BR122017003017B1 - Ácido nucléico, cassete de expressão, vetor, veículo de clonagem, microrganismotransgênico, polipeptídeo, peptídeo sinal, composição, e métodos para produzir um polipeptídeo recombinante, para gerar uma variante de um ácido nucléico, para clivar uma ligação carbono-carbono em uma composição, para formar uma ligação carbono-carbono,para fazer um gênero alimentício, uma ração ou bebida, e para converter uma biomassa ouqualquer material lignocelulósico em um combustível - Google Patents

Ácido nucléico, cassete de expressão, vetor, veículo de clonagem, microrganismotransgênico, polipeptídeo, peptídeo sinal, composição, e métodos para produzir um polipeptídeo recombinante, para gerar uma variante de um ácido nucléico, para clivar uma ligação carbono-carbono em uma composição, para formar uma ligação carbono-carbono,para fazer um gênero alimentício, uma ração ou bebida, e para converter uma biomassa ouqualquer material lignocelulósico em um combustível Download PDF

Info

Publication number
BR122017003017B1
BR122017003017B1 BR122017003017-5A BR122017003017A BR122017003017B1 BR 122017003017 B1 BR122017003017 B1 BR 122017003017B1 BR 122017003017 A BR122017003017 A BR 122017003017A BR 122017003017 B1 BR122017003017 B1 BR 122017003017B1
Authority
BR
Brazil
Prior art keywords
seq
aldolase
polypeptide
nucleic acid
approximately
Prior art date
Application number
BR122017003017-5A
Other languages
English (en)
Inventor
Ellen Burke
Paula M. Hicks
Peter Luginbuhl
Toby Richardson
David P. Weiner
Lishan Zhao
Original Assignee
Basf Enzymes Llc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Basf Enzymes Llc filed Critical Basf Enzymes Llc
Publication of BR122017003017B1 publication Critical patent/BR122017003017B1/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1022Transferases (2.) transferring aldehyde or ketonic groups (2.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/10Nitrogen as only ring hetero atom
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/05Animals comprising random inserted nucleic acids (transgenic)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/90Immunoglobulins specific features characterized by (pharmaco)kinetic aspects or by stability of the immunoglobulin
    • C07K2317/92Affinity (KD), association rate (Ka), dissociation rate (Kd) or EC50 value
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/03Oxo-acid-lyases (4.1.3)
    • C12Y401/030164-Hydroxy-2-oxoglutarate aldolase (4.1.3.16)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/03Oxo-acid-lyases (4.1.3)
    • C12Y401/030174-Hydroxy-4-methyl-2-oxoglutarate aldolase (4.1.3.17)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/52Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Nutrition Science (AREA)
  • Cell Biology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Epidemiology (AREA)
  • Communicable Diseases (AREA)
  • Oncology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Indole Compounds (AREA)
  • Coloring Foods And Improving Nutritive Qualities (AREA)

Abstract

esta presente invenção refere-se a polipeptídios com atividade de aldolase, incluindo atividade de piruvato tal como, sem limitação, atividade de hmg e/ou khg aldolase, polinucleotídeos codificando esses polipep- tídios, e métodos para produzir e usar esses polinucleotídeos e polipeptídios. em algumas modalidades, a presente invenção refere-se a polipeptídios com atividade de aldolase, incluindo atividade de piruvato tal como, sem limitação, atividade de hmg e/ou khg aldolase, incluindo atividade termoestável e termotolerante, e polinucleotídeos codificando essas enzimas, e à produção e uso desses polinucleotídeos e polipeptídios. os polipeptídios de acordo com a invenção podem ser usados em uma variedade de contextos far- macêuticos, agrícolas e industriais. em algumas modalidades, a invenção fornece polipeptídios e vias biossintéticas que são úteis na produção de ácido r-2-hidróxi 2-(indol-3-ilmetil)-4-ceto glutárico (r-mp) e certos estereoisô- meros de monatina, tais como r,r e s,r monatina, e sais dos mesmos, as- sim como certos estereoisômeros de derivados de monatina, tais como as configurações r,r e s,r, e sais dos mesmos. ainda, a presente invenção se refere a um par de iniciadores, um cassete de expressão, um vetor ou um veículo de clonagem, a peptídeos ou polipeptídeos recombinantes, a um método para produção destes peptídeos, a um anticorpo recombinante, a um método para gerar uma variante de um ácido nucléico, a um sequência líder ou sinal recombinante, a métodos para clivar e para formar uma ligação carbono-carbono, a uma composição, e a métodos para fazer um gênero alimentício, uma ração ou bebida, bem como para converter uma biomassa ou qualquer material lignocelulósico em um combustível.

Description

(54) Título: ÁCIDO NUCLEICO, CASSETE DE EXPRESSÃO, VETOR, VEÍCULO DE CLONAGEM, MICRORGANISMO TRANSGÊNICO, POLIPEPTÍDEO, PEPTÍDEO SINAL, COMPOSIÇÃO, E MÉTODOS PARA PRODUZIR UM POLIPEPTÍDEO RECOMBINANTE, PARA GERAR UMA VARIANTE DE UM ÁCIDO NUCLEICO, PARA CLIVAR UMA LIGAÇÃO CARBONO-CARBONO EM UMA COMPOSIÇÃO, PARA FORMAR UMA LIGAÇÃO CARBONO-CARBONO, PARA FAZER UM GÊNERO ALIMENTÍCIO, UMA RAÇÃO OU BEBIDA, E PARA CONVERTER UMA BIOMASSA OU QUALQUER MATERIAL LIGNOCELULÓSICO EM UM COMBUSTÍVEL (51) lnt.CI.: C12N 9/10 (30) Prioridade Unionista: 07/03/2006 US 60/780,515 (73) Titular(es): BASF ENZYMES LLC (72) Inventor(es): ELLEN BURKE; PAULA M. HICKS; PETER LUGINBUHL; TOBY RICHARDSON; DAVID P. WEINER; LISHAN ZHAO (85) Data do Início da Fase Nacional: 15/02/2017
1/788
Relatório Descritivo da Patente de Invenção para ÁCIDO NUCLEICO, CASSETE DE EXPRESSÃO, VETOR, VEÍCULO DE CLONAGEM, MICRORGANISMO TRANSGÉNICO, POLIPEPTÍDEO, PEPTÍDEO SINAL, COMPOSIÇÃO, E MÉTODOS PARA PRODUZIR UM POLIPEPTÍDEO RECOMBINANTE, PARA GERAR UMA VARIANTE DE UM ÁCIDO NUCLEICO, PARA CLIVAR UMA LIGAÇÃO CARBONO-CARBONO EM UMA COMPOSIÇÃO, PARA FORMAR UMA LIGAÇÃO CARBONO-CARBONO, PARA FAZER UM GÊNERO ALIMENTÍCIO, UMA RAÇÃO OU BEBIDA, E PARA CONVERTER UMA BIOMASSA OU QUALQUER MATERIAL LIGNOCELULÓSICO EM UM COMBUSTÍVEL.
[001] Dividido do PI0708614-8, depositado em 07.03.2007. REFERÊNCIA CRUZADA AO PEDIDO DE PATENTE RELACIONADO [002] Este pedido de patente reivindica o benefício do Pedido de Patente Provisório U.S. N°60/780.515, depositado em 7 de março de 2006.
CAMPO DE ACORDO COM A INVENÇÃO [003] A presente invenção refere-se à biologia molecular e celular e á bioquímica. Mais especificamente, a presente invenção refere-se a polipeptídeos que possuem atividade de aldolase, a polinucleotídeos que codificam estes polipeptídeos e a métodos de produção e de utilização destes polinucleotídeos e polipeptídeos.
ANTECEDENTE DA INVENÇÃO [004] A monatina é um adoçante de alta intensidade que possui a fórmula química:
Figure BR122017003017B1_D0001
Petição 870170098695, de 18/12/2017, pág. 6/17
2/788 [005] A monatina inclui dois centros quirais que levam a quatro configurações estereoisoméricas potenciais. A configuração R,R (o estereoisômero R,R ou R,R monatina); a configuração S,S (o estereoisômero S,S ou S,S monatina); a configuração R,S (o estereoisômero R,S ou R,S monatina); e a configuração S,R (o estereoisômero S,R ou S,R monatina). Como utilizado aqui, a não ser que seja citado de outra maneira, o termo monatina é utilizado para se referir a composições que incluem todos os quatro estereoisômeros de monatina, composições que incluem qualquer combinação de estereoisômeros de monatina, (tal como uma composição que inclui apenas os estereoisômeros de monatina R,R e S,S), assim como uma única forma isomérica.
[006] Para as finalidades desta descrição, a estrutura de carbono da monatina será numerada como ilustrada anteriormente, com o carbono ligado covalentemente diretamente ao grupo álcool que será identificado como o carbono da posição 2 e o carbono ligado covalentemente diretamente ao grupo amino que será identificado como o carbono da posição 4. Conseqüentemente, as referências contidas aqui para R,R monatina, S,S monatina, R,S monatina e S,R monatina significam: 2R,4R monatina, 2S,4S monatina, 2R,4S monatina e 2S,4R monatina, respectivamente, a não ser que seja indicado de outra maneira.
[007] Deve ser observado que na literatura, a estrutura de carbono da monatina também foi numerada utilizando uma convenção alternativa, com o carbono ligado ao grupo álcool sendo o carbono da posição 4 e o carbono ligado ao grupo amino sendo o carbono na posição 2. Conseqüentemente, por exemplo, as referências à 2S,4R monatina nesta descrição seriam as mesmas que as referências à 2R,4S monatina na literatura utilizando a convenção de numeração alternativa.
Petição 870170009999, de 15/02/2017, pág. 12/1247
3/788 [008] Além disso, devido às varias convenções de nomenclatura, a monatina é conhecida através de um número de nomes químicos alternativos, incluindo: ácido 2-hidróxi-2-(indol-3-ilmetil)-4aminoglutárico; ácido 4-amino-2-hidróxi-2-(1H-indol-3-ilmetil)pentanedióico; ácido 4-hidróxi-4-(3-indolilmetil) glutâmico; e 3-(1amino-1,3-dicarbóxi-3-hidróxi-but-4-il)indol.
[009] Certas formas isoméricas de monatina podem ser encontradas no córtex de raízes da planta Schlerochiton ilicifolius localizada na Região Transvaal da África do Sul. Os Pedidos de Patentes U.S. N— 10/422.366 (o Pedido de Patente 366) e 10/979.821 (o Pedido de Patente 821), que são incorporados aqui como referência, descrevem, interalia, polipeptídeos, vias e microorganismos para produção in vitro e in vivo de monatina.
SUMÁRIO [0010] A presente invenção refere-se a polipeptídeos que possuem atividade de aldolase (posteriormente aqui aldolases), incluindo a atividade de piruvato aldolase tal como, sem limitação, atividade de HMG e KHG aldolases, polinucleotídeos que codificam os polipeptídeos e os métodos para produção e utilização dos polipeptídeos e dos polinucleotídeos. Em algumas modalidades, a invenção fornece ainda composições (tais como composições farmacêuticas, combustível e composições de aditivos para combustível, alimentos e aditivos para alimentos, bebidas e aditivos para bebidas, produtos alimentícios e aditivos para produtos alimentícios, fármacos e aditivos para fármacos, suplementos dietéticos) que compreendem os polipeptídeos ou os polinucleotídeos de acordo com a invenção. Estas composições podem ser formuladas em uma variedade de formas, tais como comprimidos, géis, pílulas, implantes, líquidos, sprays, filmes, micelas, pós, alimentos, péletes alimentícios ou qualquer tipo de forma encapsulada.
[0011] Em algumas modalidades, as aldolases e/ou as composiPetição 870170009999, de 15/02/2017, pág. 13/1247
4/788 ções das mesmas podem ser úteis nos contextos farmacêuticos, industriais e/ou agrícolas.
[0012] Em algumas modalidades, as aldolases e/ou as composições das mesmas podem ser úteis para a formação ou para a divagem de ligações carbono-carbono.
[0013] Em algumas modalidades, são fornecidas aldolases que catalisam as reações de formação de ligações carbono-carbono entre um receptor alfa-ceto ácido e um doador piruvato ou derivado de piruvato (vide o esquema de reação abaixo). Em algumas modalidades, o receptor também pode ser uma cetona ou um aldeído. Em algumas modalidades, são fornecidas aldolases que possuem atividade de 4hidróxi-2-oxoglutarato aldolase (tais como 2-ceto-4-hidroxiglutarato aldolase, 2-oxo-4-hidroxiglutarato aldolase, KHG-aldolase, EC 4.1.3.16) e catalisam a reação a seguir: 4-hidróxi-2-oxoglutarato <=> piruvato + glioxilato. Em algumas modalidades, são fornecidas aldolases que possuem atividade de HMG-aldolase (tais como 4-hidróxi-4-metil-2oxoglutarato aldolase, piruvato aldolase, gama-metil-gama-hidróxi-alfacetoglutárico aldolase, 4-hidróxi-4-metil-2-cetoglutarato aldolase, EC 4.1.3.17) e catalisam a reação a seguir: 4-hidróxi-4-metil-2oxoglutarato <=> 2 piruvato. Uma HMG aldolase também agirá sobre 4-hidróxi-4-metil-2-oxoadipato e 4-carbóxi-4-hidróxi-2-oxohexadioato.
r3
Figure BR122017003017B1_D0002
Receptor a-ceto ácido, cetona ou aldeído
Figure BR122017003017B1_D0003
Piruvato ou derivado de piruvato
Figure BR122017003017B1_D0004
Figure BR122017003017B1_D0005
[0014] R = H, alquila, alquila substituída, arila, arila substituída, benzila, benzila substituída [0015] R2 = H, alquila, alquila substituída, arila, arila substituída, benzila, benzila substituída [0016] R3 = H, alquila, alquila substituída, arila, arila substituída,
Petição 870170009999, de 15/02/2017, pág. 14/1247
5/788 benzila, benzila substituída, ácido carboxílico.
[0017] Em algumas modalidades, são fornecidas aldolases, tal como uma piruvato aldolase, tal como, sem limitação uma HMG e/ou uma KHG aldolase, que facilitam a produção de um 2-ceto-g luta rato substituído em 3, 4. Em uma modalidade, a invenção fornece um método de produção de um 2-ceto-g luta rato substituído em 3, 4 que compreende: (a) o fornecimento de um polipeptídeo que possui uma atividade de aldolase, tal como uma atividade de piruvato aldolase, tal como, sem limitação, uma atividade de HMG aldolase e/ou de KMG de aldolase; (b) o fornecimento de um composto doador e um receptor; e (c) o contato do polipeptídeo da etapa (a) com os compostos da etapa (b) sob condições em que a aldolase catalisa a síntese de um 2-cetoglutarato substituído por 3, 4, em que opcionalmente o doador e o receptor são um piruvato ou um doador de piruvato e um receptor de aceto ácido, uma cetona e/ou um aldeído.
[0018] Em algumas modalidades, são fornecidas aldolases que facilitam a produção do ácido R-2-hidróxi 2-(indol-3ilmetil)-4-ceto glutárico (R-MP), um precursor da monatina. Em algumas modalidades, uma piruvato aldolase, tal como uma HMG e/ou uma KHG aldolase, pode ser utilizado em associação com uma D-aminotransferase para produzir um ácido D-glutâmico substituído em 4 ou um derivado do mesmo. Um ácido D-glutâmico substituído em 4 e/ou um derivado do mesmo pode ser utilizado como um antibiótico, uma vez que foi descoberto que estes compostos inibem a glutamato racemase bacteriana (WO0214261A3). Em uma modalidade, a invenção fornece um método de produção de um ácido D-glutâmico substituído em 4 que compreende: (a) o fornecimento de um polipeptídeo que possui uma atividade de aldolase, tal como uma atividade de piruvato aldolase, tal como, sem limitação, uma atividade de HMG aldolase e/ou de KMG aldolase; (b) o fornecimento de um receptor de α-ceto ácido e um piruvato ou
Petição 870170009999, de 15/02/2017, pág. 15/1247
6/788 doador de piruvato; e (c) o contato do polipeptídeo da etapa (a) com os compostos da etapa (b) sob condições em que a aldolase catalisa a síntese de um ácido D-glutâmico substituído em 4, em que opcionalmente o polipeptídeo possui atividade de piruvato aldolase, de HMG aldolase e/ou de KHG de aldolase e em que opcionalmente o método compreende ainda o uso de uma D-aminotransferase.
[0019] A invenção fornece ácidos nucléicos isolados, sintéticos ou recombinantes que compreendem uma sequência de ácido nucléico que possui pelo menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%,
67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%,
79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%,
91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais ou identidade de sequência completa (100%) a um ácido nucléico de acordo com a invenção, incluindo as SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID
NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID
NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID
NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID
NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID
NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID
NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID
NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID
NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID
NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ I D NO:101, SEQ ID
NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:109, SEQ ID
NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID
NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID
Petição 870170009999, de 15/02/2017, pág. 16/1247
7/788
NO:127, SEQ ΝΟ:135, SEQ ΝΟ:143, SEQ Ν0:151, SEQ ΝΟ:159, SEQ ΝΟ:167, SEQ ΝΟ:175, SEQ ΝΟ:183, SEQ Ν0:191, SEQ ΝΟ:199, SEQ ΝΟ:207, SEQ ΝΟ:215, SEQ ΝΟ:223, SEQ ΝΟ:231, SEQ ΝΟ:239, SEQ ΝΟ:247, SEQ ΝΟ:255, SEQ ΝΟ:263, SEQ ΝΟ:271, SEQ ΝΟ:279, SEQ ΝΟ:287, SEQ ΝΟ:295, SEQ ΝΟ:303, SEQ Ν0:311, SEQ ΝΟ:319, SEQ ΝΟ:327, SEQ
ID NO:129, SEQ ID NO:137, SEQ ID NO:145, SEQ ID NO:153, SEQ ID N0:161, SEQ ID NO:169, SEQ ID NO:177, SEQ ID NO:185, SEQ ID NO:193, SEQ ID NO:201, SEQ ID NO:209, SEQ ID NO:217, SEQ ID NO:225, SEQ ID NO:233, SEQ ID NO:241, SEQ ID NO:249, SEQ ID NO:257, SEQ ID NO:265, SEQ ID NO:273, SEQ ID NO:281, SEQ ID NO:289, SEQ ID NO:297, SEQ ID NO:305, SEQ ID NO:313, SEQ ID NO:321, SEQ ID NO:329, SEQ
ID N0:131, SEQ ID NO:139, SEQ ID NO:147, SEQ ID NO:155, SEQ ID NO:163, SEQ ID N0:171, SEQ ID NO:179, SEQ ID NO:187, SEQ ID NO:195, SEQ ID NO:203, SEQ ID N0:211, SEQ ID NO:219, SEQ ID NO:227, SEQ ID NO:235, SEQ ID NO:243, SEQ ID NO:251, SEQ ID NO:259, SEQ ID NO:267, SEQ ID NO:275, SEQ ID NO:283, SEQ ID NO:291, SEQ ID NO:299, SEQ ID NO:307, SEQ ID NO:315, SEQ ID NO:323, SEQ ID NO:331, SEQ
ID NO:133, SEQ ID ID N0:141, SEQ ID ID NO:149, SEQ ID ID NO:157, SEQ ID ID NO:165, SEQ ID ID NO:173, SEQ ID ID N0:181, SEQ ID ID NO:189, SEQ ID ID NO:197, SEQ ID ID NO:205, SEQ ID ID NO:213, SEQ ID ID NO:221, SEQ ID ID NO:229, SEQ ID ID NO:237, SEQ ID ID NO:245, SEQ ID ID NO:253, SEQ ID ID NO:261, SEQ ID ID NO:269, SEQ ID ID NO:277, SEQ ID ID NO:285, SEQ ID ID NO:293, SEQ ID ID NO:301, SEQ ID ID NO:309, SEQ ID ID NO:317, SEQ ID ID NO:325, SEQ ID ID NO:333, SEQ ID
NO:335, SEQ ID NO:336, SEQ ID NO:337 e SEQ ID NO:338, ao longo de uma região de pelo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200,
Petição 870170009999, de 15/02/2017, pág. 17/1247
8/788
1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500 ou mais resíduos. Em algumas modalidades, um ou mais ácidos nucléicos codificam pelo menos um polipeptídeo que possui uma atividade de aldolase, incluindo atividade de piruvato tal como, sem limitação, atividade de HMG e/ou de KHG aldolase. Em algumas modalidades, as identidades de sequência são determinadas através da análise com um algoritmo de comparação de sequências ou através de uma inspeção visual.
[0020] Em modalidades alternativas, um ou mais ácidos nucléicos codificam pelo menos um polipeptídeo capaz de gerar um anticorpo que se liga especificamente a um polipeptídeo da invenção ou estes ácidos nucléicos podem ser utilizados como sondas para a identificação ou para o isolamento de ácidos nucléicos que codificam aldolase ou para inibir a expressão de ácidos nucléicos que expressam aldolases.
[0021] Os ácidos nucléicos de acordo com a invenção incluem ainda ácidos nucléicos isolados, sintéticos ou recombinantes que codificam enzimas de acordo com a invenção, tais como enzimas que incluem um ou mais polipeptídeos que possuem uma sequência que é apresentada nas SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID
NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID
NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID
NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID
NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID
NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID
Petição 870170009999, de 15/02/2017, pág. 18/1247
9/788
NO:82, SEQ ID NO:90, SEQ ID NO:98, SEQ ID NO:106, SEQ ID N0:114, SEQ ID NO:122, SEQ ID NO:130, SEQ ID NO:138, SEQ ID NO:146, SEQ ID NO:154, SEQ ID NO:162, SEQ ID NO:170, SEQ ID NO:178, SEQ ID NO:186, SEQ ID NO:194, SEQ ID NO:202, SEQ ID NO:210, SEQ ID NO:218, SEQ ID NO:226, SEQ ID NO:234, SEQ ID NO:242, SEQ ID NO:250, SEQ ID NO:258, SEQ ID NO:266, SEQ ID NO:274, SEQ ID NO:282, SEQ ID NO:290, SEQ ID NO:298, SEQ ID NO:306, SEQ ID NO:314, SEQ ID
NO:84, SEQ ID NO:86, SEQ NO:92, SEQ ID NO:94, SEQ N0:100, SEQ ID NO:102, SEQ
NO:108, SEQ N0:116, SEQ NO:124, SEQ NO:132, SEQ NO:140, SEQ NO:148, SEQ NO:156, SEQ NO:164, SEQ NO:172, SEQ NO:180, SEQ NO:188, SEQ NO:196, SEQ NO:204, SEQ NO:212, SEQ NO:220, SEQ NO:228, SEQ NO:236, SEQ NO:244, SEQ NO:252, SEQ NO:260, SEQ NO:268, SEQ NO:276, SEQ NO:284, SEQ NO:292, SEQ N0:300, SEQ NO:308, SEQ NO:316, SEQ
ID NO:110, SEQ ID N0:118, SEQ ID NO:126, SEQ ID NO:134, SEQ ID NO:142, SEQ ID NO:150, SEQ ID NO:158, SEQ ID NO:166, SEQ ID NO:174, SEQ ID NO:182, SEQ ID NO:190, SEQ ID NO:198, SEQ ID NO:206, SEQ ID NO:214, SEQ ID NO:222, SEQ ID NO:230, SEQ ID NO:238, SEQ ID NO:246, SEQ ID NO:254, SEQ ID NO:262, SEQ ID NO:270, SEQ ID NO:278, SEQ ID NO:286, SEQ ID NO:294, SEQ ID NO:302, SEQ ID NO:310, SEQ ID NO:318, SEQ
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
NO:88, SEQ NO:96, SEQ NO:104, SEQ N0:112, SEQ NO:120, SEQ NO:128, SEQ NO:136, SEQ NO:144, SEQ NO:152, SEQ NO:160, SEQ NO:168, SEQ NO:176, SEQ NO:184, SEQ NO:192, SEQ N0:200, SEQ NO:208, SEQ NO:216, SEQ NO:224, SEQ NO:232, SEQ NO:240, SEQ NO:248, SEQ NO:256, SEQ NO:264, SEQ NO:272, SEQ NO:280, SEQ NO:288, SEQ NO:296, SEQ NO:304, SEQ NO:312, SEQ NO:320, SEQ
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
Petição 870170009999, de 15/02/2017, pág. 19/1247
10/788
NO:322, SEQ ID NO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID NO:330, SEQ ID NO:332 e SEQ ID NO:334 e subsequências das mesmas, variações das mesmas e fragmentos enzimaticamente ativos das mesmas. Em algumas modalidades, o polipeptídeo possui uma atividade de aldolase, incluindo atividade de piruvato tal como, sem limitação, atividade de HMG e/ou de KHG aldolase.
[0022] Em algumas modalidades, a invenção fornece ácidos nucléicos que codificam aldolase, tal como que codificam piruvato aldolase, tal como que codificam HMG e/ou KHG aldolase preferencialmente derivados de culturas mistas. Em algumas modalidades, a invenção fornece ácidos nucléicos que codificam enzimas que foram ou que clivam ligações carbono-carbono isolados de culturas mistas que compreendem os polinucleotídeos de acordo com a invenção, tal como uma sequência que possui pelo menos aproximadamente 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 51%, 52%, 53%, 54%, 55%,
56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%,
68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%,
80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%,
92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais ou identidade de sequência completa (100%) a um ácido nucléico de acordo com a invenção, tal como as SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ
ID NO: 7, SEi Q I D NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID
NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID
NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID
NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID
NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID
NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID
NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID
NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID
NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID
Petição 870170009999, de 15/02/2017, pág. 20/1247
11/788
NO:79, SEQ ID N0:81, SEQ ID NO:83, SEQ ID NO:85, SEQ
NO:87, SEQ ID NO:89, SEQ ID N0:91, SEQ ID NO:93, SEQ
NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQ
NO:103, SEQ N0:111, SEQ N0:119, SEQ NO:127, SEQ NO:135, SEQ NO:143, SEQ N0:151, SEQ NO:159, SEQ NO:167, SEQ NO:175, SEQ NO:183, SEQ N0:191, SEQ NO:199, SEQ NO:207, SEQ NO:215, SEQ NO:223, SEQ NO:231, SEQ NO:239, SEQ NO:247, SEQ NO:255, SEQ NO:263, SEQ NO:271, SEQ NO:279, SEQ NO:287, SEQ NO:295, SEQ NO:303, SEQ N0:311, SEQ
ID NO:105, SEQ ID N0:113, SEQ ID N0:121, SEQ ID NO:129, SEQ ID NO:137, SEQ ID NO:145, SEQ ID NO:153, SEQ ID N0:161, SEQ ID NO:169, SEQ ID NO:177, SEQ ID NO:185, SEQ ID NO:193, SEQ ID NO:201, SEQ ID NO:209, SEQ ID NO:217, SEQ ID NO:225, SEQ ID NO:233, SEQ ID NO:241, SEQ ID NO:249, SEQ ID NO:257, SEQ ID NO:265, SEQ ID NO:273, SEQ ID NO:281, SEQ ID NO:289, SEQ ID NO:297, SEQ ID NO:305, SEQ ID NO:313, SEQ
ID NO:107, SEQ ID N0:115, SEQ ID NO:123, SEQ ID N0:131, SEQ ID NO:139, SEQ ID NO:147, SEQ ID NO:155, SEQ ID NO:163, SEQ ID N0:171, SEQ ID NO:179, SEQ ID NO:187, SEQ ID NO:195, SEQ ID NO:203, SEQ ID N0:211, SEQ ID NO:219, SEQ ID NO:227, SEQ ID NO:235, SEQ ID NO:243, SEQ ID NO:251, SEQ ID NO:259, SEQ ID NO:267, SEQ ID NO:275, SEQ ID NO:283, SEQ ID NO:291, SEQ ID NO:299, SEQ ID NO:307, SEQ ID NO:315, SEQ
D NO:109, SEQ D N0:117, SEQ D NO:125, SEQ D NO:133, SEQ D N0:141, SEQ D NO:149, SEQ D NO:157, SEQ D NO:165, SEQ D NO:173, SEQ D N0:181, SEQ D NO:189, SEQ D NO:197, SEQ D NO:205, SEQ D NO:213, SEQ D NO:221, SEQ D NO:229, SEQ D NO:237, SEQ D NO:245, SEQ D NO:253, SEQ D NO:261, SEQ D NO:269, SEQ D NO:277, SEQ D NO:285, SEQ D NO:293, SEQ D NO:301, SEQ D NO:309, SEQ D NO:317, SEQ
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
Petição 870170009999, de 15/02/2017, pág. 21/1247
12/788
NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID NO:337 e SEQ ID NO:338 ao longo de uma região de pelo menos aproximadamente 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150 ou mais.
[0023] Em algumas modalidades, a invenção fornece ácidos nucléicos que codificam a enzima aldolase, tal como que codificam a enzima piruvato aldolase, que codificam a enzima HMG e/ou KHG, incluindo sequências de polinucleotídeos de acordo com a invenção e os polipeptídeos codificados pelos mesmos, incluindo enzimas de acordo com a invenção, tais como os polipeptídeos de acordo com a invenção, tais como as SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID
NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID
NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID
NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID
NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID
NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID
NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID
NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID
NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID
NO:98, SEQ ID 1 NQ:100, SEQ ID NO:102, SEQ ID NO:104, SEQ ID
NO:106, SEQ ID NO:108, SEQ ID NO:110, SEQ ID NO:112, SEQ ID
NO:114, SEQ ID NO:116, SEQ ID NO:118, SEQ ID NO:120, SEQ ID
NO:122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID NO:128, SEQ ID
NO:130, SEQ ID NO:132, SEQ ID NO:134, SEQ ID NO:136, SEQ ID
NO:138, SEQ ID NO:140, SEQ ID NO:142, SEQ ID NO:144, SEQ ID
Petição 870170009999, de 15/02/2017, pág. 22/1247
13/788
ID NO:148, SEQ ID NO:150, SEQ ID NO:152, SEQ ID
ID NO:156, SEQ ID NO:158, SEQ ID NO:160, SEQ ID
ID NO:164, SEQ ID NO:166, SEQ ID NO:168, SEQ ID
ID NO:172, SEQ ID NO:174, SEQ ID NO:176, SEQ ID
ID NO:180, SEQ ID NO:182, SEQ ID NO:184, SEQ ID
ID NO:188, SEQ ID NO:190, SEQ ID NO:192, SEQ ID
ID NO:196, SEQ ID NO:198, SEQ ID NO:200, SEQ ID
ID NO:204, SEQ ID NO:206, SEQ ID NO:208, SEQ ID
ID NO:212, SEQ ID NO:214, SEQ ID NO:216, SEQ ID
ID NO:220, SEQ ID NO:222, SEQ ID NO:224, SEQ ID
ID NO:228, SEQ ID NO:230, SEQ ID NO:232, SEQ ID
ID NO:236, SEQ ID NO:238, SEQ ID NO:240, SEQ ID
ID NO:244, SEQ ID NO:246, SEQ ID NO:248, SEQ ID
ID NO:252, SEQ ID NO:254, SEQ ID NO:256, SEQ ID
ID NO:260, SEQ ID NO:262, SEQ ID NO:264, SEQ ID
ID NO:268, SEQ ID NO:270, SEQ ID NO:272, SEQ ID
ID NO:276, SEQ ID NO:278, SEQ ID NO:280, SEQ ID
ID NO:284, SEQ ID NO:286, SEQ ID NO:288, SEQ ID
ID NO:292, SEQ ID NO:294, SEQ ID NO:296, SEQ ID
ID NO:300, SEQ ID NO:302, SEQ ID NO:304, SEQ ID
ID NO:308, SEQ ID NO:310, SEQ ID NO:312, SEQ ID
ID NO:316, SEQ ID NO:318, SEQ ID NO:320, SEQ ID
ID NO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID
ID NO:332 ou SEQ ID NO:334 e f rag mentos enzimati-
NO:146, SEQ II ΝΟ:154, SEQ II NO: 162, SEQ NO:170, SEQ II NO:178, SEQ II NO:186, SEQ II NO:194, SEQ II NO:202, SEQ II NO:210, SEQ II NO:218, SEQ II NO:226, SEQ II NO:234, SEQ II NO:242, SEQ II NO:250, SEQ II NO:258, SEQ II NO:266, SEQ II NO:274, SEQ II NO:282, SEQ II NO:290, SEQ II NO:298, SEQ II NO:306, SEQ II NO:314, SEQ II NO:322, SEQ II NO:330, SEQ II camente ativos dos mesmos, preferencialmente derivados de uma fonte comum, tal como uma fonte ambiental. Em algumas modalidades, a invenção fornece ainda ácidos nucléicos que codificam a enzima aldolase, tal como que codificam a enzima piruvato aldolase, que codificam a enzima HMG e/ou KHG preferencialmente derivados de fontes ambientais, tais como fontes ambientais mistas.
Petição 870170009999, de 15/02/2017, pág. 23/1247
14/788 [0024] Em algumas modalidades, o algoritmo de comparação de sequências é um algoritmo BLAST versão 2.2.2 em que um conjunto de filtros é ajustado em blastall -p blastp -d nr pataa -F F e todas as outras opções são ajustadas como padrão.
[0025] Outras modalidades da invenção são ácidos nucléicos isolados, sintéticos ou recombinantes que incluem pelo menos 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500 ou mais bases consecutivas de uma sequência de ácido nucléico de acordo com a invenção, sequências substancialmente idênticas à mesma e as sequências complementares à mesma.
[0026] Em algumas modalidades, os ácidos nucléicos isolados, sintéticos ou recombinantes de acordo com a invenção codificam um polipeptídeo que possui uma atividade de aldolase, incluindo atividade de piruvato tal como, sem limitação, atividade de HMG e/ou de KHG aldolase, que é termoestável. O polipeptídeo termoestável de acordo com a invenção pode manter uma atividade de aldolase, tal como uma atividade de piruvato aldolase, tal como uma atividade de HMG e/ou de KHG aldolase, sob condições que compreendem uma faixa de temperatura de aproximadamente -10013 até aproximad amente -8013, aproximadamente -8013 até aproximadamente -4013, ap roximadamente -4013 até aproximadamente -2013, aproximadame nte -2013 até aproximadamente 013, aproximadamente 013 até aproxi madamente 3713, aproximadamente 013 até aproximadamente 513, aproximadamente 513 até aproximadamente 1513, aproximadamente 1513 até aproximadamente 2513, aproximadamente 2513 até apro ximadamente 3713, aproximadamente 3713 até aproximadamente 4513 , aproximaPetição 870170009999, de 15/02/2017, pág. 24/1247
15/788 damente 45G até aproximadamente 55G, aproximadame nte 55G até aproximadamente 70G, aproximadamente 70G até aproximadamente 75G, aproximadamente 75G até aproximadament e 85G, aproximadamente 85G até aproximadamente 90G, apro ximadamente 90G até aproximadamente 95G, aproximadamente 95G até aproximadamente 100G, aproximadamente 100G até aproxima damente 105G, aproximadamente 105G até aproximadamente 11 OG, aproximadamente 110G até aproximadamente 120G ou 95G, 96G, 97G, 98G, 99G, 100G, 101G, 102G, 103G, 104G, 105° C, 106G, 107G, 108G, 109G, 110G, 111G, 112G, 113G, 11 4G, 115G ou mais. Os polipeptídeos termoestáveis de acordo com a invenção podem manter uma atividade de aldolase, tal como uma atividade de piruvato aldolase, tal como uma atividade de HMG e/ou de KHG aldolase, em temperaturas na faixa de aproximadamente -100G até aproximadamente -80G, aproximadamente -80G até aproxi madamente 40G, aproximadamente -40G até aproximadamente -20 G, aproximadamente -20G até aproximadamente OG, aproximada mente OG até aproximadamente 5G, aproximadamente 5G até ap roximadamente 15G, aproximadamente 15G até aproximadament e 25G, aproximadamente 25G até aproximadamente 37G, apro ximadamente 37G até aproximadamente 45G, aproximadamente 45G até aproximadamente 55G, aproximadamente 55G até aproximada mente 70G, aproximadamente 70G até aproximadamente 75G , aproximadamente 75G até aproximadamente 85G, aproximadame nte 85G até aproximadamente 90G, aproximadamente 90G até aproximadamente 95G, aproximadamente 95G até aproximadament e 100G, aproximadamente 100G até aproximadamente 105G, ap roximadamente 105G até aproximadamente 110G, aproximadame nte 110G até aproximadamente 120G ou 95G, 96G, 97G, 98G , 99G, 100G, 101G, 102G, 103G, 104G, 105G, 106G, 107G, 10 8G, 109G,
Petição 870170009999, de 15/02/2017, pág. 25/1247
16/788
110G, 111X3, 112G, 113G, 114G, 115G ou mais. E m algumas modalidades, os polipeptídeos termoestáveis de acordo com a invenção mantêm uma atividade de aldolase a uma temperatura nas faixas descritas anteriormente, em aproximadamente pH 3,0, aproximadamente pH 3,5, aproximadamente pH 4,0, aproximadamente pH 4,5, aproximadamente pH 5,0, aproximadamente pH 5,5, aproximadamente pH 6,0, aproximadamente pH 6,5, aproximadamente pH 7,0, aproximadamente pH 7,5, aproximadamente pH 8,0, aproximadamente pH 8,5, aproximadamente pH 9,0, aproximadamente pH 9,5, aproximadamente pH 10,0, aproximadamente pH 10,5, aproximadamente pH 11,0, aproximadamente pH 11,5, aproximadamente pH 12,0 ou mais.
[0027] Em outras modalidades, os ácidos nucléicos isolados, sintéticos ou recombinantes codificam um polipeptídeo que possui uma atividade de aldolase, incluindo atividade de piruvato tal como, sem limitação, atividade de HMG e/ou de KHG aldolase, que é termotolerante. Os polipeptídeos termotolerantes de acordo com a invenção podem manter uma atividade de aldolase, tal como uma atividade de piruvato aldolase, tal como uma atividade de HMG e/ou de KHG aldolase, após a exposição a condições que compreendem uma temperatura na faixa de aproximadamente -100G até aproximadamente -80G , aproximadamente -80G até aproximadamente -40G, aproximada mente -40G até aproximadamente -20G, aproximadamente -20G at é aproximadamente 0G, aproximadamente 0G até aproximadament e 5G, aproximadamente 5G até aproximadamente 15G, aproximad amente 15G até aproximadamente 25G, aproximadamente 25G até aproximadamente 37G, aproximadamente 37G até aproximadament e 45G, aproximadamente 45G até aproximadamente 55G, apro ximadamente 55G até aproximadamente 70G, aproximadamente 70G até aproximadamente 75G, aproximadamente 75G até aproximada mente 85G, aproximadamente 85G até aproximadamente 90G , aproximaPetição 870170009999, de 15/02/2017, pág. 26/1247
17/788 damente 90G até aproximadamente 95G, aproximadame nte 95G até aproximadamente 100G, aproximadamente 100G at é aproximadamente 105G, aproximadamente 105G até aproximada mente 110X3, aproximadamente 110X3 até aproximadamente 12 0G ou 95G, 96G, 97G, 98G, 99G, 100G, 101G, 102G, 103G, 104G, 105G, 106G, 107G, 108G, 109G, 110G, 111G, 11 2G, 113G, 114G, 115G ou mais. Os polipeptídeos termotoleran tes de acordo com a invenção podem manter uma atividade de aldolase, tal como uma atividade de piruvato aldolase, tal como uma atividade de HMG e/ou de KHG aldolase, após a exposição a uma temperatura na faixa de aproximadamente -100G até aproximadamente -80G , aproximadamente -80G até aproximadamente -40 G, aproximada mente -40G até aproximadamente -20G, aproximadamente -20G at é aproximadamente 0G, aproximadamente 0G até aproximadament e 5G, aproximadamente 5G até aproximadamente 15G, aproximad amente 15G até aproximadamente 25G, aproximadamente 25G até aproximadamente 37G, aproximadamente 37G até aproximadament e 45G, aproximadamente 45G até aproximadamente 55G, apro ximadamente 55G até aproximadamente 70G, aproximadamente 70G até aproximadamente 75G, aproximadamente 75G até aproximada mente 85G, aproximadamente 85G até aproximadamente 90G , aproximadamente 90G até aproximadamente 95G, aproximadame nte 95G até aproximadamente 100G, aproximadamente 100G at é aproximadamente 105G, aproximadamente 105G até aproximada mente 110G, aproximadamente 110G até aproximadamente 12 0G ou 95G, 96G, 97G, 98G, 99G, 100G, 101G, 102G, 103G, 104G, 105G, 106G, 107G, 108G, 109G, 110G, 111G, 11 2G, 113G, 114G, 115G ou mais. Em algumas modalidades, os po lipeptídeos termotolerantes de acordo com a invenção mantêm uma atividade de aldolase após a exposição a uma temperatura nas faixas descritas anPetição 870170009999, de 15/02/2017, pág. 27/1247
18/788 teriormente, em aproximadamente pH 3,0, aproximadamente pH 3,5, aproximadamente pH 4,0, aproximadamente pH 4,5, aproximadamente pH 5,0, aproximadamente pH 5,5, aproximadamente pH 6,0, aproximadamente pH 6,5, aproximadamente pH 7,0, aproximadamente pH 7,5, aproximadamente pH 8,0, aproximadamente pH 8,5, aproximadamente pH 9,0, aproximadamente pH 9,5, aproximadamente pH 10,0, aproximadamente pH 10,5, aproximadamente pH 11,0, aproximadamente pH 11,5, aproximadamente pH 12,0 ou mais.
[0028] A invenção fornece ácidos nucléicos isolados, sintéticos ou recombinantes que compreendem uma sequência que se hibridiza sob condições rigorosas aos ácidos nucléicos de acordo com a invenção, incluindo uma sequência que é apresentada nas SEQ ID NO:1, SEQ
ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ
ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ
D
NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID
NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID
NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID
NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID
NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID
NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID
NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID
NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID
NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID
NO:101, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID
NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID
NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ
NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ
NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ
NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ
D
D
D
D
Petição 870170009999, de 15/02/2017, pág. 28/1247
19/788
NO:149, SEQ ΝΟ:157, SEQ ΝΟ:165, SEQ ΝΟ:173, SEQ Ν0:181, SEQ ΝΟ:189, SEQ ΝΟ:197, SEQ ΝΟ:205, SEQ ΝΟ:213, SEQ ΝΟ:221, SEQ ΝΟ:229, SEQ ΝΟ:237, SEQ ΝΟ:245, SEQ ΝΟ:253, SEQ ΝΟ:261, SEQ ΝΟ:269, SEQ ΝΟ:277, SEQ ΝΟ:285, SEQ ΝΟ:293, SEQ ΝΟ:301, SEQ ΝΟ:309, SEQ ΝΟ:317, SEQ ΝΟ:325, SEQ ΝΟ:333, SEQ
ID N0:151, SEQ ID NO:159, SEQ ID NO:167, SEQ ID NO:175, SEQ ID NO:183, SEQ ID N0:191, SEQ ID NO:199, SEQ ID NO:207, SEQ ID NO:215, SEQ ID NO:223, SEQ ID NO:231, SEQ ID NO:239, SEQ ID NO:247, SEQ ID NO:255, SEQ ID NO:263, SEQ ID NO:271, SEQ ID NO:279, SEQ ID NO:287, SEQ ID NO:295, SEQ ID NO:303, SEQ ID N0:311, SEQ ID NO:319, SEQ ID NO:327, SEQ D NO:335, SEQ I
ID NO:153, SEQ ID N0:161, SEQ ID NO:169, SEQ ID NO:177, SEQ ID NO:185, SEQ ID NO:193, SEQ ID NO:201, SEQ ID NO:209, SEQ ID NO:217, SEQ ID NO:225, SEQ ID NO:233, SEQ ID NO:241, SEQ ID NO:249, SEQ ID NO:257, SEQ ID NO:265, SEQ ID NO:273, SEQ ID NO:281, SEQ ID NO:289, SEQ ID NO:297, SEQ ID NO:305, SEQ ID NO:313, SEQ ID NO:321, SEQ ID NO:329, SEQ D NO:336, SEQ II
ID NO:155, SEQ ID NO:163, SEQ ID N0:171, SEQ ID NO:179, SEQ ID NO:187, SEQ ID NO:195, SEQ ID NO:203, SEQ ID N0:211, SEQ ID NO:219, SEQ ID NO:227, SEQ ID NO:235, SEQ ID NO:243, SEQ ID NO:251, SEQ ID NO:259, SEQ ID NO:267, SEQ ID NO:275, SEQ ID NO:283, SEQ ID NO:291, SEQ ID NO:299, SEQ ID NO:307, SEQ ID NO:315, SEQ ID NO:323, SEQ ID NO:331, SEQ > NO:337 ou SEQ
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
NO:338 ou fragmentos ou subsequências da mesma. Em algumas modalidades, os ácidos nucléicos codificam polipeptídeos que possuem uma atividade de aldolase, incluindo atividade de piruvato tal como, sem limitação, atividade de HMG e/ou de KHG aldolase. Os ácidos nucléicos podem ter pelo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500,
Petição 870170009999, de 15/02/2017, pág. 29/1247
20/788
550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200 ou mais resíduos de comprimento ou o comprimento completo do gene ou do produto da transcrição. Em algumas modalidades, as condições rigorosas compreendem uma etapa de lavagem que compreende uma lavagem em 0,2X SSC a uma temperatura de aproximadamente 65°C durante aproximadamente 15 minutos.
[0029] A invenção fornece sondas de ácido nucléico para a identificação ou para o isolamento de ácidos nucléicos que codificam polipeptídeos que possuem uma atividade de aldolase, incluindo atividade de piruvato tal como, sem limitação, atividade de HMG e/ou de KHG aldolase, em que as sondas compreendem aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000 ou mais, bases consecutivas de uma sequência de acordo com a invenção e em que as sondas identificam o ácido nucléico através de ligação ou de hibridização. As sondas podem compreender um oligonucleotídeo que compreende entre aproximadamente 10-100 bases consecutivas de uma sequência de acordo com a invenção ou fragmentos ou subsequências da mesma, por exemplo, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 ou 100 bases ou mais ou qualquer comprimento desejado entre estas.
[0030] A invenção fornece sondas de ácido nucléico para a identificação ou para o isolamento de ácidos nucléicos que codificam polipeptídeos que possuem uma atividade de aldolase, incluindo atividade de piruvato, tal como, sem limitação, atividade de HMG e/ou de KHG aldolase, em que as sondas compreendem ácidos nucléicos que compreendem uma sequência de pelo menos aproximadamente 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000 ou mais resíduos de um ácido nucléico de acordo com a invenção, tal como um
Petição 870170009999, de 15/02/2017, pág. 30/1247
21/788 polinucleotídeo que possui pelo menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%,
64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%,
76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%,
88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais ou identidade de sequência completa (100%) a um ácido nucléico da invenção. Em algumas modalidades, as identidades de sequência são determinadas através da análise com um algoritmo de comparação de sequências ou através de inspeção visual. Em outras modalidades, as sondas podem compreender um oligonucleotídeo que compreende entre pelo menos aproximadamente 10-100 bases consecutivas de uma sequência de ácido nucléico de acordo com a invenção ou uma subsequência da mesma, por exemplo, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 ou 100 bases ou mais ou qualquer comprimento desejado entre estas.
[0031] A invenção fornece pares de iniciadores para amplificação (tal como através da PCR) de ácidos nucléicos que codificam polipeptídeos que possuem atividade de aldolase, incluindo atividade de piruvato tal como, sem limitação, atividade de HMG e/ou de KHG aldolase, em que cada par de iniciador é capaz de amplificar um ácido nucléico que compreende uma sequência de acordo com a invenção ou fragmentos ou subsequências da mesma (vide a Listagem de Sequências). Um ou cada membro do par de sequências de iniciadores de amplificação pode compreender um oligonucleotídeo que compreende pelo menos aproximadamente 10 até 50 ou mais, bases consecutivas da sequência ou aproximadamente 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36 ou mais bases consecutivas da sequência. Em algumas modalidades, a invenção fornece pares de iniciadores para amplificação, em que cada par de iniciadores compreende um primeiro membro que possui uma
Petição 870170009999, de 15/02/2017, pág. 31/1247
22/788 sequência que é apresentada por aproximadamente os primeiros (os a 5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36 ou mais resíduos de um ácido nucléico de acordo com a invenção e um segundo membro que possui uma sequência que é apresentada por aproximadamente os primeiros (os a 5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36 ou mais resíduos do filamento complementar do primeiro membro.
[0032] A invenção fornece ácidos nucléicos que codificam aldolase, tais como os que codificam piruvato aldolase, os que codificam HMG e/ou KHG aldolase gerados através da amplificação, tal como a reação em cadeia da polimerase (PCR), utilizando um par de iniciadores para amplificação de acordo com a invenção. Em algumas modalidades, a invenção fornece ácidos nucléicos que codificam aldolase, tais como os que codificam piruvato aldolase, que codificam HMG e/ou KHG aldolase gerados através da amplificação, tal como a reação em cadeia da polimerase (PCR), utilizando um par de iniciadores para amplificação de acordo com a invenção. Em algumas modalidades, a invenção fornece métodos de produção de uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase através da amplificação, tal como a reação em cadeia da polimerase (PCR), utilizando um par de iniciadores para amplificação de acordo com a invenção. Em algumas modalidades, o par de iniciadores para amplificação amplifica um ácido nucléico de uma biblioteca, tal como uma biblioteca gênica, tal como uma biblioteca ambiental.
[0033] A invenção fornece métodos de amplificação de um ácido nucléico que codifica um polipeptídeo que possui uma atividade de aldolase, incluindo atividade de piruvato, tal como, sem limitação, atividade de HMG e/ou de KHG aldolase que compreende a amplificação de um ácido nucléico molde com um par de sequências iniciadoras
Petição 870170009999, de 15/02/2017, pág. 32/1247
23/788 para amplificação capaz de amplificar uma sequência de ácido nucléico de acordo com a invenção ou fragmentos ou subsequências da mesma.
[0034] A invenção fornece cassetes de expressão que compreendem um ácido nucléico de acordo com a invenção ou uma subsequência do mesmo. Em algumas modalidades, o cassete de expressão pode compreender o ácido nucléico que está ligado de forma operacional a um promotor. O promotor pode ser um promotor viral, bacteriano, de mamífero, de fungo, de levedura ou vegetal. Em algumas modalidades, o promotor vegetal pode ser um promotor de batata, arroz, milho, trigo, tabaco ou cevada. O promotor pode ser um promotor constitutivo. O promotor constitutivo pode compreender CaMV35S. Em outras modalidades, o promotor pode ser um promotor que pode ser induzido. Em algumas modalidades, o promotor pode ser um promotor específico ao tecido ou um promotor regulado pelo desenvolvimento. Assim, o promotor pode ser tal como um promotor específico à semente, um específico à folha, um específico à raiz, um específico ao caule ou um induzido pela abscisão. Em algumas modalidades, o cassete de expressão pode compreender ainda um vetor de expressão vegetal ou de vírus vegetal.
[0035] A invenção fornece veículos de clonagem que compreendem um cassete de expressão (tal como um vetor) de acordo com a invenção ou um ácido nucléico de acordo com a invenção. O veículo de clonagem pode ser um vetor viral, um plasmídeo, um fago, um fagemídeo, um cosmídeo, um fosmídeo, um bacteriófago ou um cromossomo artificial. O vetor viral pode compreender um vetor de adenovírus, um vetor retroviral ou um vetor viral associado a adeno. O veículo de clonagem pode compreender um cromossomo artificial bacteriano (BAC), um plasmídeo, um vetor derivado do bacteriófato P1 (PAC), um cromossomo artificial de levedura (YAC) ou um cromossoPetição 870170009999, de 15/02/2017, pág. 33/1247
24/788 mo artificial de mamífero (MAC).
[0036] A invenção fornece células transformadas que compreendem os ácidos nucléicos de acordo com a invenção ou cassetes de expressão (tais como vetores) de acordo com a invenção ou veículos de clonagem de acordo com a invenção. Em algumas modalidades, a célula transformada pode ser uma célula bacteriana, uma célula de mamífero, uma célula de fungo, uma célula de levedura, uma célula de inseto ou uma célula vegetal. Em algumas modalidades, a célula vegetal pode ser célula de soja, de colza, de semente oleosa, de tomate, de cana de açúcar, de um cereal, de batata, de trigo, de arroz, de milho, de tabaco ou de cevada.
[0037] A invenção fornece animais não-humanos transgênicos que compreendem um ácido nucléico de acordo com a invenção ou um cassete de expressão (tal como um vetor) de acordo com a invenção. Em algumas modalidades, o animal é um camundongo, um rato, um porco, uma cabra ou uma ovelha.
[0038] A invenção fornece plantas transgênicas que compreendem um ácido nucléico de acordo com a invenção ou um cassete de expressão (tal como um vetor) de acordo com a invenção. A planta transgênica pode ser uma planta de cereal, uma planta de milho, uma planta de batata, uma planta de tomate, uma planta de trigo, uma planta de semente oleosa, uma planta de colza, uma planta de soja, uma planta de arroz, uma planta de cevada ou uma planta de tabaco.
[0039] A invenção fornece sementes transgênicas que compreendem um ácido nucléico de acordo com a invenção ou um cassete de expressão (tal como um vetor) de acordo com a invenção. A semente transgênica pode ser uma semente de planta de cereal, uma semente de milho, um grão de trigo, uma semente oleosa, uma semente de colza, uma semente de soja, uma semente de palma, uma semente de girassol, uma semente de gergilim, uma semente de amendoim ou de
Petição 870170009999, de 15/02/2017, pág. 34/1247
25/788 uma planta de tabaco.
[0040] A invenção fornece oligonucleotídeos anti-sentido que compreendem sequências de ácidos nucléicos complementares ou capazes de se hibridizarem sob condições rigorosas aos ácidos nucléicos de acordo com a invenção. Em algumas modalidades, a invenção fornece métodos de inibição da tradução da mensagem de uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase em uma célula que compreendem a administração à célula ou a expressão na célula de um oligonucleotídeo anti-sentido que compreende uma sequência de ácido nucléico complementar ou capaz de se hibridizar sob condições rigorosas a um ácido nucléico de acordo com a invenção. Em algumas modalidades, o oligonucleotídeo anti-sentido tem aproximadamente 10 até aproximadamente 50, aproximadamente 20 até aproximadamente 60, aproximadamente 30 até aproximadamente 70, aproximadamente 40 até aproximadamente 80 ou aproximadamente 60 até aproximadamente 100 bases de comprimento, tais como 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 ou mais bases de comprimento.
[0041] A invenção fornece métodos de inibição da tradução da mensagem de uma enzima aldolase, tal como uma enzima piruvato aldolase, tal como HMG e/ou KHG aldolase em uma célula que compreendem a administração à célula ou a expressão na célula de um oligonucleotídeo anti-sentido que compreende uma sequência de ácido nucléico complementar ou capaz de se hibridizar sob condições rigorosas a um ácido nucléico de acordo com a invenção.
[0042] A invenção fornece moléculas de RNA inibidoras de filamento duplo (RNAi ou interferência com RNA) (incluindo RNA interferente pequeno ou siRNAs, para a inibição da transcrição e microRNAs ou miRNAs, para a inibição da tradução) que compreendem uma subsequência de uma sequência de acordo com a invenção. Em algumas
Petição 870170009999, de 15/02/2017, pág. 35/1247
26/788 modalidades, o siRNAtem aproximadamente 21 até aproximadamente 24 resíduos ou aproximadamente pelo menos 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 ou mais nucleotídeos em dúplex de comprimento. Em algumas modalidades, a invenção fornece métodos de inibição da expressão de uma enzima aldolase, tal como uma enzima piruvato aldolase, tal como HMG e/ou KHG aldolase em uma célula que compreendem a administração à célula ou a expressão na célula de um RNA inibidor de filamento duplo (siRNA ou miRNA), em que o RNA compreende uma subsequência de uma sequência de acordo com a invenção.
[0043] A presente invenção refere-se a polipeptídeos isolados, sintéticos ou recombinantes que compreendem uma sequência de aminoácidos que possui pelo menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais ou identidade de sequência completa (100%) a um polipeptídeo ou um peptídeo de acordo com a invenção ao longo de uma região de pelo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 350 ou mais resíduos ou ao longo do comprimento completo do polipeptídeo. Em algumas modalidades, as identidades de sequência são determinadas através da análise com um algoritmo de comparação de sequências ou através de uma inspeção visual. As sequências de polipeptídeos ou de polipeptídeos de acordo com a invenção incluem as SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID
Petição 870170009999, de 15/02/2017, pág. 36/1247
27/788
NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID
NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID
NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID
NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID
NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID
NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID
NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID
NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID
NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID
NO:98, SEQ ID N0:100, SEQ ID NO:102, SEQ ID NO:104, SEQ ID
NO:106, SEQ Ν0:114, SEQ ΝΟ:122, SEQ ΝΟ:130, SEQ ΝΟ:138, SEQ ΝΟ:146, SEQ ΝΟ:154, SEQ ΝΟ:162, SEQ ΝΟ:170, SEQ ΝΟ:178, SEQ ΝΟ:186, SEQ ΝΟ:194, SEQ ΝΟ:202, SEQ ΝΟ:210, SEQ ΝΟ:218, SEQ ΝΟ:226, SEQ ΝΟ:234, SEQ ΝΟ:242, SEQ ΝΟ:250, SEQ ΝΟ:258, SEQ
ID NO:108, SEQ ID N0:116, SEQ ID NO:124, SEQ ID NO:132, SEQ ID NO:140, SEQ ID NO:148, SEQ ID NO:156, SEQ ID NO:164, SEQ ID NO:172, SEQ ID NO:180, SEQ ID NO:188, SEQ ID NO:196, SEQ ID NO:204, SEQ ID NO:212, SEQ ID NO:220, SEQ ID NO:228, SEQ ID NO:236, SEQ ID NO:244, SEQ ID NO:252, SEQ ID NO:260, SEQ
D NO:110, SEQ D N0:118, SEQ D NO:126, SEQ D NO:134, SEQ D NO:142, SEQ D NO:150, SEQ D NO:158, SEQ D NO:166, SEQ D NO:174, SEQ D NO:182, SEQ D NO:190, SEQ D NO:198, SEQ D NO:206, SEQ D NO:214, SEQ D NO:222, SEQ D NO:230, SEQ D NO:238, SEQ D NO:246, SEQ D NO:254, SEQ D NO:262, SEQ
D N0:112, SEQ D NO:120, SEQ D NO:128, SEQ D NO:136, SEQ D NO:144, SEQ D NO:152, SEQ D NO:160, SEQ D NO:168, SEQ D NO:176, SEQ D NO:184, SEQ D NO:192, SEQ D N0:200, SEQ D NO:208, SEQ D NO:216, SEQ D NO:224, SEQ D NO:232, SEQ D NO:240, SEQ D NO:248, SEQ D NO:256, SEQ D NO:264, SEQ
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
Petição 870170009999, de 15/02/2017, pág. 37/1247
28/788
NO:266, SEQ ID NO:268, SEQ ID NO:270, SEQ ID NO:272, SEQ ID
NO:274, SEQ ID NO:276, SEQ ID NO:278, SEQ ID NO:280, SEQ ID
NO:282, SEQ ID NO:284, SEQ ID NO:286, SEQ ID NO:288, SEQ ID
NO:290, SEQ ID NO:292, SEQ ID NO:294, SEQ ID NO:296, SEQ ID
NO:298, SEQ ID N0:300, SEQ ID NO:302, SEQ ID NO:304, SEQ ID
NO:306, SEQ ID NO:308, SEQ ID NO:310, SEQ ID NO:312, SEQ ID
NO:314, SEQ ID NO:316, SEQ ID NO:318, SEQ ID NO:320, SEQ ID
NO:322, SEQ ID NO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID
NO:330, SEQ ID NO:332 e SEQ ID NO:334 e subsequências das mesmas, variações das mesmas e fragmentos enzimaticamente ativos das mesmas. Os polipeptídeos de acordo com a invenção incluem ainda fragmentos de pelo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 80, 85, 90, 95, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600 ou mais resíduos de comprimento ou ao longo do comprimento completo de uma enzima. As sequências de polipeptídeos ou de peptídeos de acordo com a invenção incluem a sequência codificada por um ácido nucléico de acordo com a invenção. As sequências de polipeptídeos ou de peptídeos de acordo com a invenção incluem polipeptídeos ou peptídeos ligados especificamente por um anticorpo de acordo com a invenção (tais como epítopos) ou polipeptídeos ou peptídeos que podem gerar um anticorpo de acordo com a invenção (tais como um agente imunogênico).
[0044] Em algumas modalidades, um polipeptídeo de acordo com a invenção possui pelo menos uma atividade de enzima aldolase, tal como atividade de enzima piruvato aldolase, tal como de HMG e/ou KHG aldolase. Em outras modalidades, um polinucleotídeo de acordo com a invenção codifica um polipeptídeo que possui pelo menos uma atividade de enzima aldolase, tal como atividade de enzima piruvato aldolase, tal como de HMG e/ou KHG aldolase.
[0045] Uma outra modalidade dA presente invenção refere-se a
Petição 870170009999, de 15/02/2017, pág. 38/1247
29/788 polipeptídeos ou peptídeos isolados, sintéticos ou recombinantes que compreendem pelo menos 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150 ou mais bases consecutivas de sequências de polipeptídeos ou de peptídeos de acordo com a invenção, sequências substancialmente idênticas às mesmas e as sequências complementares às mesmas. O peptídeo pode ser, tal como um fragmento imunogênico, um motivo (tal como um sítio de ligação), uma sequência sinal, uma pré-pró-sequência ou um sítio ativo.
[0046] A invenção fornece ácidos nucléicos isolados, sintéticos ou recombinantes que compreendem uma sequência que codifica um polipeptídeo que possui uma atividade de enzima aldolase, tal como de piruvato aldolase, tal como de HMG e/ou de KHG aldolase e uma sequência sinal, em que o ácido nucléico compreende uma sequência de acordo com a invenção. Uma sinal de sequência significa um sinal de secreção ou outro domínio que facilita a secreção da aldolase de acordo com a invenção da célula hospedeira. O sinal de sequência pode ser derivado de uma outra enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase ou uma enzima sem ser aldolase, tal como sem ser piruvato aldolase, tal como sem ser HMG e/ou sem ser KHG aldolase (um heterólogo). Em algumas modalidades, a invenção fornece ácidos nucléicos isolados, sintéticos ou recombinantes que compreendem uma sequência que codifica um polipeptídeo que possui uma atividade de enzima aldolase, tal como de piruvato aldolase, tal como de HMG e/ou de KHG aldolase, em que a sequência não contém uma sequência sinal e o ácido nucléico compreende uma sequência de acordo com a invenção. Em algumas modalidades, A presente invenção refere-se a polipeptídeos isolados, sintéticos ou recombinantes que compreendem polipeptídeos de acordo com a invenção que não possuem toda ou parte de uma sequência sinal. Em algumas modalidades, o polipeptídeo isolado, sintético ou
Petição 870170009999, de 15/02/2017, pág. 39/1247
30/788 recombinante pode compreender o polipeptídeo de acordo com a invenção que compreende uma sequência sinal heteróloga, tal como uma sequência sinal de enzima aldolase heteróloga, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase ou uma sequência sinal de enzima sem ser aldolase, tal como sem ser piruvato aldolase, tal como sem ser HMG e/ou sem ser KHG aldolase.
[0047] Em algumas modalidades, a invenção fornece proteínas quiméricas que compreendem um primeiro domínio que compreende uma sequência sinal de acordo com a invenção e pelo menos um segundo domínio. A proteína pode ser uma proteína de fusão. O segundo domínio pode compreender uma enzima. A proteína pode não ser uma enzima.
[0048] A presente invenção refere-se a polipeptídeos quiméricos que compreendem pelo menos um primeiro domínio que compreende um peptídeo sinal (SP), uma pré-pró-sequência e/ou um domínio catalítico (CD) de acordo com a invenção e pelo menos um segundo domínio que compreende um polipeptídeo ou um peptídeo heterólogo, em que o polipeptídeo ou o peptídeo heterólogo não está naturalmente associado com o peptídeo sinal (SP), a pré-pró-sequência e/ou o domínio catalítico (CD). Em algumas modalidades, o polipeptídeo ou o peptídeo heterólogo não é uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase. O polipeptídeo ou o peptídeo heterólogo pode ser um terminal amino até, um terminal carbóxi até ou em ambas as extremidades do peptídeo sinal (SP), da pré-pró-sequência e/ou do domínio catalítico (CD).
[0049] A invenção fornece ácidos nucléicos isolados, sintéticos ou recombinantes que codificam um polipeptídeo quimérico, em que o polipeptídeo quimérico compreende pelo menos um primeiro domínio que compreende um peptídeo sinal (SP), um pré-pró-domínio e/ou um domínio catalítico (CD) de acordo com a invenção e pelo menos um
Petição 870170009999, de 15/02/2017, pág. 40/1247
31/788 segundo domínio que compreende um polipeptídeo ou um peptídeo heterólogo, em que o polipeptídeo ou o peptídeo heterólogo não está naturalmente associado com o peptídeo sinal (SP), o pré-pró-domínio e/ou o domínio catalítico (CD).
[0050] A invenção fornece sequências de sinais isoladas, sintéticas ou recombinantes (tais como peptídeos de sinais) que consistem ou que compreendem uma sequência que é apresentada nos resíduos 1 até 14, 1 até 15, 1 até 16, 1 até 17, 1 até 18, 1 até 19, 1 até 20, 1 até 21, 1 até 22, 1 até 23, 1 até 24, 1 até 25, 1 até 26, 1 até 27, 1 até 28, 1 até 28, 1 até 30, 1 até 31, 1 até 32, 1 até 33, 1 até 34, 1 até 35, 1 até
36, 1 até 37, 1 até 38, 1 até 40, 1 até 41, 1 até 42, 1 até 43, 1 até 44, 1 até 45, 1 até 46 ou 1 até 47, de um polipeptídeo de acordo com a invenção, tal como as SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID
NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID
NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID
NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID
NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID
NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID
NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID
NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID
NO:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID
NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID
NO:96, SEQ ID NO:98, SEQ ID NO:100, SEQ ID NO:102, SEQ ID NO:104, SEQ ID NO:106, SEQ ID NO:108, SEQ ID NO:110, SEQ ID
NO:112, SEQ ID NO:114, SEQ ID NO:116, SEQ ID NO:118, SEQ ID
NO:120, SEQ ID NO:122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID
NO:128, SEQ ID NO:130, SEQ ID NO:132, SEQ ID NO:134, SEQ ID
NO:136, SEQ ID NO:138, SEQ ID NO:140, SEQ ID NO:142, SEQ ID
Petição 870170009999, de 15/02/2017, pág. 41/1247
32/788
ΝΟ:144,
ΝΟ:152,
ΝΟ:160,
ΝΟ:168,
ΝΟ:176,
ΝΟ:184,
ΝΟ:192,
Ν0:200,
ΝΟ:208,
ΝΟ:216,
ΝΟ:224,
ΝΟ:232,
ΝΟ:240,
ΝΟ:248,
ΝΟ:256,
ΝΟ:264,
ΝΟ:272,
ΝΟ:280,
ΝΟ:288,
ΝΟ:296,
ΝΟ:304,
ΝΟ:312,
ΝΟ:320,
ΝΟ:328,
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID
ΝΟ:146, SEQ ΝΟ:154, SEQ ΝΟ: 162, SEQ ΝΟ:170, SEQ ΝΟ:178, SEQ ΝΟ:186, SEQ ΝΟ:194, SEQ ΝΟ:202, SEQ ΝΟ:210, SEQ ΝΟ:218, SEQ ΝΟ:226, SEQ ΝΟ:234, SEQ ΝΟ:242, SEQ ΝΟ:250, SEQ ΝΟ:258, SEQ ΝΟ:266, SEQ ΝΟ:274, SEQ ΝΟ:282, SEQ ΝΟ:290, SEQ ΝΟ:298, SEQ ΝΟ:306, SEQ ΝΟ:314, SEQ ΝΟ:322, SEQ
ID ΝΟ:148, SEQ ID ΝΟ:156, SEQ ID ΝΟ:164, SEQ ID ΝΟ:172, SEQ ID ΝΟ:180, SEQ ID ΝΟ:188, SEQ ID ΝΟ:196, SEQ ID ΝΟ:204, SEQ ID ΝΟ:212, SEQ ID ΝΟ:220, SEQ ID ΝΟ:228, SEQ ID ΝΟ:236, SEQ ID ΝΟ:244, SEQ ID ΝΟ:252, SEQ ID ΝΟ:260, SEQ ID ΝΟ:268, SEQ ID ΝΟ:276, SEQ ID ΝΟ:284, SEQ ID ΝΟ:292, SEQ ID ΝΟ:300, SEQ ID ΝΟ:308, SEQ ID ΝΟ:316, SEQ ID ΝΟ:324, SEQ
ID ΝΟ:150, SEQ ID ID ΝΟ:158, SEQ ID ID ΝΟ:166, SEQ ID ID ΝΟ:174, SEQ ID ID ΝΟ:182, SEQ ID ID ΝΟ:190, SEQ ID ID ΝΟ:198, SEQ ID ID ΝΟ:206, SEQ ID ID ΝΟ:214, SEQ ID ID ΝΟ:222, SEQ ID ID ΝΟ:230, SEQ ID ID ΝΟ:238, SEQ ID ID ΝΟ:246, SEQ ID ID ΝΟ:254, SEQ ID ID ΝΟ:262, SEQ ID ID ΝΟ:270, SEQ ID ID ΝΟ:278, SEQ ID ID ΝΟ:286, SEQ ID ID ΝΟ:294, SEQ ID ID ΝΟ:302, SEQ ID ID ΝΟ:310, SEQ ID ID ΝΟ:318, SEQ ID ID ΝΟ:326, SEQ ID
ΝΟ:330, SEQ ID ΝΟ:332 ou SEQ ID ΝΟ:334. Em algumas modalidades, a invenção fornece sequências de sinais que compreendem os primeiros 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62,
63, 64, 65, 66, 67, 68, 69, 70 ou mais resíduos amino terminais de um polipeptídeo de acordo com a invenção.
Petição 870170009999, de 15/02/2017, pág. 42/1247
33/788 [0051] Em algumas modalidades, a atividade da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, compreende uma atividade específica de aproximadamente 10 até aproximadamente 12.000 unidades por miligrama de proteína. Em outras modalidades, a atividade da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, compreende uma atividade específica de aproximadamente 1000 até aproximadamente 10.000 unidades por miligrama de proteína ou de aproximadamente 5000 até aproximadamente 7500 unidades por miligrama de proteína. Alternativamente, a atividade da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, compreende uma atividade específica na faixa de aproximadamente 10 até aproximadamente 7500 unidades por miligrama de proteína ou de aproximadamente 5000 até aproximadamente 12.000 unidades por miligrama de proteína. Em algumas modalidades, a atividade da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, compreende uma atividade específica na faixa de aproximadamente 10 até aproximadamente 5000 unidades por miligrama de proteína ou de aproximadamente 7500 até aproximadamente 10.000 unidades por miligrama de proteína. Em outras modalidades, a atividade da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase compreende uma atividade específica na faixa de aproximadamente 10 até aproximadamente 2500 unidades por miligrama de proteína. Alternativamente, a atividade da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase compreende uma atividade específica na faixa de aproximadamente 10 até aproximadamente 1000 unidades por miligrama de proteína. Um exemplo de método para medir a atividade de aldolases diferentes, tais como piruvato aldolases, tais como enzimas HMG e/ou KHG aldolases, utiliza um substrato geral, 4-carbóxi-4hidróxi-2-oxoadipato (CHA). Um ensaio típico compreende 50 mM de
Petição 870170009999, de 15/02/2017, pág. 43/1247
34/788 fosfato de sódio pH 7,5, 1 mM de MgCI2, 1 mM de CHA, 10 pg/mL de D-lactato desidrogenase (LDH) de Lactobacillus leichmanii (SigmaAldrich, St. Louis, MO), 0,5 mM de NADH. O ensaio é iniciado através da adição da enzima que será medida. A liberação de piruvato, acoplada com a formação de NAD+ é monitorada continuamente em um espectrofotômetro em 340 nm. Uma unidade de atividade enzimática é definida como a quantidade que libera piruvato suficiente para diminuir a absorbância em 340 nm em 1 DO por minuto.
[0052] Em outras modalidades, a tolerância térmica da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, compreende a retenção de pelo menos metade da atividade específica da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase após ser aquecida a uma temperatura elevada, tal como uma temperatura de aproximadamente 0Ό até aproximadamente 20Ό, aproximadamente 20Ό até aproximadamente 37Ό , aproximadamente 37Ό até aproximadamente 50Ό, aproximadame nte 50Ό até aproximadamente 70Ό, aproximadamente 70Ό até aproximadamente 75Ό, aproximadamente 75Ό até aproximadament e 80Ό, aproximadamente 80Ό até aproximadamente 85Ό, apro ximadamente 85Ό até aproximadamente 90Ό, aproximadamente 90Ό até aproximadamente 95Ό, aproximadamente 95Ό até aproximada mente 100Ό, aproximadamente 100Ό até aproximadamente 11 0Ό ou maior. Alternativamente, a tolerância térmica pode compreender a reteção da atividade específica de aproximadamente 10 até aproximadamente 12.000 unidades por miligrama de proteína ou de aproximadamente 5000 até aproximadamente 10.000 unidades por miligrama de proteína, após ser aquecida a uma temperatura elevada como descrito anteriormente. Em outras modalidades, a tolerância térmica pode compreender a retenção da atividade específica na faixa de aproximadamente 10 até aproximadamente 5000 unidades por miligrama de proteína
Petição 870170009999, de 15/02/2017, pág. 44/1247
35/788 após ser aquecida a uma temperatura elevada, como descrito anteriormente.
[0053] A presente invenção refere-se a polipeptídeos isolados, sintéticos ou recombinantes de acordo com a invenção, em que os polipeptídeos compreendem pelo menos um sítio de glicosilação. Em algumas modalidades, a glicosilação pode ser uma glicosilação ligada a N. Em algumas modalidades, o polipeptídeo pode ser glicosilado após ser expresso em um hospedeiro de P. pastoris ou de S. pombe ou em uma célula hospedeira de mamífero.
[0054] Em algumas modalidades, o polipeptídeo pode manter a atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase sob condições que compreendem aproximadamente pH 6,5, pH 6, pH 5,5, pH 5, pH 4,5, pH 4,0, pH 3,5, pH 3,0 ou pH menor (mais ácido). Em outras modalidades, o polipeptídeo pode reter uma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase sob condições que compreendem aproximadamente pH 7, pH 7,5 pH 8,0, pH 8,5, pH 9, pH 9,5, pH 10, pH 10,5, pH 11,0, pH 11,5, pH 12, pH 12,5 ou pH maior (mais básico). Em algumas modalidades, o polipeptídeo pode manter uma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase após a exposição a condições que compreendem aproximadamente pH 6,5, pH 6, pH 5,5, pH 5, pH 4,5, pH 4,0, pH 3,5, pH 3,0 ou pH menor (mais ácido). Em outras modalidades, o polipeptídeo pode manter uma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase após a exposição a condições que compreendem aproximadamente pH 7, pH 7,5 pH 8,0, pH 8,5, pH 9, pH 9,5, pH 10, pH 10,5, pH 11,0, pH 11,5, pH 12, pH 12,5 ou pH maior (mais básico).
[0055] Em algumas modalidades, a enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a
Petição 870170009999, de 15/02/2017, pág. 45/1247
36/788 invenção possui atividade sob condições alcalinas, tais como as condições alcalinas dos intestinos, tais como do intestino delgado. Em algumas modalidades, o polipeptídeo pode manter atividade após a exposição ao pH ácido do estômago.
[0056] A invenção fornece preparações de proteína que compreendem um polipeptídeo (incluindo peptídeos) de acordo com a invenção, em que a preparação de proteína compreende um líquido, um sólido ou um gel. Em algumas modalidades, a invenção fornece heterodímeros que compreendem um polipeptídeo de acordo com a invenção e um segundo membro, tal como um polipeptídeo ou outro (segundo) domínio. O segundo membro do heterodímero pode ser uma enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase diferente ou uma outra proteína. Em algumas modalidades, o segundo domínio pode ser um polipeptídeo e o heterodímero pode ser uma proteína de fusão. Em algumas modalidades, o segundo domínio pode ser um epítopo ou uma marcação. Em algumas modalidades, a invenção fornece homomultímeros, incluindo, mas não limitados a homodímeros, homotrímeros, homotetrâmeros, homopentâmeros e homohexâmeros, que compreendem um polipeptídeo de acordo com a invenção.
[0057] A presente invenção refere-se a polipeptídeos imobilizados (incluindo peptídeos) que possuem atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, em que o polipeptídeo imobilizado compreende um polipeptídeo de acordo com a invenção, um polipeptídeo codificado por um ácido nucléico de acordo com a invenção ou um polipeptídeo que compreende um polipeptídeo de acordo com a invenção e um segundo domínio. Em algumas modalidades, o polipeptídeo pode ser imobilizado em uma célula, um metal, uma resina, um polímero, uma cerâmica, um vidro, um microeletrodo, uma partícula de grafite, uma conta, um gel, uma placa, um
Petição 870170009999, de 15/02/2017, pág. 46/1247
37/788 arranjo ou um tubo capilar.
[0058] A invenção fornece ainda arranjos que compreendem um ácido nucléico imobilizado de acordo com a invenção, incluindo, tal como sondas de acordo com a invenção. Em algumas modalidades, a invenção fornece ainda arranjos que compreendem um anticorpo de acordo com a invenção.
[0059] A invenção fornece anticorpos isolados, sintéticos ou recombinantes que se ligam especificamente a um polipeptídeo de acordo com a invenção ou a um polipeptídeo codificado por um ácido nucléico de acordo com a invenção. Estes anticorpos de acordo com a invenção podem ser um anticorpo monoclonal ou um policlonal. Em algumas modalidades, a invenção fornece hibridomas que compreendem um anticorpo de acordo com a invenção, tal como um anticorpo que se liga especificamente a um polipeptídeo de acordo com a invenção ou a um polipeptídeo codificado por um ácido nucléico de acordo com a invenção. Em algumas modalidades, a invenção fornece ácidos nucléicos que codificam estes anticorpos.
[0060] A invenção fornece métodos de isolamento ou de identificação de polipeptídeos que possuem atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase que compreendem as etapas de: (a) fornecimento de um anticorpo de acordo com a invenção; (b) fornecimento de uma amostra que compreende polipeptídeos; e (c) contato da amostra da etapa (b) com o anticorpo da etapa (a) sob condições em que o anticorpo pode se ligar especificamente ao polipeptídeo, isolando ou identificando assim um polipeptídeo que possui uma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase.
[0061] A invenção fornece métodos de produção de um anticorpo antienzima aldolase, tal como antipiruvato aldolase, tal como anti-HMG e/ou anti-KHG aldolase que compreendem a administração a um aniPetição 870170009999, de 15/02/2017, pág. 47/1247
38/788 mal não humano de um ácido nucléico de acordo com a invenção ou um polipeptídeo de acordo com a invenção ou subsequências do mesmo em uma quantidade suficiente para gerar uma resposta imunológica humoral, produzindo assim um anticorpo antienzima aldolase, tal como antipiruvato aldolase, tal como anti-HMG e/ou anti-KHG aldolase. Em algumas modalidades, a invenção fornece métodos de produção de uma resposta imunológica antialdolase, tal como antipiruvato aldolase, tal como anti-HMG e/ou anti-KHG aldolase (celular ou humoral) que compreendem a administração a um animal não humano de um ácido nucléico de acordo com a invenção ou de um polipeptídeo de acordo com a invenção ou subsequências do mesmo em uma quantidade suficiente para gerar uma resposta imunológica (celular ou humoral).
[0062] A invenção fornece métodos de produção de um polipeptídeo recombinante que compreendem as etapas de: (a) fornecimento de um ácido nucléico de acordo com a invenção ligado de forma operacional a um promotor; e (b) expressão do ácido nucléico da etapa (a) sob condições que permitem a expressão do polipeptídeo, produzindo assim um polipeptídeo recombinante. Em algumas modalidades, o método pode compreender ainda a transformação de uma célula hospedeira com o ácido nucléico da etapa (a) seguida pela expressão do ácido nucléico da etapa (a), produzindo assim um polipeptídeo recombinante em uma célula transformada.
[0063] A invenção fornece métodos para a identificação de um polipeptídeo que possui atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase que compreendem as etapas a seguir: (a) fornecimento de um polipeptídeo de acordo com a invenção; ou de um polipeptídeo codificado por um ácido nucléico de acordo com a invenção; (b) fornecimento do substrato da enzima aldolase, tal como da piruvato aldolase, tal como da HMG e/ou da KHG
Petição 870170009999, de 15/02/2017, pág. 48/1247
39/788 aldolase; e (c) contato do polipeptídeo ou de um fragmento ou de uma variação do mesmo da etapa (a) com o substrato da etapa (b) e detecção de um decréscimo na quantidade de substrato ou de um aumento na quantidade de um produto de reação, em que um decréscimo na quantidade do substrato ou um aumento na quantidade do produto de reação detecta um polipeptídeo que possui uma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase. Em algumas modalidades, o substrato é um carboidrato, um composto que compreende carboidrato e/ou um imitador de carboidrato.
[0064] A invenção fornece métodos para a identificação do substrato da enzima aldolase, tal como da piruvato aldolase, tal como da HMG e/ou da KHG aldolase que compreendem as etapas a seguir: (a) fornecimento de um polipeptídeo de acordo com a invenção; ou de um polipeptídeo codificado por um ácido nucléico de acordo com a invenção; (b) fornecimento de um substrato de teste; e (c) contato do polipeptídeo da etapa (a) com o substrato de teste da etapa (b) e detecção de um decréscimo na quantidade de substrato ou de um aumento na quantidade de produto de reação, em que um decréscimo na quantidade do substrato ou um aumento na quantidade de um produto de reação identifica o substrato de teste como um substrato da enzima aldolase, tal como da piruvato aldolase, da HMG e/ou da KHG aldolase.
[0065] A invenção fornece métodos de determinação do fato de um composto de teste se ligar especificamente a um polipeptídeo que compreendem as etapas a seguir: (a) expressão de um ácido nucléico ou de um vetor que compreende o ácido nucléico sob condições permissivas para a tradução do ácido nucléico em um polipeptídeo, em que o ácido nucléico compreende um ácido nucléico de acordo com a invenção ou fornecimento de um polipeptídeo de acordo com a invenPetição 870170009999, de 15/02/2017, pág. 49/1247
40/788 ção; (b) fornecimento de um composto de teste; (c) contato do polipeptídeo com o composto de teste; e (d) determinação do fato do composto de teste da etapa (b) se ligar especificamente ao polipeptídeo.
[0066] A invenção fornece métodos para a identificação de um modulador de uma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase que compreendem as etapas a seguir: (a) fornecimento de um polipeptídeo de acordo com a invenção ou de um polipeptídeo codificado por um ácido nucléico de acordo com a invenção; (b) fornecimento de um composto de teste; (c) contato do polipeptídeo da etapa (a) com o composto de teste da etapa (b) e medida de uma atividade de uma enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, em que uma alteração em na atividade da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase medida na presença do composto de teste comparada com a atividade na ausência do composto de teste fornece uma determinação de que o composto de teste modula a atividade da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase. Em algumas modalidades, a atividade da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase pode ser medida através do fornecimento de um substrato da enzima aldolase, tal como da piruvato aldolase, da HMG e/ou da KHG aldolase e da detecção de um decréscimo na quantidade do substrato ou de um aumento na quantidade de um produto de reação ou de um aumento na quantidade do substrato ou de um decréscimo na quantidade de um produto de reação. Um decréscimo na quantidade do substrato ou um aumento na quantidade do produto de reação com o composto de teste quando comparada com a quantidade de substrato ou de produto de reação sem o composto de teste identifica o composto de teste como um ativador da atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase. Um aumento
Petição 870170009999, de 15/02/2017, pág. 50/1247
41/788 na quantidade do substrato ou um decréscimo na quantidade do produto de reação com o composto de teste quando comparada com a quantidade de substrato ou de produto de reação sem o composto de teste identifica o composto de teste como um inibidor da atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase.
[0067] A invenção fornece sistemas de computador que compreendem um processador e um dispositivo de armazenamento de dados em que o dito dispositivo de armazenamento de dados tem armazenada no mesmo uma sequência de polipeptídeo ou uma sequência de ácido nucléico de acordo com a invenção (tal como um polipeptídeo ou um peptídeo codificado por um ácido nucléico de acordo com a invenção). Em algumas modalidades, o sistema de computador pode compreender ainda um algoritmo de comparação de sequências e um dispositivo de armazenamento de dados que possui pelo menos uma sequência de referência armazenada no mesmo. Em outras modalidades, o algoritmo de comparação de sequências compreende um programa de computador que indica polimorfismos. Em algumas modalidades, o sistema de computador pode compreender ainda um identificador que identifica uma ou mais características na dita sequência. Em algumas modalidades, a invenção fornece meios que podem ser lidos pelo computador que possuem armazenados nos mesmos uma sequência de polipeptídeo ou uma sequência de ácido nucléico de acordo com a invenção. Em algumas modalidades, a invenção fornece métodos para a identificação de uma característica em uma sequência que compreendem as etapas de: (a) leitura da sequência utilizando um programa de computador que identifica uma ou mais características em uma sequência, em que a sequência compreende uma sequência de polipeptídeo ou uma sequência de ácido nucléico de acordo com a invenção; e (b) identificação de uma ou mais características na sePetição 870170009999, de 15/02/2017, pág. 51/1247
42/788 quência com o programa de computador. Em algumas modalidades, a invenção fornece métodos para a comparação de uma primeira sequência com uma segunda sequência que compreendem as etapas de: (a) leitura da primeira sequência e da segunda sequência através do uso de um programa de computador que compara as sequências, em que a primeira sequência compreende uma sequência de polipeptídeo ou uma sequência de ácido nucléico de acordo com a invenção; e (b) determinação de diferenças entre a primeira sequência e a segunda sequência com o programa de computador. A etapa de determinação das diferenças entre a primeira sequência e a segunda sequência pode compreender ainda a etapa de identificação de polimorfismos. Em algumas modalidades, o método pode compreender ainda um identificador que identifica uma ou mais características em uma sequência. Em outras modalidades, o método pode compreender a leitura da primeira sequência utilizando um programa de computador e a identificação de uma ou mais características na sequência.
[0068] A invenção fornece métodos para o isolamento ou para a recuperação de um ácido nucléico que codifica um polipeptídeo que possui uma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase partindo de uma amostra, tal como uma amostra ambiental, que compreendem as etapas de: (a) fornecimento de um par de sequências iniciadoras da amplificação para a amplificação de um ácido nucléico que codifica um polipeptídeo que possui uma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, em que o par de iniciadores é capaz de amplificar um ácido nucléico de acordo com a invenção; (b) isolamento de um ácido nucléico da amostra ou tratamento da amostra de forma que o ácido nucléico na amostra seja acessível para a hibridização com o par de iniciadores para amplificação; e, (c) combinação do ácido nucléico da etapa (b) com o par de iniciadores para amplificaPetição 870170009999, de 15/02/2017, pág. 52/1247
43/788 ção da etapa (a) e amplificação do ácido nucléico da amostra, isolando ou recuperando assim um ácido nucléico que codifica um polipeptídeo que possui uma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de uma amostra. Um ou cada membro do par de sequências iniciadoras da amplificação pode compreender um oligonucleotídeo que compreende um par de sequências iniciadoras da amplificação de acordo com a invenção, tal como possuindo pelo menos aproximadamente 10 até 50 bases consecutivas de uma sequência de acordo com a invenção. Em uma modalidade da invenção, a amostra é uma amostra ambiental.
[0069] A invenção fornece métodos para o isolamento ou para a recuperação de um ácido nucléico que codifica um polipeptídeo que possui uma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de uma amostra, tal como uma amostra ambiental, que compreendem as etapas de: (a) fornecimento de uma sonda de polinucleotídeo que compreende um ácido nucléico de acordo com a invenção ou uma subsequência do mesmo; (b) isolamento de um ácido nucléico da amostra ou tratamento da amostra de forma que o ácido nucléico na amostra seja acessível para a hibridização com uma sonda de polinucleotídeo da etapa (a); (c) combinação do ácido nucléico isolado ou da amostra tratada da etapa (b) com a sonda de polinucleotídeo da etapa (a); e (d) isolamento de um ácido nucléico que se hibridiza especificamente com a sonda de polinucleotídeo da etapa (a), isolando ou recuperando assim um ácido nucléico que codifica um polipeptídeo que possui uma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de uma amostra. A amostra pode compreender uma amostra de água, uma amostra líquida, uma amostra de solo, uma amostra de ar ou uma amostra biológica. Em algumas modalidades, a amostra biológica pode ser derivada de uma célula bacteriana, uma célula de protozoário,
Petição 870170009999, de 15/02/2017, pág. 53/1247
44/788 uma célula de inseto, uma célula de levedura, uma célula vegetal, uma célula de fungo ou uma célula de mamífero. Em uma modalidade da invenção, a amostra é uma amostra ambiental.
[0070] A invenção fornece métodos de produção de uma variação de um ácido nucléico que codifica um polipeptídeo que possui uma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase que compreendem as etapas de: (a) fornecimento de um ácido nucléico molde que compreende um ácido nucléico de acordo com a invenção; e (b) modificação, deleção ou adição de um ou mais nucleotídeos na sequência molde ou uma combinação das memsas, para gerar uma variação do ácido nucléico molde. Em algumas modalidades, o método pode compreender ainda a expressão da variação de ácido nucléico para gerar uma variação do polipeptídeo da enzima aldolase, tal como da piruvato aldolase, tal como da HMG e/ou da KHG aldolase. As modificações, adições ou deleções podem ser intoduzidas através de um método que compreende PCR propensa a erros, embaralhamento, mutagênese direcionada por oligonucleotídeo, PCR de montagem, mutagênese por PCR sexual, mutagênese in vivo, mutagênese com cassete, mutagênese de conjunto recursivo, mutagênese de conjunto exponencial, mutagênese específica ao sítio, remontagem gênica, Mutagênese de Saturação de Sítio Gênico (GSSM), remontagem de ligação sintética (SLR), Mutagênese de Saturação Cromossômica (CSM) ou uma combinação dos mesmos. Em outras modalidades, as modificações, adições ou deleções são introduzidas através de um método que compreende recombinação, recombinação de sequência recursiva, mutagênese de DNA modificado com fosfotioato, mutagênese com molde contendo uracila, mutagênese de dúplex com espaços, mutagênese de reparo de combinações erradas pontuais, mutagênese com cepa hospedeira deficiente em relação ao reparo, mutagênese química, mutagênese radiogênica, mutagênese de dePetição 870170009999, de 15/02/2017, pág. 54/1247
45/788 leção, mutagênese de seleção de restrição, mutagênese de purificação de restrição, síntese de gene artificial, mutagênese de conjunto, criação de multímeros de ácidos nucléicos quiméricos e uma combinação dos mesmos.
[0071] Em algumas modalidades, o método pode ser iterativamente repetido até que uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase que possui uma atividade alterada ou diferente ou uma estabilidade alterada ou diferente daquela de um polipeptídeo codificado pelo ácido nucléico molde seja produzida. Em algumas modalidades, a variação do polipeptídeo da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase é termotolerante e mantém alguma atividade após ser exposta a uma temperatura elevada. Em outras modalidades, a variação do polipeptídeo da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase tem maior glicosilação quando comparada com a enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase codificada por um ácido nucléico molde. Alternativamente, a variação do polipeptídeo da aldolase, tal como da piruvato aldolase, tal como da HMG e/ou da KHG aldolase possui uma atividade de enzima aldolase, tal como de piruvato aldolase, tal como de HMG e/ou de KHG aldolase sob uma temperatura alta, em que a enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase codificada pelo ácido nucléico molde não é ativa sob a temperatura alta. Em algumas modalidades, o método pode ser repetido de forma iterativa até que uma sequência codificadora da enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase que possui um uso de códons alterado daquele do ácido nucléico molde seja produzida. Em outras modalidades, o método pode ser repetido de forma iterativa até um gene da enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase que possui nível maior ou menor de expressão de mensagem ou de estabiPetição 870170009999, de 15/02/2017, pág. 55/1247
46/788 lidade que o do ácido nucléico molde seja produzido.
[0072] A invenção fornece métodos para a modificação de códons em um ácido nucléico que codifica um polipeptídeo que possui uma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase para aumentar sua expressão em uma célula hospedeira, o método compreendendo as etapas a seguir: (a) fornecimento de um ácido nucléico de acordo com a invenção que codifica um polipeptídeo que possui uma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase; e, (b) identificação de um códon não preferido ou menos preferido no ácido nucléico da etapa (a) e substituição do mesmo por um códon preferido ou utilizado de forma neutra que codifica o mesmo aminoácido que o do códon substituído, em que um códon preferido é um códon superrepresentado nas sequências codificadoras em genes na célula hospedeira e um códon não preferido ou menos preferido é um códon sub-representado nas sequências codificadoras em genes na célula hospedeira, modificando assim o ácido nucléico para aumentar sua expressão em uma célula hospedeira.
[0073] A invenção fornece métodos para a modificação de códons em um ácido nucléico que codifica um polipeptídeo que possui uma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase; o método compreendendo as etapas a seguir: (a) fornecimento de um ácido nucléico de acordo com a invenção; e, (b) identificação de um códon no ácido nucléico da etapa (a) e substituição do mesmo por um códon diferente que codifica o mesmo aminoácido que o códon substituído, modificando assim os códons em um ácido nucléico que codifica uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase.
[0074] A invenção fornece métodos para a modificação de códons em um ácido nucléico que codifica um polipeptídeo que possui uma
Petição 870170009999, de 15/02/2017, pág. 56/1247
47/788 atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase para aumentar sua expressão em uma célula hospedeira, o método compreendendo as etapas a seguir: (a) fornecimento de um ácido nucléico de acordo com a invenção que codifica um polipeptídeo da enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase; e, (b) identificação de um códon não preferido ou menos preferido no ácido nucléico da etapa (a) e substituição do mesmo por um códon preferido ou utilizado de forma neutra que codifica o mesmo aminoácido que o códon substituído, em que um códon preferido é um códon super-representado nas sequências codificadoras em genes na célula hospedeira e um códon não preferido ou menos preferido é um códon sub-representado nas sequências codificadoras em genes na célula hospedeira, modificando assim o ácido nucléico para aumentar a sua expressão em uma célula hospedeira. [0075] A invenção fornece métodos para a modificação de um códon em um ácido nucléico que codifica um polipeptídeo que possui uma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase para diminuir a sua expressão em uma célula hospedeira, o método compreendendo as etapas a seguir: (a) fornecimento de um ácido nucléico de acordo com a invenção; e (b) identificação de pelo menos um códon preferido no ácido nucléico da etapa (a) e substituição do mesmo por um códon não preferido ou menos preferido que codifica o mesmo aminoácido que o códon substituído, em que um códon preferido é um códon super-representado nas sequências codificadoras em genes em uma célula hospedeira e um códon não preferido ou menos preferido é um códon sub-representado em sequências codificadoras em genes na célula hospedeira, modificando assim o ácido nucléico para diminuir a sua expressão em uma célula hospedeira. Em algumas modalidades, a célula hospedeira pode ser uma célula bacteriana, uma célula de fungo, uma célula de inPetição 870170009999, de 15/02/2017, pág. 57/1247
48/788 seto, uma célula de levedura, uma célula vegetal ou uma célula de mamífero.
[0076] A invenção fornece métodos para a produção de uma biblioteca de ácidos nucléicos que codifica um grande número de sítios ativos ou os sítios de ligação ao substrato da enzima aldolase modificados, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, em que os sítios ativos ou os sítios de ligação ao substrato modificados são derivados de um primeiro ácido nucléico que compreende uma sequência que codifica um primeiro sítio ativo ou um primeiro sítio de ligação ao substrato o método compreendendo as etapas a seguir: (a) fornecimento de um primeiro ácido nucléico que codifica um primeiro sítio ativo ou um primeiro sítio de ligação ao substrato, em que a primeira sequência de ácido nucléico compreende uma sequência que se hibridiza sob condições rigorosas a um ácido nucléico de acordo com a invenção e o ácido nucléico codifica um sítio ativo da enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase ou um sítio de ligação ao substrato da enzima aldolase, tal como da piruvato aldolase, da HMG e/ou da KHG aldolase; (b) fornecimento de um conjunto de oligonucleotídeos mutagênicos que codificam variações de aminoácidos que ocorrem naturalmente em um grande número de códons direcionados no primeiro ácido nucléico; e, (c) utilização do conjunto de oligonucleotídeos mutagênicos para gerar um conjunto de variações de ácidos nucléicos que codificam o sítio ativo ou que codificam o sítio de ligação ao substrato que codificam uma faixa de variações de aminoácidos em cada códon de aminoácido que sofreu mutação, produzindo assim uma biblioteca de ácidos nucléicos que codifica um grande número de sítios ativos ou de sítios ativos de ligação ao substrato da enzima aldolase modificados, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase. Em algumas modalidades, o método compreende a mutagênese de um primeiro ácido nucléico da etapa
Petição 870170009999, de 15/02/2017, pág. 58/1247
49/788 (a) através de um método que compreende um sistema de evolução direcionado otimizado, Mutagênese de Saturação do Sítio Gênico (GSSM), remontagem de ligação sintética (SLR), PCR propensa a erros, embaralhamento, mutagênese direcionada por oligonucleotídeo, PCR de montagem, mutagênese por PCR sexual, mutagênese in vivo, mutagênese com cassete, mutagênese de conjunto recursivo, mutagênese de conjunto exponencial, mutagênese específica ao sítio, remontagem gênica e uma combinação dos mesmos. Em outras modalidades, o método compreende a mutagênese do primeiro ácido nucléico da etapa (a) ou variações através de um método que compreende recombinação, recombinação de sequência recursiva, mutagênese de DNA modificado com fosfotioato, mutagênese com molde contendo uracila, mutagênese de dúplex com espaços, mutagênese de reparo de combinações erradas pontuais, mutagênese com cepa hospedeira deficiente em relação ao reparo, mutagênese química, mutagênese radiogênica, mutagênese de deleção, mutagênese de seleção de restrição, mutagênese de purificação de restrição, síntese de gene artificial, mutagênese de conjunto, criação de multímeros de ácidos nucléicos quiméricos e uma combinação dos mesmos.
[0077] A invenção fornece métodos para a produção de uma molécula pequena que compreendem as etapas a seguir: (a) fornecimento de um grande número de enzimas biossintéticas capazes de sintetizar ou de modificar uma molécula pequena, em que uma das enzimas compreende uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase codificada por um ácido nucléico de acordo com a invenção; (b) fornecimento de um substrato para pelo menos uma das enzimas da etapa (a); e (c) e reação do substrato da etapa (b) com as enzimas sob condições que facilitam um grande número de reações biocatalíticas para gerar uma molécula pequena através de uma série de reações biocatalíticas. Em algumas modalidades, a invenção fornePetição 870170009999, de 15/02/2017, pág. 59/1247
50/788 ce métodos para a modificação de uma molécula pequena que compreendem as etapas a seguir: (a) fornecimento de uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase, em que a enzima compreende um polipeptídeo de acordo com a invenção ou um polipeptídeo codificado por um ácido nucléico de acordo com a invenção ou uma subsequência do mesmo; (b) fornecimento de uma molécula pequena; e (c) reação da enzima da etapa (a) com a molécula pequena da etapa (b) sob condições que facilitam uma reação enzimática catalisada por uma enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, modificando assim uma molécula pequena através da reação enzimática de uma aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase. Em algumas modalidades, o método pode compreender um grande número de substratos de moléculas pequenas para a enzima da etapa (a), gerando assim uma biblioteca de moléculas pequenas modificadas através de pelo menos uma reação enzimática catalisada por uma enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase. Em algumas modalidades, o método pode compreender um grande número de enzimas adicionais sob condições que facilitam um grande número de reações biocatalíticas através das enzimas para formar uma biblioteca de moléculas pequenas modificadas produzidas através do grande número de reações enzimáticas. Em outras modalidades, o método pode compreender ainda a etapa de teste da biblioteca para determinar se uma molécula pequena modificada particular que exibe uma atividade desejada está presente dentro da biblioteca. A etapa de teste da biblioteca pode compreender ainda as etapas de eliminação de forma sistemática de todas menos uma das reações biocatalíticas utilizadas para a produção de uma parte do grande número das moléculas pequenas modificadas dentro da biblioteca através do teste da parte da molécula pequena modificada em relação à presença ou à ausência da
Petição 870170009999, de 15/02/2017, pág. 60/1247
51/788 molécula pequena modificada particular com uma atividade desejada e de identificação de pelo menos uma reação biocatalítica específica que produz a molécula pequena modificada particular de atividade desejada.
[0078] A invenção fornece métodos para a determinação de um fragmento funcional de uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase que compreendem as etapas de: (a) fornecimento de uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase, em que a enzima compreende um polipeptídeo de acordo com a invenção ou um polipeptídeo codificado por um ácido nucléico de acordo com a invenção ou uma subsequência do mesmo; e (b) deleção de um grande número de resíduos de aminoácidos da sequência da etapa (a) e teste da subsequência remanescente em relação a uma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, determinando assim um fragmento funcional de uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase. Em algumas modalidades, a atividade da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase é medida através do fornecimento de um substrato da enzima aldolase, tal como da piruvato aldolase, da HMG e/ou da KHG aldolase e da detecção de um decréscimo na quantidade do substrato ou de um aumento na quantidade de um produto de reação.
[0079] A invenção fornece métodos para engenharia de células inteiras de novos fenótipos ou modificados através do uso da análise de fluxo metabólico em tempo real, o método compreendendo as etapas a seguir: (a) produção de uma célula modificada através da modificação da composição genética de uma célula, em que a composição genética é modificada através da adição à célula de um ácido nucléico de acordo com a invenção; (b) cultivo da célula modificada para gerar um grande número de células modificadas; (c) medida de pelo menos
Petição 870170009999, de 15/02/2017, pág. 61/1247
52/788 um parâmetro metabólico da célula através do monitoramento da cultura de células da etapa (b) em tempo real; e, (d) análise dos dados da etapa (c) para determinar se o parâmetro medido difere de uma medida comparável em uma célula não modificada sob condições similares, identificando assim um fenótipo engenheirado na célula utilizando a análise de fluxo metabólico em tempo real. Em algumas modalidades, a composição genética da célula pode ser modificada através de um método que compreende a deleção de uma sequência ou a modificação de uma sequência na célula ou o nocaute da expressão de um gene. Em algumas modalidades, o método pode compreender ainda a seleção de uma célula que compreendem um fenótipo recémengenheirado. Em outras modalidades, o método pode compreender o cultivo da célula selecionada, gerando assim uma nova cepa de células que compreende um fenótipo recém-engenheirado.
[0080] A invenção fornece métodos de aumento da tolerância térmica ou da estabilidade térmica de um polipeptídeo de enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase, o método compreendendo a glicosilação de um polipeptídeo de enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase, em que o polipeptídeo compreende pelo menos trinta aminoácidos contíguos de um polipeptídeo de acordo com a invenção; ou um polipeptídeo codificado por uma sequência de ácido nucléico de acordo com a invenção, aumentando assim a tolerância térmica ou a estabilidade térmica do polipeptídeo de aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase. Em algumas modalidades, a atividade específica da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase pode ser termoestável ou termotolerante a uma temperatura na faixa de mais que aproximadamente 37Ό até aproximadamente 95Ό.
[0081] A invenção fornece métodos para a superexpressão de
Petição 870170009999, de 15/02/2017, pág. 62/1247
53/788 uma um polipeptídeo recombinante de aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase em uma célula que compreendem a expressão de um vetor que compreende um ácido nucléico que compreende um ácido nucléico de acordo com a invenção ou uma sequência de ácido nucléico de acordo com a invenção, em que as identidades de sequências são determinadas através da análise com um algoritmo de comparação de sequências ou através de inspeção visual, em que a superexpressão é realizada através do uso de um promotor de alta atividade, um vetor dicistrônico ou através da amplificação gênica do vetor.
[0082] A invenção fornece métodos de produção de uma planta transgênica que compreendem as etapas a seguir: (a) introdução de uma sequência de ácido nucléico heteróloga na célula, em que a sequência de ácido nucléico heteróloga compreende uma sequência de ácido nucléico de acordo com a invenção, produzindo assim uma célula vegetal transformada; e (b) produção de uma planta transgênica partindo da célula transformada. Em algumas modalidades, a etapa (a) pode compreender ainda a introdução da sequência de ácido nucléico heteróloga através de eletroporação ou microinjeção de protoplastos de células vegetais. Em outras modalidades, a etapa (a) pode compreender ainda a introdução da sequência de ácido nucléico heteróloga diretamente no tecido vegetal através do bombardeio de partículas de DNA. Alternativamente, a etapa (a) pode compreender ainda a introdução da sequência de ácido nucléico heteróloga no DNA da célula vegetal utilizando um hospedeiro de Agrobacterium tumefaciens. Em algumas modalidades, a célula vegetal pode ser uma célula de cana de açúcar, de beterraba, de soja, de tomate, de batata, de milho, de arroz, de trigo, de tabaco ou de cevada.
[0083] A invenção fornece métodos de expressão de uma sequência de ácido nucléico heteróloga em uma célula vegetal que comprePetição 870170009999, de 15/02/2017, pág. 63/1247
54/788 endem as etapas a seguir: (a) transformação da célula vegetal com uma sequência de ácido nucléico heteróloga ligada de forma operacional a um promotor, em que a sequência de ácido nucléico heteróloga compreende um ácido nucléico de acordo com a invenção; (b) cultivo da planta sob condições em que a sequência de ácido nucléico heteróloga é expressa na célula vegetal. Em algumas modalidades, a invenção fornece métodos de expressão de uma sequência de ácido nucléico heteróloga em uma célula vegetal que compreendem as etapas a seguir: (a) transformação da célula vegetal com uma sequência de ácido nucléico heteróloga ligada de forma operacional a um promotor, em que a sequência de ácido nucléico heteróloga compreende uma sequência de acordo com a invenção; (b) cultivo da planta sob condições em que a sequência de ácido nucléico heteróloga é expressa na célula vegetal.
[0084] A invenção fornece produtos alimentícios ou alimentos que compreendem um polipeptídeo de acordo com a invenção ou um polipeptídeo codificado por um ácido nucléico de acordo com a invenção. Em algumas modalidades, a invenção fornece alimentos, produtos alimentícios, líquidos tais como bebidas (tais como sucos de frutas ou cerveja), pães ou massas ou produtos de panificação ou precursores de bebidas (tal como mosto), que compreendem um polipeptídeo de acordo com a invenção. Em outras modalidades, a invenção fornece alimentos, produtos alimentícios ou aditivos para bebidas que compreendem um polipeptídeo de acordo com a invenção. Em algumas modalidades, a invenção fornece alimentos ou suplementos nutricionais, tais como para um ser humano ou um animal, que compreendem um polipeptídeo de acordo com a invenção, tal como um polipeptídeo codificado pelo ácido nucléico de acordo com a invenção.
[0085] Em algumas modalidades, o polipeptídeo no alimento ou no suplemento nutricional pode estar glicosilado. Em algumas modalidaPetição 870170009999, de 15/02/2017, pág. 64/1247
55/788 des, a invenção fornece matrizes de fornecimento de enzimas comestíveis que compreendem um polipeptídeo de acordo com a invenção, tal como um polipeptídeo codificado pelo ácido nucléico de acordo com a invenção. Em algumas modalidades, a matriz de fornecimento compreende um pélete. Em algumas modalidades, o polipeptídeo pode estar glicosilado. Em algumas modalidades, a atividade da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase é termotolerante. Em outras modalidades, a atividade da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase é termoestável.
[0086] A invenção fornece alimentos, produtos alimentícios ou suplementos nutricionais que compreendem um polipeptídeo de acordo com a invenção. Em algumas modalidades, a invenção fornece métodos para a utilização de uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase como um suplemento nutricional na dieta de um animal, o método compreendendo: a preparação de um suplemento nutricional contendo uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase que compreende pelo menos trinta aminoácidos contíguos de um polipeptídeo de acordo com a invenção; e a administração do suplemento nutricional a um animal. O animal pode ser um ser humano, um ruminante ou um animal monogástrico. A enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase pode ser preparada através da expressão de um polinucleotídeo que codifica a enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase em um organismo selecionado do grupo que consiste em uma bactéria, uma levedura, uma planta, um inseto, um fungo e um animal. O organismo pode ser selecionado do grupo que consiste em S. pombe, S. cerevisiae, Pichia pastoris, E. coli, Streptomyces sp., Bacillus sp. Pseudomonas sp., Aspergillus sp. e Lactobacillus SP.
Petição 870170009999, de 15/02/2017, pág. 65/1247
56/788 [0087] A invenção fornece matrizes de fornecimento de enzimas comestíveis que compreendem uma enzima aldolase recombinante termoestável, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, tal como um polipeptídeo de acordo com a invenção. Em algumas modalidades, a invenção fornece métodos para o fornecimento de um suplemento de enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase a um animal, o método compreendendo: a preparação de uma matriz de fornecimento de enzimas comestível na forma de péletes que compreende um veículo comestível granulado e uma enzima aldolase recombinante termoestável, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, em que as péletes dispersam rapidamente a enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase contida nas mesmas dentro de meios aquosos e a administração da matriz de fornecimento de enzimas comestível ao animal. A enzima aldolase recombinante, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase pode compreender um polipeptídeo de acordo com a invenção. A enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase pode ser glicosilada para fornecer estabilidade térmica nas condições de peletização. A matriz de fornecimento pode ser formada através da peletização de uma mistura que compreende um embrião de grão e uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase. As condições de peletização podem incluir a aplicação de vapor. As condições de peletização podem compreender a aplicação de uma temperatura em excesso de aproximadamente 80Ό durante aproximadamente 5 minutos e a enzima mantém uma atividade específica de pelo menos 350 até aproximadamente 900 unidades por miligrama de enzima. [0088] Em algumas modalidades, a invenção fornece composições farmacêuticas que compreendem uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase de acordo com a invenção
Petição 870170009999, de 15/02/2017, pág. 66/1247
57/788 ou um polipeptídeo codificado por um ácido nucléico de acordo com a invenção. Em algumas modalidades, a composição farmacêutica atua como um agente auxiliador digestivo.
[0089] Em algumas modalidades, um composto contendo ligação carbono-carbono é colocado em contato com um polipeptídeo de acordo com a invenção que possui atividade de enzima aldolase, tal como atividade de enzima piruvato aldolase, tal como de HMG e/ou de KHG aldolase, em um pH que varia de aproximadamente pH 3,0 até aproximadamente 9,0, aproximadamente 3,0 até aproximadamente 10,0, aproximadamente 3,0 até aproximadamente 11,0 ou mais. Em outras modalidades, um composto que contém ligação carbonocarbono é colocado em contato com a enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, a uma temperatura de pelo menos aproximadamente 55G, 60G, 65G, 70° C, 75G, 80G, 85G, 90G ou mais.
[0090] Esta descrição fornece, entre outras coisas, polipeptídeos que são úteis na facilitação de uma reação em processos para a produção de monatina, derivados de monatina e sais dos mesmos, por exemplo, na produção de ácido R-2-hidróxi 2-(indol-3ilmetil)-4-ceto glutárico (também referido como monatina R-alfa ceto ácida, precursor de R-monatina, R-MP e a forma alfa ceto de monatina), um precursor para certos estereoisômeros de monatina, tais como R,R e S,R monatina. A descrição fornece ainda métodos de produção de monatina, derivados de monatina e sais e produtos de condensação interna dos mesmos utilizando um ou mais polipeptídeos da invenção. Os métodos de síntese de R-MP, estereoisômeros de monatina e/ou estereoisômeros de derivados de monatina incluem o uso de um ou mais polipeptídeos com atividade de aldolase de qualquer uma das SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID
Petição 870170009999, de 15/02/2017, pág. 67/1247
58/788
NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID
NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID
NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID
NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID
NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID
NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID
NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID
NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID
NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID
NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID
N0:100, SEQ ΝΟ:108, SEQ Ν0:116, SEQ ΝΟ:124, SEQ ΝΟ:132, SEQ ΝΟ:140, SEQ ΝΟ:148, SEQ ΝΟ:156, SEQ ΝΟ:164, SEQ ΝΟ:172, SEQ ΝΟ:180, SEQ ΝΟ:188, SEQ ΝΟ:196, SEQ ΝΟ:204, SEQ ΝΟ:212, SEQ ΝΟ:220, SEQ ΝΟ:228, SEQ ΝΟ:236, SEQ ΝΟ:244, SEQ ΝΟ:252, SEQ
ID NO:102, SEQ ID NO:110, SEQ ID N0:118, SEQ ID NO:126, SEQ ID NO:134, SEQ ID NO:142, SEQ ID NO:150, SEQ ID NO:158, SEQ ID NO:166, SEQ ID NO:174, SEQ ID NO:182, SEQ ID NO:190, SEQ ID NO:198, SEQ ID NO:206, SEQ ID NO:214, SEQ ID NO:222, SEQ ID NO:230, SEQ ID NO:238, SEQ ID NO:246, SEQ ID NO:254, SEQ
D NO:104, SEQ D N0:112, SEQ D NO:120, SEQ D NO:128, SEQ D NO:136, SEQ D NO:144, SEQ D NO:152, SEQ D NO:160, SEQ D NO:168, SEQ D NO:176, SEQ D NO:184, SEQ D NO:192, SEQ D N0:200, SEQ D NO:208, SEQ D NO:216, SEQ D NO:224, SEQ D NO:232, SEQ D NO:240, SEQ D NO:248, SEQ D NO:256, SEQ
D NO:106, SEQ D N0:114, SEQ D NO:122, SEQ D NO:130, SEQ D NO:138, SEQ D NO:146, SEQ D NO:154, SEQ D NO:162, SEQ D NO:170, SEQ D NO:178, SEQ D NO:186, SEQ D NO:194, SEQ D NO:202, SEQ D NO:210, SEQ D NO:218, SEQ D NO:226, SEQ D NO:234, SEQ D NO:242, SEQ D NO:250, SEQ D NO:258, SEQ
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
Petição 870170009999, de 15/02/2017, pág. 68/1247
59/788
NO:260, SEQ ID NO:262, SEQ ID NO:264, SEQ ID NO:266, SEQ ID
NO:268, SEQ ID NO:270, SEQ ID NO:272, SEQ ID NO:274, SEQ ID
NO:276, SEQ ID NO:278, SEQ ID NO:280, SEQ ID NO:282, SEQ ID
NO:284, SEQ ID NO:286, SEQ ID NO:288, SEQ ID NO:290, SEQ ID
NO:292, SEQ ID NO:294, SEQ ID NO:296, SEQ ID NO:298, SEQ ID
N0:300, SEQ ID NO:302, SEQ ID NO:304, SEQ ID NO:306, SEQ ID
NO:308, SEQ ID NO:310, SEQ ID NO:312, SEQ ID NO:314, SEQ ID
NO:316, SEQ ID NO:318, SEQ ID NO:320, SEQ ID NO:322, SEQ ID
NO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID NO:330, SEQ ID
NO:332 e SEQ ID NO:334 e fragmentos ativos enzimaticamente dos mesmos.
[0091] Ainda, os métodos de síntese de R-MP, estereoisômeros de monatina e/ou estereoisômeros de derivados de monatina podem incluir o uso de um polipeptídeo com atividade de aldolase codificado por uma sequência de ácido nucléico que possui pelo menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%,
60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%,
72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%,
84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%,
96%, 97%, 98%, 99% ou mais ou identidade de sequência completa (100%) ao ácido nucléico de acordo com a invenção, incluindo as SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID
NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID
NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID
NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID
NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID
NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID
Petição 870170009999, de 15/02/2017, pág. 69/1247
60/788
NO:75, SEQ ID NO:83, SEQ ID NO:91, SEQ ID NO:99, SEQ ID NO:107, SEQ ID NO:115, SEQ ID NO:123, SEQ ID NO:131, SEQ ID NO:139, SEQ ID NO:147, SEQ ID NO:155, SEQ ID NO:163, SEQ ID NO:171, SEQ ID NO:179, SEQ ID NO:187, SEQ ID NO:195, SEQ ID NO:203, SEQ ID NO:211, SEQ ID NO:219, SEQ ID NO:227, SEQ ID NO:235, SEQ ID NO:243, SEQ ID NO:251, SEQ ID NO:259, SEQ ID NO:267, SEQ ID NO:275, SEQ ID NO:283, SEQ ID NO:291, SEQ ID NO:299, SEQ ID NO:307, SEQ ID
NO:77, SEQ NO:85, SEQ NO:93, SEQ NO:101, SEQ NO:109, SEQ NO:117, SEQ NO:125, SEQ NO:133, SEQ NO:141, SEQ NO:149, SEQ NO:157, SEQ NO:165, SEQ NO:173, SEQ NO:181, SEQ NO:189, SEQ NO:197, SEQ NO:205, SEQ NO:213, SEQ NO:221, SEQ NO:229, SEQ NO:237, SEQ NO:245, SEQ NO:253, SEQ NO:261, SEQ NO:269, SEQ NO:277, SEQ NO:285, SEQ NO:293, SEQ NO:301, SEQ NO:309, SEQ
ID NO:79, SEQ ID NO:87, SEQ ID NO:95, SEQ ID NO:103, SEQ ID NO:111, SEQ ID NO:119, SEQ ID NO:127, SEQ ID NO:135, SEQ ID NO:143, SEQ ID NO:151, SEQ ID NO:159, SEQ ID NO:167, SEQ ID NO:175, SEQ ID NO:183, SEQ ID NO:191, SEQ ID NO:199, SEQ ID NO:207, SEQ ID NO:215, SEQ ID NO:223, SEQ ID NO:231, SEQ ID NO:239, SEQ ID NO:247, SEQ ID NO:255, SEQ ID NO:263, SEQ ID NO:271, SEQ ID NO:279, SEQ ID NO:287, SEQ ID NO:295, SEQ ID NO:303, SEQ ID NO:311, SEQ
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
NO:81, SEQ NO:89, SEQ NO:97, SEQ NO:105, SEQ NO:113, SEQ NO:121, SEQ NO:129, SEQ NO:137, SEQ NO:145, SEQ NO:153, SEQ NO:161, SEQ NO:169, SEQ NO:177, SEQ NO:185, SEQ NO:193, SEQ NO:201, SEQ NO:209, SEQ NO:217, SEQ NO:225, SEQ NO:233, SEQ NO:241, SEQ NO:249, SEQ NO:257, SEQ NO:265, SEQ NO:273, SEQ NO:281, SEQ NO:289, SEQ NO:297, SEQ NO:305, SEQ NO:313, SEQ
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
Petição 870170009999, de 15/02/2017, pág. 70/1247
61/788
NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID
NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID
NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID
NO:337 e SEQ ID NO:338 ao longo de uma região de pelo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500 ou mais resíduos.
[0092] Além disso, os métodos de síntese de R-MP, estereoisômeros de monatina e/ou estereoisômeros de derivados de monatina podem incluir o uso de um polipeptídeo com atividade de aldolase codificado por uma sequência de ácido nucléico que se hibridiza sob condição rigorosa a um ácido nucléico das SEQ ID NO:1, SEQ ID NO:3,
SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ
D
NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID
NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID
NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID
NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID
NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID
NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID
NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID
NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID
NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID
NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID
NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID
NO:101, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID
NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID
NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID
Petição 870170009999, de 15/02/2017, pág. 71/1247
62/788
NO:125, SEQ ID NO:133, SEQ ID N0:141, SEQ ID NO:149, SEQ ID NO:157, SEQ ID NO:165, SEQ ID NO:173, SEQ ID N0:181, SEQ ID NO:189, SEQ ID NO:197, SEQ ID NO:205, SEQ ID NO:213, SEQ ID NO:221, SEQ ID NO:229, SEQ ID NO:237, SEQ ID NO:245, SEQ ID NO:253, SEQ ID NO:261, SEQ ID NO:269, SEQ ID NO:277, SEQ ID NO:285, SEQ ID NO:293, SEQ ID NO:301, SEQ ID NO:309, SEQ ID NO:317, SEQ ID NO:325, SEQ ID NO:333, SEQ ID NO:338.
NO:127, SEQ NO:135, SEQ NO:143, SEQ N0:151, SEQ NO:159, SEQ NO:167, SEQ NO:175, SEQ NO:183, SEQ N0:191, SEQ NO:199, SEQ NO:207, SEQ NO:215, SEQ NO:223, SEQ NO:231, SEQ NO:239, SEQ NO:247, SEQ NO:255, SEQ NO:263, SEQ NO:271, SEQ NO:279, SEQ NO:287, SEQ NO:295, SEQ NO:303, SEQ N0:311, SEQ NO:319, SEQ NO:327, SEQ NO:335, SEQ
ID NO:129, SEQ ID NO:137, SEQ ID NO:145, SEQ ID NO:153, SEQ ID N0:161, SEQ ID NO:169, SEQ ID NO:177, SEQ ID NO:185, SEQ ID NO:193, SEQ ID NO:201, SEQ ID NO:209, SEQ ID NO:217, SEQ ID NO:225, SEQ ID NO:233, SEQ ID NO:241, SEQ ID NO:249, SEQ ID NO:257, SEQ ID NO:265, SEQ ID NO:273, SEQ ID NO:281, SEQ ID NO:289, SEQ ID NO:297, SEQ ID NO:305, SEQ ID NO:313, SEQ ID NO:321, SEQ ID NO:329, SEQ D NO:336, SEQ I
ID N0:131, SEQ ID ID NO:139, SEQ ID ID NO:147, SEQ ID ID NO:155, SEQ ID ID NO:163, SEQ ID ID N0:171, SEQ ID ID NO:179, SEQ ID ID NO:187, SEQ ID ID NO:195, SEQ ID ID NO:203, SEQ ID ID N0:211, SEQ ID ID NO:219, SEQ ID ID NO:227, SEQ ID ID NO:235, SEQ ID ID NO:243, SEQ ID ID NO:251, SEQ ID ID NO:259, SEQ ID ID NO:267, SEQ ID ID NO:275, SEQ ID ID NO:283, SEQ ID ID NO:291, SEQ ID ID NO:299, SEQ ID ID NO:307, SEQ ID ID NO:315, SEQ ID ID NO:323, SEQ ID ID NO:331, SEQ ID D NO:337 e SEQ ID [0093] A invenção fornece um método, que compreende: a produção de um produto escolhido de monatina, derivados de monatina,
Petição 870170009999, de 15/02/2017, pág. 72/1247
63/788 sais dos mesmos e combinações dos mesmos em uma vide de várias etapas, em que uma reação na vide é facilitada por um ou mais polipeptídeos escolhidos dos polipeptídeos isolados ou recombinantes
2,
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D que compreendem a sequência de aminoácidos das SEQ ID NO: SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ
NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ
NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ
NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ
NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ
NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ
NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ
NO:60, SEQ ID NO:64, SEQ ID NO:66, SEQ
NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQ
NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ
NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ
D NO:18, SEQ D NO:26, SEQ D NO:34, SEQ D NO:42, SEQ D NO:50, SEQ D NO:58, SEQ D NO:68, SEQ D NO:76, SEQ D NO:84, SEQ D NO:92, SEQ
NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID NQ:100, SEQ
NO:102, SEQ ID NO:106, SEQ ID NO:108, SEQ NO:112, SEQ ID NO:114, SEQ ID NO:116, SEQ NO:120, SEQ ID NO:122, SEQ ID NO:124, SEQ NO:128, SEQ ID NO:130, SEQ ID NO:132, SEQ NO:136, SEQ ID NO:138, SEQ ID NO:140, SEQ NO:144, SEQ ID NO:146, SEQ ID NO:148, SEQ NO:152, SEQ ID NO:154, SEQ ID NO:156, SEQ NO:160, SEQ ID NO:162, SEQ ID NO:164, SEQ NO:168, SEQ ID NO:170, SEQ ID NO:172, SEQ NO:176, SEQ ID NO:178, SEQ ID NO:180, SEQ NO:184, SEQ ID NO:186, SEQ ID NO:188, SEQ NO:192, SEQ ID NO:194, SEQ ID NO:196, SEQ NO:200, SEQ ID NO:204, SEQ ID NO:206, SEQ NO:210, SEQ ID NO:212, SEQ ID NO:214, SEQ
D NO:110, SEQ D NO:118, SEQ D NO:126, SEQ D NO:134, SEQ D NO:142, SEQ D NO:150, SEQ D NO:158, SEQ D NO:166, SEQ D NO:174, SEQ D NO:182, SEQ D NO:190, SEQ D NO:198, SEQ D NO:208, SEQ D NO:216, SEQ
Petição 870170009999, de 15/02/2017, pág. 73/1247
64/788
NO:218, SEQ ID NO:220, SEQ ID NO:222, SEQ ID NO:224, SEQ ID
NO:226, SEQ ID NO:228, SEQ ID NO:230, SEQ ID NO:232, SEQ ID
NO:234, SEQ ID NO:236, SEQ ID NO:238, SEQ ID NO:240, SEQ ID
NO:242, SEQ ID NO:244, SEQ ID NO:246, SEQ ID NO:248, SEQ ID
NO:250, SEQ ID NO:252, SEQ ID NO:254, SEQ ID NO:256, SEQ ID
NO:258, SEQ ID NO:260, SEQ ID NO:262, SEQ ID NO:264, SEQ ID
NO:266, SEQ ID NO:268, SEQ ID NO:270, SEQ ID NO:272, SEQ ID
NO:274, SEQ ID NO:276, SEQ ID NO:278, SEQ ID NO:282, SEQ ID
NO:284, SEQ ID NO:286, SEQ ID NO:288, SEQ ID NO:290, SEQ ID
NO:292, SEQ ID NO:294, SEQ ID NO:296, SEQ ID NO:298, SEQ ID
N0:300, SEQ ID NO:302, SEQ ID NO:304, SEQ ID NO:306, SEQ ID
NO:308, SEQ ID NO:310, SEQ ID NO:312, SEQ ID NO:314, SEQ ID
NO:316, SEQ ID NO:318, SEQ ID NO:320, SEQ ID NO:322, SEQ ID
NO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID NO:330, SEQ ID
NO:332 ou SEQ ID NO:334 ou fragmentos ou subsequências dos mesmos que possuem atividade de aldolase. Em algumas modalidades, os fragmentos ou as subsequências dos mesmos possuem uma atividade de aldolase de pelo menos 0,2 mg MP/mg de proteína/h. Em outras modalidades, os fragmentos ou as subsequências dos mesmos possuem uma atividade de aldolase de pelo menos 0,1 mg MP/mg de proteína/h. Em algumas modalidades, a reação facilitada por um ou mais polipeptídeos de acordo com a invenção é realizada em aproximadamente 1,0 até aproximadamente 10,0 mM de MgCI2. Em outras modalidades, a reação facilitada por um ou mais polipeptídeos de acordo com a invenção é realizada em aproximadamente pH 7,0 até aproximadamente pH 11,5. Ainda em outras modalidades, a reação facilitada por um ou mais polipeptídeos de acordo com a invenção é realizada em aproximadamente 0,005% até aproximadamente 1% de detergente polissorbato.
[0094] Em algumas modalidades, a reação é uma reação entre
Petição 870170009999, de 15/02/2017, pág. 74/1247
65/788 indol-3-piruvato e uma fonte de carbono C3. Em algumas modalidades, a reação produz preferencialmente o ácido R-2-hidróxi-2-(indol-3il-metil)-4-cetoglutárico em relação ao ácido S-2-hidróxi-2-(indol-3-ilmeti I )-4-cetog I utá ri co.
[0095] Em algumas modalidades, o produto feito através da vide de várias etapas é a monatina, sais da mesma e combinações dos mesmos.
[0096] Em outras modalidades, pelo menos uma de R,R-monatina, R-S monatina ou uma combinação das mesmas é produzida em maior quantidade que S,S-monatina ou S,R-monatina na vide de várias etapas. Em algumas modalidades, a R,R monatina é produzida em maior quantidade que R,S-monatina, S,S-monatina e S,R-monatina na vide de várias etapas.
[0097] A invenção fornece um método, que compreende: a produção de um produto escolhido de monatina, derivados de monatina, sais dos mesmos e combinações dos mesmos em uma vide de várias etapas, em que uma reação na vide é facilitada por pelo menos um polipeptídeo codificado por uma sequência de ácido nucléico que compreende uma sequência que possui uma porcentagem de identidade de sequências de pelo menos 50% à SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID
NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID
NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID
NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID
NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID
NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID
NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID
Petição 870170009999, de 15/02/2017, pág. 75/1247
66/788
NO:93, SEQ ΝΟ:103, SEQ Ν0:111, SEQ Ν0:119, SEQ ΝΟ:127, SEQ ΝΟ:135, SEQ ΝΟ:143, SEQ Ν0:151, SEQ ΝΟ:159, SEQ ΝΟ:167, SEQ ΝΟ:175, SEQ ΝΟ:183, SEQ Ν0:191, SEQ ΝΟ:199, SEQ ΝΟ:209, SEQ ΝΟ:217, SEQ ΝΟ:225, SEQ ΝΟ:233, SEQ ΝΟ:241, SEQ ΝΟ:249, SEQ ΝΟ:257, SEQ ΝΟ:265, SEQ ΝΟ:273, SEQ ΝΟ:283, SEQ ΝΟ:291, SEQ ΝΟ:299, SEQ ΝΟ:307, SEQ ΝΟ:315, SEQ ΝΟ:323, SEQ ΝΟ:331, SEQ
ID NO:95, SEQ ID NO:105, SEQ ID N0:113, SEQ ID N0:121, SEQ ID NO:129, SEQ ID NO:137, SEQ ID NO:145, SEQ ID NO:153, SEQ ID N0:161, SEQ ID NO:169, SEQ ID NO:177, SEQ ID NO:185, SEQ ID NO:193, SEQ ID NO:203, SEQ ID N0:211, SEQ ID NO:219, SEQ ID NO:227, SEQ ID NO:235, SEQ ID NO:243, SEQ ID NO:251, SEQ ID NO:259, SEQ ID NO:267, SEQ ID NO:275, SEQ ID NO:285, SEQ ID NO:293, SEQ ID NO:301, SEQ ID NO:309, SEQ ID NO:317, SEQ ID NO:325, SEQ ID NO:333, SEQ
ID NO:97, SEQ ID NO:107, SEQ ID N0:115, SEQ ID NO:123, SEQ ID N0:131, SEQ ID NO:139, SEQ ID NO:147, SEQ ID NO:155, SEQ ID NO:163, SEQ ID N0:171, SEQ ID NO:179, SEQ ID NO:187, SEQ ID NO:195, SEQ ID NO:205, SEQ ID NO:213, SEQ ID NO:221, SEQ ID NO:229, SEQ ID NO:237, SEQ ID NO:245, SEQ ID NO:253, SEQ ID NO:261, SEQ ID NO:269, SEQ ID NO:277, SEQ ID NO:287, SEQ ID NO:295, SEQ ID NO:303, SEQ ID N0:311, SEQ ID NO:319, SEQ ID NO:327, SEQ ID NO:335, SEQ
ID NO:99, SEQ ID ID NO:109, SEQ ID ID N0:117, SEQ ID ID NO:125, SEQ ID ID NO:133, SEQ ID ID N0:141, SEQ ID ID NO:149, SEQ ID ID NO:157, SEQ ID ID NO:165, SEQ ID ID NO:173, SEQ ID ID N0:181, SEQ ID ID NO:189, SEQ ID ID NO:197, SEQ ID ID NO:207, SEQ ID ID NO:215, SEQ ID ID NO:223, SEQ ID ID NO:231, SEQ ID ID NO:239, SEQ ID ID NO:247, SEQ ID ID NO:255, SEQ ID ID NO:263, SEQ ID ID NO:271, SEQ ID ID NO:281, SEQ ID ID NO:289, SEQ ID ID NO:297, SEQ ID ID NO:305, SEQ ID ID NO:313, SEQ ID ID NO:321, SEQ ID ID NO:329, SEQ ID ID NO:336, SEQ ID
Petição 870170009999, de 15/02/2017, pág. 76/1247
67/788
NO:337 ou SEQ ID NO:338. Em algumas modalidades, a porcentagem de identidade de sequências é de pelo menos 95%. Em outras modalidades, a porcentagem de identidade de sequências é de 100%.
[0098] A invenção fornece um método que compreende uma reação que produz preferencialmente o ácido R-2-hidróxi-2-(indol-3-ilmetil)-4-cetoglutárico em relação ao ácido S-2-hidróxi-2-(indol-3-ilmetil)-4-cetoglutárico em que pelo menos um polipeptídeo codificado pela sequência de ácido nucléico que compreende uma sequência que possui pelo menos 95% de identidade de sequência às SEQ ID NO: 28, SEQ ID NO:116, SEQ ID NO:298, SEQ ID NO: 44, SEQ ID NO:54, SEQ ID NO: 148, SEQ ID NO: 46, SEQ ID NO:134, SEQ ID NO:142, SEQ ID NO:122, SEQ ID NO:74, SEQ ID NO: 64, SEQ ID NO: 108, SEQ ID NO:96, SEQ ID NO:126, SEQ ID NO:80, SEQ ID NO:36, SEQ ID NO:62, SEQ ID NO:112, SEQ ID NO:130, SEQ ID NO:94, SEQ ID NO:58, SEQ ID NO:50, SEQ ID NO:106, SEQ ID NO:42, SEQ ID NO:278, SEQ ID NO:162, SEQ ID NO:276, SEQ ID NO:178, SEQ ID
NO:166, SEQ ID NO:218, SEQ ID NO:224, SEQ ID NO:226, SEQ ID
NO:244, SEQ ID NO:250, SEQ ID NO:252, SEQ ID NO:264, SEQ ID
NO:268, SEQ ID NO:272, SEQ ID NO:184, SEQ ID NO:282, SEQ ID
NO:186, SEQ ID NO:192, SEQ ID NO:200, SEQ ID NO:284, SEQ ID
NO:172, SEQ ID NO:180, SEQ ID NO:168, SEQ ID NO:228, SEQ ID
NO:236, SEQ ID NO:238, SEQ ID NO:240 e SEQ ID NO:156 é utilizado para facilitar uma reação em uma vide de várias etapas.
[0099] A invenção fornece um método que compreende: a produção de um produto escolhido de monatina, derivados de monatina, sais dos mesmos e combinações dos mesmos em uma vide de várias etapas, em que uma reação na vide é facilitada por pelo menos um polipeptídeo codificado por uma sequência de ácido nucléico que compreende uma sequência que se hibridiza sob condição rigorosa a um ácido nucléico da SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ
Petição 870170009999, de 15/02/2017, pág. 77/1247
68/788
ID NO: 7, SE Q I D NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID
NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID
NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID
NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID
NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID
NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID
NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:63, SEQ ID
NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID
NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID
NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID
NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID
NO:97, SEQ ID NO:99, SEQ I D NO:103, SEQ ID NO:105, SEQ ID
NO:107, SEQ Ν0:115, SEQ ΝΟ:123, SEQ Ν0:131, SEQ ΝΟ:139, SEQ ΝΟ:147, SEQ ΝΟ:155, SEQ ΝΟ:163, SEQ Ν0:171, SEQ ΝΟ:179, SEQ ΝΟ:187, SEQ ΝΟ:195, SEQ ΝΟ:205, SEQ ΝΟ:213, SEQ ΝΟ:221, SEQ ΝΟ:229, SEQ ΝΟ:237, SEQ ΝΟ:245, SEQ
ID NO:109, SEQ ID N0:117, SEQ ID NO:125, SEQ ID NO:133, SEQ ID N0:141, SEQ ID NO:149, SEQ ID NO:157, SEQ ID NO:165, SEQ ID NO:173, SEQ ID N0:181, SEQ ID NO:189, SEQ ID NO:197, SEQ ID NO:207, SEQ ID NO:215, SEQ ID NO:223, SEQ ID NO:231, SEQ ID NO:239, SEQ ID NO:247, SEQ
D N0:111, SEQ D N0:119, SEQ D NO:127, SEQ D NO:135, SEQ D NO:143, SEQ D N0:151, SEQ D NO:159, SEQ D NO:167, SEQ D NO:175, SEQ D NO:183, SEQ D N0:191, SEQ D NO:199, SEQ D NO:209, SEQ D NO:217, SEQ D NO:225, SEQ D NO:233, SEQ D NO:241, SEQ D NO:249, SEQ
D N0:113, SEQ D N0:121, SEQ D NO:129, SEQ D NO:137, SEQ D NO:145, SEQ D NO:153, SEQ D N0:161, SEQ D NO:169, SEQ D NO:177, SEQ D NO:185, SEQ D NO:193, SEQ D NO:203, SEQ D N0:211, SEQ D NO:219, SEQ D NO:227, SEQ D NO:235, SEQ D NO:243, SEQ D NO:251, SEQ
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
Petição 870170009999, de 15/02/2017, pág. 78/1247
69/788
NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID
NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID
NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID
NO:277, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID
NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID
NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID NO:301, SEQ ID
NO:303, SEQ ID NO:305, SEQ ID NO:307, SEQ ID NO:309, SEQ ID
N0:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID
NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID
NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID
NO:335, SEQ ID NO:336, SEQ ID NO:337 ou SEQ ID NO:338.
[00100] A invenção fornece ainda um método que compreende: a produção de um produto escolhido de precursor de monatina, sais do mesmo e combinações dos mesmos, em uma vide de várias etapas, em que uma reação na vide é facilitada por um ou mais polipeptídeos escolhidos de polipeptídeos isolados ou recombinantes que compreendem a sequência de aminoácidos da SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID
NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID
NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID
NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID
NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID
NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID
NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID
NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID
NO:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID
NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID
NO:96, SEQ ID NO:98, SEQ ID NO:100, SEQ ID NO:104, SEQ ID NO:106, SEQ ID NO:108, SEQ ID NO:110, SEQ ID NO:112, SEQ ID
Petição 870170009999, de 15/02/2017, pág. 79/1247
70/788
ΝΟ:114, SEQ ΝΟ:122, SEQ ΝΟ:130, SEQ ΝΟ:138, SEQ ΝΟ:146, SEQ ΝΟ:154, SEQ ΝΟ:162, SEQ ΝΟ:170, SEQ ΝΟ:178, SEQ ΝΟ:186, SEQ ΝΟ:194, SEQ ΝΟ:204, SEQ ΝΟ:212, SEQ ΝΟ:220, SEQ ΝΟ:228, SEQ ΝΟ:236, SEQ ΝΟ:244, SEQ ΝΟ:252, SEQ ΝΟ:260, SEQ ΝΟ:268, SEQ ΝΟ:276, SEQ ΝΟ:286, SEQ ΝΟ:294, SEQ ΝΟ:302, SEQ ΝΟ:310, SEQ ΝΟ:318, SEQ ΝΟ:326, SEQ
ID NO:116, SEQ ID NO:124, SEQ ID NO:132, SEQ ID NO:140, SEQ ID NO:148, SEQ ID NO:156, SEQ ID NO:164, SEQ ID NO:172, SEQ ID NO:180, SEQ ID NO:188, SEQ ID NO:196, SEQ ID NO:206, SEQ ID NO:214, SEQ ID NO:222, SEQ ID NO:230, SEQ ID NO:238, SEQ ID NO:246, SEQ ID NO:254, SEQ ID NO:262, SEQ ID NO:270, SEQ ID NO:278, SEQ ID NO:288, SEQ ID NO:296, SEQ ID NO:304, SEQ ID NO:312, SEQ ID NO:320, SEQ D NO:328, SEQ I
ID NO:118, SEQ ID NO:126, SEQ ID NO:134, SEQ ID NO:142, SEQ ID NO:150, SEQ ID NO:158, SEQ ID NO:166, SEQ ID NO:174, SEQ ID NO:182, SEQ ID NO:190, SEQ ID NO:198, SEQ ID NO:208, SEQ ID NO:216, SEQ ID NO:224, SEQ ID NO:232, SEQ ID NO:240, SEQ ID NO:248, SEQ ID NO:256, SEQ ID NO:264, SEQ ID NO:272, SEQ ID NO:282, SEQ ID NO:290, SEQ ID NO:298, SEQ ID NO:306, SEQ ID NO:314, SEQ ID NO:322, SEQ D NO:330, SEQ II
ID NO:120, SEQ ID NO:128, SEQ ID NO:136, SEQ ID NO:144, SEQ ID NO:152, SEQ ID NO:160, SEQ ID NO:168, SEQ ID NO:176, SEQ ID NO:184, SEQ ID NO:192, SEQ ID N0:200, SEQ ID NO:210, SEQ ID NO:218, SEQ ID NO:226, SEQ ID NO:234, SEQ ID NO:242, SEQ ID NO:250, SEQ ID NO:258, SEQ ID NO:266, SEQ ID NO:274, SEQ ID NO:284, SEQ ID NO:292, SEQ ID N0:300, SEQ ID NO:308, SEQ ID NO:316, SEQ ID NO:324, SEQ > NO:332 ou SEQ
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
NO:334 ou fragmentos ou subsequências dos mesmos que possuem atividade de aldolase, em que o dito precursor de monatina, sais do mesmo e combinações dos mesmos são doces.
Petição 870170009999, de 15/02/2017, pág. 80/1247
71/788 [00101] A invenção fornece adicionalmente um método que compreende: a produção de um produto escolhido de precursor de monatina, sais do mesmo e combinações dos mesmos, em uma vide de várias etapas, em que uma reação na vide é facilitada por pelo menos um polipeptídeo codificado por uma sequência de ácido nucléico que compreende uma sequência que possui uma porcentagem de identidade de sequências de pelo menos 50% à SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ
ID NO:21, SEQ D NO:2 3, SEI □ ID NO:25 , SEQ ID NO:27, SEQ ID
NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID
NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID
NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID
NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID
NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID
NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID
NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID
NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID
NO:95, SEQ ID NO:97, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:161, SEQ ID NO:163, SEQ ID NO:169, SEQ ID NO:171, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:185, SEQ ID NO:187, SEQ ID
NO:99, SEQ ID NO:103, SEQ NO:109, SEQ ID NO:111, SEQ NO:117, SEQ ID NO:119, SEQ NO:125, SEQ ID NO:127, SEQ NO:133, SEQ ID NO:135, SEQ NO:141, SEQ ID NO:143, SEQ NO:149, SEQ ID NO:151, SEQ NO:157, SEQ ID NO:159, SEQ NO:165, SEQ ID NO:167, SEQ NO:173, SEQ ID NO:175, SEQ NO:181, SEQ ID NO:183, SEQ NO:189, SEQ ID NO:191, SEQ
D
D
D
D
D
D
D
D
D
D
D
D
Petição 870170009999, de 15/02/2017, pág. 81/1247
72/788
NO:193, SEQ ΝΟ:203, SEQ Ν0:211, SEQ ΝΟ:219, SEQ ΝΟ:227, SEQ ΝΟ:235, SEQ ΝΟ:243, SEQ ΝΟ:251, SEQ ΝΟ:259, SEQ ΝΟ:267, SEQ ΝΟ:275, SEQ ΝΟ:285, SEQ ΝΟ:293, SEQ ΝΟ:301, SEQ ΝΟ:309, SEQ ΝΟ:317, SEQ ΝΟ:325, SEQ ΝΟ:333, SEQ
ID NO:195, SEQ ID NO:205, SEQ ID NO:213, SEQ ID NO:221, SEQ ID NO:229, SEQ ID NO:237, SEQ ID NO:245, SEQ ID NO:253, SEQ ID NO:261, SEQ ID NO:269, SEQ ID NO:277, SEQ ID NO:287, SEQ ID NO:295, SEQ ID NO:303, SEQ ID N0:311, SEQ ID NO:319, SEQ ID NO:327, SEQ D NO:335, SEQ I
ID NO:197, SEQ ID NO:207, SEQ ID NO:215, SEQ ID NO:223, SEQ ID NO:231, SEQ ID NO:239, SEQ ID NO:247, SEQ ID NO:255, SEQ ID NO:263, SEQ ID NO:271, SEQ ID NO:281, SEQ ID NO:289, SEQ ID NO:297, SEQ ID NO:305, SEQ ID NO:313, SEQ ID NO:321, SEQ ID NO:329, SEQ D NO:336, SEQ II
ID NO:199, SEQ ID NO:209, SEQ ID NO:217, SEQ ID NO:225, SEQ ID NO:233, SEQ ID NO:241, SEQ ID NO:249, SEQ ID NO:257, SEQ ID NO:265, SEQ ID NO:273, SEQ ID NO:283, SEQ ID NO:291, SEQ ID NO:299, SEQ ID NO:307, SEQ ID NO:315, SEQ ID NO:323, SEQ ID NO:331, SEQ > NO:337 ou SEQ
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
NO:338, em que o dito precursor de monatina, sais do mesmo e combinações dos mesmos são doces.
[00102] A invenção fornece ainda um método, que compreende: a produção de um produto escolhido de precursor de monatina, sais do mesmo e combinações dos mesmos, em uma vide de várias etapas, em que uma reação na vide é facilitada por pelo menos um polipeptídeo codificado por uma sequência de ácido nucléico que compreende uma sequência que se hibridiza sob condição rigorosa a um ácido nucléico da SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7,
SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID
Petição 870170009999, de 15/02/2017, pág. 82/1247
73/788
NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID
NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID
NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID
NO:57, SEQ ID NO:59, SEQ ID NO:63, SEQ ID NO:65, SEQ ID
NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID
NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID
NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID
NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID
NO:99, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID
NO:109, SEQ Ν0:117, SEQ ΝΟ:125, SEQ ΝΟ:133, SEQ Ν0:141, SEQ ΝΟ:149, SEQ ΝΟ:157, SEQ ΝΟ:165, SEQ ΝΟ:173, SEQ Ν0:181, SEQ ΝΟ:189, SEQ ΝΟ:197, SEQ ΝΟ:207, SEQ ΝΟ:215, SEQ ΝΟ:223, SEQ ΝΟ:231, SEQ ΝΟ:239, SEQ ΝΟ:247, SEQ ΝΟ:255, SEQ ΝΟ:263, SEQ ΝΟ:271, SEQ
ID N0:111, SEQ ID N0:119, SEQ ID NO:127, SEQ ID NO:135, SEQ ID NO:143, SEQ ID N0:151, SEQ ID NO:159, SEQ ID NO:167, SEQ ID NO:175, SEQ ID NO:183, SEQ ID N0:191, SEQ ID NO:199, SEQ ID NO:209, SEQ ID NO:217, SEQ ID NO:225, SEQ ID NO:233, SEQ ID NO:241, SEQ ID NO:249, SEQ ID NO:257, SEQ ID NO:265, SEQ ID NO:273, SEQ
D N0:113, SEQ D N0:121, SEQ D NO:129, SEQ D NO:137, SEQ D NO:145, SEQ D NO:153, SEQ D N0:161, SEQ D NO:169, SEQ D NO:177, SEQ D NO:185, SEQ D NO:193, SEQ D NO:203, SEQ D N0:211, SEQ D NO:219, SEQ D NO:227, SEQ D NO:235, SEQ D NO:243, SEQ D NO:251, SEQ D NO:259, SEQ D NO:267, SEQ D NO:275, SEQ
D N0:115, SEQ D NO:123, SEQ D N0:131, SEQ D NO:139, SEQ D NO:147, SEQ D NO:155, SEQ D NO:163, SEQ D N0:171, SEQ D NO:179, SEQ D NO:187, SEQ D NO:195, SEQ D NO:205, SEQ D NO:213, SEQ D NO:221, SEQ D NO:229, SEQ D NO:237, SEQ D NO:245, SEQ D NO:253, SEQ D NO:261, SEQ D NO:269, SEQ D NO:277, SEQ
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
Petição 870170009999, de 15/02/2017, pág. 83/1247
74/788
NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID
NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID
NO:297, SEQ ID NO:299, SEQ ID NO:301, SEQ ID NO:303, SEQ ID
NO:305, SEQ ID NO:307, SEQ ID NO:309, SEQ ID N0:311, SEQ ID
NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID
NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID
NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ ID
NO:336, SEQ ID NO:337 ou SEQ ID NO:338, em que o dito precursor de monatina, sais do mesmo e combinações dos mesmos são doces. [00103] Em um esforço para ser conciso, sempre que intermediários/produtos forem identificados no relatório descritivo e nas reivindicações (tal como monatina, precursor de monatina ou derivado(s) de monatina) como sendo formados, o termo e/ou sais dos mesmos deve ser entendido como sendo incluído quando aplicável. Em outras palavras, por exemplo, a expressão indol-3-piruvato é convertido em MP deve ser entendida como sendo lida ácido indol-3-pirúvico é convertido em MP e/ou sais do mesmo. Um perito comum, na verdade, consideraria que sob as condições de reação mostradas os sais dos intermediários/produtos estão de fato presentes.
[00104] De acordo com algumas modalidades, o método produz uma composição de monatina ou de derivado de monatina em que o componente de monatina ou de derivado de monatina da composição inclui apenas as formas R,R e S,R de monatina ou de derivado de monatina. O termo apenas quando utilizado para indicar que apenas certos isômeros são formados, significa que a vide produziría apenas os isômeros identificados se a racemização não ocorresse. Conseqüentemente, o termo apenas não deve ser tomado como significando a ausência de outros isômeros, mas ao invés disso, um perito comum entendería que outras formas isoméricas podem estar presentes em uma quantidade relativamente pequena devido à racemização que
Petição 870170009999, de 15/02/2017, pág. 84/1247
75/788 pode ocorrer. De acordo com algumas modalidades, o método produz uma composição em que o componente de monatina ou de derivado de monatina da composição inclui apenas a forma R,R de monatina ou de derivado de monatina (exceto até a extensão que a racemização ocorre resultando em outras formas isoméricas).
[00105] Como utilizado aqui, a expressão composição de monatina significa composições que incluem um ou mais isômeros de monatina; o termo pode também significar apenas uma única forma isomérica de monatina e nada mais.
[00106] Como utilizado aqui, a expressão composição de derivado de monatina significa composições que incluem um ou mais isômeros de um derivado de monatina; o termo pode também significar apenas uma única forma isomérica do derivado de monatina e nada mais. [00107] Como utilizado aqui, a expressão derivado de monatina possui a estrutura a seguir:
Figure BR122017003017B1_D0006
[00108] em que, [00109] Ra, Rb, Rc> Ra θ Re cada um independentemente representa qualquer substituinte selecionado de um átomo de hibridização, um grupo hidroxila, um grupo C1-C3 alquila, um grupo C1-C3 alcóxi, um grupo amino ou um átomo de halogênio, tal como um átomo de iodo, um átomo de bromo, um átomo de cloro ou um átomo de flúor. Entretanto, Ra, Rb, Rc, Ra θ Re não podem ser todos simultaneamente hidrogênio. Alternativamente, Rb e Rc, e/ou Rd e Re podem juntos formar um
Petição 870170009999, de 15/02/2017, pág. 85/1247
76/788 grupo C1-C4 alquileno, respectivamente.
[00110] Como utilizado aqui, indol-3-piruvato substituído significa que um ou mais átomos de carbono do anel indol do indol-3-piruvato são independentemente substituídos por um ou mais dos grupos substituintes Ra, Rb, Rc, Rd θ Re definidos anteriormente. Entretanto, Ra, Rb, Rc, Rd θ Re não podem ser todos simultaneamente hidrogênio. Alternativamente, Rb e Rc, e/ou Rd e Re podem juntos formar um grupo C1-C4 alquileno, respectivamente.
[00111] Como utilizado aqui, triptofano substituído significa que um ou mais átomos de carbono do anel indol do triptofano é independentemente substituído por um ou mais dos grupos substituintes Ra, Rb, Rc, Rd θ Re definidos anteriormente. Entretanto, Ra, Rb, Rc, Rd θ Re não podem ser todos simultaneamente hidrogênio. Alternativamente, Rb e Rc, e/ou Rd e Re podem juntos formar um grupo C1-C4 alquileno, respectivamente. Em uma modalidade, o triptofano substituído contém o(s) mesmo(s) grupo(s) substituinte(s) no anel indol como o derivado final de monatina.
[00112] Além disso, as vias biossintéticas para a produção de monatina descritas aqui podem utilizar um triptofano substituído para produzir derivados de monatina que provavelmente são doces. Em algumas modalidades, o triptofano substituído que serão utilizados nas vias biossintéticas descritas aqui incluem triptofano clorado e 5hidroxitriptofano.
[00113] Por exemplo, os D-triptofanos clorados, que possuem similaridades estruturais com a R,R monatina, foram identificados como adoçantes não nutritivos (particularmente 6-cloro-D-triptofano). Similarmente, foi descoberto que as formas de monatina halogenadas e substituídas por hidróxi eram doces. Pedido de Patente U.S. Publicado N°2005/0118317. Os halogênios e os grupos hidroxila poderiam ser substituídos por hidrogênio, particularmente nas posições 1-4 do anel
Petição 870170009999, de 15/02/2017, pág. 86/1247
77/788 benzeno no indol de triptofano, sem interferir nas conversões subseqüentes em D- ou L-triptofano, indol-3-piruvato, MP ou monatina. Foi mostrado na literatura que os indóis substituídos são substratos para enzimas PLP e produziram triptofanos substituídos. Fukuda, D.S. e outros, Production of Substituted L-Tryptophans by Fermentation, Appl. Environ. Microbiol., 21:841-43 (1971). O halogênio não parece impedir de forma estérica o mecanismo catalítico das subunidades beta da triptofano sintase e a especificidade enanciomérica também estava intacta.
[00114] Em algumas modalidades da presente invenção, é fornecido um processo para a produção de uma composição de monatina, que inclui a produção de indol-3-piruvato partindo de L-triptofano, a produção de ácido 2-hidróxi 2-(indol-3ilmetil)-4-ceto glutárico (precursor de monatina ou MP) partindo de indol-3-piruvato e a produção de monatina partindo de MP. A reação de L-triptofano para produzir indol-3-piruvato é facilitada por uma enzima que possui maior especificidade, maior atividade ou ambas em relação ao L-triptofano que em relação a R-MP, R,R monatina ou ambos. De acordo com certas modalidades, a reação de indol-3-piruvato é facilitada por uma enzima que possui atividade de aldolase específica a R e produz conseqüentemente R-MP. De acordo com certas modalidades, é fornecida uma enzima racemase que pode facilitar a epimerização do subproduto de aminoácido da reação de triptofano partindo de uma forma isomérica em uma outra forma isomérica.
[00115] Em algumas modalidades de acordo com a invenção, é fornecido um processo para a produção de uma composição de monatina, que inclui a produção de indol-3-piruvato partindo de L-triptofano, a produção de ácido 2-hidróxi 2-(indol-3ilmetil)-4-ceto glutárico (precursor de monatina ou MP) partindo de indol-3-piruvato e a produção de monatina partindo de MP. A reação de L-triptofano para produzir
Petição 870170009999, de 15/02/2017, pág. 87/1247
78/788 indol-3-piruvato é facilitada por uma enzima que possui maior especificidade, maior atividade ou ambas em relação ao L-triptofano que em relação a R-MP, R,R monatina ou ambos e a reação de MP para formar monatina é facilitada por uma enzima, que é estereosseletiva em relação a R-MP. O termo estereosseletivo significa que uma enzima possui maior especificidade, maior atividade ou ambas em relação a um isômero - neste caso em relação a R-MP versus S-MP - que um outro. Em modalidades preferidas, uma enzima estereosseletiva possui atividade limitada em relação a um isômero quando comparada com um outro. Atividade limitada significa a atividade que é minimamente ou não perceptível, por exemplo, que é determinada de acordo com os experimentos fornecidos aqui.
[00116] Deve ser observado que, quando são feitas referências a uma série de reações tal como nos parágrafos anteriores, a invenção não requer cada etapa para ser explicitamente realizada; é suficiente que as etapas podem ser realizadas de forma implícita. Em outras palavras, por exemplo, o processo para a produção de uma composição de monatina, que inclui a produção de indol-3-piruvato partindo de Ltriptofano, a produção de ácido 2-hidróxi 2-(indol-3ilmetil)-4-ceto glutárico (precursor de monatina ou MP) partindo de indol-3-piruvato e a produção de monatina partindo de MP, em que cada reação é facilitada por uma enzima apropriada, pode ser realizado através da combinação de L-triptofano com as enzimas e do ajuste das condições de forma que as reações enumeradas poderíam ocorrer. Em tal caso o Ltriptofano podería reagir para produzir indol-3-piruvato, o indol-3piruvato produzido partindo da reação de L-triptofano podería reagir para formar o MP e o MP produzido partindo da reação de indol-3piruvato podería reagir para formar monatina. O processo podería também ser realizado, com a finalidade de exemplo, através do fornecimento de um composto que pode produzir L-triptofano, sob condiPetição 870170009999, de 15/02/2017, pág. 88/1247
79/788 ções adequadas para que a produção de L-triptofano ocorra e da combinação de tal composto com enzimas capazes de facilitar a série de reações apresentadas sob condições que seriam adequadas para que estas reações ocorressem. Como ainda um outro exemplo, o processo poderia ser realizado através do forencimento de um microorganismo engenheirado geneticamente para produzir monatina de acordo com a vide descrita e do fornecimento de condições apropriadas para que o processo de fermentação ocorra. Por exemplo, um microorganismo, que produza naturalmente grandes quantidades de L-triptofano poderia ser engenheirado geneticamente para produzir ou superproduzir uma ou mais das enzimas utilizadas para facilitar as reações na vide para monatina e condições apropriadas poderíam ser fornecidas de forma que o microorganismo produziría assim monatina.
[00117] Em outras modalidades de acordo com a invenção, é fornecido um processo para a produção de monatina, em que um substrato forma um L-aminoácido quando o L-triptofano é convertido em indol-3piruvato, o indol-3-piruvato reage para formar MP (que pode incluir tanto R-MP quanto S-MP embora inclua preferencialmente apenas ou predominantemente R-MP) e o L-aminoácido reage para regenerar (também referido aqui como reciclo) o substrato quando R-MP é convertido em R,R monatina. A reação de R-MP para formar R,R monatina é facilitada através da estereoinversão da aminotransferase tal como D-metionina aminotransferase (EC 2.6.1.41) ou uma enzima que possui atividade de D-fenilglicina aminotransferase.
[00118] Em outras modalidades de acordo com a invenção, é fornecido um processo para a produção de uma composição de monatina, que inclui a produção de D-triptofano partindo de L-triptofano, a produção de indol-3-piruvato partindo de D-triptofano, a produção de R-MP partindo de indol-3-piruvato e a produção de R,R monatina partindo de R-MP. A produção do D-triptofano partindo do L-triptofano é facilitada
Petição 870170009999, de 15/02/2017, pág. 89/1247
80/788 por uma triptofano racemase e equivalentes funcionais da mesma. Em certas modalidades adicionais, as reações de D-triptofano para formar indol-3-piruvato e de MP para formar monatina são facilitadas pela mesma enzima. Ainda em outras modalidades adicionais, a reação de indol-3-piruvato é facilitada por uma enzima que possui atividade de aldolase específica a R e conseqüentemente o R-MP é formado e as reações de D-triptofano para formar indol-3-piruvato e de R-MP para formar R,R monatina são facilitadas pela mesma enzima.
[00119] Em algumas modalidades de acordo com a invenção, é fornecido um processo para a produção de um derivado de monatina, que inclui a produção do derivado de monatina partindo de um indol-3piruvato substituído e piruvato, utilizando uma enzima que possui atividade de aldolase específica a R para catalisar a reação.
[00120] Os detalhes de uma ou mais modalidades da invenção são apresentados nas figuras em anexo e na descrição abaixo. Outras características, objetivos e vantagens de acordo com a invenção serão evidentes partindo da descrição e das figuras e das reivindicações. Como seria compreendido partindo da descrição contida aqui, a invenção é capaz de fazer modificações em várias modalidades, todas sem sair do espírito e do âmbito da presente invenção. Conseqüentemente, as figuras e a descrição detalhada devem ser consideradas como tendo natureza ilustrativa e não de restrição.
[00121] Todas as publicações, as patentes, os pedidos de patentes, as sequências do GenBank e os depósitos na ATCC, citados aqui são expressamente incorporados aqui como referência para todas as finalidades.
BREVE DESCRIÇÃO DAS FIGURAS [00122] As figuras a seguir são ilustrativas das modalidades da invenção e não significam que limitam o âmbito da invenção que é abrangido pelas reivindicações.
Petição 870170009999, de 15/02/2017, pág. 90/1247
81/788 [00123] A figura 1 é um gráfico de fluxo que mostra um exemplo de um processo enzimático para a produção de R,R monatina partindo de L-triptofano de acordo com a invenção. Neste exemplo, o processo inclui a utilização de uma L-aminotransferase (cujos exemplos incluem uma L-triptofano aminotransferase, uma aminotransferase Laromática, uma L-aspartato aminotransferase e uma L-alanina aminotransferase) na reação de L-triptofano que possui maior especificidade e/ou seletividade pelo L-triptofano como um substrato que por R-MP e/ou o processo inclui a utilização de uma L-aminoácido oxidase com atividade e/ou especificidade limitada pela R,R monatina como um substrato. N° exemplo específico representado grafi camente na figura 1, uma L-aminotransferase ou uma L-aminoácido oxidase converte Ltriptofano em indol-3-piruvato, o indol-3-piruvato é reagido com uma aldolase específica a R e piruvato para produzir monatina R-alfa-ceto ácida (R-MP) e a R-MP é convertida em R,R monatina por uma Daminotransferase ou uma D-aminoácido desidrogenase. Como mostrado na figura 1, as reações são reversíveis, mas para as finalidades da invenção, não é necessário que as reações ocorram na direção inversa.
[00124] A figura 2 é um gráfico de fluxo que mostra um exemplo de um outro process para a produção de R,R monatina de acordo com a invenção. Neste exemplo, o processo inclui a utilização de uma enzima para converter R-MP em monatina que é estereosseletiva em relação a R-MP. N°exemplo específico representado graficamente na figura 2, é mostrado que o triptofano é convertido em indol-3-piruvato em uma reação reversível. O indol-3-piruvato pode ser reagido com uma aldolase não estereoespecífica para formar de forma reversível a monatina alfa-ceto ácida (tanto R- quanto S-MP). A R-MP é convertida de forma reversível em R,R monatina através de uma Daminotransferase estereosseletiva ou uma D-aminoácido desidrogePetição 870170009999, de 15/02/2017, pág. 91/1247
82/788 nase estereosseletiva. Qualquer S-MP que é formada através da aldolase não estereoespecífica pode ser convertida de volta em indol-3piruvato se uma D-aminotransferase ou uma D-aminoácido desidrogenase estereosseletiva for utilizada. Para as finalidades da invenção, não é necessário que as reações mostradas como sendo reversíveis ocorram na direção inversa.
[00125] A figura 3 é um gráfico de fluxo que mostra um exemplo de ainda um outro processo para a produção de R,R monatina partindo de L-triptofano de acordo com a invenção. Neste exemplo, o processo inclui a conversão de L-triptofano em D-triptofano utilizando uma triptofano racemase e utilizando um produto de D-aminoácido na reação acoplada com a reação que forma indol-3-piruvato como um substrato na reação acoplada com a reação que forma R,R monatina. N° exemplo específico representado graficamente na figura 3, o L-triptofano é convertido em D-triptofano através de uma triptofano racemase em uma reação reversível. O D-triptofano é reagido com alfa-cetoglutarato (α-KG) e uma D-aminotransferase de especificidade ampla para produzir indol-3-piruvato e D-glutamato. O indol-3-piruvato é reagido com piruvato e uma aldolase específica a R e convertido em R-monatina alfa-ceto ácida (R-MP) e a R-MP é reagida com uma Daminotransferase de especificidade ampla e o D-glutamato para formar R,R monatina e alfa-cetoglutarato (α-KG). Como mostrado na figura 3, cada uma das reações é reversível, mas para as finalidades da invenção, não é necessário que as reações ocorram na direção inversa. [00126] A figura 4 é um gráfico de fluxo que mostra um exemplo de ainda um outro processo para a produção de R,R monatina partindo de L-triptofano de acordo com a invenção. Neste exemplo, o processo inclui a conversão do L-aminoácido formado na reação acoplada com a reação de L-triptofano em um D-aminoácido; este D-aminoácido atua como um doador amino para a reação em que a R-MP é convertida
Petição 870170009999, de 15/02/2017, pág. 92/1247
83/788 em R,R monatina. N° exemplo específico representado graficamente na figura 4, o L-triptofano é reagido com uma L-aminotransferase e alfa-cetoglutarato para produzir indol-3-piruvato e L-glutamato. O indol3-piruvato é reagido com piruvato e uma aldolase específica a R e convertido em R-monatina alfa-ceto ácida (R-MP) e a R-MP é reagida com uma D-aminotransferase de especificidade ampla e D-glutamato para formar R,R monatina e alfa-cetoglutarato. Como mostrado na figura 4, as reações são reversíveis, mas para as finalidades da invenção, não é necessário que as reações ocorram na direção inversa. [00127] A figura 5 é um gráfico de fluxo que mostra um exemplo de ainda um outro processo para a produção de R,R monatina partindo de L-triptofano de acordo com a invenção. Neste exemplo, o processo inclui a facilitação enzimática da conversão de R-MP em R,R monatina utilizando uma enzima de estereoinversão de forma que o Laminoácido formado pela reação acoplada à reação de L-triptofano pode ser utilizado como um substrato para a reação acoplada à reação de R-MP em R,R monatina. N°exemplo específico representado graficamente na figura 5, o L-triptofano é reagido com uma Laminotransferase e oxaloacetato, piruvato ou alfa-cetoglutarato (a-KG) para produzir indol-3-piruvato e L-aspartato (se o oxaloacetato for utilizado), L-alanina (se o piruvato for utilizado) ou L-glutamato (se o a-KG for utilizado). O indol-3-piruvato é reagido com piruvato e uma aldolase específica a R e convertido em R-monatina alfa-ceto ácida (R-MP) e a R-MP é reagida com uma aminotransferase de estereoinversão e Laspartato, L-alanina ou L-glutamato para formar R,R monatina e oxaloacetato (se o L-aspartato for utilizado), piruvato (se a L-alanina for utilizada) ou alfa-cetoglutarato (α-KG, se o L-glutamato for utilizado). Como mostrado na figura 5, as reações são reversíveis, mas para as finalidades da invenção, não é necessário que as reações ocorram na direção inversa.
Petição 870170009999, de 15/02/2017, pág. 93/1247
84/788 [00128] A figura 6 é um gráfico de fluxo que mostra um exemplo de ainda um outro processo para a produção de R,R monatina de acordo com a presente invenção. Neste exemplo, o processo inclui o reciclo do L-aminoácido produzido na reação que forma indol-3-piruvato com o D-aminoácido utilizado como um reagente com a R-MP na reação formando R,R monatina através de uma série de reações de conversão. N°exemplo específico representado graficamente na figura 6, o L-triptofano é reagido de forma reversível com uma Laminotransferase e oxaloacetato para produzir indol-3-piruvato e Laspartato. O indol-3-piruvato é reagido de uma maneira reversível com piruvato e uma aldolase específica a R e convertido em R-monatina alfa-ceto ácida (R-MP) e a R-MP é reagida de forma reversível com uma D-aminotransferase e D-alanina para formar R,R monatina e piruvato. O L-aspartato é convertido em L-alanina e CO2 utilizando uma aspartato 4-descarboxilase. A L-alanina é convertida em D-alanina com uma alanina racemase. Para as finalidades da invenção, não é necessário que as reações mostradas como sendo reversíveis ocorram na direção inversa.
[00129] A figura 7 é um gráfico de fluxo que mostra um exemplo de ainda um outro processo para a produção de R,R monatina de acordo com a presente invenção. Neste exemplo, o processo inclui empurrar a reação do L-triptofano para frente (isto é, conduzir a reação em direção à produção de indol-3-piruvato) através da conversão do subproduto de L-aminoácido de tal reação em um outro produto. Neste exemplo, o subproduto de L-aminoácido L-aspartato é convertido em L-alanina em uma reação irreversível utilizando uma descarboxilase. N° exemplo específico representado graficamente na figura 7, o Ltriptofano é reagido de forma reversível com uma L-aminotransferase e com alfa-cetoglutarato (α-KG) ou oxaloacetato para produzir indol-3piruvato e L-glutamato (se o α-KG for utilizado) ou L-aspartato (se o
Petição 870170009999, de 15/02/2017, pág. 94/1247
85/788 oxaloacetato for utilizado). O indol-3-piruvato é reagido de forma reversível com piruvato e uma aldolase específica a R e convertido em R-monatina alfa-ceto ácida (R-MP). A R-MP é reagida de uma maneira reversível com uma D-aminotransferase e um D-aminoácido para formar R,R monatina e qualquer um de oxaloacetato, piruvato ou a-KG. O L-glutamato ou o L-aspartato que era um produto da reação da Laminotransferase é convertido em 4-aminobutanoato e CO2 (se o Lglutamato for o substrato) ou em β-alanina e CO2 (se o L-aspartato for o substrato) utilizando um ácido glutâmico ou uma aspartato descarboxilase. Para as finalidades da invenção, não é necessário que as reações mostradas como sendo reversíveis ocorram na direção inversa.
[00130] A figura 8 é um gráfico de fluxo que mostra um exemplo de ainda um outro processo para a produção de R,R monatina de acordo com a presente invenção. Neste exemplo, o processo inclui o reciclo do subproduto de aminoácido da reação de L-triptofano com o reagente de aminoácido da reação de R-MP através de uma série de reações de conversão. N°exemplo específico representado graficamente na figura 8, o L-triptofano é reagido de forma reversível com uma Laminotransferase e com alfa-cetoglutarato (α-KG) para produzir indol3-piruvato e L-glutamato. O indol-3-piruvato é reagido de forma reversível com piruvato e uma aldolase específica a R e convertido em Rmonatina alfa-ceto ácida (R-MP). A R-MP é reagida de uma maneira reversível com uma D-aminotransferase e D-alanina para formar R,R monatina e piruvato. Uma L-alanina aminotransferase e o piruvato são utilizados para converter de forma reversível o L-glutamato que era um produto da reação da L-aminotransferase de volta em α-KG, com Lalanina como um co-produto. Uma alanina racemase converte de forma reversível a L-alanina na D-alanina que é útil na terceira reação, a reação da D-aminotransferase. Para as finalidades da invenção, não é
Petição 870170009999, de 15/02/2017, pág. 95/1247
86/788 necessário que as reações mostradas como sendo reversíveis ocorram na direção inversa.
[00131] A figura 9 é um diagrama em blocos de um sistema de computador.
[00132] A figura 10 é um diagrama de fluxo que ilustra uma modalidade de um processo para a comparação de uma nova sequência de nucleotídeos ou de proteína com um banco de dados de sequências com a finalidade de determinar os níveis de homologia entre a nova sequência e as sequências no banco de dados.
[00133] A figura 11 é um diagrama de fluxo que ilustra uma modalidade de um processo em um computador para a determinação do fato de duas sequências serem homólogas.
[00134] A figura 12 é um diagrama de fluxo que ilustra uma modalidade de um processo identificador 300 para a detecção da presença de uma característica em uma sequência.
[00135] As figuras 13 e 14 juntas ilustram as atividades de 58 aldolases diferentes (cada uma identificada por seu número de SEQ ID específico) na formação do precursor de monatina (MP) que é medida por LC/MS/MS.
[00136] A figura 15 ilustra o efeito de ditiotreitol sobre a produção de monatina pelo polipeptídeo com atividade de aldolase da SEQ ID NO:88.
[00137] Os símbolos de referência similares nas várias figuras indicam elementos similares.
DESCRIÇÃO DETALHADA [00138] Um número de modalidades foi descrito anteriormente e é descrito em maiores detalhes infra. As modalidades da invenção incluem um ou mais dos aspectos descritos.
Abreviações e Termos [00139] As explicações a seguir dos termos e dos métodos são forPetição 870170009999, de 15/02/2017, pág. 96/1247
87/788 necidas para descrever melhor a presente descrição e para guiar os versados na técnica na prática da presente descrição. Como utilizado aqui, incluindo significa compreendendo. Em adição, as formas no sigular um ou uma ou o ou a incluem referências no plural a não ser que o contexto determine claramente de outra maneira. Por exemplo, a referência a compreendendo uma proteína inclui uma ou um grande número de tais proteínas e a referência a compreendendo a célula inclui referência a uma ou mais células e equivalentes das mesmas conhecidas pelos versados na técnica e assim por diante. O termo aproximadamente abrange a faixa de erro experimental que ocorre em qualquer medida. A não ser que seja citado de outra maneira, é presumido que todos os números de medidas possuem a palavra aproximadamente na frente dos mesmos mesmo se a palavra aproximadamente não for expressamente utilizada.
[00140] Substituição conservativa: uma substituição de um aminoácido por um outro aminoácido em um polipeptídeo, cuja substituição possui pouco até nenhum impacto sobre a atividade do polipeptídeo. A substituição é considerada conservativa independente do fato dos aminoácidos alterados parecerem estruturalmente ou funcionalmente similares. Por exemplo, de forma ideal, um polipeptídeo de triptofano aminotransferase que inclui uma ou mais substituições conservativas mantém a atividade de triptofano aminotransferase. Pode ser produzido um polipeptídeo que contém uma ou mais substituições conservativas através da manipulação da sequência de nucleotídeos que codifica tal polipeptídeo utilizando, por exemplo, procedimentos padronizados tal como a mutagênese direcionada ao sítio ou a PCR ou outros métodos conhecidos pelos versados na técnica.
[00141] Os exemplos não-limitantes de aminoácidos que podem ser substituídos por um aminoácido original em uma proteína e que podem ser considerados como substituições conservativas se houver pouco
Petição 870170009999, de 15/02/2017, pág. 97/1247
88/788 até nenhum impacto sobre a atividade do polipeptídeo incluem: Ala substituída por ser ou thr; arg substituída por gin, his ou lys; asn substituída por glu, gin, lys, his, asp; asp substituída por asn, glu ou gin; cys substituída por ser ou ala; gin substituída por asn, glu, lys, his, asp ou arg; glu substituída por asn, gin lys ou asp; gly substituída por pro; his substituída por asn, lys, gin, arg, tyr; ile substituída por leu, met, vai, phe; leu substituída por ile, met, vai, phe; lys substituída por asn, glu, gin, his, arg; met substituída por ile, leu, vai, phe; phe substituída por trp, tyr, met, ile ou leu; ser substituída por thr, ala; thr substituída por ser ou ala; trp substituído por phe, tyr; tyr substituída por his, phe ou trp; e vai substituída por met, ile, leu.
[00142] Informação adicional sobre as substituições conservativas pode ser encontrada, dentre outros locais, em Ben-Bassat e outros, (J. Bacteriol. 169:751-7, 1987), 0'Regan e outros, (Gene 77:237-51, 1989), Sahin-Toth e outros, (Protein Sei. 3:240-7, 1994), Hochuli e outros, (Bio/Technology 6:1321-5, 1988), WO 00/67796 (Curd e outros) e em livros textos padronizados de genética e biologia molecular.
[00143] Derivado: Para as finalidades do relatório descritivo e das reivindicações, uma substância é derivada de um organismo ou uma fonte se qualquer um ou mais dos seguintes for verdadeiro: 1) a substância está presente no organismo/fonte; 2) a substância é removida do hospedeiro nativo; ou, 3) a substância é removida do hospedeiro nativo e é derivada, por exemplo, por mutagênese.
[00144] Isolado: O termo isolado como utilizado aqui se refere a qualquer substância removida de seu hospedeiro nativo; a substância não precisa estar purificada. Por exemplo, ácido nucléico isolado refere-se a um ácido nucléico que ocorre naturalmente que não está imediatamente contíguo a ambas as sequências com as quais está imediatamente contíguo (uma na extremidade a 5' e uma na extremidade a 3') no genoma que ocorre naturalmente do organismo do qual
Petição 870170009999, de 15/02/2017, pág. 98/1247
89/788 é derivado. Por exemplo, um ácido nucléico isolado pode ser, sem limitação, uma molécula de DNA recombinante de qualquer comprimento, contanto que uma das sequências de ácidos nucléicos normalmente encontradas imediatamente flanqueando tal molécula de DNA recombinante em um genoma que ocorre naturalmente seja removida ou esteja ausente. Assim, um ácido nucléico isolado inclui, sem limitação, um DNA recombinante que existe na forma de uma molécula separada (tal como um cDNA ou um fragmento de DNA genômico produzido através da PCR ou do tratamento com endonucleases de restrição) independente de outras sequências assim como DNA recombinante que é incorporado em um vetor, um plasmídeo de replicação autônoma, um vírus (tal como um retrovírus, um adenovírus ou um herpes vírus) ou no DNA genômico de um procarioto ou eucarioto. Em adição, um ácido nucléico isolado pode incluir uma molécula de DNA recombinante que faz parte de uma sequência de ácido nucléico híbrida ou de fusão.
[00145] Como utilizado aqui, o termo isolado significa que o material (tal como uma proteína ou um ácido nucléico de acordo com a invenção) é removido de seu ambiente original (tal como o ambiente natural se ocorrer naturalmente). Por exemplo, um polinucleotídeo ou um polipeptídeo que ocorre naturalmente presente em um animal vivo não está isolado, mas o mesmo polinucleotídeo ou polipeptídeo, separado de alguns ou de todos os materiais co-existentes no sistema natural, está isolado. Tais polinucleotídeos poderíam fazer parte de um vetor e/ou tais polinucleotídeos ou polipeptídeos poderíam fazer parte de uma composição e ainda estar isolados pelo fato de que tal vetor ou composição não faz parte de seu ambiente natural.
[00146] O termo isolado como utilizado aqui com referência ao ácido nucléico inclui ainda qualquer ácido nucléico que não ocorre naturalmente porque as sequências de ácidos nucléicos que não ocorPetição 870170009999, de 15/02/2017, pág. 99/1247
90/788 rem naturalmente não são encontradas na natureza e não possuem sequências imediatamente contíguas em um genoma que ocorre naturalmente. Por exemplo, o ácido nucléico que não ocorre naturalmente tal como um ácido nucléico engenheirado é considerado como sendo um ácido nucléico isolado. O ácido nucléico engenheirado pode ser feito utilizando técnicas de clonagem molecular ou de síntese química de ácidos nucléicos comuns. O ácido nucléico que não ocorre naturalmente isolado pode ser independente de outras sequências ou incorporado em um vetor, um plasmídeo de replicação autônoma, um vírus (tal como um retrovírus, um adenovírus ou um herpes vírus) ou o DNA genômico de um procarioto ou um eucarioto. Em adição, um ácido nucléico que não ocorre naturalmente pode incluir uma molécula de ácido nucléico que faz parte de uma sequência de ácido nucléico híbrida ou de fusão.
[00147] Purificado: O termo purificado como utilizado aqui não requer pureza absoluta, mas ao invés disso é pretendido como um termo relativo. Assim, por exemplo, uma preparação de polipeptídeo ou de ácido nucléico purificada pode ser uma em que o polipeptídeo ou o ácido nucléico em questão esteja em uma concentração maior que o polipeptídeo ou o ácido nucléico que estaria em seu ambiente natural dentro de um organismo ou em uma concentração maior que no ambiente do qual foi removido.
[00148] Os ácidos nucléicos individuais obtidos partindo de uma biblioteca foram purificados de forma convencional até a homogeneidade eletroforética. As sequências obtidas partindo destes clones não podiam ser obtidas diretamente partindo da biblioteca ou partindo do DNA humano total. Os ácidos nucléicos purificados de acordo com a invenção foram purificados partindo do restante do DNA genômico no organismo em pelo menos 104-106 vezes. Em algumas modalidades, o termo purificado inclui ácidos nucléicos que foram purificados do resPetição 870170009999, de 15/02/2017, pág. 100/1247
91/788 tante do DNA genômico ou de outras sequências em uma biblioteca ou outro ambiente em pelo menos uma ordem de grandeza, tal como, em algumas modalidades, duas ou três ordens ou quatro ou cinco ordens de grandeza.
[00149] Aminoácido: Aminoácido ou sequência de aminoácidos como utilizado aqui refere-se a uma sequência de oligopeptídeo, de peptídeo, de polipeptídeo ou de proteína ou a um fragmento, uma parte ou uma subunidade de qualquer um destes e a moléculas que ocorrem naturalmente ou sintéticas. Aminoácido ou sequência de aminoácidos inclui uma sequência de oligopeptídeo, de peptídeo, de polipeptídeo ou de proteína ou um fragmento, uma parte ou uma subunidade de qualquer um destes e moléculas que ocorrem naturalmente ou sintéticas. O termo polipeptídeo como utilizado aqui, refere-se a aminoácidos ligados a cada outro através de ligações peptídicas ou ligações peptídicas modificadas, isto é, isoésteres peptídicos e pode conter aminoácidos modificados sem ser os 20 aminoácidos codificados por genes. Os polipeptídeos podem ser modificados através de processos naturais, tal como o processamento pós-tradução ou através de técnicas de modificação química que são bem-conhecidas na técnica. As modificações podem ocorrer em qualquer lugar no polipeptídeo, incluindo a estrutura peptídica, as cadeias laterais de aminoácidos e os terminais amino e carboxila. Será considerado que o mesmo tipo de modificação pode estar presente nos mesmos ou em graus variáveis em vários sítios em um certo polipeptídeo. Ainda, um certo polipeptídeo pode ter muitos tipos de modificações. As modificações incluem acetilação, acilação, ADP-ribosilação, amidação, ligação covalente de flavina, ligação covalente de um porção heme, ligação covalente de um nucleotídeo ou de um derivado de nucleotídeo, ligação covalente de um lipídeo ou de um derivado de lipídeo, ligação covalente de um fosfatidilinositol, ciclização de reticulação, formação de ligaPetição 870170009999, de 15/02/2017, pág. 101/1247
92/788 ção dissulfeto, desmetilação, formação de ligações cruzadas covalentes, formação de cisteína, formação de piroglutamato, formilação, gama-carboxilação, glicosilação, formação de ancoragem de GPI, hidroxilação, iodização, metilação, miristoliação, oxidação, peguilação, processamento de glucan hidrolase, fosforilação, prenilação, racemização, selenoilação, sulfação e adição mediada por RNA de transferência de aminoácidos para a proteína tal como arginilação. (Vide Creighton, T.E., Proteins - Structure and Molecular Properties 2- Ed., W.H. Freeman and Company, Nova Iorque (1993); Posttranslational Covalent Modification of Proteins, B.C. Johnson, Ed., Academic Press, Nova Iorque, pp. 1-12 (1983)). Os peptídeos e os polipeptídeos de acordo com a invenção incluem ainda todas as formas miméticas e peptídeomiméticas, que são descritas em detalhes adicionais, abaixo.
[00150] Polipeptídeo Que Possui Uma Atividade de Aldolase: Por um polipeptídeo que possui uma atividade de aldolase entende-se um polipeptídeo que por si só ou em associação com um ou mais polipeptídeos adicionais (que possuem a mesma sequência ou uma diferente), é uma proteína com a atividade enzimática de uma aldolase. [00151] Recombinante: Polipeptídeos ou proteínas recombinantes referem-se a polipeptídeos ou proteínas produzidas através de técnicas do DNA recombinante; isto é, produzidas partindo de células transformadas por um constructo de DNA exógeno que codifica o polipeptídeo ou a proteína desejada. Os polipeptídeos ou as proteínas sintéticas são aquelas preparadas através da síntese química. Os métodos de síntese química de peptídeos em fase sólida também podem ser utilizados para sintetizar o polipeptídeo ou os fragmentos de acordo com a invenção. Tal método é conhecido na técnica desde o início dos anos 60 (Merrifield, R. B., J. Am. Chem. Soc., 85:2149-2154, 1963) (Vide também Stewart, J. M. e Young, J. D., Solid Phase Peptide
Petição 870170009999, de 15/02/2017, pág. 102/1247
93/788
Synthesis, 2- Ed., Pierce Chemical Co., Rockford, III., pp. 11-12)) e foi recentemente empregado no planejamento de peptídeos em laboratório e nos kits de síntese disponíveis comercial mente (Cambridge Research Biochemicals). Tais kits de laboratório disponíveis comercialmente foram utilizavam geralmente os ensinamentos de Η. M. Geysen e outros, Proc. Natl. Acad. Sei., USA, 81.:3998 (1984) e fornecem a síntese de peptídeos sobre as extremidades de um grande número de bastões ou pinos os quais todos são conectados a uma única placa.
[00152] Substancialmente Idêntica: A expressão substancialmente idêntica no contexto de dois ácidos nucléicos ous polipeptídeos, se refere a duas ou mais sequências que possuem, tal como pelo menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%,
71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%,
83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%,
95%, 96%, 97%, 98%, 99% ou mais de identidade de resíduos (sequência) de nucleotídeos ou de aminoácidos, quando comparadas e alinhadas para correspondência máxima, que é medida utilizando um dos algoritmos de comparação de sequências conhecidos ou através de inspeção visual. Em outras modalidades, a identidade substancial existe ao longo de uma região de pelo menos aproximadamente 100 ou mais resíduos e mais comumente as sequências são substancialmente idênticas ao longo de pelo menos aproximadamente 150 até 200 ou mais resíduos. Em algumas modalidades, as sequências são substancialmente idênticas ao longo do comprimento total das regiões codificadoras.
[00153] Adicionalmente, uma sequência de aminoácidos substancialmente idêntica é uma sequência que difere de uma sequência de referência em uma ou mais substituições, deleções ou inserções de
Petição 870170009999, de 15/02/2017, pág. 103/1247
94/788 aminoácidos conservativas ou não conservativas. Em algumas modalidades, substituição ocorre em um sítio que não é o sítio ativo da molécula ou alternativamente a substituição ocorre em um sítio que é o sítio ativo da molécula, contanto que o polipeptídeo mantenha essencialmente suas propriedades funcionais (enzimáticas). Uma substituição de aminoácido conservativa, por exemplo, substitui um aminoácido por um outro da mesma classe (tal como a substituição de um aminoácido hidrofóbico, tal como isoleucina, valina, leucina ou metionina, por um outro ou a substituição de um aminoácido polar por um outro, tal como a substituição de arginina por lisina, ácido glutâmico por ácido aspártico ou glutamina por asparagina). Um ou mais aminoácidos podem ser deletados, por exemplo, de um polipeptídeo de aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase, resultando na modificação da estrutura do polipeptídeo, sem alterar significativamente sua atividade biológica. Por exemplo, os aminoácidos amino ou carboxil terminais que não são necessários para a atividade biológica da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase podem ser removidos. As sequências de polipeptídeos modificadas de acordo com a invenção podem ser analisadas em relação à atividade biológica da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase através de qualquer número de métodos, incluindo o contato da sequência de polipeptídeo modificada com um substrato e a determinação se o polipeptídeo modificado diminui a quantidade de substrato específico no ensaio ou aumenta os bioprodutos da reação enzimática de um polipeptídeo de aldolase funcional, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase com o substrato.
[00154] Fragmento: Um fragmento como utilizado aqui em relação a uma proteína ou um polipeptídeo ou um ácido nucléico é uma parte da proteína, do polipeptídeo ou do ácido nucléico, respectivamente. Os
Petição 870170009999, de 15/02/2017, pág. 104/1247
95/788 fragmentos podem ter a mesma ou substancialmente a mesma sequência de aminoácidos ou de ácido nucléico que a sequência de proteína, de polipeptídeo ou de ácido nucléico mais longa da qual o fragmento é derivado. Os fragmentos que possuem estruturas tridimensionais diferentes quando comparados com aquelas da proteína, do polipeptídeo ou do ácido nucléico mais longo também são incluídos. Um exemplo disso, é uma molécula pró-forma, tal como uma próproteína de atividade baixa que pode ser modificada através de divagem para produzir uma enzima madura com atividade significativamente maior. Um fragmento de uma proteína ou de um polipeptídeo pode ser uma parte enzimaticamente ativa de uma proteína ou de um polipeptídeo.
[00155] Aminotransferase de Estereoinversão: Uma aminotransferase de estereoinversão é um polipeptídeo capaz de produzir preferencial ou seletivamente um produto de aminoácido quiral (tal como monatina) enquanto utiliza um substrato de quiralidade oposta como o doador de amino. Por exemplo, uma aminotransferase de estereoinversão pode ser uma D-fenilglicina aminotransferase (também chamada de D-4-hidroxifenilglicina aminotransferase) que utiliza preferencial ou seletivamente o L-glutamato como um substrato para produzir R,R monatina. Os exemplos não-limitantes de aminotransferases de estereoinversão incluem D-metionina aminotransferase (EC 2.6.1.41) e enzimas que possuem atividade de D-fenilglicina aminotransferase ou atividade de D-4-hidroxifenilglicina aminotransferase.
[00156] A presente invenção refere-se a polipeptídeos com atividade de aldolase, incluindo de piruvato tal como, sem limitação, atividade de HMG e/ou KHG aldolase, polinucleotídeos que codificam os mesmos e métodos de produção e de utilização destes polinucleotídeos e polipeptídeos. Em algumas modalidades, a invenção fornece ainda enzimas aldolase, tais como enzimas piruvato aldolase, tal como HMG
Petição 870170009999, de 15/02/2017, pág. 105/1247
96/788 e/ou KHG aldolase, polinucleotídeos que codificam estas enzimas, o uso de tais polinucleotídeos e polipeptídeos.
[00157] Em algumas modalidades, a invenção fornece aldolases modificadas ou que sofreram evolução, tais como piruvato aldolases, HMG e/ou KHG aldolases, com maior atividade específica quando comparadas com as aldolases não modificadas ou que não sofreram evolução, respectivamente.
[00158] Em algumas modalidades, são fornecidas aldolases, tal como a piruvato aldolase, tal como, sem limitação a HMG e/ou a KHG aldolase, que facilitam a produção de um 2-ceto-glutarato substituído em 3, 4. Em uma modalidade, a invenção fornece um método de produção de um 2-ceto-glutarato substituído em 3, 4 que compreende: (a) o fornecimento de um polipeptídeo que possui uma atividade de aldolase, tal como uma atividade de piruvato aldolase, tal como, sem limitação, uma atividade de HMG aldolase e/ou de KMG aldolase; (b) o fornecimento de um composto doador e de um receptor; e (c) o contato do polipeptídeo da etapa (a) com os compostos da etapa (b) sob condições em que a aldolase catalisa a síntese de um 2-ceto-glutarato substituído em 3, 4, em que opcionalmente o doador e o receptor são um piruvato ou um doador de piruvato e um receptor α-ceto ácido, uma cetona e/ou um aldeído.
[00159] Em uma outra modalidade da invenção, uma piruvato aldolase, tal como uma HMG e/ou KHG aldolase, pode ser utilizada em associação com uma D-aminotransferase para produzir um ácido Dglutâmico substituído em 4 ou um derivado do mesmo. Um ácido Dglutâmico substituído em 4 e/ou um derivado do mesmo pode ser utilizado como um antibiótico, uma vez que foi descoberto que estes compostos inibem a glutamato racemase bacteriana. Em uma modalidade, a invenção fornece um método de produção de um ácido D-glutâmico substituído em 4 que compreende: (a) o fornecimento de um polipeptíPetição 870170009999, de 15/02/2017, pág. 106/1247
97/788 deo que possui uma atividade de aldolase, tal como uma atividade de piruvato aldolase, tal como, sem limitação, uma atividade de HMG aldolase e/ou de KMG aldolase; (b) o fornecimento de um receptor aceto ácido e um piruvato ou um doador de piruvato; e (c) o contato do polipeptídeo da etapa (a) com os compostos da etapa (b) sob condições em que a aldolase catalisa a síntese de um ácido D-glutâmico substituído em 4, em que opcionalmente o polipeptídeo possui atividade de piruvato aldolase, de HMG aldolase e/ou de KHG aldolase e em que opcionalmente o método compreende ainda o uso de uma Daminotransferase.
[00160] Em algumas modalidades a invenção fornece composições (tais como preparações de enzimas, alimentos e aditivos para alimentos, produtos alimentícios e aditivos para produtos alimentícios, bebida e aditivos para bebidas, fármacos e aditivos para fármacos e suplementos dietéticos) que compreendem as enzimas, os polipeptídeos ou os polinucleotídeos de acordo com a invenção. Estas composições podem ser formuladas em uma variedade de formas, tais como na forma de líquidos, géis, pílulas, comprimidos, sprays, filmes, micelas, pós, alimento, péletes de produtos alimentícios ou formas encapsuladas, incluindo formas nanoencapsuladas.
[00161] Os ensaios para a medida da atividade de aldolase, incluindo a atividade de piruvato tal como, sem limitação, a atividade de HMG e/ou de KHG aldolase, tais como para a determinação se um polipeptídeo possui atividade de aldolase, incluindo atividade de piruvato tal como, sem limitação, atividade de HMG e/ou de KHG aldolase, são bem-conhecidos na técnica e estão dentro do âmbito de acordo com a invenção; vide E.E. Dekker & R.P. Kitson, J. Biol. Chem. 267, 1050710514, 1992; Taha TS, Deits TL, Purification and characterization of 2keto-3-deoxy-6-fosfogluconate aldolase from Azotobacter vinelandir. evidence that the enzyme is bifunctional towards 2-keto-4-hydroxy gluPetição 870170009999, de 15/02/2017, pág. 107/1247
98/788 tarate cleavage, Biochem Biophys Res Commun. Abril de 1994 15;200(1 ):459-66; Dekker EE, Kobes RD, Grady SR, 2-keto-4hydroxyglutarate aldolase from bovine liver, Methods Enzymol. 1975;42:280-5; Dekker EE, Nishihara H, Grady SR, Methods Enzymol. 1975;42:285-90, 2-keto-4-hydroxyglutarate aldolase from Escherichia colr, Nishihara H, Dekker EE, Biochim Biophys Acta. Julho de 1969 8;185(1 ):255-7, A stereospecific 2-keto-4-hydroxyglutarate aldolase from Escherichia coli. Um exemplo de um ensaio adequado para a determinação se um polipeptídeo possui atividade de aldolase, tal como atividade de piruvato aldolase, tal como de HMG e/ou de KHG aldolase é descrito no Exemplo 3.
[00162] Em algumas modalidades, as aldolases da invenção podem ser utilizadas de forma eficaz em uma variedade de condições de pH, incluindo, por exemplo, de uma faixa de aproximadamente 3,0 até aproximadamente 12,0. Em outras modalidades, as aldolases da invenção podem ser utilizadas em aproximadamente pH 3,0, 4,0, 4,5,
5,0, 5,5, 6,0, 6,5, 7,0, 7,5, 8,0, 8,5, 9,0, 9,5, 10,0, 10,5, 11,0, 11,5 ou aproximadamente 12,0. As condições de reação conduziada sob condições ácidas ou alcalinas também podem ser vantajosas, tal como em algumas aplicações industriais ou farmacêuticas de enzimas de acordo com a invenção.
[00163] A invenção refere-se a polipeptídeos de aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção em uma variedade de formas e formulações. Nos métodos de acordo com a invenção, os polipeptídeos de aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção são utilizados em uma variedade de formas e formulações. Por exemplo, os polipeptídeos purificados de aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase podem ser utilizados nas preparações de enzimas mobilizadas para a produção de áciPetição 870170009999, de 15/02/2017, pág. 108/1247
99/788 do R-2-hidróxi 2-(indol-3ilmetil)-4-ceto glutárico (R-MP) e certos estereoisômeros de monatina, tais como R,R e S,R monatina e sais dos mesmos, assim como certos estereoisômeros de derivados de monatina, tais como configurações de derivados de R,R e S,R monatina e sais dos mesmos ou em aplicações de auxílio farmacêutico ou dietético. Alternativamente, as enzimas de acordo com a invenção podem ser utilizadas diretamente em processos para produzir o ácido R-2hidróxi 2-(indol-3ilmetil)-4-ceto glutárico (R-MP) e certos estereoisômeros de monatina, tais como R,R e S,R monatina e sais dos mesmos, assim como certos estereoisômeros de derivados de monatina, tais como as configurações dos derivados de R,R e S,R monatina e sais dos mesmos, para processar alimentos, líquidos ou produtos alimentícios e similares.
[00164] Em algumas modalidades, os polipeptídeos de aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção podem ser expressos em um microorganismo utilizando procedimentos conhecidos na técnica. Em algumas modalidades, os polipeptídeos de aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção podem ser imobilizados sobre um suporte sólido antes do uso nos métodos de acordo com a invenção. Os métodos para a imobilização de enzimas sobre suportes sólidos são comumente conhecidos na técnica, por exemplo, J. Mol. Cat. B: Enzymatic 6 (1999) 29-39; Chivata e outros Biocatalysis: Immobilized cells and enzymes, J Mol. Cat. 37 (1986) 1-24: Sharma e outros, Immobilized Biomaterials Techniques and Applications, Angew. Chem. Int. Ed. Engl. 21 (1982) 837-54: Laskin (Ed.), Enzymes and Immobilized Cells in Biotechnology.
Ácidos Nucléicos, Sondas e Moléculas Inibidoras [00165] A invenção fornece ácidos nucléicos isolados e recombinantes, tais como, vide a Listagem de Sequências; ácidos nucléicos
Petição 870170009999, de 15/02/2017, pág. 109/1247
100/788 que codificam polipeptídeos, incluindo as sequências de polinucleotídeos de acordo com a invenção, tais como, vide a Listagem de Sequências; incluindo cassetes de expressão tais como vetores de expressão e vários veículos de clonagem que compreendem os ácidos nucléicos de acordo com a invenção. Em algumas modalidades, a invenção inclui ainda métodos para descobrir, identificar ou isolar novas sequências de polipeptídeos de aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase utilizando os ácidos nucléicos de acordo com a invenção. Em algumas modalidades, a invenção inclui ainda métodos para inibir a expressão de genes que codificam e produtos da transcrição de aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase utilizando os ácidos nucléicos de acordo com a invenção.
[00166] São também fornecidos métodos para a modificação dos ácidos nucléicos de acordo com a invenção, incluindo a produção de variações de ácidos nucléicos de acordo com a invenção, através de, tal como a remontagem com ligação sintética, sistema de evolução direcionada otimizada e/ou mutagênese de saturação tal como mutagênese de saturação de sítio gênico (GSSM). O termo mutagênese de saturação, Mutagênese de Saturação de Sítio Gênico ou GSSM inclui um método que utiliza iniciadores de oligonucleotídeos degenerados para introduzir mutações pontuais em um polinucleotídeo, como descrito em detalhes, abaixo. O termo sistema de evolução direcionada otimizada ou evolução direcionada otimizada inclui um método para a remontagem de fragmentos de sequências de ácidos nucléicos relacionadas, tais como genes relacionados e explicado em detalhes abaixo. O termo remontagem de ligação sintética ou SLR inclui um método de ligação de fragmentos de oligonucleotídeos de uma maneira não-estocástica e explicado em detalhes abaixo. O termo variação refere-se a polinucleotídeos ou polipeptídeos de acordo com a invenPetição 870170009999, de 15/02/2017, pág. 110/1247
101/788 ção modificados em um ou mais pares de bases, códons, íntrons, éxons ou resíduos de aminoácidos (respectivamente) e ainda mantêm a atividade biológica de uma aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase de acordo com a invenção. As variações podem ser produzidas através de qualquer número de meios incluindo métodos tais como, por exemplo, PCR propensa a erros, embaralhamento, mutagênese direcionada por oligonucleotídeo, PCR de montagem, mutagênese por PCR sexual, mutagênese in vivo, mutagênese com cassete, mutagênese de conjunto recursivo, mutagênese de conjunto exponencial, mutagênese específica ao sítio, remontagem gênica, GSSM e qualquer combinação dos mesmos.
[00167] Os ácidos nucléicos de acordo com a invenção podem ser produzidos, isolados e/ou manipulados através de, tal como clonagem e expressão de bibliotecas de cDNA, amplificação de mensagem ou DNA genômico através da PCR e similar. Por exemplo, as sequências de acordo com a invenção eram inicialmente derivadas de fontes ambientais. Assim, em algumas modalidades, a invenção fornece ácidos nucléicos que codificam a enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase e os polipeptídeos codificados pelos mesmos, preferencialmente derivados de uma fonte comum, tal como uma fonte ambiental, de cultura mista ou bacteriana.
[00168] Na prática dos métodos de acordo com a invenção, os genes homólogos podem ser modificados através da manipulação de um ácido nucléico molde, como descrito aqui. Em algumas modalidades, a invenção pode ser praticada em associação com qualquer método ou protocolo ou dispositivo conhecido na técnica, que são bem-descritos na literatura científica e de patente.
[00169] As expressões ácido nucléico ou sequência de ácido nucléico como utilizados aqui se referem a um oligonucleotídeo, um nucleotídeo, um polinucleotídeo ou a um fragmento de qualquer um desPetição 870170009999, de 15/02/2017, pág. 111/1247
102/788 tes, ao DNA ou ao RNA de origem genômica ou sintética que podem ter filamento simples ou filamento duplo e podem representar um filamento sentido ou anti-sentido (complementar), ao ácido nucléico de peptídeos (PNA) ou a qualquer material similar a DNA ou similar a RNA, de origem natural ou sintética. As expressões ácido nucléico ou sequência de ácido nucléico incluem oligonucleotídeo, nucleotídeo, polinucleotídeo ou um fragmento de qualquer um destes, DNA ou RNA (tal como mRNA, rRNA, tRNA, iRNA) de origem genômica ou sintética que podem ter filamento simples ou filamento duplo e podem representar um filamento sentido ou anti-sentido, ácido nucléico de peptídeos (PNA) ou qualquer material similar a DNA ou similar a RNA, de origem natural ou sintética, incluindo, tal como iRNA, ribonucleoproteínas (tais como iRNAs de filamento duplo, tais como iRNPs). O termo abrange ácidos nucléicos, isto é, oligonucleotídeos, que contêm análogos conhecidos de nucleotídeos naturais. O termo abrange ainda estruturas similares a ácidos nucléicos com estruturas sintéticas, vide tal como Mata (1997) Toxicol. Appl. Pharmacol. 144:189-197; StraussSoukup (1997) Biochemistry 36:8692-8698; Samstag (1996) Antisense Nucleic Acid Drug Dev 6:153-156. Oligonucleotídeo inclui um polidesoxinucleotídeo de filamento simples ou dois filamentos de polidesoxinucleotídeos complementares que podem ser sintetizados quimicamente. Tais oligonucleotídeos sintéticos não possuem fosfato a 5' e assim não se ligarão com um outro oligonucleotídeo sem a adição de um fosfato com um ATP na presença de uma quinase. Um oligonucleotídeo sintético pode se ligar a um fragmento que não foi desfosforilado.
[00170] Uma sequência codificadora de ou uma sequência de nucleotídeos que codifica um polipeptídeo ou uma proteína particular, é uma sequência de ácido nucléico que pode ser transcrita e traduzida em um polipeptídeo ou uma proteína quando colocada sob o controle
Petição 870170009999, de 15/02/2017, pág. 112/1247
103/788 de sequências reguladoras apropriadas. O termo gene significa o segmento de DNA envolvido na produção de uma cadeia de polipeptídeo; inclui regiões que precedem e após a região codificadora (líder e trailer) bem como, quando aplicável, sequências intermediárias (íntrons) entre os segmentos codificadores individuais (éxons). Uma sequência promotora está ligada de forma operacional a uma sequência codificadora quando a RNA polimerase que inicia a transcrição no promotor irá transcrever a sequência codificadora no mRNA. Ligado de forma operacional como utilizado aqui se refere a uma relação funcional entre dois ou mais segmentos de ácidos nucléicos (tal como DNA). Pode se referir à relação funcional de sequência reguladora da transcrição com uma sequência transcrita. Por exemplo, um promotor está ligado de forma operacional a uma sequência codificadora, tal como um ácido nucléico de acordo com a invenção, se estimular ou modular a transcrição da sequência codificadora em uma célula hospedeira apropriada ou outro sistema de expressão. Geralmente, as sequências promotoras reguladoras da transcrição que estão ligadas de forma operacional a uma sequência transcrita estão fisicamente contíguas à sequência transcrita, isto é, atuam em cis. Entretanto, algumas sequências reguladoras da transcrição, tais como intensificadores, não precisam estar fisicamente contíguas ou localizadas em proximidade íntima com as sequências codificadoras cuja transcrição estas aumentam.
[00171] O termo cassete de expressão como utilizado aqui se refere a uma sequência de nucleotídeos que é capaz de afetar a expressão de um gene estrutural (isto é, uma sequência que codifica proteína, tal como uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase de acordo com a invenção) em um hospedeiro compatível com tais sequências. Os cassetes de expressão incluem pelo menos um promotor ligado de forma operacional à sequência que
Petição 870170009999, de 15/02/2017, pág. 113/1247
104/788 codifica o polipeptídeo; e, opcionalmente, a outras sequências, tais como sinais de término da transcrição. Também podem ser utilizados fatores adicionais necessários ou que auxiliam a realização da expressão, tais como intensificadores, fatores alfa. Assim, os cassetes de expressão incluem ainda plasmídeos, vetores de expressão, vírus recombinantes, qualquer forma de vetor de DNA nu recombinante e similares. Um vetor compreende um ácido nucléico que pode infectar, transfectar, transduzir de forma transitória ou permanente uma célula. Será reconhecido que um vetor pode ser um ácido nucléico nu ou um ácido nucléico complexado com proteína ou lipídeo. O vetor compreende opcionalmente ácidos nucléicos e/ou proteínas e/ou membranas virais ou bacterianas (tal como uma membrana celular, um envelope lipídico viral etc.). Os vetores incluem, mas não estão limitados a replicons (tais como replicons de RNA, bacteriófagos) aos quais os fragmentos de DNA podem ser ligados e se tornar replicados. Os vetores incluem assim, mas não estão limitados a RNA, DNA ou RNA circular ou linear com autorreplicação autônoma (tais como plasmídeos, vírus e similares, vide a Patente U.S. N° 5.217.879) e incluem tanto plasmídeos de expressão quanto sem ser de expressão. Quando um microorganismo ou uma cultura de células recombinantes for descrita como um hospedeiro de um vetor de expressão isto inclui tanto DNA circular quanto linear extracromossômico e DNA que foi incorporado no(s) cromossomo(s) do hospedeiro. Quando um vetor estiver sendo mantido por uma célula hospedeira, o vetor pode ser replicado de forma estável pelas células durante a mitose na forma de uma estrutura autônoma ou é incorporado dentro do genoma do hospedeiro.
[00172] Como utilizado aqui, o termo recombinante abrange ácidos nucléicos adjacentes a um ácido nucléico estrutural ao qual não estão adjacentes em seu ambiente natural. Em algumas modalidades, enriquecer os ácidos nucléicos representará aproximadamente 5%
Petição 870170009999, de 15/02/2017, pág. 114/1247
105/788 ou mais do de insertos de ácidos nucléicos em uma população de moléculas estruturais de ácido nucléico. As moléculas estruturais de acordo com a invenção incluem ácidos nucléicos tais como vetores de expressão, ácidos nucléicos de auto-replicação, vírus, ácidos nucléicos de integração e outros vetores ou ácidos nucléicos utilizados para manter ou manipular um inserto de ácido nucléico de interesse. Em algumas modalidades, os ácidos nucléicos enriquecidos representam aproximadamente 15% ou mais do número de insertos de ácidos nucléicos na população de moléculas estruturais recombinantes. Em algumas modalidades, os ácidos nucléicos enriquecidos representam aproximadamente 50% ou mais do número de insertos de ácidos nucléicos na população de moléculas estruturais recombinantes. Em algumas modalidades, os ácidos nucléicos enriquecidos representam aproximadamente 90% ou mais do número de insertos de ácidos nucléicos na população de moléculas estruturais recombinantes.
[00173] Uma modalidade da invenção é um ácido nucléico isolado, sintético ou recombinante que compreende uma das sequências de acordo com a invenção ou um fragmento que compreende pelo menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 ou 500 ou mais bases consecutivas de um ácido nucléico de acordo com a invenção. Os ácidos nucléicos isolados, sintéticos ou recombinantes podem compreender DNA, incluindo cDNA, DNA genômico e DNA sintético. O DNA pode ter filamento duplo ou filamento simples ou se tiver filamento simples pode ser o filamento codificador ou o filamento não codificador (anti-sentido). Alternativamente, os ácidos nucléicos isolados, sintéticos ou recombinantes compreendem RNA.
[00174] Os ácidos nucléicos isolados, sintéticos ou recombinantes de acordo com a invenção podem ser utilizados para preparar um dos polipeptídeos de acordo com a invenção ou fragmentos que compreendem pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 ou 150 ou
Petição 870170009999, de 15/02/2017, pág. 115/1247
106/788 mais aminoácidos consecutivos de um dos polipeptídeos de acordo com a invenção. Conseqüentemente, uma outra modalidade da invenção é um ácido nucléico isolado, sintético ou recombinante que codifica um dos polipeptídeos de acordo com a invenção ou fragmentos que compreendem pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 ou 150 ou mais aminoácidos consecutivos de um dos polipeptídeos de acordo com a invenção. As sequências codificadoras destes ácidos nucléicos podem ser idênticas a uma das sequências codificadoras de um dos ácidos nucléicos de acordo com a invenção ou podem ser sequências codificadoras diferentes que codificam um daqueles de acordo com a invenção que possuem pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 ou 150 ou mais aminoácidos consecutivos de um dos polipeptídeos de acordo com a invenção, como um resultado da redundância ou da degeneração do código genético. O código genético é bem-conhecido pelos versados na técnica e pode ser obtido, tal como na página 214 de B. Lewin, Genes VI, Oxford University Press, 1997.
[00175] O ácido nucléico isolado que codifica um dos polipeptídeos da invenção e sequências substancialmente idênticas aos mesmos, pode incluir, mas não está limitado: à sequência codificadora de um ácido nucléico de acordo com a invenção e sequências codificadoras adicionais, tais como sequências líderes ou sequências de próproteína e sequências não codificadoras, tais como íntrons ou sequências não codificadoras a 5' e/ou a 3' da sequência codificadora. Assim, como utilizado aqui, o termo polinucleotídeo que codifica um polipeptídeo abrange um polinucleotídeo que inclui a sequência codificadora do polipeptídeo assim como um polinucleotídeo que inclui sequência codificadora e/ou não codificadora adicional.
[00176] Alternativamente, as sequências de ácidos nucléicos da invenção e as sequências substancialmente idênticas às mesmas, poPetição 870170009999, de 15/02/2017, pág. 116/1247
107/788 dem sofrer mutagênese utilizando técnicas convencionais, tal como mutagênese direcionada ou sítio ou outras técnicas familiares aos versados na técnica, para a introdução de alterações silenciosas nos polinucleotídeos o de acordo com a invenção. Como utilizado aqui, alterações silenciosas incluem, por exemplo, alterações que não modificam a sequência de aminoácidos codificada pelo polinucleotídeo. Tais alterações podem ser desejáveis com a finalidade de aumentar o nível do polipeptídeo produzido pelas células hospedeiras contendo um vetor que codifica o polipeptídeo através da introdução de códons ou de pares de códons que ocorrem freqüentemente no organismo hospedeiro.
[00177] A invenção refere-se ainda a polinucleotídeos que possuem alterações de nucleotídeos que resultam em substituições, adições, deleções, fusões e truncamentos de aminoácidos no polipeptídeos de acordo com a invenção. Tais alterações de nucleotídeos podem ser introduzidas utilizando técnicas tais como mutagênese direcionada ao sítio, mutagênese química aleatória, deleção com exonuclease III e outras técnicas do DNA recombinante. Alternativamente, tais alterações de nucleotídeos podem ser variações alélicas que ocorrem naturalmente que são isoladas através da identificação de ácidos nucléicos que se hibridizam especificamente com sondas que compreendem pelo menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 ou 500 bases consecutivas de uma das sequências de acordo com a invenção (ou as sequências complementares às mesmas) sob condições de rigor alto, moderado ou baixo que são fornecidas aqui. Técnicas Gerais [00178] Os ácidos nucléicos utilizados para a prática desta invenção, seja RNA, si RNA, mi RNA, ácido nucléico anti-sentido, cDNA, DNA genômico, vetores, vírus ou híbridos dos mesmos, podem ser isolados partindo de uma variedade de fontes, engenheiradas genetiPetição 870170009999, de 15/02/2017, pág. 117/1247
108/788 camente, amplificadas e/ou expressas/geradas de forma recombinante. Os polipeptídeos recombinantes (tais como as enzimas aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase) gerados partindo destes ácidos nucléicos podem ser isolados individualmente ou clonados e testados em relação a uma atividade desejada. Qualquer sistema de expressão recombinante pode ser utilizado, incluindo sistemas de expressão em células de bactéria, de mamífero, de levedura, de inseto ou de planta.
[00179] Alternativamente, estes ácidos nucléicos podem ser sintetizados in vitro através de técnicas de síntese química bem-conhecidas, como descrito, tal como, em Adams (1983) J. Am. Chem. Soc. 105:661; Belousov (1997) Nucleic Acids Res. 25:3440-3444; Frenkel (1995) Free Radie. Biol. Med. 19:373-380; Blommers (1994) Biochemistry 33:7886-7896; Narang (1979) Meth. Enzymol. 68:90; Brown (1979) Meth. Enzymol. 68:109; Beaucage (1981) Tetra. Lett. 22:1859; Patente U.S. N°4.458.066.
[00180] As técnicas para a manipulação de ácidos nucléicos, tais como subclonagem, sondas de marcação (tal como marcação com iniciador aleatório utilizando polimerase de Klenow, tradução com pequenos cortes, amplificação), seqüenciamento, hibridização e similares são bem-descritas na literatura científica e de patente, vide Sambrook, ed., MOLECULAR CLONING: A LABORATORY MANUAL (2ã ED.), Vols. 1-3, Cold Spring Harbor Laboratory, (1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, Ausubel, ed. John Wiley & Sons, Inc., Nova Iorque (1997); LABORATORY TECHNIQUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY: HYBRIDIZATION WITH NUCLEIC ACID PROBES, Parte I. Theory and Nucleic Acid Preparation, Tijssen, ed. Elsevier, N.Y. (1993).
[00181] Um outro meio útil de obtenção e de manipulação de ácidos nucléicos utilizado para a prática dos métodos de acordo com a invenPetição 870170009999, de 15/02/2017, pág. 118/1247
109/788 ção é a clonagem partindo de amostras genômicas e, se desejado, a seleção e a reclonagem de insertos isolados ou amplificados partindo de, tal como clones genômicos ou clones de cDNA. As fontes de ácido nucléico utilizadas nos métodos de acordo com a invenção incluem bibliotecas genômicas ou de cDNA contidas em, tal como cromossomos artificiais de mamífero (MACs). Vide as Patentes U.S. N— 5.721.118; 6.025.155; cromossomos artificiais humanos, vide Rosenfeld (1997) Nat. Genet. 15:333-335; cromossomos artificiais de levedura (YAC); cromossomos artificiais de bactéria (BAC); cromossomos artificiais P1, vide Woon (1998) Genomics 50:306-316; vetores derivados de P1 (PACs), vide Kern (1997) Biotechniques 23:120-124; cosmídeos, vírus recombinantes, fagos ou plasmídeos.
[00182] Em algumas modalidades, um ácido nucléico que codifica um polipeptídeo de acordo com a invenção é montado em uma fase apropriada com uma sequência líder capaz de direcionar a secreção do polipeptídeo traduzido ou de fragmento do mesmo.
[00183] A invenção fornece proteínas de fusão e ácidos nucléicos que codificam as mesmas. Um polipeptídeo de acordo com a invenção pode ser fundido com um peptídeo ou um polipeptídeo heterólogo, tal como peptídeos com identificação N-terminal que conferem características desejadas, tal como maior estabilidade ou purificação simplificada. Os peptídeos e os polipeptídeos de acordo com a invenção também podem ser sintetizados e expressos na forma de proteínas de fusão com um ou mais domínios adicionais ligados aos mesmos para, tal como a produção de um peptídeo mais imunogênico, para isolar mais facilmente um peptídeo sintetizado de forma recombinante, para identificar e isolar anticorpos e células B que expressam anticorpos e similares. Os domínios que facilitam a detecção e a purificação incluem, tais como peptídeos que quelam metais tais como extensões de polihistidina e módulos de histidina-triptofano que permitem a purificação sobre
Petição 870170009999, de 15/02/2017, pág. 119/1247
110/788 metais imobilizados, domínios de proteína A que permitem a purificação sobre imunoglobulina imobilizada e o domínio utilizado no sistema de extensão/purificação por afinidade de FLAGS (Immunex Corp, Seattle WA). A inclusão de sequências ligantes que podem ser clivadas tal como o Fator Xa ou a enteroquinase (Invitrogen, Carlsbad, CA) entre um domínio de purificação e o peptídeo ou o polipeptídeo que compreende o motivo para facilitar a purificação. Por exemplo, um vetor de expressão pode incluir uma sequência de ácido nucléico que codifica um epítopo ligada a seis resíduos de histidina seguida por uma tiorredoxina e um sítio de divagem da enteroquinase (vide tal como Williams (1995) Biochemistry 34:1787-1797; Dobeli (1998) Protein Expr. Purif. 12:404-414). Os resíduos de histidina facilitam a detecção e a purificação enquanto o sítio de divagem da enteroquinase fornece meios para a purificação do epítopo partindo do restante da proteína de fusão. A tecnologia relativa aos vetores que codificam proteínas de fusão e a aplicação das proteínas de fusão são bemdescritas na literatura científica e de patente, vide tal como Kroll (1993) DNACell. Biol., 12:441-53.
Sequências de Controle da Transcrição e da Tradução [00184] A invenção fornece sequências de ácidos nucléicos (tais como DNA) de acordo com a invenção ligadas de forma operacional à(s) sequência(s) de controle da expressão (tal(is) como da transcrição ou da tradução), tal(is) como promotores ou intensificadores, para direcionar ou modular a síntese/expressão de RNA. A sequência de controle da expressão pode estar em um vetor de expressão. Os exemplos de promotores bacterianos incluem lacl, lacZ, T3, T7, gpt, lambda PR, PL e trp. Os exemplos de promotores eucarióticos incluem o inicial imediato do CMV, da timidina quinase do HSV, SV40 inicial e tardio, LTRs de retrovírus e metalotioneína I de camundongo.
[00185] Como utilizado aqui, o termo promotor inclui todas as sePetição 870170009999, de 15/02/2017, pág. 120/1247
111/788 quências capazes de controlar a transcrição de uma sequência codificadora em uma célula, tal como uma célula vegetal ou animal. Assim, os promotores utilizados nos constructos de acordo com a invenção incluem elementos de controle da transcrição e sequências reguladoras que atuam em cis que estão envolvidos na regulação ou na modulação da sincronia e/ou da taxa de transcrição de um gene. Por exemplo, um promotor pode ser um elemento de controle da transcrição que atua em cis, incluindo um intensificador, um promotor, um terminador da transcrição, uma origem de replicação, uma sequência de integração cromossômica, regiões não traduzidas a 5' e a 3' ou uma sequência intrônica, que está envolvida na regulação da transcrição. Estas sequências que atuam em cis podem interagir com proteínas ou outras moléculas biológicas para realizar (ligar/desligar, regular, modular etc.) a transcrição. Os promotores constitutivos são aqueles que controlam a expressão continuamente sob a maior parte das condições ambientais e estágios do desenvolvimento ou diferenciação celular. Os promotores que podem ser induzidos ou que podem ser regulados direcionam a expressão do ácido nucléico de acordo com a invenção sob a influência de condições ambientais ou condições do desenvolvimento. Os exemplos de condições ambientais que podem afetar a transcrição pelos promotores que podem ser induzidos incluem condições anaeróbicas, temperatura elevada, seca ou presença de luz. [00186] Os promotores específicos ao tecido são elementos de controle da transcrição que são ativos apenas em células ou tecidos ou órgãos particulares, tais como em plantas ou animais. A regulação específica ao tecido pode ser conseguida através de certos fatores intrínsecos que garantem que os genes que codificam proteínas específicas a um certo tecido são expressos. É sabido que tais fatores existem em mamíferos e plantas de forma que permitam que tecidos específicos se desenvolvam.
Petição 870170009999, de 15/02/2017, pág. 121/1247
112/788 [00187] Os promotores adequados para a expressão de um polipeptídeo em bactérias incluem os promotores lac ou trp de E. coli, o promotor lacl, o promotor lacZ, o promotor T3, o promotor T7, o promotor gpt, o promotor lambda PR, o promotor lambda PL, os promotores de óperons que codificam enzimas glicolíticas tal como 3fosfoglicerato quinase (PGK) e o promotor da fosfatase ácida. Os promotores eucarióticos incluem o promotor inicial imediato do CMV, o promotor da timidina quinase de HSV, os promotores de choque térmico, os promotores de SV40 inicial e tardio, LTRs de retrovírus e o promotor da metalotioneína-l de camundongo. Outros promotores conhecidos por controlarem a expressão de genes em células procarióticas ou eucarióticas ou seus vírus também podem ser utilizados. Os promotores adequados para a expressão do polipeptídeo ou de fragmento do mesmo em bactérias incluem os promotores lac ou trp de E. coli, o promotor lacl, o promotor lacZ, o promotor T3, o promotor T7, o promotor gpt, o promotor lambda PR, o promotor lambda PL, os promotores de óperons que codificam enzimas glicolíticas tal como a 3fosfoglicerato quinase (PGK) e o promotor da fosfatase ácida. Os promotores de fungos incluem o promotor do fator a. Os promotores eucarióticos incluem o promotor inicial imediato do CMV, o promotor da timidina quinase do HSV, os promotores de choque térmico, os promotores do SV40 inicial e tardio, LTRs de retrovírus e o promotor da metalotioneína-l de camundongo. Outros promotores conhecidos por controlarem a expressão de genes em células procarióticas ou eucarióticas ou seus vírus também podem ser utilizados.
Promotores Vegetais Específicos ao Tecido [00188] A invenção fornece cassetes de expressão que podem ser expressos de uma maneira específica ao tecido, tais como aqueles que podem expressar uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase de acordo com a invenção de uma maPetição 870170009999, de 15/02/2017, pág. 122/1247
113/788 neira específica ao tecido. Em algumas modalidades, a invenção fornece ainda plantas ou sementes que expressam uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase de acordo com a invenção de uma maneira específica ao tecido. A especificidade ao tecido pode ser específica à semente, específica ao caule, específica à folha, específica à raiz, específica ao fruto e similares.
[00189] O termo planta inclui plantas inteiras, partes de plantas (tais como folhas, caules, flores, raízes etc.), protoplastos de plantas, sementes e células vegetais e progênie da mesma. A classe de plantas que pode ser utilizada no método de acordo com a invenção é geralmente tão ampla quanto a classe de plantas superiores sensível às técnicas de transformação, incluindo angiospermas (plantas monocotiledôneas e dicotiledôneas), assim como gimnospermas. Esta inclui plantas de uma variedade de níveis de ploidia, incluindo estados poliplóides, diplóides, haplóides e hemizogotos. Como utilizado aqui, o termo planta transgênica inclui plantas ou células vegetais nas quais uma sequência de ácido nucléico heteróloga foi inserida, tal como os ácidos nucléicos e os vários constructos recombinantes (tais como cassetes de expressão) de acordo com a invenção.
[00190] Em algumas modalidades, um promotor constitutivo tal como o promotor 35S de CaMV pode ser utilizado para a expressão em partes específicas da planta ou da semente ou ao longo de toda a planta. Por exemplo, para a superexpressão, pode ser empregado um fragmento de promotor de planta que irá direcionar a expressão de um ácido nucléico em alguns ou em todos os tecidos de uma planta, tal como uma planta regenerada. Tais promotores são referidos aqui como promotores constitutivos e são ativos sob a maior parte das condições ambientais e estágios do desenvolvimento ou diferenciação celular. Os exemplos de promotores constitutivos incluem a região de início da transcrição 35S do vírus mosaico da couve-flor (CaMV), o
Petição 870170009999, de 15/02/2017, pág. 123/1247
114/788 promotor a Γ ou a 2' derivado do T-DNA de Agrobacterium tumefaciens e outras regiões de início da transcrição de vários genes vegetais conhecidos pelos peritos. Tais genes incluem, tal como ACT11 de Arabidopsis (Huang (1996) Plant Mol. Biol. 33:125-139); Cat3 de Arabidopsis (GenBank No. U43147, Zhong (1996) Mol. Gen. Genet. 251:196-203); o gene que codifica a proteína dessaturase carreadora de estearoil-acila de Brassica napus (Genbank No. X74782, Solocombe (1994) Plant Physiol. 104:1167-1176); GPc1 do milho (GenBank No. X15596; Martinez (1989) J. Mol. Biol 208:551-565); o Gpc2 do milho (GenBank No. U45855, Manjunath (1997) Plant Mol. Biol. 33:97112); promotores de plantas descritos nas Patentes U.S. N— 4.962.028; 5.633.440.
[00191] A invenção utiliza promotores específicos ao tecido ou constitutivos derivados de vírus que podem incluir, tal como o promotor subgenômico de tobamovírus (Kumagai (1995) Proc. Natl. Acad. Sei. USA 92:1679-1683; o vírus baciliforme tungro do arroz (RTBV), que se replica apenas em células do floema em plantas de arroz infectadas, com seu promotor que controla a forte expressão do gene repórter específico ao floema; o promotor do vírus mosaico da nervura da mandioca (CVMV), com maior atividade em elementos vasculares, nas células do mesófilo foliar e nas extremidades das raízes (Verdaguer (1996) Plant Mol. Biol. 31:1129-1139).
[00192] Em algumas modalidades, o promotor de planta direciona a expressão do ácido nucléico que expressa a enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase em um tipo de tecido, órgão ou célula específico (isto é, promotores específicos ao tecido) ou pode de outra maneira estar sob um controle ambiental ou do desenvolvimento mais preciso ou sob o controle de um promotor que pode ser induzido. Os exemplos de condições ambientais que podem afetar a transcrição incluem condições anaeróbicas, temperatura
Petição 870170009999, de 15/02/2017, pág. 124/1247
115/788 elevada, a presença de luz ou aspersão com agentes químicos/hormônios. Por exemplo, a invenção incorpora o promotor do milho que pode ser induzido pela seca (Busk (1997) supra); o promotor da batata que pode ser induzido pelo frio, pela seca e por altas concentrações de sal (Kirch (1997) Plant Mol. Biol. 33:897 909).
[00193] Em algumas modalidades, os promotores específicos ao tecido promovem a transcrição apenas dentro de um certo período de tempo de estágio do desenvolvimento dentro de tal tecido. Vide Blazquez (1998) Plant Cell 10:791-800, caracterização do promotor do gene LEAFY de Arabidopsis. Vide também Cardon (1997) Plant J 12:367-77, que descreve o fator de transcrição SPL3, que reconhece um motivo de sequência conservado na região do promotor do gene AP1 de identidade do meristema floral de A. thaliana', e Mandei (1995) Plant Molecular Biology, Vol. 29, pp 995-1004, que descreve o promotor elF4 de meristema. Os promotores específicos ao tecido que são ativos ao longo de todo o ciclo de vida de um tecido particular podem ser utilizados. Em algumas modalidades, os ácidos nucléicos de acordo com a invenção estão ligados de forma operacional a um promotor primariamente ativo apenas em células de fibras de algodão. Em algumas modalidades, os ácidos nucléicos de acordo com a invenção estão ligados de forma operacional a um promotor ativo primariamente durante os estágios de alongamento das células de fibra do algodão, tal como descrito por Rinehart (1996) supra. Os ácidos nucléicos podem estar ligados de forma operacional ao promotor do gene Fbl2A para serem expressos preferencialmente em células de fibra do algodão (Ibid). Vide também, John (1997) Proc. Natl. Acad. Sei. USA 89:5769-5773; John e outros, Patentes U.S. N— 5.608.148 e 5.602.321, que descrevem promootres específicos à fibra de algodão e métodos para a construção de plantas de algodão transgênicas. Os promotores específicos à raiz também podem ser utilizados para exPetição 870170009999, de 15/02/2017, pág. 125/1247
116/788 pressar os ácidos nucléicos de acordo com a invenção. Os exemplos de promotores específicos à raiz incluem o promotor do gene de álcool desidrogenase (DeLisle (1990) Int. Rev. Cytol. 123:39-60). Outros promotores que podem ser utilizados para a expressão dos ácidos nucléicos de acordo com a invenção incluem, tais como promotores específicos ao óvulo, específicos ao embrião, específicos ao endosperma, específicos ao integumento, específicos ao revestimento de semente ou alguma combinação dos mesmos; um promotor específico à folha (vide Busk (1997) Plant J. 11:1285 1295, que descreve um promotor específico à folha no milho); o promotor ORF13 de Agrobacterium rhizogenes (que exibe alta atividade nas raízes, vide Hansen (1997) supra); um promotor específico ao pólen do milho (vide Guerrero (1990) Mol. Gen. Genet. 224:161 168); um promotor do tomate ativo durante o amadurecimento dos frutos, senescência e abscisão das folhas e, até uma extensão menor, de flores pode ser utilizado (vide Blume (1997) Plant J. 12:731 746); um promotor específico ao pistilo do gene SK2 da batata (vide Ficker (1997) Plant Mol. Biol. 35:425 431); o gene Blec4 da ervilha, que é ativo no tecido da epiderme de ápices de brotos vegetativos e florais de alfafa transgénica tornando-o uma ferramenta útil para direcionar a expressão de genes estranhos para a camada epidérmica de brotos ou fibras que crescem ativamente; o gene BEL1 específico ao óvulo (vide Reiser (1995) Cell 83:735742, GenBank No. U39944); e/ou o promotor em Klee, Patente U.S. N° 5.589.583, que descreve uma região promotora de planta que é capaz de conferir altos níveis de transcrição no tecido meristemático e/ou em células que se dividem rapidamente.
[00194] Em algumas modalidades, os promotores de plantas que podem ser induzidos após a exposição a hormônios vegetais, tais como auxinas, são utilizados para expressar os ácidos nucléicos de acordo com a invenção. Por exemplo, a invenção pode utilizar o fragPetição 870170009999, de 15/02/2017, pág. 126/1247
117/788 mento promotor E1 dos elementos de resposta à auxina (AuxREs) na soja (Glicina maxL.) (Liu (1997) Plant Physiol. 115:397-407); o promotor GST6 de Arabidopsis que responde à auxina (que também responde ao ácido salicílico e ao peróxido de hidrogênio) (Chen (1996) Plant J. 10: 955-966); o promotor parC que pode ser induzido por auxina do tabaco (Sakai (1996) Plant Cell Physiol. 37:906-913); um elemento de resposta à biotina de planta (Streit (1997) Mol. Plant Microbe Interact. 10:933-937); e, o promotor que responde ao hormônio de estresse ácido abscísico (Sheen (1996) Science 274:1900-1902).
[00195] Os ácidos nucléicos de acordo com a invenção também podem estar ligados de forma operacional a promotores de planta que podem ser induzidos após a exposição a reagentes químicos que podem ser aplicados na planta, tais como herbicidas ou antibióticos. Por exemplo, o promotor ln2-2 do milho, ativado por agentes de segurança de herbicida benzenossulfonamida, pode ser utilizado (De Veylder (1997) Plant Cell Physiol. 38:568-577); a aplicação de agentes de segurança de herbicidas diferentes induz padrões de expressão gênica distintos, incluindo a expressão na raiz, nos hidatódios e no meristema apical de brotos. A sequência codificadora pode estar sob o controle de, tal como um promotor que pode ser induzido por tetraciclina, tal como descrito com plantas de tabaco transgênicas contendo o gene da arginina descarboxilase de Avena sativa L. (aveia) (Masgrau (1997) Plant J. 11:465-473); ou, um elemento de resposta ao ácido salicílico (Stange (1997) Plant J. 11:1315-1324). Utilizando promotores induzidos quimicamente (tal como por hormônio ou pesticida), isto é, promotor que responde a um reagente químico que pode ser aplicado na planta transgênica no campo, a expressão de um polipeptídeo de acordo com a invenção pode ser induzida em um estágio particular do desenvolvimento da planta. Assim, a invenção fornece ainda plantas transgênicas que contêm um gene que pode ser induzido que codifica
Petição 870170009999, de 15/02/2017, pág. 127/1247
118/788 polipeptídeos de acordo com a invenção cuja faixa de hospedeiros é limitada às espécies vegetais-alvos, tais como milho, arroz, cevada, soja, tomate, trigo, batata ou outras plantas de cultivo, que pode ser induzido em qualquer estágio de desenvolvimento da planta de cultivo. [00196] Um versado na técnica reconhecerá que um promotor de planta específico ao tecido pode controlar a expressão de sequências ligadas de forma operacional em tecidos sem ser o tecido-alvo. Assim, em algumas modalidades, um promotor específico ao tecido é um que controla a expressão preferencialmente no tecido ou no tipo de célulaalvo, mas também pode levar a alguma expressão em outros tecidos. [00197] Os ácidos nucléicos de acordo com a invenção também podem estar ligados de forma operacional a promotores de plantas que podem ser induzidos após a exposição a reagentes químicos. Estes reagentes incluem, tais como herbicidas, auxinas sintéticas ou antibióticos que podem ser aplicados, tal como borrifados, sobre as plantas transgênicas. A expressão que pode ser induzida dos ácidos nucléicos que produzem a enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção permitirá que o cultivador selecione plantas com a expressão e/ou a atividade ótima da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase. Assim, o desenvolvimento de partes de plantas pode ser controlado. Desta maneira a invenção fornece os meios para facilitar a colheita de plantas e de partes de plantas. Por exemplo, em várias modalidades, o promotor ln2-2 do milho, ativado por agentes de segurança do herbicida benzenossulfonamida, é utilizado (De Veylder (1997) Plant Cell Physiol. 38:568-577); a aplicação de agentes de segurança de herbicidas diferentes induz padrões de expressão gênica distintos, incluindo a expressão na raiz, nos hidatódios e no meristema apical de brotos. As sequências codificadoras de acordo com a invenção estão ainda sob o controle de um promotor que pode ser induzido
Petição 870170009999, de 15/02/2017, pág. 128/1247
119/788 por tetraciclina, tal como descrito com plantas de tabaco transgênicas contendo o gene da arginina descarboxilase de Avena sativa L. (aveia) (Masgrau (1997) Plant J. 11:465-473); ou, um elemento que responde ao ácido salicílico (Stange (1997) Plant J. 11:1315-1324).
[00198] Em algumas modalidades, a expressão apropriada do polipeptídeo pode requerer uma região de poliadenilação na extremidade a 3' da região codificadora. A região de poliadenilação pode ser derivada do gene natural, de uma variedade de outros genes vegetais (ou de animais ou outros) ou de genes no T-DNA de Agrobacteria.
Vetores de Expressão e Veículos de Clonagem [00199] A invenção fornece vetores de expressão e veículos de clonagem que compreendem os ácidos nucléicos de acordo com a invenção, tais como sequências que codificam as enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção. Os vetores de expressão e os veículos de clonagem de acordo com a invenção podem compreender partículas virais, baculovírus, fago, plasmídeos, fagemídeos, cosmídeos, fosmídeos, cromossomos artificiais de bactéria, DNA viral (tal como vaccinia, adenovírus, foul pox vírus, pseudorraiva e derivados de SV40), cromossomos artificiais baseados em P1, plasmídeos de levedura, cromossomos artificiais de levedura e quaisquer outros vetores específicos para hospedeiros específicos de interesse (tais como bacilos, Aspergillus e levedura). Os vetores de acordo com a invenção podem incluir sequências de DNA cromossômicas, não cromossômicas e sintéticas. Grandes números de vetores adequados são conhecidos pelos versados na técnica e estão disponíveis comercialmente. Os exemplos de vetores incluem: bacterianos: vetores pQE® (Qiagen, Valencia, CA), plasmídeos pBLUESCRIPT®, vetores pNH, vetores lambda-ZAP (Stratagene, La Jolla, CA); vetores ptrc99a, pKK223-3, pDR540, pRIT2T (GE Healthcare, Piscataway, NJ), pET (Novagen, Madison, Wl); EucaPetição 870170009999, de 15/02/2017, pág. 129/1247
120/788 rióticos: pXT1, pSG5 (Stratagene, La Jolla, CA), pSVK3, pBPV, pMSG, pSVLSV40 (Pharmacia). Entretanto, qualquer outro plasmídeo ou outro vetor pode ser utilizado contanto que possam ser replicados e sejam viáveis no hospedeiro. Vetores com baixo número de cópias ou com alto número de cópias podem ser empregados na presente invenção. Plasmídeos podem ser disponíveis comercialmente, disponíveis publicamente em uma base irrestrita ou podem ser construídos partindo de plasmídeos disponíveis de acordo com procedimentos publicados. Os plasmídeos equivalentes aos descritos aqui são conhecidos na técnica e serão evidentes ao perito comum na técnica.
[00200] O vetor de expressão pode compreender um promotor, um sítio de ligação ao ribossomo para o início da tradução e um terminador da transcrição. O vetor pode incluir ainda sequências apropriadas para amplificar a expressão. Os vetores de expressão de mamíferos podem compreender uma origem de replicação, quaisquer sítios de ligação ao ribossomo necessários, um sítio de poliadenilação, sítios doadores e receptores de processamento, sequências de término da transcrição e sequências não transcritas flanqueadoras a 5'. Em algumas modalidades, as sequências de DNA derivadas dos sítios de processamento e de poliadenilação de SV40 podem ser utilizadas para fornecer os elementos genéticos não transcritos necessários.
[00201] Em algumas modalidades, os vetores de expressão contêm um ou mais genes marcadores que podem ser selecionados para permitir a seleção de células hospedeiras que contêm o vetor. Tais marcadores que podem ser selecionados incluem genes que codificam dihidrofolato redutase ou genes que conferem resistência à neomicina para a cultura de células eucarióticas, genes que conferem resistência à tetraciclina ou à ampicilina em E. coli e o gene TRP1 de S. cerevisiae. As regiões promotoras podem ser selecionadas de qualquer gene desejado utilizando vetores com cloranfenicol transferase (CAT) ou
Petição 870170009999, de 15/02/2017, pág. 130/1247
121/788 outros vetores com marcadores que podem ser selecionados.
[00202] Em algumas modalidades, os vetores para a expressão do polipeptídeo ou de um fragmento do mesmo em células eucarióticas contêm intensificadores para aumentar os níveis de expressão. Os intensificadores são elementos de DNA que atuam em cis que podem ter de aproximadamente 10 até aproximadamente 300 pb de comprimento. Podem atuar sobre um promotor para aumentar sua transcrição. Os exemplos de intensificadores incluem o intensificador de SV40 do lado tardio da origem de replicação 100 até 270 pb, o intensificador do promotor inicial de citomegalovírus, o intensificador de polioma do lado tardio da origem de replicação e os intensificadores de adenovírus.
[00203] Uma sequência de ácido nucléico pode ser inserida dentro de um vetor através de vários procedimentos. Em geral, a sequência é ligada na posição desejada no vetor após a digestão do inserto e do vetor com endonucleases de restrição apropriadas. Alternativamente, as pontas cegas tanto no inserto quanto no vetor podem ser ligadas. Uma variedade de técnicas de clonagem é conhecida na literatura, tais como as descritas em Ausubel e outros Current Protocols in Molecular Biology, John Wiley & Sons, Inc. 1997 e Sambrook e outros, Molecular Cloning: A Laboratory Manual 2- Ed., Cold Spring Harbor Laboratory Press (1989). Tais procedimentos e outros são considerados como estando dentro do âmbito dos versados na técnica.
[00204] O vetor pode estar na forma de uma plasmídeo, uma partícula viral ou um fago. Outros vetores incluem sequências de DNA cromossômicas, não cromossômicas e sintéticas, derivados de SV40; plasmídeos bacterianos, DNA de fago, baculovírus, plasmídeos de levedura, vetores derivados de combinações de plasmídeos ou DNA de fago, DNA viral tal como vaccinia, adenovírus, fowl pox vírus e pseudorraiva. Uma variedade de vetores de clonagem e de expressão para
Petição 870170009999, de 15/02/2017, pág. 131/1247
122/788 uso com hospedeiros procarióticos e eucarióticos é descrita por, tal como Sambrook.
[00205] Os vetores bacterianos particulares que podem ser utilizados incluem os plasmídeos disponíveis comercial mente que compreendem os elementos genéticos do vetor de clonagem bem-conhecido pBR322 (ATCC 37017), pKK223-3 (Pharmacia Fine Chemicals, Uppsala, Suécia), GEM1 (Promega Biotec, Madison, Wl, USA) pQE70, pQE60, pQE-9 (Qiagen, Valencia, CA), pD10, psiX174 pBLUESCRIPT II KS, pNH8A, pNH16a, pNH18A, pNH46A (Stratagene, La Jolla, CA), ptrc99a, pKK223-3, pKK233-3, DR540, pRIT5 (Pharmacia), pKK232-8, pET (Novagen, Madison, Wl) e pCM7. Os vetores eucarióticos particulares incluem pSV2CAT, pOG44, pXT1, pSG (Stratagene, La Jolla, CA) pSVK3, pBPV, pMSG e pSVL (Pharmacia). Entretanto, qualquer outro vetor pode ser utilizado contanto que possa ser replicado e viável na célula hospedeira.
[00206] Os ácidos nucléicos de acordo com a invenção podem ser expressos em cassetes de expressão, vetores ou víruses e expressos de forma transitória ou estável em células vegetais e sementes. Um exemplo de sistema de expressão transitória utiliza sistemas de expressão epissomal, tal como o RNA viral do vírus mosaico da couveflor (CaMV) gerado no núcleo através da transcrição de um minicromossomo epissomal contendo DNA superenrolado, vide Covey (1990) Proc. Natl. Acad. Sei. USA 87:1633-1637. Alternativamente, as sequências codificadoras, isto é, todas ou subfragmentos de sequências de acordo com a invenção podem ser inseridos dentro do genoma da célula vegetal hospedeira se tornando uma parte integral do DNA cromossômico do hospedeiro. Os produtos da transcrição sentido ou antisentido podem ser expressos dessa maneira. Um vetor que compreende as sequências (tais como promotores ou regiões codificadoras) dos ácidos nucléicos de acordo com a invenção pode compreender um
Petição 870170009999, de 15/02/2017, pág. 132/1247
123/788 gene marcador que confere um fenótipo que pode ser selecionado em uma célula vegetal ou uma semente. Por exemplo, o marcador pode codificar resistência a biocida, tal como resistência a antibiótico, tal como resistência à canamicina, a G418, à bleomicina, à higromicina ou resistência a herbicida, tal como resistência a clorossulfurona ou Basta.
[00207] Os vetores de expressão capazes de expressar ácidos nucléicos e proteínas em plantas são bem-conhecidos na técnica e podem incluir, tais como vetores de Agrobacterium spp., vírus X da batata (vide Angell (1997) EMBO J. 16:3675-3684), vírus mosaico do tabaco (vide Casper (1996) Gene 173:69-73), vírus de enfezamento vermelho do tomate (vide Hillman (1989) Virology 169:42-50), vírus etch do tabaco (vide Dolja (1997) Virology 234:243-252), vírus mosaico dourado do feijão (vide Morinaga (1993) Microbiol Immunol. 37:471-476), vírus mosaico da couve-flor (vide Cecchini (1997) Mol. Plant Microbe Interact. 10:1094-1101), elemento que pode sofrer transposição Ac/Ds do milho (vide Rubin (1997) Mol. Cell. Biol. 17:6294-6302; Kunze (1996) Curr. Top. Microbiol. Immunol. 204:161-194) e o elemento que pode sofrer transposição agente de mutação supressor do milho (Spm) (vide Schlappi (1996) Plant Mol. Biol. 32:717-725); e derivados dos mesmos.
[00208] Em algumas modalidades, o vetor de expressão pode ter dois sistemas de replicação para permitir que seja mantido em dois organismos, por exemplo, em células de mamífero ou de inseto para a expressão e em um hospedeiro procariótico para clonagem e amplificação. Além disso, para os vetores de expressão de integração, o vetor de expressão pode conter pelo menos uma sequência homóloga ao genoma da célula hospedeira. Pode conter duas sequências homólogas que flanqueiam o constructo de expressão. O vetor de integração pode ser direcionado para um lócus específico na célula hospedeira
Petição 870170009999, de 15/02/2017, pág. 133/1247
124/788 através da seleção da sequência homóloga apropriada para inclusão no vetor. Os constructos para os vetores de integração são bemconhecidos na técnica.
[00209] Os vetores de expressão de acordo com a invenção podem incluir ainda um gene marcador que pode ser selecionado para permitir a seleção de cepas bacterianas que foram transformadas, tais como genes que tornam as bactérias resistentes a fármacos tais como ampicilina, cloranfenicol, eritromicina, canamicina, neomicina e tetraciclina. Os marcadores que podem ser selecionados também podem incluir genes biossintéticos, tais como aqueles nas vias biossintéticas de histidina, triptofano e leucina.
[00210] A sequência de DNA no vetor de expressão está ligada de forma operacional a sequência(s) de controle da expressão apropriada^) (promotor) para direcionar a síntese de RNA. Os promotores bacterianos citados em particular incluem lacl, lacZ, T3, T7, gpt, lambda PR, Pl e trp. Os promotores eucarióticos incluem o inicial imediato de CMV, da timidina quinase do HSV, o SV40 inicial e tardio, LTRs de retrovírus e metalotioneína-l de camundongo. A seleção do vetor e do promotor apropriados está bem dentro do nível de um perito comum na técnica. O vetor de expressão contém ainda um sítio de ligação ao ribossomo para o início da tradução e um terminador da transcrição. O vetor também pode incluir sequências apropriadas para a amplificação da expressão. As regiões promotoras podem ser selecionadas de qualquer gene desejado utilizando vetores com cloranfenicol transferase (CAT) ou outros vetores com marcadores que podem ser selecionados. Em adição, os vetores de expressão em algumas modalidades contêm um ou mais genes marcadores que podem ser selecionados para fornecer uma característica fenotípica para a seleção de células hospedeiras transformadas tal como dihidrofolato redutase ou resistência à neomicina para a cultura de células eucarióticas ou tal como
Petição 870170009999, de 15/02/2017, pág. 134/1247
125/788 resistência à tetraciclina ou à ampicilina em E. coli.
[00211] Os vetores de expressão de mamífero também podem compreender uma origem de replicação, quando necessário sítios de ligação ao ribossomo, um sítio de poliadenilação, sítios doadores e receptores de processamento, sequências de término da transcrição e sequências não transcritas flanqueadoras a 5'. Em algumas modalidades, as sequências de DNA derivadas dos sítios de processamento e de poliadenilação de SV40 podem ser utilizadas para fornecer os elementos genéticos não transcritos necessários.
[00212] Os vetores para a expressão do polipeptídeo ou de um fragmento do mesmo em células eucarióticas também podem conter intensificadores para aumentar os níveis de expressão. Os intensificadores são elementos de DNA que atuam em cis, geralmente com aproximadamente 10 até aproximadamente 300 pb de comprimento que atuam sobre um promotor para aumentar a sua transcrição. Os exemplos incluem o intensificador de SV40 do lado tardio da origem de replicação 100 até 270 pb, o intensificador do promotor inicial de citomegalovírus, o intensificador de polioma do lado tardio da origem de replicação e os intensificadores de adenovírus.
[00213] Em adição, os vetores de expressão podem conter um ou mais genes marcadores que podem ser selecionados para permitir a seleção de células hospedeiras contendo o vetor. Tais marcadores que podem ser selecionados incluem genes que codificam dihidrofolato redutase ou genes que conferem resistência à neomicina para cultura de células eucarióticas, genes que conferem resistência à tetraciclina ou à ampicilina em E. colie o gene TRP1 de S. cerevisiae.
[00214] Em algumas modalidades, o ácido nucléico que codifica um dos polipeptídeos de acordo com a invenção e as sequências substancialmente idênticas ao mesmo ou fragmentos que compreendem pelo menos aproximadamente 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100
Petição 870170009999, de 15/02/2017, pág. 135/1247
126/788 ou 150 ou mais aminoácidos consecutivos do mesmo é montado na fase apropriada com uma sequência líder capaz de direcionar a secreção do polipeptídeo traduzido ou de um fragmento do mesmo. Em algumas modalidades, o ácido nucléico pode codificar um polipeptídeo de fusão em que um dos polipeptídeos de acordo com a invenção ou fragmentos que compreendem pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 ou 150 ou mais aminoácidos consecutivos do mesmo é fundido a peptídeos ou polipeptídeos heterólogos, tais como peptídeos com identificação N-terminal que conferem características desejadas, tal como maior estabilidade ou purificação simplificada.
[00215] A sequência de DNA apropriada pode ser inserida dentro do vetor através de uma variedade de procedimentos. Em geral, a sequência de DNA é ligada na posição desejada no vetor após a digestão do inserto e do vetor com endonucleases de restrição apropriadas. Alternativamente, as extremidades cegas tanto no inserto quanto no vetor podem ser ligadas. Uma variedade de técnicas de clonagem é descrita em Ausubel e outros Current Protocols in Molecular Biology, John Wiley & Sons, Inc. 1997 e Sambrook e outros, Molecular Cloning: A Laboratory Manual 2- Ed., Cold Spring Harbor Laboratory Press (1989). Tais procedimentos e outros são considerados como estando dentro do âmbito dos versados na técnica.
[00216] O vetor pode, por exemplo, estar na forma de um plasmídeo, de uma partícula viral ou de um fago. Outros vetores incluem sequências de DNA cromossômicas, não cromossômicas e sintéticas, derivados de SV40; plasmídeos bacterianos, DNA de fago, baculovírus, plasmídeos de levedura, vetores derivados de combinações de plasmídeos e DNA de fago, DNA viral tal como vaccinia, adenovírus, fowl pox vírus e pseudorraiva. Uma variedade de vetores de clonagem e de expressão para uso com hospedeiros procarióticos e eucarióticos é descrita por Sambrook e outros, Molecular Cloning: A Laboratory
Petição 870170009999, de 15/02/2017, pág. 136/1247
127/788
Manual, 2- Ed., Cold Spring Harbor, N.Y., (1989).
Células Hospedeiras e Células Transformadas [00217] A invenção fornece ainda células transformadas que compreendem sequências de ácidos nucléicos de acordo com a invenção, tais como as sequências que codificam enzimas aldolases, tais como piruvato aldolases, HMG e/ou KHG aldolase de acordo com a invenção ou vetores de acordo com a invenção. A célula hospedeira pode ser qualquer uma das células hospedeiras familiares ao versado na técnica, incluindo células procarióticas, células eucarióticas, tais como células bacterianas, células de fungo, células de levedura, células de mamífero, células de inseto ou células vegetais. Os exemplos de células bacterianas incluem quaisquer espécies de Streptomyces, Staphylococcus, Pseudomonas ou Bacillus, incluindo E. coli, Bacillus subtilis, Pseudomonas fluorescens, Bacillus cereus ou Salmonella typhimurium. Os exemplos de células de fungo incluem quaisquer espécies de Aspergillus. Os exemplos de células de levedura incluem quaisquer espécies de Pichia, Saccharomyces, Schizosaccharomyces ou Schwanniomyces, incluindo Pichia pastoris, Saccharomyces cerevisiae ou Schizosaccharomyces pombe. Os exemplos de células de inseto incluem quaisquer espécies de Spodoptera ou Drosophila, incluindo Drosophila S2 e Spodoptera Sf9. Os exemplos de células de animais incluem CHO, COS ou Bowes melanoma ou qualquer linhagem de células de camundongo ou humana. A seleção de um hospedeiro apropriado está dentro das habilidades daqui versados na técnica. As técnicas para transformação de uma ampla variedade de espécies de plantas superiores são bem-conhecidas e descritas na literatura técnica e científica. Vide Weising (1988) Ann. Rev. Genet. 22:421-477; Patente U.S. N°5.750.870.
[00218] O vetor pode ser introduzido nas células hospedeiras utilizando qualquer uma de uma variedade de técnicas, incluindo transPetição 870170009999, de 15/02/2017, pág. 137/1247
128/788 formação, transfecção, transdução, infecção viral, pistolas de genes ou transferência de genes mediada por Ti. Os métodos particulares incluem transfecção com fosfato de cálcio, transfecção mediada por DEAEDextrano, lipofecção ou eletroporação (Davis, L., Dibner, M., Battey, I.,
Basic Methods in Molecular Biology, (1986)).
[00219] Em algumas modalidades, os ácidos nucléicos ou os vetores de acordo com a invenção são introduzidos nas células para seleção, assim, os ácidos nucléicos entram nas células de uma maneira adequada para a expressão subseqüente do ácido nucléico. O método de introdução é determinado em grande parte pelo tipo de célula-alvo. Os exemplos de métodos incluem precipitação com CaPO4, fusão de lipossomos, lipofecção (tal como LIPOFECTIN®), eletroporação, infecção viral etc. Os ácidos nucléicos candidatos podem se integrar de forma estável no genoma da célula hospedeira (por exemplo, com introdução retroviral) ou podem existir de forma transitória ou estável no citoplasma (isto é, através do uso de plasmídeos tradicionais, utilizando sequências reguladoras padronizadas, marcadores de seleção etc.). Como muitas seleções farmaceuticamente importantes requerem alvos de células humanas ou de mamífero de modelo, podem ser utilizados vetores retrovirais capazes de transfectar tais alvos.
[00220] Quando apropriado, células hospedeiras engenheiradas podem ser cultivadas em meios nutricionais convencionais modificados quando apropriado para a ativação de promotores, para a seleção de transformantes ou para a amplificação dos genes de acordo com a invenção. Após a transformação de uma cepa hospedeira adequada e o cultivo da cepa hospedeira até uma densidade de células apropriada, o promotor selecionado pode ser induzido através de meios apropriados (tal como alteração na temperatura ou indução química) e as células podem ser cultivadas durante um período adicional para permitir que estas produzam o polipeptídeo desejado ou fragmento do
Petição 870170009999, de 15/02/2017, pág. 138/1247
129/788 mesmo.
[00221] As células podem ser coletadas por centrifugação, rompidas através de meios físicos ou químicos e o extrato bruto resultante é mantido para purificação adicional. As células microbianas empregadas para a expressão de proteínas podem ser rompidas através de qualquer método conveniente, incluindo ciclos de congelamentodescongelamento, ultra-som, rompimento mecânico ou o uso de agentes de lise celular. Tais métodos são bem-conhecidos para aqueles versados na técnica. O polipeptídeo expresso ou fragmento do mesmo pode ser recuperado e purificado partindo de culturas de células recombinantes através de métodos que incluem precipitação com sulfato de amônio ou com etanol, extração ácida, cromatografia de troca aniônica ou catiônica, cromatografia em fosfocelulose, cromatografia de interação hidrofóbica, cromatografia por afinidade, cromatografia em hidroxilapatita e cromatografia em lectina. As etapas de redobramento de proteínas podem ser utilizadas, quando necessário, para completar a configuração do polipeptídeo. Se desejado, a cromatografia líquida de alto desempenho (HPLC) pode ser empregada para as etapas de purificação final.
[00222] Os constructos nas células hospedeiras podem ser utilizados de uma maneira convencional para produzir o produto gênico codificado pela sequência recombinante. Dependendo do hospedeiro empregado em um procedimento de produção recombinante, os polipeptídeos produzidos pelas células hospedeiras contendo o vetor podem ser glicosilados ou podem ser não-glicosilados. Os polipeptídeos de acordo com a invenção podem ou não incluir também um resíduo de aminoácido metionina inicial.
[00223] Os sistemas de tradução isentos de células também podem ser empregados para produzir um polipeptídeo de acordo com a invenção. Os sistemas de tradução isento de células podem utilizar
Petição 870170009999, de 15/02/2017, pág. 139/1247
130/788 mRNAs transcritos partindo de um constructo de DNA que compreende um promotor ligado de forma operacional a um ácido nucléico que codifica o polipeptídeo ou um fragmento do mesmo. Em algumas modalidades, o constructo de DNA pode ser linearizado antes da realização de uma reação de transcrição in vitro. O mRNA transcrito é então incubado com um extrato de tradução isenta de células apropriado, tal como um extrato de reticulócitos de coelho, para produzir o polipeptídeo desejado ou um fragmento do mesmo.
[00224] Os vetores de expressão podem conter um ou mais genes marcadores que podem ser selecionados para fornecer uma característica fenotípica para a seleção de células hospedeiras transformadas tal como dihidrofolato redutase ou resistência à neomicina para a cultura de células eucarióticas ou tal como resistência à tetraciclina ou à ampicilina em E. coli.
[00225] As células hospedeiras que contêm os polinucleotídeos de interesse, tais como os ácidos nucléicos de acordo com a invenção, podem ser cultivadas em meios nutricionais convencionais quando apropriado para a ativação de promotores, para a seleção de transformantes ou para a amplificação de genes. As condições de cultura, tais como temperatura, pH e similar, são aquelas utilizadas previamente com a célula hospedeira selecionada para a expressão e serão evidentes àqueles versados na técnica. Os clones que são identificados como possuindo a atividade enzimática especificada podem então ser seqüenciados para identificar a sequência de polinucleotídeo que codifica uma enzima que possui a atividade aumentada.
[00226] A invenção fornece métodos para a superexpressão de enzimas aldolases recombinantes, tais como piruvato aldolases, tal como HMG e/ou KHG aldolase em células que compreendem a expressão de um vetor que compreende um ácido nucléico de acordo com a invenção, tal como um ácido nucléico que compreende uma sequência
Petição 870170009999, de 15/02/2017, pág. 140/1247
131/788 de ácido nucléico com pelo menos aproximadamente 50%, 51%, 52%,
53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%,
65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%,
77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%,
89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais identidade de sequência com uma sequência de acordo com a invenção ao longo de uma região de pelo menos aproximadamente 100 resíduos, em que as identidades de sequência são determinadas através da análise com um algoritmo de comparação de sequências ou através de inspeção visual ou um ácido nucléico que se hibridiza sob condições rigorosas a uma sequência de ácido nucléico de acordo com a invenção ou a uma subsequência da mesma. A superexpressão pode ser realizada através de quaisquer meios, tal como o uso de um promotor de alta atividade, um vetor dicistrônico ou através da amplificação gênica do vetor.
[00227] Os ácidos nucléicos de acordo com a invenção podem ser expressos ou superexpressos, em qualquer sistema de expressão in vitro ou in vivo. Quaisquer sistemas de cultura de células podem ser empregados para expressar ou superexpressar, uma proteína recombinante, incluindo culturas bacterianas, de inseto, de levedura, de fungo ou de mamífero. A superexpressão pode ser realizada através da escolha apropriada de promotores, intensificadores, vetores (tal como o uso de vetores de replicon, vetores dicistrônicos (vide Gurtu (1996) Biochem. Biophys. Res. Commun. 229:295-8), meios, sistemas de cultura e similares. Em algumas modalidades, a amplificação gênica utilizando marcadores de seleção, tal como glutamina sintetase (vide Sanders (1987) Dev. Biol. Stand. 66:55-63), em sistemas de células é utilizada para superexpressar os polipeptídeos de acordo com a invenção.
[00228] Os detalhes adicionais em relação a esta abordagem estão
Petição 870170009999, de 15/02/2017, pág. 141/1247
132/788 na literatura pública e/ou são conhecidos àqueles versados na técnica. Em um exemplo não-limitante particular, tal literatura disponível publicamente inclui a EP 0659215 (WO 9403612 A1) (Nevalainen e outros); Lapidot, A., Mechaly, A., Shoham, Y., Overexpression and single-step purification of a thermostable xylanase from Bacillus stearothermophilus T-6, J. Biotechnol. Nov 51:259-64 (1996); Lüthi, E., Jasmat, N.B., Bergquist, P.L., Xylanase from the extremely thermophilic bacterium Caldocellum saccharolyticum: overexpression of the gene in Escherichia coli and characterization of the gene product, Appl. Environ. Microbiol. Setembro 56:2677-83 (1990); e Sung, W.L., Luk, C.K., Zahab, D.M., Wakarchuk, W., Overexpression of the Bacillus subtilis and circulans xylanases in Escherichia coli, Protein Expr. Purif. Jun 4:200-6 (1993), embora estas referências não ensinem as enzimas da invenção do presente pedido de patente.
[00229] A célula hospedeira pode ser qualquer uma das células hospedeiras familiares àqueles versados na técnica, incluindo células procarióticas, células eucarióticas, células de mamífero, células de inseto ou células vegetais. Como exemplos representativos de hospedeiros apropriados, podem ser mencionados: células bacterianas, tais como de E. coli, Streptomyces, Bacillus subtilis, Bacillus cereus, Salmonella typhimurium e várias espécies dentro dos gêneros Pseudomonas, Streptomyces e Staphylococcus, células de fungo, tais como de Aspergillus, de levedura tal como qualquer espécie de Pichia, Saccharomyces, Schizosaccharomyces, Schwanniomyces, incluindo Pichia pastoris, Saccharomyces cerevisiae ou Schizosaccharomyces pombe, células de inseto tais como Drosophila S2 e Spodoptera Sf9, células de animais tal como CHO, COS ou Bowes melanoma e adenoviruses. A seleção de um hospedeiro apropriado está dentro das capacidades dos versados na técnica.
[00230] O vetor pode ser introduzido nas células hospedeiras utiliPetição 870170009999, de 15/02/2017, pág. 142/1247
133/788 zando qualquer uma de uma variedade de técnicas, incluindo transformação, transfecção, transdução, infecção viral, pistolas gênicas ou transferência gênica mediada por Ti. Os métodos particulares incluem transfecção com fosfato de cálcio, transfecção mediada por DEAEDextrano, lipofecção ou eletroporação (Davis, L., Dibner, M., Battey, I., Basic Methods in Molecular Biology, (1986)).
[00231] Quando apropriado, as células hospedeiras engenheiradas podem ser cultivadas em meios nutricionais convencionais modificados quando apropriado para a ativação de promotores, para a seleção de transformantes ou para a amplificação dos genes de acordo com a invenção. Após a transformação de uma cepa hospedeira adequada e o cultivo da cepa hospedeira até uma densidade de células apropriada, o promotor selecionado pode ser induzido através de meios apropriados (tal como alteração da temperatura ou indução química) e as células podem ser cultivadas durante um período adicional para permitir que estas produzam o polipeptídeo desejado ou um fragmento do mesmo.
[00232] As células podem ser coletadas por centrifugação, rompidas através de meios físicos ou químicos e o extrato bruto resultante é mantido para purificação adicional. As células microbianas empregadas para a expressão de proteínas podem ser rompidas através de qualquer método conveniente, incluindo ciclos de congelamentodescongelamento, ultra-som, rompimento mecânico ou uso de agentes de lise celular. Tais métodos são bem-conhecidos pelos versados na técnica. O polipeptídeo expresso ou um fragmento do mesmo pode ser recuperado e purificado partindo de culturas de células recombinantes através de métodos que incluem precipitação com sulfato de amônio ou com etanol, extração ácida, cromatografia de troca aniônica ou catiônica, cromatografia em fosfocelulose, cromatografia com interação hidrofóbica, cromatografia por afinidade, cromatografia em hidroxilapaPetição 870170009999, de 15/02/2017, pág. 143/1247
134/788 tita e cromatografia em lectina. As etapas de redobramento das proteínas podem ser utilizadas, quando necessário, para completar a configuração do polipeptídeo. Se desejado, a cromatografia líquida de alto desempenho (HPLC) pode ser empregada para as etapas de purificação final.
[00233] Vários sistemas de culturas de células de mamífero também podem ser empregados para expressar a proteína recombinante. Os exemplos de sistemas de expressão de mamífero incluem as linhagens COS-7 de fibroblastos de rins de macaco (descritas por Gluzman, Cell, 23:175. 1981) e outras linhagens de células capazes de expressar proteínas partindo de um vetor compatível, tais como as linhagens de células C127, 3T3, CHO, HeLa e BHK.
[00234] Os constructos nas células hospedeiras podem ser utilizados de uma maneira convencional para produzir o produto gênico codificado pela sequência recombinante. Dependendo do hospedeiro empregado em um procedimento de produção recombinante, os polipeptídeos produzidos pelas células hospedeiras contendo o vetor podem ser glicosilados ou podem ser não-glicosilados. Os polipeptídeos de acordo com a invenção podem ou não incluir ainda um resíduo de aminoácido metionina inicial.
[00235] Alternativamente, os polipeptídeos de acordo com a invenção ou fragmentos que compreendem pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 ou 150 ou mais aminoácidos consecutivos dos mesmos podem ser produzidos de forma sintética através de sintetizadores convencionais de peptídeos, tais como os discutidos abaixo. Em outras modalidades, os fragmentos ou as partes dos polipeptídeos podem ser empregadas para a produção do polipeptídeo de comprimento completo correspondente através da síntese peptídica; portanto, os fragmentos podem ser empregados como intermediários para a produção dos polipeptídeos de comprimento completo.
Petição 870170009999, de 15/02/2017, pág. 144/1247
135/788 [00236] Os sistemas de tradução isentos de células também podem ser empregados para a produção de um dos polipeptídeos de acordo com a invenção ou dos fragmentos que compreendem pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 ou 150 ou mais aminoácidos consecutivos dos mesmos utilizando mRNAs transcritos partindo de um constructo de DNA que compreende um promotor ligado de forma operacional a um ácido nucléico que codifica o polipeptídeo ou fragmento do mesmo. Em algumas modalidades, o constructo de DNA pode ser linearizado antes da realização de uma reação de transcrição in vitro. O mRNA transcrito é então incubado com um extrato de tradução isenta de células apropriado, tal como um extrato de reticulócitos de coelho, para a produção do polipeptídeo desejado ou de um fragmento do mesmo.
Amplificação de Ácidos Nucléicos [00237] Na prática da invenção, os ácidos nucléicos de acordo com a invenção e os ácidos nucléicos que codificam as enzimas aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção ou os ácidos nucléicos modificados de acordo com a invenção, podem ser reproduzidos através de amplificação, tal como da PCR. A amplificação também pode ser utilizada para clonar ou modificar os ácidos nucléicos de acordo com a invenção. Assim, a invenção fornece pares de sequências iniciadoras de amplificação para a amplificação dos ácidos nucléicos de acordo com a invenção. Um versado na técnica pode planejar os pares de sequências iniciadoras de amplificação para qualquer parte de ou para o comprimento completo destas sequências.
[00238] Em algumas modalidades, a invenção fornece ácidos nucléicos amplificados através de pares de iniciadores de amplificação de acordo com a invenção, tais como os pares de iniciadores que são apresentados por aproximadamente os primeiros (a 5') 12, 13, 14, 15,
Petição 870170009999, de 15/02/2017, pág. 145/1247
136/788
16, 17, 18, 19, 20, 21, 22, 23, 24 ou 25 ou mais resíduos de ácidos nucléicos de acordo com a invenção e aproximadamente os primeiros (a 5') 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 ou 25 ou mais resíduos dos filamentos complementares. Em algumas modalidades, a invenção fornece pares de sequências iniciadoras de amplificação para a amplificação de um ácido nucléico que codifica um polipeptídeo que possui uma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, em que o par de iniciadores é capaz de amplificar um ácido nucléico que compreende uma sequência de acordo com a invenção ou fragmentos ou subsequências do mesmo. Um ou cada membro do par de sequências iniciadoras de amplificação pode compreender um oligonucleotídeo que compreende pelo menos aproximadamente 10 até 50 ou mais bases consecutivas da sequência ou aproximadamente 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 ou 25 ou mais bases consecutivas da sequência. Em algumas modalidades, a invenção fornece pares de iniciadores de amplificação, em que o par de iniciadores compreende um primeiro membro que possui uma sequência que é apresentada por aproximadamente os primeiros (a 5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 ou 25 ou mais resíduos de um ácido nucléico de acordo com a invenção e um segundo membro que possui uma sequência que é apresentada por aproximadamente os primeiros (a 5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 ou 25 ou mais resíduos do filamento complementar do primeiro membro.
[00239] A invenção fornece enzimas aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase geradas através de amplificação, tal como através da reação em cadeia da polimerase (PCR), utilizando um par de iniciadores de amplificação de acordo com a invenção. Em algumas modalidades, a invenção fornece métodos de produção de uma enzima aldolase, tal como piruvato aldolase, HMG
Petição 870170009999, de 15/02/2017, pág. 146/1247
137/788 e/ou KHG aldolase através de amplificação, tal como da PCR, utilizando um par de iniciadores de amplificação de acordo com a invenção.
Em algumas modalidades, o par de iniciadores de amplificação amplifica um ácido nucléico partindo de uma biblioteca, tal como uma biblioteca gênica, tal como uma biblioteca ambiental.
[00240] As reações de amplificação também podem ser utilizadas para quantificar a quantidade de ácido nucléico em uma amostra (tal como a quantidade de mensagem em uma amostra de células), marcar o ácido nucléico (tal como a aplicação do mesmo em um arranjo ou um blot), detectar o ácido nucléico ou quantificar a quantidade de um ácido nucléico específico em uma amostra. Em algumas modalidades da invenção, a mensagem isolada de uma célula ou de uma biblioteca de cDNA é amplificada.
[00241] O versado na técnica pode selecionar e planejar iniciadores de amplificação de oligonucleotídeos adequados. Os métodos de amplificação também são bem-conhecidos na técnica e incluem, tais como a reação em cadeia da polimerase, PCR (vide PCR PROTOCOLS, A GUIDE TO METHODS AND APPLICATIONS, ed. Innis, Academic Press, N.Y. (1990) e PCR STRATEGIES (1995), ed. Innis, Academic Press, Inc., N.Y., a reação em cadeia da ligase (LCR) (vide Wu (1989) Genomics 4:560; Landegren (1988) Science 241:1077; Barringer (1990) Gene 89:117); amplificação por transcrição (vide Kwoh (1989) Proc. Natl. Acad. Sei. USA 86:1173); e replicação de sequência autosustentada (vide Guatelli (1990) Proc. Natl. Acad. Sei. USA 87:1874); amplificação pela Q Beta replicase (vide Smith (1997) J. Clin. Microbiol. 35:1477-1491), ensaio de amplificação pela Q-beta replicase automatizado (vide Burg (1996) Mol. Cell. Probes 10:257-271) e outras técnicas mediadas pela RNA polimerase (tal como NASBA, Cangene, Mississauga, Ontário); vide ainda Berger (1987) Methods Enzymol. 152:307-316; Ausubel e outros Current Protocols in Molecular Biology,
Petição 870170009999, de 15/02/2017, pág. 147/1247
138/788
John Wiley & Sons, Inc. 1997 e Sambrook e outros, Molecular Cloning:
A Laboratory Manual 2- Ed., Cold Spring Harbor Laboratory Press (1989). Patentes U.S. N— 4.683.195 e 4.683.202; Sooknanan (1995)
Biotechnology 13:563-564.
Determinação da Identidade de Sequência em Ácidos Nucléicos e Polipeptídeos [00242] A invenção fornece ácidos nucléicos que compreendem sequências que possuem pelo menos aproximadamente 50%, 51%,
52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%,
64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%,
76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%,
88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais ou identidade de sequências completa (100%) (homologia) a um ácido nucléico de acordo com a invenção (vide a Listagem de Sequências) ao longo de uma região de pelo menos aproximadamente 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550 ou mais resíduos. Em algumas modalidades, A presente invenção refere-se a polipeptídeos que compreendem sequências que possuem pelo menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%,
64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%,
76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%,
88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais ou identidade de sequências completa (100%) a um polipeptídeo de acordo com a invenção (vide a Listagem de Sequências). A extensão da identidade de sequências (homologia) pode ser determinada utilizando qualquer programa de computador e parâmetros associados, incluindo os descritos aqui, tal como BLAST 2.2.2. ou FASTA versão 3.0t78, com os parâmetros preestabelecidos.
Petição 870170009999, de 15/02/2017, pág. 148/1247
139/788 [00243] As sequências de ácidos nucléicos de acordo com a invenção podem compreender pelo menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 ou 500 ou mais nucleotídeos consecutivos de uma sequência de acordo com a invenção e sequências substancialmente idênticas às mesmas. As sequências homólogas e os fragmentos de sequências de ácidos nucléicos de acordo com a invenção podem se referir a uma sequência que possui pelo menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%,
73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%,
85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%,
97%, 98%, 99% ou mais de identidade de sequências (homologia) a estas sequências. A homologia (identidade de sequências) pode ser determinada utilizando qualquer um dos programas de computador e parâmetros descritos aqui, incluindo FASTA versão 3.0t78 com os parâmetros predeterminados. As sequências homólogas incluem ainda sequências de RNA em que as uridinas substituem as timinas nas sequências de ácidos nucléicos de acordo com a invenção. As sequências homólogas podem ser obtidas utilizando qualquer um dos procedimentos descritos aqui ou podem resultar da correção de um erro de seqüenciamento. Será considerado que as sequências de ácidos nucléicos de acordo com a invenção podem ser representadas no formato de caracteres simples tradicional (vide a capa interna de Stryer, Lubert. Biochemistry, 3- Ed., W. H Freeman & Co., Nova Iorque.) ou em qualquer outro formato que registre a identidade dos nucleotídeos em uma sequência.
[00244] Em algumas modalidades, os programas de comparação de sequências identificados aqui são utilizados neste aspecto de acordo com a invenção, isto é, para determinar se uma sequência de ácido nucléico ou de polipeptídeo está dentro do âmbito de acordo com a
Petição 870170009999, de 15/02/2017, pág. 149/1247
140/788 invenção. Entretanto, as identidades das sequências de proteínas e/ou de ácidos nucléicos (homologias) podem ser avaliadas utilizando qualquer algoritmo ou programa de comparação de sequências conhecido na técnica. Tais algoritmos e programas incluem, mas não estão limitados a TBLASTN, BLASTP, FASTA, TFASTA e CLUSTALW (vide Pearson e Lipman, Proc. Natl. Acad. Sei. USA 85(8):2444-2448. 1988; Altschul e outros, J. Mol. Biol. 215(3):403-410. 1990; Thompson Nucleic Acids Res. 22(2):4673-4680. 1994; Higgins e outros, Methods Enzymol. 266:383-402. 1996; Altschul e outros, J. Mol. Biol. 215(3):403-410. 1990; Altschul e outros, Nature Genetics 3:266-272, 1993).
[00245] Em algumas modalidades, a homologia ou a identidade é medida utilizando um software de análise de sequências (tal como Sequence Analysis Software Package of the Genetics Computer Group, University of Wisconsin Biotechnology Center, 1710 University Avenue, Madison, Wl 53705). Tais software combinam sequências similares através da atribuição de graus de homologia a várias deleções, substituições e outras modificações. Em algumas modalidades, os termos homologia e identidade no contexto de duas ou mais sequências de ácidos nucléicos ou de polipeptídeos, se referem a duas ou mais sequências ou subsequências que são as mesmas ou que possuem uma porcentagem especificada de resíduos de aminoácidos ou de nucleotídeos que são os mesmos quando comparados e alinhados para a correspondência máxima ao longo de uma janela de comparação ou região determinada que é medida utilizando qualquer número de algoritmos de comparação de sequências ou através de alinhamento manual e inspeção visual. Em algumas modalidades, para a comparação de sequências, uma sequência atua como uma sequência de referência, a qual as sequências de teste são comparadas. Quando é utilizado um algoritmo de comparação de sequências, as sequências de teste e de
Petição 870170009999, de 15/02/2017, pág. 150/1247
141/788 referência são inseridas em um computador, as coordenadas das subsequências são determinadas, se necessário e os parâmetros do programa de algoritmo de sequência são determinados. Os parâmetros do programa predeterminados podem ser utilizados ou parâmetros alternativos podem ser determinados. O algoritmo de comparação de sequências calcula então a porcentagem de identidade de sequências para as sequências de teste em relação à sequência de referência, com base nos parâmetros do programa.
[00246] Uma janela de comparação, como utilizado aqui, inclui referência a um segmento de qualquer um do número de posições contíguas selecionadas do grupo que consiste em 20 até 600, geralmente aproximadamente 50 até aproximadamente 200, mas geralmente aproximadamente 100 até aproximadamente 150 em que uma sequência pode ser comparada com uma sequência de referência do mesmo número de posições contíguas após as duas sequências serem alinhadas de forma ótima. Os métodos de alinhamento de sequência para comparação são bem-conhecidos na técnica. O alinhamento ótimo de sequências para comparação pode ser realizado, tal como através do algoritmo de homologia local de Smith & Waterman, Adv. Appl. Math. 2:482, 1981, através do algoritmo de alinhamento de homologia de Needleman & Wunsch, J. Mol. Biol 48:443. 1970, através do método de busca por similaridade de Person & Lipman, Proc. Nat'l. Acad. Sei. USA 85:2444. 1988, através de implementações computarizadas destes algoritmos (GAP, BESTFIT, FASTA e TFASTA no Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, Wl) ou através de alinhamento manual e inspeção visual. Outros algoritmos para determinar a homologia ou a identidade incluem, por exemplo, em adição a um programa BLAST (Basic Local Alignment Search Tool at the National Center for Biological Information), ALIGN, AMAS (Analysis of Multiply Aligned SequenPetição 870170009999, de 15/02/2017, pág. 151/1247
142/788 ces), AMPS (Protein Multiple Sequence Alignment), ASSET (Aligned Segment Statistical Evaluation Tool), BANDS, BESTSCOR, BIOSCAN (Biological Sequence Comparative Analysis Node), BLIMPS (BLocks IMProved Searcher), FASTA, Intervals & Points, BMB, CLUSTAL V, CLUSTAL W, CONSENSUS, LCONSENSUS, WCONSENSUS, algoritmo de Smith-Waterman, DARWIN, algoritmo de Las Vegas, FNAT (Forced Nucleotide Alignment Tool), Framealign, Framesearch, DYNAMIC, FILTER, FSAP (Fristensky Sequence Analysis Package), GAP (Global Alignment Program), GENAL, GIBBS, GenQuest, ISSC (Sensitive Sequence Comparison), LALIGN (Local Sequence Alignment), LCP (Local Content Program), MACAW (Multiple Alignment Construction & Analysis Workbench), MAP (Multiple Alignment Program), MBLKP, MBLKN, ΡΙΜΑ (Pattern-lnduced Multi-sequence Alignment), SAGA (Sequence Alignment by Genetic Algorithm) e WHATIF. Tais programas de alinhamento também podem ser utilizados para buscas em bancos de dados de genoma para identificar sequências de polinucleotídeos que possuem sequências substancialmente idênticas. Um número de bancos de dados de genoma está disponível, por exemplo, uma parte substancial do genoma humano está disponível como parte do Human Genome Sequencing Project (Projeto de Seqüenciamento do Genoma Humano) (Gibbs, 1995). Pelo menos vinte e um outros genomas já foram seqüenciados, incluindo, por exemplo, de M. genitalium (Fraser e outros, Science 270:397-403 (1995)), M. jannaschii (Bult e outros, Science 23:1058-73 (1996)), H. influenzae (Fleischmann e outros, Science 269:496-512 (1995)), E. coli (Blattner e outros, Science 277:1453-74 (1997)) e levedura (S. cerevisiae) (Mewes e outros, Nature 387:7-65 (1997)) e D. melanogaster (Adams e outros, Science 287:2185-95 (2000)). Um progresso significativo também foi feito no seqüenciamento dos genomas de organismo modelo, tal como camundongo, C. elegans e Arabadopsis sp. Vários bancos de
Petição 870170009999, de 15/02/2017, pág. 152/1247
143/788 dados contendo informação genômica anotada com alguma informação funcional são mantidos por organizações diferentes e podem ser acessados através da internet.
[00247] Em algumas modalidades, são utilizados os algoritmos de BLAST e BLAST 2.0, que são descritos em Altschul e outros, Nuc. Acids Res. 25:3389-3402. 1977 e Altschul e outros, J. Mol. Biol. 215:403-410. 1990, respectivamente. O software para realizar as análises de BLAST está disponível publicamente através do National Center for Biotechnology Information. Este algoritmo envolve primeiro a identificação de pares de sequência de alto escore (HSPs) através da identificação de palavras curtas de comprimento W na sequência de busca, que se combinam ou satisfazem algum escore T de limiar com valor positivo quando alinhadas com uma palavra do mesmo comprimento em uma sequência do banco de dados. T é referido como o limiar de escore da palavra da vizinhança (Altschul e outros, supra). Estas combinações iniciais das palavras da vizinhança atuam como agentes iniciadores para começar as buscas para encontrar HSPs mais longos contendo as mesmas. As combinações de palavras são estendidas em ambas as direções ao longo de cada sequência ao longo de o mais longe o escore de alinhamento cumulativo puder ser aumentado. Os escores cumulativos são calculados utilizando, para as sequências de nucleotídeos, os parâmetros M (escore de recompensa para um par de resíduos que combinam; sempre >0). Para as sequências de aminoácidos, uma matriz de atribuição de escore é utilizada para calular o escore cumulativo. A extensão das combinações de palavras em cada direção é interrompida quando: o escore de alinhamento diminui na quantidade X de seu valor máximo atingido; o escore cumulativo vai até zero ou abaixo, devido ao acúmulo de um ou mais alinhamentos de resíduos com escore negativo; ou o final de qualquer uma das sequências é atingido. Os parâmetros W, T e X do algoritmo
Petição 870170009999, de 15/02/2017, pág. 153/1247
144/788 de BLAST determinam a sensibilidade e a velocidade do alinhamento. O programa BLASTN (para sequências de nucleotídeos) utiliza como padrões um comprimento de palavra (W) de 11, uma expectativa (E) de 10, M=5, N=-4 e uma comparação de ambos os filamentos. Para as sequências de aminoácidos, o programa BLASTP utiliza como padrões um comprimento de palavara de 3 e expectativas (E) de 10 e a matriz de obtenção de escore BLOSUM62 (vide Henikoff & Henikoff, Proc. Natl. Acad. Sei. USA 89:10915, 1989) alinhamentos (B) de 50, expectativa (E) de 10, M=5, N= -4 e uma comparação de ambos os filamentos.
[00248] O algoritmo de BLAST também realiza uma análise estatística da similaridade entre duas sequências (vide Karlin & Altschul, Proc. Natl. Acad. Sei. USA 90:5873. 1993). Uma medida da similaridade fornecida pelo algoritmo de BLAST é a menor probabilidade de soma (P(N)), que fornece uma indicação da probabilidade através da qual uma combinação entre duas sequências de nucleotídeos ou de aminoácidos ocorreria ao acaso. Por exemplo, um ácido nucléico é considerado similar a uma sequência de referência se a menor probabilidade de soma em uma comparação do ácido nucléico de teste com o ácido nucléico de referência for menor que aproximadamente 0,2, em algumas modalidades menor que aproximadamente 0,01 e em outras modalidades menor que aproximadamente 0,001.
[00249] Em algumas modalidades, as homologias das sequências de proteínas e de ácidos nucléicos são avaliadas utilizando a Basic Local Alignment Search Tool (BLAST). Em particular, cinco programas BLAST específicos são utilizados para realizar a tarefa a seguir: [00250] BLASTP e BLAST3 comparam uma sequência de busca de aminoácidos contra um banco de dados de sequências de proteínas; [00251] BLASTN compara uma sequência de busca de nucleotídeos contra um banco de dados de sequências de nucleotídeos;
Petição 870170009999, de 15/02/2017, pág. 154/1247
145/788 [00252] BLASTX compara os produtos da tradução conceituai de seis quadros de uma sequência de nucleotídeos de busca (ambos os filamentos) contra um banco de dados de sequências de proteínas; [00253] TBLASTN compara uma sequência de proteína de busca contra um banco de dados de sequências de nucleotídeos traduzidas em todos os seis quadros de leitura (ambos os filamentos); e [00254] TBLASTX compara as traduções nos seis quadros de uma sequência de busca de nucleotídeos contra as traduções nos seis quadros de um banco de dados de sequências de nucleotídeos.
[00255] Os programas BLAST identificam sequências homólogas através da identificação de segmentos similares, que são referidos aqui como pares de segmento com escore alto, entre uma sequência de aminoácidos ou de ácido nucléico de busca e uma sequência de teste que é, em algumas modalidades, obtida partindo de um banco de dados de sequências de proteínas ou de ácidos nucléicos. Os pares de segmentos com escore alto são, em algumas modalidades, identificados (isto é, alinhados) através de uma matriz de obtenção de escore, muitas da qual são conhecidas na técnica. Em algumas modalidades, a matriz de obtenção de escore é a matriz BLOSUM62 (Gonnet (1992) Science 256:1443-1445; Henikoff e Henikoff (1993) Proteins 17:49-61). Menos em algumas modalidades, as matrizes PAM ou PAM250 também podem ser utilizadas (vide Schwartz e Dayhoff, eds., 1978, Matrices for Detecting Distance Relationships: Atlas of Protein Sequence and Structure, Washington: National Biomedical Research Foundation). Os programas BLAST podem ser acessados através da U.S. National Library of Medicine.
[00256] Os parâmetros utilizados com os algoritmos anteriores podem ser adaptados dependendo do comprimento da sequência e do grau de homologia estudado. Em algumas modalidades, os parâmetros podem ser parâmetros preestabelecidos utilizados pelos algoritPetição 870170009999, de 15/02/2017, pág. 155/1247
146/788 mos na ausência de instruções do usuário.
Sistemas de Computador e Produtos de Programas de Computador [00257] A invenção fornece computadores, sistemas de computador, meios que podem ser lidos pelo computador, produtos de programas de computador e similares gravados ou armazenados nos mesmos as sequências de ácidos nucléicos e de polipeptídeos de acordo com a invenção. Adicionalmente, na prática dos métodos de acordo com a invenção, tal como para determinar e identificar identidades de sequências (para determinar se um ácido nucléico está dentro do âmbito de acordo com a invenção), homologias estruturais, motivos e similares in silico, uma sequência de ácido nucléico ou de polipeptídeo de acordo com a invenção pode ser armazenada, gravada e manipulada em qualquer meio que possa ser lido e acessado por um computador.
[00258] Como utilizado aqui, as palavras gravado e armazenado se referem a um processo para armazenar informação em um meio de computador. Um versado na técnica pode facilmente adotar quaisquer métodos conhecidos para gravar informação em um meio que pode ser lido pelo computador para gerar produtos que compreendem uma ou mais das sequências de ácidos nucléicos e/ou de polipeptídeos de acordo com a invenção. Como utilizado aqui, os termos computador, programa de computador e processador são utilizados em seus contextos gerais mais amplos e incorporam todos tais dispositivos, que são descritos em detalhes, abaixo. Uma sequência codificadora de ou uma sequência que codifica um polipeptídeo ou uma proteína particular, é uma sequência de ácido nucléico que é transcrita e traduzida em um polipeptídeo ou uma proteína quando colocada sob o controle de sequências reguladoras apropriadas.
[00259] Os polipeptídeos de acordo com a invenção incluem as sequências de acordo com a invenção e sequências substancialmente
Petição 870170009999, de 15/02/2017, pág. 156/1247
147/788 idênticas às mesmas e subsequências e fragmentos enzimaticamente ativos de qualquer uma das sequências anteriores. Em algumas modalidades, as sequências de polipeptídeos substancialmente idênticas ou homólogas se referem a uma sequência de polipeptídeo que possui pelo menos 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%,
60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%,
72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%,
84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%,
96%, 97%, 98%, 99% ou mais ou identidade de sequências completa (100%) (homologia) à sequência de acordo com a invenção.
[00260] A homologia (identidade de sequência) pode ser determinada utilizando qualquer um dos programas de computador e parâmetros descritos aqui. Uma sequência de ácido nucléico ou de polipeptídeo de acordo com a invenção pode ser armazenada, gravada e manipulada em qualquer meio que possa ser lido e acessado por um computador. Como utilizado aqui, as palavras gravado e armazenado se referem a um processo para armazenar informação em um meio de computador. Um versado na técnica pode facilmente adotar qualquer um dos métodos conhecidos atualmente para registrar informação em um meio que pode ser lido pelo computador para gerar produtos que compreendem uma ou mais das sequências de ácidos nucléicos de acordo com a invenção, uma ou mais das sequências de polipeptídeos de acordo com a invenção. Uma outra modalidade da invenção é um meio que pode ser lido pelo computador que possui gravado no mesmo pelo menos 2, 5, 10, 15 ou 20 ou mais sequências de ácidos nucléicos ou de polipeptídeos de acordo com a invenção. [00261] Uma outra modalidade da invenção é um meio que pode ser lido pelo computador que possui gravada no mesmo uma ou mais das sequências de ácidos nucléicos de acordo com a invenção. Uma outra modalidade da invenção é um meio que pode ser lido pelo comPetição 870170009999, de 15/02/2017, pág. 157/1247
148/788 putador que possui gravada no mesmo uma ou mais das sequências de polipeptídeos de acordo com a invenção. Uma outra modalidade da invenção é um meio que pode ser lido pelo computador que possui gravada no mesmo pelo menos 2, 5, 10, 15 ou 20 ou mais das sequências de ácidos nucléicos ou de polipeptídeos que são apresentadas anteriormente.
[00262] Os meios que podem ser lidos pelo computador incluem meios que podem ser lidos de forma magnética, meios que podem ser lidos de forma ótica, meios que podem ser lidos eletronicamente e meios magnéticos/ópticos. Por exemplo, os meios que podem ser lidos pelo computador podem ser um disco rígido, um disquete, uma fita magnética, CD-ROM, Digital Versatile Disk (DVD), Random Access Memory (RAM) ou Read Only Memory (ROM) assim como outros tipos de outros meios conhecidos pelos versados na técnica.
[00263] Algumas modalidades da invenção incluem sistemas (tais como sistemas com base na internet), tais como sistemas de computador que armazenam e manipulam a informação das sequências descritas aqui. Um exemplo de um sistema de computador 100 é ilustrado na forma de diagrama de blocos na figura 9. Como utilizado aqui, um sistema de computador refere-se aos componentes de hardware, aos componentes de software e aos componentes de armazenamento de dados utilizados para analisar uma sequência de nucleotídeos de uma sequência de ácido nucléico de acordo com a invenção ou de uma sequência de polipeptídeo de acordo com a invenção. Em algumas modalidades, o sistema de computador 100 inclui um processador para o processamento, para acessar e para manipular os dados das sequências. O processador 105 pode ser qualquer tipo bem-conhecido de unidade de processamento central, tal como, por exemplo, o Pentium lll da Intel Corporation ou processador similar da Sun, Motorola, Compaq, AMD ou International Business Machines.
Petição 870170009999, de 15/02/2017, pág. 158/1247
149/788 [00264] Em algumas modalidades, o sistema de computador 100 é um sistema de finalidade geral que compreende o processador 105 e um ou mais componentes de armazenamento de dados interno 110 para o armazenamento de dados e um ou mais dispositivos de recuperação de dados para recuperar os dados armazenados nos componentes de armazenamento de dados. Um versado na técnica pode considerar rapidamente que um dos sistemas de computador disponíveis atualmente é adequado.
[00265] Em uma modalidade, o sistema de computador 100 inclui um processador 105 conectado a um bus (barramento) que é conectado a uma memória principal 115 (em uma modalidade, implementada como RAM) e um ou mais dispositivos de armazenamento de dados internos 110, tal como um disco rígido e/ou outros meios que podem ser lidos pelo computador que possuem dados gravados nos mesmos. Em algumas modalidades, o sistema de computador 100 inclui ainda um ou mais dispositivos de recuperação de dados 118 para a leitura dos dados armazenados nos dispositivos de armazenamento de dados internos 110.
[00266] O dispositivo de recuperação de dados 118 pode representar, por exemplo, um drive de disquete, um drive de disco compacto, um drive de fita magnética ou um modem capaz de se conectar com um sistema de armazenamento de dados remoto (tal como através da internet) etc. Em algumas modalidades, o dispositivo de armazenamento de dados interno 110 é um meio removível que pode ser lido pelo computador tal como um disquete, um disco compacto, uma fita magnética etc. contendo controle lógico e/ou dados gravados nos mesmos. O sistema de computador 100 pode incluir vantajosamente ou ser programado por um software apropriado para a leitura do controle lógico e/ou dos dados partindo do componente de armazenamento de dados uma vez que é inserido no dispositivo de recuperação de
Petição 870170009999, de 15/02/2017, pág. 159/1247
150/788 dados.
[00267] O sistema de computador 100 inclui um display (mostrador) 120 que é utilizado para exibir os resultados a um usuário do computador. Deve ser também citado que o sistema de computador 100 pode estar ligado a outros sistemas de computador 125a-c em uma rede ou rede de área ampla para fornecer acesso centralizado ao sistema de computador 100.
[00268] O software para acessar e para processar as sequências de nucleotídeos de uma sequência de ácido nucléico de acordo com a invenção e sequências substancialmente idênticas à mesma ou uma sequência de polipeptídeo de acordo com a invenção e sequências substancialmente idênticas à mesma, (tais como ferramentas de busca, ferramentas de comparação e ferramentas de modelagem etc.) podem ficar na memória principal 115 durante a execução.
[00269] Em algumas modalidades, o sistema de computador 100 pode compreender ainda um algoritmo de comparação de sequências para a comparação de uma sequência de ácido nucléico de acordo com a invenção e sequências substancialmente idênticas à mesma ou uma sequência de polipeptídeo de acordo com a invenção e sequências substancialmente idênticas à mesma, armazenado em um meio que pode ser lido pelo computador com sequência(s) de nucleotídeos ou de polipeptídeo(s) de referência armazenada(s) em um meio que pode ser lido pelo computador. Um algoritmo de comparação de sequências refere-se a um ou mais programas que são implementados (de forma local ou remota) no sistema de computador 100 para comparar uma sequência de nucleotídeos com outras sequências de nucleotídeos e/ou compostos armazenados dentro de um meio de armazenamento de dados. Por exemplo, o algoritmo de comparação de sequências pode comparar as sequências de nucleotídeos de uma sequência de ácido nucléico de acordo com a invenção e sequências
Petição 870170009999, de 15/02/2017, pág. 160/1247
151/788 substancialmente idênticas à mesma ou uma sequência de polipeptídeo de acordo com a invenção e sequências substancialmente idênticas à mesma, armazenadas em um meio que pode ser lido pelo computador com sequências de referência armazenadas em um meio que pode ser lido pelo computador para identificar homologias ou motivos estruturais.
[00270] A figura 10 é um diagrama de fluxo que ilustra uma modalidade de um processo 200 para a comparação de uma nova sequência de nucleotídeos ou de proteína com um banco de dados de sequências com a finalidade de determinar os níveis de homologia entre a nova sequência e as sequências no banco de dados. Os bancos de dados de sequências podem ser um banco de dados privado armazenado dentro do sistema de computador 100 ou um banco de dados público tal como GENBANK que está disponível através da Internet.
[00271] O processo 200 começa em um estado de início 201 e então se move para um estado 202 em que a nova sequência que será comparada é armazenada em uma memória em um sistema de computador 100. Como discutido anteriormente, a memória poderia ser qualquer tipo de memória, incluindo RAM ou um dispositivo de armazenamento interno.
[00272] O processo 200 então se move para um estado 204 em que um banco de dados de sequências é aberto para análise e comparação. O processo 200 então se move para um estado 206 em que a primeira sequência armazenada no banco de dados é lida em uma memória no computador. Uma comparação é então realizada em um estado 210 para determinar se a primeira sequência é a mesma que a segunda sequência. É importante observar que esta etapa não está limitada à realização de uma comparação exata entre a nova sequência e a primeira sequência no banco de dados. Métodos bemconhecidos são conhecidos pelos versados na técnica para a compaPetição 870170009999, de 15/02/2017, pág. 161/1247
152/788 ração de duas sequências de nucleotídeos ou de proteínas, mesmo se não forem idênticas. Por exemplo, podem ser introduzidos espaços em uma sequência para aumentar o nível de homologia entre as duas sequências testadas. Os parâmetros que controlam os espaços ou outras características que são introduzidas em uma sequência durante a comparação são normalmente inseridos pelo usuário do sistema de computador.
[00273] Uma vez que uma comparação das duas sequências foi realizada no estado 210, é feita uma determinação em um estado de decisão 210 se as duas sequências forem as mesmas. Evidentemente, o termo mesma não está limitado às sequências que são absolutamente idênticas. As sequências que estão dentro dos parâmetros de homologia inseridos pelo usuário serão marcadas como as mesmas no processo 200.
[00274] Se for feita uma determinação de que as duas sequências são as mesmas, o processo 200 se move para um estado 214 em que o nome da sequência do banco de dados é exibido para o usuário. Este estado notifica o usuário que a sequência com o nome exibido satisfaz às restrições de homologia que foram inseridas. Uma vez que o nome da sequência armazenada é exibido para o usuário, o processo 200 se move para um estado de decisão 218 em que é feita uma determinação se há mais sequências no banco de dados. Se não houver mais sequências no banco de dados, então o processo 200 termina em um estado final 220. Entretanto, se houver mais sequências no banco de dados, então o processo 200 se move para um estado 224 em que um indicador é movido para a sequência seguinte no banco de dados de forma que esta possa ser comparada com a nova sequência. Desta maneira, a nova sequência é alinhada e comparada com cada sequência no banco de dados.
[00275] Deve ser citado que se foi feita uma determinação no estaPetição 870170009999, de 15/02/2017, pág. 162/1247
153/788 do de decisão 212 de que as sequências não eram homólogas, então o processo 200 se movería imediatamente para o estado de decisão
218 com a finalidade de determinar se quaisquer outras sequências estavam disponíveis no banco de dados para comparação.
[00276] Conseqüentemente, uma modalidade da invenção é um sistema de computador que compreende um processador, um dispositivo de armazenamento de dados que possui armazenado no mesmo uma sequência de ácido nucléico de acordo com a invenção e sequências substancialmente idênticas à mesma ou uma sequência de polipeptídeo de acordo com a invenção e sequências substancialmente idênticas à mesma, um dispositivo de armazenamento de dados que possui armazenadas de forma que pode ser recuperada no mesmo sequências de nucleotídeos ou sequências de polipeptídeos de referência que serão comparadas com uma sequência de ácido nucléico de acordo com a invenção e sequências substancialmente idênticas à mesma ou uma sequência de polipeptídeo de acordo com a invenção e sequências substancialmente idênticas à mesma e uma sequência de comparação para realizar a comparação. A sequência de comparação pode indicar um nível de homologia entre as sequências comparadas ou identificar motivos estruturais no código do ácido nucléico descrito anteriormente de uma sequência de ácido nucléico de acordo com a invenção e sequências substancialmente idênticas à mesma ou uma sequência de polipeptídeo de acordo com a invenção e sequências substancialmente idênticas à mesma ou pode identificar motivos estruturais nas sequências que são comparadas com estes códigos de ácidos nucléicos e códigos de polipeptídeos. Em algumas modalidades, o dispositivo de armazenamento de dados pode ter armazenado no mesmo as sequências de pelo menos 2, 5, 10, 15, 20, 25, 30 ou 40 ou mais das sequências de ácidos nucléicos de acordo com a invenção e sequências substancialmente idênticas às mesmas ou as sePetição 870170009999, de 15/02/2017, pág. 163/1247
154/788 quências de polipeptídeos de acordo com a invenção e sequências substancialmente idênticas às mesmas.
[00277] Uma outra modalidade da invenção é um método para determinar o nível de homologia entre uma sequência de ácido nucléico de acordo com a invenção e sequências substancialmente idênticas à mesma ou uma sequência de polipeptídeo de acordo com a invenção e sequências substancialmente idênticas à mesma e uma sequência de nucleotídeos de referência. O método inclui a leitura do código de ácido nucléico ou do código de polipeptídeo e a sequência de nucleotídeos ou de polipeptídeo de referência através do uso de um programa de computador que determina os níveis de homologia e que determina a homologia entre o código de ácido nucléico ou o código de polipeptídeo e a sequência de nucleotídeos ou de polipeptídeo de referência com o programa de computador. O programa de computador pode ser qualquer um de um número de programas de computador para determinar os níveis de homologia, incluindo os enumerados especificamente aqui, (tal como BLAST2N com os parâmetros preestabelecidos ou com quaisquer parâmetros modificados). O método pode ser implementado utilizando os sistemas de computador descritos anteriormente. O método pode também ser realizado através da leitura de pelo menos 2, 5, 10, 15, 20, 25, 30 ou 40 ou mais das sequências de ácidos nucléicos descritas anteriormente de acordo com a invenção e sequências substancialmente idênticas às mesmas ou as sequências de polipeptídeos de acordo com a invenção e sequências substancialmente idênticas às mesmas através do uso do programa de computador e da determinação da homologia entre os códigos de ácidos nucléicos ou dos códigos de polipeptídeos e sequências de nucleotídeos ou sequências de polipeptídeos de referência.
[00278] A figura 11 é um diagrama de fluxo que ilustra uma modalidade de um processo 250 em um computador para determinar se duas
Petição 870170009999, de 15/02/2017, pág. 164/1247
155/788 sequências são homólogas. O processo 250 começa no estado de início 252 e então se move para um estado 254 em que uma primeira sequência que será comparada é armazenada em uma memória. A segunda sequência que será comparada é então armazenada em uma memória em um estado 256. O processo 250 então se move para um estado 260 em que o primeiro caracter na primeira sequência é lido e então para um estado 262 em que o primeiro caracter da segunda sequência é lido. Deve ser entendido que se a sequência for uma sequência de nucleotídeos, então o caracter seria normalmente A, T, C, G ou U. Se a sequência for uma sequência de proteína, então, em algumas modalidades, está no código de aminoácido de uma única letra de forma que as primeira e segunda sequências podem ser facilmente comparadas.
[00279] É feita uma determinação em um estado de decisão 264 se os dois caracteres são os mesmos. Se forem os mesmos, então o processo 250 se move para um estado 268 em que os caracteres seguintes nas primeira e segunda sequências são lidos. É então feita uma determinação se os caracteres seguintes são os mesmos. Se forem, então o processo 250 continua neste loop até que dois caracteres não sejam os mesmos. Se for feita uma determinação de que os dois caracteres seguintes não são os mesmos, o processo 250 se move para um estado de decisão 274 para determinar se há quaisquer mais caracteres em qualquer sequência que será lida.
[00280] Se não houver quaisquer mais caracteres para serem lidos, então o processo 250 se move para um estado 276 em que o nível de homologia entre as primeira e segunda sequências é exibido para o usuário. O nível de homologia é determinado através do cálculo da proporção de caracteres entre as sequências que eram as mesmas do número total de sequências na primeira sequência. Assim, se cada caracter em uma primeira sequência de 100 nucleotídeos se alinhar a
Petição 870170009999, de 15/02/2017, pág. 165/1247
156/788 cada caracter em uma segunda sequência, o nível de homologia seria de 100%.
[00281] Alternativamente, o programa de computador pode ser um programa de computador que compara as sequências de nucleotídeos de uma sequência de ácido nucléico que é apresentada na invenção, com uma ou mais sequências de nucleotídeos de referência com a finalidade de determinar se o código de ácido nucléico de acordo com a invenção e sequências substancialmente idênticas ao mesmo, diferem de uma sequência de ácido nucléico de referência em uma ou mais posições. Opcionalmente tal programa registra o comprimento e a identidade de nucleotídeos inseridos, deletados ou substituídos em relação à sequência do polinucleotídeo de referência ou uma sequência de ácido nucléico de acordo com a invenção e sequências substancialmente idênticas à mesma. Em algumas modalidades, o programa de computador pode ser um programa que determina se uma sequência de ácido nucléico de acordo com a invenção e sequências substancialmente idênticas à mesma, contêm um polimorfismo de um único nucleotídeo (SNP) em relação a uma sequência de nucleotídeos de referência.
[00282] Conseqüentemente, uma outra modalidade da invenção é um método para determinar se uma sequência de ácido nucléico de acordo com a invenção e sequências substancialmente idênticas à mesma, diferem em um ou mais nucleotídeos de uma sequência de nucleotídeos de referência que compreende as etapas de leitura do código do ácido nucléico e da sequência de nucleotídeos de referência através do uso de um programa de computador que identifica diferenças entre sequências de ácidos nucléicos e de identificação de diferenças entre o código do ácido nucléico e a sequência de nucleotídeos de referência com o programa de computador. Em algumas modalidades, o programa de computador é um programa que identifica polimorPetição 870170009999, de 15/02/2017, pág. 166/1247
157/788 fismos de um único nucleotídeo. O método pode ser implementado através dos sistemas de computador descritos anteriormente e do método ilustrado na figura 11.0 método também pode ser realizado através da leitura de pelo menos 2, 5, 10, 15, 20, 25, 30 ou 40 ou mais das sequências de ácidos nucléicos de acordo com a invenção e sequências substancialmente idênticas às mesmas e das sequências de nucleotídeos de referência através do uso do programa de computador e da identificação de diferenças entre os códigos de ácidos nucléicos e as sequências de nucleotídeos de referência com o programa de computador.
[00283] Em outras modalidades, o sistema com baseado em computador pode compreender ainda um identificador para identificar características dentro de uma sequência de ácido nucléico de acordo com a invenção ou uma sequência de polipeptídeo de acordo com a invenção e sequências substancialmente idênticas à mesma. Um identificador refere-se a um ou mais programas que identificam certas características dentro de uma sequência de ácido nucléico de acordo com a invenção ou uma sequência de polipeptídeo de acordo com a invenção. Em algumas modalidades, o identificador pode compreender um programa que identifica um quadro aberto de leitura em uma sequência de ácido nucléico de acordo com a invenção e sequências substancialmente idênticas à mesma.
[00284] A figura 12 é um diagrama de fluxo que ilustra uma modalidade de um processo identificador 300 para a detecção da presença de uma característica em uma sequência. O processo 300 começa no estado de início 302 e então se move para um estado 304 em que uma primeira sequência que será verificada em relação às características é armazenada em uma memória 115 no sistema de computador 100. O processo 300 então se move para um estado 306 em que um banco de dados de características de sequência é aberto. Tal banco
Petição 870170009999, de 15/02/2017, pág. 167/1247
158/788 de dados incluiría uma lista de atributos de cada característica junto com o nome da característica. Por exemplo, um nome de característica podería ser Códon de Início e o atributo seria ATG. Um outro exemplo seria o nome da característica TAATAA Box e o atributo da característica seria TAATAA. Um exemplo de tal banco de dados é produzido pelo University of Wisconsin Genetics Computer Group. Alternativamente, as características podem ser motivos de polipeptídeos estruturais tais como alfa hélices, folhas beta ou motivos de polipeptídeos funcionais tais como sítios ativos enzimáticos, motivos hélicevolta-hélice ou outros motivos conhecidos pelos versados na técnica. [00285] Uma vez que o banco de dados de características é aberto no estado 306, o processo 300 se move para um estado 308 em que a primeira característica é lida partindo do banco de dados. É então feita uma comparação do atributo da primeira característica com a primeira sequência em um estado 310. É então feita uma determinação em um estado de decisão 316 se o atributo da característica foi encontrado na primeira sequência. Se o atributo tiver sido encontrado, então o processo 300 se move para um estado 318 em que o nome da característica encontrada é exibido para o usuário.
[00286] O processo 300 então se move para um estado de decisão 320 em que é feita uma determinação se há mais características no banco de dados. Se não houver mais características, então o processo 300 termina em um estado final 324. Entretanto, se houver mais características no banco de dados, então o processo 300 lê a característica de sequência seguinte em um estado 326 e entra em loop de volta para o estado 310 em que o atributo da característica seguinte é comparado contra a primeira sequência. Deve ser citado, que se o atributo da característica não for encontrado na primeira sequência no estado de decisão 316, o processo 300 se move diretamente para o estado de decisão 320 com a finalidade de determinar se há quaisquer mais caPetição 870170009999, de 15/02/2017, pág. 168/1247
159/788 racterísticas no banco de dados.
[00287] Conseqüentemente, uma outra modalidade da invenção é um método de identificação de uma característica dentro de uma sequência de ácido nucléico de acordo com a invenção e sequências substancialmente idênticas à mesma ou uma sequência de polipeptídeo de acordo com a invenção e sequências substancialmente idênticas à mesma, que compreende a leitura do(s) código(s) de ácido nucléico ou do(s) código(s) de polipeptídeo através do uso de um programa de computador que identifica características contidas no(s) mesmo(s) e da identificação de características dentro do(s) código(s) de ácido nucléico com o programa de computador. Em algumas modalidades, o programa de computador compreende um programa de computador que identifica quadros abertos de leitura. O método pode ser realizado através de leitura de uma única sequência ou de pelo menos 2, 5, 10, 15, 20, 25, 30 ou 40 ou mais das sequências de ácidos nucléicos de acordo com a invenção e sequências substancialmente idênticas às mesmas ou das sequências de polipeptídeos de acordo com a invenção e sequências substancialmente idênticas às mesmas, através do uso do programa de computador e da identificação de características dentro dos códigos de ácido nucléico ou dos códigos de polipeptídeo com o programa de computador.
[00288] Uma sequência de ácido nucléico de acordo com a invenção e sequências substancialmente idênticas à mesma ou uma sequência de polipeptídeo de acordo com a invenção e sequências substancialmente idênticas à mesma, podem ser armazenadas e manipuladas em uma variedade de programas de processamento de dados em uma variedade de formatos. Por exemplo, uma sequência de ácido nucléico de acordo com a invenção e sequências substancialmente idênticas à mesma ou uma sequência de polipeptídeo de acordo com a invenção e sequências substancialmente idênticas à mesma, podem
Petição 870170009999, de 15/02/2017, pág. 169/1247
160/788 ser armazenadas na forma de texto em um arquivo de processamento de palavras, tal como Microsoft WORD® ou WORDPERFECT® ou na forma de um arquivo ASCII em uma variedade de programas de bancos de dados familiares aos versados na técnica, tal como DB2®, SYBASE® ou ORACLE®. Em adição, muitos programas de computador e bancos de dados podem ser utilizados como algoritmos de comparação de sequências, identificadores ou fontes de sequências de nucleotídeos ou de sequências de polipeptídeos de referência que serão comparadas com uma sequência de ácido nucléico de acordo com a invenção e sequências substancialmente idênticas à mesma ou uma sequência de polipeptídeo de acordo com a invenção e sequências substancialmente idênticas à mesma. Não é pretendido que a lista a seguir limite a invenção, mas que forneça orientação a programas e bancos de dados que são úteis com as sequências de ácidos nucléicos de acordo com a invenção e sequências substancialmente idênticas às mesmas ou as sequências de polipeptídeos de acordo com a invenção e sequências substancialmente idênticas às mesmas.
[00289] Os programas e os bancos de dados que podem ser utilizados incluem, mas não estão limitados a: MACPATTERN® (EMBL), DISCOVERYBASE® (Molecular Applications Group), GENEMINE® (Molecular Applications Group), LOOK® (Molecular Applications Group), MACLOOK® (Molecular Applications Group), BLAST e BLAST2 (NCBI), BLASTN e BLASTX (Altschul e outros, J. Mol. Biol. 215: 403, 1990), FASTA (Pearson e Lipman, Proc. Natl. Acad. Sei. USA, 85: 2444, 1988), FASTDB (Brutlag e outros Comp. App. Biosci. 6:237-245, 1990), CATALYST® (Molecular Simulations Inc.), Catalyst/SHAPE® (Molecular Simulations Inc.), Cerius2.DBAccess® (Molecular Simulations Inc.), HYPOGEN® (Molecular Simulations Inc.), INSIGHT II®, (Molecular Simulations Inc.), DISCOVER® (Molecular Simulations Inc.), CHARMm® (Molecular Simulations Inc.), FELIX® (MolecuPetição 870170009999, de 15/02/2017, pág. 170/1247
161/788 lar Simulations Inc.), DELPHI®, (Molecular Simulations Inc.), QuanteMM®, (Molecular Simulations Inc.), Homology (Molecular Simulations Inc.), MODELER® (Molecular Simulations Inc.), ISIS® (Molecular Simulations Inc.), Quanta/Protein Design (Molecular Simulations Inc.), WebLab (Molecular Simulations Inc.), WebLab Diversity Explorer (Molecular Simulations Inc.), Gene Explorer (Molecular Simulations Inc.), SeqFold (Molecular Simulations Inc.), o banco de dados do MDL Available Chemicals Directory, o banco de dados do MDL Drug Data Report, o banco de dados da Comprehensive Medicinal Chemistry, o banco de dados Derwents's World Drug Index, o banco de dados BioByteMasterFile, banco de dados Genbank e o banco de dados Genseqn. Muitos outros programas e bancos de dados seriam evidentes para um versado na técnica fornecida a presente descrição.
[00290] Os motivos que podem ser detectados utilizando os programas anteriores incluem as sequências que codificam zíperes de leucina, motivos de hélice-volta-hélice, sítios de glicosilação, sítios de ubiquitinação, alfa hélices e folhas beta, sequências de sinais que codificam peptídeos de sinais que direcionam a secreção das proteínas codificadas, sequências implicadas na regulação da transcrição tais como homeoboxes, filamentos ácidos, sítios ativos enzimáticos, sítios de ligação ao substrato e sítios de divagem enzimática.
Hibridização de Ácidos Nucléicos [00291] A invenção fornece ácidos nucléicos isolados, sintéticos ou recombinantes que se hibridizam sob condições rigorosas com uma sequência de acordo com a invenção (tal como SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID
Petição 870170009999, de 15/02/2017, pág. 171/1247
162/788
NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID
NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID
NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID
NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID
NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID
NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID
NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID
NO:101, SEQ ΝΟ:109, SEQ Ν0:117, SEQ ΝΟ:125, SEQ ΝΟ:133, SEQ Ν0:141, SEQ ΝΟ:149, SEQ ΝΟ:157, SEQ ΝΟ:165, SEQ ΝΟ:173, SEQ Ν0:181, SEQ ΝΟ:189, SEQ ΝΟ:197, SEQ ΝΟ:205, SEQ ΝΟ:213, SEQ ΝΟ:221, SEQ ΝΟ:229, SEQ ΝΟ:237, SEQ ΝΟ:245, SEQ ΝΟ:253, SEQ ΝΟ:261, SEQ ΝΟ:269, SEQ ΝΟ:277, SEQ
ID NO:103, SEQ ID N0:111, SEQ ID N0:119, SEQ ID NO:127, SEQ ID NO:135, SEQ ID NO:143, SEQ ID N0:151, SEQ ID NO:159, SEQ ID NO:167, SEQ ID NO:175, SEQ ID NO:183, SEQ ID N0:191, SEQ ID NO:199, SEQ ID NO:207, SEQ ID NO:215, SEQ ID NO:223, SEQ ID NO:231, SEQ ID NO:239, SEQ ID NO:247, SEQ ID NO:255, SEQ ID NO:263, SEQ ID NO:271, SEQ ID NO:279, SEQ
D NO:105, SEQ D N0:113, SEQ D N0:121, SEQ D NO:129, SEQ D NO:137, SEQ D NO:145, SEQ D NO:153, SEQ D N0:161, SEQ D NO:169, SEQ D NO:177, SEQ D NO:185, SEQ D NO:193, SEQ D NO:201, SEQ D NO:209, SEQ D NO:217, SEQ D NO:225, SEQ D NO:233, SEQ D NO:241, SEQ D NO:249, SEQ D NO:257, SEQ D NO:265, SEQ D NO:273, SEQ D NO:281, SEQ
D NO:107, SEQ D N0:115, SEQ D NO:123, SEQ D N0:131, SEQ D NO:139, SEQ D NO:147, SEQ D NO:155, SEQ D NO:163, SEQ D N0:171, SEQ D NO:179, SEQ D NO:187, SEQ D NO:195, SEQ D NO:203, SEQ D N0:211, SEQ D NO:219, SEQ D NO:227, SEQ D NO:235, SEQ D NO:243, SEQ D NO:251, SEQ D NO:259, SEQ D NO:267, SEQ D NO:275, SEQ D NO:283, SEQ
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
Petição 870170009999, de 15/02/2017, pág. 172/1247
163/788
NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID
NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID
NO:301, SEQ ID NO:303, SEQ ID NO:305, SEQ ID NO:307, SEQ ID
NO:309, SEQ ID N0:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID
NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID
NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID
NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID NO:337 ou SEQ ID NO:338. As condições rigorosas podem ser condições altamente rigorosas, condições com rigor médio e/ou condições de baixo rigor, incluindo as condições de rigor alto e reduzido descritas aqui. Em algumas modalidades, é o rigor das condições de lavagem que apresentam as condições que determinam se um ácido nucléico está dentro do âmbito de acordo com a invenção, como discutido abaixo.
[00292] Hibridização refere-se ao processo através do qual um filamento de ácido nucléico se liga a um filamento complementar através do pareamento de bases. As reações de hibridização podem ser sensíveis e seletivas de forma que uma sequência particular de interesse pode ser identificada mesmo em amostras em que está presente em baixas concentrações. As condições rigorosas adequadas podem ser definidas, por exemplo, pelas concentrações de sal ou de formamida nas soluções de pré-hibridização e de hibridização ou pela temperatura de hibridização e são bem-conhecidas na técnica. Em outras modalidades, o rigor pode ser aumentado através da redução da concentração de sal, do aumento da concentração de formamida ou da elevação da temperatura de hibridização. Em outras modalidades, os ácidos nucléicos de acordo com a invenção são definidos por sua capacidade de se hibridizarem sob várias condições rigorosas (tais como altas, médias e baixas), como apresentado aqui.
[00293] Em algumas modalidades, a hibridização sob condições de alto rigor compreende aproximadamente 50% de formamida a aproxiPetição 870170009999, de 15/02/2017, pág. 173/1247
164/788 madamente 37Ό até 42Ό. Em algumas modalidades, as condições de hibridização compreendem condições de rigor reduzido em aproximadamente 35% até 25% de formamida a aproximadamente 30Ό até 35Ό. Em algumas modalidades, as condições de hibridização compreendem condições de alto rigor, tal como 42Ό em 50% de formamida, 5X de SSPE, 0,3% de SDS e 200 pg/mL de DNA de esperma de salmão cisalhado e desnaturado. Em algumas modalidades, as condições de hibridização compreendem estas condições de rigor reduzido, mas em 35% de formamida a uma temperatura reduzida de 35Ό. A faixa de temperatura correspondente a um nível particular de rigor pode ser adicionalmente reduzida através do cálculo da proporção de purinas em relação a pirimidinas do ácido nucléico de interesse e do ajuste da temperatura de acordo. As variações sobre as faixas e as condições anteriores são bem-conhecidas na técnica.
[00294] Em outras modalidades, os ácidos nucléicos de acordo com a invenção que são definidos pela sua capacidade de se hibridizarem sob condições rigorosas podem ter entre aproximadamente cinco resíduos e o comprimento completo do ácido nucléico de acordo com a invenção; de forma que podem ter pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 55, 60, 65, 70, 75, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000 ou mais resíduos de comprimento. Os ácidos nucléicos mais curtos que o comprimento completo também estão incluídos. Estes ácidos nucléicos podem ser úteis como, tais como sondas de hibridização, sondas de marcação, sondas de oligonucleotídeo para PCR, siRNA ou miRNA (de filamento simples ou duplo), sequências anti-sentido ou que codificam peptídeos que se ligam a anticorpos (epítopos), motivos, sítios ativos e similares.
[00295] Em algumas modalidades, os ácidos nucléicos de acordo com a invenção são definidos pela sua capacidade de se hibridizarem
Petição 870170009999, de 15/02/2017, pág. 174/1247
165/788 sob condições de alto rigor que compreendem de aproximadamente 50% de formamida a aproximadamente 37G até 42G. E m algumas modalidades, os ácidos nucléicos de acordo com a invenção são definidos por sua capacidade de se hibridizarem sob condições que compreendem rigor reduzido em aproximadamente 35% até 25% de formamida a aproximadamente 30G até 35G.
[00296] Alternativamente, os ácidos nucléicos de acordo com a invenção são definidos por sua capacidade de se hibridizarem sob condições que compreendem alto rigor a 42G em 50% de formamida, 5X de SSPE, 0,3% de SDS e uma sequência repetitiva que bloqueia ácido nucléico, tal como cot-1 ou DNA de esperma de salmão (tal como 200 pg/mL de DNA de esperma de salmão cisalhado e desnaturado). Em algumas modalidades, os ácidos nucléicos de acordo com a invenção são definidos por sua capacidade de se hibridizarem sob condições de rigor reduzido que compreendem 35% ou 40% de formamida a uma temperatura reduzida de 35G ou 42G.
[00297] Nas reações de hibridização de ácidos nucléicos, as condições utilizadas para atingir um nível particular de rigor variarão, dependendo da natureza dos ácidos nucléicos que serão hibridizados. Por exemplo, o comprimento, o grau de complementaridade, a composição da sequência de nucleotídeos (tal como conteúdo de GC v. AT) e o tipo de ácido nucléico (tal como RNA v. DNA) das regiões de hibridização dos ácidos nucléicos podem ser considerados na seleção das condições de hibridização. Uma consideração adicional é se um dos ácidos nucléicos está imobilizado, por exemplo, sobre um filtro.
[00298] A hibridização pode ser realizada sob condições de baixo rigor, de rigor moderado ou de alto rigor. Como um exemplo de hibridização de ácidos nucléicos, uma membrana de polímero contendo ácidos nucléicos desnaturados imobilizados é primeiramente préhibridizada durante 30 minutos a 45G em uma solução que consiste
Petição 870170009999, de 15/02/2017, pág. 175/1247
166/788 em 0,9 M de NaCI, 50 mM de NaH2PO4, pH 7,0, 5,0 mM de Na2EDTA, 0,5% de SDS, 10X Denhardfs e 0,5 mg/mL de ácido polirriboadenílico. Aproximadamente 2 X 107 cpm (atividade específica de 4-9 X 108 cpm/pg) de sonda de oligonucleotídeo marcada na extremidade com 32P são então adicionadas à solução. Após 12-16 horas de incubação, a membrana é lavada durante 30 minutos à temperatura ambiente em 1X SET (150 mM de NaCI, 20 mM de cloridrato de Tris, pH 7,8, 1 mM de Na2EDTA) contendo 0,5% de SDS, seguidos por uma lavagem de 30 minutos em 1X SET fresco à Tm-IOO para a sonda de oligonucleotídeo. A membrana é então exposta ao filme auto-radiográfico para a detecção de sinais de hibridização. Todas as hibridizações anteriores seriam consideradas como sob condições de alto rigor.
[00299] Após a hibridização, um filtro pode ser lavado para remover qualquer sonda detectável ligada de forma inespecífica. O rigor utilizado para lavar os filtros pode ser também variado dependendo da natureza dos ácidos nucléicos que serão hibridizados, do comprimento dos ácidos nucléicos que serão hibridizados, do grau de complementaridade, da composição de sequência de nucleotídeos (tal como conteúdo de GC v. AT) e do tipo de ácido nucléico (tal como RNA v. DNA). Os exemplos de lavagens em condições de rigor progressivamente maior são os seguintes: 2X SSC, 0,1% de SDS à temperatura ambiente durante 15 minutos (baixo rigor); 0,1X SSC, 0,5% de SDS à temperatura ambiente durante 30 minutos até 1 hora (rigor moderado); 0,1X SSC, 0,5% de SDS durante 15 até 30 minutos entre a temperatura de hibridização e 68°C (alto rigor); e 0,15 M de NaCI durante 15 minutos a 72°C (rigor muito alto). Uma lavagem de baixo rigor final pode ser realizada em 0,1X SSC à temperatura ambiente. Os exemplos anteriores são meramente ilustrativos de um conjunto de condições que pode ser utilizado para lavar os filtros. Um versado na técnica sabería que há vários protocolos para lavagens com rigor diferente. Alguns outros
Petição 870170009999, de 15/02/2017, pág. 176/1247
167/788 exemplos são fornecidos abaixo.
[00300] Em algumas modalidades, as condições de hibridização compreendem uma etapa de lavagem que compreende uma lavagem durante 30 minutos à temperatura ambiente em uma solução que compreende 1X 150 mM de NaCI, 20 mM de cloridrato de Tris, pH 7,8, 1 mM de Na2EDTA, 0,5% de SDS, seguida por uma lavagem de 30 minutos em solução fresca.
[00301] Os ácidos nucléicos que se hibridizaram com a sonda são identificados por auto-radiografia ou outras técnicas convencionais. [00302] Os procedimentos anteriores podem ser modificados para a identificação de ácidos nucléicos que possuem níveis decrescentes de identidade de sequência (homologia) com a sequência da sonda. Por exemplo, para a obtenção de ácidos nucléicos de identidade de sequência (homologia) decrescente com a sonda detectável, podem ser utilizadas condições menos rigorosas. Por exemplo, a temperatura de hibridização pode ser diminuída em incrementos de 50 partindo de 680 até 420 em um tampão de hibridização que poss ui uma concentração de Na+ de aproximadamente 1 M. Após a hibridização, o filtro pode ser lavado com 2X SSC, 0,5% de SDS na temperatura de hibridização. Estas condições são consideradas como sendo condições moderadas acima de 500 e condições baixas abai xo de 500. Um exemplo específico de condições de hibridização moderadas é quando a hibridização anterior é realizada a 550. Um exemplo específico de condições de hibridização de baixo rigor é quando a hibridização anterior é realizada a 450.
[00303] Alternativamente, a hibridização pode ser realizada em tampões, tal como 6X SSC, contendo formamida a uma temperatura de 420. Neste caso, a concentração de formamida no tampão de hibridização pode ser reduzida em incrementos de 5% partindo de 50% até 0% para identificar clones que possuem níveis decrescentes de
Petição 870170009999, de 15/02/2017, pág. 177/1247
168/788 homologia com a sonda. Após a hibridização, o filtro pode ser lavado com 6X SSC, 0,5% de SDS a 50Ό. Estas condições são consideradas como sendo condições moderadas acima de 25% de formamida e condições baixas abaixo de 25% de formamida. Um exemplo específico de condições de hibridização moderadas é quando a hibridização anterior é conduzida em 30% de formamida. Um exemplo específico de condições de hibridização de baixo rigor é quando a hibridização anterior é realizada em 10% de formamida.
[00304] Entretanto, a seleção de um formato de hibridização pode não ser crítica - é o rigor das condições de lavagem que mostra as condições que determinam se um ácido nucléico está dentro do âmbito de acordo com a invenção. As condições de lavagem utilizadas para identificar ácidos nucléicos dentro do âmbito de acordo com a invenção incluem, tal como: uma concentração de sal de aproximadamente 0,02 molar em pH 7 e uma temperatura de pelo menos aproximadamente 50Ό ou aproximadamente 55Ό até aproximadame nte 60Ό; ou uma concentração de sal de aproximadamente 0,15 M de NaCI a 72Ό durante aproximadamente 15 minutos; ou uma concentração de sal de aproximadamente 0,2X SSC a uma temperatura de pelo menos aproximadamente 50Ό ou aproximadamente 55Ό até ap roximadamente 60Ό durante aproximadamente 15 até aproximadamente 20 minutos; ou o complexo de hibridização é lavado duas vezes com uma solução com uma concentração de sal de aproximadamente 2X SSC contendo 0,1% de SDS à temperatura ambiente durante 15 minutos e então lavado duas vezes por 0,1X SSC contendo 0,1% de SDS a 68Ό durante 15 minutos; ou condições equivalentes. Vide Sambrook ed., Molecular Cloning: A Laboratory Manual (2- ed.), vols. 1-3, Cold Spring Harbor Laboratory (1989), LABORATORY TECHNIQUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY: HYBRIDIZATION WITH NUCLEIC ACID PROBES, Parte I. Theory and Nucleic Acid
Petição 870170009999, de 15/02/2017, pág. 178/1247
169/788
Preparation, Tijssen, ed. Elsevier, N.Y. (1993) e Ausubel, ed. John Wiley & Sons, Inc., Nova Iorque (1997) para uma descrição de tampão SSC e condições equivalentes.
[00305] Estes métodos podem ser utilizados para isolar ou para identificar ácidos nucléicos de acordo com a invenção e sequências substancialmente idênticas aos mesmos. Por exemplo, os métodos anteriores podem ser utilizados para isolar ou identificar ácidos nucléicos que possuem uma sequência com pelo menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%,
62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%,
74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%,
86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%,
98%, 99% ou mais identidade de sequência (homologia) a uma sequência de ácido nucléico selecionada do grupo que consiste em uma das sequências de acordo com a invenção e sequências substancialmente idênticas à mesma ou fragmentos que compreendem pelo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 ou 500 bases consecutivas da mesma e as sequências complementares à mesma. A identidade de sequência (homologia) pode ser medida utilizando o algoritmo de alinhamento. Por exemplo, os polinucleotídeos homólogos podem ter uma sequência codificadora que é uma variação alélica que ocorre naturalmente de uma das sequências codificadoras descritas aqui. Tais variações alélicas podem ter uma substituição, uma deleção ou uma adição de um ou mais nucleotídeos quando comparadas com os ácidos nucléicos de acordo com a invenção. Adicionalmente, os procedimentos anteriores podem ser utilizados para isolar ácidos nucléicos que codificam polipeptídeos que possuem pelo menos aproximadamente 99%, 95%, pelo menos 90%, pelo menos 85%, pelo menos 80%, pelo menos 75%, pelo menos 70%, pelo menos 65%, pelo menos 60%, pelo menos 55% ou pelo menos 50%
Petição 870170009999, de 15/02/2017, pág. 179/1247
170/788 de identidade de sequência (homologia) a um polipeptídeo de acordo com a invenção ou fragmentos que compreendem pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 ou 150 aminoácidos consecutivos dos mesmos que são determinados utilizando um algoritmo de alinhamento de sequências (tal como o algoritmo FASTA versão 3.0t78 com os parâmetros preestabelecidos).
[00306] Sondas de Oligonucleotídeos e Métodos para Utilização das mesmas [00307] A invenção fornece ainda sondas de ácidos nucléicos que podem ser utilizadas, tal como para a identificação, para a amplificação ou para o isolamento de ácidos nucléicos que codificam uma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase ou fragmentos dos mesmos ou para a identificação de genes da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase. Em algumas modalidades, a sonda compreende pelo menos aproximadamente 10 bases consecutivas de um ácido nucléico de acordo com a invenção. Alternativamente, uma sonda de acordo com a invenção pode ter pelo menos aproximadamente 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 110, 120, 130, 150 ou aproximadamente 10 até 50, aproximadamente 20 até 60 aproximadamente 30 até 70, bases consecutivas de uma sequência que é apresentada em um ácido nucléico de acordo com a invenção. As sondas identificam um ácido nucléico através da ligação e/ou da hibridização. As sondas podem ser utilizadas em arranjos de acordo com a invenção, vide a discussão abaixo, incluindo tais como arranjos capilares. As sondas de acordo com a invenção também podem ser utilizadas para isolar outros ácidos nucléicos ou polipeptídeos.
[00308] Os ácidos nucléicos isolados, sintéticos ou recombinantes de acordo com a invenção, as sequências complementares aos mesPetição 870170009999, de 15/02/2017, pág. 180/1247
171/788 mos ou um fragmento que compreende pelo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 ou 500 bases consecutivas de uma das sequências de acordo com a invenção ou as sequências complementares à mesma também podem ser utilizadas como sondas para determinar se uma amostra biológica, tal como uma amostra do solo, contém um organismo que possui uma sequência de ácido nucléico de acordo com a invenção ou um organismo do qual o ácido nucléico foi obtido. Em tais procedimentos, uma amostra biológica que potencialmente carrega o organismo do qual o ácido nucléico foi isolado é obtida e os ácidos nucléicos são obtidos partindo da amostra. Os ácidos nucléicos são colocados em contato com a sonda sob condições que permitem que a sonda se hibridize especificamente com quaisquer sequências complementares às quais estão presentes aqui.
[00309] Quando necessário, as condições que permitem que a sonda se hibridize especificamente com as sequências complementares podem ser determinadas colocando a sonda em contato com as sequências complementares provenientes das amostras conhecidas por conterem a sequência complementar assim como sequências de controle que não contêm a sequência complementar. As condições de hibridização, tal como a concentração de sal do tampão de hibridização, a concentração de formamida do tampão de hibridização ou a temperatura de hibridização, podem ser variadas para identificar condições que permitem que a sonda se hibridize especificamente com ácidos nucléicos complementares.
[00310] Se a amostra contiver o organismo do qual o ácido nucléico foi isolado, a hibridização específica da sonda é então detectada. A hibridização pode ser detectada através da marcação da sonda com um agente detectável tal como um isótopo radioativo, um corante fluorescente ou uma enzima capaz de catalisar a formação de um produto
Petição 870170009999, de 15/02/2017, pág. 181/1247
172/788 detectável.
[00311] Muitos métodos para a utilização das sondas marcadas para detectar a presença de ácidos nucléicos complementares em uma amostra são familiares aos versados na técnica. Estes incluem Southern Blots, Northern Blots, procedimentos de hibridização em colônias e dot blots. Os protocolos para cada um destes procedimentos são fornecidos em Ausubel e outros Current Protocols in Molecular Biology, John Wiley & Sons, Inc. (1997) e Sambrook e outros, Molecular Cloning: A Laboratory Manual 2- Ed., Cold Spring Harbor Laboratory Press (1989).
[00312] Alternativamente, mais de uma sonda (pelo menos uma que é capaz de se hibridizar especificamente com quaisquer sequências complementares que estão presentes na amostra de ácido nucléico), podem ser utilizadas em uma reação de amplificação para determinar se a amostra contém um organismo que contém uma sequência de ácido nucléico de acordo com a invenção (tal como um organismo do qual o ácido nucléico foi isolado). Em algumas modalidades, as sondas compreendem oligonucleotídeos. Em algumas modalidades, a reação de amplificação pode compreender uma reação de PCR. Os protocolos de PCR são descritos em Ausubel e Sambrook, supra. Alternativamente, a amplificação pode compreender uma reação em cadeia da ligase, 3SR ou uma reação de deslocamento de filamento. (Vide Barany, F., The Ligase Chain Reaction in a PCR World, PCR Methods and Applications 1:5-16, 1991; E. Fahy e outros, Self-sustained Sequence Replication (3SR): An Isothermal Transcription-based Amplifications System Alternative to PCR, PCR Methods and Applications 1:25-33, 1991; e Walker G.T. e outros, Strand Displacement Amplification-an Isothermal in vitro DNA Amplification Technique, Nucleic Acid Research 20:1691-1696, 1992). Em tais procedimentos, os ácidos nucléicos na amostra são colocados em contato com as sondas, a rePetição 870170009999, de 15/02/2017, pág. 182/1247
173/788 ação de amplificação é realizada e qualquer produto da amplificação resultante é detectado. O produto da amplificação pode ser detectado através da realização da eletroforese em gel com os produtos de reação e da coloração do gel com um agente intercalador tal como brometo de etídio. Alternativamente, uma ou mais das sondas podem ser marcadas com um isótopo radioativo e a presença de um produto da amplificação radioativo pode ser detectada através de auto-radiografia após a eletroforese em gel.
[00313] As sondas derivadas de sequências próximas às extremidades das sequências de acordo com a invenção, também podem ser utilizadas em procedimentos de caminhada sobre os cromossomos (chromosome walking) para identificar clones contendo sequências genômicas localizadas adjacentes às sequências de acordo com a invenção. Tais métodos permitem o isolamento de genes que codificam proteínas adicionais do organismo hospedeiro.
[00314] Em algumas modalidades, os ácidos nucléicos isolados, sintéticos ou recombinantes de acordo com a invenção, as sequências complementares aos mesmos ou um fragmento que compreende pelo menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 ou 500 ou mais bases consecutivas de uma das sequências de acordo com a invenção ou as sequências complementares à mesma são utilizadas como sondas para identificar e isolar ácidos nucléicos relacionados. Em algumas modalidades, os ácidos nucléicos relacionados podem ser cDNAs ou DNAs genômicos de organismos sem ser aquele do qual o ácido nucléico foi isolado. Por exemplo, os outros organismos podem ser organismos relacionados. Em tais procedimentos, uma amostra de ácido nucléico é colocada em contato com a sonda sob condições que permitam que a sonda se hibridize especificamente com as sequências relacionadas. A hibridização da sonda com os ácidos nucléicos do organismo relacionado é então detectada utilizando
Petição 870170009999, de 15/02/2017, pág. 183/1247
174/788 qualquer um dos métodos descritos anteriormente.
[00315] Variando o rigor das condições de hibridização utilizadas para identificar ácidos nucléicos, tais como cDNAs ou DNAs genômicos, que se hibridizam com a sonda detectável, os ácidos nucléicos que possuem níveis diferentes de homologia com a sonda podem ser identificados e isolados. O rigor pode ser variado realizando a hibridização em temperaturas variáveis abaixo das temperaturas de fusão das sondas. A temperatura de fusão, Tm, é a temperatura (sob força iônica e pH definidos) em que 50% da sequência alvo se hibridizam a uma sonda perfeitamente complementar. Condições muito rigorosas são selecionadas para serem iguais à ou aproximadamente 5°C inferiores à Tm para uma sonda particular. A temperatura de fusão pode ser calculada utilizando as fórmulas a seguir:
[00316] Para sondas entre 14 e 70 nucleotídeos de comprimento a temperatura de fusão (Tm) é calculada utilizando a fórmula: Tm=81,5+16,6(log [Na+])+0,41 (fração de G+C)-(600/N) em que N é o comprimento da sonda.
[00317] Se a hibridização for realizada em uma solução contendo formamida, a temperatura de fusão pode ser calculada utilizando a equação: Tm=81,5+16,6(log [Na+])+0,41 (fração de G+C)-(0,63% de formamida)-(600/N) em que N é o comprimento da sonda.
[00318] A pré-hibridização pode ser realizada em 6X SSC, 5X reagente de Denhardt, 0,5% de SDS, 100 pg/mL de DNA de esperma de salmão fragmentado desnaturado ou 6X SSC, 5X reagente de Denhardt, 0,5% de SDS, 100 pg/mL de DNA de esperma de salmão fragmentado desnaturado, 50% de formamida. As fórmulas para as soluções de SSC e de Denhardt são listadas em Sambrook e outros, supra.
[00319] Em algumas modalidades, a hibridização é realizada através da adição da sonda detectável nas soluções de pré-hibridização
Petição 870170009999, de 15/02/2017, pág. 184/1247
175/788 listadas anteriormente. Quando a sonda compreender DNA de filamento duplo, é desnaturada antes da adição na solução de hibridização. Em algumas modalidades, o filtro é colocado em contato com a solução de hibridização durante um período de tempo suficiente para permitir que a sonda se hibridize com os cDNAs ou com os DNAs genômicos contendo sequências complementares à mesma ou homólogas à mesma. Para as sondas com mais de 200 nucleotídeos de comprimento, a hibridização pode ser realizada a 15-25Ό abaixo da Tm. Para as sondas mais curtas, tais como sondas de oligonucleotídeo, a hibridização pode ser realizada a 5-10Ό abaixo da Tm. Em algumas modalidades, para hibridizações em 6X SSC, a hibridização é realizada a aproximadamente 68Ό. Geralmente, para as hibridizações em soluções contendo 50% de formamida, a hibridização é realizada a aproximadamente 42Ό.
Inibição da Expressão de Enzimas Aldolases [00320] A invenção fornece ácidos nucléicos complementares (tais como sequências anti-sentido para) aos ácidos nucléicos de acordo com a invenção, tais como ácidos nucléicos que codificam enzimas aldolases, tais como ácidos nucléicos que compreendem anti-sentido, siRNA, Mirna, ribozimas. Os ácidos nucléicos de acordo com a invenção que compreendem sequências anti-sentido podem ser capazes de inibir o transporte, o processamento ou a transcrição de genes que codificam enzimas aldolases. A inibição pode ser realizada através do direcionamento do DNA genômico ou do RNA mensageiro. A transcrição ou a função do ácido nucléico alvo pode ser inibida, por exemplo, através de hibridização e/ou de divagem. Um exemplo de conjunto de inibidores fornecido pela presente invenção inclui oligonucleotídeos que são capazes de se ligar ao gene ou à mensagem da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, em qualquer um dos casos prevenindo ou inibindo a produção ou a função
Petição 870170009999, de 15/02/2017, pág. 185/1247
176/788 de uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase. A associação pode ser através de hibridização específica à sequência. Uma outra classe útil de inibidores inclui oligonucleotídeos que causam a inativação ou a divagem da mensagem da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase. O oligonucleotídeo pode ter atividade de enzima que causa tal divagem, tal como ribozimas. O oligonucleotídeo pode ser modificado quimicamente ou conjugado com uma enzima ou uma composição capaz de clivar o ácido nucléico complementar. Um conjunto de muitos tais oligonucleotídeos diferentes pode ser verificado em relação àqueles com a atividade desejada. Assim, a invenção fornece várias composições para a inibição da expressão da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase em um nível de ácido nucléico e/ou de proteína, tais como anti-sentido, siRNA, miRNA e ribozimas que compreendem sequências da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção e os anticorpos antialdolase, tal como antipiruvato aldolase, tal como anti-HMG e/ou anti-KHG aldolase de acordo com a invenção. [00321] A inibição da expressão da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase pode ter uma variedade de aplicações industriais. Por exemplo, a inibição da expressão da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase pode retardar ou prevenir a deterioração. Em algumas modalidades, o uso de composições de acordo com a invenção que inibem a expressão e/ou a atividade de enzimas aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, tais como anticorpos, oligonucleotídeos anti-sentido, ribozimas, siRNA e miRNA é feito para retardar ou prevenir a deterioração. Assim, em algumas modalidades, a invenção fornece métodos e composições que compreendem a aplicação sobre uma planta ou um produto vegetal (tal como um
Petição 870170009999, de 15/02/2017, pág. 186/1247
177/788 cereal, um grão, um fruto, uma semente, uma raiz, uma folha etc.) de anticorpos, oligonucleotídeos anti-sentido, ribozimas, siRNA e miRNA de acordo com a invenção para retardar ou prevenir a deterioração. Estas composições também podem ser expressas pela planta (tal como uma planta transgênica) ou um outro organismo (tal como uma bactéria ou outro microorganismo transformado com um gene de enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase de acordo com a invenção).
[00322] As composições de acordo com a invenção para a inibição da expressão da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase (tal como anti-sentido, iRNA, ribozimas, anticorpos) podem ser utilizadas como composições farmacêuticas, tais como agentes anti patogênicos ou em outras terapias, tais como antimicrobianos para, tal como Salmonella.
Oligonucleotídeos Anti-sentido [00323] A invenção fornece oligonucleotídeos anti-sentido capazes de se ligar à mensagem da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase que, em algumas modalidades, podem inibir a atividade da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase através do direcionamento do mRNA. As estratégias para o planejamento de oligonucleotídeos anti-sentido são bem-descritas na literatura científica e de patente e o versado na técnica pode planejar tais oligonucleotídeos da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase utilizando os novos reagentes de acordo com a invenção. Por exemplo, os protocolos de gene walking/mapeamento de RNA para selecionar oligonucleotídeos anti-sentido eficientes são bem-conhecidos na técnica, vide Ho (2000) Methods Enzymol. 314:168-183, que descreve um ensaio de mapeamento de RNA, que é baseado em técnicas moleculares padronizadas para fornecer um método fácil e confiável
Petição 870170009999, de 15/02/2017, pág. 187/1247
178/788 para a seleção de sequências anti-sentido potentes. Vide também Smith (2000) Eur. J. Pharm. Sei. 11:191-198.
[00324] Os ácidos nucléicos que ocorrem naturalmente são utilizados como oligonucleotídeos anti-sentido. Os oligonucleotídeos antisentido podem ter qualquer comprimento; por exemplo, em outras modalidades, os oligonucleotídeos anti-sentido possuem aproximadamente 5 até aproximadamente 100, aproximadamente 10 até aproximadamente 80, aproximadamente 15 até aproximadamente 60, aproximadamente 18 até aproximadamente 40. O comprimento ótimo pode ser determinado através da verificação de rotina. Os oligonucleotídeos anti-sentido podem estar presentes em qualquer concentração. A concentração ótima pode ser determinada através da verificação de rotina. É conhecida uma ampla variedade de análogos de nucleotídeos e de ácidos nucléicos sintéticos que não ocorrem naturalmente que pode controlar este problema potencial. Por exemplo, os ácidos nucléicos de peptídeo (PNAs) que contêm estruturas não-iônicas, tais como unidades de N-(2-aminoetil) glicina podem ser utilizados. Os oligonucleotídeos anti-sentido que possuem ligações fosforotioato também podem ser utilizados, como descrito na WO 97/03211; na WO 96/39154; em Mata (1997) Toxicol Appl Pharmacol 144:189-197; Antisense Therapeuties, ed. Agrawal (Humana Press, Totowa, N.J., 1996). Os oligonucleotídeos anti-sentido que possuem análogos de estruturas de DNA sintéticos fornecidos pela invenção também podem incluir ácidos nucléicos fosforo-ditioato, metilfosfonato, fosforamidato, alquil fosfotriéster, sulfamato, 3'-tioacetal, metileno (metilimino), 3'-N-carbamato e morfolino carbamato, como descrito anteriormente.
[00325] A metodologia de química combinatória pode ser utilizada para criar vastos números de oligonucleotídeos que podem ser facilmente verificados em relação a oligonucleotídeos específicos que possuem afinidades e especificidades de ligação apropriadas para qualPetição 870170009999, de 15/02/2017, pág. 188/1247
179/788 quer alvo, tal como as sequências sentido e anti-sentido da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção (vide Gold (1995) J. of Biol. Chem.
270:13581-13584).
Ribozimas Inibidoras [00326] A invenção fornece ribozimas capazes de se ligar à mensagem da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase enzima. Estas ribozimas podem inibir a atividade da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase através de, tal como o direcionamento do mRNA. As estratégias para planejar ribozimas e selecionar a sequência antisentido específica à enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase para direcionamento são bem-descritas na literatura científica e de patente e o versado na técnica pode planejar tais ribozimas utilizando novos reagentes de acordo com a invenção. As ribozimas atuam através da ligação com um RNA alvo através da parte de ligação com o RNA alvo de uma ribozima que é mantida em proximidade íntima com uma parte enzimática do RNA que cliva o RNA alvo. Assim, a ribozima reconhece e se liga a um RNA através do pareamento de bases complementares e uma vez ligada ao sítio correto, atua enzimaticamente para clivar e inativar o RNA alvo. A divagem de um RNA alvo de tal maneira destruirá sua capacidade de direcionar a síntese de uma proteína codificada se a divagem ocorrer na sequência codificadora. Após uma ribozima ter se ligado e clivado seu RNA alvo, pode ser liberada de tal RNA para se ligar e clivar novos alvos repetidamente.
[00327] Em alguns casos, a natureza enzimática de uma ribozima pode ser vantajosa em relação a outras tecnologias, tal como a tecnologia anti-sentido (em que uma molécula de ácido nucléico simplesmente se liga a um ácido nucléico alvo para bloquear sua transcrição,
Petição 870170009999, de 15/02/2017, pág. 189/1247
180/788 tradução ou associação com uma outra molécula) uma vez que a concentração eficiente de ribozima necessária para realizar um tratamento terapêutico pode ser menor que a de um oligonucleotídeo anti-sentido. Esta vantagem potencial reflete a capacidade da ribozima de atuar enzimaticamente. Assim, uma única molécula de ribozima é capaz de clivar muitas moléculas de RNA alvo. Em algumas modalidades, uma ribozima é um inibidor altamente específico, com a especificidade de inibição dependendo não somente do mecanismo de ligação de pareamento de bases, mas também do mecanismo através do qual a molécula inibe a expressão do RNA ao qual se liga. Ou seja, a inibição é causada pela divagem do RNA alvo e assim a especificidade é definida como a proporção da taxa de divagem do RNA alvo em relação à taxa de divagem do RNA que não é alvo. Este mecanismo de divagem é dependente de fatores adicionais aos envolvidos no pareamento de bases. Assim, a especificidade de ação de uma ribozima pode ser maior que a da ligação do oligonucleotídeo anti-sentido ao mesmo sítio de RNA.
[00328] A ribozima de acordo com a invenção, tal como uma molécula de RNA de ribozima enzimática, pode ser formada em um motivo cabeça de martelo (hammerhead), um motivo em grampo de cabelo (hairpin), na forma de um motivo do vírus delta da hepatite, um motivo do íntron do grupo I e/ou um RNA similar a RNaseP em associação com uma sequência guia de RNA. Os exemplos de motivos cabeça de martelo são descritos por, tal como Rossi (1992) Aids Research and Human Retroviruses 8:183; os motivos em grampo de cabelo por Hampel (1989) Biochemistry 28:4929 e Hampel (1990) Nuc. Acids Res. 18:299; o motivo do vírus delta da hepatite por Perrotta (1992) Biochemistry 31:16; o motivo RNaseP por Guerrier-Takada (1983) Cell 35:849; e o íntron do grupo I por Cech Patente U.S. N° 4.987.071. Não é pretendido que a citação destes motivos específicos
Petição 870170009999, de 15/02/2017, pág. 190/1247
181/788 seja limitante. Os versados na técnica reconhecerão que uma ribozima de acordo com a invenção, tal como uma molécula de RNA enzimática desta invenção, pode possuir um sítio de ligação ao substrato específico complementar a uma ou mais regiões do RNA do gene alvo. Uma ribozima de acordo com a invenção pode ter uma sequência de nucleotídeos dentro ou que circunda tal sítio de ligação ao substrato que confere uma atividade de divagem de RNA à molécula.
Interferência de RNA (RNAi) [00329] Em algumas modalidades, a invenção fornece moléculas inibidoras de RNA, as assim chamadas moléculas RNAi, que compreendem sequências da enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase de acordo com a invenção. A molécula de RNAi pode compreender uma molécula de RNA de filamento duplo (dsRNA), tal como moléculas de siRNA, miRNA e/ou RNA em grampo de cabelo curto (shRNA). A molécula de RNAi, tal como siRNA (RNA inibidor pequeno) e/ou miRNA (microRNA), pode inibir a expressão de um gene da enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase. Em algumas modalidades, a molécula de RNAi, tal como siRNA e/ou miRNA, tem aproximadamente 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 ou mais nucleotídeos em dúplex de comprimento. Embora a invenção não esteja limitada por qualquer mecanismo de ação particular, o RNAi pode entrar em uma célula e causar a degradação de um RNA de filamento simples (ssRNA) de sequências similares ou idênticas, incluindo mRNAs endógenos. Quando uma célula é exposta ao RNA de filamento duplo (dsRNA), o mRNA do gene homólogo é degradado seletivamente através de um processo chamado de interferência de RNA (RNAi). Um mecanismo básico possível por trás da RNAi é a quebra de um RNA de filamento duplo (dsRNA) que se combina com uma sequência gênica específica em pedaços curtos chamados de RNAs interferentes, que
Petição 870170009999, de 15/02/2017, pág. 191/1247
182/788 ativam a degradação do mRNA que se combina com sua sequência. Em algumas modalidades, os RNAis de acordo com a invenção são utilizados em terapias de silenciamento gênico, vide Shuey (2002) Drug Discov. Today 7:1040-1046. Em algumas modalidades, a invenção fornece métodos para degradar seletivamente o RNA utilizando as moléculas de RNAi, tal como siRNA e/ou miRNA, de acordo com a invenção. O processo pode ser praticado in vitro, ex vivo ou in vivo. Em algumas modalidades, as moléculas de RNAi de acordo com a invenção podem ser utilizadas para gerar uma mutação de perda de função em uma célula, um órgão ou um animal.
[00330] Em um aspecto, a introdução intracelular do RNAi é através da internaiização de um ligante específico à célula-alvo ligado a uma proteína de ligação ao RNA que compreende um RNAi (tal como microRNA) que é absorvida. O ligante é específico a um antígeno de superfície celular alvo exclusivo. O ligante pode ser internalizado espontaneamente após a ligação ao antígeno de superfície celular. Se o antígeno de superfície celular exclusivo não for natural mente internalizado após a ligação com seu ligante, a internai ização pode ser promovida pela incorporação de um peptídeo rico em arginina ou outro peptídeo permeável à membrana, na estrutura do ligante ou da proteína de ligação ao RNA ou pela ligação de tal peptídeo ao ligante ou à proteína de ligação ao RNA. Vide as Publicações de Patentes U.S. N— 20060030003; 20060025361; 20060019286; 20060019258. Em um aspecto, a invenção fornece formulações à base de lipídeos para o fornecimento, de forma a introduzir os ácidos nucléicos da invenção como partículas de ácido nucléico-lipídeo que compreendem uma molécula de RNAi em uma célula, vide, por exemplo, a Publicação de Patente U.S. N°20060008910.
Modificação de Ácidos Nucléicos - Produção de Enzimas Variantes da
Invenção
Petição 870170009999, de 15/02/2017, pág. 192/1247
183/788 [00331] A invenção fornece métodos de produção de variantes dos ácidos nucléicos de acordo com a invenção, tais como os que codificam uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase. Estes métodos podem ser repetidos ou utilizados em várias combinações para gerar enzimas aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase que possuem uma atividade alterada ou diferente ou uma estabilidade alterada ou diferente daquela de uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase codificada pelo ácido nucléico molde. Estes métodos também podem ser repetidos ou utilizados em várias combinações, de forma a gerar variações na expressão gênica/de mensagem, na tradução da mensagem ou na estabilidade da mensagem. Em outras modalidades, a composição genética de uma célula é alterada através de, tal como a modificação de um gene homólogo ex vivo, seguida por sua reinserção na célula.
[00332] Um ácido nucléico de acordo com a invenção pode ser alterado através de qualquer meio. Por exemplo, métodos aleatórios ou estocásticos ou métodos não-estocásticos ou de evolução direcionada, vide a Patente U.S. N° 6.361.974. Os métodos para a mutação aleatória de genes são bem-conhecidos na técnica, vide a Patente U.S. N°5.830.696. Por exemplo, agentes mutagênicos podem ser utilizados para mutar aleatoriamente um gene. Os agentes mutagênicos incluem, tal como luz ultravioleta ou irradiação gama ou um agente mutagênico químico, tal como mitomicina, ácido nitroso, psoralenos fotoativados, isoladamente ou em combinação, para a indução de quebras no DNA susceptíveis ao reparo através da recombinação. Outros agentes mutagênicos químicos incluem, por exemplo, bissulfito de sódio, ácido nitroso, hidroxilamina, hidrazina ou ácido fórmico. Outros agentes mutagênicos são análogos de precursores de nucleotídeos, tal como nitrosoguanidina, 5-bromouracila, 2-aminopurina ou acridina.
Petição 870170009999, de 15/02/2017, pág. 193/1247
184/788
Estes agentes podem ser adicionados em uma reação de PCR no lugar do precursor de nucleotídeo mutando assim a sequência. Agentes intercalantes tais como proflavina, acriflavina, quinacrina e similares também podem ser utilizados.
[00333] Qualquer técnica na biologia molecular pode ser utilizada, tal como a mutagênese por PCR aleatória, vide Rice (1992) Proc. Natl. Acad. Sei. USA 89:5467-5471; ou, a mutagênese combinatória com vários cassetes, vide Crameri (1995) Biotechniques 18:194-196. Alternativamente, os ácidos nucléicos, tais como genes, podem ser remontados após fragmentação aleatória ou estocástica, vide as Patentes U.S. N— 6.291.242; 6.287.862; 6.287.861; 5.955.358; 5.830.721; 5.824.514; 5.811.238; 5.605.793. Em outras modalidades, modificações, adições ou deleções são introduzidas através da PCR propensa a erros, embaralhamento, mutagênese direcionada por oligonucleotídeo, PCR de montagem, mutagênese por PCR sexual, mutagênese in vivo, mutagênese com cassete, mutagênese de conjunto recursivo, mutagênese de conjunto exponencial, mutagênese específica ao sítio, remontagem gênica (tal como GeneReassembly, vide Patente U.S. N° 6.537.776), Mutagênese de Saturação de Sítio Gênico (GSSM), remontagem de ligação sintética (SLR), recombinação, recombinação de sequência recursiva, mutagênese de DNA modificado com fosfotioato, mutagênese com molde contendo uracila, mutagênese de dúplex com espaços, mutagênese de reparo de combinações erradas pontuais, mutagênese com cepa hospedeira deficiente em relação ao reparo, mutagênese química, mutagênese radiogênica, mutagênese de deleção, mutagênese de seleção de restrição, mutagênese de purificação de restrição, síntese de gene artificial, mutagênese de conjunto, criação de multímeros de ácidos nucléicos quiméricos, Mutagênese de Saturação Cromossômica (CSM) e/ou uma combinação destes e outros métodos.
Petição 870170009999, de 15/02/2017, pág. 194/1247
185/788 [00334] As publicações a seguir descrevem uma variedade de procedimentos e/ou métodos de recombinação recursiva que podem ser incorporados nos métodos de acordo com a invenção: Stemmer (1999) Molecular breeding of viruses for targeting and other clinicai properties Tumor Targeting 4:1-4; Ness (1999) Nature Biotechnology 17:893-896; Chang (1999) Evolution of a cytokine using DNA family shuffling Nature Biotechnology 17:793-797; Minshull (1999) Protein evolution by molecular breeding Current Opinion in Chemical Biology 3:284-290; Christians (1999) Directed evolution of thymidine kinase for AZT fosforylation using DNA family shuffling Nature Biotechnology 17:259-264; Crameri (1998) DNA shuffling of a family of genes from diverse species accelerates directed evolution Nature 391:288-291; Crameri (1997) Molecular evolution of an arsenate detoxification pathway by DNA shuffling, Nature Biotechnology 15:436-438; Zhang (1997) Directed evolution of an effective fucosidase from a galactosidase by DNA shuffling and screening Proc. Natl. Acad. Sei. USA 94:4504-4509; Patten e outros (1997) Applications of DNA Shuffling to Pharmaceuticals and Vaccines Current Opinion in Biotechnology 8:724-733; Crameri e outros (1996) Construction and evolution of antibody-phage libraries by DNA shuffling Nature Medicine 2:100-103; Gates e outros (1996) Affinity selective isolation of ligands from peptide libraries through display on a lac repressor 'headpiece dimer' Journal of Molecular Biology 255:373-386; Stemmer (1996) Sexual PCR and Assembly PCR Em: The Encyclopedia of Molecular Biology. VCH Publishers, Nova Iorque, pp.447-457; Crameri e Stemmer (1995) Combinatorial multiple cassette mutagenesis creates all the permutations of mutant and wildtype cassettes BioTechniques 18:194-195; Stemmer e outros (1995) Single-step assembly of a gene and entire plasmid form large numbers of oligodeoxyribonucleotides Gene, 164:49-53; Stemmer (1995) The Evolution of Molecular Computation
Petição 870170009999, de 15/02/2017, pág. 195/1247
186/788
Science 270: 1510; Stemmer (1995) Searching Sequence Space Bio/Technology 13:549-553; Stemmer (1994) Rapid evolution of a protein in vitro by DNA shuffling Nature 370:389-391; e Stemmer (1994) DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution. Proc. Natl. Acad. Sei. USA 91:10747-10751.
[00335] Os métodos de mutação para gerar diversidade incluem, por exemplo, mutagênese direcionada ao sítio (Ling e outros (1997) Approaches to DNA mutagenesis: an overview Anal Biochem. 254(2): 157-178; Dale e outros (1996) Oligonucleotide-directed random mutagenesis using the fosforothioate method Methods Mol. Biol. 57:369374; Smith (1985) In vitro mutagenesis Ann. Rev. Genet. 19:423-462; Botstein & Shortle (1985) Strategies and applications of in vitro mutagenesis Science 229:1193-1201; Carter (1986) Site-directed mutagenesis Biochem. J. 237:1-7; e Kunkel (1987) The efficiency of oligonucleotide directed mutagenesis em Nucleic Acids & Molecular Biology (Eckstein, F. e Lilley, D. M. J. eds., Springer Verlag, Berlin)); mutagênese utilizando moldes contendo uracila (Kunkel (1985) Rapid and efficient site-specific mutagenesis without phenotypic selection Proc. Natl. Acad. Sei. USA 82:488-492; Kunkel e outros (1987) Rapid and efficient site-specific mutagenesis without phenotypic selection Methods in Enzymol. 154, 367-382; e Bass e outros (1988) Mutant Trp repressors with new DNA-binding specificities Science 242:240-245); mutagênese direcionada por oligonucleotídeo (Methods in Enzymol. 100: 468-500 (1983); Methods in Enzymol. 154: 329-350 (1987); Zoller (1982) Oligonucleotide-directed mutagenesis using M13-derived vectors: an efficient and general procedure for the produetion of point mutations in any DNA fragment Nucleic Acids Res. 10:6487-6500; Zoller & Smith (1983) Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13 vectors Methods in Enzymol. 100:468-500; e
Petição 870170009999, de 15/02/2017, pág. 196/1247
187/788
Zoller (1987) Oligonucleotide-directed mutagenesis: a simple method using two oligonucleotide primers and a single-stranded DNA template Methods in Enzymol. 154:329-350); mutagênese de DNA modificado com fosfotioato (Taylor (1985) The use of fosforothioate-modified DNA in restriction enzyme reactions to prepare nicked DNA Nucl. Acids Res. 13: 8749-8764; Taylor (1985) The rapid generation of oligonucleotide-directed mutations at high frequency using fosforothioatemodified DNA Nucl. Acids Res. 13: 8765-8787 (1985); Nakamaye (1986) Inhibition of restriction endonuclease Nci I cleavage by fosforothioate groups and its application to oligonucleotide-directed mutagenesis Nucl. Acids Res. 14: 9679-9698; Sayers (1988) Ύ-Τ Exonucleases in fosforothioate-based oligonucleotídeo-directed mutagenesis Nucl. Acids Res. 16:791-802; e Sayers e outros (1988) Strand specific cleavage of fosforothioate-containing DNA by reaction with restriction endonucleases in the presence of ethidium bromide Nucl. Acids Res. 16: 803-814); mutagênese utilizando DNA em dúplex com espaços (Kramer e outros (1984) The gapped dúplex DNA approach to oligonucleotide-directed mutation construction Nucl. Acids Res. 12: 9441-9456; Kramer & Fritz (1987) Methods in Enzymol. Oligonucleotide-directed construction of mutations vide gapped dúplex DNA 154:350-367; Kramer (1988) Improved enzymatic in vitro reactions in the gapped dúplex DNA approach to oligonucleotide-directed construction of mutations Nucl. Acids Res. 16: 7207; e Fritz (1988) Oligonucleotide-directed construction of mutations: a gapped dúplex DNA procedure without enzymatic reactions in vitro Nucl. Acids Res. 16: 69876999).
[00336] Os protocolos adicionais que podem ser utilizados para a prática da invenção incluem reparo de pareamentos errados pontuais (Kramer (1984) Point Mismatch Repair Cell 38:879-887), mutagênese utilizando cepas hospedeiras deficientes em relação ao reparo (Carter
Petição 870170009999, de 15/02/2017, pág. 197/1247
188/788 e outros (1985) Improved oligonucleotide site-directed mutagenesis using M13 vectors Nucl. Acids Res. 13: 4431-4443; e Carter (1987) Improved oligonucleotide-directed mutagenesis using M13 vectors Methods in Enzymol. 154: 382-403), mutagênese de deleção (Eghtedarzadeh (1986) Use of oligonucleotides to generate large deletions Nucl. Acids Res. 14: 5115), seleção de restrição e purificação por seleção de restrição e por restrição (Wells e outros (1986) Importance of hydrogen-bond formation in stabilizing the transition State of subtilisin Phil. Trans. R. Soc. Lond. A 317: 415-423), mutagênese através da síntese do gene total (Nambiar e outros (1984) Total synthesis and cloning of a gene coding for the ribonuclease S protein Science 223: 1299-1301; Sakamar e Khorana (1988) Total synthesis and expressão of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein (transducin) Nucl. Acids Res. 14: 6361-6372; Wells e outros (1985) Cassette mutagenesis: an efficient method for generation of multiple mutations at defined sites Gene 34:315-323; e Grundstrom e outros (1985) Oligonucleotide-directed mutagenesis by microscale 'shot-gun' gene synthesis Nucl. Acids Res. 13: 33053316), reparo de quebras em filamento duplo (Mandecki (1986); Arnold (1993) Protein engineering for unusual environments Current Opinion in Biotechnology 4:450-455. Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli: a method for site-specific mutagenesis Proc. Natl. Acad. Sei. USA, 83:7177-7181). Os detalhes adicionais sobre muitos dos métodos acima podem ser encontrados em Methods in Enzymology Volume 154, que descreve também controles úteis para solucionar problemas com vários métodos de mutagênese.
[00337] Os protocolos que podem ser utilizados para a prática da invenção são descritos, tal como na Patente U.S. N° 5.605.793 a Stemmer (25 de fevereiro de 1997), Methods for In Vitro RecombinaPetição 870170009999, de 15/02/2017, pág. 198/1247
189/788 tion; Patente U.S. N° 5.811.238 a Stemmer e outros (22 de setembro de 1998) Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination; Patente U.S. N° 5.830.721 a Stemmer e outros (3 de novembro de 1998), DNA Mutagenesis by Random Fragmentation and Reassembly; Patente U.S. N° 5.834.252 a Stemmer e outros (10 de novembro de 1998) End-Complementary Polimerase Reaction; Patente U.S. N° 5.837.458 a Minshull e outros (17 de novembro de 1998), Methods and Compositions for Cellular and Metabolic Engineering; WO 95/22625, Stemmer e Crameri, Mutagenesis by Random Fragmentation and Reassembly; WO 96/33207 por Stemmer e Lipschutz End Complementary Polimerase Chain Reaction; WO 97/20078 por Stemmer e Crameri Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination; WO 97/35966 por Minshull e Stemmer, Methods and Compositions for Cellular and Metabolic Engineering; WO 99/41402 por Punnonen e outros Targeting of Genetic Vaccine Vectors; WO 99/41383 por Punnonen e outros Antigen Library Immunization; WO 99/41369 por Punnonen e outros Genetic Vaccine Vector Engineering; WO 99/41368 por Punnonen e outros Optimization of Immunomodulatory Properties of Genetic Vaccines; EP 752008 por Stemmer e Crameri, DNA Mutagenesis by Random Fragmentation and Reassembly; EP 0932670 por Stemmer Evolving Cellular DNA Uptake by Recursive Sequence Recombination; WO 99/23107 por Stemmer e outros, Modification of Virus Tropism and Host Range by Viral Genome Shuffling; WO 99/21979 por Apt e outros, Human Papillomavirus Vectors; WO 98/31837 por dei Cardayre e outros Evolution of Whole Cells and Organisms by Recursive Sequence Recombination; WO 98/27230 por Patten e Stemmer, Methods and Compositions for Polypeptide Engineering; WO 98/27230 por Stemmer e outros, Methods for OptimizaPetição 870170009999, de 15/02/2017, pág. 199/1247
190/788 tion of Gene Therapy by Recursive Sequence Shuffling and Selection, WO 00/00632, Methods for Generating Highly Diverse Libraries, WO 00/09679, Methods for Obtaining in Vitro Recombined Polynucleotide Sequence Banks and Resulting Sequences, WO 98/42832 por Arnold e outros, Recombination of Polynucleotide Sequences Using Random or Defined Primers, WO 99/29902 por Arnold e outros, Method for Creating Polynucleotide and Polypeptide Sequences, WO 98/41653 por Vind, An in Vitro Method for Construction of a DNA Library, WO 98/41622 por Borchert e outros, Method for Constructing a Library Using DNA Shuffling e WO 98/42727 por Pati e Zarling, Sequence Alterations using Homologous Recombination.
[00338] Os protocolos que podem ser utilizados na prática da invenção (que fornecem detalhes em relação aos vários métodos de obtenção de diversidade) são descritos, tal como no Pedido de Patente U.S. N°de série (USSN) 09/407.800, SHUFFLING OF CODON ALTERED GENES por Patten e outros depositado em 28 de setembro de 1999; EVOLUTION OF WHOLE CELLS AND ORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION por dei Cardayre e outros, Patente U.S. N° 6.379.964; OLIGONUCLEOTIDE M EDIATED NUCLEIC ACID RECOMBINATION por Crameri e outros, Patentes U.S. N— 6.319.714; 6.368.861; 6.376.246; 6.423.542; 6.426.224 e PCT/US00/01203; USE OF CODON-VARIED OLIGONUCLEOTIDE SYNTHESIS FOR SYNTHETIC SHUFFLING por Welch e outros, Patente U.S. N° 6.436.675; METHODS FOR MAKING CHARACTER STRINGS, POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS por Selifonov e outros, depositada em 18 de janeiro de 2000, (PCT/US00/01202) e, tal como METHODS FOR MAKING CHARACTER STRINGS, POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS por Selifonov e outros, depositado em 18 de julho de 2000 (Patente U.S. N°de
Petição 870170009999, de 15/02/2017, pág. 200/1247
191/788
Série 09/618.579); METHODS OF POPULATING DATA STRUCTURES FOR USE IN EVOLUTIONARY SIMULATIONS por Selifonov e Stemmer, depositada em 18 de janeiro de 2000 (PCT/US00/01138); e SINGLE-STRANDED NUCLEIC ACID TEMPLATE-MEDIATED RECOMBINATION AND NUCLEIC ACID FRAGMENT ISOLATION por Affholter, depositado em 6 de setembro de 2000 (Patente U.S. N°de Série 09/656.549); e Patentes U.S. N— 6.177.263; 6.153.410.
[00339] Os métodos não-estocásticos ou de evolução direcionada incluem, tal como mutagênese de saturação, tal como Mutagênese de Saturação de Sítio Gênico (GSSM), remontagem de ligação sintética (SLR) ou uma combinação das mesmas é utilizada para modificar os ácidos nucléicos de acordo com a invenção para gerar enzimas aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase com propriedades novas ou alteradas (tal como a atividade sob condições altamente ácidas ou alcalinas, temperaturas altas ou baixas e similares). Os polipeptídeos codificados pelos ácidos nucléicos modificados podem ser verificados em relação a uma atividade antes de testar em relação à formação ou à divagem de ligações carbono-carbono ou outra atividade. Qualquer modalidade de teste ou protocolo pode ser utilizado, tal como a utilização de uma plataforma com arranjo capilar. Vide as Patentes U.S. N— 6.361.974; 6.280.926; 5.939.250. Mutagênese de Saturação de Sítio Gênico ou GSSM [00340] A invenção fornece ainda métodos para a produção de enzima utilizando a Mutagênese de Saturação de Sítio Gênico ou GSSM, que é descrita aqui e também nas Patentes U.S. N— 6.171.820 e 6.579.258. Em algumas modalidades, iniciadores de códons contendo uma sequência N,N,G/T degenerada são utilizados para introduzir mutações pontuais em um polinucleotídeo, tal como uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase ou um anticorpo de acordo com a invenção, de forma a gerar um conjunto de poPetição 870170009999, de 15/02/2017, pág. 201/1247
192/788 lipeptídeos de progênie em que uma faixa completa de substituições de aminoácidos isolados é representada em cada posição de aminoácido, tal como um resíduo de aminoácido em um sítio ativo da enzima ou um sítio de ligação ao ligante direcionado para ser modificado. Estes oligonucleotídeos podem compreender uma primeira sequência homóloga contígua, uma sequência N,N,G/T degenerada e, opcionalmente, uma segunda sequência homóloga. Os produtos da tradução da progênie a jusante provenientes do uso de tais oligonucleotídeos incluem todas as alterações de aminoácidos possíveis em cada sítio de aminoácido ao longo do polipeptídeo, porque a degeneração da sequência N,N,G/T inclui códons para todos os 20 aminoácidos. Em algumas modalidades, um tal oligonucleotídeo degenerado (compreendido de, tal como um cassete N,N,G/T degenerado) é utilizado para submeter cada códon original no molde de polinucleotídeo parental a uma faixa completa de substituições de códons. Em outras modalidades, pelo menos dois cassetes degenerados são utilizados - no mesmo oligonucleotídeo ou não, para submeter pelo menos dois códons originais em um molde de polinucleotídeo parental a uma faixa completa de substituições de códons. Por exemplo, mais de uma sequência N,N,G/T pode estar contida em um oligonucleotídeo para introduzir mutações de aminoácidos em mais de um sítio. Este grande número de sequências N,N,G/T pode ser diretamente contíguo ou separado por uma ou mais sequências de nucleotídeos adicionais. Em outras modalidades, os oligonucleotídeos que podem servir para a introdução de adições e deleções podem ser utilizados isoladamente ou em combinação com os códons contendo uma sequência N,N,G/T, para introduzir qualquer combinação ou permutação de adições, deleções e/ou substituições de aminoácidos.
[00341] Em algumas modalidades, a mutagênese simultânea de duas ou mais posições de aminoácidos contíguas é feita utilizando um
Petição 870170009999, de 15/02/2017, pág. 202/1247
193/788 oligonucleotídeo que contém tripletos de N,N,G/T contíguos, isto é, uma sequência (N,N,G/T)n degenerada. Em outras modalidades, são utilizados os cassetes degenerados que possuem menos degeneração que a sequência N,N,G/T. Por exemplo, pode ser desejável em alguns casos utilizar (tal como em um oligonucleotídeo) uma sequência em tripleto degenerada compreendida apenas de um N, em que o dito N pode estar na primeira, na segunda ou na terceira posição do tripleto. Quaisquer outras bases incluindo combinações e permutações das mesmas podem ser utilizadas nas duas posições restantes do tripleto. Alternativamente, pode ser desejável em alguns casos utilizar (tal como em um oligo) uma sequência em tripleto Ν,Ν,Ν degenerada.
[00342] Em algumas modalidades, o uso de tripletos degenerados (tais como tripletos N,N,G/T) permite a produção sistemática e fácil de uma faixa completa de aminoácidos naturais possíveis (para um total de 20 aminoácidos) em cada uma e toda posição de aminoácido em um polipeptídeo (em outras modalidades, os métodos incluem ainda a produção de menos que todas as substituições possíveis por resíduo ou códon, posição de aminoácido). Por exemplo, para um polipeptídeo de 100 aminoácidos, podem ser geradas 2000 espécies distintas (isto é, 20 aminoácidos possíveis por posição X 100 posições de aminoácidos). Através do uso de um oligonucleotídeo ou de um conjunto de oligonucleotídeos contendo um tripleto N,N,G/T degenerado, 32 sequências individuais podem codificar todos os 20 aminoácidos naturais possíveis. Assim, em um recipiente de reação em que uma sequência de polinucleotídeo parental é submetida à mutagênese de saturação utilizando pelo menos um tal oligonucleotídeo, são gerados 32 polinucleotídeos de progênie possíveis que codificam 20 polipeptídeos distintos. Em contraste, o uso de um oligonucleotídeo não degenerado na mutagênese direcionada ao sítio leva a apenas um produto de polipeptídeo de progênie por recipiente de reação. Os oligonucleotídeos não
Petição 870170009999, de 15/02/2017, pág. 203/1247
194/788 degenerados podem opcionalmente ser utilizados em combinação com os iniciadores degenerados divulgados; por exemplo, os oligonucleotídeos não degenerados podem ser utilizados para gerar mutações pontuais específicas em um polinucleotídeo de trabalho. Isto fornece um meio para gerar mutações pontuais silenciosas específicas, mutações pontuais que levam a alterações de aminoácidos correspondentes e mutações pontuais que causam a produção de códons de término e a expressão correspondente de fragmentos polipeptídicos.
[00343] Em algumas modalidades, cada recipiente de reação de mutagênese de saturação contém polinucleotídeos que codificam pelo menos 20 moléculas de polipeptídeos de progênie (tais como enzimas aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase) de forma que todos os 20 aminoácidos naturais são representados em uma posição de aminoácido específica que corresponde à posição do códon que sofre mutagênese no polinucleotídeo parental (outras modalidades utilizam menos que todas as 20 combinações naturais). Os polipeptídeos de progênie degenerados 32 vezes gerados partindo de cada recipiente de reação de mutagênese de saturação podem ser submetidos à amplificação clonal (tal como clonados em um hospedeiro adequado, tal como um hospedeiro de E. coli, utilizando, tal como um vetor de expressão) e submetidos à seleção de expressão. Quando é identificado através da seleção que um polipeptídeo de progênie individual exibe uma alteração favorável na propriedade (quando comparado com o polipeptídeo parental, tal como maior atividade de formação ou de divagem de carbono-carbono sob condições alcalinas ou ácidas), este pode ser seqüenciado para identificar a substituição de aminoácido correspondente favorável contida no mesmo.
[00344] Em algumas modalidades, após a mutagênese de cada e toda a posição de aminoácido em um polipeptídeo parental utilizando a
Petição 870170009999, de 15/02/2017, pág. 204/1247
195/788 mutagênese de saturação que é divulgada aqui, as alterações de aminoácidos favoráveis podem ser identificadas em mais de uma posição de aminoácido. Pode ser gerada uma ou mais novas moléculas de progênie que contêm uma combinação de todas ou parte destas substituições de aminoácidos favoráveis. Por exemplo, se 2 alterações de aminoácidos favoráveis específicas forem identificadas em cada uma das 3 posições de aminoácido em um polipeptídeo, as permutações incluem 3 possibilidades em cada posição (nenhuma alteração do aminoácido original e cada uma de duas alterações favoráveis) e 3 posições. Assim, há 3 x 3 x 3 ou 27 possibilidades totais, incluindo 7 que foram verificadas anteriormente - 6 mutações pontuais isoladas (isto é, 2 em cada uma de três posições) e nenhuma alteração em qualquer posição.
[00345] Ainda em uma outra modalidade, a mutagênese de saturação de sítio pode ser utilizada junto com o embaralhamento, a quimerização, a recombinação e outros processos de mutagênese, junto com a seleção. Esta invenção fornece o uso de qualquer(quaisquer) processo(s) de mutagênese, incluindo a mutagênese de saturação, de uma maneira iterativa. Em um exemplo, o uso iterativo de qualquer(quaisquer) processo(s) de mutagênese é feito em combinação com a seleção.
[00346] A invenção fornece ainda o uso de iniciadores de códons de propriedade (contendo uma sequência Ν,Ν,Ν degenerada) para introduzir mutações pontuais em um polinucleotídeo, de forma a gerar um conjunto de polipeptídeos de progênie em que uma faixa completa de substituições de um único aminoácido é representada em cada posição de aminoácido (Mutagênese de Saturação de Sítio Gênico (GSSM)). Os oligos utilizados são compreendidos contiguamente de uma primeira sequência homóloga, uma sequência Ν,Ν,Ν degenerada e, em algumas modalidades, mas não necessariamente, uma segunda
Petição 870170009999, de 15/02/2017, pág. 205/1247
196/788 sequência homóloga. Os produtos da tradução de progênie a jusante provenientes do uso de tais oligos incluem todas as alterações de aminoácidos possíveis em cada sítio de aminoácido ao longo do polipeptídeo, porque a degeneração da sequência Ν,Ν,Ν inclui códons para todos os 20 aminoácidos.
[00347] Em algumas modalidades, um tal oligo degenerado (compreendido de um cassete Ν,Ν,Ν degenerado) é utilizado para submeter cada códon original em um molde de polinucleotídeo parental a uma faixa completa de substituições de códons. Em outras modalidades, pelo menos dois cassetes Ν,Ν,Ν degenerados são utilizados - no mesmo oligo ou não, para submeter pelo menos dois códons originais em um molde de polinucleotídeo parental a uma faixa completa de substituições de códons. Assim, mais de uma sequência Ν,Ν,Ν pode estar contida em um oligo para introduzir mutações de aminoácidos em mais de um sítio. Este grande número de sequências Ν,Ν,Ν pode estar diretamente contíguo ou separado por uma ou mais sequências de nucleotídeos adicionais. Em outras modalidades, os oligos úteis para a introdução de adições e deleções podem ser utilizados isoladamente ou em combinação com os códons que contêm uma sequência Ν,Ν,Ν, para introduzir qualquer combinação ou permutação de adições, deleções e/ou substituições de aminoácidos.
[00348] Em algumas modalidades, é possível mutagenizar simultaneamente duas ou mais posições de aminoácidos contíguas utilizando um oligo que contém tripletos Ν,Ν,Ν, isto é, uma sequência (N,N,N)n degenerada. Em outras modalidades, a presente invenção fornece o uso de cassetes degenerados que possuem menos degeneração que a sequência Ν,Ν,Ν. Por exemplo, pode ser desejável em alguns casos utilizar (tal como em um oligo) uma sequência de tripleto degenerada compreendida de apenas um N, em que o N pode estar na primeira, na segunda ou na terceira posição do tripleto. Quaisquer outras bases
Petição 870170009999, de 15/02/2017, pág. 206/1247
197/788 incluindo quaisquer combinações e permutações das mesmas podem ser utilizadas nas duas posições restantes do tripleto. Alternativamente, pode ser desejável em alguns casos utilizar (tal como em um oligo) uma sequência de tripleto Ν,Ν,Ν degenerada N,N,G/T ou uma sequência de tripleto N,N, G/C.
[00349] Em algumas modalidades, o uso de um tripleto degenerado (tal como N,N,G/T ou uma sequência de tripleto N,N, G/C) é vantajoso por várias razões. Em algumas modalidades, esta invenção fornece meios para gerar sistematicamente e bastante facilmente a substituição da faixa completa de aminoácidos possíveis (para um total de 20 aminoácidos) em cada e toda posição de aminoácido em um polipeptídeo. Assim, para um polipeptídeo de 100 aminoácidos, a invenção fornece maneiras de gerar sistematicamente e bastante facilmente 2000 espécies distintas (isto é, 20 aminoácidos possíveis por posição vezes 100 posições de aminoácido). É considerado que é fornecido, através do uso de um oligo contendo um N,N,G/T degenerado ou uma sequência de tripleto N,N, G/C, 32 sequências individuais que codificam 20 aminoácidos possíveis. Assim, em um recipiente de reação em que uma sequência de polinucleotídeo parental é submetida à mutagênese de saturação utilizando um tal oligo, são gerados 32 polinucleotídeos de progênie diferentes que codificam 20 polipeptídeos distintos. Em contraste, o uso de um oligo não degenerado na mutagênese direcionada ao sítio leva a apenas um produto de polipeptídeo de progênie por recipiente de reação.
[00350] Esta invenção fornece ainda o uso de oligos não degenerados, que podem ser opcionalmente utilizados em combinação com os iniciadores degenerados divulgados. É considerado que em algumas situações, é vantajoso utilizar oligos não degenerados para gerar mutações pontuais específicas em um polinucleotídeo de trabalho. Isto fornece meios para gerar mutações pontuais silenciosas específicas,
Petição 870170009999, de 15/02/2017, pág. 207/1247
198/788 mutações pontuais que levam a alterações de aminoácidos correspondentes e mutações pontuais que causam a produção de códons de término e a expressão correspondente de fragmentos polipeptídicos. [00351] Assim, em algumas modalidades desta invenção, cada recipiente de reação de mutagênese de saturação contém polinucleotídeos que codificam pelo menos 20 moléculas de polipeptídeo de progênie de forma que todos os 20 aminoácidos são representados em uma posição de aminoácido específica que corresponde à posição do códon que sofreu mutagênese no polinucleotídeo parental. Os polipeptídeos de progênie degenerados 32 vezes gerados partindo de cada recipiente de mutagênese de saturação podem ser submetidos à amplificação clonal (tal como clonados em um hospedeiro de E. coli adequado utilizando um vetor de expressão) e submetidos à verificação da expressão. Quando é identificado através da verificação que um polipeptídeo de progênie individual exibe uma alteração favorável na propriedade (quando comparado com o polipeptídeo parental), este pode ser seqüenciado para identificar a substituição de aminoácido favorável correspondente contida no mesmo.
[00352] Em algumas modalidades, após a mutagênese de cada e toda posição de aminoácido em um polipeptídeo parental utilizando a mutagênese de saturação que é divulgada aqui, alterações de aminoácidos favoráveis são identificadas em mais de uma posição de aminoácido. Pode ser gerada uma ou mais novas moléculas de progênie que contêm uma combinação de todas ou de parte destas substituições de aminoácidos favoráveis. Por exemplo, se 2 alterações de aminoácidos favoráveis específicas forem identificadas em cada uma das 3 posições de aminoácido em um polipeptídeo, as permutações incluem 3 possibilidades em cada posição (nenhuma alteração do aminoácido original e cada uma de duas alterações favoráveis) e 3 posições. Assim, há 3 x 3 x 3 ou 27 possibilidades totais, incluindo 7 que foram
Petição 870170009999, de 15/02/2017, pág. 208/1247
199/788 previamente verificadas - 6 mutações pontuais isoladas (isto é, 2 em cada uma de três posições) e nenhuma alteração em qualquer posição.
[00353] A invenção fornece o uso da mutagênese de saturação em combinação com processos de mutagênese adicionais, tal como o processo em que dois ou mais poli nucleotídeos relacionados são introduzidos em uma célula hospedeira adequada de forma que um polinucleotídeo híbrido é gerado através da recombinação e do reaporção redutivo.
[00354] Em adição à realização da mutagênese ao longo da sequência inteira de um gene, a presente invenção mostra que a mutagênese pode ser utilizada para substituir qualquer um de um número de bases em uma sequência de polinucleotídeo, em que o número de bases que será submetido à mutagênese é, em algumas modalidades cada número inteiro de 15 até 100.000. Assim, ao invés de submeter à mutagênese cada posição ao longo de uma molécula, pode-se submeter todas ou um número de bases distinto (em algumas modalidades um subconjunto totalizando 15 até 100.000) à mutagênese. Em algumas modalidades, um nucleotídeo separado é utilizado para mutagenizar cada posição ou grupo de posições ao longo de uma sequência de polinucleotídeo. Um grupo de 3 posições que será submetido à mutagênese pode ser um códon. As mutações podem ser introduzidas utilizando um iniciador mutagênico, contendo um cassete heterólogo, também referido como um cassete mutagênico. Os exemplos de cassetes podem ter de 1 até 500 bases. Cada posição de nucleotídeo em tais cassetes heterólogos é N, A, C, G, T, A/C, A/G, A/T, C/G, C/T, G/T, C/G/T, A/G/T, A/C/T, A/C/G ou E, em que E é qualquer base que não é A, C, G ou T (E pode ser referida como um oligo de planejamento).
[00355] Em algumas modalidades, a mutagênese de saturação é
Petição 870170009999, de 15/02/2017, pág. 209/1247
200/788 compreendida da mutagênese de um conjunto completo de cassetes mutagênicos (em que cada cassete tem, em algumas modalidades, aproximadamente 1-500 bases de comprimento) na sequência de polinucleotídeo definida que será submetida à mutagênese (em que a sequência que será submetida à mutagênese tem, em algumas modalidades, de aproximadamente 15 até 100.000 bases de comprimento). Assim, um grupo de mutações (variando de 1 até 100 mutações) é introduzido em cada cassete que será submetido à mutagênese. Um aporção de mutações que será introduzido em um cassete pode ser diferente ou o mesmo de um segundo aporção de mutações que será introduzido em um segundo cassete durante a aplicação de uma rodada de mutagênese de saturação. Tais aporçãos são exemplificados por deleções, adições, aporçãos de códons particulares e aporçãos de cassetes de nucleotídeos particulares.
[00356] Em algumas modalidades, as sequências definidas que serão submetidas à mutagênese incluem um gene inteiro, uma vide, um cDNA, um quadro aberto de leitura (ORF) inteiro e um promotor inteiro, um intensificador, um repressor/transativador, uma origem de replicação, um íntron, um operador ou qualquer grupo funcional de polinucleotídeo. Geralmente, sequências definidas para esta finalidade podem ser qualquer polinucleotídeo que seja uma sequência de polinucleotídeo de 15 bases e sequências de polinucleotídeos de comprimentos entre 15 bases e 15.000 bases (esta invenção cita especificamente cada número inteiro intermediário). As considerações na escolha dos aporçãos de códons incluem tipos de aminoácidos codificados por um cassete mutagênico degenerado.
[00357] Em algumas modalidades, um aporção de mutações que pode ser introduzido em um cassete mutagênico, esta invenção fornece especificamente substituições de códons (utilizando oligos degenerados) que codificam 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17,
Petição 870170009999, de 15/02/2017, pág. 210/1247
201/788
18,19 e 20 aminoácidos em cada posição e uma biblioteca de polipeptídeos codificados pelos mesmos.
Remontagem de Ligação Sintética (SLR) [00358] A invenção fornece um sistema de modificação gênica nãoestocástico denominado remontagem de ligação sintética ou simplesmente SLR, um processo de evolução direcionada, para gerar polipeptídeos, tais como enzimas aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase ou anticorpos de acordo com a invenção, com propriedades novas ou alteradas.
[00359] A SLR é um método de ligação de fragmentos de oligonucleotídeo de forma não-estocástica. Este método difere do embaralhamento de oligonucleotídeos estocástico pelo fato de que os blocos de constructo de ácido nucléico não são embaralhados, concatenados ou quimerizados de forma aleatória, mas ao invés disso, são montados de forma não-estocástica. Vide as Patentes U.S. N— 6.773.900; 6.740.506; 6.713.282; 6.635.449; 6.605.449; 6.537.776. Em algumas modalidades, a SLR compreende as etapas a seguir: (a) fornecimento de um polinucleotídeo molde, em que o polinucleotídeo molde compreende uma sequência que codifica um gene homólogo: (b) fornecimento de um grande número de polinucleotídeos de bloco de constructo, em que os polinucleotídeos de bloco de constructo são planejados para a remontagem por cross-over com o polinucleotídeo molde em uma sequência predeterminada e um polinucleotídeo de bloco de constructo compreende uma sequência que é uma variação do gene homólogo e uma sequência homóloga ao polinucleotídeo molde flanqueando a sequência variante; (c) combinação de um polinucleotídeo de bloco de constructo com um polinucleotídeo molde de forma que o polinucleotídeo de bloco de constructo sofra remontagem por crossover com o polinucleotídeo para gerar polinucleotídeos que compreendem variações da sequência do gene homólogo.
Petição 870170009999, de 15/02/2017, pág. 211/1247
202/788 [00360] A SLR não depende da presença de altos níveis de homologia entre os polinucleotídeos que sofrerão rearranjo. Assim, este método pode ser utilizado para gerar de forma não-estocástica bibliotecas (ou conjuntos) de moléculas de progênie compreendidas de mais de 1O100 quimeras diferentes. A SLR pode ser utilizada para gerar bibliotecas compreendidas de mais de io1000 quimeras de progênie diferentes. Assim, as modalidades da presente invenção incluem métodos não-estocásticos de produção de um conjunto de moléculas de ácidos nucléicos quiméricas finalizadas passando por perto de uma ordem de montagem geral que é escolhida pelo planejamento. Este método inclui as etapas de produção através do planejamento de um grande número de blocos de constructo de ácidos nucléicos específicos que possuem extremidades que podem ser ligadas mutuamente compatíveis úteis e de montagem destes blocos de constructo de ácidos nucléicos, de forma que uma ordem de montagem geral planejada é conseguida.
[00361] As extremidades que podem ser ligadas mutuamente compatíveis dos blocos de constructo de ácidos nucléicos que serão montados são consideradas como sendo úteis para este tipo de montagem ordenada se possibilitarem que os blocos de constructo sejam acoplados em ordens predeterminadas. Assim, a ordem de montagem geral em que os blocos de constructo de ácidos nucléicos podem ser acoplados é especificada pelo planejamento das extremidades que podem ser ligadas. Se mais de uma etapa de montagem tiver que ser utilizada, a ordem de montagem geral em que os blocos de constructo de ácidos nucléicos podem ser acoplados é também especificada pela ordem seqüencial da(s) etapa(s) de montagem. Em algumas modalidades, os pedaços de constructo anelados são tratados com uma enzima, tal como uma ligase (tal como T4 DNA ligase), para conseguir a ligação covalente dos pedaços de constructo.
Petição 870170009999, de 15/02/2017, pág. 212/1247
203/788 [00362] Em algumas modalidades, o planejamento dos blocos de constructo de oligonucleotídeos é obtido através da análise de um conjunto de moldes de sequências de ácidos nucléicos progenitoras que servem como uma base para a produção de um conjunto de progênie de poli nucleotídeos quiméricos finalizados. Estes moldes de oligonucleotídeos parentais servem assim como uma fonte de informação de sequência que auxilia no planejamento dos blocos de constructo de ácidos nucléicos que serão submetidos à mutagénese, tal como quimerizados ou embaralhados. Em algumas modalidades deste método, as sequências de um grande número de moldes de ácidos nucléicos parentais são alinhadas com a finalidade de selecionar um ou mais pontos de demarcação. Os pontos de demarcação podem ser localizados em uma área de homologia e são compreendidos de um ou mais nucleotídeos. Estes pontos de demarcação são, em algumas modalidades, compartilhados por pelo menos dois dos moldes progenitores. Os pontos de demarcação podem ser assim utilizados para delinear os limites dos blocos de constructo de oligonucleotídeos que serão gerados com a finalidade de rearranjar os polinucleotídeos parentais. Os pontos de demarcação identificados e selecionados nas moléculas progenitoras servem como pontos de quimerização potenciais na montagem das moléculas de progênie quiméricas finais. Um ponto de demarcação pode ser uma área de homologia (compreendida de pelo menos uma base nucleotídica homóloga) compartilhada por pelo menos duas sequências de polinucleotídeos parentais. Alternativamente, um ponto de demarcação pode ser uma área de homologia que é compartilhada por pelo menos a metade das sequências de polinucleotídeos parentais ou pode ser uma área de homologia que é compartilhada por pelo menos dois terços das sequências de polinucleotídeos parentais. Ainda mais, em algumas modalidades, um ponto de demarcação útil é uma área de homologia que é compartilhada por
Petição 870170009999, de 15/02/2017, pág. 213/1247
204/788 pelo menos três quartos das sequências de polinucleotídeos parentais ou pode ser compartilhada por quase todas as sequências de polinucleotídeos parentais. Em algumas modalidades, um ponto de demarcação é uma área de homologia que é compartilhada por todas as sequências de polinucleotídeos parentais.
[00363] Em algumas modalidades, um processo de remontagem de ligação é realizado exaustivamente com a finalidade de gerar uma biblioteca exaustiva de polinucleotídeos quiméricos de progênie. Em outras palavras, todas as combinações ordenadas possíveis dos blocos de constructo de ácidos nucléicos são representadas no conjunto de moléculas de ácidos nucléicos quiméricas finalizadas. Ao mesmo tempo, em outras modalidades, a ordem de montagem (isto é, a ordem de montagem de cada bloco de constructo na sequência 5' a 3' de cada ácido nucléico quimérico finalizado) em cada combinação é através do planejamento (ou não-estocástica) como descrito anteriormente. Devido à natureza não-estocástica desta invenção, a possibilidade de subprodutos indesejados é enormemente reduzida.
[00364] Em outras modalidades, o método de remontagem de ligação é realizado de forma sistemática. Por exemplo, o método é realizado com a finalidade de gerar uma biblioteca compartimentalizada sistematicamente de moléculas de progênie, com compartimentos que podem ser verificados de forma sistemática, tal como um por um. Em outras palavras, esta invenção fornece que, através do uso seletivo e criterioso de blocos de constructo de ácidos nucléicos específicos, acoplado com o uso seletivo e criterioso de reações de montagem em etapas sistemáticas, um planejamento pode ser conseguido quando conjuntos específicos de produtos de progênie são feitos em cada um dos vários recipientes de reação. Isto permite que um procedimento de exame e verificação sistemático seja realizado. Assim, estes métodos permitem que um número potencialmente muito grande de moléculas
Petição 870170009999, de 15/02/2017, pág. 214/1247
205/788 de progênie seja verificado de forma sistemática em grupos menores. Devido a sua capacidade de realizar quimerizações de uma maneira que é altamente flexível e ainda exaustiva e sistemática também, particularmente quando há um baixo nível de homologia entre as moléculas progenitoras, estes métodos possibilitam a produção de uma biblioteca (ou conjunto) compreendida de um grande número de moléculas de progênie. Devido à natureza não-estocástica da presente invenção de remontagem de ligação, as moléculas de progênie geradas em algumas modalidades compreendem uma biblioteca de moléculas de ácidos nucléicos quiméricas finalizadas que possuem uma ordem de montagem geral que é escolhida pelo planejamento. A mutagênese de saturação e os métodos de evolução direcionada otimizada também podem ser utilizados para gerar espécies moleculares de progênie diferentes. É considerado que a invenção fornece liberdade de escolha e controle em relação à seleção de pontos de demarcação, do tamanho e do número dos blocos de constructo de ácidos nucléicos e do tamanho e do planejamento dos acoplamentos. É considerado, além disso, que o requerimento de homologia intermolecular é altamente relaxado para a operabilidade desta invenção. Na verdade, os pontos de demarcação podem ainda ser escolhidos em áreas de pouca ou nenhuma homologia intermolecular. Por exemplo, devido à oscilação dos códons, isto é, a degeneração de códons, substituições de nucleotídeos podem ser introduzidas nos blocos de constructo de ácidos nucléicos sem alterar o aminoácido codificado originalmente no molde progenitor correspondente. Alternativamente, um códon pode ser alterado de forma que a codificação de um aminoácido original seja alterada. Esta invenção mostra que tais substituições podem ser introduzidas no bloco de constructo de ácido nucléico com a finalidade de aumentar a incidência de pontos de demarcação intermoleculares homólogos e assim permitir que um número maior de acoplamentos seja atingido entre
Petição 870170009999, de 15/02/2017, pág. 215/1247
206/788 os blocos de constructo, que por sua vez permite que um número maior de moléculas quiméricas de progênie seja gerado.
Remontaqem Gênica Sintética [00365] Em algumas modalidades, a presente invenção fornece um método não-estocástico denominado remontagem gênica sintética, que é de alguma maneira relacionada com o embaralhamento estocástico, exceto que os blocos de constructo de ácidos nucléicos não são embaralhados ou concatenados ou quimerizados de forma aleatória, mas, ao invés disso, são montados de forma não-estocástica. Vide a Patente U.S. N°6.537.776.
[00366] O método de remontagem gênica sintética não depende da presença de um alto nível de homologia entre os polinucleotídeos que serão embaralhados. A invenção pode ser utilizada para gerar bibliotecas (ou conjuntos) de forma não-estocástica de moléculas de progênie compreendidas de mais de 101°° quimeras diferentes. De modo concebível, a remontagem gênica sintética pode ainda ser utilizada para gerar bibliotecas compreendidas de mais de io1000 quimeras de progênie diferentes.
[00367] Assim, em algumas modalidades, a invenção fornece um método não-estocástico de produção de um conjunto de moléculas de ácidos nucléicos quiméricas finalizadas que possuem uma ordem de montagem geral que é escolhida por planejamento, cujo método é compreendido das etapas de produção através de planejamento de um grande número de blocos de constructo de ácidos nucléicos específicos que possuem extremidades que podem ser ligadas mutuamente compatíveis úteis e da montagem destes blocos de constructo de ácidos nucléicos, de forma que uma ordem de montagem geral planejada é conseguida.
[00368] As extremidades que podem ser ligadas mutuamente compatíveis dos blocos de constructo de ácidos nucléicos que serão monPetição 870170009999, de 15/02/2017, pág. 216/1247
207/788 tados são consideradas como sendo úteis para este tipo de montagem ordenada se possibilitarem que os blocos de constructo sejam acoplados em ordens predeterminadas. Assim, em algumas modalidades, a ordem de montagem geral em que os blocos de constructo de ácidos nucléicos podem ser acoplados é especificada pelo planejamento das extremidades que podem ser ligadas e, se mais de uma etapa de montagem tiver que ser utilizada, então a ordem de montagem geral em que os blocos de constructo de ácidos nucléicos podem ser acoplados é também especificada pela ordem seqüencial da(s) etapa(s) de montagem. Em uma modalidade da invenção, os pedaços de constructo anelados são tratados com uma enzima, tal como uma ligase (tal como T4 DNA ligase) para conseguir a ligação covalente dos pedaços de constructo.
[00369] Em uma outra modalidade, o planejamento dos blocos de constructo de ácidos nucléicos é obtido após a análise das sequências de um conjunto de moldes de ácidos nucléicos progenitores que servem como uma base para a produção de um conjunto de progênie de moléculas de ácidos nucléicos quiméricas finalizadas. Estes moldes de ácidos nucléicos progenitores servem assim como uma fonte de informação de sequência que auxilia no planejamento dos blocos de constructo de ácidos nucléicos que serão submetidos à mutagênese, isto é, quimerizados ou embaralhados.
[00370] Em um exemplo, a invenção fornece a quimerização de uma família de genes relacionados e sua família codificada de produtos relacionados. Em um exemplo particular, os produtos codificados são enzimas. As enzimas aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase da presente invenção podem sofrer mutagênese de acordo com os métodos descritos aqui.
[00371] Assim, de acordo com uma modalidade da invenção, as sequências de um grande número de moldes de ácidos nucléicos proPetição 870170009999, de 15/02/2017, pág. 217/1247
208/788 genitores (tais como polinucleotídeos de acordo com a invenção) são alinhadas com a finalidade de selecionar um ou mais pontos de demarcação, cujos pontos de demarcação podem estar localizados em uma área de homologia. Os pontos de demarcação podem ser utilizados para delinear os limites dos blocos de constructo de ácidos nucléicos que serão gerados. Assim, os pontos de demarcação identificados e selecionados nas moléculas progenitoras servem como pontos de quimerização potenciais na montagem das moléculas de progênie. [00372] Em algumas modalidades, um ponto de demarcação útil é uma área de homologia (compreendida de pelo menos uma base nucleotídica homóloga) compartilhada por pelo menos dois moldes progenitores, mas o ponto de demarcação pode ser uma área de homologia que é compartilhada por pelo menos a metade dos moldes progenitores, pelo menos dois terços dos moldes progenitores, pelo menos três quartos dos moldes progenitores e, em algumas modalidades, em quase todos os moldes progenitores. Ainda mais, em algumas modalidades, também um ponto de demarcação útil é uma área de homologia que é compartilhada por todos os moldes progenitores.
[00373] Em uma modalidade, o processo de remontagem gênica é realizado exaustivamente com a finalidade de gerar uma biblioteca exaustiva. Em outras palavras, todas as combinações ordenadas possíveis dos blocos de constructo de ácidos nucléicos são representadas no conjunto de moléculas de ácidos nucléicos quiméricas finalizadas. Ao mesmo tempo, a ordem de montagem (isto é, a ordem de montagem de cada bloco de constructo na sequência 5' a 3' de cada ácido nucléico quimérico finalizado) em cada combinação é através do planejamento (ou não-estocástica). Devido à natureza não-estocástica do método, a possibilidade de subprodutos indesejados é enormemente reduzida.
[00374] Em outras modalidades, o método mostra que o processo
Petição 870170009999, de 15/02/2017, pág. 218/1247
209/788 de remontagem gênica é realizado de forma sistemática, por exemplo, para gerar uma biblioteca compartimentalizada sistemática, com compartimentos que podem ser verificados de forma sistemática, tal como um por um. Em outras palavras, a invenção mostra que, através do uso seletivo e criterioso de blocos de constructo de ácidos nucléicos específicos, acoplado com o uso seletivo e criterioso de reações de montagem em etapas seqüenciais, um planejamento experimental pode ser conseguido quando conjuntos específicos de produtos de progênie são produzidos em cada um dos vários recipientes de reação. Isto permite que um procedimento de exame e verificação sistemático seja realizado. Assim, permite que um número potencialmente muito grande de moléculas de progênie seja verificado de forma sistemática em grupos menores.
[00375] Devido a sua capacidade de realizar quimerizações de uma maneira que é altamente flexível e ainda exaustiva e sistemática também, particularmente quando há um baixo nível de homologia entre as moléculas progenitoras, a presente invenção fornece a produção de uma biblioteca (ou conjunto) compreendida de um grande número de moléculas de progênie. Devido à natureza não-estocástica da presente invenção de remontagem gênica, as moléculas de progênie geradas em algumas modalidades compreendem uma biblioteca de moléculas de ácidos nucléicos quiméricas finalizadas que possuem uma ordem de montagem geral que é escolhida através do planejamento. Em algumas modalidades, tal biblioteca produzida é compreendida de mais de 103 até mais de io1000 espécies moleculares de progênie diferentes. [00376] Em algumas modalidades, um conjunto de moléculas de ácidos nucléicos quiméricas finalizadas, produzido como descrito é compreendido de um polinucleotídeo que codifica um polipeptídeo. Em uma modalidade, este polinucleotídeo é um gene, que pode ser um gene feito pelo ser humano. Em uma outra modalidade, este polinuPetição 870170009999, de 15/02/2017, pág. 219/1247
210/788 cleotídeo é uma vide gênica, que pode ser uma vide gênica produzida pelo ser humano. Em algumas modalidades, a invenção mostra que um ou mais genes feitos pelo ser humano gerados pela invenção podem ser incorporados em uma vide gênica feita pelo ser humano, tal como uma vide que pode ser operada em um organismo eucariótico (incluindo uma planta).
[00377] Em um outro exemplo, a natureza sintética da etapa em que os blocos de constructo são gerados permite o planejamento e a introdução de nucleotídeos (tal como um ou mais nucleotídeos, que podem ser, por exemplo, códons ou íntrons ou sequências reguladoras) que podem ser posteriormente opcionalmente removidos em um processo in vitro (tal como através de mutagênese) ou em um processo in vivo (tal como através da utilização da capacidade de processamento de um organismo hospedeiro). É considerado que em muitos casos a introdução destes nucleotídeos pode também ser desejável por muitas outras razões em adição ao benefício de criar um ponto de demarcação útil.
[00378] Assim, em algumas modalidades, a invenção mostra que um bloco de constructo de ácido nucléico pode ser utilizado para introduzir um íntron. Assim, a invenção mostra que os íntrons podem ser introduzidos em um gene feito pelo ser humano de acordo com a invenção. Em algumas modalidades, a invenção mostra ainda que íntrons funcionais podem ser introduzidos em uma vide gênica feita pelo ser humano de acordo com a invenção. Conseqüentemente, a invenção fornece a produção de um polinucleotídeo quimérico que é um gene feito pelo ser humano que contém um (ou mais) íntron(s) introduzido(s) artificialmente.
[00379] A invenção fornece ainda a produção de um polinucleotídeo quimérico que é uma vide gênica feita pelo ser humano que contém um (ou mais) íntron(s) introduzido(s) artificialmente. Em algumas moPetição 870170009999, de 15/02/2017, pág. 220/1247
211/788 dalidades, o(s) íntron(s) introduzido(s) artificialmente são funcionais em uma ou mais células hospedeiras para o processamento gênico muito no fato de que os íntrons que ocorrem naturalmente servem funcionalmente para o processamento gênico. Em algumas modalidades, a invenção fornece processos de produção de poli nucleotídeos contendo íntrons feitos pelo ser humano que serão introduzidos nos organismos hospedeiros para recombinação e/ou processamento.
[00380] Um gene feito pelo ser humano produzido utilizando a invenção também pode servir como um substrato para recombinação com um outro ácido nucléico. Similarmente, uma vide gênica feita pelo ser humano utilizando a invenção também pode servir como um substrato para recombinação com um outro ácido nucléico. Em algumas modalidades, a recombinação é facilitada por ou ocorre em áreas de homologia entre o gene contendo íntrons produzido pelo ser humano e um ácido nucléico, que serve como um parceiro de recombinação. Em algumas modalidades, o parceiro de recombinação pode também ser um ácido nucléico gerado pela invenção, incluindo um gene feito pelo ser humano ou uma vide gênica feita pelo ser humano. A recombinação pode ser facilitada por ou pode ocorrer em áreas de homologia que existem em um (ou mais) íntron(s) introduzido(s) artificialmente no gene feito pelo ser humano.
[00381] Em algumas modalidades, o método de remontagem gênica sintética de acordo com a invenção utiliza um grande número de blocos de constructo de ácidos nucléicos, dos quais cada um, em algumas modalidades, possui duas extremidades que podem ser ligadas. As duas extremidades que podem ser ligadas em cada bloco de constructo de ácido nucléico podem ser duas extremidades cegas (isto é, cada uma possuindo uma ponta pendurada de zero nucleotídeo) ou em algumas modalidades uma ponta cega e uma ponta coesiva ou mais em algumas modalidades ainda duas pontas coesivas. Em alguPetição 870170009999, de 15/02/2017, pág. 221/1247
212/788 mas modalidades, uma ponta coesiva útil para esta finalidade pode ser uma ponta coesiva a 3' ou uma ponta coesiva a 5'. Assim, um bloco de constructo de ácido nucléico pode ter uma ponta coesiva a 3' ou alternativamente uma ponta coesiva a 5' ou alternativamente duas pontas coesivas a 3' ou alternativamente duas pontas coesivas a 5'. A ordem geral em que os blocos de constructo de ácidos nucléicos são montados para formar uma molécula de ácido nucléico quimérico finalizado é determinada através do planejamento experimental intencional e não é aleatória.
[00382] Em algumas modalidades, um bloco de constructo de ácido nucléico é gerado através da síntese química de dois ácidos nucléicos de filamento simples (também referidos como oligos de filamento simples) e colocando-os em contato de forma a permitir que se anelem para formar um bloco de constructo de ácido nucléico de filamento duplo. Um bloco de constructo de ácido nucléico de filamento duplo pode ter tamanho variável. Os tamanhos destes blocos de constructo podem ser grandes ou pequenos. Os exemplos de tamanhos para o bloco de constructo variam de 1 par de bases (não incluindo quaisquer pontas coesivas) até 100.000 pares de bases (não incluindo quaisquer pontas coesivas). Outros exemplos de faixas de tamanhos são também fornecidos que possuem limites inferiores de 1 pb até 10.000 pb (incluindo cada valor de número inteiro intermediário) e limites superiores de 2 pb até 100.000 pb (incluindo cada valor de número inteiro intermediário). [00383] Há muitos métodos através dos quais pode ser gerado um bloco de constructo de ácido nucléico de filamento duplo que é útil para a invenção; e estes são conhecidos na técnica e podem ser facilmente realizados pelo versado na técnica. Em algumas modalidades, um bloco de constructo de ácido nucléico de filamento duplo é gerado produzindo primeiramente dois ácidos nucléicos de filamento simples e permitindo que se anelem para formar um bloco de constructo de áciPetição 870170009999, de 15/02/2017, pág. 222/1247
213/788 do nucléico de filamento duplo. Os dois filamentos de um bloco de constructo de ácido nucléico de filamento duplo podem ser complementares em todos os nucleotídeos não considerando qualquer um que forme uma ponta coesiva; não contendo assim pareamentos errados, não considerando qualquer(quaisquer) ponta(s) coesiva(s). Em uma outra modalidade, os dois filamentos de um bloco de constructo de ácido nucléico de filamento duplo são complementares em menos que todos os nucleotídeos não considerando qualquer um que forme uma ponta coesiva. Assim, de acordo com esta modalidade, um bloco de constructo de ácido nucléico de filamento duplo pode ser utilizado para introduzir degeneração de códons. Em algumas modalidades a degeneração de códons é introduzida utilizando a mutagênese de saturação ao sítio descrita aqui, utilizando um ou mais cassetes N,N,G/T ou alternativamente utilizando um ou mais cassetes Ν,Ν,Ν.
[00384] O método de recombinação in vivo de acordo com a invenção pode ser realizado de forma cega em um grupo de híbridos ou alelos desconhecidos de um polinucleotídeo ou uma sequência específica. Entretanto, não é necessário conhecer a sequência de DNA ou de RNA real do polinucleotídeo específico. A abordagem de utilizar recombinação dentro de uma população misturada de genes pode ser útil para produzir quaisquer proteínas úteis, por exemplo, uma aldolase de acordo com a invenção ou uma variação da mesma. Esta abordagem pode ser utilizada para gerar proteínas que possuem especificidade ou atividade alterada. A abordagem pode também ser útil para a produção de sequências de ácidos nucléicos híbridas, por exemplo, regiões promotoras, íntrons, éxons, sequências intensificadoras, regiões não traduzidas a 3' ou regiões não traduzidas a 5' de genes. Assim, esta abordagem pode ser utilizada para gerar genes que possuem maiores taxas de expressão. Esta abordagem também pode ser útil no estudo de sequências de DNA repetitivas. Finalmente, esta
Petição 870170009999, de 15/02/2017, pág. 223/1247
214/788 abordagem pode ser útil para produzir ribozimas ou aptâmeros de acordo com a invenção.
[00385] Em algumas modalidades, a invenção descrita aqui é direcionada para o uso de ciclos repetidos de reaporção redutor, recombinação e seleção que permitem a evolução molecular direcionada de sequências lineares altamente complexas, tal como DNA, RNA ou proteínas através da recombinação.
Sistema de Evolução Direcionada Otimizada [00386] A invenção fornece um sistema de modificação gênica nãoestocástico denominado sistema de evolução direcionada otimizada para gerar polipeptídeos, tais como enzimas aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase ou anticorpos de acordo com a invenção, com propriedades novas ou alteradas. Em algumas modalidades, a evolução direcionada otimizada é direcionada ao uso de ciclos repetidos de reaporção redutor, recombinação e seleção que permitem a evolução molecular direcionada de ácidos nucléicos através da recombinação.
[00387] A evolução direcionada otimizada permite a produção de uma grande população de sequências quiméricas evoluídas, em que a população produzida é significativamente enriquecida em relação a sequências que possuem um número predeterminado de eventos de crossover. Um evento de crossover é um ponto em uma sequência quimérica em que uma troca na sequência ocorre de uma variação parental com uma outra variação parental. Tal ponto é normalmente na junção de onde os oligonucleotídeos dos dois parentais são ligados para formar uma única sequência. Este método permite o cálculo das concentrações corretas das sequências de oligonucleotídeos de forma que a população quimérica final de sequências é enriquecida em relação ao número escolhido de eventos de crossover. Isto fornece mais controle em relação à escolha de variações quiméricas que possuem
Petição 870170009999, de 15/02/2017, pág. 224/1247
215/788 um número predeterminado de eventos de crossover.
[00388] Em adição, este método fornece meios convenientes para explorar uma quantidade tremenda de espaço de variantes de proteínas possíveis em comparação com outros sistemas. Previamente, se fossem geradas, por exemplo, 1013 moléculas quiméricas durante uma reação, seria extremamente difícil testar tal alto número de variações quiméricas em relação a uma atividade particular. Além disso, uma parte significativa da população de progênie teria um número muito alto de eventos de crossover que resultariam em proteínas que eram menos prováveis de possuírem níveis maiores de uma atividade particular. Utilizando estes métodos, a população de moléculas quiméricas pode ser enriquecida em relação às variações que possuem um número particular de eventos de crossover. Assim, embora ainda possam ser geradas 1013 moléculas quiméricas durante uma reação, cada uma das moléculas escolhidas para análise adicional possui mais provavelmente, por exemplo, apenas três eventos de crossover. Devido ao fato de que a população de progênie resultante pode estar inclinada a possuir um número predeterminado de eventos de crossover, os limites das variedades funcionais entre as moléculas quiméricas são reduzidos. Isto fornece um número mais controlável de variáveis quando é calculado qual oligonucleotídeo dos polinucleotídeos parentais originais poderia ser responsável por afetar uma característica particular. [00389] Um método para criar uma sequência de polinucleotídeo de progênie quimérica é criar oligonucleotídeos que correspondem a fragmentos ou partes de cada sequência parental. Cada oligonucleotídeo em algumas modalidades inclui uma região exclusiva de sobreposição de forma que a mistura dos oligonucleotídeos juntos resulta em uma nova variação que possui cada fragmento de oligonucleotídeo montado na ordem correta. Alternativamente, os protocolos para a prática destes métodos de acordo com a invenção podem ser encontrados
Petição 870170009999, de 15/02/2017, pág. 225/1247
216/788 nas Patentes U.S. N— 6.773.900; 6.740.506; 6.713.282; 6.635.449; 6.605.449; 6.537.776; 6.361.974.
[00390] O número de oligonucleotídeos gerados para cada variação parental exibe uma relação com o número total de crossovers resultantes na molécula quimérica que é criada em última análise. Por exemplo, três variações de sequências de nucleotídeos parentais poderiam ser fornecidas para sofrer uma reação de ligação com a finalidade de encontrar uma variação quimérica que possui, por exemplo, maior atividade à temperatura alta. Como um exemplo, um conjunto de 50 sequências de oligonucleotídeos pode ser gerado correspondendo a cada uma das partes de cada variação parental. Conseqüentemente, durante o processo de remontagem por ligação poderia haver até 50 eventos de crossover dentro de cada uma das sequências quiméricas. A probabilidade de que cada um dos poli nucleotídeos quiméricos gerados conterá oligonucleotídeos de cada variação parental em ordem alternada é muito baixa. Se cada fragmento de oligonucleotídeo estiver presente na reação de ligação na mesma quantidade molar é provável que nas mesmas posições os oligonucleotídeos do mesmo polinucleotídeo parental se liguem um após o outro e assim não resultarão em um evento de crossover. Se a concentração de cada oligonucleotídeo de cada parental for mantida constante durante qualquer etapa de ligação neste exemplo, há uma chance de 1/3 (assumindo 3 parentais) que um oligonucleotídeo da mesma variação parental se ligar dentro da sequência quimérica e não produzir crossover.
[00391] Conseqüentemente, uma função de densidade da probabilidade (PDF) pode ser determinada para prever a população de eventos de crossover prováveis de ocorrer durante cada etapa em uma reação de ligação dado um número ajustado de variações parentais, um número de oligonucleotídeos que correspondem a cada variação e as concentrações de cada variação durante cada etapa na reação de
Petição 870170009999, de 15/02/2017, pág. 226/1247
217/788 ligação. A estatística e a matemática por trás da determinação da PDF são descritas abaixo. Utilizando estes métodos, pode-se calcular tal função de densidade da probabilidade e assim enriquecer a população de progênie quimérica em relação a um número predeterminado de eventos de crossover resultantes de uma reação de ligação particular. Além disso, um número alvo de eventos de crossover pode ser predeterminado e o sistema é então programado para calcular as quantidades iniciais de cada oligonucleotídeo parental durante cada etapa na reação de ligação para resultar em uma função de densidade da probabilidade que se concentra no número predeterminado de eventos de crossover. Estes métodos são direcionados ao uso de ciclos repetidos de reaporção redutor, recombinação e seleção que permitem a evolução molecular direcionada de um ácido nucléico que compreende um polipeptídeo através da recombinação. Este sistema permite produzir uma grande população de sequências quiméricas evoluídas, em que a população gerada é significativamente enriquecida em relação a sequências que possuem um número predeterminado de eventos de crossover. Um evento de crossover é um ponto em uma sequência quimérica em que uma troca na sequência ocorre de uma variação parental com uma outra variação parental. Tal ponto fica normalmente na junção em que os oligonucleotídeos dos dois parentais são ligados para formar uma única sequência. O método permite o cálculo das concentrações corretas de sequências de oligonucleotídeos de forma que a população quimérica final de sequências é enriquecida em relação ao número escolhido de eventos de crossover. Isto fornece mais controle em relação à escolha de variações quiméricas que possuem um número predeterminado de eventos de crossover.
[00392] Em adição, estes métodos fornecem um meio conveniente para explorar uma quantidade tremenda do espaço de variações de
Petição 870170009999, de 15/02/2017, pág. 227/1247
218/788 proteínas possíveis em comparação com outros sistemas. Utilizando os métodos descritos aqui, a população de moléculas quiméricas pode ser enriquecida em relação a tais variações que possuem um número particular de eventos de crossover. Assim, embora ainda possam ser geradas 1013 moléculas quiméricas durante uma reação, cada uma das moléculas escolhidas para análise adicional possui mais provavelmente, por exemplo, apenas três eventos de crossover. Devido ao fato de que a população de progênie resultante pode estar inclinada a possuir um número predeterminado de eventos de crossover, os limites das variedades funcionais entre as moléculas quiméricas são reduzidos. Isto fornece um número mais controlável de variáveis quando é calculado qual oligonucleotídeo dos polinucleotídeos parentais originais podería ser responsável por afetar uma característica particular. [00393] Em algumas modalidades, o método cria uma sequência de polinucleotídeo de progênie quimérica através da criação de oligonucleotídeos que correspondem a fragmentos ou a partes de cada sequência parental. Cada oligonucleotídeo em algumas modalidades inclui uma região exclusiva de sobreposição de forma que a mistura dos oligonucleotídeos juntos resulta em uma nova variação que possui cada fragmento de oligonucleotídeo montado na ordem correta. Vide também as Patentes U.S. N— 6.773.900; 6.740.506; 6.713.282; 6.635.449; 6.605.449; 6.537.776; 6.361.974.
Determinação de Eventos de Crossover [00394] As modalidades da invenção incluem um sistema e um software que recebem uma função de densidade da probabilidade (PDF) do crossover desejado, o número de genes parentais que serão remontados e o número de fragmentos na remontagem como entradas. A saída deste programa é uma PDF de fragmento que pode ser utilizada para determinar um protocolo para produzir genes remontados e a PDF de crossover estimada de tais genes. O processamento desPetição 870170009999, de 15/02/2017, pág. 228/1247
219/788 crito aqui é, em algumas modalidades, realizado em MATLAB® (The Mathworks, Natick, Massachusetts) uma linguagem de programação e um ambiente de desenvolvimento para computação técnica.
Processos Iterativos [00395] Qualquer processo de acordo com a invenção pode ser repetido de forma iterativa, de forma que um ácido nucléico que codifica um fenótipo de enzima aldolase alterado ou novo, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção, pode ser identificado, reisolado, modificado novamente, testado novamente em relação à atividade. Este processo pode ser repetido de forma iterativa até que um fenótipo desejado seja engenheirado. Por exemplo, uma vide anabólica ou catabólica bioquímica inteira pode ser engenheirada em uma célula, incluindo, tal como a atividade da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase.
[00396] Similarmente, se for determinado que um oligonucleotídeo particular não possui efeito de forma alguma sobre a característica desejada (tal como um novo fenótipo de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase), este pode ser removido como uma variável através da síntese de oligonucleotídeos parentais maiores que incluem a sequência que será removida. Devido ao fato de que a incorporação da sequência dentro de uma sequência maior previne quaisquer eventos de crossover, não haverá mais qualquer variação desta sequência nos polinucleotídeos de progênie. Esta prática iterativa de determinação de quais oligonucleotídeos estão mais relacionados com a característica desejada e quais não estão relacionados, permite a exploração mais eficiente de todas as variações de proteínas possíveis que poderíam fornecer uma característica ou uma atividade particular.
Embaralhamento in vivo
Petição 870170009999, de 15/02/2017, pág. 229/1247
220/788 [00397] Em várias modalidades, o embaralhamento in vivo de moléculas é utilizado nos métodos de acordo com a invenção para fornecer variações de polipeptídeos de acordo com a invenção, tais como anticorpos de acordo com a invenção ou enzimas aldolases de acordo com a invenção, tal como piruvato aldolase, HMG e/ou KHG aldolase e similares. O embaralhamento in vivo pode ser realizado utilizando a propriedade natural das células para recombinar multímeros. Embora a recombinação in vivo tenha fornecido a rota natural principal para a diversidade molecular, a recombinação genética permanece um processo relativamente complexo que envolve 1) o reconhecimento de homologias; 2) a divagem de filamentos, a invasão de filamentos e as etapas metabólicas que levam à produção de quiasma recombinante; e finalmente 3) a resolução do quiasma em moléculas recombinadas distintas. A formação do quiasma requer o reconhecimento de sequências homólogas.
[00398] Em outras modalidades, a invenção inclui um método para a produção de um polinucleotídeo híbrido de pelo menos um primeiro polinucleotídeo e um segundo polinucleotídeo. Em algumas modalidades, a invenção pode ser utilizada para produzir um polinucleotídeo híbrido através da introdução de pelo menos um primeiro polinucleotídeo e um segundo polinucleotídeo (tal como um ou ambos, sendo uma sequência de acordo com a invenção que codifica uma enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase) que compartilham pelo menos uma região de homologia de sequência parcial em uma célula hospedeira adequada. As regiões de homologia de sequência parcial promovem processos que resultam na reorganização de sequências produzindo um polinucleotídeo híbrido. O termo polinucleotídeo híbrido, como utilizado aqui, é qualquer sequência de nucleotídeos que resulta do método da presente invenção e contém a sequência de pelo menos duas sequências de polinucleotídeos origiPetição 870170009999, de 15/02/2017, pág. 230/1247
221/788 nais. Tais polinucleotídeos híbridos podem resultar de eventos de recombinação intermolecular que promovem a integração de sequências entre moléculas de DNA. Em adição, tais polinucleotídeos híbridos podem resultar de processos de reaporção redutor intramolecular que utilizam sequências repetidas para alterar uma sequência de nucleotídeos dentro de uma molécula de DNA.
[00399] Em algumas modalidades, o reaporção in vivo se concentra em processos intermoleculares coletivamente referidos como recombinação; que em bactérias, é geralmente visto como um fenômeno dependente de RecA. Em algumas modalidades, a invenção pode se basear nos processos de recombinação de uma célula hospedeira para recombinar e reagrupar sequências ou na capacidade das células de mediar processos redutores para diminuir a complexidade de sequências quase repetidas na célula através de deleção. Este processo de reaporção redutor ocorre através de um processo independente de RecA intramolecular.
[00400] Em outras modalidades da invenção, novos polinucleotídeos podem ser gerados através do processo de reaporção redutor. O método envolve a produção de constructos que contêm sequências consecutivas (sequências codificadoras originais), sua inserção em um vetor apropriado e sua introdução subseqüente em uma célula hospedeira apropriada. O reaporção das identidades moleculares individuais ocorre através de processos combinatórios entre as sequências consecutivas no constructo que possui regiões de homologia ou entre unidades quase repetidas. O processo de reaporção recombina e/ou reduz a complexidade e a extensão das sequências repetidas e resulta na produção de novas espécies moleculares. Vários tratamentos podem ser aplicados para aumentar a taxa de reaporção. Estes poderíam incluir o tratamento com luz ultravioleta ou com agentes químicos que danificam o DNA e/ou o uso de linhagens de células que exibem níveis
Petição 870170009999, de 15/02/2017, pág. 231/1247
222/788 maiores de instabilidade genética. Assim, o processo de reaporção pode envolver recombinação homóloga ou a propriedade natural de sequências quase repetidas de direcionar sua própria evolução.
[00401] As sequências repetidas ou quase repetidas desempenham uma função na instabilidade genética. Em algumas modalidades, quase repetições são repetições que não estão restritas à sua estrutura de unidades original. As unidades quase repetidas podem ser apresentadas na forma de um arranjo de sequências em um constructo; unidades consecutivas de sequências similares. Uma vez ligadas, as junções entre as sequências consecutivas se tornam essencialmente invisíveis e a natureza quase repetitiva do constructo resultante é agora contígua no nível molecular. O processo de deleção que a célula realiza para reduzir a complexidade do constructo resultante opera entre as sequências quase repetidas. As unidades quase repetidas fornecem um repertório praticamente ilimitado de moldes sobre os quais os eventos de deslizamento podem ocorrer. Em algumas modalidades, os constructos que contêm as quase repetições fornecem assim eficientemente elasticidade molecular suficiente de forma que eventos de deleção (e potencialmente de inserção) podem ocorrer virtualmente em qualquer local dentro das unidades quase repetitivas. [00402] Quando as sequências quase repetidas estão todas ligadas na mesma orientação, por exemplo, cabeça à cauda ou vice-versa, a célula não pode distinguir unidades individuais. Conseqüentemente, o processo redutor pode ocorrer ao longo das sequências. Em contraste, quando, por exemplo, as unidades são apresentadas cabeça à cabeça, ao invés de cabeça à cauda, a inversão determina os pontos finais da unidade adjacente de forma que a formação da deleção favorecerá a perda de unidades distintas. Assim, é preferível com o presente método que as sequências estejam na mesma orientação. A orientação aleatória de sequências quase repetidas resultará na perda de eficiênPetição 870170009999, de 15/02/2017, pág. 232/1247
223/788 cia de reaporção, enquanto que a orientação coerente das sequências oferecerá a maior eficiência. Entretanto, embora o fato de possuir menos das sequências contíguas na mesma orientação diminua a eficiência, pode ainda fornecer elasticidade suficiente para a recuperação efetiva de novas moléculas. Os constructos podem ser feitos com as sequências quase repetidas na mesma orientação para permitir maior eficiência.
[00403] As sequências podem ser montadas em uma orientação cabeça à cauda utilizando qualquer um de uma variedade de métodos, incluindo os seguintes:
[00404] Podem ser utilizados iniciadores que incluem uma cabeça poli-A e uma cauda poli-T que quando tornados filamento simples forneceríam orientação. Isto é realizado possuindo as primeiras poucas bases dos iniciadores feitas de RNA e conseqüentemente facilmente removidas com RNaseH.
[00405] Podem ser utilizados iniciadores que incluem sítios de divagem de restrição exclusivos. Vários sítios, uma batería de sequências isoladas e etapas de síntese e de ligação repetidas seriam requeridos.
[00406] As poucas bases internas do iniciador poderíam ser tioladas e uma exonuclease podería ser utilizada para produzir moléculas com cauda de forma apropriada.
[00407] Em algumas modalidades, a recuperação das sequências reagrupadas se baseia na identificação de vetores de clonagem com um índice repetitivo reduzido (RI). As sequências codificadoras reagrupadas podem então ser recuperadas através de amplificação. Os produtos são reclonados e expressos. A recuperação de vetores de clonagem com RI reduzido pode ser realizada através de:
[00408] 1) o uso de vetores mantidos apenas estavelmente quando o constructo tiver a complexidade reduzida.
Petição 870170009999, de 15/02/2017, pág. 233/1247
224/788 [00409] 2) a recuperação física de vetores encurtados através de procedimentos físicos. Neste caso, o vetor de clonagem seria recuperado utilizando procedimentos de isolamento de plasmídeos padronizados e fracionados em relação ao tamanho em um gel de agarose ou coluna com uma faixa de peso molecular baixo utilizando procedimentos padronizados.
[00410] 3) a recuperação de vetores contendo genes interrompidos que podem ser selecionados quando o tamanho do inserto diminui. [00411] 4) o uso de técnicas de seleção direta com um vetor de expressão e a seleção apropriada.
[00412] As sequências codificadoras (por exemplo, genes) de organismos relacionados podem demonstrar um alto grau de homologia e codificar produtos de proteínas bastante diversos. Estes tipos de sequências são particularmente úteis na presente invenção como quase repetições. Entretanto, embora os exemplos ilustrados abaixo demonstrem o reaporção de sequências codificadoras originais aproximadamente idênticas (quase repetições), este processo não está limitado a tais repetições aproximadamente idênticas.
[00413] O exemplo a seguir demonstra um exemplo de método de acordo com a invenção. São descritas as sequências de ácidos nucléicos codificadoras (quase repetições) derivadas de três (3) espécies isoladas. Cada sequência codifica uma proteína com um conjunto distinto de propriedades. Cada uma das sequências difere em um único ou em poucos pares de bases em uma única posição na sequência. As sequências quase repetidas são amplificadas separadamente ou coletivamente e ligadas em montagens aleatórias de forma que todas as permutações e combinações possíveis sejam disponíveis na população de moléculas ligadas. O número de unidades quase repetidas pode ser controlado pelas condições de montagem. O número médio de unidades quase repetidas em um constructo é definido como o ínPetição 870170009999, de 15/02/2017, pág. 234/1247
225/788 dice repetitivo (RI).
[00414] Uma vez formados, os constructos podem ou não ser fracionados por tamanho em um gel de agarose de acordo com protocolos publicados, inseridos em um vetor de clonagem e transfectados em uma célula hospedeira apropriada. As células são então propagadas e o reaporção redutor é realizado. A taxa do processo de reaporção redutor pode ser estimulada através da introdução de danos no DNA se desejado. O fato da redução no RI ser mediada pela formação de deleções entre sequências repetidas através de um mecanismo intramolecular ou mediada por eventos similares à recombinação através de mecanismos intermoleculares é imaterial. O resultado final é um reaporção das moléculas em todas as combinações possíveis. [00415] Opcionalmente, o método compreende a etapa adicional de verificação dos membros da biblioteca do conjunto embaralhado para identificar os membros da biblioteca embaralhados individuais que possuem a capacidade de se ligar ou de outra maneira interagir ou catalisar uma reação particular (tal como um domínio catalítico de uma enzima) com uma macromolécula predeterminada, tal como, por exemplo, um receptor proteináceo, um oligossacarídeo, um virion ou outro composto ou estrutura predeterminada.
[00416] Os polipeptídeos que são identificados partindo de tais bibliotecas podem ser utilizados para finalidades terapêuticas, de diagnóstico, de pesquisa e relacionadas (tais como catalisadores, solutos para aumentar a osmolaridade de uma solução aquosa e similares) e/ou podem ser submetidos a um ou mais ciclos adicionais de embaralhamento e/ou seleção.
[00417] Em outras modalidades, é previsto que antes ou durante a recombinação ou o reaporção, os polinucleotídeos gerados pelo método de acordo com a invenção podem ser submetidos a agentes ou processos que promovem a introdução de mutações nos polinucleotíPetição 870170009999, de 15/02/2017, pág. 235/1247
226/788 deos originais. A introdução de tais mutações aumentaria a diversidade de polinucleotídeos híbridos e polipeptídeos codificados partindo dos mesmos. Os agentes ou os processos que promovem a mutagênese podem incluir, mas não estão limitados a: (+)-CC-1065 ou um análogo sintético tal com (+)-CC-1065-(N3-Adenina (Vide Sun e Hurley, (1992); um aduto de 4'-fluro-4-aminobifenila N-acetilado ou desacetilado capaz de inibir a síntese de DNA (Vide, por exemplo, van de Poli e outros (1992)); ou um aduto de 4-aminobifenila N-acetilado ou desacetilado capaz de inibir a síntese de DNA (Vide também, van de Poli e outros (1992), pp. 751-758); cromo trivalente, um sal de cromo trivalente, um aduto de DNA de hidrocarboneto aromático policíclico (PAH) capaz de inibir a replicação do DNA, tal como 7-bromometilbenz[a]antraceno (BMA), tris(2,3-dibromopropil)fosfato (Tris-BP), 1,2-dibromo-3-cloropropano (DBCP), 2-bromoacroleína (2BA), benzo[a]pireno-7,8-dihidrodiol-9-10-epóxido (BPDE), um sal de halogênio de platina(ll), N-hidróxi-2-amino-3-metilimidazo[4,5-/]-quinolina (Nhidróxi-IQ) e N-hidróxi-2-amino-1 -metil-6-fenilimidazo[4,5-/]-piridina (N-hidróxi-PhlP). Os exemplos de meios para retardar ou interromper a amplificação pela PCR consistem em luz UV (+)-CC-1065 e (+)-CC1065-(N3-Adenina). Os meios particularmente abrangidos são adutos de DNA ou polinucleotídeos que compreendem os adutos de DNA dos polinucleotídeos ou do conjunto de polinucleotídeos, que podem ser liberados ou removidos através de um processo que inclui o aquecimento da solução que compreende os polinucleotídeos antes do processamento adicional.
[00418] Em outras modalidades a invenção está direcionada a um método de produção de proteínas recombinantes que possuem atividade biológica através do tratamento de uma amostra que compreende polinucleotídeos de molde de filamento duplo que codificam uma proteína do tipo selvagem sob condições de acordo com a invenção
Petição 870170009999, de 15/02/2017, pág. 236/1247
227/788 que fornecem a produção de polinucleotídeos híbridos ou reagrupados.
Produção de Variações de Sequências [00419] A invenção fornece ainda métodos adicionais para a produção de variações de sequências das sequências de ácidos nucléicos (tal como enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase) de acordo com a invenção. Em algumas modalidades, a invenção fornece ainda métodos adicionais para isolar enzimas aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase utilizando os ácidos nucléicos e os polipeptídeos de acordo com a invenção. Em algumas modalidades, a invenção fornece variações de uma sequência que codifica uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase (tal como um gene, um cDNA ou uma mensagem) de acordo com a invenção, que podem ser alteradas através de quaisquer meios, incluindo, tais como métodos aleatórios e estocásticos ou métodos não-estocásticos ou de evolução direcionada, como descrito anteriormente.
[00420] As variações isoladas podem ser as que ocorrem naturalmente. A variação pode também ser criada in vitro. As variações podem ser criadas utilizando técnicas de engenharia genética tais como mutagênese direcionada ao sítio, mutagênese química aleatória, procedimentos de deleção com Exonuclease III e técnicas de clonagem padronizadas. Alternativamente, tais variações, fragmentos, análogos ou derivados podem ser criados utilizando síntese química ou procedimentos de modificação. Outros métodos de produção de variações também são familiares aos versados na técnica. Estes incluem procedimentos em que as sequências de ácidos nucléicos obtidas partindo de isolados naturais são modificadas para gerar ácidos nucléicos que codificam polipeptídeos que possuem características que aumentam seu valor em aplicações industriais ou de laboratório. Em tais procediPetição 870170009999, de 15/02/2017, pág. 237/1247
228/788 mentos, um grande número de sequências variantes que possuem uma ou mais diferenças de nucleotídeos em relação à sequência obtida partindo do isolado natural é gerado e caracterizado. Estas diferenças de nucleotídeos podem resultar em alterações de aminoácidos em relação aos polipeptídeos codificados pelos ácidos nucléicos provenientes dos isolados naturais.
[00421] Por exemplo, as variações podem ser criadas utilizando a PCR propensa a erros. Em algumas modalidades de PCR propensa a erros, a PCR é realizada sob condições em que a fidelidade de cópias da DNA polimerase é baixa, de forma que uma taxa alta de mutações pontuais é obtida ao longo do comprimento total do produto da PCR. A PCR propensa a erros é descrita, tal como em Leung, D.W. e outros, (1989) Technique 1:11-15; e Caldwell, R.C. & Joyce, G.F., (1992) PCR Methods Applic. 2:28-33. Sucintamente, em tais procedimentos, os ácidos nucléicos que serão submetidos à mutagênese são misturados com os iniciadores da PCR, o tampão de reação, MgCI2, MnCI2, Taq polimerase e uma concentração apropriada de dNTPs para atingir uma taxa alta de mutação pontual ao longo do comprimento total do produto da PCR. Por exemplo, a reação pode ser realizada utilizando 20 fmoles de ácido nucléico que será submetido à mutagênese, 30 pmoles de cada iniciador da PCR, um tampão de reação compreendendo 50 mM de KCI, 10 mM de Tris HCI (pH 8,3) e 0,01% de gelatina, 7 mM de MgCI2, 0,5 mM de MnCI2, 5 unidades de Taq polimerase, 0,2 mM de dGTP, 0,2 mM de dATP, 1 mM de dCTP e 1 mM de dTTP. A PCR pode ser realizada durante 30 ciclos de 94 Ό durante 1 minuto, 45Ό durante 1 minuto e 72Ό durante 1 minuto. Entretanto, será considerado que estes parâmetros podem ser variados quando apropriado. Os ácidos nucléicos mutagenizados são clonados em um vetor apropriado e as atividades dos polipeptídeos codificados pelos ácidos nucléicos mutagenizados são avaliadas.
Petição 870170009999, de 15/02/2017, pág. 238/1247
229/788 [00422] Em algumas modalidades, as variações são criadas utilizando mutagênese direcionada por oligonucleotídeo para gerar mutações específicas ao sítio em qualquer DNA clonado de interesse. A mutagênese com oligonucleotídeo é descrita, tal como em ReidhaarOlson (1988) Science 241:53-57. Sucintamente, em tais procedimentos um grande número de oligonucleotídeos de filamento duplo que carregam uma ou mais mutações que serão introduzidas no DNA clonado é sintetizado e inserido do DNA clonado que será submetido à mutagênese. Em algumas modalidades, os clones contendo o DNA mutagenizado são recuperados, expressos e as atividades do polipeptídeo codificado ali são avaliadas.
[00423] Um outro método para produzir variações é a PCR de montagem. A PCR de montagem envolve a montagem de um produto da PCR proveniente de uma mistura de fragmentos de DNA pequenos. Um grande número de reações da PCR diferentes ocorre em paralelo no mesmo frasco, com os produtos de uma reação iniciando os produtos de uma outra reação. A PCR de montagem é descrita na técnica, tal como na Patente U.S. N°5.965.408.
[00424] Em algumas modalidades, a mutagênese por PCR sexual é um exemplo de método de produção de variações de acordo com a invenção. Em algumas modalidades de mutagênese por PCR sexual a recombinação homóloga forçada ocorre entre moléculas de DNA de sequência de DNA diferente, mas altamente relacionada in vitro, como um resultado da fragmentação aleatória da molécula de DNA com base na homologia de sequência, seguida pela fixação do crossover através da extensão do iniciador em uma reação da PCR. A mutagênese por PCR sexual é descrita, tal como em Stemmer (1994) Proc. Natl. Acad. Sei. USA 91:10747-10751. Sucintamente, em tais procedimentos um grande número de ácidos nucléicos que será recombinado é digerido com DNase para gerar fragmentos que possuem um tamaPetição 870170009999, de 15/02/2017, pág. 239/1247
230/788 nho médio de 50-200 nucleotídeos. Os fragmentos do tamanho desejado são purificados e ressuspensos em uma mistura de PCR. A PCR é realizada sob condições que facilitam a recombinação entre os fragmentos de ácidos nucléicos. Por exemplo, a PCR pode ser realizada através da ressuspensão dos fragmentos purificados a uma concentração de 10-30 ng/pL em uma solução de 0,2 mM de cada dNTP, 2,2 mM de MgCI2, 50 mM de KCI, 10 mM de Tris HCI, pH 9,0 e 0,1% de Triton X-100. 2,5 unidades de Taq polimerase por 100 pl_ de mistura de reação são adicionadas e a PCR é realizada utilizando o regime a seguir: 94Ό durante 60 segundos, 94Ό durante 30 s egundos, 5055Ό durante 30 segundos, 72Ό durante 30 segundos (30-45 vezes) e 72Ό durante 5 minutos. Entretanto, será considerado que estes parâmetros podem ser variados quando apropriado. Em algumas modalidades, os oligonucleotídeos podem ser incluídos nas reações da PCR. Em outras modalidades, o fragmento de Klenow da DNA polimerase I pode ser utilizado em um primeiro conjunto de reações da PCR e a Taq polimerase pode ser utilizada em um conjunto subseqüente de reações da PCR. As sequências recombinantes são isoladas e as atividades dos polipeptídeos que codificam são avaliadas.
[00425] Em algumas modalidades, são criadas variações através de mutagénese in vivo. Em algumas modalidades, as mutações aleatórias em uma sequência de interesse são geradas através da propagação da sequência de interesse em uma cepa bacteriana, tal como uma cepa de E. coli, que carrega mutações em uma ou mais das vias de reparo do DNA. Tais cepas de mutação possuem uma taxa de mutação aleatória maior que um parental do tipo selvagem. A propagação do DNA em uma destas cepas irá eventualmente gerar mutações dentro do DNA. As cepas de mutação adequadas para uso na mutagênese in vivo são descritas na Publicação PCT N°W0 91/16427, publicada em 31 de outubro de 1991, intitulada Methods for Phenotype CreaPetição 870170009999, de 15/02/2017, pág. 240/1247
231/788 tion from Multiple Gene Populations.
[00426] As variações também podem ser geradas utilizando mutagênese com cassete. Na mutagênese com cassete uma pequena região de uma molécula de DNA de filamento duplo é substituída por um cassete de oligonucleotídeo sintético que difere da sequência nativa. O oligonucleotídeo contém freqüentemente sequência nativa completamente e/ou parcialmente aleatória.
[00427] A mutagênese de conjunto recursivo pode também ser utilizada para gerar variações. A mutagênese de conjunto recursivo é um algoritmo para a engenharia de proteínas (mutagênese de proteínas) desenvolvido para produzir populações diversas de mutantes relacionados fenotipicamente cujos membros diferem em relação à sequência de aminoácidos. Este método utiliza um mecanismo de retroinformação para controlar rodadas sucessivas de mutagênese com cassete combinatória. A mutagênese de conjunto recursivo é descrita, tal como em Arkin (1992) Proc. Natl. Acad. Sei. USA 89:7811-7815.
[00428] Em algumas modalidades, as variações são criadas utilizando mutagênese de conjunto exponencial. A mutagênese de conjunto exponencial é um processo para gerar bibliotecas combinatórias com uma alta porcentagem de mutantes exclusivos e funcionais, em que grupos pequenos de resíduos são escolhidos aleatoriamente em paralelo para identificar, em cada posição alterada, aminoácidos que levam a proteínas funcionais. A mutagênese de conjunto exponencial é descrita, tal como em Delegrave (1993) Biotechnology Res. 11:15481552. As mutagêneses aleatória e direcionada ao sítio são descritas, tal como em Arnold (1993) Current Opinion in Biotechnology 4:450455.
[00429] Em algumas modalidades, as variações são criadas utilizando procedimentos de embaralhamento em que partes de um grande número de ácidos nucléicos que codificam polipeptídeos distintos
Petição 870170009999, de 15/02/2017, pág. 241/1247
232/788 são fundidas juntas para criar sequências de ácidos nucléicos quiméricas que codificam polipeptídeos quiméricos que são descritos na Patente U.S. N°5.965.408, depositada em 9 de julho de 1996, intitulada. Method of DNA Reassembly by Interrupting Synthesis e na Patente U.S. N° 5.939.250, depositada em 22 de maio de 1996, intitulada, Production of Enzymes Having Desired Activities by Mutagenesis. [00430] As variações dos polipeptídeos de acordo com a invenção podem ser variações em que um ou mais dos resíduos de aminoácidos dos polipeptídeos das sequências de acordo com a invenção são substituídos por um resíduo de aminoácido conservado ou não conservado (em algumas modalidades, um resíduo de aminoácido conservado) e tal resíduo de aminoácido substituído pode ou não ser um codificado pelo código genético.
[00431] Em algumas modalidades, as substituições conservativas são aquelas que substituem um certo aminoácido em um polipeptídeo por um outro aminoácido de características similares. Em algumas modalidades, as substituições conservativas de acordo com a invenção compreendem as substituições a seguir: substituições de um aminoácido alifático tal como Alanina, Valina, Leucina e Isoleucina por um outro aminoácido alifático; substituição de uma Serina por uma Treonina ou vice-versa; substituição de um resíduo ácido tal como ácido Apártico e ácido Glutâmico por um outro resíduo ácido; substituição de um resíduo que carrega um grupo amida, tal como Asparagina e Glutamina, por um outro resíduo que carrega um grupo amida; troca de um resíduo básico tal como Lisina e Arginina por um outro resíduo básico; e substituição de um resíduo aromático tal como Fenilalanina, Tirosina por um outro resíduo aromático.
[00432] Outras variações são aquelas em que um ou mais dos resíduos de aminoácidos de um polipeptídeo de acordo com a invenção incluem um grupo substituto. Em algumas modalidades, outras variaPetição 870170009999, de 15/02/2017, pág. 242/1247
233/788 ções são aquelas em que o polipeptídeo está associado com um outro composto, tal como um composto para aumentar a meia-vida do polipeptídeo (por exemplo, polietileno glicol). Variações adicionais são aquelas em que aminoácidos adicionais são fundidos ao polipeptídeo, tal como uma sequência líder, uma sequência secretora, uma sequência de pró-proteína ou uma sequência que facilita a purificação, o enriquecimento ou a estabilização do polipeptídeo.
[00433] Em algumas modalidades, os fragmentos, os derivados e os análogos mantêm a mesma função ou atividade biológica que os polipeptídeos de acordo com a invenção e sequências substancialmente idênticas aos mesmos. Em outras modalidades, o fragmento, o derivado ou o análogo inclui uma pró-proteína, de forma que o fragmento, o derivado ou o análogo pode ser ativado através da divagem da parte de pró-proteína para produzir um polipeptídeo ativo. Otimização de Códons para Atingir Altos Níveis de Expressão de Proteína em Células Hospedeiras [00434] A invenção fornece métodos para modificar ácidos nucléicos que codifica uma enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase para modificar (tal como para otimizar) o uso de códons. Em algumas modalidades, a invenção fornece métodos para a modificação de códons em um ácido nucléico que codifica uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase para aumentar ou diminuir sua expressão em uma célula hospedeira. Em algumas modalidades, a invenção fornece ainda ácidos nucléicos que codificam uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase modificada para aumentar sua expressão em uma célula hospedeira, a enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase modificada dessa maneira e métodos de produção de enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase. O método compreende a idenPetição 870170009999, de 15/02/2017, pág. 243/1247
234/788 tificação de um códon não preferido ou menos preferido no ácido nucléico que codifica a enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase e a substituição de um ou mais destes códons não preferidos ou menos preferidos por um códon preferido que codifica o mesmo aminoácido que o códon substituído e pelo menos um códon não preferido ou menos preferido no ácido nucléico foi substituído por um códon preferido que codifica o mesmo aminoácido. Um códon preferido é um códon super-representado nas sequências codificadoras nos genes na célula hospedeira e um códon não preferido ou menos preferido é um códon sub-representado nas sequências codificadoras nos genes na célula hospedeira.
[00435] As células hospedeiras para a expressão dos ácidos nucléicos, cassetes e vetores de expressão de acordo com a invenção incluem bactérias, levedura, fungos, células vegetais, células de inseto e células de mamífero (vide a discussão, acima). Assim, a invenção fornece métodos para a otimização do uso de códons em todas estas células, ácidos nucléicos com códons alterados e polipeptídeos produzidos pelos ácidos nucléicos com códons alterados. Os exemplos de células hospedeiras incluem bactérias gram negativas, tal como Escherichia colr, bactérias gram positivas, tais como Streptomyces sp., Lactobacillus gasseri, Lactococcus lactis, Lactococcus cremoris, Bacillus subtilis, Bacillus cereus. Os exemplos de células hospedeiras incluem ainda organismos eucarióticos, tais como várias leveduras, tais como Saccharomyces sp., incluindo Saccharomyces cerevisiae, Schizosaccharomyces pombe, Pichia pastoris e Kluyveromyces lactis, Hansenula polimorpha, Aspergillus nigere células e linhagens de células de mamífero e células e linhagens de células de inseto. Assim, a invenção inclui ainda ácidos nucléicos e polipeptídeos otimizados em relação à expressão nestes organismos e espécies.
[00436] Por exemplo, os códons de um ácido nucléico que codifica
Petição 870170009999, de 15/02/2017, pág. 244/1247
235/788 uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase isolado de uma célula bacteriana são modificados de forma que o ácido nucléico é expresso de forma ótima em uma célula bacteriana diferente da bactéria da qual a enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase foi derivada, uma levedura, um fungo, uma célula vegetal, uma célula de inseto ou uma célula de mamífero. Os métodos para a otimização de códons são bemconhecidos na técnica, vide a Patente U.S. N° 5.795.737; Baca (2000) Int. J. Parasitol. 30:113-118; Hale (1998) Protein Expr. Purif. 12:185188; Narum (2001) Infect. Immun. 69:7250-7253. Vide também Narum (2001) Infect. Immun. 69:7250-7253, que descreve a otimização de códons em sistemas de camundongo; Outchkourov (2002) Protein Expr. Purif. 24:18-24, que descreve a otimização de códons em levedura; Feng (2000) Biochemistry 39:15399-15409, que descreve a otimização de códons em E. colr, Humphreys (2000) Protein Expr. Purif. 20:252-264, que descreve a otimização do uso de códons que afeta a secreção em E. coli.
Animais não-humanos Transgênicos [00437] A invenção fornece animais não-humanos transgênicos que compreendem um ácido nucléico, um polipeptídeo (tal como uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase), um cassete ou um vetor de expressão ou uma célula transfectada ou transformada de acordo com a invenção. Em algumas modalidades, a invenção fornece ainda métodos de produção e de utilização destes animais não-humanos transgênicos.
[00438] Os animais não-humanos transgênicos podem ser, tais como cães, cabras, coelhos, ovelhas, cavalos, peixes, porcos (incluindo todos os suínos, porcos castrados e animais relacionados), vacas, ratos e camundongos, que compreendem os ácidos nucléicos de acordo com a invenção. Estes animais podem ser utilizados, tal como modePetição 870170009999, de 15/02/2017, pág. 245/1247
236/788 los in vivo para estudar a atividade da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase enzima ou como modelos para selecionar agentes que alteram a atividade da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase in vivo. As sequências codificadoras para os polipeptídeos que serão expressos nos animais não-humanos transgênicos podem ser planejadas para serem constitutivas ou sob o controle de fatores reguladores da transcrição específicos ao tecido, específicos ao desenvolvimento ou que podem ser induzidos.
[00439] Os animais não-humanos transgênicos podem ser planejados e gerados utilizando qualquer método conhecido na técnica; vide as Patentes U.S. N— 6.211.428; 6.187.992; 6.156.952; 6.118.044; 6.111.166; 6.107.541; 5.959.171; 5.922.854; 5.892.070; 5.880.327; 5.891.698; 5.639.940; 5.573.933; 5.387.742; 5.087.571, que descrevem a produção e a utilização de células e óvulos transformados e camundongos, ratos, coelhos, ovelhas, porcos, frangos, cabras, peixes e vacas transgênicos. Vide também, tal como Pollock (1999) J. Immunol. Methods 231:147-157, que descreve a produção de proteínas recombinantes no leite de animais leiteiros transgênicos; Baguisi (1999) Nat. Biotechnol. 17:456-461, que demonstra a produção de cabras transgênicas. A Patente U.S. N° 6.211.428, descreve a produção e a utilização de mamíferos não-humanos transgênicos que expressam em seus cérebros um constructo de ácido nucléico que compreende uma sequência de DNA. A Patente U.S. N° 5.387.742, descreve a injeção de sequências de DNA recombinantes clonadas ou sintéticas nos óvulos fertilizados de camundongos, a implantação dos óvulos injetados em fêmeas pseudoprenhes e o crescimento até o termpo de camundongos transgênicos. A Patente U.S. N° 6.187.9 92, descreve a produção e a utilização de um camundongo transgênico.
[00440] Animais nocauteados também podem ser utilizados para
Petição 870170009999, de 15/02/2017, pág. 246/1247
237/788 a prática dos métodos de acordo com a invenção. Por exemplo, em algumas modalidades, os animais transgênicos ou modificados de acordo com a invenção compreendem um animal nocauteado, tal como um camundongo nocauteado, engenheirado para não expressar um gene endógeno, que é substituído por um gene que expressa uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase de acordo com a invenção ou uma proteína de fusão que compreende uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase de acordo com a invenção.
Plantas e Sementes Transgênicas [00441] A invenção fornece plantas e sementes transgênicas que compreendem um ácido nucléico, um polipeptídeo (tal como uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase), um cassete ou um vetor de expressão ou uma célula transfectada ou transformada de acordo com a invenção. A invenção fornece ainda produtos ou subprodutos vegetais, tais como frutos, óleos, sementes, folhas, extratos e similares, incluindo qualquer parte da planta, que compreende um ácido nucléico e/ou um polipeptídeo (tal como uma xilanase) da invenção, tal como em que o ácido nucléico ou o polipeptídeo da invenção é heterólogo à planta, à parte da planta, à semente etc. A planta transgênica (que inclui partes da planta, frutos, sementes etc.) pode ser dicotiledônea (uma dicotiledônea) ou monocotiledônea (uma monocotiledônea). Em algumas modalidades, a invenção fornece ainda métodos de produção e de utilização destas plantas e sementes transgênicas. A planta ou a célula vegetal transgênica que expressa um polipeptídeo da presente invenção pode ser construída de acordo com qualquer método conhecido na técnica. Vide, por exemplo, a Patente U.S. N°6.309.872.
[00442] Os ácidos nucléicos e os constructos de expressão de acordo com a invenção podem ser introduzidos em uma célula vegetal
Petição 870170009999, de 15/02/2017, pág. 247/1247
238/788 através de qualquer meio. Por exemplo, os ácidos nucléicos ou os constructos de expressão podem ser introduzidos no genoma de um hospedeiro vegetal desejado ou os ácidos nucléicos ou os constructos de expressão podem ser epissomos. A introdução no genoma de uma planta desejada pode ser tal que a produção da enzima aldolase do hospedeiro, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase é regulada por elementos de controle da transcrição ou da tradução endógenos. Em algumas modalidades, a invenção fornece ainda plantas nocauteadas em que a inserção da sequência gênica através de, tal como recombinação homóloga, interrompeu a expressão do gene endógeno. Os meios para gerar plantas nocauteadas são bemconhecidos na técnica, vide Strepp (1998) Proc Natl. Acad. Sei. USA 95:4368-4373; Miao (1995) Plant J 7:359-365. Vide a discussão sobre plantas transgênicas, abaixo.
[00443] Os ácidos nucléicos de acordo com a invenção podem ser utilizados para conferir características desejadas em essencialmente qualquer planta, tal como em plantas que produzem amido, tais como batata, tomate, soja, beterrabas, milho, trigo, arroz, cevada e similares. Os ácidos nucléicos de acordo com a invenção podem ser utilizados para manipular vias metabólicas de uma planta com a finalidade de otimizar ou alterar a expressão da enzima aldolase do hospedeiro, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase. Os ácidos nucléicos de acordo com a invenção podem alterar os níveis de expressão ou de atividade ou alterar características de compostos ou de enzimas produzidas naturalmente em uma planta. Alternativamente, uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase de acordo com a invenção pode ser utilizada na produção de uma planta transgênica para produzir um composto que não é naturalmente produzido por tal planta. Isto pode diminuir os custos da produção ou criar um novo produto.
Petição 870170009999, de 15/02/2017, pág. 248/1247
239/788 [00444] Em algumas modalidades, a primeira etapa na produção de uma planta transgênica envolve a produção de um constructo de expressão para a expressão em uma célula vegetal. Estas técnicas são bem-conhecidas na técnica. Podem incluir a seleção e a clonagem de um promotor, uma sequência codificadora para facilitar a ligação eficiente de ribossomos ao mRNA e a seleção das sequências terminadoras do gene apropriadas. Um exemplo de promotor constitutivo é CaMV35S, proveniente do vírus mosaico da couve-flor, que resulta geralmente em um alto grau de expressão em plantas. Outros promotores são mais específicos e respondem a estímulos no ambiente interno ou externo da planta. Um exemplo de promotor que pode ser induzido pela luz é o promotor do gene cab, que codifica a proteína de ligação com clorofilas a/b principal.
[00445] Em algumas modalidades, o ácido nucléico é modificado para atingir maior expressão em uma célula vegetal. Por exemplo, é provável que uma sequência de acordo com a invenção tenha uma maior porcentagem de pares de nucleotídeos A-T comparada com a observada em uma planta, que algumas preferem pares de nucleotídeos G-C. Portanto, os nucleotídeos A-T na sequência codificadora podem ser substituídos por nucleotídeos G-C sem alterar significativamente a sequência de aminoácidos para aumentar a obtenção do produto gênico em células vegetais.
[00446] Um gene marcador selecionável pode ser adicionado no constructo gênico com a finalidade de identificar células ou tecidos vegetais que tiveram o transgene integrado de forma bem-sucedida. Este pode ser necessário porque conseguir a incorporação e a expressão de genes em células vegetais é um evento raro, que ocorre apenas em um baixo percentual dos tecidos e das células alvos. Os genes marcadores selecionáveis codificam proteínas que fornecem resistência a agentes que são normalmente tóxicos para as plantas, tais como antiPetição 870170009999, de 15/02/2017, pág. 249/1247
240/788 bióticos ou herbicidas. Somente as células vegetais que tiveram o gene marcador selecionável integrado sobreviverão quando cultivadas em um meio contendo o antibiótico ou o herbicida apropriado. Como para outros genes inseridos, os genes marcadores também requerem sequências promotoras e de término para o funcionamento apropriado. [00447] Em algumas modalidades, a produção de plantas ou sementes transgênicas compreende a incorporação de sequências de acordo com a invenção e, opcionalmente, genes marcadores em um constructo de expressão alvo (tal como um plasmídeo), junto com o posicionamento do promotor e das sequências terminadoras. Isto pode envolver a transferência do gene modificado para dentro da planta através de um método adequado. Por exemplo, um constructo pode ser introduzido diretamente no DNA genômico da célula vegetal utilizando técnicas tais como a eletroporação e a microinjeção de protoplastos da célula vegetal ou os constructos podem ser introduzidas diretamente no tecido vegetal utilizando métodos de balística, tal como o bombardeio de partículas de DNA. Por exemplo, vide Christou (1997) Plant Mol. Biol. 35:197-203; Pawlowski (1996) Mol. Biotechnol. 6:17-30; Klein (1987) Nature 327:70-73; Takumi (1997) Genes Genet. Syst. 72:63-69, que discutem o uso do bombardeio de partículas para introduzir transgenes no trigo; e Adam (1997) supra, para o uso do bombardeio de partículas para introduzir YACs em células vegetais. Por exemplo, Rinehart (1997) supra, utilizou o bombardeio de partículas para gerar plantas de algodão transgênicas. O aparelho para acelerar as partículas é descrito na Patente U.S. N°5.015.580; e, instrumento de aceleração de partículas Bio-Rad (Biolistics) PDS-2000 disponível comercial mente (Bio-Rad, Hercules, CA); vide também, John, Patente U.S. N° 5.608.148; e Ellis, Patente U.S. N° 5.681.730, que descrevem a transformação mediada por partículas de gimnospermas. [00448] Em algumas modalidades, os protoplastos podem ser imoPetição 870170009999, de 15/02/2017, pág. 250/1247
241/788 bilizados e injetados com ácidos nucléicos, tal como um constructo de expressão. Embora a regeneração da planta partindo de protoplastos não é fácil em cereais, a regeneração da planta é possível em legumes utilizando embriogênese somática partindo de calos derivados de protoplastos. Os tecidos organizados podem ser transformados com DNA nu utilizando a técnica de pistola gênica, em que o DNA é revestido em microprojéteis de tungstênio, atirado 1/100- o tamanho das células, que carrega o DNA profundamente para dentro das células e das organelas. O tecido transformado é então induzido a se regenerar, geralmente através da embriogênese somática. Esta técnica foi bemsucedida em várias espécies de cereais incluindo milho e arroz.
[00449] Os ácidos nucléicos, tais como constructos de expressão, também podem ser introduzidos nas células vegetais utilizando vírus recombinantes. As células vegetais podem ser transformadas utilizando vetores virais, tais como vetores derivados do vírus mosaico do tabaco (Rouwendal (1997) Plant Mol. Biol. 33:989-999), vide Porta (1996) Use of viral replicons for the expression of genes in plants, Mol. Biotechnol. 5:209-221.
[00450] Alternativamente, os ácidos nucléicos, tal como um constructo de expressão, podem ser combinados com regiões flanqueadoras de T-DNA adequadas e introduzidos em um vetor de hospedeiro de Agrobacterium tumefaciens convencional. As funções de virulência do hospedeiro Agrobacterium tumefaciens irão direcionar a inserção do constructo e do marcador adjacente no DNA da célula vegetal quando a célula for infectada pelas bactérias. As técnicas de transformação mediada por Agrobacterium tumefaciens, incluindo o desarmamento e o uso de vetores binários, são bem-descritas na literatura científica. Vide Horsch (1984) Science 233:496-498; Fraley (1983) Proc. Natl. Acad. Sei. USA 80:4803 (1983); Gene Transfer to Plants, Potrykus, ed. (Springer-Verlag, Berlin 1995). O DNA em uma célula de
Petição 870170009999, de 15/02/2017, pág. 251/1247
242/788
A. tumefaciens fica contido no cromossomo bacteriano assim como em uma outra estrutura conhecida como um plasmídeo Ti (indutor de tumor). O plasmídeo Ti contém um filamento de DNA denominado TDNA (~20 kb de comprimento) que é transferido para a célula vegetal no processo de infecção e uma série de genes vir (virulência) que direcionam o processo de infecção. A. tumefaciens pode infectar somente uma planta através de ferimentos: quando uma raiz ou um caule de planta é ferido, emite certos sinais químicos, em resposta aos quais, os genes vir de A. tumefaciens se tornam ativados e direcionam uma série de eventos necessários para a transferência do T-DNA do plasmídeo Ti para o cromossomo da planta. O T-DNA então entra na célula vegetal através do ferimento. Uma especulação é que o T-DNA aguarda até que o DNA da planta seja replicado ou transcrito, então se insere no DNA da planta exposto. Para utilizar A. tumefaciens como um vetor de transgene, a seção indutora de tumor do T-DNA tem que ser removida, enquanto são mantidas as regiões de borda do T-DNA e os genes vir. O transgene é então inserido entre as regiões de borda do T-DNA, quando é transferido para a célula vegetal e se torna integrado nos cromossomos da planta.
[00451] A invenção fornece a transformação de plantas monocotiledôneas utilizando os ácidos nucléicos de acordo com a invenção, incluindo cereais importantes, vide Hiei (1997) Plant Mol. Biol. 35:205-218. Vide também, Horsch, Science (1984) 233:496; Fraley (1983) Proc. Natl. Acad. Sei USA 80:4803; Thykjaer (1997) supra; Park (1996) Plant Mol. Biol. 32:1135-1148, que discutem a integração do T-DNA no DNA genômico. Vide também D'Halluin, Patente U.S. N° 5.712.135, que descreve um processo para a integração estável de um DNA que compreende um gene que é funcional em uma célula de um cereal ou em outra planta monocotiledônea.
[00452] Em algumas modalidades, a terceira etapa envolve a selePetição 870170009999, de 15/02/2017, pág. 252/1247
243/788 ção e a regeneração de plantas inteiras capazes de transmitir o gene alvo incorporado para a geração seguinte. Tais técnicas de regeneração podem utilizar a manipulação de certos fitohormônios em um meio de cultura de tecido. Em algumas modalidades, o método utiliza um marcador de biocida e/ou de herbicida que foi introduzido junto com as sequências de nucleotídeos desejadas. A regeneração da planta partindo de protoplastos cultivados é descrita em Evans e outros, Protoplasts Isolation and Culture, Handbook of Plant Cell Culture, pp. 124176, MacMillilan Publishing Company, Nova Iorque, 1983; e Binding, Regeneration ofPlants, Plant Protoplasts, pp. 21-73, CRC Press, Boca Raton, 1985. A regeneração também pode ser obtida partindo de calos, explantes, órgãos de plantas ou partes dos mesmos. Tais técnicas de regeneração são descritas de forma geral em Klee (1987) Ann. Rev. of Plant Phys. 38:467-486. Para a obtenção de plantas inteiras partindo de tecidos transgênicos tais como embriões imaturos, estes podem ser cultivados sob condições ambientais controlados em uma série de meios contendo nutrientes e hormônios, um processo conhecido como cultura de tecido. Uma vez que plantas inteiras são geradas e produzem semente, começa a avaliação da progênie.
[00453] Em algumas modalidades, após o cassete de expressão ser incorporado de forma estável em plantas transgênicas, este pode ser introduzido em outras plantas através de cruzamento sexual. Qualquer um de um número de técnicas de cruzamento padronizadas pode ser utilizado, dependendo da espécie que será cruzada. Devido ao fato de que a expressão transgênica dos ácidos nucléicos de acordo com a invenção leva a alterações fenotípicas, as plantas que compreendem os ácidos nucléicos recombinantes de acordo com a invenção podem ser cruzadas sexualmente com uma segunda planta para a obtenção de um produto final. Assim, a semente de acordo com a invenção pode ser derivada de um cruzamento entre duas plantas
Petição 870170009999, de 15/02/2017, pág. 253/1247
244/788 transgênicas de acordo com a invenção ou de um cruzamento entre uma planta de acordo com a invenção e uma outra planta. Os efeitos desejados (tal como a expressão dos polipeptídeos de acordo com a invenção para produzir uma planta em que o comportamento de florescimento é alterado) podem ser aumentados quando ambas as plantas parentais expressam os polipeptídeos (tal como uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase) de acordo com a invenção. Os efeitos desejados podem ser passados para gerações de plantas futuras através de meios de propagação padronizados.
[00454] Em algumas modalidades, os ácidos nucléicos e os polipeptídeos de acordo com a invenção são expressos em ou inseridos em qualquer planta ou semente. As plantas transgênicas de acordo com a invenção podem ser dicotiledôneas ou monocotiledôneas. Os exemplos de plantas transgênicas monocotiledôneas de acordo com a invenção são gramíneas, tais como capim do prado (capim azul, Poa), gramínea de forragem tal como festuca, Lolium, gramínea temperada, tal como Agrostis e cereais, tais como trigo, aveia, centeio, cevada, arroz, sorgo e milho. Os exemplos de plantas transgênicas dicotiledôneas de acordo com a invenção são tabaco, legumes, tais como tremoceiros, batata, beterraba de açúcar, ervilha, feijão e soja e plantas crucíferas (família Brassicaceae), tais como couve-flor, semente de colza e o organismo modelo intimamente relacionado Arabidopsis thaliana. Assim, as plantas e as sementes transgênicas de acordo com a invenção incluem uma faixa ampla de plantas, que inclui, mas não está limitada a espécies dos gêneros Anacardium, Arachis, Asparagus, Atropa, Avena, Brassica, Citrus, Citrullus, Capsicum, Carthamus, Cocos, Coffea, Cucumis, Cucurbita, Daucus, Elaeis, Fragaria, Glicina, Gossypium, Helianassim, Heterocallis, Hordeum, Hyoscyamus, Lactuca, Linum, Lolium, Lupinus, Lycopersicon, Malus, Manihot, Majorana,
Petição 870170009999, de 15/02/2017, pág. 254/1247
245/788
Medicago, Nicotiana, Olea, Oryza, Panieum, Pannisetum, Persea, Phaseolus, Pistachia, Pisum, Pyrus, Prunus, Raphanus, Ricinus, Secale, Senecio, Sinapis, Solanum, Sorghum, Theobromus, Trigonella, Triticum, Vicia, Vitis, Vigna e Zea.
[00455] Em modalidades alternativas, os ácidos nucléicos de acordo com a invenção são expressos em plantas que contêm células fibrosas, que incluem, tais como algodão, árvore do algodão de seda (Kapok, Ceiba pentandra), salgueiro do deserto, arbusto do creosoto, Eurotia lanata, pau de balsa, rami, Hibiscus cannabinus, cânhamo, vinagreira, juta, sisal abacá e linho. Em modalidades alternativas, as plantas transgênicas de acordo com a invenção podem ser membros do gênero Gossypium, incluindo membros de qualquer espécie de Gossypium, tal como G. arboreunr, G. herbaceum, G. barbadense e G. hirsutum.
[00456] A invenção fornece ainda plantas transgênicas que serão utilizadas para produzir grandes quantidades dos polipeptídeos (tal como uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase ou anticorpo) de acordo com a invenção. Por exemplo, vide Palmgren (1997) Trends Genet. 13:348; Chong (1997) Transgenic Res. 6:289-296 (que produz proteína do leite humano beta-caseína em plantas transgênicas de batata utilizando um promotor da manopina sintase (mas1',2') bidirecional que pode ser induzido por auxina com métodos de transformação com discos foliares mediada por Agrobacterium tumefaciens).
[00457] Utilizando procedimentos conhecidos, um versado na técnica pode selecionar plantas de acordo com a invenção através da detecção do aumento ou da diminuição do mRNA ou da proteína do transgene em plantas transgênicas. Os meios para detectar e quantificar os mRNAs ou as proteínas são bem-conhecidos na técnica. Polipeptídeos e Peptídeos
Petição 870170009999, de 15/02/2017, pág. 255/1247
246/788 [00458] Em algumas modalidades, A presente invenção refere-se a polipeptídeos isolados, sintéticos ou recombinantes que possuem uma identidade de sequência (tal como pelo menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%,
63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%,
75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%,
87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%,
99% ou mais ou identidade ou homologia de sequência completa (100%)) a uma sequência de acordo com a invenção, tal como proteínas que possuem uma sequência que é apresentada na SEQ ID NO:2,
SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ
D
NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID
NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID
NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID
NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID
NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID
NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID
NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID
NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID
NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID
NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID
NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID
NO:100, SEQ ID NO:102, NO:108, SEQ ID NO:110, NO:116, SEQ ID NO:118, NO:124, SEQ ID NO:126, NO:132, SEQ ID NO:134, NO:140, SEQ ID NO:142, NO:148, SEQ ID NO:150, NO:156, SEQ ID NO:158,
SEQ ID NO:104, SEQ
SEQ ID NO:112, SEQ
SEQ ID NO:120, SEQ
SEQ ID NO:128, SEQ
SEQ ID NO:136, SEQ
SEQ ID NO:144, SEQ
SEQ ID NO:152, SEQ
SEQ ID NO:160, SEQ
D NO:106, SEQ D NO:114, SEQ D NO:122, SEQ D NO:130, SEQ D NO:138, SEQ D NO:146, SEQ D NO:154, SEQ D NO:162, SEQ
D
D
D
D
D
Petição 870170009999, de 15/02/2017, pág. 256/1247
247/788
NO:164, SEQ ΝΟ:172, SEQ ΝΟ:180, SEQ ΝΟ:188, SEQ ΝΟ:196, SEQ ΝΟ:204, SEQ ΝΟ:212, SEQ ΝΟ:220, SEQ ΝΟ:228, SEQ ΝΟ:236, SEQ ΝΟ:244, SEQ ΝΟ:252, SEQ ΝΟ:260, SEQ ΝΟ:268, SEQ ΝΟ:276, SEQ ΝΟ:284, SEQ ΝΟ:292, SEQ Ν0:300, SEQ ΝΟ:308, SEQ ΝΟ:316, SEQ ΝΟ:324, SEQ
ID NO:166, SEQ ID NO:174, SEQ ID NO:182, SEQ ID NO:190, SEQ ID NO:198, SEQ ID NO:206, SEQ ID NO:214, SEQ ID NO:222, SEQ ID NO:230, SEQ ID NO:238, SEQ ID NO:246, SEQ ID NO:254, SEQ ID NO:262, SEQ ID NO:270, SEQ ID NO:278, SEQ ID NO:286, SEQ ID NO:294, SEQ ID NO:302, SEQ ID NO:310, SEQ ID NO:318, SEQ ID NO:326, SEQ
ID NO:328, SEQ
NO:332 ou SEQ ID NO:334 e fragmentos enzimaticamente ativos das mesmas. A porcentagem de identidade de sequência pode ser ao longo do comprimento completo do polipeptídeo ou, a identidade pode ser ao longo de pelo menos aproximadamente 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 ou mais resíduos.
D NO:168, SEQ D NO:176, SEQ D NO:184, SEQ D NO:192, SEQ D N0:200, SEQ D NO:208, SEQ D NO:216, SEQ D NO:224, SEQ D NO:232, SEQ D NO:240, SEQ D NO:248, SEQ D NO:256, SEQ D NO:264, SEQ D NO:272, SEQ D NO:280, SEQ D NO:288, SEQ D NO:296, SEQ D NO:304, SEQ D NO:312, SEQ D NO:320, SEQ
D NO:170, SEQ ID D NO:178, SEQ ID D NO:186, SEQ ID D NO:194, SEQ ID D NO:202, SEQ ID D NO:210, SEQ ID D NO:218, SEQ ID D NO:226, SEQ ID D NO:234, SEQ ID D NO:242, SEQ ID D NO:250, SEQ ID D NO:258, SEQ ID D NO:266, SEQ ID D NO:274, SEQ ID D NO:282, SEQ ID D NO:290, SEQ ID D NO:298, SEQ ID D NO:306, SEQ ID D NO:314, SEQ ID D NO:322, SEQ ID D NO:330, SEQ ID [00459] Os polipeptídeos de acordo com algumas modalidades da invenção também podem ser mais curtos que o comprimento completo dos polipeptídeos. Em outras modalidades, A presente invenção refePetição 870170009999, de 15/02/2017, pág. 257/1247
248/788 re-se a polipeptídeos (peptídeos, fragmentos) que variam em tamanho entre aproximadamente 5 e o comprimento completo de um polipeptídeo, tal como uma enzima, tal como uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase; os exemplos de tamanhos sendo de aproximadamente 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 ou mais resíduos, tais como resíduos contíguos de uma enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção. Os peptídeos de acordo com a invenção (tal como uma subsequência de um polipeptídeo de acordo com a invenção) podem ser úteis como, tais como sondas de marcação, antígenos (agentes imunogênicos), toleragenos, motivos, sítios ativos da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase (tais como domínios catalíticos), sequências de sinais e/ou pré-pró-domínios.
[00460] Em outras modalidades, os polipeptídeos de acordo com a invenção que possuem atividade de aldolase, tal como atividade de piruvato aldolase, tal como de HMG e/ou de KHG aldolase são membros de um gênero de polipeptídeos que compartilham elementos estruturais, tais como resíduos de aminoácidos, que se correlacionam com a atividade de aldolase incluindo atividade de piruvato tal como, sem limitação, atividade de HMG e/ou KHG aldolase. Estes elementos estruturais compartilhados podem ser utilizados para a produção de rotina de variações de aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase. Estes elementos estruturais compartilhados de enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção podem ser utilizados como guia para a produção de rotina de variações de enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase dentro do âmbito do gênero dos polipeptídeos de acordo com a invenção.
Petição 870170009999, de 15/02/2017, pág. 258/1247
249/788 [00461] Como utilizado aqui, o termo aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase abrange qualquer polipeptídeo ou enzimas capazes de catalisar a reação de adição de aldol ou a reação de retro-aldol (tais como os polipeptídeos de acordo com a invenção, vide também a Tabela 1 e os Exemplos 4, 5 e 6, abaixo) ou qualquer modificação de um material que contém ligações carbonocarbono, tal como na produção de ácido R-2-hidróxi 2-(indol-3ilmetil)4-ceto glutárico (R-MP) e certos estereoisômeros de monatina, tal como R,R e S,R monatina e sais dos mesmos.
[00462] Os polipeptídeos de acordo com algumas modalidades da invenção catalisam a formação de ligações carbono-carbono em uma reação de aldol e possuem a capacidade de utilizar piruvato ou fosfoenolpiruvato como o componente nucleofílico na síntese de uma estrutura de 4-hidróxi-2-cetobutirato que é mostrada no esquema geral abaixo.
Figure BR122017003017B1_D0007
cetona ou Piruvato ou receptor de derivado de aldeído piruvato [00463] R = H, alquila, alquila substituída, arila, arila substituída, benzila, benzila substituída [00464] R2 = H, alquila, alquila substituída, arila, arila substituída, benzila, benzila substituída [00465] R3 = H, alquila, alquila substituída, arila, arila substituída, benzila, benzila substituída, ácido carboxílico.
[00466] Sem ficar ligado à teoria, acredita-se que o fragmento de quatro carbonos conservado preparado em todas as condensações catalisadas por piruvato aldolase é tanto densamente quanto diferencialmente funcionalizado. Além disso, em cada aduto, quatro estados
Petição 870170009999, de 15/02/2017, pág. 259/1247
250/788 de oxidação diferentes de carbono ficam contidos em quatro carbonos contíguos. A estrutura preparada através das piruvato aldolases permite assim a preparação de ácidos α-amino-Y-hidroxicarboxílicos, ácidos β-hidroxicarboxílicos, ácidos α,γ-dihidroxicarboxílicos e açúcares 2desoxialdose como mostrado no esquema abaixo.
OH
NH,
OH
OH O R^H
Figure BR122017003017B1_D0008
OH OH
COOH
OH O
Figure BR122017003017B1_D0009
[00467] Portanto, as piruvato aldolases de acordo com algumas modalidades da invenção podem ser sinteticamente versáteis e podem ser utilizadas na preparação de uma faixa ampla de produtos para uso em produtos alimentícios para animais, alimentos para seres humanos, processos industriais e produtos farmacêuticos (vide, por exemplo, Gijsen, H.J.M. e outros, Recent Advances in the Chemoenzymatic Synthesis of Carbohidrates and Carbohidrate Mimetics, Chem. Rev. 1996, 96, 443-473; Henderson, D.P. e outros J. Org. Chem., Stereospecific Preparation of the N-Terminal Amino Acid Moiety of Nikkomycins KX and KZ vide a Multiple Enzyme Synthesis, 1997, 62, 7910-7911; Wymer, N. & Toone, E.J. Enzyme-catalyzed Synthesis of Carbohidrates. Current Opin. Chemical Biology, 2000, 4, 110-119). [00468] Os polipeptídeos de acordo com algumas modalidades da invenção podem ter mais de um tipo de atividade enzimática, especificamente atividade de aldolase e uma atividade adicional, por exemplo, como apresentado na Tabela 1, abaixo. Por exemplo, um polipeptídeo de acordo com a invenção pode ter atividade de aldolase, atividade de
Petição 870170009999, de 15/02/2017, pág. 260/1247
251/788 piruvato aldolase, HMG e/ou KHG aldolase. Adicionalmente, o polipeptídeo pode ter ou pode-se acreditar que tenha, atividade enzimática adicional com base em sua classificação EC. A Tabela 1 inclui a coluna Número EC Previsto. Um número EC é o número atribuído a um tipo de enzima de acordo com um esquema de nomenclatura de enzima padronizada desenvolvida pela Enzyme Commission of the Nomenclature Committee of the International Union of Biochemistry and Molecular Biology (IUBMB). Os resultados na coluna de Número EC Previsto são determinados por uma busca por BLAST contra um banco de dados de Kegg (Kyoto Encyclopedia of Genes and Genomes). Se a combinação de BLAST principal (também chamada de uma coincidência) tiver um valor de E igual ou menor que e6, o número EC atribuído à combinação principal é inserido na tabela. O número EC da coincidência principal é utilizado como um guia para o que o número EC da sequência da invenção poderia ser. Em casos em que apenas um número EC parcial é fornecido, apenas uma classificação ampla poderia ser atribuída com base na coincidência principal. Por exemplo, na primeira fileira, para a SEQ ID NO:2, codificada pela SEQ ID NO:1, o Número EC Previsto é listado como 2.... Portanto, a classificação atribuída é de forma ampla uma transferase. Para a SEQ ID NO:26, codificada pela SEQ ID NO:25, a classificação mais específica que poderia ser atribuída com base na coincidência principal é como uma aldeído-liase.
Petição 870170009999, de 15/02/2017, pág. 261/1247
252/788
Tabela 1
SEQ ID NO: Atividade Subclas- Número se da al- EC Pre- SinalP Sinal (AA = Aminoácido) Fonte
dolase visto
1,2 Aldolase HMG 2... Bactérias
3,4 Aldolase HMG 2... Desconhecida
5, 6 Aldolase HMG 2... Desconhecida
7,8 Aldolase HMG 2... Desconhecida
9, 10 Aldolase HMG 2... Desconhecida
11, 12 Aldolase HMG 2... Desconhecida
13, 14 Aldolase HMG 2... Desconhecida
15, 16 Aldolase HMG 2... Desconhecida
17, 18 Aldolase HMG 2... Desconhecida
19, 20 Aldolase HMG 2... Desconhecida
21, 22 Aldolase HMG Desconhecida
23, 24 Aldolase HMG 2... Desconhecida
25, 26 Aldolase HMG 4.1.2. Desconhecida
27, 28 Aldolase HMG 2... Desconhecida
29, 30 Aldolase HMG 2... Desconhecida
31, 32 Aldolase HMG 2... Desconhecida
33, 34 Aldolase HMG 2... Desconhecida
35, 36 Aldolase HMG 2... Desconhecida
37, 38 Aldolase HMG 2... Desconhecida
39, 40 Aldolase HMG 2... Desconhecida
41,42 Aldolase HMG 2... Desconhecida
43, 44 Aldolase HMG 2... Desconhecida
45, 46 Aldolase HMG 2... Desconhecida
47, 48 Aldolase HMG 2... Desconhecida
49, 50 Aldolase HMG 2... Desconhecida
51, 52 Aldolase HMG 2... Desconhecida
53, 54 Aldolase HMG 2... Desconhecida
55, 56 Aldolase HMG 2... Desconhecida
57, 58 Aldolase HMG 2... Desconhecida
59, 60 Aldolase HMG 2... Desconhecida
Petição 870170009999, de 15/02/2017, pág. 262/1247
253/788
SEQ ID NO: Atividade Subclas- Número se da al- EC Pre- SinalP Sinal (AA = Aminoácido) Fonte
dolase visto
61, 62 Aldolase HMG 2... Desconhecida
63, 64 Aldolase HMG 2... Desconhecida
65, 66 Aldolase HMG 2... AA1-27 Desconhecida
67, 68 Aldolase HMG 2... Desconhecida
69, 70 Aldolase HMG 2... Desconhecida
71, 72 Aldolase HMG 2... Desconhecida
73, 74 Aldolase HMG 2... Desconhecida
75, 76 Aldolase HMG 2... Desconhecida
77, 78 Aldolase HMG 2... Desconhecida
79, 80 Aldolase HMG 2... Desconhecida
81, 82 Aldolase HMG 2... Desconhecida
83, 84 Aldolase HMG 2... Desconhecida
85, 86 Aldolase HMG 2... Desconhecida
87, 88 Aldolase HMG 2... Desconhecida
89, 90 Aldolase HMG 2... Desconhecida
91, 92 Aldolase HMG 2... Desconhecida
93, 94 Aldolase HMG 2... Desconhecida
95, 96 Aldolase HMG 2... Desconhecida
97, 98 Aldolase HMG 2... Desconhecida
99, 100 Aldolase HMG 2... Desconhecida
101, 102 Aldolase HMG 2... Desconhecida
103, 104 Aldolase HMG 2... Desconhecida
105, 106 Aldolase HMG 2... Desconhecida
107, 108 Aldolase HMG 2... Desconhecida
109, 110 Aldolase HMG 2... Desconhecida
111, 112 Aldolase HMG 2... Desconhecida
113, 114 Aldolase HMG 2... Desconhecida
115, 116 Aldolase HMG 2... Desconhecida
117, 118 Aldolase HMG 2... Desconhecida
119, 120 Aldolase HMG 2... Desconhecida
121, 122 Aldolase HMG 2... Desconhecida
Petição 870170009999, de 15/02/2017, pág. 263/1247
254/788
SEQ ID NO: Atividade Subclas- Número se da al- EC Pre- SinalP Sinal (AA = Aminoácido) Fonte
dolase visto
123, 124 Aldolase HMG 2... Desconhecida
125, 126 Aldolase HMG 2... Desconhecida
127, 128 Aldolase HMG 2... Desconhecida
129, 130 Aldolase HMG 2... Desconhecida
131, 132 Aldolase HMG 2... Desconhecida
133, 134 Aldolase HMG 2... Desconhecida
135, 136 Aldolase HMG 2... Desconhecida
137, 138 Aldolase HMG 2... Desconhecida
139, 140 Aldolase HMG 2... Desconhecida
141, 142 Aldolase HMG 2... Desconhecida
143, 144 Aldolase HMG 2... Desconhecida
145, 146 Aldolase HMG 2... Desconhecida
147, 148 Aldolase HMG 2... Desconhecida
149, 150 Aldolase HMG 2... Desconhecida
151, 152 Aldolase HMG 2... Desconhecida
153, 154 Aldolase HMG 2... Desconhecida
155, 156 Aldolase HMG 2... Desconhecida
157, 158 Aldolase HMG 2... Desconhecida
159, 160 Aldolase HMG 2... Desconhecida
161, 162 Aldolase HMG 2... Desconhecida
163, 164 Aldolase HMG 2... Desconhecida
165, 166 Aldolase HMG 2... Desconhecida
167, 168 Aldolase HMG 2... Desconhecida
169, 170 Aldolase HMG 2... Desconhecida
171, 172 Aldolase HMG 2... Desconhecida
173, 174 Aldolase HMG 2... Desconhecida
175, 176 Aldolase HMG 2... Desconhecida
177, 178 Aldolase HMG 2... Desconhecida
179, 180 Aldolase HMG 2... Desconhecida
181, 182 Aldolase HMG 2... AA1-31 Desconhecida
183, 184 Aldolase HMG 2... Desconhecida
Petição 870170009999, de 15/02/2017, pág. 264/1247
255/788
SEQ ID NO: Atividade Subclas- Número se da al- EC Pre- SinalP Sinal (AA = Aminoácido) Fonte
dolase visto
185, 186 Aldolase HMG 2... Desconhecida
187, 188 Aldolase HMG 2... Desconhecida
189, 190 Aldolase HMG 2... Desconhecida
191, 192 Aldolase HMG 2... Desconhecida
193, 194 Aldolase HMG 2... Desconhecida
195, 196 Aldolase HMG 2... Desconhecida
197, 198 Aldolase HMG 2... Desconhecida
199, 200 Aldolase HMG 2... Desconhecida
201, 202 Aldolase HMG 2... Desconhecida
203, 204 Aldolase HMG 2... Desconhecida
205, 206 Aldolase HMG 2... Desconhecida
207, 208 Aldolase HMG 2... Desconhecida
209, 210 Aldolase HMG 2... Desconhecida
211, 212 Aldolase HMG 2... Desconhecida
213, 214 Aldolase HMG 2... Desconhecida
215, 216 Aldolase HMG 2... Desconhecida
217, 218 Aldolase HMG 2... Desconhecida
219, 220 Aldolase HMG 2... Desconhecida
221, 222 Aldolase HMG 2... Desconhecida
223, 224 Aldolase HMG 2... Desconhecida
225, 226 Aldolase HMG 2... Desconhecida
227, 228 Aldolase HMG 2... Desconhecida
229, 230 Aldolase HMG 2... Desconhecida
231, 232 Aldolase HMG 2... Desconhecida
233, 234 Aldolase HMG 2... Desconhecida
235, 236 Aldolase HMG 2... Desconhecida
237, 238 Aldolase HMG 2... Desconhecida
239, 240 Aldolase HMG 2... Desconhecida
241, 242 Aldolase HMG 2... Desconhecida
243, 244 Aldolase HMG 2... Desconhecida
245, 246 Aldolase HMG 2... Desconhecida
Petição 870170009999, de 15/02/2017, pág. 265/1247
256/788
SEQ ID NO: Atividade Subclas- Número se da al- EC Pre- SinalP Sinal (AA = Aminoácido) Fonte
dolase visto
247, 248 Aldolase HMG 2... Desconhecida
249, 250 Aldolase HMG 2... Desconhecida
251, 252 Aldolase HMG 2... Desconhecida
253, 254 Aldolase HMG 2... Desconhecida
255, 256 Aldolase HMG 2... Desconhecida
257, 258 Aldolase HMG 2... Desconhecida
259, 260 Aldolase HMG 2... AA1-18 Desconhecida
261, 262 Aldolase HMG 2... Desconhecida
263, 264 Aldolase HMG 2... Desconhecida
265, 266 Aldolase HMG 2... Desconhecida
267, 268 Aldolase HMG 2... Desconhecida
269, 270 Aldolase HMG 2... Desconhecida
271, 272 Aldolase HMG 2... Desconhecida
273, 274 Aldolase HMG 2... Desconhecida
275, 276 Aldolase HMG 2... Desconhecida
277, 278 Aldolase HMG 2... Desconhecida
279, 280 Aldolase HMG 2... Desconhecida
281, 282 Aldolase HMG 2... Desconhecida
283, 284 Aldolase HMG 2... Desconhecida
285, 286 Aldolase HMG 2... Desconhecida
287, 288 Aldolase HMG 2... Desconhecida
289, 290 Aldolase HMG 2... Desconhecida
291, 292 Aldolase HMG 2... Desconhecida
293, 294 Aldolase HMG 2... Desconhecida
295, 296 Aldolase HMG 2... Desconhecida
297, 298 Aldolase HMG 2... Desconhecida
299, 300 Aldolase HMG 2.1.. Desconhecida
301, 302 Aldolase HMG 2.1.. Desconhecida
303, 304 Aldolase HMG 2.1.. Desconhecida
305, 306 Aldolase KHG 4.1.2.14 Desconhecida
307, 308 Aldolase KHG 4.1.2.14 Desconhecida
Petição 870170009999, de 15/02/2017, pág. 266/1247
257/788
SEQ ID NO: Atividade Subclas- Número se da al- EC Pre- SinalP Sinal (AA = Aminoácido) Fonte
dolase visto
309, 310 Aldolase KHG 4.1.2.14 Desconhecida
311, 312 Aldolase KHG 4.1.2.14 Desconhecida
313, 314 Aldolase KHG 4.1.2.14 Desconhecida
315, 316 Aldolase KHG 4.1.2.14 Desconhecida
317, 318 Aldolase KHG 4.1.2.14 Desconhecida
319, 320 Aldolase KHG 4.1.3.16 Desconhecida
321, 322 Aldolase KHG 4.1.2.14 Desconhecida
323, 324 Aldolase KHG 4.1.2.14 Desconhecida
325, 326 Aldolase KHG 4.1.2.14 Desconhecida
327, 328 Aldolase KHG 4.1.2.14 Desconhecida
329, 330 Aldolase KHG 4.1.3.16 Desconhecida
331, 332 Aldolase KHG 4.1.2.14 Desconhecida
333, 334 Aldolase KHG 4.1.2.14 Desconhecida
[00469] Os polipeptídeos e os peptídeos de acordo com a invenção podem ser isolados de fontes naturais, podem ser sintéticos ou podem ser polipeptídeos gerados de forma recombinante. Os peptídeos e as proteínas podem ser expressos de forma recombinante in vitro ou in vivo. Os peptídeos e os polipeptídeos de acordo com a invenção podem ser produzidos e isolados utilizando qualquer método conhecido na técnica. Os polipeptídeos e os peptídeos de acordo com a invenção também podem ser sintetizados, inteiros ou em parte, utilizando métodos químicos bem-conhecidos na técnica. Vide, tal como Caruthers (1980) Nucleic Acids Res. Symp. Ser. 215-223; Horn (1980) Nucleic Acids Res. Symp. Ser. 225-232; Banga, A.K., Therapeutic Peptides and Proteins, Formulation, Processing and Delivery Systems (1995) Technomic Publishing Co., Lancaster, PA. Por exemplo, a síntese de peptídeos pode ser realizada utilizando várias técnicas em fase sólida (vide, tal como Roberge (1995) Science 269:202; Merrifield (1997) Methods Enzymol. 289:3-13) e a síntese automatizada pode ser consePetição 870170009999, de 15/02/2017, pág. 267/1247
258/788 guida, tal como utilizando o ABI 431A Peptide Synthesizer (Perkin Elmer) de acordo com as instruções fornecidas pelo fabricante.
[00470] Os peptídeos e os polipeptídeos de acordo com a invenção também podem ser glicosilados. A glicosilação pode ser adicionada após a tradução quimicamente ou através de mecanismos biossintéticos celulares, em que os últimos incorporam o uso de motivos de glicosilação conhecidos, que podem ser nativos ou podem ser adicionados como um peptídeo ou adicionados na sequência que codifica o ácido nucléico. A glicosilação pode ser ligada a O ou ligada a N.
[00471] Em algumas modalidades, quando indicado, os peptídeos e os polipeptídeos de acordo com a invenção podem incluir todas as formas miméticas e peptídeo miméticas. Os termos mimético e peptídeo mimético referem-se a um composto químico sintético que possui substancialmente as mesmas características estruturais e/ou funcionais dos polipeptídeos de acordo com a invenção. O mimético pode ser inteiramente composto de análogos não naturais sintéticos de aminoácidos ou é uma molécula quimérica de aminoácidos de peptídeos parcialmente naturais e de análogos de aminoácidos parcialmente não naturais. O mimético também pode incorporar qualquer quantidade de substituições conservativas de aminoácidos naturais contanto que tais substituições também não alterem substituição a estrutura e/ou a atividade do mimético. Como com os polipeptídeos de acordo com a invenção que são variações ou membros conservativos de um gênero de polipeptídeos de acordo com a invenção (tal como que possuem aproximadamente 50% ou mais identidade de sequência a uma sequência de acordo com a invenção), experimentos de rotina determinação se um mimético está dentro do âmbito de acordo com a invenção, isto é, que sua estrutura e/ou função não está substancialmente alterada. Assim, em algumas modalidades, uma composição de miméticos está dentro do âmbito de acordo com a invenção se possuir
Petição 870170009999, de 15/02/2017, pág. 268/1247
259/788 atividade de uma enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase.
[00472] As composições de miméticos de polipeptídeos de acordo com a invenção podem conter qualquer combinação de componentes estruturais não naturais. Em uma modalidade alternativa, as composições de miméticos de acordo com a invenção incluem um ou todos dos três grupos estruturais a seguir: a) grupos de ligação aos resíduos sem ser as ligações amida natruais (ligação peptídica); b) resíduos não naturais no lugar de resíduos de aminoácidos que ocorrem naturalmente; ou c) resíduos que induzem mimetismo estrutural secundário, isto é, para induzir ou estabilizar uma estrutura secundária, tal como uma volta beta, uma volta gama, uma folha beta, uma conformação em hélice alfa e similares. Por exemplo, um polipeptídeo de acordo com a invenção pode ser caracterizado como um mimético quando todos ou alguns de seus resíduos estão ligados através de meios químicos sem ser ligações peptídicas naturais. Os resíduos peptidomiméticos individuais podem ser ligados através de ligações peptídicas, outras ligações químicas ou meios de acoplamento, tais como glutaraldeído, ésteres de N-hidroxissuccinimida, maleimidas bifuncionais, N,N'diciclohexilcarbodiimida (DCC) ou Ν,Ν'-diisopropilcarbodiimida (DIC). Os grupos de ligação que podem ser uma alternativa para ligações amida tradicionais (ligação peptídica) incluem, tal como cetometileno (tal como -C(=O)-CH2- para -C(=O)-NH-), aminometileno (CH2-NH), etileno, olefina (CH=CH), éter (CH2-O), tioéter (CH2-S), tetrazol (CN4-), tiazol, retroamida, tioamida ou éster (vide Spatola (1983) em Chemistry and Biochemistry of Amino Acids, Peptides and Proteins, Vol. 7, pp 267-357, Peptide Backbone Modifications, Marcell Dekker, NY). [00473] Um polipeptídeo de acordo com a invenção também pode ser caracterizado como um mimético por conter todos ou alguns resíduos não naturais no lugar de resíduos de aminoácidos que ocorrem
Petição 870170009999, de 15/02/2017, pág. 269/1247
260/788 naturalmente. Os resíduos não naturais são bem-descritos na literatura científica e de patente; alguns dos exemplos de composições não naturais úteis como miméticos de resíduos de aminoácidos naturais e diretrizes são descritos abaixo. Os miméticos de aminoácidos aromáticos podem ser gerados através da substituição por, tal como D- ou Lnafilalanina; D- ou L- fenilglicina; D- ou L-2 tienoilalanina; D- ou L-1, -2, 3- ou 4- pirenoilalanina; D- ou L-3 tienoilalanina; D- ou L-(2-piridinil)alanina; D- ou L-(3-piridinil)-alanina; D- ou L-(2-pirazinil)-alanina; D- ou L-(4-isopropil)-fenilglicina; D-(trifluorometil)-fenilglicina; D(trifluorometil)-fenilalanina; D-p-fluoro-fenilalanina; D- ou L-pbifenilfenilalanina; D- ou L-p-metóxi-bifenilfenilalanina; D- ou L-2indol(alquil)alaninas; e, D- ou L-alquilaininas, em que alquila pode ser metila, etila, propila, hexila, butila, pentila, isopropila, iso-butila, secisotila, iso-pentila substituído ou não-substituído ou aminoácidos não ácidos. Os anéis aromáticos de um aminoácido não natural incluem, tais como anéis aromáticos de tiazolila, tiofenila, pirazolila, benzimidazolila, naftila, furanila, pirrolila e piridila.
[00474] Os miméticos de aminoácidos ácidos podem ser gerados através da substituição por, tal como aminoácidos não carboxilados enquanto uma carga negativa é mantida; (fosfono)alanina; treonina sulfatada. Os grupos laterais carboxila (tal como aspartila ou glutamila) também podem ser modificados seletivamente através da reação com carbodiimidas (R-N-C-N-R') tal como 1-ciclohexil-3(2-morfolinil-(4-etil) carbodiimida ou 1-etil-3(4-azonia-4,4- dimetolpentil) carbodiimida. Aspartila ou glutamila podem também ser convertidos em resíduos asparaginila e glutaminila através da reação com íons de amônio. Os miméticos de aminoácidos básicos podem ser gerados através da substituição por, tal como (em adição à lisina e arginina) os aminoácidos ornitina, citrulina ou ácido (guanidino)-acético ou ácido (guanidino)alquilacético, em que alquila é como definido anteriormente. O derivado de
Petição 870170009999, de 15/02/2017, pág. 270/1247
261/788 nitrila (tal como contendo a porção CN no lugar de COOH) pode ser substituído por asparagina ou glutamina. Os resíduos de asparaginila e glutaminila podem ser desaminados nos resíduos aspartila ou glutamina correspondentes. Os miméticos de resíduo de arginina podem ser gerados através da reação de arginila com, tal como um ou mais reagentes convencionais, incluindo, tal como fenilglioxal, 2,3butanodiona, 1,2-ciclo-hexanodiona ou ninhidrina, em algumas modalidades sob condições alcalinas. Os miméticos de resíduo de tirosina podem ser gerados através da reação de tirosila com, tal como compostos de diazônio aromáticos ou tetranitrometano. O N-acetilimidizol e o tetranitrometano podem ser utilizados para formar espécies de Oacetil tirosila e derivados 3-nitro, respectivamente. Os miméticos de resíduo de cisteína podem ser gerados através da reação de resíduos cisteinila com, tal como alfa-haloacetatos tal como ácido 2-cloroacético ou cloroacetamida e aminas correspondentes; para fornecer derivados de carboximetila ou carboxiamidometila. Os miméticos de resíduo de cisteína também podem ser gerados através da reação de resíduos de cisteinila com, tal como bromo-trifluoroacetona, ácido alfa-bromo-beta(5-imidozoil) propiônico; fosfato de cloroacetila, N-alquilmaleimidas, dissulfeto de 3-nitro-2-piridila; dissulfeto de metil 2-piridila; pcloromercuribenzoato; 2-cloromercuri-4 nitrofenol; ou, cloro-7nitrobenzo-oxa-1,3-diazol. Os miméticos de lisina podem ser gerados (e os resíduos amino terminais podem ser alterados) através da reação de lisinila com, tal como anidridos do ácido succínico ou outro carboxílico. A lisina e outros miméticos de resíduos contendo alfa-amino também podem ser gerados através da reação com imidoésteres, tais como reações catalisadas por picolinimidato de metila, fosfato piridoxal, piridoxal, cloroborohidreto, ácido trinitro-benzenossulfônico, Ometilisouréia, 2,4, pentanodiona e transamidase com glioxilato. Os miméticos de metionina podem ser gerados através da reação com, tal
Petição 870170009999, de 15/02/2017, pág. 271/1247
262/788 como sulfóxido de metionina. Os miméticos de prolina incluem, tal como ácido pipecólico, ácido tiazolidina carboxílico, 3- ou 4- hidróxi prolina, desidroprolina, 3- ou 4-metilprolina ou 3,3,-dimetilprolina. Os miméticos de resíduo de histidina podem ser gerados através da reação de histidila com, tal como dietilprocarbonato ou brometo de parabromofenacila. Outros miméticos incluem, tal como os gerados através da hidroxilação de prolina e lisina; da fosforilação dos grupos hidroxila de resíduos serila ou treonila; da metilação dos grupos alfa-amino de lisina, arginina e histidina; da acetilação da amina N-terminal; da metilação dos resíduos de amida da cadeia principal ou da substituição por N-metil aminoácidos; ou da amidação de grupos carboxila C-terminais. [00475] Em algumas modalidades, um resíduo, tal como um aminoácido, de um polipeptídeo de acordo com a invenção também pode ser substituído por um aminoácido (resíduo peptidomimético) da quiralidade oposta. Em algumas modalidades, qualquer aminoácido que ocorre natural mente na configuração L (que também pode ser referido como R ou S, dependendo da estrutura da entidade química) pode ser substituído pelo aminoácido do mesmo tipo estrutural químico ou um peptidomimético, mas da quiralidade oposta, referido como o Daminoácido, mas também pode ser referido como a forma R ou S. [00476] A invenção fornece ainda métodos para a modificação dos polipeptídeos de acordo com a invenção através de processos naturais, tal como processamento pós-tradução (tal como fosforilação, acilação etc) ou através de técnicas de modificação química e os polipeptídeos modificados resultantes. As modificações podem ocorrer em qualquer local no polipeptídeo, incluindo na estrutura peptídica, nas cadeias laterais de aminoácidos ou nos terminais amino ou carboxila. Será considerado que o mesmo tipo de modificação pode estar presente nos mesmos graus ou variáveis em vários sítios em um certo polipeptídeo. Ainda, um certo polipeptídeo pode ter muitos tipos de
Petição 870170009999, de 15/02/2017, pág. 272/1247
263/788 modificações. Em algumas modalidades, as modificações incluem acetilação, acilação, ADP-ribosilação, amidação, ligação covalente de flavina, ligação covalente de um porção heme, ligação covalente de um nucleotídeo ou um derivado de nucleotídeo, ligação covalente de um lipídeo ou de um derivado de lipídeo, ligação covalente de um fosfatidilinositol, ciclicação de reticulação, formação de ponte dissulfeto, desmetilação, formação de ligações cruzadas covalentes, formação de cisteína, formação de piroglutamato, formilação, gama-carboxilação, glicosilação, formação de ancoragem de GPI, hidroxilação, iodinação, metilação, miristoliação, oxidação, peguilação, processamento proteolítico, fosforilação, prenilação, racemização, selenoilação, sulfação e adição de aminoácidos mediada por RNA de transferência para proteína tal como arginilação. Vide, Creighton, T.E., Proteins - Structure and Molecular Properties 2- Ed., W.H. Freeman and Company, Nova Iorque (1993); Posttranslational Covalent Modification of Proteins, B.C. Johnson, Ed., Academic Press, Nova Iorque, pp. 1-12 (1983).
[00477] Os métodos de síntese química de peptídeos em fase sólida podem também ser utilizados para sintetizar o polipeptídeo os fragmentos de acordo com a invenção. Tal método é conhecido na técnica desde o início dos anos 60 (Merrifield, R. B., J. Am. Chem. Soc., 85:2149-2154, 1963) (Vide também Stewart, J. M. e Young, J. D., Solid Phase Peptide Synthesis, 2- Ed., Pierce Chemical Co., Rockford, III., pp. 11-12)) e foi recentemente empregado nos kits de planejamento e de síntese de peptídeos em laboratório disponíveis comercial mente (Cambridge Research Biochemicals). Tais kits de laboratório disponíveis comercial mente utilizaram de forma geral os ensinamentos de H. M. Geysen e outros, Proc. Natl. Acad. Sei., USA, 81:3998 (1984) e fornecem a síntese de peptídeos sobre extremidades de um grande número de bastões ou pinos os quais todos são conectados a uma placa isolada. Quando tal sistema é utilizado, uma placa de bastões ou
Petição 870170009999, de 15/02/2017, pág. 273/1247
264/788 de pinos é invertida e inserida e uma segunda placa de cavidades ou reservatórios correspondentes, que contêm soluções para a ligação ou para a ancoragem do aminoácido apropriado às extremidades dos pinos ou dos bastões. Repetindo tal processo, isto é, invertendo e inserido as extremidades dos bastões e dos pinos em soluções apropriadas, os aminoácidos são construídos em peptídeos desejados. Em adição, está disponível um número de sistemas de síntese de peptídeos FMOC disponíves. Por exemplo, a montagem de um polipeptídeo ou de um fragmento pode ser realizada sobre um suporte sólido utilizando um sintetizador de peptídeos automático da Applied Biosystems, Inc. Model 431A®. Tal equipamento fornece acesso rápido aos peptídeos de acordo com a invenção, através da síntese direta ou através da síntese de uma série de fragmentos que podem ser acoplados utilizando outras técnicas.
[00478] Os polipeptídeos de acordo com a invenção incluem enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase em uma forma ativa ou inativa. Por exemplo, os polipeptídeos de acordo com a invenção incluem pró-proteínas antes da maturação ou do processamento de pré-pró-sequências, tal como através da enzima que processa a pró-proteína, tal como uma convertase da próproteína para gerar uma proteína madura ativa. Os polipeptídeos de acordo com a invenção incluem enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase inativas por outras razões, tal como antes da activação através de um evento de processamento pós-tradução, tal como uma ação de endo- ou exo-peptidase ou proteinase, um evento de fosforilação, uma amidação, uma glicosilação ou uma sulfação, um evento de dimerização e similares. Os polipeptídeos de acordo com a invenção incluem todas as formas ativas, incluindo subsequências ativas, tais como domínios catalíticos ou sítios ativos da enzima.
Petição 870170009999, de 15/02/2017, pág. 274/1247
265/788 [00479] A invenção inclui enzimas aldolases imobilizadas, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, anticorpos antialdolase, tal como antipiruvato aldolase, tal como anti-HMG e/ou antiKHG aldolase e fragmentos dos mesmos. Em algumas modalidades, a invenção fornece métodos para inibir a atividade de uma enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, tal como utilizando mutantes negativos dominantes ou anticorpos antialdolase, tal como antipiruvato aldolase, tal como anti-HMG e/ou antiKHG aldolase de acordo com a invenção. Em algumas modalidades, a invenção inclui heterocomplexos, tais como proteínas de fusão, heterodímeros etc., que compreendem as enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção.
[00480] Em algumas modalidades, os polipeptídeos de acordo com a invenção podem ter uma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, sob várias condições, tais como extremas em pH e/ou em temperatura ou, em algumas modalidades, na presença de agentes oxidantes. Em algumas modalidades, a invenção fornece métodos que levam a preparações de enzimas aldolases alternativas, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase com eficiências e estabilidades catalíticas diferentes, tais como em relação à temperatura, agentes oxidantes e condições de lavagem variáveis. Em algumas modalidades, as variações da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase podem ser produzidas utilizando técnicas de mutagênese direcionada ao sítio e/ou mutagênese aleatória. Em algumas modalidades, a evolução direcionada pode ser utilizada para produzir uma grande variedade de variações de enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase com especificidades e estabilidades alternativas.
Petição 870170009999, de 15/02/2017, pág. 275/1247
266/788 [00481] As proteínas de acordo com a invenção são também úteis como reagentes para pesquisa para identificar moduladores de enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, tais como ativadores ou inibidores da atividade de enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase. Sucintamente, as amostras de teste (compostos, caldos de cultura, extratos e similares) são adicionadas aos ensaios de enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase para determinar sua capacidade de inibir a divagem do substrato. Os inibidores identificados desta maneira podem ser utilizados na indústria e na pesquisa para reduzir ou prevenir proteólise indesejada. Como com as enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, os inibidores podem ser combinados para aumentar o espectro de atividade.
[00482] As enzimas de acordo com a invenção também são úteis como reagentes de pesquisa para digerir proteínas ou no seqüenciamento de proteínas. Por exemplo, as enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase podem ser utilizadas para quebrar polipeptídeos em fragmentos menores para o seqüenciamento utilizando, tal como um seqüenciador automático. [00483] A invenção fornece ainda métodos de descoberta de novas enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase enzimas utilizando os ácidos nucléicos, os polipeptídeos e os anticorpos de acordo com a invenção. Em algumas modalidades, bibliotecas de fagemídeos são verificadas em relação à descoberta baseada na expressão de enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase. Em outras modalidades, bibliotecas de fago lambda são verificadas em relação à descoberta baseada na expressão de enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase. A verificação das bibliotecas de faPetição 870170009999, de 15/02/2017, pág. 276/1247
267/788 gos ou de fagemídeos pode permitir a detecção de clones tóxicos; aumentar o acesso ao substrato; reduzir a necessidade de engenheirar um hospedeiro, omitindo o potencial a qualquer tendência resultante da excisão de massa da biblioteca; e, crescimento mais rápido em densidades baixas de clones. A verificação de bibliotecas de fagos ou de fagemídeos pode ser feita em fase líquida ou em fase sólida. Em algumas modalidades, a invenção fornece verificação em fase líquida. Isto fornece maior flexibilidade nas condições de ensaio; fleximidade adicional de substrato; maior sensibilidade para clones mais fracos; e facilidade de automação em relação à verificação em fase sólida. [00484] A invenção fornece métodos de verificação utilizando as proteínas e os ácidos nucléicos de acordo com a invenção e automação robótica para possibilitar a execução de muitos milhares de reações biocatalíticas e ensaios de verificação em um período de tempo curto, tal como por dia, bem como garantindo um alto nível de acurácia e de reprodutibilidade (vide a discussão de arranjos, abaixo). Como um resultado, uma biblioteca de compostos derivados pode ser produzida em uma questão de semanas. Para ensinamentos adicionais sobre a modificação de moléculas, incluindo moléculas pequenas, vide o PCT/US94/09174; Patente U.S. N°6.245.547.
[00485] Em algumas modalidades, os polipeptídeos ou os fragmentos de acordo com a invenção são obtidos através de procedimentos de enriquecimento bioquímico ou de purificação. A sequência de polipeptídeos ou de fragmentos potencialmente homólogos pode ser determinada através de ensaios de enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase enzima (vide os Exemplos 3, 4 e 5, abaixo), eletroforese em gel e/ou microsseqüenciamento. A sequência do polipeptídeo ou do fragmento esperado de acordo com a invenção pode ser comparada com a de um polipeptídeo de acordo com a invenção ou de um fragmento, tal como que compreende pelo
Petição 870170009999, de 15/02/2017, pág. 277/1247
268/788 menos aproximadamente 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 ou 150 ou mais aminoácidos consecutivos do mesmo utilizando qualquer um dos programas descritos anteriormente.
[00486] Uma outra modalidade da invenção é um ensaio para a identificação de fragmentos ou de variações de acordo com a invenção, que mantêm a função enzimática dos polipeptídeos de acordo com a invenção. Por exemplo, os fragmentos ou as variações dos ditos polipeptídeos, podem ser utilizadas para catalisar reações bioquímicas, que indicam que o fragmento ou a variação mantém a atividade enzimática de um polipeptídeo de acordo com a invenção. Um exemplo de ensaio para a determinação do fato de que os fragmentos de variações mantêm a atividade enzimática dos polipeptídeos de acordo com a invenção inclui as etapas de: colocar em contato o fragmento ou a variação do polipeptídeo com uma molécula de substrato sob condições que permitem que o fragmento ou a variação do polipeptídeo funcione e detectar um decréscimo no nível de substrato ou um aumento no nível do produto de reação específico entre o polipeptídeo e o substrato.
[00487] A presente invenção explora as propriedades catalíticas exclusiva das enzimas. Embora o uso de biocatalisadores (isto é, enzimas purificadas ou brutas, células não vivas ou vivas) nas transformações químicas normalmente requera a identificação de um biocatalisador particular que reaja com um composto de partida específico, a presente invenção utiliza biocatalisadores selecionados e condições de reação que são específicas para grupos funcionais que estão presentes em muitos compostos de partida, tais como moléculas pequenas. Cada biocatalisador é específico para um grupo funcional ou para vários grupos funcionais relacionados e pode reagir com muitos compostos de partida contendo este grupo funcional.
[00488] Em algumas modalidades, as reações biocatalíticas produPetição 870170009999, de 15/02/2017, pág. 278/1247
269/788 zem uma população de derivados partindo de um único composto de partida. Estes derivados podem ser submetidos a uma outra rodada de reações biocatalíticas para produzir uma segunda população de compostos derivados. Milhares de variações da molécula pequena ou do composto original podem ser produzidos com cada repetição de derivatização biocatalítica.
[00489] As enzimas reagem em sítios específicos de um composto de partida sem afetar o resto da molécula, um processo que é muito difícil de conseguir utilizando métodos químicos tradicionais. Este alto grau de especificidade biocatalítica fornece os meios de identificação de um composto ativo isolado dentro da biblioteca. A biblioteca é caracterizada pela série de reações biocatalíticas utilizadas para produzila, um assim chamado histórico biossintético. A verificação da biblioteca em relação a atividades biológicas e a determinação das identidades do histórico biossintético identificam a sequência de reação específica que produz o composto ativo. A sequência de reação é repetida e a estrutura do composto sintetizado é determinada. Este modo de identificação, ao contrário de outras abordagens de síntese e de verificação, não requer tecnologias de imobilização e os compostos podem ser sintetizados e testados livremente em solução utilizando virtualmente qualquer tipo de ensaio de verificação. É importante observar, que o alto grau de especificidade de reações enzimáticas sobre os grupos funcionais permite a determinação de reações enzimáticas específicas que constituem a biblioteca produzida de forma biocatalítica.
[00490] Em algumas modalidades, as etapas do procedimento são realizadas utilizando automação robótica que possibilita a execução de muitos milhares de reações biocatalíticas e/ou ensaios de verificação por dia assim como garante um alto nível de acurácia e reprodutibilidade. A automação robótica também pode ser utilizada para verificar a
Petição 870170009999, de 15/02/2017, pág. 279/1247
270/788 atividade de aldolase para determinar se um polipeptídeo está dentro do âmbito de acordo com a invenção. Como um resultado, em algumas modalidades, uma biblioteca de compostos derivados pode ser produzida em uma questão de semanas que poderia levar anos para ser produzida utilizando métodos de verificação química ou enzimática tradicionais.
[00491] Em uma modalidade, a invenção fornece métodos para a modificação de moléculas pequenas, que compreendem o contato de um polipeptídeo codificado por um polinucleotídeo descrito aqui ou fragmentos enzimaticamente ativos do mesmo com uma molécula pequena para produzir uma molécula pequena modificada. Uma biblioteca de moléculas pequenas modificadas é testada para determinar se uma molécula pequena modificada está presente dentro da biblioteca, que exibe uma atividade desejada. Uma reação biocatalítica específica que produz a molécula pequena modificada de atividade desejada é identificada através da eliminação sistemática de cada uma das reações biocatalíticas utilizadas para produzir uma parte da biblioteca e então do teste das moléculas pequenas produzidas na parte da biblioteca em relação à presença ou à ausência da molécula pequena modificada com a atividade desejada. As reações biocatalíticas específicas que produzem a molécula pequena modificada de atividade desejada são opcionalmente repetidas. As reações biocatalíticas são realizadas com um grupo de biocatalisadores que reagem com porçãos estruturais distintos encontrados dentro da estrutura de uma molécula pequena, cada biocatalisador é específico para um porção estrutural ou um grupo de porçãos estruturais relacionados; e cada biocatalisador reage com muitas moléculas pequenas diferentes que contêm a porção estrutural distinto.
Sequências de Sinais, Pré-pró-domínios e Domínios Catalíticos de Enzimas Aldolases, Tal como Piruvato Aldolase, tal como HMG e/ou KHG
Petição 870170009999, de 15/02/2017, pág. 280/1247
271/788
Aldolase [00492] A invenção fornece sequências de sinais (tais como peptídeos de sinais (SPs)), pré-pró-domínios e domínios catalíticos (CDs) de enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase. Os SPs, os pré-pró-domínios e/ou os CDs de acordo com a invenção podem ser peptídeos isolados, sintéticos ou recombinantes ou podem fazer parte de uma proteína de fusão, tal como um domínio heterólogo em uma proteína quimérica. Em algumas modalidades, a invenção fornece ácidos nucléicos que codificam estes domínios catalíticos (CDs), pré-pró-domínios e sequências de sinais (SPs, tal como um peptídeo que possui uma sequência que compreende/que consiste em resíduos amino terminais de um polipeptídeo de acordo com a invenção).
[00493] A invenção fornece sequências de sinais isoladas, sintéticas ou recombinantes (tais como peptídeos de sinais) que consistem em ou que compreendem uma sequência que é apresentada nos resíduos 1 até 14, 1 até 15, 1 até 16, 1 até 17, 1 até 18, 1 até 19, 1 até 20, 1 até 21, 1 até 22, 1 até 23, 1 até 24, 1 até 25, 1 até 26, 1 até 27, 1 até 28, 1 até 28, 1 até 30, 1 até 31, 1 até 32, 1 até 33, 1 até 34, 1 até 35, 1 até 36, 1 até 37, 1 até 38, 1 até 40, 1 até 41, 1 até 42, 1 até 43, 1 até 44, 1 até 45, 1 até 46 ou 1 até 47 ou mais, de um polipeptídeo de acordo com a invenção, tal como os polipeptídeos de acordo com a invenção, vide também a Tabela 1, Exemplos 4, 5 e 6, abaixo e a Listagem de Sequências. Por exemplo, a Tabela 1, acima, apresenta exemplos de sequências de sinais (líderes) de acordo com a invenção, tal como no polipeptídeo que possui uma sequência que é apresentada na SEQ ID NO:66, codificada, tal como pela SEQ ID NO:65, possui uma sequência sinal que compreende (ou que consiste em) os 27 resíduos amino terminais ou MSIWTKIERAGAAAVAALRTSGVATV (SEQ ID NO:407) que correspondem aos primeiros 27 aminoácidos da
Petição 870170009999, de 15/02/2017, pág. 281/1247
272/788
SEQ ID NO:66.
[00494] Em algumas modalidades, a invenção fornece sequências de sinais que compreendem os primeiros 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70 ou mais resíduos amino terminais de um polipeptídeo de acordo com a invenção.
[00495] A invenção inclui polipeptídeos com ou sem uma sequência sinal e/ou uma pré-pró-sequência. Em algumas modalidades, a invenção inclui polipeptídeos com sequências de sinais heterólogas e/ou pré-pró-sequências. A pré-pró-sequência (incluindo uma sequência de acordo com a invenção utilizada como um pré-pró-domínio heterólogo) pode ficar localizada na extremidade amino terminal ou carbóxi terminal da proteína. Em algumas modalidades, a invenção inclui ainda sequências de sinais, pré-pró-sequências e domínios catalíticos isolados, sintéticos ou recombinantes (tais como sítios ativos) que compreendem as sequências de acordo com a invenção. O polipeptídeo que compreende uma sequência sinal de acordo com a invenção pode ser uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase de acordo com a invenção ou uma outra enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase ou uma outra enzima ou outro polipeptídeo. Os métodos para a identificação de sequências de domínios e sequências de sinais pré-pró são bemconhecidos na técnica, vide Van de Ven (1993) Crit. Rev. Oncog. 4(2):115-136. Por exemplo, para identificar uma pré-pró-sequência, a proteína é purificada partindo do espaço extracelular e a sequência da proteína N-terminal é determinada e comparada com a forma não processada.
[00496] As sequências de sinais (SPs) e/ou pré-pró-sequências da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG
Petição 870170009999, de 15/02/2017, pág. 282/1247
273/788 aldolase de acordo com a invenção podem ser peptídeos isolados, sintéticos ou recombinantes ou sequências ligadas com uma outra enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase ou um polipeptídeo sem ser de aldolase, tal como sem ser de piruvato aldolase, por exemplo, sem ser de HMG e/ou sem ser de KHG aldolase, tal como uma proteína de fusão (quimérica). Em algumas modalidades, A presente invenção refere-se a polipeptídeos que compreendem sequências de sinais da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção. Em algumas modalidades, os polipeptídeos que compreendem sequências de sinais SPs e/ou pré-pró da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção compreendem sequências heterólogas a de uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase de acordo com a invenção (tal como uma proteína de fusão que compreende um SP e/ou pré-pró de acordo com a invenção e sequências de uma outra enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase ou de uma proteína sem ser aldolase, tal como sem ser piruvato aldolase, por exemplo, sem ser HMG e/ou sem ser KHG aldolase). Em algumas modalidades, a invenção enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção com SPs e/ou pré-pró-sequências heterólogas, tais como sequências com uma sequência sinal de levedura. Uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase de acordo com a invenção pode compreender um SP e/ou pré-pró heterólogo em um vetor, tal como um vetor da série pPIC (Invitrogen, Carlsbad, CA).
[00497] Em algumas modalidades, os SPs e/ou as pré-prósequências de acordo com a invenção são identificadas após a identificação de novos polipeptídeos de aldolase, tal como piruvato aldolase,
Petição 870170009999, de 15/02/2017, pág. 283/1247
274/788 tal como HMG e/ou KHG aldolase. As vias através das quais as proteínas são selecionadas e transportadas para sua localização celular apropriada são freqüentemente referidas como vias de direcionamento de proteínas. Um dos elementos mais importantes em todos estes sistemas de direcionamento é uma sequência de aminoácidos curta no terminal amino de um polipeptídeo recém-sintetizado chamado de sequência sinal. Esta sequência sinal direciona uma proteína à sua localização apropriada na célula e é removida durante o transporte ou quando a proteína atinge seu destino final. A maioria das proteínas lisossomais, de membrana ou secretadas possui uma sequência sinal amino terminal que as marca para a translocação para dentro do lúmen do retículo endoplasmático. As sequências de sinais podem variar em comprimento de aproximadamente 10 até 65 ou mais resíduos de aminoácidos. Vários métodos de reconhecimento de sequências de sinais são conhecidos pelos versados na técnica. Por exemplo, em algumas modalidades, novos peptídeos de sinais de enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase são identificados por um método referido como SinalP. O SinalP utiliza uma rede neural combinada que reconhece tanto os peptídeos de sinais quanto seus sítios de divagem. (Nielsen (1997) Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites. Protein Engineering 10:1-6.
[00498] Em algumas modalidades, as enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção não possuem SPs e/ou pré-pró-sequências ou domínios. Em algumas modalidades, a invenção fornece as enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção que não possuem todo ou parte de um SP e/ou um pré-pró-domínio. Em algumas modalidades, a invenção fornece sequências de ácidos nucléicos que codifica uma sequência sinal (SP)
Petição 870170009999, de 15/02/2017, pág. 284/1247
275/788 e/ou pré-pró de uma enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase ligada de forma operacional a uma sequência de ácido nucléico de uma enzima aldolase diferente, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase ou, opcionalmente, pode ser desejada uma sequência sinal (SPs) e/ou um pré-pródomínio de uma proteína sem ser aldolase, tal como sem ser piruvato aldolase, por exemplo, sem ser HMG e/ou sem ser KHG aldolase. [00499] A invenção fornece ainda polipeptídeos isolados, sintéticos ou recombinantes que compreendem sequências de sinais (SPs), prépró-domínio e/ou domínios catalíticos (CDs) de acordo com a invenção e sequências heterólogas. As sequências heterólogas são sequências que não estão naturalmente associadas (tal como a uma enzima) com um SP, um pré-pró-domínio e/ou um CD. A sequência à qual o SP, o pré-pró-domínio e/ou o CD não está naturalmente associado pode estar na extremidade amino terminal, na extremidade carbóxi terminal do SP, do pré-pró-domínio e/ou do CD e/ou em ambas as extremidades do SP e/ou do CD. Em algumas modalidades, A presente invenção refere-se a polipeptídeos isolados, sintéticos ou recombinantes que compreendem (ou que consistem em) um polipeptídeo que compreende uma sequência sinal (SP), um pré-pró-domínio e/ou um domínio catalítico (CD) de acordo com a invenção contanto que não esteja associado com qualquer sequência à qual está naturalmente associado (tal como uma sequência de enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase). Similarmente, em algumas modalidades, a invenção fornece ácidos nucléicos isolados, sintéticos ou recombinantes que codificam estes polipeptídeos. Assim, em algumas modalidades, o ácido nucléico isolado, sintético ou recombinante de acordo com a invenção compreende uma sequência codificadora de uma sequência sinal (SP), um pré-pró-domínio e/ou um domínio catalítico (CD) de acordo com a invenção e uma sequência heteróloga (isto
Petição 870170009999, de 15/02/2017, pág. 285/1247
276/788 é, uma sequência que não está naturalmente associada com uma sequência sinal (SP), um pré-pró-domínio e/ou um domínio catalítico (CD) de acordo com a invenção). A sequência heteróloga pode estar na extremidade do terminal a 3', na extremidade do terminal a 5' e/ou em ambas as extremidades da sequência codificadora do SP, do prépró-domínio e/ou do CD.
Bibliotecas de Enzimas e Peptídeos Híbridos (quiméricos) de Aldolase, tal como Piruvato Aldolase, tal como HMG e/ou KHG Aldolase [00500] Em algumas modalidades, a invenção fornece enzimas e proteínas de fusão híbridas de aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, incluindo bibliotecas de peptídeos, que compreendem as sequências de acordo com a invenção. As bibliotecas de peptídeos de acordo com a invenção podem ser utilizadas para isolar moduladores peptídicos (tais como ativadores ou inibidores) de alvos, tais como substratos de enzimas, receptores, enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase enzima. As bibliotecas de peptídeos de acordo com a invenção podem ser utilizadas para identificar parceiros de ligação formais de alvos, tais como ligantes, tais como citocinas, hormônios e similares. Em algumas modalidades, a invenção fornece proteínas quiméricas que compreendem uma sequência sinal (SP), um pré-pró-domínio e/ou um domínio catalítico (CD) de acordo com a invenção ou uma combinação dos mesmos e uma sequência heteróloga (vide acima).
[00501] Em algumas modalidades, as proteínas de fusão de acordo com a invenção (tal como a porção de peptídeo) são estabilizadas de forma conformacional (em relação aos peptídeos linerares) para permitir uma afinidade de ligação maior em relação aos alvos. Em algumas modalidades, a invenção fornece fusões de enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção e outros peptídeos, incluindo peptídeos conhecidos e
Petição 870170009999, de 15/02/2017, pág. 286/1247
277/788 peptídeos aleatórios. Estes podem ser fundidos de tal maneira que a estrutura das enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase não é significativamente perturbada e o peptídeo é estabilizado de forma conformacional metabolicamente ou estruturalmente. Isto permite a criação de uma biblioteca de peptídeos que é facilmente monitorada tanto em relação à sua presença dentro das células quanto à sua quantidade.
[00502] As variações de sequências de aminoácidos de acordo com a invenção podem ser caracterizadas por uma natureza predeterminada da variação, uma característica que os separa de uma forma que ocorre naturalmente, tal como uma variação alélica ou interespécies de uma sequência de uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase. Em algumas modalidades, as variações de acordo com a invenção exibem a mesma atividade biológica qualitativa que o análogo que ocorre naturalmente. Alternativamente, as variações podem ser selecionadas por possuírem características modificadas. Em algumas modalidades, embora o sítio ou a região para a introdução de uma variação de sequência de aminoácidos seja predeterminada, a mutação per se não precisa ser predeterminada. Por exemplo, para otimizar o desempenho de uma mutação em um certo sítio, a mutagênese aleatória pode ser realizada no códon ou na região alvo e as variações de enzimas aldolases expressas, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase podem ser selecionadas em relação à combinação ótima de atividade desejada. As técnicas para produzir mutações por substituição em sítios predeterminados no DNA que possuem uma sequência conhecida são bemconhecidas, como discutido aqui, por exemplo, mutagênese com iniciador M13 e mutagênese por PCR. A seleção dos mutantes pode ser feita utilizando, tal como ensaios de formação ou de divagem de ligações carbono-carbono. Em outras modalidades, as substituições de
Petição 870170009999, de 15/02/2017, pág. 287/1247
278/788 aminoácidos podem ser resíduos isolados; as inserções podem ser na ordem de aproximadamente 1 até 20 aminoácidos, embora inserções consideravelmente maiores possam ser feitas. As deleções podem variar de aproximadamente 1 até aproximadamente 20, 30, 40, 50, 60, 70 resíduos ou mais. Para a obtenção de um derivado final com as propriedades ótimas, substituições, deleções, inserções ou qualquer combinação das mesmas pode ser utilizada. Geralmente, estas alterações são feitas em alguns aminoácidos para minimizar a alteração da molécula. Entretanto, alterações maiores podem ser toleradas em certas circunstâncias.
[00503] A invenção fornece enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase em que a estrutura da base estrutural polipeptídica, a estrutura secundária ou a terciária, tal como uma estrutura em alfa-hélice ou em folha beta, foi modificada. Em algumas modalidades, a carga ou a hidrofobicidade foi modificada. Em algumas modalidades, a massa de uma cadeia lateral foi modificada. Alterações substanciais na função ou na identidade imunológica são feitas através da seleção de substituições que são menos conservativas. Por exemplo, podem ser feitas substituições que afetam mais significativamente: a estrutura da base estrutural polipeptídica na área da alteração, por exemplo, uma estrutura em alfa-hélice ou em folha beta; uma carga ou um sítio hidrofóbico da molécula, que pode estar em um sítio ativo; ou uma cadeia lateral. Em algumas modalidades, a invenção fornece substituições no polipeptídeo de acordo com a invenção em que (a) um resíduo hidrophílico, tal como serila ou treonila, é substituído por um resíduo hidrofóbico, tal como leucila, isoleucila, fenilalanila, valila ou alanila; (b) uma cisteína ou uma prolina é substituída por qualquer outro resíduo; (c) um resíduo que possui uma cadeia lateral eletropositiva, tal como lisila, arginila ou histidila, é substituído por um resíduo eletronegativo, tal como glutamila ou aspartila; ou
Petição 870170009999, de 15/02/2017, pág. 288/1247
279/788 (d) um resíduo que possui uma cadeia lateral volumosa, tal como fenilalanina, é substituído por um que não possui uma cadeia lateral, tal como glicina. As variações podem exibir a mesma atividade biológica qualitativa (isto é, uma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase) embora as variações possam ser selecionadas para modificar as características das enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase quando necessário.
[00504] Em algumas modalidades, as enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção compreendem epítopos ou marcações para purificação, sequências de sinais ou outras sequências de fusão etc. Em algumas modalidades, as enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção podem ser fundidas com um peptídeo aleatório para formar um polipeptídeo de fusão. Por fundido ou ligado de forma operacional entende-se aqui que o peptídeo aleatório e a enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase estão ligados juntos, de tal maneira a minimizar a quebra da estabilidade da estrutura da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, de forma que mantenha a atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase. O polipeptídeo de fusão (ou o polinucleotídeo de fusão que codifica o polipeptídeo de fusão) pode compreender componentes adicionais bem como, incluir vários peptídeos em várias alças.
[00505] Em algumas modalidades, os peptídeos e os ácidos nucléicos que os codificam são produzidos de forma aleatória, de forma completamente aleatória ou estão inclinados à sua randomização, tal como na freqüência de nucleotídeos/resíduos geral ou por posição. Randomizado significa que cada ácido nucléico e peptídeo consiste
Petição 870170009999, de 15/02/2017, pág. 289/1247
280/788 essencialmente de nucleotídeos e aminoácidos aleatórios, respectivamente. Em algumas modalidades, os ácidos nucléicos que dão origem aos peptídeos podem ser sintetizados quimicamente e assim podem incorporar qualquer nucleotídeo em qualquer posição. Assim, quando os ácidos nucléicos são expressos para formar peptídeos, qualquer resíduo de aminoácido pode ser incorporado em qualquer posição. O processo de síntese pode ser planejado para gerar ácidos nucléicos aleatórios, para permitir a formação de todas ou da maior parte das combinações possíveis ao longo do comprimento do ácido nucléico, formando assim uma biblioteca de ácidos nucléicos aleatórios. A biblioteca pode fornecer uma população com estrutura suficientemente diversa de produtos de expressão aleatórios para afetar uma faixa com probabilidade suficiente de respostas celulares para fornecer uma ou mais células que exibem uma resposta desejada. Assim, a invenção fornece bibliotecas de interação grandes o suficiente de forma que pelo menos um de seus membros tenha uma estrutura que forneça sua afinidade para alguma molécula, proteína ou outro fator.
[00506] Em algumas modalidades, uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase de acordo com a invenção é uma enzima com vários domínios que compreende um peptídeo sinal, um módulo de ligação a carboidratos, um domínio catalítico de enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase, um ligante e/ou um outro domínio catalítico.
[00507] A invenção fornece métodos e sequências para produzir polipeptídeos quiméricos que podem codificar polipeptídeos híbridos biologicamente ativos (tais como enzimas aldolases híbridas, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase). Em algumas modalidades, os poli nucleotídeos originais (tal como um ácido nucléico de acordo com a invenção) codificam polipeptídeos biologicamente ativos. Em algumas modalidades, um método de acordo com a invenPetição 870170009999, de 15/02/2017, pág. 290/1247
281/788 ção produz novos polipeptídeos híbridos através da utilização de processos celulares que integram a sequência dos polinucleotídeos originais de forma que o polinucleotídeo híbrido resultante codifica um polipeptídeo que demonstra atividades derivadas, mas diferentes, da dos polipeptídeos biologicamente ativos originais (tal como aldolase ou anticorpo de acordo com a invenção). Por exemplo, os polinucleotídeos originais podem codificar uma enzima particular (tal como aldolase) partindo ou encontrada em microorganismos diferentes. Uma enzima codificada por um primeiro polinucleotídeo de um organismo ou variação pode, por exemplo, funcionar eficientemente sob uma condição ambiental particular, tal como alta salinidade. Uma enzima codificada por um segundo polinucleotídeo de um organismo diferente ou variação pode funcionar eficientemente sob uma condição ambiental diferente, tal como temperaturas extremamente altas. Um polinucleotídeo híbrido que contém sequências provenientes dos primeiro e segundo polinucleotídeos originais pode codificar uma enzima que exibe características de ambas as enzimas codificadas pelos polinucleotídeos originais. Assim, a enzima codificada pelo polinucleotídeo híbrido de acordo com a invenção pode funcionar eficientemente sob condições ambientais compartilhadas por cada uma das enzimas codificadas pelos primeiro e segundo polinucleotídeos, tais como alta salinidade e temperaturas extremas.
[00508] Em algumas modalidades, um polipeptídeo híbrido gerado através de um método de acordo com a invenção pode exibir atividade enzimática especializada não exibida nas enzimas originais. Por exemplo, após a recombinação e/ou o reaporção redutor de polinucleotídeos que codificam enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, o polipeptídeo híbrido resultante codificado por um polinucleotídeo híbrido pode ser verificado em relação a atividades enzimáticas especializadas sem ser de aldolase, tal
Petição 870170009999, de 15/02/2017, pág. 291/1247
282/788 como sem ser piruvato aldolase, tal como sem ser HMG e/ou sem ser KHG-aldolase, tais como atividades de hidrolase, peptidase, fosforilase etc., obtidas de cada uma das enzimas originais. Em algumas modalidades, o polipeptídeo híbrido é verificado para determinar tais funcionalidades químicas que distinguem o polipeptídeo híbrido dos polipeptídeos parentais originais, tal como a temperatura, o pH ou a concentração de sal em que o polipeptídeo híbrido funciona.
[00509] Em algumas modalidades, a presente invenção refere-se a um método para a produção de um polipeptídeo híbrido biologicamente ativo e para a verificação de tal polipeptídeo em relação à maior atividade através de:
[00510] 1) introdução de pelo menos um primeiro polinucleotídeo em ligação operacional e um segundo polinucleotídeo em ligação operacional, pelo menos o primeiro polinucleotídeo e segundo polinucleotídeo compartilhando pelo menos uma região de homologia de sequência parcial, em uma célula hospedeira adequada;
[00511] 2) cultivo da célula hospedeira sob condições que promovem a reorganização da sequência resultante em um polinucleotídeo híbrido em ligação operacional;
[00512] 3) expressão de um polipeptídeo híbrido codificado pelo polinucleotídeo híbrido;
[00513] 4) seleção do polipeptídeo híbrido sob condições que promovem a identificação de maior atividade biológica; e [00514] 5) isolamento do polinucleotídeo que compreende o polipeptídeo híbrido.
Isolamento e Descoberta de Enzimas Aldolases [00515] A invenção fornece métodos para o isolamento e para a descoberta de enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolases e dos ácidos nucléicos que as codificam. Os polinucleotídeos ou as enzimas podem ser isoladas partindo de organismos inPetição 870170009999, de 15/02/2017, pág. 292/1247
283/788 dividuais (isolados), coleções de organismos que foram cultivados em meios definidos (enriquecimento de culturas) ou organismos não cultivados (amostras ambientais). Os organismos podem ser isolados através de, tal como peneiração biológica in vivo (vide a discussão, abaixo). O uso de uma abordagem independente de cultura para produzir polinucleotídeos que codificam novas atividades biológicas partindo de amostras ambientais é mais preferível porque permite acessar recursos que não foram aproveitados de biodiversidade. Os polinucleotídeos ou as enzimas também podem ser isolados de qualquer um de vários organismos, tais como bactérias. Em adição, células, polinucleotídeos ou enzimas integrais também podem ser isoladas partindo de preparações enzimáticas brutas derivadas de culturas destes organismos, tais como bactérias.
[00516] Bibliotecas ambientais são geradas partindo de amostras ambientais e representam os genomas coletivos de organismos que ocorrem naturalmente arquivados em vetores de clonagem que podem ser propagados em hospedeiros procarióticos adequados. Devido ao fato de que o DNA clonado é inicialmente extraído diretamente das amostras ambientais, as bibliotecas não estão limitadas à pequena fração de procariotos que podem ser cultivados em cultura pura. Adicionalmente, uma normalização do DNA ambiental presente nestas amostras podería permitir uma representação mais equivalente do DNA proveniente de todas as espécies presentes na amostra original. Isto pode aumentar drasticamente a eficiência de descoberta de genes interessantes partindo de constituintes em menor quantidade da amostra que podem ser sub-representados em várias ordens de grandeza comparados com as espécies dominantes.
[00517] Em algumas modalidades, as bibliotecas gênicas geradas partindo de um ou mais microorganismos não cultivados são verificadas em relação a uma atividade de interesse. As vias potenciais que
Petição 870170009999, de 15/02/2017, pág. 293/1247
284/788 codificam moléculas bioativas de interesse são primeiramente capturadas em células procarióticas na forma de bibliotecas de expressão gênica. Em algumas modalidades, os polinucleotídeos que codificam as atividades de interesse são isolados de tais bibliotecas e introduzidos em uma célula hospedeira. A célula hospedeira é cultivada sob condições que promovem a recombinação e/ou o reaporção redutor criando biomoléculas potencial mente ativas com atividades novas ou maiores.
[00518] A peneiração biológica in vivo pode ser realizada utilizando máquinas baseadas em FACS e sem serem óticas (tais como magnéticas). Em algumas modalidades, as bibliotecas gênicas complexas são construídas com vetores que contêm elementos que estabilizam o RNA transcrito. Por exemplo, a inclusão de sequências que resultam em estruturas secundárias tais como grampos que são planejados para flanquear as regiões transcritas do RNA serviríam para aumentar sua estabilidade, aumentando assim sua meia-vida dentro da célula. As moléculas de sonda utilizadas no processo de peneiração biológica consistem em oligonucleotídeos marcados com moléculas repórteres que emitem fluorescência apenas após a ligação da sonda com uma molécula alvo. Estas sondas são introduzidas nas células recombinantes partindo da biblioteca utilizando um de vários métodos de transformação. As moléculas de sonda se ligam ao mRNA alvo transcrito resultando em moléculas em heteroduplex de DNA/RNA. A ligação da sonda com um alvo produzirá um sinal fluorescente que é detectado e selecionado pela máquina de FACS durante o processo de seleção.
[00519] Em algumas modalidades, a subclonagem é realizada para isolar adicionalmente sequências de interesse. Na subclonagem, uma parte de DNA é amplificada, digerida, geralmente por enzimas de restrição, para cortar a sequência desejada, a sequência desejada é ligaPetição 870170009999, de 15/02/2017, pág. 294/1247
285/788 da em um vetor receptor e é amplificada. Em cada etapa na subclonagem, a parte é verificada em relação à atividade de interesse, para garantir que o DNA que codifica a proteína estrutural não foi excluído. O inserto pode ser purificado em qualquer etapa da subclonagem, por exemplo, através de eletroforese em gel antes da ligação em um vetor ou quando as células que contêm o vetor receptor e as células que não contêm o vetor receptor são colocadas em meios seletivos contendo, por exemplo, um antibiótico, que matará as células que não contêm o vetor receptor. Os métodos específicos de subclonagem de insertos de cDNA em vetores são bem-conhecidos na técnica (Sambrook e outros, Molecular Cloning: A Laboratory Manual, 2- Ed^, Cold Spring Harbor Laboratory Press (1989)). Em outras modalidades, as enzimas de acordo com a invenção são subclones. Tais subclones podem diferir do clone original, por exemplo, em comprimento, uma mutação, um tag ou uma marcação.
[00520] Os microorganismos dos quais o polinucleotídeo pode ser descoberto, isolado ou preparado incluem microorganismos procarióticos, tais como Eubacteria e Archaebacteria e microorganismos eucarióticos inferiores tais como fungos, algumas algas e protozoários. Os polinucleotídeos podem ser descobertos, isolados ou preparados partindo de amostras ambientais em cujo caso o ácido nucléico pode ser recuperado sem o cultivo de um organismo ou recuperado partindo de um ou mais organismos cultivados. Em algumas modalidades, tais microorganismos podem ser extremófilos, tais como hipertermófilos, psicrófilos, psicrotróficos, halófilos, barófilos e acidófilos. Podem ser utilizados os polinucleotídeos que codificam enzimas isoladas de microorganismos extremofílicos. As enzimas desta invenção podem funcionar a temperaturas acima de 100Ό, tais como as encontradas em fontes quentes terrestres e ventos térmicos da profundeza do mar ou a temperaturas abaixo de 0Ό, tais como as encontradas e m águas árticas,
Petição 870170009999, de 15/02/2017, pág. 295/1247
286/788 em ambiente saturado com sal, tal como o encontrado no Mar Morto, em valores de pH em torno de 0, tais como os encontrados em depósitos de carvão e fontes geotérmicas ricas em enxofre ou em valores de pH maiores que 11, tais como os encontrados em lama de esgoto. Em algumas modalidades, as enzimas de acordo com a invenção possuem alta atividade ao longo de toda uma faixa ampla de temperaturas e pHs.
[00521] Os polinucleotídeos selecionados e isolados como descrito anteriormente aqui são introduzidos em uma célula hospedeira adequada. Uma célula hospedeira adequada é qualquer célula que é capaz de promover a recombinação e/ou o reaporção redutor. Os polinucleotídeos selecionados, em algumas modalidades, já estão em um vetor que inclui sequências de controle apropriadas. A célula hospedeira pode ser uma célula eucariótica superior, tal como uma célula de mamífero ou uma célula eucariótica inferior, tal como uma célula de levedura ou, em algumas modalidades, a célula hospedeira pode ser uma célula procariótica, tal como uma célula bacteriana. A introdução do constructo na célula hospedeira pode ser realizada através da transfecção com fosfato de cálcio, transfecção mediada por DEAEDextrano ou eletroporação.
[00522] Os exemplos de hospedeiros incluem células bacterianas, tais como E. coli, Streptomyces, Salmonella typhimuriurrr, células de fungo, tal como levedura; células de insetos tais como Drosophila S2 e Spodoptera Sf9\ células de animais tal como CHO, COS ou melanoma de Bowes; adenovírus; e células vegetais; vide a discussão anterior. A seleção de um hospedeiro apropriado é considerada como estando dentro do âmbito dos versados na técnica partindo dos ensinamentos contidos aqui.
[00523] Vários sistemas de cultura de células de mamíferos podem ser empregados para expressar uma proteína recombinante; os exemPetição 870170009999, de 15/02/2017, pág. 296/1247
287/788 pios de sistemas de expressão de mamíferos incluem as linhagens COS-7 de fibroblastos de rins de macaco, descritas em SV40transformed simian cells support the replication of early SV40 mutants (Gluzman, 1981) e outras linhagens de células capazes de expressar um vetor compatível, por exemplo, as linhagens de células C127, 3T3, CHO, HeLa e BHK. Os vetores de expressão de mamífero podem compreender uma origem de replicação, um promotor e um intensificador adequados e também quaisquer sítios de ligação de ribossomos necessários, sítio de poliadenilação, sítios doadores e receptores de processamento, sequências de término da transcrição e sequências não transcritas flanqueadoras a 5'. As sequências de DNA derivadas dos sítios de processamento e de poliadenilação de SV40 podem ser utilizadas para fornecer os elementos genéticos não transcritos necessários.
[00524] Em outras modalidades, os ácidos nucléicos, os polipeptídeos e os métodos de acordo com a invenção são utilizados em vias bioquímicas ou para gerar novos polinucleotídeos que codificam vias bioquímicas partindo de um ou mais óperons ou aporçãos gênicos ou partes dos mesmos. Por exemplo, bactérias e muitos procariotos possuem um mecanismo coordenado para regular genes cujos produtos estão envolvidos em processos relacionados. Os genes são agrupados em estruturas referidas como aporçãos gênicos, em um único cromossomo e são transcritos juntos sob o controle de uma única sequência reguladora, incluindo um único promotor que inicia a transcrição do aporção inteiro. Assim, um aporção gênico é um grupo de genes adjacentes que são idênticos ou relacionados, geralmente em relação a sua função (um exemplo de uma vide bioquímica codificada por aporçãos gênicos são policetídeos).
[00525] Em algumas modalidades, o DNA do aporção gênico é isolado partindo de organismos diferentes e ligados em vetores, tais coPetição 870170009999, de 15/02/2017, pág. 297/1247
288/788 mo vetores que contêm sequências reguladoras da expressão que podem controlar e regular a produção de uma proteína detectável ou a atividade do arranjo relacionado com a proteína partindo dos aporçãos gênicos ligados. O uso de vetores que possuem uma capacidade excepcionalmente grande para a introdução de DNA exógeno pode ser apropriado para o uso com tais aporçãos gênicos e são descritos com a finalidade de exemplo aqui como incluindo o fator f (ou fator de fertilidade) de E. coli. Este fator f de E. coli é um plasmídeo que realiza uma transferência em alta freqüência dele mesmo durante a conjugação e é ideal para atingir e propagar de forma estável fragmentos de DNA grandes, tais como aporçãos gênicos provenientes de amostras microbianas misturadas. Em uma modalidade, os vetores de clonagem, referidos como fosmídeos ou vetores de cromossomo artificial bacteriano (BAC) são utilizados. Estes são derivados do fator f de E. coli que é capaz de integrar de forma estável segmentos grandes de DNA genômico. Quando integrado com o DNA proveniente de uma amostra ambiental não cultivada misturada, torna possível atingir fragmentos genômicos grandes na forma de uma biblioteca de DNA ambiental estável. Um outro tipo de vetor para uso na presente invenção é um vetor de cosmídeo. Os vetores de cosmídeo foram originalmente planejados para clonar e propagar sementos grandes de DNA genômico. A clonagem em vetores de cosmídeo é descrita em detalhes em Sambrook e outros, Molecular Cloning: A Laboratory Manual, 2- Ed., Cold Spring Harbor Laboratory Press (1989). Uma vez ligados em um vetor apropriado, dois ou mais vetores contendo aporçãos gênicos de policetídeo sintase diferentes podem ser introduzidos em uma célula hospedeira adequada. As regiões de homologia de sequência parcial compartilhadas pelos aporçãos gênicos promoverão processos que resultam na reorganização de sequências em um aporção gênico híbrido. O novo aporção gênico híbrido pode então ser verificado em rePetição 870170009999, de 15/02/2017, pág. 298/1247
289/788 lação a maiores atividades não observadas nos aporçãos gênicos originais.
[00526] Os métodos para a verificação em relação a várias atividades enzimáticas são conhecidos pelos versados na técnica e são discutidos ao longo de todo o presente relatório descritivo, vide os Exemplos 1, 2 e 3, abaixo. Tais métodos podem ser empregados quando são isolados os polipeptídeos e os polinucleotídeos de acordo com a invenção.
[00527] Em algumas modalidades, a invenção fornece métodos para a descoberta e para o isolamento de aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase ou compostos para modificar a atividade destas enzimas, utilizando uma abordagem celular (vide a discussão, abaixo). Podem ser selecionados os supostos clones que codificam aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase partindo da biblioteca de DNA genômico.
[00528] Metodologias de Seleção e Dispositivos de Monitoramento On-Line [00529] Na prática dos métodos de acordo com a invenção, uma variedade de aparelhos e metodologias pode ser utilizada em associação com os polipeptídeos e os ácidos nucléicos de acordo com a invenção, tal como para selecionar polipeptídeos em relação à atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, para selecionar compostos como moduladores potenciais, tais como ativadores ou inibidores, de uma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, para anticorpos que se ligam a um polipeptídeo de acordo com a invenção, para ácidos nucléicos que se hibridizam com um ácido nucléico de acordo com a invenção, para selecionar células que expressam um polipeptídeo de acordo com a invenção e similares. Em adição, aos formatos de arranjos descritos em detalhes abaixo para a vePetição 870170009999, de 15/02/2017, pág. 299/1247
290/788 rificação de amostras, também podem ser utilizados formatos alternativos para a prática dos métodos de acordo com a invenção. Tais formatos incluem, por exemplo, espectrômetros de massa, cromatógrafos, tal como HPLC de alta circulação e outras formas de cromatografia líquida e formatos menores, tais como placas de 1536 cavidades, placas de 384 cavidades e assim por diante. Os apartos de seleção de alta circulação podem ser adaptados e utilizados para a prática dos métodos de acordo com a invenção, vide os Pedidos de Patentes U.S. N— 20020001809; 20050272044.
Arranjos de Capilares [00530] Os ácidos nucléicos ou os polipeptídeos de acordo com a invenção podem ser imobilizados ou aplicados em um arranjo. Os arranjos podem ser utilizados para verificar ou monitorar bibliotecas de composições (tais como moléculas pequenas, anticorpos, ácidos nucléicos etc.) em relação à sua capacidade de se ligar a ou de modular a atividade de um ácido nucléico ou de um polipeptídeo de acordo com a invenção. Os arranjos de capilares, tal como o GIGAMATRIX®, Diversa Corporation, San Diego, CA; e arranjos descritos em, tal como o Pedido de Patente U.S. N° 20020080350 A1; WO 023120 3 A; WO 0244336 A, fornecem um aparato alternativo para sustentar e verificar amostras. Em algumas modalidades, o arranjo de capilares inclui um grande número de capilares formadas dentro de um arranjo de capilares adjacentes, em que cada capilar compreende pelo menos uma parede que define um lúmen para manter uma amostra. O lúmen pode ser cilíndrico, quadrado, hexagonal ou qualquer outra forma geométrica contanto que as paredes formem um lúmen para a retenção de um líquido ou de uma amostra. Os capilares do arranjo de capilares podem ser mantidos juntos em proximidade íntima para formar uma estrutura planar. Os capilares podem ser ligados juntos, sendo fundidos (tal como quando os capilares são feitos de vidro), colados, ligados ou
Petição 870170009999, de 15/02/2017, pág. 300/1247
291/788 apertados lado a lado. Adicionalmente, o arranjo de capilares pode incluir material intersticial disposto entre capilares adjacentes no arranjo, formando assim um dispositivo planar sólido contendo um grande número de orifícios lado a lado.
[00531] Um arranjo de capilares pode ser formado de qualquer número de capilares individuais, por exemplo, uma faixa de 100 até 4.000.000 de capilares. Ainda, um arranjo de capilares que possui aproximadamente 100.000 ou mais capilares individuais pode ser formado no tamanho e no formato padronizados de uma placa Microtiter® para encaixe dentro de um equipamento de laboratório padronizado. Os lumens são preenchidos manualmente ou automaticamente utilizando a ação dos capilares ou microinjeção utilizando uma agulha fina. As amostras de interesse podem ser subseqüentemente removidas dos capilares individuais para análise ou caracterização adicional. Por exemplo, uma sonda similar a uma agulha fina é posicionada em comunicação fluida com um capilar selecionado para adicionar ou remover material do lúmen.
[00532] Em um ensaio de seleção em um único recipiente, os componentes do ensaio são misturados fornecendo uma solução de interesse, antes da inserção dentro do arranjo de capilares. O lúmen é preenchido através da ação dos capilares quando pelo menos uma parte do arranjo é imersa em uma solução de interesse. Reações e/ou atividade química ou biológica em cada capilar é monitorada em relação a eventos detectáveis. Um evento detectável é freqüentemente referido como uma coincidência, que pode geralmente ser distinguida de uma não coincidência produzindo capilares através da detecção ótica. Assim, os arranjos de capilares permitem ponderosamente uma detecção paralela de coincidências.
[00533] Em um ensaio de seleção em vários recipientes, um polipeptídeo ou um ácido nucléico, tal como um ligante, pode ser introduPetição 870170009999, de 15/02/2017, pág. 301/1247
292/788 zido em um primeiro componente, que é introduzido em pelo menos uma parte de um capilar de um arranjo de capilares. Uma bolha de ar pode então ser introduzida no capilar atrás do primeiro componente. Um segundo componente pode então ser introduzido no capilar, em que o segundo componente é separado do primeiro componente pela bolha de ar. O primeiro e o segundo componentes podem então ser misturados através da aplicação de pressão hidrostática em ambos os lados do arranjo de capilares para haver colapso com a bolha. O arranjo de capilares é então monitorado em relação a um evento detectável resultante da reação ou de uma não reação dos dois componentes.
[00534] Em um ensaio de seleção de ligação, uma amostra de interesse pode ser introduzida na forma de um primeiro líquido marcado com uma partícula detectável dentro de um capilar de um arranjo de capilaridades, em que o lúmen do capilar é revestido com um material de ligação para a ligação da partícula detectável ao lúmen. O primeiro líquido pode ser então removido do tubo capilar, em que a partícula detectável ligada é mantida dentro do capilar e um segundo líquido pode ser introduzido dentro do tubo capilar. O capilar é então monitorado em relação a um evento detectável resultante da reação ou da não reação da partícula com o segundo líquido.
Arranjos ou Biochips [00535] Os ácidos nucléicos ou os polipeptídeos de acordo com a invenção podem ser imobilizados a ou aplicados em um arranjo. Os arranjos podem ser utilizados para selecionar ou monitorar bibliotecas de composições (tais como moléculas pequenas, anticorpos, ácidos nucléicos etc.) em relação a sua capacidade de se ligar a ou de modular a atividade de um ácido nucléico ou de um polipeptídeo de acordo com a invenção. Por exemplo, em algumas modalidades da invenção, um parâmetro monitorado é a expressão do produto da transcrição de
Petição 870170009999, de 15/02/2017, pág. 302/1247
293/788 um gene de uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase. Um ou mais ou todos os produtos da transcrição de uma célula podem ser medidos através da hibridização de uma amostra que compreende os produtos da transcrição da célula ou os ácidos nucléicos representativos de ou complementares aos produtos da transcrição de uma célula, através da hybridização com ácidos nucléicos imobilizados sobre um arranjo ou um biochip. Utilizando um arranjo de ácidos nucléicos sobre um microchip, alguns ou todos os produtos da transcrição de uma célula podem ser quantificados simultaneamente. Alternativamente, os arranjos que compreendem ácido nucléico genômico também podem ser utilizados para determinar o genótipo de uma cepa recém-engenheirada produzida através dos métodos de acordo com a invenção. Os arranjos de polipeptídeos também podem ser utilizados para quantificar simultaneamente um grande número de proteínas. A presente invenção pode ser praticada com qualquer arranjo conhecido, também referido como um microarranjo ou um arranjo de ácido nucléico ou um arranjo de polipeptídeo ou um arranjo de anticorpo ou um biochip ou uma variação dos mesmos. Os arranjos são genericamente um grande número de pontos ou elementos alvos, cada elemento alvo compreendendo uma quantidade definida de uma ou mais moléculas biológicas, tais como oligonucleotídeos, imobilizados sobre uma área definida de uma superfície de substrato para a ligação específica com uma molécula da amostra, tal como produtos da transcrição de mRNA.
[00536] O termo arranjo ou microarranjo ou biochip ou chip como utilizado aqui é um grande número de elementos alvos, cada elemento alvo compreendendo uma quantidade definida de um ou mais polipeptídeos (incluindo anticorpos) ou ácidos nucléicos imobilizados sobre uma área definida de uma superfície de substrato, como discutido em detalhes adicionais, abaixo.
Petição 870170009999, de 15/02/2017, pág. 303/1247
294/788 [00537] Na prática dos métodos de acordo com a invenção, qualquer arranjo e/ou método conhecido de produção e de utilização dos arranjos pode ser incorporado total mente ou em parte ou variações do mesmo, como descrito, por exemplo, nas Patentes U.S. N— 6.277.628; 6.277.489; 6.261.776; 6.258.606; 6.054.270; 6.048.695; 6.045.996; 6.022.963; 6.013.440; 5.965.452; 5.959.098; 5.856.174; 5.830.645; 5.770.456; 5.632.957; 5.556.752; 5.143.854; 5.807.522; 5.800.992; 5.744.305; 5.700.637; 5.556.752; 5.434.049; vide também, tal como WO 99/51773; WO 99/09217; WO 97/46313; WO 96/17958; vide também, tal como Johnston (1998) Curr. Biol. 8:R171-R174; Schummer (1997) Biotechniques 23:1087-1092; Kern (1997) Biotechniques 23:120-124; Solinas-Toldo (1997) Genes, Chromosomes & Câncer 20:399-407; Bowtell (1999) Nature Genetics Supp. 21:25-32. Vide também os pedidos de patentes U.S. publicados N— 20010018642; 20010019827; 20010016322; 20010014449; 20010014448;
20010012537; 20010008765.
Anticorpos e Métodos de Seleção Baseados em Anticorpos [00538] A invenção fornece anticorpos isolados, sintéticos ou recombinantes que se ligam especificamente a uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase de acordo com a invenção. Estes anticorpos podem ser utilizados para isolar, identificar ou quantificar as enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção ou polipeptídeos relacionados. Estes anticorpos podem ser utilizados para isolar outros polipeptídeos dentro do âmbito da invenção ou outras enzimas aldolases relacionadas, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase. Os anticorpos podem ser planejados para se ligarem a um sítio ativo de uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase. Assim, a invenção fornece métodos de inibição de enzimas aldolases, tal como piruvato aldolase, tal como HMG
Petição 870170009999, de 15/02/2017, pág. 304/1247
295/788 e/ou KHG aldolase utilizando os anticorpos de acordo com a invenção (vide a discussão anterior em relação às aplicações de composições anti-enzima aldolase, tal como antipiruvato aldolase, tal como antiHMG e/ou anti-KHG aldolase de acordo com a invenção).
[00539] O termo anticorpo inclui um peptídeo ou um polipeptídeo derivado de, modelado após ou codificado substancialmente por um gene de imunoglobulina ou genes de imunoglobulinas ou fragmentos dos mesmos, capaz de se ligar especificamente a um antígeno ou a um epítopo, vide Fundamental Immunology, Terceira Edição, W.E. Paul, ed., Raven Press, N.Y. (1993); Wilson (1994) J. Immunol. Methods 175:267-273; Yarmush (1992) J. Biochem. Biophys. Methods 25:85-97. O termo anticorpo inclui partes que se ligam a antígenos, isto é, sítios de ligação a antígenos, (tais como fragmentos, subsequências, regiões de determinação da complementaridade (CDRs)) que mantêm a capacidade de se ligarem a um antígeno, incluindo (i) um fragmento FAB, um fragmento monovalente que consiste dos domínios VL, VH, CL e CH1; (ii) um fragmento F(ab')2, um fragmento bivalente compreendendo dois fragmentos Fab ligados por uma ponte bissulfeto na região da junção; (iii) um fragmento Fd que consiste dos domínios VH e CH1; (iv) um fragmento Fv que consiste dos domínios VL e VH de um único braço de um anticorpo, (v) um fragmento dAb (Ward e outros, (1989) Nature 341:544-546), que consiste em um domínio VH; e (vi) uma região de determinação da complementaridade (CDR) isolada. Os anticorpos de cadeia simples são também incluídos como referência no termo anticorpo.
[00540] A invenção fornece fragmentos das enzimas de acordo com a invenção (tais como peptídeos) incluindo fragmentos imunogênicos (tais como subsequências) de um polipeptídeo de acordo com a invenção. Em algumas modalidades, a invenção fornece composições que compreendem um polipeptídeo ou um peptídeo de acordo com a inPetição 870170009999, de 15/02/2017, pág. 305/1247
296/788 venção e adjuvantes ou veículos e similares.
[00541] Os anticorpos podem ser utilizados na imunoprecipitação, na coloração, em colunas de imunoafinidade e similares. Se desejado, as sequências de ácidos nucléicos que codificam antígenos específicos podem ser geradas através da imunização seguida pelo isolamento do polipeptídeo ou do ácido nucléico, da amplificação ou da clonagem e da imobilização do polipeptídeo sobre um arranjo de acordo com a invenção. Alternativamente, os métodos de acordo com a invenção podem ser utilizados para modificar a estrutura de um anticorpo produzido por uma célula que será modificado, tal como a afinidade de um anticorpo pode ser aumentada ou diminuída. Além disso, a capacidade de produzir ou de modificar anticorpos pode ser um fenótipo engenheirado em uma célula através dos métodos de acordo com a invenção.
[00542] Os métodos de imunização, produção e isolamento de anticorpos (policlonais e monoclonais) são conhecidos pelos versados na técnica e são descritos na literatura científica e de patente, vide Coligan, CURRENT PROTOCOLS IN IMMUNOLOGY, Wiley/Greene, NY (1991); Stites (eds.) BASIC AND CLINICAL IMMUNOLOGY (7â ed.) Lange Medicai Publications, Los Altos, CA (Stites); Goding, MONOCLONAL ANTIBODIES: PRINCIPLES AND PRACTICE (2â ed.) Academic Press, Nova Iorque, NY (1986); Kohler (1975) Nature 256:495; Harlow (1988) ANTIBODIES, A LABORATORY MANUAL, Cold Spring Harbor Publications, Nova Iorque. Os anticorpos também podem ser produzidos in vitro, tal como utilizando bibliotecas de exibição por fagos expressando sítios de ligação a anticorpos recombinantes, em adição aos métodos tradicionais in vivo utilizando animais. Vide, Hoogenboom (1997) Trends Biotechnol. 15:62-70; Katz (1997) Annu. Rev. Biophys. Biomol. Struct. 26:27-45.
[00543] Os polipeptídeos de acordo com a invenção ou fragmentos
Petição 870170009999, de 15/02/2017, pág. 306/1247
297/788 que compreendem pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 ou 150 aminoácidos consecutivos dos mesmos, podem também ser utilizados para produzir anticorpos que se ligam especificamente aos polipeptídeos ou aos fragmentos. Os anticorpos resultantes podem ser utilizados em procedimentos de cromatografia por imunoafinidade para isolar ou purificar o polipeptídeo ou para determinar se o polipeptídeo está presente em uma amostra biológica. Em tais procedimentos, uma preparação de proteína, tal como um extrato ou uma amostra biológica é colocada em contato com um anticorpo capaz de se ligar especificamente a um dos polipeptídeos de acordo com a invenção ou a fragmentos que compreendem pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 ou 150 aminoácidos consecutivos dos mesmos.
[00544] Nos procedimentos de imunoafinidade, o anticorpo é ligado a um suporte sólido, tal como uma conta ou outra matriz de coluna. A preparação de proteína é colocada em contato com o anticorpo sob condições em que o anticorpo se liga especificamente a um dos polipeptídeos de acordo com a invenção ou a um fragmento dos mesmos. Após uma lavagem para remover proteínas ligadas de forma não específica, os polipeptídeos ligados especificamente são eluídos.
[00545] A capacidade das proteínas em uma amostra biológica de se ligar ao anticorpo pode ser determinada utilizando uma variedade de procedimentos familiares aos versados na técnica. Por exemplo, a ligação pode ser determinada através da marcação do anticorpo com uma marcação detectável tal como um agente fluorescente, uma marcação enzimática ou um radioisótopo. Alternativamente, a ligação do anticorpo à amostra pode ser detectada utilizando um anticorpo secundário que possui tal marcação detectável sobre o mesmo. Os ensaios particulares incluem ensaios de ELISA, ensaios em sanduíche, ensaios radioimunológicos e Western Blots.
Petição 870170009999, de 15/02/2017, pág. 307/1247
298/788 [00546] Os anticorpos policlonais gerados contra os polipeptídeos de acordo com a invenção ou fragmentos que compreendem pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 ou 150 aminoácidos consecutivos dos mesmos podem ser obtidos através da injeção direta dos polipeptídeos em um animal ou através da administração dos polipeptídeos a um animal, por exemplo, um não humano. O anticorpo obtido dessa maneira pode se ligar ao próprio polipeptídeo. Dessa maneira, mesmo uma sequência que codifica apenas um fragmento do polipeptídeo pode ser utilizada para produzir anticorpos que podem se ligar ao polipeptídeo nativo inteiro. Tais anticorpos podem então ser utilizados para isolar o polipeptídeo das células que expressam tal polipeptídeo.
[00547] Para a preparação de anticorpos monoclonais, qualquer técnica que forneça os anticorpos produzidos por culturas de linhagens de células contínuas pode ser utilizada. Os exemplos incluem a técnica de hibridoma (Kohler e Milstein, Nature, 256:495-497. 1975), a técnica de trioma, a técnica de hibridoma de células B humanas (Kozbor e outros, Immunology Today 4:72, 1983) e a técnica de EBV-hibridoma (Cole e outros, 1985, em Monoclonal Antibodies and Câncer Therapy, Alan R. Liss, Inc., pp. 77-96).
[00548] As técnicas descritas para a produção de anticorpos de cadeia única (Patente U.S. N°4.946.778) podem ser adaptadas para a produção de anticorpos de cadeia única para os polipeptídeos de acordo com a invenção ou fragmentos que compreendem pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 ou 150 aminoácidos consecutivos dos mesmos. Alternativamente, camundongos transgênicos podem ser utilizados para expressar anticorpos para estes polipeptídeos ou fragmentos dos mesmos.
[00549] Os anticorpos gerados contra os polipeptídeos de acordo com a invenção ou fragmentos que compreendem pelo menos 5, 10,
Petição 870170009999, de 15/02/2017, pág. 308/1247
299/788
15, 20, 25, 30, 35, 40, 50, 75, 100 ou 150 aminoácidos consecutivos dos mesmos podem ser utilizados na seleção em relação a polipeptídeos similares provenientes de outros organismos e amostras. Em tais técnicas, os polipeptídeos provenientes do organismo são colocados em contato com o anticorpo e os polipeptídeos que se ligam especificamente ao anticorpo são detectados. Qualquer um dos procedimentos descritos anteriormente pode ser utilizado para detectar a ligação ao anticorpo. Um tal ensaio de seleção é descrito em Shulman H, Eberhard A, Eberhard C, Ulitzur S, Keinan E, Bioorg Med Chem Lett. 2000 Oct 16; 10(20):2353-6, Highly sensitive and rapid detection of antibody catalysis by luminescent bactéria.
Kits [00550] A invenção fornece kits que compreendem as composições, tais como ácidos nucléicos, cassetes de expressão, vetores, células, sementes ou plantas transgênicas ou partes de plantas, polipeptídeos (tal como uma enzima aldolase) e/ou anticorpos de acordo com a invenção. Os kits contêm ainda material instrucional que ensina as metodologias e os usos industriais, médicos e dietéticos de acordo com a invenção, como descrito aqui.
Engenharia de Células Inteiras e Medida de Parâmetros Metabólicos [00551] Os métodos de acordo com a invenção fornecem evolução de células inteiras ou engenharia de células inteiras, de uma célula para desenvolver uma nova cepa de células que possui um novo fenótipo, tal como uma atividade nova ou modificada de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, através da modificação da composição genética da célula. Vide o pedido de Patente U.S. N°20040033975.
[00552] A composição genética pode ser modificada através da adição na célula de um ácido nucléico de acordo com a invenção, tal como uma sequência codificadora de uma enzima de acordo com a inPetição 870170009999, de 15/02/2017, pág. 309/1247
300/788 venção. Vide W00229032; WO0196551.
[00553] Para detectar o novo fenótipo, pelo menos um parâmetro metabólico de uma célula modificada é monitorado em um quadro de tempo em tempo real ou online. Em algumas modalidades, um grande número de células, tal como uma cultura de células, é monitorado em tempo real ou online. Em algumas modalidades, um grande número de parâmetros metabólicos é monitorado em tempo real ou online. Os parâmetros metabólicos podem ser monitorados utilizando as enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção.
[00554] A análise do fluxo metabólico (MFA) se baseia em uma estrutura bioquímica conhecida. Uma matriz metabólica linearmente independente é construída com base na lei de conservação de massa e na hipótese de estado pseudo-estacionário (PSSH) nos metabólitos intracelulares. Na prática dos métodos de acordo com a invenção, são estabelecidas redes metabólicas, incluindo:
[00555] · a identidade de todos os substratos, os produtos e metabólitos intermediários da vide [00556] · a identidade de todas as reações químicas de interconversão dos metabólitos da vide, da estequiometria das reações da vide, [00557] · a identidade de todas as enzimas que catalisam as reações, da cinética de reação das enzimas, [00558] · as interações reguladoras entre os componentes da vide, tais como interações alostéricas, interações enzima-enzima etc, [00559] · a compartimentalização intracelular de enzimas ou qualquer outra organização supramolecular das enzimas e [00560] · a presença de quaisquer gradientes de concentração de metabólitos, enzimas ou moléculas efetoras ou barreiras de difusão para o seu movimento.
Petição 870170009999, de 15/02/2017, pág. 310/1247
301/788 [00561] Uma vez que a rede metabólica para uma certa cepa é construída, a apresentação matemática através da noção de matriz pode ser introduzida para estimar os fluxos metabólicos intracelulares se os dados de metaboloma online estiverem disponíveis. O fenótipo metabólico se baseia nas alterações da rede metabólica total dentro de uma célula. O fenótipo metabólico se baseia na alteração da utilização da vide em relação a condições ambientais, regulação genética, estado do desenvolvimento e o genótipo etc. Em algumas modalidades dos métodos de acordo com a invenção, após o cálculo de MFA online, o comportamento dinâmico das células, seu fenótipo e outras propriedades são analisados através da investigação da utilização da vide. Por exemplo, se o fornecimento de glicose for aumentado e o do oxigênio for diminuído durante a fermentação por leveduras, a utilização das vias respiratórias será reduzida e/ou interrompida e a utilização das vias fermentativas dominará. O controle do estado fisiológico de culturas de células se tornará possível após a análise da vide. Os métodos de acordo com a invenção podem ajudar a determinar como manipular a fermentação através da determinação de como alterar o fornecimento de substrato, a temperatura, o uso de indutores etc. para controlar o estado fisiológico de células para se mover ao longo da direção desejada. Na prática dos métodos de acordo com a invenção, os resultados de MFA podem também ser comparados com os dados de transcriptoma e de proteoma para planejar experimentos e protocolos para a engenharia metabólica ou o embaralhamento gênico etc.
[00562] Na prática dos métodos de acordo com a invenção, qualquer fenótipo modificado ou novo pode ser conferido e detectado, incluindo novas características ou melhoradas na célula. Qualquer aspecto do metabolismo ou do crescimento pode ser monitorado. Monitoramento da expressão de um produto da transcrição de mRNA [00563] Em algumas modalidades da invenção, o fenótipo engePetição 870170009999, de 15/02/2017, pág. 311/1247
302/788 nheirado compreende o aumento ou a diminuição da expressão de um produto da transcrição de mRNA (tal como uma mensagem de enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase) ou da produção de novos produtos da transcrição (tal como uma enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase enzima) em uma célula. Esta expressão maior ou menor pode ser analisada através do teste em relação à presença de uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase de acordo com a invenção ou através de ensaios da atividade da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase. Os produtos da transcrição ou mensagens de mRNA, também podem ser detectados e quantificados através de qualquer método conhecido na técnica, incluindo, tal como Northern blots, reações de amplificação quantitativas, hibridização a arranjos e similares. As reações de amplificação quantitativas incluem, tal como PCR quantitativa, incluindo, tal como reação em cadeia da polimerase com transcrição inversa quantitativa ou RT-PCR; RT-PCR em tempo real quantitativa ou RT-PCR cinética em tempo real (vide Kreuzer (2001) Br. J. Haematol. 114:313318; Xia (2001) Transplantation 72:907-914).
[00564] Em algumas modalidades da invenção, o fenótipo engenheirado é produzido através do nocaute da expressão de um gene homólogo. A sequência codificadora do gene ou um ou mais elementos de controle da transcrição podem ser nocauteados, tais como promotores ou intensificadores. Assim, a expressão de um produto da transcrição pode ser completâmente eliminada ou apenas diminuída. [00565] Em algumas modalidades da invenção, o fenótipo engenheirado compreende o aumento da expressão de um gene homólogo. Isto pode ser realizado através do nocaute de um elemento de controle negativo, incluindo um elemento regulador da transcrição que atua em cis ou em trans ou através da mutagênese de um elemento de controle
Petição 870170009999, de 15/02/2017, pág. 312/1247
303/788 positivo. Um ou mais ou todos os produtos da transcrição de uma célula podem ser medidos através da hibridização de uma amostra que compreende os produtos da transcrição da célula ou os ácidos nucléicos representativos de ou complementares aos produtos da transcrição de uma célula, através da hibridização a ácidos nucléicos imobilizados em um arranjo.
Monitoramento da expressão de polipeptídeos, peptídeos e aminoácidos [00566] Em algumas modalidades da invenção, o fenótipo engenheirado compreende o aumento ou a diminuição da expressão de um polipeptídeo (tal como uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase) ou da produção de novos polipeptídeos em uma célula. Esta expressão maior ou menor pode ser analisada através da determinação da quantidade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase presente ou através de ensaios da atividade da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase. Os polipeptídeos, os peptídeos e os aminoácidos também podem ser detectados e quantificados através de qualquer método conhecido na técnica, incluindo, tal como ressonância magnética nuclear (RMN), espectrofotometria, radiografia (marcação radioativa de proteínas), eletroforese, eletroforese em capilar, cromatografia líquida de alto desempenho (HPLC), cromatografia em camada fina (TLC), cromatografia por hiperdifusão, vários métodos imunológicos, tais como imunoprecipitação, imunodifusão, imunoeletroforese, radioimunoensaios (RIAs), ensaios imunoabsorventes ligados à enzimas (ELISAs), ensaios imunofluorescentes, eletroforese em gel (tal como SDS-PAGE), coloração com anticorpos, separador de células ativado por fluorescência (FACS), espectrometria de massa por pirólise, Espectrometria de Infravermelho com Transformação de Fourier, espectrometria de Raman, GC-MS e LC-Electrospray e especPetição 870170009999, de 15/02/2017, pág. 313/1247
304/788 trometrias de massa por eletrospray em tandem cap-LC e similares. As novas atividades biológicas também podem ser verificadas utilizando métodos ou variações dos mesmos, descritos na Patente U.S. N° 6.057.103. Além disso, como discutido abaixo em detalhes, um ou mais ou todos os polipeptídeos de uma célula podem ser medidos utilizando um arranjo de proteínas.
Aplicações Industriais, Farmacêuticas e outras [00567] Os polipeptídeos de acordo com a invenção (tais como que possuem aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase) podem catalisar a formação ou a divagem de ligações carbono-carbono. As enzimas de acordo com a invenção podem ser catalisadores altamente seletivos. Em algumas modalidades, a invenção fornece processos industriais utilizando enzimas de acordo com a invenção, tal como na indústria farmacêutica ou de suplementação nutricional (dietética), nas indústrias de alimentos ou de produtos alimentícios, tal como nos métodos para a produção de alimentos e produtos alimentícios e aditivos para alimentos e produtos alimentícios. Em algumas modalidades, a invenção fornece processos que utilizam as enzimas de acordo com a invenção na indústria médica, tal como para produzir produtos farmacêuticos ou agentes de auxílio ou de suplementação dietética ou suplementos e aditivos alimentícios.
Conversão de biomassa e produção de biocombustíveis limpos [00568] A invenção fornece enzimas, tais como aldolases, incluindo piruvato aldolases tais como, sem limitação, HMG e/ou KHG aldolases (incluindo misturas ou coquetéis de enzimas) e métodos para a conversão de uma biomassa ou qualquer material lignocelulósico (por exemplo, qualquer composição que compreenda celulose, hemicelulose e lignina), em combustíveis (por exemplo, bioetanol, biobutanol, biopropanol, biometanol, biodiesel), utilizando as enzimas da invenção, em adição a produtos alimentícios, alimentos e produtos químicos. AsPetição 870170009999, de 15/02/2017, pág. 314/1247
305/788 sim, as composições e os métodos da invenção fornecem alternativas eficientes e sustentáveis ou adjuntos para uso de produtos à base de petróleo, por exemplo, como uma mistura de bioetanol e gasolina. A invenção fornece organismos que expressam as enzimas da invenção para a participação em ciclos químicos que envolvem a conversão de biomassa natural. Em uma modalidade, as enzimas e os métodos para a conversão são utilizados em conjuntos de enzimas para a despolimerização eficiente de polímeros de celulose e de hemicelulose em porçãos de carbono que podem ser metabolizados. A invenção fornece métodos para descobrir e implementar as mais eficientes das enzimas para possibilitar estes novos processos importantes de conversão de biomassa e industriais de energia alternativa.
[00569] Os métodos da invenção incluem ainda pegar o material de lignocelulose convertido (processado pelas enzimas da invenção) e transformá-lo em um combustível (por exemplo, bioetanol, biobutanol, biopropanol, biometanol, biodiesel) através da fermentação e/ou da síntese química. Em uma modalidade, os açúcares produzidos são fermentados e/ou os produtos que não podem ser fermentados são gaseificados.
[00570] As enzimas da invenção (incluindo, por exemplo, organismos, tais como microorganismos, por exemplo, fungos, levedura ou bactérias que produzem e em algumas modalidades que secretam as enzimas recombinantes da invenção) podem ser utilizadas em ou incluídas/integradas em qualquer estágio de qualquer processo de conversão de biomassa, por exemplo, em qualquer uma etapa, várias etapas ou incluídas em todas as etapas ou todos os métodos a seguir de processos de conversão de biomassa ou todas estas alternativas de biocombustível:
[00571] · Combustão direta: a queima de material através do calor direto e é a tecnologia de biomassa mais simples; pode ser muito ecoPetição 870170009999, de 15/02/2017, pág. 315/1247
306/788 nômica se uma fonte de biomassa estiver à mão.
[00572] · Pirólise: é a degradação térmica de biomassa através de calor na ausência de oxigênio. Em uma modalidade, a biomassa é aquecida até uma temperatura entre aproximadamente 427 e 760 graus Celsius (800 e 1400 graus Fahrenheit), mas nenhum oxigênio é introduzido para sustentar a combustão resultante na criação de gás, óleo combustível e carvão vegetal.
[00573] · Gaseificação: a biomassa pode ser utilizada para produzir metano através do aquecimento ou da digestão anaeróbica. Syngas, uma mistura de monóxido de carbono e hidrogênio, pode ser derivada de biomass.
[00574] · Gás de Aterro Sanitário: é gerado através da deterioração (digestão anaeróbica) de lixo enterrado em aterros sanitários. Quando o lixo orgânico se decompõe, gera gás que consiste em aproximadamente 50% de metano, o componente principal do gás natural.
[00575] · Digestão anaeróbica: converte matéria orgânica em uma mistura de metano, o componente principal do gás natural e do dióxido de carbono. Em uma modalidade, a biomassa, tal como esgoto, estrume ou resíduos de processamento de alimentos, é misturada com água e alimentada em um tanque de digestão sem ar.
[00576] · Fermentação [00577] · Fermentação Alcoólica: o álcool combustível é produzido através da conversão de amido em açúcar, da fermentação do açúcar em álcool, então da separação da mistura de álcool e água por destilação. Estoques de alimentação tais como trigo, cevada, batatas e sucata de papel, serragem e palha contendo açúcar, amido ou celulose podem ser convertidos em álcool através da fermentação com levedura.
[00578] · Transesterificação: Um exemplo de reação para a conversão de óleo em biodiesel é chamado de transesterificação. O proPetição 870170009999, de 15/02/2017, pág. 316/1247
307/788 cesso de transesterificação reage um álcool (como metanol) com os óleos triglicerídeos contidos em óleos vegetais, gorduras animais ou graxas recicladas, formando ésteres alquila de ácidos graxos (biodiesel) e glicerina. A reação requer calor e um catalisador básico forte, tal como hidróxido de sódio ou hidróxido de potássio.
[00579] · Biodiesel: O biodiesel é uma mistura de ésteres alquila de ácidos graxos produzida partindo de óleos vegetais, gorduras animais ou graxas recicladas. O biodiesel pode ser utilizado como um combustível para veículos em sua forma pura, mas é geralmente utilizado como um aditivo de diesel de petróleo para reduzir os níveis de particulados, monóxido de carbono, hidrocarbonetos e ar tóxicos provenientes de veículos com motor a diesel.
[00580] · Hidrólise: inclui a hidrólise de um composto, por exemplo, uma biomassa, tal como um material de lignocelulose, catalisada utilizando uma enzima da presente invenção.
[00581] · Congeneração: é a produção simultânea de mais de uma forma de energia utilizando um único combustível e uma única instalação. Em uma modalidade, a cogeneração de biomassa possui um crescimento mais potencial que a produção de biomassa isoladamente porque a cogeneração produz tanto calor quanto eletricidade.
[00582] Em uma modalidade, os polipeptídeos da invenção possuem uma atividade de aldolase, incluindo atividade de piruvato aldolase, tal como, sem limitação, atividade de HMG e/ou KHG aldolase ou outra atividade enzimática para gerar biodiesel, bioetanol, biobutanol, biopropanol ou biometanol, partindo de um material orgânico, por exemplo, uma biomassa, tal como composições derivadas de plantas e animais, incluindo qualquer planta de cultivo agrícola ou outro estoque de alimentação renovável, um resíduo agrícola ou restos de animais ou os componentes orgânicos de esgotos municipais e industriais ou microorganismos tais como algas ou levedura. Em uma modalidade,
Petição 870170009999, de 15/02/2017, pág. 317/1247
308/788 os polipeptídeos da invenção são utilizados em processos para a conversão de biomassa de lignocelulose em etanol, butanol, propanol, metanol ou são de outra maneira utilizados em processos para a hidrólise ou para a digestão de biomateriais de forma que podem ser utilizados como um biocombustível (incluindo bioetanol, biobutanol, biopropanol, biometanol ou biodiesel) ou para tornar mais fácil que a biomassa seja processada em um combustível. Em uma modalidade alternativa, os polipeptídeos da invenção são utilizados em processos para um processo de transesterificação que reage um álcool (como metanol) com um óleo triglicerídeo contido em um óleo vegetal, uma gordura animal ou graxas recicladas, formando ésteres alquila de ácidos graxos (biodiesel) e glicerina. Em uma modalidade, o biodiesel é produzido partindo de óleo de soja ou óleos de cozinha reciclados. As gorduras animais, outros óleos vegetais e outros óleos reciclados também podem ser utilizados para produzir biodiesel, dependendo de seus custos e disponibilidade. Em uma outra modalidade, misturas de todos os tipos de gorduras e óleos são utilizadas para produzir um combustível biodiesel da invenção.
[00583] As enzimas da invenção também podem ser utilizadas no refino de glicerina. O subproduto glicerina contém catalisador não reagido e sabões que são neutralizados com um ácido. Água e álcool são removidos para produzir 50% até 80% de glicerina bruta. O restante dos contaminantes inclui gorduras e óleos, que podem ser processados utilizando os polipeptídeos da invenção. Em grandes plantas de biodiesel da invenção, a glicerina pode ser adicionalmente purificada, por exemplo, até 99% ou uma pureza maior, para as indústrias farmacêuticas e de cosméticos.
[00584] O bioetanol, o biobutanol, o biopropanol, o biometanol e/ou o biodiesel são produzidos utilizando os polipeptídeos da invenção que podem ser utilizados com oxigenados de combustível para melhorar as
Petição 870170009999, de 15/02/2017, pág. 318/1247
309/788 características de combustão. A adição de oxigênio resulta na combustão mais completa, que reduz emissões de monóxido de carbono. Este é um outro benefício ambiental da substituição de combustíveis de petróleo por biocombustíveis (por exemplo, um combustível da invenção). Um bioetanol, um biobutanol, um biopropanol, um biometanol e/ou um biodiesel feito utilizando as composições e/ou os métodos desta invenção pode ser misturado com gasolina para formar uma mistura E10 (aproximadamente 5% até 10% de etanol e aproximadamente 90% até 95% de gasolina), mas pode ser utilizado em concentrações mais altas tal como E85 ou em sua forma pura. Um bioetanol, um biobutanol, um biopropanol, um biometanol e/ou um biodiesel feito utilizando as composições e/ou os métodos desta invenção podem ser misturados com diesel de petróleo para formar uma mistura B20 (20% de biodiesel e 80% de diesel de petróleo), embora outros níveis de mistura possam ser utilizados até B100 (biodiesel puro).
[00585] A invenção fornece ainda processos para a produção de etanol (bioetanol), butanol (biobutanol), propanol (biopropanol), metanol (biometanol) e/ou diesel (biodiesel) partindo de composições que compreendem biomassa de lignocelulose. O material de biomassa de lignocelulose pode ser obtido partindo de plantas de cultivo agrícolas, como um subproduto da produção de alimentos ou de produtos alimentícios ou como produtos de resíduos de lignocelulose, tais como resíduos de plantas e sucata de papel. Os exemplos de fontes vegetais ou de resíduos vegetais para o tratamento com os polipeptídeos da invenção incluem algas marinhas, algas, grãos, verds, caules, folhas, cascas, folhelhos, sabugos de milho, forragem de milho, palha, gramíneas (por exemplo, capim indiano, tal como Sorghastrum nutans', ou, Panicum virgatum, por exemplo, espécies de Panicum, tal como Panicum virgatum) e similares, assim como madeira, lascas de madeira, pasta de madeira e serragem. Os exemplos de sucata de papel
Petição 870170009999, de 15/02/2017, pág. 319/1247
310/788 adequados para o tratamento com os polipeptídeos da invenção incluem papel de fotocópia descartado, papel de impressora de computador, papel de agenda, papel de bloco de notas, papel para digitação de textos e similares, assim como jornais, revistas, papelão e materiais de embalagem à base de papel.
[00586] Em uma modalidade, as enzimas e os métodos da invenção podem ser utilizados em associação com meios mais tradicionais de produção de etanol, metanol, butanol, propanol e/ou diesel partindo de biomassa, por exemplo, como métodos que compreendem a hidrólise de materiais de lignocelulose submetendo o material de lignocelulose seco em um reator a um catalisador compreendido de uma solução diluída de um ácido forte e um sal metálico; isto pode diminuir a energia de ativação ou a temperatura, da hidrólise de celulose para a obtenção de rendimentos maiores de açúcares; vide, por exemplo, as Patentes U.S. N— 6.660.506; e 6.423.145.
[00587] Uma outra modalidade que incorpora o uso de enzimas da invenção compreende a hidrólise do material de lignocelulose contendo hemicelulose, celulose e lignina submetendo o material a uma etapa de hidrólise de primeiro estágio em um meio aquoso a uma temperatura e a uma pressão escolhidas para realizar a despolimerização primária de hemicelulose sem a despolimerização principal de celulose em glicose. Esta etapa resulta em uma suspensão em que a fase aquosa líquida contém monossacarídeos dissolvidos resultantes da despolimerização de hemicelulose e uma fase sólida que contém celulose e lignina. Uma etapa de hidrólise de segundo estágio pode compreender condições de forma que pelo menos uma parte maior da celulose é despolimerizada, tal etapa resultando em uma fase aquosa líquida contendo produtos de despolimerização da celulose dissolvidos/solúveis. Vide, por exemplo, a Patente U.S. N° 5.536.325. As enzimas da invenção podem ser adicionadas em qualquer estágio deste
Petição 870170009999, de 15/02/2017, pág. 320/1247
311/788 exemplo de processo.
[00588] Uma outra modalidade que incorpora o uso das enzimas da invenção compreende o processamento de um material de biomassa contendo lignocelulose através de um ou mais estágios de hidrólise com ácido diluído com aproximadamente 0,4% até 2% de ácido forte; e o tratamento de um componente de lignocelulose sólido não reagido do material de biomassa hidrolisado com ácido através da deslignificação alcalina para produzir precursores para termoplásticos e derivados biodegradáveis. Vide, por exemplo, a Patente U.S. N° 6.409.841. As enzimas da invenção podem ser adicionadas em qualquer estágio neste exemplo de processo.
[00589] Uma outra modalidade que incorpora o uso das enzimas da invenção compreende a pré-hidrólise do material de lignocelulose em um reator de pré-hidrólise; a adição de um líquido ácido ao material de lignocelulose sólido para produzir uma mistura; o aquecimento da mistura até a temperatura de reação; a manutenção da temperatura de reação durante tempo suficiente para fracionar o material de lignocelulose em uma parte solubilizada contendo pelo menos aproximadamente 20% da lignina proveniente do material de lignocelulose e uma fração sólida contendo celulose; a remoção de uma parte solubilizada proveniente da fração sólida enquanto está à ou próxima à temperatura de reação em que a celulose na fração sólida é tornada mais susceptível à digestão enzimática; e a recuperação de uma parte solubilizada. Vide, por exemplo, a Patente U.S. N° 5.705.36 9. As enzimas da invenção podem ser adicionadas em qualquer estágio deste exemplo de processo.
[00590] A invenção fornece métodos para a produção de composições combustíveis para motores (por exemplo, para motores com ignição com centelha com base em hidrocarbonetos líquidos misturados com um álcool de grau de combustível produzido utilizando uma enziPetição 870170009999, de 15/02/2017, pág. 321/1247
312/788 ma ou um método da invenção. Em uma modalidade, os combustíveis produzidos através do uso de uma enzima da invenção compreendem, por exemplo, gás de carvão, gás líquido ou natural, etanol líquido, metanol, butanol, propanol e/ou misturas de diesel. Em uma modalidade, um co-solvente é 2-metiltetrahidrofurano (MTHF) derivado da biomassa. Vide, por exemplo, a Patente U.S. N°6.712.866.
[00591] Em uma modalidade, os métodos da invenção para a degradação enzimática de lignocelulose, por exemplo, para a produção de etanol partindo do material de lignocelulose, também podem compreender o uso de tratamento com ultra-som do material de biomassa; vide, por exemplo, a Patente U.S. N°6.333.181.
[00592] Em uma outra modalidade, os métodos da invenção para a produção de bioetanol, biobutanol, biopropanol, biometanol e/ou biodiesel partindo de um substrato de celulose compreendem o fornecimento de uma mistura de reação na forma de uma suspensão que compreende substrato de celulose, uma enzima desta invenção e um agente de fermentação (por exemplo, dentro de um recipiente de reação, tal como um biorreator de alimentação com sólidos de forma semicontínua) e a mistura de reação é reagida sob condições suficientes para iniciar e manter uma reação de fermentação (como descrito, por exemplo, no Pedido de Patente U.S. N° 20060014260). Em uma modalidade, cálculos experimentais e teóricos podem determinar uma freqüência de alimentação ótima. Em uma modalidade, quantidades adicionais do substrato de celulose e da enzima são fornecidas ao recipiente de reação em um intervalo de acordo com a freqüência de alimentação otimizada.
[00593] Um exemplo de processo para a produção de biocombustíveis (tais como bioetanol, biobutanol, biopropanol, biometanol e/ou biodiesel) da invenção é descrito nos Pedidos de Patentes U.S. Publicados N— 20050069998; 20020164730; e em uma modalidade comprePetição 870170009999, de 15/02/2017, pág. 322/1247
313/788 ende estágios de trituração da biomassa de lignocelulose (por exemplo, até um tamanho de 15-30 mm), submetendo o produto obtido ao pré-tratamento com explosão de vapor (por exemplo, a uma temperatura de 190-230Ό) durante entre 1 e 10 minutos em um reator; coletando o material pré-tratado em um ciclone ou produto relacionado de produção; e separando as frações líquidas e sólidas por filtração em uma prensa de filtração, introduzindo a fração sólida em um depósito de fermentação e adicionando uma ou mais enzimas da invenção, por exemplo, uma enzima celulase e/ou beta-glucosidase (por exemplo, dissolvida em tampão citrato com pH 4,8).
[00594] Um outro exemplo de processo para a produção de biocombustíveis (tais como bioetanol, biobutanol, biopropanol, biometanol e/ou biodiesel) da invenção que compreende a utilização das enzimas da invenção compreende o pré-tratamento de um material de partida que compreende um estoque de alimentação de lignocelulose compreendendo pelo menos hemicelulose e celulose. Em uma modalidade, o material de partida compreende batatas, soja (semente de colza), cevada, centeio, milho, aveia, trigo, beterraba ou cana de açúcar ou um componente ou resíduo ou subproduto da produção de alimentos ou de produtos alimentícios. O material de partida (estoque de alimentação) é reagido em condições que rompem a estrutura das fibras das plantas para realizar pelo menos uma hidrólise parcial da hemicelulose e da celulose. As condições de rompimento podem compreender, por exemplo, submeter o material de partida a uma temperatura média de 180Ό até 270Ό em pH 0,5 até 2,5 dur ante um período de aproximadamente 5 segundos até 60 minutos; ou, à temperatura de 220Ό até 270Ό, em pH 0,5 até 2,5 durante um perío do de 5 segundos até 120 segundos ou equivalente. Isto gera um estoque de alimentação com maior capacidade de acesso que será digerido por uma enzima, por exemplo, uma enzima celulase da invenção. Patente U.S. N°
Petição 870170009999, de 15/02/2017, pág. 323/1247
314/788
6.090.595.
[00595] Os exemplos de condições para a hidrólise do material de lignocelulose incluem reações a temperaturas entre aproximadamente 30Ό e 48Ό e/ou um pH entre aproximadamente 4,0 e 6,0. Outros exemplos de condições incluem uma temperatura entre aproximadamente 30Ό e 60Ό e um pH entre aproximadamente 4,0 e 8,0.
[00596] As enzimas de acordo com a invenção podem catalisar reações com estéreo, régio e quimiosseletividades exclusivas. As enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção podem ser engenheiradas para funcionarem em vários solventes, operarem em pHs extremos (por exemplo, pHs altos e pHs baixos), temperaturas extremas (por exemplo, temperaturas altas e temperaturas baixas), níveis de salinidade extremos (por exemplo, salinidade alta e salinidade baixa) e catalisar reações com compostos que não são relacionados estruturalmente aos seus substratos fisiológicos naturais.
Produtos Alimentícios ou Alimentos e Aditivos para Produtos Alimentícios e Alimentos [00597] Em adição ao fornecimento de agentes de auxílio ou suplementos dietéticos ou suplementos e aditivos para alimentos, a invenção fornece ainda composições e métodos para o tratamento de produtos alimentícios e de alimentos e aditivos para alimentos ou produtos alimentícios para seres humanos e animais utilizando um polipeptídeo de acordo com a invenção, tal como uma proteína que possui atividade de enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção e/ou os anticorpos de acordo com a invenção. Em algumas modalidades, a invenção fornece produtos alimentícios, alimentos e aditivos para animais que compreendem enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção e/ou anticorpos de
Petição 870170009999, de 15/02/2017, pág. 324/1247
315/788 acordo com a invenção. O animal pode ser qualquer animal de fazenda ou qualquer animal.
[00598] O aditivo para produtos alimentícios para animais de acordo com a invenção podem ser um produto enzimático granulado que pode ser facilmente misturado com componentes de produtos alimentícios. Alternativamente, os aditivos para produtos alimentícios de acordo com a invenção podem formar um componente de uma pré-mistura. O produto enzimático granulado de acordo com a invenção pode ser revestido ou não revestido. O tamanho da partícula dos granulados de enzima pode ser compatível com o de componentes do produto alimentício e de pré-mistura. Isto fornece um meio seguro e conveniente de incorporar enzimas em produtos alimentícios. Alternativamente, o aditivo para produtos alimentícios para animais de acordo com a invenção pode ser uma composição líquida estabilizada. Esta pode ser uma suspensão aquosa ou à base de óleo. Vide a Patente U.S. N° 6.245.546.
[00599] As enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase da presente invenção, na modificação de produto alimentício ou de alimento, podem processar o alimento ou o produto alimentício in vitro (através de componentes de modificação do produto alimentício ou do alimento) ou in vivo. Os polipeptídeos de acordo com a invenção podem ser adicionados às composições de produtos alimentícios ou de alimentos.
[00600] Em algumas modalidades, uma enzima de acordo com a invenção é adicionada em combinação com uma outra enzima, tal como beta-galactosidases, catalases, lacases, celulases, outras aldolases, endoglicosidases, endo-beta-1,4-lacases, amiloglucosidases, glucosidases, glicose isomerases, glicosiltransferases, lipases, fosfolipases, lipooxigenases, beta-lacases, endo-beta-1,3(4)-lacases, cutinases, peroxidases, amilases, fitases, glucoamilases, pectinases, redutaPetição 870170009999, de 15/02/2017, pág. 325/1247
316/788 ses, oxidases, descarboxilases, fenoloxidases, ligninases, pululanases, arabinanases, hemicelulases, mananases, cilolacases, xilanases, pectina acetil esterases, ramnogalacturonana acetil esterases, proteases, peptidases, proteinases, poligalacturonases, ranogalacturonases, galactanases, pectina liases, transglutaminases, pectina metilesterases, celobiohidrolases e/ou transglutaminases. Estes produtos de digestão enzimática são mais digeríveis pelo animal. Assim, as enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção podem contribuir para a energia disponível do produto alimentício ou do alimento ou para a capacidade de digestão do alimento ou do produto alimentício através da quebra da celulose.
[00601] Em outras modalidades, a enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção pode ser fornecida através da expressão das enzimas diretamente em plantas de cultivo transgênicas para produtos alimentícios (tal como plantas transgênicas, verds e similares), tais como grãos, cereais, milho, soja, semente de soja, tremoços e similares. Como discutido anteriormente, a invenção fornece plantas, partes de plantas e células vegetais transgênicas que compreendem uma sequência de ácido nucléico que codifica um polipeptídeo de acordo com a invenção. Em algumas modalidades, o ácido nucléico é expresso de forma que a enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção seja produzida em quantidades que podem ser recuperadas. A enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase pode ser recuperada partindo de qualquer planta ou parte de planta. Alternativamente, a planta ou a parte de planta contendo o polipeptídeo recombinante pode ser utilizada de forma a aumentar a qualidade de um alimento ou de um produto alimentício, tal como melhorando o valor nutricional, a palataPetição 870170009999, de 15/02/2017, pág. 326/1247
317/788 bilidade etc.
[00602] Em algumas modalidades, a matriz de fornecimento de enzima de acordo com a invenção está na forma de várias partículas, péletes ou grânulos distintos. Por grânulos entende-se partículas que estão comprimidas ou compactadas, tal como através de uma peletização, extrusão ou compactação similar para remover água da matriz. Tal compressão ou compactação das partículas também promove a coesão intrapartícula das partículas. Por exemplo, os grânulos podem ser preparados através da peletização do substrato baseado no grão em um moinho de peletização. Os péletes preparadas dessa maneira são trituradas ou desagregadas até um tamanho de grânulos adequado para uso como um adjuvante no produto alimentício para animais. Devido ao fato de que a matriz por si só é aprovada para uso em produto alimentício para animais, esta pode ser utilizada como um diluente para o fornecimento de enzimas em produto alimentício para animais.
[00603] Em algumas modalidades, a enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase contida em uma matriz e métodos de fornecimento de enzimas é uma enzima aldolase termoestável, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, como descrito aqui, de forma que resista à inativação da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase durante a produção quando temperaturas elevadas e/ou vapor pode ser empregado para preparar a matriz de fornecimento da enzima peletizada. Durante a digestão do produto alimentício que contém uma matriz de fornecimento de enzima da invenção, fluidos digestivos aquosos causarão a liberação da enzima ativa. Outros tipos de enzimas termoestáveis e suplementos nutricionais que são termoestáveis podem também ser incorporados na matriz de fornecimento para liberação sob qualquer tipo de condições aquosas.
Petição 870170009999, de 15/02/2017, pág. 327/1247
318/788 [00604] Em algumas modalidades, um revestimento é aplicado às partículas de matriz enzimática com finalidades diferentes, tal como para adicionar sabor ou suplemento nutricional ao produto alimentício para animais, para retardar a liberação de suplementos para produtos alimentícios para animais e de enzimas em condições gástricas e similares. Em algumas modalidades, o revestimento é aplicado para atingir uma finalidade funcional, por exemplo, sempre que for desejável retardar a liberação da enzima partindo das partículas da matriz ou para controlar as condições sob as quais a enzima será liberada. A composição do material de revestimento pode ser tal que é seletivamente quebrada por um agente ao qual é susceptível (tal como calor, ácido ou base, enzimas ou outros agentes químicos). Alternativamente, dois ou mais revestimentos susceptíveis a tais agentes de quebra diferentes podem ser aplicados consecutivamente às partículas da matriz. [00605] A invenção também está direcionada a um processo para a preparação de uma matriz de liberação de enzima. De acordo com a invenção, o processo compreende o fornecimento de várias partículas distintas de um substrato baseado em grãos em um tamanho de partícula adequado para uso como uma matriz de liberação de enzima, em que as partículas compreendem uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase codificada por uma sequência de aminoácidos de acordo com a invenção. Em algumas modalidades, o processo inclui a compactação ou a compressão das partículas da matriz de liberação de enzima em grânulos, o que na maior parte de algumas modalidades é realizado através da peletização. O inibidor de bolor e o agente de coesão, quando utilizados, podem ser adicionados em qualquer momento adequado e, em algumas modalidades são misturados com o substrato baseado em grãos nas proporções desejadas antes da peletização do substrato baseado em grãos. O teor de umidade no produto alimentício em moinho de péletes em alguPetição 870170009999, de 15/02/2017, pág. 328/1247
319/788 mas modalidades está nas faixas apresentadas anteriormente em relação ao teor de umidade no produto acabado, e, em algumas modalidades, é de aproximadamente 14-15%. Em algumas modalidades, a umidade é adicionada ao estoque de alimentação na forma de uma preparação aquosa da enzima para levar o estoque de alimentação a este teor de umidade. A temperatura no moinho de péletes em algumas modalidades é levada até aproximadamente 82Ό com vapor. O moinho de péletes pode ser operado sob quaisquer condições que confiram função suficiente ao estoque de alimentação para fornecer péletes. O próprio processo de peletização é um processo com custo eficiente para a remoção de água da composição que contém enzima. [00606] As composições e os métodos de acordo com a invenção podem ser praticados em associação com a administração de prébióticos, que são açúcares de alto peso molecular, tais como frutooligossacarídeos (FOS); galacto-oligossacarídeos (GOS), material GRAS (Geralmente Reconhecido Como Seguro (Generally Recognized As Safe)). Estes pré-bióticos podem ser metabolizados por algumas bactérias do ácido láctico pró-bióticas (LAB). Não são digeríveis pela maioria dos microorganismos intestinais.
Tratamento de Alimentos e Processamento de Alimentos [00607] A invenção fornece alimentos e produtos alimentícios que compreendem as enzimas de acordo com a invenção e os métodos para a utilização das enzimas de acordo com a invenção no processamento de alimentos e produtos alimentícios. As enzimas aldolases, tal como piruvato aldolase, HMG e/ou KHG aldolase de acordo com a invenção possuem várias aplicações na indústria de processamento de alimentos. Em algumas modalidades, a invenção fornece métodos para a hidrólise de composições que compreendem celulose, incluindo, tal como uma célula vegetal, uma célula bacteriana, uma célula de levedura, uma célula de inseto ou uma célula animal ou qualquer planPetição 870170009999, de 15/02/2017, pág. 329/1247
320/788 ta ou parte de planta ou qualquer alimento ou produto alimentício, um produto residuais e similares.
[00608] Por exemplo, a invenção fornece produtos alimentícios ou alimentos que compreendem uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase da invenção, tal como em um produto alimentício, um líquido, tal como uma bebida (tal como um suco de frutas ou uma cerveja), um pão ou uma massa de pão ou um produto de panificação ou uma bebida alcoólica (tal como uma cerveja) ou um precursor de bebida (tal como mosto).
[00609] Os processos para tratamento de alimentos de acordo com a invenção também podem incluir o uso de qualquer combinação de outras enzimas tais como triptofanases ou tirosina descarboxilases, lacases, catalases, lacases, outras aldolases, celulases, endoglicosidases, endo-beta-1,4-lacases, amiloglucosidases, glucosidases, glicose isomerases, glicosiltransferases, lipases, fosfolipases, lipooxigenases, beta-lacases, endo-beta-1,3(4)-lacases, cutinases, peroxidases, amilases, fitases, glucoamilases, pectinases, redutases, oxidases, descarboxilases, fenoloxidases, ligninases, pululanases, arabinanases, hemicelulases, mananases, cilolacases, xilanases, pectina acetil esterases, ramnogalacturonana acetil esterases, proteases, peptidases, proteinases, poligalacturonases, ramnogalacturonases, galactanases, pectina liases, transglutaminases, pectina metilesterases, celobiohidrolases e/ou transglutaminases.
Composições Farmacêuticas e Suplementos Dietéticos [00610] A invenção fornece ainda composições farmacêuticas e suplementos dietéticos (tais como agentes de auxílio dietético) que compreendem uma aldolase de acordo com a invenção. A atividade da aldolase compreende a atividade de piruvato aldolase, de HMG e/ou de KHG aldolase. Em algumas modalidades, as composições farmacêuticas e os suplementos dietéticos (tais como agentes de auxílio dietétiPetição 870170009999, de 15/02/2017, pág. 330/1247
321/788 co) são formulados para ingestão oral.
[00611] Os compostos para tratamento periodôntico podem compreender uma enzima de acordo com a invenção, tal como descrito na Patente U.S. N°6.776.979. As composições e os métodos para o tratamento ou para a profilaxia de síndrome de gengiva ácida podem compreender uma enzima de acordo com a invenção, tal como descrito na Patente U.S. N°6.468.964.
[00612] Em outras modalidades, tratamento de feridas, implantes e similares compreendem enzimas antimicrobianas (tais como que atuam como antibiótico), incluindo uma enzima de acordo com a invenção (incluindo, tal como sequências de acordo com a invenção). As enzimas de acordo com a invenção podem também ser utilizadas em curativos de alginato, tratamento de barreira antimicrobiana, curativos para queimaduras, bandagens de compressão, ferramentas para diagnóstico, curativos em gel, tratamentos hidrosseletivos, curativos hidrocelulares (espuma), curativos hidrocoloidais, curativos I.V, mantas incisivas, curativos de baixa aderência, curativos com absorção de odores, bandagens em pasta, curativos pós-operatórios, controle de cicatrização, cuidado da pele, curativos de filme transparente e/ou fechamento de feridas. As enzimas de acordo com a invenção podem ser utilizadas na limpeza de feridas, preparação de leito de feridas, para tratar úlceras de pressão, úlceras nas pernas, queimaduras, úlceras diabéticas nos pés, cicatrizes, fixação IV, feridas cirúrgicas e feridas menores. As enzimas de acordo com a invenção podem ser utilizadas em composições enzimáticas de eliminação de resíduos esterilizadas, tais como ungüentos. Em várias modalidades, a aldolase é formulada na forma de um comprimido, um gel, uma pílula, um implante, um líquido, um spray, um filme, uma micela, um pó, um alimento, um pélete de produto alimentício ou na forma de uma formulação encapsulada.
[00613] As composições farmacêuticas e os suplementos dietéticos
Petição 870170009999, de 15/02/2017, pág. 331/1247
322/788 de acordo com a invenção também podem incluir o uso de qualquer combinação de outras enzimas tais como beta-galactosidases, catalases, lacases, celulases, outras aldolases, endoglicosidases, endobeta-1,4-lacases, amiloglucosidases, glucosidases, glicose isomerases, glicosiltransferases, lipases, fosfolipases, lipooxigenases, betalacases, endo-beta-1,3(4)-lacases, cutinases, peroxidases, amilases, fitases, glucoamilases, pectinases, redutases, oxidases, descarboxilases, fenoloxidases, ligninases, pululanases, arabinanases, hemicelulases, mananases, cilolacases, xilanases, pectina acetil esterases, ramnogalacturonana acetil esterases, proteases, peptidases, proteinases, poligalacturonases, ramnogalacturonases, galactanases, pectina liases, transglutaminases, pectina metilesterases, celobiohidrolases e/ou transglutaminases.
Vias Biossintéticas para a Produção de R,Re Outros Estereoisômeros da Monatina [00614] Como descrito, inter alia, na WO 03/091396 A2 (vide as figuras 1-3 e 11-13), a monatina pode ser produzida partindo de triptofano através de uma vide de várias etapas que envolvem conversões biológicas (isto é, a facilitação da reação de um substrato em um produto com um polipeptídeo). Uma vide descrita envolve a conversão biológica de triptofano em indol-3-piruvato, a conversão biológica de indol-3-piruvato no ácido 2-hidróxi 2-(indol-3-ilmetil)-4-ceto glutárico (MP) e a conversão biológica de MP em monatina. Em algumas modalidades, os polipeptídeos da invenção podem ser utilizados para facilitar a reação de indol-3-piruvato para formar MP. Em algumas modalidades, os polipeptídeos da invenção podem ser utilizados para facilitar preferencialmente a produção de R-MP.
[00615] Em algumas modalidades, um ou mais polipeptídeos escolhidos de polipeptídeos isolados ou recombinantes da SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID
Petição 870170009999, de 15/02/2017, pág. 332/1247
323/788
NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID
NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID
NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID
NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID
NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID
NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID
NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID
NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID
NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID
NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID
NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID
N0:100, SEQ ΝΟ:108, SEQ Ν0:116, SEQ ΝΟ:124, SEQ ΝΟ:132, SEQ ΝΟ:140, SEQ ΝΟ:148, SEQ ΝΟ:156, SEQ ΝΟ:164, SEQ ΝΟ:172, SEQ ΝΟ:180, SEQ ΝΟ:188, SEQ ΝΟ:196, SEQ ΝΟ:204, SEQ ΝΟ:212, SEQ ΝΟ:220, SEQ ΝΟ:228, SEQ ΝΟ:236, SEQ ΝΟ:244, SEQ
ID NO:102, SEQ ID NO:110, SEQ ID N0:118, SEQ ID NO:126, SEQ ID NO:134, SEQ ID NO:142, SEQ ID NO:150, SEQ ID NO:158, SEQ ID NO:166, SEQ ID NO:174, SEQ ID NO:182, SEQ ID NO:190, SEQ ID NO:198, SEQ ID NO:206, SEQ ID NO:214, SEQ ID NO:222, SEQ ID NO:230, SEQ ID NO:238, SEQ ID NO:246, SEQ
D NO:104, SEQ D N0:112, SEQ D NO:120, SEQ D NO:128, SEQ D NO:136, SEQ D NO:144, SEQ D NO:152, SEQ D NO:160, SEQ D NO:168, SEQ D NO:176, SEQ D NO:184, SEQ D NO:192, SEQ D N0:200, SEQ D NO:208, SEQ D NO:216, SEQ D NO:224, SEQ D NO:232, SEQ D NO:240, SEQ D NO:248, SEQ
D NO:106, SEQ D N0:114, SEQ D NO:122, SEQ D NO:130, SEQ D NO:138, SEQ D NO:146, SEQ D NO:154, SEQ D NO:162, SEQ D NO:170, SEQ D NO:178, SEQ D NO:186, SEQ D NO:194, SEQ D NO:202, SEQ D NO:210, SEQ D NO:218, SEQ D NO:226, SEQ D NO:234, SEQ D NO:242, SEQ D NO:250, SEQ
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
Petição 870170009999, de 15/02/2017, pág. 333/1247
324/788
NO:252, SEQ ID NO:254, SEQ ID NO:256, SEQ ID NO:258, SEQ ID
NO:260, SEQ ID NO:262, SEQ ID NO:264, SEQ ID NO:266, SEQ ID
NO:268, SEQ ID NO:270, SEQ ID NO:272, SEQ ID NO:274, SEQ ID
NO:276, SEQ ID NO:278, SEQ ID NO:280, SEQ ID NO:282, SEQ ID
NO:284, SEQ ID NO:286, SEQ ID NO:288, SEQ ID NO:290, SEQ ID
NO:292, SEQ ID NO:294, SEQ ID NO:296, SEQ ID NO:298, SEQ ID
N0:300, SEQ ID NO:302, SEQ ID NO:304, SEQ ID NO:306, SEQ ID
NO:308, SEQ ID NO:310, SEQ ID NO:312, SEQ ID NO:314, SEQ ID
NO:316, SEQ ID NO:318, SEQ ID NO:320, SEQ ID NO:322, SEQ ID
NO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID NO:330, SEQ ID
NO:332 ou SEQ ID NO:334 ou fragmentos ou subsequências dos mesmos que possuem atividade de aldolase podem ser úteis na facilitação de uma reação dentro de uma vide de várias etapas para a obtenção de um produto escolhido de monatina, derivados de monatina, sais dos mesmos e combinações dos mesmos. Em uma modalidade, os polipeptídeos com atividade de aldolase podem ser úteis na facilitação de uma reação em que o indol-3-piruvato é convertido em MP com uma etapa dentro de uma vide de várias etapas para a obtenção de um produto escolhido de monatina, derivados de monatina, sais dos mesmos e combinações dos mesmos.
[00616] Em uma outra modalidade, um ou mais polipeptídeos escolhidos de polipeptídeos isolados ou recombinantes com atividade de HMG aldolase de qualquer uma da SEQ ID NO:2, SEQ ID NO:4, SEQ
ID NO:( 5, SE» Q I D NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID
NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID
NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID
NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID
NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID
NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID
NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID
Petição 870170009999, de 15/02/2017, pág. 334/1247
325/788
NO:62, SEQ ID NO:64, SEQ ID
NO:70, SEQ ID NO:72, SEQ ID
NO:78, SEQ ID NO:80, SEQ ID
NO:86, SEQ ID NO:88, SEQ ID
NO:94, SEQ ID NO:96, SEQ ID
NO:66, SEQ ID NO:68, SEQ ID
NO:74, SEQ ID NO:76, SEQ ID
NO:82, SEQ ID NO:84, SEQ ID
NO:90, SEQ ID NO:92, SEQ ID
NO:98, SEQ ID N0:100, SEQ ID
NO:102, SEQ Ν0:110, SEQ ΝΟ:118, SEQ ΝΟ:126, SEQ ΝΟ:134, SEQ ΝΟ:142, SEQ ΝΟ:150, SEQ ΝΟ:158, SEQ ΝΟ:166, SEQ ΝΟ:174, SEQ ΝΟ:182, SEQ ΝΟ:190, SEQ ΝΟ:198, SEQ ΝΟ:206, SEQ ΝΟ:214, SEQ ΝΟ:222, SEQ ΝΟ:230, SEQ ΝΟ:238, SEQ ΝΟ:246, SEQ ΝΟ:254, SEQ ΝΟ:262, SEQ ΝΟ:270, SEQ ΝΟ:278, SEQ ΝΟ:286, SEQ ΝΟ:294, SEQ
ID NO:104, SEQ ID NO:112, SEQ ID NO:120, SEQ ID NO:128, SEQ ID NO:136, SEQ ID NO:144, SEQ ID NO:152, SEQ ID NO:160, SEQ ID NO:168, SEQ ID NO:176, SEQ ID NO:184, SEQ ID NO:192, SEQ ID N0:200, SEQ ID NO:208, SEQ ID NO:216, SEQ ID NO:224, SEQ ID NO:232, SEQ ID NO:240, SEQ ID NO:248, SEQ ID NO:256, SEQ ID NO:264, SEQ ID NO:272, SEQ ID NO:280, SEQ ID NO:288, SEQ ID NO:296, SEQ
D NO:106, SEQ D NO:114, SEQ D NO:122, SEQ D NO:130, SEQ D NO:138, SEQ D NO:146, SEQ D NO:154, SEQ D NO:162, SEQ D NO:170, SEQ D NO:178, SEQ D NO:186, SEQ D NO:194, SEQ D NO:202, SEQ D NO:210, SEQ D NO:218, SEQ D NO:226, SEQ D NO:234, SEQ D NO:242, SEQ D NO:250, SEQ D NO:258, SEQ D NO:266, SEQ D NO:274, SEQ D NO:282, SEQ D NO:290, SEQ D NO:298, SEQ
D NO:108, SEQ D NO:116, SEQ D NO:124, SEQ D NO:132, SEQ D NO:140, SEQ D NO:148, SEQ D NO:156, SEQ D NO:164, SEQ D NO:172, SEQ D NO:180, SEQ D NO:188, SEQ D NO:196, SEQ D NO:204, SEQ D NO:212, SEQ D NO:220, SEQ D NO:228, SEQ D NO:236, SEQ D NO:244, SEQ D NO:252, SEQ D NO:260, SEQ D NO:268, SEQ D NO:276, SEQ D NO:284, SEQ D NO:292, SEQ D N0:300, SEQ
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
Petição 870170009999, de 15/02/2017, pág. 335/1247
326/788
NO:302, SEQ ID NO:304 ou fragmentos ou subsequências dos mesmos que possuem atividade de aldolase podem ser úteis na facilitação de uma reação entre indol-3-piruvato e uma fonte de carbono C3 como uma etapa dentro de uma vide de várias etapas para a obtenção de um produto escolhido de monatina, derivados de monatina, sais dos mesmos e combinações dos mesmos. Em uma modalidade, os polipeptídeos com atividade de HMG aldolase podem ser úteis na facilitação de uma reação em que o indol-3-piruvato é convertido em MP como uma etapa dentro de uma vide de várias etapas para a obtenção de um produto escolhido de monatina, derivados de monatina, sais dos mesmos e combinações dos mesmos.
[00617] Ainda em uma outra modalidade, um ou mais polipeptídeos escolhidos de polipeptídeos isolados ou recombinantes com atividade de KHG aldolase de qualquer uma da SEQ ID NO:306, SEQ ID NO:308, SEQ ID NO:310, SEQ ID NO:312, SEQ ID NO:314, SEQ ID
NO:316, SEQ ID NO:318, SEQ ID NO:320, SEQ ID NO:322, SEQ ID
NO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID NO:330, SEQ ID
NO:332 ou SEQ ID NO:334 ou fragmentos ou subsequências dos mesmos que possuem atividade de aldolase podem ser úteis na facilitação de uma reação entre indol-3-piruvato e uma fonte de carbono C3 como uma etapa dentro de uma vide de várias etapas para a obtenção de um produto escolhido de monatina, derivados de monatina, sais dos mesmos e combinações dos mesmos. Em uma modalidade, os polipeptídeos com atividade de KHG aldolase podem ser úteis na facilitação de uma reação em que o indol-3-piruvato é convertido em MP como uma etapa dentro de uma vide de várias etapas para a obtenção de um produto escolhido de monatina, derivados de monatina, sais dos mesmos e combinações dos mesmos.
[00618] Adicionalmente, um ou mais polipeptídeos codificados por uma ou mais sequências de ácidos nucléicos que possuem pelo mePetição 870170009999, de 15/02/2017, pág. 336/1247
327/788 nos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%,
58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%,
70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%,
82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%,
94%, 95%, 96%, 97%, 98%, 99% ou mais ou identidade de sequência completa (100%) a um ácido nucléico de acordo com a invenção, incluindo as SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7,
SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ
D
NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID
NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID
NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID
NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID
NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID
NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID
NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID
NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID
NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID
NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID
NO:97, SEQ ID NO:99, SEQ I D NO:101, SEQ ID NO:103, SEQ ID
NO:105, SEQ ID NO:107, NO:113, SEQ ID NO:115, NO:121, SEQ ID NO:123, NO:129, SEQ ID NO:131, NO:137, SEQ ID NO:139, NO:145, SEQ ID NO:147, NO:153, SEQ ID NO:155, NO:161, SEQ ID NO:163, NO:169, SEQ ID NO:171, NO:177, SEQ ID NO:179, NO:185, SEQ ID NO:187,
SEQ ID NO:109, SEQ
SEQ ID NO:117, SEQ
SEQ ID NO:125, SEQ
SEQ ID NO:133, SEQ
SEQ ID NO:141, SEQ
SEQ ID NO:149, SEQ
SEQ ID NO:157, SEQ
SEQ ID NO:165, SEQ
SEQ ID NO:173, SEQ
SEQ ID NO:181, SEQ
SEQ ID NO:189, SEQ
D NO:111, SEQ D NO:119, SEQ D NO:127, SEQ D NO:135, SEQ D NO:143, SEQ D NO:151, SEQ D NO:159, SEQ D NO:167, SEQ D NO:175, SEQ D NO:183, SEQ D NO:191, SEQ
D
D
D
D
D
D
D
D
D
D
D
Petição 870170009999, de 15/02/2017, pág. 337/1247
328/788
NO:193, SEQ ΝΟ:201, SEQ ΝΟ:209, SEQ ΝΟ:217, SEQ ΝΟ:225, SEQ ΝΟ:233, SEQ ΝΟ:241, SEQ ΝΟ:249, SEQ ΝΟ:257, SEQ ΝΟ:265, SEQ ΝΟ:273, SEQ ΝΟ:281, SEQ ΝΟ:289, SEQ ΝΟ:297, SEQ ΝΟ:305, SEQ ΝΟ:313, SEQ ΝΟ:321, SEQ ΝΟ:329, SEQ
D NO:195, SEQ ID D NO:203, SEQ ID D N0:211, SEQ ID D NO:219, SEQ ID D NO:227, SEQ ID D NO:235, SEQ ID D NO:243, SEQ ID D NO:251, SEQ ID D NO:259, SEQ ID D NO:267, SEQ ID D NO:275, SEQ ID D NO:283, SEQ ID D NO:291, SEQ ID D NO:299, SEQ ID D NO:307, SEQ ID D NO:315, SEQ ID D NO:323, SEQ ID
NO:197, SEQ NO:205, SEQ NO:213, SEQ NO:221, SEQ NO:229, SEQ NO:237, SEQ NO:245, SEQ NO:253, SEQ NO:261, SEQ NO:269, SEQ NO:277, SEQ NO:285, SEQ NO:293, SEQ NO:301, SEQ NO:309, SEQ NO:317, SEQ NO:325, SEQ NO:333, SEQ
ID NO:331, SEQ ID NO:336, SEQ ID NO:337 e SEQ ID pelo menos aproximadamente 10,
D NO:199, SEQ ID D NO:207, SEQ ID D NO:215, SEQ ID D NO:223, SEQ ID D NO:231, SEQ ID D NO:239, SEQ ID D NO:247, SEQ ID D NO:255, SEQ ID D NO:263, SEQ ID D NO:271, SEQ ID D NO:279, SEQ ID D NO:287, SEQ ID D NO:295, SEQ ID D NO:303, SEQ ID D NO:311, SEQ ID D NO:319, SEQ ID D NO:327, SEQ ID ID
D NO:335, SEQ NO:338 ao longo de uma região de 15, 20, 25, 30, 35, 40, 45, 50, 75,
100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500 ou mais resíduos podem ser úteis na facilitação de uma reação entre indol-3-piruvato e uma fonte de carbono C3 como uma etapa dentro de uma vide de várias etapas para a obtenção de um produto escolhido de monatina, derivados de monatina, sais dos mesmos e combinações dos mesmos. Em uma modalidade, o um ou mais polipeptídeos ou fragmentos ou subsequências dos mesmos com atividade de aldolase
Petição 870170009999, de 15/02/2017, pág. 338/1247
329/788 podem ser úteis na facilitação de uma reação em que o indol-3piruvato é convertido em MP como uma etapa dentro de uma vide de várias etapas para a obtenção de um produto escolhido de monatina, derivados de monatina, sais dos mesmos e combinações dos mesmos.
[00619] Em uma outra modalidade da invenção, um ou mais polipeptídeos com atividade de HMG aldolase codificados por uma sequência de ácidos nucléicos que possui pelo menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%,
62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%,
74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%,
86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%,
98%, 99% ou mais ou identidade de sequência completa (100%) a um ácido nucléico de acordo com a invenção, incluindo as SEQ ID NO:1,
SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ
D
NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID
NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID
NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID
NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID
NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID
NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID
NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID
NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID
NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID
NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID
NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID
NO:99, SEQ D NO:101, SEQ ID NO:103, SEQ ID NO:105, SEQ ID
NO:107, SEQ ID NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID
NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID
NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID
Petição 870170009999, de 15/02/2017, pág. 339/1247
330/788
NO:131, SEQ ID NO:139, SEQ ID NO:147, SEQ ID NO:155, SEQ ID NO:163, SEQ ID NO:171, SEQ ID NO:179, SEQ ID NO:187, SEQ ID NO:195, SEQ ID NO:203, SEQ ID NO:211, SEQ ID NO:219, SEQ ID NO:227, SEQ ID NO:235, SEQ ID NO:243, SEQ ID NO:251, SEQ ID NO:259, SEQ ID NO:267, SEQ ID NO:275, SEQ ID NO:283, SEQ ID NO:291, SEQ ID NO:299, SEQ ID
NO:133, SEQ NO:141, SEQ NO:149, SEQ NO:157, SEQ NO:165, SEQ NO:173, SEQ NO:181, SEQ NO:189, SEQ NO:197, SEQ NO:205, SEQ NO:213, SEQ NO:221, SEQ NO:229, SEQ NO:237, SEQ NO:245, SEQ NO:253, SEQ NO:261, SEQ NO:269, SEQ NO:277, SEQ NO:285, SEQ NO:293, SEQ NO:301, SEQ
ID NO:135, SEQ ID NO:143, SEQ ID NO:151, SEQ ID NO:159, SEQ ID NO:167, SEQ ID NO:175, SEQ ID NO:183, SEQ ID NO:191, SEQ ID NO:199, SEQ ID NO:207, SEQ ID NO:215, SEQ ID NO:223, SEQ ID NO:231, SEQ ID NO:239, SEQ ID NO:247, SEQ ID NO:255, SEQ ID NO:263, SEQ ID NO:271, SEQ ID NO:279, SEQ ID NO:287, SEQ ID NO:295, SEQ ID NO:303, SEQ
ID NO:137, SEQ ID ID NO:145, SEQ ID ID NO:153, SEQ ID ID NO:161, SEQ ID ID NO:169, SEQ ID ID NO:177, SEQ ID ID NO:185, SEQ ID ID NO:193, SEQ ID ID NO:201, SEQ ID ID NO:209, SEQ ID ID NO:217, SEQ ID ID NO:225, SEQ ID ID NO:233, SEQ ID ID NO:241, SEQ ID ID NO:249, SEQ ID ID NO:257, SEQ ID ID NO:265, SEQ ID ID NO:273, SEQ ID ID NO:281, SEQ ID ID NO:289, SEQ ID ID NO:297, SEQ ID ID NO:305 ao longo de uma região de pelo menos aproximadamente 10, 15, 20, 25, 30, 35,
40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200,
1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750,
1800, 1850, 1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350,
2400, 2450, 2500 ou mais resíduos podem ser úteis na facilitação de uma reação entre indol-3-piruvato e uma fonte de carbono C3 como uma etapa dentro de uma vide de várias etapas para a obtenção de
Petição 870170009999, de 15/02/2017, pág. 340/1247
331/788 um produto escolhido de monatina, derivados de monatina, sais dos mesmos e combinações dos mesmos. Em uma modalidade, o um ou mais polipeptídeos com atividade de HMG aldolase podem ser úteis na facilitação de uma reação em que o indol-3-piruvato é convertido em MP como uma etapa dentro de uma vide de várias etapas para a obtenção de um produto escolhido de monatina, derivados de monatina, sais dos mesmos e combinações dos mesmos.
[00620] Ainda em uma outra modalidade da invenção, um ou mais polipeptídeos com atividade de KHG aldolase codificados por uma sequência de ácidos nucléicos que possui pelo menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%,
62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%,
74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%,
86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%,
98%, 99% ou mais ou identidade de sequência completa (100%) a um ácido nucléico de acordo com a invenção, incluindo as SEQ ID NO:307, SEQ ID NO:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID
NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID
NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID
NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID
NO:337 e SEQ ID NO:338 ao longo de uma região de pelo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500 ou mais resíduos podem ser úteis na facilitação de uma reação entre indol-3piruvato e uma fonte de carbono C3 como uma etapa dentro de uma vide de várias etapas para a obtenção de um produto escolhido de monatina, derivados de monatina, sais dos mesmos e combinações
Petição 870170009999, de 15/02/2017, pág. 341/1247
332/788 dos mesmos. Em uma modalidade, o um ou mais polipeptídeos com atividade de KHG aldolase podem ser úteis na facilitação de uma reação em que o indol-3-piruvato é convertido em MP como uma etapa dentro de uma vide de várias etapas para a obtenção de um produto escolhido de monatina, derivados de monatina, sais dos mesmos e combinações dos mesmos.
[00621] Além disso, um ou mais polipeptídeos com atividade de aldolase codificados por uma sequência de ácidos nucléicos que se hibridiza sob condição rigorosa com um ácido nucléico das SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ
ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ
NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ
NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ
NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ
NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ
NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ
NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ
NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ
NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ
NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ
NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ
D NO:25, SEQ D NO:33, SEQ D NO:41, SEQ D NO:49, SEQ D NO:57, SEQ D NO:65, SEQ D NO:73, SEQ D NO:81, SEQ D NO:89, SEQ D NO:97, SEQ
NO:99, SEQ ID NO:101, SEQ ID NO:103, SEQ ID NO:105, SEQ
NO:107, SEQ ID NO:109, SEQ ID NO:111, SEQ NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ NO:163, SEQ ID NO:165, SEQ ID NO:167, SEQ
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
D NO:113, SEQ D NO:121, SEQ D NO:129, SEQ D NO:137, SEQ D NO:145, SEQ D NO:153, SEQ D NO:161, SEQ D NO:169, SEQ
Petição 870170009999, de 15/02/2017, pág. 342/1247
333/788
N0:171, SEQ ΝΟ:179, SEQ ΝΟ:187, SEQ ΝΟ:195, SEQ ΝΟ:203, SEQ Ν0:211, SEQ ΝΟ:219, SEQ ΝΟ:227, SEQ ΝΟ:235, SEQ ΝΟ:243, SEQ ΝΟ:251, SEQ ΝΟ:259, SEQ ΝΟ:267, SEQ ΝΟ:275, SEQ ΝΟ:283, SEQ ΝΟ:291, SEQ ΝΟ:299, SEQ ΝΟ:307, SEQ ΝΟ:315, SEQ ΝΟ:323, SEQ ΝΟ:331, SEQ
ID NO:173, SEQ ID N0:181, SEQ ID NO:189, SEQ ID NO:197, SEQ ID NO:205, SEQ ID NO:213, SEQ ID NO:221, SEQ ID NO:229, SEQ ID NO:237, SEQ ID NO:245, SEQ ID NO:253, SEQ ID NO:261, SEQ ID NO:269, SEQ ID NO:277, SEQ ID NO:285, SEQ ID NO:293, SEQ ID NO:301, SEQ ID NO:309, SEQ ID NO:317, SEQ ID NO:325, SEQ ID NO:333, SEQ
ID NO:175, SEQ ID NO:183, SEQ ID N0:191, SEQ ID NO:199, SEQ ID NO:207, SEQ ID NO:215, SEQ ID NO:223, SEQ ID NO:231, SEQ ID NO:239, SEQ ID NO:247, SEQ ID NO:255, SEQ ID NO:263, SEQ ID NO:271, SEQ ID NO:279, SEQ ID NO:287, SEQ ID NO:295, SEQ ID NO:303, SEQ ID N0:311, SEQ ID NO:319, SEQ ID NO:327, SEQ ID NO:335, SEQ
D NO:177, SEQ ID D NO:185, SEQ ID D NO:193, SEQ ID D NO:201, SEQ ID D NO:209, SEQ ID D NO:217, SEQ ID D NO:225, SEQ ID D NO:233, SEQ ID D NO:241, SEQ ID D NO:249, SEQ ID D NO:257, SEQ ID D NO:265, SEQ ID D NO:273, SEQ ID D NO:281, SEQ ID D NO:289, SEQ ID D NO:297, SEQ ID D NO:305, SEQ ID D NO:313, SEQ ID D NO:321, SEQ ID D NO:329, SEQ ID D NO:336, SEQ ID
NO:337 e SEQ ID NO:338 podem ser úteis na facilitação de uma reação entre indol-3-piruvato e uma fonte de carbono C3 como uma etapa dentro de uma vide de várias etapas para a obtenção de um produto escolhido de monatina, derivados de monatina, sais dos mesmos e combinações dos mesmos. Em uma modalidade, o um ou mais polipeptídeos com atividade de aldolase podem ser úteis na facilitação de uma reação em que o indol-3-piruvato é convertido em MP como uma etapa dentro de uma vide de várias etapas para a obtenção de um produto escolhido de monatina, derivados de monatina, sais dos mesPetição 870170009999, de 15/02/2017, pág. 343/1247
334/788 mos e combinações dos mesmos.
[00622] Em uma outra modalidade da invenção, um ou mais polipeptídeos com atividade de HMG aldolase codificados por uma sequência de ácidos nucléicos que se hibridiza sob condições rigorosas com um ácido nucléico das SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ
ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ
NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ
NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ
NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ
NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ
NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ
NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ
NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ
NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ
D NO:37, SEQ D NO:45, SEQ D NO:53, SEQ D NO:61, SEQ D NO:69, SEQ D NO:77, SEQ D NO:85, SEQ D NO:93, SEQ
NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQ
NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ NO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ NO:159, SEQ ID NO:161, SEQ ID NO:163, SEQ NO:167, SEQ ID NO:169, SEQ ID NO:171, SEQ NO:175, SEQ ID NO:177, SEQ ID NO:179, SEQ NO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ NO:191, SEQ ID NO:193, SEQ ID NO:195, SEQ NO:199, SEQ ID NO:201, SEQ ID NO:203, SEQ
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
D NO:109, SEQ D NO:117, SEQ D NO:125, SEQ D NO:133, SEQ D NO:141, SEQ D NO:149, SEQ D NO:157, SEQ D NO:165, SEQ D NO:173, SEQ D NO:181, SEQ D NO:189, SEQ D NO:197, SEQ D NO:205, SEQ
Petição 870170009999, de 15/02/2017, pág. 344/1247
335/788
NO:207, SEQ ID NO:209, SEQ ID N0:211, SEQ ID NO:213, SEQ ID
NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID
NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID
NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID
NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID
NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID
NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID
NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID
NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID
NO:279, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID
NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID
NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID NO:301, SEQ ID
NO:303, SEQ ID NO:305 podem ser úteis na facilitação de uma reação entre indol-3-piruvato e uma fonte de carbono C3 como uma etapa dentro de uma vide de várias etapas para a obtenção de um produto escolhido de monatina, derivados de monatina, sais dos mesmos e combinações dos mesmos. Em uma modalidade, o um ou mais polipeptídeos com atividade de HMG aldolase podem ser úteis na facilitação de uma reação em que o indol-3-piruvato é convertido em MP como uma etapa dentro de uma vide de várias etapas para a obtenção de um produto escolhido de monatina, derivados de monatina, sais dos mesmos e combinações dos mesmos.
[00623] Ainda em uma outra modalidade da invenção, um ou mais polipeptídeos com atividade de KHG aldolase codificados por uma sequência de ácidos nucléicos que se hibridiza sob condições rigorosas com um ácido nucléico das SEQ ID NO:307, SEQ ID NO:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID
NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID
NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID
NO:335, SEQ ID NO:336, SEQ ID NO:337 e SEQ ID NO:338 podem
Petição 870170009999, de 15/02/2017, pág. 345/1247
336/788 ser úteis na facilitação de uma reação entre indol-3-piruvato e uma fonte de carbono C3 como uma etapa dentro de uma vide de várias etapas para a obtenção de um produto escolhido de monatina, derivados de monatina, sais dos mesmos e combinações dos mesmos. Em uma modalidade, o um ou mais polipeptídeos com atividade de KHG aldolase podem ser úteis na facilitação de uma reação em que o indol3-piruvato é convertido em MP como uma etapa dentro de uma vide de várias etapas para a obtenção de um produto escolhido de monatina, derivados de monatina, sais dos mesmos e combinações dos mesmos.
[00624] Os polipeptídeos com atividade de aldolase descritos aqui podem ser úteis na facilitação de uma reação entre indol-3-piruvato e uma fonte de carbono C3. A fonte de carbono C3 pode ser, mas não está limitada a oxaloacetato, piruvato ou um derivado de piruvato, tal como fosfoenolpiruvato. Em uma modalidade, a fonte de carbono C3 é piruvato.
[00625] Os exemplos de enzimas úteis para a conversão do produto de reação entre indol-3-piruvato e a fonte de carbono C3 em monatina incluem membros das classes de enzimas: triptofano aminotransferases (2.6.1.27), triptofano desidrogenases (1.4.1.19), D-aminoácido desidrogenases (1.4.99.1), glutamato desidrogenases (1.4.1.2-4), fenilalanina desidrogenase (EC 1.4.1.20), triptofano-fenilpiruvato transaminases (2.6.1.28) ou, de forma mais geral, membros da família das aminotransferases (2.6.1.-) tais como aspartato aminotransferase (EC 2.6.1.1), tirosina (aromática) aminotransferase (2.6.1.5), D-triptofano aminotransferase ou D-alanina (2.6.1.21) aminotransferase (vide a figura 2 da WO 03/091396 A2). Esta reação também pode ser realizada utilizando reações químicas. A aminação do ceto ácido (MP) é realizada através da aminação redutora utilizando amônia e cianoborohidreto de sódio. As figuras 11-13 da WO 03/091396 A2 mostram polipeptíPetição 870170009999, de 15/02/2017, pág. 346/1247
337/788 deos adicionais que podem ser utilizados para converter MP em monatina, assim como que fornecem maiores rendimentos de monatina partindo de indol-3-piruvato ou triptofano. Em uma modalidade, estas enzimas são utilizadas para catalisar a conversão de MP, o produto de reação entre indol-3-piruvato e piruvato, em monatina.
[00626] O perfil de sabor de uma composição de monatina pode ser alterado através do controle da quantidade relativa dos vários estereoisômeros de monatina na composição. A presente descrição fornece vias e substâncias para a produção de composições de monatina com uma porcentagem desejada de R,R monatina e/ou S,R monatina. [00627] A quiralidade dos compostos de monatina produzidos através das vias divulgadas pode ser afetada tanto pelo pH quanto pelos polipeptídeos utilizados para as conversões biológicas. Os polipeptídeos com atividade de aldolase descritos aqui, podem ser utilizados para controlar a quiralidade da monatina carbono-2 (vide a Fórmula I, acima) na reação em que o indol-3-piruvato é convertido em MP. [00628] Uma vez que o produto de reação da reação entre indol-3piruvato e a fonte de carbono C3 é obtido, o grupo amino pode ser adicionado de forma estéreoespecífica. A configuração R ou S do carbono-4 (vide a Fórmula I acima) pode ser gerada dependendo do fato de uma aminotransferase ácida D- ou L-aromática ser utilizada. Muitas aminotransferases são específicas para o L-isômero, entretanto, há Dtriptofano aminotransferases em certas plantas (Kohiba e Mito, Proceedings of the 8th International Symposium on Vitamin B6 and Carbonyl Catalysis, Osaka, Japão 1990). Além disso, as D-alanina aminotransferases (2.6.1.21), as D-metionina-piruvato aminotransferases (2.6.1.41) e tanto a (R)-3-amino-2-metilpropanoato aminotransferase (2.6.1.61), quanto a (S)-3-amino-2-metilpropanoato aminotransferase (2.6.1.22) e a D-fenilglicina aminotransferase foram identificadas. Certas aminotransferases podem aceitar apenas o substrato para esta rePetição 870170009999, de 15/02/2017, pág. 347/1247
338/788 ação com uma configuração particular no carbono C2. Portanto, mesmo se a conversão no produto de reação entre indol-3-piruvato e a fonte de carbono C3 não for estereoespecífica, a estereoquímica do produto final pode ser controlada através da seleção apropriada de uma aminotransferase. Devido ao fato de que as reações são reversíveis, o produto de reação não reagido (isômero indesejado) pode ser reciclado de volta em seus constituintes e uma mistura racêmica do produto de reação pode ser formada novamente.
[00629] Um exemplo de um doador amino adequado para a adição de um grupo amino ao produto de reação da reação entre o indol-3piruvato e a fonte de carbono C3 inclui, mas não está limitado a um aminoácido, tal como alanina, aspartato, lisina, glutamato, glicina e triptofano.
[00630] Referindo-se agora às figuras, pode ser citado o seguinte. Os gráficos de fluxo identificam vias para a produção de monatina, mas não estão limitados a qualquer método particular para a realização das vias. Por exemplo, as vias podem ser realizadas in vivo, in vitro ou uma combinação dos mesmos.
[00631] Além disso, a realização das vias não requer que cada um dos componentes identificados (tais como reagentes e enzimas) seja explicitamente fornecido pelo técnico, contanto que componentes ou fontes de componentes suficientes e condições de reação sejam fornecidos de forma que a vide pode ser potencial mente realizada. Em outras palavras, por exemplo, se uma figura representar um processo para a produção de uma composição de monatina, que inclui a produção de indol-3-piruvato partindo de L-triptofano, a produção de ácido 2hidróxi 2-(indol-3ilmetil)-4-ceto glutárico (precursor de monatina ou MP) partindo de indol-3-piruvato e a produção de monatina partindo de MP, em que cada reação é facilitada por uma enzima apropriada, é considerado que a realização de tal vide inclui a combinação de LPetição 870170009999, de 15/02/2017, pág. 348/1247
339/788 triptofano com α-cetoglutarato e enzimas consideradas para a facilitação das reações identificadas e sob condições adequadas para que cada uma das reações ocorra sem fornecer explicitamente também indol-3-piruvato ou MP. Em tal caso o L-triptofano poderia reagir com α-cetoglutarato para produzir indol-3-piruvato. Devido às condições ajustadas e à enzima fornecida, o indol-3-piruvato produzido partindo da reação com L-triptofano poderia reagir para formar MP e então devido às condições ajustadas e à enzima fornecida, o MP produzido partindo da reação com indol-3-piruvato poderia reagir para formar monatina.
[00632] Deve ainda ser citado que a prática das vias descritas não requer que o técnico forneça explicitamente os materiais de partida ou as enzimas identificadas. Em outras palavras, é considerado que a realização de qualquer uma das vias que identifica o L-triptofano como um material de partida incluiria o fornecimento de um composto que pode produzir L-triptofano, sob condições adequadas para que a produção de L-triptofano ocorra e a combinação de tal composto com enzimas capazes de facilitar a série de reações apresentadas sob condições que seriam adequadas para tais reações ocorram. Como um outro exemplo, é também considerado que a realização da vide identificada incluiria o fornecimento de um microorganismo engenheirado geneticamente para produzir monatina de acordo com a vide descrita e o fornecimento de condições apropriadas para que o processo de fermentação ocorra. Por exemplo, um microorganismo, que produz naturalmente grandes quantidades de L-triptofano poderia ser geneticamente engenheirado para produzir ou superproduzir uma ou mais das enzimas utilizadas para facilitar as reações na vide para monatina e condições apropriadas seriam fornecidas de forma que o microorganismo produziría assim monatina.
[00633] A figura 1 identifica a modalidade particular em que uma
Petição 870170009999, de 15/02/2017, pág. 349/1247
340/788 aldolase específica a R facilita a reação de indol-3-piruvato e piruvato para formar form R-MP. O gráfico de fluxo da figura 1 representa esquematicamente um processo de acordo com a invenção para a produção de uma composição de monatina que inclui R,R monatina. Como mostrado na figura 1, a vide geral envolve uma reação de triptofano para formar indol-3-piruvato, uma reação de indol-3-piruvato para produzir MP e uma reação de MP para produzir monatina, incluindo R,R monatina.
[00634] A figura 1 ilustra ainda permutações específicas desta vide geral, planejadas para aumentar a produção da forma R,R da monatina às custas das formas S,S, R,S e S, da monatina. Em particular, a figura 1 ilustra a modalidade em que: a enzima aminotransferase utilizada na reação de L-triptofano possui maior atividade e/ou especificidade por tal reação versus as reações de MP e 4S monatina ou a oxidase possui maior atividade e/ou especificidade pelo L-triptofano que pela 4R monatina; a enzima que facilita a reação de indol-3-piruvato é um polipeptídeo com atividade de aldolase divulgado aqui e, a enzima que facilita a reação de MP é uma D-enzima de especificidade ampla, preferencialmente envolvida em funcionar mais eficientemente com o isômero R de MP.
[00635] A figura 1 ilustra também permutações particulares planejadas para tornar a produção de R,R monatina mais econômica. Por exemplo, na figura 1, o L-triptofano - ao contrário do D-triptofano ou de combinações de L- e D-triptofano - é identificado como o material de partida. Embora a escolha da forma específica de triptofano não tenha impacto sobre a quiralidade dos compostos de monatina finais na composição de monatina (devido ao fato de que a reação de triptofano forma indol-3-piruvato, que não possui quiralidade), algumas pessoas podem preferir utilizar o L-triptofano como um material de partida pelo menos porque o L-triptofano é atualmente menos dispendioso e pode
Petição 870170009999, de 15/02/2017, pág. 350/1247
341/788 ser obtido mais facilmente que o D-triptofano.
[00636] Enfocando agora a primeira reação mostrada na figura 1, quando o triptofano é convertido em indol-3-piruvato qualquer um ou mais de alfa-cetoglutarato, oxaloacetato e piruvato reagem para formar um aminoácido (glutamato, aspartato e alanina, respectivamente). A figura 1 representa a modalidade em que o material de partida de triptofano é o L-triptofano e o alfa-cetoglutarato, oxaloacetato e/ou o piruvato produzem a forma de L-isômero do aminoácido (tal como Lglutamato, L-aspartato e/ou L-alanina, respectivamente).
[00637] Como mostrado na figura 1, uma abordagem par aumentar a produção de R,R monatina envolve a facilitação da reação de Ltriptofano com uma enzima que possui maior especificidade, maior atividade ou ambas em relação ao triptofano ao contrário do MP ou monatina e a facilitação da reação de MP com uma D-enzima. Como é divulgado na WO 03/091396 A2, certas enzimas podem facilitar a reação de triptofano para produzir indol-3-piruvato, assim como a reação de aminação de MP para produzir monatina. O uso de uma Laminotransferase na etapa de aminação cria um centro quiral S na posição C-4 da monatina, enquanto o uso de uma D-enzima cria um centro quiral D na posição C-4 da monatina. Assim, no exemplo em que uma L-aminotransferase, que facilita a reação de triptofano, é também ativa na reação de MP, também podem ser formadas R,S e S,S monatinas, dependendo da forma de MP presente. Em adição, certas outras enzimas - as L-aminoácido oxidases - podem não facilitar apenas a reação de triptofano em indol-3-piruvato, mas podem ter uma subatividade para a degradação da R,R monatina. De acordo com algumas modalidades, esta subatividade de 4R é minimizada ou eliminada. Uma subatividade de oxidase sobre as formas 4S de monatina diminuiría ou minimizaria as mesmas do produto final e podería ser desejável dependendo da composição final desejada. Conseqüentemente,
Petição 870170009999, de 15/02/2017, pág. 351/1247
342/788 quanto maior a especificidade e/ou a atividade da L-enzima escolhida para o triptofano versus o MP ou a monatina, maior é a quantidade de R,R e de S,R produzida versus S,S e R,S monatina.
[00638] As enzimas adequadas para a reação de triptofano, de acordo com a modalidade ilustrada na figura 1, incluem: Laminotransferases capazes de facilitar uma reação de L-triptofano para formar indol-3-piruvato e que possuem maior especificidade por tal reação em relação à reação de R-MP para formar isômeros 4S de monatina; e, L-aminoácido oxidases capazes de facilitar uma reação de Ltriptofano para formar indol-3-piruvato e que possuem maior especificidade e/ou atividade por tal reação versus a reação de isômeros 4R de monatina para formar MP e equivalentes funcionais de qualquer um dos anteriores. Mais especificamente, os exemplos não-limitantes de enzimas adequadas podem ser escolhidos de L-triptofano aminotransferases (E.C. 2.6.1.27) e tirosina (aromática) aminotransferases (EC 2.6.1.5) e L-aminoácido oxidases (EC 1.4.3.2) e mutantes derivados de enzimas que possuem atividade de aspartato aminotransferase. [00639] O Exemplo 16 identifica uma enzima específica, um polipeptídeo HEXaspC mutante que inclui uma substituição de Pro 9 por Tyr e uma substituição de Arg 122 por Gly úteis para facilitar as reações de L-triptofano e α-KG, oxaloacetato, piruvato ou combinações dos mesmos para formar indol-3-piruvato e L-glutamato, L-aspartato e L-alanina, respectivamente. Uma outra enzima específica que possui atividade limitada é TatA, a L-triptofano aminotransferase de S. meliloti. Outras enzimas adequadas para a reação de triptofano de acordo com modalidades preferidas da vide mostrada na figura 1 incluem aquelas com as características a seguir: uma enzima que causa a transaminação de MP a uma taxa de 1/10 ou menor que a taxa de Ltriptofano como no Exemplo 16 ou uma enzima quando utilizada com uma racemase, como no Exemplo 18, que produz mais de 90% dos
Petição 870170009999, de 15/02/2017, pág. 352/1247
343/788 isômeros 4R de monatina.
[00640] Os exemplos de enzimas que não possuem maior especificidade pela conversão de L-triptofano em indol-3-piruvato comparada com a conversão de MP em monatina incluem: HEXAspC (Exemplo 16), aminotransferase de especificidade ampla de Leishmania major (WO 03/091396 A2), a aminotransferase suína (WO 03/091396 A2) e TatA de Rhodobacter sphaeroides (Exemplo 18). Estas enzimas podem, entretanto, podem ser desenvolvidas, por exemplo, através de mutagênese para possuírem atividade limitada por R-MP e/ou R,R monatina versus triptofano.
[00641] Enfocando agora a segunda reação identificada na figura 1, a escolha da enzima para facilitar a reação de indol-3-piruvato em MP influencia a quantidade relativa de R,R monatina versus S,R monatina produzida. Em geral, quanto maior a quantidade relativa de R-MP versus S-MP produzido, maior a quantidade relativa de R,R monatina versus S,R monatina produzida (quando uma D-enzima facilita a reação de MP em monatina). Quando é desejada uma composição de monatina que possui a forma R,R de monatina como seu único componente de monatina, uma enzima que produz seletivamente R-MP ao invés de S-MP (uma enzima específica a R) deve ser utilizada. Os polipeptídeos com atividade de aldolase descritos aqui são úteis na produção seletiva de R-MP, ao invés de S-MP. Vários exemplos de enzimas aldolases altamente específicas a R são demonstrados na Tabela 1, acima, nos Exemplos 4, 5 e 6, abaixo e na Listagem de Sequências. [00642] Enfocando agora a última etapa da vide identificada na figura 1, é mostrado que a reação de R-MP para formar R,R monatina é facilitada por uma D-aminotransferase de especificidade ampla, por exemplo, D-alanina aminotransferase (E.C. 2.6.1.21, também conhecida como D-aminoácido aminotransferase ou D-aspartato aminotransferase) ou uma D-aminoácido desidrogenase. Como discutido anteriorPetição 870170009999, de 15/02/2017, pág. 353/1247
344/788 mente, a conversão de MP em monatina é uma reação de aminação, que cria um centro quiral no carbono C-4 da monatina. Quando a forma quiral R é desejada na posição C-4, devem ser utilizadas enzimas que produzem centros quirais R em aminoácidos.
[00643] De acordo com algumas modalidades, a Daminotransferase possui maior especificidade, maior atividade ou ambas para R-MP que para indol-3-piruvato. De acordo com algumas modalidades, a D-aminotransferase possui atividade limitada para o indol-3-piruvato. As enzimas com tais características podem ser desenvolvidas ou mutadas partindo de enzimas existentes, por exemplo, como mostrado no Exemplo 16.
[00644] Os Exemplos 9 até 12 ilustram a produção de R,Rmonatina partindo de D-triptofano.
[00645] A figura 2 ilustra um método de produção de R,R monatina e S,R monatina. Enquanto que em uma modalidade da figura 1, a aldolase utilizada na reação de indol-3-piruvato para formar R-MP influencia a proporção de R,R:S,R formada, em uma modalidade da figura 2, a D-enzima que facilita a conversão de MP em monatina influencia a proporção de R,R:S,R formada. De acordo com a vide da figura 2, se uma enzima não estereoespecífica for utilizada para facilitar a conversão de indol-3-piruvato em MP, então tanto S-MP quanto R-MP podem ser formados. Se uma aldolase não estereosseletiva for utilizada para converter indol-3-piruvato em MP, então uma transaminase estereosseletiva é necessária para converter o MP em R,R monatina ou S,R monatina. Como mostrado na figura 2, o uso de uma Daminotransferase ou uma D-aminoácido desidrogenase que é estereoespecífica para R-MP resulta na produção de R,R monatina.
[00646] A figura 3 ilustra uma outra vide alternativa para direcionar a produção de R,R monatina. A vide da figura 3 é uma modificação da vide da figura 1, em que o indol-3-piruvato é produzido indiretamente,
Petição 870170009999, de 15/02/2017, pág. 354/1247
345/788 ao invés de diretamente, partindo de L-triptofano. Mais especificamente, o L-triptofano é convertido em D-triptofano e o D-triptofano é então convertido em indol-3-piruvato.
[00647] A conversão de L-triptofano em D-triptofano pode ser facilitada por uma triptofano racemase ou um equivalente funcional da mesma. O Exemplo 15 fornece fontes potenciais de triptofano racemases e métodos de seleção para a identificação de tais enzimas. É também considerado que uma triptofano racemase pode ser desenvolvida (tal como através de mutagênese ou de engenharia recombinante) para melhor desempenho partindo de uma aminoácido racemase existente.
[00648] Os exemplos não-limitantes de triptofano racemases incluem homólogos ou mutantes de aminoácido racemases (EC 5.1.1.-), por exemplo, serina racemase, em que os homólogos ou os mutantes são capazes de converter L-triptofano em D-triptofano. Os exemplos não-limitantes de fontes partindo das quais a aminoácido racemase pode ser derivada incluem: microorganismos tais como Salmonella typhimurium, Escherichia coli, Bacillus subtilis, Pseudomonas aeruginosa, Vibrio cholerae, Schizosaccaroyces pombe, Bacillus cereus, Enterococcus gallinarum, Pediococcus pentosaceus, Bacillus pumilus, Lactobacillus fermenti, Lactobacillus brevis, Aquifex pyrophilus, Lactobacilli, Streptococcus, Anabaena sp., Pseudomonas striata, Lentinus edodes, Scapharca brouhtonii Desulfurococcus sp., Thermococcus sp. e Pseudomonas striata. Os exemplos não-limitantes adicionais de fontes partindo das quais a aminoácido racemase pode ser derivada incluem bicho-da-seda, cérebro de rato ou cérebro de camundongo. [00649] Os exemplos não-limitantes de fontes potenciais partindo das quais as triptofano racemases adequadas podem ser derivadas incluem: microorganismos tais como Pseudomonas, por exemplo, Pseudomonas chlororaphis (Pseudomonas aurereofaciens)
Petição 870170009999, de 15/02/2017, pág. 355/1247
346/788 (ATCC15926) e Burkholderia pyrrocina (ATCC15958). Os exemplos não-limitantes adicionais de fontes potenciais partindo das quais as triptofano racemases adequadas podem ser derivadas incluem plantas, por exemplo, plantas de tabaco, tal como Nicotiana tabacum, plantas de trigo, tal como Triticum aestivum, beterraba, tomates e Sclerochiton ilicifolius.
[00650] A via mostrada na figura 3 tem certos benefícios, incluindo que mesmo quando a R,R monatina é o produto desejado, a mesma enzima pode ser utilizada para a reação que produz indol-3-piruvato assim como para a reação que produz monatina. Ou seja, na vide ilustrada na figura 1, uma L-aminotransferase (ou L-enzima adequada) facilita a reação que produz indol-3-piruvato, mas uma Daminotransferase facilita a reação que produz monatina. Em contraste, na vide da figura 3, certa D-aminotransferase que facilita a reação que produz indol-3-piruvato, também pode facilitar a reação que produz monatina. Conseqüentemente, nas vias de acordo com a figura 3 as D-aminotransferases de especificidade ampla podem ser preferidas quando houver um desejo de utilizar a mesma enzima para a reação que forma indol-3-piruvato assim como para a reação que forma monatina. Em contraste, nas vias de acordo com as figuras 1, 2, 4, 6, 7 e 8 a produção de monatina pode ser levada adiante mais eficientemente quando é escolhida uma D-aminotransferase que possui atividade e/ou especificidade limitada pelo indol-3-piruvato quando comparado ao R-MP.
[00651] Um outro benefício da vide representada esquematicamente na figura 3 é que o produto de aminoácido da reação acoplada com a reação que produz indol-3-piruvato pode ser utilizada agora como um material de partida na reação acoplada com a reação que produz monatina. Ou seja, na vide ilustrada na figura 1, o L-triptofano reage para produzir indol-3-piruvato e, ao mesmo tempo, o oxaloacetato, o
Petição 870170009999, de 15/02/2017, pág. 356/1247
347/788 alfa-cetoglutarato e/ou o piruvato reagem para produzir um Laminoácido. Devido ao fato de que a reação de R-MP para formar monatina é acoplada com uma reação que utiliza um D-aminoácido como um substrato, o L-aminoácido da reação que forma indol-3-piruvato não é, sob as condições mostradas, reciclado para uso na reação acoplada com a reação de R-MP. Em contraste, na vide ilustrada na figura 3, a reação de D-triptofano para formar indol-3-piruvato é acoplada com uma reação que forma um produto de D-aminoácido, cujo D-aminoácido pode ser reciclado para uso na reação acoplada com a reação de R-MP. Isto permite utilizar quantidades não estequiométricas de receptor de amino na etapa um. Em algumas modalidades da invenção, o D-aminoácido e D-alanina.
[00652] As figuras 4 e 5 ilustram modificações adicionais da vide mostrada na figura 1, cujas modificações são direcionadas para a reciclagem do produto de aminoácido formado através da reação acoplada com a reação de L-triptofano com o reagente de aminoácido da reação acoplada com a reação de MP em monatina.
[00653] Voltando para a figura 4, a reciclagem é realizada fornecendo uma enzima que pode facilitar a conversão de um L-aminoácido em um D-aminoácido e vice-versa. Mais especificamente, como é mostrado na figura 4, α-KG reage para formar L-glutamato quando o Ltriptofano reage para formar indol-3-piruvato, pode ser fornecida uma glutamato racemase (EC 5.1.1.3) ou um equivalente funcional que pode facilitar a conversão de L-glutamato em D-glutamato e vice-versa. Em tal caso, o L-glutamato formado ao longo da produção de indol-3piruvato é removido em virtude de sua conversão em D-glutamato e o D-glutamato formado partindo da conversão de L-glutamato fica então disponível como um substrato para a reação acoplada com a reação de MP em monatina. Similarmente, o α-KG formado na reação de Dglutamato fica disponível como um substrato para a reação acoplada
Petição 870170009999, de 15/02/2017, pág. 357/1247
348/788 com a reação de L-triptofano em indol-3-piruvato.
[00654] Os exemplos não-limitantes de fontes potenciais partindo das quais uma glutamato racemase pode ser derivada incluem Pediococcus pentosaceus, Bacillus pumilus, Lactobacillus fermenti, Lactobacillus brevis, E. coli, Aquifex pyrophilus e Bacillus subtilis. Mais especificamente (também não-limitante), a glutamato racemase pode ser expressa partindo de um ácido nucléico tal como o gene murl de Pediococcus pentaosaceus (Número de Acesso do Genbank L22789) ou a glutamato racemase de Lactobacillus brevis.
[00655] Quando o oxaloacetato reage para formar o L-aspartato quando o L-triptofano reage para formar o indol-3-piruvato, uma aspartato racemase (EC 5.1.1.13) ou um equivalente funcional pode ser fornecido para converter o L-aspartato em D-aspartato. Em tal caso, o Laspartato ao longo da produção de indol-3-piruvato é removido em virtude de sua conversão em D-aspartato e o D-aspartato formado partindo da conversão de L-aspartato fica então disponível como um substrato para a reação acoplada com a reação de MP em monatina. Similarmente, o oxaloacetato formado na reação de D-aspartato fica disponível para atuar como um substrato para a reação acoplada com a reação de L-triptofano em indol-3-piruvato.
[00656] Os exemplos não-limitantes de enzimas adequadas que possuem atividade de aspartato racemase incluem ASPR-101 (BioCatalytics, Inc., Pasadena, CA) e homólogos ou mutantes de uma aminoácido racemase (EC 5.1.1.-) que são capazes de facilitar a conversão de L-aspartato em D-aspartato.
[00657] Os exemplos não-limitantes de fontes potenciais partindo das quais as aspartato racemases podem ser derivadas incluem: Desulfurococcus, Thermococcus, molusco bivalve Scapharca brouhtonii, Acinetobacter, Agrobacterium, Archaeoglobus, Bacillus, Bordetella, Bradyrhizobium, Brevibacterium, Burkholderia, Campylobacter, CandiPetição 870170009999, de 15/02/2017, pág. 358/1247
349/788 da, Caulobacter, Clostridium, Desulfitobacterium, Desulfotalea, Enterococcus, Erwinia, Escherichia, Ferroplasma, Helicobacter, Klebsiella, Lactobacillus, Mannheimia, Medicago, Mesorhizobium, Metanococcus, Metanosarcina, Oceanobacillus, Oenococcus, Pediococcus, Polaribacter, Pseudomonas, Pyrococcus, Ralsonia, Shigella, Sinorhizobium, Salmonella, Sphingomonas, Streptococcus, Thermoanaerobacter, Vibrio, Wolinella, Xanthomonas, Xanthobacter, Yersinia e Zymomonas. [00658] Quando o piruvato reage para formar a L-alanina quando o L-triptofano reage para formar o indol-3-piruvato, uma alanina racemase ou um equivalente funcional pode ser fornecido para converter a L-alanina em D-alanina. Em tal caso, a L-alanina formada ao longo da produção de indol-3-piruvato é removida em virtude de sua conversão em D-alanina e a D-alanina formada partindo da conversão de Lalanina fica então disponível para atuar como um substrato para a reação acoplada com a reação de MP em monatina. Similarmente, o piruvato formado na reação de D-alanina fica disponível para atuar como um substrato para a reação acoplada com a reação de L-triptofano em indol-3-piruvato.
[00659] Os exemplos não-limitantes de alanina racemases adequadas incluem A8936 (Sigma-Aldrich, St. Louis, MO).
[00660] Os exemplos não-limitantes de fontes potenciais partindo das quais a alanina racemase pode ser derivada incluem: Brucella abortus, Streptococcus faecalis Salmonella typhimurium, Escherichia coli, Bacillus subtilis, Bacillus stearothermophilus, Pseudomonas aeruginosa, Vibrio cholerae, Schizosaccaroyces pombe, Bacillus cereus e Lentinus edodes.
[00661] Os Exemplos 18 e 21 ilustram o uso das racemases anteriores, seu impacto sobre o aumento da proporção do produto de monatina desejado e fornecem fontes potenciais para as enzimas racemases.
Petição 870170009999, de 15/02/2017, pág. 359/1247
350/788 [00662] Voltando para a figura 5, uma aminotransferase de estereoinversão é utilizada para facilitar a reação de R-MP em monatina. Embora tipicamente a reação de R-MP (ou de S-MP) para formar R,R monatina (ou S,R monatina) esteja acoplada com a reação de um Daminoácido, uma aminotransferase de estereoinversão pode facilitar as reações acopladas de R-MP (ou de S-MP) para formar R,R monatina (ou S,R monatina) utilizando um L-aminoácido. Desta maneira, o produto de L-aminoácido da reação da L-triptofano aminotransferase pode ser utilizado como um substrato para a transaminação de MP em monatina e o produto (isto é, oxaloacetato, piruvato e/ou α-KG) da reação acoplada com a reação de MP em monatina pode ser utilizado como um material de partida para a reação acoplada com a reação de L-triptofano em indol-3-piruvato. Os exemplos não-limitantes de aminotransferases de estereoinversão que podem ser utilizadas incluem Dfenilglicina aminotransferase (EC 2.6.1.72, também conhecida como D-4-hidroxifenilglicina aminotransferase) e D-metionina aminotransferase (EC 2.6.1.41, também conhecida como D-met-aminotransferase e D-metionina-piruvato aminotransferase). Os exemplos não-limitantes de fontes potenciais partindo das quais a D-fenilglicina aminotransferase pode ser derivada incluem Pseudômonas, tal como Pseudomonas putida LW-4 e Pseudomonas stutzeri ST-201. Os exemplos nãolimitantes de fontes potenciais partindo das quais a D-metionina aminotransferase pode ser derivada incluem couve-flor e amendoim. [00663] Os Exemplos 19 e 20 juntos fornecem fontes potenciais de enzimas de estereoinversão e métodos de produção de tais enzimas. Os exemplos fornecem ainda métodos de seleção para a identificação de tais enzimas. É também considerado que tais enzimas podem ser desenvolvidas partindo das enzimas de estereoinversão conhecidas e encontradas na natureza. Como um exemplo não-limitante, a aminotransferase de estereoinversão pode ser um homólogo ou um mutante
Petição 870170009999, de 15/02/2017, pág. 360/1247
351/788 de uma D-aminoácido aminotransferase ou um homólogo ou um mutante de uma aminoácido racemase (EC 5.1.1.-).
[00664] As figuras 6-8 ilustram ainda modificações na vide da figura 1. As vias ilustradas nas figuras 6-8 fornecem métodos para empurrar as reações em equilíbrio à diante através da remoção do subproduto da reação de triptofano e, em alguns casos, para fornecer substrato para a reação de MP.
[00665] Voltando para a figura 6, a vide mostrada remove o produto de L-aminoácido da reação acoplada com a reação de triptofano através da conversão do mesmo em um L-aminoácido diferente e então fornece um substrato para a reação acoplada com a reação de MP através da conversão do L-aminoácido recém-formado em um Daminoácido. Especificamente, é mostrado que o L-triptofano reage junto com o oxaloacetato para formar indol-3-piruvato e L-aspartato. Uma aspartato 4-descarboxilase (EC 4.1.1.12) ou um equivalente funcional é utilizado para facilitar a conversão de L-aspartato em L-alanina e dióxido de carbono e uma enzima com atividade de alanina racemase é utilizada para facilitar a conversão de L-alanina em D-alanina, cuja D-alanina pode servir como um doador de amino para a conversão de R-MP em monatina.
[00666] Voltando para a figura 7, a vide mostrada ilustra métodos adicionais para a remoção do produto de L-aminoácido da reação acoplada com a reação de triptofano. As modalidades que são apresentadas na figura produzem subproduto(s) que fica(m) indisponível(veis) para reagir na direção inversa, por exemplo, devido à volatilidade (tal como dióxido de carbono) ou através da conversão espontânea em um produto final não reativo. Um exemplo de tal abordagem inclui, quando o α-KG reage junto com o L-triptofano para produzir Lglutamato, pode ser fornecida uma glutamato descarboxilase (EC 4.1.1.15) ou um equivalente funcional que pode facilitar a conversão
Petição 870170009999, de 15/02/2017, pág. 361/1247
352/788 de L-glutamato em 4-aminobutanoato (com dióxido de carbono como um subproduto). Os exemplos não-limitantes de fontes potenciais partindo das quais a L-glutamato descarboxilase pode ser derivada incluem: Clostridium perfringens, C. welchii ou E. coli.
[00667] Um outro exemplo de tal abordagem para mover a reação de triptofano à diante inclui, quando o oxaloacetato reage junto com o L-triptofano, uma aspartato descarboxilase (EC 4.1.1.11) ou um equivalente funcional pode ser fornecido para facilitar a conversão de Laspartato em β-alanina (com dióxido de carbono como um subproduto).
[00668] Voltando para a figura 8, a vide mostrada ilustra ainda métodos adicionais para a remoção do produto de L-aminoácido da reação acoplada com a reação de triptofano e o fornecimento de um substrato para a reação acoplada com a reação de MP. Especificamente, quando o α-KG reage junto com o L-triptofano para formar Lglutamato, uma enzima com atividade de L-alanina aminotransferase e piruvato podem ser fornecidos, em que a enzima L-alanina aminotransferase facilita a reação de piruvato e L-glutamato para formar Lalanina. Uma alanina racemase ou equivalente funcional também pode ser fornecido com a finalidade de facilitar a conversão da L-alanina em D-alanina, cuja D-alanina pode ser utilizada como um substrato junto com MP para formar monatina e piruvato. Vide os Exemplos 18 e 21. Vias Biossintéticas para Produzir R,R e Outros Estereoisômeros de
Derivados de Monatina [00669] Os métodos da invenção descrita incluem a utilização dos polipeptídeos com atividade de aldolase descritos aqui que podem ser utilizados para facilitar a reação entre um indol-3-piruvato substituído e uma fonte de carbono C3.
[00670] As enzimas úteis para facilitar uma reação entre um indol-3piruvato substituído e uma fonte de carbono C3 incluem um ou mais
Petição 870170009999, de 15/02/2017, pág. 362/1247
353/788 polipeptídeos com atividade de aldolase de qualquer uma das SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ
ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ
NO:28, SEQ ID NO:30, SEQ NO:36, SEQ ID NO:38, SEQ NO:44, SEQ ID NO:46, SEQ NO:52, SEQ ID NO:54, SEQ NO:60, SEQ ID NO:62, SEQ NO:68, SEQ ID NO:70, SEQ NO:76, SEQ ID NO:78, SEQ NO:84, SEQ ID NO:86, SEQ NO:92, SEQ ID NO:94, SEQ
NO:100, SEQ NO:108, SEQ NO:116, SEQ NO:124, SEQ NO:132, SEQ NO:140, SEQ NO:148, SEQ NO:156, SEQ NO:164, SEQ NO:172, SEQ NO:180, SEQ NO:188, SEQ NO:196, SEQ NO:204, SEQ NO:212, SEQ NO:220, SEQ NO:228, SEQ
ID NO:102, SEQ ID NO:110, SEQ ID NO:118, SEQ ID NO:126, SEQ ID NO:134, SEQ ID NO:142, SEQ ID NO:150, SEQ ID NO:158, SEQ ID NO:166, SEQ ID NO:174, SEQ ID NO:182, SEQ ID NO:190, SEQ ID NO:198, SEQ ID NO:206, SEQ ID NO:214, SEQ ID NO:222, SEQ ID NO:230, SEQ
ID NO:32, SEQ ID NO:40, SEQ ID NO:48, SEQ ID NO:56, SEQ ID NO:64, SEQ ID NO:72, SEQ ID NO:80, SEQ ID NO:88, SEQ ID NO:96, SEQ ID NO:104, SEQ ID NO:112, SEQ ID NO:120, SEQ ID NO:128, SEQ ID NO:136, SEQ ID NO:144, SEQ ID NO:152, SEQ ID NO:160, SEQ ID NO:168, SEQ ID NO:176, SEQ ID NO:184, SEQ ID NO:192, SEQ ID NO:200, SEQ ID NO:208, SEQ ID NO:216, SEQ ID NO:224, SEQ ID NO:232, SEQ
ID NO:34, SEQ ID NO:42, SEQ ID NO:50, SEQ ID NO:58, SEQ ID NO:66, SEQ ID NO:74, SEQ ID NO:82, SEQ ID NO:90, SEQ ID NO:98, SEQ ID NO:106, SEQ ID NO:114, SEQ ID NO:122, SEQ ID NO:130, SEQ ID NO:138, SEQ ID NO:146, SEQ ID NO:154, SEQ ID NO:162, SEQ ID NO:170, SEQ ID NO:178, SEQ ID NO:186, SEQ ID NO:194, SEQ ID NO:202, SEQ ID NO:210, SEQ ID NO:218, SEQ ID NO:226, SEQ ID NO:234, SEQ
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
ID
Petição 870170009999, de 15/02/2017, pág. 363/1247
354/788
NO:236, SEQ ID NO:238, SEQ ID NO:240, SEQ ID NO:242, SEQ ID
NO:244, SEQ ID NO:246, SEQ ID NO:248, SEQ ID NO:250, SEQ ID
NO:252, SEQ ID NO:254, SEQ ID NO:256, SEQ ID NO:258, SEQ ID
NO:260, SEQ ID NO:262, SEQ ID NO:264, SEQ ID NO:266, SEQ ID
NO:268, SEQ ID NO:270, SEQ ID NO:272, SEQ ID NO:274, SEQ ID
NO:276, SEQ ID NO:278, SEQ ID NO:280, SEQ ID NO:282, SEQ ID
NO:284, SEQ ID NO:286, SEQ ID NO:288, SEQ ID NO:290, SEQ ID
NO:292, SEQ ID NO:294, SEQ ID NO:296, SEQ ID NO:298, SEQ ID
N0:300, SEQ ID NO:302, SEQ ID NO:304, SEQ ID NO:306, SEQ ID
NO:308, SEQ ID NO:310, SEQ ID NO:312, SEQ ID NO:314, SEQ ID
NO:316, SEQ ID NO:318, SEQ ID NO:320, SEQ ID NO:322, SEQ ID
NO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID NO:330, SEQ ID
NO:332 ou SEQ ID NO:334 ou fragmentos ou subsequências dos mesmos que possuem atividade de aldolase.
[00671] Em uma modalidade, um ou mais polipeptídeos com atividade de HMG aldolase de qualquer uma das SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID
NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID
NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID
NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID
NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID
NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID
NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID
NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQ ID
NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID NO:100, SEQ ID NO:102, SEQ ID NO:104, SEQ ID NO:106, SEQ ID NO:108, SEQ ID NO:110, SEQ ID NO:112, SEQ ID NO:114, SEQ ID NO:116, SEQ ID
Petição 870170009999, de 15/02/2017, pág. 364/1247
355/788
Ν0:118, SEQ ΝΟ:126, SEQ ΝΟ:134, SEQ ΝΟ:142, SEQ ΝΟ:150, SEQ ΝΟ:158, SEQ ΝΟ:166, SEQ ΝΟ:174, SEQ ΝΟ:182, SEQ ΝΟ:190, SEQ ΝΟ:198, SEQ ΝΟ:206, SEQ ΝΟ:214, SEQ ΝΟ:222, SEQ ΝΟ:230, SEQ ΝΟ:238, SEQ ΝΟ:246, SEQ ΝΟ:254, SEQ ΝΟ:262, SEQ ΝΟ:270, SEQ ΝΟ:278, SEQ ΝΟ:286, SEQ ΝΟ:294, SEQ ΝΟ:302, SEQ
D NO:120, SEQ D NO:128, SEQ D NO:136, SEQ D NO:144, SEQ D NO:152, SEQ D NO:160, SEQ D NO:168, SEQ D NO:176, SEQ D NO:184, SEQ D NO:192, SEQ D N0:200, SEQ D NO:208, SEQ D NO:216, SEQ D NO:224, SEQ D NO:232, SEQ D NO:240, SEQ D NO:248, SEQ D NO:256, SEQ D NO:264, SEQ D NO:272, SEQ D NO:280, SEQ D NO:288, SEQ D NO:296, SEQ
D NO:122, SEQ D NO:130, SEQ D NO:138, SEQ D NO:146, SEQ D NO:154, SEQ D NO:162, SEQ D NO:170, SEQ D NO:178, SEQ D NO:186, SEQ D NO:194, SEQ D NO:202, SEQ D NO:210, SEQ D NO:218, SEQ D NO:226, SEQ D NO:234, SEQ D NO:242, SEQ D NO:250, SEQ D NO:258, SEQ D NO:266, SEQ D NO:274, SEQ D NO:282, SEQ D NO:290, SEQ D NO:298, SEQ
D NO:124, SEQ ID D NO:132, SEQ ID D NO:140, SEQ ID D NO:148, SEQ ID D NO:156, SEQ ID D NO:164, SEQ ID D NO:172, SEQ ID D NO:180, SEQ ID D NO:188, SEQ ID D NO:196, SEQ ID D NO:204, SEQ ID D NO:212, SEQ ID D NO:220, SEQ ID D NO:228, SEQ ID D NO:236, SEQ ID D NO:244, SEQ ID D NO:252, SEQ ID D NO:260, SEQ ID D NO:268, SEQ ID D NO:276, SEQ ID D NO:284, SEQ ID D NO:292, SEQ ID D N0:300, SEQ ID
D NO:304 ou fragmentos ou subsequências dos mesmos que possuem atividade de aldolase atividade podem ser úteis na facilitação de uma reação entre um indol-3-piruvato substituído e uma fonte de carbono C3.
[00672] Em uma outra modalidade, um ou mais polipeptídeos com atividade de KHG aldolase de qualquer uma das SEQ ID NO:306, SEQ ID NO:308, SEQ ID NO:310, SEQ ID NO:312, SEQ ID NO:314, SEQ
Petição 870170009999, de 15/02/2017, pág. 365/1247
356/788
ID NO:316, SEQ ID NO:318, SEQ ID NO:320, SEQ ID NO:322, SEQ ID NO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID NO:330, SEQ ID NO:332 ou SEQ ID NO:334 ou fragmentos ou subsequências dos mesmos que possuem atividade de aldolase podem ser úteis na facilitação de uma reação entre um indol-3-piruvato substituído e uma fonte de carbono C3.
[00673] Alternativamente, um ou mais polipeptídeos com atividade de aldolase codificados por uma sequência de ácidos nucléicos que possui pelo menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%,
67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%,
79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%,
91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais ou identidade de sequência completa (100%) a um ácido nucléico de acordo com a invenção, incluindo as SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID
NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID
NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID
NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID
NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID
NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID
NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID
NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID
NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID
NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ I D NO:101, SEQ ID
NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:109, SEQ ID
NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID
NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID
Petição 870170009999, de 15/02/2017, pág. 366/1247
357/788
NO:127, SEQ ID NO:135, SEQ ID NO:143, SEQ ID N0:151, SEQ ID NO:159, SEQ ID NO:167, SEQ ID NO:175, SEQ ID NO:183, SEQ ID N0:191, SEQ ID NO:199, SEQ ID NO:207, SEQ ID NO:215, SEQ ID NO:223, SEQ ID NO:231, SEQ ID NO:239, SEQ ID NO:247, SEQ ID NO:255, SEQ ID NO:263, SEQ ID NO:271, SEQ ID NO:279, SEQ ID NO:287, SEQ ID NO:295, SEQ ID NO:303, SEQ ID N0:311, SEQ ID NO:319, SEQ ID NO:327, SEQ ID NO:335, SEQ ID
NO:129, SEQ NO:137, SEQ NO:145, SEQ NO:153, SEQ N0:161, SEQ NO:169, SEQ NO:177, SEQ NO:185, SEQ NO:193, SEQ NO:201, SEQ NO:209, SEQ NO:217, SEQ NO:225, SEQ NO:233, SEQ NO:241, SEQ NO:249, SEQ NO:257, SEQ NO:265, SEQ NO:273, SEQ NO:281, SEQ NO:289, SEQ NO:297, SEQ NO:305, SEQ NO:313, SEQ NO:321, SEQ NO:329, SEQ NO:336, SEQ
ID N0:131, SEQ ID NO:139, SEQ ID NO:147, SEQ ID NO:155, SEQ ID NO:163, SEQ ID N0:171, SEQ ID NO:179, SEQ ID NO:187, SEQ ID NO:195, SEQ ID NO:203, SEQ ID N0:211, SEQ ID NO:219, SEQ ID NO:227, SEQ ID NO:235, SEQ ID NO:243, SEQ ID NO:251, SEQ ID NO:259, SEQ ID NO:267, SEQ ID NO:275, SEQ ID NO:283, SEQ ID NO:291, SEQ ID NO:299, SEQ ID NO:307, SEQ ID NO:315, SEQ ID NO:323, SEQ ID NO:331, SEQ D NO:337 e SEQ
ID NO:133, SEQ ID ID N0:141, SEQ ID ID NO:149, SEQ ID ID NO:157, SEQ ID ID NO:165, SEQ ID ID NO:173, SEQ ID ID N0:181, SEQ ID ID NO:189, SEQ ID ID NO:197, SEQ ID ID NO:205, SEQ ID ID NO:213, SEQ ID ID NO:221, SEQ ID ID NO:229, SEQ ID ID NO:237, SEQ ID ID NO:245, SEQ ID ID NO:253, SEQ ID ID NO:261, SEQ ID ID NO:269, SEQ ID ID NO:277, SEQ ID ID NO:285, SEQ ID ID NO:293, SEQ ID ID NO:301, SEQ ID ID NO:309, SEQ ID ID NO:317, SEQ ID ID NO:325, SEQ ID ID NO:333, SEQ ID ID NO:338 ao longo de uma região de pelo menos aproximadamente 10, 15, 20, 25, 30, 35,
40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200,
Petição 870170009999, de 15/02/2017, pág. 367/1247
358/788
1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500 ou mais resíduos podem ser úteis na facilitação de uma reação entre um indol-3-piruvato substituído e uma fonte de carbono C3.
[00674] Em uma modalidade da invenção, um ou mais polipeptídeos com atividade de HMG aldolase codificados por uma sequência de ácidos nucléicos que possui pelo menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%,
63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%,
75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%,
87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%,
99% ou mais ou identidade de sequência completa (100%) a um ácido nucléico de acordo com a invenção, incluindo as SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID
NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID
NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID
NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID
NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID
NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID
NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID
NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID
NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID
NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID
NO:101, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID
NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID
NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID
NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID
Petição 870170009999, de 15/02/2017, pág. 368/1247
359/788
NO:133, SEQ Ν0:141, SEQ ΝΟ:149, SEQ ΝΟ:157, SEQ ΝΟ:165, SEQ ΝΟ:173, SEQ Ν0:181, SEQ ΝΟ:189, SEQ ΝΟ:197, SEQ ΝΟ:205, SEQ ΝΟ:213, SEQ ΝΟ:221, SEQ ΝΟ:229, SEQ ΝΟ:237, SEQ ΝΟ:245, SEQ ΝΟ:253, SEQ ΝΟ:261, SEQ ΝΟ:269, SEQ ΝΟ:277, SEQ ΝΟ:285, SEQ ΝΟ:293, SEQ
ID NO:135, SEQ ID NO:143, SEQ ID N0:151, SEQ ID NO:159, SEQ ID NO:167, SEQ ID NO:175, SEQ ID NO:183, SEQ ID N0:191, SEQ ID NO:199, SEQ ID NO:207, SEQ ID NO:215, SEQ ID NO:223, SEQ ID NO:231, SEQ ID NO:239, SEQ ID NO:247, SEQ ID NO:255, SEQ ID NO:263, SEQ ID NO:271, SEQ ID NO:279, SEQ ID NO:287, SEQ ID NO:295, SEQ
D NO:137, SEQ D NO:145, SEQ D NO:153, SEQ D N0:161, SEQ D NO:169, SEQ D NO:177, SEQ D NO:185, SEQ D NO:193, SEQ D NO:201, SEQ D NO:209, SEQ D NO:217, SEQ D NO:225, SEQ D NO:233, SEQ D NO:241, SEQ D NO:249, SEQ D NO:257, SEQ D NO:265, SEQ D NO:273, SEQ D NO:281, SEQ D NO:289, SEQ
ID NO:139, SEQ ID ID NO:147, SEQ ID ID NO:155, SEQ ID ID NO:163, SEQ ID ID N0:171, SEQ ID ID NO:179, SEQ ID ID NO:187, SEQ ID ID NO:195, SEQ ID ID NO:203, SEQ ID ID N0:211, SEQ ID ID NO:219, SEQ ID ID NO:227, SEQ ID ID NO:235, SEQ ID ID NO:243, SEQ ID ID NO:251, SEQ ID ID NO:259, SEQ ID ID NO:267, SEQ ID ID NO:275, SEQ ID ID NO:283, SEQ ID ID NO:291, SEQ ID ID NO:299, SEQ ID
ID NO:297, SEQ
NO:301, SEQ ID NO:303, SEQ ID NO:305 ao longo de uma região de pelo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 75,
100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500 ou mais resíduos podem ser úteis na facilitação de uma reação entre um indol-3-piruvato substituído e uma fonte de carbono C3.
[00675] Em uma outra modalidade da invenção, um ou mais poliPetição 870170009999, de 15/02/2017, pág. 369/1247
360/788 peptídeos com atividade de KHG aldolase codificados por uma sequência de ácidos nucléicos que possui pelo menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%,
62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%,
74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%,
86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%,
98%, 99% ou mais ou identidade de sequência completa (100%) a um ácido nucléico de acordo com a invenção, incluindo as SEQ ID NO:307, SEQ ID NO:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID
NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID
NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID
NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID
NO:337 e SEQ ID NO:338 ao longo de uma região de pelo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500 ou mais resíduos podem ser úteis na facilitação de uma reação entre um indol-3piruvato substituído e uma fonte de carbono C3.
[00676] Um ou mais polipeptídeos com atividade de aldolase codificados por uma sequência de ácidos nucléicos que se hibridiza sob condições rigorosas com um ácido nucléico das SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ
ID NO:21, SEQ ID NO:2 3, SEI Q ID NO:25 i, SEQ ID i NO:27, SEQ ID
NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID
NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID
NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID
NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID
Petição 870170009999, de 15/02/2017, pág. 370/1247
361/788
NO:61, SEQ ID NO:63, SEQ
NO:69, SEQ ID NO:71, SEQ
NO:77, SEQ ID NO:79, SEQ
NO:85, SEQ ID NO:87, SEQ
NO:93, SEQ ID NO:95, SEQ
NO:65, SEQ ID NO:67, SEQ
NO:73, SEQ ID NO:75, SEQ
NO:81, SEQ ID NO:83, SEQ
NO:89, SEQ ID NO:91, SEQ
NO:97, SEQ ID NO:99, SEQ
NO:101, SEQ ΝΟ:109, SEQ Ν0:117, SEQ ΝΟ:125, SEQ ΝΟ:133, SEQ Ν0:141, SEQ ΝΟ:149, SEQ ΝΟ:157, SEQ ΝΟ:165, SEQ ΝΟ:173, SEQ Ν0:181, SEQ ΝΟ:189, SEQ ΝΟ:197, SEQ ΝΟ:205, SEQ ΝΟ:213, SEQ ΝΟ:221, SEQ ΝΟ:229, SEQ ΝΟ:237, SEQ ΝΟ:245, SEQ ΝΟ:253, SEQ ΝΟ:261, SEQ ΝΟ:269, SEQ ΝΟ:277, SEQ ΝΟ:285, SEQ ΝΟ:293, SEQ
ID NO:103, SEQ ID N0:111, SEQ ID N0:119, SEQ ID NO:127, SEQ ID NO:135, SEQ ID NO:143, SEQ ID N0:151, SEQ ID NO:159, SEQ ID NO:167, SEQ ID NO:175, SEQ ID NO:183, SEQ ID N0:191, SEQ ID NO:199, SEQ ID NO:207, SEQ ID NO:215, SEQ ID NO:223, SEQ ID NO:231, SEQ ID NO:239, SEQ ID NO:247, SEQ ID NO:255, SEQ ID NO:263, SEQ ID NO:271, SEQ ID NO:279, SEQ ID NO:287, SEQ ID NO:295, SEQ
D NO:105, SEQ D N0:113, SEQ D N0:121, SEQ D NO:129, SEQ D NO:137, SEQ D NO:145, SEQ D NO:153, SEQ D N0:161, SEQ D NO:169, SEQ D NO:177, SEQ D NO:185, SEQ D NO:193, SEQ D NO:201, SEQ D NO:209, SEQ D NO:217, SEQ D NO:225, SEQ D NO:233, SEQ D NO:241, SEQ D NO:249, SEQ D NO:257, SEQ D NO:265, SEQ D NO:273, SEQ D NO:281, SEQ D NO:289, SEQ D NO:297, SEQ
D NO:107, SEQ D N0:115, SEQ D NO:123, SEQ D N0:131, SEQ D NO:139, SEQ D NO:147, SEQ D NO:155, SEQ D NO:163, SEQ D N0:171, SEQ D NO:179, SEQ D NO:187, SEQ D NO:195, SEQ D NO:203, SEQ D N0:211, SEQ D NO:219, SEQ D NO:227, SEQ D NO:235, SEQ D NO:243, SEQ D NO:251, SEQ D NO:259, SEQ D NO:267, SEQ D NO:275, SEQ D NO:283, SEQ D NO:291, SEQ D NO:299, SEQ
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
Petição 870170009999, de 15/02/2017, pág. 371/1247
362/788
NO:301, SEQ ID NO:303, SEQ ID NO:305, SEQ ID NO:307, SEQ ID
NO:309, SEQ ID N0:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID
NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID
NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID
NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID NO:337 e SEQ ID
NO:338 podem ser úteis na facilitação de uma reação entre um indol3-piruvato substituído e uma fonte de carbono C3.
[00677] Em uma modalidade da invenção, um ou mais polipeptídeos com atividade de HMG aldolase codificados por uma sequência de ácidos nucléicos que se hibridiza sob condições rigorosas com um ácido nucléico das SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID
NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ
ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ
D
NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID
NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID
NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID
NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID
NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID
NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID
NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID
NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID
NO:97, SEQ ID NO:99, SEQ I D NO:101, SEQ ID NO:103, SEQ ID
NO:105, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:111, SEQ
NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ
NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ
NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ
NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ
NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ
NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ
D
D
D
D
D
D
D
Petição 870170009999, de 15/02/2017, pág. 372/1247
363/788
N0:161, SEQ ΝΟ:169, SEQ ΝΟ:177, SEQ ΝΟ:185, SEQ ΝΟ:193, SEQ ΝΟ:201, SEQ ΝΟ:209, SEQ ΝΟ:217, SEQ ΝΟ:225, SEQ ΝΟ:233, SEQ ΝΟ:241, SEQ ΝΟ:249, SEQ ΝΟ:257, SEQ ΝΟ:265, SEQ ΝΟ:273, SEQ ΝΟ:281, SEQ ΝΟ:289, SEQ ΝΟ:297, SEQ
ID NO:163, SEQ ID N0:171, SEQ ID NO:179, SEQ ID NO:187, SEQ ID NO:195, SEQ ID NO:203, SEQ ID N0:211, SEQ ID NO:219, SEQ ID NO:227, SEQ ID NO:235, SEQ ID NO:243, SEQ ID NO:251, SEQ ID NO:259, SEQ ID NO:267, SEQ ID NO:275, SEQ ID NO:283, SEQ ID NO:291, SEQ ID NO:299, SEQ
ID NO:165, SEQ ID NO:173, SEQ ID N0:181, SEQ ID NO:189, SEQ ID NO:197, SEQ ID NO:205, SEQ ID NO:213, SEQ ID NO:221, SEQ ID NO:229, SEQ ID NO:237, SEQ ID NO:245, SEQ ID NO:253, SEQ ID NO:261, SEQ ID NO:269, SEQ ID NO:277, SEQ ID NO:285, SEQ ID NO:293, SEQ ID NO:301, SEQ
ID NO:167, SEQ ID ID NO:175, SEQ ID ID NO:183, SEQ ID ID N0:191, SEQ ID ID NO:199, SEQ ID ID NO:207, SEQ ID ID NO:215, SEQ ID ID NO:223, SEQ ID ID NO:231, SEQ ID ID NO:239, SEQ ID ID NO:247, SEQ ID ID NO:255, SEQ ID ID NO:263, SEQ ID ID NO:271, SEQ ID ID NO:279, SEQ ID ID NO:287, SEQ ID ID NO:295, SEQ ID ID NO:303, SEQ ID
NO:305 podem ser úteis na facilitação da reação entre o indol-3piruvato substituído e a fonte de carbono C3.
[00678] Em uma outra modalidade da invenção, um ou mais polipeptídeos com atividade de KHG aldolase codificados por uma sequência de ácidos nucléicos que se hibridiza sob condições rigorosas com um ácido nucléico das SEQ ID NO:307, SEQ ID NO:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID
NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID
NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID
NO:335, SEQ ID NO:336, SEQ ID NO:337 e SEQ ID NO:338 podem ser úteis na facilitação de uma reação entre um indol-3-piruvato substituído e uma fonte de carbono C3.
Petição 870170009999, de 15/02/2017, pág. 373/1247
364/788 [00679] Em uma modalidade, o grupo substituinte do indol-3piruvato substituído é um átomo de halogênio ligado a qualquer átomo de carbono do anel indol. Em uma outra modalidade, o grupo substituinte é um átomo de cloro ligado a qualquer carbono do anel indol. Ainda em uma outra modalidade, o derivado de monatina é o ácido 4hidróxi-4-(6-metilindol-3-ilmetil) glutâmico.
[00680] Os polipeptídeos que possuem atividade de aldolase e de acordo com algumas modalidades da invenção podem ser utilizados em uma vide de várias etapas em que uma ou mais etapas é uma reação de síntese química. Por exemplo, em algumas modalidades, um ou mais polipeptídeos que possuem atividade de aldolase podem facilitar uma reação entre piruvato e indol-3-piruvato para produzir um precursor de monatina. O precursor de monatina pode ser então purificado. Uma reação de aminação redutora do precursor de monatina pode então ser utilizada para produzir monatina.
[00681] Os polipeptídeos que possuem atividade de aldolase e de acordo com algumas modalidades da invenção, assim como as outras enzimas utilizadas no processo para a produção de monatina e derivados de monatina podem ser utilizadas na forma pura, bruta, isolada ou em suspensão em sulfato de amônio.
[00682] Os polipeptídeos que possuem atividade de aldolase e de acordo com algumas modalidades da invenção, podem ser otimizados utilizando agentes estabilizantes, incluindo ditiotreitol (DTT) e βmercaptoetanol.
[00683] A monatina ou o derivado de monatina que é produzido utilizando um ou mais dos polipeptídeos divulgados aqui, tem geralmente pelo menos aproximadamente 50 até aproximadamente 99% de R,Rmonatina ou de derivado de R,R-monatina, em peso da monatina ou do derivado de monatina total produzido. Em outras modalidades, a monatina ou o derivado de monatina produzido utilizando um ou mais
Petição 870170009999, de 15/02/2017, pág. 374/1247
365/788 dos polipeptídeos divulgados aqui, tem mais de 60% de R,R-monatina ou de derivado de R,R-monatina, em peso da monatina total produzida; por exemplo, a R,R-monatina ou o derivado de R,R-monatina constitui 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% da monatina ou do derivado de monatina total produzido. Alternativamente, várias quantidades de duas ou mais preparações de monatina ou de derivado de monatina podem ser combinadas de forma a resultar em uma preparação que tem uma porcentagem desejada de R,R-monatina ou de derivado de R,R-monatina. Por exemplo, uma preparação de monatina que tem 60% de R,R-monatina pode ser combinada com uma preparação de monatina que tem 90% de R,R-monatina; se quantidades equivalentes de 60% e 90% de preparações de R,R-monatina forem combinadas, a preparação de monatina resultante teria 75% de R,R-monatina.
[00684] A monatina ou o derivado de monatina ou um intermediário (incluindo precursor de monatina), produzido utilizando um ou mais dos polipeptídeos divulgados aqui, pode ser purificado partindo dos componentes da reação. Em uma modalidade, a monatina, o derivado de monatina ou o intermediário, tal como o precursor de monatina, pode ser simplesmente purificado através da remoção da substância que será purificada partindo da preparação enzimática em que foi sintetizado.
[00685] Em outras modalidades, o intermediário, o precursor de monatina, a monatina ou o derivado de monatina é purificado partindo de uma preparação em que foi sintetizado de forma que a composição ou a preparação purificada resultante tem pelo menos aproximadamente 5-60% de monatina em peso dos compostos orgânicos totais. Em uma outra modalidade, a monatina, o derivado de monatina ou o intermediário, tal como o precursor de monatina, pode ser purificado até um grau de pureza de pelo menos aproximadamente 70%, 80%,
Petição 870170009999, de 15/02/2017, pág. 375/1247
366/788
90%, 95% ou 99% em peso dos compostos orgânicos totais. A monatina, o derivado de monatina ou o intermediário (incluindo o precursor de monatina), produzido utilizando um ou mais dos polipeptídeos divulgados aqui, pode ser purificado dos componentes da reação através de qualquer método conhecido por um perito comum na técnica. De forma ótima, a monatina ou o intermediário purificado pode ser recristalizado repetidamente até que o grau desejado de pureza seja atingido.
[00686] Os exemplos a seguir são oferecidos para ilustrar, mas não para limitar a invenção reivindicada.
EXEMPLOS
Exemplo 1
Detecção de Monatina, Precursor de Monatina, Triptofano, Alanina,
Aspartato e Glutamato [00687] Este exemplo descreve métodos utilizados para detectar a presença de monatina, precursor de monatina (MP), triptofano, aspartato, alanina e glutamato. Descreve também um método para a separação e para a detecção dos quatro estereoisômeros de monatina. Análise de Monitoramento de Reação Múltiplo (MRM) com
LC/MS/MS de Monatina e Triptofano [00688] As análises de misturas em relação à monatina e ao triptofano derivados de reações bioquímicas in vitro ou in vivo foram realizadas utilizando um instrumento de espectrometria de massa em tandem com cromatografia líquida (LC/MS/MS) Waters/Micromass incluindo um cromatógrafo líquido Waters 2795 com um monitor de absorbância Waters 996 Photo-Diode Array (PDA) colocado em série entre o cromatógrafo e um espectrômetro de massa de quadrupolo triplo Micromass Quattro Ultima. As separações por LC foram feitas utilizando uma coluna de cromatografia em fase inversa Xterra MS C8, 2,1 mm x 250 mm a 40 °C. A fase móvel da LC consistia de A) água contendo (i)
Petição 870170009999, de 15/02/2017, pág. 376/1247
367/788
0,05% (v/v) de ácido trifluoroacético ou (ii) 0,3% de ácido fórmico e 10 mM de formato de amônio e B) metanol contendo (i) 0,05% (v/v) de ácido trifluoroacético ou (ii) 0,3% de ácido fórmico e 10 mM de formato de amônio.
[00689] Se a fase móvel da LC consistisse de A) água contendo 0,05% (v/v) de ácido trifluoroacético e B) metanol contendo 0,05% (v/v) de ácido trifluoroacético, a eluição do gradiente era linear de 5% de B até 35% de B, 0-4 minutos, linear de 35% de B até 60% de B, 4-6,5 minutos, linear de 60% de B até 90% de B, 6,5-7 minutos, isocrática a 90% de B 7-11 minutos, linear de 90% de B até 95% de B, 11-12 minutos, linear de 95% de B até 5% de B, 12-13 minutos, com um período de reequilíbrio de 2 minutos entre as corridas. A vazão era de 0,25 mL/min e a absorbância de PDA foi monitorada de 200 nm até 400 nm. Todos os parâmetros da ESI-MS foram otimizados e selecionados com base na produção de íons moleculares protonados ([M + H]+) dos analitos de interesse e na produção de íons de fragmentos característicos. Os parâmetros instrumentais a seguir foram utilizados para a análise de Monitoramento de Reação Múltiplo (MRM) com LC/MS/MS de monatina e de triptofano: Capilar: 3,5 kV; Cone: 40 V; Hex 1: 20 V; Abertura: 0 V; Hex 2: 0 V; Temperatura da fonte: 100 °C; Temperatura de dessolvatação: 350 °C; Gás de dessolvatação: 500 L/h; Gás do cone: 50 L/h; Resolução baixa de massa (Q1): 12,0; Resolução alta de massa (Q1): 12,0; Energia iônica: 0,2; Entrada: -5 V; Energia de colisão: 8; Saída: 1V; Resolução baixa de massa (Q2): 15; Resolução alta de massa (Q2): 15; Energia iônica (Q2): 3,5; Multiplicador: 650. Cinco transições de MRM de parental para filha específicas à monatina são utilizadas para detectar especificamente a monatina em reações in vitro e in vivo. As transições monitoradas são de 293,1 para 158,3, 293,1 para 168,2, 293,1 para 211,2, 293,1 para 230,2 e 293,1 para 257,2. O triptofano é monitorado com a transição de MRM de 204,7
Petição 870170009999, de 15/02/2017, pág. 3ΠΙΏΑΊ
368/788 para 146,4. Para a quantificação do padrão interno de monatina e de triptofano, quatro padrões de calibração contendo quatro proporções diferentes de cada analito para d5-triptofano e para d5-monatina, são analisados. Estes dados são submetidos a uma análise de mínimos quadrados linear para formar uma curva de calibração para monatina e triptofano. A cada amostra é adicionada uma quantidade fixa de d5triptofano e de d5-monatina (a d5-monatina foi sintetizada partindo de d5-triptofano de acordo com os métodos da W003/091396 A2) e as proporções de resposta (monatina/d5-monatina; triptofano/d5triptofano) são utilizadas em associação com as curvas de calibração descritas anteriormente para calcular a quantidade de cada analito nas misturas.
[00690] Se a fase móvel da LC fosse A) água contendo 0,3% de ácido fórmico e 10 mM de formato de amônio e B) metanol contendo 0,3% de ácido fórmico e 10 mM de formato de amônio, a eluição do gradiente era linear de 5% de B até 45% de B, 0-8,5 minutos, linear de 45% de B até 90% de B, 8,5-9 minutos, isocrática de 90% de B até 90% de B, 9-12,5 minutos, linear de 95% de B até 5% de B, 12,5-13 minutos, com um período de reequilíbrio de 4 minutos entre as corridas. A vazão era de 0,27 mL/min e a absorbância de PDA era monitorada de 210 nm até 400 nm. Todos os parâmetros da ESI-MS foram otimizados e selecionados com base na produção de íons moleculares protonados ([M + H]+) dos analitos de interesse e na produção de íons de fragmentos característicos. Os parâmetros instrumentais utilizados para esta fase móvel secundária são os mesmos que os anteriores. Quatro transições de MRM de parental para filha específicas à monatina e uma transição de parental para filha específica ao triptofano são utilizadas para detectar especificamente a monatina e o triptofano em reações in vitro e in vivo. As transições monitoradas são de 293,1 para 158,0, 293,1 para 168,0, 293,1 para 211,5 e 293,1 para 257,0. O triptoPetição 870170009999, de 15/02/2017, pág. 378/1247
369/788 fano é monitorado com a transição de MRM de 205,2 para 146,1. Para a quantificação do padrão interno de monatina e de triptofano, quatro padrões de calibração contendo quatro proporções diferentes de cada analito para d5-triptofano e d5-monatina, são analisados. Estes dados são submetidos a uma análise de mínimos quadrados linear para formar uma curva de calibração para a monatina e o triptofano. A cada amostra é adicionada uma quantidade fixa de d5-triptofano e de d5monatina (a d5-monatina foi sintetizada partindo de d5-triptofano de acordo com os métodos da W003/091396 A2) e as proporções de resposta (monatina/d5-monatina; triptofano/d5-triptofano) em associação com as curvas de calibração descritas anteriormente são utilizadas para calcular a quantidade de cada analito nas misturas. As transições de massa parental para filha monitoradas para d5-triptofano e d5-monatina são de 210,2 para 151,1 e 298,1 para 172,0, respectivamente.
Medida de Massa Acurada de Monatina [00691] A análise de MS de alta resolução foi realizada utilizando um espectrômetro de massa quadrupolo/tempo de vôo híbrido Applied Biosystems-Perkin Elmer Q-Star. A massa medida para a monatina protonada utilizou o triptofano como um padrão de calibração de massa interna. A massa calculada da monatina protonada, baseada na composição elementar C14H17N2O5 é de 293.1137. A monatina produzida utilizando o processo biocatalítico descrito nos Exemplos 2 e 3 exibia uma massa medida de 293,1144. Este é um erro de medida de massa menor que 2 partes por milhão (ppm), fornecendo evidência conclusiva da composição elementar da monatina produzida enzimaticamente.
Medida da Monatina por LC/MS/MS (MRM) Quiral [00692] A determinação da distribuição de estereoisômeros de monatina em reações in vitro e in vivo foi realizada através da derivatizaPetição 870170009999, de 15/02/2017, pág. 379/1247
370/788 ção com 1-fluoro-2-4-dinitrofenil-5-L-alanina amida (FDAA), seguida pela medida por LC/MS/MS MRM em fase inversa.
Derivatização da Monatina com FDAA [00693] A 50 μΙ_ de amostra ou de padrão e 10 pL de padrão interno foram adicionados 100 μΙ_ ou 200 μΙ_ de uma solução a 1% de FDAA em acetona. Vinte ou quarenta pL, respectivamente, de 1,0 M de bicarbonato de sódio foram adicionados e a mistura foi incubada durante 1 h a 40 °C com mistura ocasional. A amostra foi removida e resfriada e neutralizada com 20 μΙ_ de 2,0 M de HCI (mais HCI pode ser requerido para realizar a neutralização de uma mistura biológica tamponada). Após a degaseificação ser completada, as amostras estavam prontas para a análise através de LC/MS/MS.
Monitoramento de Reação Múltiplo com LC/MS/MS para a Determinação da Distribuição de Estereoisômeros de Monatina em Reações in vitro e in vivo [00694] As análises foram realizadas utilizando o instrumento de LC/MS/MS descrito anteriormente. As separações por LC capazes de separar todos os quatro estereoisômeros de monatina (especificamente FDAA-monatina) foram realizadas em uma coluna de cromatografia em fase inversa Phenomenex Luna 2,0 x 250 mm (3 pm) C18 (2) a 40 °C. A fase móvel de LC consistia de A) água contendo 0,05% (massa/volume) de acetato de amônio e B) acetonitrila. A eluição era isocrática a 13% de B, 0-2 minutos, linear de 13% de B até 30% de B, 215 minutos, linear de 30% de B até 80% de B, 15-16 minutos, isocrática a 80% de B 16-21 minutos e linear de 80% de B até 13% de B, 2122 minutos, com um período de reequilíbrio de 8 minutos entre as corridas. A vazão era de 0,23 mL/min e a absorbância de PDA foi monitorada de 200 nm até 400 nm. Todos os parâmetros da ESI-MS foram otimizados e selecionados com base na produção de íons moleculares desprotonados ([Μ - H]-) de FDAA-monatina e na produção de íons de
Petição 870170009999, de 15/02/2017, pág. 380/1247
371/788 fragmentos característicos.
[00695] Os parâmetros instrumentais a seguir foram utilizados para a análise de LC/MS de monatina no modo ESI/MS de íon negativo: Capilar: 2,0 kV; Cone: 25 V; Hex 1: 10 V; Abertura: 0 V; Hex 2: 0 V; Temperatura da fonte: 100°C; Temperatura de dessolvatação: 350 °C; Gás de dessolvatação: 500 L/h; Gás do cone: 50 L/h; Resolução baixa de massa (Q1): 12,0; Resolução alta de massa (Q1): 12,0; Energia iônica: 0,2; Entrada: -5V; Energia de colisão: 20; Saída: 1V; Resolução baixa de massa (Q2): 12; Resolução alta de massa (Q2): 12; Energia iônica (Q2): 3.0; Multiplicador: 650. Três transições de parental para filha específicas a FDAA-monatina são utilizadas para detectar especificamente FDAA-monatina em reações in vitro e in vivo. As transições monitoradas para monatina são de 543,2 para 268,1, 543,2 para 499,3 e 543,2 para 525,3. A transição de massa derivada do padrão interno de monatina era de 548,2 para 530,3. A identificação de estereoisômeros de FDAA-monatina se baseia no tempo de retenção cromatográfico quando comparado com o dos estereoisômeros de monatina sintéticos purificados e dados de espectro de massa. Um padrão interno é utilizado para monitorar o progresso da reação e para a confirmação do tempo de retenção do estereoisômero S,S.
Detecção por Cromatografia Líquida Pós-Fluorescência de Coluna de
Aminoácidos Incluindo Glutamato e Alanina [00696] A detecção por cromatografia líquida com pós-fluorescência de coluna (LC/OPA) para a determinação de glutamato e alanina em reações in vitro e in vivo foi realizada em um sistema Waters 2690 LC ou equivalente combinado com um detector de fluorescência por varredura Waters 474 e um módulo de reação pós-coluna Waters. As análises semiquantitativas de monatina e triptofano foram também realizadas utilizando este método. As separações por LC foram realizadas em uma coluna de troca iônica carregada com Sódio de Interação a
Petição 870170009999, de 15/02/2017, pág. 381/1247
372/788
60°C. A fase móvel A era tampão Pickering Na 328 (Pickering Laboratories, Inc.; Mountain View, CA). A fase móvel B era tampão Pickering Na 740. A eluição do gradiente era de 0% de B até 100% de B, 0-20 minutos, isocrática a 100% de B, 20-36 minutos e linear de 100% de B até 0% de B, 36-37 minutos, com pelo menos um período de reequilíbrio de 5 minutos entre as corridas, dependendo da matriz da amostra. A vazão para a fase móvel era de 0,5 mL/min. A vazão para a solução de derivatização pós-coluna OPA era de 0,5 mL/min. Os ajustes do detector de fluorescência eram EX 338-340 nm e Em 420-425 nm. A norleucina foi empregada como um padrão interno para a análise. A identificação de aminoácidos se baseava nos dados de tempo de retenção cromatográfico para padrões purificados.
Detecção de L- e D-Aminoácidos por LC/MS/MS [00697] As amostras contendo uma mistura de L- e D-aminoácidos tais como lisina, alanina, metionina, tirosina, leucina, fenilalanina, triptofano, glutamato e aspartato provenientes de experimentos de reação bioquímica foram primeiramente tratadas com ácido fórmico para desnaturar a proteína. A amostra foi então centrifugada e filtrada através de um filtro em seringa de náilon de 0,45 pm antes da análise de LC/MS/MS. A identificação de L- e D-aminoácidos se baseava no tempo de retenção e na detecção seletiva de massa. A separação por LC foi realizada utilizando o sistema de cromatografia líquida Waters 2690 e uma coluna cromatográfica ASTEC 2,1 mm x 250 mm Chirobiotic TAG com a temperatura de coluna ajustada a 45Ό. As fases móveis A e B de LC eram 0,25% de ácido acético e 0,25% de ácido acético em metanol, respectivamente. A eluição isocrática foi utilizada para todos os métodos para separar os isômeros L e D. A lisina foi eluída utilizando 80% da fase móvel A e 20% da B. O glutamato, a alanina e a metionina foram separados com eluição de 60% da fase móvel A e 40% da B e uma vazão de 0,25 mL/min. O aspartato, o triptofano, a tirosina, a
Petição 870170009999, de 15/02/2017, pág. 382/1247
373/788 leucina e a fenilalanina foram separados de forma isomérica com 30% da fase móvel A e 70% da B com uma vazão de 0,3 mL/min para todos menos para a fenilalanina, que foi corrida a uma vazão de 0,25 mL/min.
[00698] O sistema de detecção para análise de L- e D-aminoácidos incluía um detector Waters 996 Photo-Diode Array (PDA) e um espectrômetro de massa quadrupolo triplo Micromass Quattro Ultima. O PDA, verificando de 195 até 350 nm, foi colocado em série entre o sistema de cromatografia e o espectrômetro de massa. Os parâmetros para o espectrômetro de massa quadrupolo triplo Micromass Quattro Ultima operando no modo de ionização por eletrospray positivo (+ESI) foram ajustados como a seguir: Capilar: 3,0 kV; Cone: 20 V; Hex 1:15 V; Abertura: 1 V; Hex 2: 0 V; Temperatura da fonte: 100 °C; Temperatura de dessolvatação: 350 °C; Gás de dessolvatação: 530 L/h; Gás do cone: 30 L/h; Resolução baixa de massa Q1: 12,5; Resolução alta de massa Q1: 12,5; Energia iônica 1: 0,2; Entrada: -5; Colisão: 8; Saída 1: 10; Resolução baixa de massa Q2: 12,5; Resolução alta de massa Q2: 12,5; Energia iônica 2: 0,5; Multiplicador: 650 V. Os experimentos de MS/MS com o modo de Monitoramento de Reação Múltiplo (MRM) foram ajustados para monitorar seletivamente as transições de reação de 147,8 para 84,2 e 147,8 para 102,1 para o glutamato, 134,00 para 74,30 e 134,00 para 88,2 para o aspartato, 147,3 para 85,0 para a lisina, 150,3 para 104,8 para a metionina, 182,3 para 137,0 para a tirosina, 132,3 para 87,0 para a leucina e 166,3 para 121,0 para a fenilalanina. N° caso em que duas transições são listadas, as últimas transições foram utilizadas para quantificação. Para o triptofano, os experimentos com MS/MS com modo de Monitoramento de Reação Múltiplo (MRM) foram ajustados para monitorar seletivamente as transições de reação de 205,2 para 118,2, 205,2 para 146,1 e 205,2 para 188,2 e a transição de 212,1 para 151,1 para d8-DL triptofano. A quantificação
Petição 870170009999, de 15/02/2017, pág. 383/1247
374/788 do triptofano foi realizada através da determinação da proporção de resposta de transição do analito de 205,2 para 146,1 em relação à do padrão interno, d8-D,L triptofano. Alternativamente, a quantificação de triptofano, glutamato e ácido aspártico se baseavam nas respostas de sinal de m/z=146,5, m/z=102,1 e m/z=88,2, respectivamente.
Produção de Monatina e de Precursor de Monatina (MP) para Padrões e para Ensaios
Produção de Monatina [00699] Uma mistura racêmica de R,R e S,S monatinas foi produzida sinteticamente como descrito na Patente U.S. N° 5.128.482.
[00700] As R,R e S,S monatinas foram separadas através de uma etapa de derivatização e hidrólise. Sucintamente, a mistura racêmica de monatina foi esterificada, o grupo amino livre foi bloqueado com Cbz, uma lactona foi formada e a S,S lactona foi hidrolisada seletivamente utilizando uma enzima protease imobilizada. A monatina também pode ser separada como descrito em Bassoli, A. e outros, Eur. J. Org. Chem., 8:1652-1658, (2005).
Produção de MP [00701] O R-MP foi produzido através da transaminação de R,R monatina utilizando a D-aminotransferase de faixa ampla AT-103 (BioCatalytics, Pasadena, CA) em 0,1 M de tampão de fosfato de potássio, utilizando piruvato de sódio como o receptor de amino. O S-MP foi produzido através da transaminação de S,S monatina utilizando a Laminotransferase AT-102 (BioCatalytics, Pasadena, CA) em 0,1 M de tampão de fosfato de potássio, utilizando piruvato de sódio como o receptor de amino. Ambas as reações foram realizadas a 30Ό e em um pH de aproximadamente 8,0-8,3, durante aproximadamente 20 horas. Ambos os compostos foram purificados utilizando HPLC em escala preparatória com uma resina hidrofóbica Rohm e Haas (Filadélfia, PA) (XADTM1600), eluindo em água. As amostras contendo mais de 90%
Petição 870170009999, de 15/02/2017, pág. 384/1247
375/788 de pureza de precursor de monatina foram coletadas e secas por congelamento.
Exemplo 2
Detecção de Precursor de Monatina [00702] Este exemplo descreve métodos utilizados para a separação e para a detecção dos dois enanciômeros de precursor de monatina.
Método Não Quiral para a Detecção de Precursor de Monatina [00703] As amostras de reação de placas de 96 cavidades foram injetadas em uma coluna Agilent Zorbax RX-C18, 3,5 pm, 3,0 x 150 mm utilizando um aparato de autoamostragem CTCPal (LEAP Technologies, Carrboro, N.C.). Os produtos foram separados utilizando um gradiente de H2O/ACN (0,1% de Ácido fórmico):
Tempo: 0,00 min Tempo: 4,00 min Tempo: 5,00 min Tempo: 5,10 min Tempo: 6,50 min
5% de B
100% de B 100% de B
5% de B 5% de B [00704] O gradiente foi forencido por bombas LC-10ADvp (Shimadzu, Kyoto, Japão) a 0,8 mL/min. Os produtos foram detectados utilizando o espectrômetro de massa triplo-quad API4000 TurbolonSpray (Applied Biosystems, Foster City, CA). O monitoramento por spray de íons e por vários íons foi realizado para os analitos de interesse no modo de íon negativo e cada análise durou 6,5 minutos. [00705] Piruvato = 87,1 [Μ - H+] [00706] lndol-3-piruvato = 202,1 [Μ - H+] [00707] Produto = 290,0 [Μ - H+] Análise Quiral CE de R & S Precursores de Monatina [00708] Um instrumento de eletroforese capilar P/ACE® MDQ (Beckman Coulter, Fullerton, CA) foi utilizado. O kit de DesenvolvimenPetição 870170009999, de 15/02/2017, pág. 385/1247
376/788 to Quiral foi utilizado e inclui pequenas quantidades de vários seletores quirais, tampões necessários e 2 capilares (Beckman Coulter, Fullerton, CA). Alternativamente, apenas para o ensaio de MP, os reagentes a seguir e outros suprimentos podem ser obtidos separadamente na Beckman Coulter (Fullerton, CA) ou em outro fornecedor:
Capilar revestido N-CHO; 50 um ID, 65 cm de comprimento total ou capilar de sílica fundida.
[00709] 25 mM de tampão de fosfato, pH 5 [00710] 25 mg de hidroxipropil-3-ciclodextrina [00711] Solução de condicionamento de capilar, 10 ml_ (alternativamente, pode utilizar solução de óxido de polietileno a 0,5%, Mw 600,000 ou 300,000 Daltons)
Análise Por Eletroforese Capilar (CE) [00712] Um capilar revestido neutro, 50 um ID, 60 cm (50 cm para detecção) ou 30 (20) cm foi utilizado ao longo da detecção DAD (ou UV simples) a 214 nm. O capilar de separação foi submetido a um termostato a 15Ό, as amostras a 4Ό. O tampão de s eparação era 20 mM de hidroxipropil-3-ciclodextrina, 25 mM de fosfato, pH 5. A injeção da amostra era tipicamente a 0,003 MPa (0,5 psi), 5 s. A separação era a 500 V/cm, polaridade invertida (15 kV para capilar de 30 cm, 30 kV para 60 cm). A corrente típica utilizada durante a separação era de -28 μΑ. Os tempos de migração típicos para os picos de MP eram em torno de 3,5 minutos (comprimento efetivo de 20 cm) ou 8 minutos (50 cm).
[00713] Uma etapa de limpeza/lavagem/condicionamento de capilar opcional, antes das corridas da amostra utilizava H2O 4 minutos, 0,1 M de HCI 1 minuto, H2O 1,5 minuto, solução de condicionamento de capilar 4 minutos, H2O, 1 minuto, tampão de separação 4 minutos.
[00714] Um resumo do método de corrida era: lavagem com tampão de separação 1-2 minutos, injeção da amostra 5 s a 0,003 MPa
Petição 870170009999, de 15/02/2017, pág. 386/1247
377/788 (0,5 psi), separação 5-10 minutos em polaridade com voltagem invertida 15 ou 30 kV, dependendo do comprimento do capilar.
Exemplo 3
Ensaio Geral para Piruvato Aldolases [00715] Um exemplo de método para medir a atividade de piruvato aldolases diferentes utiliza um substrato geral, 4-Carbóxi-4-hidróxi-2oxoadipato (CHA). O ensaio de CHA foi adaptado partindo de ensaios na literatura (por exemplo, vide E.E. Dekker & R.P. Kitson, J. Biol. Chem. 267, 10507-10514, 1992). Um ensaio típico compreendia 50 mM de fosfato de sódio pH 7,5, 1 mM de MgCI2, 1 mM de CHA, 10 pg/mL de D-lactato desidrogenase (LDH) de Lactobacillus leichmanii (Sigma-Aldrich, St. Louis, MO), 0,5 mM de NADH. O ensaio foi iniciado adicionando enzima (tipicamente entre 1 até 5 μΙ_). A liberação de piruvato, acoplada com a formação de NAD+ foi monitorada continuamente em um espectrofotômetro a 340nm.
[00716] O CHA foi sintetizado de acordo com o procedimento descrito em Tack, B.F. Chapman, P.J. e S. Dagley. J. Biol. Chem. 247 6438-6443 (1972).
[00717] Uma unidade de atividade enzimática, tal como de enzima piruvato aldolase, tal como HMG e/ou KHG aldolase, é definida como a quantidade que libera piruvato suficiente para diminuir a absorbância a 340nm em 1 DO por minuto.
Exemplo 4
Descoberta de Novas Ceto-hidróxi-glutarato (KHG) e Hidróxi-metilceto-glutarato (HMG) aldolases partindo de bibliotecas ambientais Diversa [00718] Mais de 150 HMG aldolases e de 15 KHG aldolases exclusivas foram descobertas através da verificação de bibliotecas de DNA Diversa. Estes genes de aldolase foram seqüenciados e subclonados em um vetor de expressão adequado. Este vetor foi então transformaPetição 870170009999, de 15/02/2017, pág. 387/1247
378/788 do em um hospedeiro de expressão adequado para a produção de quantidades suficientes da aldolase para caracterização das enzimas. Um conjunto selecionado de aldolases foi testado em relação à atividade sobre CHA e também em relação à formação de precursor de monatina (MP). Todas as enzimas descobertas e descritas nesta patente possuem o potencial para uso em outras reações de formação de ligações carbono-carbono entre um receptor alfa-ceto ácido e piruvato ou doador de derivado de piruvato como exemplificado no esquema de reação geral abaixo.
Figure BR122017003017B1_D0010
receptor de piruvato ou cetona ou de derivado de
Figure BR122017003017B1_D0011
aldeído piruvato [00719] R = H, alquila, alquila substituída, arila, arila substituída, benzila, benzila substituída [00720] R2 = H, alquila, alquila substituída, arila, arila substituída, benzila, benzila substituída [00721] R3 = H, alquila, alquila substituída, arila, arila substituída, benzila, benzila substituída, ácido carboxílico.
Exemplo 5
Caracterização de Aldolases Selecionadas [00722] As aldolases selecionadas foram caracterizadas em relação a sua capacidade de catalisar a conversão de indol-3-piruvato e piruvato no precursor de monatina (MP) como mostrado no esquema a seguir:
Figure BR122017003017B1_D0012
Figure BR122017003017B1_D0013
[00723] As figuras 13 e 14 mostram as atividades de 58 aldolases
Petição 870170009999, de 15/02/2017, pág. 388/1247
379/788 diferentes na formação de MP que é medida por LC/MS/MS.
[00724] As reações de aldol foram realizadas com 20 mM de indol3-piruvato (I3P), 50 mM de piruvato, 100 mM de fosfato de sódio pH 7, 1 mM de MgCI2, 100 pg/mL de aldolase. As reações foram incubadas à temperatura ambiente na escuridão. As alíquotas (30 pL) foram removidas em vários tempos e as reações foram interrompidas armazenando as amostras em gelo. Uma parte de cada alíquota foi submetida à análise de CE, enquanto a parte restante foi diluída 1:1000 em 50% de acetonitrila e submetida à análise de LC/MS.
Tabela 2: Enanciosseletividade de aldolases diferentes para a formação de MP partindo de I3P e piruvato como determinado por CE quiral
Aldolase % de R-MP (ponto de tempo de 23 h) CHA (U/mg) (baseado na proteína total no Usado) Expressão Relativa
SEQ ID NO:28 (codificada pela SEQ ID NO:27) 98+ 31,8 II II II II II II
SEQ ID NO:116 (codificada pela SEQIDNO:115) 95 304 ##
SEQ ID NO:76 (codificada pela SEQ ID NO:75) 50 424 II II II II II II
SEQ ID NO:298 (codificada pela SEQ ID NO:297) 98+ 388 ##
SEQ ID NO:44 (codificada pela SEQ ID NO:43) 70 332 ##
SEQ ID NO:54 (codificada pela SEQ ID NO:53) 98+ 95 #
SEQ ID NO: 148 (codificada pela SEQ ID NO:147) 90 200 ##
SEQ ID NO:46 (codificada pela SEQ ID NO:45) 70 174 ##
SEQ ID NO: 134 (codificada pela SEQ ID NO:133) 90 576 II II II II II II
Petição 870170009999, de 15/02/2017, pág. 389/1247
380/788
Aldolase % de R-MP (ponto de tempo de 23 h) CHA (U/mg) (baseado na proteína total no lisado) Expressão Relativa
SEQ ID NO: 142 (codificada pela SEQIDNO:141) 98+ 55 #
SEQ ID NO: 122 (codificada pela SEQIDNO:121) 98+ 38 ##
SEQ ID NO:74 (codificada pela SEQ ID NO:73) 80 484 II II II II II II
SEQ ID NO:64 (codificada pela SEQ ID NO:63) 95 38 #
SEQ ID NO: 108 (codificada pela SEQ ID NO:107) 98+ 40 #
SEQ ID NO:96 (codificada pela SEQ ID NO:95) 98+ não detectado #
SEQ ID NO: 126 (codificada pela SEQ ID NO:125) 95 124 ##
SEQ ID NO:80 (codificada pela SEQ ID NO:79) 98+ não detectado #
SEQ ID NO:36 (codificada pela SEQ ID NO:35) 98+ 80 ##
SEQ ID NO:62 (codificada pela SEQ ID NO:61) 98+ não detectado #
SEQ ID NO:112 (codificada pela SEQIDNO:111) 98+ não detectado #
SEQ ID NO: 130 (codificada pela SEQ ID NO:129) 98+ 38 ##
SEQ ID NO:94 (codificada pela SEQ ID NO:93) 98+ 47 ##
SEQ ID NO: 102 (codificada pela SEQIDNO:101) não detectado não detectado #
SEQ ID NO:58 (codificada pela SEQ ID NO:57) 98+ 59 ##
SEQ ID NO:88 (codificada pela SEQ ID NO:87) 50 510 II II II II II II
Petição 870170009999, de 15/02/2017, pág. 390/1247
381/788
Aldolase % de R-MP (ponto de tempo de 23 h) CHA (U/mg) (baseado na proteína total no lisado) Expressão Relativa
SEQ ID NO:50 (codificada pela SEQ ID NO:49) 98+ 144 ##
SEQ ID NO: 106 (codificada pela SEQ ID NO:105) 98+ não detectado ##
SEQ ID NO:40 (codificada pela SEQ ID NO:39) 40 406 II II II II II II
SEQ ID NO:42 (codificada pela SEQ ID NO:41) 98+ 92 ##
SEQ ID NO:278 (codificada pela SEQ ID NO:277) 95 2,0 #
SEQ ID NO: 162 (codificada pela SEQIDNO:161) 95 11,8 #
SEQ ID NO:276 (codificada pela SEQ ID NO:275) 98+ 100,4 ####
SEQ ID NO: 178 (codificada pela SEQ ID NO:177) 95 38,8 #
SEQ ID NO:202 (codificada pela SEQIDNO:201) não detectado não detectado #
SEQ ID NO: 166 (codificada pela SEQ ID NO:165) 98+ 85,5 ##
SEQ ID NO:218 (codificada pela SEQ ID NO:217) 95 49,1 ##
SEQ ID NO:224 (codificada pela SEQ ID NO:223) 98+ 23,2 #
SEQ ID NO:226 (codificada pela SEQ ID NO:225) 98+ 128,3 #
SEQ ID NO:244 (codificada pela SEQ ID NO:243) 98+ 40,4 #
SEQ ID NO:250 (codificada pela SEQ ID NO:249) 95 6,0 #
SEQ ID NO:252 (codificada pela SEQIDNO:251) 95 20,2 ##
Petição 870170009999, de 15/02/2017, pág. 391/1247
382/788
Aldolase % de R-MP (ponto de tempo de 23 h) CHA (U/mg) (baseado na proteína total no lisado) Expressão Relativa
SEQ ID NO:264 (codificada pela SEQ ID NO:263) 95 9,9 ##
SEQ ID NO:268 (codificada pela SEQ ID NO:267) 95 2,0 #
SEQ ID NO:272 (codificada pela SEQIDNO:271) 95 6,7 #
SEQ ID NO: 184 (codificada pela SEQ ID NO:183) 95 não detectado #
SEQ ID NO:282 (codificada pela SEQIDNO:281) 95 36,7 II II II II II II
SEQ ID NO: 186 (codificada pela SEQ ID NO:185) 95 4,2 #
SEQ ID NO: 192 (codificada pela SEQIDNO:191) 95 11,9 #
SEQ ID NO:200 (codificada pela SEQ ID NO:199) 95 17,9 ##
SEQ ID NO:280 (codificada pela SEQ ID NO:279) 50 não detectado #
SEQ ID NO:284 (codificada pela SEQ ID NO:283) 90 2,2 #
SEQ ID NO: 172 (codificada pela SEQIDNO:171) 95 8,4 #
SEQ ID NO: 180 (codificada pela SEQ ID NO:179) 98+ 61,0 II II II II II II
SEQ ID NO: 168 (codificada pela SEQ ID NO:167) 98+ 9,3 #
SEQ ID NO:228 (codificada pela SEQ ID NO:227) 98+ 38,7 II II II II II II
SEQ ID NO:236 (codificada pela SEQ ID NO:235) 95 13,1 #
SEQ ID NO:238 (codificada pela SEQ ID NO:237) 98+ 22,3 ##
Petição 870170009999, de 15/02/2017, pág. 392/1247
383/788
Aldolase % de R-MP (ponto de tempo de 23 h) CHA (U/mg) (baseado na proteína total no lisado) Expressão Relativa
SEQ ID NO:240 (codificada pela SEQ ID NO:239) 95 não detectado #
SEQ ID NO:270 (codificada pela SEQ ID NO:269) 40 4,6 #
SEQ ID NO: 156 (codificada pela SEQ ID NO:155) 98+ 133,0 II II II II II II
[00725] Observar que as seletividades para R-MP de 98+% indicam que nenhum S-MP foi detectado. Dada a sensibilidade do ensaio de CE, os resultados indicam que pelo menos 98% de MP formados é o R-enanciômero. Assim, as enzimas que são listadas como 98+% são pelo menos 98% seletivas em direção a R-MP e podem ser até 100% seletivas.
[00726] A Tabela 2 mostra ainda a atividade das enzimas sobre um substrato de aldolase geral, CHA, assim como a expressão relativa de cada enzima, como determinado por SDS-PAGE. Observar que várias enzimas não exibiam atividade detectável sobre CHA e ainda exibiam atividade na produção de MP.
[00727] Em resumo, as aldolases exibem uma faixa ampla de atividades, expressão e seletividades. Além disso, há várias aldolases que exibem seletividades extraordinariamente altas (98% ou mais) em relação a R-MP.
Exemplo 6
Descoberta de piruvato aldolases vegetais [00728] Os iniciadores da PCR degenerados (vide abaixo) foram planejados e utilizados para extrair genes da aldolase de cDNA preparado partindo de Sclerochiton ilicifolius. As extremidades a 5' e a 3' dos genes foram recuperadas e os genes de comprimento completo foram então amplificados pela PCR.
Petição 870170009999, de 15/02/2017, pág. 393/1247
384/788
SEQ ID NO: Nome do Iniciador Iniciador
335 F1 AARGTBTWYGARGACAATG (SEQ ID NO:335)
336 F2 GCDCAGAWCAAYGGRTGG (SEQ ID NO:336)
337 R1 CCATCRSYATCDGCRTADAGCCA (SEQ ID NO:337)
338 R2 GCRTADAGCCAYTCNCCRTC (SEQ
ID NO:338)
Exemplo 7
Clonagem da D-aminoácido aminotransferase de Bacillus sphaerícus [00729] A D-aminoácido aminotransferase (EC 2,6.1.21, também conhecida como D-alanina aminotransferase ou D-aspartato aminotransferase) de B. sphaerícus foi produzida de forma recombinante para uso em ensaios acoplados com as várias aldolases. Esta enzima é homóloga às D-aminotransferases descritas anteriormente para a produção de monatina (Publicação U.S. N° 20040063175 e Publicação U.S. N°20050282260).
Cepas [00730] B. sphaerícus (ATCC número 10208) foi cultivado em Nutrient Ágar a 30Ό durante a noite. Os grupos de colôn ias foram colocados em 100 pl_ de água esterilizada e aquecidos durante 5 minutos a 95Ό, para romper as células. Três μΙ_ foram utilizados nas amplificações subseqüentes através da Reação em Cadeia da Polimerase (PCR).
Protocolo da Reação em Cadeia da Polimerase [00731] Os iniciadores foram planejados para a clonagem em vetores pET 28b e pET 30a (Novagen, Madison, Wl), utilizando os sítios Ncol e BamHI. A constructo pET 30 contém His-tag e S-tag N-terminal, enquanto que o constructo pET 28 não é marcada.
Iniciadores para dat de Bacillus Sphaerícus:
Petição 870170009999, de 15/02/2017, pág. 394/1247
385/788 [00732] N term: 5'-GATATACCATGGCATACTCATTATGGAATG-3' (SEQ ID NO:383) e C term: 5'GTTATCGGATCCTTAGGCATTAATTGAAATTG-3' (SEQ ID NO:384). [00733] A região codificadora foi amplificada utilizando o protocolo de PCR a seguir. Em uma reação de 50 μΙ_, 3 μΙ_ de molde, 1,6 μΜ de cada iniciador, 0,25 mM de cada dNTP, 3,5 U de Expand High Fidelity Polymerase (Roche, Indianapolis, IN) e tampão 1X Expand® com Mg foram utilizados. O programa do termociclador utilizado incluía um início a quente a 94Ό durante 3 minutos, seguidos por 8 repetições das etapas a seguir: 94Ό durante 30 segundos, 52Ό dur ante 30 segundos e 72Ό durante 2 minutos. Vinte e dois ciclos s ubseqüentes foram feitos com uma temperatura de anelamento de 58Ό. A pós 30 ciclos, a amostra foi mantida a 72Ό durante 7 minutos e entã o armazenada a 4Ό. Foram obtidos produtos da PCR limpos do tamanho correto (aproximadamente 850 pb para o gene daf).
Clonagem [00734] Os produtos da PCR foram purificados utilizando o kit de purificação Qiagen QIAquick PCR (Qiagen, Valencia, CA) e digeridos com BamHI e Ncol em tampão de BamHI (New England Biolabs, Ipswich, MA).
[00735] O vetor e os insertos digeridos foram purificados utilizando o Qiagen QIAquick Gel Extraction Kit (Qiagen, Valencia, CA). As ligações foram feitas utilizando o Roche Rapid DNA Ligation Kit (Roche, Indianapolis, IN) e purificadas utilizando o kit de purificação QIAquick PCR (Qiagen, Valencia, CA). As ligações foram transformadas em Escherichia coli DH10B utilizando uma cubeta de 0,2 cm e um sistema Bio-Rad Gene Pulser II como descrito no manual de eletroporação da Bio-Rad (Bio-Rad, Hercules, CA). Foi permitido que as células se recuperassem em 900 μΙ_ de meio SOC durante 30 minutos a 37Ό a 225 rpm. As células foram plaqueadas em placas de LB-ágar contendo
Petição 870170009999, de 15/02/2017, pág. 395/1247
386/788 canamicina (25 pg/mL).
[00736] O DNA plasmideal foi purificado utilizando o Qiagen spin miniprep kit (Qiagen, Valencia, CA) e verificado em relação aos insertos corretos através da digestão de restrição com BamHI e Ncol. As sequências dos plasmídeos que pareciam ter o inserto correto foram verificadas através do seqüencia de DNA com terminação de cadeia didesóxi na Agencourt BioScience Corporation (Beverly, MA). O seqüenciamento verificou a sequência codificadora encontrada no NCBI número de acesso AF081278 Região: 134..985 (gi: 3513754), que produz uma proteína com sequência de aminoácidos que é listada no número de acesso AAC33964 (gi: 3513755).
Expressão Gênica e Ensaios [00737] O DNA plasmideal foi subclonado no hospedeiro de expressão E. coli BL21(DE3) (Novagen, Madison, Wl). As culturas foram crescidas e os plasmídeos foram isolados utilizando o Qiagen miniprep kit (Qiagen, Valencia, CA) e analisados através da digestão de restrição para confirmar a identidade. A indução foi tipicamente realizada em meio LB contendo canamicina (50 pg/mL). As células foram cultivadas até uma D06oo de 0,4-0,8, induzidas com 0,1 mM de IPTG (isopropil tiogalactosídeo) e foram tiradas amostras 4 horas após a indução. Os extratos celulares foram preparados de acordo com o protocolo que acompanha o reagente Novagen BugBuster® (Novagen, Madison, Wl) (com benzonase nuclease e o coquetel de inibidor de protease completo da Roche adicionados (Roche, Indianapolis, IN)). Níveis muito altos de proteína solúvel foram obtidos no peso molecular previsto, que é julgado por SDS-PAGE. Para algumas reações, o produto do gene pET 30 foi purificado utilizando cartuchos de His-Bind seguindo os protocolos do fabricante (Novagen, Madison, Wl). As frações do eluente foram dessalinizadas em colunas PD-10 (GE Healthcare, Piscataway, NJ) e eluídas em 25-100 mM de tampão de fosfato
Petição 870170009999, de 15/02/2017, pág. 396/1247
387/788 de potássio, pH 7.5.
[00738] Os extratos de células foram analisados em relação à atividade de D-aminotransferase seguindo a produção de alanina partindo de piruvato e D-triptofano utilizando o protocolo a seguir. Reações de um mL foram tipicamente realizadas em 100 mM de tampão de fosfato de potássio (pH 7,5), 50 μM de fosfato piridoxal, 25 mM de piruvato de sódio e 50 mM de D-triptofano. As reações foram iniciadas através da adição de extratos isentos de células ou enzima purificada e incubadas 15 minutos durante a noite a 30G, com agitação suave. O ácido fórmico foi adicionado em uma concentração final de dois por cento para interromper a reação e a proteína precipitada foi removida por centrifugação. Reações de controle sem proteína adicionada foram também realizadas. Pontos no tempo zero também foram utilizados como controles negativos. A alanina foi detectada utilizando a derivatização OPA que é descrita no Exemplo 1.
Exemplo 8
Comparação da produção de monatina total e distribuição de isômeros para os polipeptídeos com atividade de aldolase das SEQ ID NO:8,
SEQ ID NO:4, SEQ ID NO: 12 e SEQ ID NO:28 e ProA de C. testosteroni [00739] A AT-103 transaminase (uma D-aminotransferase de especificidade ampla) foi obtida na BioCatalytics (Pasadena, CA) esta enzima ou a enzima recombinante produzida no Exemplo 7 foi utilizada nas reações acopladas com HMG aldolases para produzir monatina partindo de D-triptofano e piruvato como descrito no Pedido de Patente U.S. Publicado N°20050282260. A ProA aldolase de C. testosteronifoi utilizada como uma aldolase de referência com a finalidade de comparação e foi preparada descrito no Pedido de Patente U.S. Publicado N° 20040063175 e na WO 03091396 A2. As aldolases testadas foram isoladas e transformadas como descrito anteriormente no Exemplo 4.
Petição 870170009999, de 15/02/2017, pág. 397/1247
388/788 [00740] Para produzir quantidades de teste de cada aldolase, culturas de 50 mL foram crescidas em meio LB contendo ampicilina (100 pg/mL), até uma D06oo de aproximadamente 0,5. As cepas contendo os constructos das SEQ ID NO:7, SEQ ID NO:3 e SEQ ID NO:11 foram iduzidas com 100 μΜ de IPTG. A cepa contendo o constructo de SEQ ID NO:27 foi induzida com 200 pg/L de anhidrotetraciclina. As células foram cultivadas 5 horas após a indução e os extratos celulares foram preparados de acordo com os protocolos do fabricante (Novagen, Madison, Wl, reagente Bugbuster). A benzonuclease e o inibidor de protease também foram adicionados. As proteínas solúveis nos extratos celulares foram separadas em uma Bio-Rad Laboratories Experion Automated Electrophoresis Station (Bio-Rad, Hercules, CA) e analisadas em relação à concentração e à expressão percentual utilizando o Experion Software versão 1.1.98.0.
[00741] Os seguintes foram adicionados por 1 mL de mistura de reação: aproximadamente 50 pg de aldolase (fornecida em extratos celulares a não ser que seja citado de outra maneira), 4 mM de MgCI2, 50 mM de D-triptofano, 0,5 mg de D-aminotransferase purificada de B. sphaericus, 200 mM de piruvato de sódio, 100 mM de tampão de fosfato de potássio pH 7,5 e 0,05 mM de PLP. Os experimentos foram realizados em duplicata, com controles negativos em que não era adicionada aldolase. As amostras foram incubadas 1 h, 2 h e durante a noite (17-20 horas) a 30Ό com agitação suave. Pequenas quantidades de monatina (< 0,5 ppm) são produzidas sem aldolase em reações durante a noite, devido às reações não enzimáticas catalisadas por magnésio e fosfato. Tais valores foram subtraídos dos números mostrados abaixo e os resultados médios são mostrados. Os únicos estereoisômeros detectados quando a monatina era produzida utilizando estes métodos são R,R e S,R. A porcentagem de R,R é listada abaixo e foi determinada através da área do pico de LC em fase inversa.
Petição 870170009999, de 15/02/2017, pág. 398/1247
389/788
Tabela 3: Monatina total produzida partindo de D-triptofano e % de R,R
Aldolase (ponto de tempo) Monatina total (ppm) % de R,R monatina
SEQ ID NO:8 (1 h) 15,65 89,7
SEQ ID NO:8 (18 h) 129,22 79,0
SEQ ID NO:4 (1 h) 3,22 94,8
SEQ ID NO:4 (18 h) 12,14 93,8
SEQ ID NO:12 (1 h) 2,35 100
SEQ ID NO:12 (18 h) 11,89 98,65
SEQ ID NO:28 (1 h) 14,70 100
SEQ ID NO:28 (18 h) 95,14 97,35
ProA de C. testosteroni (1 h) enzima purificada 16,63 86,45
ProA de C. testosteroni (18 h) enzima purificada 86,86 63,1
[00742] A amostra de S EQ ID NO: 28 de 18 horas também foi ana-
lisada em relação à distribuição estereoisomérica através do método de derivatização com FDAA listado no Exemplo 1, que forneceu um resultado de 94,9% de R,R e 5,1% de S,R monatina.
[00743] Os mesmos experimentos foram feitos, lado a lado, utilizando L-triptofano como o substrato de partida e acoplando as aldolases com a L-aminotransferase de especificidade ampla HexAspC produzida como descrito no Pedido de Patente U.S. Publicado N° 20050282260 e purificada. Estas reações forneceriam primariamente S,S monatina e R,S monatina. As reações também foram suplementadas com 10 mM de alfa-cetoglutarato como o receptor de amino para a transaminação de L-triptofano. Novamente, foi calculada abaixo a média dos resultados em duplicata para a monatina total (subtraído os níveis de fundo sem aldolase presente) e a porcentagem de S,S monatina é mostrada com base na área do pico de LC em fase inversa. Em alguns casos, devido ao fato de que as aldolases são bastante específicas a R e produzem pouca monatina total, as estimativas em fase inversa da distribuição estereoisomérica são menos acuradas por
Petição 870170009999, de 15/02/2017, pág. 399/1247
390/788 causa de algum resíduo do pico de triptofano que pode ser co-eluído com o pico de S,S/R,R monatina. As tendências são ainda informativas na comparação da especificidade a R das aldolases. Os resultados da análise adicional utilizando o método de derivatização com FDAA são mostrados entre parênteses para várias amostras e são mais acurados. Os números de monatina total acima de aproximadamente 400 ppm são maiores que a faixa linear da escala dos padrões utilizados para quantificar os resultados, assim são resultados qualitativos. A ProA aldolase de C. testosteroni produz tipicamente 95-100% de S,S monatina, como mostrado no Pedido de Patente U.S. Publicado N°20050282260.
Tabela 4: Monatina total produzida partindo de L-triptofano e % de S,S
Aldolase (ponto de tempo) Monatina total (ppm) % de S,S monatina
SEQ ID NO:8 (1 h) 138,65 78,9
SEQ ID NO:8 (18 h) 600,3 78,15
SEQ ID NO:4 (1 h) abaixo do controle negativo 95,65
SEQ ID NO:4 (18 h) 28,5 87,6
SEQ ID NO:12 (1 h) abaixo do controle negativo 93,55
SEQ ID NO:12 (18 h) 24,9 75 (59,35)
SEQ ID NO:28 (1 h) 17,85 55,05 (18,9)
SEQ ID NO:28 (18 h) 135,5 27,25 (19,1)
ProA de C. testosteroni (1 h) enzima purificada 440,35 92,5
ProA de C. testosteroni (18 h) enzima purificada 958,3 92,15
[00744] Pode ser observado que a especificidade a R do polipeptídeo com atividade de aldolase da SEQ ID NO: 28 é bastante alta comparada com a enzima ProA de referência, isto é também refletido na baixa % de S,S monatina produzida, apesar do alto grau de especificidade da HexAspC aminotransferase por S-MP nestas reações. Os números de monatina total, quando comparados com a produção de
Petição 870170009999, de 15/02/2017, pág. 400/1247
391/788
S,S monatina versus a produção de R,R monatina, não são indicativos da atividade de aldolase. A D-aminotransferase é menos ativa que HexAspC, particularmente nas concentrações de MP que estão presentes nestas reações.
[00745] Para a comparação adicional do polipeptídeo com atividade de aldolase da SEQ ID NO: 28 com a enzima ProA de C. testosteroni, proporções variáveis de D-aminotransferase em relação à aldolase foram utilizadas em reações partindo de D-triptofano (sem amostras em duplicata para estes experimentos). As reações foram realizadas como anteriormente. Para as reações em que a concentração de aldolase foi mantida constante, foram utilizados aproximadamente 50 pg. Para as reações em que a D-aminotransferase foi mantida constante, foi utilizado 0,5 mg. Para as concentrações de 2 e 10 mg/mL de Daminotransferase, foi utilizada a enzima liofilizada. Para as 2 concentrações mais altas de D-aminotransferase, foram corridas duplicatas.
Tabela 5: Efeito da concentração de D-aminotransferase sobre a produção de R,R monatina
Aldolase Concentração de D-aminotransferase Tempo Monatina total (ppm aproximadas) % de R,R monatina
SEQ ID NO:28 0,25 mg/mL 1 h 2 100
SEQ ID NO:28 0,25 mg/mL durante a noite 141 97,1
SEQ ID NO:28 0,5 mg/mL 1 h 8 100
SEQ ID NO:28 0,5 mg/mL durante a noite 273 96,5
SEQ ID NO:28 1 mg/mL 1 h 34 100
SEQ ID NO:28 1 mg/mL durante a noite 638 96,5
SEQ ID NO:28 2 mg/mL 1 h 979 100
SEQ ID NO:28 2 mg/mL durante a noite 1910 97,3
Petição 870170009999, de 15/02/2017, pág. 401/1247
392/788
Aldolase Concentração de D-aminotransferase Tempo Monatina total (ppm aproximadas) % de R,R monatina
SEQ ID NO:28 10 mg/mL 1 h 2930 99,1
SEQ ID NO:28 10 mg/mL durante a noite 2950 96,5
ProA de C. testosteroni (purificada) 0,25 mg/mL 1 h 4 78,7
ProA de C. testosteroni (purificada) 0,25 mg/mL durante a noite 257 61,1
ProA de C. testosteroni (purificada) 0,5 mg/mL 1 h 25 79,0
ProA de C. testosteroni (purificada) 0,5 mg/mL durante a noite 480 62,5
ProA de C. testosteroni (purificada) 1 mg/mL 1 h 74 73,8
ProA de C. testosteroni (purificada) 1 mg/mL durante a noite 810 68,1
ProA de C. testosteroni (purificada) 2 mg/mL 1 h 325 73,1
ProA de C. testosteroni (purificada) 2 mg/mL durante a noite 2220 71,9
ProA de C. testosteroni (purificada) 10 mg/mL 1 h 2910 59,7
ProA de C. testosteroni (purificada) 10 mg/mL durante a noite 2450 67,5
Petição 870170009999, de 15/02/2017, pág. 402/1247
393/788
Aldolase Concentração de D-aminotransferase Tempo Monatina total (ppm aproximadas) % de R,R monatina
SEQ ID NO:8 0,25 mg/mL 1 h 4 92,3
SEQ ID NO:8 0,25 mg/mL durante a noite 219 69,8
SEQ ID NO:8 0,5 mg/mL 1 h 14 84,9
SEQ ID NO:8 0,5 mg/mL durante a noite 426 67,5
SEQ ID NO:8 1 mg/mL 1 h 62 84,2
SEQ ID NO:8 1 mg/mL durante a noite 877 68,7
[00746] Para os níveis de monatina acima de 400 ppm, os resultados não estão na faixa linear da curva padrão e são apenas valores aproximados. A quantidade máxima de R,R monatina produzida, quando diluída apropriadamente, era de 1100 ppm. A análise estereoisomérica com FDAA foi feita para o polipeptídeo com atividade de aldolase da SEQ ID NO: 28 com amostras a 10 mg/mL de Daminotransferase. Em duas horas, a amostra continha 98,5% de R,R monatina. Em 17 horas, a amostra continha 95,9% de R,R monatina. O polipeptídeo com atividade de aldolase da SEQ ID NO: 28 produziu altas porcentagens de R,R monatina, mesmo após tempos de incubação longos e utilizando grandes quantidades de aminotransferase. Se a D-aminotransferase adequada for fornecida, o polipeptídeo com atividade de aldolase da SEQ ID NO: 28 produz tanta monatina total quanto a ProA aldolase de C. testosteroni, indicando uma atividade específica similar.
Petição 870170009999, de 15/02/2017, pág. 403/1247
394/788
Tabela 6: Efeito da concentração de aldolase sobre a produção de R,R monatina
Aldolase Concentração de aldolase Tempo Monatina total (ppm) % de R,R monatina
SEQ ID NO:28 25 pg/mL 1 h 7,0 100
SEQ ID NO:28 25 pg/mL durante a noite 275 97,4
SEQ ID NO28 50 pg/mL 1 h 9,0 97,3
SEQ ID NO:28 50 pg/mL durante a noite 334 95,7
SEQ ID NO:28 100 pg/mL durante a noite 297 93,3
ProA de C. testosteroni (purificada) 25 pg/mL 1 h 16 78,2
ProA de C. testosteroni (purificada) 25 pg/mL durante a noite 491 73,2
ProA de C. testosteroni (purificada) 50 pg/mL 1 h 18 64,1
ProA de C. testosteroni (purificada) 50 pg/mL durante a noite 437 63,0
ProA de C. testosteroni (purificada) 100 pg/mL 1 h 26 62,5
ProA de C. testosteroni (purificada) 100 pg/mL durante a noite 513 61,5
SEQ ID NO:8 25 pg/mL 1 h 11,0 88,1
SEQ ID NO:8 25 pg/mL durante a noite 337,0 74,7
SEQ ID NO:8 50 pg/mL 1 h 14,0 78,2
Petição 870170009999, de 15/02/2017, pág. 404/1247
395/788
Aldolase Concentração de aldolase Tempo Monatina total (ppm) % de R,R monatina
SEQ ID NO:8 50 pg/mL durante a noite 406,0 67,8
SEQ ID NO:8 100 pg/mL 1 h 24,0 70,1
SEQ ID NO:8 100 pg/mL durante a noite 329,0 63,9
[00747] Quando a concentração de aldo ase é variada, não ocorre
muito aumento na monatina total. A porcentagem de R,R diminui com o tempo e também com a concentração de aldolase, particularmente quando a D-aminotransferase é limitante.
[00748] Para verificar adicionalmente a especificidade a R das aldolases testadas, os experimentos foram feitos partindo de L-triptofano e HexAspC aminotransferase, que foi produzida e purificada como descrito no Pedido de Patente U.S. Publicado N° 200502 82260. A HexAspC exibe uma forte seletividade para a transaminação de S-MP versus R-MP, assim as porcentagens acima de 50% de R,S monatina indicam uma aldolase altamente estereoespecífica. Dez mM de alfacetoglutarato foram fornecidos como um receptor de amino; entretanto, em altas concentrações, o piruvato também é utilizado pela Laminotransferase. Nestas reações, tipicamente apenas S,S e R,S monatinas são produzidas dentro dos limites de detecção do protocolo de derivatização com FDAA.
Tabela 7: Efeito da concentração de L-aminotransferase sobre a produção de S,S monatina
Aldolase Concentração de D-aminotransferase Tempo Monatina total (ppm aproximadas) % de S,S monatina
SEQ ID NO:28 0,25 mg/mL 1 h 13 33,8
SEQ ID NO:28 0,25 mg/mL durante a noite 127 34,2
SEQ ID NO:28 0,5 mg/mL 1 h 31 30,9
Petição 870170009999, de 15/02/2017, pág. 405/1247
396/788
Aldolase Concentração de D-amino- transferase Tempo Monatina total (ppm aproximadas) % de S,S monatina
SEQ ID NO:28 0,5 mg/mL durante a noite 272 26,8
SEQ ID NO:28 1 mg/mL 1 h 34 20,3
SEQ ID NO:28 1 mg/mL durante a noite 385 23,5
ProA de C. testosteroni (purificada) 0,25 mg/mL 1 h 523 94,2
ProA de C. testosteroni (purificada) 0,25 mg/mL durante a noite 1817 93,7
ProA de C. testosteroni (purificada) 0,5 mg/mL 1 h 602 91,8
ProA de C. testosteroni (purificada) 0,5 mg/mL durante a noite 2122 89,9
ProA de C. testosteroni (purificada) 1 mg/mL 1 h 873 90,2
ProA de C. testosteroni (purificada) 1 mg/mL durante a noite 1237 82,6
SEQ ID NO:8 0,25 mg/mL 1 h 339 86,3
SEQ ID NO:8 0,25 mg/mL durante a noite 1499 88,0
SEQ ID NO:8 0,5 mg/mL 1 h 211 80,3
SEQ ID NO:8 0,5 mg/mL durante a noite 1328 83,1
SEQ ID NO:8 1 mg/mL 1 h 400 74,6
SEQ ID NO:8 1 mg/mL durante a noite 1370 79,0
Petição 870170009999, de 15/02/2017, pág. 406/1247
397/788
Tabela 8: Efeito da concentração de aldolase sobre a produção de S,S monatina
Aldolase Concentração de aldolase Tempo Monatina total (ppm) % de S,S monatina
SEQ ID NO:28 25 pg/mL 1 h 11 25,1
SEQ ID NO:28 25 pg/mL durante a noite 112 20,0
SEQ ID NO:28 50 pg/mL 1 h 18 31,8
SEQ ID NO:28 50 pg/mL durante a noite 160 27,0
SEQ ID NO:28 100 pg/mL 1 h 33 33,2
SEQ ID NO:28 100 pg/mL durante a noite 238 41,4
ProA de C. testosteroni (purificada) 25 pg/mL 1 h 305 86,4
ProA de C. testosteroni (purificada) 25 pg/mL durante a noite 1094 87,5
ProA de C. testosteroni (purificada) 50 pg/mL 1 h 575 90,9
ProA de C. testosteroni (purificada) 50 pg/mL durante a noite 1449 89,5
ProA de C. testosteroni (purificada) 100 pg/mL 1 h 817 93,6
ProA de C. testosteroni (purificada) 100 pg/mL durante a noite 1360 89,7
SEQ ID NO:8 25 pg/mL 1 h 134 70,7
SEQ ID NO:8 25 pg/mL durante a noite 728 76,3
SEQ ID NO:8 50 pg/mL 1 h 197 80,0
Petição 870170009999, de 15/02/2017, pág. 407/1247
398/788
Aldolase Concentração de aldolase Tempo Monatina total (PPm) % de S,S monatina
SEQ ID NO:8 50 pg/mL durante a noite 928 81,4
SEQ ID NO:8 100 pg/mL 1 h 279 86,7
SEQ ID NO:8 100 pg/mL durante a noite 1383 86,8
[00749] Para as aldolases que são altamente específicas a R, tal como o polipeptídeo com atividade de aldolase da SEQ ID NO: 28, menos monatina total é produzida e o aumento da quantidade de aldolase aumenta a monatina total (assim como a % de S,S). Estas aldolases produzem menos substrato de S-MP, o substrato preferido para a L-aminotransferase utilizado. Para as enzimas que são menos específicas a R, tal como ProA, o aumento de aldolase não aumenta significativamente a produção de monatina total ou a % de S,S monatina. O aumento da quantidade de L-aminotransferase adicionada diminui as porcentagens de S,S monatina produzida. Com base na análise acima, o polipeptídeo com atividade de aldolase da SEQ ID NO: 8 fica entre ProA e o polipeptídeo com atividade de aldolase da SEQ ID NO: 28 em termos de especificidade a R, o que concorda com os dados anteriores em que a % de R-MP é medida apenas para a etapa de aldol. Subclonagem da SEQ ID NO: 27 [00750] Os iniciadores a seguir foram utilizados para amplificar através da PCR o gene da aldolase: 5'gaggagctcgagtcagacgtatttcagtcctttttc-3' (SEQ ID NO: 385) e 5'agaagacatatgatttatcagccggggac-3' (SEQ ID NO: 386). O gene da aldolase da SEQ ID NO: 27 codifica o polipeptídeo com atividade de aldolase da SEQ ID NO: 28. O produto da PCR resultante foi digerido com Xho\ e Nde\ para cortar nos sítios que foram engenheirados dentro dos iniciadores. O fragmento foi purificado em gel (QIAquick Gel extraction Kit (Qiagen, Valencia, CA)) e ligado (utilizando T4 DNA ligase) com
Petição 870170009999, de 15/02/2017, pág. 408/1247
399/788 pET28b que foi digerido com Xho\ e Nde\ e purificado em gel. A ligação foi transformada em células quimicamente competentes de TOP10F'. As colônias cultivadas nas placas foram verificadas em relação aos insertos e vários isolados com insertos foram submetidos à análise de sequência de DNA (Agencourt, Beverly, MA).
Purificação do Polipeptídeo com Atividade de Aldolase da SEQ ID NO:
[00751] Os clones de aldolase confirmados foram transformados em BL21 DE3 ou BL21 DE3 pLysS. As culturas crescidas durante a noite com o antibiótico apropriado foram diluídas em meio fresco (tipicamente 1:100) e crescidas até uma DO600 ~0,6 com aeração a 37Ό. As culturas foram então induzidas com 1 mM de IPTG e transferidas para 30Ό (com aeração) e a incubação foi mantida d urante a noite. As células foram coletadas por centrifugação. O pélete de células foi submetido tipicamente a um ciclo de congelamento descongelamento para ajudar na lise celular. O pélete de células foi lisado em BugBuster e Benzonase (Novagen, Madison, Wl) (de acordo com o protocolo do fabricante). Os restos celulares foram removidos por centrifugação. O extrato de proteína bruto foi aplicado em uma coluna HisBind (Novagen, Madison, Wl) que foi preparada de acordo com o protocolo do fabricante. A coluna foi lavada e a proteína foi eluída de acordo com o protocolo do fabricante. A proteína purificada foi dessalinizada com colunas PD-10 (GE Healthcare, Piscataway, NJ). O tampão utilizado para a troca foi 50 mM de fosfato de potássio pH 7,5, 100 mM de NaCl, 4 mM de MgCI2. A proteína purificada foi concentrada com agentes de concentração por centrifugação Amicon (Millipore, Billerica, MA).
Exemplo 9 [00752] Comparação da produção de monatina total e da distribuição de isômeros para polipeptídeos com atividade de aldolase das
Petição 870170009999, de 15/02/2017, pág. 409/1247
400/788
SEQ ID NO:40, SEQ ID NO:298, SEQ ID NO:36, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:96, SEQ ID NO:54, SEQ ID NO:122, SEQ ID NO:142, SEQ ID NO:42, SEQ ID NO:130, SEQ ID NO:112, SEQ ID NO:108, SEQ ID NO:94, SEQ ID NO:80 e SEQ ID NO:28 [00753] A transaminase AT-103 (uma D-aminotransferase de especificidade ampla) foi obtida na BioCatalytics (Pasadena, CA) e esta enzima ou a enzima recombinante produzida no Exemplo 7 foi utilizada nas reações acopladas com HMG aldolases para produzir monatina partindo de D-triptofano e piruvato como descrito no Pedido de Patente U.S. Publicado N°20050282260. O polipeptídeo com atividade de aldolase da SEQ ID NO: 28 (marcado com his (his-tagged)) foi utilizado como uma aldolase de referência com finalidades de comparação e foi produzido e purificado como descrito no final do Exemplo 8. As outras aldolases testadas foram isoladas e transformadas como descrito anteriormente no Exemplo 4.
[00754] Para produzir quantidades de teste de cada aldolase, culturas de 25 mL foram crescidas em meio LB contendo ampicilina (100 pg/mL), até uma DO600 de aproximadamente 0,4. As cepas foram induzidas com 100 pM de IPTG. As células foram cultivadas 4 horas após a indução e os extratos celulares foram preparados de acordo com os protocolos do fabricante (Novagen, Madison, Wl, reagente Bugbuster) com benzonuclease. As proteínas solúveis nos extratos celulares foram separadas em uma Bio-Rad Laboratories Experion Automated Electrophoresis Station (Bio-Rad, Hercules, CA) e analisadas em relação à concentração e à porcentagem de expressão utilizando o Experion Software versão 1.1.98.0.
[00755] Os seguintes foram adicionados por 1 mL de mistura de reação: aproximadamente 50 pg de aldolase (fornecida nos extratos celulares a não ser que seja citado de outra maneira), 4 mM de MgCI2, 50 mg/mL de D-triptofano, 2 mg de AT-103 (BioCatalytics, Pasadena,
Petição 870170009999, de 15/02/2017, pág. 410/1247
401/788
CA), 200 mM de piruvato de sódio, 100 mM de tampão de fosfato de potássio pH 7,5 e 0,05 mM de PLP. O D-triptofano não é solúvel a esta concentração maior, mas foi utilizado para garantir que as reações eram mantidas nas quantidades de saturação de D-triptofano. Os experimentos foram rodados em duplicata, com controles negativos em que não foi adicionada aldolase. As amostras foram incubadas 2 h e durante a noite (17-20 horas) a 30G com agitação suave. Pequenas quantidades de monatina são produzidas durante a noite sem aldolase (~0,5 ppm), devido às reações não enzimáticas catalisadas por magnésio e fosfato. Os valores típicos para a % de R,R monatina são de 50% para estas amostras. Os valores de controle negativo foram subtraídos dos números mostrados abaixo e são mostrados os resultados médios. Os únicos estereoisômeros detectados quando a monatina é produzida utilizando estes métodos são R,R e S,R. A porcentagem de R,R é listada abaixo e foi determinada através da área do pico de LC em fase inversa. O mesmo experimento foi realizado após o aramazenamento dos extratos celulares e do polipeptídeo purificado com atividade de aldolase da SEQ ID NO: 28 durante 2 meses a -20G, neste momento 50 mM de D-triptofano foram utilizados como no Exemplo 8. O dobro da quantidade de aldolase foi adicionada com a exceção do polipeptídeo com atividade de aldolase da SEQ ID NO: 28, para o qual foram utilizados novamente aproximadamente 50 pg. Estes resultados são mostrados à direita da Tabela 9. Os resultados da derivatização com FDAA para a distribuição dos isômeros são mostrados entre parênteses.
Petição 870170009999, de 15/02/2017, pág. 411/1247
402/788
Tabela 9: Monatina total produzida partindo de D-triptofano e % de R,R
Aldolase (ponto de tempo) Monatina total (ppm) % de R,R monatina Monatina total (ppm) % de R,R monatina
SEQ ID NO:40 (2 h) 336 82,7 238 66,8
SEQ ID NO:40, (18 h) 707,55 76,2 748,5 62,4
SEQ ID NO:298 (2 h) 394,3 98,0 183 91,9 (91,6)
SEQ ID NO:298 (18 h) 819,5 96,1 648,5 80,0
SEQ ID NO:36 (2 h) 56 98,2 52,5 94,0
SEQ ID NO:36 (18 h) 123,25 96,9 296 88,5
SEQ ID NO:62 (2 h) 1,15 78,4 0 n/a
SEQ ID NO:62 (18 h) 0,95 73,8 16 89,2
SEQ ID NO:64 (2 h) 16,7 98,8 24 96,9
SEQ ID NO:64 (18 h) 43,7 97,6 161 98,5
SEQ ID NO:96 (2 h) 30,4 99,2 29 96,0
SEQ ID NO:96 (18 h) 80,8 98,3 200 97,3
SEQ ID NO:54 (2 h) 183,1 99,4 135,5 98,2 (98,8)
SEQ ID NO:54 (18 h) 457,7 98,9 488,5 96,9
SEQ ID NO: 122 (2 h) 129,3 97,9 126 97,8 (99,1)
SEQ ID NO:122 (18 h) 289,85 95,8 471,5 94,4
Petição 870170009999, de 15/02/2017, pág. 412/1247
403/788
Aldolase (ponto de tempo) Monatina total (ppm) % de R,R monatina Monatina total (ppm) % de R,R monatina
SEQ ID NO: 142 (2 h) 40,4 98,3 58,5 95,9
SEQ ID NO:142 (18 h) 82,3 97,3 388 96,8
SEQ ID NO:42 (2 h) 335,9 98,2 206,5 93,3
SEQ ID NO:42 (18 h) 612,45 96,6 630,5 82,9
SEQ ID NO:130 (2 h) 77,5 99,3 60,5 98,5 (99,6)
SEQ ID NO:130 (18 h) 177,45 99,1 368,5 98,4
SEQ ID NO:112 (2 h) 20,4 99,0 27 98,6
SEQ ID NO:112 (18 h) 57,75 98,3 186,5 99,3
SEQ ID NO:108 (2 h) 44,4 98,7 41 97,0
SEQ ID NO:108 (18 h) 111,7 98,0 265,5 93,3 (96,4)
SEQ ID NO:94 (2 h) 69,4 98,2 56 94,4
SEQ ID NO:94 (18 h) 181,95 96,9 341 84,8
SEQ ID NO:80 (2 h) 27,9 98,9 29,5 98,8
SEQ ID NO:80 (18 h) 74 97,9 219 96,6
SEQ ID NO:28 -purificada (2 h) 131,3 99,5 53 96,7 (99,6)
SEQ ID NO:28 -purificada (18 h) 407,4 99,2 257 99,2
[00756] Pode ser observatí o que certas enzimas são mais estáveis
Petição 870170009999, de 15/02/2017, pág. 413/1247
404/788 ao armazenamento que outras aldolases, com base nas proporções de atividade. Um produto secundário, mais provavelmente glutamato de 4-hidróxi-4-metila também pode ser formado durante estas reações. As enzimas anteriores foram classificadas em relação a sua especificidade para a produção de monatina através da comparação das áreas de pico destas versus do subproduto. Os resultados eram o polipeptídeo com atividade de aldolase das SEQ ID NO:122 > SEQ ID NO:42 > SEQ ID NO:80 > SEQ ID NO:108 > SEQ ID NO:96 > SEQ ID NO:112 > SEQ ID NO:130 > SEQ ID NO:36 > SEQ ID NO:94 > SEQ ID NO:298 > SEQ ID NO:40 > SEQ ID NO:142 > SEQ ID NO:54 > SEQ ID NO:64 > SEQ ID NO:28 > SEQ ID NO:62.
[00757] Com base nos experimentos iniciais, os polipeptídeos com atividade de aldolase das SEQ ID NO:298, SEQ ID NO:54 e SEQ ID NO:42 pareciam os mais promissores em termos de nível de atividade e da % de R,R monatina produzida. Estas enzimas foram subclonadas em vetores de expressão pET com e sem marcações de his.
Clonagem das SEQ ID NO:297, SEQ ID NO:53 e SEQ ID NO:41.
[00758] Iniciadores utilizados para a clonagem:
Tabela 10
SEQ ID NO: iniciador a 5' iniciador a 3'
297 5'- agaagacatatgggtgtcgtcgtcc aaaac-3' (SEQ ID NO:387) 5'- ataataggatccttagacatatttgag gccc-3' (SEQ ID NO:388)
53 5'- ataatacatatgaagccggtggtggt gc-3'(SEQ ID NO:389) 5'- agaagaggatccttagacataggtg agcccc-3' (SEQ ID NO:390)
41 5'- ataataccatgggtgtcgtggtccag -3' (SEQ ID NO:391) 5'- agaagaggatccttagacatatttca ggcccc-3' (SEQ ID NO:392)
[00759] As SEQ ID NO:297, SEQ ID NO:53 e SEQ ID NO:41 foram amplificadas através da PCR e digeridas com enzimas apropriadas
Petição 870170009999, de 15/02/2017, pág. 414/1247
405/788 (Nde\ e BamH\ para os produtos da PCR contendo a SEQ ID NO:297 e a SEQ ID NO:53, Nco\ e BamH\ para os produtos da PCR contendo a SEQ ID NO:41) e purificadas em gel (QIAquick Gel extraction Kit (Qiagen, Valencia, CA)). A SEQ ID NO:297 e a SEQ ID NO:53 foram ligadas individualmente em pET28 que foi digerido com Nde\ e BamH\ e purificado em gel. A SEQ ID NO:41 foi ligada em pET30 que foi digerido com Nco\ e BamH\ e purificado em gel. A ligação foi transformada em TOP10. As colônias foram verificadas em relação aos insertos. Os isolados com um inserto foram submetidos à análise de sequência de DNA (Agencourt, Beverly, MA).
Purificação de Aldolases [00760] Os clones de aldolase confirmados foram transformados em BL21 DE3 ou BL21 DE3 pLysS. As culturas crescidas durante a noite com o antibiótico apropriado foram diluídas em meio fresco (tipicamente 1:100) e crescidas até uma DO600 ~0,6 com aeração a 37Ό. As culturas foram então incubadas com 1 mM de IPTG e transferidas para 30Ό (com aeração) e a incubação foi continuad a durante a noite. As células foram coletadas por centrifugação. O pélete de células foi submetido tipicamente a um ciclo de congelamento descongelamento para ajudar na lise celular. O pélete de células foi lisado em BugBuster e Benzonase (Novagen, Madison, Wl) (de acordo com o protocolo do fabricante). Os restos celulares foram removidos por centrifugação. O extrato de proteína bruto foi aplicado em uma coluna HisBind (Novagen, Madison, Wl) que foi preparado de acordo com o protocolo do fabricante. A coluna foi lavada e a proteína foi eluída de acordo com o protocolo do fabricante. A proteína purificada foi dessalinizada com colunas PD-10 (GE Healthcare, Piscataway, NJ). O tampão utilizado para a troca era 50 mM de fosfato de potássio pH 7,5, 100 mM de NaCI, 4 mM de MgCI2. A proteína purificada foi concentrada com agentes de concentração por centrifugação Amicon (Millipore, Billerica,
Petição 870170009999, de 15/02/2017, pág. 415/1247
406/788
ΜΑ).
Teste de Aldolases Purificadas [00761] As aldolases purificadas foram testadas em relação a sua capacidade de produzir R,R monatina partindo de D-triptofano. Os seguintes foram adicionados por 1 mL de mistura de reação: aproximadamente 50 pg de purificada aldolase, 4 mM de MgCI2, 50 mM de Dtriptofano, 0,5 mg de D-aminotransferase de B. sphaericus purificada, 200 mM de piruvato de sódio, 100 mM de tampão de fosfato de potássio pH 7,5 e 0,05 mM de PLP. As amostras foram tiradas em 2 horas e durante a noite. Os resultados são mostrados na Tabela 11 abaixo.
Tabela 11: Monatina total produzida partindo de D-triptofano e % de R,R
Aldolase (ponto de tempo) Monatina total (ppm) % de R,R monatina (área do pico de LC em Fase Inversa) % de R,R monatina (derivatização com FDAA)
SEQ ID NO:298 (2 h) 16,95 88,5 n/a
SEQ ID NO:298 (durante a noite) 212 77,6 71
SEQ ID NO:54 (2 h) 12,05 96,7 n/a
SEQ ID NO:54 (durante a noite) 161,85 93,0 91,1
SEQ ID NO:42 (2 h) 20,95 80,3 n/a
SEQ ID NO:42 (durante a noite) 223,2 69,1 62,1
SEQ ID NO:28 (2 h) 14,25 95,8 n/a
SEQ ID NO:28 (durante a noite) 176,6 93,4 92,3
[00762] Os mesmos experimentos foram feitos utilizando o Ltriptofano como o substrato de partida e acoplando as aldolases com
Petição 870170009999, de 15/02/2017, pág. 416/1247
407/788
L-aminotransferase de especificidade ampla HexAspC e purificada como descrito no Pedido de Patente U.S. Publicado N° 20050282260 (0,5 mg de proteína purificada). Os resultados são mostrados abaixo na Tabela 12 para a produção de monatina total (subtraindo os níveis de fundo sem aldolase presente) e a porcentagem de S,S monatina é mostrada com base na área do pico de LC em fase inversa. Os números acima de 400 ppm estão fora da faixa linear da curva padrão e são aproximados.
Tabela 12: Monatina total produzida partindo de L-triptofano e % de
S,S
Aldolase (ponto de tempo) Monatina total (ppm) % de S,S monatina (área do pico de LC em Fase Inversa) % de S,S monatina (derivatização com FDAA)
SEQ ID NO:298 (1 h) 186,6 64,0 n/a
SEQ ID NO:298 (durante a noite) 197,5 64,3 67,6
SEQ ID NO:54 (1 h) 70,4 36,5 n/a
SEQ ID NO:54 (durante a noite) 87,8 41,7 42,1
SEQ ID NO:42 (1 h) 401,1 80,9 n/a
SEQ ID NO:42 (durante a noite) 507,5 82,9 85,8
SEQ ID NO:28 (1 h) 56,2 30,1 n/a
SEQ ID NO:28 (durante a noite) 88,8 32,2 33,8
[00763] Estes dados e os dados da R,R monatina anteriores ilustram que para a especificidade em relação a R-MP, os polipeptídeos com atividade de aldolase possuem a ordem a seguir: SEQ ID NO:28 > SEQ ID NO:54 > SEQ ID NO:298 > SEQ ID NO:42.
Petição 870170009999, de 15/02/2017, pág. 417/1247
408/788
Exemplo 10 [00764] Comparação da produção de monatina total e a distribuição de isômeros para os polipeptídeos com atividade de aldolase das SEQ ID NO:116, SEQ ID NO:76, SEQ ID NO:44, SEQ ID NO:148, SEQ ID NO:46, SEQ ID NO:134, SEQ ID NO:74, SEQ ID NO:126, SEQ ID NO:102, SEQ ID NO:58, SEQ ID NO:88, SEQ ID NO:50, SEQ ID NO:106, SEQ ID NO:304, SEQ ID NO:300 e SEQ ID NO:28.
[00765] A enzima recombinante produzida no Exemplo 7 foi utilizada em reações de acoplamento com HMG aldolases para produzir monatina partindo de D-triptofano e piruvato como descrito no Pedido de Patente U.S. Publicado N°20050282260. O polipeptídeo com atividade de aldolase da SEQ ID NO:28 foi utilizado como uma referência nestes ensaios e foi purificado como descrito no Exemplo 8.
[00766] Para produzir quantidades de teste de cada aldolase, culturas de 25 mL foram crescidas em meio LB contendo ampicilina (100 pg/mL), até uma DO600 de aproximadamente 0,5. As culturas foram induzidas com 1 mM de IPTG. As células foram transferidas para 30Ό e foram cultivadas durante a noite. Os extratos celulares foram preparados de acordo com os protocolos do fabricante (Novagen, Madison, Wl, reagente Bugbuster). A benzonuclease também foi adicionada. As proteínas solúveis nos extratos celulares foram separadas em uma Bio-Rad Laboratories Experion Automated Electrophoresis Station (Bio-Rad, Hercules, CA) e analisadas em relação à concentração e à porcentagem de expressão utilizando o Experion Software versão 1.1.98.0.
[00767] Os seguintes foram adicionados por 1 mL de mistura de reação: aproximadamente 50 pg de aldolase (fornecida em extratos celulares a não ser que seja citado de outra maneira), 4 mM de MgCI2, 50 mM de D-triptofano, 0,5 mg de D-aminotransferase purificada de B. sphaericus, 200 mM de piruvato de sódio, 100 mM de tampão de fosPetição 870170009999, de 15/02/2017, pág. 418/1247
409/788 fato de potássio pH 7,5 e 0,05 mM de PLP. O ditiotreitol (DTT) foi adicionado (concentração final de 2 mM) às amostras citadas abaixo. Os experimentos foram corridos em duplicata. As amostras foram incubadas 2 h e durante a noite (20 horas) a 30Ό com agitação suave. A média dos resultados é mostrada abaixo. Os únicos estereoisômeros detectados quando a monatina é produzida utilizando estes métodos são R,R e S,R. A porcentagem de R,R é listada abaixo e foi determinada através da área do pico de LC em fase inversa.
Tabela 13: Monatina total produzida partindo de D-triptofano e % de R,R
Aldolase (ponto de tempo) Monatina total (ppm) % de R,R monatina
SEQ ID NO:116 (2 h) 34,5 97
SEQ ID NO:116 (18 h) 99 95
SEQ ID NO:76 (2 h) 40 76
SEQ ID NO:76 (18 h) 112 67
SEQ ID NO:44 (2 h) 32,5 97
SEQ ID NO:44 (18 h) 93,5 94
SEQ ID NO:148 (2 h) 31,5 94
SEQ ID NO:148 (18 h) 98 89
SEQ ID NO:46 (2 h) 42,5 84
SEQ ID NO:46 (18 h) 169 72
SEQ ID NO:134 (2 h) 43,5 92
SEQ ID NO:134 (18 h) 113 86
SEQ ID NO:74 (2 h) 23,5 96
SEQ ID NO:74 (18 h) 78,5 92
SEQ ID NO:126 (2 h) 18 94
SEQ ID NO:126 (18 h) 72 92
SEQ ID NO:102 (2 h) 1 0
SEQ ID NO:102 (18 h) 4,5 91
SEQ ID NO:58 (2 h) 23 92
SEQ ID NO:58 (18 h) 122 88
SEQ ID NO:88 (2 h) 57,5 74
Petição 870170009999, de 15/02/2017, pág. 419/1247
410/788
Aldolase (ponto de tempo) Monatina total (ppm) % de R,R monatina
SEQ ID NO:88 (18 h) 200,5 64
SEQ ID NO:50 (2 h) 32,5 99
SEQ ID NO:50 (18 h) 131,5 97
SEQ ID NO:106 (2 h) 4,5 78
SEQ ID NO:106 (18 h) 20 95
SEQ ID NO:304 (2 h) 0 0
SEQ ID NO:304 (18 h) 0,45 55
SEQ ID NO:304 DTT (2 h) 0 0
SEQ ID NO:304 DTT (18 h) 0,55 53
SEQ ID NO:300 (2 h) 0,85 34
SEQ ID NO:300 (18 h) 5,5 36
SEQ ID NO:300 DTT (2 h) 1,5 55
SEQ ID NO:300 DTT (18 h) 9 40
SEQ ID NO:28 (2 h) 25 99
SEQ ID NO:28 (18 h) 69 97
[00768] Os números de produção de monatina total variavam de 1 ppm até mais de 200 ppm e a % de R,R variava de 0% até 99%. Devido ao fato de que a aminotransferase era a mesma para todas as aldolases, a alteração da aldolase pode ter um impacto significativo tanto sobre a quantidade de monatina produzida quanto a distribuição dos estereoisômeros da monatina produzida. O DTT (como nas amostras abaixo) parecia aumentar a quantidade de monatina total produzida. [00769] Os mesmos experimentos que os anteriores foram feitos utilizando o L-triptofano como o substrato de partida e acoplando as aldolases (fornecidas na forma de extrato celular) com Laminotransferase de especificidade ampla HexAspC parcialmente purificada (0,5 mg de HexAspC). A média dos resultados (de duplicatas) é mostrada abaixo na Tabela 14 para a produção de monatina total (subtraindo os níveis de fundo sem aldolase presente) e a porcentagem de
S,S monatina é mostrada com base na área do pico de LC em fase inversa. Os números acima de 400 ppm estão fora da faixa linear da
Petição 870170009999, de 15/02/2017, pág. 420/1247
411/788 curva padrão e são aproximações. O polipeptídeo purificado com atividade de aldolase da SEQ ID NO: 28 foi utilizado como um referência. Os polipeptídeos com atividade de aldolase das SEQ ID NO: 304 e SEQ ID NO: 300 (derivados de plantas) foram utilizados com e sem 2 mM de DTT. Shannon e Marcus (The Journal of Biological Chemistry 237: 3342-3347, 1962) utilizaram mercaptoetanol como um agente redutor na purificação original de uma HMG aldolase de amendoim.
Tabela 14: Monatina total produzida partindo de L-triptofano e % de
S,S
Aldolase (ponto de tempo) Monatina total (ppm) % de S,S monatina
SEQ ID NO:116 (2 h) 129 47,9
SEQ ID NO:116 (21 h) 207 56,4
SEQ ID NO:76 (2 h) 949 90,6
SEQ ID NO:76 (21 h) 1181 89,0
SEQ ID NO:44 (2 h) 128 55,0
SEQ ID NO:44 (21 h) 237 61,7
SEQ ID NO:148 (2 h) 199 71,5
SEQ ID NO:148 (21 h) 358 74,4
SEQ ID NO:46 (2 h) 346 79,3
SEQ ID NO:46 (21 h) 757 83,3
SEQ ID NO:134 (2 h) 215 69,2
SEQ ID NO:134 (21 h) 370 74,1
SEQ ID NO:74 (2 h) 75 51,4
SEQ ID NO:74 (21 h) 137 58,8
SEQ ID NO:126 (2 h) 47 56,7
SEQ ID NO:126 (21 h) 113 56,7
SEQ ID NO:102 (2 h) mesmo que o controle n/a
SEQ ID NO:102 (21 h) 11,5 61,1
SEQ ID NO:58 (2 h) 113 71,9
SEQ ID NO:58 (21 h) 351 75,5
SEQ ID NO:88 (2 h) 852 90,1
SEQ ID NO:88 (21 h) 1352 88,8
Petição 870170009999, de 15/02/2017, pág. 421/1247
412/788
Aldolase (ponto de tempo) Monatina total (ppm) % de S,S monatina
SEQ ID NO:50 (2 h) 62 30,8
SEQ ID NO:50 (21 h) 145 38,6
SEQ ID NO:106 (2 h) 3,5 31,0
SEQ ID NO:106 (21 h) 45 34,4
SEQ ID NO:304 (2 h) mesmo que o controle n/a
SEQ ID NO:304 + DTT (2 h) 1 n/a
SEQ ID NO:304 (21 h) mesmo que o controle n/a
SEQ ID NO:304 + DTT (21 h) 10 n/a
SEQ ID NO:300 (2 h) 73 75,2
SEQ ID NO:300 + DTT (2 h) 121 83
SEQ ID NO:300 (21 h) 91 63,6
SEQ ID NO:300 + DTT (21 h) 197 71,6
SEQ ID NO:28 (2 h) 55 35,1
SEQ ID NO:28 (21 h) 87 40,4
Exemplo 11
Efeito do Ditiotreitol (DTT) sobre a produção de monatina [00770] Várias das enzimas no Exemplo 10 foram escolhidas para estudo adicional. As aldolases derivadas de plantas exibiam melhoria após a adição de DTT como um agente redutor. É observado que as aldolases derivadas de microorganismos provenientes de várias amostras ambientais também contêm uma alta porcentagem de resíduos de cisteína. Portanto, experimentos adicionais foram realizados para observar se o DTT aumentava a produção de monatina para as aldolases sem ser vegetais também.
[00771] Os seguintes foram adicionados por 1 mL de mistura de reação: aproximadamente 50 pg de aldolase (fornecida em extratos celulares a não ser que seja citado de outra maneira), 4 mM de MgCI2, 50 mM de D-triptofano, 2 mg de AT-103, 200 mM de piruvato de sódio, 100 mM de tampão de fosfato de potássio pH 7,5 e 0,05 mM de PLP.
Petição 870170009999, de 15/02/2017, pág. 422/1247
413/788
O ditiotreitol foi adicionado (concentração final de 2 mM) às amostras citadas abaixo. Os experimentos foram corridos em duplicata. As amostras foram incubadas 2 h a 30Ό com agitação suave. A média dos resultados é mostrada abaixo para a monatina total que é determinada por LC/MS/MS, com a produção de monatina de fundo (controle sem aldolase) subtraída.
Tabela 15: Monatina total produzida partindo de D-triptofano
Aldolase Monatina total (ppm)
SEQ ID NO:116 126
SEQ ID NO:116 + DTT 102
SEQ ID NO:44 107
SEQ ID NO:44 + DTT 103
SEQ ID NO:46 88
SEQ ID NO:46 + DTT 161
SEQ ID NO:58 118
SEQ ID NO:58 + DTT 141
SEQ ID NO:50 243
SEQ ID NO:50 + DTT 170
SEQ ID NO:28 proteína purificada 174
SEQ ID NO:28 + DTT proteína purificada 196
[00772] O controle sem aldolase produziu 10 ppm de monatina total com e sem DTT, indicando que o DTT não estava afetando a reação geral através da redução de subprodutos e não estava afetando a atividade da D-aminotransferase. Todos os polipeptídeos com atividade de aldolase das SEQ ID NO: 46, SEQ ID NO: 58 e SEQ ID NO: 28 exibiam um benefício proveniente da adição de DTT. O polipeptídeo com atividade de aldolase da SEQ ID NO: 46 exibia o melhor benefício, atividade aproximadamente 1,8 vez maior com 2 mM de DTT. Dois polipeptídeos com atividade de aldolase parecem ter sido inibidos pelo DTT (SEQ ID NO: 116 e SEQ ID NO: 50) enquanto não foi observado qualquer efeito, dentro do erro experimental, para o polipeptídeo com atividade de aldolase da SEQ ID NO: 44. Entretanto, é possível que
Petição 870170009999, de 15/02/2017, pág. 423/1247
414/788 para cada aldolase utilizada haja uma concentração ótima de DTT com a finalidade de detectar um benefício de fornecer o agente redutor. [00773] O polipeptídeo com atividade de aldolase da SEQ ID NO: 88 foi escolhido para estudar o efeito da concentração de DTT sobre a produção de monatina. As reações acopladas foram realizadas como anteriormente. Os resultados são representados graficamente na figura 15. A concentração ótima de DTT neste ensaio ficava entre 2,5 e 5 mM, para a quantidade de aldolase adicionada. De forma interessante, se não fosse adicionado DTT, a quantidade de monatina produzida era quase tão alta quanto com 2,5 mM de DTT, mas a adição de quantidades subótimas de DTT (0,5-1 mM) realmente parece ser inibidora, assim como a adição de muito DTT (20 mM).
Exemplo 12 [00774] Comparação da produção de monatina total e a distribuição de isômeros para os polipeptídeos com atividade de aldolase das SEQ ID NO:278, SEQ ID NO:162, SEQ ID NO:276, SEQ ID NO:178, SEQ
ID NO:202, SEQ ID NO:166, SEQ ID NO:218, SEQ ID NO:224, SEQ
ID NO:226, SEQ ID NO:244, SEQ ID NO:250, SEQ ID NO:252, SEQ
ID NO:264, SEQ ID NO:268, SEQ ID NO:272, SEQ ID NO:184, SEQ
ID NO:282, SEQ ID NO:186, SEQ ID NO:192, SEQ ID NO:200, SEQ
ID NO:280, SEQ ID NO:284, SEQ ID NO:172, SEQ ID NO:180, SEQ
ID NO:168, SEQ ID NO:228, SEQ ID NO:236, SEQ ID NO:238, SEQ
ID NO:240, SEQ ID NO:270, SEQ ID NO:156 e SEQ ID NO:28 [00775] A enzima recombinante produzida no Exemplo 7 foi utilizada em reações acopladas com HMG aldolases para produzir monatina partindo de D-triptofano e piruvato como descrito no Pedido de Patente U.S. Publicado N°20050282260. O polipeptídeo com atividade de aldolase da SEQ ID NO: 28 foi utilizado como uma referência nestes ensaios e foi purificado como descrito no Exemplo 8.
[00776] Para produzir quantidades de teste de cada aldolase, cultuPetição 870170009999, de 15/02/2017, pág. 424/1247
415/788 ras de 25 mL foram crescidas em meio LB contendo ampicilina (100 pg/mL), até uma D06oo de aproximadamente 0,5. As culturas foram induzidas com 1 mM de IPTG. As células foram transferidas para 30Ό e foram cultivadas durante a noite. Os extratos celulares foram preparados utilizando o reagente Bugbuster de acordo com os protocolos do fabricante (Novagen, Madison, Wl). A benzonuclease também foi adicionada. As proteínas solúveis nos extratos celulares foram separadas em uma Bio-Rad Laboratories Experion Automated Electrophoresis Station (Bio-Rad, Hercules, CA) e analisadas em relação à concentração e à porcentagem de expressão utilizando o Experion Software versão 1.1.98.0.
[00777] Os seguintes foram adicionados por 1 mL de mistura de reação: aproximadamente 200 pg dos polipeptídeos com atividade de aldolase das SEQ ID NO: 278, SEQ ID NO: 162, SEQ ID NO: 276, SEQ ID NO: 178, SEQ ID NO: 202, SEQ ID NO: 166, SEQ ID NO: 218,
SEQ ID NO: 224, SEQ ID NO: 226, SEQ ID NO: 244, SEQ ID NO: 250,
SEQ ID NO: 252, SEQ ID NO: 264, SEQ ID NO: 268, SEQ ID NO: 272,
SEQ ID NO: 184, SEQ ID NO: 282, SEQ ID NO: 186, SEQ ID NO: 192 e SEQ ID NO: 200 ou 50 pg do polipeptídeo com atividade de aldolase das SEQ ID NO: 280, SEQ ID NO: 284, SEQ ID NO: 172, SEQ ID NO: 180, SEQ ID NO: 168, SEQ ID NO: 228, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 270 e SEQ ID NO: 156 (fornecidos em extratos celulares a não ser que seja citado de outra maneira), 4 mM de MgCI2, 50 mM de D-triptofano, 0,5 mg de D-aminotransferase purificada de B. sphaericus, 200 mM de piruvato de sódio, 100 mM de tampão de fosfato de potássio pH 7,5 e 0,05 mM de PLP. Os experimentos foram corridos em duplicata. As amostras foram incubadas 2 h e durante a noite (20 horas) a 30Ό com agitação su ave. A média dos resultados é mostrada abaixo. Os únicos estereoisómeros detectados quando a monatina é produzida utilizando estes métodos são R,R e
Petição 870170009999, de 15/02/2017, pág. 425/1247
416/788
S,R. A porcentagem de R,R é listada abaixo e foi determinada através da área de pico de LC em fase inversa.
Tabela 16: Monatina total produzida partindo de D-triptofano e % de R,R
Aldolase (ponto de tempo) Monatina total (ppm) % de R,R monatina
SEQ ID NO:278 (1 h) 11,35 100
SEQ ID NO:278 (18 h) 282,15 96
SEQ ID NO:162 (1 h) 19,35 100
SEQ ID NO:162 (18 h) 277,9 98
SEQ ID NO:276 (1 h) 27,2 100
SEQ ID NO:276 (18 h) 421 98
SEQ ID NO:178 (1 h) 24,8 98
SEQ ID NO:178 (18 h) 394,25 94
SEQ ID NO:202 (1 h) 0 0
SEQ ID NO:202 (18 h) 19,2 91
SEQ ID NO:166 (1 h) 42,8 89
SEQ ID NO:166 (18 h) 601,25 71
SEQ ID NO:218 (1 h) 15,6 99
SEQ ID NO:218 (18 h) 456,05 96
SEQ ID NO:224 (1 h) 19,7 98
SEQ ID NO:224 (18 h) 406,55 93
SEQ ID NO:226 (1 h) 41,3 95
SEQ ID NO:226 (18 h) 460,15 84
SEQ ID NO:244 (1 h) 11,6 99
SEQ ID NO:244 (18 h) 168,3 98
SEQ ID NO:250 (1 h) 20,25 95
SEQ ID NO:250 (18 h) 289,25 89
SEQ ID NO:252 (1 h) 48,4 81
SEQ ID NO:252 (18 h) 335,8 73
SEQ ID NO:264 (1 h) 31,65 82
SEQ ID NO:264 (18 h) 252,35 77
SEQ ID NO:268 (1 h) 12,95 98
SEQ ID NO:268 (18 h) 252,55 95
Petição 870170009999, de 15/02/2017, pág. 426/1247
417/788
Aldolase (ponto de tempo) Monatina total (ppm) % de R,R monatina
SEQ ID NO:272 (1 h) 13,8 98
SEQ ID NO:272 (18 h) 165,8 98
SEQ ID NO:184 (1 h) 19,55 96
SEQ ID NO:184 (18 h) 221,85 94
SEQ ID NO:282 (1 h) 29,75 95
SEQ ID NO:282 (18 h) 399,05 91
SEQ ID NO:186 (1 h) 14,4 94
SEQ ID NO:186 (18 h) 116,15 93
SEQ ID NO:192 (1 h) 17,1 97
SEQ ID NO:192 (18 h) 131,25 97
SEQ ID NO:200 (1 h) 32,1 97
SEQ ID NO:200 (18 h) 331,05 94
SEQ ID NO:28 (1 h) (200pg) 32,1 100
SEQ ID NO:28 (18 h) (200pg) 111,45 99
SEQ ID NO:280 (1 h) 0 n/a
SEQ ID NO:280 (18 h) 3,25 61
SEQ ID NO:284 (1 h) 2,3 100
SEQ ID NO:284 (18 h) 55,35 98
SEQ ID NO:172 (1 h) 12,75 99
SEQ ID NO:172 (18 h) 205,9 96
SEQ ID NO:180 (1 h) 38,7 93
SEQ ID NO:180 (18 h) 310,9 75
SEQ ID NO:168 (1 h) 28 98
SEQ ID NO:168 (18 h) 301,1 90
SEQ ID NO:228 (1 h) 39,2 99
SEQ ID NO:228 (18 h) 367 95
SEQ ID NO:236 (1 h) 14,85 96
SEQ ID NO:236 (18 h) 250,05 90
SEQ ID NO:238 (1 h) 30,05 97
SEQ ID NO:238 (18 h) 466,15 90
Petição 870170009999, de 15/02/2017, pág. 427/1247
418/788
Aldolase (ponto de tempo) Monatina total (ppm) % de R,R monatina
SEQ ID NO:240 (1 h) 2,65 100
SEQ ID NO:240 (18 h) 51,55 96
SEQ ID NO:270 (1 h) 12,2 91
SEQ ID NO:270 (18 h) 214,3 83
SEQ ID NO:156 (1 h) 62,5 88
SEQ ID NO:156 (18 h) 623,9 71
SEQ ID NO:28 (1 h) (50 pg) 31,3 98
SEQ ID NO:28 (18 h) (50 M9) 444,25 97
[00778] Os números de produção de monatina total variavam de não detectáveis até mais de 600 ppm e a % de R,R variava de 61% até 100%. Devido ao fato de que a aminotransferase era a mesma para todas as aldolases, a alteração da aldolase pode ter um impacto significativo tanto sobre a quantidade de monatina produzida quanto sobre a distribuição de estereoisômeros da produzida.
[00779] Os mesmos experimentos que os anteriores foram feitos utilizando o L-triptofano como o substrato de partida e acoplando as aldolases (fornecidas na forma de extrato celular) com Laminotransferase de especificidade ampla HexAspC produzida e purificada como descrito no Pedido de Patente U.S. Publicado N° 20050282260 (0,5 mg de proteína purificada). Os resultados são mostrados abaixo na Tabela 17 para a produção de monatina total (subtraindo os níveis de fundo sem aldolase presente) e a porcentagem de S,S monatina é mostrada com base na área do pico de LC em fase inversa. Os números acima de 400 ppm estão fora da faixa linear da curva padrão e são aproximações. A Tabela 12 mostra os resultados para a enzima específica a R de referência, o polipeptídeo com atividade de aldolase da SEQ ID NO: 28, que foi analisado ao mesmo tempo.
Tabela 17: Monatina total produzida partindo de L-triptofano e % de
Petição 870170009999, de 15/02/2017, pág. 428/1247
419/788
S,S
Aldolase (ponto de tempo) Monatina total (ppm) % de S,S monatina (área do pico de LC em Fase Inversa) % de S,S monatina (derivatização com FDAA)
SEQ ID NO:278 (1 h) 14,6 21,0 n/a
SEQ ID NO:278 (durante a noite) 7905 24,6 n/a
SEQ ID NO:162 (1 h) 14 15,4 n/a
SEQ ID NO:162 (durante a noite) 105,6 17,3 n/a
SEQ ID NO:276 (1 h) 35,8 10,2 n/a
SEQ ID NO:276 (durante a noite) 67,8 9 15,1
SEQ ID NO:218 (1 h) 11,7 20,3 n/a
SEQ ID NO:218 (durante a noite) 49,9 17,7 22,0
SEQ ID NO:244 (1 h) 6,2 18,0 n/a
SEQ ID NO:244 (durante a noite) 24,4 14,7 19,6
SEQ ID NO:268 (1 h) 6,3 24,1 n/a
SEQ ID NO:268 (durante a noite) 61,2 23,3 29,2
SEQ ID NO:272 (1 h) 5,7 20,5 n/a
SEQ ID NO:272 (durante a noite) 43,6 19,9 22,9
SEQ ID NO:192 (1 h) 6,8 19,0 n/a
Petição 870170009999, de 15/02/2017, pág. 429/1247
420/788
Aldolase (ponto de tempo) Monatina total (ppm) % de S,S monatina (área do pico de LC em Fase Inversa) % de S,S monatina (derivatização com FDAA)
SEQ ID NO:192 (durante a noite) 56,4 20,0 24,4
SEQ ID NO:172 (1 h) 29,9 35,6 n/a
SEQ ID NO:172 (durante a noite) 184,2 42,4 45,6
SEQ ID NO:228 (1 h) 59,6 23,9 n/a
SEQ ID NO:228 (durante a noite) 182 35,6 38,0
Exemplo 13
Produção de monatina partindo de indol-3-piruvato utilizando uma Daminotransferase [00780] A transaminase AT-103 fazia parte de uma biblioteca de transaminases obtida na BioCatalytics (Pasadena, CA) e a enzima foi testada em relação à produção de monatina em reações acopladas utilizando a aldolase ProA de C. testosteroni. A aldolase foi preparada como descrito na WO 03/091396 A2. A AT-103 é uma D-transaminase de especificidade ampla (E.C. 2,6.1.21) proveniente de uma espécie de Bacillus que requer um D-aminoácido (tal como D-glutamato, Daspartato ou D-alanina) como o doador de aminoácido. As enzimas e os componentes/substratos adicinais foram adicionados diretamente no tampão de reação fornecido no kit, que continha 100 mM de tampão de fosfato de potássio pH 7,5, 100 mM de doador de amino e 0,1 mM de PLP. A um ml_ de tampão de reação foram adicionados: 4 mg de indol-3-piruvato, 20 mg de piruvato, aproximadamente 50 pg de ProA fornecidos em um extrato celular, 1 μL de 2 M de MgCI2 e 2 mg de enzima aminotransferase. As reações foram realizadas em duplicata. As reações foram incubadas durante a noite a 30Ό com agitação
Petição 870170009999, de 15/02/2017, pág. 430/1247
421/788 suave (100 rpm). As amostras foram filtradas e submetidas à análise de LC/MS/MS em fase inversa como descrito no Exemplo 1. Os resultados indicavam que aproximadamente 370 pg/mL de monatina eram produzidos utilizando a enzima AT-103. Os resultados foram adicionalmente analisados para determinar as proporções de S,R/R,S versus R,R/S,S monatina, com base nas áreas de pico dos dois conjuntos de estereoisômeros que são resolvidos durante a separação cromatográfica. Da monatina total produzida por AT-103, 69% eram R,R/S,S monatina em comparação com os isômeros misturados. Esta enzima é homóloga à enzima DAT de Bacillus subtilis descrita na WO 03/091396 A2, que é conhecida como possuindo uma especificidade ampla por D-aminoácidos. A análise quiral foi realizada utilizando a metodologia de FDAA descrita no Exemplo 1, que verificava se a Daminotransferase estava produzindo predominantemente R,R monatina e alguma S,R monatina como esperado. Experimentos de transaminação adicionais com S,S monatina ou com R,R monatina e acetoglutarato como substratos verificaram que a enzima da BioCatalytics era altamente seletiva para a configuração D no carbono 4, como esperado. Nestes experimentos, não foi detectado glutamato na reação com S,S monatina e α-cetoglutarato como substratos.
[00781] Para aumentar a quantidade de S,S monatina ou de R,S monatina produzida como subprodutos em reações acopladas com AT-103 (a D-transaminase de faixa ampla) e a aldolase ProA, a aldolase foi purificada utilizando cartuchos His-Bind, seguindo os protocolos do fabricante (Novagen, Madison, Wl). A enzima purificada preferencialmente não deve conter atividades de L-aminotransferase do tipo selvagem que podem estar presentes em extratos celulares (tais como as atividades de AspC ou de TyrB nativas de E. coli). O eluente de His-Bind foi dessalinizado para remover imidazol utilizando colunas PD-10 (G25 Sephadex, GE Healthcare, Piscataway, NJ) e foi eluído
Petição 870170009999, de 15/02/2017, pág. 431/1247
422/788 em 50 mM de Tris-CI, pH 7. Os experimentos foram realizados em duplicata em um volume de 1 mL e continham 100 mM de tampão TrisCI, pH 7,8, 50 pg de aldolase ProA, 4 mg de indol-3-piruvato, 1 ou 2 mg de D-aminotransferase, 200 mM de piruvato de sódio, 2 mM de MgCI2, 3 mM de fosfato de potássio, 0,1 mM de PLP e 14,7 mg de Dglutamato. Os tubos foram incubados a 30Ό com agitação suave. Pontos de tempo de duas horas foram tirados e congelados imediatamente a -20Ό. O pH foi ajustado em duas horas de 5 até entre 7-8 utilizando NaOH e os ensaios foram incubados durante a noite. As amostras foram filtradas e analisadas em relação à monatina como descrito no Exemplo 1. As amostras de duas horas não tinham quantidades detectáveis de monatina, provavelmente por causa do pH baixo. As amostras durante a noite continham aproximadamente 190 ng/mL de monatina quando 1 mg de D-aminotransferase era utilizado e aproximadamente 84% eram R,R monatina e 16% eram S,R monatina. Quando 2 mg de D-aminotransferase foram utilizados, 540 ng/mL de monatina foram produzidos, aproximadamente 71% eram R,R monatina.
[00782] Experimentos similares foram realizados utilizando o tampão BioCatalytics Aminotransferase (BioCatalytics, Pasadena, CA), que continha 100 mM de fosfato de potássio pH 7,5, 0,1 mM de PLP e 100 mM de D-glutamato. O indol-3-piruvato sólido e a Daminotransferase foram adicionados como anteriormente. A aldolase ProA (50 pg), MgCI2 e 50 mM de piruvato foram adicionados partindo de soluções estoque. Os ensaios foram tratados como anteriormente, embora nenhum ajuste de pH fosse necessário neste caso. Um controle negativo foi feito apenas com a enzima e o tampão fornecidos pela BioCatalytics, que não continham monatina. Os resultados experimentais são mostrados na Tabela 18.
Petição 870170009999, de 15/02/2017, pág. 432/1247
423/788
Tabela 18: Produção de Monatina partindo de lndol-3-Piruvato em Tampão de Fosfato
Mg D-aminotransferase Tempo (h) Monatina total (ng/mL) % de R,R
0 2 0 n/a
1 2 6780 não-determinada
2 2 13170 55%
0 16 0 n/a
1 16 15000 não-determinada
2 16 28930 51%
[00783] A produção de monatina em tampão de fosfato é claramente maior que em sistemas tamponados com Tris.
[00784] Para comparar as atividades da DAT de B. subtilis clonada do WO 03/091396 A2 com a enzima da BioCatalytics (AT-103) (BioCatalytics, Pasadena, CA), ensaios adicionais foram realizados. O gene dat de B. subtilis foi também subclonado em pET30a para remover His-6 tag. A enzima sem marcação e com marcação foi produzida em BL21(DE3), como descrito na WO 03/091396 A2. Os extratos celulares foram produzidos e os ensaios de proteína total foram realizados para estimar a concentração de proteína como descrito anteriormente. Foram realizadas reações de um mL em duplicata que continham: 500 pg de D-aminotransferase, 50 pg de aldolase ProA, 100 mM de fosfato de potássio pH 7,5, 3 mM de MgCI2, 4 mg de indol-3-piruvato, 200 mM de piruvato de sódio, 7,35 mg (50 mM) de D-glutamato e 0,1 mM de PLP. As amostras foram incubadas a 30G durante 1 h, 2 h e durante a noite e foram filtradas para a análise de LC/MS/MS. As amostras continha apenas os estereoisômeros S,R e R,R de monatina, como determinado através do protocolo de derivatização com FDAA descrito no Exemplo 1. Os resultados estão resumidos na Tabela 19 abaixo. A % de R,R foi determinada através das áreas de pico que foram separadas por cromatografia em fase inversa.
Petição 870170009999, de 15/02/2017, pág. 433/1247
424/788
Tabela 19: Comparação de enzimas D-aminotransferases
Enzima Tempo (h) Monatina (ppb) % de RR monatina
DAT-HIS de B. sub 1 512 não-determinada
DAT sem marcação de B. sub 1 1056 não-determinada
AT-103 da BioCatalytics 1 2353 não-determinada
DAT-HIS de B. sub 2 894 -80-90%
DAT sem marcação de B. sub 2 1913 -80%
AT-103 da BioCatalytics 2 6887 92,5%
DAT-HIS de B. sub 16 3014 31
DAT sem marcação de B. sub 16 5612 33
AT-103 da BioCatalytics 16 16131 66
[00785] A remoção da HIS-6 tag parece ter aumentado a atividade da D-aminotransferase de B. subtil is; entretanto, o homólogo da Daminotransferase da BioCatalytics claramente possuía a maior atividade. O homólogo da D-aminotransferase da BioCatalytics também exibia maior especificidade pelo substrato para o precursor de monatina R. Tempos de incubação maiores parecem reduzir o excesso enanciomérico de R,R monatina que é produzido.
[00786] Devido ao fato de que as enzimas D-aminotransferases de Bacillus possuem uma preferência por piruvato como um receptor de amino e D-alanina como um doador de amino, era esperado que a Dalanina pudesse ser utilizada como o doador de amino para a conversão de MP em monatina com resultados similares ou melhores. Foram realizadas reações de um mL em duplicata que continham: 500 pg de D-aminotransferase, 50 pg de aldolase ProA purificada, 100 mM de fosfato de potássio pH 7,5, 3 mM de MgCI2, 4 mg de indol-3-piruvato, 100 mM de piruvato de sódio, 25 mM de D-glutamato ou D-alanina e 0,1 mM de PLP. As amostras foram incubadas durante 2 horas e tratadas como anteriormente antes da análise. Quando a D-alanina foi utilizada como o doador de amino, níveis ligeiramente maiores de moPetição 870170009999, de 15/02/2017, pág. 434/1247
425/788 natina foram produzidos (23 versus 21 ppm) como esperado. Adicionalmente, é esperado que concentrações altas de piruvato possam inibir a estapa de transaminação, assim a dosagem em quantidades menores de piruvato ao longo do tempo pode aumentar a taxa geral de produção de monatina. Pode ser observado partindo dos dados anteriores que muito embora a metade do piruvato tenha sido utilizada neste caso comparado com a tabela anterior, significativamente mais monatina foi produzida. A AT-103 é um exemplo de uma enzima com atividade limitada para S-MP. Muito embora a aldolase ProA utilizada neste estudo produza mais de 90-95% de S-MP, a AT-103 produz até 92% de R,R monatina.
Exemplo 14
Produção de R,R monatina partindo de D-triptofano [00787] Os seguintes foram adicionados por 1 mL de mistura de reação: aproximadamente 60 pg de aldolase ProA de C. testosteroni (fornecida em extratos celulares, como descrito na WO 03/091396 A2), 4 mM de MgCI2, 50 mM de D-triptofano, 0,5 mg de D-aminotransferase da BioCatalytics (AT-103) (BioCatalytics, Pasadena, CA), 100 mM de piruvato de sódio, 100 mM de tampão de fosfato de potássio pH 7,5 ou 100 mM de tamão de acetato de sódio pH 8, 0,05 mM de PLP, 3 mM de fosfato de potássio (apenas nas reações com acetato) e 10 mM de α-cetoglutarato. Os experimentos foram corridos em duplicata, com controles negativos em que não era adicionada aldolase. As amostras foram incubadas durante a noite (20 horas) a 30Ό com agitação suave. O pH real das amostras com acetato de sódio era de aproximadamente 5, enquanto que o pH final para as amostras com tampão de fosfato era de aproximadamente 7. Nenhuma das aldolases parecia ter atividade significativa em pH 5, a amostra contendo aldolase ProA estava ligeiramente acima do controle negativo, mas provavelmente não estava acima do erro experimental. Em fosfato de potássio, a aldolase
Petição 870170009999, de 15/02/2017, pág. 435/1247
426/788
ProA produziu 73,4 ppm de monatina com uma proporção de R,R:S,R de 1,7:1 (~63% de R,R partindo de D-triptofano).
[00788] Devido ao fato de que as enzimas D-aminotransferases de Bacillus possuem uma preferência por piruvato como um receptor de amino e D-alanina como um doador de amino, era esperado que a adição de alfa-cetoglutarato era desnecessária quando R,R ou S,R monatina era produzida partindo de D-triptofano. O experimento acima foi repetido (em 100 mM de tampão de fosfato de potássio) utilizando aldolase ProA purificada (50-60 pg) e um tempo de incubação de 2,5 horas. Foram corridos experimentos em duplicata, com e sem alfacetoglutarato. Com 10 mM de alfa-cetoglutarato adicionados, 56,1 ppm de monatina foram formados partindo de D-triptofano (79,5 % de R,R, 20,5% de S,R). Sem alfa-cetoglutarato, 102,5 ppm de monatina foram formados (79% de R,R, 21% de S,R).
Exemplo 15
Triptofano racemase [00789] A R,R-monatina foi produzida utilizando D-aminotransferase e uma aldolase quando o D-triptofano foi utilizado como o material de partida (Exemplo 14). Entretanto, o L-triptofano pode ser um material de partida preferido por várias razões. Por exemplo, o L-triptofano pode ser menos dispendioso e mais facilmente disponível que o Dtriptofano. Esta descrição descreve vários métodos para a obtenção de uma triptofano racemase ativa. Os rendimentos de R,R monatina são maiores através da utilização de uma aldolase específica a R, isto é, uma aldolase que produz preferencial ou seletivamente R-MP. Afigura 3 ilustra um método para a produção de R,R monatina enriquecida de forma estereoisomérica partindo de L-triptofano utilizando um triptofano racemase, uma D-aminotransferase e uma aldolase específica a R. [00790] Uma seleção de uma triptofano racemase é criada através da construção de uma cepa que requeriria uma racemase ativa para
Petição 870170009999, de 15/02/2017, pág. 436/1247
427/788 crescer. Um organismo auxotrófico em relação ao triptofano precisa de uma fonte de L-triptofano quando cultivado em meio mínimo. A suplementação do meio com D-triptofano é uma maneira de selecionar uma racemase que converte o D-triptofano em L-triptofano. Os organismos auxotróficos em relação ao triptofano foram testados em relação ao crescimento em meio mínimo suplementado com D-triptofano. As cepas, CAG18455 e CAG18579 do Coli Genetic Stock Center e NRRL12264 (Também lipA', ADE3 lisogenizada e curada de seu plasmídeo), não crescerem quando suplementadas com D-triptofano, mas cresceram quando suplementadas com L-triptofano. E. coli pode ser utilizado como um organismo hospedeiro, mas outros organismos hospedeiros também podem ser utilizados, tal como levedura, outras bactérias ou outros organismos eucarióticos. Um organismo auxotrófico em relação ao triptofano (especificamente NRRL12264 (também lipA', ADE3 lisogenizada e curada de seu plasmídeo)) crescerá em Dtriptofano quando tiver sido transformado com uma Daminotransferase. Isto confirma a capacidade de E. coli de transportar D-triptofano para dentro da célula.
[00791] Salcher e Lingens descreveram a presença de uma triptofano racemase em Pseudomonas aurereofaciens (ATCC15926). A triptofano racemase também foi descrita em várias plantas incluindo tabaco, beterraba, tomate e trigo e a enzima parece ser induzida por condições de estresse osmótico ou seca. A triptofano racemase pode desempenhar uma função em Sclerochiton ilicifolius na vide de produção de monatina nativa. Para isolar esta atividade de racemase, uma biblioteca de expressão é construída partindo de ATCC15926 (ou um outro organismo com atividade de triptofano racemase) a biblioteca é transformada no organismo auxotrófico em relação ao triptofano. É selecionada uma cepa que crescerá utilizando D-triptofano como a fonte de triptofano. Um método similar é também utilizado para verificar muitas
Petição 870170009999, de 15/02/2017, pág. 437/1247
428/788 cepas com racemases conhecidas para procurar uma racemase com atividade sobre o D-triptofano. Os exemplos incluem: alanina, serina e glutamato racemases (T. Yoshimura e N. Esaki, Amino Acid Racemases: Functions and Mechanisms. Journal of Bioscience e Bioengineering, Vol. 96, No. 2, 103-109, 2003). A alanina racemase é dependente de PLP e foi clonada partindo de Salmonella typhimurium (gene dadB). Outras fontes são Escherichia coli, Bacillus subtilis, Pseudomonas aeruginosa, Vibrio cholerae, Schizosaccaroyces pombe e Bacillus cereus. Um cogumelo basidiomiceto, Lentinus edodes, também codifica uma alanina racemase de atividade ampla. A serina racemase também é dependente de PLP e é encontrada em eucariotos (tal como cDNA do bicho-da-seda, cérebro de rato e cérebro de camundongo) assim como em bactérias (Enterococcus gallinarum). A glutamato racemase é idependente de PLP e foi clonada partindo de Pediococcus pentosaceus, Bacillus pumilus, Lactobacillus fermenti, Lactobacillus brevis, E. coli, Aquifex pyrophilus e Bacillus subtilis. A glutamato racemase é muito específica e, conseqüentemente, mesmo os aminoácidos estruturalmente similares aspartato, asparagina e glutamina não são substratos para a enzima. As aspartato racemases também existem e são independentes de PLP. Estas enzimas são encontradas em cepas de Lactobacilli, Streptococcus e algumas Archaea tais como cepas de Desulfurococcus e Thermococcus. O molusco bivalve Scapharca brouhtonii também contém uma aspartato racemase. Outras racemases encontradas na literatura incluem aminoácido racemase (EC 5.1.1.10) de Anabaena sp. e Pseudomonas striata, prolina racemase, fenilalanina racemase multifuncional. As epimerases ou racemases relacionadas também estão sendo testadas. As racemases potenciais são testadas para ter certeza que não são D-triptofano aminotransferases. Esta verificação é feita através da análise de sequência e/ou de ensaio enzimático.
Petição 870170009999, de 15/02/2017, pág. 438/1247
429/788 [00792] As enzimas que passam no teste como uma racemase são verificadas em relação à atividade sobre a monatina como descrito no Exemplo 17. De forma ideal, pode-se obter uma enzima que é muito específica em relação ao triptofano e possui pouca ou nenhuma atividade de racemase sobre a monatina.
[00793] Uma triptofano racemase também pode ser desenvolvida e/ou melhorada (através de mutagênese ou engenharia recombinante) partindo de uma racemase, uma transaminase ou uma epimerase existente. Adicionalmente, devido ao fato de que são conhecidas as estruturas em cristal das alanina aminotransferases, estas podem ser utilizadas como uma base para a mutagênese racional baseada na estrutura. O processo descrito acima é utilizado como uma seleção inicial em relação à atividade de triptofano racemase e como uma verificação em relação à maior atividade.
Bibliotecas de triptofano racemases
Constructo de Bibliotecas:
[00794] Burkholderia pyrrocina (ATCC15958) e Pseudomonas chlororaphis (ATCC15926) foram obtidas na American Type Culture Collection. Foram cultivadas como recomendado pela ATCC e o DNA genômico foi preparado de acordo com o método de Mekalanos JJ. (Duplication and amplification of toxin genes in Vibrio cholerae. Cell. 1983. 35:253-63). O DNA genômico foi digerido parcialmente com a enzima de restrição Sau3M. Os fragmentos de 1-3 Kpb foram purificados em gel utilizando um Qiagen QIAquick Gel Extraction Kit (Qiagen, Valencia, CA). O DNA purificado foi ligado em pTrc99a (Amersham, Piscataway, NJ) que foi digerido com SamHI e purificado como anteriormente. A ligação foi feita à temperatura ambiente com incubação durante a noite utilizando uma proporção molar de 3:1 de inserto em relação ao vetor. A biblioteca ligada foi transformada em células competentes quimicamente TOP10F' (Invitrogen, Carlsbad, CA) e plaquePetição 870170009999, de 15/02/2017, pág. 439/1247
430/788 ada em meio LB com 100 pg/mL de ampicilina. Após uma incubação durante a noite das placas de transformação, as colônias foram raspadas das placas lavadas com meio LB líquido e um pélete de células de tamanho apropriado foi submetida a uma mini-prep utilizando um Qiagen QIAquick mini-prep kit (Qiagen, Valencia, CA). Aproximadamente 30.000 colônias foram agrupadas e submetidas à mini-prep.
[00795] O plasmídeo agrupado foi tranformado em CAG18455 (trpC83Tn10, rph-1) ou CAG18579 (trpC\\Tn10kan, rph-1). Ambas as cepas são auxotróficas em relação ao triptofano de forma que não crescerão em meio mínimo M9 (Difco) a não ser que o meio seja suplementado com triptofano. Os transformantes foram plaqueados em meio mínimo M9 suplementado com D-triptofano. Este seleciona uma cepa que pode converter D-triptofano em L-triptofano.
[00796] Antes da transformação da biblioteca, as cepas foram testadas em relação ao crescimento em meio mínimo com L- ou Dtriptofano. As cepas foram testadas em relação ao crescimento em meio mínimo suplementado com D-triptofano e não foi observado qualquer crescimento. Ambas as cepas cresciam em meio idêntico suplementado com L-triptofano ao invés de D-triptofano. Adicionalmente, um derivado de NRRL12264 (a cepa utilizada tinha sido curada com o plasmídeo com operon de triptofano, lisogenizada com ADE3 e deletada para lipA, em adição a outras mutações codificadas pelo cromossomo (serB, ktrpED, tnaA2, aroP) (esta cepa não podia crescer em meio mínimo suplementado com D-triptofano, mas crescia em meio idêntico suplementado com L-triptofano ao invés de D-triptofano) foi transformado com uma aminotransferase específica a D de Bacillus subtilis Ç\NO 03/091396). A expressão da D-aminotransferase foi controlada pelo promotor T7. A cepa transformada era capaz de crescer em meio mínimo M9 suplementado com D-triptofano.
[00797] As colônias que crescem no meio com D-triptofano são vePetição 870170009999, de 15/02/2017, pág. 440/1247
431/788 rificadas. O plasmídeo é isolado e transformado novamente não cepa original (CAG18455 ou CAG18579) para confirmar que o crescimento em meio com D-triptofano é dependente do plasmídeo e na de uma mutação do hospedeiro. As sequências de nucleotídeos dos plasmídeos que complementam a auxotrofia em relação ao triptofano são analisadas. Os clones que são determinados como contendo um gene de triptofano racemase são adicionalmente analisados.
[00798] A triptofano racemase de outras fontes de tecido é isolada de uma maneira similar. Há relatos na literatura de atividade de triptofano racemase tanto em células de cultura de tecido de tabaco (Nicotiana tabacum L. var. Wisconsin 38) (Miura, G.A. e Mills, S.E. The convertion of D-tryptophan to L-tryptophan in cell cultures of tobacco. Plant Physiol. 1971. 47:483-487) quanto em extratos de proteína bruta de trigo (Triticum aestivum) (Rekoslavskaya, N.I., Yur'eve, O.V., Shibanova, L.A. e Salyaev, R.K. Synthesis and physiological function of Dtryptophan during wheat germination. Russian J. Plant Physiol. 1997. 44:196-203). Uma biblioteca de expressão de cDNA é produzida partindo de tecido, como descrito na literatura e a biblioteca de expressão é utilizada para transformar um organismo auxotrófico em relação ao triptofano como descrito anteriormente.
Ensaio da Triptofano Racemase [00799] Os clones que são identificados como potencial mente possuindo uma triptofano racemase são transformados em uma cepa de E. coli comumente utilizada para a expressão de proteínas recombinantes, tal como BL21. As células são cultivadas em caldo LB até uma densidade ótica a 600 nm de 0,4-0,6. O promotor que controla a expressão da racemase é induzido com IPTG (concentração final de 0,1 mM). Após a indução, é permitido que as células expressem a proteína durante 1-3 horas a 37Ό (com aeração). As células são coletadas e lisadas através de uma prensa de French, ultra-som ou através de
Petição 870170009999, de 15/02/2017, pág. 441/1247
432/788 meios químicos (tal como BugBuster (Novagen, Madison, Wl)). As células Usadas são centrifugadas para remover os restos celulares. O extrato clarificado é utilizado diretamente nos ensaios.
[00800] Quantidades variáveis do extrato são adicionadas em uma solução de forma que a concentração final seja de 50 mM de fosfato de potássio (pH 7,0) e 2 mM de L-triptofano. O piridoxal-5'-fosfato é adicionado a uma concentração final de 10 μΜ. As amostras são incubadas e então analisadas por LC/MS. A presença de um pico de Dtriptofano quando apenas o L-triptofano é utilizado como um substrato indica um resultado positivo. A concentração de D-triptofano deve aumentar à medida que o tempo avança até que o equilíbrio seja atingido e a taxa deve também aumentar com a concentração de proteína até que a concentração de enzima seja alta o suficiente que não seja mais saturada com o substrato. O D-triptofano também pode ser convertido em L-triptofano como acima.
[00801] Um gene de complementação pode codificar uma Daminotransferase. Um gene de complementação é um gene que, quando expresso, anula uma mutação em um organismo. Por exemplo, se um organismo tiver uma mutação nula em um dos genes necessários para a síntese de triptofano pela célula, um gene de complementação podería ser um que, quando expresso, permite que a cepa cresça em meio mínimo (isto é, sem triptofano). Esta reação requer um alfa-ceto ácido tal como α-cetoglutarato, oxaloacetato ou piruvato como um receptor de amino. Estes compostos provavelmente estarão presentes em um extrato de células (em pequenas quantidades). Estes compostos podem ser removidos utilizando uma coluna de dessalinização PD-10 (GE Healthcare, Piscataway, NJ) e o ensaio pode ainda ser realizado em extrato bruto. A atividade da triptofano racemase é purificada utilizando cromatografia em coluna convencional. Finalmente, o quadro aberto de leitura identificado como uma triptofano racePetição 870170009999, de 15/02/2017, pág. 442/1247
433/788 mase potencial é clonado em um vetor de expressão com uma marcação de afinidade. A triptofano racemase potencial é então purificada através de cromatografia por afinidade. Em qualquer um dos casos a proteína purificada é utilizada em ensaios enzimáticos essencialmente como descrito anteriormente.
Engenharia Genética Inversa de Triptofano Racemase [00802] A triptofano racemase pode ser purificada de fontes vegetais ou microbianas através de técnicas de purificação de proteínas convencionais incluindo o fracionamento em sulfato de amônio e a cromatografia em coluna convencional. Uma vez que a proteína foi purificada de forma que um ponto possa ser isolado em um gel de 2-D, técnicas de microsseqüenciamento de peptídeos ou o seqüenciamento de aminoácidos do tipo Edman convencional é utilizado (vide golgi.harvard.edu/microchem/ para descrições dos protocolos e equipamento utilizados para este tipo de trabalho). Em alguns casos, entretanto, a sequência genômica do organismo não pode ser utilizada como uma fonte da proteína para a purificação de proteína porque tal sequência ainda não foi determinada. Em tal situação, o primeiro conjunto de iniciadores degenerados pode ser planejado com base na sequência disponível do relativo conhecido mais próximo da fonte de proteína. A PCR degenerada e o walking genômico são então realizados de acordo com protocolos estabelecidos para isolar a sequência codificadora da triptofano racemase.
Produção de Monatina por Triptofano Racemase [00803] Os seguintes são adicionados por 1 ml_ de mistura de reação: aproximadamente 60 μg de aldolase ProA de C. testosteroni (fornecida em extratos celulares, como descrito na WO 03/091396 A2), 100 pL/mL de extrato celular de triptofano racemase ou 1 mg/mL de triptofano racemase purificada, 4 mM de MgCI2, 50 mM de L-triptofano, 0,5 mg de D-aminotransferase da BioCatalytics (AT-103) (BioCaPetição 870170009999, de 15/02/2017, pág. 443/1247
434/788 talytics, Pasadena, CA), 100 mM de piruvato de sódio, 100 mM de tampão de fosfato de potássio pH 7,5, 0,05 mM de PLP e 10 mM acetoglutarato. Devido ao fato de que o piruvato é um receptor de amino aceitável para a D-aminotransferase de especificidade ampla, o acetoglutarato é opcional. Os experimentos são corridos em duplicata, com controles negativos em que não foi adicionada aldolase ou não foi adicionada triptofano racemase. As amostras são incubadas ~ 1 hora ou durante a noite (20 horas) a 30Ό com agitação s uave.
[00804] A triptofano racemase é testada em relação à atividade sobre a monatina. Um ensaio similar ao do Exemplo 17 é utilizado com a monatina como um substrato e comparado com a atividade da enzima sobre o triptofano. A enzima ideal possui atividade sobre o triptofano, mas pouca ou nenhuma sobre outros aminoácidos particularmente glutamato e monatina. Se a enzima tiver atividade significativa sobre a monatina, a enzima pode sofrer mutagénese para diminuir a atividade sobre monatina e/ou o glutamato enquanto a atividade sobre o triptofano é inalterada ou mantida em um nível alto o suficiente para que a enzima seja útil na produção de monatina. As técnicas que podem ser utilizadas para a mutagénese incluem, mas não estão limitadas à PCR propensa a erros, à mutagénese direcionada ao sítio, à modelagem para identificar alvos de mutagénese direcionada ao sítio (sítios que podem estar envolvidos na ligação ao substrato), à passagem através de cepas mutagênicas e ao embaralhamento de DNA.
[00805] As racemases que sofreram mutagénese podem ser verificadas em relação à atividade sobre o triptofano utilizando um ensaio de placas como descrito anteriormente. Os clones que mantêm a atividade sobre o triptofano são então verificados em relação a uma perda da atividade sobre a monatina.
Exemplo 16
Mutagénese Direcionada ao Sítio de HEXAspC
Petição 870170009999, de 15/02/2017, pág. 444/1247
435/788
Resumo Experimental [00806] Foi observado que um hexamutante de AspC de E. coli (HEXaspC) possui melhor atividade quando comparado com a AspC durante a produção de S,S monatina como descrito no Exemplo 6 da WO 03/091396 A2. O HEX (número de acesso:/AHFA gi:127190) contém as mutações a seguir partindo de AspC (numeração de E. coli)·. V35L, K37Y, T43I, N64L, T104S e N285S. Com base na análise estrutural e nos relatos da literatura (S. Rothman e J. Kirsch, J. Mol. Biol. (2003), 327, 593-608; S. Rothman e outros, Protein Science (2004), 13: 763-772), foram criados 5 mais mutantes que eram esperados que aumentassem a atividade cinética em direção aos substratos utilizados na vide de produção de monatina: L-triptofano, S-MP ou ambos. Dois dos mutantes aumentaram as taxas de transaminação tanto em relação ao triptofano quanto à S,S monatina. Dois dos mutantes exibiam uma maior estereosseletividade para a formação de S,S monatina enquanto um era menos estereosseletivo. Com base nisso, é esperado que a D-aminotransferase com especificidade ampla proveniente de Bacillus sp. que possui mutações similares seja útil como a Daminotransferase nas vias de R,R monatina mostradas na figura 3 e descritas no Exemplo 15. Um dos mutantes (HEXaspCP9T/R122G) tinha maior atividade em relação à transaminação de L-triptofano, a atividade na produção de S,S monatina ou de transaminação de S,S monatina era diminuída significativamente. Assim, é esperado que esta enzima seja útil na primeira etapa das vias de produção de R,R monatina mostradas nas figuras 1, 2, 4, 5, 6, 7 e 8 e descritas nos Exemplos 18 e 19. Em geral, uma aminotransferase que possui atividade similar à de AspC sobre L-triptofano e atividade limitada sobre R-MP e S-MP seria útil para os processos representados nas figuras 1, 2, 4, 5, 6, 7 e 8.
Métodos e Materiais
Petição 870170009999, de 15/02/2017, pág. 445/1247
436/788 [00807] O gene HEX clonado em pUC19 foi fornecido pelo Professor J. F. Kirsch (Department of Molecular and Cell Biology, University of Califórnia, Berkeley, Berkeley, CA 94720-3206) e utilizado como o molde para a clonagem do gene em pET23a. Vide James J. Onuffer e Jack F. Kirsch, Redesign of the substrate specificity of Escherichia coli aspartate aminotransferase to that of Escherichia coli tyrosine aminotransferase by homology modeling and site-directed mutagenesis, Protein Science, 4: 1750-1757 (1995). Vide também NCBI número de acesso 1AHF A Gl:1127190 (sequência de aminoácidos de HEX). Os iniciadores a seguir foram planejados para a clonagem do gene HEX no vetor pET23a (Novagen, Madison, Wl):
Iniciadores para HEXasoC\
N term: 5'-GCGGAACATATGTTTGAGAACATTACCGCC-3'(SEQ ID NO: 393);
C term: 5'-ATAACCGGATCCTTACAGCACTGCCACAATCG-3' (SEQ ID NO: 394) [00808] O protocolo de PCR a seguir foi utilizado para a amplificação gênica: Em uma reação de 100 pL, 50 ng de molde de DNA, 1,0 μΜ de cada iniciador, 0,2 mM de cada dNTP, 1 U de Pfu Turbo Polymerase (Stratagene, La Jolla, CA) e 1X tampão Cloned Pfu foram adicionados. O programa do termociclador utilizava um início a quente de 94°C durante 5 minutos; seguidos por 25 ciclos de uma etapa de desnaturação a 94°C (30 s), uma etapa de anelamento a 55°C (1 min) e uma etapa de extensão a 72°C (2 min) e finalmente uma etapa de término a 72°C (7 min). Técnicas de biologia molecular padronizadas foram utilizadas para clonar o produto da PCR em pET23a utilizando os sítios de restrição Ndel e BamHI.
[00809] Acredita-se que o resíduo de triptofano na posição 130 é importante para acumular interações como o anel de piridoxila, mas também parece ser uma fonte de impedimento estérico com o substraPetição 870170009999, de 15/02/2017, pág. 446/1247
437/788 to do precursor S de monatina (MP), com base nas observações de modelagem de proteínas. Portanto, um aminoácido com cadeia hidrofóbica menor (fenilalanina) foi utilizado para substituir o triptofano. O resto das mutações se baseava nos dados de cinética na literatura, embora novas combinações de mutações desejáveis fossem criadas. Todas as mutações em HEXaspC, com a exceção de W130F, foram produzidas utilizando o Stratagene Multi-Change kit (Stratagene, La Jolla, CA) seguindo as instruções do fabricante. A mutação W130F foi produzida utilizando o Stratagene QuikChange kit (Stratagene, La Jolla, CA) de acordo com as instruções do fabricante com a única exceção sendo que a temperatura de extensão para a reação de PCR foi diminuída para 66Ό. Os iniciadores para o multi-ch ange kit foram planejados utilizando a ferramenta de planejamento de iniciadores QuikChange multi-kit em www.strataqene.com, exceto para os iniciadores de mutação isolada de W130F.
[00810] As sequências de iniciadores estão listadas abaixo na Tabela 20.
Tabela 20
Iniciador Sequência (5' a 3')
aspCW130F_para trás CGCTCTTATGGTTCGGTTTGCTTGGGTTG CTCACCC (SEQ ID NO:395)
aspCW130F_para frente GGGTGAGCAACCCAAGCTTTCCGAACCAT AAGAGCG (SEQ ID NO:396)
R122G-13 CAAAAAATACCAGCGTTAAGGGAGTGTGG GTGAGCAACC (SEQ ID NO:397)
P9T_4a CATTACCGCCGCTACTGCCGACCCGATTC (SEQ ID NO:398)
I68V-13 CACCAAAAATTACCTCGGCGTAGACGGCA TCCCTGAATT (SEQ ID NO:399)
T156Aa TGATGCGGAAAATCACGCTCTTGACTTCG ATGCAC (SEQ ID NQ:400)
a Significa um iniciador que foi modificado através da fosforilação a 5'
Petição 870170009999, de 15/02/2017, pág. 447/1247
438/788
Expressão de Genes Mutantes HEXaspC e Análise da Atividade Enzimática [00811] Culturas líquidas (5 mL) de Novagen Overnight Express® Autoinduction System 2 (N° de Catálogo 71366-3; soluções 1-6) (Novagen, Madison, Wl) foram inoculadas partindo de placas frescas ou estoques em glicerol congelados das cepas a seguir:
[00812] E. coli BL21(DE3)::HEXaspCpET23a [00813] E. coli BL21(DE3)::HEXaspCW130FpET23a [00814] E. coli BL21(DE3)::HEXaspCT156ApET23a [00815] E. coli BL21(DE3)::HEXaspCP9T/T156ApET23a [00816] E. coli BL21(DE3)::HEXaspCP9T/R122GpET23a [00817] E. coli BL21(DE3)::HEXaspCR122G/T156ApET23a.
[00818] As culturas foram incubadas a 37G a 230 rp m durante 6 8 h. A D06oo de cada cultura foi determinada e o volume de cultura necessário para a obtenção de uma D06oo de 0,03-0,05 em 25 mL foi calculado. Os volumes calculados de cada cultura líquida foram transferidos para frascos contendo 25 mL do mesmo meio. O Overnight Express® Autoinduction System 2 é um meio definido quimicamente completo para expressão em altos níveis com sistemas de expressão que podem ser induzidos com IPTG que utiliza lactose como o agente indutor e não requer monitoramento do crescimento celular. As culturas em Overnight Express foram incubadas a 30G com agitação a 230 rpm durante 18 h. As células foram coletadas por centrifugação e lavadas uma vez com 50 mM de MOPS gelado, pH 7,0. As células foram então Usadas utilizando Bugbuster® (isento de amina primária) Extraction Reagent (Novagen N° de Catálogo 70923-3) (Novagen, Madison, Wl) contendo 1 pL/mL de benzonase nuclease (Novagen N° de Catálogo 70746-3) (Novagen, Madison, Wl), 5 pL/mL de Protease Inhibitor Cocktail Set II (Novagen N° de Catálogo 539132) (Novagen, Madison, Wl) e 0,33 pL/10 mL de r-Lysozyme (Novagen N° de Catálogo 71110Petição 870170009999, de 15/02/2017, pág. 448/1247
439/788
3) (Novagen, Madison, Wl) seguindo o protocolo recomendado pela Novagen. Após a incubação a 25°C durante 15 minutos com agitação suave, os restos celulares de cada suspensão foram peletizados por centrifugação a 21.000 g durante 15 minutos a 4°C. O sobrenadante foi cuidadosamente decantado e analisado como o extrato isento de células. As frações de corpos de inclusão foram isoladas através da suspensão das frações de restos celulares em 30% de Bugbuster® (isento de amina primária) Extraction Reagent, centrifugando a 21.000xg durante 10 min; suspendendo as péletes centrifugados em 10% de Bugbuster® (isento de amina primária) Extraction Reagent, centrifugando novamente para isolar as péletes lavados. Os extratos isentos de células e as frações de corpos de inclusão foram analisados em relação à expressão de proteína através de SDS-PAGE em géis com gradiente de 4-15% (BioRad N° 161-1104, Hercules, CA). Para as amostras de extrato celular, vinte microgramas de proteína solúvel foram carregados em cada faixa de gel (pré-misturados com tampão de carregamento de proteína 1X e aquecidos a 95“C durante 5 min). As frações de corpos de inclusão foram dissolvidas em tampão de carregamento de proteína 1X (0,2 ml_), aquecidas durante 10 minutos a 95“C e 5 pl_ de cada solução foram carregados por faixa de gel. A quantidade de cada mutante HEX em comparação com a proteína solúvel total carregada em cada faixa foi calculada através da análise de intensidade das bandas utilizando a ferramenta Labworks Biolmaging 1D-gel (UVP, Inc. Upland, CA) e é relatada abaixo:
Petição 870170009999, de 15/02/2017, pág. 449/1247
440/788
Tabela 21
Amostra Proteína HEXaspC/proteína solúvel total
E. coli BL21(DE3)::HEXaspCP9T/T156ApET23a CFE 0,310
E. coli BL21(DE3)::HEXaspCP9T/R122ApET23a CFE 0,145
E. coli BL21(DE3)::HEXaspCpET23a CFE 0,172
E. coli BL21 (DE3)::HEXaspCR122A/T156ApET23a CFE 0,174
E. coli BL21(DE3)::HEXaspCW130FpET23a CFE 0,114
E. coli BL21(DE3)::HEXaspCT156ApET23a CFE 0,120
[00819] A análise dos géis mostrou que o mutante HEXaspCR122A/T156A era a única proteína que era encontrada em quantidades substanciais na forma de corpos de inclusão. A proteína HEXaspCP9T/T156A forneceu o nível mais alto de expressão, aproximadamente 90% melhor que a proteína HEXaspC. Em contraste, as proteínas W130F, T156A e P9T/R122G foram expressas em concentrações mais baixas que HEXaspC.
[00820] A atividade das proteínas mutantes HEXaspC em relação à produção de S,S-monatina foi medida utilizando as condições de reação a seguir: Cada reação de 1 ml_ continha 50 mM de TAPS, pH 8,2, 4 mM de MgCI2, 3 mM de fosfato de sódio, pH 8,0, 200 mM de piruvato de sódio (pH ajustado em 8), 5 mM de α-cetoglutarato (pH ajustado em 8), 50 mM de triptofano, 0,05 mM de 3-fosfato piridoxal, 50 pg/ml_ de aldolase ProA (adicionados na forma de um extrato isento de células) e concentrações variáveis (aproximadamente 50 e 500 pg/mL) de aminotransferase (adicionadas na forma de um extrato isento de células). Água desaerada foi utilizada para preparar as soluções estoque e para ajustar o volume das misturas de reação em 1,0 ml_. O fosfato piridoxal foi ajustado logo antes da adição das enzimas. Os tubos de
Petição 870170009999, de 15/02/2017, pág. 450/1247
441/788 reação foram incubados a 30Ό com agitação suave du rante 4 h. As amostras (0,01 mL) foram retiradas em 1, 2 e 4 h após a adição das enzimas, filtradas e analisadas por LC/MS/MS, como descrito no Exemplo 1. A produção de monatina foi normalizada com base na quantidade de aminotransferase presente nas reações. Sob as condições destes ensaios, a HEXaspC e a HEXaspCT156A produziram a maior parte da monatina total por mg de aminotransferase enquanto a proteína P9T/R122G produziu a menor, seguida pela HEXaspCW130F. As enzimas HEXaspCW130F e P9T/R122G exibiam a maior estereosseletividade por S-MP (maior que 98% de S,S-monatina), mesmo quando altas concentrações de enzima foram utilizadas (mais que 300 pg/mL). A porcentagem de produto de S,S-monatina diminui para menos que 90% nas reações enzimáticas contendo a enzima P9T/T156A em alta concentração. Os outros mutantes exibiam uma estereosseletividade para o produto muito similar à do mutante HEXaspC original (aproximadamente 95% de S,S-monatina). A análise do produto da reação contendo a enzima HEXaspC utilizando o reagente de derivatização com FDAA descrito no Exemplo 1 mostrou que o segundo estereoisômero formado é R,S-monatina.
Análise da atividade de aminotransferase em relação ao triptofano e à monatina [00821] Os mutantes foram testados em relação à atividade de transaminação utilizando S,S monatina e L-triptofano como substratos. A atividade de aminotransferase foi medida seguindo a formação do co-produto da reação, glutamato, por HPLC com derivatização póscoluna com OPA como descrito no Exemplo 1. A mistura de reação continha, em 1,0 mL, 100 mM de tampão HEPPS, pH 8,0, 20 mM de alfa-cetoglutarato, 0,08 mM de fosfato piridoxal, 25 mM de triptofano ou S,S monatina e enzima (fornecida como 2,5 mg de proteína em extratos celulares). Todos os componentes exceto a enzima foram mistuPetição 870170009999, de 15/02/2017, pág. 451/1247
442/788 rados juntos, a enzima foi adicionada no início da reação e a solução de reação foi incubada a 30°C (agitação suave) durante 90 minutos. As reações foram feitas em duplicata, com controles negativos em que não foi adicionada enzima. A reação foi interrompida pela adição de 10% de ácido fórmico (concentração final), a mistura foi centrifugada a 21.000 rpm e o sobrenadante foi removido cuidadosamente e filtrado. Os dados foram corrigidos em relação aos níveis de fundo de glutamato e em relação à diluição partindo da adição de ácido para precipitar as proteínas, então normalizados por quantidade de aminotransferase mutante adicionada. Quando o triptofano foi utilizado como um substrato, a HEXaspC produziu 13,0 mM de glutamato por mg de aminotransferase por hora. A atividade relativa, expressa na forma de uma porcentagem, dos mutantes é como a seguir: HEXaspCW130F (156%), HEXaspCT156A (151%), HEXaspCP9T/T156A (63,7%), HEXaspCP9T/R122G (116%) e HEXaspCR122G/T156A (107%). Quando a S,S monatina foi utilizada como um substrato, a HEXaspC produziu 7,43 mM de glutamato por mg de aminotransferase por hora. A atividade relativa, expressa na forma de uma porcentagem, dos mutantes é como a seguir: HEXaspCW130F (113%), HEXaspCT156A (87,7%), HEXaspCP9T/T156A (67,3%), HEXaspCP9T/R122G (11,2%) e HEXaspCR122G/T156A (114%).
[00822] O mutante HEXaspCP9T/R122G aumentou a atividade em relação ao triptofano para a conversão de indol-3-piruvato, mas diminuiu a atividade em relação à transaminação da S,S monatina. A proporção de atividade de triptofano em relação à monatina era de 18,2 em comparação com 1,75 em relação à HEXaspC, tornando um candidato desejável para a produção de R,R monatina utilizando vias que requerem uma L-aminotransferase tal como as descritas nos Exemplos 18 e 19. Como tal, a HEXaspCP9T/R122G é um exemplo de uma aminotransferase com atividade limitada sobre a S,S monatina (e MP).
Petição 870170009999, de 15/02/2017, pág. 452/1247
443/788 [00823] A maioria das mutações aumentou a atividade de Ltriptofano, mas apenas dois mutantes aumentaram a atividade em direção tanto ao L-triptofano quanto à S,S monatina (HEXaspCW130F e HEXaspCR122G/T156A). Devido ao fato de que 25 mM de substrato foram utilizados nestes ensaios, as enzimas estavam mais provavelmente saturadas e a atividade é um reflexo do kcatdas enzimas. Entretanto, sob as condições em que os ensaios para a produção de S,S monatina foram realizados (acima) é improvável que a concentração de S-MP seja suficiente para saturar a enzima, assim o aumento no kcat não é refletido. Foi relatado, para substratos similares, que algumas das mutações produziram aumento no kcat, mas também aumentaram o Km aparente para o substrato de aminoácido. Se concentrações crescentes de substratos fossem utilizadas, é esperado que estes dois mutantes forneceríam um benefício nas taxas de produção de S,S monatina em comparação com HEXaspC. A mutação HEXaspCT156A parece ter aumentando as taxas de transaminação do triptofano sem ter um efeito significativo sobre a taxa de transaminação de MP sob as condições anteriores para a produção de S,S monatina. [00824] Comparando as estruturas de HEXaspC e uma das enzimas D-aminotransferase de Bacillus sp. (vide, por exemplo, S. Sugio, G.A. Petsko, J.M. Manning, K. Soda e D. Ringe, Biochemistry 34 (1995) pp. 9661-9669), as mutações W130F, R122G, T156A e HEX de AspC podiam ser mapeadas em resíduos correspondentes na estrutura da D-aminotransferase. É esperado que mutações similares na Daminotransferase de especificidade ampla aumentaria a produção geral de R,R monatina como descrito no Exemplo 14. Por exemplo, a funcionalidade fornecida pelo triptofano 130 na AspC é substituída nas D-aminotransferases de Bacillus pela ligação de hidrogênio entre as cadeias laterais das serinas 179-181 e glutamato 166 (esquema de numeração YM-1). Para diminuir o impedimento estérico, o glutamato
Petição 870170009999, de 15/02/2017, pág. 453/1247
444/788 podería sofrer mutação em um resíduo de aspartato. Algumas Daminotransferases possuem um resíduo de treonina na posição 179, que aumentaria o impedimento estérico e devem ser evitadas. A enzima de B. sphearicus possui uma alanina no lugar de serina na posição 181, que pode também reduzir o impedimento estérico.
[00825] Informação adicional proveniente de estudos de aspartato aminotransferase pode ser aplicada à D-aminotransferase também. Embora a enzima AspC possua uma arginina no sítio ativo que interage com a cadeia lateral de substratos dicarboxilados, a Daminotransferase possui uma alça de Ser240 até Ser243. As cadeias laterais de Ser240, Thr242 e Ser243 ficam voltadas para a mesma direção e formam uma bolsa com o grupo hidroxila da Ser180 que fornece uma superfície para que substratos tanto não-polares quanto polares possam interagir. A Ser180 está envolvida na ligação de PLP; entretanto, para aumentar a atividade de uma D-aminotransferase com R-MP, podem ser modificados os resíduos de Ser240, Thr242 ou Ser243 para aceitarem substratos maiores ou para favorecer substratos carregados negativamente. Por exemplo, a Thr242 pode sofrer mutação para Ser para reduzir o comprimento da cadeia lateral. Um dos resíduos pode ser mutado para lisina ou arginina, tal como Ser243. Os resíduos (numeração YM-1) Val30-Val36 ficam localizados em um filamento beta ao longo do sítio ativo da D-aminotransferase e também são importantes para a atividade. Acredita-se que Tyr31, Val33, Glu32 e Lys35 ficam voltados para o sítio ativo. Tyr31, Glu32 e Val33 são invariáveis em todos os homólogos de Bacillus. Ro e outros (FEBS Lett 398 (1996) pp. 141-145) mutaram Val33 em Ala e observaram uma eficiência catalítica ligeiramente maior em relação à transaminação de alfa-cetoglutarato e uma eficiência catalítica significativamente maior em relação a substratos mais volumosos (menor impedimento estérico). Em alguns homólogos a Lys35 é substituída por Arg, mas se o
Petição 870170009999, de 15/02/2017, pág. 454/1247
445/788 impedimento estérico for uma preocupação o resíduo Lys é preferível. As valinas 34 e 36 são também preferíveis em relação às substituições conservativas tal como isoleucina, novamente devido ao menor impedimento estérico para moléculas grandes tal como MP.
Exemplo 17
Clonagem, Expressão e Teste de Glutamato e Aspartato Racemases [00826] Este exemplo descreve métodos utilizados para clonar e testar enzimas aminoácido racemases, que podem ser utilizadas para a interconversão entre L-glutamato e D-glutamato (ou L- e D-aspartato ou L- e D-alanina). As glutamato, aspartato ou alanina racemases são úteis em uma vide biossintética para produzir R,R monatina quando uma etapa em que a vide produz um L-aminoácido (tal como Lglutamato, L-aspartato ou L-alanina) e uma outra etapa na vide consome um D-aminoácido (tal como D-glutamato, D-aspartato ou Dalanina). A figura 4 ilustra uma vide biossintética para a produção de R,R monatina partindo de L-triptofano utilizando uma aminotransferase específica ao L-triptofano, uma aldolase específica a R, uma Daminotransferase e uma glutamato (ou aspartato ou alanina) racemase.
[00827] Os genes foram clonados nos vetores pET28 e pET30 para gerar tanto proteínas não marcadas quanto proteínas de fusão com HIS6-Tag/T7-Tags N-terminais que podem ser clivadas. As proteínas resultantes foram purificadas utilizando cromatografia por afinidade com metal imobilizado.
Resumo Experimental [00828] Os genes que codificam as glutamato racemases (EC 5.1.1.3) de Lactobacillus brevis (l\Pde Acesso do Genbank D29627, sequência de ácido nucléico) e de Pediococcus pentosaceus (gene murl) (l\Pde Acesso do Genbank L22789) foram clonados e expressos em E. coli. Os extratos foram testados em relação à atividade na conPetição 870170009999, de 15/02/2017, pág. 455/1247
446/788 versão de L-glutamato em D-glutamato e de D-glutamato em Lglutamato. A enzima aspartato racemase da BioCatalytics (EC 5.1.1.13) (BioCatalytics, Pasadena, CA) também foi testada em relação à interconversão entre L- e D-aspartato.
Isolamento de DNA Genômico para Clonagem [00829] O DNA genômico de L. brevis (ATCC 8287D) foi obtido na American Type Culture Collection. P. pentosaceus (ATCC 25745) foi cultivado a 37Ό em caldo MRS de lactobacilli e 2 mL foram utilizados para o isolamento do DNA genômico utilizando o método de Mekalanos JJ. Duplication and amplification of toxin genes in Vibrio cholerae. Cell. 1983. 35:253-63.
Protocolo da Reação em Cadeia da Polimerase [00830] Os iniciadores foram planejados com sítios de restrição a 5' e pontas coesivas para clonagem nos vetores pET 28 e pET30 (Novagen, Madison, Wl).
[00831] Iniciadores para a glutamato racemase de L. brevis·.
[00832] N term: 5'GCGGCGCCATGGAAAATGATCCGATTGGTCTAATG -3' (SEQ ID NO: 401) e [00833] C term: 5'-GCGGCGGTCGACGCAATTACAATTGTGTTTGTC-3' (SEQ ID NO: 402).
[00834] P. pentosaceus glutamato racemase iniciadores:
[00835] N term: 5'GCGGCGCCATGGATGTATGTATAATTTTATTTAG -3' (SEQ ID NO: 403) e [00836] C term: 5'GCGGCGGTCGACAAATTTCATTATTCATTCTAATTT -3' (SEQ ID NO: 404).
[00837] O gene derivado de L. brevis foi amplificado utilizando o protocolo de PCR a seguir. Em uma reação de 50 pL 0,150 pg de molde, 1,6 pM de cada iniciador, 0,4 mM de cada dNTP, 2,8 U de Expand
Petição 870170009999, de 15/02/2017, pág. 456/1247
447/788
High Fidelity® Polymerase (Roche, Indianapolis, IN), 0,5 U de Pfu polymerase (Stratagene, La Jolla, CA) e 1X tampão Expand® com Mg foram utilizados. O programa do termociclador utilizado incluía um início a quente a 96Ό durante 3 minutos, 8 repetições das etapas a seguir: 94Ό durante 30 segundos, 52Ό durante 45 seg undos e 72Ό durante 2 minutos, seguidos por 22 repetições das etapas a seguir: 94Ό durante 30 segundos, 60Ό durante 45 segundos e 72Ό durante 2 minutos. Após as 22 repetições a amostra foi mantida a 72Ό durante 7 minutos e então armazenada a 4Ό. Este protoco Io de PCR obteve um produto de ~830 pb, que é julgado através da comparação com marcadores de tamanho de DNA.
[00838] O gene derivado de P. pentosaceus foi amplificado utilizando o protocolo de PCR a seguir. Em uma reação de 50 pL, 0,15 pg de molde, 1,6 μM de cada iniciador, 0,4 mM de cada dNTP, 2,8 U de Expand High Fidelity® Polymerase, 0,5 U de Pfu polymerase e 1X tampão Expand® com Mg foram adicionados. O programa do termociclador utilizado incluía um início a quente a 96Ό durante 3 minutos, seguidos por 8 repetições das etapas a seguir: 94Ό durante 30 segundos, 37Ό durante 45 segundos e 72Ό durante 2 minutos, segui dos por 8 repetições das etapas a seguir: 94Ό durante 30 segundos, 45Ό durante 45 segundos e 72Ό durante 2 minutos, seguidos por 14 repetições das etapas a seguir: 94Ό durante 30 segundos, 55Ό dur ante 45 segundos e 72Ό durante 2 minutos. Após as 14 repetições a amostra foi mantida a 72Ό durante 7 minutos e então armazenada a 4Ό. Este protocolo de PCR obteve um produto de ~840 pb, que é julgado através da comparação com marcadores de tamanho de DNA.
Clonagem [00839] Os produtos da PCR foram purificados em gel partindo de géis de TAE-agarose a 0,8% utilizando o kit de extração do gel da Qiagen (Qiagen, Valencia, CA). Os produtos da PCR foram quantificados
Petição 870170009999, de 15/02/2017, pág. 457/1247
448/788 utilizando um espectrofotômetro SmartSpec 3000®. Os produtos foram digeridos com as enzimas de restrição Ncol e Sall seguindo os protocolos recomendandos pelo fabricante (New England Biolabs, Beverly, MA) e purificados em gel partindo de géis de TAE-agarose a 0,8% utilizando o kit de extração do gel da Qiagen (Qiagen, Valencia, CA). Os vetores pET28 e pET30 foram preparados através da digestão com enzimas de restrição Ncol e Sall seguidos pelo tratamento com fosfatase alcalina de camarão e pela purificação partindo de géis de TAEagarose a 0,8% utilizando o kit de extração do gel da Qiagen (Qiagen, Valencia, CA).
[00840] Os vetores e os insertos digeridos foram ligados utilizando o Rapid ® DNA Ligation Kit (Roche, Indianapolis, IN). Aproximadamente 50 ng de inserto tratado, 100 ng de vetor tratado (proporção molar de 3 para 1 de inserto em relação ao vetor), 5 U de T4 DNA ligase e 1X tampão de ligação foram incubados durante 5 minutos à temperatura ambiente. As reações de ligação foram purificadas utilizando o High Pure PCR Product Purification Kit (Roche, Indianapolis, IN) e utilizadas para transformar células eletrocompetentes de E. coli DH10B (Invitrogen, Carlsbad, CA). Dez pL de cada reação de ligação foram adicionados em 40 pl_ de células DH10B e foram transformados por eletroporação utilizando o Bio-Rad Gene Pulser II (Bio-Rad, Hercules, CA) sob as condições a seguir: 2,5 kV, 25 pF, 200 ohm em uma cubeta de 0,2 cm. Foi permitido que as células se recuperassem em 1 ml_ de SOC à temperatura ambiente durante 1 hora a 37Ό co m agitação a 225 rpm. As células foram plaqueadas em placas de LB contendo canamicina (50 pg/mL).
[00841] O DNA plasmideal foi purificado dos transformantes resultantes utilizando o Qiagen spin miniprep kit (Qiagen, Valencia, CA) e verificados em relação aos insertos corretos por digestão de restrição com Nco\ e Sa/I. As sequências de plasmídeos que pareciam possuir o
Petição 870170009999, de 15/02/2017, pág. 458/1247
449/788 inserto correto foram verificadas através do seqüenciamento de DNA com terminação de cadeia didesóxi.
Expressão Gênica e Ensaios [00842] O DNA plasmideal, verificado através da análise de sequência, foi subclonado no hospedeiro de expressão de E. coli BL21(DE3) (Novagen, Madison, Wl). As culturas foram crescidas. Os plasmídeos foram isolados utilizando um Qiagen miniprep kit (Qiagen, Valencia, CA) e analisados através da digestão de restrição para confirmar a identidade.
[00843] A indução em BL21(DE3) foi realizada inicialmente com as glutamato racemases de L. brevis e P. pentosaceus tanto em vetores pET28 (não marcado) quanto pET 30 (com marcação de histidina). Um estudo durante o curso de tempo foi realizado com culturas crescidas em 250 mL de LB contendo canamicina (50 mg/L) até uma DO600 de 0,5 - 0,6, induzidas com 100 mM de IPTG (isopropil tiogalacatosídeo) e foram tiradas amostras em 0 e 3 horas após a indução. As células de 600 pL (0 hora) e 275 pL (3 horas) foram ressuspensas em 40 pL de tampão dodecil sulfato de sódio contendo 2-mercaptoetanol, aquecidas a 95Ό durante 10 minutos e resfriadas. As alíquotas destas amostras de proteína celular total foram analisadas por SDS-PAGE utilizando um gel de gradiente de 4-15%.
[00844] Os extratos de células também foram preparados partindo das culturas de 3 horas através da ressuspensão dos péletes de células de 5 mL de cultura em 0,625 mL de reagente Novagen BugBuster® (Novagen, Madison, Wl) contendo 0,625 pL de benzonase nuclease e 3 pL do conjunto # 3 de coquetel de inibidor de protease (CalbiochemNovabiochem Corp., San Diego, CA) à temperatura ambiente durante 20 minutos com agitação suave e centrifugação a 16.000 x g para remover os restos celulares. Os sobrenadantes (extratos de células) foram carregados em géis com gradiente de 4-15% para a análise das
Petição 870170009999, de 15/02/2017, pág. 459/1247
450/788 proteínas solúveis celulares.
[00845] As amostras de 3 horas da glutamato racemase de L. brevis e da glutamato racemase de P. pentosaceus clonadas exibiam proteína tanto total quanto solúvel que correspondia ao tamanho correto (aproximadamente 31 kDa). O produto gênico de pET30 de L. brevis (com marcação de histidina) foi superexpresso em um nível maior e era também mais solúvel (>20% de proteína solúvel) que o produto gênico de pET 28 de L. brevis (não marcado), assim como os produtos gênicos de P. pentosaceus em ambos os vetores. O produto gênico de P. pentosaceus exibia superexpressão e solubilidade equivalentes nos vetores pET28 e pET30, que eram significativamente menores que os observados para o produto gênico de pET30 de L. brevis.
[00846] As células das culturas induzidas (250 mL) foram centrifugadas e lavadas uma vez com 0,85% de NaCI. Os péletes de células foram ressuspensos em 5 mL/g de peso úmido de célula de reagente BugBuster® (Novagen, Madison, Wl) contendo 5 pL/mL do conjunto # 3 de coquetel de inibidor de protease (Calbiochem-Novabiochem Corp., San Diego, CA) e 1 pL/mL de benzonase nuclease. As amostras foram incubadas à temperatura ambiente durante 20 minutos em um agitador orbital. Os restos celulares insolúveis foram removidos por centrifugação a 16.000 X g durante 20 minutos a 4Ό.
[00847] Os extratos de células foram analisados em relação à atividade de glutamato racemase utilizando o protocolo a seguir. Reações de 400 pL foram realizadas em 10 mM de fosfato de potássio (pH 8,0), 0,2 mM de DTT e 10 mM de L-glutamato ou D-glutamato. As reações foram iniciadas através da adição de 20-100 pL de extratos isentos de células e foram incubadas à temperatura ambiente. Alíquotas de amostras foram tiradas ao longo de um curso de tempo de 1 minuto, 5 minutos, 10 minutos, 20 minutos e 1 hora (as amostras em zero minuto serviam como reações de controle). 2 M de ácido fórmico (25 pL) foPetição 870170009999, de 15/02/2017, pág. 460/1247
451/788 ram adicionados em cada alíquota de amostra de 40 μΙ_ para interromper a reação e a proteína precipitada foi removida por centrifugação. Os sobrenadantes foram removidos e congelados a -80Ό até serem analisados por LC/MS/MS.
[00848] Os resultados dos ensaios de extratos de células provenientes da indução de pET30 com 100 mM de IPTG (3 horas) demonstram que as enzimas de L. brevis (N- de Acesso do Genbank BAA06106.1 GI:468450) e de P. pentosaceus (N- de Acesso do Genbank AAA16761.1 GL349029) possuem níveis significativos de atividade de racemase sobre ambos os isômeros de glutamato. A racemase de P. pentosaceus (20 μΙ_ de extratos celulares) atingiu o equilíbrio entre L- e D-glutamato em 10-20 minutos partindo de qualquer um dos substratos. A enzima de L. brevis (20 μΙ_ de extratos celulares) também atingiu o equilíbrio em aproximadamente 20 minutos.
[00849] Uma enzima aspartato racemase parcialmente purificada (# de Catálogo ASPR-101) obtida na BioCatalytics, Inc. (Pasadena, CA) foi analisada em relação à atividade sobre L-aspartato e D-aspartato utilizando um protocolo similar ao anterior. A enzima comercial exibia atividade de racemase sobre ambos os isômeros. Utilizando 0,5-1 mg de enzima, o equilíbrio foi alcançado em 20-60 minutos.
[00850] Todas as três racemases (glutamato racemase de L. brevis, glutamato racemase de P. pentosaceus e aspartato racemase da BioCatalytics) também foram analisadas em relação à atividade sobre S,S monatina utilizando o protocolo a seguir. Reações de 400 μΙ_ foram realizadas em 10 mM de fosfato de potássio (pH 8,0), 0,2 mM de DTT e 10 mM de S,S monatina. As reações foram iniciadas através da adição de extratos isentos de células (L brevis e P. pentosaceus) ou da enzima purificada (aspartato racemase da BioCatalytics) e foram incubadas à temperatura ambiente. Alíquotas das amostras foram tiradas ao longo de um curso de tempo de 1 minuto, 5 minutos, 10 minutos, 20
Petição 870170009999, de 15/02/2017, pág. 461/1247
452/788 minutos e 1 hora (as amostras em zero minuto serviam como reações de controle assim como as amostras sem enzima). 2 M de ácido fórmico (25 μΙ_) foram adicionados em cada alíquota de amostra de 40 μL para interromper a reação e a proteína precipitada foi removida por centrifugação. Os sobrenadantes foram removidos e congelados a 80Ό até serem analisados por LC/MS/MS (Exemplo 1). Nenhum decréscimo na concentração de S,S monatina foi observado ao longo do tempo, nem havia qualquer aumento na S,R monatina (presente inicialmente como <5% de subproduto contaminante, mesmo no controle sem enzima). Portanto, nenhuma das racemases analisadas exibia atividade em direção à monatina.
Exemplo 18
Produção de R,R Monatina partindo de L-triptofano Utilizando Glutamato ou Aspartato Racemases [00851] Este exemplo descreve métodos de produção de R,R monatina enriquecida de forma estereoisomérica partindo de L-triptofano utilizando uma L-triptofano (L-tirosina ou aromática) aminotransferase, aldolase ProA, glutamato ou aspartato racemase e uma D-aminoácido aminotransferase de especificidade ampla. A figura 5 é um diagrama que ilustra a vide. Esta abordagem para a produção de R,R monatina enriquecida de forma estereoisomérica requer uma enzima para a etapa 1 que possui baixa atividade na produção de monatina partindo do precursor de monatina (MP). Com base nos resultados anteriores, foram utilizados os produtos do gene tata de Sinorhizobium meliloti e Rhodobacter sphaeroides descritos no Exemplo 1 da WO 03/091396 A2.
Materiais e Métodos [00852] As glutamato racemases de L. brevis e P. pentosaceus foram produzidas em E. coli como descrito no Exemplo 17. Em alguns casos a versão His6-tagged destas enzimas foi purificada utilizando
Petição 870170009999, de 15/02/2017, pág. 462/1247
453/788 cartuchos His-Bind 900 de acordo com os protocolos do fabricante (Novagen, Madison, Wl) e foi dessalinizada para remover imidazol utilizando colunas PD-10 (G25 Sephadex, GE Healthcare, Piscataway, NJ). As enzimas foram eluídas em 25 mM de fosfato de potássio pH 8,0. A aspartato racemase (ASPR-101) e a D-aminotransferase (AT103) foram obtidas na BioCatalytics, Inc. (Pasadena, CA). As tirosina (aromática) aminotransferases de S. meliloti e R. sphaeroides foram preparadas como descrito no Exemplo 1 da WO 03/091396 A2. A aldolase ProA de Comamonas testosteroni foi preparada como descrito no Exemplo 4 da WO 03/091396 A2. Os ensaios de proteínas totais foram feitos utilizando o Ensaio de Proteínas da Bio-Rad de acordo com os protocolos do fabricante (Hercules, CA).
Redução na quantidade de S,S monatina produzida utilizando racemases [00853] As misturas de reação (1 mL de volume, corridas em duplicata) continham 100 mM de tampão de fosfato de potássio (pH 8), 2 mM de MgCI2, 0,05 mM de 5'-fosfato piridoxal (PLP), 200 mM de piruvato de sódio, 5 mM de α-cetoglutarato ou oxaloacetato de sódio, aproximadamente 280 pg/mL de TatA de S. meliloti fornecidos em um extrato celular, 1 mg/mL de D-aminotransferase da BioCatalytics (AT103) (BioCatalytics, Pasadena, CA), 100 pL/mL de extrato celular de glutamato racemase ou 1 mg/mL de aspartato racemase e aproximadamente 100 pg/mL de aldolase ProA fornecida na forma de um extrato celular. O triptofano sólido foi adicionado a uma concentração de 10,2 mg/mL. Os controles negativos não continham racemase. As amostras foram incubadas a 30Ό (agitando a 250 rpm) durante 1 hora, 2 horas ou durante a noite. As amostras foram centrifugadas para remover precipitado, filtradas em seringa e armazenadas a -80Ό antes da análise em relação à monatina utilizando o método de LC/MS/MS descrito no Exemplo 1. A maior parte das amostras contiPetição 870170009999, de 15/02/2017, pág. 463/1247
454/788 nha >95% de S,S monatina, devido às quatidades de Laminotransferase nativa presente nos extratos celulares. Entretanto, as amostras que continham racemase tinham uma quantidade reduzida de monatina total como um resultado das enzimas racemases tornando o L-glutamato menos disponível para a transaminação de MP. Sem racemase, 1545-2355 ppm de monatina (predominantemente S,S) foram produzidas durante o curso de tempo. Com as racemases presentes, apenas 340-879 ppm (enzima de L. brevis), 444-531 ppm (enzima de P. pentosaceus) e 506-1460 ppm de monatina (aspartato racemase) foram produzidas. Estes dados indicam que as racemases são ativas nas condições de reação requeridas para produzir monatina. Para minimizar a formação de S,S monatina partindo de enzimas do extrato celular tais como aspartato aminotransferases, foram realizados experimentos adicionais com enzimas purificadas e uma proporção maior de enzimas D-aminotransferases em relação à Laminotransferases.
Conversão de L-triptofano em 4-R contendo isômeros de Monatina [00854] Os experimentos anteriores foram repetidos utilizando aproximadamente 54 pg de L-aminotransferase purificada (TatA de S. meliloti ou de R. sphaeroides), 1 mg de aspartato aminotransferase (BioCatalytics, Pasadena, CA), 1 mg de D-aminotransferase, oxaloacetato como o receptor de amino e 75 pg de aldolase purificada. As reações foram corridas em duplicata com um tempo de amostragem de 2 horas e um tempo de incubação durante a noite. Os controles negativos foram feitos com L-aminotransferase de S. meliloti, mas sem racemase. Em adição à quantificação do pico de R,R/S,S e S,R/R,S monatina com base na cromatografia em fase inversa, a porcentagem de cada estereoisômero foi determinada utilizando a técnica de derivatização com FDAA descrita no Exemplo 1. Os resultados são como a seguir:
Petição 870170009999, de 15/02/2017, pág. 464/1247
455/788
Tabela 22
L-Am i notra ns-fe rase Tempo de Incubação Monatina Total (PPm) % de S,S % de R,R % de R,S % de S,R
TatA de S. meliloti 2 h 17,1 10,2 58,1 0,8 31,0
TatA de S. meliloti 2 h 15,8 13,3 55,3 1,0 30,4
TatA de S. meliloti durante a noite 77,7 25,8 40,0 1,3 32,9
TatA de S. meliloti durante a noite 67,9 29,4 37,3 1,5 31,8
R. sphaeroides TatA 2 h 241,2 96,3 2,3 0,8 0,6
R. sphaeroides TatA 2 h 223,2 95,7 2,7 1,0 0,6
R. sphaeroides TatA durante a noite 600,4 96,6 1,8 0,5 1,1
R. sphaeroides TatA durante a noite 618,5 96,1 2,1 0,5 1,3
sem controle de racemase 2 h 7,1 92,0 1,4 6,6 0,0
sem controle de racemase 2 h 5,7 94,0 1,2 4,8 0,0
sem controle de racemase durante a noite 44,6 93,5 1,3 4,7 0,5
sem controle de racemase durante a noite 37,5 95,4 0,9 3,7 0,0
[00855] Claramen te a presença da racemase aumenl tava a quanti-
dade total de monatina produzida quando TatA de S. meliloti era utilizada como a enzima para a transaminação de L-triptofano. Os níveis de monatina aumentaram de uma média de 6,4 para 16,5 ppm no ensaio de duas horas e de 41-73 ppm no ensaio durante a noite. Adicionalmente, a porcentagem de R,R formada aumentava de aproximadamente 1% até tanto quanto 58% através da utilização da enzima racemase. O estereoisômero S,R de monatina, um outro adoçante potente, era o outro componente mais abundante, aumentando de aproximadamente 0 nos controles negativos para 31%. A TatA de R.
Petição 870170009999, de 15/02/2017, pág. 465/1247
456/788 sphaeroides claramente tinha mais atividade sobre S-MP que a Ltransaminase de S. meliloti, demonstrando a importância de ter uma enzima que possui uma alta especificidade pelo substrato em relação ao L-triptofano quando comparado com MP quando os isômeros 4-R de monatina são os produtos desejados. Com aproximadamente 10% da monatina total sendo 4S no ponto de tempo de duas horas, a TatA de S. meliloti poderia ser considerada como tendo atividade limitada sobre MP.
[00856] Os experimentos foram repetidos com a TatA de S. meliloti (54 pg) e a glutamato racemase de L. brevis purificadas. Quando a glutamato racemase purificada foi utilizada, aproximadamente 64 pg foram utilizados por reação de 1 mL. Os extratos celulares contendo a glutamato racemase também foram testados e 1,4 mg de proteína solúvel foi utilizado. Um controle negativo sem racemase foi utilizado novamente e todas as amostras foram corridas em duplicata. Os resultados são como a seguir:
Tabela 23
Glutamato racemase Tempo de Incubação Monatina Total (PPm) % de S,S % de R,R % de R,S % de S,R
L. brevis (purificada) 2 h 3,3 49,1 34,2 3,7 13,0
L. brevis (purificada) 2 h 3,6 47,9 35,2 3,5 13,4
L. brevis (purificada) durante a noite 29,3 58,9 24,7 3,2 13,2
L. brevis (purificada) durante a noite 40,2 55,1 25,0 4,7 15,3
L. brevis (extrato de células) 2 h 10,5 45,8 35,9 U 17,2
L. brevis (extrato de células) 2 h 10,5 47,4 33,9 1,1 17,6
Petição 870170009999, de 15/02/2017, pág. 466/1247
457/788
Glutamato racemase Tempo de Incubação Monatina Total (PPm) % de S,S % de R,R % de R,S % de S,R
L. brevis (extrato de células) durante a noite 79,4 70,3 17,9 1,3 10,5
L. brevis (extrato de células) durante a noite 80,1 69,1 19,1 1,1 10,7
nenhuma 2 h 2,7 84,1 7,1 6,3 2,4
nenhuma 2 h 3,2 84,9 6,0 6,8 2,2
nenhuma durante a noite 36,5 92,3 2,3 4,2 1,2
nenhuma durante a noite 30,5 92,7 2,0 4,1 1,3
[00857] Novamente, é evidente que a adição da racemase aumenta a monatina total produzida partindo do L-triptofano, assim como aumenta as quantidades relativas de isômeros contendo 4R de monatina quando comparadas com as de S,S monatina. O uso de aldolase, racemase e L-aminotransferase purificadas aumenta enormemente a capacidade de controlar a formação do estereoisômero desejado. A proporção de L em relação à D aminotransferase também é uma forma de manipular a estereoquímica do produto final.
[00858] Quando os resultados mostrados nas Tabelas 18 e 19 no Exemplo 13 são comparados com os resultados com condições de reação similares às condições acima, pode ser observado que aproximadamente 7-29 ppm de monatina foram formadas partindo de indol3-piruvato e as porcentagens de R,R monatina formadas eram aproximadamente 51-90%. A utilização da aspartato racemase aumentou a quantidade total de monatina produzida para 16-78 ppm de monatina com uma % de R,R de aproximadamente 40-58%. Adicionalmente, um material bruto mais estável e menos dispendioso, o L-triptofano, foi utilizado. N° Exemplo 14, aproximadamente 73 ppm de monatina foram produzidas partindo do D-triptofano em uma proporção de
Petição 870170009999, de 15/02/2017, pág. 467/1247
458/788
R,R:S,R de aproximadamente 1,7:1. A quantidade total de isômeros 4R era >80% da monatina total. Devido ao fato de que tanto a R,Rmonatina quanto a S,R-monatina são adoçantes potentes (>1000 vezes mais doces que a sacarose) a capacidade de enriquecer estes isômeros sem a necessidade de substratos de D-aminoácidos caros é crítica.
[00859] Como descrito nos Exemplos 13 e 14, a D-alanina pode servir como o doador de amino para a transaminação de MP em monatina. Muitas L-aminotransferases possuem a capacidade de utilizar piruvato como um receptor de amino até alguma extensão e produzir L-alanina. Devido ao fato de que as reações mencionadas anteriormente utilizarem altas concentrações de piruvato, é provável que parte do piruvato seja convertida em L-alanina. Por exemplo, durante a transaminação do L-triptofano, foi descoberto que a enzima HexAspC descrita no Exemplo 16 converte 10-18% de piruvato (50-200 mM de concentrações iniciais) em L-alanina em 2 horas se o alfa-cetoglutarato estiver ausente. A enzima exibiu uma preferência de 10 vezes pelo alfa-cetoglutarato quando ambos os receptores de amino estavam presentes em concentrações altas (>50 mM). A AspC (descrita na WO 03/091396 A2) também produzia alguma L-alanina partindo do piruvato. Portanto, é esperado que se possa omitir a adição de alfacetoglutarato ou de oxaloacetato nas reações anteriores e utilizar uma alanina racemase (EC 5.1.1.1) no lugar da glutamato ou aspartato racemase. As enzimas alanina racemases foram primeiramente identificadas em Brucella abortus e Streptococcus faecalis (Marr, A.G. e Wilson, P.W. Arch. Biochem. Biophys., 49 (1954) 424-433 e Wood, W.A. e Gunsalus, I.C. J. Biol. Chem., 190 (1951) 403-416). O gene dadB em Salmonella typhimurium foi identificado como a fonte de atividade de alanina racemase e várias centenas de homólogos podem ser encontradas em bancos de dados genômicos. Outras fontes conhecidas de
Petição 870170009999, de 15/02/2017, pág. 468/1247
459/788 atividade de alanina racemase são Escherichia coli, Bacillus subtil is, Pseudomonas aeruginosa, Vibrio cholerae, Schizosaccaroyces pombe e Bacillus cereus. Um cogumelo basidiomiceto, Lentinus edodes, também contém uma alanina racemase de atividade ampla. Um homólogo termoestável de Bacillus stearothermophilus está disponível para compra na Sigma-Aldrich (# de Catálogo A8936) (Sigma-Aldrich, St. Louis, MO) e foi imobilizado para aplicações comerciais (Inagaki, K., Biochemistry, 25: 3268 1986). Uma alanina racemase é convertida em uma glutamato ou aspartato racemase através de métodos aleatórios tal como PCR mutagênica, passagem através de cepas mutagênicas ou outros métodos conhecidos pelos versados na técnica. Uma evolução mais focalizada da alanina racemase está centralizada nos resíduos de sítios ativos, incluindo Lys129, Met134 e os resíduos incluindo e entre Gly283 e Trp288 (numeração de Bacillus stearothermophilus). Exemplo 19
D-fenilglicina aminotransferase (D-4-hidroxifenilglicina aminotransferase) [00860] Como mostrado na figura 3, a D-fenilglicina aminotransferase é útil em uma vide biossintética para a produção de monatina. Por exemplo, a D-fenilglicina aminotransferase produz R,R monatina partindo de R-MP com L-glutamato como o doador de amino.
[00861] Síntese através da PCR de 4 D-hidroxifenilglicina aminotransferase de P. stutzeri partindo de iniciadores de oligonucleotídeo [00862] Este exemplo descreve métodos que foram utilizados para sintetizar 4 D-hidroxifenilglicina aminotransferase, uma enzima de estereoinversão que pode ser utilizada para converter o precursor R de monatina em R,R monatina utilizando L-glutamato como o doador de amino.
Planejamento dos Iniciadores [00863] A sequência publicada (N- de Acesso do Genbank
Petição 870170009999, de 15/02/2017, pág. 469/1247
460/788
ΑΥ319935, sequência de ácido nucléico; N° de Acesso do Genbank AAQ8290, sequência de proteína) para 4 D-hidroxifenilglicina aminotransferase de Pseudomonas stutzeri (4 D-HPG AT) foi utilizada como um molde para o planejamento de iniciadores da PCR. Alternativamente, a 4-D-hidroxifenilglicina aminotransferase de Pseudomonas putida, (CAD42450 (proteína), AX467211 (nucleotídeo)) é utilizada como um molde de sequência. Foi planejado um total de 34 iniciadores para frente e 35 iniciadores inversos; os iniciadores para frente e inversos eram 40-mers compartilhando 20 pares de bases sobrepostos. Em adição, 2 iniciadores externos foram planejados com sítios de restrição a 5' e pontas coesivas para clonagem nos vetores pET 28 e pET30 (Novagen, Madison, Wl).
[00864] Iniciadores externos de 4 D-HPG AT de P. stutzerr. N term (com o sítio Nde\)\ [00865] 5'-GGCCGGCATATGTCGATCCTTAACGACTACAAACGT -3' (SEQ ID NO: 405) e C term (com o sítio Xbol):
[00866] 5'-GGAAGGCTCGAGTCATGATTGGTTTCCAGACAAATT 3' (SEQ ID NO: 406).
Protocolo da Reação em Cadeia da Polimerase [00867] A sequência gênica de P. stutzeri foi amplificada utilizando os protocolos a seguir. A reação de PCR primária de 100 pL incluía 0,05 μΜ de cada um dos 69 iniciadores internos, 0,4 mM de cada dNTP, 10 U de rTth Polymerase XL (Roche, Indianapolis, IN), 0,625 U de Pfu polymerase (Stratagene, La Jolla, CA), 1X tampão XL e 1 mM de Mg(OAc)2. O programa do termociclador utilizado incluía um início a quente a 94Ό durante 3 minutos, 15 repetições das etapas a seguir: 94Ό durante 30 segundos, 42Ό durante 30 segundos e 68Ό durante 15 segundos, seguidos por 10 repetições das etapas a seguir: 94 Ό durante 30 segundos, 52Ό durante 30 segundos e 68° C durante 30 segundos, seguidos por 10 repetições das etapas a seguir: 94 Ό duPetição 870170009999, de 15/02/2017, pág. 470/1247
461/788 rante 30 segundos, 60G durante 30 segundos e 68G durante 1 minuto e 15 segundos. Após os 10 ciclos finais a amostra foi mantida a 68G durante 7 minutos e então armazenada a 4G. Es te protocolo de PCR produziu um esfregaço de produto em ~0,5 kb em um gel de TAE-agarose a 0,8%.
[00868] A reação de PCR secundária foi ajustada utilizando a reação de PCR primária como molde. A reação de PCR secundária de 100 pl_ incluía 2,5 μΙ_ da reação de PCR primária, 0,5 μΜ de cada dos 2 iniciadores externos (com sítios de restrição de Nde\ e Xho\), 0,4 mM de cada dNTP, 10 U de rTth Polymerase XL, 0,625 U de Pfu polymerase, 1X tampão XL e 1 mM de Mg(OAc)2. O programa do termociclador utilizado incluía um início a quente a 94 G durante 3 minutos, 10 repetições das etapas a seguir: 94G durante 30 seg undos, 52G durante 30 segundos e 68G durante 1 minuto e 30 segu ndos, seguidos por 15 repetições das etapas a seguir: 94 G durante 30 segundos, 60G durante 30 segundos e 68G durante 1 minuto e 30 segundos. Após as 15 repetições, a amostra foi mantida a 68G durante 7 minutos e então armazenada a 4G. Este protocolo de PCR produziu uma banda de produto distinta em ~1,4 kb em um gel de TAE- agarose a 0,8%.
[00869] O produto da PCR foi purificado em gel partindo do gel de TAE-agarose a 0,8% utilizando o kit de extração do gel da Qiagen (Qiagen, Valencia, CA). O produto foi clonado em TOPO e transformado em células TOP 10 de acordo com o protocolo do fabricante (Invitrogen, Carlsbad, CA). O DNA plasmideal foi purificado dos transformantes resultantes utilizando o Qiagen spin miniprep kit (Qiagen, Valencia, CA) e verificado em relação aos insertos corretos través da digestão de restrição com Nde\ e Xho\. As sequências de plasmídeos que pareciam ter o iserto correto foram verificadas através do seqüenciamento de DNA com terminação de cadeia didesóxi com iniciadores universais
Petição 870170009999, de 15/02/2017, pág. 471/1247
462/788
Μ13 para frente e M13 inversos. Dos 10 clones seqüenciados, todos tinham pelo menos uma mutação partindo da sequência desejada. O melhor clone tinha uma mutação de um único par de bases que resultou em uma alteração de aminoácido. A sequência deste clone foi corrigida utilizando o protocolo QuickChange Mutagenesis de acordo com as recomendações do fabricante (Stratagene, La Jolla, CA).
[00870] O clone TOPO corrigido foi digerido com as enzimas de restrição Nde\ e Xho\ seguindo os protocolos recomendandos pelo fabricante (New England Biolabs, Beverly, MA) e purificado em gel partindo de géis de TAE-agarose a 0,8% utilizando o kit de extração do gel da Qiagen (Qiagen, Valencia, CA). Os vetores pET 28 e pET 30 foram preparados através da digestão com as enzimas de restrição Nde1 e Xho1 seguida pelo tratamento com fosfatase alcalina de camarão e a purificação de géis de TAE-agarose a 0,8% utilizando o kit de extração do gel da Qiagen (Qiagen, Valencia, CA).
[00871] Os vetores e o inserto digeridos foram ligados utilizando o NEB Quick Ligation Kit (Beverly, MA). Aproximadamente 50 ng de inserto tratado, 100 ng de vetor tratado (proporção molar de 3 para 1 de inserto em relação ao vetor), 5 U de T4 DNA ligase e 1X tampão de ligação foram incubados durante 5 minutos à temperatura ambiente. A mistura de ligação foi transformada em células quimicamente competentes TOP10F' (Invitrogen, Carlsbad, CA). Foi permitido que as células se recuperassem em 0,25 mL de SOC à temperatura ambiente durante 1 hora a 370 com agitação a 225 rpm. As célu Ias foram plaqueadas em placas de LB contendo canamicina (50 pg/mL). O DNA plasmideal é purificado dos transformantes resultantes utilizando o Qiagen spin miniprep kit (Qiagen, Valencia, CA) e verificado em relação aos insertos corretos através da digestão de restrição com Nde\ e Xho\. Expressão Gênica e Ensaios [00872] O DNA plasmideal foi transformado no hospedeiro de exPetição 870170009999, de 15/02/2017, pág. 472/1247
463/788 pressão de E. coli BL21(DE3) (Novagen, Madison, Wl). As culturas foram crescidas e os plasmídeos foram isolados utilizando o Qiagen miniprep kit (Qiagen, Valencia, CA) e analisados através da digestão de restrição para confirmar a identidade.
[00873] A indução em BL21(DE3) é inicialmente realizada com 4 D HPG de P. stutzeri em ambos os vetores pET 28 (com marcação de histidina) e pET 30 (não marcado). Um estudo ao longo do tempo é realizado com culturas crescidas em 250 mL de LB contendo canamicina (50 mg/L) até uma D06oo de 0,5 - 0,6, induzidas com 100 mM de IPTG (isopropil tiogalacatosídeo) e foram tiradas amostras em 0 e 3 horas após a indução. Um volume apropriado de células de 0 hora e 3 horas é ressuspenso em 40 pL de tampão dodecil sulfato de sódio contendo 2-mercaptoetanol e aquecido a 95G durante 10 minutos e resfriado. As alíquotas destas amostras de proteínas celulares totais são analisadas por SDS-PAGE utilizando um gel de gradiente de 415%.
[00874] Os extratos de células também são preparados partindo de culturas de 3 horas através da suspensão dos péletes de células de 5 mL de cultura em 0,625 mL de reagente Novagen BugBuster® (Novagen, Madison, Wl) contendo 0,625 pL de benzonase nuclease e 3 pL de conjunto # 3 de coquetel de inibidor de protease (CalbiochemNovabiochem Corp., San Diego, CA) à temperatura ambiente durante 20 minutos com agitação suave e centrifugação a 16.000 x g para remover restos celulares. Os sobrenadantes (extratos de células) são carregados em géis com gradiente de 4-15% para a análise das proteínas solúveis celulares. Quando necessário, a proteína é purificada utilizando cartuchos His-Bind 900 de acordo com os protocolos do fabricante (Novagen, Madison, Wl) e é dessalinizada para remover imidazol utilizando colunas PD-10 (G25 Sephadex, GE Healthcare, Piscataway, NJ).
Petição 870170009999, de 15/02/2017, pág. 473/1247
464/788
Organismos com D-fenilglicina aminotransferase (DPGAT) [00875] Os organismos do gênero Pseudomonas e gêneros similares, com uma D-fenilglicina aminotransferase de estereoinversão (também chamada de D-4-hidroxifenilglicina aminotransferase) são isolados da maneira a seguir. Amostras de solo são incubadas em placas de Petri com o meio a seguir: (por litro) 15 g de Ágar, 3,4 g de KH2PO4, 3,55 g de Na2HPO4, 0,2 g de MgSO4-7H2O, 8 mg de CaCI2-2H2O, 10 mg de extrato de levedura, 1 mL de solução 1000x de elementos traços, 1 g de D-fenilglicina (D-4-hidroxifenilglicina).
[00876] Os isolados são testados por PCR em relação à presença de uma aminotransferase de estereoinversão (iniciadores planejados partindo de D-fenilglicina aminotransferases conhecidas) ou são adicionalmente enriquecidos em relação à presença de uma aminotransferase de estereoinversão como a seguir: os isolados das placas poderiam ser cultivados em meio líquido como anteriormente menos o ágar a 30Ό com agitação até uma D06oo de aproximadamente 1,0. As células são coletadas por centrifugação e lavadas duas vezes com 0,85% de NaCI. Uma amostra de 10 mg (peso úmido) é suspensa em 1 mL de tampão de fosfato de potássio (pH 7,0) e 5 mM de D-fenilglicina (ou D-4-hidroxifenilglicina). 15 mM de ácido (aminoóxi)acético neutralizado são adicionados em amostras em duplicata preparadas como descrito anteriormente. O consumo de D-fenilglicina (ou D-4-hidroxiglicina) é medido por HPLC. Os isolados capazes de degradar D-fenilglicina (ou D-4-hidroxifenilglicina), mas o fazem a uma taxa mais lenta na presença do ácido (aminoóxi)acético são selecionados para análise adicional. Os isolados são testados, por PCR, em relação à presença de uma aminotransferase de estereoinversão (iniciadores planejados partindo de D-fenilglicina aminotransferases conhecidas).
[00877] A presença da aminotransferase de estereoinversão é confirmada através do crescimento de uma cultura em meio líquido como
Petição 870170009999, de 15/02/2017, pág. 474/1247
465/788 descrito anteriormente, coletando as células e produzindo um extrato bruto isento de células (CFE) e testando em relação à atividade enzimática de D-fenilglicina aminotransferase (ou D-4-hidroxifenilglicina aminotransferase). O CFE é adicionado a uma mistura de reação com as concentrações finais a seguir: 0,1 M de CAPS (pH 9,5), 60 mM de L-glutamato (sal de sódio), 5 mM de benzoilformiato (ou 4hidroxibenzoato) e 50 μΜ de PLP. A reação inversa é medida através da adição de CFE em uma mistura de reação com as concentrações a seguir: 50 mM de fosfato de potássio (pH 7,0), 60 mM de D-fenilglicina (ou D-4-hidroxifenilglicina), 5 mM de a-cetoglutarato, 50 pM de PLP. Os ensaios são incubados a 35Ό e as alíquotas são tiradas em pontos de tempo e interrompidas através de fervura durante 2 minutos. O produto será quantificado através do método de HLPC de Gil-Av, E., Tishbee, A., Hare, P.E., Resolution of underivatized amino acids by reversed phase chromatography. J. Am. Chem. Soc., 102: 5115-5117 (1980) ou através dos métodos descritos no Exemplo 1 (medida da formação de glutamato).
[00878] Como uma alternativa para os métodos baseados na PCR, a D-fenilglicina aminotransferase de estereoinversão é purificada partindo das bactérias isoladas através de técnicas de purificação de proteínas tradicionais incluindo o fracionamento em sulfato de amônio e a cromatografia em coluna convencional. Uma vez que a proteína foi purificada até um grau razoável, técnicas de microsseqüenciamento de peptídeos ou o seqüenciamento de aminoácidos do tipo Edman convencional é utilizado (vide golgi.harvard.edu/microchem/ para descrições dos protocolos e equipamento utilizados para este tipo de trabalho). Os iniciadores degenerados são planejados com base na sequência disponível do relativo conhecido mais próximo da fonte de proteína. A PCR degenerada e o walking genômico são então realizados de acordo com protocolos estabelecidos para isolar a sequência codiPetição 870170009999, de 15/02/2017, pág. 475/1247
466/788 ficadora da D-fenilglicina aminotransferase de estereoinversão. Produção de monatina por DPGAT [00879] As D-hidroxifenilglicina aminotransferases, como descrito em (1) e (2) acima, são utilizadas em extratos de proteínas brutos isentos de células ou purificadas como descrito em (1) acima. As tirosina (aromática) aminotransferases de S. meliloti e de R. sphaeroides são preparadas como descrito no Exemplo 1 da WO 03/091396 A2. A aldolase ProA de Comamonas testosteroni é preparada como descrito no Exemplo 4 da WO 03/091396 A2. Os ensaios de proteínas totais são feitos utilizando o Ensaio de Proteínas da Bio-Rad de acordo com os protocolos do fabricante (Hercules, CA).
[00880] As misturas de reação (volume de 1 mL, corrido em duplicata) contêm 100 mM de tampão de fosfato de potássio (pH 8), 2 mM de MgCI2, 0,05 mM de 5'-fosfato piridoxal (PLP), 200 mM de piruvato de sódio, 5 mM de α-cetoglutarato de sódio, aproximadamente 280 pg/mL de TatA de S. meliloti fornecidos em um extrato celular, 100 pL/mL de extrato celular com D-hidroxifenilglicina aminotransferase ou 1 mg/mL de D-hidroxifenilglicina aminotransferase purificada e aproximadamente 100 pg/mL de aldolase ProA fornecidos como um extrato celular. O triptofano sólido é adicionado a uma concentração de 10,2 mg/mL. Os controles negativos são ajustados sem D-hidroxifenilglicina aminotransferase. As amostras são incubadas a 30Ό com agitação suave durante -1 hora ou durante a noite. As amostras são centrifugadas para remover o precipitado, filtradas com seringa e armazenadas a -800 antes da análise em relação à monatina utilizando o método de LC/MS/MS descrito no Exemplo 1.
[00881] As D-hidroxifenilglicina aminotransferases com maior atividade em relação à produção de monatina são produzidas através de técnicas de mutagênese conhecidas pelos versados na técnica, incluindo: PCR mutagênica, passagem através de cepas mutagênicas ou
Petição 870170009999, de 15/02/2017, pág. 476/1247
467/788 mutagênese direcionada ao sítio. As D-hidroxifenilglicina aminotransferases melhoradas são selecionadas através do cultivo em meio mínimo com R,R-monatina como a fonte de nitrogênio. Inicialmente a seleção se baseia no crescimento, mas as aminotransferases melhoradas são selecionadas com verificação baseada na taxa de crescimento. Ou seja, as células com versões mutadas do gene são cultivadas e o gene é expresso em meio mínimo com R,R-monatina como a fonte de nitrogênio. As taxas de crescimento das células com as versões mutadas do gene são comparadas com a da versão não mutada. Tais células com uma taxa de crescimento mais rápida são selecionadas e a aminotransferase é analisada adicionalmente. A D-hidroxifenilglicina aminotransferase é submetida à mutagênese através de técnicas disponíveis tais como a PCR propensa a erros e passagem através de cepas mutagênicas ou através de métodos para os quais uma licença foi obtida tais como o embaralhamento de DNA e outras tecnologias de evolução direcionada.
Ensaio de DPGAT [00882] As células com a D-hidroxifenilglicina aminotransferase recombinante foram cultivadas, a proteína expressa e as células Usadas como descrito no Exemplo 17 ou através de protocolos padronizados. A proteína é expressa em seu hospedeiro nativo utilizando métodos descritos (Wiyakrutta, W., Meevootisom, V. A stereoinverting Dphenylglycine aminotransferase from Pseudomonas stutzeri ST-201: purification, characterization and application for D-phenylglycine synthesis. J. Biotechnol., 55: 193-203 (1997)).
[00883] O extrato isento de células foi adicionado em uma mistura de reação com as concentrações finais a seguir: 100 mM de fosfato de potássio (pH 7,0-8,5), 60 mM de D-fenilglicina (ou D-4hidroxifenilglicina), 5 mM de a-cetoglutarato, 50 μM de PLP. Os ensaios foram incubados à temperatura ambiente e alíquotas foram tiradas
Petição 870170009999, de 15/02/2017, pág. 477/1247
468/788 em pontos de tempo e interrompidas através da adição de um volume equivalente de ácido fórmico. O produto (L-glutamato) é quantificado através dos métodos descritos no Exemplo 1.
Exemplo 20 [00884] Descoberta de um gene de D-metionina aminotransferase Fundamento [00885] Acredita-se que a D-metionina-piruvato aminotransferase (EC 2.6.1.41) é um outro exemplo, embora raro, de uma transaminase de estereoinversão. Esta enzima catalisa a conversão reversível de Dmetionina e piruvato em L-alanina e 4-metiltio-2-oxobutanoato. O oxaloacetato, o fenilpiruvato, o 2-oxobutirato, o 2-oxovalerato, o 2oxoheptanoato, o glioxilato e o oxoglutarato também podem servir como receptores de amino.
[00886] Acredita-se que a transaminação de D ou L metionina faz parte de uma vide para produção de etileno em plantas superiores (couve-flor, tomate, maçã, caule de ervilha, banana, amendoim) assim como em microorganismos do solo (Escherichia coli, Pseudomonas pisi, Pseudomonas aeruginosa, Bacillus mycoides, Acinetobacter calcoaceticus, Aeromonas hydrophila B12E, Rhizobium trifolii N2P7, Penicillium digitatum, Saccharomyces cerevisiae, Corynebacterium D7F). D.C. Billington, B.T. Golding e S.B. Primrose Biochem J. (1979) 182, 827-836. Em bactérias, a L-metionina é tipicamente utilizada como o substrato nos estudos de produção de etileno e acredita-se que enzimas de especificidade ampla tal como TyrB ou AspC de E. coli são responsáveis pela transaminação. Entretanto, S.B. Primrose J. Gen. Microbiol. (1976), 95(1), 159-65 e S.B. Primrose J. Gen. Microbiol. (1977), 98, 519-528, mostraram que a cepa SPA O de E. coli (University of Warwick culture collection) produzia quase tanto etileno partindo de D-metionina quanto de L-metionina em culturas em batelada. Devido ao fato de que foi identificada D-aminotransferase sem especificiPetição 870170009999, de 15/02/2017, pág. 478/1247
469/788 dade ampla em E. coli, uma explicação possível poderia ser que a Daminoácido desidrogenase de E. coli (codificada pelo gene dadA) converte a D-metionina em 4-metiltio-2-oxobutanoato. É também possível que haja uma metionina racemase em E. colr, entretanto, nenhuma tal enzima foi descrita na literatura.
[00887] Em contraste a E. coli, em flósculos de couve-flor (preparações de extrato mitocondrial) e sementes de amendoim em germinação, a produção de etileno era maior quando a D-metionina e o piruvato foram fornecidos ao extrato de enzima quando comparada com Lmetionina e piruvato (L.W. Mapson, J.F. March e D.A. Wardale Biochem J. (1969) 115, 653-661; J.l. Durham, P.W. Morgan, J.M. Prescott e C.M. Lyman Phytochemistry (1973) 12, 2123-2126). Portanto, a possibilidade de uma combinação de metionina racemase e uma Laminotransferase não é sustentada pelos dados. A atividade de desidrogenase foi eliminada através da diálise de extratos celulares de couve-flor, não havia NAD presente nas misturas de ensaio. A atividade de oxidase foi descartada uma vez que nenhum consumo de oxigênio foi observado e não havia requerimento de FAD. A D-metionina aminotransferase de tecidos de amendoim foi purificada, foi mostrado que era dependente de PLP e foi mostrado que era independente da atividade de L-metionina aminotransferase. Há uma possibilidade de que estas D-metionina-piruvato aminotransferases realmente produzem D-alanina como um subproduto (similar às enzimas de Bacillus descritas nos Exemplos 13 e 14) e que as células contêm alanina racemase para reciclar a D-alanina de volta em L-alanina (ou um doador de amino análogo). Em qualquer um dos casos, a descoberta da Daminotransferase de especificidade de plantas superiores é vantajosa para o desenvolvimento de processos que produzem R,R monatina ou S,R monatina.
Resumo Experimental
Petição 870170009999, de 15/02/2017, pág. 479/1247
470/788 [00888] A D-metionina aminotransferase é parcialmente purificada partindo de flósculos de couve-flor e embriões de amendoim em germinação utilizando protocolos de cromatografia padronizados e um sistema Pharmacia AKTA Explorer. As sequências de proteínas de proteínas homólogas são determinadas por técnicas de fingerprinting por LC/MS/MS e buscas em bancos de dados realizadas pela Harvard Microchemistry Facility. As regiões codificadoras dos genes vegetais são clonadas partindo de uma biblioteca de cDNA utilizando protocolos de PCR padronizados ou através da síntese do gene como descrito no Exemplo 19.
[00889] Alternativamente, as bibliotecas de expressão de cDNA são construídas (Stratagene, La Jolla, CA) partindo de tecido de couve-flor ou de sementes de amendoim cultivadas na presença de D-metionina (e produzindo etileno). As bibliotecas são transformadas em E. coli auxotrófica em relação à metionina do E. coli Genetic Stock Center (Yale) tais como as cepas RC519 ou AB1931. Os plasmídeos de cepas capazes de crescer em meios mínimos contendo D-metionina contêm a região codificadora de interesse (vide o Exemplo 15, uma técnica de seleção de análogos).
[00890] Uma vez que as regiões codificadoras de interesse são obtidas e são expressas em uma cepa de laboratório padronizada de E. coli, os produtos gênicos resultantes podem ser utilizados em ensaios para produzir R,R monatina como descrito no Exemplo 19 no lugar da D-hidroxifenilglicina aminotransferase, com a exceção do pH sendo de 7,5 (o pH ótimo para a aminotransferase). Se a D-metionina aminotransferase tiver um requerimento estrito por substratos doadores de D-aminoácidos, a enzima pode ser utilizada para produzir R,R monatina como descrito nos Exemplos 13 e 14. O gene pode sofrer mutagênese e ser verificado em relação à maior atividade como descrito no Exemplo 19.
Petição 870170009999, de 15/02/2017, pág. 480/1247
471/788
Métodos
Isolamento partindo de couve-flor [00891] Quatrocentos gramas de flósculos de couve-flor recémpicados são extraídos com 400 mL de uma solução de sacarose/tampão a 4Ό (0,4 M de sacarose e 0,1 M de tampão de fosfato de sódio pH 7,4) alternando o encharcamento e a mistura utilizando uma misturadora. Os restos celulares são removidos por filtração com tecido de algodão e a solução resultante é centrifugada a 40.000Xg durante 30 minutos a 4Ό. O material sólido (contendo organelas mitocondriais) é ressuspenso em 20 mL de 10 mM de tampão de fosfato de sódio pH 7,4 e as enzimas são extraídas com 200 mL de acetona gelada (-30Ό). A suspensão é centrifugada novamente e o precipitado é seco utilizando um Savant Speed Vac. O material sólido é dissolvido em 10 mM de tampão de fosfato de sódio pH 7,4 e a acetona residual é removida utilizando uma coluna PD-10 (GE Healthcare, Piscataway, NJ).
[00892] A atividade de aminotransferase é analisada através da incubação da preparação de enzima com 5 mM de D-metionina, 1 mM de piruvato, 0,05 mM de PLP e 2 mM de EDTA em 0,1 M de tampão de fosfato de sódio pH 7,4. Os ensaios são realizados a 25Ό durante 16 horas. O 4-Metiltio-2-oxobutanoato é medido através da formação do derivado de 2,4-dinitrofenilhidrazona, utilizando LC/MS (m/z de 328) e a metodologia similar descrita no Exemplo 1. Uma solução a 0,4% (p/v) de 2,4-dinitrofenilhidrazina em ácido sulfúrico a 2 M é preparada e a metade do volume é adicionada na mistura de ensaio após a incubação. A mistura é misturada com agitação suave a 30Ό durante 30 minutos e o precipitado é coletado por centrifugação e analisado por LC/MS. As frações de proteína separadas por técnicas cromatográficas padronizadas são analisadas em relação à atividade de uma maneira similar, mas o co-produto alanina é medido através de técnica de
Petição 870170009999, de 15/02/2017, pág. 481/1247
472/788 derivatização pós-coluna de OPA descrita no Exemplo 1.
Isolamento partindo de amendoim (Arachia hvoogea L. cv. Starr) [00893] A enzima D-metionina aminotransferase proveniente do homogenado de embrião de amendoim em germinação (menos os cotilédones) é purificada de acordo com the método de J.l. Durham, P.W. Morgan, J.M. Prescott e C.M. Lyman Phytochemistry (1973) 12, 21232126. Agentes redutores são utilizados durante a preparação de extratos brutos para estabilizar as enzimas e os restos celulares são removidos por centrifugação a 33.000Xg. Uma fração de sulfato de amônio a 35-50% é adicionalmente purificada através da incubação à temperatura baixa e através da remoção das proteínas no precipitado. O sobrenadante é adicionalmente fracionado utilizando acetona. Os conjuntos ativos são então adicionalmente purificados através da cromatografia por filtração em gel (Sephadex 200, GE Healthcare, Piscataway, NJ).
[00894] À medida que as frações de proteína ficam enriquecidas com a proteína transaminase, a eletroforese em 2D-gel é utilizada para separar a enzima de interesse para microsseqüenciamento. Após a elucidação de regiões codificadoras homólogas nas sequências vegetais depositadas no NCBI, a proteína D-aminotransferase é produzida de forma recombinante em Escherichia coli utilizando técnicas de biologia molecular padronizadas. É esperado que os extratos celulares de flósculos de couve-flor ou de sementes de amendoim ou enzimas homólogas produzidas de forma recombinante possam ser utilizadas na produção de R,R monatina como descrito no Exemplo 19 (se for uma transaminase de estereoinversão) ou nos Exemplos 13 e 14 (se for uma D-aminotransferase de especificidade ampla).
Exemplo 21
L-alanina aminotransferase/alanina racemase/D-alanina aminotransferase
Petição 870170009999, de 15/02/2017, pág. 482/1247
473/788 [00895] As figuras 4, 6 e 8 ilustram vias biossintéticas para a produção de R,R monatina enriquecida de forma estereoisomérica partindo do L-triptofano utilizando uma L-aminoácido aminotransferase (tal como L-alanina-aminotransferase e/ou L-triptofano-aminotransferase), uma aldolase específica a R, uma alanina racemase e uma D-alanina aminotransferase.
[00896] Uma aminotransferase específica ao triptofano é descrita no Exemplo 16. Alternativamente, as tirosina (aromática) aminotransferases de S. meliloti e R. sphaeroides são preparadas como descrito no Exemplo 1 da WO 03/091396 A2. A aldolase ProA de Comamonas testosteroni é preparada como descrito no Exemplo 4 da WO 03/091396 A2. Os ensaios de proteína total são feitos utilizando o Ensaio de Proteína da Bio-Rad de acordo com os protocolos do fabricante (Bio-Rad, Hercules, CA). A alanina racemase é obtida na SigmaAldrich (St. Louis, MO) (número de catálogo A8936). A D-alanina aminotransferase é obtida na BioCatalytics (número de catálogo AT-103) (BioCatalytics, Pasadena, CA).
[00897] As L-alanina aminotransferases são amplamente distribuídas em eucariotos, bactérias e archaea. Os organismos a seguir foram identificados (com base na homologia de sequência) como contendo uma L-alanina aminotransferase (E.C. 2.6.1.2): Arabidopsis thaliana, Ashbya gossypii, Azotobacter vinelandii, Bifidobacterium longum, Caenorhabditis elegans, Candida albicans, Candida glabrata, Chlamydomonas reinhardtii, Cryptococcus neoformans, Debaryomyces hansenii, Homo sapiens, Hordeum vulgare, Kluyveromyces lactis, Magnaporthe grisea, Medicago truncatula, Mus musculus, Neurospora crassa, Oryza sativa, Phanerochaete chrysosporium, Pinus taeda, Pseudomonas putida, Pyrococcus abyssi, Pyrococcus furiosus, Pyrococcus horikoshii, Rattus norvegicus, Saccharomyces cerevisiae, Schizosaccharomyces pombe, Takifugu rubripes, Trypanosoma cruzi, Vibrio cholerae, Vibrio
Petição 870170009999, de 15/02/2017, pág. 483/1247
474/788 parahaemolyticus, Vibrío vulnificus, Yarrowia lipolytica e Zea mays. Adicionalmente, muitas aminotransferases possuem atividade de alanina aminotransferase em baixo nível e, fornecidos altos níveis de Lglutamato e piruvato podem convertê-los em L-alanina e acetoglutarato. Uma enzima com baixa atividade é melhorada com técnicas de mutagénese padronizadas tais como PCR propensa a erros e passagem através de cepas mutagênicas ou através de técnicas de evolução direcionada. O gene para uma L-alanina aminotransferase é clonado utilizando iniciadores disponíveis publicamente para serem planejados e utilizando técnicas padronizadas para amplificar, clonar, expressar e purificar o gene/enzima.
[00898] As misturas de reação (volume de 1 mL, corridas em duplicata) contêm 100 mM de tampão de fosfato de potássio (pH 8), 2 mM de MgCI2, 0,05 mM de 5'-fosfato piridoxal (PLP), 200 mM de piruvato de sódio, 5 mM de α-cetoglutarato de sódio, aproximadamente 280 pg/mL de TatA de S. meliloti fornecidos em um extrato celular (ou outra aminotransferase específica ao L-triptofano), 100 pL/mL de extrato celular de alanina racemase ou 1 mg/mL de alanina racemase purificada, aproximadamente 280 pg/mL de D-alanina aminotransferase fornecidos em um extrato celular e aproximadamente 100 pg/mL de aldolase ProA fornecida como um extrato celular. O triptofano sólido é adicionado a uma concentração de 10,2 mg/mL. Os controles negativos são ajustados sem alanina racemase. As amostras são incubadas a 30Ό com agitação suave durante ~1 hora ou durante a noite. As amostras são centrifugadas para remover o precipitado, filtradas com seringa e armazenadas a -800 antes da análise em relação à monatina utilizando o método de LC/MS/MS descrito no Exemplo 1. Nestas misturas de reação, se a L-triptofano aminotransferase puder utilizar acetoglutarato, mas não piruvato, como um receptor de amino, pode ser adicionada uma L-alanina aminotransferase, que converte L-glutamato
Petição 870170009999, de 15/02/2017, pág. 484/1247
475/788 e piruvato em L-alanina e α-cetoglutarato, como mostrado na figura 6. Exemplo 22 [00899] Subclonagem de genes que codificam as aldolases das SEQ ID NO: 276, 244, 218, 228, 162, 50, 74, 44 e 116 [00900] Os genes que codificam aldolases que possuem as sequências de aminoácidos das SEQ ID NO: 276, 244, 218, 228, 162, 50, 74, 44 e 116 foram subclonados no vetor de expressão pET28b (Novagen, Madison, Wl) com His-tags N-terminais para permitir a purificação. A SEQ ID NO: 275 é a sequência do gene que codifica a aldolase que possui a sequência de aminoácidos da SEQ ID NO: 276. A SEQ ID NO: 243 é a sequência do gene que codifica a aldolase que possui a sequência de aminoácidos da SEQ ID NO: 244. A SEQ ID NO: 217 é a sequência do gene que codifica a aldolase que possui a sequência de aminoácidos da SEQ ID NO: 218. A SEQ ID NO: 227 é a sequência do gene que codifica a aldolase que possui a sequência de aminoácidos da SEQ ID NO: 228. A SEQ ID NO: 161 é a sequência do gene que codifica a aldolase que possui a sequência de aminoácidos da SEQ ID NO: 162. A SEQ ID NO: 49 é a sequência do gene que codifica a aldolase que possui a sequência de aminoácidos da SEQ ID NO: 50. A SEQ ID NO: 73 é a sequência do gene que codifica a aldolase que possui a sequência de aminoácidos da SEQ ID NO: 74. A SEQ ID NO: 43 é a sequência do gene que codifica a aldolase que possui a sequência de aminoácidos da SEQ ID NO: 44. A SEQ ID NO: 115 é a sequência do gene que codifica a aldolase que possui a sequência de aminoácidos da SEQ ID NO: 116.
[00901] Os iniciadores utilizados para clonagem são mostrados na Tabela 24.
Petição 870170009999, de 15/02/2017, pág. 485/1247
476/788
Tabela 24
SEQ ID NO: do DNA da Aldolase Iniciador a 5' Iniciador a 3'
275 5'- ATAAGACATATGCCTATC GTTGTTACGAAG-3' (SEQ ID NO:339) 5'- ATAAGAGGATCCTTATTCC TCGGGCAGCCGCTC-3' (SEQ ID NO:340)
243 5'- ATAAGACATATGAACAGA CCTGTGGTTGTC-3' (SEQ ID NO:341) 5'- ATAAGAGGATCCTTACAGG TACTTGAGACCGAG-3' (SEQ ID NO:342)
217 5'- ATAAGACATATGAGCGTG GTCATCCGAAAC-3' (SEQ ID NO:343) 5'- ATAAGAGGATCCTTACTTC GCTTTGTTATAGGC-3' (SEQ ID NO:344)
227 5'- ATAAGACATATGAACAAG CCCGTGGTTGTG-3' (SEQ ID NO:345) 5'- ATAAGAGGATCCTTACAAG TACTTGAGACCGAGG-3' (SEQ ID NO:346)
161 5'- ATAAGACATATGAGCGTG GTCGTCACCGG-3' (SEQ ID NO:347) 5'- ATAAGAGGATCCTTAGCCG TTTTTCCCGTCGGTG-3' (SEQ ID NO:348)
49 5'- AGAAGACATATGATGAGC ATCGTCGTCCAGAAC-3' (SEQ ID NO:349) 5'- AGAAGAGGATCCTCAGAC ATATTTCAGGCCCTTG-3' (SEQ ID NO:350)
73 5'- AGAAGACATATGATGAGC GTGGTCATCACC-3' (SEQ ID NO:351) 5'- ACAACAGGATCCCTATTTC TTCTCCGGCGTTTC-3' (SEQ ID NO:352)
43 5'- ATAATACATATGAGCGTC GTCGTTCAGAAC-3' (SEQ ID NO:353) 5'- ATAATAGGATCCTTAGACA TATTTGAGCCCCTTC-3' (SEQ ID NO:354)
115 5'- AGAAGACATATGATGTCG GTTGTCGTTCAGAAC-3' (SEQ ID NO:355) 5'- AGAAGAGGATCCTCAGATA TACTTCAGGCCC-3' (SEQ ID NO:356)
[00902] Os genes que codificam as a dolases anteriores foram am-
plificados através da PCR e digeridos com enzimas apropriadas (Nde I
Petição 870170009999, de 15/02/2017, pág. 486/1247
477/788 e BamH I) e purificados em gel (QIAquick® Gel extration Kit (Qiagen, Valencia, CA)). Os produtos da digestão foram ligados individualmente em pET28 que foi digerido com Nde I e BamH I e purificado em gel. A ligação foi transformada em células TOP10 (Invitrogen, Carlsbad, CA). O DNA da miniprep de colônias individuais foi analisado em relação à presença de insertos através da análise de tamanho utilizando eletroforese em gel de agarose. Os isolados com um inserto foram submetidos à análise de sequência de DNA (Agencourt, Beverly, MA). Purificação de Aldolases [00903] Os clones de aldolases confirmados foram transformados em BL21(DE3) ou BL21(DE3) pLysS. A indução foi realizada durante a noite em Terrific Broth a 30G. As culturas crescidas durante a noite com o antibiótico apropriado foram diluídas em meio fresco (tipicamente 1:100) e crescidas até uma D06oo ~0,6 com aeração a 37G. As culturas foram então induzidas com 1 mM de IPTG e transferidas para 30G (com aeração) e a incubação foi continuada durante a noite. As células foram coletadas por centrifugação. O pélete de células foi submetido tipicamente a um ciclo de congelamento descongelamento para ajudar na lise celular. O pélete de células foi lisada em BugBuster e Benzonase Nuclease (Novagen, Madison, Wl) (de acordo com o protocolo do fabricante). Os restos celulares foram removidos por centrifugação. O extrato de proteína bruto foi aplicado em uma coluna HISBind com capacidade de 10 mg (Novagen, Madison, Wl) que foi preparada de acordo com o protocolo do fabricante. A coluna foi lavada e a proteína foi eluída de acordo com o protocolo do fabricante. A proteína purificada foi dessalinizada com colunas PD-10 (GE Healthcare, Piscataway, NJ) e eluída em 50 mM de tampão de fosfato de potássio, pH 7,5, contendo 4 mM de MgCI2,200 mM de NaCI. A proteína purificada foi concentrada com agentes de concentração por centrifugação Amicon (faixa de 5000 MW) (Millipore, Billerica, MA). Após a concentraPetição 870170009999, de 15/02/2017, pág. 487/1247
478/788 ção, foi observado que as aldolases das SEQ ID NO: 44, SEQ ID NO: 28 e SEQ ID NO: 276 exibiam algum nível de precipitação, embora a atividade ainda fosse bastante alta. As proteínas foram armazenadas a -80Ό até serem analisadas.
[00904] Os ensaios de proteína foram realizados utilizando o kit Pierce BCA (Pierce, Rockford, IL) e o protocolo de microtitulação em placas com Albumina de Soro Bovino (BSA) como o padrão de proteína. O sistema de eletroforese Experion Pro260 (Bio-Rad, Hercules, CA) ou a SDS-PAGE foi utilizada para estimar a porcentagem de aldolase na amostra purificada e para avaliar os níveis de expressão no extrato de células solúvel e na proteína total.
Teste de Aldolases Purificadas [00905] As aldolases purificadas foram testadas em relação a sua capacidade de produzir R,R monatina partindo de D-triptofano e foram comparadas com as aldolases das SEQ ID NO: 28 e SEQ ID NO: 54 preparadas da mesma maneira. Os ensaios foram corridos em tubos de microcentrífuga (em duplicata) com a proteína purificada, utilizando a mesma concentração de enzima por ensaio (50 pg/mL) com a exceção da SEQ ID NO: 244, para a qual foram utilizados 25 pg/mL. A SEQ ID NO: 243 não expressava bem e produzia quantidades menores de proteína purificada. Dois mg/mL de AT-103 da BioCatalytics (BioCatalytics, Pasadena, CA) foram utilizados como a D-aminotransferase. Os seguintes foram adicionados por 1 mL de mistura de reação: aldolase, 4 mM de MgCI2, 50 mM de D-triptofano, D-aminotransferase, 200 mM de piruvato de sódio, 100 mM de tampão de fosfato de potássio pH 7,5 e 0,05 mM de PLP. As amostras foram incubadas a 30Ό. Foram tiradas amostras em trinta minutos, 1 hora, 3 horas e durante a noite (19 horas). A Tabela 25 mostra os resultados médios de monatina total produzida em cada ponto de tempo e a % de R,R monatina produzida, que é determinada pelas áreas dos picos em fase inversa.
Petição 870170009999, de 15/02/2017, pág. 488/1247
479/788
Na coluna 3 da Tabela 25, a análise de LC/MS/MS de derivatização com FDAA adicional como descrito no Exemplo 1 foi realizada para algumas das reações e tais resultados são mostrados entre parênteses.
Tabela 25: Monatina total produzida partindo de D-triptofano e % de R,R
Aldolase (h) Monatina total (ppm) % de R,R monatina
SEQ ID NO: 28 (0,5) 16 99,1
SEQ ID NO: 28 (1) 53,2 99,2 (99,0)
SEQ ID NO: 28 (3) 207,8 98,6 (98,1)
SEQIDNO: 28 (19) 544,9 95,3 (93,2)
SEQ ID NO: 44 (0,5) 46,2 88,0
SEQIDNO: 44 (1) 92,5 86,8
SEQ ID NO: 44 (3) 319,7 76,4
SEQIDNO: 44 (19) 762,9 67,1
SEQ ID NO: 54 (0,5) 35,3 96,2
SEQIDNO: 54 (1) 82,7 96,1
SEQ ID NO: 54 (3) 280,1 92,9
SEQIDNO: 54 (19) 715,3 77,1
SEQ ID NO: 74 (0,5) 51,1 92,6
SEQ ID NO: 74 (1) 89,3 94,3
SEQ ID NO: 74 (3) 269,5 89,9
SEQ ID NO: 74(19) 701,9 76,2
SEQ ID NO: 50 (0,5) 55,9 96,7
SEQIDNO: 50 (1) 96,5 96,2
SEQ ID NO: 50 (3) 272,2 95,6
SEQIDNO: 50 (19) 645,8 88,5
SEQIDNO: 162 (0,5) 37,3 95,7
SEQ ID NO: 162 (1) 75,0 97,1
SEQIDNO: 162 (3) 261,0 95,9
SEQ ID NO: 162 (19) 633,1 87,0
SEQ ID NO: 276 (0,5) 37,8 98,8
Petição 870170009999, de 15/02/2017, pág. 489/1247
480/788
Aldolase (h) Monatina total (ppm) % de R,R monatina
SEQ ID NO: 276 (1) 71,2 99,3 (99,5)
SEQ ID NO: 276 (3) 245,2 99,0 (99,0)
SEQIDNO: 276 (19) 585,4 96,7 (96,1)
SEQ ID NO: 244 (0,5) 30,2 97,7
SEQ ID NO: 244 (1) 46,4 98,3 (99,2)
SEQ ID NO: 244 (3) 165 98,4 (98,7)
SEQ ID NO: 244 (19) 572,5 95,6 (93,7)
SEQ ID NO: 228 (0,5) 52 95,0
SEQ ID NO: 228 (1) 81,7 96,5
SEQ ID NO: 228 (3) 251 95,9
SEQ ID NO: 228 (19) 723 87,1
sem aldolase (0,5) 0
sem aldolase (1) 0
sem aldolase (3) 0,6 58,3
sem aldolase (19) 6,5 61,5
[00906] A aldolase da SEQ ID NO: 276 manteve um alto nível de atividade, assim como a estereoespecificidade mais alta para a produção de R,R monatina. O armazenamento desta enzima em um tampão omitindo o cloreto de sódio parece reduzir o nível de precipitação observado anteriormente. A concentração de magnésio no tampão de armazenamento não parece ter um impacto sobre o nível de precipitação.
[00907] Todas as aldolases das SEQ ID NO: 276, SEQ ID NO: 28 e SEQ ID NO: 244 demonstraram alta atividade e alta estereosseletividade em relação à produção de R,R monatina. Estas três enzimas foram preparadas como descrito no Exemplo 23 e analisadas de forma anaeróbica, como descrito no Exemplo 24, utilizando frascos de soro de 10 mL. Ensaios de sete mL foram realizados utilizando 0,05 mg/mL de cada aldolase (purificada) e 2 mg/mL de D-aminotransferase de purificada de B. sphaericus preparada como descrito no Exemplo 24. A atividade de cada aldolase na produção de monatina partindo de DPetição 870170009999, de 15/02/2017, pág. 490/1247
481/788 triptofano foi comparada com a da HMG aldolase de S. meliloti preparada como descrito no Exemplo 27. A monatina total foi estimada utilizando o método de LC-OPA descrito no Exemplo 1. A porcentagem de R,R monatina formada foi determinada utilizando o método de derivatização com FDAA descrito no Exemplo 1. Os resultados são mostrados abaixo na Tabela 26.
Tabela 26
Aldolase Tempo (h) Monatina (g/L) % de R,R formada
S. meliloti 23 3,9 82,0
SEQ ID NO: 28 23 4,0 84,6
SEQ ID NO: 276 23 4,0 95,7
SEQ ID NO: 244 23 3,7 88,8
S. meliloti 47 4,5 76,2
SEQ ID NO: 28 47 4,3 84,6
SEQ ID NO: 276 47 4,3 93,2
SEQ ID NO: 244 47 4,5 85,2
[00908] Estes resultados demonstram que a aldolase da SEQ ID NO: 276 produz altos níveis de R,R monatina também em reações anaeróbicas de volume maior.
Exemplo 23
Expressão e Purificação da aldolase da SEQ ID NO: 276 [00909] A clonagem do hospedeiro E. coli BL21(DE3)pLysS que carrega o gene da aldolase listado como a SEQ ID NO: 275 no plasmídeo pET28b é descrita anteriormente no Exemplo 22.
[00910] A aldolase da SEQ ID NO: 276 com uma marcação de purificação HIS6 amino-terminal foi produzida utilizando o EMD Biosciences Overnight Express System II (Novagen, Madison, Wl) (soluções 16) contendo 50 pg/ml_ de canamicina em frascos de agitação. Este sistema de expressão induz a expressão de sistemas que podem ser induzidos por IPTG sem a necessidade de monitorar o crescimento celular. Após a inoculação de alíquotas de 200 mL do meio (em frascos de
Petição 870170009999, de 15/02/2017, pág. 491/1247
482/788
L) de culturas líquidas ou de placas do constructo de aldolase, as culturas foram incubadas a 30Ό durante a noite com agitação a 225 rpm. Quando a DO600nm atingiu um mínimo de 6, as células foram coletadas por centrifugação e lavadas uma vez com tampão.
[00911] Para preparar o extrato isento de células contendo a aldolase, as células foram suspensas em 3-4 volumes de 100 mM de fosfato de potássio, pH 7,8 e então rompidas utilizando um homogeneizador da Microfluidics (Microfluidics, Newton, MA) (3 passagens a 124,10 MPa (18.000 psi)), mantendo a temperatura da suspensão em menos de 15Ό. Alternativamente, o extrato isento de células foi preparado utilizando EMD Biosciences BugBuster® (isento de amina primária) Extration Reagent (Novagen, Madison, Wl) contendo 1 pL/mL de Benzonase® Nuclease, 5 pL/mL de Protease Inhibitor Cocktail Set II e 0,033 pL/mL de rLysozyme® seguindo o protocolo do fabricante. Todas as etapas de purificação subseqüentes foram realizadas a 4Ό. A suspensão de células foi centrifugada durante 20-30 minutos a 15.00020.000 x g para remover os restos celulares. Uma alíquota de 20-25 mL do extrato isento de células foi aplicada em uma coluna de 45 mL de resina GE Healthcare Chelating Sepharose® Fast Flow (forma de níquel (II)) (GE Healthcare, Piscataway, NJ) que foi previamente equilibrada com 100 mM de fosfato de potássio contendo 200 mM de cloreto de sódio. Para produzir a forma de níquel da resina, a resina foi lavada com 150 mL de 200 mM de sulfato de níquel (II) hexahidratado e então com 150 mL de água destilada. Após carregar a amostra, a coluna foi lavada/eluída com 150 mL do tampão de equilíbrio contendo 25 mM de imidazol, 150 mL do tampão de equilíbrio contendo 50 mM de imidazol e 150 mL do tampão de equilíbrio contendo 500 mM de imidazol. A proteína marcada com The HIS6 foi eluída na última lavagem. A lavagem com 500 mM de imidazol foi concentrada com dispositivos de filtro por centrifugação Millipore/Amicon Centricon Plus-70
Petição 870170009999, de 15/02/2017, pág. 492/1247
483/788 (MWCO 10 kDa) (Millipore, Billerica, MA) em 15-20 mL de acordo com as instruções do fabricante. O imidazol e o cloreto de sódio foram removidos através da passagem ao longo de colunas GE Healthcare PD10 descartáveis (GE Healthcare, Piscataway, NJ) (2,5 mL de amostra por coluna) equilibradas previamente com 100 mM de fosfato de potássio, pH 7,8. A aldolase purificada foi eluída com 3,5 mL por coluna do mesmo tampão.
[00912] A concentração de proteína de cada fração foi determinada utilizando o kit de ensaio Pierce BCA (Pierce, Rockford, IL) utilizando BSA como o padrão de proteína. A pureza de cada fração e o nível de expressão no extrato isento de células foram determinados utilizando um Bio-Rad Experion microcapillary chip system (Bio-Rad, Hercules, CA) ou utilizando géis com gradiente de 4-15% de SDS-poliacrilamida da Bio-Rad corridos em um aparato de células Mini PROTEAN® 3 (BioRad, Hercules, CA). A proteína foi visualizada nos géis de poliacrilamida utilizando a coloração Bio-Rad Bio-Safe G-250 Coomassie (BioRad, Hercules, CA) e descorados com água. Tipicamente, este procedimento produz ~ 50 mg de enzima partindo de 400 mL de cultura durante a noite que é 85-95% pura como é julgado pelo Experion software. Alíquotas (1-5 mL) da enzima purificada foram armazenadas a 80Ό até o uso. A preparação da enzima desta maneira reduziu o nível de precipitação da enzima observado anteriormente. A presença de magnésio no tampão de armazenamento não tinha efeito sobre o nível de precipitação.
Exemplo 24
Produção de R,R-monatina Utilizando a Aldolase da SEQ ID NO: 276:
Otimização das Condições de Reação [00913] A D-alanina aminotransferase de Bacillus sphaericus (ATCC cepa 10208) clonada no Exemplo 7 foi purificada na forma da proteína marcada com HIS6 como descrito abaixo utilizando o EM D
Petição 870170009999, de 15/02/2017, pág. 493/1247
484/788
Biosciences Overnight Express System II (Novagen, Madison, Wl) para cultivo e indução. O EMD Biosciences Overnight Express System II (soluções 1-6) (Novagen, Madison, Wl) continha 50 pg/mL de canamicina em frascos de agitação. Este sistema de expressão induz a expressão de sistemas que podem ser induzidos com IPTG sem a necessidade de monitorar o crescimento celular. Após a inoculação de alíquotas de 200 mL do meio (em frascos de 1 L) de culturas líquidas ou de placas do constructo de aminotransferase, as culturas foram incubadas a 30Ό durante a noite com agitação a 225 rpm. Quando a D06oonm atingiu um mínimo de 6, as células foram coletadas por centrifugação e lavadas uma vez com tampão.
[00914] Para preparar o extrato isento de células contendo a Dalanina aminotransferase, as células foram suspensas em 3-4 volumes de 100 mM de fosfato de potássio, pH 7,8, contendo 50 μΜ de fosfato piridoxal (PLP) e então rompidas utilizando um homogeneizador da Microfluidics (Microfluidics, Newton, MA) (3 passagens a 124,10 MPa (18.000 psi)), mantendo a temperatura da suspensão em menos de 15Ό. Alternativamente, o extrato isento de células foi preparado utilizando o EMD Biosciences BugBuster® (isento de amina primária) Extration Reagent (Novagen, Madison, Wl) contendo 1 pL/mL de Benzonase® Nuclease, 5 pL/mL de Protease Inhibitor Cocktail Set II e 0,033 pL/mL de rLysozyme® seguindo o protocolo do fabricante. Todas as etapas de purificação subseqüentes foram realizadas a 4Ό. O extrato de células foi centrifugado durante 20-30 minutos a 15.000 x g para remover os restos celulares. Uma alíquota de 20-25 mL do extrato isento de células foi aplicada em uma coluna de 45 mL de resina GE Healthcare Chelating Sepharose® Fast Flow (forma de níquel (II)) (GE Healthcare, Piscataway, NJ) que foi previamente equilibrada com 100 mM de fosfato de potássio contendo 200 mM de cloreto de sódio e 50 pM de PLP. Para gerar a forma de níquel da resina, a resina foi lavada
Petição 870170009999, de 15/02/2017, pág. 494/1247
485/788 com 150 mL de 200 mM de sulfato de níquel (II) hexahidratado e então com 150 mL de água destilada. Após carregar a amostra, a coluna foi lavada/eluída com 150 mL do tampão de equilíbrio contendo 25 mM de imidazol, 150 mL do tampão de equilíbrio contendo 50 mM de imidazol e 150 mL do tampão de equilíbrio contendo 500 mM de imidazol. A proteína marcada com HIS6 foi eluída na última lavagem. A lavagem com 500 mM de imidazol foi concentrada com dispositivos de filtro por centrifugação Millipore/Amicon Centricon Plus-70 (MWCO 10 kDa) (Millipore, Billerica, MA) em 15-20 mL de acordo com as instruções do fabricante. O imidazol e o cloreto de sódio foram removidos através da passagem ao longo de colunas GE Healthcare PD10 descartáveis (GE Healthcare, Piscataway, NJ) (2,5 mL de amostra por coluna) previamente equilibradas com 100 mM de fosfato de potássio, pH 7,8 contendo 0,5 μΜ de PLP. A aminotransferase purificada foi eluída com 3,5 mL por coluna do mesmo tampão.
[00915] A concentração de proteína de cada fração foi determinada utilizando o kit de ensaio Pierce BCA (Pierce, Rockford, IL) com BSA como o padrão de proteína. A pureza de cada fração e o nível de expressão na fração do extrato isento de células foram determinados utilizando um Bio-Rad Experion microcapillary chip system (Bio-Rad, Hercules, CA) ou utilizando géis com gradiente de 4-15% de SDSpoliacrilamida da Bio-Rad (Bio-Rad, Hercules, CA) corridos em um aparato de células Mini PROTEAN® 3. A proteína foi visualizada nos géis de poliacrilamida utilizando a coloração Bio-Rad Bio-Safe G-250 Coomassie (Bio-Rad, Hercules, CA) e descorados com água. Tipicamente, este procedimento produz ~ 50 mg de enzima partindo de 200 mL de cultura durante a noite que é 85-90% pura como é julgado pelo Experion software ou partindo da análise dos géis de SDS-PAGE. Alíquotas (1-5 mL) da enzima purificada foram armazenadas a -80Ό até o uso.
Petição 870170009999, de 15/02/2017, pág. 495/1247
486/788 [00916] A aldolase da SEQ ID NO: 276 (clonada no Exemplo 22) foi purificada na forma da proteína marcada com HIS6 como descrito no Exemplo 23.
[00917] O co-fator metálico preferido para a aldolase da SEQ ID NO: 276 foi determinado através da verificação de uma variedade de metais divalentes. As reações foram ajustadas anaerobicamente em garrafas de soro de 10 ml_ com volumes finais de 7 ml_. Uma solução de massa consistindo de 100 mM de fosfato de potássio (pH 7,8), 200 mM de piruvato de sódio, 0,05 mM de PLP e 0,01% (v/v) de Tween 80 foi preparada em um volume final de 48,8 ml_ e purgada com nitrogênio durante 30 minutos. O D-Triptofano (143 mg; concentração final de 100 mM) foi distribuído em sete frascos de soro de 10 ml_. A cada um dos frascos foi adicionado 0,014 ml_ de uma solução estoque a 2 M de um cátion metálico divalente, preparada partindo do sal de cloreto (concentração final de 4 mM). Para o controle negativo, 0,014 ml_ de dH2O foi adicionado. Os frascos de soro foram tampados com membrana de borracha e purgados com nitrogênio através de agulhas de calibre 16-18. Sob condições anaeróbicas, 5,625 ml_ da solução de massa anaeróbica foram adicionados em cada garrafa de soro anaeróbica. Subseqüentemente, a D-alanina aminotransferase de B. sphaericus e a aldolase da SEQ ID NO: 276 foram adicionadas anaerobicamente em cada garrafa de soro em uma concentração final de 2 mg/mL e 0,05 mg/mL, respectivamente. As soluções foram incubadas à temperatura ambiente com agitação suave durante 18 horas. A monatina final foi analisada de acordo com os métodos descritos no Exemplo 1 utilizando o método de Detecção de Aminoácidos Por Fluorescência Pós-Coluna por Cromatografia Líquida. (Tabela 27).
Petição 870170009999, de 15/02/2017, pág. 496/1247
487/788
Tabela 27
Co-fator Metálico Monatina Final (mM) em 18 h
Nenhuma (controle negativo) 1,7
Magnésio 10,6
Manganês 10,0
Cobalto 6,7
Zinco 4,9
Níquel 1,5
Cálcio 0,7
[00918] As condições de reação para a aldolase da SEQ ID NO: 276 foram adicionalmente investigadas com um experimento fatorial em dois níveis planejado utilizando o software de estatística Design Expert 7.0.0 (Stat-Ease, Inc.; Minneapolis, MN). O planejamento da verificação consistia de um único bloco de cinco fatores em dois níveis com pontos centrais (total de 20 corridas). Os cinco fatores que seriam otimizados eram a concentração do co-fator metálico, o pH da reação, a concentração de Tween® 80, a proporção de piruvato em relação ao triptofano e a concentração de aldolase (Tabela 28).
[00919] Tubos de polipropileno cônicos (14 mL) contendo 143 mg de D-triptofano foram desoxigenados em uma câmara anaeróbica com luvas (Coy Laboratory Products, Inc; Grass Lake, Ml) durante a noite. Soluções estoque de 2 M de MgCI2; 1 M de fosfato de potássio em pH 7,0, 7,75 e 8,5; 10% (v/v) de Tween® 80; 2 M de piruvato de sódio e 10 mM de PLP (5-fosfato piridoxal) foram preparadas em água degaseificada e equilibradas na câmara anaeróbica com luvas durante a noite. As soluções estoque de D-alanina aminotransferase purificada de B. sphaericus e da aldolase da SEQ ID NO: 276 foram descongeladas em gelo e utilizadas na câmara anaeróbica com luvas imediatamente. As soluções estoque foram adicionadas nos tubos cônicos de 14 mL contendo o D-triptofano para a obtenção das concentrações determinadas pelo planejamento estatístico (Tabela 28). A água degaseificada
Petição 870170009999, de 15/02/2017, pág. 497/1247
488/788 foi adicionada em cada tubo para levar o volume final, junto com as adições de enzima, para 7,0 mL. Os tubos foram incubados à temperatura ambiente na câmara anaeróbica com luvas com agitação suave durante até 24 horas. A concentração de monatina e a pureza isomérica foram analisadas de acordo com os métodos descritos no Exemplo 1 utilizando o método de Detecção de Aminoácidos por Fluorescência Pós-Coluna por Cromatografia Líquida e método de Monitoramento de Reação Múltiplo por LC/MS/MS para a Determinação da Distribuição de Estereoisômeros de Monatina em Reações in vitro e in vivo (método de derivatização com FDAA).
Tabela 28
# da Corrida Padrão # Bloco Mg (mM) pH Tween® (%) Pyr:Trp Aldolase da SEQ ID NO: 276 (mg/mL)
20 1 Bloco 1 5,00 7,75 0,01 2,00 0,05
8 2 Bloco 1 9,00 8,50 0,02 1,00 0,01
3 3 Bloco 1 1,00 8,50 0,00 1,00 0,01
16 4 Bloco 1 9,00 8,50 0,02 3,00 0,09
7 5 Bloco 1 1,00 8,50 0,02 1,00 0,09
12 6 Bloco 1 9,00 8,50 0,00 3,00 0,01
6 7 Bloco 1 9,00 7,00 0,02 1,00 0,09
2 8 Bloco 1 9,00 7,00 0,00 1,00 0,01
15 9 Bloco 1 1,00 8,50 0,02 3,00 0,01
4 10 Bloco 1 9,00 8,50 0,00 1,00 0,09
5 11 Bloco 1 1,00 7,00 0,02 1,00 0,01
1 12 Bloco 1 1,00 7,00 0,00 1,00 0,09
13 13 Bloco 1 1,00 7,00 0,02 3,00 0,09
14 14 Bloco 1 9,00 7,00 0,02 3,00 0,01
17 15 Bloco 1 5,00 7,75 0,01 2,00 0,05
11 16 Bloco 1 1,00 8,50 0,00 3,00 0,09
18 17 Bloco 1 5,00 7,75 0,01 2,00 0,05
9 18 Bloco 1 1,00 7,00 0,00 3,00 0,01
Petição 870170009999, de 15/02/2017, pág. 498/1247
489/788
# da Corrida Padrão # Bloco Mg (mM) pH Tween® (%) Pyr:Trp Aldolase da SEQ ID NO: 276 (mg/mL)
19 19 Bloco 1 5,00 7,75 0,01 2,00 0,05
10 20 Bloco 1 9,00 7,00 0,00 3,00 0,09
[00920] A análise estatística dos dados indicou que o pH da reação, a proporção de piruvato:triptofano e a concentração de aldolase eram os fatores significativos que afetavam o título da monatina, a pureza isomérica e o rendimento de carbono. Um gráfico de qualidade de aproveitamento foi gerado utilizando o Design Expert software em que os fatores eram variados com a finalidade de maximizar os objetivos de título mais alto de monatina e pureza isomérica mais alta sob condições de piruvato em excesso. As condições de reação indicaram como ótimo sendo 1 mM de MgCI2, pH >8,0, 0,01% (v/v) de Tween®80 e 0,01 mg/mL da aldolase da SEQ ID NO: 276. Esta é uma redução de 5 vezes na quantidade típica de aldolase utilizada, assim como uma redução de 4 vezes na quantidade de metal divalente utilizada tipicamente.
[00921] Experimentos adicionais foram realizados para determinar a faixa ótima de pH para o processo de reação. Soluções estoque de 1 M de tampão EPPS foram preparadas em incrementos de 0,2 unidade de pH entre pH 7,0 e 9,0. Estas soluções foram degaseificadas e equilibradas na câmara anaeróbica com luvas durante a noite. Os tubos de polipropileno (14 mL) contendo 143 mg de D-triptofano foram desoxigenados em uma câmara anaeróbica com luvas durante a noite. Soluções estoque de 2 M de MgCI2, 10% (v/v) de Tween® 80, 2 M de piruvato de sódio e 10 mM de PLP foram preparadas em água degaseificada e equilibradas na câmara anaeróbica com luvas. As preparações de D-alanina aminotransferase purificada de B. sphaerícus e aldolase da SEQ ID NO: 276 foram descongeladas em gelo e utilizadas imediatamente na câmara anaeróbica com luvas. As soluções estoque
Petição 870170009999, de 15/02/2017, pág. 499/1247
490/788 foram adicionadas nos tubos cônicos de 14 mL para fornecer uma concentração final de 100 mM de EPPS, 200 mM de piruvato, 100 mM de triptofano, 1 mM de MgCI2, 0,01% (v/v) de Tween® 80, 0,05 mM de PLP, 2 mg/mL de D-alanina aminotransferase de B. sphaericus e 0,01 mg/mL de aldolase da SEQ ID NO: 276 em um volume total de 7 mL por tubo. As reações foram incubadas à temperatura ambiente na câmara anaeróbica com luvas com agitação suave durante 22 horas. As amostras foram removidas e analisadas em relação à monatina como descrito no Exemplo 1 utilizando o método de monitoramento de reação múltiplo por LC/MS/MS (Tabela 29).
Tabela 29
pH da Reação Monatina (mM) em 22 h
7,0 5,8
7,2 9,9
7,4 7,8
7,6 10,6
7,8 14,0
8,0 14,2
8,2 14,3
8,4 12,6
8,6 12,3
8,8 10,8
9,0 11,1
Ό0922] Os resultados indicaram que a formação de monatina aumentou com o aumento do pH entre 7,0 - 8,0. A formação de monatina atingiu um máximo na faixa de pH 8,0 - 8,2 e diminuiu acima de pH 8,4. Adicionalmente, a pureza isomérica da monatina diminui acima de pH 8,4.
[00923] A otimização adicional da reação foi feita utilizando a aldolase da SEQ ID NO: 276 (0,01 mg/mL), 2 mg/mL da T243N 4978 DAT (não marcada, do Exemplo 26), 1 mM de MgCI2, 200 mM de piruvato
Petição 870170009999, de 15/02/2017, pág. 500/1247
491/788 de sódio, 0,05 mM de PLP, 0,01% Tween-80 e 100 mM de D-triptofano em pH 8,5. As células utilizadas para produzir a aldolase e a Daminotransferase foram rompidas em 50 mM de EPPS, pH 8,4 utilizando um homogeneizador da Microfluidics (Microfluidics, Newton, MA) (3 passagens em 137,89 MPa (20.000 psi)). Os restos celulares foram removidos por centrifugação (20.000 x g durante 30 minutos) e os extratos de células clarificados foram utilizados nas reações enzimáticas. Não foi utilizado tampão adicional, mas as misturas de reação foram ajustadas em pH 8,5 utilizando hidróxido de sódio e purgadas com nitrogênio antes da adição de enzima. Reações de duzentos e cinqüenta mL foram realizadas em fermentadores agitados Sixfor de 0,7 L (Infors AG, Bottmingen, Suíça) a 30Ό utiliza ndo nitrogênio na câmara principal. O fosfato de potássio foi adicionado em uma concentração final de 0, 5, 10, 20 e 50 mM. Foi observado que a adição de 510 mM de fosfato era ótima, produzindo 3,5 g/L de monatina (quantificada por LC/MS/MS como descrito no Exemplo 1).
Exemplo 25
Clonagem de uma Nova D-Aminoácido Aminotransferase de Bacillus [00924] Uma D-aminoácido aminotransferase de Bacillus (DAAT ou DAT) (EC 2.6.1.21, também conhecida como D-alanina aminotransferase ou D-aspartato aminotransferase) foi produzida de forma recombinante. Esta aminotransferase foi utilizada em ensaios acoplados com aldolases para a produção de R,R monatina. Esta enzima aminotransferase é homóloga às D-aminotransferases descritas anteriormente para a produção de monatina (Pedido de Patente U.S. Publicado N° 20040063175 e Pedido de Patente U.S. Publicado N° 20050282260). O organismo ATCC 4978--Bacillus sphaericus depositado originalmente como Bacillus rotans-fo\ encomendando na ATCC e utilizado para preparar DNA genômico. Iniciadores degenerados foram planejados nas regiões de conservação de sequência de proteína de
Petição 870170009999, de 15/02/2017, pág. 501/1247
492/788
D-aminotransferases conhecidas de Bacillus e utilizados para a amplificação pela reação em cadeia da polimerase (PCR) da sequência do gene DAAT interna da cepa da ATCC mencionada anteriormente. Walking genômico foi realizado utilizando o BD GenomeWalker® Universal Kit (Clontech, Mountain View, CA). As análises das sequências (Agencourt BioScience Corporation, Beverly, MA) verificaram uma sequência codificadora de comprimento completo para o gene DAAT da ATCC 4978. A sequência de DNA do gene DAAT da ATCC 4978 é a SEQ ID NO: 357 e é mostrada abaixo. O gene da SEQ ID NO: 357 pode ser amplificado através de protocolos de PCR padronizados e clonado utilizando técnicas do DNA recombinante padronizadas. O gene da SEQ ID NO: 357 pode ainda ser reconstruído através de qualquer método conhecido por um perito comum na técnica, tal como métodos de PCR de montagem conhecidos por um versado na técnica.
[00925] A sequência de DNA de DAAT da ATCC 4978 é: atgagttata gcttatggaa tgaccaaatt gtgaatgatg aagaagtagt agttgataag gaggaccgtg gctatcaatt tggcgatggt gtttatgaag ttgtaaaagt atataacggt gaattattta cagcggagga gcatgtcgat cgtttttacg cgagtgctga aaaaattcgc gttacgatcc cttatacaaa agacaaattg catcaattat tgcatcagtt agttgaaatg aataaagttc aaacaggaca tatttatttc caaattacgc gtggtgcagg ccctcgtaat catattttcc ctggtgatga agtgaagcca gtattaacag gtaataccaa ggaaaatcca cgtcccgtag caaactttga aaaaggtgtg aaagcaacat ttgtagaaga cattcgttgg ttacgctgtg acattaaatc attaaattta cttggtgcgg tacttgctaa acaagaagca catgaaaaag gatgctatga agcggtttta catcgtgatg aaatcgtaac agaaggctct tcttcaaata tttatggaat taaagatggc gtattataca cacatccagc gaataacttc atcttaaatg gtattacacg tcaagtaatc attaaatgtg ctgctgaaat tggcttacca gtgaaggaag aagcaatgac aaaaactcag cttcttgcaa tggatgaagt gattgtttca tcaacgactt cagaagtaac gccaattatc gacatagatg gaacagtaat tggtgcgggt aaaccgggtg actggacacg taaattacaa gcacaatttg atacgaaaat cccaaaaggt attcgcgcat aa
Petição 870170009999, de 15/02/2017, pág. 502/1247
493/788 (SEQ ID NO: 357) [00926] A sequência de aminoácidos do gene DAAT da ATCC 4978 que é codificada pela sequência de DNA anterior é a SEQ ID NO: 358 e é mostrada abaixo:
Met Ser Tyr Ser Leu Trp Asn Asp Gin lie Vai Asn Asp Glu Glu Vai Vai Vai Asp Lys Glu Asp Arg Gly Tyr Gin Phe Gly Asp Gly Vai Tyr Glu Vai Vai Lys Vai Tyr Asn Gly Glu Leu Phe Thr Ala Glu Glu His Vai Asp Arg Phe Tyr Ala Ser Ala Glu Lys lie Arg Vai Thr lie Pro Tyr Thr Lys Asp Lys Leu His Gin Leu Leu His Gin Leu Vai Glu Met Asn Lys Vai Gin Thr Gly His lie Tyr Phe Gin lie Thr Arg Gly Ala Gly Pro Arg Asn His lie Phe Pro Gly Asp Glu Vai Lys Pro Vai Leu Thr Gly Asn Thr Lys Glu Asn Pro Arg Pro Vai Ala Asn Phe Glu Lys Gly Vai Lys Ala Thr Phe Vai Glu Asp lie Arg Trp Leu Arg Cys Asp lie Lys Ser Leu Asn Leu Leu Gly Ala Vai Leu Ala Lys Gin Glu Ala His Glu Lys Gly Cys Tyr Glu Ala Vai Leu His Arg Asp Glu lie Vai Thr Glu Gly Ser Ser Ser Asn lie Tyr Gly lie Lys Asp Gly Vai Leu Tyr Thr His Pro Ala Asn Asn Phe lie Leu Asn Gly lie Thr Arg Gin Vai lie lie Lys Cys Ala Ala Glu lie Gly Leu Pro Vai Lys Glu Glu Ala Met Thr Lys Thr Gin Leu Leu Ala Met Asp Glu Vai lie Vai Ser Ser Thr Thr Ser Glu Vai Thr Pro lie lie Asp lie Asp Gly Thr Vai lie Gly Ala Gly Lys Pro Gly Asp Trp Thr Arg Lys Leu Gin Ala Gin Phe Asp Thr Lys lie Pro Lys Gly lie Arg Ala (SEQ ID NO: 358) [00927] A nova D-aminotransferase obtida da cepa ATCC 4978 tem uma sequência de proteína que possui alterações de resíduos de aminoácidos distintos quando comparada com a sequência de Daminotransferase publicada para B. sphaericus ATCC 10208. A DAAT da ATCC 4978 possui apenas 72% de identidade com a DAAT de B. sphaericus (ATCC 10208). Embora esta cepa esteja atualmente listada como B. sphaericus na ATCC, foi depositada como B. rotans. Com base nos alinhamentos de sequências e nas diferenças destacadas entre
Petição 870170009999, de 15/02/2017, pág. 503/1247
494/788 esta nova DAAT e a DAAT de B. sphaericus, é identificado um número de resíduos candidatos que pode ser avaliado em relação a sua função (individualmente ou em combinação) no aumento da atividade de DAAT para a biossíntese de R,R monatina, nestas, assim como em outras sequências de DAAT.
Exemplo 26
Caracterização de mutantes de D-aminotransferase da ATCC 4978
Resumo Experimental [00928] O novo gene de D-aminotransferase (descrito no Exemplo 25) de Bacillus cepa ATCC 4978 foi submetido à mutagénese utilizando métodos direcionados ao sítio. Os genes mutantes foram expressos e analisados em relação às atividades de interesse para as vias de produção de monatina, especialmente quando acoplados com uma ou mais aldolases.
[00929] Em adição às idéias listadas no Exemplo 16 para a mutagênese direcionada ao sítio, outras idéias foram desenvolvidas através do acoplamento real do R-MP no sítio ativo da estrutura em cristal YM1 e os alinhamentos de sequências de aminoácidos primárias foram utilizados para determinar se a proteína aminotransferase 4978 provavelmente tinha características estruturais similares em tal região. Era esperado que as mutações adicionais a seguir fossem benéficas (utilizando a numeração de aminoácidos da aminotransferase 4978). Acreditava-se que a mutagénese da alanina 153 em arginina estabilizaria o segundo grupo carboxila do substrato (R-MP). É provável que esta alteração aumente o impedimento estérico, de forma a compensar os resíduos de serina nas posições 181 e 182 que foram alterados para alanina ou glicina. Também foi levantada a hipótese de que poderia ser introduzida uma arginina na posição 180, 181 ou 182 e converter um ou mais dos outros resíduos de serina em alanina ou glicina para obter espaço para a cadeia lateral mais volumosa da arginina. A fenilaPetição 870170009999, de 15/02/2017, pág. 504/1247
495/788 lanina no aminoácido 200 fica espacialmente próxima ao local onde é previsto que o R-MP se acopla no sítio ativo e há uma grande quantidade de variabilidade neste resíduo entre as D-aminotransferases que catalisam a transaminação da monatina razoavelmente bem. Acreditava-se que modificações de aminoácidos nesta posição poderíam ser úteis. Foi previsto que a mutação da leucina 151 em fenilalanina aumenta potencialmente as interações com o anel indol do substrato. [00930] Com base na literatura, foi levantada a hipótese de que a mutação da treonina 243 em asparagina pode aumentar a seletividade do R-MP em relação às reações de transaminação. Similarmente, acreditava-se que a mutagênese da asparagina 100 em alanina podería aumentar a atividade específica da enzima em relação às reações de transaminação da monatina (Ro e outros, FEBS Lett 398:141-145, (1996); Sugio, S e outros, Biochemistry 34:9661-9669, (1995); EP1580268).
[00931] Lee e outros caracterizaram mutantes da região 141-144 (alça) e descobriram que as D-aminotransferases com o EYcY ao invés de com o LRcD (que é nativo da proteína dos presentes inventores) tendem a ter um Km menor em relação a substratos de ácido dicarboxílico. (Lee SG, Hong SP, Song JJ, Kim SJ, Kwak MS, Sung MH. Functional and structural characterization of thermostable D-amino acid aminotransferases from Geobacillus spp. Appl Environ Microbiol. Fevereiro de 2006; 72(2):1588-94). Devido ao fato de que o MP é um substrato de ácido dicarboxílico, similar ao alfa-ceto glutarato e das concentrações de MP serem razoavelmente baixas em uma mistura de reação para produção de monatina típica, um Km menor podería potencialmente ajudar na atividade de um DAT mutante em relação à produção de monatina.
[00932] Abaixo, estão descritos métodos para a criação de mutantes da D-aminotransferase 4978, assim como resultados de ensaios
Petição 870170009999, de 15/02/2017, pág. 505/1247
496/788 utilizando estes mutantes.
Mutagênese [00933] Os iniciadores para mutagênese foram planejados seguindo as sugestões listadas no kit Stratagene Multi-Change (Stratagene, La Jolla, CA). Os iniciadores foram fosforilados a 5'. A mutagênese foi realizada utilizando o kit Stratagene Multi-Change (Stratagene, La Jolla, CA) seguindo as instruções do fabricante. Os moldes utilizados para mutagênese eram os constructos de DAT 4978 em pET30 (não marcado) ou em pET28 (marcado) descritas no Exemplo 25. Os iniciadores estão listados abaixo na Tabela 30:
Tabela 30
Nome do Mutante Alteração de aminoácido Iniciador
4978-22 T243N GTGATTGTTTCATCAACGAATTCAGAAG TAACGCC (SEQ ID NO:359)
10 T243R GTGATTGTTTCATCAACGCGTTCAGAAG TAACGCC (SEQ ID NO:360)
7 T243S GTGATTGTTTCATCAACGAGTTCAGAAG TAACGCC (SEQ ID NO:361)
19 T243A GTGATTGTTTCATCAACGGCTTCAGAAG TAACGCC (SEQ ID NO:362)
15 N100A GTGCAGGCCCTCGTGCTCATATTTTCCC TGG (SEQ ID NO:363)
B T243Q GAAGTGATTGTTTCATCAACGCAGTCAG AAGTAACGCCAATTATC (SEQ ID NO:364)
2 T243N/N100 iniciadores anteriores utilizados juntos
[00934] Células E. coli XL10-Gold (Stratagene, La Jolla, CA) foram
transformadas e as preparações de plasmídeos purificados resultantes foram seqüenciadas para verificar que as mutações corretas foram incorporadas.
Expressão e Ensaio [00935] As preparações de DNA plasmideal contendo os mutantes
Petição 870170009999, de 15/02/2017, pág. 506/1247
497/788 corretos ou o DAT 4978 do tipo selvagem foram transformadas no hospedeiro de expressão de E. coli BL21(DE3) (Novagen, Madison, Wl). As culturas foram crescidas utilizando os protocolos descritos anteriormente, os plasmídeos foram isolados utilizando o Qiagen miniprep kit (Qiagen, Valencia, CA) e analisados através da digestão de restrição, como descrito anteriormente, para confirmar a presença de um inserto.
[00936] A indução do gene DAAT foi tipicamente realizada em meio LB contendo canamicina (50 pg/mL). As células foram cultivadas até uma D06oonm de 0,4-0,8 a 37G, induzidas com 0,1 mM de IPTG (isopropil tiogalactosídeo) e foram tiradas amostras 3-4 horas após a indução.
[00937] Extratos celulares foram preparados com o Reagente BugBuster e Benzonase Nuclease (Novagen, Madison, Wl). Ensaios de um mL foram realizados a 30G com agitação suave e continham 10,2 mg de D-triptofano, 0,05 mM de PLP, 4 mM de MgCI2, 100 mM de tampão de fosfato de potássio pH 7,5, aproximadamente 50 pg de aldolase, 200 mM de piruvato e 0,150-0,5 mg/mL de D-aminotransferase fornecidos na forma de extratos celulares. Os ensaios de proteína total foram feitos utilizando o kit de proteína total da Bio-Rad (Coomassie) (Bio-Rad, Hercules, CA) ou o kit Pierce BCA (Pierce, Rockford, IL) e a porcentagem de expressão da D-aminotransferase foi estimada através de SDS-PAGE ou do Bio-Rad Experion Automated Electrophoresis System (Bio-Rad, Hercules, CA). Foram tiradas amostras em 3 horas e durante a noite.
[00938] A aldolase específica a R da SEQ ID NO: 28 foi utilizada em ensaios com aproximadamente 0,150 mg/mL de Daminotransferase.
[00939] Os primeiros ensaios mostraram que os mutantes a seguir (não marcados) tinham atividade de transaminação (na ordem da mais
Petição 870170009999, de 15/02/2017, pág. 507/1247
498/788 alta para a mais baixa): T243N, T243S, T243N/N100A, N100A. Foi também observado que ο T243N parecia aumentar a estéreo pureza da R,R monatina produzida. Os ensaios foram repetidos utilizando aldolase ProA purificada de Comamonas testosteroni (100 pg/mL) e 0,50 mg/mL de D-aminotransferases mutantes (não marcadas, fornecidas na forma de extrato celular). As amostras foram tiradas em 2 horas e durante a noite. Os resultados para as proteínas ativas são mostrados abaixo, foi tirada a média de resultados em duplicata. A % de R,R monatina foi determinada através da área do pico em HPLC em fase inversa e então medida utilizando o método de derivatização com FDAA descrito no Exemplo 1. Na coluna 3 da Tabela 31, uma análise de LC/MS/MS com derivatização com FDAA adicional, como descrito no Exemplo 1, foi realizada para as mesmas reações e os resultados são mostrados entre parênteses. Apenas R,R e S,R monatinas são produzidas partindo de D-triptofano. O mutante T243R não parecia produzir monatina sob as condições testadas e o mutante T243A produzia níveis muito baixos de monatina.
Tabela 31
Enzima não marcada (tempo - h ou durante a noite) Monatina total (PPm) % de R,R
4978 do tipo selvagem (2 horas) 4,7 41,6
4978 do tipo selvagem (durante a noite) 43,2 35,1 (30,9)
T243S (2 horas) 55,0 37,4 (21,7)
T243S (durante a noite) 97,7 35,5 (29,8)
T243N (2 horas) 73,2 86,7 (88,3)
T243N durante a noite 120,9 86,3 (86,1)
N100A (2 horas) 12,0 40,8
N100A (durante a noite) 22,3 41
T243A (2 horas) 0,8 -100
T243A (durante a noite) 1,3 -100
[00940] Embora os ensaios tenham sido realizados estimando a porcentagem de D-aminotransferase utilizando o Bio-Rad Experion
Petição 870170009999, de 15/02/2017, pág. 508/1247
499/788 software, é evidente que os mutantes T243S e T243N tinham maior atividade comparada com a da enzima do tipo selvagem. O mutante T243N também forneceu um benefício adicional de aumentar drasticamente a % de R,R monatina formada. Esta enzima possui uma maior preferência por R-MP quando comparado com S-MP em reações de transaminação. O mutante N100A não aumentou a atividade isoladamente ou em combinação com T243N ao contrário do que foi sugerido na literatura. Um mutante direcionado ao sítio V34A da DAT 4978 não marcada também foi criado utilizando métodos similares, como descrito anteriormente. Foi observado que o mutante direcionado ao sítio V34A tem atividade significativamente menor que a enzima do tipo selvagem sob as condições testadas.
[00941] Um outro ponto de interesse nos ensaios iniciais era que a enzima do tipo selvagem parecia ter mais atividade quando produzida com uma marcação de His N-terminal. A mutagênese subseqüente foi realizada na versão marcada do gene. Adicionalmente, os mutantes anteriores mais promissores foram subclonados em pET28b que tinha uma marcação de His N-terminal. Estes foram purificados utilizando colunas Novagen HIS-bind e o protocolo do fabricante com os tampões recomendados (Novagen, Madison, Wl). O tampão das frações do eluente foi trocado, utilizando colunas GE Healthcare PD10 (GE Healthcare, Piscataway, NJ), pelo tampão utilizado nos ensaios.
[00942] Ensaios de um mL com D-aminotransferase purificada (0,5 mg/mL) e aldolase específica a R purificada SEQ ID NO: 276 (50 pg/mL) foram realizados a 30G com agitação suave e continham 10,2 mg de D-triptofano, 0,05 mM de PLP, 200 mM de piruvato, 4 mM de MgCI2 e 100 mM de tampão de fosfato de potássio pH 7,5. Amostras em duplicata foram incubadas durante 2 horas e durante a noite. Como um controle positivo, o DAT de Bacillus sphaericus (clonado no Exemplo 7) foi utilizado nos mesmos ensaios. Os resultados são aprePetição 870170009999, de 15/02/2017, pág. 509/1247
500/788 sentados na Tabela 32: Tabela 32
Enzima - marcada (tempo: horas ou durante a noite) Monatina total (PPm) % de R,R
4978 do tipo selvagem (2 horas) 43 98,4
4978 do tipo selvagem (durante a noite) 96,7 98,3 (95,9)
T243N (2 horas) 197,5 100
T243N durante a noite 301,2 99,9 (99,6)
DAT de B. sphaericus (2 horas) 58,2 99,7
DAT de B. sphaericus (durante a noite) 221,7 98,7 (96,6)
T243Q (2 horas) 7,1 100
T243Q (durante a noite) 12,4 98,8
[00943] Os dados anteriores mostram que o mutante T243N produz claramente a maior quantidade de monatina em 2 horas. À medida que o tempo passa, a proporção de mutante T243N mutante em relação ao controle positivo de DAT de B. sphaericus é reduzida. Este resultado sugere que o mutante T243N não é tão estável durante a reação de monatina quanto o DAT de B. sphaericus. Quando analisada sob condições similares, a enzima T243S (marcada purificada) tinha níveis similares de atividade aos do mutante T243N; entretanto, a porcentagem de R,R monatina produzida era menor (97,2% tanto em 2 h quanto durante a noite). O mutante T243N/N100A tinha atividade menor que o mutante T243N. Entretanto, tanto T243S quanto T243N/N100A tinham atividade maior que o DAT 4978 do tipo selvagem.
[00944] Ensaios de transaminação foram realizados para determinar quais taxas de reação eram aumentadas quando se utilizava o mutante T243N no lugar do DAT de B. sphaericus. Ensaios com meio mL foram realizados a 30Ό tirando pontos de tempo em 1 hora, 2 horas e 5 horas. Os ensaios continham 25 mM de monatina ou de D-triptofano, 25 mM de piruvato, 100 mM de fosfato de potássio pH 7,5, 50 μM de PLP e 0,1 mg de D-aminotransferase (marcada, purificada). N° caso
Petição 870170009999, de 15/02/2017, pág. 510/1247
501/788 em que menos de 100 pg de DAT eram utilizados, a quantidade de alanina era normalizada para 100 pg de D-aminotransferase. As amostras foram tratadas com ácido fórmico e analisadas por LC-OPA em relação à presença do co-produto, alanina. Os resultados são mostrados nas Tabelas 33 e 34.
Tabela 33: Atividade de transaminação com R,R monatina como substrato
Enzima D-alanina (mM)
DAT 4978 do tipo selvagem (2 h) 0,54
DAT 4978 do tipo selvagem (5 h) 1,11
T243N/N100A (2 h) 1,32
T243N/N100A (5 h) 2,78
T243S (2 h) 1,5
T243S (5 h) 2,61
T243N (2 h) 1,26
T243N (5 h) 2,65
DAT de B. sphaericus (2 h) 0,97
DAT de B. sphaericus (5 h) 2,2
Tabela 34: Atividade de transaminação com D-triptofano como substrato
Enzima D-alanina (mM)
DAT 4978 do tipo selvagem (1 h) 4,55
DAT 4978 do tipo selvagem (2 h) 8,47
T243N/N100A (1 h) 8,52
T243N/N100A (2 h) 12,67
T243S (1 h) 4,89
T243S (2 h) 8,1
T243N (1 h) 7,19
T243N (2 h) 10,83
DAT de B. sphaericus (1 h) 8,7
DAT de B. sphaericus (2 h) 12,54
Ό0945] Para as reações com D-triptofano, os resultados mostram
Petição 870170009999, de 15/02/2017, pág. 511/1247
502/788 que parte das enzimas atingiu o equilíbrio em 2 horas. As reações com R,R monatina claramente são limitantes da taxa e aumentos nesta atividade possuem mais impacto sobre as taxas de produção de monatina partindo de D-triptofano.
[00946] Ensaios adicionais foram realizados para verificar a estabilidade do mutante DAT 4978 T243N. A enzima do tipo selvagem também perde a atividade ao longo do tempo. O Exemplo 27 descreve métodos para aumentar a estabilidade do mutante de Daminotransferase T243N. Quando versões não marcadas e marcadas recém-preparadas do mutante T243N são preparadas e comparadas em relação à atividade, é observado que a versão não marcada possui uma estabilidade temporal melhor, tornando-a de forma geral uma versão melhor da enzima para uso em reações de produção de monatina. [00947] Mutantes adicionais de DAT 4978 foram produzidos através de métodos comumente conhecidos pelos versados na técnica. Entretanto, todas estas mutações resultaram em proteína que era insolúvel sob as condições que foram preparadas e assim não podiam ser analisadas em relação à atividade. As mutações que resultaram em proteína insolúvel eram:
[00948] S180A/S181A/S182R;
[00949] L151F;
[00950] V34G [00951] S181R [00952] A153R/S181A/S182A;
[00953] A153R/S182A;
[00954] A153R/S182G;
[00955] S180R/S181A/S182G;
[00956] S180R/S181A/S182A;
[00957] S180R/S181G/S182G;
[00958] S180G/S181R/S182G; e
Petição 870170009999, de 15/02/2017, pág. 512/1247
503/788 [00959] S180A/S181R/S182A.
Mutagênese Adicional [00960] Para criar o mutante DAT 4978 F200M, o quadro aberto de leitura do DAT 4978 do tipo selvagem do Exemplo 25 (marcado) foi amplificado com os iniciadores 73 e 80 (abaixo) e PfuTurbo DNA Polymerase (Stratagene, La Jolla, CA) e clonado em pCRIl-Blunt (Invitrogen, Carlsbad, CA). Sua sequência foi verificada (Agencourt, Beverly, MA). As regiões a 5' e a 3' foram amplificadas utilizando os iniciadores 80 e 96 e 99 e 103, respectivamente. O DNA amplificado foi então purificado em gel utilizando o Qiagen QIAquick Gel Extraction Kit (Qiagen, Valencia, CA). O DNA amplificado foi submetido à PCR utilizando os iniciadores 80 e 99. O DNA amplificado foi purificado em gel como descrito anteriormente e clonado em pCRIl Blunt e sua sequência foi verificada. O quadro aberto de leitura de DAT foi subclonado na forma de um fragmento de digestão de restrição com Ndel/Xhol em pET28b. Tabela 35
Número do Sequência
Iniciador
CATATGAGTTATAGCTTATGGAATGACCAAATTGTG AATG (SEQ ID NO:365)
CTCGAGTGCGGCCGCAAGCTTGTCGACGGAGCTC (SEQ ID NO:366)
AATATTTATGGAATTAAAGATGGCGTATTATACACAC
ATCCAGCGAATAACATGATCTTAAATGGTATTACAC
GTCAAGTAATCATTAAATGTGC (SEQ ID NO:367)
GGCCAGTGAATTGTAATACGACTCACTATAGGGC (SEQ ID NO:368)
103 CGCCATCTTTAATTCCATAAATATTTGAAGAAGAGC
CTTCTG (SEQ ID NO:369) [00961] Os iniciadores a seguir foram planejados para mutagênese direcionada ao sítio adicional utilizando o QuikChange® Multi SiteDirected Mutagenesis Kit (Stratagene, La Jolla, CA). A mutagênese foi
Petição 870170009999, de 15/02/2017, pág. 513/1247
504/788 realizada utilizando o kit Stratagene Multi-Change (Stratagene, La Jolla, CA) seguindo as instruções do fabricante. O molde utilizado para a mutagénese era o constructo de DAT 4978 pET28 (marcada) descrito no Exemplo 25. Um mutante duplo também foi criado utilizando o mutante F200Y como molde e fazendo uma rodada adicional de mutagênese com o iniciador T243N (listado anteriormente).
Tabela 36
Mutante Oligo
141-LRcD-144 GCAACATTTGTAGAAGACATTCGTTGGGAATAC EYcY TGTTACATTAAATCATTAAATTTACTTGGTGCG (SEQ ID NO:370)
F200Y GTATTATACACACATCCAGCGAATAACTACATC
TTAAATGGTATTACACGTCAAG (SEQ ID NO:371)
S244K GCAATGGATGAAGTGATTGTTTCATCAACGACT
AAAGAAGTAACGCCAATTATCGACATAGATG (SEQ ID NO:372)
243-TS-244 NK GCAATGGATGAAGTGATTGTTTCATCAACGAAT AAAGAAGTAACGCCAATTATCGACATAGATG (SEQ ID NO:373)
243-TS-244 GCAATGGATGAAGTGATTGTTTCATCAACGAAT
NR CGTGAAGTAACGCCAATTATCGACATAGATG (SEQ ID NO:374) [00962] As regiões codificadoras dos mutantes foram verificadas através do seqüenciamento de DNA (Agencourt). Os plasmídeos com a sequência verificada foram transformados em células BL21(DE3) (Novagen, Madison, Wl).
Expressão e Ensaio [00963] Culturas contendo 100 mL de LB com 50 pg/mL de canamicina em um frasco com aletas de 500 mL foram inoculadas com um mL de uma cultura crescida durante a noite e crescidas a 37Ό até uma densidade ótica (a 600 nm) de aproximadamente 0,6. A produção da proteína foi induzida por IPTG em uma concentração final de 1 mM. As células foram incubadas a 30Ό durante 4,5 horas após a adição do
Petição 870170009999, de 15/02/2017, pág. 514/1247
505/788
IPTG. As células foram centrifugadas e congeladas a -80Ό. As células foram rompidas (preparadas utilizando o reagente Novagen BugBuster (Novagen, Madison, Wl) contendo 1 pL/mL de benzonase nuclease, 5 pL/mL de coquetel II de inibidor de protease e 0,033 pL/mL de rLysozyme seguindo o protocolo recomendado pela Novagen) e analsiadas por SDS-PAGE. Os mutantes (141-LRcD-144 -> EYcY) e (243-TS-244 -> NR) resultaram em proteínas insolúveis sob as condições em que foram preparados. O mutante 243-TS-244--> NK não tinha atividade que pudesse ser quantificada sob as condições testadas e provavelmente é uma atividade fraca em comparação com a do tipo selvagem assim como é a do mutante S244K.
[00964] As proteínas marcadas com His foram purificadas como a seguir. Colunas HIS-bind (Novagen, Madison, Wl) foram equilibradas com 10 ml_ de 100 mM de fosfato de potássio, pH 7,8, contendo 200 mM de NaCI e 50 pM de PLP. Os extratos isentos de células foram carregados na coluna. As colunas foram lavadas com 10 mL de tampão de equilíbrio, 10 mL de tampão de equilíbrio contendo 25 mM de imidazol e 10 mL de tampão de equilíbrio contendo 50 mM de imidazol. As proteínas foram eluídas com 5 mL de tampão de equilíbrio contendo 500 mM de imidazol. As proteínas foram dessalinizadas utilizando colunas PD10 que foram equilibradas em 100 mM de fosfato de potássio, pH 7,8 contendo 50 pM DE PLP. As proteínas purificadas foram concentradas e quantificadas utilizando o Ensaio de Bradford (Bio-Rad, Hercules, CA).
[00965] Os mutantes de D-aminotransferase foram analisados utilizando 500 pg/mL da D-aminotransferase, 50 pg/mL da aldolase da SEQ ID NO: 276, 4 mM de MgCI2,50 mM de fosfato de potássio pH 8, 200 mM de piruvato de sódio, 0,05 mM de PLP e 20,4 mg/mL de Dtriptofano para as condições de ensaio. O volume final era de 1,25 mL. Foram tiradas amostras (200 pL) após 0,5, 1, 2 e 14 horas e congelaPetição 870170009999, de 15/02/2017, pág. 515/1247
506/788 das até o experimento ser completado. As amostras foram filtradas, diluídas 1 para 10 e analisadas por LC/MS/MS como descrito no Exemplo 1.
[00966] A D-aminotransferase 4978 do tipo selvagem do Exemplo 25 foi utilizada como uma referência para a atividade relativa percentual. A Tabela 37 mostra a atividade relativa de cada mutante em cada ponto de tempo. Tabela 37
D-aminotransferase Tempo (h) % de atividade
4978 do tipo selvagem 0,5 100
T243N 0,5 270
F200M 0,5 50
F200Y 0,5 70
F200M/T243N 0,5 183
S244K 0,5 4
4978 do tipo selvagem 1 100
T243N 1 289
F200M 1 55
F200Y 1 81
F200M/T243N 1 203
S244K 1 6
4978 do tipo selvagem 2 100
T243N 2 266
F200M 2 51
F200Y 2 79
F200M/T243N 2 185
S244K 2 6
4978 do tipo selvagem 14 100
T243N 14 254
F200M 14 56
F200Y 14 80
F200M/T243N 14 168
S244K 14 8
[00967] Ο T243N era o melhor mutante de tod os os testados em
relação à atividade na produção de R,R monatina. Exemplo 27
Petição 870170009999, de 15/02/2017, pág. 516/1247
507/788
Estabilização do Mutante T243N da D-aminotransferase da cepa
ATCC 4978 [00968] Como mostrado no Exemplo 25, a atividade inicial da DAT mutante T243N é significativamente maior que a da DAT de B. sphaericus, mas a atividade diminui mais rapidamente. Experimentos adicionais, utilizando o protocolo anaeróbico descrito abaixo, indicaram que a atividade inicial da DAT mutante T243N era até 8 vezes maior que a da DAT de B. sphaerícus, entretanto a atividade diminuiu rapidamente mesmo sob as condições anaeróbicas. Os estudos a seguir foram realizados para tentar manter a maior atividade durante um período de tempo estendido.
[00969] O mutante T243N da D-aminotransferase da cepa 4978 (descrita no Exemplo 25) e a HMG aldolase de S. meliloti foram purificadas na forma das proteínas marcadas com HIS6 como descrito abaixo. A aldolase da SEQ ID NO: 276 foi purificada como descrito no Exemplo 23.
Purificação de DAT da ATCC 4978 (mutante T243N) [00970] O mutante T243N da D-aminotransferase da cepa ATCC 4978 com uma marcação para purificação de His6 amino-terminal (descrita no Exemplo 26) foi produzido utilizando o EM D Biosciences Overnight Express System II (soluções 1-6) (Novagen, Madison, Wl) contendo 50 pg/mL de canamicina em frascos de agitação. Este sistema de expressão induz a expressão de sistemas que podem ser induzidos por IPTG sem a necessidade de monitorar o crescimento celular. Após a inoculação de alíquotas de 200 mL do meio (em frascos de 1 L) de culturas líquidas ou de placas do hospedeiro de E. coli BL21(DE3) carregando o gene para a D-aminotransferase mutante T243N da cepa ATCC 4978 no plasmídeo pET28b, as culturas foram incubadas a 30Ό durante a noite com agitação a 225 rpm. Quando a DO600 atingiu um mínimo de 6, as células foram coletadas por centriPetição 870170009999, de 15/02/2017, pág. 517/1247
508/788 fugação e lavadas uma vez com tampão.
[00971] O extrato isento de células foi preparado utilizando EMD Biosciences BugBuster® (isento de amina primária) Extraction Reagent (Novagen, Madison, Wl) contendo 1 pL/mL de Benzonase® Nuclease (Novagen, Madison, Wl), 5 pL/mL de Protease Inhibitor Cocktail Set II (Calbiochem - Novabiochem Corp., San Diego, CA) e 0,033 pL/mL de rLysozyme® (Novagen, Madison, Wl) seguindo o protocolo do fabricante. Todas as etapas de purificação subseqüentes foram realizadas a 4Ό. O extrato de células foi centrifugado durante 20-30 minutos a 15.000 x g para remover os restos celulares. Uma alíquota de 20-25 mL do extrato isento de células foi aplicada em uma coluna de 45 mL de resina GE Healthcare Chelating Sepharose® Fast Flow (forma de níquel (II)) (GE Healthcare, Piscataway, NJ) que foi previamente equilibrada com 100 mM de fosfato de potássio contendo 200 mM de cloreto de sódio e 50 pM de PLP. Para gerar a forma de níquel da resina, a resina foi lavada com 150 mL de 200 mM de sulfato de níquel (II) hexahidratado e então com 150 mL de água destilada. Após carregar a amostra, a coluna foi lavada/eluída com 150 mL do tampão de equilíbrio contendo 25 mM de imidazol, 150 mL do tampão de equilíbrio contendo 50 mM de imidazol e 150 mL do tampão de equilíbrio contendo 500 mM de imidazol. A proteína marcada com HIS6 foi eluída na última lavagem. A lavagem com 500 mM de imidazol foi concentrada com dispositivos de filtro por centrifugação Millipore/Amicon Centricon Plus70 (MWCO 10 kDa) (Millipore, Billerica, MA) em 15-20 mL de acordo com as instruções do fabricante. O imidazol e cloreto de sódio foram removidos através da passagem ao longo de colunas PD10 GE Healthcare descartáveis (GE Healthcare, Piscataway, NJ) (2,5 mL de amostra por coluna) previamente equilibradas com 100 mM de fosfato de potássio, pH 7,8 contendo 0,5 pM de PLP. A aminotransferase purificada foi eluída com 3,5 mL por coluna do mesmo tampão. A concenPetição 870170009999, de 15/02/2017, pág. 518/1247
509/788 tração de proteína de cada fração foi determinada utilizando o kit de ensaio Pierce BCA (Pierce, Rockford, IL) com BSA como o padrão de proteína.
[00972] A pureza de cada fração e o nível de expressão na fração de extrato isento de células foram determinados utilizando um Bio-Rad Experion microcapillary chip system (Bio-Rad, Hercules, CA) ou utilizando géis de gradiente de 4-15% de SDS-poliacrilamida da Bio-Rad (Bio-Rad, Hercules, CA) corridos em um aparato de células Mini PROTEAN® 3. A proteína foi visualizada nos géis de poliacrilamida utilizando a coloração Bio-Rad Bio-Safe G-250 Coomassie (Bio-Rad, Hercules, CA) e descorados com água. Tipicamente, este procedimento produz ~ 20 mg de enzima partindo de 200 mL de cultura crescida durante a noite que é 85-90% pura como é julgado pelo Experion software ou partindo da análise dos géis de SDS-PAGE. Alíquotas (1-5 mL) da enzima purificada foram armazenadas a -80Ό até o u so.
[00973] A purificação da aldolase da SEQ ID NO: 276 é como descrito no Exemplo 23.
Purificação da HMG Aldolase de S. meliloti [00974] A HMG aldolase de S. meliloti com uma marcação de purificação de HIS6 amino-terminal (clonagem descrita no Pedido de Patente U.S. Publicado N° 20040063175 e na WO 03091396 A2) foi produzida através da indução de culturas crescidas em caldo Luria-Bertani contendo 50 mg/L de canamicina com 0,2 mM de IPTG. Após a inoculação de alíquotas de 800 mL do meio de culturas líquidas ou de placas do hospedeiro de E. coli BL21(DE3) carregando o gene para a HMG aldolase de S. meliloti em pET30(Xa/LIC), as culturas foram incubadas a 37Ό com agitação a 225 rpm. Quando a den sidade ótica atingiu uma DO600nm de 0,5-0,75, o IPTG foi adicionado e as culturas foram incubadas a 30Ό com agitação a 225 rpm durante 4 horas. As células foram coletadas por centrifugação e lavadas uma vez com
Petição 870170009999, de 15/02/2017, pág. 519/1247
510/788 tampão.
[00975] Para preparar o extrato isento de células contendo a aldolase de S. meliloti, as células foram ressuspensas em 3-4 volumes de 50 mM de EPPS (N-(2-hidroxietil)piperazina-N'-(ácido 3propanossulfônico), pH 8,2 contendo 100 mM de NaCI e então rompidas utilizando um homogeneizador da Microfluidics (Microfluidics, Newton, MA) (3 passagens a 124,10 MPa (18.000 psi)), mantendo a temperatura da suspensão em menos de 15Ό. A suspensão de células foi centrifugada durante 20-30 minutos a 15.000-20.000 x g para remover os restos celulares. A proteína marcada com HIS6 foi purificada utilizando colunas EMD Biosciences HIS-Bind® (Novagen, Madison, Wl) seguindo o protocolo recomendado pelo fabricante com uma exceção: as colunas foram lavadas com uma solução 1:1 de tampão de Ligação:tampão de Lavagem ao invés do tampão de Lavagem isoladamente. A fração de eluição foi concentrada com dispositivos de filtro por centrifugação de 15 mL Millipore/Amicon (MWCO 5 kDa) (Millipore, Billerica, MA) em 7-10 mL de acordo com as instruções do fabricante. O imidazol e o cloreto de sódio foram removidos através da passagem ao longo de colunas PD10 GE Healthcare descartáveis (GE Healthcare, Piscataway, NJ) (2,5 mL de amostra por coluna) previamente equilibradas com 50 mM de EPPS, pH 8,2 contendo 100 mM de NaCI. A aldolase purificada foi eluída com 3,5 mL por coluna do mesmo tampão. A concentração de proteína de cada fração foi determinada utilizando o kit de ensaio Pierce BCA (Pierce, Rockford, IL) utilizando BSA como o padrão de proteína.
[00976] A pureza de cada fração e o nível de expressão na fração de extrato isento de células foram determinados utilizando géis de gradiente de 4-15% de SDS-poliacrilamida da Bio-Rad (Bio-Rad, Hercules, CA) corridos em um aparato de células Mini PROTEAN® 3. A proteína foi visualizada nos géis de poliacrilamida utilizando a coloraPetição 870170009999, de 15/02/2017, pág. 520/1247
511/788 ção Bio-Rad Bio-Safe G-250 Coomassie (Bio-Rad, Hercules, CA) e descorados com água. Tipicamente, este procedimento produz ~15-20 mg de enzima partindo de 800 mL de cultura e é 85-95% pura. Alíquotas (1-5 mL) da enzima purificada foram armazenadas a -80Ό até o uso.
Ensaios de Produção de Monatina [00977] Tubos cônicos de polipropileno (14 mL) contendo 143 mg de D-triptofano foram desoxigenados em uma câmara anaeróbica com luvas durante a noite. As soluções estoque de 1 M de tampão EPPS (pH 8,2), 2 M de MgCI2, 2 M de piruvato de sódio e 10 mM de PLP foram preparadas em água degaseificada e equilibradas em uma câmara anaeróbica com luvas durante a noite. Soluções estoque de 10% (v/v) de Tween 80, 1% (v/v) de Tween 20, 1% (v/v) de Triton X-100, 100% de acetona, 100% de etanol e 50% (p/v) de glicerol foram equilibradas na câmara anaeróbica com luvas junto com 0,7 g de cada de trealose, inositol, sorbitol e eritritol em tubos de microcentrífuga de 2 mL. As preparações das enzimas purificadas foram descongeladas em gelo e utilizadas imediatamente na câmara anaeróbica com luvas. As soluções estoque foram adicionadas nos tubos cônicos de 14 mL para fornecer uma concentração final de 100 mM de EPPS, 200 mM de piruvato, 100 mM de triptofano, 1 mM de MgCI2, 0,05 mM de PLP, 0,5 mg/mL de D-aminotransferase e 0,01 mg/mL de aldolase da SEQ ID NO: 276 ou 0,05 mg/mL de HMG aldolase de S. meliloti. Os compostos de estabilização de enzima propostos foram adicionados em várias concentrações finais (Tabelas 38 e 39) para levar o volume de reação final a 7 mL por tubo. As reações foram incubadas à temperatura ambiente na câmara anaeróbica com luvas com agitação suave durante até 24 horas. Amostras foram removidas periodicamente e analisadas em relação à monatina como descrito no Exemplo 1 utilizando o método de monitoramento de reação múltiplo por LC/MS/MS. As taxas iniPetição 870170009999, de 15/02/2017, pág. 521/1247
512/788 ciais foram calculadas partindo das amostras tiradas 0 e 3 h após a adição da enzima.
Tabela 38
Aditivo Quantidade de Aumento na Taxa Inicial de Formação de Monatina Quantidade de Aumento no Título Final de Monatina (20 h)
Nenhum 1,0 1,0
0,01% (v/v) de Tween 80 1,3 1,4
0,1% (v/v) de Tween 80 1,3 1,5
0,01% (v/v) de Tween 20 1,1 1,5
0,01% (v/v) de Triton X-100 1,1 1,2
5% (v/v) de Acetona 0,4 0,3
5% (v/v) de Etanol 0,7 0,5
1% (p/v) de Glicerol 1,9 1,1
5% (p/v) de Glicerol 1,4 1,4
10% (p/v) de Glicerol 1,1 1,7
10% (p/v) de Trealose 1,0 1,3
10% (p/v) de Inositol 1,3 1,5
10% (p/v) de Sorbitol 1,1 1,3
10% (p/v) de Eritritol 0,8 1,0
Petição 870170009999, de 15/02/2017, pág. 522/1247
513/788
Tabela 39 (aldolase da SEQ ID NO: 276)
Aditivo Quantidade de Aumento na Taxa Inicial de Formação de Monatina Quantidade de Aumento no Título Final de Monatina em 22 h
0,01% (v/v) de Tween 80 1,0 1,0
1% (p/v) de Glicerol 1,2 0,9
5% (p/v) de Glicerol 1,5 1,5
10% (p/v) de Glicerol 1,7 2,1
[00978] A adição de 0,01% - 0,1% (v/v) de detergente, tal como Triton X-100, Tween 20 ou Tween 80 ou 1% - 10% (p/v) de poliol, tal como glicerol, trealose, inositol ou sorbitol, aumentou a estabilidade da D-aminotransferase T243N ao longo do tempo do experimento. Exemplo 28
A: Clonagem de Aminoácido Racemase de Especificidade Ampla (Broad-specificitv Amino Acid Racemase - BAR) de Pseudomonas outida KT2440 [00979] Uma BAR foi identificada em P. putida KT2440 utilizando informação proveniente da literatura (Roise, D., Soda, K., Yagi, T., Walsch, C.T., Biochemistry 23, 5195-5201, (1984)). O sítio ativo de uma enzima BAR de P. striata foi seqüenciada e relatada - LTAVLKADAYGXGIGL (SEQ ID NO: 375). Esta sequência foi utilizada para submeter ao BLAST a sequência genômica de P. putida KT2440 disponível no NCBI. Foi identificada uma proteína com uma sequência consenso quase idêntica. Os iniciadores foram planejados para clonar o gene do DNA genômico obtido na American Type Culture Collection (ATCC, Manassas, VA) (5'-AGAAGACATATGCCCTTTCGCCGTAGGG-3' (SEQ ID NO: 376 e 5'-AGAAGAGGATCCTCAGTCGACGAGTATCTTCG-3') (SEQ ID NO:
Petição 870170009999, de 15/02/2017, pág. 523/1247
514/788
377)).
[00980] A PCR foi realizada sob condições padronizadas e o produto da PCR foi purificado (QIAquick PCR purification kit, Qiagen, Valencia, CA). O produto da PCR purificado foi digerido com Nde I e SamH I. O produto da PCR digerido foi purificado em gel (QIAquick Gel Extraction Kit, Qiagen, Valencia, CA) e ligado em pET30 e pET28 que foram digeridos e purificados em gel de uma maneira similar. Os clones com insertos foram seqüenciados (Agencourt, Beverly, MA) e os isolados com a sequência correta foram identificados (pET30 KT2440 BAR e pET28 KT2440BAR) e utilizados em estudos posteriores.
[00981 ] A sequência de DNA de BAR de KT2440 é:
atgccctttcgccgtacccttctggctgcatccctggcacttctgatcaccggacaggcccccctgta tgcggcaccaccgttgtcgatggacaacggcaccaacaccctgaccgtgcaaaacagcaatgc ctgggtcgaagtcagcgccagcgccctgcagcacaacatccgcacgctgcaggccgagctgg ccggcaagtccaagctgtgcgccgtgctcaaggccgatgcctatggccacggtatcggcctggt aatgccatcgatcatcgcccaaggcgtgccctgcgtggcggtggccagcaacgaggaggccc gcgtggtccgcgccagtggcttcaccgggcaactggtgcgggtacgcctggccagcctcagcga gctggaagatggcttgcagtacgacatggaagagctggtgggcagcgcggaatttgcccgcca ggccgatgccatcgccgcgcgccatggcaagaccttgcgcattcacatggcgctcaactccagc ggcatgagccgcaacggggtggagatggccacctggtccggccgtggcgaagcgctgcagat caccgaccagaagcacctcaagctggtcgcgctgatgacccacttcgccgtggaagacaagg acgatgtacgcaagggcctggcggcattcaacgagcagaccgactggttgatcaagcacgcca ggctggaccgcagcaagctcaccctgcacgccgccaactcgttcgctacgctggaagtgccgg aagcgcgcctggacatggtacgaacgggtggcgcgctgttcggcgacaccgtgccggcgcgc accgagtacaaacgtgcgatgcagttcaaatcgcacgtggcggcggtgcacagctatccggcc ggcaacaccgtgggctatgaccgcaccttcaccctggcccgtgattcgcggctggccaacattac ggtcgggtactccgatggctaccgccgggtattcaccaacaagggccatgtgctgatcaacggc caccgtgtgccggtcgtgggcaaggtgtcgatgaacacgctgatggtcgatgtcaccgacttccct gatgtgaaggggggtaacgaagtggtgctgttcggcaagcaggccgggggcgaaatcaccca ggccgagatggaagaaatcaacggcgcgttgctcgccgatttgtacaccgtatggggcaattcc
Petição 870170009999, de 15/02/2017, pág. 524/1247
515/788 aacccgaagatactcgtcgactga (SEQ ID NO: 378).
[00982] A sequência de aminoácidos de BAR de KT2440 é:
Mpfrrtllaaslallitgqaplyaapplsmdngtntltvqnsnawvevsasalqhnirtlqaelagksk
Icavlkadayghgiglvmpsiiaqgvpcvavasneearwrasgftgqlvrvrlaslseledglqyd meelvgsaefarqadaiaarhgktlrihmalnssgmsrngvematwsgrgealqitdqkhlklva
Imthfavedkddvrkglaafneqtdwlikharldrskltlhaansfatlevpearldmvrtggalfgdt vparteykramqfkshvaavhsypagntvgydrtftlardsrlanitvgysdgyrrvftnkghvling hrvpvvgkvsmntlmvdvtdfpdvkggnewlfgkqaggeitqaemeeingalladlytvwgns npkilvd (SEQ ID NO: 379)
B) Purificação de BAR de P. putida KT2440.
[00983] O plasmídeo pET30 KT2440 BAR descrito anteriormente foi transformado em BL21 DE3 pLysS (Invitrogen, Carlsbad, CA). A cepa resultante foi cultivada em LB ou Terrific Broth a 37G com aeração até uma D06oonm de 0,4-0,6 e induzida com 1 mM de IPTG. A incubação foi continuada 3-4 horas a 37G com aeração. As cél ulas foram coletadas por centrifugação e a pélete de células foi armazenada a -80G até o uso. O pélete de células foi descongelada em gelo. As células foram Usadas com BugBuster (Novagen, Madison, Wl) e Benzonase (Novagen, Madison, Wl). Os restos celulares foram removidos por centrifugação e o extrato isento de células foi utilizado imediatamente ou armazenado a -80G. O gene BAR de KT2440 também foi c lonado nos sítios Ndei-Bami-W de pET28 e transformado em BL21 DE3 pLysS. Esto constructo não parecia expressar proteína solúvel muito eficientemente de forma que a versão não marcada (pET30 KT2440 BAR) foi utilizada em estudos futuros.
[00984] O extrato foi aplicado em uma coluna UnoQ (Bio-Rad, Hercules, CA) que foi equilibrada com pelo menos 5 volumes da coluna de tampão A (25 mM de fosfato de potássio pH 8,0, 10 pM de piridoxal-5'Petição 870170009999, de 15/02/2017, pág. 525/1247
516/788 fosfato (PLP)). A coluna foi lavada com 2 volumes da coluna de tampão A. A proteína foi eluída com um um gradiente linear de tampão B (tampão A + 1 M de NaCI) partindo de 0-100% de tampão B ao longo de 20 volumes da coluna e frações de 5 mL foram coletadas no momento em que o gradiente foi iniciado. As frações foram analisadas utilizando o método Amplex Red descrito no Exemplo 4 - parte 7. Sucintamente, 100 pg de D-aminoácido oxidase (Sigma-Aldrich, St. Louis, MO), 0,05 mM de FAD, 25 mM de L-trp e um volume pequeno da fração que seria analisada foram combinados em 50 pL de H2O e adicionados em 50 pL de tampão de reação de Amplex Red preparado como indicado no protocolo do fabricante. As frações com atividade foram dessalinizadas com uma coluna PD-10 (GE Healthcare, Piscataway, NJ) e concentradas com agentes de concentração por centrifugação Amicon (Millipore, Billercia, MA). A proteína purificada foi armazenada a -80G.
C) Produção e ensaio de um mutante Y354A de alanina racemase de
Geobacillus stearothermophilus com atividade de triptofano racemase [00985] A alanina racemase de Geobacillus stearothermophilus do tipo selvagem (SEQ ID NO: 380, mostrada abaixo) foi clonada em pET30 como um molde para a mutagênese direcionada ao sítio para produzir uma alteração Y354A. O gene da SEQ ID NO: 380 pode ser amplificado através de protocolos de PCR padronizados e clonados utilizando técnicas de DNA recombinante padronizadas. O gene da SEQ ID NO: 380 também pode ser reconstruído através de qualquer método conhecido por um perito comum na técnica, tal como métodos de PCR de montagem conhecidos por um versado na técnica.
[00986] As sequências de DNA e de aminoácidos da alanina racemase de Geobacillus stearothermophilus do tipo selvagem são mostradas abaixo como a SEQ ID NO: 380:
atggacgagt ttcaccgcga tacgtgggcg gaagtggatt tggacgccat ttacgacaat
Petição 870170009999, de 15/02/2017, pág. 526/1247
517/788 gtggagaatt tgcgccgttt gctgccggac gacacgcaca ttatggcggt cgtgaaggcg aacgcctatg gacatgggga tgtgcaggtg gcaaggacag cgctcgaagc gggggcctcc cgcctggcgg ttgccttttt ggatgaggcg ctcgctttaa gggaaaaagg aatcgaagcg ccgattctag ttctcggggc ttcccgtcca gctgatgcgg cgctggccgc ccagcagcgc attgccctga ccgtgttccg ctccgactgg ttggaagaag cgtccgccct ttacagcggc ccttttccta ttcatttcca tttgaaaatg gacaccggca tgggacggct tggagtgaaa gacgaggaag agacgaaacg aatcgtagcg ctgattgagc gccatccgca ttttgtgctt gaaggggtgt acacgcattt tgcgactgcg gatgaggtga acaccgatta tttttcctat cagtataccc gttttttgca catgctcgaa tggctgccgt cgcgcccgcc gctcgtccat tgcgccaaca gcgcagcgtc gctccgtttc cctgaccgga cgttcaatat ggtccgcttc ggcattgcca tgtatgggct tgccccgtcg cccggcatca agccgctgct gccgtatcca ttaaaagaag cattttcgct ccatagccgc ctcgtacacg tcaaaaaact gcaaccaggc gaaaaggtga gctatggtgc gacgtacact gcgcagacgg aggagtggat cgggacgatt ccgatcggct atgcggacgg ctggctccgc cgcctgcagc actttcatgt ccttgttgac ggacaaaagg cgccgattgt cggccgcatt tgcatggacc agtgcatgat ccgcctgcct ggtccgctgc cggtcggcac gaaggtgaca ctgattggtc gccaagggga cgaggtaatt tccattgatg atgtcgctcg ccatttggaa acgatcaact acgaagtgcc ttgcacgatc agttatcgag tgccccgtat ttttttccgc cataagcgta taatggaagt gagaaacgcc gttggccgcg ga (SEQ ID NO: 380).
[00987] A sequência de aminoácidos codificada da Alanina Racemase (Geobacillus stearothermophilus) é mostrada abaixo como a SEQ ID NO: 381:
Met Asp Glu Phe His Arg Asp Thr Trp Ala Glu Vai Asp Leu Asp Ala Ile Tyr Asp Asn Vai Glu Asn Leu Arg Arg Leu Leu Pro Asp Asp Thr His Ile Met Ala Vai Vai Lys Ala Asn Ala Tyr Gly His Gly Asp Vai Gin Vai Ala Arg Thr Ala Leu Glu Ala Gly Ala Ser Arg Leu Ala Vai Ala Phe Leu Asp Glu Ala Leu Ala Leu Arg Glu Lys Gly Ile Glu Ala Pro Ile Leu Vai Leu Gly Ala Ser Arg Pro Ala Asp Ala Ala Leu Ala Ala Gin Gin Arg Ile Ala Leu Thr Vai Phe Arg Ser Asp Trp Leu Glu Glu Ala Ser Ala Leu Tyr Ser
Petição 870170009999, de 15/02/2017, pág. 527/1247
518/788
Gly Pro Phe Pro lie His Phe His Leu Lys Met Asp Thr Gly Met Gly Arg Leu Gly Vai Lys Asp Glu Glu Glu Thr Lys Arg lie Vai Ala Leu lie Glu Arg His Pro His Phe Vai Leu Glu Gly Vai Tyr Thr His Phe Ala Thr Ala Asp Glu Vai Asn Thr Asp Tyr Phe Ser Tyr Gin Tyr Thr Arg Phe Leu His Met Leu Glu Trp Leu Pro Ser Arg Pro Pro Leu Vai His Cys Ala Asn Ser Ala Ala Ser Leu Arg Phe Pro Asp Arg Thr Phe Asn Met Vai Arg Phe Gly lie Ala Met Tyr Gly Leu Ala Pro Ser Pro Gly lie Lys Pro Leu Leu Pro Tyr Pro Leu Lys Glu Ala Phe Ser Leu His Ser Arg Leu Vai His Vai Lys Lys Leu Gin Pro Gly Glu Lys Vai Ser Tyr Gly Ala Thr Tyr Thr Ala Gin Thr Glu Glu Trp lie Gly Thr lie Pro lie Gly Tyr Ala Asp Gly Trp Leu Arg Arg Leu Gin His Phe His Vai Leu Vai Asp Gly Gin Lys Ala Pro lie Vai Gly Arg lie Cys Met Asp Gin Cys Met lie Arg Leu Pro Gly Pro Leu Pro Vai Gly Thr Lys Vai Thr Leu lie Gly Arg Gin Gly Asp Glu Vai lie Ser lie Asp Asp Vai Ala Arg His Leu Glu Thr lie Asn Tyr Glu Vai Pro Cys Thr lie Ser Tyr Arg Vai Pro Arg lie Phe Phe Arg His Lys Arg lie Met Glu Vai Arg Asn Ala Vai Gly Arg Gly (SEQ ID NO: 381) [00988] A mutagênese foi realizada utilizando o QuickChange-Multi site-Directed Mutagenesis Kit (Stratagene, La Jolla, CA). O iniciador mutagênico a seguir foi utilizado para produzir a alteração Y354A, 5'gccatttggaaacgatcaacgcggaagtgccttgcacgatcag-3' (SEQ ID NO: 382). A mutagênese direcionada ao sítio foi realizada como descrito no protocolo do fabricante. Vários isolados foram seqüenciados (Agencourt, Beverly, MA) e um isolado com a sequência correta foi selecionado e utilizado para análise adicional.
[00989] O mutante isolado pET30Y354A foi transformado em E. coli BL21(DE3)pLysS. A proteína purificada foi preparada da maneira a seguir. A cepa foi cultivada em LB ou Terrific Broth (a 37Ό com aeração) até uma DO600nm de 0,4-0,6 e induzida com 1 mM de IPTG. A incubação foi continuada a 37Ό com aeração durante - 3 horas. As céPetição 870170009999, de 15/02/2017, pág. 528/1247
519/788 lulas foram coletadas por centrifugação e a pélete de células foi armazenada a -80G.
[00990] O pélete de células foi descongelado em gelo e então ressuspenso em um volume apropriado de BugBuster (Novagen, Madison, Wl) mais Benzonase nuclease (Novagen, Madison, Wl). Os restos celulares foram removidos por centrifugação e o extrato isento de células foi aplicado em uma coluna HIS-Bind (Novagen, Madison, Wl) que foi equilibrada com tampão de Ligação. A coluna foi lavada com tampão de ligação e tampão de Lavagem e a proteína foi eluída com o tampão de Eluição (como indicado no protocolo do fabricante). A proteína purificada foi dessalinizada utilizando uma coluna PD-10 (GE Healthcare, Piscataway, NJ). A proteína foi dessalinizada em 50 mM de fosfato de potássio pH 8,0 e 10 pM de piridoxal-5'-fosfato de acordo com o protocolo do fabricante. A proteína foi concentrada utilizando um agente de concentração por centrifugação Amicon (Millipore, Billercia, MA). A proteína purificada e concentrada foi dividida em pequenas alíquotas e armazenada a -80G até o uso.
[00991] A Y354A purificada foi comparada com a alanina racemase do tipo selvagem (preparada da maneira descrita anteriormente) tanto nos ensaios com alanina quanto com triptofano. Os ensaios foram realizados a 37G em 50 mM de tampão de fosfato de potássio, pH 8 e 10 pM de PLP utilizando 400 pL de proteína purificada concentrada (>1 mg/mL) e 50 mM de substrato. A detecção de D-alanina e de Dtriptofano foi realizada utilizando a metodologia de aminoácido quiral descrita no Exemplo 1.
Tabela 40
Enzima Substrato Tempo Isômero D produzido (ppm)
Do tipo selvagem L-triptofano 0 nd*
10 nd
30 nd
60 nd
Petição 870170009999, de 15/02/2017, pág. 529/1247
520/788
Enzima Substrato Tempo Isômero D produzido (ppm)
1080 nd
Y354A 0 nd
10 198
30 568
60 1386
1080 10080
Do tipo selvagem L-alanina 0 5140
10 5960
30 6280
60 6500
1080 5040
Y354A 0 4760
10 4980
30 4980
60 4200
1080 5000
*nd = nenhum detectado [00992] Estes dados foram analisados sem o uso de um padrão interno; assim, estes dados são semiquantitativos e devem ser utilizados para finalidades de comparação. Entretanto, estes resultados mostram que a mutação isolada Y354A é suficiente para ampliar a especificidade da alanina racemase de forma que possa catalisar a racemização de aminoácidos utilizando substratos alternativos.
D) Ensaio da enzima BAR.
[00993] A enzima BAR foi analisada como a seguir. Os ensaios de Amplex Red foram ajustados como descrito neste exemplo. A BAR de P. putida KT2440 foi utilizada a 200 pg (purificada como descrito neste exemplo). A alanina racemase de G. stearothermophilus do tipo selvagem e a Y354A foram purificadas como descrito neste exemplo e utilizadas a 200 pg/mL ou a 1000 pg/mL. CE é o extrato isento de células que foi preparado como descrito neste exemplo. Os resultados para o
Petição 870170009999, de 15/02/2017, pág. 530/1247
521/788 ponto de tempo de 60 minutos são mostrados na Tabela 41 abaixo. Tabela 41
Enzima Leitura no fluorômetro (em 60 minutos)
BAR (200) 56943
Y354A (200) 7860
Y354A(1000) 13587
Alanina racemase do tipo selvagem (200) 3646
Alanina racemase do tipo selvagem (1000) 3639
CE DE BAR (5 pL) 16228
CE DE BAR (10 pL) 26662
CE DE BAR (50 pL) >58000
Nenhuma Enzima 1510
[00994] A proteína purificada também foi analisada em relação à atividade de triptofano racemase em 50 mM de fosfato de potássio pH 8, 10 pM de PLP e 30 mM de L-triptofano como descrito anteriormente. 200 pg/mL ou 1000 pg/mL de enzima purificada foram utilizados nos ensaios (indicado entre parênteses). O D-triptofano foi analisado utilizando o método de aminoácido quiral descrito no Exemplo 1 para detecção.
Tabela 42
Enzima Tempo D-triptofano (ppm)
BAR (200) 0 0
5 172
10 410
20 844
30 1318
60 2362
120 2594
240 2762
1080 2294
Y354A (200) 0 0
Petição 870170009999, de 15/02/2017, pág. 531/1247
522/788
Enzima Tempo D-triptofano (ppm)
5 0
10 0
20 0
30 12
60 22
120 44
240 56
1080 368
Y354A(1000) 0 0
5 0
10 12
20 18
30 40
60 80
120 146
240 218
1080 1164
[00995] Os ensaios indicam que a enzima BAR de P. putida KT2440 é muito mais ativa sobre o triptofano que a eznima derivada de G. stearothermophilus e o mutante Y354A da mesma.
E) Produção de monatina com BAR de P. putida KT2440.
[00996] Um ensaio de produção de monatina foi realizado com a BAR de P. putida KT2440 purificada (como purificada anteriormente) (100 pg) ou Y354A purificada (como purificada anteriormente) (500 pg), a D-aminotransferase (BioCatalytics AT-103 (Pasadena, CA)) (500 pg) e a aldolase da SEQ ID NO: 276) (como purificada no Exemplo 23) (50 pg). O experimento de produção de monatina partindo de Ltriptofano foi realizado como a seguir. Em adição às enzimas anteriores, os seguintes foram adicionados por 1 mL de mistura de reação: 4 mM de MgCI2, 50 mM de L-triptofano, 100 mM de piruvato de sódio, 100 mM de tampão de fosfato de potássio pH 7,5 e 0,05 mM de PLP.
Petição 870170009999, de 15/02/2017, pág. 532/1247
523/788 [00997] Como um controle, o experimento foi realizado como descrito anteriormente sem racemase e partindo de D-triptofano ao invés de L-triptofano. Um resumo dos resultados é apresentado na Tabela 43 abaixo.
Tabela 43
Substra- to Race- mase Tempo Monatina Total % de R,R % de S,S % de R,S % de S,R
L-Trp Y354A 2 horas Nenhuma detectada
18 horas Nenhuma detectada
L-trp BAR 2 horas Nenhuma detectada
18 horas 38,6 ppm 92,1 5 2,9
L-trp Nenhuma 2 horas Nenhuma detectada
18 horas Nenhuma detectada
D-trp Nenhuma 2 horas 19,9 ppm Não testa- do Não testa- do Não testa- do Não testado
18 horas 221,25 PPm 97,8 0,2 2
[00998] Não foi detectada monatina utilizando Y354A neste experimento. Esta racemase foi utilizada no passado (dados não mostrados) para produzir monatina, mas um nível muito mais alto de enzima foi utilizado (pelo menos 2 mg e até 10 mg para observar níveis mais altos de monatina). A BAR de P. putida KT2440 foi utilizada para produzir monatina partindo de L-triptofano. Os 100 pg utilizados neste experimento não eram suficientes para observar a produção de monatina após duas horas, mas eram suficientes para observar a produção de monatina após 18 horas. A distribuição de estereoisômeros indicava que a maior parte da monatina produzida era o isômero R,R. Não era
Petição 870170009999, de 15/02/2017, pág. 533/1247
524/788 produzido o isômero R,S. Este resultado indica que a BAR de KT2440 não é capaz de racemizar de forma detectável o isômero R,R de monatina (a racemização do isômero R,R produziría o isômero R,S). Era produzida uma quantidade significativa do isômero S,S neste experimento. Isto é provavelmente por causa do fato de que a AT-103 utilizada neste experimento não era altamente purificada e podia conter Laminotransferases do extrato celular e que havia uma grande quantidade de L-triptofano presente para servir como um doador de amino para a transaminação de S-MP.
Exemplo 29
Clonagem e Expressão de Arginina Racemase de Pseudomonas taetrolens
Resumo Experimental [00999] A arginina racemase de Pseudomonas taetrolens (também conhecida como P. graveolens) (Na de Acesso do Genbank AB096176, sequência de ácido nucléico) e um mutante I384M da mesma, foram clonadas, expressas e testadas em relação à atividade na conversão de L-triptofano em D-triptofano. Este gene é 72% idêntico ao gene BAR de P. putida de KT2440 e 73% idêntico ao gene BAR de P. putida BAR de NBRC 12996 descritos anteriormente. A sequência de aminoácidos é 72% idêntica a ambas as proteínas BAR de P. putida.
Protocolo da Reação em Cadeia da Polimerase [001000] Pseudomonas taetrolens (ATCC 4683) foi cultivada em caldo nutricional a 28Ό com agitação a 225 rpm. A reação em cadeia da polimerase foi realizada em células inteiras utilizando os iniciadores planejados com sítios de restrição a 5' e pontas coesivas para clonagem nos vetores pET 28 e pET30 (Novagen, Madison, Wl).
[001001] As sequências dos iniciadores eram:
[001002] N term: 5'-ATAATACATATGCCCTTCTCCCGTACCC -3'
Petição 870170009999, de 15/02/2017, pág. 534/1247
525/788 (SEQ ID NO: 408) e [001003] C term: 5'-GCGGCGGGATCCTTACTGATCTTTCAGGATT3' (SEQ ID NO: 409).
[001004] O gene derivado de P. taetrolens foi amplificado utilizando o protocolo de PCR a seguir. Vinte e cinco μΙ_ de células cultivadas foram Usados a 96Ό durante 10 minutos. Os restos celulares foram removidos por centrifugação e o sobrenadante foi utilizado como molde para a PCR. Uma reação de 100 μΙ_ continha 5 μΙ_ de molde (sobrenadante de células lisadas), 1,6 μΜ de cada iniciador, 0,3 mM de cada dNTP, 10 U de rTth Polymerase XL (Applied Biosystems, Foster City, CA), 1X tampão XL e 1 mM de Mg(OAc)2. O programa do termociclador utilizado incluía um início a quente a 94 Ό durante 3 minutos, 8 repetições das etapas a seguir: 94Ό durante 30 seg undos, 52Ό durante 30 segundos e 68Ό durante 2 minutos, seguidos por 22 repetições das etapas a seguir: 94Ό durante 30 segundos, 58Ό durante 30 segundos e 68Ό durante 2 minutos. Após as 22 repetições, a amostra foi mantida a 68Ό durante 7 minutos e então armaze nada a 4Ό. Este protocolo da PCR obteve um produto de 1230 pb.
Clonagem [001005] O produto da PCR foi purificado em gel partindo de gel de TAE-agarose a 0,8% utilizando o Qiagen gel extraction kit (Qiagen, Valencia, CA). O produto foi clonado em TOPO e transformado em células TOP 10 de acordo com o protocolo do fabricante (Invitrogen, Carlsbad, CA). O DNA plasmideal foi purificado partindo dos transformantes resultantes utilizando o Qiagen spin miniprep kit (Qiagen, Valencia, CA) e verificados em relação aos insertos corretos através da digestão de restrição com Nde I e BamH I. As sequências dos plasmídeos que pareciam ter o inserto correto foram verificadas através do seqüenciamento de DNA com terminação de cadeia didesóxi com os iniciadores universais M13 para frente e M13 Inverso.
Petição 870170009999, de 15/02/2017, pág. 535/1247
526/788 [001006] O clone TOPO correto foi digerido com as enzimas de restrição Nde I e BamH I seguindo os protocolos recomendados pelo fabricante (New England Biolabs, Beverly, MA) e purificado em gel partindo de géis de TAE-agarose a 0,8% utilizando o Qiagen gel extraction kit (Qiagen, Valencia, CA). Os vetores pET 28 e pET 30 foram preparados através da digestão com as enzimas de restrição Nde I e BamH I seguida pelo tratamento com fosfatase alcalina de camarão (Roche, Indianapolis, IN) e pela purificação partindo de géis de TAEagarose a 0,8% utilizando o Qiagen gel extraction kit (Qiagen, Valencia, CA). Os vetores e o inserto digeridos foram ligados utilizando o Rapid ® DNA Ligation Kit (Roche, Indianapolis, IN). Aproximadamente 50 ng de inserto tratado, 100 ng de vetor tratado (proporção molar de 3 para 1 de inserto em relação ao vetor), 5 U de T4 DNA ligase e 1X tampão de ligação foram incubados durante 5 minutos à temperatura ambiente. A reação de ligação foi dessalinizada utilizando o High Pure PCR Product Purification Kit (Roche, Indianapolis, IN) e utilizada para transformar células eletrocompetentes E. coli DH10B (Invitrogen, CarIsbad, CA). Dez pL de cada reação de ligação foram adicionados em 40 pL de células DH10B, que foram transformadas por eletroporação utilizando o BioRad Gene Pulsar II sob as condições a seguir: 2,5 kV, 25 pF, 200 ohm em uma cubeta de 0,2 cm. Foi permitido que as células se recuperassem em 1 mL de SOC à temperatura ambiente durante 1 hora a 37Ό com agitação a 225 rpm. As células foram plaqueadas em placas de LB contendo canamicina (50 pg/mL). O DNA plasmideal foi purificado partindo dos transformantes resultantes utilizando o Qiagen spin miniprep kit (Qiagen, Valencia, CA) e verificados em relação aos insertos corretos através da digestão de restrição com Nde I e BamH I.
Expressão Gênica e Ensaios [001007] O DNA plasmideal foi transformado no hospedeiro de exPetição 870170009999, de 15/02/2017, pág. 536/1247
527/788 pressão de E. coli BL21(DE3) pLysS (Novagen, Madison, Wl). As culturas foram crescidas e os plasmídeos foram isolados utilizando o Qiagen miniprep kit (Qiagen, Valencia, CA) e analisados através da digestão de restrição para confirmar a identidade.
[001008] A indução em BL21DE3 pLysS foi inicialmente realizada em ambos os vetores pET 28 (marcado com histidina) e pET 30 (não marcado). Um estudo de curso de tempo foi realizado com culturas crescidas a 37Ό em 100 mL de LB contendo canamicina (50 mg/L) até uma D06oo de 0,5 e induzidas com 100 μM de IPTG (isopropil tiogalacatosídeo) e foram tiradas amostras em 0 e 3 horas após a indução. As células dos pontos de tempo de 0 hora e 3 horas foram ressuspensas em 1X tampão dodecil sulfato de sódio contendo 2-mercaptoetanol e aquecidas a 95Ό durante 10 minutos e resfriadas. Alíquotas destas amostras de proteína celular total foram analisadas através de SDSPAGE utilizando um gel com gradiente de 4-15%.
[001009] Os extratos de células também foram preparados partindo das culturas de 3 horas através da suspensão dos péletes de células de 5 mL de cultura em reagente Novagen BugBuster® contendo benzonase nuclease e o conjunto # 3 de coquetel de inibidor de protease (Calbiochem-Novabiochem Corp., San Diego, CA) à temperatura ambiente durante 20 minutos com agitação suave e centrifugados a 16.000 x g para remover restos celulares. Os sobrenadantes (extratos de células) foram carregados em géis com gradiente de 4-15% para a análise das proteínas solúveis celulares.
[001010] A amostra de 3 horas da arginina racemase de P. taetrolens clonada exibia uma banda de proteína total que correspondia ao tamanho correto (aproximadamente 45 kDa) no vetor pET 30 (não marcado). O produto gênico de pET 30 de P. taetrolens era superexpresso em um nível mais alto que o produto gênico de pET 28 de P. taetrolens (não marcado com histidina), mas nenhum dos vetores forPetição 870170009999, de 15/02/2017, pág. 537/1247
528/788 neceu uma banda de proteína solúvel visível.
[001011] As células das culturas induzidas (100 mL) foram centrifugadas e lavadas uma vez com 0,85% de NaCI. Os péletes de células foram ressuspensos em 5 mL/g de peso úmido de células do reagente BugBuster® (Novagen, Madison, Wl) contendo 5 pL/mL do conjunto # 3 de coquetel de inibidor de protease (Calbiochem-Novabiochem Corp., San Diego, CA) e 1 pL/mL de benzonase nuclease. As amostras foram incubadas à temperatura ambiente durante 20 minutos em um agitador orbital. Os restos celulares insolúveis foram removidos por centrifugação a 16.000 X g durante 20 minutos a 4G.
[001012] Os extratos de células foram analisados em relação à atividade de triptofano racemase utilizando o protocolo a seguir. Reações de um mL foram realizadas em 50 mM de fosfato de potássio (pH 8,0), 0,05 mM de PLP e 30 mM de L triptofano. As reações foram iniciadas através da adição de extratos isentos de células e foram incubadas a 30Ό durante a noite. Foram tiradas alíquotas de amostras após a incubação durante a noite (as amostras em zero minuto serviam como a reação de controle). O ácido fórmico concentrado (5 pL) foi adicionado em cada alíquota de amostra de 250 pL para interromper a reação e a proteína precipitada foi removida por centrifugação. Os sobrenadantes foram removidos e congelados a -800 até serem anal isados em relação ao D-triptofano através do método de aminoácido quiral descrito no Exemplo 1.
[001013] Os resultados dos ensaios dos extratos de células provenientes da indução de pET28 e pET30 com 100 pM de IPTG (3 horas) demonstram que os clones de P. taetrolens exibem atividade de racemase sobre o L-triptofano. Novamente, a versão marcada da BAR parece ser menos ativa e pode precipitar ou ser menos solúvel que a não marcada (pET28). A Tabela 44, abaixo, mostra os resultados iniciais, embora não quantitativos uma vez que foi obtida uma proteína muito
Petição 870170009999, de 15/02/2017, pág. 538/1247
529/788 fracamente solúvel. Tabela 44
Tratamento Ponto de Tempo Subs- trato Extrato de Racemase (200 pg) Cone de Dtrp (pg/mL)
pET28 / P. taetrolens 0 L-trp 500 pL nd
pET30 / P. taetrolens 0 L-trp 500 pL nd
pET28 / P. taetrolens durante a noite L-trp 500 pL 140
pET30 / P. taetrolens durante a noite L-trp 500 pL 226
Ό01014] A indução do constructo de pET30 (não marcada) foi repetida utilizando as mesmas condições que as mencionadas anteriormente e uma banda de proteína solúvel visível foi observada na SDSPAGE. O ensaio foi repetido utilizando as mesmas condições descritas anteriormente e foram obtidos os resultados, que são mostrados na Tabela 45 abaixo.
Tabela 45
Tratamento Ponto de Tempo Substrato Extrato de Racemase (μί) Cone de Dtrp (pg/mL)
P. taetrolens-pET30 0 L-trp 300 Nd
P. taetrolens-pET30 0 L-trp 150 Nd
P. taetrolens-pET30 2 h L-trp 300 319
P. taetrolens-pET30 2 h L-trp 150 308
P. taetrolens-pET30 Durante a noite L-trp 300 1586
P. taetrolens-pET30 Durante a noite L-trp 150 1658
[001015] Novamente, foi observado que a duplicação d os volumes
não aumentava mais a atividade. Para um trabalho futuro, foi determinado remover a proteína do Bugbuster o mais rápido possível após a preparação dos extratos de células e armazenar a proteína em 50 mM
Petição 870170009999, de 15/02/2017, pág. 539/1247
530/788 de tampão de fosfato pH 8 contendo 0,01 mM de PLP. O detergente no Bugbuster pode inibir a reação ou pode causar uma perda de atividade após o armazenamento.
[001016] A indução do constructo pET30 foi realizada novamente e o extrato de células foi processado com cromatografia de troca aniônica (como no Exemplo 28) para fornecer um extrato mais puro. O ensaio foi repetido com esta preparação parcialmente purificada. Os números entre parênteses na coluna de Extrato de Racemase da Tabela 46 abaixo indicam a quantidade aproximada de enzima racemase parcialmente purificada utilizada no ensaio. Os resultados do ensaio são mostrados na Tabela 46 abaixo.
Tabela 46
Fonte da Enzima Ponto de Tempo Substrato Extrato de Racemase Cone de D-trp (pg/mL)
KT2440 0 L-trp 75 pL (90 pg) nd
NBRC 12996 0 L-trp 42 pL (200pg) nd
NBRC 12996 0 L-trp 21 pL (100 pg) nd
P. taetrolens 0 L-trp 108 pL (200 pg) nd
P. taetrolens 0 L-trp 54 pL (100 pg) nd
KT2440 2 h L-trp 75 pL (90 pg) 661
NBRC 12996 2 h L-trp 42 pL (200pg) 408
NBRC 12996 2 h L-trp 21 pL (100 pg) 208
P. taetrolens 2 h L-trp 108 pL (200 pg) 862
P. taetrolens 2 h L-trp 54 pL (100 pg) 547
KT2440 durante a noite L-trp 75 pL (90 pg) 2386
NBRC 12996 durante a noite L-trp 42 pL (200pg) 2382
NBRC 12996 durante a noite L-trp 21 pL (100 pg) 1706
P. taetrolens durante a noite L-trp 108 pL (200 pg) 2029
P. taetrolens durante a noite L-trp 54 pL (100 pg) 2099
[001017] A não linearidade da amostra cultivada durante a noite neste caso é provavelmente devida ao fato de que as reações estão atinPetição 870170009999, de 15/02/2017, pág. 540/1247
531/788 gindo o equilíbrio. Evidentemente, a BAR de P. taetrolens possui atividade significativa em relação à racemização de triptofano, assim como a BAR de 12996 e a BAR de KT2440. Parece que a BAR de KT2440 e a BAR de P. taetrolens possuem atividade similar, que é ligeiramente maior que a da BAR de 12996.
[001018] A sequência de DNA da arginina racemase de P. taetrolens é mostrada abaixo como a SEQ ID NO: 410. A sequência da PCR forneceu duas alterações quando comparada com a sequência do NCBI publicada. Especificamente, a sequência da PCR continha uma adenosina ao invés de uma guanina na posição 902 e uma citosina ao invés de uma guanina na posição 921. Estas alterações no DNA resultaram em uma mutação silenciosa assim como em uma alteração de glicina em aspartato na posição de aminoácido 301.
ATGCCCTTCTCCCGTACCCTGCTCGCCCTTTCCCTTGGCATGGCA
TTGCTGCAAAACCCGGCCTTTGCTGCGCCACCCCTGTCGATGACC
GACGGCGTAGCTCAAGTGAATACCCAGGACAGCAATGCCTGGGT
CGAAATCAATAAAGCCGCGTTCGAGCACAACATACGGACTCTGCA
AACCGCCCTCGCCGGCAAGTCGCAGATCTGCGCCGTACTCAAGG
CGGATGCCTATGGCCACGGTATCGGCTTGTTGATGCCCTCGGTG
ATCGCCATGGGTGTTCCCTGTGTCGGTGTCGCCAGCAACGAAGA
AGCCCGCGTCGTGCGCGAGAGCGGTTTCAAGGGTCAACTGATAC
GCGTGCGCACCGCTGCCCTGAGCGAACTGGAAGCTGCACTGCCG
TACAACATGGAAGAGCTGGTGGGCAACCTGGACTTCGCGGTCAA
GGCCAGCCTGATTGCCGAGGATCACGGTCGCCCGCTGGTGGTGC
ACCTGGGTCTGAATTCCAGCGGCATGAGCCGTAACGGAGTGGAC
ATGACCACCGCTCAGGGCCGTCGTGATGCGGTAGCTATCACCAA
GGTGCCAAACCTGGAAGTGCGGGCGATCATGACCCACTTCGCGG
TCGAAGATGCTGCCGACGTGCGTGCCGGGCTCAAGGCCTTCAAT
CAGCAAGCCCAATGGCTGATGAACGTGGCCCAGCTTGATCGCAG
CAAGATCACCCTGCACGCGGCCAACTCGTTCGCCACACTGGAGG
Petição 870170009999, de 15/02/2017, pág. 541/1247
532/788
TGCCCGAATCGCATCTGGACATGGTCCGCCCCGGCGGCGCGCTG
TTCGGCGACACCGTACCGTCCCACACCGAGTACAAGCGGGTCAT
GCAGTTCAAGTCCCACGTGGCGTCGGTCAACAGCTACCCCAAGG
GCAACACCGTCGGTTATGACCGCACGTACACCCTGGGCCGCGAC
TCGCGGCTGGCCAACATCACCGTCGGCTACTCTGACGGCTACCG
CCGCGCGTTTACCAATAAAGGGATTGTGCTGATCAACGGCCATCG
CGTGCCAGTGGTGGGCAAAGTCTCGATGAACACCCTGATGGTGG
ACGTCACTGACGCGCCGGATGTGAAAAGCGGCGATGAAGTGGTG
CTGTTCGGGCACCAGGGCAAGGCCGAGATTACCCAGGCTGAGAT
CGAAGACATCAACGGTGCACTGCTTGCGGATCTGTATACCGTGTG
GGGCAATTCCAACCCTAAAATCCTGAAAGATCAGTAA (SEQ ID NO: 410).
[001019] A proteína codificada pelo gene da SEQ ID NO: 410 foi analisada através do programa de previsão de peptídeo sinal Signal P 3.0 (www.cbs.dtu.dk/services/SignalP/) e foi prevista uma sequência líder de 23 aminoácidos.
Mutagênese I384M de BAR de P. taetrolens [001020] A mutagênese foi realizada utilizando o QuickChange-Multi site-Directed Mutagenesis Kit (Stratagene, La Jolla, CA), utilizando o gene BAR de P. taetrolens em pET30 que resulta em uma proteína não marcada. O iniciador mutagênico a seguir foi utilizado para produzir a alteração I384M: 5'TACCCAGGCTGAGATGGAAGACATCAACG-3' (SEQ ID NO: 411). [001021] A mutagênese direcionada ao sítio foi realizada como descrito no protocolo do fabricante. Vários isolados foram seqüenciados (Agencourt, Beverly, MA) e um isolado com a sequência correta foi selecionado e utilizado para análises adicionais.
[001022] O plasmídeo foi transformado em células BL21(DE3) (Novagen, Madison, Wl). A proteína recombinante foi produzida em meio Overnight Express II (Novagen, Madison, Wl) contendo 50 pg/mL de
Petição 870170009999, de 15/02/2017, pág. 542/1247
533/788 canamicina de acordo com os protocolos do fabricante. Os extratos isentos de células foram preparados utilizando BugBuster (Novagen, Madison, Wl) de acordo com os protocolos do fabricante, dessalinizados e analisado em relação à porcentagem de expressão da proteína alvo utilizando o método Experion descrito anteriormente.
[001023] Os ensaios de proteína total foram realizados utilizando um kit Pierce BCA (Pierce, Rockford, IL). Os ensaios de triptofano racemase com a enzima mutante foram realizados utilizando a enzima do tipo selvagem preparada da mesma maneira que um controle positivo. Os ensaios continham por mL: 30 mM de L-triptofano, 50 mM de fosfato de potássio pH 8, 10 μΜ de PLP e aproximadamente 100 pg de proteína racemase em um extrato isento de células. N° caso em que 100 pg não foram utilizados (com base na % de expressão por Experion e números de proteína total da Pierce), os resultados foram normalizados. Foram coletadas amostras em zero, 30 minuto, 2 horas e durante a noite amostras, tratadas com 2% de ácido fórmico, filtradas e diluídas 1:10 para análise utilizando o método de aminoácido quiral método descrito no Exemplo 1.
[001024] A enzima do tipo selvagem parecia produzir 49,1 ppm de Dtriptofano em 30 minutos, enquanto que o mutante I384M produzia 108 ppm. O ponto de tempo de 2 horas era similar - 229,4 ppm de Dtriptofano foram produzidas pela enzima do tipo selvagem versus 541,7 para o mutante I384M. A mutação I384M parecia ter aproximadamente dobrado a atividade da BAR de P. taetrolens. O ponto de tempo durante a noite para o mutante também é maior, mas à medida que as reações se aproximavam do equilíbrio a diferença entre as atividades era reduzida. Quando foram realizados ensaios para a produção de monatina como no Exemplo 28, a I384M não parecia fornecer qualquer benefício em relação à enzima de P. taetrolens do tipo selvagem.
Petição 870170009999, de 15/02/2017, pág. 543/1247
534/788
Exemplo 30
Ensaio do Extrato de A. caviae [001025] Aeromonas caviae ATCC 14486 foi cultivada em caldo nutricional a 37Ό. As células da cultura (200 mL) fo ram centrifugadas e lavadas uma vez com 0,85% de NaCI. Os péletes de células foram ressuspensos em 5 mL/g de peso de células úmido de reagente BugBuster® (Novagen, Madison, Wl) contendo 5 pL/mL do conjunto # 3 de coquetel de inibidor de protease (Calbiochem-Novabiochem Corp., San Diego, CA) e 1 pL/mL de benzonase nuclease. As amostras foram incubadas à temperatura ambiente durante 20 minutos em um agitador orbital. Os restos celulares insolúveis foram removidos por centrifugação a 16.000 X g durante 20 minutos a 4Ό. O extrato isento de células foi dessalinizado em uma coluna PD-10 (GE Healthcare, Piscataway, NJ).
[001026] O extrato isento de células foi analisado em relação à atividade de triptofano racemase utilizando o protocolo a seguir. Reações de um mL foram realizadas em 50 mM de fosfato de potássio (pH 8,0), 0,05 mM de PLP e 30 mM de L triptofano. As reações foram iniciadas através da adição de extrato isento de células (100 pL ou 500 pL) e foram incubadas a 30Ό durante a noite. Alíquotas de amostras foram tiradas em 2 horas e após a incubação durante a noite (as amostras de zero minuto serviam como reações de controle). O ácido fórmico concentrado (5 pL) foi adicionado em cada alíquota de amostra de 250 pL para interromper a reação e a proteína precipitada foi removida por centrifugação. Os sobrenadantes foram removidos e congelados a 80Ό até serem analisados em relação ao D-triptofan o através do método de aminoácido quiral descrito no Exemplo 1.
[001027] Os resultados do ensaio partindo dos extratos de células de A. caviae demonstraram atividade de racemase sobre L-triptofano, como mostrado na Tabela 47.
Petição 870170009999, de 15/02/2017, pág. 544/1247
535/788
Tabela 47
Tratamento Ponto de Tempo substrato Extrato de racemase Cone de Dtrp (pg/mL)
A. caviae 0 L-trp 100 pL nd
A. caviae 0 L-trp 500 pL nd
A. caviae 2 h L-trp 100 pL 2
A. caviae 2 h L-trp 500 pL 19
A. caviae durante a noite L-trp 100 pL 45
A. caviae durante a noite L-trp 500 pL 130
[001028] Após observar a atividade nos extratos de células de A. caviae, foram planejados iniciadores degenerados (com base nas regiões conservadas de homólogos de BAR conhecidos) para a obtenção do gene BAR desta espécie. As sequências dos iniciadores degenerados são mostradas abaixo:
[001029] Aer deg F2: 5'-GCCAGCAACGARGARGCMCGCGT-3' (SEQ ID NO: 412); e [001030] Aer deg R1: 5'-TGGCCSTKGATCAGCACA-3' (SEQ ID NO: 413) [001031] em que K indica G ou T, R indica A ou G, S indica C ou G e M de indica A ou C.
[001032] Os iniciadores anteriores foram utilizados para amplificar através da PCR um fragmento de DNA de 715 pb partindo do DNA genômico de A. caviae (ATCC 14486). Foi utilizado o protocolo da PCR a seguir: Uma reação de 50 pl_ continha 0,5 μΙ_ de molde (~100 ng de DNA genômico de A. caviae), 1,6 μM de cada iniciador, 0,3 mM de cada dNTP, 10 U de rTth Polymerase XL (Applied Biosystems, Foster City, CA), 1X tampão XL, 1 mM de Mg(OAc)2 e 2,5 pL de dimetil sulfóxido. O programa do termociclador utilizado incluía um início a quente a 94Ό durante 3 minutos e 30 repetições das etapas a seguir: 94Ό durante 30 segundos, 53Ό durante 30 segundos e 68Ό durante
Petição 870170009999, de 15/02/2017, pág. 545/1247
536/788 minutos. Após as 30 repetições, a amostra foi mantida a 68G durante 7 minutos e então armazenada a 4G. Este protoco Io da PCR obteve um produto de 715 pb.
Clonagem [001033] O produto da PCR foi purificado em gel partindo de gel de TAE-agarose a 0,8% utilizando o Qiagen gel extraction kit (Qiagen, Valencia, CA). O produto foi clonado em TOPO e transformado em células TOP 10 de acordo com o protocolo do fabricante (Invitrogen, Carlsbad, CA). O DNA plasmideal foi purificado partindo dos transformantes resultantes utilizando o Qiagen spin miniprep kit (Qiagen, Valencia, CA) e verificado em relação aos insertos corretos através da digestão de restrição com EcoR /. As sequências dos plasmídeos que pareciam ter o inserto correto foram verificadas através do seqüenciamento de DNA com terminação de cadeia didesóxi com os iniciadores M13 universais para frente.
[001034] A sequência de DNA do produto da PCR de A. caviae é mostrada abaixo como a SEQ ID NO: 414, com as regiões das sequências dos iniciadores degenerados sublinhadas:
GCCAGCAACGARGARGCMCGCGTTGCCCGCGAGAAGGGCTTCG
AAGGTCGCCTGATGCGGGTACGTGCCGCCACCCCGGATGAAGTG
GAGCAGGCCCTGCCCTACAAGCTGGAGGAGCTCATCGGCAGCCT
GGAGAGCGCCAAGGGGATCGCCGACATCGCCCAGCGCCATCAC
ACCAACATCCCGGTGCACATCGGCCTGAACTCCGCCGGCATGAG
CCGCAACGGCATCGATCTGCGCCAGGACGATGCCAAGGCCGATG
CCCTGGCCATGCTCAAGCTCAAGGGGATCACCCCGGTCGGCATC
ATGACCCACTTCCCGGTGGAGGAGAAAGAGGACGTCAAGCTGGG
GCTGGCCCAGTTCAAGCTGGACTACCAGTGGCTCATCGACGCCG
GCAAGCTGGATCGCAGCAAGCTCACCATCCACGCCGCCAACTCC
TTCGCCACCCTGGAAGTACCGGAAGCCTACTTTGACATGGTGCGC
CCGGGCGGCATCATCTATGGCGACACCATTCCCTCCTACACCGA
Petição 870170009999, de 15/02/2017, pág. 546/1247
537/788
GTACAAGAAGGTGATGGCGTTCAAGACCCAGGTCGCCTCCGTCA
ACCACTACCCGGCGGGCAACACCGTCGGCTATGACCGCACCTTC
ACCCTCAAGCGCGACTCCCTGCTGGCCAACCTGCCGATGGGCTA
CTCCGACGGCTACCGCCGCGCCATGAGCAACAAGGCCTATGTGÇ
TGATCMASGGCCA [001035] (SEQ ID NO: 414), em que R indica A ou G, S indica C ou G e M de indica A ou C.
[001036] A sequência de aminoácidos da enzima BAR parcial de A. caviae é mostrada como a SEQ ID NO: 415 abaixo. ASNEEARVAREKGFEGRLMRVRAATPDEVEQALPYKLEELIGSLESA KG IADIAQRH HTNIPVHIGLNSAGMSRNGIDLRQDDAKADALAMLKLK GITPVGIMTHFPVEEKEDVKLGLAQFKLDYQWLIDAGKLDRSKLTIHA ANSFATLEVPEAYFDMVRPGGIIYGDTIPSYTEYKKVMAFKTQVASVN HYPAGNTVGYDRTFTLKRDSLLANLPMGYSDGYRRAMSNKAYVLIX G [001037] em que X é H, Q, N ou K (SEQ ID NO: 415).
[001038] O fragmento da sequência de proteína consenso da SEQ ID NO: 415 acima é 89% homólogo no nível de aminoácidos à sequência TIGR publicada para A. hydrophila. Era esperado que devido ao fato de que a proteína altamente relacionada de Aeromonas hydrophila exibir atividade de racemase de especificidade ampla, assim como os extratos celulares de A. caviae, a região codificadora de comprimento completo para A. caviae, uma vez obtida, produziria uma racemase que também teria uma especificidade ampla com atividade sobre o triptofano. Os métodos de Genome Walker foram utilizados para a obtenção da sequência gênica de comprimento completo do gene BAR de A. caviae mostrada abaixo como a SEQ ID NO: 416. atgcacaaga aaacactgct cgcgaccctg atctttggcc tgctggccgg ccaggcagtc gccgccccct atctgccgct cgccgacgac caccgcaacg gtcaggaaca gaccgccgcc aacgcctggc tggaagtgga tctcggcgcc ttcgagcaca acatccagac
Petição 870170009999, de 15/02/2017, pág. 547/1247
538/788 cctgaagaat cgcctcggtg acaagggccc gcagatctgc gccatcatga aggcggacgc ctacggtcac ggcatcgacc tgctggtccc ttccgtggtc aaggcaggca tcccctgcat cggcatcgcc agcaacgaag aagcacgtgt tgcccgcgag aagggcttcg aaggtcgcct gatgcgggta cgtgccgcca ccccggatga agtggagcag gccctgccct acaagctgga ggagctcatc ggcagcctgg agagcgccaa ggggatcgcc gacatcgccc agcgccatca caccaacatc ccggtgcaca tcggcctgaa ctccgccggc atgagccgca acggcatcga tctgcgccag gacgatgcca aggccgatgc cctggccatg ctcaagctca aggggatcac cccggtcggc atcatgaccc acttcccggt ggaggagaaa gaggacgtca agctggggct ggcccagttc aagctggact accagtggct catcgacgcc ggcaagctgg atcgcagcaa gctcaccatc cacgccgcca actccttcgc caccctggaa gtaccggaag cctactttga catggtgcgc ccgggcggca tcatctatgg cgacaccatt ccctcctaca ccgagtacaa gaaggtgatg gcgttcaaga cccaggtcgc ctccgtcaac cactacccgg cgggcaacac cgtcggctat gaccgcacct tcaccctcaa gcgcgactcc ctgctggcca acctgccgat gggctactcc gacggctacc gccgcgccat gagcaacaag gcctatgtgc tgatccatgg ccagaaggcc cccgtcgtgg gcaagacttc catgaacacc accatggtgg acgtcaccga catcaagggg atcaaacccg gtgacgaggt ggtcctgttc ggacgccagg gtgatgccga ggtgaaacaa tctgatctgg aggagtacaa cggtgccctc ttggcggaca tgtacaccgt ctggggctat accaacccca agaagatcaa gcgctaa (SEQ ID NO: 416).
[001039] A sequência de aminoácidos correspondente para a BAR nativa de A. caviae é mostrada abaixo como a SEQ ID NO: 417:
mhkktllatl ifgllagqav aapylpladd hrngqeqtaa nawlevdlga fehniqtlkn rlgdkgpqic aimkadaygh gidllvpsw kagipcigia sneearvare kgfegrlmrv
121 raatpdeveq alpykleeli gslesakgia diaqrhhtni
161 pvhiglnsag msrngidlrq ddakadalam Iklkgitpvg
201 imthfpveek edvklglaqf kldyqwlida gkldrsklti
241 haansfatle vpeayfdmvr pggiiygdti psyteykkvm
281 afktqvasvn hypagntvgy drtftlkrds llanlpmgys
321 dgyrramsnk ayvlihgqka pwgktsmnt tmvdvtdikg
Petição 870170009999, de 15/02/2017, pág. 548/1247
539/788
361 ikpgdewlf grqgdaevkq sdleeyngal ladmytvwgy
401 tnpkkikr (SEQ ID NO: 417).
[001040] Os primeiros 21 resíduos de aminoácidos N-terminais da SEQ ID NO: 417 são previstos como sendo um peptídeo sinal utilizando o programa Signal P 3.0 (www.cbs.dtu.dk/services/SignalP/). Evidências experimentais confirmaram que o produto de expressão era secretado no periplasma de E. coli e o peptídeo sinal era clivado como previsto. Foi observado que o gene de comprimento completo, quando clonado e expresso utilizando os métodos descritos anteriormente, tinha atividade comparável a, mas maior que à da BAR de P. taetrolens. Exemplo 31
Produção da aldolase da SEQ ID NO: 276 em um hospedeiro de expressão alternativo [001041] O gene da SEQ ID NO: 275 foi subclonado utilizando procedimentos de biologia molecular padronizados em um derivado do vetor pET23d (Novagen, Madison, Wl) contendo o gene metE de E. coli e o promotor inseridos no sítio de restrição de Λ/goMIV e um segundo sítio de restrição de psil que foi adicionado para a remoção fácil do gene da beta lactamase (bla). A constructo deste vetor contendo um inserto para um gene de myo-inositol oxigenase é descrita no PCT W02006066072 nos Exemplos 2 e 20. O inserto de aldolase foi confirmado através do seqüenciamento de DNA (Agencourt Bioscience Corporation; Beverly, MA) e o plasmídeo com a sequência de inserto correta foi transformado no hospedeiro de expressão de E. coli BW30384(DE3)AompTAmetE. A constructo deste hospedeiro de expressão e o protocolo de transformação também são descritos no PCT W02006066072 (Exemplos 21 e 22). O gene da aldolase foi expresso utilizando o Novagen Overnight Express® Autoinduction System II (Novagen, Madison, Wl) contendo 100 mg/L de ampicilina. Este sistema
Petição 870170009999, de 15/02/2017, pág. 549/1247
540/788 foi descrito no Exemplo 24 para a expressão de D-alanina aminotransferase de Bacillus sphaericus (ATCC cepa 10208). Os extratos isentos de células contendo a aldolase foram produzidos utilizando o Novagen BugBuster® Extraction Reagent (isento de amina primária) (Novagen, Madison, Wl) contendo 1 pL/mL de benzonase nuclease, 0,033 de pL/mL r-Lysozyme e 5 pL/mL de Protease Inhibitor Cocktail Set II seguindo o protocolo recomendado pelo fabricante para a lise das células. As proteínas solúveis nos extratos isentos de células foram separadas em uma Bio-Rad Laboratories Experion® Automated Electrophoresis Station (Bio-Rad, Hercules, CA) e analisadas em relação à porcentagem de expressão de proteína solúvel utilizando o Experion Software versão 1.1.98.0 como descrito no Exemplo 12.
[001042] Para tentar aumentar a expressão da aldolase em E. coli, os códons dois até sete da sequência codificadora de DNA foram mutados nas alterações sugeridas partindo da análise da sequência do tipo selvagem utilizando o algoritmo Roche ProteoExpert RTS E. coli HY. As alterações foram feitas utilizando um QuikChange® Multi SiteDirected Mutagenesis Kit ou um QuikChange® II XL Site-Directed Mutagenesis Kit (Stratagene, La Jolla, CA) seguindo o protocolo sugerido pelo fabricante com 0,75 pL de Quik Solution por 25 pL de mistura de reação e a transformação em células XL10-Gold® ultracompetentes. As mutações foram geradas utilizando os iniciadores (cada um com 45 nucleotídeos de comprimento) planejados com o Stratagene's webbased QuikChange® Primer Design Program diponível online em www. stratagene.com.qciniciadordesign.
Petição 870170009999, de 15/02/2017, pág. 550/1247
541/788
Tabela 48
Códon 1 Códon 2 Códon 3 Códon 4 Códon 5 Códon 6 Códon 7
Tipo Selvagem ATG CCT ATC GTT GTT ACG AAG
ProteoExpert #1 ATG CCA ATT GTT GTA ACT AAA
ProteoExpert #2 ATG CCA ATT GTT GTT ACT AAA
ProteoExpert #6 ATG CCA ATT GTT GTA ACC AAA
ProteoExpert #10 ATG CCA ATT GTT GTT ACC AAA
[001043] As sequências gênicas da aldolase com as alterações de códons acima foram transformadas no hospedeiro de expressão de E. coli BW30384(DE3)AompTAmetE e então expressas utilizando o Novagen Overnight Express® Autoinduction System II (Novagen, Madison, Wl). Nenhuma destas mutações resultou em níveis mais altos de expressão gênica quando comparadas com a sequência do tipo selvagem. Os resultados típicos partindo dos extratos isentos de células analisados pelo Bio-Rad Experion Pro260 software 1.1.98.0 são mostrados na Tabela 49 abaixo, em que a coluna intitulada Expressão de Proteína mostra os valores para a % de proteína solúvel total.
[001044] Os extratos isentos de células (0,025 mg/mL de proteína solúvel por ensaio) foram analisados em relação a sua capacidade de produzir R,R-monatina partindo de 200 mM de piruvato de sódio e 100 mM de D-triptofano utilizando o protocolo descrito no Exemplo 7. As reações (volume total de 7 mL) foram realizadas em tubos de polipropileno de 14 mL em uma câmara anaeróbica com luvas utilizando a Daminotransferase purificada de B. sphaericus (ATCC 10208) na concentração final de 2 mg/mL. As concentrações de monatina produzida em 1, 4 e 20 h após a adição das enzimas são mostradas na Tabela
Petição 870170009999, de 15/02/2017, pág. 551/1247
542/788 abaixo. A Tabela 49 mostra que o extrato isento de células gerado partindo do constructo contendo a sequência de aldolase do tipo selvagem produzia uma concentração ligeiramente maior de monatina em 20 horas que a dos extratos isentos de células partindo dos constructos que carregavam mutações ProteoExpert. As concentrações de monatina foram determinadas através do método de LC/MS/MS descrito no Exemplo 1.
Tabela 49
Expressão de Proteína (%) [Monatina] mM-1 h [Monatina] mM-4 h [Monatina] mM-20 h
Tipo Selvagem 22 2,1 4,2 13,4
ProteoExpert #1 18 1,3 3,1 12,4
ProteoExpert #2 18 2,1 4,7 11,6
ProteoExpert #6 18 1,4 1,9 12,4
ProteoExpert #10 20 1,8 1,8 11,7
[001045] Estes dados demonstram que a aldolase da SEQ ID NO: 276 pode ser produzida em um hospedeiro de expressão alternativo sem a indução por IPTG.
[001046] O gene bla foi removido do vetor e fermentações subseqüentes para produzir aldolase foram realizadas sem o uso de antibiótico como descrito no PCT W02006066072 para uma outra enzima. Os níveis de expressão em fermentações alimentadas em batelada a 300 atingiram um máximo em 6-8 horas após a indução, produzindo a aldolase da SEQ ID NO: 276 em 25-30% da proteína solúvel, de acordo com os dados de Experion. Estudos de estabilidade não mostraram perda evidente de atividade de aldolase quando o produto da fermentação era deixado durante 6 horas a 15 ou 30°C (sob condições limitantes de oxigênio assim como condições aeradas) antes da concentração e do rompimento das células. Foi observado que a aldolase era igualmente estável armazenada na forma de um extrato isento de
Petição 870170009999, de 15/02/2017, pág. 552/1247
543/788 células ou na forma de um pélete de células quando armazenada durante 5 dias a -80G. A lavagem do pélete de célula s em tampão antes do armazenamento a -80G não era necessária e causa va na verdade uma ligeira diminuição na atividade. Foi observado que as células ressuspensas em água destilada, no sobrenadante de fermentação ou em 100 mM de tampão de fosfato de potássio (pH 7,8) não tinham perda na atividade ou na concentração de proteína (julgada por SDS-PAGE) quando armazenadas durante 11 dias à temperatura ambiente ou a 4G. O extrato isento de células produzido em tampã o de fosfato de potássio não exibia perda de atividade de aldolase quando armazenado a 4G ou à temperatura ambiente durante 5 dias. As células podem ser rompidas em tampão de fosfato, até 25% de sobrenadante de cultura ou água com recuperação comparável de atividade de aldolase; entretanto, foi observado que a adição de 1 mM de MgCI2 em água aumentava ligeiramente a atividade de aldolase. Estes dados mostram que a proteína aldolase é suficientemente estável para ser útil comercialmente.
[001047] Foi descrito um número de modalidades da invenção. As modalidades da invenção incluem um ou mais dos aspectos descritos anteriormente. Será entendido que várias modificações podem ser feitas sem sair do espírito e do âmbito de acordo com a invenção. Conseqüentemente, outras modalidades estão dentro do âmbito das reivindicações a seguir.
Petição 870170009999, de 15/02/2017, pág. 553/1247
544/788
LISTAGEM DE SEQÜÊNCIA <110> Burke, Ellen
Hicks, Paula M.
Luginbuhl, Peter Richardson, Toby Weiner, David Zhao, Lishan <120> Aldolases, ácidos nucléicos codificando estes e métodos para produção e uso destes <130> D1710-6WO <140> PCT/US07/63515 <141> 2007-03-07 <150> 60/780,515 <151> 2006-03-07 <160> 417 <170> Patentln 3.1 <210> 1 <211> 699 <212> DNA <213> desconhecido <220>
<223> DNA bacteriano <400> 1
atgcagccgc tgaaggaatt cgccgagctc tccaccccgc tgatcgccga cgcctgcgtg 60
cggctcgggg aacccctgcg cgtcgcgccc gccggcatcc tgcccgtcgt cgcgggccgg 120
cgcgtcgccg gccgggccct gcccgtacgg cactacggca gcgtcgacgt cttcctggag 180
gcgttcggcg aggccgagcc cggtgacgtc ctcgtcatcg acaacgcggg ccgcgtcgac 240
gaggcctgca tcggcgacct cgccgtcctg gaggcggcgg cggccggcat cgccggggtc 300
gtcgtgtggg gcctgcaccg ggacaccccc gacctcgtcg agatcgggct gcccgtcttc 360
tcctacggac gccacgcgcc cggccccgtg cgcgtcgacc cccgggaccc ggacgcgctg 420
acgaccgcgc ggttcggcga gcacgaggtg accgccgccg acgtcgtgtt cggcgacgac 480
gacggcgtgg tcttcgtcgc cgccgcccgg gccggcgccg tcctggaggc ggcccgggcc 540
ctgttccgta cggagcgcga gcaggcgcgg cggatcaggg cgggggagac gctgcgcgcc 600
cagacccggt tcgacgcgta cctggcgggc cgggccgagg acccctcgta caccttccgg 660
cagcacctgc gccggatcgg cggcgcgatc gaggagtga 699
<210> 2 <211> 232 <212> PRT <213> desconhecido <220>
<223> Proteína Bacteriana <220>
<221> DOMÍNIO <222> (8)...(165) <223> Demetilmenaquinone metiltransferase
Petição 870170009999, de 15/02/2017, pág. 554/1247
545/788
<400> 2
Met Gin Pro Leu Lys Glu Phe Ala Glu Leu Ser Thr Pro Leu Ile Ala
1 5 10 15
Asp Ala Cys Vai Arg Leu Gly Glu Pro Leu Arg Vai Ala Pro Ala Gly
20 25 30
Ile Leu Pro Vai Vai Ala Gly Arg Arg Vai Ala Gly Arg Ala Leu Pro
35 40 45
Vai Arg His Tyr Gly Ser Vai Asp Vai Phe Leu Glu Ala Phe Gly Glu
50 55 60
Ala Glu Pro Gly Asp Vai Leu Vai Ile Asp Asn Ala Gly Arg Vai Asp
65 70 75 80
Glu Ala Cys Ile Gly Asp Leu Ala Vai Leu Glu Ala Ala Ala Ala Gly
85 90 95
Ile Ala Gly Vai Vai Vai Trp Gly Leu His Arg Asp Thr Pro Asp Leu
100 105 110
Vai Glu Ile Gly Leu Pro Vai Phe Ser Tyr Gly Arg His Ala Pro Gly
115 120 125
Pro Vai Arg Vai Asp Pro Arg Asp Pro Asp Ala Leu Thr Thr Ala Arg
130 135 140
Phe Gly Glu His Glu Vai Thr Ala Ala Asp Vai Vai Phe Gly Asp Asp
145 150 155 160
Asp Gly Vai Vai Phe Vai Ala Ala Ala Arg Ala Gly Ala Vai Leu Glu
165 170 175
Ala Ala Arg Ala Leu Phe Arg Thr Glu Arg Glu Gin Ala Arg Arg Ile
180 185 190
Arg Ala Gly Glu Thr Leu Arg Ala Gin Thr Arg Phe Asp Ala Tyr Leu
195 200 205
Ala Gly Arg Ala Glu Asp Pro Ser Tyr Thr Phe Arg Gin His Leu Arg
210 215 220
Arg Ile Gly Gly Ala Ile Glu Glu
225 230 <210> 3 <211> 693 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 3 gtgaccggcc acgtcatcgt ccgcgagatc gaccgcgccg acgcgaacgc cctcgacggc 60 ctcgccgcgc tcggcgtctc gacggtgcac gaggccgacg gccgccgcgg cgcgctcgcc 120 accgccattc gaccgatcca cagtggattc acgatcgccg gttcggcggt gacggtctcc 180 tcccagccgg gcgacaacgt catgatccac gccgccattg aggtgtgccg gcccggcgac 240 atcctcgtgg tcaccaccac ctcgccgtcc accgacggga tgatcggcga actgctggcg 300 acgtcgctgc gcgcgcacgg ggtgcggggt gtcgtcaccg atgccggcgt acgcgacgtc 360 gcccagctcc gggcgatgaa cttcccggtg tggacgcgcg ccatcagtcc acaggggacg 420
Petição 870170009999, de 15/02/2017, pág. 555/1247
546/788
gcccgggctc ggtgaacata ccggtcgtct gcgccggcca ggtcgtccac 480
ccatcgtcgc cgacgacgac ggcgttgtcg tcgtcccgcg cgaccgggtg 540
tggcggccgg ccgggcgcgg gccgagagcg aggacgacaa acgcgtccgg 600
gcgaactctc ggtcgacatg tacgggctgc gcgagctgct cacccgactc 660
acgtcgaccg gcggccggcg tga 693
<210> 4 <211> 230 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (28)...(174) <223> Demetilmenaquinone metiltransferase <400> 4
Met Thr Gly His Vai Ile Vai Arg Glu Ile Asp Arg Ala Asp Ala Asn 15 10 15
Ala Leu Asp Gly Leu Ala Ala Leu Gly Vai Ser Thr Vai His Glu Ala
25 30
Asp Gly Arg Arg Gly Ala Leu Ala Thr Ala Ile Arg Pro Ile His Ser
40 45
Gly Phe Thr Ile Ala Gly Ser Ala Vai Thr Vai Ser Ser Gin Pro Gly
55 60
Asp Asn Vai Met Ile His Ala Ala Ile Glu Vai Cys Arg Pro Gly Asp
70 75 80
Ile Leu Vai Vai Thr Thr Thr Ser Pro Ser Thr Asp Gly Met Ile Gly
90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Arg Gly Vai Vai
100 105 110
Thr Asp Ala Gly Vai Arg Asp Vai Ala Gin Leu Arg Ala Met Asn Phe
115 120 125
Pro Vai Trp Thr Arg Ala Ile Ser Pro Gin Gly Thr Vai Lys Ala Ser
130 135 140
Pro Gly Ser Vai Asn Ile Pro Vai Vai Cys Ala Gly Gin Vai Vai His
145 150 155 160
Pro Gly Asp Ala Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Pro
165 170 175
Arg Asp Arg Vai Pro Ala Vai Leu Ala Ala Gly Arg Ala Arg Ala Glu
180 185 190
Ser Glu Asp Asp Lys Arg Vai Arg Leu Ala Gly Gly Glu Leu Ser Vai
195 200 205
Asp Met Tyr Gly Leu Arg Glu Leu Leu Thr Arg Leu Gly Vai Glu Tyr
210 215 220
Vai Asp Arg Arg Pro Ala
Petição 870170009999, de 15/02/2017, pág. 556/1247
547/788
225 230 <210> 5 <211> 762 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 5
atggcgttga ataccggttc cgacattatt cgcccgtcca aggagctcgt tgccgggctc 60
aaagctcttg gcagtgcgac catcgcgggc acgctcggcc acatggggtt caagaacccg 120
cacatgacgg gcatcctgcc acagacggcg ggcaaggtca tggccggccc ggcgctgacg 180
ctgcagtgca tgccgcagcg accggacctg ttcagcgaag gcgaatacgc cgatcctgaa 240
acgcagctcc accgccatgt gctctatcac gtgcaggagg gcgacgtggt cgtcgtcgat 300
gcgcgcggcg atatgaagtc gggcatcttc ggcgacatga tgtcgaccta cttcaagggc 360
cgcggcggcg ccggcatcgt catcgacggc tgcatgcgcg atcgtcccaa tgtcgaaaag 420
ctcgacctgt cgctctggct caagggctgg acgccgaact accacgtcca gaccgacatc 480
tttccctacg cggtgaacgt tccagtcgca tgtggcggcg ttcttgtgct ccccggcgac 540
atcatcgttg ccgatgacga cggcgctgtc gtcgtgccgg tgaagatggc gcagcacatc 600
gtcgaggacg gcaagaagca cgccgagtgg gaagtgttct cgcgcgagaa gctgatggcc 660
ggcgagtcgc tccgccgtta ctacccgctg caccccgatg ccgaggacga ataccaggcc 720
tggcggaagg cgaaggggct gccgccgtcg ccctcgcgct aa 762
<210> 6 <211> 253 <212> PRT <213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente
<220>
<221> DOMÍNIO
<222> (21)...(191)
<223> Demetilmenaquinone metiltransferase
<400> 6
Met Ala Leu Asn Thr Gly Ser Asp Ile Ile Arg Pro Ser Lys Glu Leu
15 10 15
Vai Ala Gly Leu Lys Ala Leu Gly Ser Ala Thr Ile Ala Gly Thr Leu
20 25 30
Gly His Met Gly Phe Lys Asn Pro His Met Thr Gly Ile Leu Pro Gin
35 40 45
Thr Ala Gly Lys Vai Met Ala Gly Pro Ala Leu Thr Leu Gin Cys Met
50 55 60
Pro Gin Arg Pro Asp Leu Phe Ser Glu Gly Glu Tyr Ala Asp Pro Glu
65 70 75 80
Thr Gin Leu His Arg His Vai Leu Tyr His Vai Gin Glu Gly Asp Vai
85 90 95
Vai Vai Vai Asp Ala Arg Gly Asp Met Lys Ser Gly Ile Phe Gly Asp
Petição 870170009999, de 15/02/2017, pág. 557/1247
548/788
100 105 110
Met Met Ser Thr Tyr Phe Lys Gly Arg Gly Gly Ala Gly Ile Vai Ile
115 120 125
Asp Gly Cys Met Arg Asp Arg Pro Asn Vai Glu Lys Leu Asp Leu Ser
130 135 140
Leu Trp Leu Lys Gly Trp Thr Pro Asn Tyr His Vai Gin Thr Asp Ile
145 150 155 160
Phe Pro Tyr Ala Vai Asn Vai Pro Vai Ala Cys Gly Gly Vai Leu Vai
165 170 175
Leu Pro Gly Asp Ile Ile Vai Ala Asp Asp Asp Gly Ala Vai Vai Vai
180 185 190
Pro Vai Lys Met Ala Gin His Ile Vai Glu Asp Gly Lys Lys His Ala
195 200 205
Glu Trp Glu Vai Phe Ser Arg Glu Lys Leu Met Ala Gly Glu Ser Leu
210 215 220
Arg Arg Tyr Tyr Pro Leu His Pro Asp Ala Glu Asp Glu Tyr Gin Ala
225 230 235 240
Trp Arg Lys Ala Lys Gly Leu Pro Pro Ser Pro Ser Arg
245 250
<210> 7
<211> 672
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 7
atgagtgtag tggtgcaaaa tatcgagcgg gcagatcagg caattatcaa ggcgcttgct 60
gaatgcggtg tagcaactgt gcatgaggcc caaggccgca cggggttgct ggcttcttat 120
atgcggccaa tttatagcgg tgcttgcatt ggtgcatcag cggtaaccat tctggctccg 180
ccttgcgata actggatggt ccatgtggcc attgagcaga taaagccggg tgatgctctg 240
gttatggcaa caacatcgtc atctgatgcc ggatattttg gtgacctgct ggcgacctcg 300
atgcaggcgc gtggcggggt tggcatgatt atcgatgccg gggtgcgcga tattaaagac 360
ctgaccgaga tgaaatgtcc tgtctggtca aaagcgatct gcgctgaagg gacggtgaaa 420
gaaacacttg gctctgtaaa tattccggtg gtttgcgccg gccagttggt caaccccggc 480
gatattgtca tcgctgatga tgatggggtc tgtgtcgttg agcgcgaaag ggctggcgaa 540
gttctggaaa aagcgcaagc ccgcatggct ttggaagaag acaaacgtaa acgtttggcc 600
tccggtgaac ttgggctgga tatgtataat atgcgcgagc gtctggctga aaaaggtctc 660
aaatatgttt aa 672
<210> 8 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
Petição 870170009999, de 15/02/2017, pág. 558/1247
549/788 <221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 8
Met Ser Vai Vai Vai Gin Asn Ile Glu Arg Ala Asp Gin Ala Ile Ile 15 10 15
Lys Ala Leu Ala Glu Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
25 30
Arg Thr Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser Gly Ala
40 45
Cys Ile Gly Ala Ser Ala Vai Thr Ile Leu Ala Pro Pro Cys Asp Asn
55 60
Trp Met Vai His Vai Ala Ile Glu Gin Ile Lys Pro Gly Asp Ala Leu
70 75 80
Vai Met Ala Thr Thr Ser Ser Ser Asp Ala Gly Tyr Phe Gly Asp Leu
90 95
Leu Ala Thr Ser Met Gin Ala Arg Gly Gly Vai Gly Met Ile Ile Asp
100 105 110
Ala Gly Vai Arg Asp Ile Lys Asp Leu Thr Glu Met Lys Cys Pro Vai
115 120 125
Trp Ser Lys Ala Ile Cys Ala Glu Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Ile Pro Vai Vai Cys Ala Gly Gin Leu Vai Asn Pro Gly
145 150 155 160
Asp Ile Vai Ile Ala Asp Asp Asp Gly Vai Cys Vai Vai Glu Arg Glu
165 170 175
Arg Ala Gly Glu Vai Leu Glu Lys Ala Gin Ala Arg Met Ala Leu Glu
180 185 190
Glu Asp Lys Arg Lys Arg Leu Ala Ser Gly Glu Leu Gly Leu Asp Met
195 200 205
Tyr Asn Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Vai
210 215 220 <210> 9 <211> 552 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 9 atgaacggga ccgtcgtgcg caacatccat cgcgccgagg cgggggccat cgcggcgctc gggcgcatcg gcgtctcgac cgtccacgag gcgcaggggc gcaccgggct catgcaggcc tacatgcggc ccgtatggcg gggcgcgcgc atcgccggca gcgccgtgac cgtcctgtgc catcccaacg acaactggat gatccacgtc gcgatggagg tggcaaggcc cggcgacgtg ctcgtggtgg cttgctcgag cgagaacacg aacggcgcga tcggcgacct gatcgccacc tcgctcatgg cgcgcggcgt gaaaggcgcg atcctcgaca tgggctgccg cgacgtgctg
Petição 870170009999, de 15/02/2017, pág. 559/1247
550/788 gagctcgagc agatgaggtt tccgctctgg tcgcgggcca tctcggcgca gggaaccatc aagggcacgc tcggctcggt caacttcccg gtcacctgcg ccggcgccca cgtcaggccg ggcgacatcg tggtcgcgga cgacgacggc gtggtggtcg tgccccgcca ggacgcggcg aaagtgatcc aa <210> 10 <211> 184 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (21)...(173) <223> Demetilmenaquinone metiltransferase <220>
<221> SITE <222> (2)...(5) <223> N-glycosylation site. Prosite id = PS00001 <400> 10
420
480
540
552
Met Asn Gly Thr Vai Vai Arg Asn Ile His Arg Ala Glu Ala Gly Ala
1 5 10 15
Ile Ala Ala Leu Gly Arg Ile Gly Vai Ser Thr Vai His Glu Ala Gin
20 25 30
Gly Arg Thr Gly Leu Met Gin Ala Tyr Met Arg Pro Vai Trp Arg Gly
35 40 45
Ala Arg Ile Ala Gly Ser Ala Vai Thr Vai Leu Cys His Pro Asn Asp
50 55 60
Asn Trp Met Ile His Vai Ala Met Glu Vai Ala Arg Pro Gly Asp Vai
65 70 75 80
Leu Vai Vai Ala Cys Ser Ser Glu Asn Thr Asn Gly Ala Ile Gly Asp
85 90 95
Leu Ile Ala Thr Ser Leu Met Ala Arg Gly Vai Lys Gly Ala Ile Leu
100 105 110
Asp Met Gly Cys Arg Asp Vai Leu Glu Leu Glu Gin Met Arg Phe Pro
115 120 125
Leu Trp Ser Arg Ala Ile Ser Ala Gin Gly Thr Ile Lys Gly Thr Leu
130 135 140
Gly Ser Vai Asn Phe Pro Vai Thr Cys Ala Gly Ala His Vai Arg Pro
145 150 155 160
Gly Asp Ile Vai Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Pro Arg
165 170 175
Gin Asp Ala Ala Lys Vai Ile Gin
180
<210> 11 <211> 645
Petição 870170009999, de 15/02/2017, pág. 560/1247
551/788 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 11
atggatccag gggtcatcag gcgtctgggg gagctgggcg ttgcgaccgt tcacgaggcg 60
ctcggccgcc agggccttct cgatcccgtc gtgcgcccga tctaccccgg cgcgcgggcg 120
gccggaaccg ccgtaacggt gtgctgtccg gccggggaca acctgatgat ccatgcggcg 180
ctccaggtcg tggcgcgcgg cgacgtgctc gtcgtcacga ccgagccgcc gtcgacgtac 240
ggcatgttcg gcgacgtgct ggggacgtcg tgccaggcgc tcggggtcgc ggggctcgtc 300
atcgacgccg gcatccgtga cacggaggag ctcgagcgga tggcgtttcc cgcctgggcg 360
cgcgcgacgt cggcgcaggg cacggtgaaa gtggctccgg gcatcgtcaa cgcgccgatt 420
gtgtgcgcgg gcgcggacgt tcgtccgggc gacgttgtcg tggcggatcg cgacggcgtc 480
gtcatcgtcc cgcgcgagcg ggctgccgaa gcggcggagc ttggtgagca gcggcgcgat 540
cgcgagatcg aataccgccg gcggctggca ggtggagagc tgaccctgga cgtgctcgac 600
ctccggcgca ccctgcggga gatcgggatg gacaggctgg actga 645
<210> 12 <211> 214 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (10)...(162) <223> Demetilmenaquinone metiltransferase <400> 12
Met Asp Pro Gly Vai Ile Arg Arg Leu Gly Glu Leu Gly Vai Ala Thr 15 10 15
Vai His Glu Ala Leu Gly Arg Gin Gly Leu Leu Asp Pro Vai Vai Arg
25 30
Pro Ile Tyr Pro Gly Ala Arg Ala Ala Gly Thr Ala Vai Thr Vai Cys
40 45
Cys Pro Ala Gly Asp Asn Leu Met Ile His Ala Ala Leu Gin Vai Vai
55 60
Ala Arg Gly Asp Vai Leu Vai Vai Thr Thr Glu Pro Pro Ser Thr Tyr
70 75 80
Gly Met Phe Gly Asp Vai Leu Gly Thr Ser Cys Gin Ala Leu Gly Vai
90 95
Ala Gly Leu Vai Ile Asp Ala Gly Ile Arg Asp Thr Glu Glu Leu Glu
100 105 110
Arg Met Ala Phe Pro Ala Trp Ala Arg Ala Thr Ser Ala Gin Gly Thr
115 120 125
Vai Lys Vai Ala Pro Gly Ile Vai Asn Ala Pro Ile Vai Cys Ala Gly
130 135 140
Petição 870170009999, de 15/02/2017, pág. 561/1247
552/788
Ala Asp Vai Arg Pro Gly Asp Vai Vai Vai Ala Asp Arg Asp Gly Vai
145 150 155 160
Vai Ile Vai Pro Arg Glu Arg Ala Ala Glu Ala Ala Glu Leu Gly Glu
165 170 175
Gin Arg Arg Asp Arg Glu Ile Glu Tyr Arg Arg Arg Leu Ala Gly Gly
180 185 190
Glu Leu Thr Leu Asp Vai Leu Asp Leu Arg Arg Thr Leu Arg Glu Ile
195 200 205
Gly Met Asp Arg Leu Asp
210 <210> 13 <211> 498 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 13
atggcgaccg gggagtacga cgcatgggcc ggctcctggt actcgaagct ctcgccggag 60
ccgttcatgg atctcattcg tcccggcact gccctggtga tcgacgatgc gcccgcagcg 120
gatgtcggct ccatcgggtc gaacaacatc ctccaatgga agacgcgtgg gatggtggcg 180
gtcgtgacga acgcgacggc gcgggacacc gacgaaatcg ttgtcgagcg cgtgccgctc 240
tatttccggc agcctggccg cggcatccgt ccgggccgca atgagatcga atcggtcaac 300
cgtcccgtgg tcgtgggcgg ggtgctcgtg atgcccggcg acgtcatcgt cggagacggc 360
gacggcgtgg ttgtcgtccc acgcgcgcag gccgaggccg tggcgcgata tgctcacacg 420
atcctcgaga aggacacgga aggacgtcgg cggctctacc agcagctgaa gcttccaacc 480
gattcgacgg tccggtag 498
<210> 14 <211> 165 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 14
Met Ala Thr Gly Glu Tyr Asp Ala Trp Ala Gly Ser Trp Tyr Ser Lys
1 5 10 15
Leu Ser Pro Glu Pro Phe Met Asp Leu Ile Arg Pro Gly Thr Ala Leu
20 25 30
Vai Ile Asp Asp Ala Pro Ala Ala Asp Vai Gly Ser Ile Gly Ser Asn
35 40 45
Asn Ile Leu Gin Trp Lys Thr Arg Gly Met Vai Ala Vai Vai Thr Asn
50 55 60
Ala Thr Ala Arg Asp Thr Asp Glu Ile Vai Vai Glu Arg Vai Pro Leu
65 70 75 80
Tyr Phe Arg Gin Pro Gly Arg Gly Ile Arg Pro Gly Arg Asn Glu Ile
85 90 95
Petição 870170009999, de 15/02/2017, pág. 562/1247
553/788
Glu Ser Vai Asn Arg Pro Vai Vai Vai Gly Gly Vai Leu Vai 110 Met Pro
100 105
Gly Asp Vai Ile Vai Gly Asp Gly Asp Gly Vai Vai Vai Vai Pro Arg
115 120 125
Ala Gin Ala Glu Ala Vai Ala Arg Tyr Ala His Thr Ile Leu Glu Lys
130 135 140
Asp Thr Glu Gly Arg Arg Arg Leu Tyr Gin Gin Leu Lys Leu Pro Thr
145 150 155 160
Asp Ser Thr Vai Arg
165 <210> 15 <211> 723 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 15
atgacaacaa gcactaaaaa tatgcaggta agtcagaaag ttattgacga tcttcgtcgc 60
gtgtcaacag caactctgca cactgcgctg ttcaaaagag gtttacgcaa cacctacatc 120
cagggtgtca gcctcatcaa caaccaaaaa ctgaagatgg tcggccaggc gttcaccctg 180
cgctacatcc cggctcgtga agacgttgac accgttgcgg cattcaaaag ccctgagcac 240
cctcagcgcc tggccgttga atccgtcccg gaaggcatgg tgctggtttc agactgtcgt 300
caggacgcaa cagctgcttc tgccgggagc atccttctta ctcgattgga agttcgcaag 360
tgtgcgggtt ttgtttccga tgcgggcatc agagatttca acgatgcatc tgaaatgaac 420
atgccgattt tttgcgccaa gccaagcgct ccaaccaacc tgaccaagca ccacgccgta 480
gacatacaag taccgatcgg ctgcggcggt gtgatggtta atccaggcga tgtgttagtc 540
ggcgatggtg acggcatcat cgttatccct gtggaaattg cacaggaggt ttcagaagaa 600
gcacttgcaa tggaactctt cgaagatttt gtgctggata aagttcgggc gggaagcaaa 660
gtcattgggc tgtaccctcc taacgcagaa actctggagg agtacaacaa ccaaaaggca 720
tag 723
<210> 16 <211> 240 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (19)...(188) <223> Demetilmenaquinone metiltransferase <220>
<221> SITE <222> (155)...(158) <223> Sítio de N-glicosilação prosítio id = PS00001 <400> 16
Petição 870170009999, de 15/02/2017, pág. 563/1247
554/788
Met Thr Thr Ser Thr Lys Asn Met Gin Vai Ser Gin Lys Vai Ile Asp 15 10 15
Asp Leu Arg Arg Vai Ser Thr Ala Thr Leu His Thr Ala Leu Phe Lys
25 30
Arg Gly Leu Arg Asn Thr Tyr Ile Gin Gly Vai Ser Leu Ile Asn Asn
40 45
Gin Lys Leu Lys Met Vai Gly Gin Ala Phe Thr Leu Arg Tyr Ile Pro
55 60
Ala Arg Glu Asp Vai Asp Thr Vai Ala Ala Phe Lys Ser Pro Glu His
70 75 80
Pro Gin Arg Leu Ala Vai Glu Ser Vai Pro Glu Gly Met Vai Leu Vai
90 95
Ser Asp Cys Arg Gin Asp Ala Thr Ala Ala Ser Ala Gly Ser Ile Leu
100 105 110
Leu Thr Arg Leu Glu Vai Arg Lys Cys Ala Gly Phe Vai Ser Asp Ala
115 120 125
Gly Ile Arg Asp Phe Asn Asp Ala Ser Glu Met Asn Met Pro Ile Phe
130 135 140
Cys Ala Lys Pro Ser Ala Pro Thr Asn Leu Thr Lys His His Ala Vai
145 150 155 160
Asp Ile Gin Vai Pro Ile Gly Cys Gly Gly Vai Met Vai Asn Pro Gly
165 170 175
Asp Vai Leu Vai Gly Asp Gly Asp Gly Ile Ile Vai Ile Pro Vai Glu
180 185 190
Ile Ala Gin Glu Vai Ser Glu Glu Ala Leu Ala Met Glu Leu Phe Glu
195 200 205
Asp Phe Vai Leu Asp Lys Vai Arg Ala Gly Ser Lys Vai Ile Gly Leu
210 215 220
Tyr Pro Pro Asn Ala Glu Thr Leu Glu Glu Tyr Asn Asn Gin Lys Ala 225 230 235 240 <210> 17 <211> 792 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 17 atgattcggt tgaccaacct gaaccccttt gagcggtttg acgatggccg ccccaaggtg cccgatgacc tgctggagcg gatgaagctg gtcaccaccg aggaggcctg gggcacgctc tatcacgccg gctacctgcg ccagttcgaa ggcaagtggc acgagaccca cccgggcgtc atcactgtcg gccgcgccgt caccgcccag ttcctgcccc atcgccccga ctaccacgcc gtggtgcaag aaaccggcgt cggcgaaggc cgcggcagcg ccggtggtca gaactcgtgg atcatcgaga gcctgcagcg caacgacgtc atggtggtcg acatcttcgg caaggtcaaa gacggcacgg tcgtcggcga caacctgggc accgccgtgc gcacccgcac ccgcgccggg gccgtcatcg acggcggcgt gcgcgactac cagggcctga cccagctcac cgacgtcaac
Petição 870170009999, de 15/02/2017, pág. 564/1247
555/788
ttctacatcc gcggtatgga cccgaccggc atcgccgacg tcaccctggc cggcctgaac 540
atccccatcc gcatcggtgg ctgcacagtc ctgcccggcg acgtggtcct cggcacgccc 600
agcggcgtcc tgttcatccc gccgcacctg gtgtcgaagg tggtcgagga gagcgaggac 660
gtccgcgtcc gcgacgagtt tggcaagagc cgcctggccg aaggcatttg gacctccggc 720
cagatcgact cggcctggag cgacgagatc aaggccgact tcgagaactg gaaggccaac 780
cgccccaagt ag 792
<210> 18 <211> 263 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (39)...(205) <223> Demetilmenaquinone metiltransferase <400> 18
Met Ile Arg Leu Thr Asn Leu Asn Pro Phe Glu Arg Phe Asp Asp Gly
1 5 10 15
Arg Pro Lys Vai Pro Asp Asp Leu Leu Glu Arg Met Lys Leu Vai Thr
20 25 30
Thr Glu Glu Ala Trp Gly Thr Leu Tyr His Ala Gly Tyr Leu Arg Gin
35 40 45
Phe Glu Gly Lys Trp His Glu Thr His Pro Gly Vai Ile Thr Vai Gly
50 55 60
Arg Ala Vai Thr Ala Gin Phe Leu Pro His Arg Pro Asp Tyr His Ala
65 70 75 80
Vai Vai Gin Glu Thr Gly Vai Gly Glu Gly Arg Gly Ser Ala Gly Gly
85 90 95
Gin Asn Ser Trp Ile Ile Glu Ser Leu Gin Arg Asn Asp Vai Met Vai
100 105 110
Vai Asp Ile Phe Gly Lys Vai Lys Asp Gly Thr Vai Vai Gly Asp Asn
115 120 125
Leu Gly Thr Ala Vai Arg Thr Arg Thr Arg Ala Gly Ala Vai Ile Asp
130 135 140
Gly Gly Vai Arg Asp Tyr Gin Gly Leu Thr Gin Leu Thr Asp Vai Asn
145 150 155 160
Phe Tyr Ile Arg Gly Met Asp Pro Thr Gly Ile Ala Asp Vai Thr Leu
165 170 175
Ala Gly Leu Asn Ile Pro Ile Arg Ile Gly Gly Cys Thr Vai Leu Pro
180 185 190
Gly Asp Vai Vai Leu Gly Thr Pro Ser Gly Vai Leu Phe Ile Pro Pro
195 200 205
His Leu Vai Ser Lys Vai Vai Glu Glu Ser Glu Asp Vai Arg Vai Arg
210 215 220
Petição 870170009999, de 15/02/2017, pág. 565/1247
556/788
Asp Glu Phe Gly Lys Ser Arg Leu Ala Glu Gly Ile Trp Thr Ser Gly
225 230 235 240
Gin Ile Asp Ser Ala Trp Ser Asp Glu Ile Lys Ala Asp Phe Glu Asn
245 250 255
Trp Lys Ala Asn Arg Pro Lys
260 <210> 19 <211> 723 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 19
atgagcgatt ataccaacga gattaccggc gaaccgccag ctgctgaacc tttgccggac 60
gagcaggaaa tcttggattt tgtacggcag aagctgcatg tcgccgcggt ttgcgatatt 120
ttggatgatt tgggctaccg caatcaagcc atgcaccagc gattgcgccc gctcctaccc 180
gatattcgga actgtggttt tgtcgggcga gcgcgtacgt tgcgctggat ggagaccgat 240
tatattgtcg aggaagatcc ctatgggctg gagatcgact ttatggatag tctgggcgcg 300
ggtgatgtca ttgttcattc caccgaccct ggcggcacca atgccccgtg gggcgaactc 360
atgaccacca tcgccaagtt gcgcggcgca gttggctgcg tctgcgacag ccagatacgc 420
gacacggtgc agatcatcga catgggcttc cccgtctact acacgggaat tcgtccgttg 480
gattccaaag ggcgggcgcg cgtgatgggt ttggatctgc ccgtacgctg tggtgatgtg 540
ttggtgcatc ctggcgatct catcttcgcc gaccatgacg gcatcgtggt cattccgcaa 600
gcgcaggtgc agcaggtact caagctggcc caagaaaaga tggagaagga gaaccacacg 660
cgcaatgacc tgctcgcggg caagacactg cgcgaggtct atgatacgta tggggtgttg 720
tag 723
<210> 20 <211> 240 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (30)...(197) <223> Demetilmenaquinone metiltransferase <220>
<221> SITE <222> (221)...(224) <223> Sítio de N-glicosilação prosítio id = PS00001 <400> 20
Met Ser Asp Tyr Thr Asn Glu Ile Thr Gly Glu Pro Pro Ala Ala Glu 15 10 15
Pro Leu Pro Asp Glu Gin Glu Ile Leu Asp Phe Vai Arg Gin Lys Leu
25 30
Petição 870170009999, de 15/02/2017, pág. 566/1247
557/788
His Vai Ala Ala Vai Cys Asp Ile Leu Asp Asp Leu Gly Tyr Arg Asn 35 40 45
Gin Ala Met His Gin Arg Leu Arg Pro Leu Leu Pro Asp Ile Arg Asn
55 60
Cys Gly Phe Vai Gly Arg Ala Arg Thr Leu Arg Trp Met Glu Thr Asp
70 75 80
Tyr Ile Vai Glu Glu Asp Pro Tyr Gly Leu Glu Ile Asp Phe Met Asp
90 95
Ser Leu Gly Ala Gly Asp Vai Ile Vai His Ser Thr Asp Pro Gly Gly
100 105 110
Thr Asn Ala Pro Trp Gly Glu Leu Met Thr Thr Ile Ala Lys Leu Arg
115 120 125
Gly Ala Vai Gly Cys Vai Cys Asp Ser Gin Ile Arg Asp Thr Vai Gin
130 135 140
Ile Ile Asp Met Gly Phe Pro Vai Tyr Tyr Thr Gly Ile Arg Pro Leu
145 150 155 160
Asp Ser Lys Gly Arg Ala Arg Vai Met Gly Leu Asp Leu Pro Vai Arg
165 170 175
Cys Gly Asp Vai Leu Vai His Pro Gly Asp Leu Ile Phe Ala Asp His
180 185 190
Asp Gly Ile Vai Vai Ile Pro Gin Ala Gin Vai Gin Gin Vai Leu Lys
195 200 205
Leu Ala Gin Glu Lys Met Glu Lys Glu Asn His Thr Arg Asn Asp Leu
210 215 220
Leu Ala Gly Lys Thr Leu Arg Glu Vai Tyr Asp Thr Tyr Gly Vai Leu 225 230 235 240 <210> 21 <211> 444 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 21
atgaccaagc cgctgagtga agccgcgcgc gccaagctcg ccaccgtcag taccgccacg 60
ctgacgacgc aactgttcaa gcgcgggctg cgcaacacct tcatccaggg cgcacgcccg 120
ctcaatcccg acgcgccgcc gatggtcggc ccggcctaca cgctgcgcta tatcccggca 180
cgcgaggaca tcgacacgct cgatgtgttc aatgaccgca cccacccgca acgcaaggcc 240
gtggaggaca tcccgccggg cagcgtgctg gtgatggact gccgcggcga cgcgagcgtc 300
gcgtcggccg gcagcatcct ggtgacccgc atgatgatgc gcggcgcagc cggcgtggtc 360
agcgacggcg gcctgcgcga ttcccccgag atcgcgaagc tccccttccc cacctactgc 420
cagggcgggt cggcgcccac caac 444
<210> 22
<211> 148
<212> PRT
<213> desconhecido
Petição 870170009999, de 15/02/2017, pág. 567/1247
558/788 <220>
<223> Proteína obtida por amostra do ambiente
<400> 22
Met Thr Lys Pro Leu Ser Glu Ala Ala Arg Ala Lys Leu Ala Thr Vai
1 5 10 15
Ser Thr Ala Thr Leu Thr Thr Gin Leu Phe Lys Arg Gly Leu Arg Asn
20 25 30
Thr Phe Ile Gin Gly Ala Arg Pro Leu Asn Pro Asp Ala Pro Pro Met
35 40 45
Vai Gly Pro Ala Tyr Thr Leu Arg Tyr Ile Pro Ala Arg Glu Asp Ile
50 55 60
Asp Thr Leu Asp Vai Phe Asn Asp Arg Thr His Pro Gin Arg Lys Ala
65 70 75 80
Vai Glu Asp Ile Pro Pro Gly Ser Vai Leu Vai Met Asp Cys Arg Gly
85 90 95
Asp Ala Ser Vai Ala Ser Ala Gly Ser Ile Leu Vai Thr Arg Met Met
100 105 110
Met Arg Gly Ala Ala Gly Vai Vai Ser Asp Gly Gly Leu Arg Asp Ser
115 120 125
Pro Glu Ile Ala Lys Leu Pro Phe Pro Thr Tyr Cys Gin Gly Gly Ser
130 135 140
Ala Pro Thr Asn
145 <210> 23 <211> 801 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 23
atgatcaatt gcctcgcggc taaaccacag cggccttccc aattatccaa tccctatcag 60
gagcctgcca tgccagccat ctccctcgaa gtgcttgaga aactgcgcgc atacgatacg 120
cccaccattt gcaacgtgat cgagctgttc gacgtgcggc cgcgcaccag cggctacatg 180
gatgcccgca tccgcgcctg cttccccgag atgccgccgg tggtgggctt tgcctccacc 240
gccaccttcc gcgcttctga agcgccgctc tccggcccgg atatctacgg ctcgctgaac 300
ctgcaagtgg agagctttgg cacgctctcc ggcccggcca tcgtggtctt tcaagacctg 360
gacgacccgg cggtggcggc aacctttggc gaggtgatgt gcaccaccta ccagacgtac 420
ggatcggtcg ggctgatcac ctctggcgcg gggcgcgacc tggaccaggt acgcaagatt 480
ggttactcgg tcttcaccaa cggcgcgatt tgctcgcacg gctactgcca cattccggat 540
gtcaacgtgc cggtgcgggt gggcggctta atcgtgcgcc cggatgatct gctgcacatg 600
gacgtgaacg gcgtgaccaa catccccaag gagatcgcgg cggaggtggc ggaggcctgc 660
gaggcctacg tggcggcgga gatggcgacg ctgaacgggc tgcatgcgta taggcaagat 720
ggggatgccg ggaagctgca agaggcgaag aaggagagta aaaggctgat gcaggcgctg 780
aaggaacggg tgaggaggta a 801
<210> 24
Petição 870170009999, de 15/02/2017, pág. 568/1247
559/788 <211> 266 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (36)...(207) <223> Demetilmenaquinone metiltransferase <400> 24
Met Ile Asn Cys Leu Ala Ala Lys Pro Gin Arg Pro Ser Gin Leu Ser 15 10 15
Asn Pro Tyr Gin Glu Pro Ala Met Pro Ala Ile Ser Leu Glu Vai Leu
25 30
Glu Lys Leu Arg Ala Tyr Asp Thr Pro Thr Ile Cys Asn Vai Ile Glu
40 45
Leu Phe Asp Vai Arg Pro Arg Thr Ser Gly Tyr Met Asp Ala Arg Ile
55 60
Arg Ala Cys Phe Pro Glu Met Pro Pro Vai Vai Gly Phe Ala Ser Thr
70 75 80
Ala Thr Phe Arg Ala Ser Glu Ala Pro Leu Ser Gly Pro Asp Ile Tyr
90 95
Gly Ser Leu Asn Leu Gin Vai Glu Ser Phe Gly Thr Leu Ser Gly Pro
100 105 110
Ala Ile Vai Vai Phe Gin Asp Leu Asp Asp Pro Ala Vai Ala Ala Thr
115 120 125
Phe Gly Glu Vai Met Cys Thr Thr Tyr Gin Thr Tyr Gly Ser Vai Gly
130 135 140
Leu Ile Thr Ser Gly Ala Gly Arg Asp Leu Asp Gin Vai Arg Lys Ile
145 150 155 160
Gly Tyr Ser Vai Phe Thr Asn Gly Ala Ile Cys Ser His Gly Tyr Cys
165 170 175
His Ile Pro Asp Vai Asn Vai Pro Vai Arg Vai Gly Gly Leu Ile Vai
180 185 190
Arg Pro Asp Asp Leu Leu His Met Asp Vai Asn Gly Vai Thr Asn Ile
195 200 205
Pro Lys Glu Ile Ala Ala Glu Vai Ala Glu Ala Cys Glu Ala Tyr Vai
210 215 220
Ala Ala Glu Met Ala Thr Leu Asn Gly Leu His Ala Tyr Arg Gin Asp
225 230 235 240
Gly Asp Ala Gly Lys Leu Gin Glu Ala Lys Lys Glu Ser Lys Arg Leu
245 250 255
Met Gin Ala Leu Lys Glu Arg Vai Arg Arg
260 265 <210> 25
Petição 870170009999, de 15/02/2017, pág. 569/1247
560/788 <211> 741 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 25
atggctgaga agaaactgac cgggcggatt gcgcgggaga aaatcaggtt gatggaggtg 60
ccgcggccgc cgcaaggcgt cgtcgagcgg ttcaagtcgc tcggcgattg caccggcatc 120
atttccgaca ccatggatga actgggcatc ccgaacggcg tgatcggcgc gtcagtgctg 180
cgaccaacca tccccggcac cgtcatcgcc gggccggcgt tgacgctgcg caacattctc 240
cagcgcatcg atccactcgc cggcgcgcgc gagcacgtca acaagatggc cgagttcgaa 300
tgtcacaacc tcgcgacccc gggcgacgtg ctggtgatcc agggggtgcc gaacgtctcc 360
agtatgggag gcatctcggc gctgaccggc aagcgcgccg gtgaagtcgg cgccatcgtc 420
gaaggcggca tccgcgacat tgcacattcg cgtgaggttg gctttccact gtggtcgagc 480
cagatcacgc cggtcaccgg caagtggcgg ctggaggcgg ccgagatcaa cggcaccatc 540
gaaatcggcg gcgtgcaggt gcaccccggc gatctggtgg tggccgacga caccggcgtc 600
tgcttcatcc cgcgcgacaa cattctggaa gtgctcgccg agtgcgagaa gaaagcgaag 660
gccgaggacc tgcgctgcaa ggcgatcgat ggcggcgtcc cggtgccgga tatctcgaaa 720
tcgacgtatg gagagacgtg a 741
<210> 26
<211> 246
<212> PRT
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente
<220>
<221> DOMÍNIO
<222> (38) ... (202)
<223> Demetilmenaquinone metiltransferase
<220>
<221> SITE
<222> (119) ... (122)
<223> Sítio de N-glicosilação prosítio id = PS00001
<220>
<221> SITE
<222> (179) ... (182)
<223> Sítio de N-glicosilação prosítio id = PS00001
<400> 26
Met Ala Glu Lys Lys Leu Thr Gly Arg Ile Ala Arg Glu Lys Ile Arg
1 5 10 15
Leu Met Glu Vai Pro Arg Pro Pro Gin Gly Vai Vai Glu Arg Phe Lys
20 25 30
Ser Leu Gly Asp Cys Thr Gly Ile Ile Ser Asp Thr Met Asp Glu Leu
35 40 45
Gly Ile Pro Asn Gly Vai Ile Gly Ala Ser Vai Leu Arg Pro Thr Ile
Petição 870170009999, de 15/02/2017, pág. 570/1247
561/788
50 55 60
Pro Gly Thr Vai Ile Ala Gly Pro Ala Leu Thr Leu Arg Asn Ile Leu
65 70 75 80
Gin Arg Ile Asp Pro Leu Ala Gly Ala Arg Glu His Vai Asn Lys Met
85 90 95
Ala Glu Phe Glu Cys His Asn Leu Ala Thr Pro Gly Asp Vai Leu Vai
100 105 110
Ile Gin Gly Vai Pro Asn Vai Ser Ser Met Gly Gly Ile Ser Ala Leu
115 120 125
Thr Gly Lys Arg Ala Gly Glu Vai Gly Ala Ile Vai Glu Gly Gly Ile
130 135 140
Arg Asp Ile Ala His Ser Arg Glu Vai Gly Phe Pro Leu Trp Ser Ser
145 150 155 160
Gin Ile Thr Pro Vai Thr Gly Lys Trp Arg Leu Glu Ala Ala Glu Ile
165 170 175
Asn Gly Thr Ile Glu Ile Gly Gly Vai Gin Vai His Pro Gly Asp Leu
180 185 190
Vai Vai Ala Asp Asp Thr Gly Vai Cys Phe Ile Pro Arg Asp Asn Ile
195 200 205
Leu Glu Vai Leu Ala Glu Cys Glu Lys Lys Ala Lys Ala Glu Asp Leu
210 215 220
Arg Cys Lys Ala Ile Asp Gly Gly Vai Pro Vai Pro Asp Ile Ser Lys
225 230 235 240
Ser Thr Tyr Gly Glu Thr
245
<210> 27
<211> 693
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 27
atgatttatc agccggggac aacaggcatc gtcgtgcagg atattgcacg cgctgatcaa 60
gccattatcg atggcctagc agaatgtggt gtggcgacgg tgcatgaggc acaggggcgc 120
aagggcctgt tggcggatta tatgacgccg atttactcgg gcgcgcgcat cgctggatct 180
gcggtgacca ttctggcacc gccgtgtgac aattggatga tccatgtggc ggtagaacag 240
ttgcaaaagg gcgatgtgtt gctgctgggc acgatcacac cgtccaatgc tggctatttc 300
ggtgacttgc tggccacgtc agccatggcg cacggttgtc gcggattgat cattgatggc 360
ggtgtgcgcg atgtgcaaga gctgacggat atgggctttc cggtttggtc caaggccgta 420
catgcccaag gcacaatcaa agaaacgctg ggatcggtca acgtgccagt tgtctgcggc 480
caagagttgg taaaccccgg tgatattgtg gtggccgacg atgacggggt gtgcgttgtg 540
cgccgcgaag aagctgctga tgtgctggct aaggcgcggg cgcgcgagag caatgaagcg 600
gccaagcgcg cgcgttttga ggccggtgag ctggggctgg atatctatga catgcgcgcg 660
cggctggccg aaaaaggact gaaatacgtc tga 693
<210> 28
Petição 870170009999, de 15/02/2017, pág. 571/1247
562/788 <211> 230 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (27)...(179) <223> Demetilmenaquinone metiltransferase <400> 28
Met Ile Tyr Gin Pro Gly Thr Thr Gly Ile Vai Vai
10
Arg Ala Asp Gin Ala Ile Ile Asp Gly Leu Ala Glu
25
Thr Vai His Glu Ala Gin Gly Arg Lys Gly Leu Leu 35 40
Thr Pro Ile Tyr Ser Gly Ala Arg Ile Ala Gly Ser 50 55 60
Leu Ala Pro Pro Cys Asp Asn Trp Met Ile His Vai 65 70 75
Leu Gin Lys Gly Asp Vai Leu Leu Leu Gly Thr Ile
90
Ala Gly Tyr Phe Gly Asp Leu Leu Ala Thr Ser Ala 100 105
Cys Arg Gly Leu Ile Ile Asp Gly Gly Vai Arg Asp 115 120
Thr Asp Met Gly Phe Pro Vai Trp Ser Lys Ala Vai 130 135 140
Thr Ile Lys Glu Thr Leu Gly Ser Vai Asn Vai Pro 145 150 155
Gin Glu Leu Vai Asn Pro Gly Asp Ile Vai Vai Ala
165 170
Vai Cys Vai Vai Arg Arg Glu Glu Ala Ala Asp Vai 180 185
Arg Ala Arg Glu Ser Asn Glu Ala Ala Lys Arg Ala 195 200
Gly Glu Leu Gly Leu Asp Ile Tyr Asp Met Arg Ala 210 215 220
Gin Asp Ile Ala 15
Cys Gly Vai Ala 30
Ala Asp Tyr Met 45
Ala Vai Thr Ile
Ala Vai Glu Gin
Thr Pro Ser Asn
Met Ala His Gly 110
Vai Gin Glu Leu
125
His Ala Gin Gly
Vai Vai Cys Gly 160
Asp Asp Asp Gly 175
Leu Ala Lys Ala 190
Arg Phe Glu Ala 205
Arg Leu Ala Glu
Lys Gly Leu Lys Tyr Vai
225 230
<210> 29
<211> 756
<212> DNA
<213> desconhecido
<220>
Petição 870170009999, de 15/02/2017, pág. 572/1247
563/788 <223> Proteína obtida por amostra do ambiente <400> 29
ttgcagcgac agctttccac actgcagcgg cgatggaagg cttatacgtc gggcatggaa 60
cagaagattg cggaacggct gtcggccttg tcggtggcgc atctggccga tggctgcctg 120
cgtgccggaa cggcgatgcg ggtggtggcc aatctacccc cgatcgtagc tggtcagcga 180
acgtccggcc ggacacggcc ggtgcggcat tacggcagcg tcgacgtctt ccttgaagcg 240
ctggccgacc ccagggcggg cgatgtgctg gtcgtcgaca atggcgaccg ggacgatgaa 300
ggctgcatcg gcgacctgac ggcgctggaa gtcgctcagg ccgggctggc cgggatcatc 360
atctcgggcc ggcaccgcga cacggcgatc ctccgctcca ttccaatcgc cttgttcagc 420
cgcggtgcct gcgcgcgtgg gccggtccgg ctcgacgtcc gcgcgccgga gacattcgtc 480
agcgcccgca ttggcgacga ggtcgtaacc gcagcagatt gggtagcggc cgatgacgac 540
ggcgccatct tcatcggcga caaccatatt gcggcggtgg tcgcggcggc ggagtcgatc 600
cgcgacaccg agctccggca gaccgggctg atgaaggccg ggacaagctt gcgcgagcag 660
cttgaggtcg cggcttatct ggacgcgcgg gcggcggatc cggcgctgga cttccgcgcc 720
catttgcgcg cgctcaacgc ggcgatcgag gaatga 756
<210> 30 <211> 251 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (28)...(184) <223> Demetilmenaquinone metiltransferase <400> 30
Met Gin Arg Gin Leu Ser Thr Leu Gin Arg Arg Trp Lys Ala Tyr Thr
1 5 10 15
Ser Gly Met Glu Gin Lys Ile Ala Glu Arg Leu Ser Ala Leu Ser Vai
20 25 30
Ala His Leu Ala Asp Gly Cys Leu Arg Ala Gly Thr Ala Met Arg Vai
35 40 45
Vai Ala Asn Leu Pro Pro Ile Vai Ala Gly Gin Arg Thr Ser Gly Arg
50 55 60
Thr Arg Pro Vai Arg His Tyr Gly Ser Vai Asp Vai Phe Leu Glu Ala
65 70 75 80
Leu Ala Asp Pro Arg Ala Gly Asp Vai Leu Vai Vai Asp Asn Gly Asp
85 90 95
Arg Asp Asp Glu Gly Cys Ile Gly Asp Leu Thr Ala Leu Glu Vai Ala
100 105 110
Gin Ala Gly Leu Ala Gly Ile Ile Ile Ser Gly Arg His Arg Asp Thr
115 120 125
Ala Ile Leu Arg Ser Ile Pro Ile Ala Leu Phe Ser Arg Gly Ala Cys
130 135 140
Ala Arg Gly Pro Vai Arg Leu Asp Vai Arg Ala Pro Glu Thr Phe Vai
Petição 870170009999, de 15/02/2017, pág. 573/1247
564/788
145 150 155 160
Ser Ala Arg Ile Gly Asp Glu Vai Vai Thr Ala Ala Asp Trp Vai Ala
165 170 175
Ala Asp Asp Asp Gly Ala Ile Phe Ile Gly Asp Asn His Ile Ala Ala
180 185 190
Vai Vai Ala Ala Ala Glu Ser Ile Arg Asp Thr Glu Leu Arg Gin Thr
195 200 205
Gly Leu Met Lys Ala Gly Thr Ser Leu Arg Glu Gin Leu Glu Vai Ala
210 215 220
Ala Tyr Leu Asp Ala Arg Ala Ala Asp Pro Ala Leu Asp Phe Arg Ala
225 230 235 240
His Leu Arg Ala Leu Asn Ala Ala Ile Glu Glu
245 250 <210> 31 <211> 327 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 31
gaatgcgact tgctcacacg cgtgtggcgc ccgaacttgt atcggccttc 60
agaccgccac gattcacgag gcacaaggtg gtatcggtgc ggtcgcggcg 120
ctctcgaccg ggcaatgtcc atctgcggcc ctgccctgac gatcaaaact 180
acaacctggc gcttcaccag gcgctttatc tcgcggaacc gggtgacgtg 240
attgcgcaag ccacaccgag gccgggcaat ggggcggcat tctcatggaa 300
tgcgcggcat agccggg 327
<210> 32 <211> 109 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 32
Met Arg Gin Gly Met Arg Leu Ala His Thr Arg Vai Ala Pro Glu Leu
1 5 10 15
Vai Ser Ala Phe Ser Ala Vai Gin Thr Ala Thr Ile His Glu Ala Gin
20 25 30
Gly Gly Ile Gly Ala Vai Ala Ala Asp Ile Arg Pro Leu Asp Arg Ala
35 40 45
Met Ser Ile Cys Gly Pro Ala Leu Thr Ile Lys Thr Pro Pro Ala Asp
50 55 60
Asn Leu Ala Leu His Gin Ala Leu Tyr Leu Ala Glu Pro Gly Asp Vai
65 70 75 80
Leu Vai Vai Asp Cys Ala Ser His Thr Glu Ala Gly Gin Trp Gly Gly
85 90 95
Petição 870170009999, de 15/02/2017, pág. 574/1247
565/788
Ile Leu Met Glu Ala Ala Lys Vai Arg Gly Ile Ala Gly 100 105 <210> 33 <211> 681 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 33
gcgctcgaga gcgtcacgac cgcgacgctg accaccgtgc tgctgaagca gggcctgcgc 60
aacgtctgga tgcgcggcac ccggccgctg gcgagcggtc agccgcgcaa ggtcgggcgc 120
gcgttcacgc tccgcttcgt gccggcgcgc gaggacctcg cgaccccggc ttcatggggc 180
gcgccgatct cgacccgcgc cgcgatcgag gcgatgccgg aaggcgtgat cgcggtcgcc 240
gatgcgatgg gcgtgactga cgccggcatc ttcggcgaca tcctgtgcgc ccggatgcgc 300
cggcgcaacg tggccgcgct cgtgaccgac ggcgtgatcc gcgacctggc cggcgtgctg 360
agcaccggcc tgccggtctg gtgccagggt accgcagcgc cttcgtcggt caccggcctg 420
accttcgtcg cctggcagca gccggtcggc tgcggtgggg tggcggtgtt cccgaacgac 480
gtggtcgtca tcgacgccga cggcgcggtc gtcatcccgg ctgcgctgct cgatggcgtc 540
atcgcggagg cgatcgagca ggagacccag gagggctgga tcatgcggga ggtggagggc 600
ggtgcggcgc tgccgggcct ctatccgatg aacgaggcga cgaaggcgcg ctacgaagcc 660
tggaagaagg cgagcgactg a 681
<210> 34 <211> 226 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (3)...(171) <223> Demetilmenaquinone metiltransferase <400> 34
Ala Leu Glu Ser Vai Thr Thr Ala Thr Leu Thr Thr Vai Leu Leu Lys
1 5 10 15
Gin Gly Leu Arg Asn Vai Trp Met Arg Gly Thr Arg Pro Leu Ala Ser
20 25 30
Gly Gin Pro Arg Lys Vai Gly Arg Ala Phe Thr Leu Arg Phe Vai Pro
35 40 45
Ala Arg Glu Asp Leu Ala Thr Pro Ala Ser Trp Gly Ala Pro Ile Ser
50 55 60
Thr Arg Ala Ala Ile Glu Ala Met Pro Glu Gly Vai Ile Ala Vai Ala
65 70 75 80
Asp Ala Met Gly Vai Thr Asp Ala Gly Ile Phe Gly Asp Ile Leu Cys
85 90 95
Ala Arg Met Arg Arg Arg Asn Vai Ala Ala Leu Vai Thr Asp Gly Vai
Petição 870170009999, de 15/02/2017, pág. 575/1247
566/788
100 105 110
Ile Arg Asp Leu Ala Gly Vai Leu 120 Ser Thr Gly Leu Pro 125 Vai Trp Cys
115
Gin Gly Thr Ala Ala Pro Ser Ser Vai Thr Gly Leu Thr Phe Vai Ala
130 135 140
Trp Gin Gin Pro Vai Gly Cys Gly Gly Vai Ala Vai Phe Pro Asn Asp
145 150 155 160
Vai Vai Vai Ile Asp Ala Asp Gly Ala Vai Vai Ile Pro Ala Ala Leu
165 170 175
Leu Asp Gly Vai Ile Ala Glu Ala Ile Glu Gin Glu Thr Gin Glu Gly
180 185 190
Trp Ile Met Arg Glu Vai Glu Gly Gly Ala Ala Leu Pro Gly Leu Tyr
195 200 205
Pro Met Asn Glu Ala Thr Lys Ala Arg Tyr Glu Ala Trp Lys Lys Ala
210 215 220
Ser Asp 225 <210> 35 <211> 681 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 35
gtgaccgatc cggttgtcgt tcgacagatc gacaggccgt ccgcgaatct ggtcgctgat 60
ctgcagcgct acggcgtctc caccgtgcac gaggcgcaag ggcgtcgcgg cctgctcgcg 120
tcgtacatgc ggccgatcta tgccggcgcg ctcatcgccg gtcccgcgat cacggtcctg 180
gtgccgcctg gcgacaactt gatgatccac gtcgccgtgg aagtgtgcca gcccggcgac 240
gttctcatcg tcgccaccac ctcgccgtgc accgacggct atttcggcga gctgctggcg 300
acgtcgctgc gggcccgcgg cgtggcgggg ctcgtgatcg atgcgggctg ccgggatgtt 360
cgcgcgctga cagaaatgcg atttcccgtc tggagccgcg cgatcagcgc gcagggaacc 420
gtcaaagcga cgctgggctc ggtgaacgcg gcggtggtgt gcgccggggc gtcggtgaga 480
gccggggatc tcatcgtggc cgacgatgac ggggtggtgg cggtgcggcg ggaggaagtc 540
gtcgccgtga cgcaggcagc cgaacagcgc gttcgcaagg aagagggcac gcgcgcacgg 600
ctcgcgcagg gcgagctcgg cctggacatt tacggcttgc gccagaagct gtcggatctc 660
ggcttgaagt catcgtcgtg a 681
<210> 36 <211> 226 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174)
Petição 870170009999, de 15/02/2017, pág. 576/1247
567/788 <223> Demetilmenaquinone metiltransferase
<400> 36
Met Thr Asp Pro Vai Vai Vai Arg Gin Ile Asp Arg Pro Ser Ala Asn
1 5 10 15
Leu Vai Ala Asp Leu Gin Arg Tyr Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Leu Ile Ala Gly Pro Ala Ile Thr Vai Leu Vai Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gin Pro Gly Asp
65 70 75 80
Vai Leu Ile Vai Ala Thr Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Vai Ala Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ala Leu Thr Glu Met Arg Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Ser Ala Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Ala Ala Vai Vai Cys Ala Gly Ala Ser Vai Arg
145 150 155 160
Ala Gly Asp Leu Ile Vai Ala Asp Asp Asp Gly Vai Vai Ala Vai Arg
165 170 175
Arg Glu Glu Vai Vai Ala Vai Thr Gin Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Glu Gly Thr Arg Ala Arg Leu Ala Gin Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Gin Lys Leu Ser Asp Leu Gly Leu Lys Ser
210 215 220
Ser Ser
225 <210> 37 <211> 675 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 37 atggccggcg tcgtggttca acagatcgag cgcgccggtc tcgacactgc cgctgccctc 60 ggggaatgcg gcgtcgccac agtgcacgag gcgcagggcc ggacagggct gatgcgctcc 120 tacatgcggc cgatttattc aggcgcccgc gttgcgggcc ccgcggtaac ggtgtctatc 180 ccgccgggcg acaactggat gattcacgtc gctgtggaac agtgccggga aggcgacgtc 240 ctcgtcgtgg cgccgacgag tccttgcgag gacggctatt tcggcgagct gctcgcctgc 300 tcgctgcaga cccgccgagt gagcggtctc atcatagagg ccggggtgcg cgacgtccgc 360
Petição 870170009999, de 15/02/2017, pág. 577/1247
568/788
gagctgaccg agatgcggtt cccggtttgg tccaaggcga ttctcgcaca agggactgtg 420
aaggaaacca tcggctcggt gaacgtcgca atcgtctgcg ccggtgcggc ggtcagtccc 480
ggcgacgtga tcgtcgccga tgacgacggc gtctgcattg tgccgcgcgg acaggcggag 540
acggtgcttc aggcgagccg cgcccgcgag gcgaaggagg ccgaaacgcg gcggcggctc 600
cggtcgggcg aactcggcct cgatatctac agcatgcgcg aaaagctggc ggccaggggc 660
ctgaaatatg tctga 675
<210> 38 <211> 224 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (21)...(173) <223> Demetilmenaquinone metiltransferase <400> 38
Met Ala Gly Vai Vai Vai Gin Gin Ile Glu Arg Ala Gly Leu Asp Thr
1 5 10 15
Ala Ala Ala Leu Gly Glu Cys Gly Vai Ala Thr Vai His Glu Ala Gin
20 25 30
Gly Arg Thr Gly Leu Met Arg Ser Tyr Met Arg Pro Ile Tyr Ser Gly
35 40 45
Ala Arg Vai Ala Gly Pro Ala Vai Thr Vai Ser Ile Pro Pro Gly Asp
50 55 60
Asn Trp Met Ile His Vai Ala Vai Glu Gin Cys Arg Glu Gly Asp Vai
65 70 75 80
Leu Vai Vai Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Glu
85 90 95
Leu Leu Ala Cys Ser Leu Gin Thr Arg Arg Vai Ser Gly Leu Ile Ile
100 105 110
Glu Ala Gly Vai Arg Asp Vai Arg Glu Leu Thr Glu Met Arg Phe Pro
115 120 125
Vai Trp Ser Lys Ala Ile Leu Ala Gin Gly Thr Vai Lys Glu Thr Ile
130 135 140
Gly Ser Vai Asn Vai Ala Ile Vai Cys Ala Gly Ala Ala Vai Ser Pro
145 150 155 160
Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Ile Vai Pro Arg
165 170 175
Gly Gin Ala Glu Thr Vai Leu Gin Ala Ser Arg Ala Arg Glu Ala Lys
180 185 190
Glu Ala Glu Thr Arg Arg Arg Leu Arg Ser Gly Glu Leu Gly Leu Asp
195 200 205
Ile Tyr Ser Met Arg Glu Lys Leu Ala Ala Arg Gly Leu Lys Tyr Vai
210 215 220
Petição 870170009999, de 15/02/2017, pág. 578/1247
569/788 <210> 39 <211> 672 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 39
atggccaaag ttgttcaaaa tatcgaacgc gcagcccaaa aggtgattga tgcgcttggg 60
gcctgcggtg ttgccacggt gcatgaggcg caggggcgca aaggcctgct cgcttcctat 120
atgcggccga tttattccgg tgcgcggctt gcggcatcgg cggtgaccat atcggctgca 180
cccggtgata actggatggt gcatgtggcg attgagcaag tgaaagaggg cgacattttg 240
gtgcttgccc cgacctcgcc ttgtgaagac ggctattttg gcgatctgct ggcgacatcg 300
atgcaggcgc gtggcgggcg tgggctgatt atcgatgccg gggttcgcga tattcgcgat 360
ctgacggaaa tgggttttcc ggtgtggtca aaggcgattt atgcccaagg cacggtcaag 420
aaaacgctgg ggtcggttaa tattcctatc gtctgcgccg gtgcgcttat caatgctggc 480
gacattattg ttgccgatga tgacggtgtg tgtgttgtgg cccgagaaga ggccgaagcg 540
gtgctggcca aggcgcaggc gcgcgaggcc aatgaggaag acaagcgcaa gcggttggct 600
gccggtgagt tggggcttga tatgtataac atgcgcgcac ggctggcgga aaagggcctg 660
aaatatgttt ag 672
<210> 40 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 40
Met Ala Lys Vai 1 Vai 5 Gin Asn Ile Glu Arg Ala Ala Gin Lys Vai Ile
10 15
Asp Ala Leu Gly Ala Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser Gly Ala
35 40 45
Arg Leu Ala Ala Ser Ala Vai Thr Ile Ser Ala Ala Pro Gly Asp Asn
50 55 60
Trp Met Vai His Vai Ala Ile Glu Gin Vai Lys Glu Gly Asp Ile Leu
65 70 75 80
Vai Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Met Gin Ala Arg Gly Gly Arg Gly Leu Ile Ile Asp
100 105 110
Ala Gly Vai Arg Asp Ile Arg Asp Leu Thr Glu Met Gly Phe Pro Vai
Petição 870170009999, de 15/02/2017, pág. 579/1247
570/788
115 120 125
Trp Ser Lys 130 Ala Ile Tyr Ala 135 Gin Gly Thr Vai Lys 140 Lys Thr Leu Gly
Ser Vai Asn Ile Pro Ile Vai Cys Ala Gly Ala Leu Ile Asn Ala Gly
145 150 155 160
Asp Ile Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Ala Arg Glu
165 170 175
Glu Ala Glu Ala Vai Leu Ala Lys Ala Gin Ala Arg Glu Ala Asn Glu
180 185 190
Glu Asp Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Met
195 200 205
Tyr Asn Met Arg Ala Arg Leu Ala Glu Lys Gly Leu Lys Tyr Vai
210 215 220 <210> 41 <211> 672 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 41
atgggtgtcg tggtccagaa cattgcccgc gcagcctccg atgtcatcga tcggctcgca 60
gcctgcggtg tcgcaacggt acatgaggcg cagggtcgca cggggctgct tgccagccat 120
atgcggccga tctatccggg cgcgcggctc gcggcaagcg cggtgaccat ctctgcgccg 180
ccaggtgaca actggatgat ccatgtggcg atcgagcagt tgaaggatgg cgacgtgctg 240
ctgctcgcgc cgacgagccc ctgcgaggat ggctatttcg gcgacctcct ggcgacgtcg 300
gccagggcga ggggctgccg gggcctgatc atcgatgccg gcgtgcgcga cgttgccgat 360
ctgaccgaga tgaagtttcc cgtctggtcg aaggcgatct ttgcgcaggg aaccgtcaag 420
gagactgtcg gatcggtgaa tgtaccggtc gtttgcgccg gtgctttcgt caatccgggc 480
gatgtgatcg tcgccgacga tgacggcgcc tgcgtcgtgc cccggcaaga cgcggccgat 540
gtggccgaca aggcggaggc acgtgtcgct gccgaggagg ccaagcgcaa gcggctggca 600
tcgggcgagc ttgggctcga catctacgac atgcgcgggc ggctggcgca gaggggcctg 660
aaatatgtct ga 672
<210> 42 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 42
Met Gly Vai Vai Vai Gin Asn Ile Ala Arg Ala Ala Ser Asp Vai Ile 15 10 15
Petição 870170009999, de 15/02/2017, pág. 580/1247
571/788
Asp Arg Leu Ala 20 Ala Cys Gly Vai Ala Thr Vai 25 His Glu Ala Gin 30 Gly
Arg Thr Gly Leu Leu Ala Ser His Met Arg Pro Ile Tyr Pro Gly Ala
35 40 45
Arg Leu Ala Ala Ser Ala Vai Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Vai Ala Ile Glu Gin Leu Lys Asp Gly Asp Vai Leu
65 70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Arg Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp
100 105 110
Ala Gly Vai Arg Asp Vai Ala Asp Leu Thr Glu Met Lys Phe Pro Vai
115 120 125
Trp Ser Lys Ala Ile Phe Ala Gin Gly Thr Vai Lys Glu Thr Vai Gly
130 135 140
Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Phe Vai Asn Pro Gly
145 150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Ala Cys Vai Vai Pro Arg Gin
165 170 175
Asp Ala Ala Asp Vai Ala Asp Lys Ala Glu Ala Arg Vai Ala Ala Glu
180 185 190
Glu Ala Lys Arg Lys Arg Leu Ala Ser Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Asp Met Arg Gly Arg Leu Ala Gin Arg Gly Leu Lys Tyr Vai
210 215 220 <210> 43 <211> 672 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 43
atgagcgtcg tcgttcagaa catcgcgcgc gccgatcaat ccatcgtcga taggctcggg 60
gcctgcggcg tcgccaccgt gcacgaagcg cagggccgca aaggattgct cgcgagccac 120
atgcggccga tctattccgg cgcgcggctc gcggcgagcg ccgtgaccat ctcggcgccg 180
ccgggtgaca attggatggt ccatgtcgcg atcgagcaat tgcgagccgg cgacattatg 240
gtgctcgcgc cgaccagccc gtgcgaggat ggctatttcg gtgatctgct cgcgacctcg 300
gcgaaagcgc ggggctgccg cggtctcatc atcgatgccg gcgtgcgcga tgtcgccgat 360
ctcaccgcga tgcagtttcc cgtctggtcc aaggccgtct tcgcccaggg aaccgtgaag 420
gaaacgctcg gctcggtaaa catccccgtg gtctgcgccg gtgcgctggt caatccgggc 480
gatgtcatcg tcgccgatga cgatggtgtc tgcgtcgtgc gccgcgaaga ggcggaggcg 540
gtggcgcaga aggccgaggc ccgcgtcgcc gccgaggagg ataagcgcaa gcgcctcgcc 600
gccggcgaac tcggcctcga catctacaag atgcgcgagc ggctcgccga gaaggggctc 660
aaatatgtct ga 672
Petição 870170009999, de 15/02/2017, pág. 581/1247
572/788 <210> 44 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 44
Met Ser Vai Vai Vai Gin Asn Ile Ala Arg Ala Asp Gin Ser Ile Vai 15 10 15
Asp Arg Leu Gly Ala Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
25 30
Arg Lys Gly Leu Leu Ala Ser His Met Arg Pro Ile Tyr Ser Gly Ala
40 45
Arg Leu Ala Ala Ser Ala Vai Thr Ile Ser Ala Pro Pro Gly Asp Asn
55 60
Trp Met Vai His Vai Ala Ile Glu Gin Leu Arg Ala Gly Asp Ile Met
70 75 80
Vai Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
90 95
Leu Ala Thr Ser Ala Lys Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp
100 105 110
Ala Gly Vai Arg Asp Vai Ala Asp Leu Thr Ala Met Gin Phe Pro Vai
115 120 125
Trp Ser Lys Ala Vai Phe Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Ile Pro Vai Vai Cys Ala Gly Ala Leu Vai Asn Pro Gly
145 150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Arg Arg Glu
165 170 175
Glu Ala Glu Ala Vai Ala Gin Lys Ala Glu Ala Arg Vai Ala Ala Glu
180 185 190
Glu Asp Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Vai
210 215 220 <210> 45 <211> 672 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente
Petição 870170009999, de 15/02/2017, pág. 582/1247
573/788 <400> 45
atgaacgttg tcgtccagaa ctttgaacgg gctgatcctg cggttgttaa ggccttgggc 60
gaatgtggtg tggccacggt gcatgaagca cagggccgca aggggctttt agcctcttat 120
atacgcccga tttatagcgg aacttctatc ggggcttcgg ctgttaccat acttgcggct 180
ccatgcgaca actggatgct gcatgtggcg atcgaacaag tgcaagcggg cgatgtattg 240
gtactggcgg ttacgtcacc atcagacgca ggttactttg gcgatttgtt agcaacatct 300
gcgcaagcgc ggggttgcgc aggtttgatc actgatgcgg gcgtacgcga tgtgcgcgat 360
ttgcaggcga tgaattttcc ggtttggtcg aaagcgatct gtgcgcaagg cacggtgaaa 420
gaaaccctgg gttcggtcaa cgttcccgtt gtctgtgcag gagcgaagat taatcccggt 480
gatgtgattg tggcggatga tgatggggtt tgcgctgtga agtgcgaaga ggcggcagag 540
gttttgaaaa aagcgcaagc gcgtttggcc aatgaagagc agaaacgtac gcgattggct 600
gatggtgagt tagggctgga catgtatgat atgcgcgggc gcctagctga aaaaggtctg 660
aaatatgtct aa 672
<210> 46 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 46
Met Asn Vai Vai Vai Gin Asn Phe Glu Arg Ala Asp Pro Ala Vai Vai
1 5 10 15
Lys Ala Leu Gly Glu Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Ile Arg Pro Ile Tyr Ser Gly Thr
35 40 45
Ser Ile Gly Ala Ser Ala Vai Thr Ile Leu Ala Ala Pro Cys Asp Asn
50 55 60
Trp Met Leu His Vai Ala Ile Glu Gin Vai Gin Ala Gly Asp Vai Leu
65 70 75 80
Vai Leu Ala Vai Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Gin Ala Arg Gly Cys Ala Gly Leu Ile Thr Asp
100 105 110
Ala Gly Vai Arg Asp Vai Arg Asp Leu Gin Ala Met Asn Phe Pro Vai
115 120 125
Trp Ser Lys Ala Ile Cys Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Lys Ile Asn Pro Gly
145 150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Ala Vai Lys Cys Glu
Petição 870170009999, de 15/02/2017, pág. 583/1247
574/788
165
Glu Ala Ala Glu 180 Vai
Glu Gin Lys 195 Arg Thr
Tyr Asp 210 Met Arg Gly
170
Leu Lys Lys Ala 185 Gin
Arg Leu Ala 200 Asp Gly
Arg Leu 215 Ala Glu Lys
175
Ala Arg Leu Ala 190 Asn Glu
Glu Leu Gly 205 Leu Asp Met
Gly Leu 220 Lys Tyr Vai
<210> 47 <211> 672 <212> DNA <213> desconhecido <220>
<223> Proteína obtida <400> 47 por amostra do ambiente
atgggtattg ttgttcagaa catcaagcgg gcggaccccg ggatcatagc aggtcttggc 60
aaatgcggcg ttgccactgt gcatgaagcg caggggtgca aggggctcct ggcggcctat 120
atgcggccca tttattctgg cgcgcgcctt gccgcctccg ctgtcaccat ttccgcgccg 180
ccgggagaca actggatggt gcatgtcgcc attgagcagg tgaggcaagg tgatattctg 240
gttcttgccc caacatcgcc ctgtgaagac ggctatttcg gtgatttgct cgccacctcc 300
atgctgcagc gcggcggcag ggggctgatt attgacgccg gtgtccgcga tatccgtgat 360
ctgactcaaa tgaaatttcc ggtgtggtcg aaaaccgttt ttgcgcaggg caccgttaag 420
gaaacccttg gctctgtgaa cgtcccgata gtttgcgccg gtgaagtggt caatcctggc 480
gacatcatga ttgccgatga tgatggtgtg tgcgtggtcc ggcgcgacga cgctgaaagc 540
gtgcttgaaa aagcattggc gcgtgaggca aaggaagaag atacacgcaa acgccttgcg 600
gcaggcgagc tgggtcttga tatttacggc atgcgcgcac gtctggccga aaagggccta 660
aaatatgtct ga 672
<210> 48 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 48
Met Gly Ile Vai Vai Gin Asn Ile Lys Arg Ala Asp Pro Gly Ile Ile
1 5 10 15
Ala Gly Leu Gly Lys Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Cys Lys Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Tyr Ser Gly Ala
35 40 45
Arg Leu Ala Ala Ser Ala Vai Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Petição 870170009999, de 15/02/2017, pág. 584/1247
575/788
Trp Met Vai His Vai Ala Ile Glu Gin Vai Arg Gin Gly Asp Ile Leu
65 70 75 80
Vai Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Met Leu Gin Arg Gly Gly Arg Gly Leu Ile Ile Asp
100 105 110
Ala Gly Vai Arg Asp Ile Arg Asp Leu Thr Gin Met Lys Phe Pro Vai
115 120 125
Trp Ser Lys Thr Vai Phe Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Vai Pro Ile Vai Cys Ala Gly Glu Vai Vai Asn Pro Gly
145 150 155 160
Asp Ile Met Ile Ala Asp Asp Asp Gly Vai Cys Vai Vai Arg Arg Asp
165 170 175
Asp Ala Glu Ser Vai Leu Glu Lys Ala Leu Ala Arg Glu Ala Lys Glu
180 185 190
Glu Asp Thr Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Ala Arg Leu Ala Glu Lys Gly Leu Lys Tyr Vai
210 215 220
<210> 49
<211> 672
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 49 atgagcatcg tcgtccagaa catcgagcgc gccgacaagg atgcggttgt ggcactcggc gaatgcggcg ttgcgacggt gcatgaggcg caggcccgca aagggctcat gcggccttac atgcggccaa tctatgccgg cgcccgcatc gccggcccag ccgtgacggt ctcgatcgcg ccgggcgaca actggatgat ccatgtggca gtggagcagt gccgcgacgg cgatatcctc gtggtggcac cgaccagccc gagtgaagac ggctatttcg gcgaactgct ggcgcgctcg ctcatggcgc gcggtgtgaa ggggctgatc atcgaagccg gggtgcgcga cgtgcgcgac ctcaccgaga tcaatttccc ggtctggtcg aaagcgatct ccgcgcaagg gacggtgaag gaaacgctcg gctcggtgaa tgtgccggtc gtctgcgccg gcgcgctggt caatccgggc gacgtcatca ttgccgatga cgacggcgtc tgtgtcgtgg cgcgcgctgc ggcaagtgac gttgcgaagg cgtcccgaac ccgcgaagcc aaggaagccg aaacccgcaa gcgcctgatg gcgggtgaac tcggactcga catctacggg atgcgcgaca agcttgcggc caagggcctg aaatatgtct ga <210> 50 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente
Petição 870170009999, de 15/02/2017, pág. 585/1247
576/788 <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 50
Met Ser Ile Vai Vai Gin Asn Ile Glu Arg Ala Asp Lys Asp Ala Vai 15 10 15
Vai Ala Leu Gly Glu Cys Gly Vai Ala Thr Vai His Glu Ala Gin Ala
25 30
Arg Lys Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Ala Gly Ala
40 45
Arg Ile Ala Gly Pro Ala Vai Thr Vai Ser Ile Ala Pro Gly Asp Asn
55 60
Trp Met Ile His Vai Ala Vai Glu Gin Cys Arg Asp Gly Asp Ile Leu
70 75 80
Vai Vai Ala Pro Thr Ser Pro Ser Glu Asp Gly Tyr Phe Gly Glu Leu
90 95
Leu Ala Arg Ser Leu Met Ala Arg Gly Vai Lys Gly Leu Ile Ile Glu
100 105 110
Ala Gly Vai Arg Asp Vai Arg Asp Leu Thr Glu Ile Asn Phe Pro Vai
115 120 125
Trp Ser Lys Ala Ile Ser Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Leu Vai Asn Pro Gly
145 150 155 160
Asp Vai Ile Ile Ala Asp Asp Asp Gly Vai Cys Vai Vai Ala Arg Ala
165 170 175
Ala Ala Ser Asp Vai Ala Lys Ala Ser Arg Thr Arg Glu Ala Lys Glu
180 185 190
Ala Glu Thr Arg Lys Arg Leu Met Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Asp Lys Leu Ala Ala Lys Gly Leu Lys Tyr Vai
210 215 220
<210> 51 <211> 672 <212> DNA <213> desconhecido <220> <223> Proteína obtida <400> 51 atgggcgtcg tggtccagaa por amostra do ambiente tatcgcccgg gccgagcagt ccgtcgtcga caggctggct 60
gcgtgcggtg ttgccacggt gcacgaggcg cagggccgca aggggctgct cgcgagttct 120
gtgcggccga tctatccggg cgcgcgggtg gcggccagcg cggtcacgat ctcagcgccg 180
ccgggtgaca actggatggt ccatgtagcg atcgaacagt tgaaggaggg cgacatcctg 240
ctgttggcgc cgaccagtcc ctgcgaggat ggctatttcg gtgatctgct cgccacttcg 300
Petição 870170009999, de 15/02/2017, pág. 586/1247
577/788
gccatggcgc ggggctgccg cggactgatc atagatgcgg gggtgcgcga cgtcgcggac 360
ctgacggcga tgcagtttcc agtctggtcc aaggcgatct tcgcccaagg caccgtcaag 420
gaaacgctgg gttcggtgaa tattcctgtg gtctgcgccg gcgcgctggt caatcccggt 480
gacgtgatcg tggccgatga cgacggcgtc tgcgtcgtcc gccgcgaaga ggcggccgcc 540
gtcgccgaaa aggcggaggc acgggtggcg atcgaggaag gcaaacgcaa gcggctcgcg 600
gcgggcgaac tcgggctcga tatttacgac atgcgcagtc gccttgccga gaaggggctg 660
aaatatgtct ga 672
<210> 52 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 52
Met Gly Vai Vai Vai Gin Asn Ile Ala Arg Ala Glu Gin Ser Vai Vai 15 10 15
Asp Arg Leu Ala Ala Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
25 30
Arg Lys Gly Leu Leu Ala Ser Ser Vai Arg Pro Ile Tyr Pro Gly Ala
40 45
Arg Vai Ala Ala Ser Ala Vai Thr Ile Ser Ala Pro Pro Gly Asp Asn
55 60
Trp Met Vai His Vai Ala Ile Glu Gin Leu Lys Glu Gly Asp Ile Leu
70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
90 95
Leu Ala Thr Ser Ala Met Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp
100 105 110
Ala Gly Vai Arg Asp Vai Ala Asp Leu Thr Ala Met Gin Phe Pro Vai
115 120 125
Trp Ser Lys Ala Ile Phe Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Ile Pro Vai Vai Cys Ala Gly Ala Leu Vai Asn Pro Gly
145 150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Arg Arg Glu
165 170 175
Glu Ala Ala Ala Vai Ala Glu Lys Ala Glu Ala Arg Vai Ala Ile Glu
180 185 190
Glu Gly Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Asp Met Arg Ser Arg Leu Ala Glu Lys Gly Leu Lys Tyr Vai
Petição 870170009999, de 15/02/2017, pág. 587/1247
578/788
210 215 220 <210> 53 <211> 675 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 53
atgaagccgg tggtggtgca gactatcgag cgggccgacc gagcgatcat cgagggtctg 60
gccgcgtgtg gcgttgccac cgtccatgag gcgcaggggc gccgggggct gcttgcgtcc 120
tacatgcgcc cgatctattc gggcgctgcg gttgcggcct cggccgtcac catcctctct 180
ccaccctgcg acaactggat gctgcacgtc gccatcgagc agatccagcc gggcgacatt 240
ctcgttctcg gcacgacctc tccgtccgat gccggctatt tcggtgatct gctggcgact 300
tcggccaagg cgcgcggttg cgtcgggttg gtcatcgatg ccggcgtacg cgatatccgc 360
gacctgacag cgatgcagtt tccggtctgg tccaaggccg tttcggccca gggcacgatc 420
aaggagacgc tgggttcggt caacgtcccc gtcgtctgcg ccggtgctct ggtcaatccc 480
ggcgacgtcg tcgtggccga tgacgacggt gtctgcgtgg tgcgccgcga ggaagccgcg 540
gaaacgctgg aaaaggcccg ggcgcggatc gccaatgagg aggaaaagcg ccagcgcttt 600
gccgctggcg aactcgggct cgacatctac aagatgcgcg aacgcctcgc tgccctgggg 660
ctcacctatg tctga 675
<210> 54 <211> 224 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (21)...(173) <223> Demetilmenaquinone metiltransferase <400> 54
Met Lys Pro Vai Vai Vai Gin Thr Ile Glu Arg Ala Asp Arg Ala Ile
1 5 10 15
Ile Glu Gly Leu Ala Ala Cys Gly Vai Ala Thr Vai His Glu Ala Gin
20 25 30
Gly Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser Gly
35 40 45
Ala Ala Vai Ala Ala Ser Ala Vai Thr Ile Leu Ser Pro Pro Cys Asp
50 55 60
Asn Trp Met Leu His Vai Ala Ile Glu Gin Ile Gin Pro Gly Asp Ile
65 70 75 80
Leu Vai Leu Gly Thr Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Asp
85 90 95
Leu Leu Ala Thr Ser Ala Lys Ala Arg Gly Cys Vai Gly Leu Vai Ile
100 105 110
Petição 870170009999, de 15/02/2017, pág. 588/1247
579/788
Asp Ala Gly 115 Vai Arg Asp Ile Arg Asp Leu Thr Ala Met Gin Phe Pro
120 125
Vai Trp Ser Lys Ala Vai Ser Ala Gin Gly Thr Ile Lys Glu Thr Leu
130 135 140
Gly Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Leu Vai Asn Pro
145 150 155 160
Gly Asp Vai Vai Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Arg Arg
165 170 175
Glu Glu Ala Ala Glu Thr Leu Glu Lys Ala Arg Ala Arg Ile Ala Asn
180 185 190
Glu Glu Glu Lys Arg Gin Arg Phe Ala Ala Gly Glu Leu Gly Leu Asp
195 200 205
Ile Tyr Lys Met Arg Glu Arg Leu Ala Ala Leu Gly Leu Thr Tyr Vai
210 215 220
<210> 55 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 55
atgaatgatc cggtggtggt ccggcaagtg gagcagccgc cagccgacgc cgttgtcgca 60
ttggagaagt gtggtgtgac gaccgtgcat gaagctcagg gacgttgtgg tctccttgcc 120
tcctacatgc gtccgattta ctcgggagca agcatcgccg gttccgctgt gactgtctct 180
ctgcctcctg gcgacaacct catgatccac gtcgccgtcg aggtttgcgg tccgggaaac 240
atcctggtcg tttcaccaac gtcgccttgc accgatggct acttcggaga gctgttggcg 300
acatctctcc gtgcccacgg tgtaagaggg ctggtgatcg acgccggctg ccgcgacgtc 360
cggtcgttaa ccgagatgaa atttcctgtc tggagccgcg gcatcagctc gcaagggaca 420
gtcaaagcca cgctcggatc tgtgaacgtg gcggtcactt gcgcgggtgc actggtcgaa 480
gctggcgatg taatcgtcgc cgatgacgat ggagttgtgg ttgtgaagcg cgcgcaggcg 540
caagaggtcg ccgccgcggc gcaacaacgg gttcgcaaag aagacgtaac tcgagagcga 600
cttgctcgtg gagaactcgg actggatatt tacgacatgc gccaaaagat cgcgcaactg 660
ggcctaaagt atctgtga 678
<210> 56 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 56
Met Asn Asp Pro Vai Vai Vai Arg Gin Vai Glu Gin Pro Pro Ala Asp
Petição 870170009999, de 15/02/2017, pág. 589/1247
580/788
1 5 10 15
Ala Vai Vai Ala Leu Glu Lys Cys Gly Vai Thr Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser
35 40 45
Gly Ala Ser Ile Ala Gly Ser Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gly Pro Gly Asn
65 70 75 80
Ile Leu Vai Vai Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Arg Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Gly Ile Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Ala Vai Thr Cys Ala Gly Ala Leu Vai Glu
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Gin Ala Gin Glu Vai Ala Ala Ala Ala Gin Gin Arg Vai Arg
180 185 190
Lys Glu Asp Vai Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gin Lys Ile Ala Gin Leu Gly Leu Lys Tyr
210 215 220
Leu
225 <210> 57 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 57
atgaatgatc cggtggtagt ccgagaggtg gagcagccac cagcggatgc ggttgtcaca 60
ttggagaagt gcggagtgac aactgtgcat gaggcgcagg gacgttgtgg ccttctcgcc 120
cactacatgc gtccgattta tcctggagcc accatcgccg gttccgctgt cactgtctct 180
ttgccgcctg gcgacaacct catgatccac gttgcggtcg aggtttgtcg tccgggaaac 240
atcctggtcg tttcaccgac gtcgccttgc accgatggct acttcggaga gctgttggcg 300
acatctctcc gtgcccacgg tgtaagaggg ctggtgatcg acgccggctg ccgcgacgtc 360
cggtcgttga ccgagatgaa atttcctgtc tggagccgcg gcatcagctc gcaagggacg 420
gtcaaagcca cgctcggatc tgtgaacgtg gcggtcactt gcgcgggtgc actggtcgaa 480
gctggcgatg taatcgtcgc cgatgacgat ggagttgtgg ttgtgaagcg cgcgcaggcg 540
Petição 870170009999, de 15/02/2017, pág. 590/1247
581/788 caagaggtcg ccgccgcggc gcaacaacgg gttcgcaaag aagacgtaac tcgagagcga cttgctcgtg gagaactcgg actcgatatt tacgacatgc gccaaaagat cgcgcaactg ggcctaaagt atctgtga <210> 58 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 58
600
660
678
Met 1 Asn Asp Pro Vai 5 Vai Vai Arg Glu Vai 10 Glu Gin Pro Pro Ala 15 Asp
Ala Vai Vai Thr Leu Glu Lys Cys Gly Vai Thr Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala His Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Thr Ile Ala Gly Ser Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Arg Pro Gly Asn
65 70 75 80
Ile Leu Vai Vai Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Arg Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Gly Ile Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Ala Vai Thr Cys Ala Gly Ala Leu Vai Glu
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Gin Ala Gin Glu Vai Ala Ala Ala Ala Gin Gin Arg Vai Arg
180 185 190
Lys Glu Asp Vai Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gin Lys Ile Ala Gin Leu Gly Leu Lys Tyr
210 215 220
Leu
225 <210> 59
Petição 870170009999, de 15/02/2017, pág. 591/1247
582/788 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 59
atgaatgatc cggtggtagt ccgagaggtg gagcagccac cagcggatgc ggttgtcaca 60
ttggagaagt gtggagtgac aaccgtgcat gaggcacagg gacgttgtgg ccttctcgcg 120
cactacatgc gtccgattta cccgggggca accatcgccg gttccgctgt cactgtctct 180
ttgccgcctg gcgacaacct catgatccac gtcgccgtcg aggtttgcgg tccgggaaac 240
atcctggtcg tttcaccgac gtcgccttgc accgatggct acttcggaga gctgttggcg 300
acatctctcc gtgcccacgg tgtaagaggg ctggtgatcg acgccggatg ccgtgatgtc 360
cggtcgttga ccgagatgaa atttcctgtc tggagccgcg cgatcagctc gcaagggaca 420
gtcaaagcca cgctcgggtc ggtgaacgtg gcggtcactt gcgcgggtgc actggtcgaa 480
gctggcgatg taatcgtcgc cgatgacgat ggagttgtgg ttgtgaagcg cgcgcgggcg 540
caagaggtcg cggccgcggc gcaacaacgg gttcgcaaag aagacgtaac tcgagagcga 600
cttgctcgtg gagaactcgg actcgatatt tacgacatgc gccaaaagat cgcgcaactg 660
ggcctaaagt atctgtga 678
<210> 60 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 60
Met Asn 1 Asp Pro Vai Vai 5 Vai Arg Glu Vai 10 Glu Gin Pro Pro Ala 15 Asp
Ala Vai Vai Thr Leu Glu Lys Cys Gly Vai Thr Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala His Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Thr Ile Ala Gly Ser Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gly Pro Gly Asn
65 70 75 80
Ile Leu Vai Vai Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Arg Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Petição 870170009999, de 15/02/2017, pág. 592/1247
583/788
Pro Vai 130 Trp Ser Arg Ala Ile 135 Ser Ser Gin Gly Thr 140 Vai Lys Ala Thr
Leu Gly Ser Vai Asn Vai Ala Vai Thr Cys Ala Gly Ala Leu Vai Glu
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Arg Ala Gin Glu Vai Ala Ala Ala Ala Gin Gin Arg Vai Arg
180 185 190
Lys Glu Asp Vai Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gin Lys Ile Ala Gin Leu Gly Leu Lys Tyr
210 215 220
Leu
225
<210> 61 <211> 675 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 61
atgagcggcg tggttgtgcg ggaggtcgcc cgcccggcgc ccgatctcgt ggcctcgctc 60
gaagaggcgg gtgtctcaac cgtccacgaa gcacagggac gccggggact gctcgccacc 120
tacatgcgtc cgatctacgc cggagccacg ctcgcgggac cggcagtcac cgtcctcgtc 180
ccccccggcg acaacctgat gattcacgta gccgtggagg tgtgccgccc gggtgacgtg 240
ctggtcgtcg ccgtcacgtc gccgtgcacc gacggttact tcggcgagct gctggcgacg 300
tcggttcgcg cgcgcggcgt caaggggctc gtcatcgatg caggctgccg ggacgtgcgg 360
gcgctcaccg agatgcggtt tccggtgtgg agccgggcgg tcagcgcgca gggcaccgtc 420
aaggccacgc tgggctccgt gagcgttccg gtcgtttgcg ccggcgcgct gatcgaggcc 480
ggcgacgtcg tcgtgggcga cgacgacgga gtggttgtcg tgaaacggag cgaggccgat 540
gcggtcgtga gtgcttcgcg ccagcggctc ctcaaggaag aggggacgcg tcagcgcctg 600
gcaagcggtg aactcggtct ggacatctac tcgctgcgca aaacgctttc cgacctgggg 660
ctgaagtacc ggtaa 675
<210> 62 <211> 224 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (21)...(173) <223> Demetilmenaquinone metiltransferase <400> 62
Met Ser Gly Vai Vai Vai Arg Glu Vai Ala Arg Pro Ala Pro Asp Leu
Petição 870170009999, de 15/02/2017, pág. 593/1247
584/788
10 15
Vai Ala Ser Leu 20 Glu Glu Ala Gly Vai 25 Ser Thr Vai His Glu 30 Ala Gin
Gly Arg Arg Gly Leu Leu Ala Thr Tyr Met Arg Pro Ile Tyr Ala Gly
35 40 45
Ala Thr Leu Ala Gly Pro Ala Vai Thr Vai Leu Vai Pro Pro Gly Asp
50 55 60
Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Arg Pro Gly Asp Vai
65 70 75 80
Leu Vai Vai Ala Vai Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly Glu
85 90 95
Leu Leu Ala Thr Ser Vai Arg Ala Arg Gly Vai Lys Gly Leu Vai Ile
100 105 110
Asp Ala Gly Cys Arg Asp Vai Arg Ala Leu Thr Glu Met Arg Phe Pro
115 120 125
Vai Trp Ser Arg Ala Vai Ser Ala Gin Gly Thr Vai Lys Ala Thr Leu
130 135 140
Gly Ser Vai Ser Vai Pro Vai Vai Cys Ala Gly Ala Leu Ile Glu Ala
145 150 155 160
Gly Asp Vai Vai Vai Gly Asp Asp Asp Gly Vai Vai Vai Vai Lys Arg
165 170 175
Ser Glu Ala Asp Ala Vai Vai Ser Ala Ser Arg Gin Arg Leu Leu Lys
180 185 190
Glu Glu Gly Thr Arg Gin Arg Leu Ala Ser Gly Glu Leu Gly Leu Asp
195 200 205
Ile Tyr Ser Leu Arg Lys Thr Leu Ser Asp Leu Gly Leu Lys Tyr Arg
210 215 220 <210> 63 <211> 693 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 63
atgaccggca tcgtcgtcca gtggttcgag cgcacgccgc ttgccgatgt cgcggcgctt 60
gccgagttcg gcgtggctac catccacgag gcgcaaggcc gcaaggggct gctcgcgtcc 120
tacatgcggc cgatctatgc gggtgctgcc gcggcgggca atgccgtcac agtatcggtg 180
cctcccggtg acaactggat gatccatgtg gcggtcgagg tgtgccgcga gggcgacgtg 240
ctggtggtcg ccccgacctc gccctgcgac aacggctatt tcggtgagct gctggcctgc 300
tcgctcaagg cgcgcggcgt gcgcgggctc gtcatcgagg ccggctgccg cgacgtgaag 360
ccactctccg acatgaagtt tcccgtgtgg tcgcgcgccg tttccgccca gggcaccgtc 420
aaggagagcc tgggcgacgt caacctgccg ctcgtgatcg ccagccagac cgtgcatcct 480
ggcgacgtgg tggtcgccga tgacgacggt gtcgtcatcg tcgctcgcgg cgaggtgcgc 540
gccgtcaccg ccaagtcgcg cgagcgcgag gacaaggagg ccgcaagccg cgagaagctg 600
agcaaggggg aggtgggcct cgacatctac ggcatgcggg ccaagctgaa ggagaagggc 660
Petição 870170009999, de 15/02/2017, pág. 594/1247
585/788 attcgctacg tcgcgaatcc cgacaaactc tga <210> 64 <211> 230 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (21)...(173) <223> Demetilmenaquinone metiltransferase <400> 64
693
Met Thr Gly Ile Vai Vai Gin Trp Phe Glu Arg Thr Pro Leu Ala Asp
1 5 10 15
Vai Ala Ala Leu Ala Glu Phe Gly Vai Ala Thr Ile His Glu Ala Gin
20 25 30
Gly Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala Gly
35 40 45
Ala Ala Ala Ala Gly Asn Ala Vai Thr Vai Ser Vai Pro Pro Gly Asp
50 55 60
Asn Trp Met Ile His Vai Ala Vai Glu Vai Cys Arg Glu Gly Asp Vai
65 70 75 80
Leu Vai Vai Ala Pro Thr Ser Pro Cys Asp Asn Gly Tyr Phe Gly Glu
85 90 95
Leu Leu Ala Cys Ser Leu Lys Ala Arg Gly Vai Arg Gly Leu Vai Ile
100 105 110
Glu Ala Gly Cys Arg Asp Vai Lys Pro Leu Ser Asp Met Lys Phe Pro
115 120 125
Vai Trp Ser Arg Ala Vai Ser Ala Gin Gly Thr Vai Lys Glu Ser Leu
130 135 140
Gly Asp Vai Asn Leu Pro Leu Vai Ile Ala Ser Gin Thr Vai His Pro
145 150 155 160
Gly Asp Vai Vai Vai Ala Asp Asp Asp Gly Vai Vai Ile Vai Ala Arg
165 170 175
Gly Glu Vai Arg Ala Vai Thr Ala Lys Ser Arg Glu Arg Glu Asp Lys
180 185 190
Glu Ala Ala Ser Arg Glu Lys Leu Ser Lys Gly Glu Vai Gly Leu Asp
195 200 205
Ile Tyr Gly Met Arg Ala Lys Leu Lys Glu Lys Gly Ile Arg Tyr Vai
210 215 220
Ala Asn Pro Asp Lys Leu
225 230
<210> 65
<211> 672
<212> DNA
Petição 870170009999, de 15/02/2017, pág. 595/1247
586/788 <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 65
atgagcatcg tcgtcacgaa gatcgagcgc gccggcgcgg cggccgtcgc cgcgctgcgc 60
acaagtggcg ttgccacagt gcacgaggcg caagggcgca cgggcttgat gcgtccctac 120
atgcggccga tctacccggg cgcgcgcatc gccggcacgg cgatcaccgt ctccctgcct 180
ccgggcgaca actggatgat ccacgtcgcg gtcgagcagt gccgcgaggg cgatatcctc 240
gtggtggcgc cgaccagccc gagcgacgac ggctatttcg gcgacctgct tggcaattcg 300
ctcgtcgcac gcggcgtcag gggcctggtg atcgaggccg gtgtgcgtga cgtgcgcgac 360
ctcacggaga tgcgctttcc ggtctggtcg aagacgattt cggcgcaagg cacggtcaag 420
gagacgttgg gctcggtcaa cgtgccgatc gtctgcgcgg gtgctgccgt gaaccccgga 480
gacgtgatcg tggccgacga cgacggcgtc tgcgtcgtgc cgcgccagac ggtcacagag 540
gtcgtcgagg cggcccacgc ccgcgaggcc aaggaggccg aggtccggca gcggctcatc 600
gcgggcgagc ttggcctcga cgtctacggc atgcgcgaga agctggcggc caagggcctc 660
aaatatgtct ga 672
<210> 66 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> SINAL <222> (1)...(27) <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 66
Met 1 Ser Ile Vai Vai 5 Thr Lys Ile Glu Arg Ala Gly Ala Ala Ala Vai
10 15
Ala Ala Leu Arg Thr Ser Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Pro Gly Ala
35 40 45
Arg Ile Ala Gly Thr Ala Ile Thr Vai Ser Leu Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Vai Ala Vai Glu Gin Cys Arg Glu Gly Asp Ile Leu
65 70 75 80
Vai Vai Ala Pro Thr Ser Pro Ser Asp Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Gly Asn Ser Leu Vai Ala Arg Gly Vai Arg Gly Leu Vai Ile Glu
100 105 110
Ala Gly Vai Arg Asp Vai Arg Asp Leu Thr Glu Met Arg Phe Pro Vai
Petição 870170009999, de 15/02/2017, pág. 596/1247
587/788
115 120 125
Trp Ser Lys Thr Ile Ser Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Vai Pro Ile Vai Cys Ala Gly Ala Ala Vai Asn Pro Gly
145 150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Pro Arg Gin
165 170 175
Thr Vai Thr Glu Vai Vai Glu Ala Ala His Ala Arg Glu Ala Lys Glu
180 185 190
Ala Glu Vai Arg Gin Arg Leu Ile Ala Gly Glu Leu Gly Leu Asp Vai
195 200 205
Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Vai
210 215 220
<210> 67
<211> 672
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 67
atgagcgttg tcgtcacgaa gatcgagcgc gccggcgccg aagctgttgt agcgctggcc 60
gaaagtggtg tgtcgaccgt gcacgaggcg cagggccgga ccgggctgat gcggccttat 120
atgcggccga tctacgcggg cgcgcggatc gccgggacgg cgatcaccgt gtcgctgcag 180
ccgggcgaca actggatgat ccatgtggcg gtcgagcaat gccggcaggg cgacatcctc 240
gtcgtggcgc cgaccagccc gagcgacgac gggtatttcg gcgacctgct cggcaattcg 300
cttgtcgcgc ggggcgtcag ggggctggtg atcgaggccg gcgtgcgcga cgtgcgcgat 360
ctgaccgcga tgggttttcc ggtatggtcg aagacagtct cggcgcaagg caccgtgaag 420
gagacgctcg gctcggtgaa cgtgcccgtc gtctgcgcgg gggcgaccgc aaaccccggt 480
gacgtgatcg tggccgatga cgacggcgtc tgcgtggtgc cgcgcgagac ggccgcggca 540
gtggtcgagg cggcccatgc gcgggaggtg aaggaggcag aggtacggcg gcggctgatc 600
tccggcgagc tcggcctaga catctacggc atgcgcgaca agctcgctgc caagggcctc 660
aaatatgtct ga 672
<210> 68 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 68
Met Ser Vai Vai Vai Thr Lys Ile Glu Arg Ala Gly Ala Glu Ala Vai 15 10 15
Petição 870170009999, de 15/02/2017, pág. 597/1247
588/788
Vai Ala Leu Ala 20 Glu Ser Gly Vai Ser Thr Vai 25 His Glu Ala 30 Gin Gly
Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Ala Gly Ala
35 40 45
Arg Ile Ala Gly Thr Ala Ile Thr Vai Ser Leu Gin Pro Gly Asp Asn
50 55 60
Trp Met Ile His Vai Ala Vai Glu Gin Cys Arg Gin Gly Asp Ile Leu
65 70 75 80
Vai Vai Ala Pro Thr Ser Pro Ser Asp Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Gly Asn Ser Leu Vai Ala Arg Gly Vai Arg Gly Leu Vai Ile Glu
100 105 110
Ala Gly Vai Arg Asp Vai Arg Asp Leu Thr Ala Met Gly Phe Pro Vai
115 120 125
Trp Ser Lys Thr Vai Ser Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Thr Ala Asn Pro Gly
145 150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Pro Arg Glu
165 170 175
Thr Ala Ala Ala Vai Vai Glu Ala Ala His Ala Arg Glu Vai Lys Glu
180 185 190
Ala Glu Vai Arg Arg Arg Leu Ile Ser Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Asp Lys Leu Ala Ala Lys Gly Leu Lys Tyr Vai
210 215 220 <210> 69 <211> 672 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 69
atgggcaccg tggttcaaaa cattgcgcgc gctgaccact ccgtcatcga ccgccttgct 60
gcctgcggtg tcgccaccgt tcacgaggcc cagggccgca ccggattgct cgccagttac 120
atgcggccga tctatgcggg cgcgcggctg gccgctagcg ccgtcaccat ctccgcccca 180
ccgggcgaca actggatgat ccacgtcgcc atcgagcaac tcaaggcagg cgacatcatg 240
gtgctggccc cgaccagccc ctgcgaggac ggttatttcg gcgacctgct cgccacttcc 300
gcccaagcgc gagggtgcaa gggcctaatc atcgacgccg gcgtgcgcga cgttgcagac 360
ctgaccgcga tgggatttcc cgtgtggtcc aaggccatct tcgcgcaggg tacggtcaag 420
gcgagtttgg gttcagtcaa tgtgtcggtg gtctgtgcta gtgccttgat caatccgggc 480
gacattgtcg tggccgacga tgatggtgtg tgtgtcgtac ggcgcgagga cgcggtctcc 540
gtggcggcga aggccgaagc gcgggtggca gccgaagagg acaagcgccg gcgcctcgca 600
gggggcgaac tgggacttga tatttatggg atgcgcgaca cgctcgcggc caaggggcta 660
aaatatgtct ga 672
Petição 870170009999, de 15/02/2017, pág. 598/1247
589/788 <210> 70 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <220>
<221> SITE <222> (149)...(152) <223> Sítio de N-glicosilação prosítio id = PS00001 <400> 70
Met Gly Thr Vai Vai Gin Asn Ile Ala Arg Ala 10 Asp His Ser Vai 15 Ile
1 5
Asp Arg Leu Ala Ala Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Arg Thr Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala Gly Ala
35 40 45
Arg Leu Ala Ala Ser Ala Vai Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Vai Ala Ile Glu Gin Leu Lys Ala Gly Asp Ile Met
65 70 75 80
Vai Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Gin Ala Arg Gly Cys Lys Gly Leu Ile Ile Asp
100 105 110
Ala Gly Vai Arg Asp Vai Ala Asp Leu Thr Ala Met Gly Phe Pro Vai
115 120 125
Trp Ser Lys Ala Ile Phe Ala Gin Gly Thr Vai Lys Ala Ser Leu Gly
130 135 140
Ser Vai Asn Vai Ser Vai Vai Cys Ala Ser Ala Leu Ile Asn Pro Gly
145 150 155 160
Asp Ile Vai Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Arg Arg Glu
165 170 175
Asp Ala Vai Ser Vai Ala Ala Lys Ala Glu Ala Arg Vai Ala Ala Glu
180 185 190
Glu Asp Lys Arg Arg Arg Leu Ala Gly Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Asp Thr Leu Ala Ala Lys Gly Leu Lys Tyr Vai
210 215 220 <210> 71 <211> 672
Petição 870170009999, de 15/02/2017, pág. 599/1247
590/788 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 71
atgagcgtcg tcgtccagac catcgcgcgc gccgatcaga cggtcatcga ccgcctcggc 60
gcctgcggcg tcgccaccgt acatgaggcg cagggccgca aggggctact cgcgagctac 120
atgcggccca tctattccgg cgcgcggctg gctgcgagcg cggtgacaat ttcggcgccg 180
cccggcgaca actggatgat ccacgtcgcc atcgagcagc tcaaggccgg cgacatcatg 240
gtgctcgctc ccaccagccc ctgcgaagac ggctatttcg gcgacctgct cgcgacgtcg 300
gctgtggcgc gcggctgccg cgggctcgtc atcgaggccg gcgtgcgcga tgtggccgat 360
ctcaccgcga tgaaattccc ggtatggtcg aaagccatct ccgctcaggg caccgtcaag 420
gagacgctgg gctcggtgaa cgtgccgatc gtatgcgccg gcacgctggt cgagccgggc 480
gacgtcatcg tcgccgacga tgacggcgtc tgcgtcgtgc gccgcgaaga ggcggaggcc 540
gtggcgcaga aggccgaggc ccgcatcgcc accgaagagg acaagcgcaa acgcctggcg 600
ggcggcgagc tcggtctcga catctacaag atgcgcgagc ggctggccga aaaaggactc 660
aaatatgtct ag 672
<210> 72 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 72
Met Ser Vai Vai Vai Gin Thr Ile Ala Arg Ala Asp Gin Thr Vai Ile
1 5 10 15
Asp Arg Leu Gly Ala Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser Gly Ala
35 40 45
Arg Leu Ala Ala Ser Ala Vai Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Vai Ala Ile Glu Gin Leu Lys Ala Gly Asp Ile Met
65 70 75 80
Vai Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Vai Ala Arg Gly Cys Arg Gly Leu Vai Ile Glu
100 105 110
Ala Gly Vai Arg Asp Vai Ala Asp Leu Thr Ala Met Lys Phe Pro Vai
115 120 125
Trp Ser Lys Ala Ile Ser Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
Petição 870170009999, de 15/02/2017, pág. 600/1247
591/788
130 135 140
Ser Vai Asn Vai Pro Ile Vai Cys Ala Gly Thr Leu Vai Glu Pro Gly
145 150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Arg Arg Glu
165 170 175
Glu Ala Glu Ala Vai Ala Gin Lys Ala Glu Ala Arg Ile Ala Thr Glu
180 185 190
Glu Asp Lys Arg Lys Arg Leu Ala Gly Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Vai
210 215 220 <210> 73 <211> 690 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 73
atgagcgtgg tcatcaccaa tatccagcgc cccgatcccg agcacaccaa agcgctcgcc 60
gccttcggcg ttgcgactat tcacgaggcg cagggccgca ccggactgat gcagtccttc 120
atgcgaccga tctatgccgg cgcgcgcgcc gccggcaccg ccgtcaccgt gtcgctgccc 180
cccgccgaca actggatgat ccacgtcgcg gtggagcaat gccaggcagg cgacattctc 240
gtcgtcgcgc cgacctcgcc ctccgatgtc ggatatttcg gcgagctcct cgccacctcg 300
ctcgccgcac ggggcgtggt cggcctcatc atcgaaggcg gctgccgcga cgtcgcggca 360
ttgaccgaga tgggtttccc ggtctggtcg cgcgccgtat cggcgcaggg caccgtgaag 420
gagacgctcg gctccgtgaa cataccgatc gtctgcgccg gcgcgcatat tcatcccggc 480
gacttcgtcg ccgccgacga tgacggcgtg gtcgtcgtgc cccgcgccca cgtggcggaa 540
atcgccgccg cctccctcgc gcgcgaggac aaggaggccg ccgttcgcga gcgcctgaaa 600
tccggtgagc tcggcctcga tatttacggc atgcgcccgc gcctcaagga gaaaggcctc 660
gtctggcgcg aaacgccgga gaagaaatag 690
<210> 74 <211> 229 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 74
Met Ser Vai Vai Ile Thr Asn Ile Gin Arg Pro Asp Pro Glu His Thr
1 5 10 15
Lys Ala Leu Ala Ala Phe Gly Vai Ala Thr Ile His Glu Ala Gin Gly
20 25 30
Petição 870170009999, de 15/02/2017, pág. 601/1247
592/788
Arg Thr Gly Leu 35 Met Gin Ser Phe Met Arg Pro 40 Ile Tyr 45 Ala Gly Ala
Arg Ala Ala Gly Thr Ala Vai Thr Vai Ser Leu Pro Pro Ala Asp Asn
50 55 60
Trp Met Ile His Vai Ala Vai Glu Gin Cys Gin Ala Gly Asp Ile Leu
65 70 75 80
Vai Vai Ala Pro Thr Ser Pro Ser Asp Vai Gly Tyr Phe Gly Glu Leu
85 90 95
Leu Ala Thr Ser Leu Ala Ala Arg Gly Vai Vai Gly Leu Ile Ile Glu
100 105 110
Gly Gly Cys Arg Asp Vai Ala Ala Leu Thr Glu Met Gly Phe Pro Vai
115 120 125
Trp Ser Arg Ala Vai Ser Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Ile Pro Ile Vai Cys Ala Gly Ala His Ile His Pro Gly
145 150 155 160
Asp Phe Vai Ala Ala Asp Asp Asp Gly Vai Vai Vai Vai Pro Arg Ala
165 170 175
His Vai Ala Glu Ile Ala Ala Ala Ser Leu Ala Arg Glu Asp Lys Glu
180 185 190
Ala Ala Vai Arg Glu Arg Leu Lys Ser Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Pro Arg Leu Lys Glu Lys Gly Leu Vai Trp Arg Glu
210 215 220
Thr Pro Glu Lys Lys 225 <210> 75 <211> 672 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 75
atgggagtcg tcgttcagaa tatcgcgcgg gccgagcagg agatcatcga ccggctggcc 60
gcctgcggcg ttgccaccgt tcacgaagcg caagggcgca aagggctgct ggcaagctat 120
atgcggccga tctatcaggg tgcgcggctc gccgcgagcg ccgtcacaat ctcggcgccg 180
ccgggcgaca actggatggt tcatgtcgcc atcgaacaga taagggccgg cgacatcctg 240
ctgcttgcgc ccacaagccc gtgcgaggac ggctattttg gcgatctcct cgcaacgtcc 300
gcgcaggcaa gggggtgccg cgggctggtc atcgacgctg gtgtgcgcga catcgccgat 360
ctgaaggcga tgaattttcc ggtctggtcg aaggccgtgt tcgcgcaggg aacgatcaag 420
gagacactcg gatcggtcaa tgtgcccgtg gtctgtgccg gagcgctggt caatccggga 480
gacgtgattg tggcggacga cgacggcgtc tgcgtcgtgc gccgggagga ggccgaaaac 540
gtagtccaga aagccgaggc gcgggtcagc gcggaagtgg ccaagcgcgc caggctcgca 600
gccggcgaac tcggcctcga catctacagg atgcgcgaaa ggctggcgga gaaggggctg 660
aaatatgtct ga 672
Petição 870170009999, de 15/02/2017, pág. 602/1247
593/788 <210> 76 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 76
Met Gly Vai Vai Vai Gin Asn Ile Ala Arg Ala Glu Gin Glu Ile Ile 15 10 15
Asp Arg Leu Ala Ala Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Gin Gly Ala
40 45
Arg Leu Ala Ala Ser Ala Vai Thr Ile Ser Ala Pro Pro Gly Asp Asn
55 60
Trp Met Vai His Vai Ala Ile Glu Gin Ile Arg Ala Gly Asp Ile Leu
70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
90 95
Leu Ala Thr Ser Ala Gin Ala Arg Gly Cys Arg Gly Leu Vai Ile Asp
100 105 110
Ala Gly Vai Arg Asp Ile Ala Asp Leu Lys Ala Met Asn Phe Pro Vai
115 120 125
Trp Ser Lys Ala Vai Phe Ala Gin Gly Thr Ile Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Leu Vai Asn Pro Gly
145 150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Arg Arg Glu
165 170 175
Glu Ala Glu Asn Vai Vai Gin Lys Ala Glu Ala Arg Vai Ser Ala Glu
180 185 190
Vai Ala Lys Arg Ala Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Arg Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Vai
210 215 220 <210> 77 <211> 681 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente
Petição 870170009999, de 15/02/2017, pág. 603/1247
594/788 <400> 77
gtgaccgatc cggttgtcgc tcgacagatc gacaggccgc ccgcgaatct ggtcgccgat 60
ctgcagcgct acggcgtctc caccgtccac gaggcgcaag ggcgtcgcgg cctgctcgcg 120
tcgtacatgc ggccgatcta tgccggcgcg ctcattgccg gtcccgcgat cacggtcctg 180
gtaccgcctg gcgacaactt gatgatccac gtcgccgtgg aagtgtgcca gcctggcgac 240
gttctcgtcg tcgccacgac gtcgccgtgc accgacggct atttcggcga gctgctggcg 300
acgtcgctgc gggcccgcgg cgtggcgggg ctcgtgatcg atgcgggctg ccgggatgtt 360
cgcgcgctga cggaaatgcg atttcccgtc tggagccgcg cgatcagcgc gcagggaacc 420
gtcaaagcca cgctgggctc ggtgaacgcg gcggtggtgt gcgccgggac gtcggtgaga 480
gccggggatc tcatcgtggc cgacgatgac ggggtggtgg cggtgcggcg ggaggaagtc 540
gtcgccgtga cgcaggcggc cgaacagcgc gttcgcaagg aagagggcac gcgcgcacgg 600
ctcgcgcagg gcgagctcgg cctggacatt tacggcttgc gccagaagct gtcggatcta 660
ggcttgaagt catcgtcgtg a 681
<210> 78 <211> 226 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 78
Met Thr Asp Pro Vai Vai Ala Arg Gin Ile Asp Arg Pro Pro Ala Asn
1 5 10 15
Leu Vai Ala Asp Leu Gin Arg Tyr Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Leu Ile Ala Gly Pro Ala Ile Thr Vai Leu Vai Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gin Pro Gly Asp
65 70 75 80
Vai Leu Vai Vai Ala Thr Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Vai Ala Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ala Leu Thr Glu Met Arg Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Ser Ala Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Ala Ala Vai Vai Cys Ala Gly Thr Ser Vai Arg
145 150 155 160
Ala Gly Asp Leu Ile Vai Ala Asp Asp Asp Gly Vai Vai Ala Vai Arg
Petição 870170009999, de 15/02/2017, pág. 604/1247
595/788
165 170 175
Arg Glu Glu Vai Vai Ala Vai Thr Gin Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Glu Gly Thr Arg Ala Arg Leu Ala Gin Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Gin Lys Leu Ser Asp Leu Gly Leu Lys Ser
210 215 220
Ser Ser
225 <210> 79 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 79
atgagcgagc cggtcgtcgt tcggcagatc gagaggccct cttcggccgc gatcgccgat 60
ctccggcggt acggcgtctc gacggttcac gaagcgcagg gccgccgcgg actgctcgcg 120
tccggcctgc ggccgatcta tgcgaccgcg ctcatggcgg gccctgcgat cacggtgctg 180
gtcgcaccgg gcgacaacct gatgatccac gtcgccgtcg aggtctgcca gcccggggat 240
gtgctcgtgg tcacgccgac gtcaccgtgc acggacggct atttcggcga gctgctggcc 300
acgtcgctgc gggcgcgagg cgttgcgggc ctcgtcatcg acgccggctg ccgcgacatt 360
cgcgcgctga cggagatgcg gtttcccgta tggagtcgcg cgatcagcgc gcagggcacg 420
gtcaaagcca cgctcggctc cgtgaatgtc cccgtcgtct gcgccggcgc gcttgtcgaa 480
gcgggcgacg tcatcgtcgc cgacgatgac ggggtcgtgg tggtgaagcg gggcgaagtc 540
gacgtcgtca tccaggcggc ggagcagcgc gtgcgcaagg aagaagtcac gcgggcccgg 600
ctggcgcagg gcgagctcgg tctggacatc tacggcctgc gcaagaagat tgcggacctg 660
ggcttgaagt cgtcgtga 678
<210> 80 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 80
Met Ser Glu Pro Vai Vai Vai Arg Gin Ile Glu Arg Pro Ser Ser Ala
1 5 10 15
Ala Ile Ala Asp Leu Arg Arg Tyr Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Arg Gly Leu Leu Ala Ser Gly Leu Arg Pro Ile Tyr Ala
35 40 45
Petição 870170009999, de 15/02/2017, pág. 605/1247
596/788
Thr Ala Leu Met Ala Gly Pro Ala 55 Ile Thr Vai Leu 60 Vai Ala Pro Gly
50
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gin Pro Gly Asp
65 70 75 80
Vai Leu Vai Vai Thr Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Vai Ala Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Ile Arg Ala Leu Thr Glu Met Arg Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Ser Ala Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Leu Vai Glu
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Gly Glu Vai Asp Vai Vai Ile Gin Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Glu Vai Thr Arg Ala Arg Leu Ala Gin Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Lys Lys Ile Ala Asp Leu Gly Leu Lys Ser
210 215 220
Ser
225
<210> 81
<211> 678
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 81
atgaacgagc cgaccgttgt tcgagcgatc gacaggccgc cggcggatgt ggtcgcggcg 60
ctccagcgct acggcgtgtc gaccgtgcat gaagcacaag ggagacgcgg cctcgtagcg 120
tcctgcatgc ggccgatcta caccggcgct ttggtcgccg gtcctgccgt aaccgtctcg 180
ctcccgccgg gcgacaacct catgattcac gtcgctgtcg aagcctgcca ggcgggcgac 240
gtgcttgtcg tggtgccgac ctccccgtgc acggacgggt atttcggtga gttactggcg 300
acgtcgctgc acgcacgcgg agtcgtggct ctcgtcatcg atgccggctg ccgcgacgtg 360
cgcgctctgt cggagatgcg atttcctgtc tggagccgcg cgatcagcgc tcagggcacg 420
gtcaaagcca cgttgggatc ggtgaacgtt cccgtggtgt gcgcgggagc gcccgtggag 480
cccggcgatg tgatcgtcgc cgacgacgat ggggtggtgg ttgtgaagcg cagcgaggtg 540
gagggggtgg cgcaggcgtc ggagcagcga gtcctgaagg aggaggcgac gcgcgagcgg 600
ttggcgcgcg gcgagctggg cctcgacatc tacgggctgc ggaaaaaggt gtcggacctc 660
ggcctgaaat attcgtga 678
<210> 82 <211> 225
Petição 870170009999, de 15/02/2017, pág. 606/1247
597/788 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 82
Met Asn Glu Pro Thr Vai Vai Arg Ala Ile Asp Arg Pro Pro Ala Asp 15 10 15
Vai Vai Ala Ala Leu Gin Arg Tyr Gly Vai Ser Thr Vai His Glu Ala
25 30
Gin Gly Arg Arg Gly Leu Vai Ala Ser Cys Met Arg Pro Ile Tyr Thr
40 45
Gly Ala Leu Vai Ala Gly Pro Ala Vai Thr Vai Ser Leu Pro Pro Gly
55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Ala Cys Gin Ala Gly Asp
70 75 80
Vai Leu Vai Vai Vai Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
90 95
Glu Leu Leu Ala Thr Ser Leu His Ala Arg Gly Vai Vai Ala Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ala Leu Ser Glu Met Arg Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Ser Ala Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Pro Vai Glu
145 150 155 160
Pro Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ser Glu Vai Glu Gly Vai Ala Gin Ala Ser Glu Gin Arg Vai Leu
180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Lys Lys Vai Ser Asp Leu Gly Leu Lys Tyr
210 215 220
Ser
225 <210> 83 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente
Petição 870170009999, de 15/02/2017, pág. 607/1247
598/788 <400> 83
atgagcgagc cggtcgtcgt tcggcagatc gagaggccct cttcggccgc gatcgccgat 60
ctccggcggt acggcgtctc gacggttcac gaagcgcagg gccgccgcgg actgctcgcg 120
tccggcctgc ggccgatcta tgcgagcgcg ctcatggtgg gccctgcgat cacggtgctg 180
gtcgcaccgg gcgacaacct gatgatccac gtcgccgtcg aggtctgcca gcccggggat 240
gtgctcgtgg tcacgccgac gtcaccgtgc acggacggct atttcggcga gctgctggcc 300
acgtcgctgc gggcgcgagg cgttgcgggc ctcgtcatcg acgccggctg ccgcgacatt 360
cgcgcgctga cggagatgcg gtttcccgta tggagtcgcg cgatcagcgc gcagggcacg 420
gtcaaagcca cgctcggctc cgtgaatgtc cccgtcgtct gcgccggcgc gctcgtcgaa 480
gcgggcgacg tcatcgtcgc cgacgatgac ggggtcgtgg tggtgaagcg gggcgaagtc 540
gacgtcgtca tccaggcggc ggagcagcgc gtgcgcaagg aagaagtcac gcgggcgcgg 600
ctggcgcagg gcgagctcgg tctggacatc tacggcctgc gcaagaagat tgcggacctg 660
ggcttgaagt cgttgtga 678
<210> 84 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 84
Met Ser Glu Pro Vai Vai Vai Arg Gin Ile Glu Arg Pro Ser Ser Ala
1 5 10 15
Ala Ile Ala Asp Leu Arg Arg Tyr Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Arg Gly Leu Leu Ala Ser Gly Leu Arg Pro Ile Tyr Ala
35 40 45
Ser Ala Leu Met Vai Gly Pro Ala Ile Thr Vai Leu Vai Ala Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gin Pro Gly Asp
65 70 75 80
Vai Leu Vai Vai Thr Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Vai Ala Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Ile Arg Ala Leu Thr Glu Met Arg Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Ser Ala Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Leu Vai Glu
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
Petição 870170009999, de 15/02/2017, pág. 608/1247
599/788
165 170 175
Arg Gly Glu Vai Asp Vai Vai Ile Gin Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Glu Vai Thr Arg Ala Arg Leu Ala Gin Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Lys Lys Ile Ala Asp Leu Gly Leu Lys Ser
210 215 220
Leu
225 <210> 85 <211> 699 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 85
atgaccggca ttgtcgtcga gaccatcgag cgcgcgtcgc tcgccgacat cgccgcgttg 60
gccgaattcg gcgtcgccac catccacgag gcgcagggcc gcatcggcct gcttgcctcc 120
accatgcgcc cgatctacgc aggcgcggcg gccgccggca atgccgtcac cgtgtcggtg 180
ccgcccggcg acaactggat gatccacgtc gccgtcgagc agtgccgcga aggcgatatt 240
ctcgtcgtcg cccccaccag cccgaacgac aacggctact ttggcgaact gctggcctgc 300
tcgctcaagt cgcgcggcgt gcgcggcctc atcatcgagg ccggctgccg cgacgtgaaa 360
ccgctcaccg agatgaagtt ccccgtctgg tcccgcgccg tctcctccca gggcacggtg 420
aaggaaagcc tcggcgacgt gaacctgccg ctctcgatcg ccggccagct cgtcaacccc 480
ggcgatgtca tcgtcgccga tgacgacggc gtggtcgtgg tctcccgcaa tgaagtcagg 540
agcgtcaccg ccaagtcccg cgagcgcgaa gacaaggagg ccaagaaccg cgtgcagctc 600
caagccggcc agctcggcat cgacatctac ggcatgcgcg acaagctcaa ggccaagggc 660
ctccgctacg tcaaatccgc ggcggagttg aagaagtag 699
<210> 86 <211> 232 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (21)...(173) <223> Demetilmenaquinone metiltransferase <400> 86
Met 1 Thr Gly Ile Vai 5 Vai Glu Thr Ile Glu 10 Arg Ala Ser Leu Ala 15 Asp
Ile Ala Ala Leu Ala Glu Phe Gly Vai Ala Thr Ile His Glu Ala Gin
20 25 30
Gly Arg Ile Gly Leu Leu Ala Ser Thr Met Arg Pro Ile Tyr Ala Gly
35 40 45
Petição 870170009999, de 15/02/2017, pág. 609/1247
600/788
Ala Ala Ala 50 Ala Gly Asn Ala Vai 55 Thr Vai Ser Vai 60 Pro Pro Gly Asp
Asn Trp Met Ile His Vai Ala Vai Glu Gin Cys Arg Glu Gly Asp Ile
65 70 75 80
Leu Vai Vai Ala Pro Thr Ser Pro Asn Asp Asn Gly Tyr Phe Gly Glu
85 90 95
Leu Leu Ala Cys Ser Leu Lys Ser Arg Gly Vai Arg Gly Leu Ile Ile
100 105 110
Glu Ala Gly Cys Arg Asp Vai Lys Pro Leu Thr Glu Met Lys Phe Pro
115 120 125
Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys Glu Ser Leu
130 135 140
Gly Asp Vai Asn Leu Pro Leu Ser Ile Ala Gly Gin Leu Vai Asn Pro
145 150 155 160
Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Ser Arg
165 170 175
Asn Glu Vai Arg Ser Vai Thr Ala Lys Ser Arg Glu Arg Glu Asp Lys
180 185 190
Glu Ala Lys Asn Arg Vai Gin Leu Gin Ala Gly Gin Leu Gly Ile Asp
195 200 205
Ile Tyr Gly Met Arg Asp Lys Leu Lys Ala Lys Gly Leu Arg Tyr Vai
210 215 220
Lys Ser Ala Ala Glu Leu Lys Lys
225 230 <210> 87 <211> 672 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 87
atgggcattg tcgttcagaa cattcagcgg gcggagcagt ccgtcatcga tcgtctcgct 60
gcttgcggag ttgcgaccgt acatgaagcg cagggccgca aggggctgct cgccagctac 120
atgcggccga tttatccggg cgcgcggatc gcggcgagtg ccgtgacaat ttccgcgcct 180
ccgggcgata actggatgct gcatgtggcg atcgagcaga tcaaggcggg cgatatccta 240
ctgcttgcgc cgaccagtcc ctgcgaggac ggttatttcg gcgatctctt ggcgacgtct 300
gccatggcac gcggctgccg cgggttggtg atcgatgccg gcgtgcgcga tgtcgccgat 360
ctcaaggcga tgaattttcc cgtttggtcg aagacgatct ctgcacaggg gacggtcaag 420
gagacggtgg gctcggtcaa tattcccgtc gtctgcgcca gtgcgctcgt caatcctggc 480
gatgtgatcg ttgccgatga tgatggcgtc tgcgtcgtac ggcgggagga agctgccgag 540
gtcgcggata aggccgagca gcgggtcgcg gcagaagagg acaagcgccg gcgactggcc 600
gcgggtgaac tcgggctcga tatctacaag atgcgcgagc ggctggcgga gaaggggctg 660
aaatatgtct ag 672
<210> 88 <211> 223
Petição 870170009999, de 15/02/2017, pág. 610/1247
601/788 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 88
Met Gly Ile Vai Vai Gin Asn Ile Gin Arg Ala Glu Gin Ser Vai Ile 15 10 15
Asp Arg Leu Ala Ala Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro Gly Ala
40 45
Arg Ile Ala Ala Ser Ala Vai Thr Ile Ser Ala Pro Pro Gly Asp Asn
55 60
Trp Met Leu His Vai Ala Ile Glu Gin Ile Lys Ala Gly Asp Ile Leu
70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
90 95
Leu Ala Thr Ser Ala Met Ala Arg Gly Cys Arg Gly Leu Vai Ile Asp
100 105 110
Ala Gly Vai Arg Asp Vai Ala Asp Leu Lys Ala Met Asn Phe Pro Vai
115 120 125
Trp Ser Lys Thr Ile Ser Ala Gin Gly Thr Vai Lys Glu Thr Vai Gly
130 135 140
Ser Vai Asn Ile Pro Vai Vai Cys Ala Ser Ala Leu Vai Asn Pro Gly
145 150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Arg Arg Glu
165 170 175
Glu Ala Ala Glu Vai Ala Asp Lys Ala Glu Gin Arg Vai Ala Ala Glu
180 185 190
Glu Asp Lys Arg Arg Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Vai
210 215 220 <210> 89 <211> 696 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 89 atgaagcgcg gcgtggtggt gacccatatc gcgcgggcgg atgcggcgaa cgtggccgtg
Petição 870170009999, de 15/02/2017, pág. 611/1247
602/788
ctgcgggagg caggcgttgc gaccgtccac gaggcgcaga gccggcttgg tcttctagcg 120
tgctacatgc ggccgatcta tccgggcgcg gccattgccg gaccggccgt cacggtgctc 180
gtgccgccgt cggacaactg gatgctgcat gtggcggtcg aacagtgccg cgcaggcgac 240
gtgctggtgg tggcgcccac gtctgcctgc gaggacgggt atttcgggga actgcttgcc 300
acgtcgctcg cgaagcgcgg cgtacagggc ctgatcatcg atgcgggctg ccgggatgtg 360
tgcgcgctca aggcaatgga ttttcccgtg tggtcgaagg ccgtctccgc gcagggcacg 420
gtcaaggaga cgctcggctc ggtcaatgtg ccggtcgtat gcgcgcagca gatcgtgcat 480
ccgggagacg tgatcgtggc cgatgacgac ggcatcgtcg tggcgccgct cgccaccgtc 540
gaggcggtag cgaaggccgc gcaggcgcgc ctggagaagg aagagaagac gcgtgcggtg 600
ctcgcaagcg gcacgctcgg cctcgactac tacgcgatgc gtgacaggct cgcggaaaga 660
ggcttgcgct acgtcgattc ggcctctgaa ctttga 696
<210> 90 <211> 231 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 90
Met Lys Arg Gly Vai Vai Vai Thr His Ile Ala Arg Ala Asp Ala Ala
1 5 10 15
Asn Vai Ala Vai Leu Arg Glu Ala Gly Vai Ala Thr Vai His Glu Ala
20 25 30
Gin Ser Arg Leu Gly Leu Leu Ala Cys Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala Vai Thr Vai Leu Vai Pro Pro Ser
50 55 60
Asp Asn Trp Met Leu His Vai Ala Vai Glu Gin Cys Arg Ala Gly Asp
65 70 75 80
Vai Leu Vai Vai Ala Pro Thr Ser Ala Cys Glu Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Ala Lys Arg Gly Vai Gin Gly Leu Ile
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Cys Ala Leu Lys Ala Met Asp Phe
115 120 125
Pro Vai Trp Ser Lys Ala Vai Ser Ala Gin Gly Thr Vai Lys Glu Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Vai Vai Cys Ala Gin Gin Ile Vai His
145 150 155 160
Pro Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Ile Vai Vai Ala Pro
165 170 175
Leu Ala Thr Vai Glu Ala Vai Ala Lys Ala Ala Gin Ala Arg Leu Glu
Petição 870170009999, de 15/02/2017, pág. 612/1247
603/788
180 185 190
Lys Glu Glu Lys 195 Thr Arg Ala Vai Leu Ala Ser Gly Thr Leu Gly Leu
200 205
Asp Tyr Tyr Ala Met Arg Asp Arg Leu Ala Glu Arg Gly Leu Arg Tyr
210 215 220
Vai Asp Ser Ala Ser Glu Leu
225 230 <210> 91 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 91
atgaacaaac cggtggtggt ccggaaggtc gaacagccgc cacaagatgc ggtggcggct 60
ctggagaaat atggcgtgtc cacggtgcac gaagcgcaag gccgttgcgg gctgctcgcc 120
ccttacatgc gcccgatcta tgccggcgct tccatggccg ggcccgccgt caccgtctcc 180
cttccgcccg gtgacaacct catgatccat gtcgcggtcg aagtgtgcca gcccggaaac 240
attctggtcg tcgcccccac ttcaccttgt accgacgggt atttcggcga gttgctggct 300
acttccttgc gcgcccacgg cgtgaaggca ctcataatcg atgccggatg ccgtgacgtg 360
cgctccctca ccgaaatgaa gtttcccgtg tggagccgcg ccgtcagttc gcagggaaca 420
gtgaagtcca cgctcggatc agtgaacgtg ggcgtagtgt gtgcgggcgc tttcatcgaa 480
gcgggcgaca tcgtcgtcgc tgatgatgac ggagttgtcg tcgtgaagcg gactttcgcg 540
cgcgacgtgg ttgaagcctg tgaacagagg gttcgcaagg aagaggcgac gcgggcacgg 600
ctggcgcggg gcgaacttgg gctggacatc tacggattgc gctccaaggt ggcggaactc 660
ggtctcaagt acatataa 678
<210> 92 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 92
Met Asn Lys Pro Vai Vai Vai Arg Lys Vai Glu Gin Pro Pro Gin Asp
1 5 10 15
Ala Vai Ala Ala Leu Glu Lys Tyr Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Pro Tyr Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Ser Met Ala Gly Pro Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Petição 870170009999, de 15/02/2017, pág. 613/1247
604/788
Asp 65 Asn Leu Met Ile His Vai Ala Vai 70 Glu Vai 75 Cys Gin Pro Gly Asn 80
Ile Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Lys Ala Leu Ile
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys Ser Thr
130 135 140
Leu Gly Ser Vai Asn Vai Gly Vai Vai Cys Ala Gly Ala Phe Ile Glu
145 150 155 160
Ala Gly Asp Ile Vai Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Thr Phe Ala Arg Asp Vai Vai Glu Ala Cys Glu Gin Arg Vai Arg
180 185 190
Lys Glu Glu Ala Thr Arg Ala Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Ser Lys Vai Ala Glu Leu Gly Leu Lys Tyr
210 215 220
Ile
225
<210> 93
<211> 678
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 93
atgaataaac cggtggtagt ccggcaagtg gagcagccac cagcggacgc ggttgcggcg 60
ctggagaagt atggcgtcac caccgtgcat gaggctcagg gacgttgtgg cctgctcgcg 120
cactacatgc gtccgatttt tccgggagcg gccatctcgg gttctgctgt caccgtagcc 180
ttgccgccgg gcgataacct catgatccac gtcgcggtcg aggtctgcgg cccgggaaac 240
atcctggtgg ttgcgccgac ctcgccttcg acggatggct acttcggtga gctgttggcg 300
acctctctgc gtgctcgcgg tgtgaaagga cttgtgattg atgccggatg ccgtgacgtt 360
cgctccctga ccgagatgaa attccccgtc tggagccgtg ccatcagctc gcagggaaca 420
gtcaaggcca ccctcggatc ggtgaatgtg ccggtcatgt gcgcgggcgc gctcgtcgaa 480
gctggggatg tcatcgtcgc cgatgatgat ggaattgtgg ttgtcaagcg cgcgcatgcg 540
cacgaggtgg ccgcggcggc agaacaaagg gtgcgcaaag agaatataac ccgcgaacgg 600
cttcgacgcg gagagctcgg actcgatatt tacgacatgc gccaaaaaat cgcgcaactg 660
ggcctcaaat acctgtga 678
<210> 94 <211> 225 <212> PRT <213> desconhecido
Petição 870170009999, de 15/02/2017, pág. 614/1247
605/788 <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 94
Met 1 Asn Lys Pro Vai 5 Vai Vai Arg Gin Vai 10 Glu Gin Pro Pro Ala 15 Asp
Ala Vai Ala Ala Leu Glu Lys Tyr Gly Vai Thr Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala His Tyr Met Arg Pro Ile Phe Pro
35 40 45
Gly Ala Ala Ile Ser Gly Ser Ala Vai Thr Vai Ala Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gly Pro Gly Asn
65 70 75 80
Ile Leu Vai Vai Ala Pro Thr Ser Pro Ser Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Vai Lys Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Vai Met Cys Ala Gly Ala Leu Vai Glu
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Ile Vai Vai Vai Lys
165 170 175
Arg Ala His Ala His Glu Vai Ala Ala Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Asn Ile Thr Arg Glu Arg Leu Arg Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gin Lys Ile Ala Gin Leu Gly Leu Lys Tyr
210 215 220
Leu
225 <210> 95 <211> 639 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 95 gtgagcgatc cgatcgccga cctgcgcggg tatggagtct cgacggttca cgaggcccag
Petição 870170009999, de 15/02/2017, pág. 615/1247
606/788
ggccggcgcg gtctgctggc gccttacatg cgtccgatct atgccggcgc ccttgtcgcc 120
ggaccagccg tgacggttct ggtcccgccc ggcgacaacc tgatgatcca cgtcgccgtc 180
gagcggtgct cgccgggcga catcctcgtc gtcgcgccga cgtcgccgtg cacggacggc 240
tatttcggcg agctgctggc gacgtcgctg cgggcacgcg gtgtcgccgc actgatcatc 300
gacgccggct gcagggacgt gcgagcgctc accgagatgc gcttcccggt gtggagccgc 360
gccatcagcg cccaaggaac ggtgaaggcg acgctcggct cggtgaatgt gccagtggtc 420
tgcgccggag ccatcgtcgg tcctggcgac gtcatggttg cggacgatga cggcgtggtc 480
gtggtgagga aggacgaagt cgccgcggtg acgcaggcgg cggcgcagcg ggtccgcaaa 540
gaagagggca cgcgggcgcg gctggccgcg ggcgagctcg gcctggacat ctacggcctc 600
cggcagaagc tgtcggatct cggcctgaag tcgtcgtga 639
<210> 96 <211> 212 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (9)...(161) <223> Demetilmenaquinone metiltransferase <400> 96
Met Ser Asp Pro Ile Ala Asp Leu Arg Gly Tyr Gly Vai Ser Thr Vai
1 5 10 15
His Glu Ala Gin Gly Arg Arg Gly Leu Leu Ala Pro Tyr Met Arg Pro
20 25 30
Ile Tyr Ala Gly Ala Leu Vai Ala Gly Pro Ala Vai Thr Vai Leu Vai
35 40 45
Pro Pro Gly Asp Asn Leu Met Ile His Vai Ala Vai Glu Arg Cys Ser
50 55 60
Pro Gly Asp Ile Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly
65 70 75 80
Tyr Phe Gly Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Vai Ala
85 90 95
Ala Leu Ile Ile Asp Ala Gly Cys Arg Asp Vai Arg Ala Leu Thr Glu
100 105 110
Met Arg Phe Pro Vai Trp Ser Arg Ala Ile Ser Ala Gin Gly Thr Vai
115 120 125
Lys Ala Thr Leu Gly Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala
130 135 140
Ile Vai Gly Pro Gly Asp Vai Met Vai Ala Asp Asp Asp Gly Vai Vai
145 150 155 160
Vai Vai Arg Lys Asp Glu Vai Ala Ala Vai Thr Gin Ala Ala Ala Gin
165 170 175
Arg Vai Arg Lys Glu Glu Gly Thr Arg Ala Arg Leu Ala Ala Gly Glu
180 185 190
Petição 870170009999, de 15/02/2017, pág. 616/1247
607/788
Leu Gly Leu Asp Ile Tyr Gly Leu Arg Gin Lys Leu Ser Asp Leu Gly
Leu Lys Ser Ser 210 <210> 97 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 97 atgagcggcc ccacggtcgt tcgcgagatc gaccggccgg aaggcgacct cgtgaccgca 60 cttgagcacg cgggcgtgtc gacggtccac gaagcacagg gacggcgggg actgctcgcc 120 acctacatgc ggccgattta cgccggagcc gtgatcgccg gaccggcggt caccgtcctc 180 gtgccgcccg gcgacaacct gatgattcac gtggcggtcg aagtgtgccg cccgggtgac 240 gtgctggtcg tcgccgtcac gtcgccgtgt accgacggct acttcggtga gctgctggcg 300 acgtcggttc gcgcgcgcgg cgtcaaaggg ctcgtcatcg atgcagggtg ccgggacgtg 360 cgggcgctca ccgagatgcg gtttccggtg tggagccggg cggtcagtgc gcagggcacc 420 gtcaaggcca cgctcggctc cgtgaacgtt ccagtcgtgt gtgccggcgc gctcatcaca 480 ggtggagacg tcgtcatcgc cgacgacgat ggggtggtcg tggtgaagcg cgaggaagtg 540 gacgcggtcg ttcaggactc gcgccagcgg ctgctcaagg aagacgggac gcgagagcgt 600 ctcgcgacag gcgagctggg gctggacatc tactcgctgc gcaagatgct gtccgatctg 660 ggactgaagt accgatag 678 <210> 98 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 98
Met Ser Gly Pro Thr Vai Vai Arg Glu Ile Asp Arg Pro Glu Gly Asp
10 15
Leu Vai Thr Ala Leu Glu His Ala Gly Vai Ser Thr Vai His Glu Ala 20 25 30
Gin Gly Arg Arg Gly Leu Leu Ala Thr Tyr Met Arg Pro Ile Tyr Ala 35 40 45
Gly Ala Vai Ile Ala Gly Pro Ala Vai Thr Vai Leu Vai Pro Pro Gly 50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Arg Pro Gly Asp
70 75 80
Vai Leu Vai Vai Ala Vai Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
Petição 870170009999, de 15/02/2017, pág. 617/1247
608/788
85 90 95
Glu Leu Leu Ala Thr Ser Vai Arg Ala Arg Gly Vai Lys Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ala Leu Thr Glu Met Arg Phe
115 120 125
Pro Vai Trp Ser Arg Ala Vai Ser Ala Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Leu Ile Thr
145 150 155 160
Gly Gly Asp Vai Vai Ile Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Glu Glu Vai Asp Ala Vai Vai Gin Asp Ser Arg Gin Arg Leu Leu
180 185 190
Lys Glu Asp Gly Thr Arg Glu Arg Leu Ala Thr Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Ser Leu Arg Lys Met Leu Ser Asp Leu Gly Leu Lys Tyr
210 215 220
Arg
225
<210> 99
<211> 639
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 99
gtgagcgatc cgatcgccga cctgcgaggg tatggtgtct ccacggttca cgaggcgcag 60
ggccggcgcg gcctgctggc gccttacatg cgtccgatct atgccggcgc gctcgtcgcc 120
ggaccagccg tgacggtcct ggtcccgccc ggcgacaacc tgatgatcca cgtcgctgtc 180
gagcggtgct cgccaggcga catcctcgtc gtcgcgccga cgtcgccgtg cacggacggc 240
tatttcggcg agctgctggc gacgtcgctg cgggcacgcg gtgtcgccgc actgatcatc 300
gacgctggct gcagggacgt gcgagcgctc accgagatgc gcttcccggt gtggagccgc 360
gccatcagcg cccaaggaac ggtgaaagcg acgctcggct cggtgaatgt gccactggtc 420
tgcgccggag ccatcgtcgg tcctggcgac gtcatggttg cggacgatga cggcgtggtc 480
gtggtgagga aggacgaagt cgccgcggtg acgcaggcgg cggcgcagcg ggtccgcaaa 540
gaagaaggca cgcgggcgcg gctggccgcg ggcgagctcg gcctggacat ctacggcctc 600
cggcagaagc tgtcggatct cggcctgaag tcgtcgtga 639
<210> 100 <211> 212 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO
Petição 870170009999, de 15/02/2017, pág. 618/1247
609/788 <222> (9)...(161) <223> Demetilmenaquinone metiltransferase <400> 100
Met Ser Asp Pro Ile Ala Asp Leu Arg Gly Tyr Gly Vai Ser Thr Vai
1 5 10 15
His Glu Ala Gin Gly Arg Arg Gly Leu Leu Ala Pro Tyr Met Arg Pro
20 25 30
Ile Tyr Ala Gly Ala Leu Vai Ala Gly Pro Ala Vai Thr Vai Leu Vai
35 40 45
Pro Pro Gly Asp Asn Leu Met Ile His Vai Ala Vai Glu Arg Cys Ser
50 55 60
Pro Gly Asp Ile Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly
65 70 75 80
Tyr Phe Gly Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Vai Ala
85 90 95
Ala Leu Ile Ile Asp Ala Gly Cys Arg Asp Vai Arg Ala Leu Thr Glu
100 105 110
Met Arg Phe Pro Vai Trp Ser Arg Ala Ile Ser Ala Gin Gly Thr Vai
115 120 125
Lys Ala Thr Leu Gly Ser Vai Asn Vai Pro Leu Vai Cys Ala Gly Ala
130 135 140
Ile Vai Gly Pro Gly Asp Vai Met Vai Ala Asp Asp Asp Gly Vai Vai
145 150 155 160
Vai Vai Arg Lys Asp Glu Vai Ala Ala Vai Thr Gin Ala Ala Ala Gin
165 170 175
Arg Vai Arg Lys Glu Glu Gly Thr Arg Ala Arg Leu Ala Ala Gly Glu
180 185 190
Leu Gly Leu Asp Ile Tyr Gly Leu Arg Gin Lys Leu Ser Asp Leu Gly
195 200 205
Leu Lys Ser Ser 210 <210> 101 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 101 atgaacacac cggtggtagc aagacaagtg gagcagccac cagcggatgc aattgccgca 60 ttggagaagt gtggagtgac aaccgtccat gaggctcagg gacgttgtgg cctccttgcg 120 tcctacattc gcccgattta cccgggagca gccatcgcag gatccgctat cactgtgtct 180 ttgcctcctg gcgacaacct catgatccac gttgcggtgg aggtctgcgg tccgggaaac 240 atcctggtag tttcaccgac gtcgccttgt acggacggct acttcggtga gttgttggca 300 acatctctcc gtgcccacgg agtgattggg cttgtgatcg atgccggatg ccgtgatgtg 360 cgctctctga cagaaatgaa attcccggtc tggagccgcg ccatctgttc gcgagggaca 420
Petição 870170009999, de 15/02/2017, pág. 619/1247
610/788
gtcaaggcca cacttggatc ggtgaatgtg cccatcgtat gcgcgggtgc aatggtcgag 480
gctggtgatg gcatcgtcgc cgacgatgat ggcgttgtcg ttgtgaagcg agcgctggcg 540
caggagatcg ctgcggcggc ggaacaaagg gttcgcaaag agaatgtaac ccgcgaacga 600
ctcgcacgtg gagagctcgg acttgatatt tacgacatgc gccaaaagat ggcctcaaat atctctga <210> 102 <211> 225 <212> PRT <213> desconhecido <220> <223> Proteína obtida por amostra do ambiente <220> <221> DOMÍNIO <222> (28)...(174) <223> Demetilmenaquinone metiltransferase <400> 102 cgcgcaactg 660 678
Met Asn Thr Pro Vai Vai Ala Arg Gin Vai Glu 15 10 Gin Pro Prc i Ala Asp 15
Ala Ile Ala Ala Leu Glu Lys Cys Gly Vai Thr Thr Vai His Glu Ala 20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Ser Tyr Ile Arg Pro Ile Tyr Pro 35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Vai Ser Leu Pro Pro Gly
55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gly Pro Gly Asn
70 75 80
Ile Leu Vai Vai Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Ile Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Cys Ser Arg Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Ile Vai Cys Ala Gly Ala Met Vai Glu
145 150 155 160
Ala Gly Asp Gly Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Leu Ala Gin Glu Ile Ala Ala Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Asn Vai Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gin Lys Ile Ala Gin Leu Gly Leu Lys Tyr
210 215 220
Leu
Petição 870170009999, de 15/02/2017, pág. 620/1247
611/788
225 <210> 103 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 103
atgaatcgac cggtggtagt ccggcaagtg gagcaggcac cagcggatgc ggtcgccgca 60
ctggagaagt gcggagtgac caccgtgcat gaggctcagg gacggggtgg cctgcttgcc 120
tcctacatgc gcccgattta cccgggagca gccatcgccg gttccgcgat caccgtgtct 180
ttgccccctg gcgataacct catgatccac gtcgcagtgg aggtctgcgg tccgggaaac 240
attctggtgg tttcaccgat ctcgccttgt acggatggtt acttcggcga gctgttggca 300
acatccctcc gtgcccgcgg tgggagaggg cttgtgatcg atgccggatg ccgggacgtg 360
cgctctttaa cagaaatgaa atttccagtc tggagccgcg ccgtcagttc gcaggggaca 420
gtcaaggcca cactgggatc ggtgaatgtg cccgtcgtgt gtgcgggcgc actggtcgag 480
gcgggtgatg tcatcgtcgc cgatgacgat ggagttgtgg tggtgaagcg cgcgctggcc 540
caggaggtcg ccgccgcagc ggaacaaagg gttcgcaaag agaacctgac ccgcgaacga 600
cttgcgcgtg gagaactcgg actcgatatt tacgacatgc gccaaaagat cgcgcaaatg 660
ggccttaaat atctctaa 678
<210> 104 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 104
Met Asn Arg Pro Vai Vai Vai Arg Gin Vai Glu Gin Ala Pro Ala 15 Asp
1 5 10
Ala Vai Ala Ala Leu Glu Lys Cys Gly Vai Thr Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Gly Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gly Pro Gly Asn
65 70 75 80
Ile Leu Vai Vai Ser Pro Ile Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Gly Arg Gly Leu Vai
100 105 110
Petição 870170009999, de 15/02/2017, pág. 621/1247
612/788
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Leu Vai Glu
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Leu Ala Gin Glu Vai Ala Ala Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Asn Leu Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gin Lys Ile Ala Gin Met Gly Leu Lys Tyr
210 215 220
Leu
225 <210> 105 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 105
atgaatacac cggtggtagt ccggcaagtg gagcagccac ctgcggaggc ggttgccgca 60
ctggaaaagc gtggggtgac aaccgtgcat gaggctcagg gacgttgtgg cctccttgcc 120
tcctacatgc gcccgattta cacgggagca gcgatcgcag gatccgctat cacagtgtcc 180
ttgccgcccg gcgacaacct catgatccac gttgccgtgg aggtatgtgg ttcaggaaac 240
atcctggtag tttcaccaac ctcgccttgt gcggatggct acttcggtga gctgttggca 300
acatctctcc gtgcccatgg tgtcagaggg ctggtgatcg atgcgggatg ccgtgatgtg 360
cgctccctaa cagagatgaa atttccggtc tggagccgcg ccgtcagctc acaggggaca 420
gtcaaggcca cacttggatc ggtgaacgtg cccatcgttt gcgcgggtgc actggtcgac 480
gctggtgatg tcatcgtcgc agatgacgat ggcgttgtgg tggtgaagcg cgcgatggcg 540
caagaggtcg ccgcggcggc ggaacaaagg gttcgcaaag agaatctgac ccgcgaacga 600
cttgcgcgtg gtgaacttgg tctcgatatt tacgacatgc gccaaaagat cgcgcaactg 660
ggacttaagt atctgtaa 678
<210> 106 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase
Petição 870170009999, de 15/02/2017, pág. 622/1247
613/788
<400> 106
Met Asn Thr Pro Vai Vai Vai Arg Gin Vai Glu Gin Pro Pro Ala Glu
1 5 10 15
Ala Vai Ala Ala Leu Glu Lys Arg Gly Vai Thr Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Thr
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gly Ser Gly Asn
65 70 75 80
Ile Leu Vai Vai Ser Pro Thr Ser Pro Cys Ala Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Arg Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Ile Vai Cys Ala Gly Ala Leu Vai Asp
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Met Ala Gin Glu Vai Ala Ala Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Asn Leu Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gin Lys Ile Ala Gin Leu Gly Leu Lys Tyr
210 215 220
Leu
225 <210> 107 <211> 636 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 107 gtgagcgatc cgatcgccgc cctgcgcgga tatggcgttt cgacggtgca cgaggcgcag 60 gggcggcgcg gcctgctggc gccttacatg cgcccgatct atgccggtgc gctcctcgcc 120 gggcccgcgg tgacggtcct ggttcctcct ggcgacaacc tgatgatcca cgtggcggtc 180 gagaaatgct cgcctggaga cgtcctcgtc gtcgccccgg cgtctccgtg cacggacggc 240 tacttcggag aattgcttgc gacgtcgttg cgggcccgcg gcgttgccgg cttgatcatc 300 gatgccggct gccgggatgt gcgcgcgctc acggagatgc ggtttccggt gtggagccgc 360 ttcgtctgcg ctcagggcac ggtgaaggcc acgctcggct cgctgaatgt gccgctggtc 420
Petição 870170009999, de 15/02/2017, pág. 623/1247
614/788
tgcgccggcg ccctcatcgc tcccgctgat gtcatcgttg cagacgatga cggggtggtg 480
gtggtgaaga gggacgagat cgccatggtg acgcaggcgg cggagcagcg ggttcgcaaa 540
gaggaaggca cgcgcgcgcg gctcgccgcg ggcgagctcg gcctggacat ctacggcttg 600
cggcagaagc tgtcggacct cggcctcaag tcgtga 636
<210> 108
<211> 211
<212> PRT
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente
<220>
<221> DOMÍNIO
<222> (9) . . . (161)
<223> Demetilmenaquinone metiltransferase
<400> 108
Met Ser Asp Pro Ile Ala Ala Leu Arg Gly Tyr Gly Vai Ser Thr Vai
1 5 10 15
His Glu Ala Gin Gly Arg Arg Gly Leu Leu Ala Pro Tyr Met Arg Pro 20 25 30
Ile Tyr Ala Gly Ala Leu Leu Ala Gly Pro Ala Vai Thr Vai Leu Vai 35 40 45
Pro Pro Gly Asp Asn Leu Met Ile His Vai Ala Vai Glu Lys Cys Ser
55 60
Pro Gly Asp Vai Leu Vai Vai Ala Pro Ala Ser Pro Cys Thr Asp Gly
70 75 80
Tyr Phe Gly Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Vai Ala
90 95
Gly Leu Ile Ile Asp Ala Gly Cys Arg Asp Vai Arg Ala Leu Thr Glu
100 105 110
Met Arg Phe Pro Vai Trp Ser Arg Phe Vai Cys Ala Gin Gly Thr Vai
115 120 125
Lys Ala Thr Leu Gly Ser Leu Asn Vai Pro Leu Vai Cys Ala Gly Ala
130 135 140
Leu Ile Ala Pro Ala Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai
145 150 155 160
Vai Vai Lys Arg Asp Glu Ile Ala Met Vai Thr Gin Ala Ala Glu Gin
165 170 175
Arg Vai Arg Lys Glu Glu Gly Thr Arg Ala Arg Leu Ala Ala Gly Glu
180 185 190
Leu Gly Leu Asp Ile Tyr Gly Leu Arg Gin Lys Leu Ser Asp Leu Gly
195 200 205
Leu Lys Ser
210 <210> 109 <211> 678
Petição 870170009999, de 15/02/2017, pág. 624/1247
615/788 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 109
atgaatacac cggtggtagt aagacaagtg gagcagccac cagcggatgc aattgccgca 60
ttaaagaagt gtggagtgac aaccgtccat gaggctcagg gacgtggtgg cctccttgcg 120
tcctacatgc gcccgattta cccgggagca gccatcgcag gatccgctat cactgtgtct 180
ttgcctcctg gcgacaacct catgatccac gttgcggtgg aggtctgcgg tccgggaaac 240
atcctggtag tttcaccgac gtcgccttgt acggacggct acttcggtga gttgttggca 300
acatctctcc gtgcccacgg agtgattggg cttgtgatcg atgccggatg ccgtgatgtg 360
cgctccctga cagaaatgaa gttcccggtc tggagccgcg ccatctgttc gcaagggaca 420
gtcaaggcca cacttggatc ggtgaatgtg cccatcgtat gcgcgggtgc attggtcgag 480
gctggtgatg tcatcgtcgc cgacgatgat ggcgttgtcg ttgtgaagcg agcgctggcg 540
caagagatcg ccgcggcggc ggaacaaagg gttcgcaaag agaatgtaac ccgcgaacga 600
ctcgcacgtg gagagctcgg acttgatatt tacgacatgc gccaaaagat cgcgcaactg 660
ggcctgaaat atctctga 678
<210> 110 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 110
Met Asn Thr Pro Vai Vai Vai Arg Gin Vai Glu Gin Pro Pro Ala Asp
1 5 10 15
Ala Ile Ala Ala Leu Lys Lys Cys Gly Vai Thr Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Gly Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gly Pro Gly Asn
65 70 75 80
Ile Leu Vai Vai Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Ile Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Cys Ser Gin Gly Thr Vai Lys Ala Thr
Petição 870170009999, de 15/02/2017, pág. 625/1247
616/788
130 135 140
Leu Gly Ser Vai Asn Vai Pro Ile Vai Cys Ala Gly Ala Leu Vai Glu
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Leu Ala Gin Glu Ile Ala Ala Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Asn Vai Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gin Lys Ile Ala Gin Leu Gly Leu Lys Tyr
210 215 220
Leu
225
<210> 111
<211> 678
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 111
atgaaagagg cggtggtggt caggaatatt gagcgcccgc cggccgatgt gatcgcggcg 60
ctggaaaagt ttggtgtttc aacggtacac gaagcgcaag gccgccgcgg acttctggcc 120
gcttatatga ggccgattta tgggggcgcg gccattgccg ggcctgcggt gactgtctcg 180
ttggctccgg gtgacaatct aatgattcac gtggccgtgg aagtttgccg gtcaggtgac 240
attctcgtgg tcgctccgac gtcgccgtgc acggatgggt attttggcga gttgctggcg 300
acttccttgc gcgcgcacgg ggtaaaagga ctcgtgatcg aggcaggatg ccgcgatgtc 360
cgggcgctta cggagatgaa atttcccgtg tggagccgcg cggtgagttc gcagggaacg 420
gtgaaggcta gtttgggctc ggtgaacgtg ggaattgtgt gcgctgccgc ggcgatcgaa 480
gccggcgacg cgatcgttgc cgatgatgac ggcgttgtgg tggtgaaacg cggcgacgcc 540
gccagtgttg tcgccgcgtc gcagcaacgc gtccgcaagg aagaggctgc gcgaggacgc 600
ctggcgcgcg gcgaactggg cctggacatt tacggcctgc gcgccaaggt cgcggagctt 660
ggcttgaaat atttgtga 678
<210> 112 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 112
Met Lys Glu Ala Vai Vai Vai Arg Asn Ile Glu Arg Pro Pro Ala Asp 15 10 15
Petição 870170009999, de 15/02/2017, pág. 626/1247
617/788
Vai Ile Ala Ala Leu 20 Glu Lys Phe Gly Vai 25 Ser Thr Vai His 30 Glu Ala
Gin Gly Arg Arg Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Tyr Gly
35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala Vai Thr Vai Ser Leu Ala Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Arg Ser Gly Asp
65 70 75 80
Ile Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Lys Gly Leu Vai
100 105 110
Ile Glu Ala Gly Cys Arg Asp Vai Arg Ala Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys Ala Ser
130 135 140
Leu Gly Ser Vai Asn Vai Gly Ile Vai Cys Ala Ala Ala Ala Ile Glu
145 150 155 160
Ala Gly Asp Ala Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Gly Asp Ala Ala Ser Vai Vai Ala Ala Ser Gin Gin Arg Vai Arg
180 185 190
Lys Glu Glu Ala Ala Arg Gly Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Ala Lys Vai Ala Glu Leu Gly Leu Lys Tyr
210 215 220
Leu
225 <210> 113 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 113
atgaaagggg cggtggtggt caggaatatc gagcgcccgc cggccgaggt ggtcgcggcg 60
ctggaaaagt ttggtgtttc gacggtgcac gaagcgcaag gacgccgcgg acttctggcc 120
gcttatatga ggccgattta tgggggcgcg gccattgccg ggcctgcggt gactgtctcg 180
ttggctccgg gcgacaattt aatgattcac gtggcggtgg aagtttgccg gtcaggcgac 240
attctcgtgg tcgctccgac gtcgccgtgc acggatgggt attttggcga gttgctggcg 300
acttccttgc gcgcgcacgg ggtaaaagga ctggtgatcg aggcaggatg ccgcgatgtc 360
cgggcgctta cggagatgaa atttcccgtg tggagccgcg cggtgagttc gcagggaacg 420
gtgaaggcta ctttgggctc ggtgaacgtg gaaattgtgt gcgctgccgc ggcgatcgaa 480
gccggtgacg tgatcgttgc cgatgatgac ggcgttgtgg tggtgaaacg gggcgacgcc 540
gccgctgtgg tcgccgcgtc gcagcaacgc gtccgcaaag aagaagctac gcgagaacgc 600
Petição 870170009999, de 15/02/2017, pág. 627/1247
618/788 ctggcgcgcg gcgaactggg cctggacatt tacggcctgc gcgccaaggt cgcggagctt ggcttgaaat atttgtga <210> 114 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 114
660
678
Met Lys Gly Ala Vai Vai Vai Arg
5
Vai Vai Ala Ala Leu Glu Lys Phe
Gin Gly Arg Arg Gly Leu Leu Ala 35 40
Gly Ala Ala Ile Ala Gly Pro Ala 50 55
Asp Asn Leu Met Ile His Vai Ala 65 70
Ile Leu Vai Vai Ala Pro Thr Ser
Glu Leu Leu Ala Thr Ser Leu Arg 100
Ile Glu Ala Gly Cys Arg Asp Vai 115 120
Pro Vai Trp Ser Arg Ala Vai Ser 130 135
Leu Gly Ser Vai Asn Vai Glu Ile
145 150
Ala Gly Asp Vai Ile Vai Ala Asp
165
Arg Gly Asp Ala Ala Ala Vai Vai 180
Lys Glu Glu Ala Thr Arg Glu Arg 195 200
Asp Ile Tyr Gly Leu Arg Ala Lys 210 215
Leu
225 <210> 115 <211> 672
Asn Ile Glu Arg Pro Pro Ala Glu 10 15
Gly Vai Ser Thr Vai His Glu Ala
30
Ala Tyr Met Arg Pro Ile Tyr Gly
Vai Thr Vai Ser Leu Ala Pro Gly 60
Vai Glu Vai Cys Arg Ser Gly Asp 75 80
Pro Cys Thr Asp Gly Tyr Phe Gly 90 95
Ala His Gly Vai Lys Gly Leu Vai
105 110
Arg Ala Leu Thr Glu Met Lys Phe
125
Ser Gin Gly Thr Vai Lys Ala Thr 140
Vai Cys Ala Ala Ala Ala Ile Glu 155 160
Asp Asp Gly Vai Vai Vai Vai Lys 170 175
Ala Ala Ser Gin Gin Arg Vai Arg
185 190
Leu Ala Arg Gly Glu Leu Gly Leu
205
Vai Ala Glu Leu Gly Leu Lys Tyr 220
Petição 870170009999, de 15/02/2017, pág. 628/1247
619/788 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 115
atgtcggttg tcgttcagaa catcgagcgt gctgatcagt cggtcatcga ccggctggcc 60
gcctgcggcg ttgccacggt gcatgaagcg cagggccgca agggcctgct cgccagctat 120
atgcggccga tctttccggg tgcacgcctc gcggcgagtg ccgtcactat ctccgcacct 180
ccgggcgaca actggatgct gcatgtggcg atcgaacagt tgaaggccgg cgacattctg 240
ctgctcgccc cgaccagccc ctgcgaggac ggctatttcg gtgatctcct cgccacgtct 300
gcgcaggcgc gcggttgcga gggattgatc atcgatgcgg gtgttcggga tgtggctgat 360
ctgacggaga tgaaatttcc tgtctggtcg aaggcgatct tcgcccaggg cacagtcaag 420
gagaccctcg gttctgtgaa cgtaccggtc gtatgcgctg gcgcctatgt tcgcccgggt 480
gatgtgatcg ttgccgatga tgatggcgtt tgtgttgtgc tgcgcgagga agctgaagtg 540
gtcgcaaaga aggcggaagc ccgtgttgcg gccgaagatg gtaaacgcaa gcggctcgcg 600
gccggcgaac tcggcctcga tatctacgac atgcgcggcc ggctggctga aaagggcctg 660
aagtatatct ga 672
<210> 116 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 116
Met Ser Vai Vai Vai Gin Asn Ile Glu Arg Ala Asp Gin Ser Vai Ile
1 5 10 15
Asp Arg Leu Ala Ala Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Phe Pro Gly Ala
35 40 45
Arg Leu Ala Ala Ser Ala Vai Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Trp Met Leu His Vai Ala Ile Glu Gin Leu Lys Ala Gly Asp Ile Leu
65 70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Gin Ala Arg Gly Cys Glu Gly Leu Ile Ile Asp
100 105 110
Ala Gly Vai Arg Asp Vai Ala Asp Leu Thr Glu Met Lys Phe Pro Vai
115 120 125
Trp Ser Lys Ala Ile Phe Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
Petição 870170009999, de 15/02/2017, pág. 629/1247
620/788
130 135 140
Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Tyr Vai Arg Pro Gly
145 150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Leu Arg Glu
165 170 175
Glu Ala Glu Vai Vai Ala Lys Lys Ala Glu Ala Arg Vai Ala Ala Glu
180 185 190
Asp Gly Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Asp Met Arg Gly Arg Leu Ala Glu Lys Gly Leu Lys Tyr Ile
210 215 220 <210> 117 <211> 672 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 117
atgggtgtcg tcgtccagaa cattgaccgc gccgagcaag ccgtcatcga ccggctcgcc 60
gcctgcggcg tcgcgaccgt gcatgaggcg caggggcgca aggggctgct ggcgagctat 120
atgcggccga tctatcccgg cgcgcggatc gcggcgagtg cggtgacgat ctcggcgccg 180
cctggtgaca actggatggt gcatgtggcg atcgagcagg tgaaggatgg cgacatcctg 240
ctgctggcac cgaccagccc ctgcgaggac ggctatttcg gcgatctttt ggcgacctcg 300
gccttggcgc ggggctgccg cgggctggtc atcgatgccg gcgtgcgcga cgtcgctgac 360
cttgcggcga tgaagtttcc ggtctggtcg aaagcgatct tcgcccaggg cacggtcaag 420
gaaacgctgg gttcggtgaa tgtgccggtc gtctgcgccg gcgcgctggt caaccccggc 480
gacgtgatcg tcgccgacga tgacggcgtt tgtgtcgttc gccgcgaaga ggcggcggag 540
gttgcagaca aggctgaggc ccacgtcgcg gcagaggagg gcaagcgcaa gcggctggcg 600
gccggcgagc ttggtctcga catctacgac atgcgcaagc ggctcgccga gaaagggctg 660
aaatatgtct ga 672
<210> 118 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 118
Met Gly Vai Vai Vai Gin Asn Ile Asp Arg Ala Glu Gin Ala Vai Ile 15 10 15
Asp Arg Leu Ala Ala Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
25 30
Petição 870170009999, de 15/02/2017, pág. 630/1247
621/788
Arg Lys Gly Leu Leu 35 Ala Ser Tyr Met 40 Arg Pro Ile Tyr 45 Pro Gly Ala
Arg Ile Ala Ala Ser Ala Vai Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Trp Met Vai His Vai Ala Ile Glu Gin Vai Lys Asp Gly Asp Ile Leu
65 70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Leu Ala Arg Gly Cys Arg Gly Leu Vai Ile Asp
100 105 110
Ala Gly Vai Arg Asp Vai Ala Asp Leu Ala Ala Met Lys Phe Pro Vai
115 120 125
Trp Ser Lys Ala Ile Phe Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Leu Vai Asn Pro Gly
145 150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Arg Arg Glu
165 170 175
Glu Ala Ala Glu Vai Ala Asp Lys Ala Glu Ala His Vai Ala Ala Glu
180 185 190
Glu Gly Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Asp Met Arg Lys Arg Leu Ala Glu Lys Gly Leu Lys Tyr Vai
210 215 220
<210> 119 <211> 672 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 119
atgggtattg ttgttcagaa catcaagcgg gcggaccccg ggatcatagc aggtcttggc 60
aaatgcggcg ttgccactgt gcatgaagcg caggggtgca aggggctcct ggcggcctat 120
atgcggccca tttattctgg cgcgcgcctt gccgcctccg ctgtcaccat ttccgcgccg 180
ccgggagaca actggatggt gcatgtcgcc attgagcagg tgaggcaagg tgatattctg 240
gttcttgccc caacatcgcc ctgtgaagac ggctatttcg gtgatttgct cgccacctcc 300
atgctgcagc gcggcggcag ggggctgatt attgacgccg gtgtccgcga tatccgtgat 360
ctgactcaaa tgaaatttcc ggtgtggtcg aaaaccgttt ttgcgcaggg caccgttaag 420
gaaacccttg gctctgtgaa cgtcccgata gtttgcgccg gtgaagtggt caatcctggc 480
gacatcatga ttgccgatga tgatggtgtg tgcgtggtcc ggcgcgacga cgctgaaagc 540
gtgcttgaaa aagcattggc gcgtgaggca aaggaagaag atacacgcaa acgccttgcg 600
gcaggcgagc tgggtcttga tatttacggc atgcgcgcac gtctggccga aaagggccta 660
aaatatgtct ga 672
<210> 120 <211> 223
Petição 870170009999, de 15/02/2017, pág. 631/1247
622/788 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 120
Met Gly Ile Vai Vai Gin Asn Ile Lys Arg Ala Asp Pro Gly Ile Ile
1 5 10 15
Ala Gly Leu Gly Lys Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Cys Lys Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Tyr Ser Gly Ala
35 40 45
Arg Leu Ala Ala Ser Ala Vai Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Trp Met Vai His Vai Ala Ile Glu Gin Vai Arg Gin Gly Asp Ile Leu
65 70 75 80
Vai Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Met Leu Gin Arg Gly Gly Arg Gly Leu Ile Ile Asp
100 105 110
Ala Gly Vai Arg Asp Ile Arg Asp Leu Thr Gin Met Lys Phe Pro Vai
115 120 125
Trp Ser Lys Thr Vai Phe Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Vai Pro Ile Vai Cys Ala Gly Glu Vai Vai Asn Pro Gly
145 150 155 160
Asp Ile Met Ile Ala Asp Asp Asp Gly Vai Cys Vai Vai Arg Arg Asp
165 170 175
Asp Ala Glu Ser Vai Leu Glu Lys Ala Leu Ala Arg Glu Ala Lys Glu
180 185 190
Glu Asp Thr Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Ala Arg Leu Ala Glu Lys Gly Leu Lys Tyr Vai
210 215 220 <210> 121 <211> 696 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 121 atgaagcgcg gtgtcgtcgt cacccatatc gagcgcgcca acccgcgtga cgtggccgtg
Petição 870170009999, de 15/02/2017, pág. 632/1247
623/788
cttcagcagg cgggcgctgc gaccgttcat gaagcgcaga gccgtctggg cctgctcgcg 120
tcgtacatgc ggcccatcta tgcgggcgcg tcaatcgcgg gatcggcggt gacggtgctc 180
gtgccgccgt cggacaactg gatgttgcac gttgccgccg aacagtgccg cgaaggcgac 240
gtgctcgtgg tcgcgccgac ttcgccgtgc gaagacggct acttcggcga actgctcgcg 300
acgtcgcttg ccgcgcgcgg tgtgcgcggg ctcatcatcg atgcgggctg tcgcgatgtg 360
cgcgcgctca aggacatgaa cttcccggtc tggtcgaaag cggtctctgc gcaaggcacg 420
gtgaaggaga cgctgggctc ggtcaatgtg cctgttgtgt gcgcacagca gatcgtgcat 480
gcgggcgacg tgatcgtcgc cgacgatgac ggcgtcgtgg tcgtgccgtt cgccacggtg 540
tcgcgcgtgg ccgaagcagc gcaggcgcgt ctcgcgaagg aagagaagac gcgttccgtg 600
ctcgcgacgg gcgtgctggg cctcgactac tacagcatgc gtgacaagct cgcggaaaag 660
ggcctgcgtt acgtcgggtc gatcgaggaa gcgtga 696
<210> 122 <211> 231 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 122
Met Lys Arg Gly Vai Vai Vai Thr His Ile Glu Arg Ala Asn Pro Arg
1 5 10 15
Asp Vai Ala Vai Leu Gin Gin Ala Gly Ala Ala Thr Vai His Glu Ala
20 25 30
Gin Ser Arg Leu Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Ser Ile Ala Gly Ser Ala Vai Thr Vai Leu Vai Pro Pro Ser
50 55 60
Asp Asn Trp Met Leu His Vai Ala Ala Glu Gin Cys Arg Glu Gly Asp
65 70 75 80
Vai Leu Vai Vai Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Ala Ala Arg Gly Vai Arg Gly Leu Ile
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ala Leu Lys Asp Met Asn Phe
115 120 125
Pro Vai Trp Ser Lys Ala Vai Ser Ala Gin Gly Thr Vai Lys Glu Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Vai Vai Cys Ala Gin Gin Ile Vai His
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Pro
165 170 175
Phe Ala Thr Vai Ser Arg Vai Ala Glu Ala Ala Gin Ala Arg Leu Ala
Petição 870170009999, de 15/02/2017, pág. 633/1247
624/788
180 185 190
Lys Glu Glu Lys 195 Thr Arg Ser Vai Leu Ala Thr Gly Vai Leu Gly Leu
200 205
Asp Tyr Tyr Ser Met Arg Asp Lys Leu Ala Glu Lys Gly Leu Arg Tyr
210 215 220
Vai Gly Ser Ile Glu Glu Ala
225 230 <210> 123 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 123
atgaacaaac ccgtggtagt gcggcaactg gagcagccac ccgccgatgc ggttgcggcc 60
ctggagaagt atggcgtgac taccgtccac gaggctcagg gacgttgtgg cctgctggct 120
ccttatatgc gaccgatttt tgcgggagcc tgcatcgccg gttccgccgt caccgtgtct 180
ttgccgcccg gcgataactt catgatccac gttgccgtcg aggtctgcag tccgggcagc 240
attctcgtag tcgcccccac ctcaccttgc acggacggtt atttcggcga actcttggca 300
acttccctcc gcgctcacgg tgtcaaagga ctggtcattg atgccggctg ccgggatgtt 360
cgctcgttaa cggaaatgaa attccccgtt tggagccgtg cggtgagttc gcaaggaacg 420
gtgaaggcta cgctcggatc tgtgaatgtg ccggtcattt gcgcgggcgc cgaggtggaa 480
gccggtgacg tcatcatcgc cgatgacgat ggtgtggtag tggtgaagcg tgcgactgcc 540
cacgaggtag cagcggcggc ggaacaacga gttcgcaagg agaatgccac tcgcgaacga 600
ctggcacgag gagaactcgg cctcgacatc tacgacatgc ggcaaaaaat cgcgcaactt 660
ggtctcaaat atctgtga 678
<210> 124 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 124
Met Asn Lys 1 Pro Vai 5 Vai Vai Arg Gin Leu Glu Gin 10 Pro Pro Ala 15 Asp
Ala Vai Ala Ala Leu Glu Lys Tyr Gly Vai Thr Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Pro Tyr Met Arg Pro Ile Phe Ala
35 40 45
Gly Ala Cys Ile Ala Gly Ser Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Petição 870170009999, de 15/02/2017, pág. 634/1247
625/788
Asp Asn 65 Phe Met Ile His 70 Vai Ala Vai Glu Vai 75 Cys Ser Pro Gly Ser 80
Ile Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Lys Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Vai Ile Cys Ala Gly Ala Glu Vai Glu
145 150 155 160
Ala Gly Asp Vai Ile Ile Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Thr Ala His Glu Vai Ala Ala Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gin Lys Ile Ala Gin Leu Gly Leu Lys Tyr
210 215 220
Leu
225 <210> 125 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 125
atgaacgatc ccgtcgtcgt ccgagagatc gagaggccgt cggcgacgtc gatcgacgat 60
ctgcggcgtt tcggcgtctc gacggtgcac gaagcgcagg ggcgccgcgg gctgctcgca 120
tcgtacatgc ggccgatcta tgccggcgcg ctggtcgccg ggcctgcgat taccgtcctg 180
gtgacgccgg gcgacaacct gatgatccat gtcgcggtcg agatctgcca gccaggcgat 240
gtcctcgtcg tcgccccgac gtcgccgtgc accgacggat acttcggcga gctgctggcg 300
acgtcgttgc gagcgcatgg cgtcgcgggt ctgatcatcg atgccggctg ccgggatgtt 360
cgctcgttga gcgagatgcg atttcccgtg tggagccgcg cgatcagcgc ccaggggacc 420
gtcaaggcga cgctgggttc ggtgaacgtg ccgctggtgt gcgccggagc gctggtcgag 480
ccgggcgatg cgatcgtcgc cgacgacgac ggtgtcgtcg tcgtcaggcg ggaacaggtc 540
gacactgtgt gccaggcggc gggacagcgc gtgcgcaagg aagaggacac gcgcgcgcgg 600
ctggcgcaag gcgagcttgg cctcgacatc tacggcttgc gcaaaaagct gtcggacctc 660
gggttgaagt cgtcgtga 678
<210> 126 <211> 225 <212> PRT <213> desconhecido
Petição 870170009999, de 15/02/2017, pág. 635/1247
626/788 <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 126
Met 1 Asn Asp Pro Vai 5 Vai Vai Arg Glu Ile 10 Glu Arg Pro Ser Ala 15 Thr
Ser Ile Asp Asp Leu Arg Arg Phe Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Leu Vai Ala Gly Pro Ala Ile Thr Vai Leu Vai Thr Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Ile Cys Gin Pro Gly Asp
65 70 75 80
Vai Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Ala Gly Leu Ile
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Ser Glu Met Arg Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Ser Ala Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Leu Vai Cys Ala Gly Ala Leu Vai Glu
145 150 155 160
Pro Gly Asp Ala Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Arg
165 170 175
Arg Glu Gin Vai Asp Thr Vai Cys Gin Ala Ala Gly Gin Arg Vai Arg
180 185 190
Lys Glu Glu Asp Thr Arg Ala Arg Leu Ala Gin Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Lys Lys Leu Ser Asp Leu Gly Leu Lys Ser
210 215 220
Ser
225 <210> 127 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 127 atgaacgatc cggtcgtcgt tcgcgagatc gacaggccgg cgggtaccgc catcgacgat
Petição 870170009999, de 15/02/2017, pág. 636/1247
627/788
ctccggcgct tcggcgtgtc gaccgtccac gaagcgcagg ggcgttgcgg cttgctcgct 120
tcgtacatac ggccgattta ttcaggcgcc ctgctcgccg gcccggcgat caccgtccag 180
gttacgcctg gcgacaacct gatgatccac gtcgctgtcg aagtgtgccg gccaggagac 240
gtgctcgtcg tcgccccgac gtcgccgtgc acggatggct atttcggcga gctgctcgcg 300
acatcgctgc gtgcccacgg cgtcgtcggg ctgatcatcg acgccggttg ccgggacgtt 360
cgcgccttga gcgagatgcg atttcctgtg tggagtcgcg cgatcagcgc gcagggcacc 420
gtcaaagcca cgctgggctc ggtgaacgtg ccgctgttgt gtgccgggat gctggtcgag 480
gccggcgacg cgatcgtggc cgacgacgac ggagtggtgg tggtcaggcg gagccaggtc 540
gatgctgtcc gcgaggcggc cgaacgacgc gtgcgcaagg aagaggacac gcgggcccgg 600
ctcgcccgag gcgagcttgg cctcgacatc tacggcctgc gcaggaaact gtcagacccc 660
ggtttgaagt cgtcgtga 678
<210> 128 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 128
Met Asn Asp Pro Vai Vai Vai Arg Glu Ile Asp Arg Pro Ala Gly Thr
1 5 10 15
Ala Ile Asp Asp Leu Arg Arg Phe Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Ser Tyr Ile Arg Pro Ile Tyr Ser
35 40 45
Gly Ala Leu Leu Ala Gly Pro Ala Ile Thr Vai Gin Vai Thr Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Arg Pro Gly Asp
65 70 75 80
Vai Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Vai Gly Leu Ile
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ala Leu Ser Glu Met Arg Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Ser Ala Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Leu Leu Cys Ala Gly Met Leu Vai Glu
145 150 155 160
Ala Gly Asp Ala Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Arg
165 170 175
Arg Ser Gin Vai Asp Ala Vai Arg Glu Ala Ala Glu Arg Arg Vai Arg
Petição 870170009999, de 15/02/2017, pág. 637/1247
628/788
180 185 190
Lys Glu Glu Asp Thr Arg Ala Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Arg Lys Leu Ser Asp Pro Gly Leu Lys Ser
210 215 220
Ser
225 <210> 129 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 129
atgaacaaac cggtggtggt ccggaaggtc gaacagccgc cacaagatgc ggtggcggct 60
ctggagaaat atggcgtctc cacggtgcac gaagcgcaag gccgttgcgg gctgctcgcc 120
gcttacatgc gcccgatcta tgccggagct tccatggccg gacccgccgt gaccgtttcc 180
cttccgcccg gtgacaacct catgatccac gtcgcggtcg aagtgtgcca ccccggaaac 240
attctggtcg tcgcccccac ttcaccttgt accgacgggt atttcggcga gttgctggct 300
acttccttgc gcgcccacgg cgtgaaggca ctcataatcg atgccggatg ccgtgacgtg 360
cgctccctca ccgaaatgaa gtttcccgtg tggagccgcg ccgtcagttc gcagggaaca 420
gtgaagtcca cgctcggatc agtgaacgtg ggcgtagtgt gtgcgggcgc tttcatcgaa 480
gcgggcgaca tcgtcgtcgc tgatgatgac ggagtcgtcg tcgtgaagag ggctttcgcg 540
cgcgacgtgg ttgaagcctg tgaacagagg gtccgcaagg aagaagcgac gcgggcacgc 600
ctggcgcagg gcgagcttgg tctggacatc tacggattgc gcgccaaagt ggcggagctc 660
ggtctcaagt acatataa 678
<210> 130 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 130
Met Asn Lys Pro Vai Vai Vai Arg Lys Vai Glu Gin Pro Pro Gin Asp
1 5 10 15
Ala Vai Ala Ala Leu Glu Lys Tyr Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Ser Met Ala Gly Pro Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Petição 870170009999, de 15/02/2017, pág. 638/1247
629/788
Asp Asn 65 Leu Met Ile His Vai Ala Vai 70 Glu Vai 75 Cys His Pro Gly Asn 80
Ile Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Lys Ala Leu Ile
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys Ser Thr
130 135 140
Leu Gly Ser Vai Asn Vai Gly Vai Vai Cys Ala Gly Ala Phe Ile Glu
145 150 155 160
Ala Gly Asp Ile Vai Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Phe Ala Arg Asp Vai Vai Glu Ala Cys Glu Gin Arg Vai Arg
180 185 190
Lys Glu Glu Ala Thr Arg Ala Arg Leu Ala Gin Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Ala Lys Vai Ala Glu Leu Gly Leu Lys Tyr
210 215 220
Ile
225 <210> 131 <211> 672 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 131
atgagcatcg tcgtgcagaa catcgagcga gcggacctgg aggcggttac gacgcttggc 60
gaatgcggtg tggcgaccgt gcacgaggca caaggccgca cgggcctcat gctcccctat 120
atgcggccga tctggccggg cgcacggatc gcaggcccgg ctgtgaccgt ctccctgccg 180
ccgggcgaca actggatgat ccatgtcgcg gtggagcaat gccgggaggg cgacatcctg 240
atcgtggcgc cgaccagccc cagcgaggac ggctatttcg gcgagcttct ggcgcgctcg 300
ctcgtggcgc gcagcgtcaa gggcttcgtg atcgaggctg gggtgcgcga tgtgcgcgac 360
cttaccgaga tacgtttccc ggtctggtcg cgggcagtct ccgcccaggg cacggtcaag 420
gaaacgatcg gctcggtgaa cgtgccgatc gtctgcgcag gtgctgcggt gaatccgggc 480
gacgtggtcg tggctgacga tgacggcata tgtgtcgtgg ctcgcgacaa agctggtgag 540
gtggccaagg ctgcgcgagc gcgcgaggcg aaggaagctg aaacgcgccg ccggctgatc 600
aatggcgagc tcgggctcga catctatgga atgcgggaga agcttgcggc gaagggcctg 660
aaatatgtct ga 672
<210> 132 <211> 223 <212> PRT <213> desconhecido
Petição 870170009999, de 15/02/2017, pág. 639/1247
630/788 <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 132
Met Ser Ile Vai Vai Gin Asn Ile Glu Arg Ala Asp Leu Glu Ala Vai
1 5 10 15
Thr Thr Leu Gly Glu Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Arg Thr Gly Leu Met Leu Pro Tyr Met Arg Pro Ile Trp Pro Gly Ala
35 40 45
Arg Ile Ala Gly Pro Ala Vai Thr Vai Ser Leu Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Vai Ala Vai Glu Gin Cys Arg Glu Gly Asp Ile Leu
65 70 75 80
Ile Vai Ala Pro Thr Ser Pro Ser Glu Asp Gly Tyr Phe Gly Glu Leu
85 90 95
Leu Ala Arg Ser Leu Vai Ala Arg Ser Vai Lys Gly Phe Vai Ile Glu
100 105 110
Ala Gly Vai Arg Asp Vai Arg Asp Leu Thr Glu Ile Arg Phe Pro Vai
115 120 125
Trp Ser Arg Ala Vai Ser Ala Gin Gly Thr Vai Lys Glu Thr Ile Gly
130 135 140
Ser Vai Asn Vai Pro Ile Vai Cys Ala Gly Ala Ala Vai Asn Pro Gly
145 150 155 160
Asp Vai Vai Vai Ala Asp Asp Asp Gly Ile Cys Vai Vai Ala Arg Asp
165 170 175
Lys Ala Gly Glu Vai Ala Lys Ala Ala Arg Ala Arg Glu Ala Lys Glu
180 185 190
Ala Glu Thr Arg Arg Arg Leu Ile Asn Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Vai
210 215 220
<210> 133 <211> 672 <212> DNA <213> desconhecido <220> <223> Proteína obtida <400> 133 atgaacatcg tcgtccagaa por amostra do ambiente catcgagcgc gccgatccgg cggtgatcgc cggcctcgcc 60
gagtgcggcg tcgccacagt ccacgaagcg caggggcgca tcgggctgat gtcatcgaag 120
atgcggccga tctacgccgg cgcccgcatc gcggcctcgg cggtgaccgt gtcgctgccg 180
Petição 870170009999, de 15/02/2017, pág. 640/1247
631/788 ccggccgaca actggatgat ccatgtcgcc gtggagcaga tcaaagcggg cgacgtcatg gtcgtggcgc cgacctcgcc ctcggacgcg ggctattttg gcgacctgct cgccaattcg ctgcaggccc ggggctgcgc cggcctcgtg atcgatgccg gggtgcgcga cgtgcgtgac cttaccgaaa tgcggttccc cgtctggtcg acggcgatct cggcgcaggg aaccgtcaag gaaacgcttg gttcggtgaa cgtcccgatc gtctgcgccg gtgcacatgt cgaacccggc gacgtgatcg tcgccgacga cgacggcgtc tgcatcgtca agcgcaccga cgcggctgcg gtgctcgaaa aggcgcgggc ccggctcgcg aacgaaaccg acaagcgcga gaaactcgcg aacggcacgc tgggcctcga tctctacaag atgcgcgagg cgctggagaa gaagggcctc aggtatgcct ga <210> 134 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <220>
<221> SITE <222> (193)...(196) <223> Sítio de N-glicosilação prosítio id = PS00001 <220>
240
300
360
420
480
540
600
660
672
<221> SITE
<222> (204)...(207)
<223> Sítio de N-glicosilação prosítio id = PS00001
<400> 134
Met Asn Ile Vai Vai Gin Asn Ile Glu Arg Ala Asp Pro Ala Vai Ile
15 10 15
Ala Gly Leu Ala Glu Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Arg Ile Gly Leu Met Ser Ser Lys Met Arg Pro Ile Tyr Ala Gly Ala
35 40 45
Arg Ile Ala Ala Ser Ala Vai Thr Vai Ser Leu Pro Pro Ala Asp Asn
50 55 60
Trp Met Ile His Vai Ala Vai Glu Gin Ile Lys Ala Gly Asp Vai Met
65 70 75 80
Vai Vai Ala Pro Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Asn Ser Leu Gin Ala Arg Gly Cys Ala Gly Leu Vai Ile Asp
100 105 110
Ala Gly Vai Arg Asp Vai Arg Asp Leu Thr Glu Met Arg Phe Pro Vai
115 120 125
Trp Ser Thr Ala Ile Ser Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
Petição 870170009999, de 15/02/2017, pág. 641/1247
632/788
130 135 140
Ser Vai Asn Vai Pro Ile Vai Cys Ala Gly Ala His Vai Glu Pro Gly
145 150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Ile Vai Lys Arg Thr
165 170 175
Asp Ala Ala Ala Vai Leu Glu Lys Ala Arg Ala Arg Leu Ala Asn Glu
180 185 190
Thr Asp Lys Arg Glu Lys Leu Ala Asn Gly Thr Leu Gly Leu Asp Leu
195 200 205
Tyr Lys Met Arg Glu Ala Leu Glu Lys Lys Gly Leu Arg Tyr Ala
210 215 220
<210> 135
<211> 672
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 135
atgagcgtcg tcgtccagaa catcgcgcgc gccgatcaag cgatcgtcga tcggctcgcg 60
gcctgcggtg ttgccactgt gcatgaagcg cagggccgca agggactgct cgcgagccat 120
atgcggccga tctatcccgg tacccggctc gcggcgagcg ctgtgaccat ctcggcgccg 180
ccgggcgaca actggatggt ccacgtcgcg atcgagcaat tgcgagcggg cgacatcatg 240
gtgctcgccc cgaccagccc ctgcgaggat ggttatttcg gcgatctgct tgccacatcg 300
gcgaaagcac ggggctgccg cggtctcatc atcgatgccg gcgtccgcga tgtcgccgat 360
ctcacggcga tgcagtttcc tgtctggtcc aaggccatct tcgcgcaagg caccgtcaag 420
gaaacgctcg gctcggtgaa catcccggtg gtgtgcgcgg gtgcgctggt caatcccggc 480
gatgtcatcg tcgccgatga cgatggcgtc tgcgttgtgc gccgcgaaga ggcggaggcg 540
gtggcgcaga aggccgaagc ccgcgtcgcc gccgaggacg acaagcgcaa gcgcctcgcc 600
gccggcgaac tcggtctcga catctacaag atgcgcgagc ggctggccga gaaggggctc 660
aaatatgtct ga 672
<210> 136 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 136
Met Ser Vai Vai Vai Gin Asn Ile Ala Arg Ala Asp Gin Ala Ile Vai 15 10 15
Asp Arg Leu Ala Ala Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
25 30
Petição 870170009999, de 15/02/2017, pág. 642/1247
633/788
Arg Lys Gly Leu 35 Leu Ala Ser His Met 40 Arg Pro Ile Tyr 45 Pro Gly Thr
Arg Leu Ala Ala Ser Ala Vai Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Trp Met Vai His Vai Ala Ile Glu Gin Leu Arg Ala Gly Asp Ile Met
65 70 75 80
Vai Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Lys Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp
100 105 110
Ala Gly Vai Arg Asp Vai Ala Asp Leu Thr Ala Met Gin Phe Pro Vai
115 120 125
Trp Ser Lys Ala Ile Phe Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Ile Pro Vai Vai Cys Ala Gly Ala Leu Vai Asn Pro Gly
145 150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Arg Arg Glu
165 170 175
Glu Ala Glu Ala Vai Ala Gin Lys Ala Glu Ala Arg Vai Ala Ala Glu
180 185 190
Asp Asp Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Vai
210 215 220 <210> 137 <211> 672 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 137
atggctgtcg tggtccagaa tattgcccgt gccgaccagg cggtcattga ccggctggcc 60
gcctgtgatg tcgccacggt tcatgaggcg cagggccgca agggcctgct cgccggctac 120
atgcggccga tttatcccgg tgcccggatt gctgccagtg ccgtaacgat ctctgcgccg 180
cccggcgaca actggatggt ccatgtggcg atcgaacagc tcaaggcggg cgatatcctg 240
ttgcttgcgc cgacaagccc ctgcgaggac ggctatttcg gcgatcttct cgcgacgtcg 300
gccgttgcgc gcggctgccg cgggcttatc atcgatgccg gcgtgcgtga cgttgccgat 360
ctcacggaaa tgaagtttcc ggtctggtcc aaggcggtct tcgcccaggg cacggtcaag 420
gagacgctcg gctcggtcaa tgtgaccgtg gtctgtgccg gtgccctggt caatgccggc 480
gacgtgatcg tggccgacga cgatggcgtc tgcgtggtcc ggcgcgagga agcggctgac 540
gtggctgcca aagccgaggc gcgtgtcgct gccgaggagg gcaagcgcaa gcggctcgcg 600
gccggcgaac tcgggctcga catttacgac atgcgcgggc gattggcgga gaagggactg 660
agatatgtct ga 672
<210> 138 <211> 223
Petição 870170009999, de 15/02/2017, pág. 643/1247
634/788 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <220>
<221> SITE <222> (149)...(152) <223> Sítio de N-glicosilação prosítio id = PS00001 <400> 138
Met Ala Vai Vai Vai Gin Asn Ile Ala Arg Ala Asp Gin Ala Vai Ile
1 5 10 15
Asp Arg Leu Ala Ala Cys Asp Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Arg Lys Gly Leu Leu Ala Gly Tyr Met Arg Pro Ile Tyr Pro Gly Ala
35 40 45
Arg Ile Ala Ala Ser Ala Vai Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Trp Met Vai His Vai Ala Ile Glu Gin Leu Lys Ala Gly Asp Ile Leu
65 70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Vai Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp
100 105 110
Ala Gly Vai Arg Asp Vai Ala Asp Leu Thr Glu Met Lys Phe Pro Vai
115 120 125
Trp Ser Lys Ala Vai Phe Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Vai Thr Vai Vai Cys Ala Gly Ala Leu Vai Asn Ala Gly
145 150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Arg Arg Glu
165 170 175
Glu Ala Ala Asp Vai Ala Ala Lys Ala Glu Ala Arg Vai Ala Ala Glu
180 185 190
Glu Gly Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Asp Met Arg Gly Arg Leu Ala Glu Lys Gly Leu Arg Tyr Vai
210 215 220
<210> 139
<211> 693
<212> DNA
<213> desconhecido
Petição 870170009999, de 15/02/2017, pág. 644/1247
635/788 <220>
<223> Proteína obtida por amostra do ambiente <400> 139
atgaattatc agccggggac aacaggcatc gtcgtgcagg atattgcgcg cgctgatcaa 60
gccattatcg atggcctagc agaatgtggt gtggcgacgg tgcatgaggc acaagggcgc 120
aaggggctgt tggcggacta tatgacgccg attttttcag gcgcgggcat cgctggatct 180
gcggtgacca ttctggcgcc accttgtgac aattggatga ttcatgtggc ggtagaacag 240
ttgcaaaagg gcgatgtgtt gctgctgggc acgatcacac cgtccaatgc tggctatttc 300
ggtgacttgc tggccacgtc agccatggcg cacggttgtc gcggattgat cattgatggc 360
ggtgtgcgcg atgtgcaaga gctgacggat atgggctttc cggtttggtc caaggccgta 420
catgcccaag gcacaatcaa agaaacgctg ggatcggtca acgtgccagt tgtctgcggc 480
caagagttgg taaatcccgg tgatattgtg gtggccgatg atgacggggt gtgcgttgtg 540
cgccgcgaag aagctgctga tgtgctggct aaggcgcggg cgcgcgagag taatgaagcc 600
gccaagcgcg cgcgttttga ggacggtgag ctggggctgg atatctatga catgcgcgcg 660
cggctggccg aaaagggact gaaatacgtc tga 693
<210> 140 <211> 230 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (27)...(179) <223> Demetilmenaquinone metiltransferase <400> 140
Met Asn Tyr Gin Pro Gly Thr Thr Gly Ile Vai Vai Gin Asp Ile Ala
1 5 10 15
Arg Ala Asp Gin Ala Ile Ile Asp Gly Leu Ala Glu Cys Gly Vai Ala
20 25 30
Thr Vai His Glu Ala Gin Gly Arg Lys Gly Leu Leu Ala Asp Tyr Met
35 40 45
Thr Pro Ile Phe Ser Gly Ala Gly Ile Ala Gly Ser Ala Vai Thr Ile
50 55 60
Leu Ala Pro Pro Cys Asp Asn Trp Met Ile His Vai Ala Vai Glu Gin
65 70 75 80
Leu Gin Lys Gly Asp Vai Leu Leu Leu Gly Thr Ile Thr Pro Ser Asn
85 90 95
Ala Gly Tyr Phe Gly Asp Leu Leu Ala Thr Ser Ala Met Ala His Gly
100 105 110
Cys Arg Gly Leu Ile Ile Asp Gly Gly Vai Arg Asp Vai Gin Glu Leu
115 120 125
Thr Asp Met Gly Phe Pro Vai Trp Ser Lys Ala Vai His Ala Gin Gly
130 135 140
Thr Ile Lys Glu Thr Leu Gly Ser Vai Asn Vai Pro Vai Vai Cys Gly
Petição 870170009999, de 15/02/2017, pág. 645/1247
636/788
145 150 155 160
Gin Glu Leu Vai Asn Pro Gly Asp Ile Vai Vai Ala Asp Asp Asp Gly
165 170 175
Vai Cys Vai Vai Arg Arg Glu Glu Ala Ala Asp Vai Leu Ala Lys Ala
180 185 190
Arg Ala Arg Glu Ser Asn Glu Ala Ala Lys Arg Ala Arg Phe Glu Asp
195 200 205
Gly Glu Leu Gly Leu Asp Ile Tyr Asp Met Arg Ala Arg Leu Ala Glu
210 215 220
Lys Gly Leu Lys Tyr Vai
225 230
<210> 141
<211> 672
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 141
atgagcgtcg tcgtccagaa catcgaacgc gccgacccgg actccgtcgc cgtgctcggc 60
gcgagcggcg tcgccaccgt gcacgaagcg caaggccgga cgggactcat gcggccctat 120
atgcggccga tctattcggg cgtgcgcatt gccggaccga ccgtcacggt ctccatcccg 180
ccgggcgaca actggatgat tcatgtcgcg gtcgagcagt gccgcgaagg cgacattctc 240
gttgtggctc cgaccagccc gagcgatgac ggctatttcg gcgacctgct tgccgggtcg 300
cttatggcac gaggcgtcaa ggctctcatc atcgaggccg gtgtgcgcga cgttcgcgat 360
ctgaccgaaa tgcgctttcc ggtctggtcg aagaccattt ccgcgcaggg aaccgtcaag 420
gaaacgcttg gctccgtgaa tgtgccgatc gtctgcgccg gtgcggcggt caatcccggc 480
gacgcggtcg tggccgatga cgacggcgta tgcgtcgtgc cgcgagagcg agcggccgag 540
gtggccaagg cgtcgcaggc ccgcgaggca aaggaagccg ggacgcgccg gcggctgatg 600
gccggtgaac tggggctcga catctacggc atgcgcgaga aactcgctgc caagggtttg 660
aaatatgtct ga 672
<210> 142 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 142
Met 1 Ser Vai Vai Vai 5 Gin Asn Ile Glu Arg Ala 10 Asp Pro Asp Ser 15 Vai
Ala Vai Leu Gly Ala Ser Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Petição 870170009999, de 15/02/2017, pág. 646/1247
637/788
Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro 40 Ile Tyr 45 Ser Gly Vai
35
Arg Ile Ala Gly Pro Thr Vai Thr Vai Ser Ile Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Vai Ala Vai Glu Gin Cys Arg Glu Gly Asp Ile Leu
65 70 75 80
Vai Vai Ala Pro Thr Ser Pro Ser Asp Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Gly Ser Leu Met Ala Arg Gly Vai Lys Ala Leu Ile Ile Glu
100 105 110
Ala Gly Vai Arg Asp Vai Arg Asp Leu Thr Glu Met Arg Phe Pro Vai
115 120 125
Trp Ser Lys Thr Ile Ser Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Vai Pro Ile Vai Cys Ala Gly Ala Ala Vai Asn Pro Gly
145 150 155 160
Asp Ala Vai Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Pro Arg Glu
165 170 175
Arg Ala Ala Glu Vai Ala Lys Ala Ser Gin Ala Arg Glu Ala Lys Glu
180 185 190
Ala Gly Thr Arg Arg Arg Leu Met Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Vai
210 215 220 <210> 143 <211> 672 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 143
atgagcgtcg tcgtccagaa catcgaacgc gccgacccgg actccgtcac cgtgctcggc 60
gcgagcggcg tcgccaccgt gcacgaagcg caaggccgga cgggactcat gcggccctac 120
atgcggccga tctattcggg cgtgcgcatt gccggaccgg ccgtcacggt ctccatcccg 180
ccgggcgaca actggatgat tcatgtcgcg gtcgagcagt gccgcgaagg cgacattctc 240
gttgtggctc cgaccagccc gagcgatgat ggctatttcg gcgacctgct tgccgggtcg 300
cttgtggcac gaggcgtcaa ggctctcatc atcgaggccg gtgtgcgcga cgttcgcgat 360
ctgaccgaaa tgcgctttcc ggtctggtcg aagaccattt ccgcgcaggg aaccgtcaag 420
gaaacgcttg gctccgtgaa tgtgccgatc gtctgcgccg gtgcggcggt caatcccggc 480
gacgcggtcg tggccgatga cgacggcgta tgcgtcgtgc cgcgagagcg agcggctgag 540
gtggccaagg cgtcgcaggc ccgcgaggca aaggaggccg ggacgcgccg gcggctgatg 600
gccggtgaac tggggctcga catctacggc atgcgcgaga aactcgctgc caagggtttg 660
aaatatgtct ga 672
<210> 144 <211> 223
Petição 870170009999, de 15/02/2017, pág. 647/1247
638/788 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <220>
<221> SITE <222> (1)...(21) <223> Assinatura de proteína do receptor TonB-dependente e prosítio id = PS00430 <400> 144
Met 1 Ser Vai Vai Vai 5 Gin Asn Ile Glu Arg Ala 10 Asp Pro Asp Ser 15 Vai
Thr Vai Leu Gly Ala Ser Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Ser Gly Vai
35 40 45
Arg Ile Ala Gly Pro Ala Vai Thr Vai Ser Ile Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Vai Ala Vai Glu Gin Cys Arg Glu Gly Asp Ile Leu
65 70 75 80
Vai Vai Ala Pro Thr Ser Pro Ser Asp Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Gly Ser Leu Vai Ala Arg Gly Vai Lys Ala Leu Ile Ile Glu
100 105 110
Ala Gly Vai Arg Asp Vai Arg Asp Leu Thr Glu Met Arg Phe Pro Vai
115 120 125
Trp Ser Lys Thr Ile Ser Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Vai Pro Ile Vai Cys Ala Gly Ala Ala Vai Asn Pro Gly
145 150 155 160
Asp Ala Vai Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Pro Arg Glu
165 170 175
Arg Ala Ala Glu Vai Ala Lys Ala Ser Gin Ala Arg Glu Ala Lys Glu
180 185 190
Ala Gly Thr Arg Arg Arg Leu Met Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Vai
210 215 220 <210> 145 <211> 672 <212> DNA
Petição 870170009999, de 15/02/2017, pág. 648/1247
639/788 <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 145
atgaccatcg tcgtcaccgg catcgagcgc gcgggagcgg acactgtcgc cgcgctgggc 60
acaagcggcg tcgcgaccgt acacgaggcg cagggccgca ccggcctgat gcgtccctac 120
atgcggccga tctatacggg agcgcgcatc gccgggacgg cgattaccgt gtcgctgccg 180
cccggcgaca actggatgat ccacgtcgcc gtcgagcagt gccggcaagg cgatatcctc 240
gtggtggcgc cgaccagccc gagcgacgac ggctatttcg gcgacctgct cgccaattct 300
ctcgtcgccc gcggcgtgag gggcatggtc atcgaggccg gcgtgcgtga cgttcgcgat 360
ctcaccgaga tgcgcttccc ggtctggtcg aagacgatct cggcgcaggg aacggtcaag 420
gagacgctcg gctcggtcaa cgtgccggtc gtctgcgctg gcttggccgt gaacccgggc 480
gacatcatcg tggccgacga cgacggcatc tgcgtggtgc cgcgccagac cgccgcgcag 540
gtcgtcgagg cggctcatgc gcgcgaggcg aaggaggcgg aggtccgtcg gcggctcatc 600
gccggcgaac tcggcctcga tatctacggc atgcgtgaga agctggcggc caagggcctg 660
aaatatgtct ga 672
<210> 146 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 146
Met Thr Ile Vai Vai Thr Gly Ile Glu Arg Ala Gly Ala Asp Thr Vai
1 5 10 15
Ala Ala Leu Gly Thr Ser Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Thr Gly Ala
35 40 45
Arg Ile Ala Gly Thr Ala Ile Thr Vai Ser Leu Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Vai Ala Vai Glu Gin Cys Arg Gin Gly Asp Ile Leu
65 70 75 80
Vai Vai Ala Pro Thr Ser Pro Ser Asp Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Asn Ser Leu Vai Ala Arg Gly Vai Arg Gly Met Vai Ile Glu
100 105 110
Ala Gly Vai Arg Asp Vai Arg Asp Leu Thr Glu Met Arg Phe Pro Vai
115 120 125
Trp Ser Lys Thr Ile Ser Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Petição 870170009999, de 15/02/2017, pág. 649/1247
640/788
Ser 145 Vai Asn Vai Pro Vai 150 Vai Cys Ala Gly Leu Ala Vai Asn 155 Pro Gly 160
Asp Ile Ile Vai Ala Asp Asp Asp Gly Ile Cys Vai Vai Pro Arg Gin
165 170 175
Thr Ala Ala Gin Vai Vai Glu Ala Ala His Ala Arg Glu Ala Lys Glu
180 185 190
Ala Glu Vai Arg Arg Arg Leu Ile Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Vai
210 215 220
<210> 147 <211> 675 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 147
gtgagcggca tcgtcgtcca gaacatcgag cgcgccgacc ccgcgatcat cacgggcctc 60
gccgaatgcg gcgtcgccac ggtgcatgag gcgcagggcc gcaagggtct gctcgcgtcc 120
tacatgcggc cgatctatgc cggcgccgct gtcggcgcat cggcggtcac catcctcgcc 180
ccgccctgcg acaactggat ggtgcatgtg gcgatcgagc aggtgcgggc aggggacatc 240
ctcgtcctcg cgaccacctc gccctccgac gccggctatt tcggcgatct gctcgccacc 300
tcgatgaagg cccgcggcgg tgtcggcctc atcatcgatg ccggcgttcg tgacattcgc 360
gacctcacgg cggtgcagtt cccggtgtgg tccaaggccg tctgcgccca gggcaccatc 420
aaggaaacgc tgggctcggt gaacgtgccg gtggtctgtg ccggcgagct ggtcaacccg 480
ggcgatgtca tcgtcgccga tgacgacggc gtctgcgtcg tgcggcgcga ggaagctgcc 540
gatgtgctga agaaggcgca ggcccgcgtg gcgaacgaag gcgacaagcg tcagcgcctc 600
gcggccggcg aactcggcct cgacatgtac aagatgcgcg acaagctgaa ggaaatgggc 660
ctcaaatatg tctga 675
<210> 148 <211> 224 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (21)...(173) <223> Demetilmenaquinone metiltransferase <400> 148
Met 1 Ser Gly Ile Vai 5 Vai Gin Asn Ile Glu 10 Arg Ala Asp Pro Ala 15 Ile
Ile Thr Gly Leu Ala Glu Cys Gly Vai Ala Thr Vai His Glu Ala Gin
20 25 30
Gly Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala Gly
Petição 870170009999, de 15/02/2017, pág. 650/1247
641/788
40 45
Ala Ala 50 Vai Gly Ala Ser Ala Vai 55 Thr Ile Leu Ala 60 Pro Pro Cys Asp
Asn Trp Met Vai His Vai Ala Ile Glu Gin Vai Arg Ala Gly Asp Ile
65 70 75 80
Leu Vai Leu Ala Thr Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Asp
85 90 95
Leu Leu Ala Thr Ser Met Lys Ala Arg Gly Gly Vai Gly Leu Ile Ile
100 105 110
Asp Ala Gly Vai Arg Asp Ile Arg Asp Leu Thr Ala Vai Gin Phe Pro
115 120 125
Vai Trp Ser Lys Ala Vai Cys Ala Gin Gly Thr Ile Lys Glu Thr Leu
130 135 140
Gly Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Glu Leu Vai Asn Pro
145 150 155 160
Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Arg Arg
165 170 175
Glu Glu Ala Ala Asp Vai Leu Lys Lys Ala Gin Ala Arg Vai Ala Asn
180 185 190
Glu Gly Asp Lys Arg Gin Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp
195 200 205
Met Tyr Lys Met Arg Asp Lys Leu Lys Glu Met Gly Leu Lys Tyr Vai
210 215 220
<210> 149 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 149
atgaataaac cggtggtagt tcgacaggtc gagcagccat cagccgatgc ggttgcggca 60
ctagaaaagt gtggcgtaac gacggtgcat aaggctcagg gacgctgcgg cttgcttgca 120
gcctacatgc gaccgatttt cccaggagct agcatcgccg gttctgcggt cactgtgtcc 180
ctgccgccgg gcgacaacct gatgattcac gtcgcggtcg aggtctgcag cacaggaaac 240
attctggtgg tcgctccgac ctcgccatgc acggatggtt acttcggtga actcctcgca 300
acgtcgttgc gcgcgcacgg tgtaagaggc cttgtgatcg atgctggatg ccgtgacgtt 360
cgctctttga cggaaatgaa attcccggtc tggagccgcg ccatcagctc tcaggggaca 420
gtgaaagcca cactcggatc agtcaatgtg ccgatcacat gcgcggggac actcgttgaa 480
tccggtgacg tcatcgtcgc cgacgatgat ggtgtcgtag tcgtgaagcg tacggccgca 540
caagaagtcg ccgcagccgc tgaacaaagg gtgcgcaaag agaatgcgac ccgtgaacga 600
ctcgcacggg gcgaactcgg tctcgatatc tacgagatgc gccagaaaat cgcgcagctc 660
ggcctcaagt atctgtga 678
<210> 150 <211> 225 <212> PRT
Petição 870170009999, de 15/02/2017, pág. 651/1247
642/788 <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 150
Met 1 Asn Lys Pro Vai 5 Vai Vai Arg Gin Vai 10 Glu Gin Pro Ser Ala 15 Asp
Ala Vai Ala Ala Leu Glu Lys Cys Gly Vai Thr Thr Vai His Lys Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Phe Pro
35 40 45
Gly Ala Ser Ile Ala Gly Ser Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Ser Thr Gly Asn
65 70 75 80
Ile Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Arg Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Ile Thr Cys Ala Gly Thr Leu Vai Glu
145 150 155 160
Ser Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Thr Ala Ala Gin Glu Vai Ala Ala Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Glu Met Arg Gin Lys Ile Ala Gin Leu Gly Leu Lys Tyr
210 215 220
Leu
225 <210> 151 <211> 675 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 151
Petição 870170009999, de 15/02/2017, pág. 652/1247
643/788
atgagcggaa ttgttgtcca gaatatcgag cgcgccgacg cggcggtcat cgcagccttg 60
gaaagctgcg gcgtctcaac tgtgcacgag gctcaaggcc gtactggact gctggcttct 120
tatatgcgtc caatctacac aggtgcacgg atagcaggaa gtgcagtgac tatctccgca 180
cctcctggcg ataactggat ggtgcatgtg gctatcgagc aattgcacgc aggcgacata 240
ttgataatcg caccaacctc gccgtgcgaa gacggctatt tcggcgactt gctagccacg 300
tctgcgcagg cccgtgggtg caagggtctg attatcaacg ccggcgttcg cgatgtgcgc 360
gatttgactg aaatgggctt tcccgtctgg tcgaaggcca tttttgccca aggcactatc 420
aaagcatcgc tgggttcggt caacataccc gtcgtgtgcg caggcgcgcc catcaatccc 480
ggcgatgtga ttgtggccga tgatgacggc gtttgtgtcg tgccgcgcca gaatgcggca 540
gaggtcgcaa aggcggcgaa ggcacgtgag gcgaacgagg ccgcaaagcg cgaccagctt 600
gcaaccggca tcttggggct tgatatgtat gacatgcgcg gaaatctcgc cgagatgggg 660
ctgaaatata tatga 675
<210> 152 <211> 224 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (21)...(173) <223> Demetilmenaquinone metiltransferase <400> 152
Met 1 Ser Gly Ile Vai Vai 5 Gin Asn Ile Glu Arg Ala Asp Ala Ala Vai
10 15
Ile Ala Ala Leu Glu Ser Cys Gly Vai Ser Thr Vai His Glu Ala Gin
20 25 30
Gly Arg Thr Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Thr Gly
35 40 45
Ala Arg Ile Ala Gly Ser Ala Vai Thr Ile Ser Ala Pro Pro Gly Asp
50 55 60
Asn Trp Met Vai His Vai Ala Ile Glu Gin Leu His Ala Gly Asp Ile
65 70 75 80
Leu Ile Ile Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp
85 90 95
Leu Leu Ala Thr Ser Ala Gin Ala Arg Gly Cys Lys Gly Leu Ile Ile
100 105 110
Asn Ala Gly Vai Arg Asp Vai Arg Asp Leu Thr Glu Met Gly Phe Pro
115 120 125
Vai Trp Ser Lys Ala Ile Phe Ala Gin Gly Thr Ile Lys Ala Ser Leu
130 135 140
Gly Ser Vai Asn Ile Pro Vai Vai Cys Ala Gly Ala Pro Ile Asn Pro
145 150 155 160
Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Pro Arg
165 170 175
Petição 870170009999, de 15/02/2017, pág. 653/1247
644/788
Gin Asn Ala Ala Glu Vai Ala Lys Ala Ala Lys Ala Arg Glu Ala Asn
180 185 190
Glu Ala Ala Lys Arg Asp Gin Leu Ala Thr Gly Ile Leu Gly Leu Asp
195 200 205
Met Tyr Asp Met Arg Gly Asn Leu Ala Glu Met Gly Leu Lys Tyr Ile
210 215 220 <210> 153 <211> 672 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 153
atgtccgtcg tcgtccagaa catcgcgcgc gccgaccagt ccgtcatcga tcggctcggc 60
gcctgcggcg tcgccactgt gcatgaagcg cagggccgca cgggactgct agccagctac 120
atgcgcccca tctatcgggg tgcgcgtctg gccgcgagcg cggtgaccat ctcggccccg 180
cccggcgaca attggatgct ccatgtcgcc atcgagcagc tgaggcccgg cgacatcatg 240
gtgcttgccc ccaccagccc ctgcgaggat ggctatttcg gcgacctgct tgcgacatcg 300
gccctggcgc gcggctgccg tggtctcgtc atcgaggcgg gcgttcgcga tgtcgccgac 360
ctcaccgcga tgaagtttcc cgtctggtcc aaagccatct tcgcccaggg caccgtcaag 420
ggaacgctgg gttcggtgaa cgtgcccgtc gtctgtgccg gcgcgctgat caatcccggt 480
gacgtcattg tggccgatga cgatggcgtc tgcgtggtgc gccgcgagga agccgaagcg 540
gtggcgcaaa aggccgaggc gcgcgtcgcc gccgaagagg ataagcgcaa gcgcctcgcc 600
gccggcgaac tcgggctcga tatctacaag atgcgcgagc ggctcgccga aaagggactc 660
aaatatgtct ag 672
<210> 154 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 154
Met Ser Vai Vai Vai Gin Asn Ile Ala Arg Ala Asp Gin Ser Vai Ile
1 5 10 15
Asp Arg Leu Gly Ala Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Arg Thr Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Arg Gly Ala
35 40 45
Arg Leu Ala Ala Ser Ala Vai Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Trp Met Leu His Vai Ala Ile Glu Gin Leu Arg Pro Gly Asp Ile Met
Petição 870170009999, de 15/02/2017, pág. 654/1247
645/788
70 75 80
Vai Leu Ala Pro Thr 85 Ser Pro Cys Glu Asp Gly Tyr 90 Phe Gly Asp 95 Leu
Leu Ala Thr Ser Ala Leu Ala Arg Gly Cys Arg Gly Leu Vai Ile Glu
100 105 110
Ala Gly Vai Arg Asp Vai Ala Asp Leu Thr Ala Met Lys Phe Pro Vai
115 120 125
Trp Ser Lys Ala Ile Phe Ala Gin Gly Thr Vai Lys Gly Thr Leu Gly
130 135 140
Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Leu Ile Asn Pro Gly
145 150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Arg Arg Glu
165 170 175
Glu Ala Glu Ala Vai Ala Gin Lys Ala Glu Ala Arg Vai Ala Ala Glu
180 185 190
Glu Asp Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Vai
210 215 220 <210> 155 <211> 672 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 155
atgaacatcg tggtgcagaa catcgagcgc gccgatccgg ccgtgatcgc cggactcgcg 60
gattgcggcg tcgccaccgt gcacgaggcg caggggcgca tcggactgat gtcgtccaag 120
atgcgaccga tctatccggg cgcgcgtgtc gcggcgtcgg cggtgacggt gtcgctgccg 180
ccggccgaca actggatgat tcatgtggcg gtggagcaga tcaaggccgg cgacatcatg 240
gtggtcgctc cgacctcgcc gtctgatgcc ggctacttcg gcgacctact ggcgacctcg 300
ctcaaggcgc ggggctgcgt gggactggtg atcgacgcgg gggtgcgcga tgtgcgcgac 360
ctgaccgaaa tgcagttccc ggtgtggtcg acggcgatct cggcgcaggg gaccgtgaaa 420
gaaacgctgg gctcggtgaa cgtccctgtc atctgcgccg gcgcgcatgt ggagccgggc 480
gacgtgattg ttgccgacga cgacggggtc tgcatcgtca agcgtgccaa tgcggcggcg 540
gtgcttgaga aggcgcgagc gcgggtcgcc ggcgaagccg acaagcgcga gagattagcg 600
aacggcacgc tcgggctcga cctctacaag atgcgcgaag ggctggagaa gaagggtcta 660
aaatatgtct ga 672
<210> 156 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
Petição 870170009999, de 15/02/2017, pág. 655/1247
646/788 <221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <220>
<221> SITE <222> (204)...(207) <223> Sítio de N-glicosilação prosítio id = PS00001 <400> 156
Met Asn 1 Ile Vai Vai 5 Gin Asn Ile Glu Arg 10 Ala Asp Pro Ala Vai 15 Ile
Ala Gly Leu Ala Asp Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Arg Ile Gly Leu Met Ser Ser Lys Met Arg Pro Ile Tyr Pro Gly Ala
35 40 45
Arg Vai Ala Ala Ser Ala Vai Thr Vai Ser Leu Pro Pro Ala Asp Asn
50 55 60
Trp Met Ile His Vai Ala Vai Glu Gin Ile Lys Ala Gly Asp Ile Met
65 70 75 80
Vai Vai Ala Pro Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Leu Lys Ala Arg Gly Cys Vai Gly Leu Vai Ile Asp
100 105 110
Ala Gly Vai Arg Asp Vai Arg Asp Leu Thr Glu Met Gin Phe Pro Vai
115 120 125
Trp Ser Thr Ala Ile Ser Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Vai Pro Vai Ile Cys Ala Gly Ala His Vai Glu Pro Gly
145 150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Ile Vai Lys Arg Ala
165 170 175
Asn Ala Ala Ala Vai Leu Glu Lys Ala Arg Ala Arg Vai Ala Gly Glu
180 185 190
Ala Asp Lys Arg Glu Arg Leu Ala Asn Gly Thr Leu Gly Leu Asp Leu
195 200 205
Tyr Lys Met Arg Glu Gly Leu Glu Lys Lys Gly Leu Lys Tyr Vai
210 215 220 <210> 157 <211> 690 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 157 atgagcgtgg tcgtcaccgg cgtgcagcgg cccgctcccg cggacgtcgc ggcattgggc cgcttcggcg tagcgacaat ccacgaggcg cagggacgca ctggactaat gcacgcttac
120
Petição 870170009999, de 15/02/2017, pág. 656/1247
647/788
atgcggccga tctattccgg cgcgcatgtc tgcggtccag cggtaaccgt gtctctcccg 180
ccagcggaca actggatgat ccacgttgcc atcgagcaat gtgttgcagg cgacatcctc 240
gtggtggcac caacctcgcc ttccgacgcc ggctatttcg gcgagctact ggcaacctcg 300
cttcaggcgc gcggcgtgaa ggggcttatc atcgaggctg gctgccgcga tgtcgcggca 360
ctgactgcca tgcgcttccc ggtgtggtcg cgctcgatct ctgcgcaggg gacagtgaag 420
gagacgctcg gctcggtaaa tgtgcccgtc gtctgtaccg gcgcgctggt ggcgccgggc 480
gatgttatcg tcgctgacga cgatggagtt gtcgtggtcc caaaggacaa tgtggccgcc 540
atcgcctccg cctccgcggc gcgtgaggcg aaggaggaag aggtgcgggc gaagctcaag 600
gccggcgtgc tgggcctcga catctacggc gtgcgcgagc ggctgaagga gaaggggctt 660
cgctatcgtg ccgccgacga aggccactag 690
<210> 158 <211> 229 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <220>
<221> SITE <222> (20)...(40) <223> Multicopper oxidases signature 1. Prosite id = PS00079 <400> 158
Met 1 Ser Vai Vai Vai 5 Thr Gly Vai Gin Arg Pro Ala 10 Pro Ala Asp 15 Vai
Ala Ala Leu Gly Arg Phe Gly Vai Ala Thr Ile His Glu Ala Gin Gly
20 25 30
Arg Thr Gly Leu Met His Ala Tyr Met Arg Pro Ile Tyr Ser Gly Ala
35 40 45
His Vai Cys Gly Pro Ala Vai Thr Vai Ser Leu Pro Pro Ala Asp Asn
50 55 60
Trp Met Ile His Vai Ala Ile Glu Gin Cys Vai Ala Gly Asp Ile Leu
65 70 75 80
Vai Vai Ala Pro Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Glu Leu
85 90 95
Leu Ala Thr Ser Leu Gin Ala Arg Gly Vai Lys Gly Leu Ile Ile Glu
100 105 110
Ala Gly Cys Arg Asp Vai Ala Ala Leu Thr Ala Met Arg Phe Pro Vai
115 120 125
Trp Ser Arg Ser Ile Ser Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Vai Pro Vai Vai Cys Thr Gly Ala Leu Vai Ala Pro Gly
145 150 155 160
Petição 870170009999, de 15/02/2017, pág. 657/1247
648/788
Asp Vai Ile Vai Ala 165 Asp Asp Asp Gly Vai Vai Vai Vai 170 Pro Lys 175 Asp
Asn Vai Ala Ala Ile Ala Ser Ala Ser Ala Ala Arg Glu Ala Lys Glu
180 185 190
Glu Glu Vai Arg Ala Lys Leu Lys Ala Gly Vai Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Vai Arg Glu Arg Leu Lys Glu Lys Gly Leu Arg Tyr Arg Ala
210 215 220
Ala Asp Glu Gly His
225 <210> 159 <211> 672 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 159
atggcggtag tcgtccagaa tatcgagcgg gcggacggcg cggccatcga caagctggca 60
acatgcggcg tggcgaccgt gcacgaggcg caggggcgca ccggtctgct ggcatcggcc 120
atgcggccga tctacgccgg cgcccagatt gccggatcgg cgatcaccat ttcggcccca 180
cccggcgaca actggatggt gtacgtcgca atcgaacagc tcaagcaggg cgacgtgctg 240
gtgattgccc cgacgagtcc ctgtgaagac ggatacttcg gcgacctgct tgccacttcg 300
gcgatggcgc gcggctgccg cggcctgatc atcgatgcgg gcgtgcgcga cgtgcgcgat 360
ctgaccgcaa tgcgcttccc ggtctggtcc aaggcgatct tcgcgcaggg aaccgtcaag 420
gagacgctcg ggtcggtcaa cgtggcggtc gtgtgcgcca acgcgctggt caaccccggc 480
gacgtgatta tagccgacga cgacggcgtc gtcgtggtgc cacgcgcgca ggccggcgag 540
gtcctgaaga aggcggaagc gcgcatcgca tcggaagaag ccaagcgcaa gcggctggcg 600
gccggcgaac tcggcctcga tctctacgac atgcgcggca gactggccga caagggcctg 660
aagtatgttt ga 672
<210> 160 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 160
Met Ala Vai Vai Vai Gin Asn Ile Glu Arg 10 Ala Asp Gly Ala Ala 15 Ile
1 5
Asp Lys Leu Ala Thr Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Arg Thr Gly Leu Leu Ala Ser Ala Met Arg Pro Ile Tyr Ala Gly Ala
Petição 870170009999, de 15/02/2017, pág. 658/1247
649/788
40 45
Gin Ile 50 Ala Gly Ser Ala Ile 55 Thr Ile Ser Ala Pro 60 Pro Gly Asp Asn
Trp Met Vai Tyr Vai Ala Ile Glu Gin Leu Lys Gin Gly Asp Vai Leu
65 70 75 80
Vai Ile Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Met Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp
100 105 110
Ala Gly Vai Arg Asp Vai Arg Asp Leu Thr Ala Met Arg Phe Pro Vai
115 120 125
Trp Ser Lys Ala Ile Phe Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Vai Ala Vai Vai Cys Ala Asn Ala Leu Vai Asn Pro Gly
145 150 155 160
Asp Vai Ile Ile Ala Asp Asp Asp Gly Vai Vai Vai Vai Pro Arg Ala
165 170 175
Gin Ala Gly Glu Vai Leu Lys Lys Ala Glu Ala Arg Ile Ala Ser Glu
180 185 190
Glu Ala Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Leu
195 200 205
Tyr Asp Met Arg Gly Arg Leu Ala Asp Lys Gly Leu Lys Tyr Vai
210 215 220
<210> 161 <211> 699 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 161
atgagcgtgg tcgtcaccgg catcgcgcgg cctgaccgcg ccgaggtgga aggcttcgct 60
gccatcggcg tggcgaccat ccacgaggcg cagggccgca ccggcctgat gcagtccttc 120
atgcagccga tctataccgg cgcgcacatt ggcgggcccg cggtgacggt ctcgctgccg 180
cccggcgaca actggatgat tcacgtcgcg gtagagcagt gccaggccgg cgacgttctg 240
gtcgtcgccc ccacctcacc ctcggacgtc ggctatttcg gcgagctgct ggcgacctcg 300
ctcgtcgcac gcggcatccg cggcctcgtc atcgaggccg gctgccgcga taaaacggcg 360
ctgactgcga tgcgctttcc cgtttggtcc cgcgcggtct cggcgcaggg aacggtcaag 420
gagacgctcg gctcggtgaa tgtcccactc gtctgcgccg gtgcgctggt aaatcccggt 480
gatctcgtgg tcgccgatga cgacggtgtc gtcgttgtgc cgcgcgacaa ggtcgcggcg 540
gtgcgggcgg catcgcttgc acgcgaggcg aaggaggatg gggtgcgcgc gcggctgcag 600
gccggcgagc tcggactcga cgtctacggc atgcgcgagc gcctgaagga aaaggggctg 660
gtctatcgcg cggcgaacac cgacgggaaa aacggctga 699
<210> 162 <211> 232 <212> PRT
Petição 870170009999, de 15/02/2017, pág. 659/1247
650/788 <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 162
Met Ser Vai Vai Vai Thr Gly Ile Ala Arg Pro Asp Arg Ala Glu Vai
1 5 10 15
Glu Gly Phe Ala Ala Ile Gly Vai Ala Thr Ile His Glu Ala Gin Gly
20 25 30
Arg Thr Gly Leu Met Gin Ser Phe Met Gin Pro Ile Tyr Thr Gly Ala
35 40 45
His Ile Gly Gly Pro Ala Vai Thr Vai Ser Leu Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Vai Ala Vai Glu Gin Cys Gin Ala Gly Asp Vai Leu
65 70 75 80
Vai Vai Ala Pro Thr Ser Pro Ser Asp Vai Gly Tyr Phe Gly Glu Leu
85 90 95
Leu Ala Thr Ser Leu Vai Ala Arg Gly Ile Arg Gly Leu Vai Ile Glu
100 105 110
Ala Gly Cys Arg Asp Lys Thr Ala Leu Thr Ala Met Arg Phe Pro Vai
115 120 125
Trp Ser Arg Ala Vai Ser Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Vai Pro Leu Vai Cys Ala Gly Ala Leu Vai Asn Pro Gly
145 150 155 160
Asp Leu Vai Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Pro Arg Asp
165 170 175
Lys Vai Ala Ala Vai Arg Ala Ala Ser Leu Ala Arg Glu Ala Lys Glu
180 185 190
Asp Gly Vai Arg Ala Arg Leu Gin Ala Gly Glu Leu Gly Leu Asp Vai
195 200 205
Tyr Gly Met Arg Glu Arg Leu Lys Glu Lys Gly Leu Vai Tyr Arg Ala
210 215 220
Ala Asn Thr Asp Gly Lys Asn Gly
225 230 <210> 163 <211> 699 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 163
Petição 870170009999, de 15/02/2017, pág. 660/1247
651/788
atgagtgtcg tcgtcacagg aattccgcgg gcctcggcat ctgagatcga cgcgcttcgc 60
cgctgcgggg tggcgacgat ccacgaggcg caagggcgta ccggccttct gcgcgcgaac 120
atgcggccga tctacgctgg tgcccatgcc gtcggatcgg cggtgaccgt gtcgttgccc 180
ccggccgata actggatgat ccatgtggcg gtcgagcagt gtcaggcagg agacgtcctc 240
gtcgtggccc cgacttcgcc ttcggatgcc ggctactttg gcgagctgct ggcgacctct 300
ctcgccgcgc ggggtgtgcg cggcctcgtt atcgaggctg ggtgccgcga cgtggcggcg 360
ttgacggcaa tgcgttttcc ggtctggtca cgcgccgtct ccgcacaagg gacggtgaag 420
gagacgcttg gttcggtgaa tgtgccgatc atctgcgccg gtgctctcgt gaatccggga 480
gacgttgtcg ttgccgacga tgacggcgtg gtcgttgtgc cacgcatcgg agtggcggat 540
gtcgctgccg cctcggccgc gcgtgaagcg aaggaggatc aggtcagggc gcgcttcaag 600
gcgggcgagc tcgggctcga tatctatagg atgcgcgagc ggctgaagga aaaagggctc 660
gtctaccgta ccgcgggtga tggcccaggc gggggctag 699
<210> 164 <211> 232 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 164
Met 1 Ser Vai Vai Vai 5 Thr Gly Ile Pro Arg 10 Ala Ser Ala Ser Glu 15 Ile
Asp Ala Leu Arg Arg Cys Gly Vai Ala Thr Ile His Glu Ala Gin Gly
20 25 30
Arg Thr Gly Leu Leu Arg Ala Asn Met Arg Pro Ile Tyr Ala Gly Ala
35 40 45
His Ala Vai Gly Ser Ala Vai Thr Vai Ser Leu Pro Pro Ala Asp Asn
50 55 60
Trp Met Ile His Vai Ala Vai Glu Gin Cys Gin Ala Gly Asp Vai Leu
65 70 75 80
Vai Vai Ala Pro Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Glu Leu
85 90 95
Leu Ala Thr Ser Leu Ala Ala Arg Gly Vai Arg Gly Leu Vai Ile Glu
100 105 110
Ala Gly Cys Arg Asp Vai Ala Ala Leu Thr Ala Met Arg Phe Pro Vai
115 120 125
Trp Ser Arg Ala Vai Ser Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Vai Pro Ile Ile Cys Ala Gly Ala Leu Vai Asn Pro Gly
145 150 155 160
Asp Vai Vai Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Pro Arg Ile
165 170 175
Petição 870170009999, de 15/02/2017, pág. 661/1247
652/788
Gly Vai Ala Asp Vai Ala Ala Ala Ser Ala Ala Arg Glu Ala Lys Glu
180 185 190
Asp Gin Vai Arg Ala Arg Phe Lys Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Arg Met Arg Glu Arg Leu Lys Glu Lys Gly Leu Vai Tyr Arg Thr
210 215 220
Ala Gly Asp Gly Pro Gly Gly Gly
225 230 <210> 165 <211> 672 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 165
atgggtgtgg tggtccagaa tatcgcccgc gccgcgcaat ccgtcatcga ccggctcgcg 60
gcttgcggcg tcgcgacggt tcatgaagca caggggcgca aaggcctgct cgccagccgt 120
atgcggccga tctatcccgg cgcccggatc gccgcgagcg cggtgacgat ctcagcgccg 180
cccggtgaca actggatgat tcatgtggcg atcgagcagc tcaagacggg tgacatcctg 240
cttctggcgc cgaccagtcc ttgcgaggac ggctatttcg gcgatctgct tgcgacgtcc 300
gcgatggcgc ggggctgtcg gggattgatc atcgatgctg gcgtgcgcga tgtcgccgac 360
ctggccgcga tgaaattccc tgtctggtcg aaggccatct tcgcgcaggg cacggtcaag 420
gagacagtcg gttccgtgaa tgtgccggtc gtctgcgccg gcgcgctggt caatcccggc 480
gatgtgatcg tcgccgacga tgacggcgtc tgtgtcgtca ggcgcgagga tgcggctgat 540
gtggctgaca aggccgaggc gcgcgtcgcg gccgaagaga gcaagcgcaa gcggctagca 600
tcaggcgagc tcggtctcga catttacgat atgcgccaac ggctcacgga gaaaggcctt 660
agatatgtct ga 672
<210> 166 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 166
Met Gly Vai Vai Vai Gin Asn Ile Ala Arg Ala Ala Gin Ser Vai Ile
1 5 10 15
Asp Arg Leu Ala Ala Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Arg Lys Gly Leu Leu Ala Ser Arg Met Arg Pro Ile Tyr Pro Gly Ala
35 40 45
Arg Ile Ala Ala Ser Ala Vai Thr Ile Ser Ala Pro Pro Gly Asp Asn
Petição 870170009999, de 15/02/2017, pág. 662/1247
653/788
55 60
Trp Met Ile His Vai Ala Ile Glu Gin Leu Lys Thr Gly Asp Ile Leu
65 70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Met Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp
100 105 110
Ala Gly Vai Arg Asp Vai Ala Asp Leu Ala Ala Met Lys Phe Pro Vai
115 120 125
Trp Ser Lys Ala Ile Phe Ala Gin Gly Thr Vai Lys Glu Thr Vai Gly
130 135 140
Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Leu Vai Asn Pro Gly
145 150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Arg Arg Glu
165 170 175
Asp Ala Ala Asp Vai Ala Asp Lys Ala Glu Ala Arg Vai Ala Ala Glu
180 185 190
Glu Ser Lys Arg Lys Arg Leu Ala Ser Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Asp Met Arg Gin Arg Leu Thr Glu Lys Gly Leu Arg Tyr Vai
210 215 220 <210> 167 <211> 672 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 167
atgggcgtcg tggtccagaa catcgcccgc gccgagcgag atgtcatcga ccggcttgcg 60
atctgcggcg tcgcgaccgt gcatgaggcg caagggcgca aggggctgct ggcgagctat 120
atgcggccga tctatcccgg cgcgcggatt gcggcgagcg ccgtcaccat ttcggctccc 180
cccggtgaca actggatggt ccatgtggcg atcgagcagg tgagggaggg cgacatcctg 240
ctgctcgctc cgacgagccc ttgcgaggac gggtattttg gcgacctgct ggcgacctcg 300
gccatggcgc gcggatgccg cgggctggtc atcgatgccg gcgtgcgtga tgtcgccgat 360
ctcacggcga tgcagttccc cgtctggtcg aaggcgatct tcgcacaggg cacggtcaag 420
gagacgctgg gctctgtgaa tgtgccggtc gtctgcgccg gcgcgcttat caatccgggc 480
gatgtcatcg tggcggatga tgacggcgtc tgcgtcgtca ggcgcgagga ggcggccgat 540
gtcgccgcca aggccgaggc gcgcgttggc gccgaggagg ccaagcgcaa gcgtctcgct 600
gccggcgaac tcggactcga catctacgat atgcgcaggc gtctcgccga gaagggattg 660
aaatatgtct ga 672
<210> 168 <211> 223 <212> PRT <213> desconhecido <220>
Petição 870170009999, de 15/02/2017, pág. 663/1247
654/788 <223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 168
Met Gly Vai Vai Vai Gin Asn Ile Ala Arg Ala Glu Arg Asp Vai Ile 15 10 15
Asp Arg Leu Ala Ile Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro Gly Ala
40 45
Arg Ile Ala Ala Ser Ala Vai Thr Ile Ser Ala Pro Pro Gly Asp Asn
55 60
Trp Met Vai His Vai Ala Ile Glu Gin Vai Arg Glu Gly Asp Ile Leu
70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
90 95
Leu Ala Thr Ser Ala Met Ala Arg Gly Cys Arg Gly Leu Vai Ile Asp
100 105 110
Ala Gly Vai Arg Asp Vai Ala Asp Leu Thr Ala Met Gin Phe Pro Vai
115 120 125
Trp Ser Lys Ala Ile Phe Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Leu Ile Asn Pro Gly
145 150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Arg Arg Glu
165 170 175
Glu Ala Ala Asp Vai Ala Ala Lys Ala Glu Ala Arg Vai Gly Ala Glu
180 185 190
Glu Ala Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Asp Met Arg Arg Arg Leu Ala Glu Lys Gly Leu Lys Tyr Vai
210 215 220
<210> 169 <211> 672 <212> DNA <213> desconhecido <220> <223> Proteína obtida <400> 169 atgagtgtgg tcgttcagaa por amostra do ambiente tatcgagcgg gccgatcccg ccatcatcgc cggccttgcc 60
gaatgcggtg tggcgaccgt ccacgaagcg cagggccgca agggcctgct ggcgtcctat 120
atgcgtccca tctactcggg cgcgcgcctg gcagcaagtg ccgtgaccat ttcggcgccg 180
ccctgcgaca actggatgtt gcatgtcgcc attgagaaat tgcgggaggg cgacattctc 240
Petição 870170009999, de 15/02/2017, pág. 664/1247
655/788
gtcctcgccc caacgtcgcc gtctgacgct gggtactttg gcgacctgct ggccacttcg 300
gcgcaggccc gcggctgcaa gggcctgatc attgatgccg gcgtacgcga cgtggccgac 360
ctcacgcgga tgaaattccc cgtctggtcc aaggcgatat ttgcccaggg cacgatcaag 420
gagacgctgg gctcggtcaa tgtgccgatt gtctgcgcgg gcgagctggt caatgccggc 480
gacatcatcg tggccgatga cgatggggtt tgcgttgtgc gccgcgagga ggctgctgcg 540
gtgctcgaag cctcgcagaa gcgcgtggcc aatgaagaga gcacgcgcaa gcgcctcgct 600
gccggggaac tgggactcga catctatgga atgcgccagc ggctgaccga gaaggggttg 660
aagtatgtct ga 672
<210> 170 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 170
Met Ser Vai Vai Vai Gin Asn Ile Glu Arg Ala Asp Pro Ala Ile Ile 15 10 15
Ala Gly Leu Ala Glu Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser Gly Ala
40 45
Arg Leu Ala Ala Ser Ala Vai Thr Ile Ser Ala Pro Pro Cys Asp Asn
55 60
Trp Met Leu His Vai Ala Ile Glu Lys Leu Arg Glu Gly Asp Ile Leu
70 75 80
Vai Leu Ala Pro Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Asp Leu
90 95
Leu Ala Thr Ser Ala Gin Ala Arg Gly Cys Lys Gly Leu Ile Ile Asp
100 105 110
Ala Gly Vai Arg Asp Vai Ala Asp Leu Thr Arg Met Lys Phe Pro Vai
115 120 125
Trp Ser Lys Ala Ile Phe Ala Gin Gly Thr Ile Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Vai Pro Ile Vai Cys Ala Gly Glu Leu Vai Asn Ala Gly
145 150 155 160
Asp Ile Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Arg Arg Glu
165 170 175
Glu Ala Ala Ala Vai Leu Glu Ala Ser Gin Lys Arg Vai Ala Asn Glu
180 185 190
Glu Ser Thr Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Petição 870170009999, de 15/02/2017, pág. 665/1247
656/788
Tyr Gly Met Arg Gin Arg Leu Thr Glu Lys Gly Leu Lys Tyr Vai 210 215 220 <210> 171 <211> 672 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 171
atgaccgtcg tcgtccgcaa cttcgagcgc gcgtcgcccg aagtcgtagc cgtgctgggc 60
gaatgcggcg tggcgacggt gcatgaagcg caaggccgca gcggcctcat gctcgccttc 120
atgcggccga tcttcgcggg cgcccgcatc gccgggccgg cggtgacagt ttccgtcccg 180
ccgggcgaca actggatgat ccatgtggcg atcgagcagt gccgcgaagg cgacgtgctc 240
gtcgtggcgc cgaccagccc ctccgaggac ggctatttcg gcgacctgct cgcgcactcg 300
ctgatggcgc ggggcgtcaa ggggctcgtc attgaggccg gcgttcgcga tctacgcgat 360
ctcaccgaga tgcgctttcc ggtctggtcc cggacgatct ccgcgcaggg aacggtcaag 420
gagacgctcg gctcggtgaa cgtgccgatc gtctgcgccg gcgcggcggt cgatccgggc 480
gacgtagtcg tggccgacga cgacggcgtc tgcatcgtga gacgcgcccg ggcggaagag 540
gtcgcgaaag cggcgcgcga acgcgaggcg aaggagaggg agacgcggcg gcggctggcc 600
gccggcgagc tcggtctcga catctatggc atgcgcgaga agcttgcggc caaagggctg 660
aaatatgtct ga 672
<210> 172 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 172
Met 1 Thr Vai Vai Vai Arg Asn 5 Phe Glu Arg Ala 10 Ser Pro Glu Vai 15 Vai
Ala Vai Leu Gly Glu Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Arg Ser Gly Leu Met Leu Ala Phe Met Arg Pro Ile Phe Ala Gly Ala
35 40 45
Arg Ile Ala Gly Pro Ala Vai Thr Vai Ser Vai Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Vai Ala Ile Glu Gin Cys Arg Glu Gly Asp Vai Leu
65 70 75 80
Vai Vai Ala Pro Thr Ser Pro Ser Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala His Ser Leu Met Ala Arg Gly Vai Lys Gly Leu Vai Ile Glu
Petição 870170009999, de 15/02/2017, pág. 666/1247
657/788
100 105 110
Ala Gly Vai Arg Asp Leu Arg Asp Leu Thr Glu Met Arg Phe Pro Vai
115 120 125
Trp Ser Arg Thr Ile Ser Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Vai Pro Ile Vai Cys Ala Gly Ala Ala Vai Asp Pro Gly
145 150 155 160
Asp Vai Vai Vai Ala Asp Asp Asp Gly Vai Cys Ile Vai Arg Arg Ala
165 170 175
Arg Ala Glu Glu Vai Ala Lys Ala Ala Arg Glu Arg Glu Ala Lys Glu
180 185 190
Arg Glu Thr Arg Arg Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Vai
210 215 220
<210> 173
<211> 672
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 173
atgggcgttg tggtccagaa tgtcggccgc gccgaacaat ccgtcatcga ccggctcgca 60
gcctgtggcg tggcgactgt gcatgaggcg cagggccgcc ggggcctcct cgcgagctac 120
atgcggccga tctattccgg tgcacggatc gccgcgagtg cagtgacgat ctcggcgccg 180
cccagtgaca actggatgct gcatgtggcg atcgagcaat tgaagcaggg cgatctgctt 240
ctgctcgcgc ccaccagccc gtgcgaagac ggctatttcg gtgacctgct cgcgacctct 300
gccgtggcgc gaggttgccg cggcctgatc atcgacgcgg gcgtacgcga tgtcgccgac 360
ctgacggcca tgtcgtttcc ggtctggtcc aaggcgatat ctgcgcaagg caccgtcaag 420
gagacattgg gctcggtgaa tgtgccggtc gtctgcgccg gtgcgctggt caacccaggc 480
gacgtgatcg tggccgacga cgatggcgtc tgcgtcgtgc gccgcgagga ggcggcggag 540
atcgccgaca aggccgaagc gcgcgtcgcg gccgaggaaa gcaagcgggc gcggctggca 600
gccggcgaac ttgggttgga tatctacgac atgcgcaagc ggctcgccga gaaagggctg 660
aagtatgtct ga 672
<210> 174 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 174
Petição 870170009999, de 15/02/2017, pág. 667/1247
658/788
Met Gly Vai Vai Vai Gin Asn Vai Gly Arg Ala 10 Glu Gin Ser Vai 15 Ile
1 5
Asp Arg Leu Ala Ala Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser Gly Ala
35 40 45
Arg Ile Ala Ala Ser Ala Vai Thr Ile Ser Ala Pro Pro Ser Asp Asn
50 55 60
Trp Met Leu His Vai Ala Ile Glu Gin Leu Lys Gin Gly Asp Leu Leu
65 70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Vai Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp
100 105 110
Ala Gly Vai Arg Asp Vai Ala Asp Leu Thr Ala Met Ser Phe Pro Vai
115 120 125
Trp Ser Lys Ala Ile Ser Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Leu Vai Asn Pro Gly
145 150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Arg Arg Glu
165 170 175
Glu Ala Ala Glu Ile Ala Asp Lys Ala Glu Ala Arg Vai Ala Ala Glu
180 185 190
Glu Ser Lys Arg Ala Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Asp Met Arg Lys Arg Leu Ala Glu Lys Gly Leu Lys Tyr Vai
210 215 220 <210> 175 <211> 672 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 175
atgggtgtcg tcgtccagaa tatcgagcgc gccgatcctt cggtcatcga acggctggcg 60
gcatgcgggg ttgctactgt gcacgaagcg cagggacgca agggtctgct ggcgagccat 120
atgcggccga tctatgccgg tgcgcgcctt gcagccagtg ccgtgaccat atcggcgccg 180
ccgggcgata actggatgat ccatgtcgcc atcgaacagc tcagggcggg tgacataatg 240
gtgcttgccc cgacaagtcc ctgcgaggat ggctatttcg gcgacttgct ggcgacgtct 300
gctgcggcgc gaggctgccg ggggctgatc atcgatgcgg gcgtgcgtga cgtggcggac 360
ctgacggcga tgaagtttcc ggtgtggtcg aaggccattt ttgcgcaggg cacggtcaag 420
gaaacgctgg gctcggtcaa tgtgccggtg gtctgcgcgg gagcgctggt caacccgggc 480
gacgtgatcg tggccgatga cgacggcgtc tgcgtcgtgc gacgcgagga agcggccgcg 540
gtggccgaca aggccgaggc gcgcgtggct gcggaagagg acaagcgcag gcgcctggcg 600
Petição 870170009999, de 15/02/2017, pág. 668/1247
659/788 gccggggaac tgggcctcga catctacaag atgcgcgagc gcctggccga gaagggcctc aggtatgtct ga <210> 176 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 176
660
672
Met Gly Vai Vai Vai Gin Asn Ile Glu Arg Ala 10 Asp Pro Ser Vai 15 Ile
1 5
Glu Arg Leu Ala Ala Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Arg Lys Gly Leu Leu Ala Ser His Met Arg Pro Ile Tyr Ala Gly Ala
35 40 45
Arg Leu Ala Ala Ser Ala Vai Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Vai Ala Ile Glu Gin Leu Arg Ala Gly Asp Ile Met
65 70 75 80
Vai Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Ala Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp
100 105 110
Ala Gly Vai Arg Asp Vai Ala Asp Leu Thr Ala Met Lys Phe Pro Vai
115 120 125
Trp Ser Lys Ala Ile Phe Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Leu Vai Asn Pro Gly
145 150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Arg Arg Glu
165 170 175
Glu Ala Ala Ala Vai Ala Asp Lys Ala Glu Ala Arg Vai Ala Ala Glu
180 185 190
Glu Asp Lys Arg Arg Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Arg Tyr Vai
210 215 220
<210> 177
<211> 675
<212> DNA
<213> desconhecido
Petição 870170009999, de 15/02/2017, pág. 669/1247
660/788 <220>
<223> Proteína obtida por amostra do ambiente <400> 177
atggggggcg tagtcgtgca gaacatcgag cgggccgacg cggaaaccat ccgccggctc 60
ggcgaatgcg gtgtggcgac ggtgcacgag gcgcaggggc gcagcgggct gatggcgccc 120
catatgacgc cggtctggcg cggcgcatcg gttgccggtt cggcggtgac gatctccgcc 180
ccgcccggcg acaactggat gctgcacgtg gcgatcgagc aggtgcatga gggcgatatc 240
ctcgtgctgg cgccgaccag tccttccacg gacggctatt tcggcgattt gcttgccacc 300
tcggcgatgg cgcgggggtg tcgcgggctg gtcatcgaag caggcgtgcg cgacgtggcc 360
gacctgacga agatgcggtt ccccgtctgg tcgaaggcgg tccacgcgca gggtacggtc 420
aaagagacgc cgggctcagt caacgtgccg gtcgtctgcg ccggtgccca tgtgcggccg 480
ggcgacgtca tcgtggccga cgatgacggc gtgtgcgtgg tcaggcgcga ggaggcggcg 540
gaaatattga ggaaggccga ggcccgcatc gccaacgaag ccgacaagcg cgagcgtttc 600
gccgccggcg aactcggcct cgacatctac ggcatgcgcg agaagctggc cgccaaggga 660
ttgaaatata tctga 675
<210> 178 <211> 224 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (21)...(173) <223> Demetilmenaquinone metiltransferase <400> 178
Met Gly Gly Vai Vai Vai Gin Asn Ile Glu Arg Ala Asp Ala Glu Thr
1 5 10 15
Ile Arg Arg Leu Gly Glu Cys Gly Vai Ala Thr Vai His Glu Ala Gin
20 25 30
Gly Arg Ser Gly Leu Met Ala Pro His Met Thr Pro Vai Trp Arg Gly
35 40 45
Ala Ser Vai Ala Gly Ser Ala Vai Thr Ile Ser Ala Pro Pro Gly Asp
50 55 60
Asn Trp Met Leu His Vai Ala Ile Glu Gin Vai His Glu Gly Asp Ile
65 70 75 80
Leu Vai Leu Ala Pro Thr Ser Pro Ser Thr Asp Gly Tyr Phe Gly Asp
85 90 95
Leu Leu Ala Thr Ser Ala Met Ala Arg Gly Cys Arg Gly Leu Vai Ile
100 105 110
Glu Ala Gly Vai Arg Asp Vai Ala Asp Leu Thr Lys Met Arg Phe Pro
115 120 125
Vai Trp Ser Lys Ala Vai His Ala Gin Gly Thr Vai Lys Glu Thr Pro
130 135 140
Gly Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala His Vai Arg Pro
Petição 870170009999, de 15/02/2017, pág. 670/1247
661/788
145 150 155 160
Gly Asp Vai Ile Vai 165 Ala Asp Asp Asp Gly Vai Cys Vai Vai Arg Arg
170 175
Glu Glu Ala Ala Glu Ile Leu Arg Lys Ala Glu Ala Arg Ile Ala Asn
180 185 190
Glu Ala Asp Lys Arg Glu Arg Phe Ala Ala Gly Glu Leu Gly Leu Asp
195 200 205
Ile Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Ile
210 215 220
<210> 179 <211> 672 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 179
atgggggtcg tggtccagaa catcgaacgc gccgatcagg ccgtcatcaa ccgccttgcc 60
gcctgcggcg tggccaccgt gcacgaggcg cagggccgca agggcctgct cgccgccaat 120
atgcgtccga tctacagcgg agaacgtctg gcggcctcgg ccgtgacgat ttccgcgccc 180
cccggtgaca actggatggt ccatgtcgcg atcgagcaat tgcaggccgg tgacatcatg 240
gttttggccc ccacctcgcc ctgcgaggac ggctatttcg gtgatcttct ggccacgtcg 300
gctatcgcac gtggctgcaa gggcctgatc atcgatgcgg gcgtgcgcga tgtgtcggat 360
ctgacggcga tgaaattccc cgtctggtcc aaggcgatct tcgcccaagg cacggtcaag 420
gaaacccttg ggtcggtgaa tattcccgtg gtctgcgccg gcgcgctgat caatcccggt 480
gatgtaattg tggccgatga cgacggcgtt tgcgtggtcc gccgcgagga agccgaagcc 540
gttgcagcca aagccgaagc ccgtgtcgca gccgaagaag gcaagcgcgt gcgtctggcc 600
gcgggtgaac tgggccttga tatctataac atgcgcgaac gtctggccga gaagggcctg 660
aaatatgtct ga 672
<210> 180 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 180
Met 1 Gly Vai Vai Vai 5 Gin Asn Ile Glu Arg Ala Asp Gin Ala Vai Ile
10 15
Asn Arg Leu Ala Ala Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Arg Lys Gly Leu Leu Ala Ala Asn Met Arg Pro Ile Tyr Ser Gly Glu
35 40 45
Petição 870170009999, de 15/02/2017, pág. 671/1247
662/788
Arg Leu 50 Ala Ala Ser Ala Vai 55 Thr Ile Ser Ala Pro 60 Pro Gly Asp Asn
Trp Met Vai His Vai Ala Ile Glu Gin Leu Gin Ala Gly Asp Ile Met
65 70 75 80
Vai Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Ile Ala Arg Gly Cys Lys Gly Leu Ile Ile Asp
100 105 110
Ala Gly Vai Arg Asp Vai Ser Asp Leu Thr Ala Met Lys Phe Pro Vai
115 120 125
Trp Ser Lys Ala Ile Phe Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Ile Pro Vai Vai Cys Ala Gly Ala Leu Ile Asn Pro Gly
145 150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Arg Arg Glu
165 170 175
Glu Ala Glu Ala Vai Ala Ala Lys Ala Glu Ala Arg Vai Ala Ala Glu
180 185 190
Glu Gly Lys Arg Vai Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Asn Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Vai
210 215 220 <210> 181 <211> 687 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 181
atgagcggtc atcgcatcgt ccgcaactat ccaaaagcag actcgggcgt cgcctccgct 60
ctgggcgctc tgggcagcgc gaccgtgcac gaggccatgg gccgcgtggg atacgccggc 120
caccgtatcc ggccgatcca gcagggcgtg tcgatcggcg gcaccgccgt aaccgtctcg 180
gtcgcaccgg gtgacaacct gatggttcac gccgcgattg ccgaggccaa cgaaggcgac 240
gtgctggtcg tcgttcccgt gagcgacagc gcgttcggct ttatcggcga cctgatggcg 300
actcagatgc gctctcgccg gctgcgcggt tacgtgacct ccggcggcgt gcgtgatacc 360
gccgagttgg cccgcttggg ttttccggta tggacgaaat acgtctcgtc gcaagggacg 420
gtgaaagata cccccggctc ggtcaatgtg cccgtcgtgc tcgaaggcgt cgtggtccat 480
cctggagacg tcgtggtagc ggacgacgac ggcgtcacca tcgtgccgcg cgagatcgcc 540
gccgacacgc tccaggccgc tcgggcccgc gtggagaagg aagccgcgac ccgatcgcgg 600
tatgcggcgg gcgagctttc actcgacgtc aacaacctgc gcccgaccct cgcagcgctg 660
ggagtggagt atgtcgattt cgggtga 687
<210> 182 <211> 228 <212> PRT <213> desconhecido
Petição 870170009999, de 15/02/2017, pág. 672/1247
663/788 <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> SINAL <222> (1)...(31) <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 182
Met Ser Gly His Arg Ile Vai Arg Asn Tyr Pro Lys Ala Asp Ser Gly
1 5 10 15
Vai Ala Ser Ala Leu Gly Ala Leu Gly Ser Ala Thr Vai His Glu Ala
20 25 30
Met Gly Arg Vai Gly Tyr Ala Gly His Arg Ile Arg Pro Ile Gin Gin
35 40 45
Gly Vai Ser Ile Gly Gly Thr Ala Vai Thr Vai Ser Vai Ala Pro Gly
50 55 60
Asp Asn Leu Met Vai His Ala Ala Ile Ala Glu Ala Asn Glu Gly Asp
65 70 75 80
Vai Leu Vai Vai Vai Pro Vai Ser Asp Ser Ala Phe Gly Phe Ile Gly
85 90 95
Asp Leu Met Ala Thr Gin Met Arg Ser Arg Arg Leu Arg Gly Tyr Vai
100 105 110
Thr Ser Gly Gly Vai Arg Asp Thr Ala Glu Leu Ala Arg Leu Gly Phe
115 120 125
Pro Vai Trp Thr Lys Tyr Vai Ser Ser Gin Gly Thr Vai Lys Asp Thr
130 135 140
Pro Gly Ser Vai Asn Vai Pro Vai Vai Leu Glu Gly Vai Vai Vai His
145 150 155 160
Pro Gly Asp Vai Vai Vai Ala Asp Asp Asp Gly Vai Thr Ile Vai Pro
165 170 175
Arg Glu Ile Ala Ala Asp Thr Leu Gin Ala Ala Arg Ala Arg Vai Glu
180 185 190
Lys Glu Ala Ala Thr Arg Ser Arg Tyr Ala Ala Gly Glu Leu Ser Leu
195 200 205
Asp Vai Asn Asn Leu Arg Pro Thr Leu Ala Ala Leu Gly Vai Glu Tyr
210 215 220
Vai Asp Phe Gly
225 <210> 183
<211> 693
<212> DNA
<213> desconhecido
<220>
Petição 870170009999, de 15/02/2017, pág. 673/1247
664/788 <223> Proteína obtida por amostra do ambiente <400> 183
atgcgcggcg tcgtggtccg gaacattcca cgcgccgacg cgcgcgagat cgcggttctg 60
catgaagcgg gcgtcgccac cgtgcacgag gcgcagagcc gcctcggtct gctcgcttcg 120
tacatgcggc ccatttacga gggcgcatcg attgccggtc cggccgtgac cgtgctcgtg 180
ccgccatcgg acaactggat gctgcacgtc gccgctgaac agtgccagcc cggcgatgtc 240
ctcgtggtcg cgccgacgtc gccgtgcgaa gacggctact tcggcgaact gttggcgacg 300
tcgctggcac agctcggcgt gcgcggactg atcatcgatg cgggctgccg cgacatccgt 360
gcgctcaagg cgatgaattt ccccgtgtgg tcgaaaggga tctcggcgca agggaccgtc 420
aaggaaacgc tcgggtcggt gaacatcccc gtggtgtgcg cgcagcaact ggtgcgaccg 480
ggcgacgtga tcgtggccga tgacgatggc gtcgtggtcg tcgcgttcga gacggtggcg 540
gccgtggcga gcgccgcacg cgcgcgcctc gagaaggaag agaagacgcg cagcgtgctt 600
gcgacaggcc agctcggtct cgactactac gcgatgcgcg agaagcttgc ggcaaagggt 660
ttgcgttacg tcgattccgc tgcgggtctt tga 693
<210> 184 <211> 230 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (21)...(173) <223> Demetilmenaquinone metiltransferase <400> 184
Met Arg Gly Vai Vai Vai Arg Asn Ile Pro Arg Ala Asp Ala Arg Glu
1 5 10 15
Ile Ala Vai Leu His Glu Ala Gly Vai Ala Thr Vai His Glu Ala Gin
20 25 30
Ser Arg Leu Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Glu Gly
35 40 45
Ala Ser Ile Ala Gly Pro Ala Vai Thr Vai Leu Vai Pro Pro Ser Asp
50 55 60
Asn Trp Met Leu His Vai Ala Ala Glu Gin Cys Gin Pro Gly Asp Vai
65 70 75 80
Leu Vai Vai Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Glu
85 90 95
Leu Leu Ala Thr Ser Leu Ala Gin Leu Gly Vai Arg Gly Leu Ile Ile
100 105 110
Asp Ala Gly Cys Arg Asp Ile Arg Ala Leu Lys Ala Met Asn Phe Pro
115 120 125
Vai Trp Ser Lys Gly Ile Ser Ala Gin Gly Thr Vai Lys Glu Thr Leu
130 135 140
Gly Ser Vai Asn Ile Pro Vai Vai Cys Ala Gin Gin Leu Vai Arg Pro
145 150 155 160
Petição 870170009999, de 15/02/2017, pág. 674/1247
665/788
Gly Asp Vai Ile Vai 165 Ala Asp Asp Asp Gly Vai Vai Vai Vai Ala Phe
170 175
Glu Thr Vai Ala Ala Vai Ala Ser Ala Ala Arg Ala Arg Leu Glu Lys
180 185 190
Glu Glu Lys Thr Arg Ser Vai Leu Ala Thr Gly Gin Leu Gly Leu Asp
195 200 205
Tyr Tyr Ala Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Arg Tyr Vai
210 215 220
Asp Ser Ala Ala Gly Leu
225 230 <210> 185 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 185
atgaatcgac cggtggtagt ccggcaagtt gaacagccac cagcggatgc ggttgccgca 60
ctggagaggt atggcgtgac aaccgtccat gaggctcagg gacccggtgg cctcctagcc 120
tcctacatgc gcccgattta cccgggagca gtcatcgccg gttccgcggt cactgtgtct 180
ttacctcctg gcgacaacct catgatccac gtggccgtgg aggtctgtgg tccgggaaac 240
attctggttg ttgcaccgat ctcgccgtgt acggatggct acttcggaga gctgttggca 300
acctctctcc gcgcccacgg tgtgcgaggg cttgtgatcg atgccggatg ccgggacgtg 360
cgctctctca cagaaatgaa atttccggcc tggagccgcg ccgtcagttc acaggggaca 420
gtcaaggcca ccctgggatc ggtgaatgtg ccgattgtgt gcgcgggcgc gcgggtcgag 480
gctggggatg tcatcgtcgc cgatgacgat ggagttgtgg tggtgaagcg cgcgctggcc 540
gaagaggtcg ccgccgcggc ggaacaaagg gttcgcaaag agaatgtgac ccgggaacga 600
cttgcgcgtg gagagctggg actcgatatt tacgacatgc gccaaaagat cgcacaactg 660
ggccttaaat atctctga 678
<210> 186 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 186
Met Asn Arg Pro Vai Vai Vai Arg Gin Vai 10 Glu Gin Pro Pro Ala 15 Asp
1 5
Ala Vai Ala Ala Leu Glu Arg Tyr Gly Vai Thr Thr Vai His Glu Ala
20 25 30
Gin Gly Pro Gly Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro
Petição 870170009999, de 15/02/2017, pág. 675/1247
666/788
40 45
Gly Ala Vai Ile Ala Gly Ser 55 Ala Vai Thr Vai Ser 60 Leu Pro Pro Gly
50
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gly Pro Gly Asn
65 70 75 80
Ile Leu Vai Vai Ala Pro Ile Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Arg Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Ala Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Ile Vai Cys Ala Gly Ala Arg Vai Glu
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Leu Ala Glu Glu Vai Ala Ala Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Asn Vai Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gin Lys Ile Ala Gin Leu Gly Leu Lys Tyr
210 215 220
Leu
225 <210> 187 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 187
atgaatcgac cggtggtagt ccggcaagtt gaacagccac cagcggatgc ggttgccgca 60
ctggagaagt atggcgtgac aaccgtccat gaggctcagg gacccggtgg cctcctagcc 120
tcctacatgc gcccgattta cccgggagca gtcatcgccg gttccgcggt cactgtgtct 180
ttacctcctg gcgacaacct catgatccac gtggccgtgg aggtctgtgg tccgggaaac 240
attctggttg ttgcaccgat ctcgccgtgt acggatggct acttcggaga gctgttggca 300
acctctctcc gcgcccacgg tgtgcgaggg cttgtgatcg atgccggatg ccgggacgtg 360
cgctctctca cagaaatgaa atttccggtc tggagccgcg ccgtcagtcc acaggggaca 420
gtcaaggcca ccctgggatc ggtgaatgtg ccgattgtgt gcgcgggcgc gcgggtcgag 480
gctggggatg tcatcgtcgc cgatgacgat ggagttgtgg tggtgaagcg cgcgctggcc 540
gaagaggtcg ccgccgcggc ggaacaaagg gttcgcaaag agaatgtgac ccgggaacga 600
cttgcgcgtg gagagctggg actcgatatt tacgacatgc gccaaaagat cgcacaactg 660
ggccttaaat atctctga 678
<210> 188
Petição 870170009999, de 15/02/2017, pág. 676/1247
667/788 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 188
Met Asn Arg Pro Vai Vai Vai Arg
5
Ala Vai Ala Ala Leu Glu Lys Tyr
Gin Gly Pro Gly Gly Leu Leu Ala 35 40
Gly Ala Vai Ile Ala Gly Ser Ala 50 55
Asp Asn Leu Met Ile His Vai Ala 65 70
Ile Leu Vai Vai Ala Pro Ile Ser
Glu Leu Leu Ala Thr Ser Leu Arg 100
Ile Asp Ala Gly Cys Arg Asp Vai 115 120
Pro Vai Trp Ser Arg Ala Vai Ser 130 135
Leu Gly Ser Vai Asn Vai Pro Ile
145 150
Ala Gly Asp Vai Ile Vai Ala Asp
165
Arg Ala Leu Ala Glu Glu Vai Ala 180
Lys Glu Asn Vai Thr Arg Glu Arg 195 200
Asp Ile Tyr Asp Met Arg Gin Lys 210 215
Leu
225 <210> 189
<211> 678
<212> DNA
<213> desconhecido
<220>
Gin Vai Glu Gin Pro Pro Ala Asp 10 15
Gly Vai Thr Thr Vai His Glu Ala
30
Ser Tyr Met Arg Pro Ile Tyr Pro
Vai Thr Vai Ser Leu Pro Pro Gly 60
Vai Glu Vai Cys Gly Pro Gly Asn 75 80
Pro Cys Thr Asp Gly Tyr Phe Gly 90 95
Ala His Gly Vai Arg Gly Leu Vai
105 110
Arg Ser Leu Thr Glu Met Lys Phe
125
Pro Gin Gly Thr Vai Lys Ala Thr 140
Vai Cys Ala Gly Ala Arg Vai Glu 155 160
Asp Asp Gly Vai Vai Vai Vai Lys 170 175
Ala Ala Ala Glu Gin Arg Vai Arg
185 190
Leu Ala Arg Gly Glu Leu Gly Leu
205
Ile Ala Gin Leu Gly Leu Lys Tyr 220
Petição 870170009999, de 15/02/2017, pág. 677/1247
668/788 <223> Proteína obtida por amostra do ambiente <400> 189
atgaacaaac cggtggtgat ccggcaactg gagcgggcgc cggctgatgc ggtggcggcg 60
ctcgaaaaat atggtgtgtc caccgtgcat gaagctcagg gacgttgcgg actactcgct 120
tcctacatgc gaccgattta tccgggtgcc gctattgccg ggtcggcggt cacggtgtca 180
cttccgcccg gcgataacct gatgattcac gttgccgtcg aggtttgcca gtccggcgac 240
atactcgtgg ttgcccccac ctcgccttgc tcggacggat acttcgggga gttgttggca 300
acatctttgc gcgcccacgg cgtgaagggg cttgtcattg aggcaggatg ccgtgatgtt 360
cgctcgctca ccgaaatgaa gttcccggtc tggagccgcg ccgtcagttc gcaaggcacc 420
gtgaagtcta acctcggatc ggtgaatgtg ggcatagtct gtgcgggtgc acacattgac 480
gctggcgatg tggtcgtggc agatgacgac ggtgtcgtgg cggtgaagcg cgcatccgcc 540
caagaagtag ttggggcgtg cgaacaacgg gttcgcaagg aagaggcagc ccgtgagcgg 600
ctggcgcggg gagagcttgg cctcgacatc tacggcttgc gcacacgaat cgcggaaatg 660
ggtctcaagt atcaatga 678
<210> 190 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 190
Met Asn Lys Pro Vai Vai Ile Arg Gin Leu Glu Arg Ala Pro Ala Asp
1 5 10 15
Ala Vai Ala Ala Leu Glu Lys Tyr Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gin Ser Gly Asp
65 70 75 80
Ile Leu Vai Vai Ala Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Lys Gly Leu Vai
100 105 110
Ile Glu Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys Ser Asn
130 135 140
Leu Gly Ser Vai Asn Vai Gly Ile Vai Cys Ala Gly Ala His Ile Asp
145 150 155 160
Petição 870170009999, de 15/02/2017, pág. 678/1247
669/788
Ala Gly Asp Vai Vai Vai Ala Asp Asp Asp Gly Vai Vai Ala Vai Lys
165 170 175
Arg Ala Ser Ala Gin Glu Vai Vai Gly Ala Cys Glu Gin Arg Vai Arg
180 185 190
Lys Glu Glu Ala Ala Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Thr Arg Ile Ala Glu Met Gly Leu Lys Tyr
210 215 220
Gin
225 <210> 191 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 191
atgaacaaac cggtggtgat ccggcaactg gagcgggcgc cggctgatgc ggtggcggcg 60
ctcgaaaaat atggtgtgtc caccgtgcat gaagctcagg gacgttgcgg actactcgct 120
tcctacatgc gaccgattta tccgggtgcc gctattgccg ggtcggcggt cacggtgtca 180
cttccgcccg gcgataacct gatgattcac gttgccgtcg aggtttgcca gtccggcgac 240
atactcgtgg ttgcccccac ctcgccttgc tcggacggat acttcgggga gttgttggca 300
acatctttgc gcgcccacgg cgtgaagggg cttgtcattg aggcaggatg ccgtgatgtt 360
cgctcgctca ccgaaatgaa gttcccggtc tggagccgcg ccgtcagttc gcaaggcacc 420
gtgaagtcta acctcggatc ggtgaatgtg ggcatagtct gtgcgggtgc acacattgac 480
gctggcgatg tggtcgtggc agatgacgac ggtgtcgtgg cggtgaagcg cgcatccgcc 540
caagaagtag ttggggcgtg cgaacaacgg gttcgcaagg aagaggcaac ccgtgagcgg 600
ctggcgcggg gagagcttgg cctcgacatc tacggcttgc gcacacgaat cgcggaaatg 660
ggtctcaagt atcaatga 678
<210> 192 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 192
Met Asn Lys Pro Vai Vai Ile Arg Gin Leu Glu Arg Ala Pro Ala Asp
1 5 10 15
Ala Vai Ala Ala Leu Glu Lys Tyr Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro
Petição 870170009999, de 15/02/2017, pág. 679/1247
670/788
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gin Ser Gly Asp
65 70 75 80
Ile Leu Vai Vai Ala Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Lys Gly Leu Vai
100 105 110
Ile Glu Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys Ser Asn
130 135 140
Leu Gly Ser Vai Asn Vai Gly Ile Vai Cys Ala Gly Ala His Ile Asp
145 150 155 160
Ala Gly Asp Vai Vai Vai Ala Asp Asp Asp Gly Vai Vai Ala Vai Lys
165 170 175
Arg Ala Ser Ala Gin Glu Vai Vai Gly Ala Cys Glu Gin Arg Vai Arg
180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Thr Arg Ile Ala Glu Met Gly Leu Lys Tyr
210 215 220
Gin
225
<210> 193
<211> 678
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 193
atgaatacac cggtggtagt ccggcaggtg gagcagccgc cagcaggtgc ggttgccaca 60
ctggagaagt gtggggtgac aaccgtgcat gaggctcaag gacgttgtgg cctgcttgcg 120
ccctacctgc gcccgattta cccgggagca gccatcgccg gttccgcgat caccgtgact 180
ttgcctccgg gcgacaacct catgatccac gttgcggtgg aggtctgcgg tccgggaaac 240
attctcgtag tttcaccgac ctcggcttgc accgatggct acttcggtga gctgttggcc 300
acatctctcc gtgcccacgg tgtgagaggg ctggtgatcg atgccggatg ccgtgatgtg 360
cgctctctaa cagaaatgaa attcccggtc tggagccgcg ccgtcagtcc gcagggcacc 420
gtcaaggcca cgctgggatc ggtgaatgtg cccatcgtgt gcgcgggcgc actggtcgaa 480
gctggtgatg ttatcgtcgc cgatgacgat ggcgtggtgg tggtgaggcg cgcgctggcc 540
gaagaggtcg ccgcggcggc ggaacaaagg gttcagaaag agaatgtgac ccgcgagcgg 600
cttgcacgcg gagagctcgg cctcgatatt tacgacattc gccaacggat cgcgcaactg 660
ggccttaaat atctgtaa 678
<210> 194
Petição 870170009999, de 15/02/2017, pág. 680/1247
671/788 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 194
Met Asn Thr Pro Vai Vai Vai Arg
5
Ala Vai Ala Thr Leu Glu Lys Cys
Gin Gly Arg Cys Gly Leu Leu Ala 35 40
Gly Ala Ala Ile Ala Gly Ser Ala 50 55
Asp Asn Leu Met Ile His Vai Ala 65 70
Ile Leu Vai Vai Ser Pro Thr Ser
Glu Leu Leu Ala Thr Ser Leu Arg 100
Ile Asp Ala Gly Cys Arg Asp Vai 115 120
Pro Vai Trp Ser Arg Ala Vai Ser 130 135
Leu Gly Ser Vai Asn Vai Pro Ile
145 150
Ala Gly Asp Vai Ile Vai Ala Asp
165
Arg Ala Leu Ala Glu Glu Vai Ala 180
Lys Glu Asn Vai Thr Arg Glu Arg 195 200
Asp Ile Tyr Asp Ile Arg Gin Arg 210 215
Leu
225 <210> 195
<211> 678
<212> DNA
<213> desconhecido
<220>
Gin Vai Glu Gin Pro Pro Ala Gly 10 15
Gly Vai Thr Thr Vai His Glu Ala
30
Pro Tyr Leu Arg Pro Ile Tyr Pro
Ile Thr Vai Thr Leu Pro Pro Gly 60
Vai Glu Vai Cys Gly Pro Gly Asn 75 80
Ala Cys Thr Asp Gly Tyr Phe Gly 90 95
Ala His Gly Vai Arg Gly Leu Vai
105 110
Arg Ser Leu Thr Glu Met Lys Phe
125
Pro Gin Gly Thr Vai Lys Ala Thr 140
Vai Cys Ala Gly Ala Leu Vai Glu 155 160
Asp Asp Gly Vai Vai Vai Vai Arg 170 175
Ala Ala Ala Glu Gin Arg Vai Gin
185 190
Leu Ala Arg Gly Glu Leu Gly Leu
205
Ile Ala Gin Leu Gly Leu Lys Tyr 220
Petição 870170009999, de 15/02/2017, pág. 681/1247
672/788 <223> Proteína obtida por amostra do ambiente <400> 195
atgaatacac cggtggtagt ccggcaggtg gagcagccgc cagcaggtgc ggttgccaca 60
ctggagaagt gtggggtgac aaccgtgcat gaggctcaag gacgttgtgg cctgcttgcg 120
ccctacatgc gcccgattta cccgggagca gccatcgccg gttccgcgat caccgtgact 180
ttgcctccgg gcgacaacct catgatccac gttgcggtgg aggtctgcgg tccgggaaac 240
attttggtgg tttcaccgac ctcggcttgc accgatggct acttcggtga gctgttggcc 300
acctctctcc gtgctcacgg tgtgagaggg ctggtgatcg atgccggatg ccgtgatgtg 360
cgctctctaa cagaaatgaa attcccggtc tggagccgcg ccgtcagttc gcagggcacc 420
gtcaaggcca cactgggatc ggtgaatgtg cccatcgtgt gcgcgggcgc actggtcgaa 480
gctggtgatg tcatcgtcgc cgatgacgat ggagtggtgg tggtgaggcg cgcgctggcc 540
gaagaggtcg ccgccgcggc ggaacaaagg gctcagaaag agaatgtgac ccgcgagcga 600
ctggcgcgcg gagagctcgg cctcgatatt tacgacatgc gccaaaagat cgcgcaactg 660
ggccttaaat atccgtaa 678
<210> 196 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 196
Met Asn Thr Pro Vai Vai Vai Arg Gin Vai Glu Gin Pro Pro Ala Gly
1 5 10 15
Ala Vai Ala Thr Leu Glu Lys Cys Gly Vai Thr Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Pro Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Vai Thr Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gly Pro Gly Asn
65 70 75 80
Ile Leu Vai Vai Ser Pro Thr Ser Ala Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Arg Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Ile Vai Cys Ala Gly Ala Leu Vai Glu
145 150 155 160
Petição 870170009999, de 15/02/2017, pág. 682/1247
673/788
Ala Gly Asp Vai Ile Vai 165 Ala Asp Asp Asp Gly Vai Vai Vai Vai Arg
170 175
Arg Ala Leu Ala Glu Glu Vai Ala Ala Ala Ala Glu Gin Arg Ala Gin
180 185 190
Lys Glu Asn Vai Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gin Lys Ile Ala Gin Leu Gly Leu Lys Tyr
210 215 220
Pro
225
<210> 197 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 197
atgaataaac cggtggtaat ccggcaagtg gagcagccac cagcggacgc cgttgcagca 60
ttggagaagt atggcgtcac aaccgtgcat gaggtgcagg gacgctgtgg cctcctcgcg 120
cactacgtgc gtccgattta cgcaggagct gcaatcgcag gttccgctgt tactgtgtcg 180
ttgcctcccg gcgacaacct catgattcat gttgctgtcg aggtctgcgg tcctggaaat 240
attctggttg tttcacccac ctccccttgt acagacggct atttcggtga actgttggca 300
acgtctttgc gcgctcacgg agtgaagggg cttgtgatcg atgccggatg ccgcgacgtt 360
cgctcactga cggagatgaa attcccggtg tggagccggg ccatctgctc acaggggaca 420
gtcaaggcta cactcggatc ggtcaatgtg cccatcatgt gcgcgggcgc actcgtcgaa 480
gccggcgacg tcatcgtggc cgacgatgat ggagtggtgg ttgtgaagcg agcgatggcg 540
attgacgtcg ccgcggccgc cgagcaaagg gttcacaaag agaatacgac ccgcgaacgg 600
cttgcacgtg gagagcttgg gctcgatatt tacgagatgc gtcagaaaat cgtacaactg 660
ggccttaagt attcctga 678
<210> 198 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <220>
<221> SITE <222> (197)...(200) <223> Sítio de N-glicosilação prosítio id = PS00001 <400> 198
Met Asn Lys Pro Vai Vai Ile Arg Gin Vai Glu Gin Pro Pro Ala Asp
Petição 870170009999, de 15/02/2017, pág. 683/1247
674/788
1 5 10 15
Ala Vai Ala Ala Leu Glu Lys Tyr Gly Vai Thr Thr Vai His Glu Vai
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala His Tyr Vai Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gly Pro Gly Asn
65 70 75 80
Ile Leu Vai Vai Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Lys Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Cys Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Ile Met Cys Ala Gly Ala Leu Vai Glu
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Met Ala Ile Asp Vai Ala Ala Ala Ala Glu Gin Arg Vai His
180 185 190
Lys Glu Asn Thr Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Glu Met Arg Gin Lys Ile Vai Gin Leu Gly Leu Lys Tyr
210 215 220
Ser
225 <210> 199 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 199
atgaacaagc ccgtggtggt gcgggacatc gagcggccgc cggcggatgc catcgcggcg 60
ctcgaacggt acggtgtgtc cacggtgcac gaggcgcagg gccgttgcgg gctgctggcc 120
ccttacatgc gtccgatcta tgcgggcgca gcgatcgctg gtcccgccgt tacagtttca 180
cttccgccgg gagacaacct gatgatccac gtcgccgtcg aagtgtgccg tcccggagac 240
atcctggttg tcacgccgac ctcgccgtgc accgacggct attttggaga gttgctcgcg 300
acttcgctgg ctgcgcacgg ggtgaaagga ctggtcattg atgcgggatg ccgcgatgtt 360
cgagcgttga ccgagatgaa atttcccgtc tggagccgcg ccgtgagttc gcagggaacg 420
gtgaaggcta cacttgggtc ggtgaatgtg acgattgcat gcgcgggggc tacggttgag 480
cccggtgacg taatcgtagc ggacgatgat ggcgtcgttg tggtgaaacg ggctgaggcg 540
Petição 870170009999, de 15/02/2017, pág. 684/1247
675/788
caagacgttg tcgccgcatc tgagcagaga gtgcgaaagg aagagggaac ccgtaaacgg 600
ctcgcgcagg gcgaactcgg cttggatatt tacggcttgc gcgcgaagat cgcggacctc 660
ggcctcaagt acttgtag 678
<210> 200
<211> 225
<212> PRT
<213> desconhecido
<220>
<223> Proteína obtida por amostra l do ambiente
<220>
<221> DOMÍNIO
<222> (22) ... (174)
<223> Demetilmenaquinone metiltransferase <220>
<221> SITE <222> (151)...(154) <223> Sítio de N-glicosilação prosítio id = PS00001 <400> 200
Met Asn Lys Pro Vai Vai Vai Arg Asp Ile Glu Arg Pro Pro Ala Asp
1 5 10 15
Ala Ile Ala Ala Leu Glu Arg Tyr Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Pro Tyr Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Arg Pro Gly Asp
65 70 75 80
Ile Leu Vai Vai Thr Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Ala Ala His Gly Vai Lys Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ala Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Thr Ile Ala Cys Ala Gly Ala Thr Vai Glu
145 150 155 160
Pro Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Glu Ala Gin Asp Vai Vai Ala Ala Ser Glu Gin Arg Vai Arg
180 185 190
Lys Glu Glu Gly Thr Arg Lys Arg Leu Ala Gin Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Ala Lys Ile Ala Asp Leu Gly Leu Lys Tyr
Petição 870170009999, de 15/02/2017, pág. 685/1247
676/788
210 215 220
Leu
225 <210> 201 <211> 633 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 201
atgagcaacg atttgcggcg cttcggcgtc tcgacgctgc acgaggcgca aggacggcgc 60
gggttgctcg cgtcatacat gcggccgatc tatccgggcg cgctggtcgc cggtccggcg 120
gtaaccgtcc tcgtgccgcc aggcgacaac ctggtgatcc acgtcgcggt ggaagcgtgc 180
gcgccgggcg acgtcctcgt cgtcgcgccg acgtcgccct gcacggacgg ctattttggc 240
gagctgctgg cgacgtcttt acgcgctcgg aacgtggcgg gcctggtgat cgacgccggc 300
tgccgggatg tccgtgcgct caccgagatg cggttcccgg tctggcgccg cgccatcagc 360
gcgcagggga cggtcaaggc gacgctcggc tctctgaaca cgccgatcgt ctgtgccgga 420
gcgctcgttg cccccggcga tgtcatcgtg gccgacgatg acggagtcgt cgtggtgaag 480
cgggaggaaa tcgcggcggt gacgcaggcg gcggagcagc gcgtccgcaa ggaagagggt 540
acgcgagcga ggctcgcaaa cggtgaactg ggtttggaca tctacggctt gcggcagaag 600
ctggcggacc tgggcctgaa gtcgtcatcg tga 633
<210> 202 <211> 210 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (6)...(158) <223> Demetilmenaquinone metiltransferase <400> 202
Met Ser Asn Asp Leu Arg Arg Phe Gly Vai Ser Thr Leu His Glu Ala
1 5 10 15
Gin Gly Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro
20 25 30
Gly Ala Leu Vai Ala Gly Pro Ala Vai Thr Vai Leu Vai Pro Pro Gly
35 40 45
Asp Asn Leu Vai Ile His Vai Ala Vai Glu Ala Cys Ala Pro Gly Asp
50 55 60
Vai Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
65 70 75 80
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Asn Vai Ala Gly Leu Vai
85 90 95
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ala Leu Thr Glu Met Arg Phe
Petição 870170009999, de 15/02/2017, pág. 686/1247
677/788
100 105 110
Pro Vai Trp Arg Arg Ala Ile Ser Ala Gin Gly Thr Vai Lys Ala Thr
115 120 125
Leu Gly Ser Leu Asn Thr Pro Ile Vai Cys Ala Gly Ala Leu Vai Ala
130 135 140
Pro Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
145 150 155 160
Arg Glu Glu Ile Ala Ala Vai Thr Gin Ala Ala Glu Gin Arg Vai Arg
165 170 175
Lys Glu Glu Gly Thr Arg Ala Arg Leu Ala Asn Gly Glu Leu Gly Leu
180 185 190
Asp Ile Tyr Gly Leu Arg Gin Lys Leu Ala Asp Leu Gly Leu Lys Ser
195 200 205
Ser Ser
210
<210> 203
<211> 699
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 203
atgaccggca ttgtcgtcga gaccatcgag cgcgcgtccc tcgccgacat cgccgcgctg 60
gccgagttcg gcgtcgccac catccacgag gcgcagggcc gcatcggtct cctcgcctcc 120
accatgcgcc cgatctacgc gggtgccgca gccgccggca atgccgtcac cgtgtcggtt 180
ccgcccggcg acaactggat gatccacgtg gccgtcgagc agtgccgcga gggcgacatc 240
ctggtggtgg cccccaccag cccgaacgac aacggctact tcggcgaact gctggcctgc 300
tcgctcaagt cgcgcggcgt gcgcggcctc atcatcgaag ccggctgccg cgacgtgaaa 360
ccgctcaccg agatgaagtt ccccgtctgg tcccgcgccg tctcctccca aggcaccgtc 420
aaggaaagcc tcggcgacgt gaatctgccg ctctcgatcg cgggccagct cgtcaacccc 480
ggcgatgtca tcgtcgccga tgacgacggc gtggtcgtgg tcgcccgcag cgatgtgcgc 540
tcagtcaccg ccaagtcgcg cgaacgcgaa gacaaggaag ccaaaaaccg ggtgcaactc 600
caggccggcc agctcggcat tgacatctat ggcatgcgcg acaagctcaa ggccaaaggc 660
ctgcgctacg tgaaaagcgc ggcggacctg aagggctaa 699
<210> 204 <211> 232 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (21)...(173) <223> Demetilmenaquinone metiltransferase <400> 204
Petição 870170009999, de 15/02/2017, pág. 687/1247
678/788
Met Thr 1 Gly Ile Vai Vai 5 Glu Thr Ile Glu 10 Arg Ala Ser Leu Ala 15 Asp
Ile Ala Ala Leu Ala Glu Phe Gly Vai Ala Thr Ile His Glu Ala Gin
20 25 30
Gly Arg Ile Gly Leu Leu Ala Ser Thr Met Arg Pro Ile Tyr Ala Gly
35 40 45
Ala Ala Ala Ala Gly Asn Ala Vai Thr Vai Ser Vai Pro Pro Gly Asp
50 55 60
Asn Trp Met Ile His Vai Ala Vai Glu Gin Cys Arg Glu Gly Asp Ile
65 70 75 80
Leu Vai Vai Ala Pro Thr Ser Pro Asn Asp Asn Gly Tyr Phe Gly Glu
85 90 95
Leu Leu Ala Cys Ser Leu Lys Ser Arg Gly Vai Arg Gly Leu Ile Ile
100 105 110
Glu Ala Gly Cys Arg Asp Vai Lys Pro Leu Thr Glu Met Lys Phe Pro
115 120 125
Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys Glu Ser Leu
130 135 140
Gly Asp Vai Asn Leu Pro Leu Ser Ile Ala Gly Gin Leu Vai Asn Pro
145 150 155 160
Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Ala Arg
165 170 175
Ser Asp Vai Arg Ser Vai Thr Ala Lys Ser Arg Glu Arg Glu Asp Lys
180 185 190
Glu Ala Lys Asn Arg Vai Gin Leu Gin Ala Gly Gin Leu Gly Ile Asp
195 200 205
Ile Tyr Gly Met Arg Asp Lys Leu Lys Ala Lys Gly Leu Arg Tyr Vai
210 215 220
Lys Ser Ala Ala Asp Leu Lys Gly
225 230 <210> 205 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 205
atgaacacac cggtggtagc aagacaagtg gagcagccac cagcggatgc aattgccgca 60
ttggagaagt gtggagtgac aaccgtccat gaggctcagg gacgttgtgg cctccttgcg 120
tcctacattc gcccgattta cccgggagca gccatcgcag gatccgctat cactgtgtct 180
ttgcctcctg gcgacaacct catgatccac gttgcggtgg aggtctgcgg tccgggaaac 240
atcctggtag tttcaccgac gtcgccttgt acggacggct acttcggtga gttgttggca 300
acatctctcc gtgcccacgg agtgattggg cttgtgatcg atgccggatg ccgtgatgtg 360
cgctctctga cagaaatgaa attcccggtc tggagccgcg ccatctgttc gcaagggaca 420
gtcaaggcca cacttggatc ggtgaatgtg cccatcgtat gcgcgggtgc aatggtcgag 480
Petição 870170009999, de 15/02/2017, pág. 688/1247
679/788 gctggtgatg tcatcgtcgc cgacgatgat ggcgttgtcg ttgtgaagcg agcgctggcg caggagatcg ctgcggcggc ggaacaaagg gttcgcaaag agaatgtaac ccgcgaacga ctcgcacgtg gagatctcgg acttgatatt tacgacatgc gccaaaagat cgcgcaactg ggcctcaaat atctctga <210> 206 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (28)...(174) <223> Demetilmenaquinone metiltransferase <400> 206
540
600
660
678
Met Asn Thr Pro Vai Vai Ala Arg Gin Vai Glu Gin Pro Pro Ala Asp
1 5 10 15
Ala Ile Ala Ala Leu Glu Lys Cys Gly Vai Thr Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Ser Tyr Ile Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gly Pro Gly Asn
65 70 75 80
Ile Leu Vai Vai Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Ile Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Cys Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Ile Vai Cys Ala Gly Ala Met Vai Glu
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Leu Ala Gin Glu Ile Ala Ala Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Asn Vai Thr Arg Glu Arg Leu Ala Arg Gly Asp Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gin Lys Ile Ala Gin Leu Gly Leu Lys Tyr
210 215 220
Leu
225
Petição 870170009999, de 15/02/2017, pág. 689/1247
680/788 <210> 207 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 207 atgaacaaac cggtggtgat ccggcaagtg gagcggccgc cggctgacgc ggtggcggcg 60 ctcgaaaccc atggcgtgtc caccgtgcat gaggcccagg ggcgttgcgg actgctcgct 120 tcctacatgc ggccgattta tcccggcgcc gcgattgccg ggtcggcggt cacggtgtcg 180 cttccgcccg gcgataatct catgattcat gttgccgtgg aggtctgcca atccggcgac 240 attctcgtgg ttgctcccac gtcgccttgt tcggacggtt acttcggtga actcctggca 300 acctccctgc gggcgcacgg cgtcaggggg ctcgttatcg atgcaggttg ccgcgacgtt 360 cgctcgctta ccgagatgaa gttccccgtc tggagccgcg ctgtcagttc gcaaggcacc 420 gtgaaatcca ctctcggatc ggtgaatgtg agcgtcgttt gcgccggagc acgcatcgaa 480 gccggcgatg tggtcgtcgc cgatgacgat ggcgtcgttg tggtggagcg agcacgcgcc 540 cacgaagtag tcgctgcgtg cgaacaacgc attcgcaagg aagaggcaac tcgcgagcgg 600 ctggcgcggg gagaactcgg actcgatatc tacggcttgc gcacaaaaat cgcggagatg 660 ggtctcaagt atcagtga 678 <210> 208 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaguinone metiltransferase <220>
<221> SITE <222> (151)...(154) <223> Sítio de N-glicosilação prosítio id = PS00001 <400> 208
Met Asn Lys Pro Vai Vai Ile Arg Gin Vai Glu Arg Pro Pro Ala Asp
10 15
Ala Vai Ala Ala Leu Glu Thr His Gly Vai Ser Thr Vai His Glu Ala 20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro 35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Vai Thr Vai Ser Leu Pro Pro Gly 50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gin Ser Gly Asp
Ile Leu Vai Vai Ala Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly
Petição 870170009999, de 15/02/2017, pág. 690/1247
681/788
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Arg Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys Ser Thr
130 135 140
Leu Gly Ser Vai Asn Vai Ser Vai Vai Cys Ala Gly Ala Arg Ile Glu
145 150 155 160
Ala Gly Asp Vai Vai Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Glu
165 170 175
Arg Ala Arg Ala His Glu Vai Vai Ala Ala Cys Glu Gin Arg Ile Arg
180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Thr Lys Ile Ala Glu Met Gly Leu Lys Tyr
210 215 220
Gin
225
<210> 209
<211> 678
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 209
atgaatacac cagtggtagt ccgacaggtg cagcagccac cagccgaaac ggtggccgcg 60
ctggagaagt gtggggtgac aacggtgcat gaggctcagg gacgtgctgg cctgcttgcg 120
tcctacatgc gcccgatcta cccgggagca gcgatcgctg gttccgctat cacggtgtct 180
ttgcctcccg gcgacaacct catgatccac gttgcggtgg aggtctgcgg cccgggaaac 240
atcctggtag tttcaccaac ctcgccttct acggatggct acttcggtga gctgttggca 300
acatctctcc gtgcccacgg tgtgagaggg cttgtgatcg atgctggatg ccgtgatgtg 360
cgctctttaa cagaaatgaa attccccgtc tggagccgcg ccatcaattc gcaggggaca 420
gtcaagacca cacttggatc ggtgaatgtg cccatcgttt gcgcgggcgc actggtcgac 480
gctggagatg tcatcgtcgc ggatgacgat ggagttgtag ttgttaagca ggcgatggcg 540
cgagaggttg ccgcggcagc ggaacaaagg gttcgcaaag agaacctgac ccgcgaacga 600
cttgcgcgcg gagaacttgg tctcgacatt tacgagatac gacaaaagat cgcgcaacta 660
ggacttaagt atttgtaa 678
<210> 210 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
Petição 870170009999, de 15/02/2017, pág. 691/1247
682/788 <221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 210
Met Asn Thr Pro Vai Vai Vai Arg Gin Vai Gin Gin Pro Pro Ala Glu
1 5 10 15
Thr Vai Ala Ala Leu Glu Lys Cys Gly Vai Thr Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Ala Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gly Pro Gly Asn
65 70 75 80
Ile Leu Vai Vai Ser Pro Thr Ser Pro Ser Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Arg Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Asn Ser Gin Gly Thr Vai Lys Thr Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Ile Vai Cys Ala Gly Ala Leu Vai Asp
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Gin Ala Met Ala Arg Glu Vai Ala Ala Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Asn Leu Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Glu Ile Arg Gin Lys Ile Ala Gin Leu Gly Leu Lys Tyr
210 215 220
Leu
225 <210> 211 <211> 702 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 211 gtgagcgccg tcatcaggaa cattccacgc tcgccgcccg agctcctcga tcgcttcaag 60 ggcctcggcg ttgcgaccgt ctcggaagcg cagggccgca agggcctttt ggccccgtat 120 atgcgcccga tctatccggg ggccgcgctg atcggcaatg cggtgacggc ctcggtcgcg 180 cccggcgaca attggacgat ccatgtcgcc gtcgaagtct gccaggaagg cgacgcgctc 240
Petição 870170009999, de 15/02/2017, pág. 692/1247
683/788
gtcgtcgcgc ccacctcctt ctgcgaggac ggctatttcg gcgagctact cgccacgtct 300
ctgcagcagc gcggtgtgcg cgggctcatt ctcgaagcag gctgccgcga cgtgcgcgag 360
cttcaaagga tgaattttcc ggtttggtcg cgcgcaatct atgcgcaagg aactgtgaaa 420
gagacggtgg gcgacgtgaa cctgccgctc cgctgcgcag gccagatcgt caatgccggc 480
gatctcattg tcgccgacga cgacggcgtt tgcgtcgtgc cctatgccga tgtcgagaag 540
gtcttgaacg cggcccgcga acgtgcggcg aaggaagaga ggaaccgtgc cgagttcgcc 600
aagggcgtgc tcggcctcga cctctacaaa taccgcgagc gcctcgccgc caagggcctc 660
aaatatttcg acgacatcga ggcgtataag aaggcgaagt ga 702
<210> 212 <211> 233 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 212
Met Ser Ala Vai Ile Arg Asn Ile Pro Arg Ser Pro Pro Glu Leu Leu
1 5 10 15
Asp Arg Phe Lys Gly Leu Gly Vai Ala Thr Vai Ser Glu Ala Gin Gly
20 25 30
Arg Lys Gly Leu Leu Ala Pro Tyr Met Arg Pro Ile Tyr Pro Gly Ala
35 40 45
Ala Leu Ile Gly Asn Ala Vai Thr Ala Ser Vai Ala Pro Gly Asp Asn
50 55 60
Trp Thr Ile His Vai Ala Vai Glu Vai Cys Gin Glu Gly Asp Ala Leu
65 70 75 80
Vai Vai Ala Pro Thr Ser Phe Cys Glu Asp Gly Tyr Phe Gly Glu Leu
85 90 95
Leu Ala Thr Ser Leu Gin Gin Arg Gly Vai Arg Gly Leu Ile Leu Glu
100 105 110
Ala Gly Cys Arg Asp Vai Arg Glu Leu Gin Arg Met Asn Phe Pro Vai
115 120 125
Trp Ser Arg Ala Ile Tyr Ala Gin Gly Thr Vai Lys Glu Thr Vai Gly
130 135 140
Asp Vai Asn Leu Pro Leu Arg Cys Ala Gly Gin Ile Vai Asn Ala Gly
145 150 155 160
Asp Leu Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Pro Tyr Ala
165 170 175
Asp Vai Glu Lys Vai Leu Asn Ala Ala Arg Glu Arg Ala Ala Lys Glu
180 185 190
Glu Arg Asn Arg Ala Glu Phe Ala Lys Gly Vai Leu Gly Leu Asp Leu
195 200 205
Petição 870170009999, de 15/02/2017, pág. 693/1247
684/788
Tyr Lys 210 Tyr Arg Glu Arg Leu 215 Ala Ala Lys Gly Leu Lys Tyr Phe Asp 220
Asp Ile Glu Ala Tyr Lys Lys Ala Lys
225 230
<210> 213 <211> 690 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 213
atgagcgttg tcatcacgaa gattacgcgg ccggacccca aacatgtgga gatgctggct 60
gctttcggtg tcgccaccat tcatgaggcg cagggccgca ccggcctgat gcagtcctac 120
atgcgccccg tctatgccgg cgcccgtgcc gccggcacag ccgtcacggt ctcgctgccc 180
cccgccgaca actggatgat ccatgtcgcc gtggagcagt gccgggaagg cgacattctc 240
gtcgtcgcgc ccacttcgcc ctccgatgtc gggtatttcg gcgagctgct ggcgacctcg 300
ctcgtcgccc gcggcgtccg cggcctcgtc attgaaggcg gctgccgcga tgtcagggcg 360
ctgaccgaga tgcgcttccc ggtctggtcg cgcgccattt ccgcgcaggg caccgtcaag 420
gaaacgctcg gctcggtgaa cgtgccgatc gtttgcgccg gcgcgcatat ccatcccggc 480
gatttcattg ccgccgacga cgatggcgtt gtcgtggtgc gccgcagccg cgtcgccgag 540
atcgccgccg ccgcgatggc gcgcgaagac aaggaaacaa ccgtccgcga gcgcctgaaa 600
gccggagagc ttggcctcga catttacgga atgcgcccgc gtctcaagga aaagggcctc 660
gtctggcgcg agacgccgga gaaggagtag 690
<210> 214 <211> 229 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 214
Met Ser Vai Vai Ile Thr Lys Ile Thr Arg Pro Asp Pro Lys His Vai
1 5 10 15
Glu Met Leu Ala Ala Phe Gly Vai Ala Thr Ile His Glu Ala Gin Gly
20 25 30
Arg Thr Gly Leu Met Gin Ser Tyr Met Arg Pro Vai Tyr Ala Gly Ala
35 40 45
Arg Ala Ala Gly Thr Ala Vai Thr Vai Ser Leu Pro Pro Ala Asp Asn
50 55 60
Trp Met Ile His Vai Ala Vai Glu Gin Cys Arg Glu Gly Asp Ile Leu
65 70 75 80
Vai Vai Ala Pro Thr Ser Pro Ser Asp Vai Gly Tyr Phe Gly Glu Leu
Petição 870170009999, de 15/02/2017, pág. 694/1247
685/788
85 90 95
Leu Ala Thr Ser Leu Vai Ala Arg Gly Vai Arg Gly Leu Vai Ile Glu
100 105 110
Gly Gly Cys Arg Asp Vai Arg Ala Leu Thr Glu Met Arg Phe Pro Vai
115 120 125
Trp Ser Arg Ala Ile Ser Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Ser Vai Asn Vai Pro Ile Vai Cys Ala Gly Ala His Ile His Pro Gly
145 150 155 160
Asp Phe Ile Ala Ala Asp Asp Asp Gly Vai Vai Vai Vai Arg Arg Ser
165 170 175
Arg Vai Ala Glu Ile Ala Ala Ala Ala Met Ala Arg Glu Asp Lys Glu
180 185 190
Thr Thr Vai Arg Glu Arg Leu Lys Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Pro Arg Leu Lys Glu Lys Gly Leu Vai Trp Arg Glu
210 215 220
Thr Pro Glu Lys Glu
225
<210> 215
<211> 702
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 215
gtgagcgccg tcatcaggaa cattccacgc tcgccgctcg agctcctcga tcgcttcaag 60
ggcctcggcg ttgcgaccgt ctcggaagcg cagggccgca agggcctttt ggcctcgtat 120
atgcgcccga tctatccggg ggccgcgctg atcggcaatg cggtgacggc ctcggtcgcg 180
cccggcgaca attggacgat ccatgtcgcc gtcgaagtct gccaggaagg cgacgcgctc 240
gtcgtcgcgc ccacctcctt ctgcgaggac ggctatttcg gcgagctact cgccacgtct 300
ctgcagcagc gcggtgtgcg cgggctcatt ctcgaagcag gctgccgcga cgtgcgcgag 360
cttcaaagga tgaattttcc ggtttggtcg cgcgcaatct atgcgcaagg aactgtgaaa 420
gagacggtgg gcgacgtgaa cctgccgctc cgctgcgcag gccagatcgt caatgccggc 480
gatctcattg tcgccgacga cgacggcgtt tgcgtcgtgc cctatgccga tgtcgagaag 540
gtcttgaacg cggcccgcga acgtgcggcg aaggaagaga ggaaccgtgc cgagttcgcc 600
aagggcgtgc tcggcctcga cctctacaaa taccgcgagc gcctcgccgc caagggcctc 660
aaatatttcg acgacatcga ggcgtataag aaggcgaagt ga 702
<210> 216 <211> 233 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
Petição 870170009999, de 15/02/2017, pág. 695/1247
686/788 <221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 216
Met 1 Ser Ala Vai Ile 5 Arg Asn Ile Pro Arg Ser 10 Pro Leu Glu Leu 15 Leu
Asp Arg Phe Lys Gly Leu Gly Vai Ala Thr Vai Ser Glu Ala Gin Gly
20 25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro Gly Ala
35 40 45
Ala Leu Ile Gly Asn Ala Vai Thr Ala Ser Vai Ala Pro Gly Asp Asn
50 55 60
Trp Thr Ile His Vai Ala Vai Glu Vai Cys Gin Glu Gly Asp Ala Leu
65 70 75 80
Vai Vai Ala Pro Thr Ser Phe Cys Glu Asp Gly Tyr Phe Gly Glu Leu
85 90 95
Leu Ala Thr Ser Leu Gin Gin Arg Gly Vai Arg Gly Leu Ile Leu Glu
100 105 110
Ala Gly Cys Arg Asp Vai Arg Glu Leu Gin Arg Met Asn Phe Pro Vai
115 120 125
Trp Ser Arg Ala Ile Tyr Ala Gin Gly Thr Vai Lys Glu Thr Vai Gly
130 135 140
Asp Vai Asn Leu Pro Leu Arg Cys Ala Gly Gin Ile Vai Asn Ala Gly
145 150 155 160
Asp Leu Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Pro Tyr Ala
165 170 175
Asp Vai Glu Lys Vai Leu Asn Ala Ala Arg Glu Arg Ala Ala Lys Glu
180 185 190
Glu Arg Asn Arg Ala Glu Phe Ala Lys Gly Vai Leu Gly Leu Asp Leu
195 200 205
Tyr Lys Tyr Arg Glu Arg Leu Ala Ala Lys Gly Leu Lys Tyr Phe Asp
210 215 220
Asp Ile Glu Ala Tyr Lys Lys Ala Lys
225 230 <210> 217 <211> 702 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 217 gtgagcgtgg tcatccgaaa cattccgcgc acgccgctcg cgctgctgga cagtttcaaa 60 gggttcggcg ttgcgacgat ctcggaggcg cagggccgca agggcctcat ggcttcttat 120 atgcgtccga tttatccggg agctgagctt gtcggcaatg cggtgacggc ctcggtcgcg 180 cccggcgaca attggacgat ccatgtcgcg atcgaagtct gccaggaagg tgatgtgctc 240
Petição 870170009999, de 15/02/2017, pág. 696/1247
687/788
gtggtcgcgc ctgcctcgtt ttgcgaggat ggctatttcg gcgagcttct cgcgacttcg 300
cttcagcagc gcggcgtgcg cgggctcatt ctcgaagccg gctgccgcga cgtacgcgcg 360
cttcagaaga tgaattttcc ggtttggtcg cgcgcgattt tcgcacaagg aaccgtgaaa 420
gagacggtcg gcgacgtcaa cctgccgctc cactgcgcgg gccagatcgt gcatggcggc 480
gatctcatcg tcgccgatga tgacggcgtc tgcgtcgtgc cgcataccga tgtcgagaag 540
gtcttgagcg cggcgcgcga acgcgcggcg aaggaggagc gaaaccgcgc cgagtttgcc 600
aagggcgtgc tcggcctcga cctctacaaa taccgcgagc gcctcgctca aaagggcctc 660
aagtattacg acgacatcga agcctataac aaagcgaagt ga 702
<210> 218 <211> 233 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 218
Met Ser Vai Vai Ile Arg Asn Ile Pro Arg Thr Pro Leu Ala Leu Leu
1 5 10 15
Asp Ser Phe Lys Gly Phe Gly Vai Ala Thr Ile Ser Glu Ala Gin Gly
20 25 30
Arg Lys Gly Leu Met Ala Ser Tyr Met Arg Pro Ile Tyr Pro Gly Ala
35 40 45
Glu Leu Vai Gly Asn Ala Vai Thr Ala Ser Vai Ala Pro Gly Asp Asn
50 55 60
Trp Thr Ile His Vai Ala Ile Glu Vai Cys Gin Glu Gly Asp Vai Leu
65 70 75 80
Vai Vai Ala Pro Ala Ser Phe Cys Glu Asp Gly Tyr Phe Gly Glu Leu
85 90 95
Leu Ala Thr Ser Leu Gin Gin Arg Gly Vai Arg Gly Leu Ile Leu Glu
100 105 110
Ala Gly Cys Arg Asp Vai Arg Ala Leu Gin Lys Met Asn Phe Pro Vai
115 120 125
Trp Ser Arg Ala Ile Phe Ala Gin Gly Thr Vai Lys Glu Thr Vai Gly
130 135 140
Asp Vai Asn Leu Pro Leu His Cys Ala Gly Gin Ile Vai His Gly Gly
145 150 155 160
Asp Leu Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Pro His Thr
165 170 175
Asp Vai Glu Lys Vai Leu Ser Ala Ala Arg Glu Arg Ala Ala Lys Glu
180 185 190
Glu Arg Asn Arg Ala Glu Phe Ala Lys Gly Vai Leu Gly Leu Asp Leu
195 200 205
Petição 870170009999, de 15/02/2017, pág. 697/1247
688/788
Tyr Lys 210 Tyr Arg Glu Arg Leu 215 Ala Gin Lys Gly Leu Lys Tyr Tyr Asp 220
Asp Ile Glu Ala Tyr Asn Lys Ala Lys
225 230
<210> 219 <211> 672 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 219
atgagcgtgg tcgtgcagaa catcgaacgc gccgacgcgt catttgtggc aacgctcggc 60
gagtgcggcg tggcgaccgt gcacgaggcg caaggtcgaa ctggcttgat gcgcccttac 120
atgcgaccga tctacgccgg cgcccgcatc gccggaccgg cggtgacggt gtcgatcccg 180
cccggcgaca actggatgat ccacgtcgcg gtcgagcagt gccgcgaggg cgatatcctc 240
gtcgtggccc cgaccagccc gagcgaggac ggctatttcg gcgagttgct ggcgcgctcg 300
ctgctcgcgc gcggcgtgag gggtcttgtc atcgaggccg gcgtccgcga cgtacgcgat 360
ctcaccgaga tcaagttccc cgtatggtcc aaagcgatat cggcgcaagg cacggtgaag 420
gagacgatcg gctcggtgaa tgtgccggtc gtatgtgccg gcgccgccat caatcccggc 480
gatgtcatag tcgctgacga cgacggtgtc tgcgtcgtgt cacgcgaacg ggcggaagac 540
gtcgccaagg ccgcgcgcgc ccgcgaagcc aaggaagcgg aaacgcgcaa gcggctgata 600
tcaggcgagc tcggcctcga tatctacggc atgcgcgaga agctcgcggc gaaaggcctc 660
aaatatgcct ga 672
<210> 220 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 220
Met Ser Vai Vai Vai Gin Asn Ile Glu Arg Ala Asp Ala Ser Phe Vai
1 5 10 15
Ala Thr Leu Gly Glu Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Ala Gly Ala
35 40 45
Arg Ile Ala Gly Pro Ala Vai Thr Vai Ser Ile Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Vai Ala Vai Glu Gin Cys Arg Glu Gly Asp Ile Leu
65 70 75 80
Vai Vai Ala Pro Thr Ser Pro Ser Glu Asp Gly Tyr Phe Gly Glu Leu
Petição 870170009999, de 15/02/2017, pág. 698/1247
689/788
85 90 95
Leu Ala Arg Ser Leu Leu Ala Arg Gly Vai Arg Gly Leu Vai Ile Glu
100 105 110
Ala Gly Vai Arg Asp Vai Arg Asp Leu Thr Glu Ile Lys Phe Pro Vai
115 120 125
Trp Ser Lys Ala Ile Ser Ala Gin Gly Thr Vai Lys Glu Thr Ile Gly
130 135 140
Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Ala Ile Asn Pro Gly
145 150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Ser Arg Glu
165 170 175
Arg Ala Glu Asp Vai Ala Lys Ala Ala Arg Ala Arg Glu Ala Lys Glu
180 185 190
Ala Glu Thr Arg Lys Arg Leu Ile Ser Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Ala
210 215 220
<210> 221
<211> 672
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 221
atgagcgtgg tcgtgcagaa catcgaacgc gccgacgcgt cttttgtggc aacgctcggc 60
gagtgcggcg tggcgaccgt gcacgaggcg caaggtcgaa ccggcttgat gcgcccctac 120
atgcgaccga tctacgccgg cgcccgcatc gccgggccgg cggtgacggt gtcgatccca 180
cccggcgaca actggatgat ccacgtcgcg gtcgagcaat gccgcgacgg tgacatcctg 240
gtcgtcgcgc cgaccagccc gagcgaggac ggctatttcg gcgagttgct ggcgcgctcg 300
cttctcgcgc gtggcgtgag aggcctcgtc atcgaggccg gcgtccgcga cgtgcgcgac 360
cttaccgaaa tcggatttcc cgtctggtcg aaggcgatct ccgcacaagg caccgtcaag 420
gagacgctcg gcttggtgaa cgtgccggtt gtctgcgccg gcgctacggt caacccgggc 480
gatgtcatcg tcgcggacga cgacggtgtg tgcgtggtgc cacgcggcaa tgccgaagag 540
gtcgcgaagg ccgcccgcgc ccgcgaggca aaggaggcgg agacgagcaa gcggttgata 600
gcaggtgagc tcggcctcga catctacggc atgcgcgaga agctggcggc caagggcctc 660
aaatatgtct ga 672
<210> 222 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172)
Petição 870170009999, de 15/02/2017, pág. 699/1247
690/788 <223> Demetilmenaquinone metiltransferase <400> 222
Met Ser Vai Vai Vai Gin Asn Ile Glu Arg Ala Asp Ala Ser Phe Vai
1 5 10 15
Ala Thr Leu Gly Glu Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Ala Gly Ala
35 40 45
Arg Ile Ala Gly Pro Ala Vai Thr Vai Ser Ile Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Vai Ala Vai Glu Gin Cys Arg Asp Gly Asp Ile Leu
65 70 75 80
Vai Vai Ala Pro Thr Ser Pro Ser Glu Asp Gly Tyr Phe Gly Glu Leu
85 90 95
Leu Ala Arg Ser Leu Leu Ala Arg Gly Vai Arg Gly Leu Vai Ile Glu
100 105 110
Ala Gly Vai Arg Asp Vai Arg Asp Leu Thr Glu Ile Gly Phe Pro Vai
115 120 125
Trp Ser Lys Ala Ile Ser Ala Gin Gly Thr Vai Lys Glu Thr Leu Gly
130 135 140
Leu Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Thr Vai Asn Pro Gly
145 150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Pro Arg Gly
165 170 175
Asn Ala Glu Glu Vai Ala Lys Ala Ala Arg Ala Arg Glu Ala Lys Glu
180 185 190
Ala Glu Thr Ser Lys Arg Leu Ile Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Vai
210 215 220 <210> 223 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 223
atgaacgagc cgatcgtcgt tcggacgatc gcgcggccgt cggccgaggc gatcgcggcg 60
ctgcagcggt acggcgtgtc gactgtgcat gaagcgcaag gacgacgcgg actgctcggg 120
tctcgcttgc gaccgatcta cagcggcgcg gcgatcgccg gtccagcggt caccgtttcg 180
ctgccgcctg gtgacaacct catgattcac gtcgccgtcg aggtgtgcca gcctggcgac 240
gtgctcgtcg tggccccgac ctccccctgc acggacggct atttcggtga actgttggcc 300
acgtcgtttc gcgcacgcgg cgtcgtcggc ctgatcatcg atgccggctg ccgcgacgtg 360
cgcgcgttgt cggagatgcg ctttcccgtc tggagccgcg cgatcagcgc gcagggtacg 420
gtgaaggcct cgttgggttc ggtgaacgtt gccgtcgtgt gtgggggagc gtccgtcaat 480
Petição 870170009999, de 15/02/2017, pág. 700/1247
691/788 ccaggcgatg cgatcgtggc cgacgatgat ggggtggtgg tcgtggcgcg caacgaggtg gaagcggtgg tgcaggcgtc ggagcagcgc atccggaagg aacaggcgac gcgcgagcgg ctggcgagcg gtgaactggg cctcgatatc tacggcctca ggaaaaaggt gtcggacctc gggctgaaat attcgtga <210> 224 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 224
540
600
660
678
Met Asn Glu Pro Ile Vai Vai Arg Thr Ile Ala Arg Pro Ser Ala Glu
1 5 10 15
Ala Ile Ala Ala Leu Gin Arg Tyr Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Arg Gly Leu Leu Gly Ser Arg Leu Arg Pro Ile Tyr Ser
35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gin Pro Gly Asp
65 70 75 80
Vai Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Phe Arg Ala Arg Gly Vai Vai Gly Leu Ile
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ala Leu Ser Glu Met Arg Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Ser Ala Gin Gly Thr Vai Lys Ala Ser
130 135 140
Leu Gly Ser Vai Asn Vai Ala Vai Vai Cys Gly Gly Ala Ser Vai Asn
145 150 155 160
Pro Gly Asp Ala Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Ala
165 170 175
Arg Asn Glu Vai Glu Ala Vai Vai Gin Ala Ser Glu Gin Arg Ile Arg
180 185 190
Lys Glu Gin Ala Thr Arg Glu Arg Leu Ala Ser Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Lys Lys Vai Ser Asp Leu Gly Leu Lys Tyr
210 215 220
Ser
225
Petição 870170009999, de 15/02/2017, pág. 701/1247
692/788 <210> 225 <211> 672 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 225
atgaacgttg tcgtccggaa tatcgagcgg gccgctgcgg atacgatcgc cgtgcttggc 60
gaatgcggcg tcgcgacggt gcacgaggca cagggccgca gcggcctcat gcgtccctat 120
atgcgaccga tctatacggg cgcgcgcatc gccggctcgg cggtcactgt gtcggtcccg 180
ccgggcgaca actggatgat ccatgtcgcg gtcgaacaat gccacgacgg cgacgtcctc 240
gtcgtggcgc cgaccagccc atgcgatgac ggctatttcg gcgagcttct ggcgcgctcg 300
ctgcgggcgc acggcgtgag aggcctcgtg atcgaggcag gcgtgcgcga cgtgcgcgat 360
ctcaccgaga tgcagttccc ggtctggtcg aaatcgatct ccgcgcaagg gacggtgaag 420
gagacgatcg gctcggtgaa cgtgccggtc gtctgcgcgg gtgccgccgt caatccgggc 480
gacgtcatcg tggccgacga cgatggcgtc tgcgttgtac cgcgaggcca ggcggcagtc 540
gttgccgagg cggcacgcgc gcgcgaggcg aaggaggccg aggtccgcaa gcgcctggtt 600
gccggggagc tcggtctcga catctacggc atgcgcgaac ggctggcggc gaagggcctg 660
aagtatgtct ga 672
<210> 226 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 226
Met 1 Asn Vai Vai Vai 5 Arg Asn Ile Glu Arg Ala Ala Ala Asp Thr Ile
10 15
Ala Vai Leu Gly Glu Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Arg Ser Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Thr Gly Ala
35 40 45
Arg Ile Ala Gly Ser Ala Vai Thr Vai Ser Vai Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Vai Ala Vai Glu Gin Cys His Asp Gly Asp Vai Leu
65 70 75 80
Vai Vai Ala Pro Thr Ser Pro Cys Asp Asp Gly Tyr Phe Gly Glu Leu
85 90 95
Leu Ala Arg Ser Leu Arg Ala His Gly Vai Arg Gly Leu Vai Ile Glu
100 105 110
Ala Gly Vai Arg Asp Vai Arg Asp Leu Thr Glu Met Gin Phe Pro Vai
Petição 870170009999, de 15/02/2017, pág. 702/1247
693/788
115 120 125
Trp Ser Lys Ser Ile Ser Ala Gin Gly Thr Vai Lys Glu Thr Ile Gly
130 135 140
Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Ala Vai Asn Pro Gly
145 150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Pro Arg Gly
165 170 175
Gin Ala Ala Vai Vai Ala Glu Ala Ala Arg Ala Arg Glu Ala Lys Glu
180 185 190
Ala Glu Vai Arg Lys Arg Leu Vai Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Glu Arg Leu Ala Ala Lys Gly Leu Lys Tyr Vai
210 215 220
<210> 227
<211> 678
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 227
atgaacaagc ccgtggttgt gcggaacatc gagcgtccgc cggcggatgc tgtggccgcg 60
cttgagaaat acggcgtgtc gacggtgcac gaggcccagg gccggaacgg cctactggcc 120
tcctatatgc gcccgatcta tgcaggagcc gcgatcgctg gaccagccgt cacagtttcc 180
ctcccgccgg gagacaacct gatgattcac gtcgccgtcg aggtctgtcg gcctggggat 240
gtcctcgttg ttgcgccgac atcgccatgc accgacggct attttggaga gttgcttgca 300
acttcgctcg cggcgcatgg ggtgaaaggc ttagtcattg aggcgggatg tcgcgacgtc 360
cgagctctga cggaaatgaa gtttccagtc tggagccgcg ccgtcagctc gcaaggaacg 420
gtgaaggcaa cacttgggtc ggtaaatgta acgattgttt gtgcgggtgc tgcggttgca 480
cccggtgatg tgatcgtggc ggacgatgat ggcgtcgttg tcgtgaaacg gacagaggcg 540
caagaggtcg ttaccgcatc tgagcagaga ttgcgaaagg aagagggaac ccgcaagcgg 600
cttgcttcgg gggaactcgg cctggatatt tacggcctgc gaccgaagat tgcagacctc 660
ggtctcaagt acttgtag 678
<210> 228 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <220>
<221> SITE <222> (151)...(154)
Petição 870170009999, de 15/02/2017, pág. 703/1247
694/788 <223> Sítio de N-glicosilação prosítio id = PS00001 <400> 228
Met Asn Lys Pro Vai Vai Vai Arg Asn Ile Glu Arg Pro Pro 15 10
Ala Vai Ala Ala Leu Glu Lys Tyr Gly Vai Ser Thr Vai His 20 25 30
Gin Gly Arg Asn Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile 35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala Vai Thr Vai Ser Leu Pro 50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Arg Pro
70 75
Vai Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr
90
Glu Leu Leu Ala Thr Ser Leu Ala Ala His Gly Vai Lys Gly 100 105 110
Ile Glu Ala Gly Cys Arg Asp Vai Arg Ala Leu Thr Glu Met 115 120 125
Pro Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys 130 135 140
Leu Gly Ser Vai Asn Vai Thr Ile Vai Cys Ala Gly Ala Ala
145 150 155
Pro Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai
165 170
Arg Thr Glu Ala Gin Glu Vai Vai Thr Ala Ser Glu Gin Arg 180 185 190
Lys Glu Glu Gly Thr Arg Lys Arg Leu Ala Ser Gly Glu Leu 195 200 205
Asp Ile Tyr Gly Leu Arg Pro Lys Ile Ala Asp Leu Gly Leu 210 215 220
Leu
225 <210> 229 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 229 atgaacaagc ccgtggttgt gcggaacatc gagcgtccgc cggcggatgc cttgagaaat acggcgtgtc gacggtgcac gaggcccagg gccggaacgg tcctatatgc gcccgatcta tgcaggagcc gcgatcgctg gaccagccgt ctcccgccgg gagacaacct gatgattcac gtcgccgtcg aggtctgtcg gtcctcgttg ttgcgccgac atcgccatgc accgacggct attttggaga acttcgctcg cggcgcatgg ggtgaaaggc ttagtcattg aggcgggatg
Ala Asp 15
Glu Ala
Tyr Ala
Pro Gly
Gly Asp
Phe Gly 95
Leu Vai
Lys Phe
Ala Thr
Vai Ala
160 Vai Lys 175
Leu Arg
Gly Leu
Lys Tyr
120
180
240
300
360 tgtggccgcg cctactggcc cacagtttcc gcctggggat gttgcttgca tcgcgacgtc
Petição 870170009999, de 15/02/2017, pág. 704/1247
695/788
cgagctctga cggaaatgaa gtttccagtc tggagccgcg ccgtcagctc gcaaggaacg 420
gtgaaggcaa cacttgggtc ggtaaatgta acgattgttt gtgcgggtgc tgcggttgca 480
cccggtgatg tgatcgtggc ggacgatgat ggcgtcgttg tcgtgaaacg gacagaggcg 540
caagaggccg ttaccgcatc tgagcagaga ttgcgaaagg aagagggaac ccgcaagcgg 600
cttgcttcgg gggaactcgg cctggatatt tacggcctgc gaccgaagat tgcagacctc 660
ggtctcaagt acttgtag 678
<210> 230 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <220>
<221> SITE <222> (151)...(154) <223> Sítio de N-glicosilação prosítio id = PS00001 <400> 230
Met Asn Lys Pro Vai Vai Vai Arg Asn Ile Glu Arg Pro Pro Ala Asp
1 5 10 15
Ala Vai Ala Ala Leu Glu Lys Tyr Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Asn Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Arg Pro Gly Asp
65 70 75 80
Vai Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Ala Ala His Gly Vai Lys Gly Leu Vai
100 105 110
Ile Glu Ala Gly Cys Arg Asp Vai Arg Ala Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Thr Ile Vai Cys Ala Gly Ala Ala Vai Ala
145 150 155 160
Pro Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Thr Glu Ala Gin Glu Ala Vai Thr Ala Ser Glu Gin Arg Leu Arg
180 185 190
Petição 870170009999, de 15/02/2017, pág. 705/1247
696/788
Lys Glu Glu Gly Thr Arg Lys Arg Leu Ala Ser Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Pro Lys Ile Ala Asp Leu Gly Leu Lys Tyr
210 215 220
Leu
225 <210> 231 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 231
atgaatgaac cggtggtaat ccggcaggtg gagcagccac cagcagacgc agttgccgca 60
ttggagaaat gtggcgtgac aaccgtccat gaagctcaag gacgttgtgg cctgcttgcg 120
cactacatgc gtcccatttt cccgggagca accatcgcgg gttccgccgt caccgtgtct 180
ctgcctcccg gtgacaacct catgatccac gttgcggtcg aagtctgcag gccgggaaac 240
atcctggtcg tttcaccgac atcgccgtgc tcggatggct acttcggcga gctattggca 300
acttctctgc gtgctcacgg tgtaagaggg cttgtgatcg acgccggatg cagggacgtc 360
cgctcgctga ctgagatgaa atttcccgtc tggagccgcg ccatcagttc gcagggtacc 420
gtcaaagcca cgctcggatc ggtgaatgtg ccgatcacgt gcgcgggcgc gttagtcgac 480
gcaggtgatg tcattgtcgc tgacgatgat ggagttgtgg ttgtgaagcg cgcgcaggcg 540
caagaggtcg ctgccgcggc ggagcaaagg gttcgcaaag agaacgcgac ccgcgaacga 600
cttgcacgtg gagagctagg actcgatatt tacgacatgc gccagaagat cgcgcaactg 660
ggccttaagt atcggtga 678
<210> 232 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 232
Met Asn Glu Pro Vai Vai Ile Arg Gin Vai Glu Gin Pro Pro Ala Asp
1 5 10 15
Ala Vai Ala Ala Leu Glu Lys Cys Gly Vai Thr Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala His Tyr Met Arg Pro Ile Phe Pro
35 40 45
Gly Ala Thr Ile Ala Gly Ser Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Arg Pro Gly Asn
Petição 870170009999, de 15/02/2017, pág. 706/1247
697/788
70 75 80
Ile Leu Vai Vai Ser 85 Pro Thr Ser Pro Cys 90 Ser Asp Gly Tyr Phe 95 Gly
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Arg Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Ile Thr Cys Ala Gly Ala Leu Vai Asp
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Gin Ala Gin Glu Vai Ala Ala Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gin Lys Ile Ala Gin Leu Gly Leu Lys Tyr
210 215 220
Arg
225 <210> 233 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 233
atgaacaaac cggtggtgat ccggcaagtg gagcggccgc cggctgacgc ggtggcggcg 60
ctcgaaacct atggcgtgtc caccgtgcac gaggcccagg ggcgttgcgg gctgctcgct 120
tcctacatgc ggccgattta tggcggcgcc ctgattgccg ggtcggcggt cacggtgtca 180
cttccgcccg gcgataatct gatgattcac gttgccgtgg aggtctgcca atccggcgac 240
attctcgtgg ttgctcccac gtcgccttgt tcggacggtt acttcggtga acttctggca 300
acctccctgc gggcacacgg cgtcaagggg ctcgtgattg atgcgggttg ccgcgacgtt 360
cggtcgctta ccgaaatgaa gttccccgtc tggagccgcg ctgtcagttc gcaaggaacc 420
gtgaaatcga ctctcggatc ggtgaatgta agcgtcgttt gcgccggagc acgcatcgaa 480
gccggcgatg tggtcgtcgc ggatgacgat ggcgtcgtgg tggtggcgcg ggcacgcgcc 540
cacgaagtag tcgcggcgtg cgaacaacgc attcgcaagg aagaggcaac ccgcgaacgg 600
ctggcgcggg gagaactcgg actcgatatc tacggcttgc gcacaaaaat cgcggagatg 660
ggtctcgagt atcaatga 678
<210> 234 <211> 225 <212> PRT <213> desconhecido <220>
Petição 870170009999, de 15/02/2017, pág. 707/1247
698/788 <223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <220>
<221> SITE <222> (151)...(154) <223> Sítio de N-glicosilação prosítio id = PS00001 <400> 234
Met Asn Lys Pro Vai Vai Ile Arg Gin Vai Glu Arg Pro Pro Ala Asp
1 5 10 15
Ala Vai Ala Ala Leu Glu Thr Tyr Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Gly
35 40 45
Gly Ala Leu Ile Ala Gly Ser Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gin Ser Gly Asp
65 70 75 80
Ile Leu Vai Vai Ala Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Lys Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys Ser Thr
130 135 140
Leu Gly Ser Vai Asn Vai Ser Vai Vai Cys Ala Gly Ala Arg Ile Glu
145 150 155 160
Ala Gly Asp Vai Vai Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Ala
165 170 175
Arg Ala Arg Ala His Glu Vai Vai Ala Ala Cys Glu Gin Arg Ile Arg
180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Thr Lys Ile Ala Glu Met Gly Leu Glu Tyr
210 215 220
Gin
225 <210> 235
<211> 678
<212> DNA
<213> desconhecido
<220>
Petição 870170009999, de 15/02/2017, pág. 708/1247
699/788 <223> Proteína obtida por amostra do ambiente <400> 235
atgaatgaac cggtggtaat ccggcaggtg gagcagccac cagcagacgc agttgccgca 60
ttggagaaat gtggcgtgac aaccgtccat gaagctcaag gacgttgtgg cctgcttgcg 120
cactacatgc gtcccatttt cccgggagca accatcgcgg gttccgccgt caccgtgtct 180
ctgcctcccg gtgacaacct catgatccac gttgcggtcg aagtctgcag gccgggaaac 240
atcctggtcg tttcaccgac atcgccgtgc tcggatggct acttcggcga gctattggca 300
acttctctgc atgctcacgg tgtaagaggg cttgtgatcg acgccggatg cagggacgtc 360
cgctcgctga ctgagatgaa atttcccgtc tggagccgcg ccatcagttc gcagggtacc 420
gtcaaagcca cgctcggatc ggtgaatgtg ccgatcacgt gcgcgggcgc gttagtcgac 480
gcaggtgata tcattgtcgc tgacgatgat ggagttgtgg ttgtgaagcg cgcgcaggcg 540
caagaggtcg ctgccgcggc ggagcaaagg gttcgcaaag agaacgcgac ccgcgaacga 600
cttgcacgtg gagagctagg actcgatatt tacgacatgc gccagaagat cgcacaactg 660
ggccttaagt atcggtga 678
<210> 236 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 236
Met Asn Glu Pro Vai Vai Ile Arg Gin Vai Glu Gin Pro Pro Ala Asp
1 5 10 15
Ala Vai Ala Ala Leu Glu Lys Cys Gly Vai Thr Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala His Tyr Met Arg Pro Ile Phe Pro
35 40 45
Gly Ala Thr Ile Ala Gly Ser Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Arg Pro Gly Asn
65 70 75 80
Ile Leu Vai Vai Ser Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu His Ala His Gly Vai Arg Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Ile Thr Cys Ala Gly Ala Leu Vai Asp
145 150 155 160
Petição 870170009999, de 15/02/2017, pág. 709/1247
700/788
Ala Gly Asp Ile Ile Vai 165 Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
170 175
Arg Ala Gin Ala Gin Glu Vai Ala Ala Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gin Lys Ile Ala Gin Leu Gly Leu Lys Tyr
210 215 220
Arg
225 <210> 237 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 237
atgaacaagc ccgtggtggt ccggcacgtg gagcagccac ctgctgatgc ggtagccgct 60
ttggaaaagt atggcgtgtc aaccgttcat gaggcccagg gacggtcggg tcttctcgcc 120
agttacctgc ggccgatctt tgccggcgcc tcaatcgcag ggccggcggt tacggtctcg 180
ctgccacctg gggacaattt gatgatccac gtcgccgtcg aggtgtgcac gcctggaagc 240
atccttgtcg tcgccccaac ctccccttgt acggacggct atttcggaga gctgctggcg 300
acctcgcttc gcgcacacgg cgtaaagggg ttggtcatcg atgccgggtg tcgcgacgtt 360
aggtctttaa cggaaatgaa ctttcccgtt tggagccgct cggtcagttc gcaaggaacc 420
gtcaaagcga cgttgggatc ggtgaatgta ggcgtcgtct gcgccggtgc atacgtcgag 480
ccaggcgacg tgatcgtcgc ggacgatgac ggagttgtag tcgtgaagcg ggcggctgcg 540
cccgaggctg tcgtcgcctc cgaagcgaga gttcgtaaag aagccgcgac gcgcgagcgt 600
ctctcccgcg gagagcttgg ccttgacatc tacggcctac gttcaaagat tgcggacctt 660
ggcctcgagt atctgtga 678
<210> 238 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaguinone metiltransferase <400> 238
Met Asn Lys 1 Pro Vai 5 Vai Vai Arg His Vai 10 Glu Gin Pro Pro Ala 15 Asp
Ala Vai Ala Ala Leu Glu Lys Tyr Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Ser Gly Leu Leu Ala Ser Tyr Leu Arg Pro Ile Phe Ala
Petição 870170009999, de 15/02/2017, pág. 710/1247
701/788
40 45
Gly Ala 50 Ser Ile Ala Gly Pro 55 Ala Vai Thr Vai Ser 60 Leu Pro Pro Gly
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Thr Pro Gly Ser
65 70 75 80
Ile Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Lys Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Asn Phe
115 120 125
Pro Vai Trp Ser Arg Ser Vai Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Gly Vai Vai Cys Ala Gly Ala Tyr Vai Glu
145 150 155 160
Pro Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Ala Ala Pro Glu Ala Vai Vai Ala Ser Glu Ala Arg Vai Arg
180 185 190
Lys Glu Ala Ala Thr Arg Glu Arg Leu Ser Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Ser Lys Ile Ala Asp Leu Gly Leu Glu Tyr
210 215 220
Leu
225 <210> 239 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 239
atgaacaaac cggtggtgat ccggcaagcg gagcggccgc cggctgacgc ggtggcggcg 60
ctcgcaacct atggcgtgtc caccgtgcat gaggcccagg ggcgttgcgg actgctcgct 120
tcctacatgc ggccgattta tcacggcacc gcgattgccg ggtcggcggt cacggtgtcc 180
cttccgcccg gcgacaatct gatgattcac gttgccgtgg aggtctgcca atccggcgac 240
attctcgtgg tcgctcccac gtcgccctgt tccgacggtt acttcggcga actcctggcc 300
acctctctgc gggcgcacgg cgtcaagggg ctcgttattg atgcgggttg ccgcgacgtt 360
cgctcgctca gcgcaatgaa gttccccgtc tggagccgcg ctgtcagttc gcaaggcacc 420
gtgaaatcta ctctcggatc ggtgaatgtg agcgtcgttt gcgccggagc acgcatcgaa 480
gccggcgacg tggtcgtcgc ggatgacgat ggcgtcgtgg tggtggagcg agcatccgcc 540
cacgaagtag tcgtggcgtg cgaacaacgc cttcgcaagg aagaggcaac tcgcgagcgc 600
ctggcgcggg gagaactcgg actcgacatc tacggcttgc gcacaaaagt cgcggagatg 660
ggtctcaagt atcaatga 678
<210> 240
Petição 870170009999, de 15/02/2017, pág. 711/1247
702/788 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <220>
<221> SITE <222> (151)...(154) <223> Sítio de N-glicosilação prosítio id = PS00001 <400> 240
Met Asn Lys Pro Vai Vai Ile Arg Gin Ala Glu Arg Pro Pro Ala Asp
1 5 10 15
Ala Vai Ala Ala Leu Ala Thr Tyr Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr His
35 40 45
Gly Thr Ala Ile Ala Gly Ser Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gin Ser Gly Asp
65 70 75 80
Ile Leu Vai Vai Ala Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Lys Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Ser Ala Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys Ser Thr
130 135 140
Leu Gly Ser Vai Asn Vai Ser Vai Vai Cys Ala Gly Ala Arg Ile Glu
145 150 155 160
Ala Gly Asp Vai Vai Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Glu
165 170 175
Arg Ala Ser Ala His Glu Vai Vai Vai Ala Cys Glu Gin Arg Leu Arg
180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Thr Lys Vai Ala Glu Met Gly Leu Lys Tyr
210 215 220
Gin
225 <210> 241
Petição 870170009999, de 15/02/2017, pág. 712/1247
703/788 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 241
atgaacaaac cggtggtgat ccggcaagtg gagcggccgc cggctgacgc ggtggcggcg 60
ctcgcaacct atggcgtgtc caccgtgcat gaggcccagg ggcgttgcgg actgctcgct 120
tcctacatgc ggccgattta tcccggcacc gcgattgccg ggtcggcggt cacggtgtcc 180
cttccgcccg gcgacaatct gatgattcac gttgccgtgg aggtctgcca atccggcgac 240
attctcgtgg tcgctcccac gtcgccttgt tcggacggtt acttcggcga actcctggcc 300
acctctctgc gggcgcacga cgtcaagggg ctcgttattg atgcgggttg ccgcgacgtt 360
cgctcgctca gcgcaatgaa gttccccgtc tggagccgcg ctgtcagttc gcaaagcacc 420
gtgaaatcta ctctcggatc ggtgaatgtg agcgtcgttt gcgccggagc acgcatcgaa 480
gccggcgacg tggtcgtcgc ggatgacgat ggcgtcgtgg tggtggagcg agcatccgcc 540
cacgaagtag tcgcggcgtg cgaacaacgc cttcgcaagg aagaggcaac tcgcgagcgc 600
ctggcgcggg gagaactcgg actcgacatc tacggcttgc gcacaaaagt cgcggagatg 660
ggtctcaagt atcaatga 678
<210> 242 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <220>
<221> SITE <222> (151)...(154) <223> Sítio de N-glicosilação prosítio id = PS00001 <400> 242
Met Asn Lys Pro Vai Vai Ile Arg Gin Vai Glu Arg Pro Pro Ala Asp
1 5 10 15
Ala Vai Ala Ala Leu Ala Thr Tyr Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Thr Ala Ile Ala Gly Ser Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gin Ser Gly Asp
65 70 75 80
Ile Leu Vai Vai Ala Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly
85 90 95
Petição 870170009999, de 15/02/2017, pág. 713/1247
704/788
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Asp Vai 105 Lys Gly 110 Leu Vai
100
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Ser Ala Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Vai Ser Ser Gin Ser Thr Vai Lys Ser Thr
130 135 140
Leu Gly Ser Vai Asn Vai Ser Vai Vai Cys Ala Gly Ala Arg Ile Glu
145 150 155 160
Ala Gly Asp Vai Vai Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Glu
165 170 175
Arg Ala Ser Ala His Glu Vai Vai Ala Ala Cys Glu Gin Arg Leu Arg
180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Thr Lys Vai Ala Glu Met Gly Leu Lys Tyr
210 215 220
Gin
225
<210> 243
<211> 678
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 243
atgaacagac ctgtggttgt ccgggaggtg gagcggccgc cggcagatgc tgtgacagcg 60
ctcgagcagt acggggtatc gacggtgcat gaagctcaag ggcgttgcgg gttactcgca 120
tcgtatatgc ggccgattta tgccggagcg gccatcgctg gtcccgccgt gactgtttct 180
ctacctccgg gagacaactt gatgattcac gtggcggtcg aggtctgccg tccgggagac 240
atcctcgttg tggcgccgac gtcgccgtgt acggatggct attttggaga gctgcttgca 300
acttcactcc gagcacatgg cgtgaaagga cttgtgatcg atgcgggatg tcgcgatgtt 360
cgctcgctga ctgagatgaa gtttcccgtg tggagtcgcg cggtgagttc gcagggaacg 420
gtgaaggcga cgctcggatc agtaaatgtg agtatcgtgt gcgccggcgc actcgtcgaa 480
gccggcgatg tcatcatcgc ggatgacgat ggagccgtag ttgtgaggag gacagccgcg 540
aaagacgtgg tcgcggcgtc tgaacagaga gtgcgaaaag aagaggcgac gcgaaggcgg 600
cttgcgcaag gcgaactcgg tctggacatc tacgggttgc gcgcgaaaat cgcggacctc 660
ggtctcaagt acctgtaa 678
<210> 244 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO
Petição 870170009999, de 15/02/2017, pág. 714/1247
705/788 <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <220>
<221> SITE <222> (151)...(154) <223> Sítio de N-glicosilação prosítio id = PS00001 <400> 244
Met Asn Arg Pro Vai Vai Vai Arg Glu Vai Glu Arg Pro Pro Ala Asp
1 5 10 15
Ala Vai Thr Ala Leu Glu Gin Tyr Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Arg Pro Gly Asp
65 70 75 80
Ile Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Lys Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Ser Ile Vai Cys Ala Gly Ala Leu Vai Glu
145 150 155 160
Ala Gly Asp Vai Ile Ile Ala Asp Asp Asp Gly Ala Vai Vai Vai Arg
165 170 175
Arg Thr Ala Ala Lys Asp Vai Vai Ala Ala Ser Glu Gin Arg Vai Arg
180 185 190
Lys Glu Glu Ala Thr Arg Arg Arg Leu Ala Gin Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Ala Lys Ile Ala Asp Leu Gly Leu Lys Tyr
210 215 220
Leu
225 <210> 245 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 245 atgaacaagt ccgtggtggt tcgcaacgtc gagcagcctc ctgccgatgc catggccgcg
Petição 870170009999, de 15/02/2017, pág. 715/1247
706/788
ctcgaaaaat atggcgtttc caccgttcac gaagcgcaag gccgctgcgg cttgctcgcc 120
tcttacatgc gcccaatttt cgggggtgcc tccgtcgccg gccccgcggt caccgtctcc 180
gtgccgcccg gcgacaacct catgattcac gtcgctgtag aagtctgccg cccgggagac 240
attctcgtcg tagcccccac atcgcgctgc accgacggct acttcggcga actactagcc 300
acttcgttgc gcgcccacgg cgtcaaaggc ctcgtcatcg atgccggttg ccgcgacgtc 360
cgctccttga ccgaaatgaa atttcccgtc tggagccgcg ccatcagttc gcaaggcacc 420
gtcaaatcca ctgtgggctc ggtaaacgtc cccgtcgtgt gtgcgggcgc actcatcgca 480
cccggcgacg tcatggtcgc ggatgacgat ggcgttgtcg tcgtgcagcg cgccgccgcc 540
cgcgacgtcg tcgccgcctc ggaacaaagg attcgcaagg aagaagccac acgtgagcgt 600
ctggtgcgcg gtgaactcag cctcgatatc tacggcctgc gcgcaaaact caccgaattg 660
ggtctcacgt acttgtag 678
<210> 246 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <220>
<221> SITE <222> (2)...(5) <223> Sítio de N-glicosilação prosítio id = PS00001 <400> 246
Met 1 Asn Lys Ser Vai Vai Vai Arg Asn Vai Glu Gin Pro Pro Ala 15 Asp
5 10
Ala Met Ala Ala Leu Glu Lys Tyr Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Phe Gly
35 40 45
Gly Ala Ser Vai Ala Gly Pro Ala Vai Thr Vai Ser Vai Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Arg Pro Gly Asp
65 70 75 80
Ile Leu Vai Vai Ala Pro Thr Ser Arg Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Lys Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Ser Ser Gin Gly Thr Vai Lys Ser Thr
130 135 140
Vai Gly Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Leu Ile Ala
Petição 870170009999, de 15/02/2017, pág. 716/1247
707/788
145 150 155 160
Pro Gly Asp Vai Met Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Gin
165 170 175
Arg Ala Ala Ala Arg Asp Vai Vai Ala Ala Ser Glu Gin Arg Ile Arg
180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Vai Arg Gly Glu Leu Ser Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Ala Lys Leu Thr Glu Leu Gly Leu Thr Tyr
210 215 220
Leu
225 <210> 247 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 247
gtgacgggtc cgatcgtcgt tcgcaccatc gacagaccga tggccgatgt cgtcgccgcg 60
ctgcagcgcc atggcgtctc gacggttcac gaagcacaag ggcgacgggg actgctcgcg 120
tcctgcgtgc ggccgatcta tgtgggcgcc gtgattgcgg gtcctgccgt caccgtctcg 180
ctgccacctg gcgacaacct gatgattcac gtcgcggtgg agatgtgtca gcccggcgat 240
gtcctcgtcg tcgccccgac ctctccgtgc accgacggct atttcggcga actgctggcg 300
acctcattgc acgcccgcgg cgtcacggga ctcatcatcg atgccggctg ccgggacgtt 360
cgcgccttga cggacatgcg atttccggtt tggagccgcg cgatcagcgc gcagggcacc 420
gtcaagtcaa cgctcggatc agtgaacgtg ccggtggtgt gcgccggagc gttggtccac 480
gcgggcgacg ccatcgtggc ggatgacgat ggcgtggtgg tggtgagacg ggaagaggcg 540
gggaccgtgt cggaggcgtg cgcggagcgg gcgcgcaagg aagaggccac gagggaacgg 600
ctcgcgcgag gcgagcttgg tctcgatatc tacggcctgc gaaaaaaact caccgacctc 660
ggcctgaagt attcgtag 678
<210> 248 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 248
Met Thr Gly Pro Ile Vai Vai Arg Thr Ile Asp Arg Pro Met Ala Asp 15 10 15
Vai Vai Ala Ala Leu Gin Arg His Gly Vai Ser Thr Vai His Glu Ala
25 30
Petição 870170009999, de 15/02/2017, pág. 717/1247
708/788
Gin Gly Arg Arg 35 Gly Leu Leu Ala 40 Ser Cys Vai Arg Pro 45 Ile Tyr Vai
Gly Ala Vai Ile Ala Gly Pro Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Met Cys Gin Pro Gly Asp
65 70 75 80
Vai Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu His Ala Arg Gly Vai Thr Gly Leu Ile
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ala Leu Thr Asp Met Arg Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Ser Ala Gin Gly Thr Vai Lys Ser Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Leu Vai His
145 150 155 160
Ala Gly Asp Ala Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Arg
165 170 175
Arg Glu Glu Ala Gly Thr Vai Ser Glu Ala Cys Ala Glu Arg Ala Arg
180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Lys Lys Leu Thr Asp Leu Gly Leu Lys Tyr
210 215 220
Ser
225 <210> 249 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 249
atgaacaagt ccgtggtggt tcgcaacgtc gagcagcctc ctgccgatgc catggccgcg 60
ctcgaaaaat atggcgtttc caccgttcac gaagcgcaag gccgctgcgg cttgctcgcc 120
tcttacatgc gcccaatttt cgggggtgcc tccgtcgccg gccccgcggt caccgtctcc 180
gtgccgcccg gcgacaacct catgattcac gtcgctgtag aagtctgccg cccgggagac 240
attctcgtcg tagcccccac atcgccctgc accgacggct acttcggcga actactagcc 300
acttcgttgc gcgcccacgg cgtcaaaggc ctcgtcatcg atgccggttg ccgcgacgtc 360
cgctccttga ccgaaatgaa atttcccgtc tggagccgcg ccatcagttc gcaaggcacc 420
gtcaaatcca ctgtgggctc ggtaaacgtc cccgtcgtgt gtgcgggcgc actcatcgca 480
cccggcgacg tcatggtcgc ggatgacgat ggcgttgtcg tcgtgcagcg cgccgccgcc 540
cgcgacgtcg tcgccgcctc ggaacaaagg attcgcaagg aagaagccac acgtgagcgt 600
ctggtgcgcg gtgaactcgg cctcgatatc tacggcctgc gcgcaaaact caccgaattg 660
ggtgtcacgt acttgtag 678
Petição 870170009999, de 15/02/2017, pág. 718/1247
709/788 <210> 250 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <220>
<221> SITE <222> (2)...(5) <223> Sítio de N-glicosilação prosítio id = PS00001 <400> 250
Met 1 Asn Lys Ser Vai 5 Vai Vai Arg Asn Vai 10 Glu Gin Pro Pro Ala 15 Asp
Ala Met Ala Ala Leu Glu Lys Tyr Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Phe Gly
35 40 45
Gly Ala Ser Vai Ala Gly Pro Ala Vai Thr Vai Ser Vai Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Arg Pro Gly Asp
65 70 75 80
Ile Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Lys Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Ser Ser Gin Gly Thr Vai Lys Ser Thr
130 135 140
Vai Gly Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Leu Ile Ala
145 150 155 160
Pro Gly Asp Vai Met Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Gin
165 170 175
Arg Ala Ala Ala Arg Asp Vai Vai Ala Ala Ser Glu Gin Arg Ile Arg
180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Vai Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Ala Lys Leu Thr Glu Leu Gly Vai Thr Tyr
210 215 220
Leu
225
Petição 870170009999, de 15/02/2017, pág. 719/1247
710/788 <210> 251 <211> 693 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 251
atgaacaagc cggcattcgt tcgccccgta gttgttcgca atgtcgagca accttctgcc 60
gacgcggtag ccgcgctcga aaaatatggc gtctcgaccg ttcatgaagc gcagggccgc 120
tgtggcttgc tcgcttcctg tatccgcccg attttcgcgg gcgccgccgt cgccggtccc 180
gtggtcaccg tttccgtgcc gccaggggac aacctgatga ttcacgtcgc agtggaagtc 240
tgccgcccgg gagatatcct cgtcgtagcc ccaacgtctc cttgcaccga cggctacttc 300
ggcgaactat tggccacttc gcttcgcgcg cacggcgtca agggcttgat tattgacgcc 360
ggctgccgtg acgtccgcgc cctcaccgaa atgaaatttc ccgtctggag ccgcgccgtc 420
agttcgcaag gcactgtcaa atccacgtta ggctcggtga atgtttcagt cgtctgtgcc 480
ggcgcactgg tcgcacccgg cgacgtcatc gtcgccgatg acgacggagt ggtcgtcgtc 540
cagcgcgctg ccgcccgcga ggtagtcgcc gccgcagaac aaaggattcg caaggaagaa 600
gccactcgcg aacgcctcgc gcgcggtgaa ctcggtctcg atatctacag cctgcgcgca 660
aaactcaccg aactcggcct cacctacttg tga 693
<210> 252 <211> 230 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (27)...(179) <223> Demetilmenaquinone metiltransferase <220>
<221> SITE <222> (156)...(159) <223> Sítio de N-glicosilação prosítio id = PS00001 <400> 252
Met Asn 1 Lys Pro Ala 5 Phe Vai Arg Pro Vai Vai Vai Arg Asn Vai Glu
10 15
Gin Pro Ser Ala Asp Ala Vai Ala Ala Leu Glu Lys Tyr Gly Vai Ser
20 25 30
Thr Vai His Glu Ala Gin Gly Arg Cys Gly Leu Leu Ala Ser Cys Ile
35 40 45
Arg Pro Ile Phe Ala Gly Ala Ala Vai Ala Gly Pro Vai Vai Thr Vai
50 55 60
Ser Vai Pro Pro Gly Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai
65 70 75 80
Cys Arg Pro Gly Asp Ile Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr
Petição 870170009999, de 15/02/2017, pág. 720/1247
711/788
85 90 95
Asp Gly Tyr Phe Gly Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly
100 105 110
Vai Lys Gly Leu Ile Ile Asp Ala Gly Cys Arg Asp Vai Arg Ala Leu
115 120 125
Thr Glu Met Lys Phe Pro Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly
130 135 140
Thr Vai Lys Ser Thr Leu Gly Ser Vai Asn Vai Ser Vai Vai Cys Ala
145 150 155 160
Gly Ala Leu Vai Ala Pro Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly
165 170 175
Vai Vai Vai Vai Gin Arg Ala Ala Ala Arg Glu Vai Vai Ala Ala Ala
180 185 190
Glu Gin Arg Ile Arg Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg
195 200 205
Gly Glu Leu Gly Leu Asp Ile Tyr Ser Leu Arg Ala Lys Leu Thr Glu
210 215 220
Leu Gly Leu Thr Tyr Leu
225 230
<210> 253
<211> 702
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 253
atgagcggta tcgtcgtcca ggacttcgag cgcgcatcgc tcgccgacat caaggcgctc 60
gccgagttcg gcgtcgccac gatccacgag gcgcagggcc gcgttggcct gctcgcgtcg 120
tacatgcgcc cgatttatgc gggagctgca gccgccggca atgccgtcac cgtgtcggtg 180
ccgccgggcg acaactggat gatccacgtg gcggtggagg tgtgccgcga gggcgacatc 240
ctcgtggtgg cgccgacctc gccaaacgac aacggctact tcggcgagct gctggcgtct 300
tcactgaaga gccgcggtgt gcgtgggctc gtcatcgagg ccggatgccg cgacgtgaag 360
cccctcaccg acatgaaatt cccggtgtgg tcgcgcgccg tgtccgcgca agggacagtc 420
aaggagagcc tcggcgatgt gaacctcccg cttgtcattg ccgggcagac ggtgaacccc 480
ggcgacgtga tcgtggctga cgacgacggc gttgtcatcg ttggccgcag cgaggtgcgc 540
gccgtgacga ccaaatcgcg cgagcgcgag gagaaggagg ccaagaaccg cttgcagctc 600
accagcggcc agctcggcat cgacatctat ggtatgcgcg gcaagctcaa ggaaaagggg 660
ctgcgctacg tgaagaacgc gagcgagttg aaggccaaat aa 702
<210> 254 <211> 233 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
Petição 870170009999, de 15/02/2017, pág. 721/1247
712/788 <221> DOMÍNIO <222> (21)...(173) <223> Demetilmenaquinone metiltransferase <220>
<221> SITE <222> (229)...(232) <223> Sítio de N-glicosilação prosítio id = PS00001 <400> 254
Met Ser Gly Ile Vai Vai Gin Asp Phe Glu Arg Ala Ser Leu Ala Asp
1 5 10 15
Ile Lys Ala Leu Ala Glu Phe Gly Vai Ala Thr Ile His Glu Ala Gin
20 25 30
Gly Arg Vai Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala Gly
35 40 45
Ala Ala Ala Ala Gly Asn Ala Vai Thr Vai Ser Vai Pro Pro Gly Asp
50 55 60
Asn Trp Met Ile His Vai Ala Vai Glu Vai Cys Arg Glu Gly Asp Ile
65 70 75 80
Leu Vai Vai Ala Pro Thr Ser Pro Asn Asp Asn Gly Tyr Phe Gly Glu
85 90 95
Leu Leu Ala Ser Ser Leu Lys Ser Arg Gly Vai Arg Gly Leu Vai Ile
100 105 110
Glu Ala Gly Cys Arg Asp Vai Lys Pro Leu Thr Asp Met Lys Phe Pro
115 120 125
Vai Trp Ser Arg Ala Vai Ser Ala Gin Gly Thr Vai Lys Glu Ser Leu
130 135 140
Gly Asp Vai Asn Leu Pro Leu Vai Ile Ala Gly Gin Thr Vai Asn Pro
145 150 155 160
Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Ile Vai Gly Arg
165 170 175
Ser Glu Vai Arg Ala Vai Thr Thr Lys Ser Arg Glu Arg Glu Glu Lys
180 185 190
Glu Ala Lys Asn Arg Leu Gin Leu Thr Ser Gly Gin Leu Gly Ile Asp
195 200 205
Ile Tyr Gly Met Arg Gly Lys Leu Lys Glu Lys Gly Leu Arg Tyr Vai
210 215 220
Lys Asn Ala Ser Glu Leu Lys Ala Lys
225 <210> 255 <211> 681 <212> DNA <213> desconhecido <220> 230
<223> Proteína obtida por amostra do <400> 255
Petição 870170009999, de 15/02/2017, pág. 722/1247
713/788
atgaacgatc cgatcgtcgt tcgacagatc gacagaccat caggcccttc ggtcgatagt 60
ctgcgtcgct ttggcgtctc gaccgtgcac gaggcacagg ggcgccgcgg gctgctcgcg 120
tcgcacatgc ggccgattta cgccggtgcg ctcgtcgctg gtccagcgat cactgtcctg 180
gtgccgccgg gcgacaacct gatgattcac gtcgcggtgg aggtgtgcca gccgggtgac 240
gttctcgttg ttgctccgac gtcgccgtgc accgacggct atttcggcga gctgctggcg 300
acctcgctgc gggctcgtgg cgtggcggga ctcatcatcg acgccggttg ccgggatgtt 360
cgggcgctga gcgagatgcg atttcccgtc tggagtcgcg cgatcagcgc gcagggtacc 420
gtcaaggcga cgctgggttc ggtgaacgtg cccctggtgt gcgccggggc gctggtcgag 480
gcgggagaca ttgtcgtcgc cgacgatgac ggcgtcgtga tcgtcaagaa ggatcaggtc 540
gatgcggtca ctcaggcagc cgaacagcgc gtgcgcaaag aagaggacac acgggcgcgg 600
ttggcgcgag gcgagctcgg cctggacatc tacgccttgc gcaagaagct gtcggacctc 660
gggctgaagt cgtcgtcgtg a 681
<210> 256 <211> 226 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 256
Met Asn Asp Pro Ile Vai Vai Arg Gin Ile Asp Arg Pro Ser Gly Pro
1 5 10 15
Ser Vai Asp Ser Leu Arg Arg Phe Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Arg Gly Leu Leu Ala Ser His Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Leu Vai Ala Gly Pro Ala Ile Thr Vai Leu Vai Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gin Pro Gly Asp
65 70 75 80
Vai Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Vai Ala Gly Leu Ile
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ala Leu Ser Glu Met Arg Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Ser Ala Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Leu Vai Cys Ala Gly Ala Leu Vai Glu
145 150 155 160
Ala Gly Asp Ile Vai Vai Ala Asp Asp Asp Gly Vai Vai Ile Vai Lys
165 170 175
Petição 870170009999, de 15/02/2017, pág. 723/1247
714/788
Lys Asp Gin Vai Asp Ala Vai Thr Gin Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Glu Asp Thr Arg Ala Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Ala Leu Arg Lys Lys Leu Ser Asp Leu Gly Leu Lys Ser
210 215 220
Ser Ser
225 <210> 257 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 257
atgaacgatc ccttcgtcgt tcgacaggtg gaccgaccgt cagctgcgtc gatcgacgat 60
ctgcggcgat tcggcgtctc gaccgtgcac gaggcccagg ggcgccgcgg gttgctcgca 120
tcgtacatgc ggccgatcta caccggtgcg ctcgtcgccg gtcctgccat cacggtcctg 180
gtggcgccgg gcgacaacct gatgatccac gtcgcggtgg aggtgtgcca gcctggtgat 240
gtcctcgtcg tcgccccgac gtcgccatgc acggacgggt atttcggcga actgctggcg 300
acctcgttgc gggctcgcgg cgtcgcaggg ctcatcatcg acgccggctg ccgcgatgtt 360
cgagcgttga gcgagatgcg gtttcccgtc tggagtcgcg cgatcagcgc gcagggcacc 420
gtcaaggcga cgctgggttc ggtgaatgtg ccgctgatgt gcgccggaac gctggtcgag 480
gccggagacg tgatcgtggc cgatgatgac ggcgtcgtgg tcgtcaagcg ggagcaggtc 540
gatgccgtaa cgcaggccgc cgaacagcgc gtgcgaaagg aagaggacac acgggcacgg 600
ctcgcgcgag gcgagctggg cctcgacatc tacggcttgc gcaagaaact gtcggacctc 660
ggtttgaagt cgtcgtga 678
<210> 258 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 258
Met Asn Asp Pro Phe Vai Vai Arg Gin Vai Asp Arg Pro Ser Ala Ala
1 5 10 15
Ser Ile Asp Asp Leu Arg Arg Phe Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Thr
35 40 45
Gly Ala Leu Vai Ala Gly Pro Ala Ile Thr Vai Leu Vai Ala Pro Gly
Petição 870170009999, de 15/02/2017, pág. 724/1247
715/788
55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gin Pro Gly Asp
65 70 75 80
Vai Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Vai Ala Gly Leu Ile
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ala Leu Ser Glu Met Arg Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Ser Ala Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Leu Met Cys Ala Gly Thr Leu Vai Glu
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Glu Gin Vai Asp Ala Vai Thr Gin Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Glu Asp Thr Arg Ala Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Lys Lys Leu Ser Asp Leu Gly Leu Lys Ser
210 215 220
Ser
225 <210> 259 <211> 579 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 259
atgcggccca tctatgccgg tgcggcggcc gccggcagcg ccgtcaccgt atccgtacct 60
ccgggcgaca actggatgat ccacgtggcc gtcgaagtct gccgcgaagg cgacgtgctg 120
gtcgtcgccc caacctcgcc atgcgataac ggctacttcg gcgagctgct cgccagctcg 180
ctcaagtccc gtggcgtgcg cgggcttgtc atcgaggcag gctgtcgcga cgtgagagca 240
ctctcggata tgaaattccc ggtctggtcg cgggccgtct ccgcgcaagg cactgtgaag 300
gaaagcctgg gcgacgtgaa cctgccgctc gtgatcgccg gacagctcgt caatccgggc 360
gatgtcgtgg ttgccgacga cgacggcgtc gtcgtcgtgg cgcggttaga agcgcgcgcc 420
gtgaccgcca agtcgcacga acgggagcag aaagaagcag ccaaccgcga gcagctgagc 480
aagggtgagc tcggcatcga tacctacggc atgcgcaaga agctcgccga caaggggctg 540
cgctacgtcg ccaccgccga agaactcaag gcgaagtga 579
<210> 260 <211> 192 <212> PRT <213> desconhecido <220>
Petição 870170009999, de 15/02/2017, pág. 725/1247
716/788 <223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (1)...(132) <223> Demetilmenaquinone metiltransferase <400> 260
Met Arg Pro Ile Tyr Ala Gly Ala Ala Ala Ala Gly Ser Ala Vai Thr
1 5 10 15
Vai Ser Vai Pro Pro Gly Asp Asn Trp Met Ile His Vai Ala Vai Glu
20 25 30
Vai Cys Arg Glu Gly Asp Vai Leu Vai Vai Ala Pro Thr Ser Pro Cys
35 40 45
Asp Asn Gly Tyr Phe Gly Glu Leu Leu Ala Ser Ser Leu Lys Ser Arg
50 55 60
Gly Vai Arg Gly Leu Vai Ile Glu Ala Gly Cys Arg Asp Vai Arg Ala
65 70 75 80
Leu Ser Asp Met Lys Phe Pro Vai Trp Ser Arg Ala Vai Ser Ala Gin
85 90 95
Gly Thr Vai Lys Glu Ser Leu Gly Asp Vai Asn Leu Pro Leu Vai Ile
100 105 110
Ala Gly Gin Leu Vai Asn Pro Gly Asp Vai Vai Vai Ala Asp Asp Asp
115 120 125
Gly Vai Vai Vai Vai Ala Arg Leu Glu Ala Arg Ala Vai Thr Ala Lys
130 135 140
Ser His Glu Arg Glu Gin Lys Glu Ala Ala Asn Arg Glu Gin Leu Ser
145 150 155 160
Lys Gly Glu Leu Gly Ile Asp Thr Tyr Gly Met Arg Lys Lys Leu Ala
165 170 175
Asp Lys Gly Leu Arg Tyr Vai Ala Thr Ala Glu Glu Leu Lys Ala Lys
180 185 190
<210> 261 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 261
atgaatcaac cggcggtagt ccgccacgtg gagcagccac ccgccgacgc ggttgcggcg 60
ctggagaagt atggtgtgac gaccgtgcat gaagctcagg gacgttgtgg cctccttgcc 120
gcgtacatgc gtccgatttt cccgggagcg gccatcgccg gctccgctgt caccgtgtcg 180
ttgcctcccg gcgacaacct catgatccat gtcgcggtcg aggtctgcag gccgggaaac 240
atcctggtcg tttcacccac ctcgccttgt accgacggat acttcggtga actgttggca 300
acttctctgc gagctcacgg cgtgcaaggt cttgtgattg atgccggatg ccgcgacgtt 360
cgaccgctga ctgagatgaa attcccggtc tggagccgga ccatcagctc gcaggggacg 420
gtcaaggcca cactcggatc ggtcaatgtc ccgatcatgt gcgcgggcgc actcgtcgaa 480
Petição 870170009999, de 15/02/2017, pág. 726/1247
717/788 gctggcgacg tcatcatcgc cgatgacgat ggggtcgtgg ttgtcaagcg tgcagacgcg caccaggtcg ctgctgctgc ggaacaaagg gttcggaaag agaatgtgac ccgtgagcga cttgcgcgtg gagagctagg actcgatatc tacgacatgc gccagaaaat cgcgcaactg ggcctcaaat acctgtaa <210> 262 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 262
540
600
660
678
Met Asn Gin Pro Ala Vai Vai Arg His Vai Glu Gin Pro Pro Ala Asp
1 5 10 15
Ala Vai Ala Ala Leu Glu Lys Tyr Gly Vai Thr Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Phe Pro
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Arg Pro Gly Asn
65 70 75 80
Ile Leu Vai Vai Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Gin Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Pro Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Thr Ile Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Ile Met Cys Ala Gly Ala Leu Vai Glu
145 150 155 160
Ala Gly Asp Vai Ile Ile Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Asp Ala His Gin Vai Ala Ala Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Asn Vai Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gin Lys Ile Ala Gin Leu Gly Leu Lys Tyr
210 215 220
Leu
225
Petição 870170009999, de 15/02/2017, pág. 727/1247
718/788 <210> 263 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 263
atgaataaac cggtggtagt tcgtcaagtg gagcagccac caacggatgc ggttacggca 60
ctagaaaagt atggcgtgac gaccgtgcat gaagcccagg gacgttgtgg cctccttgcc 120
tcctacatgc gtccgatttt tccgggagcg agcatcgcgg gttctgccgt cactgtgtct 180
ttgcctcctg gcgacaacct gatgatccac gtggcggtcg aggtctgtgg tccgggaaat 240
atcctcgtcg tttcgccgac ttcgccttgt accgatggct acttcggtga attgttggcc 300
acttccctgc gtgcccgagg tgtccaagga ttagtcatcg atgccggatg ccgtgacgtc 360
cgctcgctga cggagatgaa attcccggtc tggagtcgtg ccatcagctc gcagggcaca 420
gtcaaagcca cccttggatc ggtgaacgtg ccgatcatgt gtgcgggtgc gtccgtggaa 480
gcgggcgatg taattgtggc cgatgatgat ggagttgttg tcgtgaagcg tgcggccgca 540
caagacgtcg ctgcggccgc ggaacaaagg gttcgcaagg aaaacgcgac ccgcgaacgt 600
cttgcacgcg gcgaactcgg actcgatatc tacgacatgc gccagaagat cgcgcagctg 660
ggcctcaaat atctgtga 678
<210> 264 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 264
Met 1 Asn Lys Pro Vai Vai Vai 5 Arg Gin Vai 10 Glu Gin Pro Pro Thr 15 Asp
Ala Vai Thr Ala Leu Glu Lys Tyr Gly Vai Thr Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Phe Pro
35 40 45
Gly Ala Ser Ile Ala Gly Ser Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gly Pro Gly Asn
65 70 75 80
Ile Leu Vai Vai Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Vai Gin Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
Petição 870170009999, de 15/02/2017, pág. 728/1247
719/788
115 120 125
Pro Vai 130 Trp Ser Arg Ala Ile 135 Ser Ser Gin Gly Thr 140 Vai Lys Ala Thr
Leu Gly Ser Vai Asn Vai Pro Ile Met Cys Ala Gly Ala Ser Vai Glu
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Ala Ala Gin Asp Vai Ala Ala Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gin Lys Ile Ala Gin Leu Gly Leu Lys Tyr
210 215 220
Leu
225 <210> 265 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 265
atgacgggtc ctatcgtcgt gcgtcacatc gaacggccac cggcagctgc cgtggcacgg 60
ctgcaggagt acggcgtggc gacggtccac gaagcgcaag gacgccgcgg gttgctggcc 120
gcctatatgc gaccgatcta tgcgggcgca gccattgcgg gccctgcggt cacggtgtcc 180
gttccgccgg gcgacaacct gatgatccac gtcgcggtgg aggtctgcca gccgggagac 240
gtgctcgtcg tcgctcccac gtcaccgtgc acggacggct acttcggcga gctgctcgcg 300
acctcgctgc aggctcatgg cgtcgtcgcg ctcgtcatcg acgccggatg ccgagatgtg 360
cgtgccatga cagagatgcg cttccccgtc tggagccgcg cagtcagttc gcagggcacc 420
gtgaaagcga cgctggggtc ggtgaacgtg ccggtggcat gtgcgggcac gctcgtgaat 480
cccggcgatg tcgtcatagc ggatgatgac ggcgttgtgg tggtgaggcg agacgaggtg 540
gaagagaccg tgagctcgtc ggaaaagcgg atccagaaag aggcgattac gcgagagcgg 600
ctcgccagcg gcgagctcgg gctggatatc tacgggctgc ggaagaaact cgccgacctc 660
ggactgaagt actcataa 678
<210> 266 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 266
Petição 870170009999, de 15/02/2017, pág. 729/1247
720/788
Met 1 Thr Gly Pro Ile 5 Vai Vai Arg His Ile 10 Glu Arg Pro Pro Ala 15 Ala
Ala Vai Ala Arg Leu Gin Glu Tyr Gly Vai Ala Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Arg Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala Vai Thr Vai Ser Vai Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gin Pro Gly Asp
65 70 75 80
Vai Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Gin Ala His Gly Vai Vai Ala Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ala Met Thr Glu Met Arg Phe
115 120 125
Pro Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Vai Ala Cys Ala Gly Thr Leu Vai Asn
145 150 155 160
Pro Gly Asp Vai Vai Ile Ala Asp Asp Asp Gly Vai Vai Vai Vai Arg
165 170 175
Arg Asp Glu Vai Glu Glu Thr Vai Ser Ser Ser Glu Lys Arg Ile Gin
180 185 190
Lys Glu Ala Ile Thr Arg Glu Arg Leu Ala Ser Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Lys Lys Leu Ala Asp Leu Gly Leu Lys Tyr
210 215 220
Ser
225 <210> 267 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 267
atgaatacac cgttggtagt ccgacaagtc gagcagccac cagcggacgc ggttgcggca 60
ttggaaaagt gcggagtcac aaccgtgcat gaggctcagg gacgtggtgg cctctttgcc 120
tcctacatgc gcccgattta cccgggagca accatcgcag gatccgccat cacagtgtct 180
gtgcctccgg gcgacaacct tatgatccat gtggctgtgg aagtctgcgg tgcgggaaac 240
atcctggtgg tttcaccaac ctccccttgt acggatggat acttcggtga gctgttggca 300
acatctcttc gcgcccacgg tgtgaggggg cttgtgatcg atgccggatg tcgtgatgtg 360
cgctctctga cggatatgaa atttccggtt tggagtcgca ccgtcagttc gcaagggaca 420
gtcaaggcca cactcggatc ggtgaatgta cccatcgttt gtgcgggcgc gatggttgag 480
Petição 870170009999, de 15/02/2017, pág. 730/1247
721/788 gccggtgatg tgatcgtcgc cgacgacgat ggagttgtgg tggtgaagcg cgcgctggcg ccagaggtcg ccgcggcggc gcaacaaagg gttcgcaaag agaatttggc ccgcgaacga cttggacgcg gagaactcgg actcgacatt tatgacatgc gcgaaaagat cgcgaaactg ggccttaagt atttgtaa <210> 268 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 268
540
600
660
678
Met Asn Thr Pro Leu Vai Vai Arg Gin Vai Glu Gin Pro Pro Ala Asp
1 5 10 15
Ala Vai Ala Ala Leu Glu Lys Cys Gly Vai Thr Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Gly Gly Leu Phe Ala Ser Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Thr Ile Ala Gly Ser Ala Ile Thr Vai Ser Vai Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gly Ala Gly Asn
65 70 75 80
Ile Leu Vai Vai Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Arg Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Asp Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Thr Vai Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Ile Vai Cys Ala Gly Ala Met Vai Glu
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Leu Ala Pro Glu Vai Ala Ala Ala Ala Gin Gin Arg Vai Arg
180 185 190
Lys Glu Asn Leu Ala Arg Glu Arg Leu Gly Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Glu Lys Ile Ala Lys Leu Gly Leu Lys Tyr
210 215 220
Leu
225
Petição 870170009999, de 15/02/2017, pág. 731/1247
722/788 <210> 269 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 269
atgaacacac cggtcgtagt ccggcaagtg gagcaaccat caatggatgt gattgcagcc 60
ctggagaaac atggtgtgac gaccgtacat gaggcccagg gacgttgtgg cctgctggcg 120
tgttacatgc gtccgatttt ccccggagcg agcatcgctg gttccgcggt cactgtttct 180
ttgccccccg gcgataatct tatgatccac gttgcggtcg aggtctgcag tccagggaac 240
atccttgtag ttgccccgac ctcgccttgc acggatggct atttcggaga attgttggca 300
acttccctgc gcgctcgcgg tgtgaaaggt ctcgtgattg atgccggatg ccgtgatgtt 360
cgctctttga cggaaatgaa gttcccggtc tggagccgag cgatcagctc gcagggaacg 420
gtcaaatcta cactcggctc cgtgaacgtg cctatcctgt gcgcgggcgc actcgtcgag 480
gccggcgata tcatcgccgc cgatgacgac ggcgttgtcg ttgtcaagcg cgcaatggcg 540
caggaggtcg ccacggcggc agaacaaagg gtgcgcaaag agaatgtgac ccgagagcgt 600
cttgcgcggg gagatctcgg gctcgatatc tacgacatgc ggcagaaact cgcccaactg 660
ggcctcaaat atctgtga 678
<210> 270 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 270
Met Asn Thr Pro Vai Vai Vai Arg Gin Vai Glu Gin Pro Ser Met Asp
1 5 10 15
Vai Ile Ala Ala Leu Glu Lys His Gly Vai Thr Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Cys Tyr Met Arg Pro Ile Phe Pro
35 40 45
Gly Ala Ser Ile Ala Gly Ser Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Ser Pro Gly Asn
65 70 75 80
Ile Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Vai Lys Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
Petição 870170009999, de 15/02/2017, pág. 732/1247
723/788
115 120 125
Pro Vai 130 Trp Ser Arg Ala Ile 135 Ser Ser Gin Gly Thr 140 Vai Lys Ser Thr
Leu Gly Ser Vai Asn Vai Pro Ile Leu Cys Ala Gly Ala Leu Vai Glu
145 150 155 160
Ala Gly Asp Ile Ile Ala Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Met Ala Gin Glu Vai Ala Thr Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Asn Vai Thr Arg Glu Arg Leu Ala Arg Gly Asp Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gin Lys Leu Ala Gin Leu Gly Leu Lys Tyr
210 215 220
Leu
225 <210> 271 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 271
atgaaccaag ccgtggtggt ccggaatatc gagcgcccgc ccgcggatgt agttgctgcg 60
ttggagaaac ttggtgtttc cacggtgcac gaggcgcagg gacgttgcgg tctgttcgct 120
acgtatatga ggccgattta tgcgggtgcg gcgattgccg ggccggcggt taccgtatcg 180
ttgccgccgg gtgacaattt gatgattcac gtggccgtgg aagtgtgccg cgcgggggac 240
attttggtgg tcgcgccgac ttcgccttgc acggacgggt atttcggcga attgctggcg 300
acttcgttgc gcgcacatgg cgtcaagggc ctggtgatcg atgcggggtg ccgcgacgtc 360
cgagcgctcg cggagatgaa atttcccgtg tggagccgcg cagtaagttc gcagggaacg 420
gtgaagtcga cccttggttc ggtaaacgtc ggaattgtgt gcgcaggagc acgcgtggaa 480
gccggagacg tgatcgttgc cgacgatgac ggcgtagtgg gggtgaagtg cggcgcagcg 540
caggaagtgg ttgccgcggc gcagctgcgc gttcgcaagg aagaggccac gcgcgaacgc 600
ttggggcgtg gcgagctcgg cctggatatc cacgggctgc gggccaaggt cgcggagctt 660
ggcctgaaat atttgtga 678
<210> 272 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 272
Petição 870170009999, de 15/02/2017, pág. 733/1247
724/788
Met 1 Asn Gin Ala Vai Vai Vai Arg 5 Asn Ile 10 Glu Arg Pro Pro Ala 15 Asp
Vai Vai Ala Ala Leu Glu Lys Leu Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Phe Ala Thr Tyr Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Arg Ala Gly Asp
65 70 75 80
Ile Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Lys Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ala Leu Ala Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys Ser Thr
130 135 140
Leu Gly Ser Vai Asn Vai Gly Ile Vai Cys Ala Gly Ala Arg Vai Glu
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Gly Vai Lys
165 170 175
Cys Gly Ala Ala Gin Glu Vai Vai Ala Ala Ala Gin Leu Arg Vai Arg
180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Gly Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile His Gly Leu Arg Ala Lys Vai Ala Glu Leu Gly Leu Lys Tyr
210 215 220
273
678
DNA desconhecido
Proteína obtida por amostra do ambiente
Leu
225 <210>
<211>
<212>
<213>
<220>
<223>
<400> 273 atgaacaagc cttgagaaat tcctatatgc ctcccgccgg gtcctcgttg acttcgctcg cgagctctga gtgaaggcaa ccgtggttgt acggcgtgtc gcccgatcta gagacaacct ttgcgccgac cggcgcatgg cggaaatgaa cacttgggtc gcggaacatc gacggtgcac tgcaggagcc gatgattcac atcgccatgc ggtgaaaggc gtttccagtc ggtaaatgta gagcgtccgc gaggcccagg gcgatcgctg gtcgccgtcg accgacggct ttgatcattg tggagccgcg acgattgttt cggcggatgc gccggaacgg gaccagccgt aggtctgtcg attttggcga aggcgggatg ccgtcagctc gtgcgggtgc tgtggccgcg cctactggcc cacagtttcc acctggggat gttgcttgca tcgcgacgtc gcaaggaacg tgcggttgcg
120
180
240
300
360
420
480
Petição 870170009999, de 15/02/2017, pág. 734/1247
725/788 cccggtgatg tgatcgtggc ggacgatgat ggcgtcgttg tcgtgaaacg gacagaggcg caagaggtcg ttaccgcatc tgagcagaga ttgcgaaagg aagagggaac ccgcaagcgg cttgcttcgg gggaactcgg cctggatatt tacggcctgc gagcgaagat tgcagacctc ggtctcaagt acttgtag <210> 274 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <220>
<221> SITE <222> (151)...(154) <223> Sítio de N-glicosilação prosítio id = PS00001 <400> 274
540
600
660
678
Met Asn Lys Pro Vai Vai Vai Arg Asn Ile Glu Arg Pro Pro Ala Asp
1 5 10 15
Ala Vai Ala Ala Leu Glu Lys Tyr Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Asn Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Arg Pro Gly Asp
65 70 75 80
Vai Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Ala Ala His Gly Vai Lys Gly Leu Ile
100 105 110
Ile Glu Ala Gly Cys Arg Asp Vai Arg Ala Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Thr Ile Vai Cys Ala Gly Ala Ala Vai Ala
145 150 155 160
Pro Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Thr Glu Ala Gin Glu Vai Vai Thr Ala Ser Glu Gin Arg Leu Arg
180 185 190
Lys Glu Glu Gly Thr Arg Lys Arg Leu Ala Ser Gly Glu Leu Gly Leu
195 200 205
Petição 870170009999, de 15/02/2017, pág. 735/1247
726/788
Asp Ile Tyr Gly Leu Arg Ala Lys Ile Ala Asp Leu Gly Leu Lys Tyr 210 215 220
Leu
225 <210> 275 <211> 690 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 275
atgcctatcg ttgttacgaa gatcgaccga cccagcgcgg cggacgtcga aaggatcgcc 60
gcctatggtg tcgcgacctt gcatgaagcg caaggacgaa ccgggttgat ggcgtccaat 120
atgcgcccaa tctatcgccc tgcgcacatt gccgggcccg cggtgacctg ccttgtggcg 180
cctggcgaca attggatgat ccatgtcgcc gtcgaacagt gccagccggg agatgtcctg 240
gtcgtggtac cgaccagccc ctgcgaagac ggctatttcg gcgatctgct ggcgacctcg 300
ctgcggtcgc gcggggtcaa aggtctgatc atcgaggccg gcgtacgcga tatcgcgaca 360
ttgaccgaga tgaaattccc ggtctggtcc aaggcggtgt tcgcgcaagg aacggtcaag 420
gagaccatcg ccagcgtcaa tgtgcccctc gtctgcgcgg gcgcccgcat cgtgccgggc 480
gatctgatcg ttgccgacga cgacggggtc gtcgtgattc caagacgttc cgttccggcg 540
gtcctttcca gcgccgaggc ccgcgaagag aaggaagccc gcaaccgcgc ccgcttcgaa 600
gctggcgagc tgggcctcga cgtctacaac atgcgccagc gcctggccga caagggcttg 660
cgctatgtcg agcggctgcc cgaggaatag 690
<210> 276 <211> 229 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 276
Met Pro Ile Vai Vai Thr Lys Ile Asp Arg Pro Ser Ala Ala Asp Vai
1 5 10 15
Glu Arg Ile Ala Ala Tyr Gly Vai Ala Thr Leu His Glu Ala Gin Gly
20 25 30
Arg Thr Gly Leu Met Ala Ser Asn Met Arg Pro Ile Tyr Arg Pro Ala
35 40 45
His Ile Ala Gly Pro Ala Vai Thr Cys Leu Vai Ala Pro Gly Asp Asn
50 55 60
Trp Met Ile His Vai Ala Vai Glu Gin Cys Gin Pro Gly Asp Vai Leu
65 70 75 80
Vai Vai Vai Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
Petição 870170009999, de 15/02/2017, pág. 736/1247
727/788
90 95
Leu Ala Thr Ser Leu Arg Ser Arg Gly Vai Lys Gly Leu Ile 110 Ile Glu
100 105
Ala Gly Vai Arg Asp Ile Ala Thr Leu Thr Glu Met Lys Phe Pro Vai
115 120 125
Trp Ser Lys Ala Vai Phe Ala Gin Gly Thr Vai Lys Glu Thr Ile Ala
130 135 140
Ser Vai Asn Vai Pro Leu Vai Cys Ala Gly Ala Arg Ile Vai Pro Gly
145 150 155 160
Asp Leu Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Ile Pro Arg Arg
165 170 175
Ser Vai Pro Ala Vai Leu Ser Ser Ala Glu Ala Arg Glu Glu Lys Glu
180 185 190
Ala Arg Asn Arg Ala Arg Phe Glu Ala Gly Glu Leu Gly Leu Asp Vai
195 200 205
Tyr Asn Met Arg Gin Arg Leu Ala Asp Lys Gly Leu Arg Tyr Vai Glu
210 215 220
Arg Leu Pro Glu Glu
225 <210> 277 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 277
atgaatacac cggtggtagt ccgacaagtg gagcagccac cagcggatgc ggttgccgca 60
ttggagaagt gtggagtgac caccgtgcat gaggcgcagg gacgctgcgg cctccttgcg 120
tcctacatgc gcccaattta cccgggagca gccatcgccg gttccgctat cactgtgtct 180
ttgcctcctg gcgacaacct catgatccat gttgcggtgg aggtctgcag tccgggaaat 240
atcctggtag tttcaccggc ctcgccttgt accgatggct acttcggtga gctgttggcg 300
acgtctctcc gtgcccacgg cgtgagaggg cttgtgatcg aggcgggatg ccgtgacgtg 360
cgctctctaa cagaaatgaa attcccggtc tggagccgcg ccatcagttc gcaggggaca 420
gtcaaggcta cacttggatc ggtaaacgtg cccatcgtgt gcgcgggcgc acgggtcgag 480
gctggtgatg tcatcgtcgc cgatgacgat ggagtggtgg ttgtgaagcg ggcgcttgcg 540
caagaggtcg ccgcggcggc ggaacaaagg gttcgcaaag agaatgcgac ccgcgaacga 600
cttgcgcgcg gagaactcgg actcgatatt tacgacctgc gccaaaagat cgctcaactg 660
ggccttaaat atctgtga 678
<210> 278 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
Petição 870170009999, de 15/02/2017, pág. 737/1247
728/788 <221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 278
Met Asn Thr Pro Vai Vai Vai Arg Gin Vai Glu Gin Pro Pro Ala Asp
1 5 10 15
Ala Vai Ala Ala Leu Glu Lys Cys Gly Vai Thr Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Ser Pro Gly Asn
65 70 75 80
Ile Leu Vai Vai Ser Pro Ala Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Arg Gly Leu Vai
100 105 110
Ile Glu Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Ile Vai Cys Ala Gly Ala Arg Vai Glu
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Leu Ala Gin Glu Vai Ala Ala Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Leu Arg Gin Lys Ile Ala Gin Leu Gly Leu Lys Tyr
210 215 220
279
678
DNA desconhecido
Proteína obtida por amostra do ambiente
Leu
225 <210>
<211>
<212>
<213>
<220>
<223>
<400> 279 atgaataaac ctggagaagt ccctatatgc ttgccgcctg cggtggtagt atggcgtgac gcccgatttt gcgataatct gcggcaagtc caccgtgcac tgcgggagca catgatccac gagcagccac gaagctcaag tgcatcgccg gttgccgtcg ccgccgatgc cgcgttgtgg gttccgccgt aggtctgcac ggttgcggcc cctgctggct gaccgtgtct tccgggcagc
120
180
240
Petição 870170009999, de 15/02/2017, pág. 738/1247
729/788
attctggtag ttgcccccac ctcgccttgc acggacggtt atttcgggga actcctggca 300
acttccctgc tcgctcacgg tgtcaaagga ttggtcatcg atgctggctg tcgggatgtt 360
cgctcgttaa cggaaatgaa attccccgtc tggagccgtg ctgtcagttc tcaaggaacg 420
gtgaaggcca cgctcggatc ggtgaatgtg ccggtcattt gcgcgggcgc ggaggtggag 480
gctggcgata tcatcatcgc cgatgatgat ggtgtggtgg tggtgaagcg cacgctggcg 540
cacgaggtgg cagcggcggc ggaactacgg gttcgcaagg agaatgccac ccgcgaacga 600
ctcgcacgag gggatctcgg cctcgatatc tacgacatgc ggcaaaaaat cgcgcaactt 660
ggtctcaaat atctgtga 678
<210> 280 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 280
Met Asn 1 Lys Pro Vai 5 Vai Vai Arg Gin Vai 10 Glu Gin Pro Pro Ala 15 Asp
Ala Vai Ala Ala Leu Glu Lys Tyr Gly Vai Thr Thr Vai His Glu Ala
20 25 30
Gin Ala Arg Cys Gly Leu Leu Ala Pro Tyr Met Arg Pro Ile Phe Ala
35 40 45
Gly Ala Cys Ile Ala Gly Ser Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Thr Pro Gly Ser
65 70 75 80
Ile Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Leu Ala His Gly Vai Lys Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Vai Ile Cys Ala Gly Ala Glu Vai Glu
145 150 155 160
Ala Gly Asp Ile Ile Ile Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Thr Leu Ala His Glu Vai Ala Ala Ala Ala Glu Leu Arg Vai Arg
180 185 190
Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Asp Leu Gly Leu
195 200 205
Petição 870170009999, de 15/02/2017, pág. 739/1247
730/788
Asp Ile Tyr Asp Met Arg Gin Lys Ile Ala Gin Leu Gly Leu Lys Tyr 210 215 220
Leu
225 <210> 281 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 281
atgaacaagc ccgtggtcgt ccggcacgtg gaccaaccgt cagccgacgt tgtggctgcg 60
ctggagaagt acggagtctc gaccgtgcac gaagcgcaag gccgttgcgg tctactggcc 120
tcgtacatgc acccgattta tcccggcgat tccatcgctg ggcctgcggt cacggtttcg 180
cttccgccag gtgacaattt gatgatccat gttgcggtcg aggtctgccc ggcgggaagc 240
gttctggtcg tggctcccac ctcaccgtgc acagacggtt atttcggcga attgctggca 300
acttctctgc gcgctcacca tgtgacgggg ttggttatcg atgccggttg ccgcgacgtt 360
cgctcactca cggaaatgaa gtttccggtg tggagtcgcg ccgtcagttc acaggggacc 420
gtaaagtcga cgcttggctc cgtgaacgtg ccagtagtgt gcgccggggc ccatgtcgaa 480
gcgggcgata tcatcgtcgc cgatgacgat ggagtggtag ttgtaaagcg attggacgca 540
cccgaggtag tcgctgcgtg cgaacaaagg gttcgcaagg aacaggtgac gcgcgaacgg 600
ctggcgcgcg gcgaactggg tctggatatt tacggcctgc gaagcaaaat cgccgaactt 660
ggcctcaagt acgagtag 678
<210> 282 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 282
Met Asn Lys Pro Vai Vai Vai Arg His Vai Asp Gin Pro Ser Ala Asp
1 5 10 15
Vai Vai Ala Ala Leu Glu Lys Tyr Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met His Pro Ile Tyr Pro
35 40 45
Gly Asp Ser Ile Ala Gly Pro Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Pro Ala Gly Ser
65 70 75 80
Vai Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
Petição 870170009999, de 15/02/2017, pág. 740/1247
731/788
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His His Vai Thr Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys Ser Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala His Vai Glu
145 150 155 160
Ala Gly Asp Ile Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Leu Asp Ala Pro Glu Vai Vai Ala Ala Cys Glu Gin Arg Vai Arg
180 185 190
Lys Glu Gin Vai Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Ser Lys Ile Ala Glu Leu Gly Leu Lys Tyr
210 215 220
Glu
225
<210> 283
<211> 678
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 283
atgaatacac cggtggtagt ccggcaagtg gagcagccac cagcggacgc ggtggccgca 60
ttggagaact gtggcgtgac caccgtgcat gaggctcagg gacgtagtgg cctgcttgcc 120
tcctacatgc gcccgattta ccagggagca gccatcgcag gttccgctct caccgtgtct 180
ttgcctccgg gcgacaacct catgatgcat gttgcggtag agttctgcgg cccgggaaat 240
atcctggtcg ttgcaccgac ctcgccctgt acggatggct acttcggtga gctgttggca 300
acatctctcc gtgcccacgg tgggagaggg cttgtgatcg atgccggatg ccgtgacctg 360
cgctctctaa cagaaatgaa attccctgtc tggagccgcg ccatcagttc gcaagggacg 420
gtcaaggcca cacttggatc cgtgaatgtg cccatcgtat gcgcgggcgc attggtcgag 480
gccggagatg tcatcgtcgc cgatgacgat ggagttgtgg ttgtgaagcg cgccctcgcg 540
caagaggtca gggcggcggc ggagcaaagg gttcgcaaag aaaatgcgac ccgcgaaaga 600
ctcgcacgtg gagaactcgg actcgacatt tacgacatgc gccaaaagat cgcgcagctg 660
ggccttaaat atctgtga 678
<210> 284 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
Petição 870170009999, de 15/02/2017, pág. 741/1247
732/788 <221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 284
Met Asn Thr Pro Vai Vai Vai Arg Gin Vai Glu Gin Pro Pro Ala Asp
1 5 10 15
Ala Vai Ala Ala Leu Glu Asn Cys Gly Vai Thr Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Ser Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Gin
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Leu Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Met His Vai Ala Vai Glu Phe Cys Gly Pro Gly Asn
65 70 75 80
Ile Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Gly Arg Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Leu Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Ile Vai Cys Ala Gly Ala Leu Vai Glu
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Leu Ala Gin Glu Vai Arg Ala Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gin Lys Ile Ala Gin Leu Gly Leu Lys Tyr
210 215 220
Leu
225 <210> 285 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 285 atgaatacac cggtggtagt aagacaagtg gagcagccac cagcggatgc aattgccgca 60 ttgaagaagt gtggcgtgac aaccgtccac gaggctcagg gacgtggtgg ccttcttgcg 120 tcctacatgc gcccgattta cccgggagca gccatcgcag gatccgctat cactgtgtct 180 ttgcctcctg gcgacaacct catgatccac gttgcggtgg aggtctgcgg tccgggaaac 240
Petição 870170009999, de 15/02/2017, pág. 742/1247
733/788
atcctggtag tttcaccgac ctcgccttgt acggatggct acttcggtga gttgttggca 300
acatctctcc gtgcccaggg cgtgattggg cttgtgatcg atgccggatg ccgtgacgtg 360
cgctctctaa cagaaatgaa attcccggtc tggagccgcg ccatctgttc gcaagggaca 420
gtcaaggcca cacttggatc ggtgaatgtg cccatcgtat gcgcgggtgc attggtcgag 480
gctggtgatg tcatcgtcgc cgacgacgat ggcgttgtgg ttgtaaagcg agcgctggcg 540
caagaggtcg ccgctgcggc ggaacaaaag gttcgcaaag agaatgtaac ccgcgaacga 600
ctcgcacgtg gagagctcgg acttgatatt tacgacatgc gccaaaagat cgcgcaactg 660
ggcctcaaat atctgtga 678
<210> 286 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 286
Met 1 Asn Thr Pro Vai 5 Vai Vai Arg Gin Vai 10 Glu Gin Pro Pro Ala 15 Asp
Ala Ile Ala Ala Leu Lys Lys Cys Gly Vai Thr Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Gly Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gly Pro Gly Asn
65 70 75 80
Ile Leu Vai Vai Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Gin Gly Vai Ile Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Cys Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Ile Vai Cys Ala Gly Ala Leu Vai Glu
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Leu Ala Gin Glu Vai Ala Ala Ala Ala Glu Gin Lys Vai Arg
180 185 190
Lys Glu Asn Vai Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Petição 870170009999, de 15/02/2017, pág. 743/1247
734/788
Asp Ile Tyr Asp Met Arg Gin Lys Ile Ala Gin Leu Gly Leu Lys Tyr 210 215 220
Leu
225 <210> 287 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 287
atgaacaaac cgttggtgat ccggcaagtg gagcggccgc cggctgacgc tgtggcggcg 60
ctcgaaaaat atggcgtgtc caccgtgcat gaagcccagg gacgttgcgg actgctcgct 120
tcctacatgc gaccgattta tcccggtgct gccgttgccg gttcggcggt caccgtatcc 180
cttccgcccg gcgataatct gatgattcac gttgctgtcg aggtctgcca gtccggcgat 240
attctcgtgg ttgctccgac ctcgccttgc tcggacggat acttcggtga gttgctggcg 300
acgtccttgc gcgcgcacgg cgtgaagggc ctcgtcattg acgcggggtg ccgtgacgtt 360
cgctcactta ccgaaatgag gttccccgtc tggagccgca gcgtcagctc gcaaggtacc 420
gtgaagtcta ctctcggatc tgtgaatgtg agcattgttt gtgccggcgc gcacatcgaa 480
gctggtgatg tgatcgtcgc ggatgacgac ggtgtcgtgg tggtgaagcg cgcatccgcc 540
cacgaagtag tcgcggcgtg cgaacagcgg gttcgcaagg aagaggtcac tcgggagcgg 600
ttggcgcgcg gggagcttgg gcttgacatc tacgggttgc gcacaaaaat cgcggaaatg 660
ggtctcaagt atcaatga 678
<210> 288 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <220>
<221> SITE <222> (151)...(154) <223> Sítio de N-glicosilação prosítio id = PS00001 <400> 288
Met Asn Lys Pro Leu Vai Ile Arg Gin Vai Glu Arg Pro Pro Ala Asp
1 5 10 15
Ala Vai Ala Ala Leu Glu Lys Tyr Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Ala Vai Ala Gly Ser Ala Vai Thr Vai Ser Leu Pro Pro Gly
Petição 870170009999, de 15/02/2017, pág. 744/1247
735/788
55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gin Ser Gly Asp
65 70 75 80
Ile Leu Vai Vai Ala Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Lys Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Arg Phe
115 120 125
Pro Vai Trp Ser Arg Ser Vai Ser Ser Gin Gly Thr Vai Lys Ser Thr
130 135 140
Leu Gly Ser Vai Asn Vai Ser Ile Vai Cys Ala Gly Ala His Ile Glu
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Ser Ala His Glu Vai Vai Ala Ala Cys Glu Gin Arg Vai Arg
180 185 190
Lys Glu Glu Vai Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Thr Lys Ile Ala Glu Met Gly Leu Lys Tyr
210 215 220
Gin
225 <210> 289 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 289
atgaacaagc ccgtggttgt gcggaacatc gagcgtccgc cggcggatgc tgtggccgcg 60
cttgagaaat acggcgtgtc gacggtgcac gaggcccagg gccggaacgg cctactggcc 120
tcctatatgc gcccgatcta tgcaggagcc gcgatcgctg gaccagccgt cacagtttcc 180
ctcccgccgg gagacaacct gatgattcac gtcgccgtcg aggtctgtcg gcctggggat 240
gtcctcgttg ttgcgccgac atcgccatgc accgacggct attttggaga gttgcttgca 300
acttcgctcg cggcgcatgg ggtgaaaggc ttagtcattg aggcgggatg tcgcgacgtc 360
cgagctctga tggaaatgaa gtttccagtc tggagccgcg ccgtcaactc gcaaggaacg 420
gtgaaggcaa cacttgggtc ggtaaatgta acgattgttt gtgcgggtgc tgcggttgcg 480
cccggtgatg tgatcgtggc ggacgatgat ggcgtcgttg tcgtgaaacg gacagaggcg 540
caagaggtcg ttaccgcatc tgagcagaga ttgcgaaagg aagagggaac ccgcaagcgg 600
cttgcttcgg gggaactcgg cctggatatt tacggcctgc gagcgaagat tgcagacctc 660
ggtctcaagt acttgtag 678
<210> 290 <211> 225 <212> PRT
Petição 870170009999, de 15/02/2017, pág. 745/1247
736/788 <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <220>
<221> SITE <222> (151)...(154) <223> Sítio de N-glicosilação prosítio id = PS00001 <400> 290
Met Asn Lys Pro Vai Vai Vai Arg Asn Ile Glu Arg Pro Pro Ala Asp
1 5 10 15
Ala Vai Ala Ala Leu Glu Lys Tyr Gly Vai Ser Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Asn Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Arg Pro Gly Asp
65 70 75 80
Vai Leu Vai Vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Ala Ala His Gly Vai Lys Gly Leu Vai
100 105 110
Ile Glu Ala Gly Cys Arg Asp Vai Arg Ala Leu Met Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Vai Asn Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Thr Ile Vai Cys Ala Gly Ala Ala Vai Ala
145 150 155 160
Pro Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Thr Glu Ala Gin Glu Vai Vai Thr Ala Ser Glu Gin Arg Leu Arg
180 185 190
Lys Glu Glu Gly Thr Arg Lys Arg Leu Ala Ser Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Ala Lys Ile Ala Asp Leu Gly Leu Lys Tyr
210 215 220
Leu
225
<210> 291
<211> 678
<212> DNA
Petição 870170009999, de 15/02/2017, pág. 746/1247
737/788 <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 291
atgaataaac cggtggtagt ccggcaagtg gagcagccac ccgcggacgc ggttgcggcg 60
ctggagaagt atggcgttac caccgtgcat gaggctcagg gacgttgtgg cctgctcgcg 120
cactacatgc gtccgatttt tccgggagcg gccatctcgg gttctgctgt caccgtagct 180
ttgccgccgg gcgataacct catgatccac gtcgcggtcg aggtctgcgg cccgggaaac 240
atcctggttg tggcaccgac ctcgccttcg acggatggct acttcggtga gctgttggcg 300
acctctttgc gtgctcacgg tgtgaaaggg cttgtgattg atgccggatg ccgtgacgtt 360
cgctccctga ccgagatgaa attccccgtc tggagccgtg ccatcagctc gcagggaaca 420
gtcaaggcca ccctcggatc ggtgaatgtg ccggtcatgt gcgcgggcgc gctcgtcgaa 480
gctggggatg tcatcgtcgc cgatgatgat ggagttgtgg ttgtgaagcg cgcgaatgcg 540
cacgaggtgg ccgcggcggc agaacaaagg gtgcgcaagg agaatataac ccgcgaacgg 600
cttcgacgcg gagagctcgg actcgatatt tacgacatgc gccaaaaaat cgcgcaactg 660
ggcctcaaat acctgtga 678
<210> 292 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 292
Met 1 Asn Lys Pro Vai Vai 5 Vai Arg Gin Vai 10 Glu Gin Pro Pro Ala 15 Asp
Ala Vai Ala Ala Leu Glu Lys Tyr Gly Vai Thr Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Ala His Tyr Met Arg Pro Ile Phe Pro
35 40 45
Gly Ala Ala Ile Ser Gly Ser Ala Vai Thr Vai Ala Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gly Pro Gly Asn
65 70 75 80
Ile Leu Vai Vai Ala Pro Thr Ser Pro Ser Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Lys Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Petição 870170009999, de 15/02/2017, pág. 747/1247
738/788
Leu Gly 145 Ser Vai Asn Vai 150 Pro Vai Met Cys Ala Gly Ala Leu 155 Vai Glu 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Asn Ala His Glu Vai Ala Ala Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Asn Ile Thr Arg Glu Arg Leu Arg Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gin Lys Ile Ala Gin Leu Gly Leu Lys Tyr
210 215 220
Leu
225 <210> 293 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 293
atgaatcgac cggtggtagt ccggcaagtt gaacagccac cagcggatgc ggttgccgca 60
ctggagaagt atggcgtgac aaccgtccat gaggctcagg gacccggtgg cctcctagcc 120
tcctacatgc gcccgattta cccgggagca gtcatcgccg gttccgcggt cactgtgtct 180
ttacctcctg gcgacaacct catgatccac gtggccgtgg aggtctgtgg tccgggaaac 240
attctggttg ttgcaccgat ctcgccgtgt acggatggct acttcggaga gctgttggca 300
acctctctcc gcgcccacgg tgtgcgaggg cttgtgatcg atgccggatg ccgggacgtg 360
cgctctctca cagaaatgaa atttccggtc tggagccgcg ccgtcagttc acaggggaca 420
gtcaaggcca ccctgggatc ggtgaatgtg ccgattgtgt gcgcgggcgc gcgggtcggg 480
gctggggatg tcatcgtcgc cgatgacgat ggagttgtgg tggtgaagcg cgcgctggcc 540
gaagaggtcg ccgccgcggc ggaacaaagg gttcgcaaag agaatgtgac ccgggaacga 600
cttgcgcgtg gagagctggg actcgatatt tacgacatgc gccaaaagat cgcacaactg 660
ggccttaaat atctctga 678
<210> 294 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 294
Met Asn Arg Pro Vai Vai Vai Arg Gin Vai Glu Gin Pro Pro Ala Asp 15 10 15
Ala Vai Ala Ala Leu Glu Lys Tyr Gly Vai Thr Thr Vai His Glu Ala
Petição 870170009999, de 15/02/2017, pág. 748/1247
739/788
25 30
Gin Gly Pro 35 Gly Gly Leu Leu Ala 40 Ser Tyr Met Arg Pro 45 Ile Tyr Pro
Gly Ala Vai Ile Ala Gly Ser Ala Vai Thr Vai Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gly Pro Gly Asn
65 70 75 80
Ile Leu Vai Vai Ala Pro Ile Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Vai Arg Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Vai Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Ile Vai Cys Ala Gly Ala Arg Vai Gly
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala Leu Ala Glu Glu Vai Ala Ala Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Asn Vai Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gin Lys Ile Ala Gin Leu Gly Leu Lys Tyr
210 215 220
Leu
225 <210> 295 <211> 678 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 295
atgaataaac cggtggtagt ccggcaagtg gagcagccgc cagcggacgc ggttgcggcg 60
ctggagaagt atggcgtcac caccgtgcat gaggctcagg gacgttgtgg cctgctcggg 120
cactacatgc gtccgatttt tccgggagcg gccatctcgg gttctgcagt caccgtagct 180
ttgccgccgg gcgataacct catgatccac gtcgcggtcg aggtctgcgg cccgggaaac 240
atcctggtgg ttgcaccgac ctcgccttcg acggatggct acttcggtga gctgttggcg 300
acctctctgc gtgctcgcga tgtgaaaggg cttgtgattg atgccggatg ccgtgacgtt 360
cgctccctga ccgagatgaa attccccgtc tggagccgtg ccatcagctc gcagggaacg 420
gtcaaggcca ccctcggatc ggtgaatgtg ccggtcacgt gcgcgggcgc gctcgtcgaa 480
gccggggatg tcatcgtcgc cgatgatgat ggagttgtgg ttgtgaagcg cgcgcatgcg 540
cacgaggtgg cggcggcggc agaacaaagg gtgcgcaaag agaatataac ccgcgaacgg 600
cttcgacgcg gagagctcgg actcgatatt tacgacatgc gccaaaagat cgcgcaactg 660
Petição 870170009999, de 15/02/2017, pág. 749/1247
740/788 ggcctcaaat acctgtga <210> 296 <211> 225 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinone metiltransferase <400> 296
678
Met 1 Asn Lys Pro Vai 5 Vai Vai Arg Gin Vai 10 Glu Gin Pro Pro Ala 15 Asp
Ala Vai Ala Ala Leu Glu Lys Tyr Gly Vai Thr Thr Vai His Glu Ala
20 25 30
Gin Gly Arg Cys Gly Leu Leu Gly His Tyr Met Arg Pro Ile Phe Pro
35 40 45
Gly Ala Ala Ile Ser Gly Ser Ala Vai Thr Vai Ala Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Vai Ala Vai Glu Vai Cys Gly Pro Gly Asn
65 70 75 80
Ile Leu Vai Vai Ala Pro Thr Ser Pro Ser Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Asp Vai Lys Gly Leu Vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp Vai Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Vai Trp Ser Arg Ala Ile Ser Ser Gin Gly Thr Vai Lys Ala Thr
130 135 140
Leu Gly Ser Vai Asn Vai Pro Vai Thr Cys Ala Gly Ala Leu Vai Glu
145 150 155 160
Ala Gly Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Vai Vai Vai Lys
165 170 175
Arg Ala His Ala His Glu Vai Ala Ala Ala Ala Glu Gin Arg Vai Arg
180 185 190
Lys Glu Asn Ile Thr Arg Glu Arg Leu Arg Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gin Lys Ile Ala Gin Leu Gly Leu Lys Tyr
210 215 220
Leu
225
<210> 297
<211> 672
<212> DNA
Petição 870170009999, de 15/02/2017, pág. 750/1247
741/788 <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 297
atgggtgtcg tcgtccaaaa catcgagcgg gctgcgcaag ggaccatcga ccgcctcgcc 60
gcctgcgggg tggctaccgt ccatgaagcg caggggcgca aggggctgct ggcgagccac 120
atgcggccgg tctacagggg cgcacggctc gccgcgagcg cggtgacgat ttcggcgccg 180
cccggcgaca actggatgat ccatgtcgcc atcgagcagc tccaagccgg cgacatcatg 240
gtgctggcgc cgaccagccc gtgcgaggac ggatatttcg gcgacctcct ggcgacctcg 300
gcgcaggcgc gcgggtgcaa ggggctggtg atcgatgccg gcgtgcgcga cgttgccgac 360
cttacggcaa tgcagttccc ggtgtggtcg aaggcgatct tcgcgcaggg cacgctgaaa 420
gagacgctgg gttcggtgaa cgtgccggtg gtctgcgccg gcgcgctggt caacccgggc 480
gacgtcatcg tcgccgatga cgacggggtc tgcgtggtac gccgcgagga ggtcgaggca 540
gtggcggaaa aggcggaagc ccgcgtcgct gccgaggagg acaagcgcaa gcgcctcgcc 600
gggggagaac tggggctcga catctacaag atgcgcgagc gcttggccga gaagggcctc 660
aaatatgtct ga 672
<210> 298 <211> 223 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (20)...(172) <223> Demetilmenaquinone metiltransferase <400> 298
Met Gly Vai Vai Vai Gin Asn Ile Glu Arg Ala Ala Gin Gly Thr Ile
1 5 10 15
Asp Arg Leu Ala Ala Cys Gly Vai Ala Thr Vai His Glu Ala Gin Gly
20 25 30
Arg Lys Gly Leu Leu Ala Ser His Met Arg Pro Vai Tyr Arg Gly Ala
35 40 45
Arg Leu Ala Ala Ser Ala Vai Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Vai Ala Ile Glu Gin Leu Gin Ala Gly Asp Ile Met
65 70 75 80
Vai Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Gin Ala Arg Gly Cys Lys Gly Leu Vai Ile Asp
100 105 110
Ala Gly Vai Arg Asp Vai Ala Asp Leu Thr Ala Met Gin Phe Pro Vai
115 120 125
Trp Ser Lys Ala Ile Phe Ala Gin Gly Thr Leu Lys Glu Thr Leu Gly
130 135 140
Petição 870170009999, de 15/02/2017, pág. 751/1247
742/788
Ser 145 Vai Asn Vai Pro Vai Vai Cys Ala Gly Ala Leu Vai Asn Pro Gly
150 155 160
Asp Vai Ile Vai Ala Asp Asp Asp Gly Vai Cys Vai Vai Arg Arg Glu
165 170 175
Glu Vai Glu Ala Vai Ala Glu Lys Ala Glu Ala Arg Vai Ala Ala Glu
180 185 190
Glu Asp Lys Arg Lys Arg Leu Ala Gly Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Vai
210 215 220 <210> 299 <211> 501 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 299
atgggttcct tggcaactgc cgaagcttgt gacacgaatg cagcacacct gacaagcggt 60
gacatccggg tcctgccacc actcttcaag atttacgggc aaagtcgggc attctctggg 120
ccaatcgtga ctgtgaaggt atttgaagac aatgtgctgg tacgggaact tcttgaaacc 180
aaaggcgacg gtagagttct ggtgatagac ggcggaggga gcatgaggtg tgccttggtc 240
ggaggaaacc tggggcagtt agcgcagaac atggggtggg cggggattgt tgtaaacggg 300
tgcataagag acgtagatga gatcaacggg tgcgatgttg gggttagagc attggcatcc 360
catccacaga agtcgaataa aaaggggcat ggggagaaac acatgccgat taatatcgcg 420
ggcacgatga tccgagacgg agagtggttg tatgcagaca gtgatggcat tctcatctcc 480
agaactgagc tctctatcta g 501
<210> 300 <211> 166 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (2)...(159) <223> Demetilmenaquinone metiltransferase <400> 300
Met Gly Ser Leu Ala Thr Ala Glu Ala Cys Asp Thr Asn Ala Ala His
1 5 10 15
Leu Thr Ser Gly Asp Ile Arg Vai Leu Pro Pro Leu Phe Lys Ile Tyr
20 25 30
Gly Gin Ser Arg Ala Phe Ser Gly Pro Ile Vai Thr Vai Lys Vai Phe
35 40 45
Glu Asp Asn Vai Leu Vai Arg Glu Leu Leu Glu Thr Lys Gly Asp Gly
50 55 60
Petição 870170009999, de 15/02/2017, pág. 752/1247
743/788
Arg Vai Leu Vai Ile Asp Gly Gly Gly Ser Met Arg Cys Ala Leu Vai
65 70 75 80
Gly Gly Asn Leu Gly Gin Leu Ala Gin Asn Met Gly Trp Ala Gly Ile
85 90 95
Vai Vai Asn Gly Cys Ile Arg Asp Vai Asp Glu Ile Asn Gly Cys Asp
100 105 110
Vai Gly Vai Arg Ala Leu Ala Ser His Pro Gin Lys Ser Asn Lys Lys
115 120 125
Gly His Gly Glu Lys His Met Pro Ile Asn Ile Ala Gly Thr Met Ile
130 135 140
Arg Asp Gly Glu Trp Leu Tyr Ala Asp Ser Asp Gly Ile Leu Ile Ser
145 150 155 160
Arg Thr Glu Leu Ser Ile
165 <210> 301 <211> 501 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 301
atgggttcct tggcaactgc cgaagcttgt gacacgaatg cagcacacct gacaagcggt 60
gacatccggg tcctgccacc actcttcaag atttacgggc aaagtcgggc attctctggg 120
ccaatcgtga ctgtgaaggt atttgaagac aatgtgctgg tacgggaact tcttgaaacc 180
aaaggcgacg gtagagttct ggtgatagac ggcggaggga gcatgaggtg tgccttggtc 240
ggaggaaacc tggggcagtt agctcagaac atggggtggg cagggattgt tgtaaacggg 300
tgcataagag acatagatga gatcaacggg tgcgatgttg gggttagagc attggcatcc 360
catccacaga agtcgaataa aaaggggcat ggggagaaac acatgccgat taatatcgcg 420
ggcacgatga tccgagacgg agagtggttg tatgcagaca gtgatggcat tctcatctcc 480
agaactgagc tctctatcta g 501
<210> 302 <211> 166 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (2)...(159) <223> Demetilmenaquinone metiltransferase <400> 302
Met 1 Gly Ser Leu Ala 5 Thr Ala Glu Ala Cys Asp Thr Asn Ala Ala His
10 15
Leu Thr Ser Gly Asp Ile Arg Vai Leu Pro Pro Leu Phe Lys Ile Tyr
20 25 30
Petição 870170009999, de 15/02/2017, pág. 753/1247
744/788
Gly Gin Ser 35 Arg Ala Phe Ser Gly 40 Pro Ile Vai Thr Vai 45 Lys Vai Phe
Glu Asp Asn Vai Leu Vai Arg Glu Leu Leu Glu Thr Lys Gly Asp Gly
50 55 60
Arg Vai Leu Vai Ile Asp Gly Gly Gly Ser Met Arg Cys Ala Leu Vai
65 70 75 80
Gly Gly Asn Leu Gly Gin Leu Ala Gin Asn Met Gly Trp Ala Gly Ile
85 90 95
Vai Vai Asn Gly Cys Ile Arg Asp Ile Asp Glu Ile Asn Gly Cys Asp
100 105 110
Vai Gly Vai Arg Ala Leu Ala Ser His Pro Gin Lys Ser Asn Lys Lys
115 120 125
Gly His Gly Glu Lys His Met Pro Ile Asn Ile Ala Gly Thr Met Ile
130 135 140
Arg Asp Gly Glu Trp Leu Tyr Ala Asp Ser Asp Gly Ile Leu Ile Ser
145 150 155 160
Arg Thr Glu Leu Ser Ile
165
<210> 303
<211> 501
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 303
atggccttag taaccactgc cgaagtttgt gatgcgaacc cacagctcat tgtgagcggc 60
gagcttcgcg cactccatcc aattttccaa atttacggta ggcggcaagt cttctccggg 120
cccgttgtta cgctgaaggt gtttgaagat aatgtgttgg tgcgcgaatt tcttgaggag 180
aggggcaatg gcagggttct tgttgtcgat ggtggtggca gcttgagatg cgcaatactc 240
ggtggcaacc ccgttgtaca agctcagaac aacgggtggg ctggcattgt ggttaacggg 300
tgtataaggg atgttgatga aatcaacggg tgcgacattg gagtcagagc tctggccgcg 360
cacccggtga aagccaataa gaaaggcatc ggtgagaagc atgttccggt gaacattggt 420
ggaacccgta tatgtgatgg agagtggctc tatgcagata ccgatggtat tttggtgtct 480
aaaaccgagt tgtctgtcta a 501
<210> 304 <211> 166 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (2)...(159) <223> Demetilmenaquinone metiltransferase <400> 304
Petição 870170009999, de 15/02/2017, pág. 754/1247
745/788
Met 1 Ala Leu Vai Thr 5 Thr Ala Glu Vai Cys Asp 10 Ala Asn Pro Gin 15 Leu
Ile Vai Ser Gly Glu Leu Arg Ala Leu His Pro Ile Phe Gin Ile Tyr
20 25 30
Gly Arg Arg Gin Vai Phe Ser Gly Pro Vai Vai Thr Leu Lys Vai Phe
35 40 45
Glu Asp Asn Vai Leu Vai Arg Glu Phe Leu Glu Glu Arg Gly Asn Gly
50 55 60
Arg Vai Leu Vai Vai Asp Gly Gly Gly Ser Leu Arg Cys Ala Ile Leu
65 70 75 80
Gly Gly Asn Pro Vai Vai Gin Ala Gin Asn Asn Gly Trp Ala Gly Ile
85 90 95
Vai Vai Asn Gly Cys Ile Arg Asp Vai Asp Glu Ile Asn Gly Cys Asp
100 105 110
Ile Gly Vai Arg Ala Leu Ala Ala His Pro Vai Lys Ala Asn Lys Lys
115 120 125
Gly Ile Gly Glu Lys His Vai Pro Vai Asn Ile Gly Gly Thr Arg Ile
130 135 140
Cys Asp Gly Glu Trp Leu Tyr Ala Asp Thr Asp Gly Ile Leu Vai Ser
145 150 155 160
Lys Thr Glu Leu Ser Vai
165
<210> 305
<211> 639
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 305
ttggatcaaa tccacaaatc cggcattatc cccgtcgtcg aaatcgactc ggtagaacgc 60
gccgtcccgc tggctgaggc attgcttgca ggagggctga cggtcgtgga gatcaccctc 120
cgcaccgggg cggcgctcga gtcgattcga gcaattgctc agcaggtacc agaggtcagt 180
gtcggggcag gaacagtcat tacctgggaa caggcgcagg cggcacgtga tgcaggcgcg 240
cagttcctcg tctcaccggg gatggtggag caggttgtca tctgggcgca ggagcaccag 300
cttccgatca tacctggcgc agcaactccc accgagatga tccgcggcat caacctgggg 360
ctcaacctcc tgaaattctt tcccgccgaa acgatgggtg gggtaagcgc tgttaaggcg 420
ttatctgacc cgtttccgca gttgaaattc attcccacgg gcggcatcag gttggaaaat 480
gcagcttcgt atctcgcgca tcctaaaatc catgctgtgg gcggctcgtg gatagcgaaa 540
cgagagatga tcgcggatgg cagatttgat gagatccggc gtatggcaca ggaagccaga 600
gacctggtaa agcagatcag gaggaaaacg atcccatga 639
<210> 306 <211> 212 <212> PRT <213> desconhecido <220>
Petição 870170009999, de 15/02/2017, pág. 755/1247
746/788 <223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (1)...(195) <223> KDPG and KHG aldolase <220>
<221> SITE <222> (32)...(41) <223> KDPG and KHG aldolases active site. Prosite id = PS00159 <400> 306
Met Asp Gin Ile His Lys Ser Gly Ile Ile Pro Vai Vai Glu Ile Asp 15 10 15
Ser Vai Glu Arg Ala Vai Pro Leu Ala Glu Ala Leu Leu Ala Gly Gly
25 30
Leu Thr Vai Vai Glu Ile Thr Leu Arg Thr Gly Ala Ala Leu Glu Ser
40 45
Ile Arg Ala Ile Ala Gin Gin Vai Pro Glu Vai Ser Vai Gly Ala Gly
55 60
Thr Vai Ile Thr Trp Glu Gin Ala Gin Ala Ala Arg Asp Ala Gly Ala
70 75 80
Gin Phe Leu Vai Ser Pro Gly Met Vai Glu Gin Vai Vai Ile Trp Ala
90 95
Gin Glu His Gin Leu Pro Ile Ile Pro Gly Ala Ala Thr Pro Thr Glu
100 105 110
Met Ile Arg Gly Ile Asn Leu Gly Leu Asn Leu Leu Lys Phe Phe Pro
115 120 125
Ala Glu Thr Met Gly Gly Vai Ser Ala Vai Lys Ala Leu Ser Asp Pro
130 135 140
Phe Pro Gin Leu Lys Phe Ile Pro Thr Gly Gly Ile Arg Leu Glu Asn
145 150 155 160
Ala Ala Ser Tyr Leu Ala His Pro Lys Ile His Ala Vai Gly Gly Ser
165 170 175
Trp Ile Ala Lys Arg Glu Met Ile Ala Asp Gly Arg Phe Asp Glu Ile
180 185 190
Arg Arg Met Ala Gin Glu Ala Arg Asp Leu Vai Lys Gin Ile Arg Arg
195 200 205
Lys Thr Ile Pro
210 <210> 307 <211> 639 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 307
Petição 870170009999, de 15/02/2017, pág. 756/1247
747/788
ttgactttga aacaaggcgt gttgcctttg tattttaata aggacgagga ggtgagtatc 60
gctgttttaa aagctttata tgaagcggga attcgtacag ttgaatatac gaatcgtggt 120
gaagccgcat tgaaaaactt taagtcgttg cgcaaggtat gtgataccga attgaatgga 180
atgtacctcg gtattgggac gattaaaaat ggccagcagg cacaagcttt tgtggatgca 240
ggtgcagatt atttaattag tccgggtgta gtggatgatg cagcaaaagt tgccgatcaa 300
aatggtttgt tatatgtgcc tggtgcaatg accccaacag aaattatcag ggcagagcaa 360
caatttggat caacgctggt gaaacttttt ccgggtaata ttttaggccc tggctttgtt 420
agtgctatta aagaattgtt cagcggattg aaatttatta ttaccggagg agttgaaccg 480
gaagaaaata atttgaaagg atggttcaac gcaggtgccg cagctgtggg catgggaagt 540
aaattaatta ccaaacaggt tttggaaaat aaagactatg caaaaattac agagttaact 600
aaggaatctt taagactgat taaattggtc agagggtaa 639
<210> 308 <211> 212 <212> PRT <213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente
<220>
<221> DOMÍNIO
<222> (2)...(199)
<223> KDPG and KHG aldolase
<400> 308
Met Thr Leu Lys Gin Gly Vai Leu Pro Leu Tyr Phe Asn Lys Asp Glu
15 10 15
Glu Vai Ser Ile Ala Vai Leu Lys Ala Leu Tyr Glu Ala Gly Ile Arg
20 25 30
Thr Vai Glu Tyr Thr Asn Arg Gly Glu Ala Ala Leu Lys Asn Phe Lys
35 40 45
Ser Leu Arg Lys Vai Cys Asp Thr Glu Leu Asn Gly Met Tyr Leu Gly
50 55 60
Ile Gly Thr Ile Lys Asn Gly Gin Gin Ala Gin Ala Phe Vai Asp Ala
65 70 75 80
Gly Ala Asp Tyr Leu Ile Ser Pro Gly Vai Vai Asp Asp Ala Ala Lys
85 90 95
Vai Ala Asp Gin Asn Gly Leu Leu Tyr Vai Pro Gly Ala Met Thr Pro
100 105 110
Thr Glu Ile Ile Arg Ala Glu Gin Gin Phe Gly Ser Thr Leu Vai Lys
115 120 125
Leu Phe Pro Gly Asn Ile Leu Gly Pro Gly Phe Vai Ser Ala Ile Lys
130 135 140
Glu Leu Phe Ser Gly Leu Lys Phe Ile Ile Thr Gly Gly Vai Glu Pro
145 150 155 160
Glu Glu Asn Asn Leu Lys Gly Trp Phe Asn Ala Gly Ala Ala Ala Vai
165 170 175
Gly Met Gly Ser Lys Leu Ile Thr Lys Gin Vai Leu Glu Asn Lys Asp
Petição 870170009999, de 15/02/2017, pág. 757/1247
748/788
180 185 190
Tyr Ala Lys Ile Thr Glu Leu Thr Lys Glu Ser Leu Arg Leu Ile Lys
195 200 205
Leu Vai Arg Gly
210 <210> 309 <211> 687 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 309
atgagtattg ctgcaaatac aggtgtagac aaaaaaaatg agatcctaca attaacattg 60
caacaaggtg tgttgccttt gtattttaat aaagatgaag aagtgagtat tgctgttttg 120
aaagcgttat atgaggcagg cattcgcaca gttgagtata ccaatcgtgg agaagccgca 180
ttaaaaaatt ttaaagtact gagaaaaatt tgtgatacgg aattgagtgg attatacctg 240
ggtatcggca ccattaaaaa tggagaacag gcaaaagctt ttgttgatgc cggtgcagat 300
tatttaatta gtccgggtgt ggtagatgat gcagcaaaaa ttgctgatca aaatggattg 360
ttatatgtgc ctggtgccat gacgccaact gaaattatca gggcagaaca atttggtgca 420
acactggtaa aactttttcc cggtaatatt ttaggccctg gtttcgttag tgccgttaag 480
gaattattca gcggtttgaa atttatcatc actggtggag tagaacctga agaaaataat 540
ttgaaaggat ggtttaatgc aggtgctgcg gccgtaggaa tgggaagtaa attgatcaca 600
aaacaaactt tggaaaataa agactacgca aaaattacag agctcacgaa agagtcttta 660
agattgattg aactggtgcg gaaataa 687
<210> 310 <211> 228 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (16)...(215) <223> KDPG and KHG aldolase <400> 310
Met Ser Ile Ala Ala Asn Thr Gly Vai Asp Lys Lys Asn Glu Ile Leu
1 5 10 15
Gin Leu Thr Leu Gin Gin Gly Vai Leu Pro Leu Tyr Phe Asn Lys Asp
20 25 30
Glu Glu Vai Ser Ile Ala Vai Leu Lys Ala Leu Tyr Glu Ala Gly Ile
35 40 45
Arg Thr Vai Glu Tyr Thr Asn Arg Gly Glu Ala Ala Leu Lys Asn Phe
50 55 60
Lys Vai Leu Arg Lys Ile Cys Asp Thr Glu Leu Ser Gly Leu Tyr Leu
65 70 75 80
Petição 870170009999, de 15/02/2017, pág. 758/1247
749/788
Gly Ile Gly Thr Ile 85 Lys Asn Gly Glu Gin Ala Lys 90 Ala Phe Vai 95 Asp
Ala Gly Ala Asp Tyr Leu Ile Ser Pro Gly Vai Vai Asp Asp Ala Ala
100 105 110
Lys Ile Ala Asp Gin Asn Gly Leu Leu Tyr Vai Pro Gly Ala Met Thr
115 120 125
Pro Thr Glu Ile Ile Arg Ala Glu Gin Phe Gly Ala Thr Leu Vai Lys
130 135 140
Leu Phe Pro Gly Asn Ile Leu Gly Pro Gly Phe Vai Ser Ala Vai Lys
145 150 155 160
Glu Leu Phe Ser Gly Leu Lys Phe Ile Ile Thr Gly Gly Vai Glu Pro
165 170 175
Glu Glu Asn Asn Leu Lys Gly Trp Phe Asn Ala Gly Ala Ala Ala Vai
180 185 190
Gly Met Gly Ser Lys Leu Ile Thr Lys Gin Thr Leu Glu Asn Lys Asp
195 200 205
Tyr Ala Lys Ile Thr Glu Leu Thr Lys Glu Ser Leu Arg Leu Ile Glu
210 215 220
Leu Vai Arg Lys
225 <210> 311 <211> 600 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 311
atgatattcg ccgatgccat agccgaatgc ggcctcatcg ccatcctgcg cggcattgca 60
acggctgaaa ttgaagccgt gggacaagcc ctcatcgaag ccggcattcg cgtcgctgaa 120
attccgctga actcgccgga tccatttgcc tccatcgaga aaatggccaa ggccttcaag 180
ggcgagctgg ttgtcggggc tggaaccgtt ctcagtgtgc aggatgtcaa tttactgaaa 240
gcccatggcg gccagatcag cgtttctccc gattgcaacg aggcggtggt cgcacgcacc 300
aaagaactgg gtctggagcc cgttcccggc gtcttcacgc ccactgaggc ttttgccgcg 360
atccgcgccg gggcaaccca tatcaagttg tttccggcgg aagccgcaag ccccgcaacc 420
atcagggcct ggcgcgctgt tcttccaaag catgtgaaaa tctatccggt gggcggcatc 480
acgccagcaa atatgcaggg ctgggttgat gccggcgccg caggctttgg aattggctca 540
aatatctata agcagggggc cacagccgcc aacgtggcaa aggcggccaa ggaattcttt 600
<210> 312 <211> 200 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO
Petição 870170009999, de 15/02/2017, pág. 759/1247
750/788 <222> (4)...(198) <223> KDPG and KHG aldolase <400> 312
Met Ile Phe Ala Asp Ala Ile Ala Glu Cys Gly Leu Ile Ala Ile Leu 15 10 15
Arg Gly Ile Ala Thr Ala Glu Ile Glu Ala Vai Gly Gin Ala Leu Ile
25 30
Glu Ala Gly Ile Arg Vai Ala Glu Ile Pro Leu Asn Ser Pro Asp Pro
40 45
Phe Ala Ser Ile Glu Lys Met Ala Lys Ala Phe Lys Gly Glu Leu Vai
55 60
Vai Gly Ala Gly Thr Vai Leu Ser Vai Gin Asp Vai Asn Leu Leu Lys
70 75 80
Ala His Gly Gly Gin Ile Ser Vai Ser Pro Asp Cys Asn Glu Ala Vai
90 95
Vai Ala Arg Thr Lys Glu Leu Gly Leu Glu Pro Vai Pro Gly Vai Phe
100 105 110
Thr Pro Thr Glu Ala Phe Ala Ala Ile Arg Ala Gly Ala Thr His Ile
115 120 125
Lys Leu Phe Pro Ala Glu Ala Ala Ser Pro Ala Thr Ile Arg Ala Trp
130 135 140
Arg Ala Vai Leu Pro Lys His Vai Lys Ile Tyr Pro Vai Gly Gly Ile
145 150 155 160
Thr Pro Ala Asn Met Gin Gly Trp Vai Asp Ala Gly Ala Ala Gly Phe
165 170 175
Gly Ile Gly Ser Asn Ile Tyr Lys Gin Gly Ala Thr Ala Ala Asn Vai
180 185 190
Ala Lys Ala Ala Lys Glu Phe Phe
195 200 <210> 313 <211> 681 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 313
atgagccagc ccgatagaaa cctgaaggag accgtgattg cgttaactaa ggaatgcggg 60
gttctgccct gcatcaagtt gcgcaaaaaa gatgatttta ttgcctatgc ccaggcgatg 120
tatgacggag gagctcgcgt catcgaagtg accatgacaa ctccaggcgc cctggaagcg 180
atcgaagcca tttcgtctgc ctttaaagac aaactctatg ttgcttcggg caccacattg 240
gacgcgtcca ctgcgcgcga ggtcatcact cacggcggaa gctgcattgt taatccttgt 300
gtcatccccg aagtgatcga tgtcgccaac cgctatggca ttccagttta ttccggagca 360
ttcactgcga ccgaggtgtt cacggcgatg cgcgccggag cgtccatggt caaaatattt 420
cccgggggtc tgggcggcgc caagtacatg accaatctga aaatggtatt cccagaagtg 480
aacctgattc cttcaggggg aattaacctt gataatgctc ccgaatttat tcgcgccggc 540
Petição 870170009999, de 15/02/2017, pág. 760/1247
751/788 gcctgcgctg tcagtggtgc acgaactttc atggatcacg aaatgattgc caagcatggt ttgaaatgga ttactcaaca gacgtcaaaa ttcattgaag tggttctgga agcgaagcgg aacgctccag agttgccttg a <210> 314 <211> 226 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (12)...(207) <223> KDPG and KHG aldolase <400> 314
600
660
681
Met Ser Gin Pro
Lys Glu Cys Gly 20
Phe Ile Ala Tyr 35
Glu Vai Thr Met
Ser Ser Ala Phe
Asp Ala Ser Thr
Vai Asn Pro Cys 100
Gly Ile Pro Vai 115
Ala Met Arg Ala 130
Gly Gly Ala Lys 145
Asn Leu Ile Pro
Ile Arg Ala Gly 180
His Glu Met Ile
195
Ser Lys Phe Ile 210
Leu Pro
225 <210> 315
Asp Arg Asn Leu 5
Vai Leu Pro Cys
Ala Gin Ala Met
Thr Thr Pro Gly 55
Lys Asp Lys Leu 70
Ala Arg Glu Vai 85
Vai Ile Pro Glu
Tyr Ser Gly Ala 120
Gly Ala Ser Met 135
Tyr Met Thr Asn 150
Ser Gly Gly Ile 165
Ala Cys Ala Vai
Ala Lys His Gly 200
Glu Vai Vai Leu
215
Lys Glu Thr Vai 10
Ile Lys Leu Arg 25
Tyr Asp Gly Gly
Ala Leu Glu Ala
Tyr Vai Ala Ser 75
Ile Thr His Gly 90
Vai Ile Asp Vai 105
Phe Thr Ala Thr
Vai Lys Ile Phe 140
Leu Lys Met Vai 155
Asn Leu Asp Asn 170
Ser Gly Ala Arg 185
Leu Lys Trp Ile
Glu Ala Lys Arg 220
Ile Ala Leu Thr
Lys Lys Asp Asp 30
Ala Arg Vai Ile 45
Ile Glu Ala Ile
Gly Thr Thr Leu 80
Gly Ser Cys Ile 95
Ala Asn Arg Tyr 110
Glu Vai Phe Thr
125
Pro Gly Gly Leu
Phe Pro Glu Vai
160
Ala Pro Glu Phe
175
Thr Phe Met Asp 190
Thr Gin Gin Thr
205
Asn Ala Pro Glu
Petição 870170009999, de 15/02/2017, pág. 761/1247
752/788 <211> 576 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 315
atggcacaat ttacaagaat agaagttgca acagcaatga aagaaactgg gatgattcct 60
ttgtttttta acaacgattt agaattaagt aaaaaagtat taaaagcttg ttacgatggt 120
ggagcacgct taatggaatt tactgctcgt ggagattttg cacacgaagt ttttggtgaa 180
ttaacaaaat atgcaattgc agaattacca ggaatgatta tgggtgtagg ttctgtaacc 240
gatgcagctg cagcatcttt atacatggct ttaggagcaa actttattgt aactccagta 300
ttaagagaag atatagcaat tgtttgtaac agacgtaaag ttttatggtc tcctggttgt 360
ggaactttaa ctgaaattac taaggccgaa gaattaggat gtgaaattgt aaaattattc 420
cctggtgata tttatggacc tcaatttgta aaaggaatta aaggaccaca accttggact 480
agtgtaatgc caactggagg agtttctcca acaaaagaaa atttaacagg ttggtttaat 540
gcaggtgtaa cttgtgttgg aatgggatct caatta 576
<210> 316 <211> 192 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (9)...(192) <223> KDPG and KHG aldolase <220>
<221> SITE
<222> (176)...(179)
<223> Sítio de N-glicosilação prosítio id = PS00001
<400> 316
Met Ala Gin Phe Thr Arg Ile Glu Vai Ala Thr Ala Met Lys Glu Thr
15 10 15
Gly Met Ile Pro Leu Phe Phe Asn Asn Asp Leu Glu Leu Ser Lys Lys
20 25 30
Vai Leu Lys Ala Cys Tyr Asp Gly Gly Ala Arg Leu Met Glu Phe Thr
35 40 45
Ala Arg Gly Asp Phe Ala His Glu Vai Phe Gly Glu Leu Thr Lys Tyr
50 55 60
Ala Ile Ala Glu Leu Pro Gly Met Ile Met Gly Vai Gly Ser Vai Thr
65 70 75 80
Asp Ala Ala Ala Ala Ser Leu Tyr Met Ala Leu Gly Ala Asn Phe Ile
85 90 95
Vai Thr Pro Vai Leu Arg Glu Asp Ile Ala Ile Vai Cys Asn Arg Arg
100 105 110
Petição 870170009999, de 15/02/2017, pág. 762/1247
753/788
Lys Vai Leu 115 Trp Ser Pro Gly Cys 120 Gly Thr Leu Thr Glu 125 Ile Thr Lys
Ala Glu Glu Leu Gly Cys Glu Ile Vai Lys Leu Phe Pro Gly Asp Ile
130 135 140
Tyr Gly Pro Gin Phe Vai Lys Gly Ile Lys Gly Pro Gin Pro Trp Thr
145 150 155 160
Ser Vai Met Pro Thr Gly Gly Vai Ser Pro Thr Lys Glu Asn Leu Thr
165 170 175
Gly Trp Phe Asn Ala Gly Vai Thr Cys Vai Gly Met Gly Ser Gin Leu
180 185 190 <210> 317 <211> 612 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 317
atgagcgggc gagagatcat tgcgatcctg cggggcgtgc gcccgaatga ggtggtggcc 60
attgggcacg ttctgctgga tgcaggtatc gacaagatcg aagttccgct gaattccccc 120
gatgcctttg aaagcattgc gcttttggcg gatgcgtttc acgatagtgc ggtgataggt 180
gctggcaccg ttctgacgcc acaagacgtg gtgaaggtgc atcaacaggg tggcgcgatg 240
gtggtatcgc ctgattgcaa tccggatgtg atcaaggcaa ccaaggcgct gggcatgttg 300
tcttaccccg gtgttttcac cccgaccgaa gcttttaccg ccctgcgttc tggtgcggat 360
gggatcaaac tgtttcctgc ttcaggcatt ggccctgcag ggctggccgc gatgttggcc 420
gttttgccca caggcatgcg cagctatgcg gtggggggcg tcgggccaga tagcttcgcg 480
ccttggatcg gagttggcgt gaccggattt ggcattggaa cgggcctgtt caaaccgggg 540
tttggcacgg ctgatgtggc taaacgggca gcggacattg tggcggccta tgatcggggt 600
attttgaaat ga 612
<210> 318 <211> 203 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (1)...(192) <223> KDPG and KHG aldolase <400> 318
Met Ser Gly Arg Glu Ile Ile Ala Ile Leu Arg Gly Vai Arg Pro Asn
1 5 10 15
Glu Vai Vai Ala Ile Gly His Vai Leu Leu Asp Ala Gly Ile Asp Lys
20 25 30
Ile Glu Vai Pro Leu Asn Ser Pro Asp Ala Phe Glu Ser Ile Ala Leu
40 45
Petição 870170009999, de 15/02/2017, pág. 763/1247
754/788
Leu Ala Asp Ala Phe His Asp 55 Ser Ala Vai Ile Gly 60 Ala Gly Thr Vai
50
Leu Thr Pro Gin Asp Vai Vai Lys Vai His Gin Gin Gly Gly Ala Met
65 70 75 80
Vai Vai Ser Pro Asp Cys Asn Pro Asp Vai Ile Lys Ala Thr Lys Ala
85 90 95
Leu Gly Met Leu Ser Tyr Pro Gly Vai Phe Thr Pro Thr Glu Ala Phe
100 105 110
Thr Ala Leu Arg Ser Gly Ala Asp Gly Ile Lys Leu Phe Pro Ala Ser
115 120 125
Gly Ile Gly Pro Ala Gly Leu Ala Ala Met Leu Ala Vai Leu Pro Thr
130 135 140
Gly Met Arg Ser Tyr Ala Vai Gly Gly Vai Gly Pro Asp Ser Phe Ala
145 150 155 160
Pro Trp Ile Gly Vai Gly Vai Thr Gly Phe Gly Ile Gly Thr Gly Leu
165 170 175
Phe Lys Pro Gly Phe Gly Thr Ala Asp Vai Ala Lys Arg Ala Ala Asp
180 185 190
Ile Vai Ala Ala Tyr Asp Arg Gly Ile Leu Lys
195 200
<210> 319
<211> 600
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 319
gtgccggttc tggtcatcga agacgtcaat gatgccgtgc cgcttgccaa ggccttggtg 60
gccggtggtt tgcgcgtgct tgaaatcacc ctgcgcagtg ccgccgccga ggaaagcatt 120
aaacgtatta tcgccgaagt tcccgatgca attaccggtg cgggcaccgt gatcaatgcc 180
aaacagatgg aacgtatggc cgaaatcggt tgtgcttttg cggtttcgcc gggccatacc 240
gatggtttgc ttaaggccgc caaagatacc ggcgtgccgt tgctgcccgg tgccggaacg 300
ccgtctgaaa tcatgcatct gattgatcat ggctatgaca tcttgaaatt cttcccggcc 360
gaacaacagg gcggtgtttc gatgcttaaa gccctgtctg gcccgctgcc acaggtgaaa 420
ttctgcccga cgggtggtgt gtcgctggca aatttggggg attatctcgc cctgccaaat 480
atcatcaccg ttggtgggtc gtgggtctcg ccaaaaagcg cggtcaaggc cggtgactgg 540
gcaacgatca cgcgcctggc acaggaagca accgacaagg ttgccgaact tcgcggttaa 600
<210> 320 <211> 199 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO
Petição 870170009999, de 15/02/2017, pág. 764/1247
755/788
<222> (D · · . . (186)
<223> KDPG and KHG
<220>
<221> SITE
<222> (23) . . . . (32)
<223> KDPG and KHG aldolases active site. Prosite id = PS00159 <220>
<221> SITE <222> (112)...(125)
<223> KDPG and KHG 1 aldolases Schiff-base forming residue. Prosite
PS00160
<400> 320
Met Pro Vai Leu Vai Ile Glu Asp Vai Asn Asp Ala Vai Pro Leu Ala
1 5 10 15
Lys Ala Leu Vai Ala Gly Gly Leu Arg Vai Leu Glu Ile Thr Leu Arg
20 25 30
Ser Ala Ala Ala Glu Glu Ser Ile Lys Arg Ile Ile Ala Glu Vai Pro
35 40 45
Asp Ala Ile Thr Gly Ala Gly Thr Vai Ile Asn Ala Lys Gin Met Glu
50 55 60
Arg Met Ala Glu Ile Gly Cys Ala Phe Ala Vai Ser Pro Gly His Thr
65 70 75 80
Asp Gly Leu Leu Lys Ala Ala Lys Asp Thr Gly Vai Pro Leu Leu Pro
85 90 95
Gly Ala Gly Thr Pro Ser Glu Ile Met His Leu Ile Asp His Gly Tyr
100 105 110
Asp Ile Leu Lys Phe Phe Pro Ala Glu Gin Gin Gly Gly Vai Ser Met
115 120 125
Leu Lys Ala Leu Ser Gly Pro Leu Pro Gin Vai Lys Phe Cys Pro Thr
130 135 140
Gly Gly Vai Ser Leu Ala Asn Leu Gly Asp Tyr Leu Ala Leu Pro Asn
145 150 155 160
Ile Ile Thr Vai Gly Gly Ser Trp Vai Ser Pro Lys Ser Ala Vai Lys
165 170 175
Ala Gly Asp Trp Ala Thr Ile Thr Arg Leu Ala Gin Glu Ala Thr Asp
180 185 190
Lys Vai Ala Glu Leu Arg Gly
195 <210> 321 <211> 654 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 321
Petição 870170009999, de 15/02/2017, pág. 765/1247
756/788
atgaccagcg aaacgaacca gatattagag gcgaaatttg ccgctgcgcc ggtggtgccc 60
ctgatcgaag ccagtgaccc tacggttgcg gtagcaatcg caaaagcgct gcaggcgggc 120
ggcctcgatg tgatcgaagt cgtcctccgg accgacgcgg cgctcgattg catggaagcc 180
attatcgcgg agacttcgga catcattgtt ggcgcgggaa caatcttgac cgctgacgat 240
gcgaaggcag ctgttacccg cggcgcgcag ttcattgtgt gcccgggact ggtcgacgcg 300
gtggtcaatt tctgcaaggc aaatgatctt ccggtcttcc cgggaacaat gaccccgggc 360
gaagtgcaac aggcccataa tctcggtctc ggaacggtga aattctttcc cgccaaactc 420
gctggcggtg tgccgatgct caaggcattg agctcggtct ttcgcaatat gcgtttcatg 480
ccgacgggtg gggtgtcagc agagaatctg ggcgaatttc tggccgtgcc ttccgtaatt 540
gcctgcggcg gtagctggct cacgccgaaa gcggctatcg acgcgggcga ttacgatgca 600
atcaccaagc tggcccgtga agctgtcgct ctcgcacgtg cctctagacc ataa 654
<210> 322 <211> 217 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (9)...(204) <223> KDPG and KHG aldolase <400> 322
Met 1 Thr Ser Glu Thr 5 Asn Gin Ile Leu Glu Ala Lys 10 Phe Ala Ala 15 Ala
Pro Vai Vai Pro Leu Ile Glu Ala Ser Asp Pro Thr Vai Ala Vai Ala
20 25 30
Ile Ala Lys Ala Leu Gin Ala Gly Gly Leu Asp Vai Ile Glu Vai Vai
35 40 45
Leu Arg Thr Asp Ala Ala Leu Asp Cys Met Glu Ala Ile Ile Ala Glu
50 55 60
Thr Ser Asp Ile Ile Vai Gly Ala Gly Thr Ile Leu Thr Ala Asp Asp
65 70 75 80
Ala Lys Ala Ala Vai Thr Arg Gly Ala Gin Phe Ile Vai Cys Pro Gly
85 90 95
Leu Vai Asp Ala Vai Vai Asn Phe Cys Lys Ala Asn Asp Leu Pro Vai
100 105 110
Phe Pro Gly Thr Met Thr Pro Gly Glu Vai Gin Gin Ala His Asn Leu
115 120 125
Gly Leu Gly Thr Vai Lys Phe Phe Pro Ala Lys Leu Ala Gly Gly Vai
130 135 140
Pro Met Leu Lys Ala Leu Ser Ser Vai Phe Arg Asn Met Arg Phe Met
145 150 155 160
Pro Thr Gly Gly Vai Ser Ala Glu Asn Leu Gly Glu Phe Leu Ala Vai
165 170 175
Pro Ser Vai Ile Ala Cys Gly Gly Ser Trp Leu Thr Pro Lys Ala Ala
Petição 870170009999, de 15/02/2017, pág. 766/1247
757/788
180 185 190
Ile Asp Ala Gly Asp Tyr Asp Ala Ile Thr Lys Leu Ala Arg Glu Ala 205
195 200
Vai Ala Leu Ala Arg Ala Ser Arg Pro
210 215
<210> 323 <211> 603 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 323
atgacgttcc ccctgagatc actcgtggaa gccgcgacca aggcaccgat tgtacccgtt 60
ctggtcgtcg accgcattga agttgcggcc ccccttgcgc gggcgcttgt tgatggcggc 120
ctgacaattg ccgaagtcac gctgcgaaca ccttcggggc tggcggtaat cgaagagatg 180
aaatccgccg agcccggcct gaaggtcggc gcgggcaccg tgttgaccga atccgatgtc 240
gagaacgcat tggcggccgg cgcggatttc ctcgtggcac cgggcatgtc gccaaaactg 300
ttggccggac tgggtggcca ccgccgcctg atgatccctg gcgttgcgac agccagcgaa 360
gccatggcca ggcacgagga cgggttcgac ctgttgaaac tgtttccggc ctcgattgcc 420
ggcggagtca gcgctctcaa ggcgcttggc ggtccgctgc cgcacctgcg cttcatgccg 480
accggcggca tcaccgaggc ggatgtcggc aaatacctcg cccttcccaa tgttttcgcg 540
gccggaggct cgtggattgc gacgggcgcc gacattgctg ccgaagactc gagccgaatt 600
ctt 603
<210> 324 <211> 201 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (9)...(201) <223> KDPG and KHG aldolase <220>
<221> SITE <222> (40)...(49) <223> KDPG and KHG aldolases active site. Prosite id = PS00159 <400> 324
Met Thr Phe Pro Leu Arg Ser Leu Vai Glu Ala Ala Thr Lys Ala Pro
1 5 10 15
Ile Vai Pro Vai Leu Vai Vai Asp Arg Ile Glu Vai Ala Ala Pro Leu
20 25 30
Ala Arg Ala Leu Vai Asp Gly Gly Leu Thr Ile Ala Glu Vai Thr Leu
35 40 45
Arg Thr Pro Ser Gly Leu Ala Vai Ile Glu Glu Met Lys Ser Ala Glu
Petição 870170009999, de 15/02/2017, pág. 767/1247
758/788
50 55 60
Pro Gly Leu Lys Vai Gly Ala Gly Thr Vai Leu Thr Glu Ser Asp Vai
65 70 75 80
Glu Asn Ala Leu Ala Ala Gly Ala Asp Phe Leu Vai Ala Pro Gly Met
85 90 95
Ser Pro Lys Leu Leu Ala Gly Leu Gly Gly His Arg Arg Leu Met Ile
100 105 110
Pro Gly Vai Ala Thr Ala Ser Glu Ala Met Ala Arg His Glu Asp Gly
115 120 125
Phe Asp Leu Leu Lys Leu Phe Pro Ala Ser Ile Ala Gly Gly Vai Ser
130 135 140
Ala Leu Lys Ala Leu Gly Gly Pro Leu Pro His Leu Arg Phe Met Pro
145 150 155 160
Thr Gly Gly Ile Thr Glu Ala Asp Vai Gly Lys Tyr Leu Ala Leu Pro
165 170 175
Asn Vai Phe Ala Ala Gly Gly Ser Trp Ile Ala Thr Gly Ala Asp Ile
180 185 190
Ala Ala Glu Asp Ser Ser Arg Ile Leu
195 200
<210> 325
<211> 648
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 325
atacaagaag taaaggagat tggtttattg cctttatatt atcacgacga tgcagctatt 60
tgtctgaaag tagctaatac tttgtatgat gccgatgtaa aatgcataga atttacaaac 120
cgtggtgaat atgcacttac aaactttaaa cacttagtga agctgagaga tgaaaagatg 180
aaaggtctat tgcttgcagt gggcacaatt aaaaccggga cggatgctca gaaatttatt 240
gatgccggtg ccgatttttt gatcagccca atatttgaca gcagcgtttg cgatacggcc 300
tatttgaata aaacgttgtg gataccaggt tgtacaacgc caacagaaat tcatgtagca 360
cagcaagcgg gttgtaagct tatcaaatta ttcccgggaa atgtactggg gccgggtttt 420
gtagaagcga tcatgccatt attcagtgga attgatttta cgatcactgg tggagtagaa 480
gcaacagaag caaatctggg tgcctggttt aaatcaggtg tgaaggtagt tggaatgggc 540
agcaagctta taacaaaaga cattttaaag aatggtgatt atgatggatt gaaagctaaa 600
acaaaagaag tgctttcaat aattcgacat attaaatcag ctaaatag 648
<210> 326 <211> 215 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO
Petição 870170009999, de 15/02/2017, pág. 768/1247
759/788 <222> (1)...(200) <223> KDPG and KHG aldolase <220>
<221> SITE <222> (104)...(107) <223> Sítio de N-glicosilação prosítio id = PS00001 <400> 326
Ile Gin Glu Vai Lys Glu Ile Gly Leu Leu Pro Leu Tyr Tyr His Asp
1 5 10 15
Asp Ala Ala Ile Cys Leu Lys Vai Ala Asn Thr Leu Tyr Asp Ala Asp
20 25 30
Vai Lys Cys Ile Glu Phe Thr Asn Arg Gly Glu Tyr Ala Leu Thr Asn
35 40 45
Phe Lys His Leu Vai Lys Leu Arg Asp Glu Lys Met Lys Gly Leu Leu
50 55 60
Leu Ala Vai Gly Thr Ile Lys Thr Gly Thr Asp Ala Gin Lys Phe Ile
65 70 75 80
Asp Ala Gly Ala Asp Phe Leu Ile Ser Pro Ile Phe Asp Ser Ser Vai
85 90 95
Cys Asp Thr Ala Tyr Leu Asn Lys Thr Leu Trp Ile Pro Gly Cys Thr
100 105 110
Thr Pro Thr Glu Ile His Vai Ala Gin Gin Ala Gly Cys Lys Leu Ile
115 120 125
Lys Leu Phe Pro Gly Asn Vai Leu Gly Pro Gly Phe Vai Glu Ala Ile
130 135 140
Met Pro Leu Phe Ser Gly Ile Asp Phe Thr Ile Thr Gly Gly Vai Glu
145 150 155 160
Ala Thr Glu Ala Asn Leu Gly Ala Trp Phe Lys Ser Gly Vai Lys Vai
165 170 175
Vai Gly Met Gly Ser Lys Leu Ile Thr Lys Asp Ile Leu Lys Asn Gly
180 185 190
Asp Tyr Asp Gly Leu Lys Ala Lys Thr Lys Glu Vai Leu Ser Ile Ile
195 200 205
Arg His Ile Lys Ser Ala Lys
210 215
<210> 327 <211> 642 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 327 atggaacaat ctatctttga ttacttctac aaaatcggcg tcattcccgt actggaaatc gactcggcgc ttcatgccaa accgttagcc gaggcgctgc tggcaggagg tctgcctatc gccgagatca cactgcgcac cgaggcagcg ctcgaggcga ttcgcactat tgcgcgcgat
120
180
Petição 870170009999, de 15/02/2017, pág. 769/1247
760/788
gtaccggatg tcatcgtcgg ggctggaacc gtgataacct gggaacaagc cgaagcggca 240
cgtgacgcgg gcgcgcaatt tctcgtctca cccgggatgg tggagcaggt tgtcatctgg 300
gcacaggaaa atcaaatccc tgttctgccc ggcgctgtga cccccaccga gatgatccgc 360
gccatccatc tcggtttgaa gtttctgaaa tttttcccat cggaagctgt aggcggactc 420
aaagccctca aggccctctc agaccccttt ccgggattgc gatttatccc aaccggtgga 480
gtgaagtttg agaatctggc ggattatcta caaatggaaa agatccacgc tgtcggcggc 540
tcgtggatgg caaagcgcca gatgatcgcc gaccgaaaat tcgacgagat tacgcgattg 600
gcgaatgaag ccagcgacct tgtgacaaaa atcaggaagt ag 642
<210> 328 <211> 213 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (5)...(200) <223> KDPG and KHG aldolase <220>
<221> SITE <222> (37)...(46) <223> KDPG and KHG aldolases active site. Prosite id = PS00159 <400> 328
Met Glu Gin Ser Ile Phe Asp Tyr Phe Tyr Lys Ile Gly Vai Ile Pro
1 5 10 15
Vai Leu Glu Ile Asp Ser Ala Leu His Ala Lys Pro Leu Ala Glu Ala
20 25 30
Leu Leu Ala Gly Gly Leu Pro Ile Ala Glu Ile Thr Leu Arg Thr Glu
35 40 45
Ala Ala Leu Glu Ala Ile Arg Thr Ile Ala Arg Asp Vai Pro Asp Vai
50 55 60
Ile Vai Gly Ala Gly Thr Vai Ile Thr Trp Glu Gin Ala Glu Ala Ala
65 70 75 80
Arg Asp Ala Gly Ala Gin Phe Leu Vai Ser Pro Gly Met Vai Glu Gin
85 90 95
Vai Vai Ile Trp Ala Gin Glu Asn Gin Ile Pro Vai Leu Pro Gly Ala
100 105 110
Vai Thr Pro Thr Glu Met Ile Arg Ala Ile His Leu Gly Leu Lys Phe
115 120 125
Leu Lys Phe Phe Pro Ser Glu Ala Vai Gly Gly Leu Lys Ala Leu Lys
130 135 140
Ala Leu Ser Asp Pro Phe Pro Gly Leu Arg Phe Ile Pro Thr Gly Gly
145 150 155 160
Vai Lys Phe Glu Asn Leu Ala Asp Tyr Leu Gin Met Glu Lys Ile His
165 170 175
Petição 870170009999, de 15/02/2017, pág. 770/1247
761/788
Ala Vai Gly Gly Ser Trp Met Ala Lys Arg Gin Met Ile Ala Asp Arg
180 185 190
Lys Phe Asp Glu Ile Thr Arg Leu Ala Asn Glu Ala Ser Asp Leu Vai
195 200 205
Thr Lys Ile Arg Lys
210
<210> 329
<211> 618
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente <400> 329
atgactcgct tttctgaact tatgtcaggg caaacattac tgcctataat tcaagccgac 60
acaccagagc aaggcgttaa aatagctcaa gctatggcta atgctggcct tactttggtt 120
gaagtagtac ttagaactga tgcatcgtta gatgcattaa aagctattaa agagcaggtg 180
ccagcgctta aagtaggtgc aggcacagta ataaatactg acattttaga gcaagcactt 240
gcagcaggtg ccgactttat tgttacgcca gcagtgtctc cgcaattatt agccgcgcta 300
acaaaatgca atgtgccggt acttcctggt gtgtctaaca cgggtgacat tttaatggcg 360
cttgagtacg gttttgaaga acaaaaatta ttccctgcat cgctcgctgg tggtgcacca 420
ttcgtatcgg ctgtctcgtc agtatttaga gctgctagct tttgtcctac aggtggcgta 480
agcgagcaaa ataaaatgga ttacttatct ttaaataatg tatttgctgt gggtggtact 540
tggattgcaa ataaagagtg ggttgcacaa gaaaactggc aagcaattac tgactcgtgt 600
attcaagcat taaagtag 618
<210> 330 <211> 205 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (4)...(199) <223> KDPG and KHG aldolase <400> 330
Met Thr Arg Phe Ser Glu Leu Met Ser Gly Gin Thr Leu Leu Pro Ile
1 5 10 15
Ile Gin Ala Asp Thr Pro Glu Gin Gly Vai Lys Ile Ala Gin Ala Met
20 25 30
Ala Asn Ala Gly Leu Thr Leu Vai Glu Vai Vai Leu Arg Thr Asp Ala
35 40 45
Ser Leu Asp Ala Leu Lys Ala Ile Lys Glu Gin Vai Pro Ala Leu Lys
50 55 60
Vai Gly Ala Gly Thr Vai Ile Asn Thr Asp Ile Leu Glu Gin Ala Leu
65 70 75 80
Petição 870170009999, de 15/02/2017, pág. 771/1247
762/788
Ala Ala Gly Ala Asp Phe Ile Vai Thr Pro Ala 90 Vai Ser Pro Gin 95 Leu
85
Leu Ala Ala Leu Thr Lys Cys Asn Vai Pro Vai Leu Pro Gly Vai Ser
100 105 110
Asn Thr Gly Asp Ile Leu Met Ala Leu Glu Tyr Gly Phe Glu Glu Gin
115 120 125
Lys Leu Phe Pro Ala Ser Leu Ala Gly Gly Ala Pro Phe Vai Ser Ala
130 135 140
Vai Ser Ser Vai Phe Arg Ala Ala Ser Phe Cys Pro Thr Gly Gly Vai
145 150 155 160
Ser Glu Gin Asn Lys Met Asp Tyr Leu Ser Leu Asn Asn Vai Phe Ala
165 170 175
Vai Gly Gly Thr Trp Ile Ala Asn Lys Glu Trp Vai Ala Gin Glu Asn
180 185 190
Trp Gin Ala Ile Thr Asp Ser Cys Ile Gin Ala Leu Lys
195 200 205 <210> 331 <211> 663 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 331
atggcatatc cgaccgcggt caattcacag attaccgaca cagcaggcaa ggttttgcat 60
cgcaaactga ttgctatttt acgcggagtg aagcccgatg aagcggcatc catggcgcgt 120
gtgctggtcg atgccgggat cacgatgatc gaggtgccgc tgaattcccc ggaaccgctt 180
aaaagcattg cgatcatgaa ggcagaagtc ggtgacgcgg ccctgatcgg ggcaggtacg 240
gtcttaacgg tcgaggatgt tgtgaacgtt cgtgacgcgg gcggtgagtt tgttgtgtcg 300
cccaattacg atgtcgatgt gattaaaaaa accaaggaag tcggtatggg aagttggccg 360
ggggtgctga ctccgaccga atgtttcgcc gcgatcaagg ccggggcgga tgggcttaaa 420
atattccctg ccagcatcat tggcgcatcg gggatttcgg cgatgcgggc ggttttgcca 480
aaagatatgc cggtttatgc ggttggtggt gttgggccgg atgattttgc gacctatgcc 540
aaggcggggt gcgatggttt cggccttgga tcggggattt ataaacccgg cctgacagcg 600
gacgaagtat cggggcgcgc tattgccttc gtaacggcgc atgacgcggt atttgcgggc 660
tag 663
<210> 332 <211> 220 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (15)...(211) <223> KDPG and KHG aldolase
Petição 870170009999, de 15/02/2017, pág. 772/1247
763/788
<400> 332
Met Ala Tyr Pro Thr Ala Vai Asn Ser Gin Ile Thr Asp Thr Ala Gly
1 5 10 15
Lys Vai Leu His Arg Lys Leu Ile Ala Ile Leu Arg Gly Vai Lys Pro
20 25 30
Asp Glu Ala Ala Ser Met Ala Arg Vai Leu Vai Asp Ala Gly Ile Thr
35 40 45
Met Ile Glu Vai Pro Leu Asn Ser Pro Glu Pro Leu Lys Ser Ile Ala
50 55 60
Ile Met Lys Ala Glu Vai Gly Asp Ala Ala Leu Ile Gly Ala Gly Thr
65 70 75 80
Vai Leu Thr Vai Glu Asp Vai Vai Asn Vai Arg Asp Ala Gly Gly Glu
85 90 95
Phe Vai Vai Ser Pro Asn Tyr Asp Vai Asp Vai Ile Lys Lys Thr Lys
100 105 110
Glu Vai Gly Met Gly Ser Trp Pro Gly Vai Leu Thr Pro Thr Glu Cys
115 120 125
Phe Ala Ala Ile Lys Ala Gly Ala Asp Gly Leu Lys Ile Phe Pro Ala
130 135 140
Ser Ile Ile Gly Ala Ser Gly Ile Ser Ala Met Arg Ala Vai Leu Pro
145 150 155 160
Lys Asp Met Pro Vai Tyr Ala Vai Gly Gly Vai Gly Pro Asp Asp Phe
165 170 175
Ala Thr Tyr Ala Lys Ala Gly Cys Asp Gly Phe Gly Leu Gly Ser Gly
180 185 190
Ile Tyr Lys Pro Gly Leu Thr Ala Asp Glu Vai Ser Gly Arg Ala Ile
195 200 205
Ala Phe Vai Thr Ala His Asp Ala Vai Phe Ala Gly
210 215 220
<210> 333 <211> 648 <212> DNA <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <400> 333 atggcgattg atcccgccgc tgccagtcgg cgcatgcgcg aattggcggc gctggccccg 60 gtgatcccgg tgctggtgat cgaggatgcc gcaagggcga ggcccctggc cgaggcgctg 120 gtggcgggtg gtctgccggt gctggaggtg acgctgcgca ccccggccgc gccagaggtc 180 attcgcgaga tgtcccgggt cccgggggcc attgtcggcg ccggcaccgt gatcacaccg 240 gccgacgtgc ggatcgcaca agcggcgggg gcccgattcg ccgtctcccc cggcgcgacc 300 gatgcgttgc tcgatgcctg cgaagcggcg gggctgccgc tcctgcccgg cgcggccacg 360 gcgagcgagg cgatggcgct tctggcgcgc ggctacgaca tgctgaagtt ctttcccgcc 420 gaggcagtgg gcggcgcggc ggcgcttgca gcgctgggcg cgccgctgcc gcagatttcc 480 ttctgcccga ccggaggggt cagcccggca aacgcgcccg actacctcgc cttgcccacg 540
Petição 870170009999, de 15/02/2017, pág. 773/1247
764/788 gttccctgcg tcggcggcag ctgggtggcc ccgaaaccac aggtcgccgc cggcgactgg gacgcgatcc gtgccctcgc cgaacacgcc cgcaccctcg cgccctga <210> 334 <211> 215 <212> PRT <213> desconhecido <220>
<223> Proteína obtida por amostra do ambiente <220>
<221> DOMÍNIO <222> (12)...(206) <223> KDPG e KHG aldolase <220>
<221> SITE <222> (44)...(53) <223> KDPG e KHG aldolases sítio ativo. Prosítio id = PS00159 <220>
<221> SITE <222> (133)...(146) <223> KDPG e KHG aldolases Schiff-base forming residue. Prosite id <400> 334
Met Ala Ile Asp Pro Ala Ala Ala Ser Arg Arg Met Arg Glu Leu Ala 15 10 15
Ala Leu Ala Pro Vai Ile Pro Vai Leu Vai Ile Glu Asp Ala Ala Arg
25 30
Ala Arg Pro Leu Ala Glu Ala Leu Vai Ala Gly Gly Leu Pro Vai Leu
40 45
Glu Vai Thr Leu Arg Thr Pro Ala Ala Pro Glu Vai Ile Arg Glu Met
55 60
Ser Arg Vai Pro Gly Ala Ile Vai Gly Ala Gly Thr Vai Ile Thr Pro
70 75 80
Ala Asp Vai Arg Ile Ala Gin Ala Ala Gly Ala Arg Phe Ala Vai Ser
90 95
Pro Gly Ala Thr Asp Ala Leu Leu Asp Ala Cys Glu Ala Ala Gly Leu
100 105 110
Pro Leu Leu Pro Gly Ala Ala Thr Ala Ser Glu Ala Met Ala Leu Leu
115 120 125
Ala Arg Gly Tyr Asp Met Leu Lys Phe Phe Pro Ala Glu Ala Vai Gly
130 135 140
Gly Ala Ala Ala Leu Ala Ala Leu Gly Ala Pro Leu Pro Gin Ile Ser
145 150 155 160
Phe Cys Pro Thr Gly Gly Vai Ser Pro Ala Asn Ala Pro Asp Tyr Leu
165 170 175
Ala Leu Pro Thr Vai Pro Cys Vai Gly Gly Ser Trp Vai Ala Pro Lys
180 185 190
600
648
PS00160
Petição 870170009999, de 15/02/2017, pág. 774/1247
765/788
Pro Gin Vai Ala Ala Gly Asp Trp Asp Ala Ile Arg Ala Leu Ala Glu 195 200 205
His Ala Arg Thr Leu Ala Pro 210 215 <210> 335 <211> 19 <212> DNA <213> Artificial sequence <220>
<223> Iniciador <220>
<221> região de interesse biológico
<222> (D · · (19)
<223> b is c, g, or t
<220>
<221> região de interesse biológico
<222> (D · · (19)
<223> y is c or t
<220>
<221> região de interesse biológico
<222> (D · · (19)
<223> r is a or g
<220>
<221> região de interesse biológico
<222> (D · · (19)
<223> w is a or t
<400> 335 aargtbtwyg argacaatg
<210> 336
<211> 18
<212> DNA
<213> Sequência Artificial
<220>
<223> Iniciador
<220>
<221> região de interesse biológico
<222> (D · · (18)
<223> d is a, g, or t
<220>
<221> região de interesse biológico
<222> (D · · (18)
<223> y is c or t
<220>
<221> região de interesse biológico
<222> (D · · (18)
Petição 870170009999, de 15/02/2017, pág. 775/1247
766/788
<223> r is a or g
<220>
<221> região de interesse biológico
<222> (D · · (18)
<223> w is a or t
<400> 336
gcdcagawca ayggrtgg 18 <210> 337
<211> 23
<212> DNA
<213> Sequência Artificial
<220>
<223> Iniciador
<220>
<221> região de interesse biológico
<222> (D · · (23)
<223> d is a, g, or t
<220>
<221> região de interesse biológico
<222> (D · · (23)
<223> y is c or t
<220>
<221> região de interesse biológico
<222> (D · · (23)
<223> r is a or g
<220>
<221> região de interesse biológico
<222> (D · · (23)
<223> s is c or g
<400> 337
ccatcrsyat cdgcrtadag cca 23 <210> 338
<211> 20
<212> DNA
<213> Sequência Artificial
<220>
<223> Iniciador
<220>
<221> região de interesse biológico
<222> (D · · (20)
<223> d is a, g, or t
<220>
<221> região de interesse biológico
<222> (D · · (20)
<223> y is c or t
Petição 870170009999, de 15/02/2017, pág. 776/1247
767/788 <220>
<221> região de interesse biológico
<222> (D · · (20)
<223> r is a or g
<220>
<221> região de interesse biológico
<222> (D · · (20)
<223> n is a, c, g, or t
<400> 338
gcrtadagcc aytcnccrtc 20 <210> 339
<211> 30
<212> DNA
<213> Següência Artificial
<220>
<223> Iniciador
<400> 339
ataagacata tgcctatcgt tgttacgaag 30 <210> 340
<211> 33
<212> DNA
<213> Següência Artificial
<220>
<223> Iniciador
<400> 340
ataagaggat ccttattcct cgggcagccg ctc 33 <210> 341
<211> 30
<212> DNA
<213> Següência Artificial
<220>
<223> Iniciador
<400> 341
ataagacata tgaacagacc tgtggttgtc 30 <210> 342
<211> 33
<212> DNA
<213> Següência Artificial
<220>
<223> Iniciador
<400> 342
ataagaggat ccttacaggt acttgagacc gag 33 <210> 343 <211> 30 <212> DNA
Petição 870170009999, de 15/02/2017, pág. 777/1247
768/788 <213> Sequência Artificial <220>
<223> Iniciador <400> 343 ataagacata tgagcgtggt catccgaaac <210> 344 <211> 33 <212> DNA <213> Sequência Artificial <220>
<223> Iniciador <400> 344 ataagaggat ccttacttcg ctttgttata ggc <210> 345 <211> 30 <212> DNA <213> Sequência Artificial <220>
<223> Iniciador <400> 345 ataagacata tgaacaagcc cgtggttgtg <210> 346 <211> 34 <212> DNA <213> Sequência Artificial <220>
<223> Iniciador <400> 346 ataagaggat ccttacaagt acttgagacc gagg <210> 347 <211> 29 <212> DNA <213> Sequência Artificial <220>
<223> Iniciador <400> 347 ataagacata tgagcgtggt cgtcaccgg <210> 348 <211> 34 <212> DNA <213> Sequência Artificial <220>
<223> Iniciador <400> 348 ataagaggat ccttagccgt ttttcccgtc ggtg
Petição 870170009999, de 15/02/2017, pág. 778/1247
769/788
<210> 349
<211> 33
<212> DNA
<213> Següência Artificial
<220>
<223> Iniciador
<400> 349
agaagacata tgatgagcat cgtcgtccag aac 33 <210> 350
<211> 34
<212> DNA
<213> Següência Artificial
<220>
<223> Iniciador
<400> 350
agaagaggat cctcagacat atttcaggcc cttg 34 <210> 351
<211> 30
<212> DNA
<213> Següência Artificial
<220>
<223> Iniciador
<400> 351
agaagacata tgatgagcgt ggtcatcacc 30 <210> 352
<211> 33
<212> DNA
<213> Següência Artificial
<220>
<223> Iniciador
<400> 352
acaacaggat ccctatttct tctccggcgt ttc 33 <210> 353
<211> 30
<212> DNA
<213> Següência Artificial
<220>
<223> Iniciador
<400> 353
ataatacata tgagcgtcgt cgttcagaac 30
<210> 354
<211> 34
<212> DNA
<213> Següência Artificial
<220>
Petição 870170009999, de 15/02/2017, pág. 779/1247
770/788 <223> Iniciador <400> 354 ataataggat ccttagacat atttgagccc cttc <210> 355 <211> 33 <212> DNA <213> Sequência Artificial <220>
<223> Iniciador <400> 355 agaagacata tgatgtcggt tgtcgttcag aac <210> 356 <211> 31 <212> DNA <213> Sequência Artificial <220>
<223> Iniciador <400> 356 agaagaggat cctcagatat acttcaggcc c <210> 357 <211> 852 <212> DNA <213> Sequência Artificial <220>
<223> ATCC 4978 DAAT <400> 357
atgagttata gcttatggaa tgaccaaatt gtgaatgatg aagaagtagt agttgataag 60
gaggaccgtg gctatcaatt tggcgatggt gtttatgaag ttgtaaaagt atataacggt 120
gaattattta cagcggagga gcatgtcgat cgtttttacg cgagtgctga aaaaattcgc 180
gttacgatcc cttatacaaa agacaaattg catcaattat tgcatcagtt agttgaaatg 240
aataaagttc aaacaggaca tatttatttc caaattacgc gtggtgcagg ccctcgtaat 300
catattttcc ctggtgatga agtgaagcca gtattaacag gtaataccaa ggaaaatcca 360
cgtcccgtag caaactttga aaaaggtgtg aaagcaacat ttgtagaaga cattcgttgg 420
ttacgctgtg acattaaatc attaaattta cttggtgcgg tacttgctaa acaagaagca 480
catgaaaaag gatgctatga agcggtttta catcgtgatg aaatcgtaac agaaggctct 540
tcttcaaata tttatggaat taaagatggc gtattataca cacatccagc gaataacttc 600
atcttaaatg gtattacacg tcaagtaatc attaaatgtg ctgctgaaat tggcttacca 660
gtgaaggaag aagcaatgac aaaaactcag cttcttgcaa tggatgaagt gattgtttca 720
tcaacgactt cagaagtaac gccaattatc gacatagatg gaacagtaat tggtgcgggt 780
aaaccgggtg actggacacg taaattacaa gcacaatttg atacgaaaat cccaaaaggt 840
attcgcgcat aa 852
<210>
<211>
<212>
358
283
PRT <213> Sequência Artificial
Petição 870170009999, de 15/02/2017, pág. 780/1247
771/788 <220>
<223> ATCC 497E i DAAT
<400> 358
Met Ser Tyr Ser Leu Trp Asn Asp Gin Ile Vai Asn Asp Glu Glu Vai
1 5 10 15
Vai Vai Asp Lys Glu Asp Arg Gly Tyr Gin Phe Gly Asp Gly Vai Tyr
20 25 30
Glu Vai Vai Lys Vai Tyr Asn Gly Glu Leu Phe Thr Ala Glu Glu His
35 40 45
Vai Asp Arg Phe Tyr Ala Ser Ala Glu Lys Ile Arg Vai Thr Ile Pro
50 55 60
Tyr Thr Lys Asp Lys Leu His Gin Leu Leu His Gin Leu Vai Glu Met
65 70 75 80
Asn Lys Vai Gin Thr Gly His Ile Tyr Phe Gin Ile Thr Arg Gly Ala
85 90 95
Gly Pro Arg Asn His Ile Phe Pro Gly Asp Glu Vai Lys Pro Vai Leu
100 105 110
Thr Gly Asn Thr Lys Glu Asn Pro Arg Pro Vai Ala Asn Phe Glu Lys
115 120 125
Gly Vai Lys Ala Thr Phe Vai Glu Asp Ile Arg Trp Leu Arg Cys Asp
130 135 140
Ile Lys Ser Leu Asn Leu Leu Gly Ala Vai Leu Ala Lys Gin Glu Ala
145 150 155 160
His Glu Lys Gly Cys Tyr Glu Ala Vai Leu His Arg Asp Glu Ile Vai
165 170 175
Thr Glu Gly Ser Ser Ser Asn Ile Tyr Gly Ile Lys Asp Gly Vai Leu
180 185 190
Tyr Thr His Pro Ala Asn Asn Phe Ile Leu Asn Gly Ile Thr Arg Gin
195 200 205
Vai Ile Ile Lys Cys Ala Ala Glu Ile Gly Leu Pro Vai Lys Glu Glu
210 215 220
Ala Met Thr Lys Thr Gin Leu Leu Ala Met Asp Glu Vai Ile Vai Ser
225 230 235 240
Ser Thr Thr Ser Glu Vai Thr Pro Ile Ile Asp Ile Asp Gly Thr Vai
245 250 255
Ile Gly Ala Gly Lys Pro Gly Asp Trp Thr Arg Lys Leu Gin Ala Gin
260 265 270
Phe Asp Thr Lys Ile Pro Lys Gly Ile Arg Ala
275 280
<210> 359
<211> 35
<212> DNA
<213> Sequência Artificial
<220>
<223> Iniciador Mutagênico
Petição 870170009999, de 15/02/2017, pág. 781/1247
772/788 <400> 359 gtgattgttt catcaacgaa ttcagaagta acgcc 35 <210> 360
<211> 35
<212> DNA
<213> Sequência Artificial
<220>
<223> Iniciador Mutagênico
<400> 360
gtgattgttt catcaacgcg ttcagaagta acgcc 35 <210> 361
<211> 35
<212> DNA
<213> Sequência Artificial
<220>
<223> Iniciador Mutagênico
<400> 361
gtgattgttt catcaacgag ttcagaagta acgcc 35 <210> 362
<211> 35
<212> DNA
<213> Sequência Artificial
<220>
<223> Iniciador Mutagênico
<400> 362
gtgattgttt catcaacggc ttcagaagta acgcc 35 <210> 363
<211> 31
<212> DNA
<213> Sequência Artificial
<220>
<223> Iniciador Mutagênico
<400> 363
gtgcaggccc tcgtgctcat attttccctg g 31 <210> 364
<211> 45
<212> DNA
<213> Sequência Artificial
<220>
<223> Iniciador Mutagênico
<400> 364
gaagtgattg tttcatcaac gcagtcagaa gtaacgccaa ttatc 45 <210> 365 <211> 40 <212> DNA
Petição 870170009999, de 15/02/2017, pág. 782/1247
773/788
<213> Sequência Artificial
<220>
<223> Iniciador Mutagênico
<400> 365
catatgagtt atagcttatg gaatgaccaa attgtgaatg 40 <210> 366
<211> 34
<212> DNA
<213> Sequência Artificial
<220>
<223> Iniciador Mutagênico
<400> 366
ctcgagtgcg gccgcaagct tgtcgacgga gctc 34 <210> 367
<211> 95
<212> DNA
<213> Sequência Artificial
<220>
<223> Iniciador Mutagênico
<400> 367
aatatttatg gaattaaaga tggcgtatta tacacacatc cagcgaataa catgatctta 60 aatggtatta cacgtcaagt aatcattaaa tgtgc 95 <210> 368
<211> 34
<212> DNA
<213> Sequência Artificial
<220>
<223> Iniciador Mutagênico
<400> 368
ggccagtgaa ttgtaatacg actcactata gggc 34 <210> 369
<211> 42
<212> DNA
<213> Sequência Artificial
<220>
<223> Iniciador Mutagênico
<400> 369
cgccatcttt aattccataa atatttgaag aagagccttc tg 42 <210> 370
<211> 66
<212> DNA
<213> Sequência Artificial
<220>
<223> Iniciador Mutagênico
<400> 370
Petição 870170009999, de 15/02/2017, pág. 783/1247
774/788 gcaacatttg tagaagacat tcgttgggaa tactgttaca ttaaatcatt aaatttactt ggtgcg <210> 371 <211> 55 <212> DNA <213> Següência Artificial <220>
<223> Iniciador Mutagênico <400> 371 gtattataca cacatccagc gaataactac atcttaaatg gtattacacg tcaag <210> 372 <211> 64 <212> DNA <213> Següência Artificial <220>
<223> Iniciador Mutagênico <400> 372 gcaatggatg aagtgattgt ttcatcaacg actaaagaag taacgccaat tatcgacata gatg <210> 373 <211> 64 <212> DNA <213> Següência Artificial <220>
<223> Iniciador Mutagênico <400> 373 gcaatggatg aagtgattgt ttcatcaacg aataaagaag taacgccaat tatcgacata gatg <210> 374 <211> 64 <212> DNA <213> Següência Artificial <220>
<223> Iniciador Mutagênico <400> 374 gcaatggatg aagtgattgt ttcatcaacg aatcgtgaag taacgccaat tatcgacata gatg <210> 375 <211> 16 <212> PRT <213> P. striata <220>
<221> região de interesse biológico <222> (12)..(12) <223> Xaa can be any naturally occurring amino acid
Petição 870170009999, de 15/02/2017, pág. 784/1247
775/788 <400> 375
Leu Thr Ala Vai Leu Lys Ala Asp Ala Tyr Gly Xaa Gly Ile Gly Leu <210> 376 <211> 28 <212> DNA <213> Sequência Artificial <220>
<223> Iniciador <400> 376 agaagacata tgccctttcg ccgtaggg <210> 377 <211> 32 <212> DNA <213> Sequência Artificial <220>
<223> Iniciador <400> 377 agaagaggat cctcagtcga cgagtatctt cg <210> 378 <211> 1230 <212> DNA <213> Sequência Artificial <220>
<223> KT2440 BAR <400> 378
atgccctttc gccgtaccct tctggctgca tccctggcac ttctgatcac cggacaggcc 60
cccctgtatg cggcaccacc gttgtcgatg gacaacggca ccaacaccct gaccgtgcaa 120
aacagcaatg cctgggtcga agtcagcgcc agcgccctgc agcacaacat ccgcacgctg 180
caggccgagc tggccggcaa gtccaagctg tgcgccgtgc tcaaggccga tgcctatggc 240
cacggtatcg gcctggtaat gccatcgatc atcgcccaag gcgtgccctg cgtggcggtg 300
gccagcaacg aggaggcccg cgtggtccgc gccagtggct tcaccgggca actggtgcgg 360
gtacgcctgg ccagcctcag cgagctggaa gatggcttgc agtacgacat ggaagagctg 420
gtgggcagcg cggaatttgc ccgccaggcc gatgccatcg ccgcgcgcca tggcaagacc 480
ttgcgcattc acatggcgct caactccagc ggcatgagcc gcaacggggt ggagatggcc 540
acctggtccg gccgtggcga agcgctgcag atcaccgacc agaagcacct caagctggtc 600
gcgctgatga cccacttcgc cgtggaagac aaggacgatg tacgcaaggg cctggcggca 660
ttcaacgagc agaccgactg gttgatcaag cacgccaggc tggaccgcag caagctcacc 720
ctgcacgccg ccaactcgtt cgctacgctg gaagtgccgg aagcgcgcct ggacatggta 780
cgaacgggtg gcgcgctgtt cggcgacacc gtgccggcgc gcaccgagta caaacgtgcg 840
atgcagttca aatcgcacgt ggcggcggtg cacagctatc cggccggcaa caccgtgggc 900
tatgaccgca ccttcaccct ggcccgtgat tcgcggctgg ccaacattac ggtcgggtac 960
tccgatggct accgccgggt attcaccaac aagggccatg tgctgatcaa cggccaccgt 1020
gtgccggtcg tgggcaaggt gtcgatgaac acgctgatgg tcgatgtcac cgacttccct 1080
gatgtgaagg ggggtaacga agtggtgctg ttcggcaagc aggccggggg cgaaatcacc 1140
Petição 870170009999, de 15/02/2017, pág. 785/1247
776/788 caggccgaga tggaagaaat caacggcgcg ttgctcgccg aattccaacc cgaagatact cgtcgactga <210> 379 <211> 409 <212> PRT <213> Següência Artificial atttgtacac cgtatggggc
1200
1230 <220>
<223> KT2440 BAR <400> 379
Met Pro Phe Arg Arg 1 5
Thr Gly Gin Ala Pro
Gly Thr Asn Thr Leu 35
Ser Ala Ser Ala Leu
Ala Gly Lys Ser Lys 65
His Gly Ile Gly Leu 85
Cys Vai Ala Vai Ala 100
Gly Phe Thr Gly Gin 115
Leu Glu Asp Gly Leu 130
Glu Phe Ala Arg Gin 145
Leu Arg Ile His Met 165
Vai Glu Met Ala Thr
180
Asp Gin Lys His Leu 195
Glu Asp Lys Asp Asp 210
Thr Asp Trp Leu Ile 225
Leu His Ala Ala Asn
245
Leu Asp Met Vai Arg 260
Ala Arg Thr Glu Tyr 275
Thr Leu Leu Ala Ala Ser
Leu Tyr Ala Ala Pro Pro 25
Thr Vai Gin Asn Ser Asn
Gin His Asn Ile Arg Thr 55
Leu Cys Ala Vai Leu Lys 70 75
Vai Met Pro Ser Ile Ile
Ser Asn Glu Glu Ala Arg 105
Leu Vai Arg Vai Arg Leu 120
Gin Tyr Asp Met Glu Glu 135
Ala Asp Ala Ile Ala Ala 150 155
Ala Leu Asn Ser Ser Gly
170
Trp Ser Gly Arg Gly Glu 185
Lys Leu Vai Ala Leu Met 200
Vai Arg Lys Gly Leu Ala 215
Lys His Ala Arg Leu Asp 230 235
Ser Phe Ala Thr Leu Glu
250
Thr Gly Gly Ala Leu Phe 265
Lys Arg Ala Met Gin Phe 280
Leu Ala Leu Leu Ile
Leu Ser Met Asp Asn 30
Ala Trp Vai Glu Vai 45
Leu Gin Ala Glu Leu
Ala Asp Ala Tyr Gly 80
Ala Gin Gly Vai Pro 95
Vai Vai Arg Ala Ser 110
Ala Ser Leu Ser Glu
125
Leu Vai Gly Ser Ala 140
Arg His Gly Lys Thr 160
Met Ser Arg Asn Gly 175
Ala Leu Gin Ile Thr
190
Thr His Phe Ala Vai
205
Ala Phe Asn Glu Gin
220
Arg Ser Lys Leu Thr 240
Vai Pro Glu Ala Arg 255
Gly Asp Thr Vai Pro 270
Lys Ser His Vai Ala 285
Petição 870170009999, de 15/02/2017, pág. 786/1247
777/788
Ala Vai 290 His Ser Tyr Pro Ala Gly Asn Thr Vai 295 Gly 300 Tyr Asp Arg Thr
Phe Thr Leu Ala Arg Asp Ser Arg Leu Ala Asn Ile Thr Vai Gly Tyr
305 310 315 320
Ser Asp Gly Tyr Arg Arg Vai Phe Thr Asn Lys Gly His Vai Leu Ile
325 330 335
Asn Gly His Arg Vai Pro Vai Vai Gly Lys Vai Ser Met Asn Thr Leu
340 345 350
Met Vai Asp Vai Thr Asp Phe Pro Asp Vai Lys Gly Gly Asn Glu Vai
355 360 365
Vai Leu Phe Gly Lys Gin Ala Gly Gly Glu Ile Thr Gin Ala Glu Met
370 375 380
Glu Glu Ile Asn Gly Ala Leu Leu Ala Asp Leu Tyr Thr Vai Trp Gly
385 390 395 400
Asn Ser Asn Pro Lys Ile Leu Vai Asp
405 <210> 380 <211> 1152 <212> DNA <213> Geobacillus stearothermophilus <400> 380
atggacgagt ttcaccgcga tacgtgggcg gaagtggatt tggacgccat ttacgacaat 60
gtggagaatt tgcgccgttt gctgccggac gacacgcaca ttatggcggt cgtgaaggcg 120
aacgcctatg gacatgggga tgtgcaggtg gcaaggacag cgctcgaagc gggggcctcc 180
cgcctggcgg ttgccttttt ggatgaggcg ctcgctttaa gggaaaaagg aatcgaagcg 240
ccgattctag ttctcggggc ttcccgtcca gctgatgcgg cgctggccgc ccagcagcgc 300
attgccctga ccgtgttccg ctccgactgg ttggaagaag cgtccgccct ttacagcggc 360
ccttttccta ttcatttcca tttgaaaatg gacaccggca tgggacggct tggagtgaaa 420
gacgaggaag agacgaaacg aatcgtagcg ctgattgagc gccatccgca ttttgtgctt 480
gaaggggtgt acacgcattt tgcgactgcg gatgaggtga acaccgatta tttttcctat 540
cagtataccc gttttttgca catgctcgaa tggctgccgt cgcgcccgcc gctcgtccat 600
tgcgccaaca gcgcagcgtc gctccgtttc cctgaccgga cgttcaatat ggtccgcttc 660
ggcattgcca tgtatgggct tgccccgtcg cccggcatca agccgctgct gccgtatcca 720
ttaaaagaag cattttcgct ccatagccgc ctcgtacacg tcaaaaaact gcaaccaggc 780
gaaaaggtga gctatggtgc gacgtacact gcgcagacgg aggagtggat cgggacgatt 840
ccgatcggct atgcggacgg ctggctccgc cgcctgcagc actttcatgt ccttgttgac 900
ggacaaaagg cgccgattgt cggccgcatt tgcatggacc agtgcatgat ccgcctgcct 960
ggtccgctgc cggtcggcac gaaggtgaca ctgattggtc gccaagggga cgaggtaatt 1020
tccattgatg atgtcgctcg ccatttggaa acgatcaact acgaagtgcc ttgcacgatc 1080
agttatcgag tgccccgtat ttttttccgc cataagcgta taatggaagt gagaaacgcc 1140
gttggccgcg ga 1152
<210> 381 <211> 384 <212> PRT <213> Geobacillus stearothermophilus
Petição 870170009999, de 15/02/2017, pág. 787/1247
778/788 <400> 381
Met Asp Glu 1
Ile Tyr Asp
His Ile Met
Gin Vai Ala
Ala Phe Leu
Pro Ile Leu
Ala Gin Gin
Glu Ala Ser
115
Lys Met Asp 130
Thr Lys Arg 145
Glu Gly Vai
Tyr Phe Ser
Pro Ser Arg 195
Arg Phe Pro 210
Tyr Gly Leu 225
Leu Lys Glu
Leu Gin Pro
Thr Glu Glu
275
Leu Arg Arg 290
Pro Ile Vai
305
Gly Pro Leu
Asp Glu Vai
Phe His Arg Asp Thr Trp Ala Glu Vai Asp Leu Asp Ala 5 10 15
Asn Vai Glu Asn Leu Arg Arg Leu Leu Pro Asp Asp Thr
25 30
Ala Vai Vai Lys Ala Asn Ala Tyr Gly His Gly Asp Vai
45
Arg Thr Ala Leu Glu Ala Gly Ala Ser Arg Leu Ala Vai 55 60
Asp Glu Ala Leu Ala Leu Arg Glu Lys Gly Ile Glu Ala 70 75 80
Vai Leu Gly Ala Ser Arg Pro Ala Asp Ala Ala Leu Ala 85 90 95
Arg Ile Ala Leu Thr Vai Phe Arg Ser Asp Trp Leu Glu
100 105 110
Ala Leu Tyr Ser Gly Pro Phe Pro Ile His Phe His Leu
120 125
Thr Gly Met Gly Arg Leu Gly Vai Lys Asp Glu Glu Glu 135 140
Ile Vai Ala Leu Ile Glu Arg His Pro His Phe Vai Leu 150 155 160
Tyr Thr His Phe Ala Thr Ala Asp Glu Vai Asn Thr Asp 165 170 175
Tyr Gin Tyr Thr Arg Phe Leu His Met Leu Glu Trp Leu
180 185 190
Pro Pro Leu Vai His Cys Ala Asn Ser Ala Ala Ser Leu
200 205
Asp Arg Thr Phe Asn Met Vai Arg Phe Gly Ile Ala Met 215 220
Ala Pro Ser Pro Gly Ile Lys Pro Leu Leu Pro Tyr Pro 230 235 240
Ala Phe Ser Leu His Ser Arg Leu Vai His Vai Lys Lys 245 250 255
Gly Glu Lys Vai Ser Tyr Gly Ala Thr Tyr Thr Ala Gin
260 265 270
Trp Ile Gly Thr Ile Pro Ile Gly Tyr Ala Asp Gly Trp
280 285
Leu Gin His Phe His Vai Leu Vai Asp Gly Gin Lys Ala 295 300
Gly Arg Ile Cys Met Asp Gin Cys Met Ile Arg Leu Pro 310 315 320
Pro Vai Gly Thr Lys Vai Thr Leu Ile Gly Arg Gin Gly 325 330 335
Ile Ser Ile Asp Asp Vai Ala Arg His Leu Glu Thr Ile
340 345 350
Petição 870170009999, de 15/02/2017, pág. 788/1247
779/788
Asn Tyr Glu Vai Pro Cys Thr Ile 360 Ser Tyr Arg Vai Pro Arg Ile 365 Phe
355
Phe Arg His Lys Arg Ile Met Glu Vai Arg Asn Ala Vai Gly Arg Gly
370 375 380
<210> 382 <211> 43 <212> DNA <213> Sequência Artificial <220>
<223> Iniciador Mutagênico <400> 382 gccatttgga aacgatcaac gcggaagtgc <210> 383 <211> 30 <212> DNA <213> Sequência Artificial <220>
<223> Iniciador <400> 383 gatataccat ggcatactca ttatggaatg <210> 384 <211> 32 <212> DNA <213> Sequência Artificial <220>
<223> Iniciador <400> 384 gttatcggat ccttaggcat taattgaaat <210> 385 <211> 36 <212> DNA <213> Sequência Artificial <220>
<223> Iniciador <400> 385 gaggagctcg agtcagacgt atttcagtcc <210> 386 <211> 29 <212> DNA <213> Sequência Artificial <220>
<223> Iniciador <400> 386 agaagacata tgatttatca gccggggac <210> 387 cttgcacgat cag tg tttttc
Petição 870170009999, de 15/02/2017, pág. 789/1247
780/788
<211> 30
<212> DNA
<213> Sequência Artificial
<220>
<223> Iniciador
<400> 387
agaagacata tgggtgtcgt cgtccaaaac 30 <210> 388
<211> 31
<212> DNA
<213> Sequência Artificial
<220>
<223> Iniciador
<400> 388
ataataggat ccttagacat atttgaggcc c 31 <210> 389
<211> 28
<212> DNA
<213> Sequência Artificial
<220>
<223> Iniciador
<400> 389
ataatacata tgaagccggt ggtggtgc 28
<210> 390
<211> 31
<212> DNA
<213> Sequência Artificial
<220>
<223> Iniciador
<400> 390
agaagaggat ccttagacat aggtgagccc c 31 <210> 391
<211> 26
<212> DNA
<213> Sequência Artificial
<220>
<223> Iniciador
<400> 391
ataataccat gggtgtcgtg gtccag 26
<210> 392
<211> 32
<212> DNA
<213> Sequência Artificial
<220>
<223> Iniciador
Petição 870170009999, de 15/02/2017, pág. 790/1247
781/788 <400> 392 agaagaggat ccttagacat atttcaggcc cc <210> 393 <211> 30 <212> DNA <213> Sequência Artificial <220>
<223> Iniciador <400> 393 gcggaacata tgtttgagaa cattaccgcc <210> 394 <211> 32 <212> DNA <213> Sequência Artificial <220>
<223> Iniciador <400> 394 ataaccggat ccttacagca ctgccacaat cg <210> 395 <211> 36 <212> DNA <213> Sequência Artificial <220>
<223> Iniciador <400> 395 cgctcttatg gttcggtttg cttgggttgc tcaccc <210> 396 <211> 36 <212> DNA <213> Sequência Artificial <220>
<223> Iniciador <400> 396 gggtgagcaa cccaagcttt ccgaaccata agagcg <210> 397 <211> 39 <212> DNA <213> Sequência Artificial <220>
<223> Iniciador <400> 397 caaaaaatac cagcgttaag ggagtgtggg tgagcaacc <210> 398 <211> 29 <212> DNA
Petição 870170009999, de 15/02/2017, pág. 791/1247
782/788 <213> Sequência Artificial <220>
<223> Iniciador <400> 398 cattaccgcc gctactgccg acccgattc <210> 399 <211> 39 <212> DNA <213> Sequência Artificial <220>
<223> Iniciador <400> 399 caccaaaaat tacctcggcg tagacggcat ccctgaatt <210> 400 <211> 35 <212> DNA <213> Sequência Artificial <220>
<223> Iniciador <400> 400 tgatgcggaa aatcacgctc ttgacttcga tgcac <210> 401 <211> 35 <212> DNA <213> Sequência Artificial <220>
<223> Iniciador <400> 401 gcggcgccat ggaaaatgat ccgattggtc taatg <210> 402 <211> 33 <212> DNA <213> Sequência Artificial <220>
<223> Iniciador <400> 402 gcggcggtcg acgcaattac aattgtgttt gtc <210> 403 <211> 34 <212> DNA <213> Sequência Artificial <220>
<223> Iniciador <400> 403 gcggcgccat ggatgtatgt ataattttat ttag
Petição 870170009999, de 15/02/2017, pág. 792/1247
783/788 <210>
<211>
<212>
<223>
<400>
404
DNA <213> Sequência Artificial <220>
Iniciador
404 gcggcggtcg acaaatttca ttattcattc taattt <210> 405
DNA <213> Sequência Artificial <220>
Iniciador
405 ggccggcata tgtcgatcct taacgactac aaacgt <210> 406
DNA <213> Sequência Artificial <220>
Iniciador
406 <211>
<212>
<223>
<400>
<211>
<212>
<223>
<400>
ggaaggctcg agtcatgatt ggtttccaga caaatt <210>
<211>
<212>
407
PRT <213> Artificial Sequence <220>
<223> Synthetic Signal Sequence <400> 407
Met Ser Ile Vai Vai Thr Lys Ile Glu Arg Ala Gly Ala Ala Ala Vai 15 10 15
Ala Ala Leu Arg Thr Ser Gly Vai Ala Thr Vai
25
408
DNA <213> Artificial Sequence <220>
Iniciador
408 ataatacata tgcccttctc ccgtaccc <210> 409 <211> 31 <210>
<211>
<212>
<223>
<400>
Petição 870170009999, de 15/02/2017, pág. 793/1247
784/788 <212> DNA <213> Artificial Sequence <220>
<223> Iniciador <400> 409 gcggcgggat ccttactgat ctttcaggat t 31 <210> 410 <211> 1230 <212> DNA <213> Artificial Sequence <220>
<223> Synthetic Pseudomonas taetrolens arginine racemase <400> 410
atgcccttct cccgtaccct gctcgccctt tcccttggca tggcattgct gcaaaacccg 60
gcctttgctg cgccacccct gtcgatgacc gacggcgtag ctcaagtgaa tacccaggac 120
agcaatgcct gggtcgaaat caataaagcc gcgttcgagc acaacatacg gactctgcaa 180
accgccctcg ccggcaagtc gcagatctgc gccgtactca aggcggatgc ctatggccac 240
ggtatcggct tgttgatgcc ctcggtgatc gccatgggtg ttccctgtgt cggtgtcgcc 300
agcaacgaag aagcccgcgt cgtgcgcgag agcggtttca agggtcaact gatacgcgtg 360
cgcaccgctg ccctgagcga actggaagct gcactgccgt acaacatgga agagctggtg 420
ggcaacctgg acttcgcggt caaggccagc ctgattgccg aggatcacgg tcgcccgctg 480
gtggtgcacc tgggtctgaa ttccagcggc atgagccgta acggagtgga catgaccacc 540
gctcagggcc gtcgtgatgc ggtagctatc accaaggtgc caaacctgga agtgcgggcg 600
atcatgaccc acttcgcggt cgaagatgct gccgacgtgc gtgccgggct caaggccttc 660
aatcagcaag cccaatggct gatgaacgtg gcccagcttg atcgcagcaa gatcaccctg 720
cacgcggcca actcgttcgc cacactggag gtgcccgaat cgcatctgga catggtccgc 780
cccggcggcg cgctgttcgg cgacaccgta ccgtcccaca ccgagtacaa gcgggtcatg 840
cagttcaagt cccacgtggc gtcggtcaac agctacccca agggcaacac cgtcggttat 900
gaccgcacgt acaccctggg ccgcgactcg cggctggcca acatcaccgt cggctactct 960
gacggctacc gccgcgcgtt taccaataaa gggattgtgc tgatcaacgg ccatcgcgtg 1020
ccagtggtgg gcaaagtctc gatgaacacc ctgatggtgg acgtcactga cgcgccggat 1080
gtgaaaagcg gcgatgaagt ggtgctgttc gggcaccagg gcaaggccga gattacccag 1140
gctgagatcg aagacatcaa cggtgcactg cttgcggatc tgtataccgt gtggggcaat 1200
tccaacccta aaatcctgaa agatcagtaa 1230
<210> 411 <211> 29 <212> DNA <213> Artificial Sequence <220>
<223> Iniciador <400> 411 tacccaggct gagatggaag acatcaacg 29 <210> 412 <211> 23
Petição 870170009999, de 15/02/2017, pág. 794/1247
785/788 <212> DNA <213> Artificial Sequence <220>
<223> Iniciador <400> 412 gccagcaacg argargcmcg cgt <210> 413 <211> 18 <212> DNA <213> Artificial Sequence <220>
<223> Iniciador <400> 413 tggccstkga tcagcaca <210> 414 <211> 716 <212> DNA <213> Artificial Sequence <220>
<223> A.caviae PCR product <400> 414
gccagcaacg argargcmcg cgttgcccgc gagaagggct tcgaaggtcg cctgatgcgg 60
gtacgtgccg ccaccccgga tgaagtggag caggccctgc cctacaagct ggaggagctc 120
atcggcagcc tggagagcgc caaggggatc gccgacatcg cccagcgcca tcacaccaac 180
atcccggtgc acatcggcct gaactccgcc ggcatgagcc gcaacggcat cgatctgcgc 240
caggacgatg ccaaggccga tgccctggcc atgctcaagc tcaaggggat caccccggtc 300
ggcatcatga cccacttccc ggtggaggag aaagaggacg tcaagctggg gctggcccag 360
ttcaagctgg actaccagtg gctcatcgac gccggcaagc tggatcgcag caagctcacc 420
atccacgccg ccaactcctt cgccaccctg gaagtaccgg aagcctactt tgacatggtg 480
cgcccgggcg gcatcatcta tggcgacacc attccctcct acaccgagta caagaaggtg 540
atggcgttca agacccaggt cgcctccgtc aaccactacc cggcgggcaa caccgtcggc 600
tatgaccgca ccttcaccct caagcgcgac tccctgctgg ccaacctgcc gatgggctac 660
tccgacggct accgccgcgc catgagcaac aaggcctatg tgctgatcma sggcca 716
<210>
<211>
<212>
415
238
PRT <213> Aeromonas caviae <220>
<221> MISC_FEATURE <222> (237)..(237) <223> Xaa can be Phe, Gin, Asn or Lys <400> 415
Ala Ser Asn Glu Glu Ala Arg Vai Ala Arg Glu 15 10
Arg Leu Met Arg Vai Arg Ala Ala Thr Pro Asp
Lys Gly Phe Glu Gly 15
Glu Vai Glu Gin Ala
Petição 870170009999, de 15/02/2017, pág. 795/1247
786/788
25 30
Leu Pro Tyr Lys 35 Leu Glu Glu Leu 40 Ile Gly Ser Leu Glu 45 Ser Ala Lys
Gly Ile Ala Asp Ile Ala Gin Arg His His Thr Asn Ile Pro Vai His
50 55 60
Ile Gly Leu Asn Ser Ala Gly Met Ser Arg Asn Gly Ile Asp Leu Arg
65 70 75 80
Gin Asp Asp Ala Lys Ala Asp Ala Leu Ala Met Leu Lys Leu Lys Gly
85 90 95
Ile Thr Pro Vai Gly Ile Met Thr His Phe Pro Vai Glu Glu Lys Glu
100 105 110
Asp Vai Lys Leu Gly Leu Ala Gin Phe Lys Leu Asp Tyr Gin Trp Leu
115 120 125
Ile Asp Ala Gly Lys Leu Asp Arg Ser Lys Leu Thr Ile His Ala Ala
130 135 140
Asn Ser Phe Ala Thr Leu Glu Vai Pro Glu Ala Tyr Phe Asp Met Vai
145 150 155 160
Arg Pro Gly Gly Ile Ile Tyr Gly Asp Thr Ile Pro Ser Tyr Thr Glu
165 170 175
Tyr Lys Lys Vai Met Ala Phe Lys Thr Gin Vai Ala Ser Vai Asn His
180 185 190
Tyr Pro Ala Gly Asn Thr Vai Gly Tyr Asp Arg Thr Phe Thr Leu Lys
195 200 205
Arg Asp Ser Leu Leu Ala Asn Leu Pro Met Gly Tyr Ser Asp Gly Tyr
210 215 220
Arg Arg Ala Met Ser Asn Lys Ala Tyr Vai Leu Ile Xaa Gly
225 230 235
<210> 416 <211> 1227 <212> DNA <213> Aeromonas caviae <400> 416
atgcacaaga aaacactgct cgcgaccctg atctttggcc tgctggccgg ccaggcagtc 60
gccgccccct atctgccgct cgccgacgac caccgcaacg gtcaggaaca gaccgccgcc 120
aacgcctggc tggaagtgga tctcggcgcc ttcgagcaca acatccagac cctgaagaat 180
cgcctcggtg acaagggccc gcagatctgc gccatcatga aggcggacgc ctacggtcac 240
ggcatcgacc tgctggtccc ttccgtggtc aaggcaggca tcccctgcat cggcatcgcc 300
agcaacgaag aagcacgtgt tgcccgcgag aagggcttcg aaggtcgcct gatgcgggta 360
cgtgccgcca ccccggatga agtggagcag gccctgccct acaagctgga ggagctcatc 420
ggcagcctgg agagcgccaa ggggatcgcc gacatcgccc agcgccatca caccaacatc 480
ccggtgcaca tcggcctgaa ctccgccggc atgagccgca acggcatcga tctgcgccag 540
gacgatgcca aggccgatgc cctggccatg ctcaagctca aggggatcac cccggtcggc 600
atcatgaccc acttcccggt ggaggagaaa gaggacgtca agctggggct ggcccagttc 660
aagctggact accagtggct catcgacgcc ggcaagctgg atcgcagcaa gctcaccatc 720
cacgccgcca actccttcgc caccctggaa gtaccggaag cctactttga catggtgcgc 780
Petição 870170009999, de 15/02/2017, pág. 796/1247
787/788
ccgggcggca tcatctatgg cgacaccatt ccctcctaca ccgagtacaa gaaggtgatg 840
gcgttcaaga cccaggtcgc ctccgtcaac cactacccgg cgggcaacac cgtcggctat 900
gaccgcacct tcaccctcaa gcgcgactcc ctgctggcca acctgccgat gggctactcc 960
gacggctacc gccgcgccat gagcaacaag gcctatgtgc tgatccatgg ccagaaggcc 1020
cccgtcgtgg gcaagacttc catgaacacc accatggtgg acgtcaccga catcaagggg 1080
atcaaacccg gtgacgaggt ggtcctgttc ggacgccagg gtgatgccga ggtgaaacaa 1140
tctgatctgg aggagtacaa cggtgccctc ttggcggaca tgtacaccgt ctggggctat 1200
accaacccca agaagatcaa gcgctaa 1227
<210> 417 <211> 408 <212> PRT <213> Aeromonas caviae <400> 417
Met 1 His Lys Lys Thr 5 Leu Leu Ala Thr Leu 10 Ile Phe Gly Leu Leu 15 Ala
Gly Gin Ala Vai Ala Ala Pro Tyr Leu Pro Leu Ala Asp Asp His Arg
20 25 30
Asn Gly Gin Glu Gin Thr Ala Ala Asn Ala Trp Leu Glu Vai Asp Leu
35 40 45
Gly Ala Phe Glu His Asn Ile Gin Thr Leu Lys Asn Arg Leu Gly Asp
50 55 60
Lys Gly Pro Gin Ile Cys Ala Ile Met Lys Ala Asp Ala Tyr Gly His
65 70 75 80
Gly Ile Asp Leu Leu Vai Pro Ser Vai Vai Lys Ala Gly Ile Pro Cys
85 90 95
Ile Gly Ile Ala Ser Asn Glu Glu Ala Arg Vai Ala Arg Glu Lys Gly
100 105 110
Phe Glu Gly Arg Leu Met Arg Vai Arg Ala Ala Thr Pro Asp Glu Vai
115 120 125
Glu Gin Ala Leu Pro Tyr Lys Leu Glu Glu Leu Ile Gly Ser Leu Glu
130 135 140
Ser Ala Lys Gly Ile Ala Asp Ile Ala Gin Arg His His Thr Asn Ile
145 150 155 160
Pro Vai His Ile Gly Leu Asn Ser Ala Gly Met Ser Arg Asn Gly Ile
165 170 175
Asp Leu Arg Gin Asp Asp Ala Lys Ala Asp Ala Leu Ala Met Leu Lys
180 185 190
Leu Lys Gly Ile Thr Pro Vai Gly Ile Met Thr His Phe Pro Vai Glu
195 200 205
Glu Lys Glu Asp Vai Lys Leu Gly Leu Ala Gin Phe Lys Leu Asp Tyr
210 215 220
Gin Trp Leu Ile Asp Ala Gly Lys Leu Asp Arg Ser Lys Leu Thr Ile
225 230 235 240
His Ala Ala Asn Ser Phe Ala Thr Leu Glu Vai Pro Glu Ala Tyr Phe
245 250 255
Petição 870170009999, de 15/02/2017, pág. 797/1247
788/788
Asp Met Vai Arg Pro Gly 260
Tyr Thr Glu Tyr Lys Lys 275
Vai Asn His Tyr Pro Ala 290
Thr Leu Lys Arg Asp Ser 305 310
Asp Gly Tyr Arg Arg Ala
325
Gly Gin Lys Ala Pro Vai 340
Vai Asp Vai Thr Asp Ile 355
Leu Phe Gly Arg Gin Gly 370
Glu Tyr Asn Gly Ala Leu 385 390
Thr Asn Pro Lys Lys Ile
405
Gly Ile Ile Tyr Gly 265
Vai Met Ala Phe Lys 280
Gly Asn Thr Vai Gly 295
Leu Leu Ala Asn Leu
315
Met Ser Asn Lys Ala 330
Vai Gly Lys Thr Ser 345
Lys Gly Ile Lys Pro 360
Asp Ala Glu Vai Lys 375
Leu Ala Asp Met Tyr 395
Lys Arg
Asp Thr Ile Pro Ser 270
Thr Gin Vai Ala Ser
285
Tyr Asp Arg Thr Phe 300
Pro Met Gly Tyr Ser 320
Tyr Vai Leu Ile His 335
Met Asn Thr Thr Met
350
Gly Asp Glu Vai Vai 365
Gin Ser Asp Leu Glu 380
Thr Vai Trp Gly Tyr 400
Petição 870170009999, de 15/02/2017, pág. 798/1247
1/4

Claims (18)

  1. REIVINDICAÇÕES
    1. Ácido nucléico, caracterizado pelo fato de que consiste na sequência de nucleotídeos de SEQ ID NO: 27, operacionalmente ligado a uma sequência promotora heteróloga.
  2. 2. Cassete de expressão, caracterizado pelo fato de que consiste em um ácido nucléico, como definido na reivindicação 1.
  3. 3. Vetor, caracterizado pelo fato de que consiste em um ácido nucléico, como definido na reivindicação 1.
  4. 4. Veículo de clonagem, caracterizado pelo fato de que consiste em um ácido nucléico, como definido na reivindicação 1.
  5. 5. Microrganismo transgênico, caracterizado pelo fato de que compreende um ácido nucléico, um cassete de expressão, um vetor ou um veículo de clonagem, como definido nas reivindicações 1 a 4, respectivamente.
  6. 6. Polipeptídeo, caracterizado pelo fato de que consiste na sequência de aminoácidos da SEQ ID NO: 28 e uma sequência heteróloga.
  7. 7. Método para produzir um polipeptídeo recombinante, caracterizado pelo fato de que compreende as etapas de:
    (a) fornecer um ácido nucléico, como definido na reivindicação 1; e (b) expressar o ácido nucléico da etapa (a) sob condições que permitem a expressão do polipeptídeo, dessa forma produzindo um polipeptídeo recombinante.
  8. 8. Método para gerar uma variante de um ácido nucléico, como definido na reivindicação 1, caracterizado pelo fato de que compreende as etapas de:
    (a) fornecer um ácido nucléico molde consistindo em um ácido nucléico, como definido na reivindicação 1; e (b) modificar, deletar ou adicionar um ou mais nucleotídeos
    Petição 870170098695, de 18/12/2017, pág. 7/17
    2/4 na sequência molde, ou uma combinação dos mesmos, para gerar uma variante do ácido nucléico molde.
  9. 9. Método de acordo com a reivindicação 8, caracterizado pelo fato de que é um método para modificar códons em um ácido nucléico codificando um polipeptídeo de aldolase, consistindo nas seguintes etapas:
    (a) fornecer um ácido nucléico, como definido na reivindicação 1; e (b) identificar um códon no ácido nucléico da etapa (a) e substituí-lo por um códon diferente codificando o mesmo aminoácido que o códon substituído, dessa forma modificando códons em um ácido nucléico codificando uma aldolase.
  10. 10. Peptídeo sinal, caracterizado pelo fato de que consiste em uma sequência de aminoácidos como a apresentada nos resíduos amino-terminais 1 a 14, 1 a 15, 1 a 16, 1 a 17, 1 a 18, 1 a 19, 1 a 20, 1 a 21, 1 a 22, 1 a 23, 1 a 24, 1 a 25, 1 a 26, 1 a 27, 1 a 28, 1 a 30, 1 a 31, 1 a 32, 1 a 33, 1 a 34, 1 a 35, 1 a 36, 1 a 37, 1 a 38, 1 a 40, 1 a 41, 1 a 42, 1 a 43 ou 1 a 44 da SEQ ID NO: 28, em que o referido peptídeo sinal é ligado a uma proteína heteróloga.
  11. 11. Método para clivar uma ligação carbono-carbono em uma composição, caracterizado pelo fato de que compreende as seguintes etapas:
    (a) fornecer um polipeptídeo, como definido na reivindicação 6, ou um polipeptídeo codificado por um ácido nucléico, como definido na reivindicação 1;
    (b) fornecer uma composição compreendendo uma ligação carbono-carbono; e (c) contatar o polipeptídeo da etapa (a) com a composição da etapa (b) sob condições em que a aldolase cliva a ligação carbonocarbono na composição.
    Petição 870170098695, de 18/12/2017, pág. 8/17
    3/4
  12. 12. Método para formar uma ligação carbono-carbono, caracterizado pelo fato de que compreende as seguintes etapas:
    (a) fornecer um polipeptídeo, como definido na reivindicação 8, ou um polipeptídeo codificado por um ácido nucléico, como definido na reivindicação 1;
    (b) fornecer um composto doador e um composto receptor; e (c) contatar o polipeptídeo da etapa (a) com os compostos da etapa (b) sob condições em que a aldolase forma a ligação carbono-carbono.
  13. 13. Método de acordo com a reivindicação 12, caracterizado pelo fato de que é para produzir um ácido D-glutâmico 4substituído, compreendendo as seguintes etapas:
    (a) fornecer um polipeptídeo, como definido na reivindicação 6, ou um polipeptídeo codificado por um ácido nucléico, como definido na reivindicação 1;
    (b) fornecer um receptor de α-ceto ácido e um piruvato ou um doador de piruvato; e (c) contatar o polipeptídeo da etapa (a) com os compostos da etapa (b) sob condições em que a aldolase catalisa a síntese de um ácido D-glutâmico 4-substituído.
  14. 14. Método de acordo com a reivindicação 12, caracterizado pelo fato de que é para produzir um 2-ceto-glutarato 3,4substituído, compreendendo as seguintes etapas:
    (a) fornecer um polipeptídeo, como definido na reivindicação 6, ou um polipeptídeo codificado por um ácido nucléico, como definido na reivindicação 1;
    (b) fornecer um composto doador e um composto receptor, em que opcionalmente o doador e o receptor são um piruvato ou um doador de piruvato e um receptor de α-ceto ácido, uma cetona e/ou
    Petição 870170098695, de 18/12/2017, pág. 9/17
    4/4 um aldeído; e (c) contatar o polipeptídeo da etapa (a) com os compostos da etapa (b) sob condições em que a aldolase catalisa a síntese de um 2-ceto-glutarato 3,4-substituído.
  15. 15. Composição, caracterizada pelo fato de que compreende um polipeptídeo que tem uma atividade aldolase consistindo na sequência de aminoácidos de SEQ ID No: 28 e um adjuvante ou veículo, opcionalmente em que o polipeptídeo está ligado a uma sequência heteróloga ou carece de uma sequência sinal.
  16. 16. Composição, de acordo com a reivindicação 15, caracterizada pelo fato de que é formulada como comprimidos, géis, pílulas, implantes, líquidos, pulverizações, filmes, micelas, pós, alimentos, péletes de alimentação ou como qualquer tipo de forma encapsulada.
  17. 17. Método para fazer um gênero alimentício, uma ração ou bebida, caracterizado pelo fato de que compreende contatar uma composição compreendendo um composto contendo uma ligação carbono-carbono com um polipeptídeo, como definido na reivindicação 6, ou um polipeptídeo codificado por um ácido nucléico, como definido na reivindicação 1.
  18. 18. Método para converter uma biomassa ou qualquer material lignocelulósico em um combustível, caracterizado pelo fato de que compreende contatar a biomassa ou material lignocelulósico com um polipeptídeo, como definido na reivindicação 6, ou um polipeptídeo codificado por um ácido nucléico, como definido na reivindicação 1, ou um fragmento enzimaticamente ativo do mesmo.
    Petição 870170098695, de 18/12/2017, pág. 10/17
    1/15 φ
    ω ro σ
    ο σ
    Ό ^ro ο
    ç
    Ε ro ro φ
    ω ro c
    φ =3 Ο) ΟΡ
    L-triptofano ο
    φ ω
    Ε £
    ω c
    ο
    C
    Ε ro ο
    Μ—» (0 >
    *
    Ω.
    * 00
    Õ ό
    ο φ
    ο.
    ω φ
    φ ω
    ro ο
    ρ <
    0_ ώ
    φΌ ω'ω 2 φ φ·σ ωθ
    Ε— ro ο i=^ro ο ο c c
    ΕΕ ro ro
    QQ
    R,R monatina
    Petição 870170009999, de 15/02/2017, pág. 811/1247
    2/15
    L-aminotransferase ou
    Φ ω
    ro σ
    ο g
    Ό ^ro ο
    ç
    E ro o
    ro >
    'o.
    o
    Φ ω
    □_ φ^ ω ι ro^ φ ro cu w ω-σ φ c
    2-g
    O c
    E ro
    Q
    Φ ω ω ro φ ro cc .ç '-t—<
    cc c
    o
    E
    CL
    CM
    S,R monatina
    Petição 870170009999, de 15/02/2017, pág. 812/1247
    3/15 triptofano racemase
    Petição 870170009999, de 15/02/2017, pág. 813/1247
    4/15 ο
    ro
    E ro
    O) φ
    ω ro
    E φ
    o ro
    L-triptofano
    R,R monatina
    Petição 870170009999, de 15/02/2017, pág. 814/1247
    5/15
    L-triptofano
    o ro E ro 3 0 ÇJ) σ o o CO o c ro 'c > CO CO 'Õ_ _J d o ro LO ro Έ CO φ o CD Ó Q. ω CO o CD LL
    φ σ
    φ ω ω ω Φ c > c ο φ £” ο C
    R,R monatina
    Petição 870170009999, de 15/02/2017, pág. 815/1247
    6/15
    L-triptofano
    R,R monatina
    Petição 870170009999, de 15/02/2017, pág. 816/1247
    7/15
    L-triptofano
    R,R monatina
    Petição 870170009999, de 15/02/2017, pág. 817/1247
    8/15
    L-alanina
    R,R monatina
    Petição 870170009999, de 15/02/2017, pág. 818/1247
    9/15
    Petição 870170009999, de 15/02/2017, pág. 819/1247
    10/15
    Não , 220
    Final
BR122017003017-5A 2006-03-07 2007-03-07 Ácido nucléico, cassete de expressão, vetor, veículo de clonagem, microrganismotransgênico, polipeptídeo, peptídeo sinal, composição, e métodos para produzir um polipeptídeo recombinante, para gerar uma variante de um ácido nucléico, para clivar uma ligação carbono-carbono em uma composição, para formar uma ligação carbono-carbono,para fazer um gênero alimentício, uma ração ou bebida, e para converter uma biomassa ouqualquer material lignocelulósico em um combustível BR122017003017B1 (pt)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US78051506P 2006-03-07 2006-03-07
US60/780,515 2006-03-07
BRPI0708614-8A BRPI0708614A2 (pt) 2006-03-07 2007-03-07 aldolases, ácidos nucléicos codificando as mesmas e métodos para produzir e usar as mesmas
PCT/US2007/063515 WO2007103989A2 (en) 2006-03-07 2007-03-07 Aldolases, nucleic acids encoding them and methods for making and using them

Publications (1)

Publication Number Publication Date
BR122017003017B1 true BR122017003017B1 (pt) 2018-10-23

Family

ID=38475839

Family Applications (2)

Application Number Title Priority Date Filing Date
BRPI0708614-8A BRPI0708614A2 (pt) 2006-03-07 2007-03-07 aldolases, ácidos nucléicos codificando as mesmas e métodos para produzir e usar as mesmas
BR122017003017-5A BR122017003017B1 (pt) 2006-03-07 2007-03-07 Ácido nucléico, cassete de expressão, vetor, veículo de clonagem, microrganismotransgênico, polipeptídeo, peptídeo sinal, composição, e métodos para produzir um polipeptídeo recombinante, para gerar uma variante de um ácido nucléico, para clivar uma ligação carbono-carbono em uma composição, para formar uma ligação carbono-carbono,para fazer um gênero alimentício, uma ração ou bebida, e para converter uma biomassa ouqualquer material lignocelulósico em um combustível

Family Applications Before (1)

Application Number Title Priority Date Filing Date
BRPI0708614-8A BRPI0708614A2 (pt) 2006-03-07 2007-03-07 aldolases, ácidos nucléicos codificando as mesmas e métodos para produzir e usar as mesmas

Country Status (13)

Country Link
US (3) US8546118B2 (pt)
EP (4) EP1999256B1 (pt)
JP (3) JP5733777B2 (pt)
KR (4) KR101588539B1 (pt)
CN (3) CN102690833B (pt)
AT (1) ATE548450T1 (pt)
AU (1) AU2007223086B2 (pt)
BR (2) BRPI0708614A2 (pt)
CA (1) CA2645225A1 (pt)
EA (2) EA019971B1 (pt)
ES (1) ES2383767T3 (pt)
MX (1) MX2008011442A (pt)
WO (1) WO2007103989A2 (pt)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8158389B2 (en) * 2005-04-20 2012-04-17 Cargill, Incorporated Products and methods for in vivo secretion of monatin
WO2006113897A2 (en) * 2005-04-20 2006-10-26 Cargill, Incorporated Products and methods for in vivo secretion of monatin
US8076108B2 (en) 2005-04-26 2011-12-13 Cargill, Incorporated Polypeptides and biosynthetic pathways for the production of stereoisomers of monatin and their precursors
EP2322643B1 (en) 2006-03-07 2014-07-09 Cargill, Incorporated Aldolases, nucleic acids encoding them and methods for making and using them
EP2479272A4 (en) 2010-10-14 2013-11-20 Ajinomoto Kk PROCESS FOR THE PRODUCTION OF MONATIN
CN102181471B (zh) * 2011-03-23 2014-07-02 深圳大学 莱茵衣藻分泌型表达载体及分泌型表达系统的构建方法
US10436790B2 (en) 2011-09-28 2019-10-08 Waters Technologies Corporation Rapid fluorescence tagging of glycans and other biomolecules with enhanced MS signals
JP6150818B2 (ja) 2011-12-22 2017-06-21 ザイレコ,インコーポレイテッド バイオマス処理
CN102559722B (zh) * 2012-03-12 2017-05-17 杭州师范大学 一种高酶活、耐热醛缩酶基因、酶、载体、工程菌及应用
EP2831102A4 (en) 2012-03-26 2015-12-02 Pronutria Inc NUTRIENT FRAGMENTS, NUTRIENT PROTEINS AND METHODS
JP2015518470A (ja) 2012-03-26 2015-07-02 プロニュートリア・インコーポレイテッドPronutria, Inc. 栄養タンパク質および方法
JP2015513904A (ja) 2012-03-26 2015-05-18 プロニュートリア・インコーポレイテッドPronutria, Inc. 栄養断片、タンパク質、および方法
CN104470946A (zh) 2012-03-26 2015-03-25 普罗努塔利亚公司 带电荷营养性蛋白质和方法
US9850512B2 (en) 2013-03-15 2017-12-26 The Research Foundation For The State University Of New York Hydrolysis of cellulosic fines in primary clarified sludge of paper mills and the addition of a surfactant to increase the yield
WO2015048334A2 (en) 2013-09-25 2015-04-02 Pronutria, Inc. Edible species nutritive polypeptides and methods of production and use thereof
US9951363B2 (en) 2014-03-14 2018-04-24 The Research Foundation for the State University of New York College of Environmental Science and Forestry Enzymatic hydrolysis of old corrugated cardboard (OCC) fines from recycled linerboard mill waste rejects
DK3213056T3 (da) 2014-10-30 2020-09-28 Waters Technologies Corp Fremgangsmåder til hurtig forberedelse af mærkede glycosylaminer og til analyse af glykosylerede biomolekyler, som giver samme baggrund
CN111796039B (zh) 2014-11-13 2023-03-17 沃特世科技公司 快速标记的n-聚糖的液相色谱校准方法
CN109642906A (zh) 2016-06-21 2019-04-16 沃特世科技公司 对用两亲强碱性部分改性的聚糖进行电喷雾电离的方法
CN109690297A (zh) * 2016-07-01 2019-04-26 沃特世科技公司 使用分子量截留过滤和过滤器上去糖基化从复杂基质快速制备标记的葡基胺的方法
CN108079315B (zh) * 2016-11-21 2021-09-24 厦门华绰生物医药科技有限公司 FBP aldolase在制备激活AMPK的药物中的用途
EP3330380A1 (en) * 2016-12-05 2018-06-06 Evonik Degussa GmbH Process for producing l-methionine from methional
CN107541540B (zh) * 2017-10-18 2021-07-20 南京财经大学 一种活性炭串联大孔树脂纯化菜籽肽的方法
EP3820833A4 (en) * 2018-07-12 2022-08-03 Codexis, Inc. MODIFIED AMMONIA-LYASE PHENYLALANINE POLYPEPTIDES
EP3875590A4 (en) * 2018-10-30 2023-02-15 Green Earth Institute Co., Ltd. PROCESS FOR THE PRODUCTION OF AN ORGANIC COMPOUND AND CORYNEFORM BACTERIUM
US20220315967A1 (en) * 2019-09-19 2022-10-06 The Regents Of The University Of California Methods for producing d-tryptophan and substituted d-tryptophans
CN114279952B (zh) * 2020-09-27 2024-03-12 瑞辰星生物技术(广州)有限公司 用于造纸系统控制有机污染物沉积的生物酶酶活力的测定方法
CN112301067B (zh) * 2020-11-06 2022-07-05 杭州濡湜生物科技有限公司 一种制备2-氨基-3-取代苯基-3-羟基丙酸的绿色环保工艺
CN112280773B (zh) * 2020-11-06 2022-07-12 杭州濡湜生物科技有限公司 一种制备2-氨基-3-取代苯基-3-羟基丙酸的生物酶催化流式工艺
CN113151551A (zh) * 2021-04-22 2021-07-23 山西农业大学 Caps分子标记在鉴定谷子株高性状的用途及引物和检测试剂盒
CN116987601B (zh) * 2023-09-27 2023-12-15 菏泽学院 一种微生物制剂及其在多环芳烃降解中的应用

Family Cites Families (150)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5366558A (en) 1979-03-23 1994-11-22 Brink David L Method of treating biomass material
US4458066A (en) 1980-02-29 1984-07-03 University Patents, Inc. Process for preparing polynucleotides
US5087571A (en) 1984-06-22 1992-02-11 President And Fellows Of Harvard College Method for providing a cell culture from a transgenic non-human mammal
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
EP0590689B2 (fr) 1985-03-30 2006-08-16 KAUFFMAN, Stuart A. Procédé d'obtention d'ADN, ARN, peptides, polypeptides ou protéines, par une technique de recombinaison d'ADN
US5780292A (en) 1987-04-29 1998-07-14 Alko Group Ltd. Production of phytate degrading enzymes in trichoderma
US4962028A (en) 1986-07-09 1990-10-09 Dna Plant Technology Corporation Plant promotors
US4946778A (en) 1987-09-21 1990-08-07 Genex Corporation Single polypeptide chain binding molecules
US4987071A (en) 1986-12-03 1991-01-22 University Patents, Inc. RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods
US5015580A (en) 1987-07-29 1991-05-14 Agracetus Particle-mediated transformation of soybean plants and lines
US5573933A (en) 1987-04-14 1996-11-12 Luminis Pty, Ltd. Transgenic pigs
US5700637A (en) 1988-05-03 1997-12-23 Isis Innovation Limited Apparatus and method for analyzing polynucleotide sequences and method of generating oligonucleotide arrays
US6054270A (en) 1988-05-03 2000-04-25 Oxford Gene Technology Limited Analying polynucleotide sequences
US5217879A (en) 1989-01-12 1993-06-08 Washington University Infectious Sindbis virus vectors
US5744101A (en) 1989-06-07 1998-04-28 Affymax Technologies N.V. Photolabile nucleoside protecting groups
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5527681A (en) 1989-06-07 1996-06-18 Affymax Technologies N.V. Immobilized molecular synthesis of systematically substituted compounds
US5589583A (en) 1990-01-11 1996-12-31 Monsanto Company Plant promoter
GB2240105B (en) 1990-01-19 1993-06-09 Technology Finance Corp Process for the production of 3-(1-amino-1,3-dicarboxy-3-hydroxy-but-4-yl) indole
WO1991016427A1 (en) 1990-04-24 1991-10-31 Stratagene Methods for phenotype creation from multiple gene populations
CA2085127C (en) 1990-06-15 2002-12-10 Barbara Cordell Transgenic non-human mammal displaying the amyloid-forming pathology of alzheimer's disease
JP3234598B2 (ja) 1990-11-23 2001-12-04 プラント・ジエネテイツク・システムズ・エヌ・ベー 単子葉植物の形質転換方法
AU9166691A (en) 1990-12-20 1992-07-22 Ixsys, Inc. Optimization of binding proteins
US6110700A (en) 1991-03-11 2000-08-29 The General Hospital Corporation PRAD1 cyclin and its cDNA
US5922854A (en) 1991-06-14 1999-07-13 Kumar; Ramesh Purifying Human Hemogloblin from transgenic pig red cells and plasmids containing pig globin nucleic acids
JP2648897B2 (ja) 1991-07-01 1997-09-03 塩野義製薬株式会社 ピリミジン誘導体
CA2075135A1 (en) 1991-08-02 1993-02-03 David E. Ellis Particle-mediated transformation of gymnosperms
US5632957A (en) 1993-11-01 1997-05-27 Nanogen Molecular biological diagnostic systems including electrodes
JPH05236997A (ja) 1992-02-28 1993-09-17 Hitachi Ltd ポリヌクレオチド捕捉用チップ
CA2127807A1 (en) 1992-11-20 1994-06-09 John Maliyakal Transgenic cotton plants producing heterologous bioplastic
JPH08509871A (ja) 1993-09-30 1996-10-22 アグラシータス インコーポレイテッド 異種ペルオキシダーゼを生産するトランスジェニック綿植物
US6045996A (en) 1993-10-26 2000-04-04 Affymetrix, Inc. Hybridization assays on oligonucleotide arrays
US5965452A (en) 1996-07-09 1999-10-12 Nanogen, Inc. Multiplexed active biologic array
US6468742B2 (en) 1993-11-01 2002-10-22 Nanogen, Inc. Methods for determination of single nucleic acid polymorphisms using bioelectronic microchip
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US5834252A (en) 1995-04-18 1998-11-10 Glaxo Group Limited End-complementary polymerase reaction
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US5639940A (en) 1994-03-03 1997-06-17 Pharmaceutical Proteins Ltd. Production of fibrinogen in transgenic animals
AU694181B2 (en) 1994-03-09 1998-07-16 Abbott Laboratories Humanized milk
EP0750671A1 (en) 1994-03-09 1997-01-02 Abbott Laboratories Transgenic animals producing oligosaccharides and glycoconjugates
US5750870A (en) 1994-06-17 1998-05-12 Agritope, Inc. Plant genetic transformation methods and transgenic plants
US5807522A (en) 1994-06-17 1998-09-15 The Board Of Trustees Of The Leland Stanford Junior University Methods for fabricating microarrays of biological samples
US5959171A (en) 1994-08-17 1999-09-28 Pharming B.V. Method for the production of biologically active polypeptides in a mammal's
WO1996006927A1 (en) 1994-09-01 1996-03-07 Merck & Co., Inc. Transgenic animal expressing a familial form of human amyloid precursor protein
US5795737A (en) 1994-09-19 1998-08-18 The General Hospital Corporation High level expression of proteins
US6111166A (en) 1994-09-19 2000-08-29 Medarex, Incorporated Transgenic mice expressing human Fcα and β receptors
US5880327A (en) 1994-09-21 1999-03-09 American National Red Cross Transgenic mammals expressing human coagulation factor VIII
US5556752A (en) 1994-10-24 1996-09-17 Affymetrix, Inc. Surface-bound, unimolecular, double-stranded DNA
US6187992B1 (en) 1994-12-05 2001-02-13 Merck & Co., Inc. Transgenic mouse having a disrupted amyloid precursor protein gene
US5830645A (en) 1994-12-09 1998-11-03 The Regents Of The University Of California Comparative fluorescence hybridization to nucleic acid arrays
US5633440A (en) 1994-12-20 1997-05-27 Dna Plant Technology Corporation P119 promoters and their uses
US5705369A (en) 1994-12-27 1998-01-06 Midwest Research Institute Prehydrolysis of lignocellulose
EP0805856B2 (en) 1995-01-26 2009-04-01 Novozymes A/S Animal feed additives comprising xylanase
US5959098A (en) 1996-04-17 1999-09-28 Affymetrix, Inc. Substrate preparation process
US5795749A (en) 1995-04-05 1998-08-18 The Scripps Research Institution Use of 2-deoxyribose-5-phosphate aldolase to prepare 2-deoxyfucose, analogues and derivatives
WO1996039154A1 (en) 1995-06-06 1996-12-12 Isis Pharmaceuticals, Inc. Oligonucleotides having phosphorothioate linkages of high chiral purity
US5856174A (en) 1995-06-29 1999-01-05 Affymetrix, Inc. Integrated nucleic acid diagnostic device
US5985662A (en) 1995-07-13 1999-11-16 Isis Pharmaceuticals Inc. Antisense inhibition of hepatitis B virus replication
US6057103A (en) 1995-07-18 2000-05-02 Diversa Corporation Screening for novel bioactivities
US5958672A (en) 1995-07-18 1999-09-28 Diversa Corporation Protein activity screening of clones having DNA from uncultivated microorganisms
US5962258A (en) 1995-08-23 1999-10-05 Diversa Corporation Carboxymethyl cellulase fromthermotoga maritima
US5721118A (en) 1995-10-31 1998-02-24 The Regents Of The University Of California, San Diego Mammalian artificial chromosomes and methods of using same
US6361974B1 (en) 1995-12-07 2002-03-26 Diversa Corporation Exonuclease-mediated nucleic acid reassembly in directed evolution
US20030215798A1 (en) 1997-06-16 2003-11-20 Diversa Corporation High throughput fluorescence-based screening for novel enzymes
US6358709B1 (en) 1995-12-07 2002-03-19 Diversa Corporation End selection in directed evolution
US6537776B1 (en) 1999-06-14 2003-03-25 Diversa Corporation Synthetic ligation reassembly in directed evolution
US5830696A (en) 1996-12-05 1998-11-03 Diversa Corporation Directed evolution of thermophilic enzymes
US6171820B1 (en) 1995-12-07 2001-01-09 Diversa Corporation Saturation mutagenesis in directed evolution
US5939250A (en) 1995-12-07 1999-08-17 Diversa Corporation Production of enzymes having desired activities by mutagenesis
US6740506B2 (en) 1995-12-07 2004-05-25 Diversa Corporation End selection in directed evolution
US5965408A (en) 1996-07-09 1999-10-12 Diversa Corporation Method of DNA reassembly by interrupting synthesis
US6022963A (en) 1995-12-15 2000-02-08 Affymetrix, Inc. Synthesis of oligonucleotide arrays using photocleavable protecting groups
US6013440A (en) 1996-03-11 2000-01-11 Affymetrix, Inc. Nucleic acid affinity columns
US6096548A (en) 1996-03-25 2000-08-01 Maxygen, Inc. Method for directing evolution of a virus
US6025155A (en) 1996-04-10 2000-02-15 Chromos Molecular Systems, Inc. Artificial chromosomes, uses thereof and methods for preparing artificial chromosomes
US5697987A (en) 1996-05-10 1997-12-16 The Trustees Of Princeton University Alternative fuel
US6057100A (en) 1996-06-07 2000-05-02 Eos Biotechnology, Inc. Oligonucleotide arrays
WO1998031837A1 (en) 1997-01-17 1998-07-23 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
US6326204B1 (en) 1997-01-17 2001-12-04 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
DE69840382D1 (de) 1997-03-18 2009-02-05 Novozymes As Methode zur herstellung einer bibliothek mittels dna-shuffling
WO1998041653A1 (en) 1997-03-18 1998-09-24 Novo Nordisk A/S An in vitro method for construction of a dna library
US5948653A (en) 1997-03-21 1999-09-07 Pati; Sushma Sequence alterations using homologous recombination
US6153410A (en) 1997-03-25 2000-11-28 California Institute Of Technology Recombination of polynucleotide sequences using random or defined primers
US6333181B1 (en) 1997-04-07 2001-12-25 University Of Florida Research Foundation, Inc. Ethanol production from lignocellulose
US5916780A (en) 1997-06-09 1999-06-29 Iogen Corporation Pretreatment process for conversion of cellulose to fuel ethanol
US7019827B2 (en) 1997-06-16 2006-03-28 Diversa Corporation GigaMatrix holding tray having through-hole wells
AUPO758297A0 (en) 1997-06-27 1997-07-24 Rowe, James Baber Control of acidic gut syndrome
US6826296B2 (en) 1997-07-25 2004-11-30 Affymetrix, Inc. Method and system for providing a probe array chip design database
CN1273609A (zh) 1997-08-15 2000-11-15 希斯克有限公司 检测或量化核酸物类的方法和组合物
AU733589B2 (en) 1997-09-11 2001-05-17 Bioventures, Inc. Method of making high density arrays
US6465178B2 (en) 1997-09-30 2002-10-15 Surmodics, Inc. Target molecule attachment to surfaces
WO1999021979A1 (en) 1997-10-28 1999-05-06 Maxygen, Inc. Human papillomavirus vectors
AU1449499A (en) 1997-10-31 1999-05-24 Maxygen, Incorporated Modification of virus tropism and host range by viral genome shuffling
EP0921189B1 (en) 1997-11-14 2005-01-12 Sankyo Company Limited Transgenic animal allergy models and methods for their use
CA2313380C (en) 1997-12-08 2008-12-30 California Institute Of Technology Method for creating polynucleotide and polypeptide sequences
AU2674299A (en) 1998-02-11 1999-08-30 Maxygen, Inc. Targeting of genetic vaccine vectors
JP2002507393A (ja) 1998-02-11 2002-03-12 マキシジェン, インコーポレイテッド 抗原ライブラリー免疫
ATE340870T1 (de) 1998-04-03 2006-10-15 Compound Therapeutics Inc Adressierbare protein arrays
US6156952A (en) 1998-04-09 2000-12-05 Constituent Institution Of The University Of Maryland System HIV transgenic animals and uses therefor
US6048695A (en) 1998-05-04 2000-04-11 Baylor College Of Medicine Chemically modified nucleic acids and methods for coupling nucleic acids to solid support
NZ508287A (en) 1998-06-29 2003-08-29 Phylos Inc Method for generating highly diverse libraries
FR2782323B1 (fr) 1998-08-12 2002-01-11 Proteus Procede de production in vitro de sequences polynucleotidiques recombinees, banques de sequences et sequences ainsi obtenues
GB2340755B (en) 1998-08-24 2002-09-25 Cannon Rubber Ltd Breast pump insert
US6277628B1 (en) 1998-10-02 2001-08-21 Incyte Genomics, Inc. Linear microarrays
US6277489B1 (en) 1998-12-04 2001-08-21 The Regents Of The University Of California Support for high performance affinity chromatography and other uses
US6368861B1 (en) 1999-01-19 2002-04-09 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US6376246B1 (en) 1999-02-05 2002-04-23 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US6436675B1 (en) 1999-09-28 2002-08-20 Maxygen, Inc. Use of codon-varied oligonucleotide synthesis for synthetic shuffling
US7024312B1 (en) 1999-01-19 2006-04-04 Maxygen, Inc. Methods for making character strings, polynucleotides and polypeptides having desired characteristics
DE19910464A1 (de) 1999-03-10 2000-09-14 Bayer Ag Verfahren zur Herstellung von Cyclobutanon
US6221653B1 (en) 1999-04-27 2001-04-24 Agilent Technologies, Inc. Method of performing array-based hybridization assays using thermal inkjet deposition of sample fluids
HUP0201009A2 (en) 1999-05-07 2002-07-29 Genentech Inc Treatment of autoimmune diseases with antagonists which bind to b cell surface markers
US6653151B2 (en) 1999-07-30 2003-11-25 Large Scale Proteomics Corporation Dry deposition of materials for microarrays using matrix displacement
US6409841B1 (en) 1999-11-02 2002-06-25 Waste Energy Integrated Systems, Llc. Process for the production of organic products from diverse biomass sources
US20010008765A1 (en) 1999-12-06 2001-07-19 Fuji Photo Film Co., Ltd. DNA chip and reactive solid carrier
ES2166316B1 (es) 2000-02-24 2003-02-16 Ct Investig Energeticas Ciemat Procedimiento de produccion de etanol a partir de biomasa lignocelulosica utilizando una nueva levadura termotolerante.
JP2001328984A (ja) 2000-05-19 2001-11-27 Kuraray Co Ltd メバロラクトンの製造方法
EP1294869A2 (en) 2000-06-14 2003-03-26 Diversa Corporation Whole cell engineering by mutagenizing a substantial portion of a starting genome, combining mutations, and optionally repeating
US6423145B1 (en) 2000-08-09 2002-07-23 Midwest Research Institute Dilute acid/metal salt hydrolysis of lignocellulosics
WO2002014261A2 (en) 2000-08-10 2002-02-21 Eli Lilly And Company 4-substituted d-glutamic acid derivatives for use as antibiotic
WO2002029032A2 (en) 2000-09-30 2002-04-11 Diversa Corporation Whole cell engineering by mutagenizing a substantial portion of a starting genome, combining mutations, and optionally repeating
WO2002031203A2 (en) 2000-10-10 2002-04-18 Diversa Corporation High throughput or capillary-based screening for a bioactivity or biomolecule
US6309872B1 (en) 2000-11-01 2001-10-30 Novozymes Biotech, Inc Polypeptides having glucoamylase activity and nucleic acids encoding same
JP2004523219A (ja) 2000-11-30 2004-08-05 ディヴァーサ コーポレイション タンパク質ポリマーの製造方法および前記ポリマーの使用
US20060019913A1 (en) 2001-05-18 2006-01-26 Sirna Therapeutics, Inc. RNA interference mediated inhibtion of protein tyrosine phosphatase-1B (PTP-1B) gene expression using short interfering nucleic acid (siNA)
CA2462641A1 (en) 2001-10-01 2003-04-10 Diversa Corporation Whole cell engineering using real-time metabolic flux analysis
ES2356132T3 (es) 2002-04-23 2011-04-05 Cargill, Incorporated Polipéptidos y rutas biosintéticas.
US7572607B2 (en) 2002-04-23 2009-08-11 Cargill, Incorporated Polypeptides and biosynthetic pathways for the production of monatin and its precursors
KR100741650B1 (ko) * 2002-08-26 2007-07-24 아지노모토 가부시키가이샤 신규한 알돌라제 및 치환 α-케토산의 제조방법
JP2006512086A (ja) * 2002-09-20 2006-04-13 ダイヴァーサ コーポレイション スタチンおよびスタチン中間体の合成のための酵素化学的方法
US6776979B2 (en) 2002-12-30 2004-08-17 Marvin B. Frager Periodontal treatment compound and method of use
CN1890377B (zh) 2003-10-21 2013-06-05 嘉吉有限公司 生产莫纳甜和莫纳甜前体
JP4500977B2 (ja) 2003-11-05 2010-07-14 味の素株式会社 新規アミノ酸誘導体及び甘味剤
JP4604524B2 (ja) * 2004-03-16 2011-01-05 味の素株式会社 変異型アルドラーゼ、並びにこれを用いた光学活性ihog及び光学活性モナティンの製造方法
US20060014260A1 (en) 2004-05-07 2006-01-19 Zhiliang Fan Lower cellulase requirements for biomass cellulose hydrolysis and fermentation
US20060030003A1 (en) 2004-05-12 2006-02-09 Simon Michael R Composition and method for introduction of RNA interference sequences into targeted cells and tissues
US7338763B2 (en) 2004-06-02 2008-03-04 Eppendorf Array Technologies S.A. Method and kit for the detection and/or quantification of homologous nucleotide sequences on arrays
CA2506247C (en) * 2004-06-07 2012-02-21 Ajinomoto Co., Inc. Novel aldolase, and method for producing optically active ihog and monatin
CN100519756C (zh) * 2004-06-07 2009-07-29 味之素株式会社 新的醛缩酶及光学活性ihog及莫那亭的制备方法
ATE536418T1 (de) 2004-06-07 2011-12-15 Protiva Biotherapeutics Inc Lipidverkapselte interferenz-rna
US7635563B2 (en) 2004-06-30 2009-12-22 Massachusetts Institute Of Technology High throughput methods relating to microRNA expression analysis
US20060019258A1 (en) 2004-07-20 2006-01-26 Illumina, Inc. Methods and compositions for detection of small interfering RNA and micro-RNA
US7923231B2 (en) 2004-12-17 2011-04-12 Cargill, Incorporated Production of glucuronic acid using myo-inositol oxygenase from cryptococcus neoformans
US7582455B2 (en) * 2005-04-26 2009-09-01 Cargill, Incorporated Polypeptides and biosynthetic pathways for the production of stereoisomers of monatin and their precursors
US8076108B2 (en) * 2005-04-26 2011-12-13 Cargill, Incorporated Polypeptides and biosynthetic pathways for the production of stereoisomers of monatin and their precursors
SG11201510439PA (en) 2013-06-21 2016-01-28 Bio Rad Laboratories Microfluidic system with fluid pickups

Also Published As

Publication number Publication date
ES2383767T3 (es) 2012-06-26
CN102690833B (zh) 2015-09-09
EA200870329A1 (ru) 2009-06-30
KR20090004918A (ko) 2009-01-12
MX2008011442A (es) 2008-11-18
EP1999256A4 (en) 2009-06-03
KR20160058194A (ko) 2016-05-24
KR20140023424A (ko) 2014-02-26
CN101443446A (zh) 2009-05-27
JP2013066469A (ja) 2013-04-18
US20140053287A1 (en) 2014-02-20
CN105063072A (zh) 2015-11-18
CN101443446B (zh) 2013-08-21
JP5733777B2 (ja) 2015-06-10
US8546118B2 (en) 2013-10-01
JP2013063068A (ja) 2013-04-11
WO2007103989A8 (en) 2009-07-23
ATE548450T1 (de) 2012-03-15
EA029538B1 (ru) 2018-04-30
AU2007223086A1 (en) 2007-09-13
EP3153580A3 (en) 2017-04-19
EP2385108B1 (en) 2016-11-23
EP2385108A1 (en) 2011-11-09
JP5793487B2 (ja) 2015-10-14
EA201301267A1 (ru) 2014-11-28
BRPI0708614A2 (pt) 2011-06-07
EP3153580A2 (en) 2017-04-12
KR101622894B1 (ko) 2016-05-19
CA2645225A1 (en) 2007-09-13
JP2009531025A (ja) 2009-09-03
EP2388316A2 (en) 2011-11-23
US9290755B2 (en) 2016-03-22
KR101508249B1 (ko) 2015-04-10
EA019971B1 (ru) 2014-07-30
KR101744157B1 (ko) 2017-06-08
CN102690833A (zh) 2012-09-26
KR101588539B1 (ko) 2016-01-25
US20100095390A1 (en) 2010-04-15
EP2388316A3 (en) 2012-03-14
EP1999256B1 (en) 2012-03-07
EP1999256A2 (en) 2008-12-10
WO2007103989A2 (en) 2007-09-13
US20160251643A1 (en) 2016-09-01
AU2007223086B2 (en) 2013-09-26
US9719079B2 (en) 2017-08-01
JP5793486B2 (ja) 2015-10-14
WO2007103989A9 (en) 2007-11-29
KR20150020722A (ko) 2015-02-26

Similar Documents

Publication Publication Date Title
KR101744157B1 (ko) 알돌라제, 이것을 코딩하는 핵산과 그 제조 방법 및 사용 방법
JP5441417B2 (ja) アルドース、それをコードする核酸、ならびにそれを生成および使用する方法
AU2016201456A1 (en) Aldolases, nucleic acids encoding them and methods for making and using them
AU2013251189A1 (en) Aldolases, nucleic acids encoding them and methods for making and using them

Legal Events

Date Code Title Description
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B25D Requested change of name of applicant approved

Owner name: BASF ENZYMES LLC (US)

B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 23/10/2018, OBSERVADAS AS CONDICOES LEGAIS.

B21F Lapse acc. art. 78, item iv - on non-payment of the annual fees in time

Free format text: REFERENTE A 14A ANUIDADE

B24J Lapse because of non-payment of annual fees (definitively: art 78 iv lpi, resolution 113/2013 art. 12)

Free format text: MANUTENCAO DA EXTINCAO - ART. 78 INCISO IV DA LPI