BR112012031559B1 - Método de seleção de um mrna para expressão de um polipeptídeo de interesse em uma planta ou fungo - Google Patents

Método de seleção de um mrna para expressão de um polipeptídeo de interesse em uma planta ou fungo Download PDF

Info

Publication number
BR112012031559B1
BR112012031559B1 BR112012031559-5A BR112012031559A BR112012031559B1 BR 112012031559 B1 BR112012031559 B1 BR 112012031559B1 BR 112012031559 A BR112012031559 A BR 112012031559A BR 112012031559 B1 BR112012031559 B1 BR 112012031559B1
Authority
BR
Brazil
Prior art keywords
mrna
polypeptide
interest
mol
kcal
Prior art date
Application number
BR112012031559-5A
Other languages
English (en)
Other versions
BR112012031559A2 (pt
Inventor
Shib Sankar Basu
Kristen Kamerath Dang
Kasimalai AZHAKANANDAM
Thomas Z. McNeill
Sheng Guo
Original Assignee
Syngenta Participations Ag
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Syngenta Participations Ag filed Critical Syngenta Participations Ag
Publication of BR112012031559A2 publication Critical patent/BR112012031559A2/pt
Publication of BR112012031559B1 publication Critical patent/BR112012031559B1/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1089Design, preparation, screening or analysis of libraries using computer algorithms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries

Landscapes

  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Analytical Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

composições e métodos para a produção de proteínas - a presente invenção refere-se a um m´todo de seleção de um mrna paraprodução de um polipeptídeo de interesse, compreendendo: a) produção de uma matriz de sequências individuais do mrda compreendendo diferentes sequências de nucleotídeos que codificam para o polipeptídeo de interesse; b) determinação de um ou mais ou de dois ou mais dos seguintes parâmetros para cada sequência individual do mrna de (a): (i) energia livre mínima (mfe) da estrutura secundária do rna; (ii) energia do conjunto (efe); (iii) frequência da energia termodinâmico; e (iv) diversidade do conjunto (ed); c) classificação das sequências individuais do mrna da matriz de acordo com os parâmetros determinados no passo (b); e d) selecionar uma sequência de mrna da matriz classificada do passo (c), em que o mrna selecionado produz o polipeptídeo de interesse. a presente invewnção ainda fornece um método de seleção de um mrna para produção melhorada e reduzida de um polipeptídeo de interesse.

Description

Relatório Descritivo da Patente de Invenção para “MÉTODO DE SELEÇÃO DE UM MRNA PARA EXPRESSÃO DE UM POLIPEPTÍDEO DE INTERESSE EM UMA PLANTA OU FUNGO”.
DECLARAÇÃO DE PRIORIDADE
O presente pedido reivindica o benefício, de acordo com o Art. 35 U.S.C. 119(e), do Pedido Provisório U.S. N° 61/353,879; depositado em 11 de Junho de 2010, cujos conteúdos são aqui incorporados como referência.
CAMPO DA INVENÇÃO
A presente invenção refere-se aos métodos relacionados geralmente com o campo da produção de proteínas. Especificamente, a presente invenção fornece métodos para seleção de um mRNA para produção de um polipeptídeo de interesse.
ANTECEDENTES DA INVENÇÃO
Muitos fatores influenciam a produção de proteínas incluindo o número de cópias do gene, a localização do gene, a eficiência da transcrição e da tradução, fatores de transcrição e a estabilidade do mRNA. Os esforços se concentraram no desenvolvimento da tecnologia para manipular esses e outros fatores, a fim de aumentar a produção de proteínas. Assim, por exemplo, vários registros do aumento da expressão proteica através do uso de códons alterados são encontrados na bibliografia, tornando esta abordagem genética sintética uma estratégia comum para a expressão da proteína. Apesar das vantagens relatadas, muitas vezes as observações experimentais reforçam a importância de outros fatores na determinação da eficiência da produção de proteínas heterólogas. Assim, ainda não foi concebido um método que proporcione o nível necessário de previsibilidade na produção das proteínas.
De um modo concordante, a presente invenção destina-se a resolver os problemas anteriores do estado da arte, fornecendo métodos para seleção de um mRNA produzindo uma proteína de interesse, em uma quantidade desejada.
SUMÁRIO DA INVENÇÃO
Petição 870190074939, de 05/08/2019, pág. 17/178
2/117
Um primeiro aspecto da presente invenção fornece um método de seleção de um mRNA para produção de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências individuais do mRNA compreendendo diferentes sequências de nucleotídeos que codificam para o polipeptídeo de interesse; b) determinação de um ou mais dos seguintes parâmetros para cada sequência individual do mRNA (a): (i) conjunto energia livre (EFE); (ii) frequência da energia livre mínima (FMFE) estrutura secundária do RNA em um conjunto termodinâmico; e (iii) diversidade do conjunto (ED); c) classificação das sequências individuais do mRNA da matriz de acordo com os parâmetros determinados na etapa (b); e d) selecionar uma sequência de mRNA da matriz classificada do passo (c), em que o mRNA selecionado produz o polipeptídeo de interesse.
Um aspeto adicional da presente invenção fornece um método de seleção de um mRNA para produção de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências individuais do mRNA compreendendo diferentes sequências de nucleotídeos que codificam para o polipeptídeo de interesse; b) determinação da energia livre mínima (MFE) da estrutura secundária do RNA para cada sequência individual do mRNA de (a); c) determinação de um ou mais dos seguintes parâmetros para cada sequência individual do mRNA de (a): (i) frequência da energia livre mínima (FMFE) da estrutura secundária do RNA em um conjunto termodinâmico; e (ii) diversidade do conjunto (ED); d) classificação das sequências individuais do mRNA da matriz de acordo com uma distribuição conjunta dos parâmetros determinados nas etapas (b) e (c) acima; e e) selecionar uma sequência de mRNA da matriz classificada do passo (d), em que o mRNA selecionado produz o polipeptídeo de interesse.
Em outros aspectos, a presente invenção fornece um método de seleção de um mRNA para produção de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências individuais do mRNA compreendendo diferentes sequências de nucleotídeos que codificam para o polipeptídeo de interesse; b) determinação da energia livre do conjunto (EFE) para cada sequência individual do mRNA de (a); c) determiPetição 870190074939, de 05/08/2019, pág. 18/178
3/117 nação de um ou mais dos seguintes parâmetros para cada sequência individual do mRNA de (a): (i) frequência da energia livre mínima (FMFE) da estrutura secundária do RNA em um conjunto termodinâmico; e (ii) diversidade do conjunto (ED); d) classificação das sequências individuais do mRNA da matriz de acordo com uma distribuição conjunta dos parâmetros determinados nas etapas (b) e (c) acima; e e) selecionar uma sequência de mRNA da matriz classificada do passo (d), em que o mRNA selecionado produz o polipeptídeo de interesse.
A presente invenção fornece ainda um método de seleção de um mRNA para uma maior produção de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências individuais de mRNA compreendendo diferentes sequências nucleotídicas que codificam para o polipeptídeo de interesse; b) determinação da energia livre mínima (MFE) da estrutura do RNA para sequência individual do mRNA de (a) e frequência da energia livre mínima (FMFE) da estrutura secundária do RNA em um conjunto termodinâmico para cada sequência individual de mRNA de a);
c) classificação das sequências individuais do mRNA da matriz de acordo com uma distribuição conjunta da MFE e FMFE determinadas na etapa (b) acima; e d) seleção de uma sequência de mRNA a partir da matriz classificada do passo (c), em que o mRNA é selecionado de entre aproximadamente 0,0001 % até cerca de 20% das sequências na matriz classificada com os valores mais elevados para MFE da estrutura secundária do RNA e os valores mais baixos para FMFE da estrutura secundária do RNA ou da sequência de mRNA é selecionado de entre as sequências de mRNA contendo uma MFE da estrutura secundária do RNA compreendida entre cerca de 0 kcal/mol até cerca de -2 kcal/mol, tal como medido à temperatura ambiente e os valores mais baixos para a FMFE da estrutura secundária do RNA, em que a expressão da sequência do mRNA selecionada resulta em uma produção aumentada do polipeptídeo de interesse, em relação à sequência de mRNA do tipo selvagem.
Um aspeto adicional da invenção fornece ainda um método de seleção de um mRNA para uma produção reduzida de um polipeptídeo de
Petição 870190074939, de 05/08/2019, pág. 19/178
4/117 interesse, o método compreendendo: a) produção de uma matriz de sequências individuais de mRNA compreendendo diferentes sequências nucleotídicas que codificam para o polipeptídeo de interesse; b) determinação da energia livre mínima (MFE) da estrutura secundária do RNA para cada sequência individual do mRNA de (a) e frequência da energia livre mínima (FMFE) da estrutura secundária do RNA em um conjunto termodinâmico para cada sequência individual de mRNA de (a); c) classificação das sequências individuais de mRNA da matriz de acordo com uma distribuição conjunta da MFE e FMFE determinadas na etapa (b) acima; e (d) seleção de uma sequência de mRNA a partir da matriz classificada do passo (c), em que o mRNA é selecionado de entre aproximadamente 0,0001 % até cerca de 20% das sequências na matriz classificada com os valores mais baixos para MFE da estrutura secundária do RNA e os valores mais elevados para FMFE da estrutura secundária do RNA ou da sequência de mRNA é selecionada de entre as sequências de mRNA contendo uma MFE da estrutura secundária do RNA compreendida entre cerca de -9 kcal/mol até cerca de -18 kcal/mol, tal como medido à temperatura ambiente e os valores mais elevados para a FMFE da estrutura secundária do RNA, em que a expressão da sequência do mRNA selecionada resulta em uma produção reduzida do polipeptídeo de interesse, em relação à sequência de mRNA do tipo selvagem.
Em outros aspectos da invenção é fornecido um método para seleção de um mRNA para a produção aumentada de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências individuais de mRNA compreendendo diferentes sequências nucleotídicas que codificam para o polipeptídeo de interesse; b) determinação da energia livre do conjunto (EFE) para cada sequência individual do mRNA de (a) e frequência da energia livre mínima (FMFE) da estrutura secundária do RNA em um conjunto termodinâmico para cada sequência individual do mRNA de (a); e c) classificação das sequências individuais de mRNA da matriz de acordo com uma distribuição conjunta da EFE e FMFE determinadas na etapa (b) acima; e d) seleção de uma sequência de mRNA a partir da matriz classificada do passo (c), em que o mRNA é selecionado de entre aproPetição 870190074939, de 05/08/2019, pág. 20/178
5/117 ximadamente 0,0001% até cerca de 20% das sequências na matriz classificada com os valores mais elevados para EFE e os valores mais baixos para FMFE da estrutura secundária do RNA, em que a expressão da sequência do mRNA selecionada resulta em uma produção aumentada do polipeptídeo de interesse, em relação à sequência de mRNA do tipo selvagem.
Ainda, em outros aspectos, a invenção fornece um método para seleção de um mRNA para a produção reduzida de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências individuais de mRNA compreendendo diferentes sequências nucleotídicas que codificam para o polipeptídeo de interesse; b) determinação da energia livre do conjunto (EFE) para cada sequência individual do mRNA de (a) e frequência da energia livre mínima (FMFE) da estrutura secundária do RNA em um conjunto termodinâmico; e c) classificação das sequências individuais de mRNA da matriz de acordo com uma distribuição conjunta da EFE e FMFE determinadas na etapa (b) acima; e d) seleção de uma sequência de mRNA a partir da matriz classificada do passo (c), em que o mRNA é selecionado de entre aproximadamente 0,0001% até cerca de 20% das sequências na matriz classificada com os valores mais baixos para EFE e os valores mais elevados para FMFE da estrutura secundária do RNA, em que a expressão da sequência do mRNA selecionada resulta em uma produção reduzida do polipeptídeo de interesse, em relação à sequência de mRNA do tipo selvagem.
A presente invenção ainda fornece um método de seleção de um mRNA para a produção de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências de mRNA individuais compreendendo diferentes sequências nucleotídicas que codificam para o polipeptídeo de interesse; b) determinação da energia livre mínima (MFE) da estrutura secundária do RNA para cada sequência individual do mRNA de (a); c) classificação das sequências individuais do mRNA da matriz de acordo com a MFE da estrutura secundária do RNA determinada em (b) da mais alta MFE da estrutura secundária do RNA para a menor MFE da estrutura secundária do RNA; e d) seleção de uma sequência de mRNA a partir da
Petição 870190074939, de 05/08/2019, pág. 21/178
6/117 matriz classificada do passo (c), em que o mRNA é selecionado a partir do grupo de mRNAs contendo a MFE da estrutura secundária do RNA em uma gama de cerca de 0 kcal/mol a cerca de -2 kcal/mol, o grupo dos mRNAs contendo uma MFE da estrutura secundária do RNA em uma gama de cerca de -2 kcal/mol a cerca de -9 kcal/mol, ou o grupo de mRNAs contendo uma MFE da estrutura secundária do RNA em uma gama de cerca de -9 kcal/mol a cerca de -18 kcal/mol, em que o mRNA selecionado produz o polipeptídeo de interesse.
Adicionalmente é fornecido um método de seleção de um mRNA para a produção aumentada de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências individuais de mRNA compreendendo diferentes sequências nucleotídicas que codificam para o polipeptídeo de interesse; b) determinar a energia livre mínima (MFE) da estrutura secundária do RNA para cada sequência individual de mRNA de (a); e c) seleção de uma sequência de mRNA de (a) contendo uma MFE da estrutura secundária do RNA na gama de cerca de 0 kcal/mol a cerca de -2 kcal/mol, em que a expressão da sequência de mRNA selecionada resulta em uma produção aumentada do polipeptídeo de interesse em relação à sequência de mRNA do tipo selvagem.
Em aspectos adicionais da presente invenção, é fornecido um método de seleção de um mRNA para a produção reduzida de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências individuais de mRNA compreendendo diferentes sequências nucleotídicas que codificam para o polipeptídeo de interesse; b) determinação da energia livre mínima (MFE) da estrutura secundária do RNA para cada sequência individual de mRNA de (a) e o nível de expressão de cada sequência individual de mRNA de (a); c) seleção de uma sequência de mRNA de (a) contendo uma MFE da estrutura secundária do RNA na gama de cerca de -9 kcal/mol a cerca de -18 kcal/mol, em que a expressão da sequência de mRNA selecionada resulta em uma produção aumentada do polipeptídeo de interesse em relação à sequência de mRNA do tipo selvagem.
Em algumas modalidades de realização da presente invenção, é
Petição 870190074939, de 05/08/2019, pág. 22/178
7/117 fornecido um método para modificar a produção de um polipeptídeo de interesse em uma célula de um organismo, o método compreendendo: (a) seleção de um mRNA que codifica para um polipeptídeo de interesse, de acordo com os métodos da presente invenção; (b) mutação da sequência nucleotídica do mRNA de (a) para produzir um mRNA mutado contendo uma MFE aumentada ou reduzida da estrutura secundária do RNA, em relação à MFE da estrutura secundária do RNA da sequÊncia nucleotídica do mRNA de (a) e que codifica para uma sequência polipeptídica que é mutada em comparação com a sequência polipeptídica codificada pelo mRNA de (a); em que a sequência polipeptídica mutada mantém a função do polipeptídeo codificado pelo mRNA de (a), e a expressão da sequência do mRNA mutada em uma célula de um organismo resulta na produção modificada do polipeptídeo de interesse em relação à sequência de mRNA do tipo selvagem.
Em algumas modalidades de realização da presente invenção, é fornecido um método para modificar a produção de um polipeptídeo de interesse em uma célula de um organismo, o método compreendendo: (a) seleção de um mRNA que codifica para um polipeptídeo de interesse de os acordo com os métodos da presente invenção; (b) identificação das diferenças entre a sequência nucleotídica do mRNA selecionado de acordo com (a) e uma sequência nucleotídica endógena do tipo selvagem do referido organismo, em que a sequência nucleotídica endógena do tipo selvagem codifica para um polipeptídeo de interesse, que é o mesmo que é codificado pelo mRNA selecionado de acordo com (a); e (c) mutação in situ da sequência nucleotídica endógena que codifica para o polipeptídeo de interesse para integrar cada uma das diferenças do nucleotídeo identificadas em (b) na sequência nucleotídica endógena, na qual a produção do polipeptídeo de interesse a partir da sequência nucleotídica endógena in situ mutada na célula do organismo é modificada.
Outros objetos e objetos adicionais, características e vantagens seriam evidentes e mais facilmente entendidas através da leitura da seguinte descrição e pela referência aos desenhos que a acompanham, e que fazem parte dela, ou quaisquer exemplos das modalidades de realização da invenPetição 870190074939, de 05/08/2019, pág. 23/178
8/117 ção fornecidas para a finalidade da revelação.
BREVE DESCRIÇÃO DAS FIGURAS
Figura 1 é um fluxograma ilustrando operações de acordo com algumas modalidades de realização da presente invenção.
Figura 2 é um diagrama de blocos ilustrando sistemas de acordo com algumas modalidades de realização da presente invenção.
Figura 3 mostra o nível de transcritos AmCyan (A) e os níveis relativos de mRNA de AmCyan para PPO (B) em amostras foliares infiltradas com os constructos vetoriais codificando para diferentes variantes [Tabela 2] do peptídeo em trânsito de Cloroplasto N-terminal ssRubisco com AmCyan (CFP) em um sistema transiente de tabaco.
Figura 4 mostra a correlação entre os níveis de produção de proteínas (ELISA) de variantes CFP (AmCyan) e os respetivos níveis de energia livre mínima (A) e os seus níveis de energia livre do conjunto (B).
Figura 5 mostra a correlação entre os níveis de produção de proteínas (ELISA) das variantes AmCyan (CFP) e os respetivos níveis de energia livre mínima (A) e os seus níveis de energia livre do conjunto (B). CFP = AmCyan [Proteína Cyan Fluorescente] nível de expressão; CFP* (23,3/PPO) = nível de expressão da CFP normalizado relativamente ao nível de expressão da PPO (do mesmo vetor transiente de tabaco).
Figura 6 mostra a correlação da energia calculada para o arranjo do mRNA e a produção de proteína (ELISA) no sistema de levedura, normalizado relativamente ao nível medido do transcrito (qRT-PCR).
Figura 7 mostra a correlação entre os níveis de produção de proteína (ELISA) das variantes AmCyan (CFP) no sistema de levedura e os seus níveis de energia livre do conjunto.
DESCRIÇÃO DETALHADA DA INVENÇÃO
Esta descrição não pretende ser um catálogo detalhado de todas as maneiras diferentes em que a invenção pode ser implementada, ou de todas as características que podem ser adicionadas à presente invenção. Por exemplo, as características ilustradas relativamente a uma modalidade podem ser incorporadas em outras modalidades de realização, e as caractePetição 870190074939, de 05/08/2019, pág. 24/178
9/117 rísticas ilustradas relativamente a uma modalidade de realização particular podem ser eliminadas dessa modalidade. Além disso, inúmeras variações e adições às várias modalidades de realização aqui sugeridas serão evidentes para os especialistas na arte à luz do momento da revelação, que não saem do âmbito da presente invenção. Assim, as descrições seguintes destinamse a ilustrar algumas modalidades de realização particulares da invenção, e não de forma exaustiva especificar todas as suas permutações, combinações e variações.
Os presentes inventores descobriram que, ao determinar uma ou mais (por exemplo, 1, 2, 3, 4, 5, etc.), ou duas ou mais (por exemplo, 2, 3, 4, 5, etc.) variáveis termodinâmicas da estrutura secundária de um mRNA codificando para uma proteína de interesse, que um mRNA codificando para um polipeptídeo de interesse pode ser selecionado, que produz uma proteína a uma taxa desejada ou pré-selecionada e/ou nível e/ou em determinadas condições de produção. Assim, algumas modalidades de realização da invenção fornecem um método de seleção de um mRNA para a produção modulada (melhorada ou diminuída (por exemplo, reduzida)) de um polipeptídeo de interesse. De um modo concordante, em algumas modalidades de realização da presente invenção um mRNA que codifica para um polipeptídeo de interesse pode ser selecionado, que produza uma quantidade melhorada ou aumentada de proteínas, em comparação com a quantidade de proteína produzida pelo tipo selvagem (i.e., nativa) do mRNA codificando para o mesmo polipeptídeo de interesse. Ainda, em outras modalidades de realização da presente invenção, um mRNA que codifica para um polipeptídeo de interesse pode ser selecionado, que produza uma quantidade reduzida ou diminuída de proteínas, em comparação com a quantidade de proteína produzida pelo tipo selvagem do mRNA codificando para o mesmo polipeptídeo de interesse. Em aspectos adicionais da invenção, um primeiro mRNA que codifica para um polipeptídeo de interesse pode ser selecionado, que produza uma quantidade melhorada ou aumentada de proteínas, em comparação com a quantidade de proteína produzida por um segundo mRNA (por exemplo, que não o mRNA nativo) codificando para o mesmo polipeptídeo de intePetição 870190074939, de 05/08/2019, pág. 25/178
10/117 resse. Ainda, em outros aspectos da invenção, um primeiro mRNA que codifica para um polipeptídeo de interesse pode ser selecionado, que produza uma quantidade diminuída ou reduzida de proteínas, em comparação com a quantidade de proteína produzida por um segundo mRNA selecionado, codificando para o mesmo polipeptídeo de interesse. A quantificação da melhoria (por exemplo, aumento) ou diminuição (por exemplo, redução; decréscimo) podem variar conforme o desejado, com base na seleção do mRNA utilizando os métodos da presente invenção. Assim, qualquer mRNA de uma matriz gerada com base em um mRNA nativo ou um segundo mRNA mas que produz uma quantidade modificada de um polipeptídeo de interesse em relação ao mRNA de tipo selvagem ou nativo ou a um segundo mRNA pode ser selecionado usando os métodos da presente invenção.
Além disso, os métodos aqui descritos podem ser utilizados como uma ferramenta para superar o silenciamento do RNA. Como exemplo, os promotores fortes são frequentemente utilizados para gerar um nível elevado de trancrito do RNA. No entanto, como é conhecido dos especialistas na arte, os promotores fortes resultam frequentemente no silenciamento de genes. Em vez disso, um promotor moderado ou fraco pode ser utilizado em combinação com um constructo de gene compreendendo um mRNA selecionado de acordo com os métodos da presente invenção para produzir um transcrito de mRNA que seja mais eficientemente traduzido. Assim, apesar do uso de um promotor fraco ou moderado, pode ser alcançado um nível elevado de produção de proteína, usando os métodos da presente invenção que podem identificar os transcritos do mRNA que são mais eficientemente traduzidos e, ao mesmo tempo, evitar o silenciamento de genes devido aos elevados níveis de transcrito.
Um primeiro aspeto da presente invenção fornece um método de seleção de um mRNA para produção de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências individuais do mRNA compreendendo diferentes sequências de nucleotídeos que codificam para o polipeptídeo de interesse; b) determinação de um ou mais dos seguintes parâmetros para cada sequência individual do mRNA de (a): (i)
Petição 870190074939, de 05/08/2019, pág. 26/178
11/117 conjunto energia livre (EFE); (ii) frequência da energia livre mínima (FMFE) estrutura secundária do RNA em um conjunto termodinâmico; e (iii) diversidade do conjunto (ED); c) classificação das sequências individuais do mRNA da matriz de acordo com os parâmetros determinados na etapa (b); e d) selecionar uma sequência de mRNA da matriz classificada do passo (c), em que o mRNA selecionado produz o polipeptídeo de interesse. Em algumas modalidades de realização, quando dois ou mais parâmetros são determinados, a classificação das sequências individuais de mRNA da matriz no passo (c) está de acordo com a distribuição conjunta dos parâmetros determinados no passo (b), como descrito anteriormente.
Um aspeto adicional da presente invenção fornece um método de seleção de um mRNA para produção de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências individuais do mRNA compreendendo diferentes sequências de nucleotídeos que codificam para o polipeptídeo de interesse; b) determinação da energia livre mínima (MFE) da estrutura secundária do RNA para cada sequência individual do mRNA de (a); c) determinação de um ou mais dos seguintes parâmetros para cada sequência individual do mRNA de (a): (i) frequência da energia livre mínima (FMFE) da estrutura secundária do RNA em um conjunto termodinâmico; e (ii) diversidade do conjunto (ED); d) classificação das sequências individuais do mRNA da matriz de acordo com uma distribuição conjunta dos parâmetros determinados nas etapas (b) e (c) acima; e e) selecionar uma sequência de mRNA da matriz classificada do passo (d), em que o mRNA selecionado produz o polipeptídeo de interesse.
Em outros aspectos, a presente invenção fornece um método de seleção de um mRNA para produção de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências individuais do mRNA compreendendo diferentes sequências de nucleotídeos que codificam para o polipeptídeo de interesse; b) determinação da energia livre do conjunto (EFE) para cada sequência individual do mRNA de (a); c) determinação de um ou mais dos seguintes parâmetros para cada sequência individual do mRNA de (a): (i) frequência da energia livre mínima (FMFE) da esPetição 870190074939, de 05/08/2019, pág. 27/178
12/117 trutura secundária do RNA em um conjunto termodinâmico; e (ii) diversidade do conjunto (ED); d) classificação das sequências individuais do mRNA da matriz de acordo com uma distribuição conjunta dos parâmetros determinados nas etapas (b) e (c) acima; e e) selecionar uma sequência de mRNA da matriz classificada do passo (d), em que o mRNA selecionado produz o polipeptídeo de interesse.
De um modo concordante, em algumas modalidades de realização da presente invenção, os seguintes parâmetros ou combinação de parâmetros podem ser determinados para cada sequência individual de mRNA de uma matriz e usados para classificar as sequências individuais de mRNA (note-se que, quando dois ou mais parâmetros são determinados, a classificação está de acordo com uma distribuição conjunta dos parâmetros): (1) EFE; (2) FMFE; (3) MFE; (4) ED; (5) EFE e FMFE; (6) EFE e ED; (7) FMFE e ED; (8) EFE, FMFE e ED; (9) MFE e FMFE; (10) MFE e ED; e (11) MFE, FMFE e ED. Além disso, em alguns aspectos, a presente invenção compreende ainda a determinação da probabilidade do emparelhamento de bases (BPP) para cada sequência individual de mRNA para além dos parâmetros ou combinações dos parâmetros acima descritos. Assim, tal como previsto no presente documento, as seguintes combinações de parâmetros podem ser determinadas para cada sequência individual de mRNA de uma matriz e usadas para classificar as sequências individuais de mRNA de acordo com uma distribuição conjunta: (1) EFE e BPP; (2) FMFE e BPP; (3) ED e BPP;
(4) EFE, FMFE e BPP; (5) EFE, ED e BPP; (6) FMFE, ED e BPP; (7) EFE, FMFE, ED e BPP; (8) MFE, FMFE e BPP; (9) MFE, ED e BPP; e (10) MFE, FMFE, ED e BPP.
Deve ser entendido que, embora os termos primeiro, segundo, etc. possam ser utilizados neste documento para descrever vários elementos, estes elementos não devem ser limitados por estes termos. Estes termos são utilizados apenas para distinguir um elemento do outro. Assim, um primeiro elemento (por exemplo, uma primeira sequência de mRNA) discutido abaixo também poderia ser designado como um segundo elemento (por exemplo, uma segunda sequência de mRNA) sem se afastar dos
Petição 870190074939, de 05/08/2019, pág. 28/178
13/117 ensinamentos da presente invenção.
O ácido nucléico do tipo selvagem, sequência de nucleotídeos, sequência polipeptídica ou de aminoácido refere-se a um ácido nucléico, sequência nucleotídica, polipeptídica ou de aminoácido que ocorre naturalmente (nativo) ou é endógeno. Assim, um mRNA de tipo selvagem é um mRNA que ocorre naturalmente no organismo ou é endógeno.
Como aqui usado, o termo método de otimização termodinâmica significa qualquer implementação do algoritmo Zuker para determinar a estrutura da energia livre mínima de uma molécula de ácido nucléico (Zuker et al., Nucleic Acids Research, 9, 133-148 (1981); ver também, Mathews et al., J. Mol. Biol. 288:911-940 (1999) e Walter et al., PNAS 91:9218-9222 (1994)).
O termo energia livre mínima da estrutura secundária do RNA (MFE) tal como aqui usado significa a estrutura encontrada por otimização termodinâmica (i.e., uma implementação do algoritmo Zuker (M. Zuker e P. Stiegler., Nucleic Acids Research 9:133-148 (1981)) que tem o valor mais baixo de energia livre.
O termo frequência da energia livre mínima da estrutura secundária de RNA (FMFE) refere-se à fração da estrutura MFE no conjunto termodinâmico: (eA(-E/kT))/Z, onde E é a energia livre mínima da estrutura, k é a constante de Boltzmann, T é a temperatura e Z é a função de partição (Wuchty et al., Biopolymers 49:145-165 (1999)). De um modo concordante, a função de partição e as estruturas do conjunto termodinâmico são utilizados na determinação da FMFE da estrutura secundária do RNA.
Como aqui usado, o termo função de partição refere-se à função de partição tal como definida por J.S. McCaskill (Biopolymers 29:11051119 (1990)): Z = sum( e Λ [ Ei / kT ] ), onde Ei é a energia livre da estrutura i e a soma é considerada sobre todas as estruturas (desde i = 1 a i = n) para uma dada sequência.
O termo energia livre do conjunto (EFE) tal como usado aqui significa -kt * ln Z, onde k, T, e Z são definidos como acima e implementados por exemplo, no pacote de software ViennaRNA (I.L. Hofacker et al, MonaPetição 870190074939, de 05/08/2019, pág. 29/178
14/117 tsh. Chem., 125: 167-188 (1994)). A energia livre do conjunto é definida por J.S. McCaskill em Biopolymers 29:1105-1119 (1990).
Como usado aqui, o termo diversidade do conjunto (ED) significa a diferença média do par de bases entre todas as estruturas no conjunto termodinâmico: sum_a,b p_a * p_b * d(a,b), onde a soma abrange todos os pares estrutura possível a,b, p_a é o peso Boltzmann da estrutura a, e d(a,b) é a distância do par de bases, onde a distância do par de bases é definida por Wuchty et al. em Biopolymers 49:145-165 (1999)).
A distribuição conjunta dos parâmetros define a probabilidade dos eventos em termos dos parâmetros específicos determinados, tais como MFE, EFE, FMFE, ED e/ou BPP. Assim, quando dois ou mais dos parâmetros MFE, EFE, FMFE, ED e/ou BPP são determinados, uma distribuição conjunta é utilizada para classificar os mRNAs de acordo com os valores determinados para cada parâmetro e para cada mRNA individual.
Assim, tal como aqui utilizado, a expressão distribuição conjunta pode ser definida através da seleção de uma fração inicial de sequências de interesse (por exemplo, os 5% superiores das estruturas MFE, tal como acima definido) e, em seguida, usando o outro parâmetro que foi determinado (por exemplo, FMFE) para selecionar uma fração da fração inicial. Por exemplo, tomando os 10% superiores e inferiores das estruturas MFE (por exemplo, para a expressão melhorada e reduzida, respectivamente), e em seguida tomar os 50% superiores de cada uma destas frações de acordo com o seu valor de FMFE.
O termo probabilidade do emparelhamento de bases (BPP) tal como usado aqui significa a média de todas as posições na sequência de nucleotídeos das entropias de Shannon por posição das probabilidades do emparelhamento de bases. O cálculo das probabilidades do emparelhamento de bases é definido por J.S. McCaskill (Biopolymers 29:1105-1119 (1990)) e implementado, por exemplo, no pacote de software ViennaRNA (I.L. Hofacker et al., Monatsh. Chem., 125:167-188 (1994)). O cálculo dos valores de entropia é descrito por M. Huynen (J Mol. Biol. 267:1104-1112 (1997)).
Em modalidades de realização da presente invenção, os métoPetição 870190074939, de 05/08/2019, pág. 30/178
15/117 dos compreendem a produção de uma matriz de sequências individuais de mRNA compreendendo diferentes sequências de nucleotídeos que codificam para o polipeptídeo de interesse.
Em algumas modalidades de realização da presente invenção, uma matriz é produzida pela retrotradução de um polipeptídeo de interesse para produzir mRNAs que codificam para o polipeptídeo de interesse. Em modalidades de realização particulares, uma matriz é produzida por retrotradução da extremidade N-terminal de um polipeptídeo de interesse para produzir mRNAs que codificam para a extremidade N-terminal de um polipeptídeo de interesse. Em modalidades de realização adicionais, uma matriz é produzida por retrotradução da extremidade N-terminal de um polipeptídeo de interesse para produzir mRNAs que codificam para a extremidade Nterminal do polipeptídeo de interesse, em que os mRNAs individuais que são produzidos compreendem um códon iniciador e um comprimento de cerca de 20 a 70 nucleotídeos.
Assim, em algumas modalidades de realização, uma matriz de sequências individuais de mRNA é produzida, em que as sequências individuais de mRNA compreendem, cada uma, o códon iniciador e um comprimento de cerca de 20 até cerca de 25 nucleotídeos, cerca de 20 até cerca de 30 nucleotídeos, cerca de 20 até cerca de 35 nucleotídeos, cerca de 20 até cerca de 40 nucleotídeos, cerca de 20 até cerca de 45 nucleotídeos, cerca de 20 até cerca de 50 nucleotídeos, cerca de 20 até cerca de 55 nucleotídeos, cerca de 20 até cerca de 55 nucleotídeos, cerca de 20 até cerca de 60 nucleotídeos, cerca de 20 até cerca de 65 nucleotídeos, cerca de 25 até cerca de 30 nucleotídeos, cerca de 25 até cerca de 35 nucleotídeos, cerca de 25 até cerca de 40 nucleotídeos, cerca de 25 até cerca de 45 nucleotídeos, cerca de 25 até cerca de 50 nucleotídeos, cerca de 25 até cerca de 55 nucleotídeos, cerca de 25 até cerca de 60 nucleotídeos, cerca de 25 até cerca de 65 nucleotídeos, cerca de 25 nucleotídeos até cerca de 70 nucleotídeos, cerca de 30 até cerca de 35 nucleotídeos, cerca de 30 até cerca de 40 nucleotídeos, cerca de 30 até cerca de 45 nucleotídeos, cerca de 30 até cerca de 55 nucleotídeos, cerca de 30 até cerca de 55 nucleotídeos, cerca de 30
Petição 870190074939, de 05/08/2019, pág. 31/178
16/117 até cerca de 60 nucleotídeos, cerca de 30 até cerca de 65 nucleotídeos, cerca de 30 nucleotídeos até cerca de 70 nucleotídeos, cerca de 35 até cerca de 40 nucleotídeos, cerca de 35 até cerca de 45 nucleotídeos, cerca de 35 até cerca de 50 nucleotídeos, cerca de 35 até cerca de 55 nucleotídeos, cerca de 35 até cerca de 60 nucleotídeos, cerca de 35 até cerca de 65 nucleotídeos, cerca de 35 até cerca de 70 nucleotídeos, cerca de 40 até cerca de 45 nucleotídeos, cerca de 40 até cerca de 50 nucleotídeos, cerca de 40 até cerca de 55 nucleotídeos, cerca de 40 até cerca de 60 nucleotídeos, cerca de 40 até cerca de 65 nucleotídeos, cerca de 40 até cerca de 70 nucleotídeos, cerca de 45 até cerca de 50 nucleotídeos, cerca de 45 até cerca de 55 nucleotídeos, cerca de 45 nucleotídeos até cerca de 60 nucleotídeos, cerca de 45 até cerca de 65 nucleotídeos, cerca de 45 até cerca de 70 nucleotídeos, cerca de 50 até cerca de 55 nucleotídeos, cerca de 50 até cerca de 60 nucleotídeos, cerca de 50 até cerca de 65 nucleotídeos, cerca de 50 até cerca de 70 nucleotídeos, cerca de 55 até cerca de 60 nucleotídeos, cerca de 55 até cerca de 65 nucleotídeos, cerca de 55 até cerca de 70 nucleotídeos, cerca de 60 até cerca de 65 nucleotídeos, cerca de 60 até cerca de 70 nucleotídeos, cerca de 65 até cerca de 70 nucleotídeos, e semelhantes. Assim, em modalidades de realização adicionais, as sequências individuais de mRNA de uma matriz compreendem um códon iniciador e um comprimento de cerca de 20 nucleotídeos, cerca de 21 nucleotídeos, cerca de 22 nucleotídeos, cerca de 23 nucleotídeos, cerca de 24 nucleotídeos, cerca de 25 nucleotídeos, cerca de 26 nucleotídeos, cerca de 27 nucleotídeos, cerca de 28 nucleotídeos, cerca de 29 nucleotídeos, cerca de 30 nucleotídeos, cerca de 31 nucleotídeos, cerca de 32 nucleotídeos, cerca de 33 nucleotídeos, cerca de 34 nucleotídeos, cerca de 35 nucleotídeos, cerca de 36 nucleotídeos, cerca de 37 nucleotídeos, cerca de 38 nucleotídeos, cerca de 39 nucleotídeos, cerca de 40 nucleotídeos, cerca de 41 nucleotídeos, cerca de 42 nucleotídeos, cerca de 43 nucleotídeos, cerca de 44 nucleotídeos, cerca de 45 nucleotídeos, cerca de 46 nucleotídeos, cerca de 47 nucleotídeos, cerca de 48 nucleotídeos, cerca de 49 nucleotídeos, cerca de 50 nucleotídeos, cerca de 51 nucleotídeos, cerca de 52 nucleotídeos, cerca de 53 Nucleotídeos, cerca
Petição 870190074939, de 05/08/2019, pág. 32/178
17/117 de 54 nucleotídeos, cerca de 55 nucleotídeos, cerca de 56 nucleotídeos, cerca de 57 nucleotídeos, cerca de 58 nucleotídeos, cerca de 59 nucleotídeos, cerca de 60 nucleotídeos, cerca de 61 nucleotídeos, cerca de 62 nucleotídeos, cerca de 63 nucleotídeos, cerca de 64 nucleotídeos, cerca de 65 nucleotídeos, cerca de 66 nucleotídeos, cerca de 67 nucleotídeos, cerca de 68 nucleotídeos, cerca de 69 nucleotídeos, ou cerca de 70 nucleotídeos. Em modalidades de realização particulares da invenção, as sequências individuais de mRNA de uma matriz compreendem um códon iniciador e cerca de 40 nucleotídeos.
Em modalidades de realização adicionais da presente invenção, as sequências individuais de mRNA da matriz compreendem nucleotídeos nas posições -20 até 50 em relação ao códon iniciador (i.e., o A do códon iniciador ATG (AUG) é zero). Em algumas modalidades de realização particulares da invenção, as extremidades 5' termina das as sequências individuais de mRNA compreendem nucleotídeos nas posições -4 até 35 em relação ao códon iniciador. Em modalidades de realização adicionais da invenção, as extremidades 5' das sequências individuais de mRNA compreendem nucleotídeos nas posições -4 até 37 em relação ao códon iniciador.
Em outras modalidades de realização, as sequências individuais de mRNA compreendem nucleotídeos nas posições -15 até 50 em relação ao códon iniciador, nas posições -10 até 50 em relação ao códon iniciador, nas posições -5 até 50 em relação ao códon iniciador, nas posições -20 até 45 em relação ao códon iniciador, nas posições -15 até 45 em relação ao códon iniciador, nas posições -10 em 45 em relação ao códon iniciador, nas posições -5 até 45 em relação ao códon iniciador, nas posições -20 até 40 em relação ao códon iniciador, nas posições -15 até 40 em relação ao códon iniciador, nas posições -10 até 40 em relação ao códon iniciador, nas posições -5 até 40 em relação ao códon iniciador, nas posições -20 até 35 em relação ao códon iniciador, nas posições -15 até 35 em relação ao códon iniciador, nas posições -10 até 35 em relação ao códon iniciador, nas posições -5 até 35 em relação ao códon iniciador, nas posições -20 até 30 em relação ao códon iniciador, nas posições -15 até 30 em relação ao códon iniciador,
Petição 870190074939, de 05/08/2019, pág. 33/178
18/117 nas posições -10 até 30 em relação ao códon iniciador, nas posições -5 até 30 em relação ao códon iniciador, nas posições -20 até 25 em relação ao códon iniciador, nas posições -15 até 25 em relação ao códon iniciador, nas posições -10 até 25 em relação ao códon iniciador, nas posições -5 até 25 em relação ao códon iniciador, nas posições -20 até 20 em relação ao códon iniciador, nas posições -15 até 20 em relação ao códon iniciador, nas posições -10 até 20 em relação ao códon iniciador, nas posições -5 até 20 em relação ao códon iniciador, nas posições -20 até 15 em relação ao códon iniciador, nas posições -15 até 15 em relação ao códon iniciador, nas posições -10 até 15 em relação ao códon iniciador, nas posições -5 até 15 em relação ao códon iniciador, nas posições -20 até 10 em relação ao códon iniciador, nas posições -15 até 10 em relação ao códon iniciador, nas posições -10 até 10 em relação ao códon iniciador e semelhantes. Assim, em algumas modalidades de realização particulares, as sequências individuais de mRNA de uma matriz compreendem um códon iniciador e cerca de 40 nucleotídeos com a extremidade 5' das sequências individuais de mRNA compreendendo nucleotídeos nas posições -4 até 35 em relação ao códon iniciador.
Em algumas modalidades de realização da presente invenção, uma matriz é produzida compreendendo todos os mRNAs possíveis que codificam para o polipeptídeo de interesse. Em outras modalidades de realização da invenção, uma matriz é produzida de forma a ser uma matriz representativa. Assim, tal como é aqui utilizado, uma matriz representativa significa uma matriz na qual nem todos os mRNAs que possivelmente podem codificar para um polipeptídeo de interesse são produzidos e avaliados para os parâmetros descritos aqui mas, sim uma subpopulação ou subgrupo que é representativo da distribuição dos mRNAs que poderiam codificar para o polipeptídeo de interesse, é produzida e avaliada. Uma matriz representativa pode ser produzida utilizando protocolos tendenciosos ou imparciais tal como conhecido na arte. Um exemplo não-limitante de um método imparcial de geração de uma matriz representativa começa com uma sequência de aminoácidos de entrada. Um processo aleatório automatizado de amostragem é utilizado para gerar sequências nucleotídicas que codificam para a sequênPetição 870190074939, de 05/08/2019, pág. 34/178
19/117 cia de aminoácidos de entrada (por exemplo, BioPerl). (Stajich et al. Genome Res 12(10):1611-8 (2002)). Para cada posição da sequência de aminoácidos, os códons para essa posição são selecionados por amostragem dos códons possíveis a partir de uma distribuição uniforme. Assim, em algumas modalidades de realização, dez mil sequências nucleotídicas são produzidas desta forma para cada sequência de aminoácidos de entrada. Em outras modalidades de realização, um número maior ou menor de sequências nucleotídicas são produzidas. O número de sequências produzidas dependerá de um número de fatores, incluindo o comprimento da sequência de aminoácidos de entrada.
De um modo concordante, em algumas modalidades de realização particulares da invenção, uma matriz compreende cerca de 103 a cerca de 108 sequências individuais de mRNA. Em outras modalidades de realização, uma matriz da invenção compreende cerca de 103, cerca de 2χ103, cerca de 4χ103, cerca de 6χ103, cerca de 8χ103, cerca de 104, cerca de 2χ104, cerca de 4χ104, cerca de 6χ104, cerca de 8χ104, cerca de 105, cerca de 2χ105, cerca de 4χ105, cerca de 6χ105, cerca de 8χ105, cerca de 106, cerca de 2χ106, cerca de 4χ106, cerca de 6χ106, cerca de 8χ106, cerca de 107, cerca de 2χ107, cerca de 4χ107, cerca de 6χ107, cerca de 8χ107, ou cerca de 108 sequências individuais de mRNA.
Como descrito acima, a presente invenção fornece métodos para a seleção de um mRNA contendo um nível desejado de produção de um polipeptídeo de interesse. Assim, em algumas modalidades de realização, a presente invenção fornece um método de seleção de um mRNA para produção de um polipeptídeo de interesse, em que a produção do polipeptídeo de interesse é melhorada. Em outras modalidades de realização, é fornecido um método para seleção de um mRNA para produção de um polipeptídeo de interesse, em que a produção do polipeptídeo de interesse é reduzida. Um mRNA selecionado como aqui descrito pode ter produção de proteínas ligeiramente melhorada, moderadamente melhorada ou grandemente melhorada.
Em outras modalidades de realização da invenção, um mRNA
Petição 870190074939, de 05/08/2019, pág. 35/178
20/117 pode ser selecionado contendo um nível desejado de produção da proteínas que é ligeiramente reduzido, moderadamente reduzid ou grandemente reduzido. Em algumas modalidades de realização, o nível de produção de proteínas de um mRNA selecionado é melhorado ou reduzido em comparação com a produção do mesmo polipeptídeo de interesse pelo mRNA do tipo selvagem. Em algumas modalidades de realização, é selecionada uma sequência de mRNA que produz a mesma quantidade de proteína, em relação à produção do mesmo polipeptídeo de interesse pelo mRNA do tipo selvagem (0% melhorada ou reduzida).
Tal como aqui utilizado, o termo ligeiramente melhorado ou ligeiramente reduzido pode significar uma alteração na produção de um polipeptídeo de interesse de cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, e semelhantes, em comparação com um mRNA nativo ou outro mRNA selecionado. O termo moderadamente melhorado ou moderadamente reduzido pode significar uma alteração na produção de um polipeptídeo de interesse de cerca de 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, e semelhantes, em comparação com um mRNA nativo ou outro mRNA selecionado. O termo grandemente melhorado ou grandemente reduzido pode significar uma alteração na produção de um polipeptídeo de interesse de cerca de 45% a cerca de 100% (por exemplo, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100%, etc.) em comparação com um mRNA nativo ou outro mRNA selecionado.
Em outras modalidades de realização, a presente invenção fornece um método de seleção de um primeiro mRNA (mRNA selecionado) para a produção de um polipeptídeo de interesse, em que a produção do polipeptídeo de interesse pelo primeiro mRNA se encontra aumentada ou reduzida em comparação com a produção do polipeptídeo por um segundo mRNA que codifica para o mesmo polipeptídeo de interesse tal como codificado pelo primeiro mRNA.
Petição 870190074939, de 05/08/2019, pág. 36/178
21/117
Assim, a presente invenção fornece métodos para a seleção de um mRNA com base na sua classificação no âmbito da distribuição de valores para cada parâmetro determinado para as sequências individuais de mRNA na matriz. Assim, por exemplo, os mRNAs de uma matriz são classificados do valor mais alto para o mais baixo, para cada parâmetro determinado (i.e., MFE da estrutura secundária do RNA, EFE, FMFE da estrutura secundária do RNA, ED e/ou BPP); assim, proporcionando uma distribuição dos mRNAs que codificam para um único polipeptídeo de interesse mas tendo diferentes valores para o parâmetro determinado (i.e, MFE da estrutura secundária do RNA, EFE, FMFE da estrutura secundária do RNA, ED, e/ou BPP). A distribuição pode ser descrita como variando entre o valor mais elevado a 100% até ao valor mais baixo, inferior a 1% (por exemplo, 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, etc.). Um mRNA pode ser selecionado de qualquer ponto ao longo da distribuição desde menos de 1% (por exemplo, 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, etc.) a 100%. Assim, selecionando um mRNA como aqui descrito, pode ser alcançado um nível desejado de produção de proteínas.
De um modo concordante, em algumas modalidades de realização da presente invenção, um mRNA pode ser selecionado de entre os mRNAs de uma dada matriz contendo um valor da MFE da estrutura secundária do RNA entre cerca de 95% a 100% do valor mais elevado da MFE determinado para essa matriz de sequências. Em outras modalidades de realização, um mRNA pode ser selecionado entre as sequências de mRNA contendo um valor da MFE em uma gama entre cerca de 90%-100%, 85%100%, 90%-95%, 85%-95%, 80%-95%, 85%-90%, 80%-90%, 75%-90%,
80%-85%, 75%-85%, 70%-85%, 75%-80%, 70%-80%, 65%-80%, 70%-75%,
65%-75%, 60%-75%, 65%-70%, 60%-70%, 55%-70%, 60%-65%, 55%-65%,
50%-65%, 55%-60%, 50%-60%, 45%-60%, 50%-55%, 45%-55%, 40%-55%,
45%-50%, 40%-50%, 35%-50%, 40%-45%, 35%-45%, 30%-45%, 35%-40%,
30%-40%, 25%-40%, 30%-35%, 25%-35%, 20%-35%, 25%-30%, 20%-30%,
15%-30%, 20%-25%, 15%-25%, 10%-25%, 15%-20%, 10%-20%, 5%-20%, 10%-15%, 5%-15%, 0%-15%, 5%-10%, 0%-5%, e similares, do valor mais
Petição 870190074939, de 05/08/2019, pág. 37/178
22/117 alto da MFE determinado para essa matriz de sequências de mRNA. Assim, em algumas modalidades de realização, um mRNA pode ser selecionado de entre as sequências de mRNA contendo um valor da MFE de cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%,
31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%,
44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%,
57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%,
70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%,
83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%,
96%, 97%, 98%, 99%, 100% do valor mais elevado da MFE determinado para essa matriz de sequências.
Em outras modalidades de realização, o valor da MFE da estrutura secundária de RNA (MFE) versus o nível de produção de proteínas para os mRNAs no âmbito da matriz não forma um padrão linear mas em vez disso constitui um padrão passo-a-passo com os mRNAs a cair em grupos nos quais o nível de expressão ou produção de proteínas é o mesmo para os mRNAs de cada grupo, embora contendo valores diferentes de MFE. Especificamente, em um padrão passo-a-passo, quando outros fatores afetando a expressão de proteínas se mantém constante, os mRNAs com valores de MFE a cair dentro de uma gama específica podem ter o mesmo nível de expressão de proteínas. Assim, o agrupamento dos mRNAs em algumas modalidades de realização é baseado na MFE calculada.
Um padrão passo-a-passo do nível de expressão pode ocorrer porque a energia necessária para abrir uma determinada estrutura de mRNA para a tradução pode ser a mesma para os mRNAs tendo diferentes valores de MFE. Assim, por exemplo, o ÁG° para a hidrólise de um único GTP a GDP a 25°C é -6,95 kcal/mol (a 37°C o ÁG° é -7,14). De um modo concordante,em alguns casos, certos mRNAs tendo diferentes valores de MFE podem, cada um, requerer a energia de um único GTP (um pacote único de energia) a fim de abrir a sua estrutura para a tradução. Assim, o nível de
Petição 870190074939, de 05/08/2019, pág. 38/178
23/117 expressão ou produção de proteínas a partir daqueles mRNAs que requerem um único pacote da energia (por exemplo, ATP, GTP e semelhantes) pode ser o mesmo ou semelhante apesar dos diferentes valores da MFE e, portanto, níveis semelhantes de produção de proteínas podem ser conseguidos, selecionando qualquer mRNA de entre uma gama particular de valores MFE. Como um exemplo, um mRNA contendo um valor de MFE de -3 kcal/mol e outro mRNA tendo um valor de MFE de -6 kcal/mol, ambos podem requerer um ou menos de um pacote de energia, a fim de abrir a sua estrutura para a tradução. Consequentemente, a eficiência de produção de proteína para estes dois mRNAs é igual e, por isso, qualquer um pode ser selecionado sem consequências para o nível de produção de proteínas.
As fronteiras entre as gamas são determinadas pelo número de pacotes de energia (por exemplo, GTP, ATP e semelhantes) hidrolisados e pela energia correspondente liberada. Assim, por exemplo, a primeira gama pode corresponder a zero hidrólise do GTP, a segunda gama a 1 hidrólise do GTP, e assim por diante. As fronteiras podem ser variáveis até certo grau e há alguma sobreposição entre as gamas vizinhas porque (1) a energia liberada pela hidrólise varia com a temperatura e com o ambiente aquático e iônico in vivo e (2) o cálculo da MFE para os mRNAs pode ser aproximado. Geralmente, as fronteiras são calculadas por experimentação e os mRNAs próximos das fronteiras são evitados. Tal como aqui descrito, a equação para o cálculo da MFE é conhecido na arte (i.e., eA(-E/kT))/Z, onde E é a energia livre mínima da estrutura, k é a constante de Boltzmann, T é a temperatura e Z é a função de partição (Wuchty et al., Biopolymers 49:145-165 (1999)).
De um modo concordante, em algumas modalidades de realização, um mRNA pode ser selecionado de entre um grupo de mRNAs em uma dada matriz tendo um valor da MFE da estrutura secundária do RNA em uma faixa de cerca de 0 kcal/mol a cerca de -2 kcal/mol, em um intervalo de cerca de -2 kcal/mol a cerca de -9 kcal/mol, ou em um intervalo de cerca de 9 kcal/mol a cerca de -18 kcal/mol. A escolha de qual o grupo a selecionar dependerá do nível de produção da proteína desejada. Assim, em algumas
Petição 870190074939, de 05/08/2019, pág. 39/178
24/117 modalidades de realização, quando a produção otimizada de proteínas é desejada, o mRNA pode ser selecionado a partir de um grupo de mRNAs tendo um valor de MFE da estrutura secundária do RNA em uma gama de cerca de 0 kcal/mol a cerca de -2 kcal/mol. Portanto, um mRNA pode ser selecionado desde que tenha um valor de MFE de cerca de 0 kcal/mol, -0,1 kcal/mol, -0,2 kcal/mol, -0,3 kcal/mol, -0,4 kcal/mol, -0,5 kcal/mol, -0,6 kcal/mol, -0,7 kcal/mol, -0,9 kcal/mol, -1 kcal/mol, -1,1 kcal/mol, -1,2 kcal/mol, -1,3 kcal/mol, -1,4 kcal/mol, -1,5 kcal/mol, -1,6 kcal/mol, -1,7 kcal/mol, -1,8 kcal/mol, -1,9 kcal/mol, -2 kcal/mol, e semelhantes.
Em outras modalidades de realização, quando a produção reduzida de proteínas é desejada, o mRNA pode ser selecionado a partir de um grupo de mRNAs tendo um valor de MFE da estrutura secundária do RNA em uma gama de cerca de -9 kcal/mol a cerca de -18 kcal/mol. Em algumas modalidades de realização, quando a produção reduzida de proteínas é desejada, o mRNA pode ser selecionado a partir de um grupo de mRNAs tendo um valor de MFE da estrutura secundária do RNA em uma gama de cerca de -9 kcal/mol a cerca de -23 kcal/mol. Em outras modalidades de realização, quando a produção reduzida de proteínas é desejada, o mRNA pode ser selecionado a partir de um grupo de mRNAs tendo um valor de MFE da estrutura secundária do RNA em uma gama de cerca de -9 kcal/mol a cerca de -30 kcal/mol. Assim, em algumas modalidades de realização, quando a produção reduzida de proteínas é desejada, um mRNA pode ser selecionado desde que tenha um valor de MFE de cerca de -9 kcal/mol,
-9,1 kcal/mol, -9,2 kcal/mol, -9,3 kcal/mol, -9,4 kcal/mol, -9,5 kcal/mol, - 9,6 kcal/mol, -9,7 kcal/mol, -9,9 kcal/mol, -10 kcal/mol,-10,1 kcal/mol, -10,2 kcal/mol, -10,3 kcal/mol, -10,4 kcal/mol, -10,5 kcal/mol,-10,6 kcal/mol, -10,7 kcal/mol, -10,8 kcal/mol, -10,9 kcal/mol, -11 kcal/mol,-11,1 kcal/mol, -11,2 kcal/mol, -11,3 kcal/mol, -11.4 kcal/mol, -11,5 kcal/mol,-11,6 kcal/mol, -11,7 kcal/mol, -11,8 kcal/mol, -11,9 kcal/mol, -12 kcal/mol,-12,1 kcal/mol, -12,2 kcal/mol, -12,3 kcal/mol, -12,4 kcal/mol, -12,5 kcal/mol,-12,6 kcal/mol, -12,7 kcal/mol, -12,8 kcal/mol, -12,9 kcal/mol, -13 kcal/mol,-13,1 kcal/mol, -13,2 kcal/mol, -13,3 kcal/mol,
Petição 870190074939, de 05/08/2019, pág. 40/178
25/117
-13,4 kcal/mol, -13,5 kcal/mol, -13,6 kcal/mol, -13,7 kcal/mol, -
13.8 kcal/mol, -13,9 kcal/mol, -14 kcal/mol, -14,1 kcal/mol, -14,2 kcal/mol,-
14.3 kcal/mol, -14,4 kcal/mol, -14,5 kcal/mol, -14,6 kcal/mol, -14,7 kcal/mol, -
14.8 kcal/mol, -14,9 kcal/mol, -15 kcal/mol, -15,1 kcal/mol, -15,2 kcal/mol,-
15.3 kcal/mol, -15,4 kcal/mol, -15,5 kcal/mol, -15,6 kcal/mol, -15,7 kcal/mol, -
15.8 kcal/mol, -15,9 kcal/mol, -16 kcal/mol, -16,1 kcal/mol, -16,2 kcal/mol,-
16.3 kcal/mol, -16,4 kcal/mol, -16,5 kcal/mol, -16,6 kcal/mol, -16,7 kcal/mol, -
16.8 kcal/mol, -16,9 kcal/mol, -17 kcal/mol, -17,1 kcal/mol, -17,2 kcal/mol,-
17.3 kcal/mol, -17,4 kcal/mol, -17,5 kcal/mol,
-17,6 kcal/mol, -17,7 kcal/mol, -17,8 kcal/mol, -17,9 kcal/mol, -18 kcal/mol, -18,1 kcal/mol, -18,2 kcal/mol, -18,3 kcal/mol, -18,4 kcal/mol, -18,5 kcal/mol, -18,6 kcal/mol, -18,7 kcal/mol, -18,8 kcal/mol, -18,9 kcal/mol, -19 kcal/mol, -19,5 kcal/mol, -20 kcal/mol, -20,5 kcal/mol, -21 kcal/mol, -21,5 kcal/mol, -22 kcal/mol, -22,5 kcal/mol, -23 kcal/mol, -23,5 kcal/mol, -24 kcal/mol, -24,5 kcal/mol, -25 kcal/mol, -25,5 kcal/mol, -26 kcal/mol, -26,5 kcal/mol, -27 kcal/mol, -27,5 kcal/mol, -28,5 kcal/mol, -29 kcal/mol, -29,5 kcal/mol, -30 kcal/mol, e semelhantes.
Ainda, em outras modalidades de realização, dependendo do nível de expressão desejado, o mRNA pode ser selecionado a partir de um grupo de mRNAs tendo um valor de MFE da estrutura secundária do RNA em uma gama de cerca de -2 kcal/mol a cerca de -9 kcal/mol. Assim, um mRNA pode ser selecionado desde que tenha um valor de MFE de cerca de -2 kcal/mol, -2,1 kcal/mol, -2,2 kcal/mol, -2,3 kcal/mol, -2,4 kcal/mol,
-2,5 kcal/mol, -2,6 kcal/mol, -2,7 kcal/mol, -2,9 kcal/mol, -3 kcal/mol, -3,1 kcal/mol, -3,2 kcal/mol, -3,3 kcal/mol, -3,4 kcal/mol, -3,5 kcal/mol, -3,6 kcal/mol, -3,7 kcal/mol, -3,8 kcal/mol, -3,9 kcal/mol, -4 kcal/mol, -4,1 kcal/mol, -4,2 kcal/mol, -4,3 kcal/mol, -4,4 kcal/mol, -4,5 kcal/mol, -4,6 kcal/mol, -4,7 kcal/mol, -4,8 kcal/mol, -4,9 kcal/mol -5 kcal/mol, -5,1 kcal/mol, -5,2 kcal/mol, -5,3 kcal/mol, -5,4 kcal/mol, -5,5 kcal/mol, -5,6 kcal/mol, -5.7 kcal/mol, -5,8 kcal/mol, -5,9 kcal/mol, -6 kcal/mol, -6,1 kcal/mol, -6,2 kcal/mol,
-6,3 kcal/mol, -6,4 kcal/mol, -6,5 kcal/mol, -6,6 kcal/mol, -6,7 kcal/mol, -6,8 kcal/mol, -6,9 kcal/mol, -7 kcal/mol, -7,1 kcal/mol, -7,2 kcal/mol, -7,3 kcal/mol,
Petição 870190074939, de 05/08/2019, pág. 41/178
26/117
-7,4 kcal/mol, -7,5 kcal/mol, -7,6 kcal/mol, -7.7 kcal/mol, -7,8 kcal/mol, -7,9 kcal/mol, -8 kcal/mol, -8,1 kcal/mol, -8,2 kcal/mol, -8,3 kcal/mol, -8,4 kcal/mol, -8,5 kcal/mol, -8,6 kcal/mol, -8,7 kcal/mol, -8,8 kcal/mol, -8,9 kcal/mol, -9 kcal/mol, e similares.
Portanto, em algumas modalidades de realização da presente invenção, é fornecido um método de seleção de um mRNA para a produção de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz sequências individuais de mRNA compreendendo diferentes sequências nucleotídicas que codificam para o polipeptídeo de interesse; b) determinação da energia livre mínima (MFE) da estrutura secundária do RNA para cada sequência individual de mRNA de (a); c) classificação das sequências individuais de mRNA da matriz de acordo com a MFE da estrutura secundária do RNA determinada em (b) da MFE mais alta da estrutura secundária do RNA até à menor MFE da estrutura secundária do RNA; e
d) seleção de uma sequência de mRNA a partir da matriz classificada do passo (c), em que o mRNA é selecionado a partir do grupo de mRNAs tendo uma MFE da estrutura secundária do RNA em uma gama de cerca de 0 kcal/mol de aproximadamente -2 kcal/mol, o grupo dos mRNAs tendo uma MFE da estrutura secundária do RNA em uma gama de cerca de -2 kcal/mol a cerca de -9 kcal/mol, ou o grupo de mRNAs tendo uma MFE da estrutura secundária do RNA em uma gama de cerca de -9 kcal/mol a cerca de -18 kcal/mol, em que o mRNA selecionado produz o polipeptídeo de interesse.
Em outras modalidades de realização, a presente invenção fornece um método de seleção de um mRNA para produção melhorada de um polipeptídeo de interesse, o método compreendendo:
a) produção de uma matriz de sequências individuais de mRNA compreendendo diferentes sequências nucleotídicas que codificam para o polipeptídeo de interesse; b) determinação da energia livre mínima (MFE) da estrutura secundária do RNA para cada sequência individual de mRNA de (a); e c) seleção de uma sequência de mRNA de (a) contendo uma MFE da estrutura secundária do RNA na gama de cerca de 0 kcal/mol a cerca de -2
Petição 870190074939, de 05/08/2019, pág. 42/178
27/117 kcal/mol, em que a expressão da sequência de mRNA selecionada resulta em uma produção aumentada do polipeptídeo de interesse em relação à sequência de mRNA do tipo selvagem.
Em modalidades de realização adicionais, é fornecido um método de seleção de um mRNA para a produção reduzida de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências individuais de mRNA compreendendo diferentes sequências nucleotídicas que codificam para o polipeptídeo de interesse; b) determinação da energia livre mínima (MFE) da estrutura secundária do RNA para cada sequência individual de mRNA de (a) e o nível de expressão de cada sequência individual de mRNA de (a); c) seleção de uma sequência de mRNA de (a) contendo uma MFE da estrutura secundária do RNA na gama de cerca de -9 kcal/mol a cerca de -18 kcal/mol, em que a expressão da sequência de mRNA selecionada resulta em uma produção aumentada do polipeptídeo de interesse em relação à sequência de mRNA do tipo selvagem.
Em outras modalidades de realização, um mRNA pode ser selecionado de entre os mRNAs de uma dada matriz contendo um valor da EFE entre cerca de 95% a 100% do valor mais elevado da EFE determinado para essa matriz de sequências. Em outras modalidades de realização, um mRNA pode ser selecionado entre as sequências de mRNA contendo um valor da EFE em uma gama entre cerca de 90%-100%, 85%-100%, 90%95%, 85%-95%, 80%-95%, 85%-90%, 80%-90%, 75%-90%, 80%-85%, 75%85%, 70%-85%, 75%-80%, 70%-80%, 65%-80%, 70%-75%, 65%-75%, 60%75%, 65%-70%, 60%-70%, 55%-70%, 60%-65%, 55%-65%, 50%-65%, 55%60%, 50%-60%, 45%-60%, 50%-55%, 45%-55%, 40%-55%, 45%-50%, 40%50%, 35%-50%, 40%-45%, 35%-45%, 30%-45%, 35%-40%, 30%-40%, 25%40%, 30%-35%, 25%-35%, 20%-35%, 25%-30%, 20%-30%, 15%-30%, 20%25%, 15%-25%, 10%-25%, 15%-20%, 10%-20%, 5%-20%, 10%-15%, 5%15%, 0%-15%, 5%-10%, 0%-5%, e similares, do valor mais alto da EFE determinado para essa matriz de sequências de mRNA. Assim, em algumas modalidades de realização, um mRNA pode ser selecionado de entre as sequências de mRNA contendo um valor da EFE de cerca de 0,0001%,
Petição 870190074939, de 05/08/2019, pág. 43/178
28/117
0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%,
32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%,
45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%,
58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%,
71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%,
84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%,
97%, 98%, 99%, 100% do valor mais elevado da EFE determinado para essa matriz de sequências.
Ainda, em outras modalidades de realização, um mRNA pode ser selecionado de entre as sequências de mRNA de uma dada matriz contendo um valor da FMFE da estrutura de RNA secundária entre cerca de 95% a 100% do valor mais elevado da FMFE determinado para essa matriz de sequências. Em outras modalidades de realização, um mRNA pode ser selecionado entre os mRNAs contendo um valor da FMFE em uma gama entre cerca de 90%-100%, 85%-100%, 90%-95%, 85%-95%, 80%-95%,
85%-90%, 80%-90%, 75%-90%, 80%-85%, 75%-85%, 70%-85%, 75%-80%,
70%-80%, 65%-80%, 70%-75%, 65%-75%, 60%-75%, 65%-70%, 60%-70%,
55%-70%, 60%-65%, 55%-65%, 50%-65%, 55%-60%, 50%-60%, 45%-60%,
50%-55%, 45%-55%, 40%-55%, 45%-50%, 40%-50%, 35%-50%, 40%-45%,
35%-45%, 30%-45%, 35%-40%, 30%-40%, 25%-40%, 30%-35%, 25%-35%,
20%-35%, 25%-30%, 20%-30%, 15%-30%, 20%-25%, 15%-25%, 10%-25%,
15%-20%, 10%-20%, 5%-20%, 10%-15%, 5%-15%, 0%-15%, 5%-10%, 0%5%, e similares, do valor mais alto da FMFE determinado para essa matriz de sequências. Assim, em modalidades de realização adicionais, um mRNA pode ser selecionado de entre as sequências de mRNA contendo um valor da FMFE de cerca de 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%,
25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%,
38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%,
51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%,
Petição 870190074939, de 05/08/2019, pág. 44/178
29/117
64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100% do valor mais elevado da FMFE determinado para essa matriz de sequências.
Em modalidades de realização adicionais, um mRNA pode ser selecionado de entre as sequências de mRNA de uma dada matriz contendo um valor da MFE da estrutura de RNA secundária entre cerca de 95% a 100% do valor mais elevado da MFE determinado para essa matriz de sequências. Em outras modalidades de realização, um mRNA pode ser selecionado entre os mRNAs contendo um valor da MFE em uma gama entre cerca de 90%-100%, 85%-100%, 90%-95%, 85%-95%, 80%-95%, 85%-90%, 80%-90%, 75%-90%, 80%-85%, 75%-85%, 70%-85%, 75%-80%, 70%-80%,
65%-80%, 70%-75%, 65%-75%, 60%-75%, 65%-70%, 60%-70%, 55%-70%,
60%-65%, 55%-65%, 50%-65%, 55%-60%, 50%-60%, 45%-60%, 50%-55%,
45%-55%, 40%-55%, 45%-50%, 40%-50%, 35%-50%, 40%-45%, 35%-45%,
30%-45%, 35%-40%, 30%-40%, 25%-40%, 30%-35%, 25%-35%, 20%-35%,
25%-30%, 20%-30%, 15%-30%, 20%-25%, 15%-25%, 10%-25%, 15%-20%,
10%-20%, 5%-20%, 10%-15%, 5%-15%, 0%-15%, 5%-10%, 0%-5%, e similares, do valor mais alto da MFE determinado para essa matriz de sequências. Assim, em algumas modalidades de realização adicionais, um mRNA pode ser selecionado de entre as sequências de mRNA contendo um valor da MFE de cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%,
27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%,
40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%,
53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%,
66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%,
79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%,
92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100% do valor mais elevado da MFE determinado para essa matriz de sequências.
Ainda, em modalidades de realização adicionais, um mRNA poPetição 870190074939, de 05/08/2019, pág. 45/178
30/117 de ser selecionado de entre os mRNAs de uma dada matriz contendo um valor da ED entre cerca de 95% a 100% do valor mais elevado da ED determinado para essa matriz de sequências. Em outras modalidades de realização, um mRNA pode ser selecionado entre as sequências de mRNA contendo um valor da ED em uma gama entre cerca de 90%-100%, 85%-100%, 90%-95%, 85%-95%, 80%-95%, 85%-90%, 80%-90%, 75%-90%, 80%-85%,
75%-85%, 70%-85%, 75%-80%, 70%-80%, 65%-80%, 70%-75%, 65%-75%,
60%-75%, 65%-70%, 60%-70%, 55%-70%, 60%-65%, 55%-65%, 50%-65%,
55%-60%, 50%-60%, 45%-60%, 50%-55%, 45%-55%, 40%-55%, 45%-50%,
40%-50%, 35%-50%, 40%-45%, 35%-45%, 30%-45%, 35%-40%, 30%-40%,
25%-40%, 30%-35%, 25%-35%, 20%-35%, 25%-30%, 20%-30%, 15%-30%,
20%-25%, 15%-25%, 10%-25%, 15%-20%, 10%-20%, 5%-20%, 10%-15%, 5%-15%, 0%-15%, 5%-10%, 0%-5%, e similares, do valor mais alto da ED determinado para essa matriz de sequências de mRNA. Assim, em algumas modalidades de realização adicionais, um mRNA pode ser selecionado de entre as sequências de mRNA contendo um valor da ED de cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%,
31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%,
44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%,
57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%,
70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%,
83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%,
96%, 97%, 98%, 99%, 100% do valor mais elevado da ED determinado para essa matriz de sequências.
Em aspectos adicionais da invenção, um mRNA pode ser selecionado de entre as sequências de mRNA de uma dada matriz contendo um valor da BPP entre cerca de 95% a 100% do valor mais elevado da BPP determinado para essa matriz de sequências. Em outras modalidades de realização, um mRNA pode ser selecionado entre as sequências de mRNA contendo um valor da BPP em uma gama entre cerca de 90%-100%, 85%Petição 870190074939, de 05/08/2019, pág. 46/178
31/117
100%, 90%-95%, 85%-95%, 80%-95%, 85%-90%, 80%-90%, 75%-90%,
80%-85%, 75%-85%, 70%-85%, 75%-80%, 70%-80%, 65%-80%, 70%-75%,
65%-75%, 60%-75%, 65%-70%, 60%-70%, 55%-70%, 60%-65%, 55%-65%,
50%-65%, 55%-60%, 50%-60%, 45%-60%, 50%-55%, 45%-55%, 40%-55%,
45%-50%, 40%-50%, 35%-50%, 40%-45%, 35%-45%, 30%-45%, 35%-40%,
30%-40%, 25%-40%, 30%-35%, 25%-35%, 20%-35%, 25%-30%, 20%-30%,
15%-30%, 20%-25%, 15%-25%, 10%-25%, 15%-20%, 10%-20%, 5%-20%, 10%-15%, 5%-15%, 0%-15%, 5%-10%, 0%-5%, e similares, do valor mais alto da BPP determinado para essa matriz de sequências. Assim, em modalidades de realização adicionais, um mRNA pode ser selecionado de entre os mRNAs contendo um valor da BPP de cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%,
34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%,
47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%,
60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%,
73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%,
86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%,
99%, 100% do valor mais elevado da BPP determinado para essa matriz de sequências.
Em aspectos adicionais da invenção, quando selecionado um mRNA para uma produção melhorada de um polipeptídeo de interesse como aqui descrito e a MFE da estrutura secundária do RNA, EFE, e/ou ED é um parâmetro(s) determinado para cada sequência individual de mRNA de uma matriz que é utilizada na classificação das sequências individuais de mRNA da matriz, então o mRNA é selecionado de entre as sequências de mRNA tendo os valores mais elevados de MFE da estrutura secundária de RNA, EFE, e/ou ED determinados para essa matriz de sequências de mRNA. Assim, em aspectos particulares da invenção, quando se seleciona um mRNA para produção melhorada de um polipeptídeo de interesse, o mRNA pode ser selecionado de entre as sequências de mRNA contendo um valor de
Petição 870190074939, de 05/08/2019, pág. 47/178
32/117
MFE da estrutura secundária de RNA, EFE, e/ou ED que é cerca de 95100% do valor mais elevado para o parâmetro que é determinado para essa matriz de sequências. Em outras modalidades de realização, quando se seleciona um mRNA para uma produção melhorada de um polipeptídeo de interesse, o mRNA pode ser selecionado de entre os mRNAs tendo um valor na gama de cerca de 90%-100%, 85%-100%, 90%-95%, 85%-95%, 80%95%, 85%-90%, 80%-90%, 75%-90%, 80%-85%, 75%-85%, 70%-85%, 75%80%, 70%-80%, 65%-80%, 70%-75%, 65%-75%, 60%-75%, 65%-70%, 60%70%, 55%-70%, 60%-65%, 55%-65%, 50%-65%, 55%-60%, 50%-60%, 45%60%, e similares, do valor mais alto para MFE da estrutura secundária de
RNA, EFE, e/ou ED que é determinado para essa matriz de sequências. Ainda, em outras modalidades de realização, ao selecionar um mRNA para uma produção melhorada de um polipeptídeo de interesse, o mRNA é selecionado de entre as sequências de mRNA da matriz contendo um valor de cerca de 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 89%, 88%, 87%, 86%, 85%, 84%, 83%, 82%, 81%, 80%, 79%, 78%, 77%,
76%, 75%, 74%, 73%, 72%, 71%, 70%, 69%, 68%, 67%, 66%, 65%, 64%,
63%, 62%, 61%, 60%, 59%, 58%, 57%, 56%, 55%, 54%, 53%, 52%, 51%,
50%, 49%, 48%, 47%, 46%, 45%, e semelhantes, do valor mais elevado de
MFE da estrutura secundária de RNA, EFE, e/ou ED que é determinada para essa matriz de sequências.
Em outros aspectos adicionais da invenção, quando selecionado um mRNA para uma produção melhorada de um polipeptídeo de interesse como aqui descrito e a FMFE da estrutura secundária do RNA é um parâmetro determinado para cada sequência individual de mRNA de uma matriz que é utilizada na classificação das sequências individuais de mRNA da matriz, então o mRNA é selecionado de entre as sequências de mRNA tendo os valores mais baixos de FMFE da estrutura secundária de RNA determinados para essa matriz de sequências de mRNA. Assim, em aspectos particulares da invenção, o mRNA pode ser selecionado de entre os mRNAs contendo um valor para FMFE de cerca de 0%-5% do valor mais elevado para FMFE da estrutura secundária de RNA determinada para essa matriz de sequênPetição 870190074939, de 05/08/2019, pág. 48/178
33/117 cias. Em outras modalidades de realização, o mRNA pode ser selecionado de entre os mRNAs tendo um valor em uma gama de cerca de 0%-10%, 5%10%, 0%-15%, 0%-20%, 5%-15%, 10%-15%, 5%-20%, 10%-20%, 15%20%, 10%-25%, 15%-25%, 20%-25%, 15%-30%, 20%-30%, 25%-30%, 20%35%, 25%-35%, 30%-35%, 25%-40%, 30%-40%, 35%-40%, 30%-45%, 35%45%, 40%-45%, 35%-50%, 40%-50%, 45%-50%, 40%-55%, 45%-55%, e similares, do valor mais alto para FMFE da estrutura secundária de RNA que é determinado para essa matriz de sequências. Ainda, em outras modalidades de realização, ao selecionar um mRNA para uma produção melhorada de um polipeptídeo de interesse, o mRNA é selecionado de entre as sequências de mRNA da matriz contendo um valor de cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%,
19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%,
32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%,
45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, e semelhantes, do valor mais elevado de FMFE que é determinado para essa matriz de sequências.
Em aspectos adicionais da invenção, quando selecionado um mRNA para uma produção melhorada de um polipeptídeo de interesse como aqui descrito e a BPP é um parâmetro determinado para cada sequência individual de mRNA de uma matriz que é utilizada na classificação das sequências individuais de mRNA da matriz, então o mRNA é selecionado de entre as sequências de mRNA tendo os valores mais elevados para a BPP determinados para essa matriz de sequências de mRNA. Assim, em aspectos particulares da invenção, quando se seleciona um mRNA para produção melhorada de um polipeptídeo de interesse, o mRNA pode ser selecionado de entre as sequências de mRNA contendo um valor de BPP que é cerca de 95-100% do valor mais elevado para o parâmetro que é determinado para essa matriz de sequências. Em outras modalidades de realização, quando se seleciona um mRNA para uma produção melhorada de um polipeptídeo de interesse, o mRNA pode ser selecionado de entre os mRNAs tendo um
Petição 870190074939, de 05/08/2019, pág. 49/178
34/117 valor na gama de cerca de 90%-100%, 85%-100%, 90%-95%, 85%-95%,
80%-95%, 85%-90%, 80%-90%, 75%-90%, 80%-85%, 75%-85%, 70%-85%,
75%-80%, 70%-80%, 65%-80%, 70%-75%, 65%-75%, 60%-75%, 65%-70%,
60%-70%, 55%-70%, 60%-65%, 55%-65%, 50%-65%, 55%-60%, 50%-60%,
45%-60%, e similares, do valor mais alto para BPP que é determinado para essa matriz de sequências. Ainda, em outras modalidades de realização, ao selecionar um mRNA para uma produção melhorada de um polipeptídeo de interesse, o mRNA é selecionado de entre as sequências de mRNA da matriz contendo um valor de cerca 100%, 99%, 98%, 97%, 96%, 95%, 94%,
93%, 92%, 91%, 90%, 89%, 88%, 87%, 86%, 85%, 84%, 83%, 82%, 81%,
80%, 79%, 78%, 77%, 76%, 75%, 74%, 73%, 72%, 71%, 70%, 69%, 68%,
67%, 66%, 65%, 64%, 63%, 62%, 61%, 60%, 59%, 58%, 57%, 56%, 55%,
54%, 53%, 52%, 51%, 50%, 49%, 48%, 47%, 46%, 45%, e semelhantes, do valor mais elevado da BPP que é determinado para essa matriz de sequências.
Em outros aspectos da invenção, quando selecionado um mRNA para uma produção reduzida de um polipeptídeo de interesse como aqui descrito e a MFE da estrutura secundária do RNA, EFE, e/ou ED é um parâmetro(s) determinado para cada sequência individual de mRNA de uma matriz que é utilizada na classificação das sequências individuais de mRNA da matriz, então o mRNA é selecionado de entre as sequências de mRNA tendo o valor mais baixo da MFE da estrutura secundária de RNA, EFE, e/ou ED, respectivamente, determinado para essa matriz de sequências de mRNA. Assim, em aspectos particulares da invenção, quando se seleciona um mRNA para produção reduzida de um polipeptídeo de interesse, o mRNA pode ser selecionado de entre os mRNAs contendo um valor de cerca de 0-5% do valor mais elevado para a MFE da estrutura secundária de RNA, EFE, e/ou ED determinado para essa matriz de sequências. Em outras modalidades de realização, quando selecionado um mRNA para a produção reduzida de um polipeptídeo de interesse, o mRNA pode ser selecionado de entre os mRNAs tendo um valor em uma gama de cerca de 0%-10%, 5%10%, 0%-15%, 0%-20%, 5%-15%, 10%-15%, 5%-20%, 10%-20%, 15%Petição 870190074939, de 05/08/2019, pág. 50/178
35/117
20%, 10%-25%, 15%-25%, 20%-25%, 15%-30%, 20%-30%, 25%-30%, 20%35%, 25%-35%, 30%-35%, 25%-40%, 30%-40%, 35%-40%, 30%-45%, 35%45%, 40%-45%, 35%-50%, 40%-50%, 45%-50%, 40%-55%, 45%-55%, e similares, do valor mais alto para MFE da estrutura secundária de RNA, EFE, e/ou ED determinado para essa matriz de sequências. Ainda, em outras modalidades de realização, ao selecionar um mRNA para uma produção melhorada de um polipeptídeo de interesse, o mRNA é selecionado de entre as sequências de mRNA da matriz contendo um valor de cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%,
19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%,
32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%,
45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, e semelhantes, do valor mais elevado de MFE da estrutura secundária de RNA, EFE, e/ou ED que é determinada para essa matriz de sequências.
Em aspectos adicionais da invenção, quando selecionado um mRNA para uma produção reduzida de um polipeptídeo de interesse como aqui descrito e a FMFE da estrutura secundária do RNA é um parâmetro(s) determinado para cada sequência individual de mRNA de uma matriz que é utilizada na classificação das sequências individuais de mRNA da matriz, então o mRNA é selecionado de entre as sequências de mRNA tendo o valor mais elevado de FMFE da estrutura secundária de RNA determinado para essa matriz de sequências. Assim, em aspectos particulares da invenção, quando se seleciona um mRNA para produção reduzida de um polipeptídeo de interesse, o mRNA pode ser selecionado de entre as sequências de mRNA contendo um valor de FMFE da estrutura secundária de RNA de cerca de 95-100% do valor mais elevado para a FMFE, que é determinado para essa matriz de sequências. Assim, em algumas modalidades de realização, quando se seleciona um mRNA para uma produção reduzida de um polipeptídeo de interesse, o mRNA pode ser selecionado de entre os mRNAs tendo um valor na gama de cerca de 90%-100%, 85%-100%, 90%-95%, 85%-95%, 80%-95%, 85%-90%, 80%-90%, 75%-90%, 80%-85%, 75%-85%, 70%-85%,
Petição 870190074939, de 05/08/2019, pág. 51/178
36/117
75%-80%, 70%-80%, 65%-80%, 70%-75%, 65%-75%, 60%-75%, 65%-70%, 60%-70%, 55%-70%, 60%-65%, 55%-65%, 50%-65%, 55%-60%, 50%-60%, 45%-60%, e similares, do valor mais elevado para FMFE da estrutura secundária de RNA que é determinado para essa matriz de sequências. Ainda, em outras modalidades de realização, ao selecionar um mRNA para uma produção reduzida de um polipeptídeo de interesse, o mRNA é selecionado de entre as sequências de mRNA da matriz contendo um valor de cerca 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 89%, 88%, 87%, 86%, 85%, 84%, 83%, 82%, 81%, 80%, 79%, 78%, 77%, 76%, 75%,
74%, 73%, 72%, 71%, 70%, 69%, 68%, 67%, 66%, 65%, 64%, 63%, 62%,
61%, 60%, 59%, 58%, 57%, 56%, 55%, 54%, 53%, 52%, 51%, 50%, 49%,
48%, 47%, 46%, 45%, e semelhantes, do valor mais elevado da FMFE que é determinado para essa matriz de sequências.
Em modalidades de realização adicionais, quando selecionado um mRNA para uma produção melhorada do polipeptídeo de interesse e a MFE da estrutura secundária de RNA é determinada para cada sequência individual de mRNA de uma matriz e utilizada na classificação das sequências individuais do mRNA da matriz, então o mRNA é selecionado entre cerca de 0,0001% a cerca de 20% (por exemplo, de cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%) das sequências de mRNA na matriz classificada com os valores mais elevados da MFE da estrutura secundária de RNA determinados para essa matriz. Assim, em aspectos adicionais da invenção, quando selecionar um mRNA para uma produção melhorada do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001% a cerca de 10%, cerca de 1% a cerca de 10%, cerca de 5% a cerca de 15%, cerca de 10% a cerca de 15%, cerca de 10% a cerca de 20%, cerca de 15% a cerca de 20%, ou qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais elevados para a MFE da estrutura secundária de RNA. Em outras modalidades de realização, quando selecionado um mRNA para uma produção melhorada do polipeptídeo de interesse, o mRNA pode ser
Petição 870190074939, de 05/08/2019, pág. 52/178
37/117 selecionado entre cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, ou qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais elevados para a MFE da estrutura secundária de RNA.
Em outros aspectos da invenção, quando selecionado um mRNA para uma produção melhorada do polipeptídeo de interesse como aqui descrito e a EFE é um parâmetro determinado para cada sequência de mRNA de uma matriz que é utilizada na classificação das sequências individuais do mRNA da matriz, então o mRNA é selecionado entre cerca de 0,0001% a cerca de 20% (por exemplo, 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%) das sequências de mRNA na matriz classificada com os valores mais elevados para a EFE. Assim, em aspectos adicionais da invenção, quando selecionado um mRNA para uma produção melhorada do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001% a cerca de 10%, cerca de 1% a cerca de 10%, cerca de 5% a cerca de 15%, cerca de 10% a cerca de 15%, cerca de 10% a cerca de 20%, cerca de 15% a cerca de 20%, ou qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais elevados para a EFE. Em outras modalidades de realização, quando selecionado um mRNA para uma produção melhorada do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, ou qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais elevados para a EFE.
Em outros aspectos da invenção, quando selecionado um mRNA para uma produção melhorada do polipeptídeo de interesse como aqui descrito e a ED é um parâmetro determinado para cada sequência individual de mRNA de uma matriz que é utilizada na classificação das sequências individuais do mRNA da matriz, então o mRNA é selecionado entre cerca de
Petição 870190074939, de 05/08/2019, pág. 53/178
38/117
0,0001% a cerca de 20% (por exemplo, 0,0001%, 0,0005%, 0,001%,
0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%) das sequências de mRNA na matriz classificada com os valores mais elevados para a ED. Assim, em aspectos adicionais da invenção, quando selecionado um mRNA para uma produção melhorada do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001% a cerca de 10%, cerca de 1% a cerca de 10%, cerca de 5% a cerca de 15%, cerca de 10% a cerca de 15%, cerca de 10% a cerca de 20%, cerca de 15% a cerca de 20%, ou qualquer sua combinação, das sequências de mRNA na matriz classificada com os valores mais elevados para a ED. Em outras modalidades de realização, quando selecionado um mRNA para uma produção melhorada do polipeptídeo de interesse, o mRNA é selecionado entre cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, ou qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais elevados para a ED.
Ainda, em outros aspectos da invenção, quando selecionado um mRNA para uma produção melhorada do polipeptídeo de interesse como aqui descrito e a FMFE da estrutura secundária de RNA é um parâmetro determinado para cada sequência individual de mRNA de uma matriz que é utilizada na classificação das sequências individuais do mRNA da matriz, então o mRNA é selecionado entre cerca de 0,0001% a cerca de 20% (por exemplo, 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%) das sequências de mRNA na matriz classificada com os valores mais baixos para a FMFE da estrutura secundária de RNA. Assim, em aspectos adicionais da invenção, quando selecionado um mRNA para uma produção melhorada do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001% a cerca de 10%, cerca de 1% a cerca de 10%, cerca de 5% a cerca de 15%, cerca de 10% a cerca de 15%, cerca de 10% a cerca de 20%, cerca de 15% a cerca de 20%, ou uma qualPetição 870190074939, de 05/08/2019, pág. 54/178
39/117 quer sua combinação, de sequências de mRNA na matriz classificada com os valores mais baixos para a FMFE da estrutura secundária de RNA. Em outras modalidades de realização, quando selecionado um mRNA para uma produção melhorada do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, ou qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais baixos para a FMFE da estrutura secundária de RNA.
A presente invenção proporciona adicionalmente, quando selecionado um mRNA para uma produção melhorada de um polipeptídeo de interesse como aqui descrito e a BPP é um parâmetro determinado para cada sequência individual de mRNA de uma matriz que é utilizada na classificação das sequências individuais de mRNA da matriz, então o mRNA é selecionado de entre cerca de 0,0001% a cerca de 20% das sequências de mRNA na matriz classificada com os valores mais elevados para a BPP. Assim, em aspectos adicionais da invenção, quando selecionado um mRNA para uma produção melhorada do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001% a cerca de 10%, cerca de 1% a cerca de 10%, cerca de 5% a cerca de 15%, cerca de 10% a cerca de 15%, cerca de 10% a cerca de 20%, cerca de 15% a cerca de 20%, ou uma qualquer sua combinação, das sequências de mRNA na matriz classificada com os valores mais elevados para a BPP. Em outras modalidades de realização, quando selecionado um mRNA para uma produção melhorada do polipeptídeo de interesse, o mRNA é selecionado entre cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, ou uma qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais elevados para a BPP.
Ainda, em aspectos adicionais da invenção, quando selecionado um mRNA para uma produção melhorada do polipeptídeo de interesse como aqui descrito e a MFE da estrutura secundária de RNA é um parâmetro dePetição 870190074939, de 05/08/2019, pág. 55/178
40/117 terminado para cada sequência individual de mRNA de uma matriz que é utilizada na classificação das sequências individuais do mRNA da matriz, então o mRNA é selecionado entre cerca de 0,0001% a cerca de 20% (por exemplo, 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%) das sequências de mRNA na matriz classificada com os valores mais baixos para a MFE da estrutura secundária de RNA. Assim, em aspectos adicionais da invenção, quando selecionado um mRNA para uma produção melhorada do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001% a cerca de 10%, cerca de 1% a cerca de 10%, cerca de 5% a cerca de 15%, cerca de 10% a cerca de 15%, cerca de 10% a cerca de 20%, cerca de 15% a cerca de 20%, ou uma qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais baixos para a MFE da estrutura secundária de RNA. Em outras modalidades de realização, quando selecionado um mRNA para uma produção reduzida do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, ou uma qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais baixos para a MFE da estrutura secundária de RNA.
Ainda, em aspectos adicionais da presente invenção, quando selecionado um mRNA para uma produção reduzida do polipeptídeo de interesse como aqui descrito e a EFE é um parâmetro determinado para cada sequência individual de mRNA de uma matriz que é utilizada na classificação das sequências individuais de mRNA da matriz, então o mRNA é selecionado de entre cerca de 0,0001% a cerca de 20% das sequências de mRNA na matriz classificada com os valores mais baixos para a EFE. Assim, em aspectos adicionais da invenção, quando selecionado um mRNA para uma produção reduzida do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001% a cerca de 10%, cerca de 1% a cerca de 10%, cerca de 5% a cerca de 15%, cerca de 10% a cerca de 15%, cerca de 10% a
Petição 870190074939, de 05/08/2019, pág. 56/178
41/117 cerca de 20%, cerca de 15% a cerca de 20%, ou uma qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais baixos para a EFE. Em outras modalidades de realização, quando selecionado um mRNA para uma produção melhorada do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, ou uma qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais baixos para a EFE.
Em alguns aspectos da invenção, quando selecionado um mRNA para uma produção reduzida do polipeptídeo de interesse como aqui descrito e a ED é um parâmetro determinado para cada sequência individual de mRNA de uma matriz que é utilizada na classificação das sequências individuais de mRNA da matriz, então o mRNA é selecionado de entre cerca de 0,0001% a cerca de 20% das sequências de mRNA na matriz classificada com os valores mais baixos para a ED. Assim, em aspectos adicionais da invenção, quando selecionado um mRNA para uma produção reduzida do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001% a cerca de 10%, cerca de 1% a cerca de 10%, cerca de 5% a cerca de 15%, cerca de 10% a cerca de 15%, cerca de 10% a cerca de 20%, cerca de 15% a cerca de 20%, ou uma qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais baixos para a ED. Em outras modalidades de realização, quando selecionado um mRNA para uma produção reduzida do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, ou uma qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais baixos para a ED.
Em outros aspectos da invenção, quando selecionado um mRNA para uma produção reduzida do polipeptídeo de interesse como aqui descrito e a FMFE da estrutura secundária de RNA é um parâmetro determinaPetição 870190074939, de 05/08/2019, pág. 57/178
42/117 do para cada sequência individual de mRNA de uma matriz que é utilizada na classificação das sequências individuais de mRNA da matriz, então o mRNA é selecionado de entre cerca de 0,0001% a cerca de 20% das sequências de mRNA na matriz classificada com os valores mais elevados para a FMFE da estrutura secundária de RNA. Assim, em aspectos adicionais da invenção, quando selecionado um mRNA para uma produção reduzida do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001% a cerca de 10%, cerca de 1% a cerca de 10%, cerca de 5% a cerca de 15%, cerca de 10% a cerca de 15%, cerca de 10% a cerca de 20%, cerca de 15% a cerca de 20%, ou uma qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais elevados para a FMFE da estrutura secundária de RNA. Em outras modalidades de realização, quando selecionado um mRNA para uma produção reduzida do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, ou uma qualquer sua combinação de sequências de mRNA na matriz classificada com os valores mais elevados para a FMFE da estrutura secundária de RNA.
A presente invenção proporciona adicionalmente, quando selecionado um mRNA para uma produção reduzida de um polipeptídeo de interesse como aqui descrito e a BPP é um parâmetro determinado para cada sequência individual de mRNA de uma matriz que é utilizada na classificação das sequências individuais de mRNA da matriz, então o mRNA é selecionado de entre cerca de 0,0001% a cerca de 20% das sequências de mRNA na matriz classificada com os valores mais baixos para a BPP. Assim, em aspectos adicionais da invenção, quando selecionado um mRNA para uma produção reduzida do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001% a cerca de 10%, cerca de 1% a cerca de 10%, cerca de 5% a cerca de 15%, cerca de 10% a cerca de 15%, cerca de 10% a cerca de 20%, cerca de 15% a cerca de 20%, ou uma qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais
Petição 870190074939, de 05/08/2019, pág. 58/178
43/117 baixos para a BPP. Em outras modalidades de realização, quando selecionado um mRNA para uma produção reduzida do polipeptídeo de interesse, o mRNA é selecionado entre cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, ou uma qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais baixos para a BPP.
De um modo concordante, em alguns aspectos da presente invenção, é fornecido um método de seleção de um mRNA para uma produção melhorada de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências individuais de mRNA compreendendo diferentes sequências nucleotídicas que codificam para o polipeptídeo de interesse; b) determinação da energia livre mínima (MFE) da estrutura secundária do RNA para cada sequência individual do mRNA de (a) e frequência da energia livre mínima (FMFE) da estrutura secundária do RNA em um conjunto termodinâmico para cada sequência individual de mRNA de (a): c) classificação das sequências individuais de mRNA da matriz de acordo com uma distribuição conjunta da MFE e FMFE determinadas na etapa (b) acima; e (d) seleção de uma sequência de mRNA a partir da matriz classificada do passo (c), em que o mRNA é selecionado de entre cerca de 0,0001% até cerca de 20% na matriz classificada com os valores mais elevados para a MFE da estrutura secundária do RNA e os valores mais baixos para FMFE da estrutura secundária do RNA ou da sequência de mRNA é selecionada de entre as sequências de mRNA contendo uma MFE da estrutura secundária do RNA compreendida entre cerca de 0 kcal/mol até cerca de -2 kcal/mol, tal como medido à temperatura ambiente e os valores mais baixos para a FMFE da estrutura secundária do RNA, em que a expressão da sequência do mRNA selecionada resulta em uma produção aumentada do polipeptídeo de interesse, em relação à sequência de mRNA do tipo selvagem. Assim, em aspectos adicionais da invenção, quando selecionado um mRNA para uma produção melhorada do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001% a cerca de 10%, cerca de 1%
Petição 870190074939, de 05/08/2019, pág. 59/178
44/117 a cerca de 10%, cerca de 5% a cerca de 15%, cerca de 10% a cerca de 15%, cerca de 10% a cerca de 20%, cerca de 15% a cerca de 20%, ou uma qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais elevados para a MFE da estrutura secundária de RNA e os valores mais baixos para a FMFE da estrutura secundária de RNA. Em outras modalidades de realização, quando selecionado um mRNA para uma produção melhorada do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, ou qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais elevados para a MFE da estrutura secundária de RNA e os valores mais baixos para a FMFE da estrutura secundária de RNA.
Além disso, em alguns aspectos, a presente invenção compreende ainda a determinação da probabilidade do emparelhamento de bases (BPP) para cada sequência individual de mRNA para além da MFE e da FMFE. Assim, ao selecionar um mRNA para uma produção melhorada de um polipeptídeo de interesse e a BPP é determinada e utilizada na classificação das sequências de mRNA da matriz de acordo com uma distribuição conjunta, em seguida, o mRNA é selecionado de entre cerca de 0,0001% até cerca de 20% das seqüências na matriz classificada com os valores mais elevados para a BPP. Assim, em aspectos adicionais da invenção, quando selecionado um mRNA para uma produção melhorada do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001% a cerca de 10%, cerca de 1% a cerca de 10%, cerca de 5% a cerca de 15%, cerca de 10% a cerca de 15%, cerca de 10% a cerca de 20%, cerca de 15% a cerca de 20%, ou uma qualquer sua combinação, das sequências de mRNA na matriz classificada com os valores mais elevados para a BPP. Em outras modalidades de realização, quando selecionado um mRNA para uma produção melhorada do polipeptídeo de interesse, o mRNA é selecionado entre cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%,
Petição 870190074939, de 05/08/2019, pág. 60/178
45/117 16%, 17%, 18%, 19%, 20%, ou uma qualquer sua combinação, das sequências de mRNA na matriz classificada com os valores mais elevados para a BPP.
Em um aspeto adicional da invenção, é fornecido um método para seleção de um mRNA para uma produção reduzida de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências individuais de mRNA compreendendo diferentes sequências nucleotídicas que codificam para o polipeptídeo de interesse; b) determinação da energia livre mínima (MFE) da estrutura secundária do RNA para cada sequência individual do mRNA de (a) e frequência da energia livre mínima (FMFE) da estrutura secundária do RNA em um conjunto termodinâmico para cada sequência individual de mRNA de (a); c) classificação das sequências individuais de mRNA da matriz de acordo com uma distribuição conjunta da MFE e FMFE determinadas na etapa (b) acima; e d) seleção de uma sequência de mRNA a partir da matriz classificada do passo (c), em que o mRNA é selecionado de entre cerca de 0,0001% até cerca de 20% das sequências na matriz classificada com os valores mais baixos para a MFE da estrutura secundária do RNA e os valores mais elevados para a FMFE da estrutura secundária do RNA ou a sequência de mRNA é selecionada de entre as sequências de mRNA contendo uma MFE da estrutura secundária do RNA em uma gama entre cerca de -9 kcal/mol até cerca de -18 kcal/mol, tal como medido à temperatura ambiente e os valores mais elevados para a FMFE da estrutura secundária do RNA. Assim, em aspectos adicionais da invenção, quando selecionado um mRNA para uma produção reduzida do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001% a cerca de 10%, cerca de 1% a cerca de 10%, cerca de 5% a cerca de 15%, cerca de 10% a cerca de 15%, cerca de 10% a cerca de 20%, cerca de 15% a cerca de 20%, ou uma qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais baixos para a MFE da estrutura secundária de RNA e os valores mais elevados para a FMFE da estrutura secundária de RNA. Em outras modalidades de realização, quando selecionado um mRNA para uma produção reduzida do polipeptídeo de intePetição 870190074939, de 05/08/2019, pág. 61/178
46/117 resse, o mRNA pode ser selecionado entre cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, ou qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais baixos para a MFE da estrutura secundária de RNA e os valores mais elevados para a FMFE da estrutura secundária de RNA.
Além disso, em alguns aspectos, a presente invenção compreende ainda a determinação da probabilidade do emparelhamento de bases (BPP) para cada sequência individual de mRNA para além da MFE e da FMFE. Em alguns aspectos da presente invenção, o método compreende ainda a determinação da probabilidade do emparelhamento de bases (BPP) para cada sequência individual de mRNA para além da MFE e da FMFE. Assim, ao selecionar um mRNA para uma produção reduzida de um polipeptídeo de interesse e a BPP é determinada e utilizada na classificação das sequências individuais de mRNA da matriz de acordo com uma distribuição conjunta, em seguida, o mRNA é selecionado de entre cerca de 0,0001% até cerca de 20% das seqüências na matriz classificada com os valores mais baixos para a BPP. Assim, em aspectos adicionais da invenção, quando selecionado um mRNA para uma produção reduzida do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001% a cerca de 10%, cerca de 1% a cerca de 10%, cerca de 5% a cerca de 15%, cerca de 10% a cerca de 15%, cerca de 10% a cerca de 20%, cerca de 15% a cerca de 20%, ou uma qualquer sua combinação, das sequências de mRNA na matriz classificada com os valores mais baixos para a BPP. Em outras modalidades de realização, quando selecionado um mRNA para uma produção reduzida do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, ou uma qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais baixos para a BPP.
A presente invenção proporciona adicionalmente um método para seleção de um mRNA para a produção melhorada de um polipeptídeo de
Petição 870190074939, de 05/08/2019, pág. 62/178
47/117 interesse, o método compreendendo: a) produção de uma matriz de sequências individuais de mRNA compreendendo diferentes sequências nucleotídicas que codificam para o polipeptídeo de interesse; b) determinação da energia livre do conjunto (EFE) para cada sequência individual do mRNA de (a) e frequência da energia livre mínima (FMFE) da estrutura secundária do RNA em um conjunto termodinâmico para cada sequência individual do mRNA de (a); e c) classificação das sequências individuais de mRNA da matriz de acordo com uma distribuição conjunta da EFE e FMFE determinadas na etapa (b) acima; e d) seleção de uma sequência de mRNA a partir da matriz classificada do passo (c), em que o mRNA é selecionado de entre cerca de 0,0001% até cerca de 20% das sequências na matriz classificada com os valores mais elevados para EFE e os valores mais baixos para FMFE da estrutura secundária do RNA. Em outras modalidades de realização, quando selecionado um mRNA para uma produção melhorada do polipeptídeo de interesse, o mRNA é selecionado entre cerca de 0,0001% a cerca de 10%, cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, ou qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais elevados para a EFE e os valores mais baixos para a FMFE da estrutura secundária de RNA.
Em alguns aspectos da presente invenção, o método compreende ainda a determinação da probabilidade do emparelhamento de bases (BPP) para cada sequência individual de mRNA para além da EFE e da FMFE. Assim, ao selecionar um mRNA para uma produção melhorada de um polipeptídeo de interesse e a BPP é determinada e utilizada na classificação das sequências de mRNA da matriz de acordo com uma distribuição conjunta, em seguida, o mRNA é selecionado de entre cerca de 0,0001% até cerca de 20% das seqüências na matriz classificada com os valores mais elevados para a BPP. Assim, em aspectos adicionais da invenção, quando selecionado um mRNA para uma produção melhorada do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001% a cerca de 10%, cerca de 1% a cerca de 10%, cerca de 5% a cerca de 15%, cerca de
Petição 870190074939, de 05/08/2019, pág. 63/178
48/117 10% a cerca de 15%, cerca de 10% a cerca de 20%, cerca de 15% a cerca de 20%, ou uma qualquer sua combinação, das sequências de mRNA na matriz classificada com os valores mais elevados para a BPP. Em outras modalidades de realização, quando selecionado um mRNA para uma produção melhorada do polipeptídeo de interesse, o mRNA é selecionado entre cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, ou uma qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais elevados para a BPP.
Em outras modalidades de realização, a presente invenção proporciona um método para seleção de um mRNA para a produção reduzida de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências individuais de mRNA compreendendo diferentes sequências nucleotídicas que codificam para o polipeptídeo de interesse; b) determinação da energia livre do conjunto (EFE) para cada sequência individual do mRNA de (a) e frequência da energia livre mínima (FMFE) da estrutura secundária do RNA em um conjunto termodinâmico; c) classificação das sequências individuais de mRNA da matriz de acordo com uma distribuição conjunta da EFE e FMFE determinadas na etapa (b) acima; e d) seleção de uma sequência de mRNA a partir da matriz classificada do passo (c), em que o mRNA é selecionado de entre cerca de 0,0001% até cerca de 20% das sequências na matriz classificada com os valores mais baixos para EFE e os valores mais elevados para a FMFE da estrutura secundária do RNA. Assim, em aspectos adicionais da invenção, quando selecionado um mRNA para uma produção reduzida do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001% a cerca de 10%, cerca de 1% a cerca de 10%, cerca de 5% a cerca de 15%, cerca de 10% a cerca de 15%, cerca de 10% a cerca de 20%, cerca de 15% a cerca de 20%, ou uma qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais baixos para a EFE e os valores mais elevados para a FMFE da estrutura secundária de RNA. Em outras modalidades de realização, quando selecionado um mRNA para uma produção reduzida do polipeptídeo de intePetição 870190074939, de 05/08/2019, pág. 64/178
49/117 resse, o mRNA pode ser selecionado entre cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, ou qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais baixos para a EFE e os valores mais elevados para a FMFE da estrutura secundária de RNA.
Em aspectos adicionais da presente invenção, o método compreende ainda a determinação da probabilidade do emparelhamento de bases (BPP) para cada sequência individual de mRNA para além da EFE e da FMFE. Assim, ao selecionar um mRNA para uma produção reduzida de um polipeptídeo de interesse e a BPP é determinada e utilizada na classificação das sequências individuais de mRNA da matriz de acordo com uma distribuição conjunta, em seguida, o mRNA é selecionado de entre cerca de 0,0001% até cerca de 20% das seqüências na matriz classificada com os valores mais baixos para a BPP. Assim, em aspectos adicionais da invenção, quando selecionado um mRNA para uma produção reduzida do polipeptídeo de interesse, o mRNA pode ser selecionado entre cerca de 0,0001% a cerca de 10%, cerca de 1% a cerca de 10%, cerca de 5% a cerca de 15%, cerca de 10% a cerca de 15%, cerca de 10% a cerca de 20%, cerca de 15% a cerca de 20%, ou uma qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais baixos para a BPP. Em outras modalidades de realização, quando selecionado um mRNA para uma produção reduzida do polipeptídeo de interesse, o mRNA é selecionado entre cerca de 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, ou uma qualquer sua combinação, de sequências de mRNA na matriz classificada com os valores mais baixos para a BPP.
Os mRNAs selecionados da presente invenção podem ser modificados para produção de proteína. Como um exemplo, o emparelhamento de bases em e/ou em torno do códon iniciador (AUG) de um mRNA selecionado codificando para o polipeptídeo de interesse pode ser modificado posteriormente para tornar o códon iniciador do mRNA selecionado mais aberto
Petição 870190074939, de 05/08/2019, pág. 65/178
50/117 (por exemplo, tendo menos ou nenhum emparelhamento de bases para uma melhor iniciação da produção/tradução de proteínas) ou menos abertos (por exemplo, ter mais pares de bases para diminuir a iniciação da produção/tradução de proteínas). A quantidade de pares de bases do códon iniciador do mRNA selecionado (i.e., mais ou menos aberto) é comparada com o códon iniciador do mRNA do tipo selvagem (nativo) que codifica para o polipeptídeo de interesse ou é comparada com o códon iniciador de um segundo mRNA que codifica para o polipeptídeo (diferente do mRNA selecionado (por exemplo, primeiro mRNA)). Em modalidades de realização adicionais da presente invenção, os mRNAs selecionados da presente invenção podem ser combinados com outros fatores que modificam a produção de proteínas tais como os promotores da transcrição e da tradução.
Em algumas modalidades de realização da presente invenção, para atingir o nível desejado de produção de proteínas, as sequências de mRNA selecionadas são posteriormente alteradas (i.e., mutadas) de modo que a sequência de aminoácidos codificada do polipeptídeo de interesse é mutada para incorporar uma ou mais mutações inconsequentes (por exemplo, um ou mais substituições de aminoácidos conservadoras), que resultam em uma alteração desejada no valor da MFE do mRNA e na correspondente alteração desejada no nível de produção de proteínas. Assim, enquanto a sequência de mRNA mutada codifica para uma sequência de aminoácidos mutada, a mutação na sequência de aminoácidos não altera a função do polipeptídeo em comparação com a sequência polipeptídica do tipo selvagem.
Em algumas modalidades de realização da presente invenção, é fornecido um método para modificar a produção de um polipeptídeo de interesse em uma célula de um organismo, o método compreendendo: (a) seleção de um mRNA que codifica para um polipeptídeo de interesse, de acordo com qualquer uma das reivindicações anteriores; (b) mutação da sequência nucleotídica do mRNA de (a) para produzir um mRNA mutado contendo uma MFE aumentada ou reduzida da estrutura secundária do RNA, em relação à MFE da estrutura secundária do RNA da sequência nucleotídica do mRNA de (a)) e que codifica para uma sequência polipeptídica que é mutada em
Petição 870190074939, de 05/08/2019, pág. 66/178
51/117 comparação com a sequência polipeptídica codificada pelo mRNA de (a); em que a sequência polipeptídica mutada mantém a função do polipeptídeo codificado pelo mRNA de (a), e a expressão da sequência do mRNA mutada em uma célula de um organismo resulta na produção modificada do polipeptídeo de interesse em relação à sequência de mRNA do tipo selvagem.
As mutações conservadoras ou inconsequentes incluem mutações pontuais (substituição de um nucleotídeo de base singular com um outro nucleotídeo). Os tipos de mutações pontuais que podem resultar em mutações inconsequentes (i.e. , não afetam a função) são bem conhecidas na arte (ver, p. ex., D. Bordo e P. Argos, Suggestions for “Safe” Residue Substitutions in Site-Directed Mutagensis, J. Mol. Biol. 217:721-729 (1991); Figura 2). Assim, por exemplo, pode ser gerada uma matriz de sequências de mRNA em que as mutações pontuais conservadoras são introduzidas na sequência do mRNA e a partir desta matriz pode ser selecionado um mRNA contendo um valor de MFE desejado e codificando para um polipeptídeo que é mutado mas mantém a função do tipo selvagem (por exemplo, mutação inconsequente). Assim, a MFE de um mRNA selecionado da presente invenção pode ainda ser manipulada por mutação na sequência do mRNA com a mutação resultante de uma mutação inconsequente no polipeptídeo. Essas mutações oferecem uma flexibilidade adicional na escolha da sequência de mRNA para uso no sentido de alcançar um nível desejado de produção de proteínas.
Em modalidades de realização adicionais, o polipeptídeo de interesse pode ser ainda mais otimizado utilizando códons preferenciais para a expressão melhorada em um determinado organismo de interesse, ou pode ser sintetizado usando códons com uma frequência preferida de utilização do códon. Assim, em algumas modalidades de realização, o conteúdo em GC do gene será aumentado. Ver, por exemplo, Campbell & Gowri (1990) Plant Physiol. 92:1-11 para uma discussão do uso dos códons dos códons preferidos para os hospedeiros.
Em alternativa, os códons raros, que são conhecidos por impedir ou tornar mais lenta a tradução, podem ser úteis para a (por exemplo, reduPetição 870190074939, de 05/08/2019, pág. 67/178
52/117 ção) da produção de proteínas moduladoras relativamente à produção de proteínas de um mRNA do tipo selvagem ou outro mRNA selecionado. Os códons raros são determinados com base nas espécies particulares (i.e., determinados códons podem ser raros em uma espécie, mas não serem raros em outra espécie). Assim, tal como é aqui utilizado, um códon raro é um códon que é codificado por um tRNA contendo uma abundância inferior a cerca de 15% dos tRNAs totais que codificam para um determinado aminoácido em uma determinada espécie ou tipo de célula em uma dada espécie. De um modo concordante, em algumas modalidades de realização desta invenção, as sequências de mRNA individuais selecionadas de acordo com os métodos da presente invenção podem compreender um ou mais códons raros próximos do códon iniciador. Alternativamente, em outras modalidades de realização desta invenção as sequências de mRNA compreendendo códons raros podem ser eliminadas da matriz. A eliminação de sequências compreendendo códons raros pode ser feita através do uso de programas de software.
Conforme utilizado aqui, o termo próximo do códon iniciador significa que esses códons codificam para os 12 primeiros aminoácidos (AUG para + 12 aminoácidos). Ao nível do polipeptídeo, o termo próximo do códon iniciador compreende os nucleotídeos 1 a +36.
Tal como usado neste documento, os termos um, uma ou o/a pode significar um ou mais do que um. Por exemplo, uma célula pode significar uma única célula ou uma multiplicidade de células.
Tal como utilizado aqui, o termo e/ou refere-se a, e engloba, toda e qualquer possível combinação de um ou mais dos itens listados associados, bem como a falta de combinações quando interpretado no alternativo (ou).
Adicionalmente, o termo cerca de como aqui usado refere-se a um valor mensurável tal como uma quantidade de um composto (por exemplo, mRNA) ou agente desta invenção, dose, tempo, percentagem, temperatura, e semelhantes, pretende englobar variações de ± 20%, ± 10%, ± 5%, ± 1%, ± 0,5%, ou mesmo ± 0,1% da quantidade especificada.
Petição 870190074939, de 05/08/2019, pág. 68/178
53/117
Tal como aqui usado, o termo polipeptídeo engloba ambos os peptídeos e proteínas, salvo indicação em contrário.
Tal como é aqui utilizado, um polipeptídeo ou fragmento de polipeptídeo isolado significa um polipeptídeo ou fragmento de polipeptídeo separado ou substancialmente livre de, pelo menos, parte dos outros componentes do organismo que ocorre naturalmente, por exemplo, os componentes celulares ou outros polipeptídeos ou ácidos nucléicos encontrados comumente em associação com o polipeptídeo.
Tal como aqui utilizada, a expressão transitória consistindo essencialmente em significa que o âmbito de uma reivindicação deve ser interpretado de forma a abranger todos os materiais especificados ou passos citados na reivindicação e aqueles que não afetem materialmente as características fundamentais e inovadoras da invenção reivindicada. Assim, o termo consistindo essencialmente em quando usado em uma reivindicação da presente invenção não se destina a ser interpretado como equivalente a compreendendo.
Os termos reduz, reduzido/a, reduzir, redução, diminuir, e decréscimo (e suas variações gramaticais), tal como aqui utilizados, descrevem um decréscimo na produção de um polipeptídeo de interesse codificado por um mRNA selecionado. Este decréscimo pode ser observado por comparação da produção de um polipeptídeo de interesse pelo mRNA selecionado para a produção do polipeptídeo de interesse pelo tipo selvagem (i.e., nativo) o mRNA que codifica para o mesmo polipeptídeo de interesse ou por comparação da produção de um polipeptídeo de interesse pelo mRNA selecionado para a produção do polipeptídeo por outro (segundo) mRNA (além do mRNA já selecionado (primeiro)) que codifica para o mesmo polipeptídeo de interesse como codificado pelo mRNA selecionado.
Os termos melhora, melhorado/a, melhorar, melhoria, aumento (e suas variações gramaticais), tal como aqui utilizados, descrevem um aumento na produção de um polipeptídeo de interesse codificado por um mRNA selecionado. Este aumento pode ser observado por comparação da produção de um polipeptídeo de interesse pelo mRNA selecionado
Petição 870190074939, de 05/08/2019, pág. 69/178
54/117 para a produção do polipeptídeo de interesse pelo tipo selvagem (i.e., nativo) o mRNA que codifica para o mesmo polipeptídeo de interesse como codificado pelo mRNA selecionado ou por comparação da produção de um polipeptídeo de interesse pelo mRNA selecionado para a produção do polipeptídeo por outro (segundo) mRNA (além do mRNA já selecionado (primeiro)) que codifica para o mesmo polipeptídeo de interesse como codificado pelo mRNA selecionado.
O termo modular, modula, modulado/a ou modulação refere-se à melhoria (por exemplo, um aumento) ou inibição (por exemplo, uma redução) na atividade especificada (por exemplo, produção de proteína modulada).
Um polipeptídeo de interesse pode ser qualquer polipeptídeo. Os exemplos não-limitantes dos polipeptídeos de interesse, que são adequados para a expressão em plantas incluem aqueles resultantes de características agronomicamente importantes, tais como resistência a herbicidas, resistência a vírus, resistência a bactérias patogénicas, resistência a insetos, resistência a nemátodos e resistência fúngica. Ver, por exemplo, as Patentes U.S. N°s 5,569,823; 5,304,730; 5,495,071; 6,329,504; e 6,337,431. O polipeptídeo de interesse também pode ser aquele que resulta em aumentos no vigor da planta ou no rendimento (incluindo polipeptídeos que permitem que a planta cresça em diferentes temperaturas, condições de solo e de níveis de radiação solar e precipitação), ou um que permite a identificação de uma planta apresentando a característica de interesse (por exemplo, um gene marcador selecionável, cor do revestimento da semente, etc.).
A resistência a herbicidas também é por vezes referida como tolerância a herbicidas. Os genes que conferem resistência a um herbicida que iniba o ponto de crescimento ou meristema, tal como uma imidazalinona ou uma sulfonilureia, podem ser adequados. Os genes exemplo deste código de categoria para enzimas ALS e AHAS mutantes como descrito, por exemplo, nas Patentes U.S. N° 5,767,366 e 5,928,937. As Patentes U.S. N° 4,761,373 e 5,013,659 são direcionadas para as plantas resistentes a vários herbicidas imidazalinona ou sulfonamidas. A Patente U.S. N° 4,975,374 refePetição 870190074939, de 05/08/2019, pág. 70/178
55/117 re-se a plantas e células vegetais que contêm um gene que codifica para uma glutamina sintetase mutante (GS) resistente à inibição por herbicidas que são conhecidos por inibir a GS, por exemplo, a fosfinotricina e a metionina sulfoximina. A Patente U.S. N° 5,162,602 divulga plantas resistentes à inibição por herbicidas cicloexanodionas e ácidos ariloxifenoxipropanóicos. A resistência é conferida por uma acetilcoenzima A carboxilase alterada (ACCase).
Os polipeptídeos de interesse codificados pelos genes para resistência ao glifosato também são adequados. Ver, por exemplo, a Patente U.S. N° 4,940,835 e a Patente U.S. N° 4,769,061. A Patente U.S. N° 5,554,798 revela as plantas de milho transgénico resistentes ao glifosato, resistência essa que é conferida por um gene 5-enolpiruvil-3-fosfochiquimato (EPSP) sintase alterado.
Os genes de resistência aos compostos fosfono, tais como o glufosinato de amónio ou a fosfinotricina, e os ácidos propiónicos piridinoxi ou fenoxi e as cicloexonas também são adequados. Ver, Pedido de Patente Europeia N° 0 242 246. Ver também, as Patentes U.S. N°s 5,879,903,
5,276,268 e 5,561,236.
Outros herbicidas adequados incluem aqueles que inibem a fotossíntese, como uma triazina e um benzonitrilo (nitrilase). Ver, Patente U.S. N° 4,810,648. Outros herbicidas adequados incluem o ácido 2,2dicloropropiónico, a setoxidima, haloxifop, herbicidas imidazolinonas, herbicidas de sulfonilureia, herbicidas triazolopirimidina, herbicidas s-triazina e bromoxinil. São também adequados os genes que conferem resistência a uma enzima protox, ou proporcionam uma resistência melhorada às doenças de plantas; uma tolerância melhorada aos efeitos adversos das condições ambientais (stress abiótico) incluindo, mas não limitado à seca, frio excessivo, calor excessivo, ou excessiva salinidade do solo ou de extrema acidez ou alcalinidade; e alterações na arquitetura da planta ou do desenvolvimento, incluindo alterações no periodo de desenvolvimento. Ver, por exemplo, a Publicação do Pedido de Patente U.S. N° 2001/0016956 e a Patente U.S. N° 6,084,155.
Petição 870190074939, de 05/08/2019, pág. 71/178
56/117
As proteínas inseticidas úteis para a invenção podem ser expressas em uma quantidade suficiente para controlar pragas de insetos, i.e., quantidades para controlar os insetos. É reconhecido que a quantidade de expressão da proteína inseticida em uma planta necessária para o controle de insetos pode variar, dependendo da cultura, do tipo de inseto, fatores ambientais e semelhantes. Os genes úteis para a resistência a insetos ou pragas incluem, por exemplo, os genes que codificam para as toxinas identificadas em organismos de Bacillus. Os genes que codificam para toxinas de Bacillus thuringiensis (Bt) de várias subespécies foram clonados e os clones recombinantes foram verificados como sendo tóxicos para lepidópteros, dipteranos e para as larvas de insetos coleópteros (por exemplo, vários genes delta-endotoxina tais como CrylAa, CrylAb, CrylAc, CrylB, CrylC, CrylD, CrylEa, CrylFa, Cry3A, Cry9A, Cry9C e Cry9B; bem como os genes que codificam para proteínas inseticidas vegetativas tais como Vip1, Vip2 e Vip3). Uma lista completa das toxinas Bt pode ser encontrada na web mundial na base de dados de Nomenclatura de Toxinas de Bacillus thuringiensis mantida pela Universidade de Sussex (ver também , Crickmore et al. (1998) Microbiol. Mol. Biol. Rev. 62:807-813).
Os polipeptídeos de interesse, que são adequados para a expressão de plantas incluem ainda os que contribuem para melhorar ou facilitar a conversão da cana-de-açúcar colhida em um produto comercialmente útil, incluindo, por exemplo, o conteúdo aumentado ou alterado em carboidratos e/ou a distribuição, propriedades de fermentação melhorada, maior teor em óleo, maior teor em proteínas, melhor digestibilidade, e aumento do conteúdo nutracêutico, por exemplo, conteúdo em fitoesterol aumentado, conteúdo em tocoferol aumentado, conteúdo em estanol aumentado ou conteúdo em vitamina aumentado. Os polipeptídeos de interesse também incluem, por exemplo, aqueles que resultam em ou contribuindo para um teor reduzido de um componente indesejado em uma colheita, por exemplo, ácido fítico, ou enzimas para degradação de açúcares. Por resultando em ou contribuir para, se pretende que o polipeptídeo de interesse possa direta ou indiretamente contribuir para a existência de uma característica de intePetição 870190074939, de 05/08/2019, pág. 72/178
57/117 resse (por exemplo, aumentar a degradação da celulose pela expressão heteróloga de uma enzima celulase).
Em uma modalidade de realização, o polipeptídeo de interesse contribui para uma digestibilidade aumentada dos alimentos ou rações animais. As xilanases são enzimas hemicelulóticas que melhoram a degradação das paredes celulares das plantas, o que leva a uma melhor utilização dos nutrientes da planta pelo animal. Isto leva a uma taxa de crescimento e conversão dos alimentos aumentadas. Também, a viscosidade dos alimentos contendo xilana pode ser reduzida. A expressão de xilanases em células vegetais também pode potencialmente atuar como facilitadora na conversão lenho-celulósica em açúcares fermentáveis no processamento industrial.
Várias xilanases de microrganismos fúngicos e bacterianos têm sido identificadas e caracterizadas (ver, por exemplo, a Patente U.S. N° 5,437,992; Coughlin et al. (1993) Proceedings of the Second TRICEL Symposium on Trichoderma reesei Cellulases and Other Hydrolases, Espoo; Souminen e Reinikainen, eds. (1993) Foundation for Biotechnical and Industrial Fermentation Research 8:125-135; Publicação do Pedido de Patente U.S. N° 2005/0208178; e WO 03/16654). Em particular, três xilanases específicas (XYL-I, XYL-II, e XIL-III) foram identificadas em T. reesei (Tenkanen et al. (1992) Enzyme Microb. Technol. 14:566; Torronen et al. (1992) Bio/Technology 10:1461; e Xu et al. (1998) Appl. Microbiol. Biotechnol. 49:718).
Em outra modalidade de realização, o polipeptídeo de interesse é uma enzima degradante polissacarídica. Essas plantas podem ser úteis para gerar, por exemplo, matérias-primas de fermentação para bioprocessamento. Em algumas modalidades de realização, as enzimas úteis para o processo de fermentação incluem alfa amilases, proteases, pululanases, isoamilases, celulases, hemicelulases, xilanases, ciclodextrina glicotransferases, lipases, fitases, lacases, oxidases, esterases, cutinases, hidrólise do amido granulado e de outras glucoamilases.
As enzimas degradativos do polissacarídeo incluem: enzimas degradadoras de amido tais como -amilases (EC 3.2.1.1), glucoronidases
Petição 870190074939, de 05/08/2019, pág. 73/178
58/117 (E.C. 3.2.1.131); exo-1,4-D-D glucanases tais como amiloglucosidases e glucoamilase (EC 3.2.1.3), D-amilases (EC 3.2.1.2), D-glucosidases (EC 3.2.1.20), e outras exo-amilases; e enzimas de desramificação de amido, como a) isoamylase (EC 3.2.1.68), pululanase (EC 3.2.1.41), e semelhantes; b) celulases como a exo-1,4-3-celobio-hidrolase (EC 3.2.1.91), exo-1,3-D-Dglucanase (EC 3.2.1.39), D-glucosidase (EC 3.2.1.21); c) L-arabinases, tais como endo-1,5-D -L-arabinase (EC 3.2.1.99), D-arabinosidases (EC 3.2.1.55) e similares; d) galactanases tais como endo-1,4- -D-galactanase (EC 3.2.1.89), endo-1,3-D -D-galactanase (EC 3.2.1.90), □ -galactosidase (EC 3.2.1.22), □-galactosidase (EC 3.2.1.23) e semelhantes; e) mananases, tais como endo-1,4- -D-mananase (EC 3.2.1.78), □ -manosidase (EC
3.2.1.25), D-manosidase (EC 3.2.1.24) e similares; f) xilanases, como, por exemplo, endo-1,4--xilanase (EC 3.2.1.8), D-D-xilosidase (EC 3.2.1.37),
1,3- -D-xilanase e afins; g) outros enzimas tais como -L-fucosidase (EC 3.2.1.51), D-L-ramnosidase (CE 3.2.1.40), levanase (EC 3.2.1.65), inulanase (EC 3.2.1.7), e semelhantes.
Mais enzimas adicionais que podem ser utilizadas incluem proteases, tais como as proteases de fungos e bactérias. As proteases fúngicas incluem, mas não estão limitadas a, aquelas obtidas a partir de Aspergillus, Trichoderma, Mucor e Rhizopus, tais como A. niger, A. awamori, A. oryzae e M. miehei. Em algumas modalidades de realização, os polipeptídeos de interesse são enzimas de celobioidrolase (CBH) (EC 3.2.1.91). Em uma modalidade de realização, a enzima celobioidrolase é a CBH1 ou a CBH2.
Outras enzimas (polipeptídeos de interesse) incluem, mas não estão limitadas a, hemicelusases, tais como manases e arabinofuranosidases (EC 3.2.1.55); lenhinases; lipases (por exemplo, E.C. 3.1.1.3), oxidases de glucose, pectinases, xilanases, transglucosidases, alfa-1,6-glucosidases (por exemplo, E.C. 3.2.1.20); esterases tais como a esterase do ácido ferúlico (EC 3.1.1.73) e acetilxilana esterases (EC 3.1.1.72); e cutinases (p.ex. E.C. 3.1.1.74).
Em algumas modalidades de realização desta invenção, um polipeptídeo de interesse compreende ainda um peptídeo líder. Como é bem
Petição 870190074939, de 05/08/2019, pág. 74/178
59/117 conhecido na arte, um peptídeo líder é um peptídeo que é codificado a montante (extremidade 5' da sequência codificante) de uma matriz de leitura aberta maior. Qualquer peptídeo líder pode ser usado com os métodos da presente invenção. Um peptídeo líder pode ser um peptídeo que é encontrado na natureza, ou pode ser um peptídeo sintético concebido para funcionar como um peptídeo líder.
Assim, em algumas modalidades de realização da presente invenção, um polipeptídeo de interesse compreende um peptídeo líder, e assim a extremidade 5' do mRNA codificando para o polipeptídeo de interesse compreende uma sequência líder que codifica para o peptídeo líder a montante (extremidade 5' da sequência codificante) de uma matriz de leitura aberta. Assim, em algumas modalidades de realização, a matriz de sequências individuais de mRNA compreendendo diferentes sequências nucleotídicas que codificam para o polipeptídeo de interesse codificam para uma sequência líder fundida com o polipeptídeo de interesse. Em algumas modalidades de realização, a produção de um polipeptídeo de interesse pode ser modulada através da modulação da expressão de uma sequência líder fundida com o polipeptídeo de interesse. Assim, um mRNA codificando para o peptídeo líder é selecionado de acordo com qualquer um dos métodos da presente invenção e fundido com o polipeptídeo de interesse. Através da modulação da expressão da sequência líder, a expressão do polipeptídeo com o qual é fundida pode ser modulada. Assim, a expressão do polipeptídeo de interesse pode ser modulada sem alterar a sequência de nucleotídeos que codifica para o polipeptídeo de interesse ou a sequência de aminoácidos do polipeptídeo de interesse.
Os exemplos não-limitantes de peptídeos líder incluem peptídeos de sinal, peptídeos de trânsito, peptídeos de alvejamento, sequências de sinal, e semelhantes. Como é bem conhecido na arte, os peptídeos de sinal/trânsito alvejam ou transportam uma proteína codificada por um gene nuclear de um determinado organelo como a mitocôndria, plastídios (por exemplo, apicoplasto, cromoplasto, cloroplasto, cianelo, tilacóide, amiloplasto, e semelhantes), microcorpos (por exemplo, pequenos organelos associaPetição 870190074939, de 05/08/2019, pág. 75/178
60/117 dos a membrana simples, tais como peroxissomas, hidrogenossomas, glioxissomas e glicossoma).
Os peptídeos líder são bem conhecidos na arte e podem ser encontrados nas bases de dados públicas, tais como o Signal Peptide Website: An Information Platform for Signal Sequences and Signal Peptides. (www.signalpeptide.de); a Signal Peptide Database (proline.bic.nus.edu.sg/spdb/index.html) (Choo et al., BMC Bioinformatics 6:249 (2005)(disponível em www.biomedcentral.com/1471-2105/6/249/abstract); ChloroP (www.cbs.dtu.dk/services/ChloroP/; prevê a presença de peptídeos de transito de cloroplastos (cTP) em sequências de proteínas e a localização dos potenciais locais de clivagem da cTP); LipoP (www.cbs.dtu.dk/services/LipoP/; prevê lipoproteínas e peptídeos de sinal em bactérias Gram-negativas); MITOPROT (ihg2.helmholtzmuenchen.de/ihg/mitoprot.html; prevê as sequências de alvejamento mitocondrial); PlasMit (gecco.org.chemie.uni-frankfurt.de/plasmit/index.html; prevê peptídeos de trânsito mitocondriais em Plasmodium falciparum); Predotar (urgi.versailles.inra.fr/predotar/predotar.html; prevê sequências de alvejamento mitocondriais e de plastídeos); PTS1 (mendel.imp.ac.at/mendeljsp/sat/pts1/PTS1predictor.jsp; prevê proteínas contendo o sinal 1 de alvejamento peroxissomal); SignalP (www.cbs.dtu.dk/services/SignalP/; prevê a presença e a localização de locais de clivagem no péptido de sinal em sequências de aminoácidos de diferentes organismos: Procariotas Gram-positivos, Procariotas Gram-negativos e eucariotas. O método incorpora a previsão dos locais de clivagem e a previsão de um peptídeo de sinal/não sinal baseada em uma combinação de várias redes neurais artificiais e modelos de Markov ocultos); e TargetP (www.cbs.dtu.dk/services/TargetP/); prevê a localização subcelular das proteínas eucarióticas - a localização atribuída é baseada na presença previsível de qualquer uma das pré-sequências N-terminais: péptido de trânsito do cloroplasto (cTP), peptídeo de alvejamento mitocondrial (mTP) ou peptídeo de sinal da via secretória (SP)). (Ver também, von Heijne, G., Eur J Biochem 133 (1) 17-21 (1983); Martoglio et al. Trends Cell Biol 8 (10):410-5 (1998);
Petição 870190074939, de 05/08/2019, pág. 76/178
61/117
Hegde et al. Trends Biochem Sci 31(10):563-71 (2006); Dultz et al. J Biol Chem 283(15):9966-76 (2008); Emanuelsson et al. Nature Protocols 2(4) 953-971(2007); Zuegge et al. 280(1-2):19-26 (2001); Neuberger et al. J Mol Biol. 328(3):567-79 (2003); e Neuberger et al. J Mol Biol. 328(3):581-92 5 (2003)).
Exemplos não-limitantes específicos de peptídeos de trânsito são fornecidos na Tabela 1.
Petição 870190074939, de 05/08/2019, pág. 77/178
Tabela 1. Os peptídeos líder que alvejam proteínas a vários organelos incluindo o cloroplasto, retículo endoplasmático, peroxissoma, mitocôndria e vacúolo.
Peptídeo de Trânsito Fonte de Proteí- na/Organismo Compartimento do Alvo Sub-Celular Sequência do Aminoácido
xFNR Cloroplasto mafvasvpvfanasglkteakvcqkpalknsffrgeevtsrsffasqavsakpattgevdttir (SEQ ID N°:105)
Cyt-C550 Synechococcus sp. PCC 7002 Cloroplasto MNKILGIDPLKKPIFGISAFVLLFWQLNVGAANA (SEQ ID N°:106)
Cyt-553 Synechocystis sp. PCC 6803 Cloroplasto MFKLFNQASRIFFGIALPCLIFLGGIFSLGNTALA (SEQ ID N°:107)
PSAF Synechocystis sp. PCC 6803 Cloroplasto MKHLLALLLAFTLWFNFAPSASA (SEQ ID N°:108)
P28 Chlamydomonas rei- nhardtii Cloroplasto MALVARPVLSARVAASRPRVAARKAVRVSA (SEQ ID N°:109)
P30 Chlamydomonas rei- nhardtii Cloroplasto MQALSSRVNIAAKPQRAQRLVVRA (SEQ ID N°:110)
P35 Chlamydomonas rei- nhardtii Cloroplasto MQTLASRPSLRASARVAPRRAPRVAVVTKA (SEQ ID N°:111)
P37 Chlamydomonas rei- nhardtii Cloroplasto MQALATRPSAIRPTKAARRSSVVVRA (SEQ ID N°:112)
SSRub Chlamydomonas rei- nhardtii Cloroplasto MAAVIAKSSVSAAVARPARSSVRPMAALKPA- VKAAPVAAPAQANQ (SEQ ID N°:113)
ATPase Chlamydomonas rei- nhardtii Cloroplasto MAAMLASKQGAFMGRSSFAPAPKGVASRGSLQVVA (SEQ ID N°:114)
62/117
Petição 870190074939, de 05/08/2019, pág. 78/178
Peptídeo de Trânsito Fonte de Proteí- na/Organismo Compartimento do Alvo Sub-Celular Sequência do Aminoácido
Cyt-C6 Cyanophora paradoxa Cloroplasto MAAFVAALPVIPSKAFIAGKADVAKAPVATNKGGVRM (SEQ ID N°:115)
EPSPS Dunaliella salina Cloroplasto MLARQGGSLRASQCNAGLARRVEVGALVVPRPISVNDVVPHVYSAPLSVARRSCSKSSIRSTRRLQTTVCSATLAAHSAP (SEQ ID N°:116)
Peptídeo de Trânsito Otimi- zado Cloroplasto MASISSSVATVSRTAPAQANMVAPFTGLKSNAAFPTTKKANDFSTLPSNGGRVQCMQVWPAYGNKKFETLSYLPPLSMAPTVMMASSATAVAPFQGLKSTASLPVARRSSRSLGNVSNGGRIRC (SEQ ID N°:117)
Sequência de sinal □ -Zein Sequência de Sinal da Proteína gama Zein 27 KDa de milho Retículo endoplasmático MRVLLVALALLALAASAT (SEQ ID N°:118)
Sinal de alvejamento do RE Retículo endoplasmático MetMetSerPheValSerLeuLeuLeuValGlyIleLeuPheTrpAlaThrGluAlaGluGlnLeuThrLysCysGuValPheGln (SEQ ID N°:119)
PTS2 Peroxissoma Arg-Leu-X5-His-Leu- (X = qualquer aminoácido) (SEQ ID N°:120)
Sinal de alvejamento da Mitocôndria Mitocôndrias MetLeuSerLeuArgGlnSerIleArgPhePheLysProAlaThrArg- ThrLeuCysSerSerArgTyrLeuLeu (SEQ ID N°:121)
63/117
Petição 870190074939, de 05/08/2019, pág. 79/178
Peptídeo de Trânsito Fonte de Proteí- na/Organismo Compartimento do Alvo Sub-Celular Sequência do Aminoácido
Sinal de alvejamento da Mitocôndria NADH-ubiquinona oxidorredutase, Bos taurus Mitocôndrias MLRIPVRKALVGLSKSSKGCVRT (SEQ ID N°:122)
xZmSOD3.1-01 Gene Superóxido Dismutase SOD 3.1 do Milho Mitocôndrias MALRTLASKKVLSFPFGGAGRPLAAAASAR (SEQ ID NO:123)
xZmHSP60-01 Proteína de choque térmico HSP60 do Milho Matriz mitocondrial MAYRAAASLASKARQAGNSLATRQVGSRLAWSR (SEQ ID N°:124)
Pro-peptídeo 37 AA N-terminal de Esporamina Batata-doce, Sinal de alvejamento Vacuolar MKAFTLALFLALSLYLLPNPAHSRFNPIRLPTTHEPA (SEQ ID N°:125)
xOsGlobVTS-01 Sinal de Alvejamento do Vacúolo da Globulina do Arroz Vacúolo de armaze- namento de proteínas MQLSESEMRFRDRQCQREVQD (SEQ ID N°:126)
64/117
Petição 870190074939, de 05/08/2019, pág. 80/178
65/117
Como aqui usado, o termo sequência nucleotídica refere-se a um heteropolímero de nucleotídeos ou a sequência destes nucleotídeos da extremidade 5' a 3' da molécula de ácido nucléico e inclui moléculas de ADN ou RNA, incluindo cADN, um fragmento de ADN, ADN genómico, ADN sintético (por exemplo, sintetizado quimicamente), ADN plasmídico, mRNA, RNA anti-senso, qualquer um dos quais pode ser de cadeia simples ou dupla. Os termos sequência nucleotídica, ácido nucléico, molécula de ácido nucléico, oligonucleotídeo e polinucleotídeo são também aqui usados alternadamente para referir um heteropolímero de nucleotídeos.
Os ácidos nucleicos da presente invenção pode compreender uma sequência nucleotídica que pode ser idêntica em sequência à sequência que ocorre naturalmente (i.e., do tipo nativo ou do tipo selvagem) ou, devido à degeneração bem-caracterizada do código do ácido nucléico, pode incluir códons alternativos que codificam para o mesmo aminoácido que é encontrado na sequência que ocorre naturalmente. Além disso, os ácidos nucleicos da presente invenção podem compreender as sequências de nucleotídeos que podem incluir códons que representam as substituições mais conservadoras dos aminoácidos como são bem conhecidas na arte, tal que a atividade biológica do polipeptídeo resultante e/ou fragmento é mantida. Um ácido nucléico da presente invenção pode ter uma cadeia simples ou dupla. Além disso, os ácidos nucleicos da presente invenção podem também incluir uma cadeia de ácidos nucléicos que são parcialmente complementares a uma parte da sequência de ácido nucléico ou completamente complementares em todo o comprimento da sequência de ácido nucléico. As sequências de ácidos nucléicos aqui fornecidas são aqui apresentadas na direção 5' para 3', da esquerda para a direita, e são representadas utilizando o código padrão para representação dos caracteres nucleotídicos, tal como definido nas regras de sequência U.S., 37 CFR § §1.821 - 1.825 e a Organização Mundial da Propriedade Intelectual (OMPI) Norma ST.25.
Tal como aqui usado, o termo gene refere-se a uma molécula de ácido nucléico capaz de ser usado para produzir mRNA ou RNA antisenso. Os genes podem ou não ser capazes de ser usados para produzir uma
Petição 870190074939, de 05/08/2019, pág. 81/178
66/117 proteína funcional. Os genes podem incluir ambas regiões codificantes e não codificantes (por exemplo, intrões, elementos reguladores, promotores, potenciadores, sequências de terminação e regiões não traduzidas 5' e 3'). Um gene pode ser isolado pelo que se entende que um ácido nucléico substancialmente ou essencialmente livre de componentes normalmente é encontrado em associação com o ácido nucléico em seu estado natural. Esses componentes incluem outro material celular, meio de cultura para produção recombinante, e/ou vários produtos químicos utilizados na síntese química do ácido nucléico.
Um ácido nucléico isolado da presente invenção é geralmente livre de sequências de ácidos nucléicos que flanqueiam o ácido nucléico de interesse no ADN genómico do organismo a partir do qual o ácido nucléico foi derivado (tal como sequências codificantes presentes nas extremidades 5' ou 3'). No entanto, o ácido nucléico da presente invenção pode incluir algumas bases adicionais ou porções que não afetam negativamente as características básicas estruturais e/ou funcionais do ácido nucléico. Isolado não significa que a preparação é tecnicamente pura (homogênea).
Assim, um ácido nucléico isolado é uma sequência nucleotídica que não é imediatamente contígua com sequências nucleotídicas com as quais ela seja imediatamente contígua (uma sobre a extremidade 5' e uma sobre a extremidade 3') no genoma que ocorre naturalmente do organismo do qual é derivado. Assim, em uma modalidade de realização, um ácido nucléico isolado inclui algumas ou todas as sequências 5' não codificantes (por exemplo, promotoras) que são imediatamente contíguas a uma sequência codificante. O termo inclui, portanto, por exemplo, um ácido nucléico recombinante que é incorporado em um vetor, em um plasmídeo ou vírus de replicação autónoma, ou no ADN genômico de um procariota ou eucariota, ou que existe como uma molécula separada (por exemplo, um cADN ou um fragmento de ADN genômico produzido por PCR ou por tratamento com endonucleases de restrição), independentemente de outras sequências. Inclui também um ácido nucléico recombinante que é parte de um ácido nucléico híbrido que codifica para um polipeptídeo ou sequência peptídica adicional.
Petição 870190074939, de 05/08/2019, pág. 82/178
67/117
O termo transgene tal como aqui usado, refere-se a qualquer sequência de ácido nucléico utilizada na transformação de uma planta, animal, ou de outro organismo. Assim, um transgene pode ser uma sequência codificante, uma sequência não-codificante, um cADN, um gene ou um seu fragmento ou porção, uma sequência genômica, um elemento regulador e similares. Um organismo transgênico, como uma planta transgênica, microrganismo transgênico, ou animal transgênico, é um organismo em que o transgene foi entregue ou introduzido e o transgene pode ser expresso no organismo transgênico para produzir um produto, cuja presença pode conferir um efeito e/ou um fenótipo no organismo.
Os termos complementar ou complementaridade, conforme aqui usados, referem-se à ligação natural dos polinucleotídeos sob condições salinas e de temperatura permissivas por emparelhamento de bases. Por exemplo, a sequência A-G-T liga-se à sequência complementar T-CA. A complementaridade entre duas moléculas de cadeia simples pode ser parcial, em que apenas alguns dos nucleotídeos se ligam, ou ela pode ser completa quando se verifica uma complementaridade total entre as moléculas de cadeia simples. O grau de complementaridade entre cadeias de ácidos nucléicos tem efeitos significativos sobre a eficiência e a força da hibridação entre cadeias de ácidos nucleicos.
Ácidos nucleicos ou proteínas diferentes contendo homologia são aqui referidos como sendo homólogos. O termo homólogo inclui sequências homólogas da mesma e de outras espécies e as sequências ortólogas provenientes da mesma e de outras espécies. O termo homologia refere-se ao grau de similaridade entre dois ou mais ácidos nucleicos e/ou sequências de aminoácidos em termos de percentagem de identidade posicional (i.e., semelhança ou identidade da sequência). A homologia também se refere ao conceito de propriedades funcionais semelhantes entre ácidos nucleicos ou proteínas diferentes.
Tal como aqui utilizado, o termo identidade da sequência refere-se ao grau em que duas sequências polinucleotídicas ou peptídicas otimamente alinhadas são invariantes ao longo de um janela de alinhamento
Petição 870190074939, de 05/08/2019, pág. 83/178
68/117 dos componentes, por exemplo, nucleotídeos ou aminoácidos. Uma fração de identidade para segmentos alinhados de uma sequência de teste e uma sequência de referência é o número de componentes idênticos que são partilhados pelas duas sequências alinhadas divididas pelo número total de componentes em segmento de sequência de referência, i.e., a totalidade da sequência de referência ou uma menor parte definida da sequência de referência. Tal como é aqui utilizada, a expressão percentagem da identidade de sequência ou percentagem de identidade refere-se à percentagem de nucleotídeos idênticos em uma sequência linear de polinucleotídeo de uma molécula polinucleotídica de referência (controlo)(ou a sua cadeia complementar) em comparação com uma molécula polinucleotídica de teste (objeto) (ou a sua cadeia complementar) quando as duas seqüências são perfeitamente alinhadas (com inserções nucleotídicas apropriadas, deleções ou lacunas totalizando menos de 20% da sequência de referência sobre a janela de comparação). Em algumas modalidades de realização, a percentagem de identidade pode referir-se à percentagem de aminoácidos idênticos em uma sequência de aminoácidos.
O alinhamento ótimo de seqüências para alinhar uma janela de comparação é bem conhecido para os especialistas na arte e pode ser realizado através de ferramentas tais como o algoritmo de homologia local de Smith e Waterman, o algoritmo de alinhamento da homologia de Needleman e Wunsch, a busca pelo método de similaridade de Pearson e Lipman, e opcionalmente por implementações informatizadas desses algoritmos, tais como GAP, BESTFIT, FASTA, e TFASTA disponíveis como parte do Pacote Wisconsin® GCG® (Accelrys Inc., Burlington, Mass.). Uma fração de identidade para segmentos alinhados de uma sequência de teste e uma sequência de referência é o número de componentes idênticos que são partilhados pelas duas sequências alinhadas dividido pelo número total de componentes no segmento da sequência de referência, i.e., a totalidade da sequência de referência ou uma menor parte definida da sequência de referência. A percentagem de identidade da sequência é representada como a fração de identidade multiplicada por 100. A comparação de uma ou mais sequências
Petição 870190074939, de 05/08/2019, pág. 84/178
69/117 polinucleotídicas pode ser com uma sequência o comprimento total de uma sequência polinucleotídica, ou com uma sua porção, ou com uma sequência polinucleotídica mais longa. Para fins da presente invenção a percentagem de identidade também pode ser determinada usando uma versão BLASTX 2.0 para sequências de nucleotídeos traduzidas e a versão BLASTN 2.0 para sequências polinucleotídicas.
A percentagem da identidade de sequência pode ser determinada usando o programa Best fit ou Gap programa do Sequence Analysis Software Package™ (Versão 10; Genetics Computer Group, Inc., Madison, Wis.). O Gap utiliza o algoritmo de Needleman e e Wunsch (Needleman e Wunsch, J Mol. Biol. 48:443-453, 1970) para encontrar o alinhamento de duas seqüências que maximiza o número de correspondências e minimiza o número de lacunas. O BestFit executa um alinhamento ótimo do melhor segmento de similaridade entre duas seqüências e insere lacunas para maximizar o número de correspondências utilizando o algoritmo de homologia local de Smith e Waterman (Smith e Waterman, Adv. Appl. Math., 2:482-489, 1981, Smith et al., Nucleic Acids Res. 11:2205-2220, 1983).
Os métodos úteis para determinar a identidade de sequência são também divulgados no Guide to Huge Computers (Martin J. Bishop, ed., Academic Press, San Diego (1994)), e Carillo, H., e Lipton, D., (Applied Math 48:1073(1988)). Mais particularmente, os programas de computador preferidos para determinar a identidade da sequência incluem mas não se limitam aos programas Basic Local Alignment Search Tool (BLAST) que estão publicamente disponíveis através da National Center Biotechnology Information (NCBI) na National Library of Medicine, National Institute of Health, Bethesda, Md. 20894; ver Manual BLAST, Altschul et al., NCBI, NLM, NIH; (Altschul et al., J. Mol. Biol. 215:403-410 (1990)); a versão 2.0 ou superior dos programas BLAST permite a introdução de lacunas (deleções e inserções) nos alinhamentos; para seqüências de peptídeos o BLASTX pode ser utilizado para determinar a identidade de sequência; e, para seqüências de polinucleotídeos o BLASTN pode ser utilizado para determinar a identidade de sequência.
Petição 870190074939, de 05/08/2019, pág. 85/178
70/117
Como aqui usado, o termo promotor refere-se a uma região de uma sequência de nucleotídeos que incorpora os sinais necessários para a expressão eficiente de uma sequência codificante. Este pode incluir sequências com as quais uma RNA polimerase se liga, mas não está limitado a essas seqüências e pode incluir regiões com as quais outras proteínas reguladoras se liguem, juntamente com as regiões envolvidas no controlo da tradução de proteínas e podem também incluir seqüências codificantes.
Adicionalmente, um promotor desta invenção é um promotor capaz de iniciar a transcrição em células de um organismo de interesse (por exemplo, animal, planta, microrganismo). Tais promotores incluem aqueles que conduzem a expressão de uma sequência nuclotídica constitutivamente, aqueles que conduzem a expressão quando induzida, e aqueles que conduzem a expressão em um tecido- ou de um modo específico em termos evolutivos, na medida em que estes vários tipos de promotores são conhecidos na arte.
O termo transformação tal como aqui usado refere-se à introdução de um ácido nucléico heterólogo em uma célula. A transformação de uma célula pode ser estável ou transitória. O termo transformação transitória ou transientemente transformada refere-se à introdução de um ou mais ácidos nucléicos heterólogos em uma célula onde o ácido nucléico heterólogo não é hereditário de uma geração para outra.
A transformação estável ou estavelmente transformada refere-se à integração de um ácido nucléico heterólogo no genoma do organismo ou a incorporação do ácido nucléico heterólogo na célula ou células do organismo (por exemplo, através de um plasmídeo) de tal modo que o ácido nucléico heterólogo é hereditário ao longo de gerações repetidamente. Assim, em uma modalidade de realização da presente invenção um organismo transformado de um modo estável é produzido. Em outras modalidades de realização da presente invenção, uma planta transformada de um modo estável é produzida.
A transformação transitória pode ser detetada por, por exemplo, um ensaio imunoadsorvente ligado à enzima (ELISA) ou por Western blot,
Petição 870190074939, de 05/08/2019, pág. 86/178
71/117 que pode detetar a presença de um peptídeo ou polipeptídeo codificado por um ou mais transgenes introduzidos num organismo. A transformação estável de uma célula pode ser detetada através de, por exemplo, um ensaio de hibridação por Southern blot do ADN genômico de células com sequências de ácido nucléico que hibridam especificamente com uma sequência de nucleotídeos de um transgene introduzido em um organismo (por exemplo, uma planta). A transformação estável de uma célula pode ser detetada através de, por exemplo, um ensaio de hibridação por Northern blot do RNA da célula com sequências de ácido nucléico que hibridam especificamente com uma sequência de nucleotídeos de um transgene introduzido em uma planta ou outro organismo. A transformação estável de uma célula pode também ser detetada por, por exemplo, uma reação em cadeia da polimerase (PCR) ou outros reações de amplificação como são bem conhecidas na arte, empregando sequências iniciadoras específicas que hibridam com sequência alvo de um transgene, resultando na amplificação da sequência do transgene, que pode ser detetada de acordo com os métodos padrão. A transformação também pode ser detetada por sequenciação direta e/ou por protocolos de hibridação bem conhecidos na arte.
Um ácido nucléico (por exemplo, o mRNA selecionado) desta invenção pode ser introduzido em uma célula por qualquer método conhecido para aos especialistas na arte. Em algumas modalidades de realização da presente invenção, a transformação de uma célula compreende a transformação nuclear. Em outras modalidades de realização, a transformação de uma célula compreende a transformação do plastídeo (por exemplo, transformação dos cloroplastos). Assim, os mRNAs selecionados de acordo com os métodos da presente invenção podem ser utilizados para transformar qualquer organismo, utilizando métodos conhecidos para os especialistas na arte.
Os procedimentos para transformar uma grande variedade de organismos, incluindo, mas não limitando a, uma bactéria, uma cianobactéria, um animal, uma planta, um fungo, e semelhantes, são bem conhecidos e comuns na arte e são descritos em toda a bibliografia. Como exemplo, tais
Petição 870190074939, de 05/08/2019, pág. 87/178
72/117 métodos de transformação de plantas incluem, mas não estão limitados a, transformação através da entrega de ácidos nucléicos mediada por bactérias (por exemplo, via Agrobacteria), entrega de ácidos nucléicos mediada por vírus, entrega de ácidos nucléicos mediada por carboneto de silício ou whiskers de ácidos nucleicos, entrega de ácidos nucléicos mediada por lipossomas, microinjeção, bombardeamento de micropartículas, eletroporação, sonicação, infiltração, captação de ácidos nucleicos mediada por PEG, bem como qualquer outro mecanismo elétrico, químico, físico (mecânico) e/ou mecanismo biológico que resulta na introdução do ácido nucléico na célula vegetal, incluindo uma qualquer sua combinação. Os guias gerais de vários métodos de transformação de plantas, conhecidos na arte, incluem Miki et al. (Procedures for Introducing Foreign DNA into Plants em Methods in Plant Molecular Biology and Biotechnology, Glick, B. R. e Thompson, J. E., Eds. (CRC Press, Inc., Boca Raton, 1993), páginas 67-88) e RakowoczyTrojanowska (Cell. Mol. Biol. Lett. 7:849-858 (2002)).
O termo vetor refere-se a uma composição para transferir, entregar ou introduzir um ácido nucléico (ou ácidos nucleicos) em uma célula. Um vetor compreende um ácido nucléico compreendendo a sequência de nucleotídeos a ser transferida, entregue ou introduzida. Em algumas modalidades de realização, um vetor da presente invenção pode ser um vetor viral, que pode incluir, por exemplo, um capsídeo viral e/ou outros materiais para facilitar a entrada do ácido nucléico em uma célula e/ou a replicação de ácidos nucléicos do vetor na célula (por exemplo, a transcritase reversa ou outras enzimas que estão empacotadas dentro do capsídeo, ou como parte do capsídeo). O vetor viral pode ser uma partícula viral infecciosa que entrega o ácido nucléico em uma célula após a infeção da célula pelas partículas virais.
Assim, em determinadas modalidades de realização da presente invenção, uma célula vegetal pode ser transformada por qualquer método conhecido na arte e como aqui descrito podem ser regeneradas plantas intactas a partir dessas células transformadas utilizando uma qualquer variedade de técnicas já conhecidas. A regeneração de plantas a partir de células
Petição 870190074939, de 05/08/2019, pág. 88/178
73/117 vegetais, cultura de tecidos vegetais e/ou culturas de protoplastos é descrita, por exemplo, em Evans et al. (Handbook of Plant Cell Cultures, Vol. 1, MacMilan Publishing Co. New York (1983)); e Vasil I.R. (ed.) (Cell Culture and Somatic Cell Genetics of Plants, Acad. Press, Orlando, Vol. I (1984), e Vol. II (1986)). Os métodos de seleção para plantas transgénicas transformadas, células vegetais e/ou culturas de tecidos vegetais são rotineiros na arte e podem ser empregues nos métodos de invenção aqui fornecidos.
Assim, em algumas modalidades de realização da presente invenção, um mRNA que codifica para um polipeptídeo de interesse selecionado através dos métodos descritos aqui podem ser introduzido em uma célula eucariota para produzir uma célula eucariota transgênica ou um organismo eucariota transgênico que produz assim uma quantidade melhorada ou diminuída do polipeptídeo de interesse em relação à quantidade de proteína produzida pelo tipo selvagem (i.e., nativo) o mRNA codifica para o mesmo polipeptídeo de interesse como o mRNA selecionado de acordo com os métodos da presente invenção. Assim, em algumas modalidades de realização da presente invenção, um primeiro mRNA que codifica para um polipeptídeo de interesse selecionado usando os métodos descritos aqui pode ser introduzido em uma célula eucariota para produzir uma célula eucariota transgênica ou um organismo eucariota transgênico que produz assim uma quantidade melhorada ou diminuída do polipeptídeo de interesse em relação à quantidade de proteína produzida por um segundo mRNA selecionado usando os métodos aqui descritos e codificando para o mesmo polipeptídeo de interesse que o primeiro mRNA.
Em modalidades de realização adicionais, um mRNA codificando para um polipeptídeo de interesse selecionado usando os métodos descritos aqui, pode ser utilizado como descrito a seguir para modificar (melhorar ou reduzir) a produção de proteínas de uma sequência nucleotídica endógena (por exemplo, presente no genoma) codificando para o mesmo polipeptídeo de interesse que o codificado pelo mRNA que é selecionado utilizando os métodos aqui descritos. Assim, em algumas modalidades de realização da presente invenção, é fornecido um método para modificar a produção de um
Petição 870190074939, de 05/08/2019, pág. 89/178
74/117 polipeptídeo de interesse em uma célula de um organismo, o método compreendendo: (a) seleção de um mRNA que codifica para um polipeptídeo de interesse de acordo com os métodos da presente invenção; (b) identificação das diferenças entre a sequência nucleotídica do mRNA selecionado de acordo com (a) e uma sequência nucleotídica endógena do tipo selvagem do referido organismo, em que a sequência nucleotídica endógena do tipo selvagem codifica para um polipeptídeo de interesse, que é o mesmo que é codificado pelo mRNA selecionado de acordo com (a); e (c) mutação in situ da sequência nucleotídica endógena que codifica para o polipeptídeo de interesse para integrar cada uma das diferenças do nucleotídeo identificadas em (b) na sequência nucleotídica endógena, na qual a produção do polipeptídeo de interesse a partir da sequência nucleotídica endógena in situ mutada na célula do organismo é modificada. Os métodos de modificação in situ de sequências nucleotídicas são conhecidos na arte. Assim, por exemplo, as nucleases com motivo em dedo de zinco podem ser utilizadas como descrito por Cai et al. (Plant Mol Biol. 69(6):699-709 (2009)) para conduzir a integração do ADN direcionada localmente em sequências de nucleotídeos nativas.
O alvejamento de genes e a modificação do ADN genômico pode também ser realizado através do uso de nucleases efetoras (TAL) semelhantes a ativadores, tal como é conhecido pelos especialistas na arte. WO10054348, Shornack, S. et al. Gene-for gen mediated recognition of nuclear-targeted AvrBs-like bacterial effector proteins, Journal of Plant Physiology, 163 (2006) 256-272, Boch et al., Breaking the code of DNA binding specificity of TAL-type III effectors, Science, Vol 326, Dezembro 2009.
Um organismo transgênico é também aqui fornecido, compreendendo, consistindo essencialmente em e/ou consistindo em um ou mais constructos de ácidos nucléicos da presente invenção. Um organismo transgênico é aqui adicionalmente fornecido compreendendo uma célula transformada da presente invenção.
Em modalidades de realização particulares, uma planta transgênica é aqui fornecida, compreendendo, consistindo essencialmente em e/ou consistindo em um ou mais constructos de ácidos nucléicos da presente inPetição 870190074939, de 05/08/2019, pág. 90/178
75/117 venção. Uma planta transgênica é aqui adicionalmente fornecida compreendendo uma célula vegetal transformada da presente invenção.
Adicionalmente é aqui fornecida uma semente transgênica, um grão de pólen transgênico e um óvulo transgênico da planta transgênica da presente invenção. É adicionalmente fornecida uma cultura de tecidos de células transgênicas regeneráveis da planta transgênica da presente invenção.
A presente invenção fornece adicionalmente um método de seleção de um mRNA para a produção melhorada de um polipeptídeo de interesse, o método compreendendo a determinação de uma sequência de nucleotídeos de um mRNA que codifica para o polipeptídeo de interesse, em que o mRNA possui uma estrutura secundária compreendendo menos de quatro pares de bases de nucleotídeos e um códon iniciador não compreendendo pares de bases de nucleotídeos.
Adicionalmente é aqui fornecido um método de seleção de um mRNA para a produção reduzida de um polipeptídeo de interesse, o método compreendendo a determinação de uma sequência de nucleotídeos de um mRNA que codifica para o polipeptídeo de interesse, em que o mRNA possui uma estrutura secundária compreendendo pelo menos seis pares de bases de nucleotídeos e um códon iniciador compreendendo pelo menos um par de bases.
Em modalidades de realização adicionais, a presente invenção fornece métodos implementados por computador para seleção de um mRNA para produção de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências individuais do mRNA compreendendo diferentes sequências de nucleotídeos que codificam para o polipeptídeo de interesse; b) determinação de um ou mais dos seguintes parâmetros para cada sequência individual do mRNA de (a): (i) conjunto energia livre (EFE); (ii) frequência da energia livre mínima (FMFE) estrutura secundária do RNA em um conjunto termodinâmico; e (iii) diversidade do conjunto (ED); c) classificação das sequências individuais do mRNA da matriz de acordo com os parâmetros determinados na etapa (b); e d) selecionar uma sequência de
Petição 870190074939, de 05/08/2019, pág. 91/178
76/117 mRNA da matriz classificada do passo (c), em que o mRNA selecionado produz o polipeptídeo de interesse.
Em modalidades de realização adicionais, a presente invenção fornece um método implementado por computador para a seleção de um mRNA para produção de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências individuais de mRNA compreendendo diferentes sequências de nucleotídeos que codificam para o polipeptídeo de interesse; b) determinação da energia livre mínima (MFE) da estrutura secundária do RNA para cada sequência individual do mRNA de (a); c) determinação de um ou mais dos seguintes parâmetros para cada sequência individual do mRNA de (a): (i) frequência da energia livre mínima (FMFE) da estrutura secundária do RNA em um conjunto termodinâmico; e (ii) diversidade do conjunto (ED); d) classificação das sequências individuais do mRNA da matriz de acordo com uma distribuição conjunta dos parâmetros determinados nas etapas (b) e (c) acima; e e) selecionar uma sequência de mRNA da matriz classificada do passo (d), em que o mRNA selecionado produz o polipeptídeo de interesse.
Em outros aspectos, a presente invenção fornece um método implementado por computador para a seleção de um mRNA para produção de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências individuais do mRNA compreendendo diferentes sequências de nucleotídeos que codificam para o polipeptídeo de interesse; b) determinação da energia livre do conjunto (EFE) para cada sequência individual do mRNA de (a); c) determinação de um ou mais dos seguintes parâmetros para cada sequência individual do mRNA de (a): (i) frequência da energia livre mínima (FMFE) da estrutura secundária do RNA em um conjunto termodinâmico; e (ii) diversidade do conjunto (ED); d) classificação das sequências individuais do mRNA da matriz de acordo com uma distribuição conjunta dos parâmetros determinados nas etapas (b) e (c) acima; e e) selecionar uma sequência de mRNA da matriz classificada do passo (d), em que o mRNA selecionado produz o polipeptídeo de interesse.
As modalidades de realização de acordo com a presente invenPetição 870190074939, de 05/08/2019, pág. 92/178
77/117 ção fornecem um método implementado por computador para a seleção de um mRNA para uma produção melhorada de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências individuais de mRNA compreendendo diferentes sequências nucleotídicas que codificam para o polipeptídeo de interesse; b) determinação da energia livre mínima (MFE) da estrutura do RNA para cada sequência individual do mRNA de (a) e frequência da energia livre mínima (FMFE) da estrutura secundária do RNA em um conjunto termodinâmico para cada sequência individual de mRNA de (a); c) classificação das sequências mRNA da matriz de acordo com uma distribuição conjunta da MFE e FMFE determinadas na etapa (b) acima; e d) seleção de uma sequência de mRNA a partir da matriz classificada do passo (c), em que o mRNA é selecionado de entre cerca de 0,0001% até cerca de 20% das sequências na matriz classificada com os valores mais elevados para MFE da estrutura secundária do RNA e os valores mais baixos para FMFE da estrutura secundária do RNA ou da sequência de mRNA é selecionado de entre as sequências de mRNA contendo uma MFE da estrutura secundária do RNA compreendida entre cerca de 0 kcal/mol até cerca de -2 kcal/mol, tal como medido à temperatura ambiente e os valores mais baixos para a FMFE da estrutura secundária do RNA, em que a expressão da sequência do mRNA selecionada resulta em uma produção melhorada do polipeptídeo de interesse, em relação à sequência de mRNA do tipo selvagem.
Em outras modalidades de realização, é fornecido um método implementado por computador para a seleção de um mRNA para uma produção reduzida de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências individuais de mRNA compreendendo diferentes sequências nucleotídicas que codificam para o polipeptídeo de interesse; b) determinação da energia livre mínima (MFE) da estrutura secundária do RNA para cada sequência individual do mRNA de (a) e frequência da energia livre mínima (FMFE) da estrutura secundária do RNA em um conjunto termodinâmico para cada sequência individual de mRNA de (a); c) classificação das sequências individuais de mRNA da matriz de acordo
Petição 870190074939, de 05/08/2019, pág. 93/178
78/117 com uma distribuição conjunta da MFE e FMFE determinadas na etapa (b) acima; e d) seleção de uma sequência de mRNA a partir da matriz classificada do passo (c), em que o mRNA é selecionado de entre aproximadamente 0,0001% até cerca de 20% das sequências na matriz classificada com os valores mais baixos para MFE da estrutura secundária do RNA e os valores mais elevados para FMFE da estrutura secundária do RNA ou da sequência de mRNA é selecionada de entre as sequências de mRNA contendo uma MFE da estrutura secundária do RNA compreendida entre cerca de -9 kcal/mol até cerca de -18 kcal/mol, tal como medido à temperatura ambiente e os valores mais elevados para a FMFE da estrutura secundária do RNA, em que a expressão da sequência do mRNA selecionado resulta em uma produção reduzida do polipeptídeo de interesse, em relação à sequência de mRNA do tipo selvagem.
Ainda em outras modalidades de realização da invenção é proporcionado um método implementado por computador para seleção de um mRNA para a produção melhorada de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências individuais de mRNA compreendendo diferentes sequências nucleotídicas que codificam para o polipeptídeo de interesse; b) determinação da energia livre do conjunto (EFE) para cada sequência individual do mRNA de (a) e frequência da energia livre mínima (FMFE) da estrutura secundária do RNA em um conjunto termodinâmico para cada sequência individual do mRNA de (a); e c) classificação das sequências individuais de mRNA da matriz de acordo com uma distribuição conjunta da EFE e FMFE determinadas na etapa (b) acima; e d) seleção de uma sequência de mRNA a partir da matriz classificada do passo (c), em que o mRNA é selecionado de entre cerca de 0,0001% até cerca de 20% das sequências na matriz classificada com os valores mais elevados para EFE e os valores mais baixos para FMFE da estrutura secundária do RNA.
Em modalidades de realização adicionais da invenção proporciona um método implementado por computador para seleção de um mRNA para a produção reduzida de um polipeptídeo de interesse, os métodos
Petição 870190074939, de 05/08/2019, pág. 94/178
79/117 compreendendo: a) produção de uma matriz de sequências individuais de mRNA compreendendo diferentes sequências nucleotídicas que codificam para o polipeptídeo de interesse; b) determinação da energia livre do conjunto (EFE) para cada sequência individual do mRNA de (a) e frequência da energia livre mínima (FMFE) da estrutura secundária do RNA em um conjunto termodinâmico; c) classificação das sequências individuais de mRNA da matriz de acordo com uma distribuição conjunta da EFE e FMFE determinadas na etapa (b) acima; e d) seleção de uma sequência de mRNA a partir da matriz classificada do passo (c), em que o mRNA é selecionado de entre cerca de 0,0001% até cerca de 20% das sequências na matriz classificada com os valores mais baixos para EFE e os valores mais elevados para a FMFE da estrutura secundária do RNA.
A presente invenção fornece adicionalmente um método implementado por computador para a seleção de um mRNA para a produção de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências de mRNA individuais compreendendo diferentes sequências nucleotídicas que codificam para o polipeptídeo de interesse; b) determinação da energia livre mínima (MFE) da estrutura secundária do RNA para cada sequência individual do mRNA de (a); c) classificação das sequências individuais do mRNA da matriz de acordo com a MFE da estrutura secundária do RNA determinada em (b) da mais alta MFE da estrutura secundária do RNA para a menor MFE da estrutura secundária do RNA; e d) seleção de uma sequência de mRNA a partir da matriz classificada do passo (c), em que o mRNA é selecionado a partir do grupo de mRNAs contendo a MFE da estrutura secundária do RNA em uma gama de cerca de 0 kcal/mol a cerca de -2 kcal/mol, o grupo dos mRNAs contendo uma MFE da estrutura secundária do RNA em uma gama de cerca de -2 kcal/mol a cerca de -9 kcal/mol, ou o grupo de mRNAs contendo uma MFE da estrutura secundária do RNA em uma gama de cerca de -9 kcal/mol a cerca de -18 kcal/mol, em que o mRNA selecionado produz o polipeptídeo de interesse.
Petição 870190074939, de 05/08/2019, pág. 95/178
80/117
Adicionalmente é fornecido um método implementado por computador para seleção de um mRNA para a produção aumentada de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências individuais de mRNA compreendendo diferentes sequências nucleotídicas que codificam para o polipeptídeo de interesse; b) determinação da energia livre mínima (MFE) da estrutura secundária do RNA para cada sequência individual de mRNA de (a); e c) seleção de uma sequência de mRNA de (a) contendo uma MFE da estrutura secundária do RNA na gama de cerca de 0 kcal/mol a cerca de -2 kcal/mol, em que a expressão da sequência de mRNA selecionada resulta em uma produção aumentada do polipeptídeo de interesse em relação à sequência de mRNA do tipo selvagem.
Em aspectos adicionais da presente invenção, é fornecido um método implementado por computador para seleção de um mRNA para a produção reduzida de um polipeptídeo de interesse, o método compreendendo: a) produção de uma matriz de sequências individuais de mRNA compreendendo diferentes sequências nucleotídicas que codificam para o polipeptídeo de interesse; b) determinação da energia livre mínima (MFE) da estrutura secundária do RNA para cada sequência individual de mRNA de (a) e o nível de expressão de cada sequência individual de mRNA de (a); c) seleção de uma sequência de mRNA de (a) contendo uma MFE da estrutura secundária do RNA na gama de cerca de -9 kcal/mol a cerca de -18 kcal/mol, em que a expressão da sequência de mRNA selecionada resulta em uma produção aumentada do polipeptídeo de interesse em relação à sequência de mRNA do tipo selvagem.
Em algumas modalidades de realização da presente invenção, é fornecido um método implementado por computador para modificar a produção de um polipeptídeo de interesse em uma célula de um organismo, o método compreendendo: (a) seleção de um mRNA que codifica para um polipeptídeo de interesse, de acordo com os métodos da presente invenção; (b) mutação da sequência nucleotídica do mRNA de (a) para produzir um mRNA mutado contendo uma MFE aumentada ou reduzida da estrutura secundária
Petição 870190074939, de 05/08/2019, pág. 96/178
81/117 do RNA, em relação à MFE da estrutura secundária do RNA da sequência nucleotídica do mRNA de (a)) e que codifica para uma sequência polipeptídica que é mutada em comparação com a sequência polipeptídica codificada pelo mRNA de (a); em que a sequência polipeptídica mutada mantém a função do polipeptídeo codificado pelo mRNA de (a), e a expressão da sequência do mRNA mutada em uma célula de um organismo resulta na produção modificada do polipeptídeo de interesse em relação à sequência de mRNA do tipo selvagem.
Em modalidades de realização adicionais da presente invenção, é fornecido um método implementado por computador para modificar a produção de um polipeptídeo de interesse em uma célula de um organismo, o método compreendendo: (a) seleção de um mRNA que codifica para um polipeptídeo de interesse de os acordo com os métodos da presente invenção; (b) identificação das diferenças entre a sequência nucleotídica do mRNA selecionado de acordo com (a) e uma sequência nucleotídica endógena do tipo selvagem do referido organismo, em que a sequência nucleotídica endógena do tipo selvagem codifica para um polipeptídeo de interesse, que é o mesmo que é codificado pelo mRNA selecionado de acordo com (a); e (c) mutação in situ da sequência nucleotídica endógena que codifica para o polipeptídeo de interesse para integrar cada uma das diferenças do nucleotídeo identificadas em (b) na sequência nucleotídica endógena, na qual a produção do polipeptídeo de interesse a partir da sequência nucleotídica endógena in situ mutada na célula do organismo é modificada.
Em algumas modalidades de realização, são fornecidos sistemas e/ou produtos de programas de computador para a realização dos métodos aqui descritos. De um modo concordante, a presente invenção é descrita abaixo com referência a esquemas em bloco e/ou iluastrações em fluxograma de métodos, aparelhos (sistemas) e/ou produtos de programa de computador, de acordo com modalidades de realização da invenção. Entende-se que cada bloco de esquemas em bloco e/ou ilustrações de fluxograma, e combinações de blocos em esquemas em bloco e/ou ilustrações de fluxograma, podem ser implementados por instruções de programa de comPetição 870190074939, de 05/08/2019, pág. 97/178
82/117 putador. Estas instruções de programa de computador poderão ser fornecidas a um processador de um computador generalista, de um computador com determinada finalidade, e/ou outro aparelho de processamento de dados programáveis para produzir uma máquina, de modo que as instruções, que são executadas através do processador do computador e/ou de outros aparelhos de processamento de dados programáveis, criar meios para implementar as funções/atos especificados nos diagramas de bloco e/ou blocos do fluxograma ou blocos.
Estas instruções do programa de computador também podem ser armazenadas em uma memória legível em computador que pode induzir um computador ou outros aparelhos de processamento de dados programáveis a funcionar de uma determinada maneira, de tal modo que as instruções armazenadas na memória legível em computador produzem um artigo de fabricação, incluindo as instruções que implementam a função/ato especificado nos esquemas em bloco e/ou blocos do fluxograma ou blocos.
As instruções do programa de computador também podem ser carregadas em um computador ou em outros aparelhos de processamento de dados programáveis para causar uma série de etapas operacionais para serem realizadas sobre o computador ou outro aparelho programável para produzir um processo implementado por computador, de tal modo que as instruções que executam sobre o computador ou outro aparelho programável fornecem etapas para a implementação das funções/atos especificados nos esquemas em bloco e/ou blocos do fluxograma ou blocos.
Assim, a presente invenção pode ser concretizada em hardware e/ou em software (incluindo firmware, software residente, micro-código, etc.). Além disso, modalidades de realização da presente invenção podem tomar a forma de um produto de programa de computador em um meio de armazenamento, utilizável em computador ou legível em computador, contendo o código do programa utilizável em computador ou legível em computador, concretizado meio para utilização por ou em ligação com um sistema de execução da instrução. No contexto do presente documento, um médio utilizável em computador ou legível por computador pode ser qualquer meio que
Petição 870190074939, de 05/08/2019, pág. 98/178
83/117 pode conter ou armazenar o programa para uso através de, ou em ligação com, o sistema de execução de instruções, o aparelho, ou dispositivo.
Como ilustrado na Figura 1, as operações de acordo com algumas modalidades de realização da presente invenção incluem a produção de uma matriz de sequências de mRNA que codificam para um polipeptídeo de interesse (Bloco 10). Por exemplo, uma sequência de aminoácidos de entrada é selecionada e utilizando um procedimento de amostragem aleatória são geradas as sequências nucleotídicas que codificam para a sequência de aminoácidos de entrada. Os parâmetros termodinâmicos são determinados para cada sequência de mRNA individual na matriz (Bloco 20). Os dados do parâmetro são fornecidos para cada uma das sequências individuais de mRNA da matriz (Bloco 30). As sequências individuais de mRNA são classificadas de acordo com o valor determinado para cada parâmetro (Bloco 40). No caso em que mais do que um parâmetro é determinado, a classificação está de acordo com uma distribuição conjunta dos parâmetros. Uma sequência de mRNA é selecionada a partir das sequências de mRNA classificadas com base no nível de produção da proteína desejada (Bloco 50). Um nível desejado da produção de proteínas pode ser qualquer nível de produção de proteínas incluindo a produção de proteínas grandemente melhorada, melhorada, moderadamente melhorada, moderadamente reduzida ou reduzida ou grandemente reduzida.
Como ilustrado na Figura 2, um sistema de processamento de dados inclui um processador 110. O processador 110 se comunica com a memória 114 através de um endereço/dados bus 148. O processador 110 pode ser qualquer microprocessador disponível comercialmente ou personalizado. A memória 114 é representativa da hierarquia global de dispositivos de memória contendo o software e os dados usados para implementar a funcionalidade do sistema de processamento de dados 100. A memória 114 pode incluir, mas não se limita a, os seguintes tipos de dispositivos: cache, ROM, PROM, EPROM, EEPROM, memória flash, SRAM e DRAM.
Como apresentado na Figura 2, a memória 114 pode incluir várias categorias de software e dados utilizados no sistema de processamento
Petição 870190074939, de 05/08/2019, pág. 99/178
84/117 de dados: os programas da aplicação 140, o sistema operativo 142; os dispositivos condutores de entrada/saída (I/O) 148; e os dados 146. Os programas da aplicação 140 podem incluir um módulo de seleção do mRNA 150 e/ou um módulo de produção da matriz do mRNA 152. Em o módulo de produção da matriz do mRNA 152, uma sequência de aminoácidos de entrada pode ser utilizada para gerar uma matriz de sequências de mRNA que codificam para a sequência de aminoácidos de entrada. Em o módulo de seleção do mRNA 150, os mRNAs podem ser classificados com base nos valores para os parâmetros determinados para os mRNAs individuais da matriz, e o mRNA pode ser selecionado com base no nível desejado de produção de proteínas. Os dados 146 podem incluir os dados dos parâmetros determinados para as seqüências individuais de mRNA para uma matriz 160 e a distribuição dos mRNAs individuais na matriz 162. O módulo de seleção 150 do mRNA e o de produção da matriz do mRNA 152 podem ser configurados para levar a cabo as operações discutidas na Figura 1.
Como será apreciado pelos especialistas na arte, o sistema operativo 152 apresentado na Figura 2 pode ser qualquer sistema operativo adequado para utilização com um sistema de processamento de dados, tal como OS/2, AIX, OS/390 ou System390 da International Business Machines Corporation, Armonk, NY, Windows CE, Windows NT, Windows95, Windows98, Windows2000 ou WindowsXP da Microsoft Corporation, Redmond, WA, Unix ou Linux ou FreeBSD, Mac OS da Apple Computer, ou sistemas operativos protegidos. Os dispositivos condutores I/O 148 incluem tipicamente as rotinas de software acessadas através do sistema operativo 142 pelos programas da aplicação 144 para comunicar com dispositivos tais como portas de dados(s) de I/O, dados 146 e alguns componentes da memória 114 e/ou o sistema de processamento de imagem de lâminas para histologia 120. Os programas da aplicação 140 são ilustrativos dos programas que implementam as várias características do sistema de processamento de dados 100 e podem incluir, pelo menos, uma aplicação que suporta operações de acordo com as modalidades de realização da presente invenção. Finalmente, os dados 140 representam os dados estáticos e dinâmicos utilizados pePetição 870190074939, de 05/08/2019, pág. 100/178
85/117 los programas da aplicação 140, o sistema operativo 142, os dispositivos condutores de I/O 148, e outros programas de software que podem residir na memória 114.
Enquanto a presente invenção é ilustrada, por exemplo, com referência ao módulo de seleção do mRNA 150 e ao módulo de produção da matriz do mRNA 152 estando o programa da aplicação na Figura 2, como será apreciado pelos especialistas na arte, outras configurações também podem ser utilizadas de acordo com modalidades de realização da presente invenção. Por exemplo, o módulo de seleção do mRNA 150 também pode ser incorporado no sistema operativo 142, os dispositivos condutores I/O 148 ou outra tal divisão lógica do sistema de processamento de dados 100. Assim, a presente invenção não deve ser interpretada como limitada à configuração da Figura 2, a qual pretende abranger qualquer configuração capaz de realizar as operações aqui descritas.
A porta de dados I/O pode ser utilizada para a transferência de informações entre o sistema de processamento de dados 100 e outro sistema de computador ou uma rede (por exemplo, a Internet) ou a outros dispositivos controlados pelo processador. Estes componentes podem ser componentes convencionais, tais como aqueles utilizados em muitos sistemas de processamento convencionais de dados que podem ser configurados de acordo com a presente invenção para funcionar como aqui descrito. Portanto, o módulo de seleção do mRNA 150 pode ser utilizado para analisar os dados dos parâmetros determinados para as sequências individuais de mRNA para uma matriz 160 e a distribuição dos mRNAs individuais na matriz 162 que foi previamente coletada.
A invenção será agora descrita com referência aos exemplos seguintes. Deve ser apreciado que este exemplo é para efeito de aspectos ilustrativos da presente invenção, e não limita o âmbito da invenção como definido pelas reivindicações.
EXEMPLOS
Exemplo 1. Descrição dos métodos (1) Geração das energias de arranjo do RNA para sequências potenciais coPetição 870190074939, de 05/08/2019, pág. 101/178
86/117 dificarem para uma sequência teste de aminoácidos.
(2) Seleção das variantes (algumas que são previstas expressar proteínas a um nível elevado, enquanto outras são previstas resultar na expressão ineficiente de proteína) (3) Geração de constructos de vetor de cada variante para a expressão de levedura e para a expressão transiente de tabaco (4) Transformação (levedura e tabaco) (5) O RT-PCR quantitativo utilizado para estimar o nível do transcrito de mRNA (para normalizar os dados da expressão de proteínas e reduzir a possível influência da(s) variação(s) a nível transcricional) (6) Coleta de amostras para medir o nível da expressão de proteínas (7) ELISA quantitativo (8) Estimativa da proteína, para verificar a qualidade da amostra do extrato a ser utilizada em ELISA (9) Análise por Western blot para verificar qualquer modificação possível pós-traducional da proteína expressa (10) Análise de dados para construir uma correlação entre os parâmetros termodinâmicos do mRNA e o nível de expressão das proteínas.
Exemplo 2. Métodos para a geração das energias de arranjo do RNA para sequências potenciais que codificam para uma dada sequência de aminoácidos
Começando com uma sequência de aminoácidos de entrada, foi utilizado BioPerl para automatizar um procedimento de amostragem aleatória que gerou as sequências de nucleotídeos que codificam para as sequências de aminoácidos de entrada. (Stajich et al. Genome Res 12(10):1611-8 (2002)). Para cada posição na sequência de aminoácidos, os códons para essa posição foram selecionados por amostragem dos códons possíveis a partir de uma distribuição uniforme. Foram geradas dez mil sequências nucleotídicas desta forma para cada sequência de aminoácidos de entrada. Cada sequência de nucleotídeos de saída foi verificada relativamente ao comprimento e à tradução para assegurar a precisão do procedimento de amostragem. A versão 1.8.2 do pacote ViennaRNA foi utilizada para calcular
Petição 870190074939, de 05/08/2019, pág. 102/178
87/117 para cada sequência de entrada, a energia livre mínima, a energia livre do conjunto e a frequência da estrutura MFE no conjunto. (Hofacker et al. Monatshefte f. Chemie 125: 167-188 (1994); www.tbi.univie.ac.at/RNA/). As definições dos parâmetros para o cálculo foram -p0 -d2, que aciona o cálculo da função de partição e assegura que a função de partição e a energia livre mínima tratam as energias finais pendentes da mesma forma. O cálculo das energias foi executado no aglomerado Linux interno. Os histogramas das distribuições resultantes de energia foram representados graficamente utilizando R. (R Development Core Team. R: Uma linguagem e ambiente para computação estatística. R Foundation for Statistical Computing, Vienna, Austria (2009); ISBN 3-900051-07-0; www.R-project.org).
Exemplo 3. Seleção das variantes do mRNA (ambas produção melhorada e reduzida de proteínas)
A proteína fluorescente ciano Anemonia majano (gene reporter AmCyan) com um polipeptídeo de sinal de alvejamento do cloroplasto Nterminal da Chlamydomonas reinhardtii foi selecionada como o polipeptídeo de interesse. As variantes selecionadas do mRNA foram sintetizadas pela GENEART ® (Alemanha). As variantes da sequência nucleotídica AmCyan foram geradas por substituição da sequência codificante da região 5' (região N-terminal do polipeptídeo codificado). Assim, neste exemplo em particular, 40 nucleotídeos da extremidade 5' da sequência de nucleotídeos do peptídeo N-terminal (a montante da sequência repórter AmCyan) foram substituídos com as sequências (variantes) estabelecidas na Tabela 2 e/ou na Tabela 3, abaixo.
Constructo para a transformação do tabaco e expressão de proteínas. Um constructo de ácido nucléico que codifica para a sequência nucleotídica AmCyan (CFP) fundida com a sequência nucleotídica de um peptídeo do cloroplasto em trânsito ssRubisco foi utilizado para transformar tabaco. A sequência de nucleotídeos (SEQ ID N°:1) do constructo e a sequência de aminoácidos (SEQ ID N°:2) codificada pelo constructo são apresentadas abaixo.
Petição 870190074939, de 05/08/2019, pág. 103/178
88/117
CACC ATG qcc qcq qtc ata qcc aaa tea aqc qtt tcc qca gccgtggcaaggcctgctagatctagcgtgaggccgatggctgccttgaaacccgcagtcaaagcggcacctgtggcagctccagcacaagcgaatcaggccctgagcaacaagttcatcggcgacgacatgaagatgacctaccacatggacggctgcgtgaacggccactacttcaccgtgaagggcgagggcagcggcaagccatacgagggcacccagaccagcaccttcaaggtgacgatggccaacggtggcccactggccttcagcttcgacatcctgagcaccgtgttcatgtacggcaaccgctgcttcaccgcctacccgaccagcatgccggactacttcaagcaggccttcccggacggcatgagctacgagcgcaccttcacctacgaggacggcggcgtggctaccgccagctgggagatcagcctgaagggcaactgcttcgagcacaagagcaccttccacggcgtgaacttcccagccgacggcccggtgatggccaagatgaccaccggctgggatccgagcttcgagaagatgactgtgtgcgacggcatcctgaagggcgacgtgaccgccttcctgatgcttcaaggcggtggcaactaccgctgccagttccacaccagctacaagaccaagaagccggtgaccatgccgccaaaccatgccgtggagcacaggatcgcccgcaccgacctggacaagggcggcaacagcgtccagctgaccgagcacgccgtggcccacatcaccagcgtggtgccgttctga (SEQ ID N°:1) MALSNKFIGDDMKMTYHMDGCVNGHYFTVKGEGSGKPYEGTQTSTFKVTMANGGPLAFSFDILSTVFMYGNRCFTAYPTSMPDYFKQAFPDGMSYERTFTYEDGGVATASWEISLKGNCFEHKSTFHGVNFPADGPVMAKKTTGWDPSFEKMTVCDGILKGDVTAFLMLQGGGNYRCQFHTSYKTKKPVTMPPNHVVEHRIARTDLDKGGNSVQLTEHAVAHITSVVPF (SEQ ID N°:2)
O peptídeo de trânsito do cloroplasto ssRubisco é indicado a negrito na extremidade 5' da SEQ ID N°:1. Os nucleotídeos a negrito e sublinhados (também na extremidade 5' da sequência) apresentam a porção da SEQ ID N°:1, que é variada entre as variantes. Além disso, cada variante compreende em sua extremidade 5' quatro nucleotídeos, CACC (em letras maiúsculas cinzentas), imediatamente a montante do códon iniciador ATG. As sequências nucleotídicas utilizadas para gerar as variantes são estabelecidas na Tabela 2 (SEQ ID N°s:5-26), abaixo.
Petição 870190074939, de 05/08/2019, pág. 104/178
Tabela 2. Variantes do peptídeo de trânsito do cloroplasto N-terminal ssRubisco com gene repórter AmCyan (CFP) (para expressão de tabaco).
Variante # Sequência de Nucleotídeos [-4 a +35] MFE EFE
9532 CACCATGGCAGCGGTGATTGCCAAATCATCGGTGTCAGCT (SEQ ID N°:5) -17,40 -17,56
5605 CACCATGGCCGCGGTCATTGCGAAAAGCAGTGTGTCGGCC (SEQ ID N°:6) -16,60 -17,17
2198 CACCATGGCGGCGGTTATTGCCAAGTCGTCCGTGAGTGCG (SEQ ID N°:7) -16,60 -16,81
6030 CACCATGGCGGCGGTCATTGCTAAAAGCAGCGTGAGCGCC (SEQ ID N°:8) -14,30 -15,23
1386 CACCATGGCCGCTGTGATCGCAAAGTCCAGCGTGTCAGCC (SEQ ID N°:9) -14,30 -14,51
8708 CACCATGGCCGCGGTCATAGCGAAAAGCTCTGI I ICCGCA (SEQ ID N°:10) -12,30 -12,38
811 CACCATGGCAGCCGTGATAGCTAAGTCGTCTGTCTCGGCT (SEQ ID N°:11) -12,30 -14,12
6408 CACCATGGCAGCAGTGATCGCAAAGTCGAGCGTTAGTGCA (SEQ ID N°:12) -10,20 -10,27
3263 CACCATGGCAGCCGTTATCGCTAAGAGTAGCGTGTCTGCT (SEQ ID N°:13) -10,20 -12,39
3143 CACCATGGCAGCAGTAATCGCGAAATCAAGTGTTAGTGCA (SEQ ID N°:14) -8,90 -8,94
7925 CACCATGGCAGCTGTTATTGCAAAGTCGTCCGTGAGTGCC (SEQ ID N°:15) -8,90 -11,17
8256 CACCATGGCAGCTGTAATAGCAAAATCCTCTGTCTCAGCA (SEQ ID N°:16) -7,40 -7,51
3947 CACCATGGCTGCCGTAATCGCAAAGTCGTCCGTGAGTGCG (SEQ ID N°:17) -7,40 -9,46
3909 CACCATGGCAGCCGTAATCGCAAAGAGCAGCGTAAGTGCT (SEQ ID N°:18) -5,20 -7,11
89/117
Petição 870190074939, de 05/08/2019, pág. 105/178
Variante # Sequência de Nucleotídeos [-4 a +35] MFE EFE
7120 CACCATGGCAGCTGTAATCGCAAAATCATCTGTCTCCGCA (SEQ ID N°:19) -5,20 -5,34
4261 CACCATGGCCGCCGTGATAGCCAAGTCGTCAGTATCCGCT (SEQ ID N°:20) -3,90 -5,71
2159 CACCATGGCCGCAGTAATAGCCAAATCTTCAGI I ICCGCC (SEQ ID N°:21) -3,90 -4,10
6682 CACCATGGCAGCCGTAATAGCAAAATCATCAGTCAGCGCC (SEQ ID N°:22) -2,30 -2,85
5286 CACCATGGCCGCCGTTATTGCAAAATCGTCTGTGTCTGCA (SEQ ID N°:23) -2,30 -4,20
1089 CACCATGGCCGCCGTAATTGCTAAATCATCTGTCTCTGCC (SEQ ID N°:24) -1,40 -2,33
6096 CACCATGGCCGCCGTAATAGCAAAGAGTTCCGTATCCGCA (SEQ ID N°:25) -1,40 -2,99
7397 CACCATGGCTGCCGTTATTGCAAAATCTTCTGI I I CCGCT (SEQ ID N°:26) -0,80 -2,73
MFE =energia livre mínima; EFE= energia livre do conjunto
90/117
Petição 870190074939, de 05/08/2019, pág. 106/178
91/120
As sequências nucleotídicas foram geradas usando técnicas recombinantes padrão de ADN e de clonagem molecular que são bem conhecidas na arte (Ver, por exemplo, Sambrook et al. Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y. (1989); Silhavy et al., Experiments with Gene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y. (1984); e Ausubel et al. Current protocols in Molecular Biology, Greene Publishing Assoc, e Wiley Interscience (1987))
Constructo para a transformação de levedura e expressão de proteínas. Um constructo de ácido nucléico que codifica para a sequência de nucleotídeos AmCyan foi utilizado para transformar levedura (Saccharomyces cerevisiae). As sequências nucleotídicas AmCyan foram digeridas com Xho1/Kpn1 e extraídas em gel. O vetor de expressão de levedura, de cópia única, YpEB/peri_isomaltase/V5 foi digerido com Xho1/Kpn1 e a estrutura de suporte foi extraída. Os fragmentos foram ligados e as células competentes foram transformadas. As colônias foram colhidas e os positivos foram identificados pela colônia PCR e verificados por análise de digestão de restrição e sequenciação.
A sequência de nucleotídeos (SEQ ID N°:3) do constructo e a sequência de aminoácidos (SEQ ID N°:4) codificada pelo constructo são apresentadas abaixo. Neste caso, ao contrário do constructo utilizado para a expressão da planta, o constructo usado na expressão de levedura não tem um peptídeo de trânsito N-terminal.
CACC ATG qcc ctq tcc aac aaq ttc ate qqc qac qac atq aagatgacctaccacatggacggctgcgtgaacggccactacttcaccgtgaagggcgagggcagcggcaagccctacgagggcacccagacctccaccttcaaggtgacgatggccaacggcggccccctggccttctccttcgacatcctgtccaccgtgttcatgtacggcaaccgctgcttcaccgcctaccccaccagcatgcccgactacttcaagcaggccttccccgacggcatgtcctacgagagaaccttcacctacgaggacggcggcgtggccaccgccagctgggagatcagcctgaagggcaactgcttcgagcacaagtccaccttccacggcgtgaacttccccgccgacggccccgtgatggccaagaagaccaccggctgggatccctccttcgagaagatgaccgtgtgcgacggcatcttgaagggcgacgtgaccgccttcctgatgctgcagggcggcggcaacta
Petição 870190074939, de 05/08/2019, pág. 107/178
92/117 cagatgccagttccacacctcctacaagaccaagaagcccgtgaccatgccccccaaccacgtggtggagcaccgcatcgccagaaccgacctggacaagggcggcaacagcgtgcagctgaccgagcacgccgtggcccacatcacctccgtggtgcccttctga (SEQ ID N°:3)
MALSNKFIGDDMKMTYHMDGCVNGHYFTVKGEGSGKPYEGTQTSTFKVTMANGGPLAFSFDILSTVFMYGNRCFTAYPTSMPDYFKQAFPDGMSYERTFTYEDGGVATASWEISLKGNCFEHKSTFHGVNFPADGPVMAKKTTGWDPSFEKMTVCDGILKGDVTAFLMLQGGGNYRCQFHTSYKTKKPVTMPPNHVVEHRIARTDLDKGGNSVQLTEHAVAHITSVVPF (SEQ ID N°:4)
Os nucleotídeos que são indicados a negrito e sublinhados na extremidade 5' da SEQ ID N°:3 mostram a porção da sequência que é variada entre as variantes. Além disso, na extremidade 5', cada variante da sequência de nucleotídeos também inclui quatro nucleotídeos, CACC (em letras maiúsculas cinzentas), imediatamente a montante do códon iniciador ATG. As sequências nucleotídicas variantes foram geradas usando técnicas recombinantes padrão de ADN e de clonagem molecular que são bem conhecidas na arte (Ver, por exemplo, Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor laboratory, Cold Spring Harbor, N.Y. (1989); Silhavy et al., Experiments with Gene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y. (1984); e Ausubel et al., Current Protocols in Molecular Biology, Greene Publishing Assoc. e Wiley-Interscience (1987). As sequências de nucleotídeos variantes utilizadas nos ensaios com levedura são fornecidas na Tabela 3 (SEQ ID N°s:27-48).
Petição 870190074939, de 05/08/2019, pág. 108/178
Tabela 3. Am Cyan para expressão em levedura
Variante # Sequência de Nucleotídeos [-4 a +35] MFE EFE
5433 CACCATGGCGCTCTCCAATAAAI I IAI IGGAGACGACATG (SEQ ID N°:27) -16,30 -16,49
1451 CACCATGGCGCTCTCCAATAAGTTCATTGGAGACGACATG (SEQ ID N°:28) -15,20 -15,33
4226 CACCATGGCGTTGTCGAATAAAI I IAI CGGCGACGACATG (SEQ ID N°:29) -15,20 -15,74
2753 CACCATGGCTCTCTCCAATAAAI I IAI I GGAGACGACATG (SEQ ID N°:30) -13,60 -14,17
5426 CACCATGGCCTTGAGCAATAAGTTCATAGGTGATGATATG (SEQ ID N°:31) -13,50 -13,55
1370 CACCATGGCGTTGTCAAATAAGI I IAI I GGCGACGATATG (SEQ ID N°:32) -11,60 -12,41
7158 CACCATGGCCCTGAGCAATAAGTTCATCGGTGATGATATG (SEQ ID N°:33) -11,60 -11,68
4960 CACCATGGCCTTGTCTAACAAGTTCATTGGAGACGATATG (SEQ ID N°:34) -9,30 -10,49
7663 CACCATGGCACTGTCCAATAAGTTCATCGGTGATGATATG (SEQ ID N°:35) -9,30 -9,34
3065 CACCATGGCI I IGICGAACAAGTTCATCGGGGACGATATG (SEQ ID N°:36) -7,60 -9,47
5108 CACCATGGCACTCAGTAATAAAI I IAI I GGCGATGATATG (SEQ ID N°:37) -7,60 -7,72
2493 CACCATGGCGTTGTCTAACAAGTTCATCGGAGACGATATG (SEQ ID N°:38) -6,60 -8,27
3961 CACCATGGCGTTGTCCAACAAAI I IAI AGGAGATGACATG (SEQ ID N°:39) -6,60 -6,71
3531 CACCATGGCI I I Al CGAATAAATTCATTGGGGACGATATG (SEQ ID N°:40) -4,50 -6,28
613 CACCATGGCACTATCCAACAAATTTATAGGAGACGACATG (SEQ ID N°:41) -4,50 -4,59
93/117
Petição 870190074939, de 05/08/2019, pág. 109/178
Variante # Sequência de Nucleotídeos [-4 a +35] MFE EFE
5223 CACCATGGCATTGAGTAACAAATTTATAGGCGACGATATG (SEQ ID N°:42) -3,10 -3,39
5246 CACCATGGCCCTGTCAAATAAAI I IAIAGGCGACGATATG (SEQ ID N°:43) -3,10 -4,87
1214 CACCATGGCATTAAGTAATAAATTCATAGGAGACGATATG (SEQ ID N°:44) -2,30 -2,90
5013 CACCATGGCATTGAGTAACAAG I I IAI CGGGGATGATATG (SEQ ID N°:45) -2,30 -4,00
7122 CACCATGGCATTAAGCAACAAATTTATAGGAGACGATATG (SEQ ID N°:46) -1,00 -1,71
8537 CACCATGGCGCTGTCAAACAAAI I I Al AGGGGATGATATG (SEQ ID N°:47) -1,00 -2,69
8979 CACCATGGCGCI I ICAAACAAAI I IAI AGGGGATGATATG (SEQ ID N°:48) -0,42 -2,44
94/117
Petição 870190074939, de 05/08/2019, pág. 110/178
95/117
Exemplo 4. Transformação e Expressão da Planta
Os vetores de expressão capazes de direcionar a expressão das variantes foram concebidos como descrito acima. A SEQ ID N°:1 e Tabela 2 fornecem as sequências das variantes.
O promotor constitutivo CaMV 35S foi utilizado para conduzir a expressão dos genes variantes otimizados de dicotiledônea. A proteína repórter expressa em tabaco, AmCyan, foi direcionado ao cloroplasto via fusão com a pequena sub-unidade do peptídeo de trânsito Rubisco da Chlamydomonas reinhardtii.
Os vetores de expressão de tabaco usaram o vetor binário, pGR106, contendo o amplicão do vírus da batata X (PVX) (Lu et al., 2003, EMBO J, 22:5690-5699). Note-se que os vetores similares podem ser construídos para transformação e expressão em outros sistemas de expressão.
Todas as cassetes de expressão são sub-clonadas em um vetor binário para transformação em tabaco utilizando técnicas de ADN recombinante que são conhecidas na arte. O vetor de expressão também pode conter um marcador de seleção da protoporfirinogênio oxidase (PPO) induzido pelo mesmo promotor, daí a PPO poder servir como um controle interno.
Expressão transiente em folhas de tabaco. As cassetes de expressão foram clonadas quer em um vetor binário ou em um vetor binário também contendo uma origem de replicação do vírus superior da beterraba enrolada (BCTV). Os vetores binários sem a origem de replicação do BCTV foram transferidos para a estirpe LBA4404 de Agrobacterium tumefaciens usando o método de congelamento-descongelamento (An et al., Binary vector. In: Gelvin SB, Schilproot RA (eds), Plant molecular biology manual. Kluwar Academic Publishers, Dordrecht, pp A3 1-19 (1988)). Os vetores binários contendo a origem de replicação do BCTV (vetores binários BCTV) foram transferidos para Agrobacterium tumefaciens estirpe LBA4404 contendo um plasmídeo auxiliar que contém uma sequência de replicase do BCTV, também utilizando o método de congelamento-descongelamento aqui descrito.
As folhas de tabaco foram utilizadas para a expressão transiente
Petição 870190074939, de 05/08/2019, pág. 111/178
96/117 de proteínas-alvo em tecido da plantas. As folhas de tabaco de plantas transgênicas TEV-B (feitas na cultura de tabaco Xanthi) contendo um gene P1/HC-Pro mutado de TEV que suprime o silenciamento do gene póstranscricional (Mallory et al., Nat Biotechnol 20:622 (2002)) foram utilizadas para a expressão transiente das enzimas selecionadas. A preparação das culturas de Agrobacterium e a infiltração de tabaco foram realizadas conforme descrito por Azhakanandam et al. (Plant Mol. Biol. 63: 393-404 (2007)). Em resumo, as agrobactéhas geneticamente modificadas foram cultivadas durante a noite em 50 mL de meio LB contendo acetosehngona 100 μΜ e MES 10 μΜ (pH 5,6). As agrobactérias foram depois sedimentadas por centrifugação a 4000 X g durante 10 min e os sedimentos foram ressuspendidos em meio de infeção (sais com vitaminas Murashige e Skoog, sacarose 2%, MES 500 μΜ (pH 5,6), MgSCU 10 μΜ, e acetosehngona 100 μΜ) a uma concentração de DOeoo = 1,0 e subsequentemente mantida a 28 °C durante 3 horas. A infiltração de folhas individuais foi realizada em plantas de tabaco TEV-B (com cerca de 4 semanas de idade) usando uma seringa de 5 mL, pressionando a ponta da seringa (sem agulha) contra a superfície abaxial da folha. As plantas infiltradas foram mantidas a 22-25 °C, com um fotoperíodo de 16 horas de luz e 8 horas de escuridão. Os tecidos da planta foram colhidos após cerca de 5 dias após infiltração para análise subsequente.
Exemplo 5. Transformação e Expressão da Levedura
Os plasmídeos preparados como descrito no Exemplo 3 foram introduzidos em leveduras (Saccharomyces cerevisiae) usando o kit FAST™-Yeast Transformation (G-Biosciences, St Louis, MO, EUA). Uma vez que o vetor contém a cassete kanMX4, o sal dissulfato G-418 (Sigma, A1720) foi utilizado como o agente de seleção para uma concentração final de 200 pg/mL.
Preparação de Células Competentes. As células de levedura foram cultivadas a 30°C em 10 mL de caldo YPD até meio da fase log (cerca de 5 x 106 a cerca de 2 x 107 células/mL ou uma DO600 de cerca de 0,8 a cerca de 1,0). As células foram sedimentadas a 500 x g durante 4 minutos e o sobrenadante foi descartado. Foram usados 10 mL de solução de lavagem
Petição 870190074939, de 05/08/2019, pág. 112/178
97/117 para lavar o sedimento. Após a lavagem, as células foram re-sedimentadas e o sobrenadante descartado. Um mL de solução competente foi adicionado ao sedimento para ressuspender as células.
Transformação. As células competentes (50 pL) foram misturadas com 0,2-1 pg de ADN em um volume inferior a 5 pL. A solução de transformação (500 pL) foi adicionada às células e misturada cuidadosamente. A mistura células/ADN foi incubada a 30°C durante 45 minutos e depois misturada vigorosamente agitando com um dedo. A etapa de mistura foi realizada 2-3 vezes durante a incubação de 45 minutos.
A mistura de transformação (ADN/células) foi espalhada (50 pL 150 pL) em uma placa apropriada como é conhecido na arte. A placa com a mistura de transformação foi, em seguida, incubada a 30°C durante 2-4 dias para permitir o crescimento de transformantes.
As células de levedura transgénica foram identificadas com base na sua capacidade para produzir fluorescência azul quando observadas sob o microscópio de fluorescência.
Exemplo 6. Coleta de amostras de folhas de tabaco transitoriamente expressando a proteína repórter AmCyan.
Três plantas de tabaco foram plantadas por constructo para amostragem de qRT-PCR e ELISA. Duas folhas por planta foram infiltradas com agrobactérias contendo as sequências nucleotídicas das variantes que expressam a proteína AmCyan. Seis amostras foram coletadas a partir das folhas infiltradas, três dias após a infiltração, duas amostras de cada planta. Duas repicagens (cerca de 20 mg) de tecido foliar foram coletadas por amostra.
Os extratos de proteína foram preparados a partir dos cerca de 100 - 500 mg de tecido foliar coletado a partir de plantas de tabaco transitoriamente expressando AmCyan, como descrito acima. Especificamente, o material foliar foi colocada em blocos de 24 poços fundos contendo pequenas bolas de aço e pré-arrefecido em gelo seco. As amostras foram trituradas em um pó fino usando um Genogrinder (SPEC/CertiPrep, Metuchen, New Jersey). As amostras foram então extraídas em 500-1000 uL de TamPetição 870190074939, de 05/08/2019, pág. 113/178
98/117 pão de Extração Western (WEB = borato de sódio 12,5 mM, pH 10; BME 2% e SDS 1%) à temperatura ambiente durante cerca de 30 minutos seguido de centrifugação durante 5 minutos a 13.000 rpm.
Exemplo 7. Coleta de amostra do sistema de expressão de levedura.
Três colônias foram escolhidas por cada variante. As células de levedura transgênicas foram cultivadas durante a noite em caldo YPD contendo G-418 a 30°C com agitação a 255 rpm. Na manhã seguinte, as culturas foram diluídas a uma D.O. de cerca de 0,5 a 600 nm. Três a quatro horas mais tarde, quando a D.O. das culturas atingiu cerca de 1,0 a 600 nm, as células foram colhidas. Dois mL para cada variante foram utilizados e a proteína total e o RNA total foram isolados.
A proteína foi isolada usando Reagente de Extração da Proteína de Levedura Y-PER (Thermo Scientific, Rockford, IL). O RNA total foi isolado usando o RNA Easy Mini Kit (QIAGEN). Para gerar esferoplastos, as células de levedura foram ressuspendidas em 2 mL de Tampão Y contendo zimolase e incubadas 30 min a 30°C, com agitação suave a 75 rpm. O Tampão Y foi preparado adicionando zimolase-100T 50x (10 mg/mL) (de Arthrobacter luteus; Seikagaku Biobusiness Corporation, Japão) e β-mercaptoetanol 0,1% a sorbitol 1M e EDTA 0,1, solução com pH 7,4. Para eliminar a contaminação do ADN, as amostras de RNA foram digeridas com RNAse-Free DNase Set (QIAGEN) de acordo com o protocolo do fabricante.
Três proteínas e três amostras de RNA foram analisadas por ELISA e PCR quantitativa para cada variante.
Exemplo 8. Estimativa do Transcrito e os Níveis de Proteína
A. Estimativa do nível de transcrito por método qRT-PCR. As amostras de tecido vegetal ou de células de levedura expressando as variantes foram coletadas e mantidas congeladas a -80 °C até serem processadas. O RNA foi extraído das amostras por um procedimento de Esferas Magnéticas (Promega) seguido de digestão do ADN. Os ensaios TaqMan foram selecionados com base no alvo de interesse. Assim, estes testes consistem em um iniciador direto e inverso e em uma sonda marcada com FAM
Petição 870190074939, de 05/08/2019, pág. 114/178
99/117 que são específicos da sequência-alvo. Um alvo de referência específico marcado com TET também foi executado para cada amostra para um cálculo da expressão relativa. As reações RT-PCR de um só passo foram estabelecidas em triplicado (3 para o gene endógeno de referência (por exemplo, selvagem/nativo) e 3 para o gene-alvo) em placas de PCR com 384 poços. Um controlo do tipo selvagem e nenhum controle negativo RT foram incluídos em cada placa para testar a amplificação não-específica e a contaminação do ADN, respectivamente.
Os resultados foram capturados em um termociclador em tempo real (ABI 7900 HT). Os valores-limite foram estabelecidos pelo analisador por cada repórter e os dados resultantes foram exportados para o modelo de amostragem. A expressão relativa foi calculada para cada amostra.
B. ELISA CFP quantitativo. O imunoensaio ELISA CFP é um ensaio quantitativo em sanduíche para a deteção da proteína fluorescente AmCyan (CFP). Emprega dois anticorpos policlonais produzidos contra o produto do gene da CFP e purificados por imunoafinidade contra a proteína CFP. As placas de poliestireno de ligação elevada (Costar®, Cambridge MA) são revestidas a 4°C durante a noite com anti-CFP de coelho 2 pg/mL (proteína A purificada) em borato 25 mM, NaCl 75 mM, ph 8,5. As placas são lavadas cinco vezes com Tris 10 mM, pH 8,0 contendo Tween-20 0,05% e NaN3 0,2%. As amostras foram preparadas adicionando quatro amostras de repicagens de folhas com 1Λ polegadas em blocos de 96 poços contendo esferas de aço. As amostras foram trituradas usando um triturador Kleco seguido de adição de 500 pL de tetraborato de sódio 0,1 M pH 7,5, Tween-20 0,5%, e polivinilpirrolidona 0,2% (tampão de extração) e misturaram-se bem. Os blocos foram centrifugados a 3.500 x g durante 2 min antes da diluição do sobrenadante em diluentes ELISA (PBS contendo BSA 1%, Tween-20 0,05% e NaN 0,2%). Os padrões (128, 64, 32, 16, 8, 4, 2, e 0 ng/mL de proteína purificada CFP) são preparados em diluentes ELISA. Cem microlitros de cada amostra ou padrão apropriadamente diluído são adicionados à planta, incubados durante 1 hora à temperatura ambiente com agitação a 200 rpm, e lavada cinco vezes. A IgG anti-CFP de cabra (100 pL/poço) a 5
Petição 870190074939, de 05/08/2019, pág. 115/178
100/117 pg/mL é então adicionada à placa, incubada durante 1 hora à temperatura ambiente com agitação a 200 rpm, e lavada como antes. A anti-cabra de burro conjugada com fosfatase alcalina (Jackson ImmunoResearch, West Grove, PA) a 1 pg/mL é adicionada à placa (100 pL/poço), incubada à temperatura ambiente com agitação a 200 rpm, e lavada. O substrato fosfato de p-nitrofeílo (Sigma, St. Louis, MO) é adicionado e permitido desenvolver-se durante 30 min, à temperatura ambiente. A absorvância é medida a 405 nm, com 492 como uma referência, utilizando um leitor de microplacas (Tecan Rainbow, Research Triangle Park, NC). A curva padrão utiliza um ajuste de quatro parâmetros da curva para representar a concentração versus a absorvância. É de notar que outros métodos de quantificação de AmCyan envolvendo ensaios de fluorescência (AmCyan pode ser detetada pela excitação a 475 nm e emissão a 515 nm) podem ser usados para estimar o nível de expressão de proteínas.
C. Análise de Western Blot foi realizada para verificar a possível modificação pós-traducional da proteína expressa e uma análise de dados é feita para correlacionar os parâmetros termodinâmicos de mRNA com o nível de produção de proteínas. As amostras foram trituradas num pó fino e foram extraídas em 500-1000 pL de Meio de Extração Western (WEB = borato de sódio 12,5 mM, pH 10; BME 2% e SDS 1%) à temperatura ambiente durante cerca de 30 minutos seguido de centrifugação durante 5 minutos a 13.000 rpm.
D. Eletroforese em SDS - gel de poliacrilamida (SDS-PAGE) foi realizada por transferência de 10 pL das amostras extraídas para um tubo eppendorf e adição de 25 pL de LDS 4XBioRad ou de tampão de carregamento modificado da BioRad (LDS 4X BioRad: BME na proporção de 2:1). As amostras foram aquecidas durante 10 minutos a 70°C e em seguida colocadas imediatamente em gelo durante 5 minutos. Após incubação em banho de gelo, as amostras foram centrifugadas por breves instantes. Os extratos da amostra (5-10 pL) foram corridos em gel de proteínas Bis/Tris BioRad 4-12% (18 poços) usando tampão MOPS.
E. Análise de Immunoblot foi realizada por transferência de
Petição 870190074939, de 05/08/2019, pág. 116/178
101/117 géis SDS-PAGE para uma membrana de nitrocelulose utilizando o tampão de transferência Nupage (Invitrogen) durante 30 minutos a 100 volts. A proteína total transferida para o blot foi visualizada utilizando corante de Ponceau (Sigma). Após corar com Ponceau, a membrana foi incubada em tampão de bloqueio durante 30 minutos em tampão de lavagem TBST (Tris-HCL 30 mM, pH 7,5, NaCl 100 mM, e Tween 20, 0,05%) com leite em pó a 3%, depois lavada três vezes durante 5 minutos em TBST. O anticorpo primário foi adicionado a 1 pg/mL, lavado com solução tampão TBST com leite 3%, e o blot incubado 2 horas durante a noite. Após a incubação, o blot foi lavado três vezes durante 5 minutos cada, em tampão de lavagem TBST. O anticorpo secundário (Coelho-AP) foi diluído a 1:8.000 (em TBST) e adicionado ao blot durante, pelo menos, 30 minutos. Após a incubação com o anticorpo secundário, o blot foi novamente lavado três vezes durante 5 minutos cada. Visualização das bandas imunoreativas foi realizada adicionando substrato BCIP/NBT-fosfatase alcalina de Moss. Os blots foram lavados cuidadosamente em água após a incubação no substrato BCIP/NBT e permitiu-se que secássem ao ar.
F. Microscopia Fluorescente. As amostras de folhas de tabaco foram examinados ao microscópio (Nikon SMZ 1500) relativamente à acumulação de proteína fluorescente AnCyan.
Exemplo 9. Resultados
A. Sistema de Expressão Transiente Tabaco In-Planta.
Nível de expressão da proteína AmCyan transitoriamente expressa em plantas. Dois conjuntos de ensaios independentes foram realizados para analisar o nível de expressão da proteína AmCyan transitoriamente expressa no tabaco infiltrada com diferentes constructos vetoriais das sequências nucleotídicas variantes. Ver a Figura 3, que mostra o nível de transcritos de AmCyan em amostras de folhas infiltrada com constructos de vetores indicadores (Figura 3A) e níveis relativos de mRNA da AmCyan à PPO (Figura 3B).
Os resultados qRT-PCR sugerem que todos os constructos têm níveis semelhantes de mRNA dentro das variações típicas de qRT-PCR para
Petição 870190074939, de 05/08/2019, pág. 117/178
102/117 os dados, com a exceção do constructo 8707, que teve um nível muito baixo de mRNA.
Os níveis de expressão da proteína AmCyan transitoriamente expressa em tabaco para vários constructos foram quantificados pelo método ELISA. As amostras duplicadas de três plantas de tabaco foram coletadas para cada constructo. Os níveis de expressão (medidos por ELISA) da CPF foram normalizados em relação à proteína celular total extraída. As médias dos seis pontos de dados são representados graficamente na Figura 4A e na Figura 4B. Os níveis de expressão do controle internalizado de PPO das mesmas amostras também foram quantificados pelo método ELISA e normalizados com respeito à proteína celular total extraída. Os dados do ELISA revelam que o nível de expressão de PPO é quase o mesmo para os constructos diferentes, enquanto o nível de expressão para AmCyan (CFP) variou ao longo de uma vasta gama. Os níveis de expressão da AmCyan (quadrado-CFP) e os valores relativos normalizados para PPO (círculoCFP*) foram representados graficamente contra os valores da energia livre (energia livre mínima (Figura 4A) e a energia livre do conjunto (Figura 4B) e dos seus 40 nucleotídeos (-4 a 36) transcritos de mRNA. São apresentados gráficos semelhantes para o segundo conjunto de dados na Figura 5A e Figura 5B.
Estes resultados demonstram claramente que os níveis de expressão de proteínas AmCyan aumentam com o aumento do valor da energia livre do trancrito 5' mRNA transcrição com um valor de R2 de 0,8 quando os dados foram ajustados com uma equação linear. Foram observados resultados semelhantes para o nível de expressão de AmCyan em relação à PPO com um valor de R2 de 0,75.
Um gráfico alternativo dos dados descritos acima é apresentado na Figura 6. Um exame cuidadoso do uso do códon nos primeiros 36 nucleotídeos do gene indica que os três contructos com os menores níveis de expressão, têm códons raros duplos do mesmo tipo. Isto sugere que a reduzida expressão desses constructos pode ser parcialmente devida a estes códons raros duplos. Os restantes dados excluindo estes três constructos
Petição 870190074939, de 05/08/2019, pág. 118/178
103/117 encaixam bem com o decaimento exponencial (R2=0,81) como demonstrado na Figura 6.
Observações microscópicas fluorescentes das amostras de folhas de tabaco infiltradas com constructos variantes de sequências nucleotídicas. As observações visuais sob um microscópio fluorescente de amostras coletadas de folhas infiltradas com os diferentes constructos de ácido nucléico aqui descritos suportaram a co-relação entre a quantidade de expressão da proteína variante AmCyan (CFP) e a energia livre do arranjo do transcrito associado.
B. Sistema de Expressão de Leveduras.
RNA e Análise de Proteínas em Células de Levedura. Os níveis de mRNA de AmCyan apresentaram variações entre diferentes variantes, no entanto quando eles foram normalizados com respeito à medidação do transcrito kanMX4, um controle interno derivado do mesmo vetor, as pro15 porções não foram significativamente diferentes entre as diferentes variantes.
Os níveis de proteína AmCyan medidos por ELISA utilizando anticorpos anti-CFP variaram de 3021 ng/mg a 12.062 ng/mg de proteína total solúvel (Tabela 4).
Petição 870190074939, de 05/08/2019, pág. 119/178
Tabela 4. Níveis de expressão de proteínas de variantes individuais de AmCyan medidos por ELISA utilizando anticorpos antiCFP e os seus níveis correspondentes de mRNA.
Variante MFE* Proteína AmCyan mRNA AmCyan Proporção, Proteína/mRNA
Av* ELISA, ng/mg SE** ELISA Av AmCyan SE AmCyan
5433 -16,3 3021,2 836,1 70917,6 8452,6 0,043
1451 -15,2 4886,6 37,0 95830,3 18253,2 0,051
4226 -15,2 7891,0 2936,4 123750,5 40318,9 0,064
1370 -11,6 9178,1 1793,3 156901,4 22251,8 0,058
7158 -11,6 11622,8 2948,0 220724,3 64475,2 0,053
4960 -9,3 6324,4 1775,3 161070,6 50908,3 0,039
7663 -9,3 6642,6 1241,8 111453,4 16260,3 0,060
3065 -7,6 3779,0 1330,2 85305,3 19265,8 0,044
5108 -7,6 7661,0 314,6 135452,6 15848,1 0,057
3531 -4,5 11603,3 2632,7 156894,3 27269,7 0,074
613 -4,5 12062,0 1910,7 113197,8 19211,5 0,107
5223 -3,1 7846,3 1547,9 82203,5 20914,5 0,095
5246 -3,1 9888,2 842,8 114470,8 28544,8 0,086
7122 -1 8969,3 1004,8 129938,8 23872,6 0,069
8537 -1 6515,7 817,3 125433,9 34025,9 0,052
8979 -0,42 9548,0 3310,1 109045,2 34480,9 0,088
* Av., Média das medições (n=3), **SE, Erro padrão (n=3).
104/117
Petição 870190074939, de 05/08/2019, pág. 120/178
106/117
O gráfico da energia de arranjo do transcrito versus a proporção da expressão de proteínas AmCyan (medidas por ELISA) sobre o mRNA AmCyan (medido por qRT-PCR) é apresentado na Figura 6 (dados na Tabela 4). A correlação entre a energia do arranjo do mRNA estimada e a expressão de proteína AmCyan foi de R2=0,34. Assim, estes dados mostram que tal como os valores MFE aumentam, a produção de proteínas aumenta enquanto os níveis do transcrito de mRNA permanecem constantes.
Um segundo gráfico (Figura 7) em que os dados médios de ELISA para cada variante de AmCyan foram representados graficamente contra a energia livre do arranjo, mostra uma correlação linear com R2=0,49. Em comparação com os ensaios correspondentes em tabaco, a correlação entre a expressão da proteína e os valores da energia livre do arranjo foi menor na levedura (0,49 versus 0,8). Algumas razões possíveis para a correlação mais baixa no sistema de expressão de levedura podem incluir a diferença global no sistema de expressão (neste caso, o sistema de levedura é selecionado para altos níveis de produção de proteínas), o uso de códons raros e/ou a ocorrência de códons raros consecutivos em algumas variantes AmCyan testadas. No entanto, é de notar que o valor R2 observado para a levedura é comparável ou ligeiramente melhor do que o observado para o sistema de expressão procariota da Escherichia coli de 0,44 relatado por Kudla et al. (Science 324 (5924): 255-258 (2009)).
C. Sistema de Expressão Transiente do Milho In-Planta.
As cassetes de expressão foram clonadas em um vetor binário. Os constructos foram transferidos para a estirpe LBA4404 de Agrobacterium tumefaciens contendo um plasmídeo auxiliar (pSBI) utilizando um método de congelamento-descongelamento (An et al., vetor binário. In: Gelvin SB, Schilproot RA (eds), Plant molecular biology manual. Kluwar Academic Publishers, Dordrecht, pp A3 1-19 (1988)). A preparação das culturas de Agrobacterium foi realizada conforme descrito por Azhakanandam et al., Plant Mol. Biol. 63: 393-404 (2007). Em resumo, as agrobactérias geneticamente modificadas foram cultivadas durante a noite em 50 mL de meio YP contendo acetoseringona 100 uM e MES 10 uM (ph 5,6), e posteriormente
Petição 870190074939, de 05/08/2019, pág. 121/178
107/117 foram sedimentadas por centrifugação a 4000xg durante 10 min. Os sedimentos foram ressuspendidos em meio de infeção (sais de Murashige e Skoog com vitaminas, sacarose 2%, MES 500 μΜ (ph 5,6), MgSO4 10 μΜ, e acetoseringona 100 μM) com DO600=0,5 e posteriormente mantidos a 28 graus C durante 2-3 horas.
O sistema de expressão transiente in-planta foi estabelecido utilizando plântulas de milho. As sementes foram germinadas sob condições de estufa em vasos com 2,5 polegadas cheios com mistura de germinação Fafard. As plântulas foram mantidas sob um ciclo diurno/noturno de 14/10 com uma intensidade de luz dp dia de 2000 μ-mol m-2.s-1 mantida com iluminação suplementar. A temperatura foi mantida entre 23°C-26°C. O ensaio de agroinfiltração foi realizado utilizando principalmente folhas primárias e secundárias de fase V2 (Ritchie S.W., Hanway J.J. Benson G.O. (eds): How a Corn Plant Develops: Iowa State Univ Special Report N° 48, July 2005). Para tornar a infiltração mais fácil, as plântulas foram regadas 1-2 horas antes da agroinfiltração, que mantém as folhas túrgidas e os estomas abertos. A infiltração de folhas individuais foi realizada em plântulas de milho utilizando um corpo de seringa com 5 mL (BD seringa de 5 ml com ponta Luer-Lok™, BD™, Franklin Lakes, NJ 07427, USA), pressionando a ponta da seringa contra a superfície abaxial da folha. A primeira e segunda folhas visíveis da fase V2 foram infiltradas com: 1 mL de suspensão de agrobactérias/28 segundos/folha. As plantas infiltradas foram transferidas e mantidas sob as condições da câmara de crescimento a 25°C com um ciclo diurno/noturno de 16/8 com uma intensidade de luz de 1900 μ-mol-m-2.s-1. Os tecidos da planta foram colhidos após 4 dias após infiltração para análise subsequente.
Exemplo 10. Seleção Passo a Passo das sequências de mRNA
Para mostrar a eficácia da seleção de uma sequência mRNA por grupo (seleção passo-a-passo em vez de linear), as sequências de mRNA variantes do peptídeo de trânsito do cloroplasto ssRubisco com AmCyan (RbAmCyan) são selecionadas como aqui descrito. O valor da MFE da estrutura secundária do RNA (MFE) versus o nível de produção de proteína para cada sequência de mRNA é determinado. As sequências apresentadas
Petição 870190074939, de 05/08/2019, pág. 122/178
108/117 na Tabela 5, abaixo, são variantes da AmCyan com o peptídeo de sinal do cloroplasto, como aqui descrito, com o uso dos códons sendo otimizado para expressão de tabaco. Com exceção das três primeiras sequências fornecidas na Tabela 5, cada sequência foi otimizada para um conteúdo em GC de 5 cerca de 50%. Além disso, o uso de códons raros foi evitado (i.e., uso dos códons inferior a 15%). Aproximadamente 209.952 sequências diferentes foram geradas por tradução inversa ou retrotradução e 36 foram escolhidas para os testes (aproximadamente três variantes foram selecionadas por cada gama de 1 kcal/mol) (Tabela 5).
Petição 870190074939, de 05/08/2019, pág. 123/178
Tabela 5: Variantes da sequência de RbAmCyan.
Nome Seq MFE
>MAAVIAKSSVSA 90142 CACCAUGGCUGCUGUCAUUGCCAAGAGUAGUGUCAGCGCC (SEQ ID N°:49) -16,6
>MAAVIAKSSVSA 16649 CACCAUGGCAGCUGUUAUCGCUAAGAGCUCCGUGAGUGCC (SEQ ID N°:50) -15,9
>MAAVIAKSSVSA 91454 CACCAUGGCUGCUGUCAUCGCUAAGUCUAGCGUGUCAGCA (SEQ ID N°:51) -14,6
>MAAVIAKSSVSA 220603 CACCAUGGCAGCUGUCAUUGCAAAGAGCAGUGUUUCAGCA (SEQ ID N°:52) -13,7
>MAAVIAKSSVSA 126667 CACCAUGGCAGCAGUCAUAGCUAAAAGCAGUGUCUCUGCA (SEQ ID N°:53) -12,6
>MAAVIAKSSVSA 45663 CACCAUGGCAGCUGUGAUUGCAAAGUCAUCAGUUAGCGCA (SEQ ID N°:54) -11,4
>MAAVIAKSSVSA 24204 CACCAUGGCUGCUGUUAUAGCAAAAAGCUCUGUCAGUGCC (SEQ ID N°:55) -10,6
>MAAVIAKSSVSA 149781 CACCAUGGCUGCUGUGAUCGCUAAAUCUAGCGUAUCUGCA (SEQ ID N°:56) -10,0
>MAAVIAKSSVSA 176557 CACCAUGGCUGCAGUAAUAGCCAAAAGUAGCGUCUCUGCA (SEQ ID N°:57) -9,6
>MAAVIAKSSVSA 252588 CACCAUGGCAGCUGUAAUCGCUAAGUCUAGCGUAAGUGCA (SEQ ID N°:58) -9,2
>MAAVIAKSSVSA 198140 CACCAUGGCAGCAGUAAUUGCUAAAAGCAGUGUCAGCGCA (SEQ ID N°:59) -8,8
>MAAVIAKSSVSA 67 CACCAUGGCAGCAGUUAUUGCAAAAAGCUCUGUGAGCGCA (SEQ ID N°:60) -8,4
>MAAVIAKSSVSA 134260 CACCAUGGCUGCAGUAAUUGCUAAGAGCAGCGUAUCAGCA (SEQ ID N°:61) -8,1
>MAAVIAKSSVSA 69638 CACCAUGGCCGCAGUGAUUGCAAAAUCAAGUGUAUCCGCU (SEQ ID N°:62) -7,7
>MAAVIAKSSVSA 12130 CACCAUGGCAGCCGUUAUAGCAAAGAGCUCUGUAUCUGCU (SEQ ID N°:63) -7,4
>MAAVIAKSSVSA 205840 CACCAUGGCUGCAGUCAUAGCCAAAAGUUCAGUUAGCGCU (SEQ ID N°:64) -7,2
>MAAVIAKSSVSA 898 CACCAUGGCAGCCGUAAUUGCAAAAUCAAGCGUAAGCGCA (SEQ ID N°:65) -6,8
>MAAVIAKSSVSA 203464 CACCAUGGCUGCUGUCAUUGCCAAAUCCAGUGUAAGUGCU (SEQ ID N°:66) -6,5
>MAAVIAKSSVSA 3421 CACCAUGGCAGCAGUAAUAGCUAAGAGUUCCGUUUCAGCC (SEQ ID N°:67) -6,2
109/117
Petição 870190074939, de 05/08/2019, pág. 124/178
Nome Seq MFE
>MAAVIAKSSVSA 146286 CACCAUGGCAGCUGUAAUCGCUAAAUCUUCAGUGAGCGCU (SEQ ID N°:68) -5,8
>MAAVIAKSSVSA 231944 CACCAUGGCUGCAGUCAUAGCAAAGUCUAGUGUUAGUGCC (SEQ ID N°:69) -5,5
>MAAVIAKSSVSA 260970 CACCAUGGCUGCAGUUAUAGCAAAAAGCUCAGUGUCCGCU (SEQ ID N°:70) -5,2
>MAAVIAKSSVSA 18682 CACCAUGGCUGCUGUUAUAGCUAAAUCAUCCGUAAGCGCC (SEQ ID N°:71) -4,9
>MAAVIAKSSVSA 4483 CACCAUGGCAGCAGUAAUAGCUAAGAGUAGUGUCAGCGCA (SEQ ID N°:72) -4,5
>MAAVIAKSSVSA 179366 CACCAUGGCCGCUGUUAUUGCCAAAUCAUCAGUCAGUGCA (SEQ ID N°:73 -4,4
>MAAVIAKSSVSA 245289 CACCAUGGCUGCAGUCAUCGCAAAAUCUUCAGUUUCCGCA (SEQ ID N°:74) -3,9
>MAAVIAKSSVSA 234943 CACCAUGGCAGCUGUGAUCGCUAAAAGUUCUGUAUCAGCC (SEQ ID N°:75) -3,6
>MAAVIAKSSVSA 196281 CACCAUGGCUGCAGUCAUCGCUAAAUCUUCAGUAUCCGCU (SEQ ID N°:76) -3,2
>MAAVIAKSSVSA 291743 CACCAUGGCCGCCGUAAUAGCAAAAAGUUCUGUAAGCGCU (SEQ ID N°:77) -2,8
>MAAVIAKSSVSA 202071 CACCAUGGCCGCCGUCAUUGCAAAAAGUUCAGUAUCAGCA (SEQ ID N°:78) -2,4
>MAAVIAKSSVSA 10852 CACCAUGGCUGCCGUAAUCGCUAAAUCAUCUGUCUCUGCU (SEQ ID N°:79) -2,0
>MAAVIAKSSVSA 80632 CACCAUGGCCGCUGUUAUUGCAAAAUCCUCCGUAUCUGCU (SEQ ID N°:80) -1,6
>MAAVIAKSSVSA 271445 CACCAUGGCCGCAGUAAUUGCUAAAUCUUCAGUCUCCGCU (SEQ ID N°:81) -1,4
>MAAVIAKSSVSA 14671 CACCAUGGCCGCAGUUAUCGCAAAAUCAUCAGUCUCAGCA (SEQ ID N°:82) -1,0
>MAAVIAKSSVSA 289906 CACCAUGGCCGCCGUAAUUGCAAAAUCAUCUGUUUCCGCU (SEQ ID N°:83) -0,9
>MAAVIAKSSVSA 80081 CACCAUGGCCGCCGUUAUCGCAAAAUCAUCAGUAUCAGCU (SEQ ID N°:84) -0,4
110/117
Petição 870190074939, de 05/08/2019, pág. 125/178
111/117
As sequências de mRNA na Tabela 5 são testadas em um sistema de expressão transiente em tabaco como antes e o nível de expressão do transcrito e os níveis de proteína podem ser estimados por qRT-PCR e ELISA, respectivamente, como descrito a seguir.
Para testar variantes em um sistema de expressão de milho, as sequências foram otimizadas para uso dos códons de milho e as sequências compreendendo códons raros, como aqui definido, perto do códon de iniciação não foram utilizadas (Tabela 6). As correspondentes sequências de tabaco otimizadas estão na Tabela 5, acima.
Petição 870190074939, de 05/08/2019, pág. 126/178
Tabela 6: Variantes da sequência otimizada para uso dos códons de milho.
Nome Seq MFE
>MAAVIAKSSVSA 91454 CACCAUGGCUGCUGUCAUCGCUAAGUCUAGCGUGUCAGCA (SEQ ID N°:85) -14,6
>MAAVIAKSSVSA 45663 CACCAUGGCAGCUGUGAUUGCAAAGUCAUCAGUUAGCGCA (SEQ ID N°:86) -11,4
>MAAVIAKSSVSA 67 CACCAUGGCAGCAGUUAUUGCAAAAAGCUCUGUGAGCGCA (SEQ ID N°:87) -8,4
>MAAVIAKSSVSA 260970 CACCAUGGCUGCAGUUAUAGCAAAAAGCUCAGUGUCCGCU (SEQ ID N°:88) -5,2
>MAAVIAKSSVSA 245289 CACCAUGGCUGCAGUCAUCGCAAAAUCUUCAGUUUCCGCA (SEQ ID N°:89) -3,9
>MAAVIAKSSVSA 14671 CACCAUGGCCGCAGUUAUCGCAAAAUCAUCAGUCUCAGCA (SEQ ID N°:90) -1,0
112/117
Petição 870190074939, de 05/08/2019, pág. 127/178
113/117
O nível de expressão do transcrito e da proteína é estimado no milho por qRT-PCR e ELISA, respectivamente, como descrito a seguir.
Exemplo 11. Uso dos codons raros
Em alguns casos, evitar uso de códon raro pode ser um passo na otimização da sequência do transcrito com base na sua energia livre da arranjo. Tabela 7 fornece variantes da AmCyan com o peptídeo de sinal de alvejamento do cloroplasto, cada um tendo um ou mais códons raros perto do códon de iniciação. Seis pares de variantes são testados: um conjunto com códons raros e um conjunto sem códons raros.
Um códon raro é aquele que tem um tRNA com uma abundância inferior a 15%
O impacto dos códons raros consecutivos perto do códon de iniciação pode ser estudado usando as sequências estabelecidas na Tabela 7 (ver, por exemplo, AAV e VSA na Tabela 7 abaixo). Esses códons raros 15 consecutivos podem ter um impacto mais severo na produção de proteína por um mRNA do que um com um códon raro único perto do local de início.
Petição 870190074939, de 05/08/2019, pág. 128/178
Tabela 7: Sequências variantes de RbAmCyan com códons raros de tabaco
Uso dos códons raros
Ser,AGC,0,13,UCC,0,13
Ala,GCC,0,17
Val,GUC,0,17,GUA,0,17
Nome Seq MFE
>MAAVIAKSSVSA CódonRaro 18 CACCAUGGCCGCCGUAAUCGCCAAAAGCAGCGUAAGCGCC (SEQ ID N°:91) -8,8
>MAAVIAKSSVSA CódonRaro 119 CACCAUGGCCGCCGUAAUCGCCAAAUCCAGCGUAAGCGCC (SEQ ID N°:92) -7,7
>MAAVIAKSSVSA CódonRaro 96 CACCAUGGCCGCCGUCAUAGCCAAAAGCUCCGUAAGCGCC (SEQ ID N°:93) -6,2
>MAAVIAKSSVSA CódonRaro 85 CACCAUGGCCGCCGUAAUCGCCAAAAGCUCCGUAAGCGCC (SEQ ID N°:94) -5,8
>MAAVIAKSSVSA CódonRaro 110 CACCAUGGCCGCCGUCAUAGCCAAGAGCUCCGUCUCCGCC (SEQ ID N°:95) -4,9
>MAAVIAKSSVSA CódonRaro 3 CACCAUGGCCGCCGUAAUAGCCAAAAGCUCCGUCUCCGCC (SEQ ID N°:96) -3,9
114/117
Petição 870190074939, de 05/08/2019, pág. 129/178
115/117
Estas variantes são testadas em um sistema transiente de tabaco como aqui descrito e o nível de expressão do transcrito e da proteína é estimado por qRT-PCR e ELISA, respectivamente, como aqui descrito.
Exemplo 12. Uso de mutações não-consequentes para mo5 dular os níveis da produção de proteínas.
As variantes da sequência nucleotídica que codifica para a 5enolpiruvil-3-fosfochiquimato (EPSP) sintase com o peptídeo de sinal direcionado para o cloroplasto, de milho, foram geradas. Também estão incluídas a sequência do tipo selvagem (WT) EPSPS como controle, também o trans10 crito EPSPS com um valor de -6,4 para a MFE da estrutura secundária do RNA. O uso do códon foi otimizado para a expressão de tabaco (Tabela 8).
Petição 870190074939, de 05/08/2019, pág. 130/178
Tabela 8: Variantes da sequência com a mutação para EPSPS e excluindo os códons raros em tabaco
Nome Seq MFE
>MAALGTKGGAGT MutanteEPSPS 4172 AACCAUGGCAGCAUUAGGAACAAAAGGGGGAGCAGGAACC (SEQ ID N°:97) -0,85
>MAAIGTKAGGGT MutanteEPSPS 2931 AACCAUGGCAGCAAUCGGAACAAAAGCAGGAGGAGGUACU (SEQ ID N°:98) -1,19
>MAAIGTKAGAGS MutanteEPSPS 3713 AACCAUGGCAGCAAUAGGAACAAAGGCAGGAGCAGGCAGU (SEQ ID N°:99) -1,21
>MAAIGSKAGAGT MutanteEPSPS 1574 AACCAUGGCAGCAAUUGGAUCAAAAGCAGGAGCAGGAACC (SEQ ID N°:100) -2,8
>MAALGTRGAAGT MutanteEPSPS 4993 AACCAUGGCAGCAUUAGGUACAAGAGGAGCAGCAGGCACU (SEQ ID N°:101) -2,8
>MAAIGSRAAAGT MutanteEPSPS 5931 AACCAUGGCAGCAAUAGGUAGUAGAGCAGCAGCAGGCACA (SEQ ID N°:102) -3,4
>MAAMATKAAAGT CTP-Zm EPSPS 30418 AACCAUGGCAGCUAUGGCAACUAAAGCAGCAGCAGGCACA (SEQ ID N°:103) -6,4
>MAAMATKAAAGT CTP-Zm_EPSPS WT AACCAUGGCUGCUAUGGCUACUAAGGCUGCUGCUGGAACU (SEQ ID N°:104) -10,6
116/117
Petição 870190074939, de 05/08/2019, pág. 131/178
117/117
As variantes são testadas em um sistema transiente de tabaco como anteriormente e o nível de expressão do transcrito e da proteína é estimado por qRT-PCR e ELISA, respectivamente, como aqui descrito.
Todas as publicações, pedidos de patente, patentes e outras re5 ferências aqui citadas são incorporadas como referência na sua totalidade para os ensinamentos relevantes relativamente à frase e/ou parágrafo em que a referência é apresentada.
O que precede é ilustrativo da presente invenção, e não deve ser interpretado como limitando o âmbito da mesma. A invenção é definida 10 pelas seguintes reivindicações, com equivalentes das reivindicações a serem nelas incluídos.

Claims (8)

  1. REIVINDICAÇÕES
    1. Método de seleção de um mRNA para expressão de um polipeptídeo de interesse em uma planta ou fungo, o método caracterizado pelo fato de compreender:
    a) produção de uma matriz de sequências individuais de mRNA compreendendo sequências de nucleotídeos diferentes que codificam o polipeptídeo de interesse; em que as sequências individuais de mRNAb compreendem nucleotídeos nas posições de -5 até 50 relacionadas ao códon de inciação e a matriz é gerada por retrotradução do polipeptídio de interesse;
    b) determinação da energia livre mínima (MFE) da estrutura secundária do RNA para cada sequência individual de mRNA de (a);
    c) classificação das sequências individuais de mRNA da matriz de acordo com a MFE da estrutura secundária do RNA determinada na etapa (b) de maior MFE da estrutura secundária do RNA para menor MFE da estrutura secundária do RNA; e
    d) seleção de uma sequência de mRNA da matriz classificada da etapa (c), em que o mRNA selecionado produz o polipeptídeo de interesse, em que o mRNA selecionado produz o polipeptídeo de interesse em uma planta eucariótica ou um fungo, e ainda em que para produção melhorada do mRNA é selecionado a partir do grupo de mRNAs tendo um MFE na gama de 0 kcal/mol a -2 kcal/mol e para a produção reduzida o mRNA é selecionado do grupo de mRNAs possuindo um MFE na gama de -9 kcal/mol a -18 kcal/mol.
  2. 2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o mRNA é selecionado para produção melhorada de um polipeptídeo de interesse.
  3. 3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o mRNA é selecionado para produção reduzida de um polipeptídeo de interesse.
  4. 4. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que antes da seleção o método compreende adicionalmente a determinação da energia livre do conjunto (EFE) para cada sequência individu
    Petição 870190074939, de 05/08/2019, pág. 133/178
    2/2 al de mRNA de (a) e classificação das sequências individuais de mRNA da matriz, de acordo com uma distribuição conjunta das MFE e EFE determinadas para cada sequência individual de mRNA de (a).
  5. 5. Método, de acordo com a reivindicação 4, caracterizado pelo fato de que o mRNA é selecionado para produção melhorada de um polipeptídeo de interesse e é selecionado de entre 0,0001% até 20% das sequências do mRNA na matriz classificada com os valores mais altos para a EFE e do grupo de mRNAs tendo uma MFE de estrutura secundária do RNA em uma gama de 0 kcal/mol a -2 kcal/mol.
  6. 6. Método, de acordo com a reivindicação 4, caracterizado pelo fato de que o mRNA é selecionado para produção reduzida de um polipeptídeo de interesse e é selecionado de entre 0,0001% até 20% das sequências de mRNA na matriz classificada com os valores mais baixos para a EFE e do grupo dos mRNAs tendo uma MFE da estrutura secundária do RNA na gama de -9kcal/mol a -18 kcal/mol.
  7. 7. Método, de acordo com qualquer uma das reivindicações 1 a 6, caracterizado pelo fato de que a sequência individual de mRNA selecionada na etapa (d) compreende um ou mais códons raros perto do códon de iniciação.
  8. 8. Método, de acordo com qualquer uma das reivindicações 1 a 6, caracterizado pelo fato de compreender adicionalmente a eliminação das sequências individuais de mRNA que compreendem um ou mais códons raros próximos do códon de iniciação a partir da matriz de sequências individuais de mRNA da etapa (a).
BR112012031559-5A 2010-06-11 2011-06-09 Método de seleção de um mrna para expressão de um polipeptídeo de interesse em uma planta ou fungo BR112012031559B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US35387910P 2010-06-11 2010-06-11
US61/353,879 2010-06-11
PCT/US2011/039701 WO2011156539A2 (en) 2010-06-11 2011-06-09 Compositions and methods for protein production

Publications (2)

Publication Number Publication Date
BR112012031559A2 BR112012031559A2 (pt) 2017-09-19
BR112012031559B1 true BR112012031559B1 (pt) 2020-03-03

Family

ID=45098659

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112012031559-5A BR112012031559B1 (pt) 2010-06-11 2011-06-09 Método de seleção de um mrna para expressão de um polipeptídeo de interesse em uma planta ou fungo

Country Status (7)

Country Link
US (3) US9334494B2 (pt)
EP (1) EP2580230B1 (pt)
CN (1) CN103080123A (pt)
AU (1) AU2011264879B2 (pt)
BR (1) BR112012031559B1 (pt)
CA (1) CA2801564A1 (pt)
WO (1) WO2011156539A2 (pt)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011011210A1 (en) * 2009-07-21 2011-01-27 Syngenta Participations Ag Plastid transit peptides derived from lower photosynthetic eukaryotes and methods
AU2011264879B2 (en) 2010-06-11 2015-11-12 Syngenta Participations Ag Compositions and methods for protein production
TW201341394A (zh) 2012-02-01 2013-10-16 Dow Agrosciences Llc 合成之葉綠體輸送胜肽
US10723806B2 (en) * 2012-02-27 2020-07-28 Riken Method of introducing nucleic acid into plant cells
WO2014178932A1 (en) * 2013-05-02 2014-11-06 Syngenta Participations Ag Glyphosate resistant class i epsps genes
US10724040B2 (en) 2015-07-15 2020-07-28 The Penn State Research Foundation mRNA sequences to control co-translational folding of proteins
EP3555289A1 (en) 2016-12-13 2019-10-23 ModernaTX, Inc. Rna affinity purification
EP3577221A4 (en) * 2017-02-01 2020-12-23 ModernaTX, Inc. SECONDARY POLYNUCLEOTIDE STRUCTURE
CN116705141B (zh) * 2022-12-15 2024-01-09 西北大学 一种基于cnn-lstm神经网络从核桃酶解产物中筛选阿尔兹海默症预防肽的方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6818752B2 (en) 2000-01-31 2004-11-16 Biocatalytics, Inc. Synthetic genes for enhanced expression
US6366860B1 (en) 2000-01-31 2002-04-02 Biocatalytics, Inc. Synthetic genes for enhanced expression
AU2001249170A1 (en) * 2000-03-13 2001-09-24 Aptagen Method for modifying a nucleic acid
US6733994B2 (en) * 2000-10-04 2004-05-11 The Trustees Of The University Of Pennsylvania Highly expressible genes
US20040002083A1 (en) 2002-01-29 2004-01-01 Ye Ding Statistical algorithms for folding and target accessibility prediction and design of nucleic acids
DE10205091B4 (de) 2002-02-07 2007-04-19 Biomax Informatics Ag Verfahren zur Vorhersage der Expressionseffizienz in zellfreien Expressionssystemen
EP1869177A4 (en) * 2005-03-17 2008-11-26 Zenotech Lab Ltd METHOD FOR ACHIEVING THE EXPRESSION OF RECOMBINANT HUMAN INTERLEUKIN-2 AT A HIGH LEVEL AFTER DESTABILIZING THE RNA SECONDARY STRUCTURE
US8855936B2 (en) 2009-10-02 2014-10-07 University Of Southern California Production of stable proteins
AU2011264879B2 (en) 2010-06-11 2015-11-12 Syngenta Participations Ag Compositions and methods for protein production

Also Published As

Publication number Publication date
US11643651B2 (en) 2023-05-09
US9605258B2 (en) 2017-03-28
US20170226504A1 (en) 2017-08-10
BR112012031559A2 (pt) 2017-09-19
AU2011264879A1 (en) 2013-01-10
WO2011156539A2 (en) 2011-12-15
EP2580230A4 (en) 2013-12-25
CN103080123A (zh) 2013-05-01
US20150152408A1 (en) 2015-06-04
US9334494B2 (en) 2016-05-10
WO2011156539A3 (en) 2012-06-07
CA2801564A1 (en) 2011-12-15
AU2011264879B2 (en) 2015-11-12
EP2580230A2 (en) 2013-04-17
US20130084641A1 (en) 2013-04-04
EP2580230B1 (en) 2017-08-23

Similar Documents

Publication Publication Date Title
BR112012031559B1 (pt) Método de seleção de um mrna para expressão de um polipeptídeo de interesse em uma planta ou fungo
ES2837575T3 (es) Composiciones y procedimientos para la producción y administración de ARN
US20170028083A1 (en) Methods and Compositions for RNA-Directed Repression of Transcription Using CRISPR-Associated Genes
Caroca et al. Design of chimeric expression elements that confer high‐level gene activity in chromoplasts
WO2018107103A1 (en) Crispr-systems for modifying a trait of interest in a plant
CN116334037A (zh) 新型Cas酶和系统以及应用
Srinivasan et al. Synergistic action of D-glucose and acetosyringone on Agrobacterium strains for efficient Dunaliella transformation
CN104135851A (zh) 合成的双向植物启动子ubi1的构建体和方法
Lacroix et al. Extracellular VirB5 enhances T-DNA transfer from Agrobacterium to the host plant
Xie et al. Characterization of VdASP F2 secretory factor from Verticillium dahliae by a fast and easy gene knockout system
Li et al. Agrobacterium-delivered VirE2 interacts with host nucleoporin CG1 to facilitate the nuclear import of VirE2-coated T complex
US20190352652A1 (en) Crispr-systems for modifying a trait of interest in a plant
BR112019014797A2 (pt) Elementos reguladores de planta e usos dos mesmos
BR102015001527B1 (pt) Cassete de expressão do gene e métodos para a expressão de uma sequência de codificação em uma planta transgênica e para a fabricação de uma sequência de polinucleotídeo sintética
Ershova et al. A novel cellular factor of Nicotiana benthamiana susceptibility to tobamovirus infection
Tao et al. Revealing differentially expressed genes and identifying effector proteins of Puccinia striiformis f. sp. tritici in response to high-temperature seedling plant resistance of wheat based on transcriptome sequencing
CN116286724A (zh) 凝集素类受体蛋白TaLecRLK2及其编码基因与应用
AU2015222996B2 (en) Root specific expression conferred by chimeric gene regulatory elements
KR20170136549A (ko) 트랜스젠 발현을 위한 식물 프로모터
Ding et al. The bacterial potassium transporter gene MbtrkH improves K+ uptake in yeast and tobacco
BR102014032957A2 (pt) promotores de ubiquitina de milho
Ni RNA Translocation into Chloroplasts
Zafar et al. RISKS AND RISK ASSESSMENT OF GM CROPS WITH ADVANCED MODIFICATION TECHNOLOGIES
Niehl et al. Impact of RNA virus infection on plant cell function and evolution
JP2018511331A (ja) 導入遺伝子発現のための植物プロモーター

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 09/06/2011, OBSERVADAS AS CONDICOES LEGAIS.