BR112018000262B1 - METHOD FOR MODIFYING CODING SEQUENCES AND METHOD FOR PREPARING AN EXPRESSION CASSETTE - Google Patents

METHOD FOR MODIFYING CODING SEQUENCES AND METHOD FOR PREPARING AN EXPRESSION CASSETTE Download PDF

Info

Publication number
BR112018000262B1
BR112018000262B1 BR112018000262-3A BR112018000262A BR112018000262B1 BR 112018000262 B1 BR112018000262 B1 BR 112018000262B1 BR 112018000262 A BR112018000262 A BR 112018000262A BR 112018000262 B1 BR112018000262 B1 BR 112018000262B1
Authority
BR
Brazil
Prior art keywords
polyadenylation
sequence
motifs
coding sequence
expression
Prior art date
Application number
BR112018000262-3A
Other languages
Portuguese (pt)
Other versions
BR112018000262A2 (en
Inventor
Wyatt Paul
Nora Temme
Original Assignee
Genective
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP15306105.6A external-priority patent/EP3115458A1/en
Application filed by Genective filed Critical Genective
Publication of BR112018000262A2 publication Critical patent/BR112018000262A2/en
Publication of BR112018000262B1 publication Critical patent/BR112018000262B1/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)

Abstract

MÉTODO DE MODIFICAÇÃO DE SEQUÊNCIAS DE CODIFICAÇÃO, MÉTODOS DE ELABORAÇÃO DE CONJUNTO DE EXPRESSÃO, SEQUÊNCIA DE CODIFICAÇÃO, CONJUNTO DE EXPRESSÃO QUE PODE SER OBTIDO POR MEIO DO MÉTODO, CÉLULA HOSPEDEIRA E PLANTA TRANSGÊNICA. A presente invenção refere-se a um método de modificação de sequências de codificação que codificam proteínas não vegetais, que compreende as etapas de otimização da mencionada sequência de codificação por meio de substituição de códons, de forma a obter uma sequência de codificação otimizada que codifica a mencionada proteína não vegetal; e reintrodução de pelo menos uma sequência de motivos de poliadenilação do tipo selvagem na sua posição na mencionada sequência genética otimizada.METHOD FOR MODIFYING CODING SEQUENCES, METHODS FOR PREPARING AN EXPRESSION SET, CODING SEQUENCE, EXPRESSION SET THAT CAN BE OBTAINED THROUGH THE METHOD, HOST CELL AND TRANSGENIC PLANT. The present invention relates to a method of modifying coding sequences encoding non-plant proteins, which comprises the steps of optimizing said coding sequence by means of codon substitution, in order to obtain an optimized coding sequence encoding the aforementioned non-vegetable protein; and reintroducing at least one wild-type polyadenylation motif sequence into its position in said optimized genetic sequence.

Description

[0001] A expressão de proteínas com poucos transgenes em plantas transgênicas pode ser atribuída a vários fatores (vide Lu et al (2015) para análise). Estes incluem: - baixos níveis de transcrição, que podem ser atribuídos à ligação de genes a promotores fracos; - processamento aberrante de transcritos, incluindo má divisão e poliadenilação prematura, gerando um transcrito que não contém partes da região de codificação; - baixo início de tradução causado por códons de início de ATG acima no fluxo do ponto inicial e baixa acessibilidade do ribossomo ao local de início correto; - baixas taxas de tradução devido à presença de códons raramente utilizados na região de codificação; e - fatores pós-transcrição tais como estabilidade de RNA, modificações de proteínas e estabilidade de proteínas.[0001] The expression of proteins with few transgenes in transgenic plants can be attributed to several factors (see Lu et al (2015) for analysis). These include: - low levels of transcription, which can be attributed to the binding of genes to weak promoters; - aberrant processing of transcripts, including missplitting and premature polyadenylation, generating a transcript that does not contain parts of the coding region; - low translation initiation caused by ATG start codons upstream of the start point and low accessibility of the ribosome to the correct start site; - low translation rates due to the presence of rarely used codons in the coding region; and - post-transcription factors such as RNA stability, protein modifications and protein stability.

[0002] Frequentemente, os transgenes a serem expressos em plantas são derivados de outras espécies vegetais ou não vegetais. Estes genes são evolutivamente adaptados para expressão no seu organismo hospedeiro no nível de expressão desejado no organismo hospedeiro, mas podem não ser adaptados para expressão na planta transformada. Além disso, alguns genes da mesma planta como a planta a ser transformada podem não ser adaptados para expressão em alto nível naquela mesma planta. Diferentes organismos possuem composições de base de DNA diferentes (%AT ou %GC), da mesma forma que genomas diferentes em uma célula eucariótica (núcleo contra mitocôndria (com também T para U) e em células vegetais (plastídeos)). Esta diferença da composição de pares de bases de DNA afeta a frequência da ocorrência de códons degenerados que codificam o mesmo aminoácido (frequência de uso de códons). A abundância dos tRNAs carregados cognatos é geralmente proporcional à frequência dos códons alvo no genoma. Genes que são ricos em %AT, portanto, são mal traduzidos em organismos que são ricos em %GC devido à falta de certos tRNAs carregados. Sabe-se bem na técnica que este problema pode ser superado pela recodificação de transgene, de tal forma que o uso de códon reflita o utilizado no organismo transgênico e, caso seja necessária alta expressão, coincida o uso de códon com o de genes de alta expressão naquele organismo.[0002] Often, transgenes to be expressed in plants are derived from other plant or non-plant species. These genes are evolutionarily adapted for expression in their host organism at the level of expression desired in the host organism, but may not be adapted for expression in the transformed plant. Furthermore, some genes from the same plant as the plant to be transformed may not be adapted for high-level expression in that same plant. Different organisms have different DNA base compositions (%AT or %GC), as do different genomes in a eukaryotic cell (nucleus versus mitochondria (with also T to U) and in plant cells (plastids)). This difference in the composition of DNA base pairs affects the frequency of occurrence of degenerate codons that code for the same amino acid (codon usage frequency). The abundance of cognate charged tRNAs is generally proportional to the frequency of target codons in the genome. Genes that are rich in %AT are therefore poorly translated in organisms that are rich in %GC due to a lack of certain charged tRNAs. It is well known in the art that this problem can be overcome by recoding the transgene, such that the codon usage reflects that used in the transgenic organism and, if high expression is required, the codon usage coincides with that of high-quality genes. expression in that organism.

[0003] Além da questão de uso de códons, genes nucleares eucarióticos possuem sinais de poliadenilação e divisão de transcritos que podem diferir entre organismos eucarióticos (por exemplo, entre plantas, animais e insetos ou entre plantas monocotiledôneas e dicotiledôneas) e podem estar ausentes em outros organismos, tais como procariotes. A expressão de genes de espécies exógenas em plantas transgênicas pode, portanto, gerar processamento de transcritos indesejado, tal como má divisão e poliadenilação prematura. Em animais, descobriu-se que o sinal de poliadenilação é composto de dois elementos principais, o elemento de posicionamento (PE) de motivo AAUAAA localizado em 10 a 30 bp acima no fluxo do local de poliadenilação (local de divisão (CS)) e um elemento abaixo no fluxo (DE) rico em U ou UG abaixo no fluxo do CS (Colgan e Manley (1997). Foram realizados esforços para identificar sequências de DNA que agem como sinais de poliadenilação em plantas. Joshi (1987) analisou quatro domínios abaixo no fluxo da região de codificação em 46 sequências genômicas de plantas e identificou supostas sequências de consenso acima e abaixo no fluxo do motivo similar a AAUAAA. Graber et al (1999) compararam sinais de poliadenilação in silico em levedura, Arabidopsis, arroz, mosca das frutas, camundongos e seres humanos. Eles concluíram que o uso e a conservação da sequência AAUAAA variaram entre as seis espécies, em que este sinal é particularmente fraco em plantas e leveduras. Eles favoreceram um modelo em que o sinal de poliadenilação consiste de uma série de elementos em que nenhum elemento é universalmente exigido. A falta de um elemento poderá ser compensada pela presença de palavras fortes em outros elementos. Graber et al (1999) propuseram cinco elementos de sequências para plantas, nesta ordem: o elemento acima no fluxo (UE) (UUGUAU ou UUGUAA), PE (AAUAAA ou AAUGAA = rico em A), o rico em U (UUUUCU, UUUUUU ou similar), o CS (UA ou UC) e segunda região rica em U. Desta forma, as plantas, em comparação com animais, possuem um elemento acima no fluxo adicional que contribui com a definição do sinal de poliadenilação. Mogen et al (1990) relataram que exclusões de elementos acima no fluxo do Vírus Mosaico da Couve-Flor (CaMV) e as regiões de poliadenilação de PeaRbsC reduziram a eficiência da poliadenilação no local “correto”. Resultado similar também foi relatado por Sanfacon et al (2007), novamente sobre o sinal de poliadenilação de CaMV.[0003] In addition to the issue of codon usage, eukaryotic nuclear genes have signs of polyadenylation and transcript splitting that may differ between eukaryotic organisms (for example, between plants, animals and insects or between monocotyledonous and dicot plants) and may be absent in other organisms, such as prokaryotes. Expression of genes from exogenous species in transgenic plants can therefore generate unwanted transcript processing, such as missplitting and premature polyadenylation. In animals, the polyadenylation signal has been found to be composed of two main elements, the AAUAAA motif positioning element (PE) located 10 to 30 bp upstream from the polyadenylation site (split site (CS)) and a U-rich or UG-rich element downstream (DE) downstream of the CS (Colgan and Manley (1997). Efforts have been made to identify DNA sequences that act as polyadenylation signals in plants. Joshi (1987) analyzed four domains downstream of the coding region in 46 plant genomic sequences and identified putative consensus sequences upstream and downstream of the AAUAAA-like motif Graber et al (1999) compared in silico polyadenylation signals in yeast, Arabidopsis, rice, fly of fruits, mice and humans. They concluded that the use and conservation of the AAUAAA sequence varied among the six species, with this signal being particularly weak in plants and yeast. They favored a model in which the polyadenylation signal consists of a series of elements in which no element is universally required. The lack of an element may be compensated by the presence of strong words in other elements. Graber et al (1999) proposed five sequence elements for plants, in this order: the element upstream (UE) (UUGUAU or UUGUAA), PE (AAUAAA or AAUGAA = rich in A), the rich in U (UUUUCU, UUUUUU or similar), the CS (UA or UC) and second U-rich region. Thus, plants, in comparison to animals, have an additional element upstream that contributes to the definition of the polyadenylation signal. Mogen et al (1990) reported that deletions of elements upstream of Cauliflower Mosaic Virus (CaMV) and the polyadenylation regions of PeaRbsC reduced the efficiency of polyadenylation at the “correct” site. A similar result was also reported by Sanfacon et al (2007), again regarding the CaMV polyadenylation signal.

[0004] Como os sinais de poliadenilação em plantas são ricos em AT e aqueles procariotes não contêm esses sinais, genes de procariotes que são ricos em %AT frequentemente contêm sequências que poderão ser reconhecidas como sequências de poliadenilação. A presença desses motivos de poliadenilação “crípticos” em regiões de codificação de transgenes foi atribuída, portanto, à baixa expressão de genes tais como genes de Bacillus thuringiensis em plantas. Fischhoff et al (US 7.741.118 B1) descreve que a remoção de motivos similares a AATAAA de hexâmeros aumentará a expressão genética. Eles fornecem uma lista de 16 potenciais motivos de poliadenilação cuja frequência deverá ser reduzida na região de codificação de um transgene para aumentar a expressão in planta.[0004] As polyadenylation signals in plants are rich in AT and those in prokaryotes do not contain these signals, prokaryotic genes that are rich in %AT often contain sequences that can be recognized as polyadenylation sequences. The presence of these “cryptic” polyadenylation motifs in transgene coding regions has therefore been attributed to the low expression of genes such as Bacillus thuringiensis genes in plants. Fischhoff et al (US 7,741,118 B1) describe that removing AATAAA-like motifs from hexamers will increase gene expression. They provide a list of 16 potential polyadenylation motifs whose frequency must be reduced in the coding region of a transgene to increase expression in planta.

[0005] A expressão em alto nível de genes não vegetais em plantas é uma questão agronômica crítica. Existe, portanto, a necessidade de desenvolver novos métodos de aumentar a expressão genética em plantas, notadamente pelo método fornecido que introduz menos modificações que as propostas por alguns outros métodos de modificação genética conhecidos na técnica.[0005] High-level expression of non-plant genes in plants is a critical agronomic issue. There is, therefore, a need to develop new methods of increasing gene expression in plants, notably by the method provided that introduces fewer modifications than those proposed by some other genetic modification methods known in the art.

DESCRIÇÃO DETALHADA DA INVENÇÃODETAILED DESCRIPTION OF THE INVENTION

[0006] O propósito da presente invenção é o de fornecer um método de modificação de uma sequência genética de codificação, particularmente quando esta sequência genética de codificação codificar uma proteína inseticida de Bacillus thuringiensis, a fim de obter expressão in planta da proteína em nível significativamente mais alto que a sequência genética do tipo selvagem.[0006] The purpose of the present invention is to provide a method of modifying a genetic coding sequence, particularly when this genetic coding sequence encodes a Bacillus thuringiensis insecticidal protein, in order to obtain in planta expression of the protein at a significantly higher level. higher than the wild-type gene sequence.

[0007] Outro propósito da presente invenção é o de fornecer um método de preparação de construções de DNA que compreendem uma sequência genética modificada, em que a sequência genética modificada é expressa em nível significativamente mais alto que a sequência genética do tipo selvagem in planta.[0007] Another purpose of the present invention is to provide a method of preparing DNA constructs comprising a modified genetic sequence, wherein the modified genetic sequence is expressed at a significantly higher level than the wild-type genetic sequence in planta.

[0008] A presente invenção refere-se a um método de elaboração de sequências de codificação modificadas que codificam proteínas não vegetais, em que o método compreende: (a) identificação de sequência de codificação que codifica uma proteína não vegetal; (b) identificação de cada sequência de motivos de poliadenilação e sua posição de ácido nucleico na mencionada sequência de codificação; (c) otimização da mencionada sequência de codificação por meio de substituição de códons, em que a sequência de codificação otimizada codifica a mencionada proteína não vegetal; e (d) modificação da mencionada sequência de codificação otimizada para obter uma sequência genética modificada por meio da introdução de pelo menos uma sequência de motivos de poliadenilação, conforme ilustrado na Tabela 1, na sequência genética otimizada, em que a sequência de codificação modificada compreende pelo menos um motivo de poliadenilação e a mencionada sequência de codificação modificada codifica a mencionada proteína não vegetal.[0008] The present invention relates to a method of preparing modified coding sequences that encode non-plant proteins, wherein the method comprises: (a) identifying a coding sequence that encodes a non-plant protein; (b) identifying each polyadenylation motif sequence and its nucleic acid position in said coding sequence; (c) optimizing said coding sequence by means of codon substitution, wherein the optimized coding sequence encodes said non-plant protein; and (d) modifying said optimized coding sequence to obtain a modified genetic sequence by introducing at least one polyadenylation motif sequence, as illustrated in Table 1, into the optimized genetic sequence, wherein the modified coding sequence comprises at least one polyadenylation motif and said modified coding sequence encodes said non-plant protein.

[0009] A presente invenção também se refere a um método de modificação de uma sequência de codificação que codifica proteínas não vegetais, que compreende as etapas de: (a) identificação de cada sequência de motivos de poliadenilação do tipo selvagem e sua posição na mencionada sequência de codificação; (b) otimização da mencionada sequência de codificação por meio de substituição de códons, de forma a obter uma sequência de codificação otimizada que codifica a mencionada proteína não vegetal; e (c) introdução de pelo menos uma sequência de motivos de poliadenilação conforme descrito na Tabela 1, na mencionada sequência genética otimizada, de forma a obter uma sequência de codificação modificada que compreende pelo menos um motivo de poliadenilação e a mencionada sequência de codificação modificada codifica a mencionada proteína não vegetal.[0009] The present invention also relates to a method of modifying a coding sequence encoding non-plant proteins, which comprises the steps of: (a) identifying each wild-type polyadenylation motif sequence and its position in said coding sequence; (b) optimizing said coding sequence by means of codon substitution, in order to obtain an optimized coding sequence that encodes said non-plant protein; and (c) introducing at least one sequence of polyadenylation motifs as described in Table 1, into said optimized genetic sequence, so as to obtain a modified coding sequence comprising at least one polyadenylation motif and said modified coding sequence encodes the aforementioned non-vegetable protein.

[0010] Em uma realização preferida e conforme descrito abaixo, a poliadenilação que é introduzida na sequência genética otimizada é preferivelmente um motivo de poliadenilação fraco, conforme definido abaixo.[0010] In a preferred embodiment and as described below, the polyadenylation that is introduced into the optimized genetic sequence is preferably a weak polyadenylation motif, as defined below.

[0011] Além disso, não é introduzida poliadenilação forte, conforme definido abaixo, na sequência genética otimizada.[0011] Furthermore, strong polyadenylation, as defined below, is not introduced into the optimized genetic sequence.

[0012] Além disso, a quantidade de sequências de motivos de poliadenilação introduzidas na sequência genética otimizada é tal que a quantidade total de sequências de motivos de poliadenilação na sequência modificada é de três ou mais, mas menos que a quantidade de sequências de motivos de poliadenilação presentes na sequência do tipo selvagem.[0012] Furthermore, the amount of polyadenylation motif sequences introduced into the optimized genetic sequence is such that the total amount of polyadenylation motif sequences in the modified sequence is three or more, but less than the amount of polyadenylation motif sequences in the modified sequence. polyadenylation present in the wild-type sequence.

[0013] Como será descrito abaixo, a sequência modificada conterá, portanto, uma combinação de pelo menos três poliadenilações, idênticas a uma combinação de poliadenilação que está presente na sequência de tipo selvagem, e a sequência modificada não compreenderá a combinação da totalidade dos motivos de poliadenilação que estão presentes na sequência de tipo selvagem.[0013] As will be described below, the modified sequence will therefore contain a combination of at least three polyadenylations, identical to a polyadenylation combination that is present in the wild-type sequence, and the modified sequence will not comprise the combination of the entire motifs polyadenylation sequences that are present in the wild-type sequence.

[0014] O propósito da modificação da sequência genética otimizada por meio de reintrodução de motivos de poliadenilação, conforme descrito no presente, é que isso aumentará ou manterá a expressão da sequência, em comparação com a sequência otimizada. Os exemplos demonstram, entretanto, que a reintrodução de motivos de poliadenilação na sequência otimizada, a fim de obter uma sequência modificada que compreende todos os motivos de poliadenilação presentes na sequência de tipo selvagem, pode, em alguns casos, reduzir a expressão com relação à sequência otimizada. A introdução de apenas alguns motivos de poliadenilação, particularmente os fracos, a fim de ter pelo menos três (preferivelmente, no máximo dez ou, no máximo, seis) motivos de poliadenilação na sequência modificada, mas nem todos os motivos de poliadenilação, deverá, portanto, possibilitar um método robusto que pode ser aplicável e repetido com virtualmente qualquer sequência.[0014] The purpose of modifying the optimized genetic sequence by reintroducing polyadenylation motifs, as described herein, is that this will increase or maintain expression of the sequence, compared to the optimized sequence. The examples demonstrate, however, that reintroducing polyadenylation motifs into the optimized sequence in order to obtain a modified sequence that comprises all polyadenylation motifs present in the wild-type sequence can, in some cases, reduce expression relative to optimized sequence. The introduction of only a few polyadenylation motifs, particularly weak ones, in order to have at least three (preferably at most ten or at most six) polyadenylation motifs in the modified sequence, but not all polyadenylation motifs, should, therefore, enabling a robust method that can be applicable and repeated with virtually any sequence.

[0015] Nesta realização, a presente invenção refere-se, portanto, a um método de elaboração de sequências de codificação modificadas que codificam uma proteína não vegetal, em que o método compreende: (a) identificação de sequência de codificação que codifica uma proteína não vegetal; (b) identificação de cada sequência de motivos de poliadenilação e sua posição de ácido nucleico na mencionada sequência de codificação; (c) otimização da mencionada sequência de codificação por meio de substituição de códons, em que a sequência de codificação otimizada codifica a mencionada proteína não vegetal; e (d) modificação da mencionada sequência de codificação otimizada para obter uma sequência genética modificada conforme descrito na Tabela 1, por meio da introdução de pelo menos uma sequência de motivos de poliadenilação na sequência genética otimizada, de forma a obter uma sequência de codificação modificada que compreende pelo menos três motivos de poliadenilação, mas nem todos os motivos de poliadenilação identificados na etapa (b) e a mencionada sequência de codificação modificada codifica a mencionada proteína não vegetal.[0015] In this embodiment, the present invention therefore relates to a method of preparing modified coding sequences that encode a non-plant protein, wherein the method comprises: (a) identifying a coding sequence that encodes a protein non-vegetable; (b) identifying each polyadenylation motif sequence and its nucleic acid position in said coding sequence; (c) optimizing said coding sequence by means of codon substitution, wherein the optimized coding sequence encodes said non-plant protein; and (d) modifying said optimized coding sequence to obtain a modified genetic sequence as described in Table 1, by introducing at least one sequence of polyadenylation motifs into the optimized genetic sequence, so as to obtain a modified coding sequence which comprises at least three polyadenylation motifs, but not all of the polyadenylation motifs identified in step (b) and said modified coding sequence encodes said non-plant protein.

[0016] De forma similar, a presente invenção também se refere a um método de modificação de uma sequência de codificação de proteínas não vegetais, que compreende as etapas de: (a) identificação de cada sequência de motivos de poliadenilação do tipo selvagem e sua posição na mencionada sequência de codificação; (b) otimização da mencionada sequência de codificação por meio de substituição de códons, de forma a obter uma sequência de codificação otimizada que codifica a mencionada proteína não vegetal; e (c) introdução de pelo menos uma sequência de motivos de poliadenilação conforme descrito na Tabela 1 na mencionada sequência genética otimizada, de forma a obter uma sequência de codificação modificada que compreende pelo menos três motivos de poliadenilação, mas nem todos os motivos de poliadenilação identificados na etapa (a) e a mencionada sequência de codificação modificada codifica a mencionada proteína não vegetal.[0016] Similarly, the present invention also relates to a method of modifying a non-plant protein coding sequence, which comprises the steps of: (a) identifying each wild-type polyadenylation motif sequence and its position in said coding sequence; (b) optimizing said coding sequence by means of codon substitution, in order to obtain an optimized coding sequence that encodes said non-plant protein; and (c) introducing at least one sequence of polyadenylation motifs as described in Table 1 into said optimized genetic sequence, so as to obtain a modified coding sequence comprising at least three polyadenylation motifs, but not all polyadenylation motifs. identified in step (a) and said modified coding sequence encodes said non-plant protein.

[0017] Estes métodos são preferivelmente realizados com uma ou mais das características a seguir, que podem ser implementadas independentemente ou por meio de qualquer combinação: - a sequência de motivos de poliadenilação introduzida na etapa (d) (ou (c)) não é uma sequência de motivos de poliadenilação forte (conforme descrito abaixo); - a sequência de motivos de poliadenilação introduzida na etapa (d) (ou (c)) é uma sequência de motivos de poliadenilação fraco (conforme descrito abaixo); - a sequência de motivos de poliadenilação é aquela que tenha sido identificada na etapa (b) e é reintroduzida na sua posição identificada na etapa (b) (ou (a)); - a sequência modificada contém, no máximo, seis sequências de motivos de poliadenilação; - a sequência modificada contém, no máximo, dez sequências de motivos de poliadenilação; e - todas as pelo menos três sequências de motivos de poliadenilação na sequência modificada estavam inicialmente presentes na sequência do tipo selvagem e estão posicionadas no local que possuíam na sequência do tipo selvagem.[0017] These methods are preferably carried out with one or more of the following characteristics, which can be implemented independently or through any combination: - the sequence of polyadenylation motifs introduced in step (d) (or (c)) is not a sequence of strong polyadenylation motifs (as described below); - the polyadenylation motif sequence introduced in step (d) (or (c)) is a weak polyadenylation motif sequence (as described below); - the sequence of polyadenylation motifs is that which was identified in step (b) and is reintroduced into its position identified in step (b) (or (a)); - the modified sequence contains a maximum of six polyadenylation motif sequences; - the modified sequence contains a maximum of ten polyadenylation motif sequences; and - all at least three polyadenylation motif sequences in the modified sequence were initially present in the wild-type sequence and are positioned in the location they had in the wild-type sequence.

[0018] Em uma realização preferida, a mencionada sequência de motivos de poliadenilação introduzida na mencionada sequência genética otimizada foi identificada na etapa (a) e, neste caso, prefere-se adicionalmente que a mencionada sequência de motivos de poliadenilação identificada na etapa (a) seja introduzida na sua posição na mencionada sequência genética otimizada.[0018] In a preferred embodiment, said sequence of polyadenylation motifs introduced in said optimized genetic sequence was identified in step (a) and, in this case, it is further preferred that said sequence of polyadenylation motifs identified in step (a) ) is introduced into its position in the aforementioned optimized genetic sequence.

[0019] Em uma realização adicional, quando mais de um motivo de poliadenilação for introduzido na sequência otimizada, cada motivo de poliadenilação introduzido na mencionada sequência otimizada é um motivo de poliadenilação do tipo selvagem identificado na etapa (a), que é introduzido em uma posição de ácido nucleico correspondente à sua posição na sequência de codificação.[0019] In a further embodiment, when more than one polyadenylation motif is introduced into the optimized sequence, each polyadenylation motif introduced into said optimized sequence is a wild-type polyadenylation motif identified in step (a), which is introduced into a nucleic acid position corresponding to its position in the coding sequence.

[0020] A presente invenção engloba a identificação de uma sequência genética de codificação. Essa sequência genética de codificação é a sequência de codificação do tipo selvagem que é isolada ou identificada a partir do organismo no qual a proteína é expressa naturalmente.[0020] The present invention encompasses the identification of a genetic coding sequence. This genetic coding sequence is the wild-type coding sequence that is isolated or identified from the organism in which the protein is naturally expressed.

[0021] Especificamente, a presente invenção engloba o uso de sequências de codificação exógenas que codificam proteínas não vegetais. Preferivelmente, a proteína não vegetal é uma proteína inseticida codificada por Bacillus thuringiensis.[0021] Specifically, the present invention encompasses the use of exogenous coding sequences that encode non-plant proteins. Preferably, the non-plant protein is an insecticidal protein encoded by Bacillus thuringiensis.

[0022] A sequência genética de codificação pode ser um fragmento da sequência genética de codificação do tipo selvagem. A sequência genética de codificação pode, por exemplo, ser uma sequência codificadora do fragmento de toxina de uma proteína de Bacillus thuringiensis. A sequência de codificação pode também codificar uma fusão entre dois fragmentos de proteína obtidos de diferentes proteínas do tipo selvagem.[0022] The genetic coding sequence may be a fragment of the wild-type genetic coding sequence. The genetic coding sequence may, for example, be a coding sequence for the toxin fragment of a Bacillus thuringiensis protein. The coding sequence may also encode a fusion between two protein fragments obtained from different wild-type proteins.

[0023] Quando apropriado, a sequência de codificação pode ser otimizada para maior expressão na planta transformada. Existem diversas otimizações que podem ser realizadas em nível de DNA, sem alterar a sequência de proteínas por meio de alterações de códons conservadoras que substituem um códon por outro códon que codifica o mesmo aminoácido.[0023] When appropriate, the coding sequence can be optimized for greater expression in the transformed plant. There are several optimizations that can be performed at the DNA level without changing the protein sequence through conservative codon changes that replace a codon with another codon that codes for the same amino acid.

[0024] Os parâmetros que podem ser otimizados são, por exemplo, uso de códons, teor de GC local, ausência de locais de divisão, estrutura secundária de mRNA e motivos de poliadenilação.[0024] Parameters that can be optimized are, for example, codon usage, local GC content, absence of division sites, mRNA secondary structure and polyadenylation motifs.

[0025] Mais especificamente, os genes podem ser sintetizados utilizando códons preferidos por plantas para maior expressão ou podem ser sintetizados utilizando códons em frequência de uso de códons preferida das plantas. Consequentemente, o teor de GC do gene será frequentemente aumentado. Métodos de atingir essa otimização para expressão são bem conhecidos na técnica e notadamente descritos em Campbell e Gowri (1990) para uma discussão do uso de códons preferidos do hospedeiro e, mais especificamente, para a síntese de genes preferidos de plantas (WO 91/16432 e Murray et al (1989)). WO 91/16432 descreve particularmente um processo de modificação de gene Bt ICP para aumentar a sua expressão em células vegetais transformadas com o gene; em que o processo compreende a etapa de: alteração das sequências A e T em uma série de códons de tradução do gene para sequências G e C correspondentes que codificam os mesmos aminoácidos, de forma a aumentar a transcrição do gene em mRNA, acúmulo nuclear do mRNA e/ou exportação nuclear do mRNA, particularmente, a transcrição do gene, na célula vegetal.[0025] More specifically, genes can be synthesized using codons preferred by plants for greater expression or can be synthesized using codons at the plant's preferred codon usage frequency. Consequently, the GC content of the gene will often be increased. Methods of achieving such optimization for expression are well known in the art and notably described in Campbell and Gowri (1990) for a discussion of the use of host-preferred codons and, more specifically, for the synthesis of plant-preferred genes (WO 91/16432 and Murray et al (1989)). WO 91/16432 particularly describes a process for modifying the Bt ICP gene to increase its expression in plant cells transformed with the gene; in which the process comprises the step of: changing the A and T sequences in a series of gene translation codons to corresponding G and C sequences that encode the same amino acids, in order to increase the transcription of the gene into mRNA, nuclear accumulation of the mRNA and/or nuclear export of mRNA, particularly gene transcription, in the plant cell.

[0026] A fim de realizar essa otimização, diferentes algoritmos são disponíveis para prever a posição de motivos de poliadenilação em genes vegetais. Ji et al (2015), por exemplo, desenvolveram o algoritmo PASPA (Previsão de Local PoliA em Plantas e Algas; http://bmi.xmu.edu.cn/paspa). Outros algoritmos também são disponíveis, tais como PAC (classificador de local poli(A) (Wu et al, 2012) e poliA-iEP (Tzanis et al (2011)). A linha inicial deste sistema é a identificação de motivos com um dado nível de probabilidade para representar um motivo de poliadenilação. Os motivos de poliadenilação que abrigam alto nível de probabilidade para representar locais de poliadenilação na sequência de tipo selvagem podem ser então removidos da sequência otimizada.[0026] In order to perform this optimization, different algorithms are available to predict the position of polyadenylation motifs in plant genes. Ji et al (2015), for example, developed the PASPA algorithm (PolyA Location Prediction in Plants and Algae; http://bmi.xmu.edu.cn/paspa). Other algorithms are also available, such as PAC (poly(A) site classifier (Wu et al, 2012) and polyA-iEP (Tzanis et al (2011)). The starting line of this system is the identification of motifs with a given level of probability to represent a polyadenylation motif.Polyadenylation motifs that harbor high level of probability to represent polyadenylation sites in the wild-type sequence can then be removed from the optimized sequence.

[0027] Pretende-se no presente que motivos de poliadenilação na presente invenção consistam das 16 sequências de motivos a seguir: AAAATA, AACCAA, AAGCAT, AATAAA, AATAAT, AATACA, AATCAA, AATTAA, ATAAAA, ATACAT, ATACTA, ATATAA, ATGAAA, ATTAAA, ATTAAT e CATAAA. Cada motivo de poliadenilação pode ser indicado por uma sequência específica descrita pelo código poliA na Tabela 1. Além disso, cada motivo de poliadenilação compreendido em uma sequência de codificação pode ser caracterizado não apenas pela sua sequência, mas também pela sua posição de ácido nucleico na sequência de codificação, tal como “localizado entre o nucleotídeo X e o nucleotídeo Y da sequência de codificação” ou “em que o primeiro nucleotídeo do motivo de poliadenilação está localizado na posição X na sequência de codificação”.[0027] It is hereby intended that polyadenylation motifs in the present invention consist of the following 16 motif sequences: AAAATA, AACCAA, AAGCAT, AATAAA, AATAAT, AATACA, AATCAA, AATTAA, ATAAAA, ATACAT, ATACTA, ATATAA, ATGAAA, ATTAAA, ATTAAT and CATAAA. Each polyadenylation motif can be indicated by a specific sequence described by the polyA code in Table 1. Furthermore, each polyadenylation motif comprised in a coding sequence can be characterized not only by its sequence, but also by its nucleic acid position in the coding sequence, such as “located between nucleotide X and nucleotide Y of the coding sequence” or “wherein the first nucleotide of the polyadenylation motif is located at position X in the coding sequence”.

[0028] Consequentemente, uma sequência de codificação que codifica uma proteína não vegetal pode ser caracterizada por uma combinação de motivos de poliadenilação em que uma sequência de poliA e uma posição de ácido nucleico na sequência de codificação podem ser atribuídas a cada motivo de poliadenilação identificado na sequência de codificação.[0028] Consequently, a coding sequence encoding a non-plant protein can be characterized by a combination of polyadenylation motifs in which a polyA sequence and a nucleic acid position in the coding sequence can be assigned to each identified polyadenylation motif. in the coding sequence.

[0029] A otimização de uma sequência de codificação por meio dos métodos descritos no presente pode gerar a remoção de um ou mais motivos de poliadenilação relacionados na Tabela 1. Até certo ponto, todos os motivos de poliadenilação podem ser removidos, de forma que a sequência de codificação otimizada seja livre de quaisquer motivos de poliadenilação. A remoção completa de motivos de poliadenilação pode, entretanto, impor grandes restrições sobre outras variáveis de sequência, notadamente sobre as sequências de aminoácidos (ou seja, perda de identidade da proteína obtida a partir da sequência otimizada com relação à proteína do tipo selvagem obtida da sequência do tipo selvagem não otimizada).[0029] Optimization of a coding sequence using the methods described herein can generate the removal of one or more polyadenylation motifs listed in Table 1. To some extent, all polyadenylation motifs can be removed, so that the optimized coding sequence is free of any polyadenylation motifs. Complete removal of polyadenylation motifs may, however, impose major restrictions on other sequence variables, notably amino acid sequences (i.e., loss of identity of the protein obtained from the optimized sequence with respect to the wild-type protein obtained from unoptimized wild-type sequence).

[0030] O depositante demonstrou que, surpreendentemente, é possível reintroduzir motivos de poliadenilação na sequência genética otimizada e que ainda se observará redução do nível de motivos de poliadenilação calculados inicialmente e previstos a partir da sequência do tipo selvagem para a maior parte dos motivos de poliadenilação.[0030] The applicant demonstrated that, surprisingly, it is possible to reintroduce polyadenylation motifs into the optimized genetic sequence and that a reduction in the level of polyadenylation motifs initially calculated and predicted from the wild-type sequence for most of the polyadenylation motifs will still be observed. polyadenylation.

[0031] Sem desejar restrições a esta teoria do mecanismo que sustenta esse fenômeno, os inventores supõem que a otimização da sequência genética de codificação modifica os motivos circunvizinhos que agem em combinação com motivos de poliadenilação para reduzir a expressão genética, de forma que, quando os motivos de poliadenilação forem reintroduzidos na sequência genética de codificação otimizada, eles perdem a sua capacidade de reduzir a expressão genética.[0031] Without wishing to restrict this theory of the mechanism underlying this phenomenon, the inventors hypothesize that optimization of the genetic coding sequence modifies the surrounding motifs that act in combination with polyadenylation motifs to reduce gene expression, so that when polyadenylation motifs are reintroduced into the optimized gene coding sequence, they lose their ability to reduce gene expression.

[0032] Deve-se observar que o(s) local(is) de poliadenilação que é(são) introduzido(s) na sequência otimizada não estava(m) necessariamente presente(s) na sequência do tipo selvagem. Além disso, esse(s) local(is) não é(são) necessariamente introduzido(s) na mesma posição dos locais de poliadenilação do tipo selvagem na sequência de tipo selvagem.[0032] It should be noted that the polyadenylation site(s) that are introduced in the optimized sequence were not necessarily present in the wild-type sequence. Furthermore, these site(s) are not necessarily introduced at the same position as the wild-type polyadenylation sites in the wild-type sequence.

[0033] Os técnicos no assunto podem determinar quais e quantos motivos de poliadenilação com código poliA específico podem ser introduzidos na sequência de codificação otimizada para a realização da presente invenção, mantendo ao mesmo tempo a sequência de proteínas do tipo selvagem.[0033] Those skilled in the art can determine which and how many polyadenylation motifs with specific polyA code can be introduced into the optimized coding sequence for carrying out the present invention, while maintaining the wild-type protein sequence.

[0034] Em realização preferida, cada motivo de poliadenilação que é introduzido na sequência de codificação otimizada é introduzido em uma posição de ácido nucleico idêntica a uma posição de local de poliadenilação do tipo selvagem identificada na sequência de codificação do tipo selvagem. Em uma realização de preferência superior, o motivo de poliadenilação que é introduzido na sequência otimizada é o motivo de poliadenilação do tipo selvagem, introduzido na sua posição natural (tipo selvagem).[0034] In a preferred embodiment, each polyadenylation motif that is introduced into the optimized coding sequence is introduced into a nucleic acid position identical to a wild-type polyadenylation site position identified in the wild-type coding sequence. In a higher preferred embodiment, the polyadenylation motif that is introduced into the optimized sequence is the wild-type polyadenylation motif, introduced in its natural position (wild type).

[0035] Nestas duas realizações, a proteína codificada pela sequência de codificação modificada é a proteína do tipo selvagem, codificada pela sequência não otimizada do tipo selvagem.[0035] In these two embodiments, the protein encoded by the modified coding sequence is the wild-type protein, encoded by the non-optimized wild-type sequence.

[0036] De preferência superior, o método de acordo com a presente invenção refere-se a um método de modificação de sequências de codificação em que todos os motivos de poliadenilação introduzidos são introduzidos em uma posição de ácido nucleico idêntica às suas posições, conforme identificado na sequência de codificação do tipo selvagem, em que a sequência de codificação modificada resultante compreende a mesma combinação de motivos de poliadenilação identificada na sequência de codificação do tipo selvagem.[0036] Preferably, the method according to the present invention refers to a method of modifying coding sequences in which all introduced polyadenylation motifs are introduced into a nucleic acid position identical to their positions as identified. in the wild-type coding sequence, wherein the resulting modified coding sequence comprises the same combination of polyadenylation motifs identified in the wild-type coding sequence.

[0037] Nesta realização, motivos de poliadenilação do tipo selvagem identificados na sequência de codificação são introduzidos em posições de ácidos nucleicos idênticas às suas posições na sequência de codificação, de forma a obter uma sequência de codificação modificada que compreende a mesma combinação de motivos de poliadenilação da sequência de codificação do tipo selvagem.[0037] In this embodiment, wild-type polyadenylation motifs identified in the coding sequence are introduced into nucleic acid positions identical to their positions in the coding sequence, in order to obtain a modified coding sequence that comprises the same combination of polyadenylation motifs. polyadenylation of the wild-type coding sequence.

[0038] Essa sequência modificada codifica a proteína não vegetal do tipo selvagem e é capaz de ser expressa em nível significativamente mais alto em comparação com a sequência do tipo selvagem não otimizada, muito embora compreenda todos os motivos de poliadenilação presentes na sequência de codificação do tipo selvagem.[0038] This modified sequence encodes the wild-type non-plant protein and is capable of being expressed at a significantly higher level compared to the non-optimized wild-type sequence, even though it comprises all of the polyadenylation motifs present in the protein coding sequence. wild type.

[0039] O método de acordo com a presente invenção também se refere a um método de modificação de sequências de codificação em que todos os motivos de poliadenilação introduzidos são introduzidos em uma posição de ácido nucleico idêntica à sua posição, conforme identificado na sequência de codificação do tipo selvagem, e a sequência de codificação modificada resultante deverá compreender, portanto, uma combinação de um, dois ou três motivos de poliadenilação, conforme identificado na sequência de codificação do tipo selvagem. Nestes casos, espera-se que a sequência de codificação modificada não compreenda a combinação de todos os motivos de poliadenilação, conforme identificado na sequência de codificação do tipo selvagem.[0039] The method according to the present invention also refers to a method of modifying coding sequences in which all introduced polyadenylation motifs are introduced into a nucleic acid position identical to their position as identified in the coding sequence wild-type, and the resulting modified coding sequence should therefore comprise a combination of one, two, or three polyadenylation motifs as identified in the wild-type coding sequence. In these cases, it is expected that the modified coding sequence will not comprise the combination of all polyadenylation motifs as identified in the wild-type coding sequence.

[0040] Em realização específica, motivos de poliadenilação do tipo selvagem identificados na sequência de codificação são introduzidos na etapa (c) em posições de ácidos nucleicos idênticas às suas posições na sequência de codificação, de forma a obter uma sequência de codificação modificada que compreende um motivo de poliadenilação presente na sequência do tipo selvagem.[0040] In a specific embodiment, wild-type polyadenylation motifs identified in the coding sequence are introduced in step (c) into nucleic acid positions identical to their positions in the coding sequence, so as to obtain a modified coding sequence comprising a polyadenylation motif present in the wild-type sequence.

[0041] Em outra realização, motivos de poliadenilação do tipo selvagem identificados na sequência de codificação são introduzidos na etapa (c) em posições de ácidos nucleicos idênticas às suas posições na sequência de codificação, de forma a obter uma sequência de codificação modificada que compreende uma combinação de dois motivos de poliadenilação presentes na sequência do tipo selvagem.[0041] In another embodiment, wild-type polyadenylation motifs identified in the coding sequence are introduced in step (c) into nucleic acid positions identical to their positions in the coding sequence, so as to obtain a modified coding sequence comprising a combination of two polyadenylation motifs present in the wild-type sequence.

[0042] Deve-se observar que, a fim de obter uma sequência de codificação modificada que compreende uma combinação de dois motivos de poliadenilação presentes na sequência do tipo selvagem, serão introduzidos um ou dois motivos de poliadenilação presentes na sequência do tipo selvagem na sequência otimizada, dependendo se a mencionada sequência otimizada já compreende um ou zero desses motivos de poliadenilação presentes na sequência do tipo selvagem.[0042] It should be noted that, in order to obtain a modified coding sequence comprising a combination of two polyadenylation motifs present in the wild-type sequence, one or two polyadenylation motifs present in the wild-type sequence will be introduced into the sequence optimized, depending on whether said optimized sequence already comprises one or zero of these polyadenylation motifs present in the wild-type sequence.

[0043] Em outra realização, motivos de poliadenilação do tipo selvagem identificados na sequência de codificação são introduzidos na etapa (c) em posições de ácidos nucleicos idênticas às suas posições na sequência de codificação, de forma a obter uma sequência de codificação modificada que compreende uma combinação de três motivos de poliadenilação presentes na sequência do tipo selvagem.[0043] In another embodiment, wild-type polyadenylation motifs identified in the coding sequence are introduced in step (c) into nucleic acid positions identical to their positions in the coding sequence, so as to obtain a modified coding sequence comprising a combination of three polyadenylation motifs present in the wild-type sequence.

[0044] Deve-se observar que, a fim de obter uma sequência de codificação modificada que compreende uma combinação de três motivos de poliadenilação presentes na sequência do tipo selvagem, serão introduzidos um, dois ou três motivos de poliadenilação presentes na sequência do tipo selvagem na sequência otimizada, dependendo se a mencionada sequência otimizada já compreende dois, um ou zero desses motivos de poliadenilação presentes na sequência do tipo selvagem.[0044] It should be noted that in order to obtain a modified coding sequence comprising a combination of three polyadenylation motifs present in the wild-type sequence, one, two or three polyadenylation motifs present in the wild-type sequence will be introduced. in the optimized sequence, depending on whether said optimized sequence already comprises two, one or zero of these polyadenylation motifs present in the wild-type sequence.

[0045] Espera-se que motivos de poliadenilação possuam diferentes efeitos sobre o nível da expressão genética, seja qual for a sequência genética considerada. Motivos de poliadenilação podem ser apresentados como motivos fortes ou fracos. Espera-se que motivos fracos sejam mais tolerados para a expressão da sequência genética de codificação que motivos fortes. Convenientemente, os motivos de poliadenilação introduzidos na sequência genética otimizada são os motivos de poliadenilação identificados como motivos fracos.[0045] Polyadenylation motifs are expected to have different effects on the level of gene expression, whatever the genetic sequence considered. Polyadenylation motifs can be presented as strong or weak motifs. Weak motifs are expected to be more tolerated for expression of the coding gene sequence than strong motifs. Conveniently, the polyadenylation motifs introduced into the optimized gene sequence are the polyadenylation motifs identified as weak motifs.

[0046] Motivos de poliadenilação foram avaliados do mais fraco para o mais forte, com relação à sua ocorrência em sequências genéticas codificadoras de milho e com relação à sua ocorrência em sequências genéticas otimizadas consideradas bem expressas em plantas. Preferivelmente, os motivos de poliadenilação fracos são selecionados a partir das sequências AAAATA, AAGCAT, AATCAA e ATGAAA. Os motivos fortes são selecionados a partir das sequências AATTAA, ATACAT, ATACTA, ATATAA, ATTAAA, ATTAAT e CATAAA.[0046] Polyadenylation motifs were evaluated from weakest to strongest, with respect to their occurrence in maize coding genetic sequences and with respect to their occurrence in optimized genetic sequences considered well expressed in plants. Preferably, weak polyadenylation motifs are selected from the sequences AAAATA, AAGCAT, AATCAA and ATGAAA. Strong motifs are selected from the sequences AATTAA, ATACAT, ATACTA, ATATAA, ATTAAA, ATTAAT and CATAAA.

[0047] De maior preferência, a avaliação entre os motivos de poliadenilação fracos é, do mais fraco para o menos fraco: ATGAAA, AATCAA, AAAATA e AAGCAT. A avaliação entre os motivos de poliadenilação fortes é, do mais forte para o menos forte: ATACTA, ATTAAT, AATTAA, ATTAAA, CATAAA, ATATAA e ATACAT.[0047] Most preferably, the evaluation among the weak polyadenylation motifs is, from weakest to least weak: ATGAAA, AATCAA, AAAATA and AAGCAT. The ranking among the strong polyadenylation motifs is, from strongest to least strong: ATACTA, ATTAAT, AATTAA, ATTAAA, CATAAA, ATATAA and ATACAT.

[0048] De preferência superior, a avaliação dos motivos de poliadenilação mais fracos para os mais fortes é fornecida na Tabela 1.[0048] From top preference, the evaluation of the weakest to the strongest polyadenylation motifs is provided in Table 1.

[0049] Mediante comparação das sequências genéticas de codificação de monocotiledôneas e dicotiledôneas, pode-se observar que os motivos de poliadenilação mais fortes comuns são os motivos AATTAA, ATACTA, ATATAA, ATTAAA, ATTAAT e CATAAA.[0049] By comparing the genetic coding sequences of monocots and dicots, it can be seen that the strongest common polyadenylation motifs are the AATTAA, ATACTA, ATATAA, ATTAAA, ATTAAT and CATAAA motifs.

[0050] Outro motivo de poliadenilação fraco (motivo de poliadenilação AACCAA) pode também ser identificado.[0050] Another weak polyadenylation motif (AACCAA polyadenylation motif) can also be identified.

[0051] Em uma realização da presente invenção, nenhum dos motivos de poliadenilação mais fortes AATTAA, ATACTA, ATATAA, ATTAAA, ATTAAT e CATAAA é adicionado na sequência otimizada. Deve-se observar, entretanto, que a sequência modificada pode conter um ou mais desses motivos de poliadenilação, caso estejam presentes na sequência otimizada, após a otimização da sequência nativa (tipo selvagem) por meio de substituição de códons.[0051] In one embodiment of the present invention, none of the strongest polyadenylation motifs AATTAA, ATACTA, ATATAA, ATTAAA, ATTAAT and CATAAA are added in the optimized sequence. It should be noted, however, that the modified sequence may contain one or more of these polyadenylation motifs if they are present in the optimized sequence after optimization of the native (wild-type) sequence through codon substitution.

[0052] De preferência superior, os motivos de poliadenilação que são adicionados à sequência otimizada são selecionados a partir do grupo que consiste de ATGAAA, AATCAA, AAAATA, AACCAA e AAGCAT. Consequentemente, apenas esses motivos de poliadenilação fracos são adicionados na sequência otimizada.[0052] Preferably, the polyadenylation motifs that are added to the optimized sequence are selected from the group consisting of ATGAAA, AATCAA, AAAATA, AACCAA and AAGCAT. Consequently, only these weak polyadenylation motifs are added in the optimized sequence.

[0053] Em realização adicional da presente invenção, a sequência modificada final compreende, ao todo, três a alguns mais motivos de poliadenilação, em que pelo menos três motivos de poliadenilação são correspondentes a uma combinação de três motivos de poliadenilação identificados na sequência de codificação do tipo selvagem, em que a sequência de codificação modificada não compreende todos os motivos de poliadenilação identificados e presentes na sequência de codificação do tipo selvagem.[0053] In a further embodiment of the present invention, the final modified sequence comprises, in total, three to a few more polyadenylation motifs, wherein at least three polyadenylation motifs correspond to a combination of three polyadenylation motifs identified in the coding sequence wild-type, wherein the modified coding sequence does not comprise all of the identified polyadenylation motifs present in the wild-type coding sequence.

[0054] Preferivelmente, a sequência otimizada modificada compreende três a dez motivos de poliadenilação.[0054] Preferably, the modified optimized sequence comprises three to ten polyadenylation motifs.

[0055] Preferivelmente, a sequência otimizada modificada compreende três a seis motivos de poliadenilação.[0055] Preferably, the modified optimized sequence comprises three to six polyadenylation motifs.

[0056] A etapa de reintrodução de motivos de poliadenilação poderá criar alterações do aminoácido nas extremidades dos motivos de poliadenilação.[0056] The step of reintroducing polyadenylation motifs may create amino acid changes at the ends of the polyadenylation motifs.

[0057] Ela pode também criar motivos adicionais que poderão reduzir a expressão genética. Motivos adicionais podem incluir, por exemplo, locais de divisão crípticos GGTAAG, GGTGAT, GTAAAA e GTAAGT e/ou poliA ou poliT e/ou repetições de sete ou mais pares de bases.[0057] It can also create additional motifs that may reduce gene expression. Additional motifs may include, for example, cryptic division sites GGTAAG, GGTGAT, GTAAAA and GTAAGT and/or polyA or polyT and/or repeats of seven or more base pairs.

[0058] O método do presente pode, portanto, compreender etapas adicionais de modificações da sequência genética modificada, a fim de garantir que a sequência de proteínas codificada pela sequência modificada seja idêntica àquela codificada pela sequência genética de codificação do tipo selvagem. Os técnicos no assunto conhecem os tipos diferentes de motivos a serem verificados e, quando apropriado, modificarão a sequência genética modificada, de forma que a função da proteína codificada pela sequência genética de codificação modificada não seja alterada em comparação com a função da proteína codificada pela sequência de codificação do tipo selvagem. De maior preferência, a sequência de aminoácidos da proteína codificada pela sequência genética de codificação modificada é idêntica à sequência de aminoácidos da proteína codificada pela sequência de codificação do tipo selvagem.[0058] The method of the present may therefore comprise additional steps of modifications of the modified genetic sequence in order to ensure that the protein sequence encoded by the modified sequence is identical to that encoded by the wild-type coding genetic sequence. Those skilled in the art are aware of the different types of motifs to be checked and, where appropriate, will modify the modified genetic sequence so that the function of the protein encoded by the modified genetic coding sequence is not altered compared to the function of the protein encoded by the wild-type coding sequence. Most preferably, the amino acid sequence of the protein encoded by the modified genetic coding sequence is identical to the amino acid sequence of the protein encoded by the wild-type coding sequence.

[0059] A presente invenção engloba uma sequência de codificação modificada que pode ser obtida de acordo com o método de elaboração de sequências de codificação modificadas, em que motivos de poliadenilação são introduzidos em uma posição de ácido nucleico idêntica à sua posição, conforme identificado na sequência de codificação do tipo selvagem, e a sequência de codificação modificada resultante compreende a mesma combinação de motivos de poliadenilação identificada na sequência de codificação do tipo selvagem.[0059] The present invention encompasses a modified coding sequence that can be obtained according to the method of preparing modified coding sequences, in which polyadenylation motifs are introduced into a nucleic acid position identical to its position, as identified in wild-type coding sequence, and the resulting modified coding sequence comprises the same combination of polyadenylation motifs identified in the wild-type coding sequence.

[0060] Pretende-se, na presente invenção, que todas as etapas do método de elaboração de sequências de codificação modificadas possam ser realizadas por meio da combinação de projeto de sequências in silico com a preparação de sequências genéticas de codificação sintéticas. De preferência superior, todas as etapas dos métodos descritos acima podem ser realizadas in silico. Neste caso, portanto, o método de preparação de conjuntos de expressão descrito abaixo necessitará, como primeira etapa, da síntese da sequência genética de codificação modificada correspondente.[0060] It is intended, in the present invention, that all steps of the method of preparing modified coding sequences can be carried out by combining in silico sequence design with the preparation of synthetic coding genetic sequences. Preferably, all steps of the methods described above can be performed in silico. In this case, therefore, the method of preparing expression sets described below will require, as a first step, the synthesis of the corresponding modified genetic coding sequence.

[0061] A presente invenção engloba, portanto, um método de produção de moléculas de ácido nucleico, que compreende as etapas de realização dos métodos descritos acima e síntese do ácido nucleico modificado que abriga a sequência modificada obtida.[0061] The present invention therefore encompasses a method of producing nucleic acid molecules, which comprises the steps of carrying out the methods described above and synthesizing the modified nucleic acid that harbors the modified sequence obtained.

[0062] Outra realização da presente invenção é um método de preparação de um cassete de expressão que compreende uma sequência de codificação modificada que codifica uma proteína não vegetal, em que o método compreende as etapas de preparação de sequências de codificação modificadas que codificam a mencionada proteína de acordo com qualquer método descrito acima e operavelmente ligar o promotor e terminador à mencionada sequência de codificação modificada para obter construções para expressão em plantas.[0062] Another embodiment of the present invention is a method of preparing an expression cassette comprising a modified coding sequence encoding a non-plant protein, wherein the method comprises the steps of preparing modified coding sequences encoding said protein according to any method described above and operably link the promoter and terminator to said modified coding sequence to obtain constructs for expression in plants.

[0063] Mais especificamente, a presente invenção refere-se a um método de preparação de conjuntos de expressão, em que motivos de poliadenilação são introduzidos em uma posição de ácido nucleico idêntica à sua posição, conforme identificado na sequência de codificação do tipo selvagem, e a sequência de codificação modificada resultante compreende a mesma combinação de motivos de poliadenilação identificada na sequência de codificação do tipo selvagem.[0063] More specifically, the present invention relates to a method of preparing expression sets, in which polyadenylation motifs are introduced into a nucleic acid position identical to its position as identified in the wild-type coding sequence, and the resulting modified coding sequence comprises the same combination of polyadenylation motifs identified in the wild-type coding sequence.

[0064] Esses conjuntos podem ser obtidos in silico ou realmente sintetizados.[0064] These sets can be obtained in silico or actually synthesized.

[0065] De maior preferência, a sequência de codificação codifica uma proteína inseticida de Bacillus thuringiensis.[0065] Most preferably, the coding sequence encodes an insecticidal protein from Bacillus thuringiensis.

[0066] A expressão “ligado operavelmente”, da forma utilizada no presente, indica que o promotor e a sequência genética de codificação modificada são orientados de tal forma que o promotor dirija a expressão da sequência de codificação, geralmente na direção 5’ para 3’.[0066] The expression “operably linked”, as used herein, indicates that the promoter and the modified genetic coding sequence are oriented in such a way that the promoter directs the expression of the coding sequence, generally in the 5' to 3 direction. '.

[0067] As construções podem também conter amplificadores (tais como introns) e terminais na extremidade 3’ da sequência de codificação.[0067] Constructs may also contain amplifiers (such as introns) and termini at the 3' end of the coding sequence.

[0068] Promotor “ativo em plantas” é um promotor que seja capaz de dirigir a expressão de um gene ligado operavelmente a ele em uma célula vegetal.[0068] A “plant-active” promoter is a promoter that is capable of directing the expression of a gene operably linked to it in a plant cell.

[0069] Para ser expressa, a sequência de codificação pode estar presente sob o controle de um promotor constitutivo, específico de tecido, com desenvolvimento regulado ou induzível.[0069] To be expressed, the coding sequence may be present under the control of a constitutive, tissue-specific, developmentally regulated or inducible promoter.

[0070] Os promotores podem vir da mesma espécie ou de outra espécie (promotores heterólogos). Embora alguns promotores possam ter o mesmo padrão de regulagem quando utilizados em espécies diferentes, é frequentemente preferível o uso de promotores monocotiledôneos em promotores monocotiledôneos e dicotiledôneos em plantas dicotiledôneas.[0070] Promoters can come from the same species or from another species (heterologous promoters). Although some promoters may have the same pattern of regulation when used in different species, it is often preferable to use monocot promoters over monocot promoters and dicot promoters in dicotyledonous plants.

[0071] Em realização preferida, o mencionado construto encontra- se sob o controle de promotor constitutivo.[0071] In a preferred embodiment, said construct is under the control of a constitutive promoter.

[0072] Exemplos de promotores constitutivos úteis para expressão incluem o promotor 35S ou o promotor 19S (Kay et al, 1987, Science, 236: 12991302), o promotor actina de arroz (McElroy et al, 1990, Plant Cell, 2: 163-171), o promotor pCRV (Depigny-This et al, 1992, Plant Molecular Biology, 20: 467-479), o promotor CsVMV (Verdaguer et al, 1998, Plant Mol. Biol. 6: 1129-39), o promotor ubiquitina 1 de milho (Christensen et al, 1996, Transgenic. Res., 5: 213), as sequências reguladoras do T-DNA de Agrobacterium tumefaciens, incluindo manopina sintase, nopalina sintase e octopina sintase.[0072] Examples of constitutive promoters useful for expression include the 35S promoter or the 19S promoter (Kay et al, 1987, Science, 236: 12991302), the rice actin promoter (McElroy et al, 1990, Plant Cell, 2: 163 -171), the pCRV promoter (Depigny-This et al, 1992, Plant Molecular Biology, 20: 467-479), the CsVMV promoter (Verdaguer et al, 1998, Plant Mol. Biol. 6: 1129-39), the maize ubiquitin 1 promoter (Christensen et al, 1996, Transgenic. Res., 5: 213), the T-DNA regulatory sequences of Agrobacterium tumefaciens, including mannopine synthase, nopaline synthase and octopine synthase.

[0073] Outros promotores apropriados poderão ser utilizados. Poderá ser um promotor induzível ou um promotor específico de tecido, tal como promotor específico de folhas ou específico de sementes. Numerosos promotores específicos de tecidos são descritos na literatura e qualquer um deles pode ser utilizado. Pode-se mencionar os promotores descritos em US 20130024998.[0073] Other appropriate promoters may be used. It may be an inducible promoter or a tissue-specific promoter, such as a leaf-specific or seed-specific promoter. Numerous tissue-specific promoters are described in the literature and any of them can be used. Mention may be made of the promoters described in US 20130024998.

[0074] Em uma realização, a proteína codificada pela sequência de codificação modificada é dirigida ao cloroplasta para expressão. Desta forma, o cassete de expressão conterá adicionalmente um ácido nucleico que codifica um peptídeo de trânsito para dirigir a proteína para os cloroplastas. Esses peptídeos de trânsito são conhecidos na técnica. Vide, por exemplo, Von Heijne et al (1991), Plant Mol. Biol. Rep. 9: 104-126; Clark et al (1989), J. Biol. Chem. 264: 17544-17550; Della-Cioppa et al (1987), Plant Physiol. 84: 965-968; Romer et al (1993), Biochem. Biophys. Res. Commun. 196: 1414-1421; e Shah et al (1986), Science 233: 478-481.[0074] In one embodiment, the protein encoded by the modified coding sequence is targeted to the chloroplast for expression. In this way, the expression cassette will additionally contain a nucleic acid encoding a transit peptide to direct the protein to chloroplasts. Such transit peptides are known in the art. See, for example, Von Heijne et al (1991), Plant Mol. Biol. Rep. 9: 104-126; Clark et al (1989), J. Biol. Chem. 264: 17544-17550; Della-Cioppa et al (1987), Plant Physiol. 84: 965-968; Romer et al (1993), Biochem. Biophys. Res. Commun. 196: 1414-1421; and Shah et al (1986), Science 233: 478-481.

[0075] A presente invenção também engloba um vetor que contém o cassete de expressão (construto de ácido nucleico) de acordo com a presente invenção.[0075] The present invention also encompasses a vector that contains the expression cassette (nucleic acid construct) according to the present invention.

[0076] Pode-se, portanto, utilizar um vetor tal como um plasmídeo para transformação de células hospedeiras. O construto de vetores para transformação de células hospedeiras encontra-se dentro da capacidade dos técnicos no assunto seguindo métodos padrão.[0076] A vector such as a plasmid can therefore be used for transformation of host cells. The construction of vectors for host cell transformation is within the capabilities of those skilled in the art following standard methods.

[0077] A decisão de utilizar ou não um vetor para transformar uma célula ou de qual vetor utilizar é orientada pelo método de transformação selecionado e pela célula hospedeira selecionada.[0077] The decision of whether or not to use a vector to transform a cell or which vector to use is guided by the selected transformation method and the selected host cell.

[0078] Possíveis vetores incluem os vetores de plasmídeo Ti, vetores impulsionadores projetados apenas para maximizar a geração de altos números de cópias, vetores epissomais que contêm sequências mínimas necessárias para reprodução final após a ocorrência de transformação e vetores transpossons, incluindo a possibilidade de formas de RNA das sequências genéticas. A seleção de vetores e métodos de seu construto é comumente conhecida pelos técnicos comuns no assunto e descrita em referências técnicas gerais (Mullis, K. B. (1987), Methods in Enzymology).[0078] Possible vectors include Ti plasmid vectors, booster vectors designed only to maximize the generation of high copy numbers, episomal vectors that contain minimal sequences necessary for final reproduction after transformation has occurred, and transposon vectors, including the possibility of forms of RNA from genetic sequences. The selection of vectors and methods of constructing them is commonly known to those skilled in the art and described in general technical references (Mullis, K. B. (1987), Methods in Enzymology).

[0079] Para métodos de transformação em células vegetais, pode- se mencionar métodos de transferência direta de genes, tais como microinjeção direta em embriões vegetais, infiltração a vácuo ou eletroporação, precipitação direta por meio de PEG ou bombardeamento por disparador de partículas cobertas com o DNA de interesse.[0079] For transformation methods in plant cells, direct gene transfer methods may be mentioned, such as direct microinjection into plant embryos, vacuum infiltration or electroporation, direct precipitation by means of PEG or bombardment by a trigger of particles covered with the DNA of interest.

[0080] Prefere-se transformar a célula vegetal com uma linhagem bacteriana, particularmente Agrobacterium, particularmente Agrobacterium tumefaciens. É particularmente possível utilizar o método descrito por Ishida et al (Nature Biotechnology, 14, 745-750, 1996) para transformação de monocotiledôneas.[0080] It is preferred to transform the plant cell with a bacterial strain, particularly Agrobacterium, particularly Agrobacterium tumefaciens. It is particularly possible to use the method described by Ishida et al (Nature Biotechnology, 14, 745-750, 1996) for transformation of monocots.

[0081] A célula pode ser transformada por meio de qualquer sistema de expressão transitória, alguns dos quais são bem conhecidos pelos técnicos no assunto.[0081] The cell can be transformed by any transient expression system, some of which are well known to those skilled in the art.

[0082] Em uma realização específica, o mencionado cassete de expressão é integrado de forma estável no genoma da mencionada célula hospedeira. Esta realização é particularmente interessante para células hospedeiras vegetais. Integração estável no genoma indica que o cassete de expressão pode ser transmitido para a prole da mencionada célula hospedeira mediante divisão.[0082] In a specific embodiment, said expression cassette is stably integrated into the genome of said host cell. This realization is particularly interesting for plant host cells. Stable integration into the genome indicates that the expression cassette can be transmitted to the offspring of the aforementioned host cell upon division.

[0083] A presente invenção também engloba uma planta que contém pelo menos uma célula que contém o cassete de expressão conforme definido acima, preferivelmente integrado de forma estável no seu genoma.[0083] The present invention also encompasses a plant that contains at least one cell that contains the expression cassette as defined above, preferably stably integrated into its genome.

[0084] Uma parte de planta transgênica, particularmente frutos, sementes, grãos ou pólen, que compreende essa célula ou gerada a partir dessa célula também é englobada pela presente invenção. A célula hospedeira mencionada acima, parte da presente invenção, também é considerada parte de planta transgênica.[0084] A transgenic plant part, particularly fruits, seeds, grains or pollen, comprising such a cell or generated from such a cell is also encompassed by the present invention. The host cell mentioned above, part of the present invention, is also considered part of a transgenic plant.

[0085] Salienta-se que plantas inteiras podem ser regeneradas a partir de uma única célula vegetal transformada. Em aspecto adicional, portanto, a presente invenção fornece plantas transgênicas (ou partes delas) que incluem o cassete de expressão de acordo com a presente invenção. A regeneração pode ser processada por meio de métodos conhecidos.[0085] It should be noted that entire plants can be regenerated from a single transformed plant cell. In a further aspect, therefore, the present invention provides transgenic plants (or parts thereof) that include the expression cassette according to the present invention. Regeneration can be processed using known methods.

[0086] As sementes que crescem por meio de fertilização a partir desta planta também contêm esse transgene no seu genoma.[0086] The seeds that grow through fertilization from this plant also contain this transgene in their genome.

[0087] A mencionada planta ou parte de planta de acordo com a presente invenção pode ser uma planta ou sua parte de diversas espécies, notadamente angiospermas, monocotiledôneas e dicotiledôneas.[0087] Said plant or part of a plant according to the present invention may be a plant or part thereof of various species, notably angiosperms, monocotyledons and dicotyledons.

[0088] A mencionada planta é preferivelmente selecionada a partir do grupo que consiste de milho, trigo, cevada, canola, beterraba e girassol. Em realização preferida, a mencionada planta é milho.[0088] Said plant is preferably selected from the group consisting of corn, wheat, barley, canola, beet and sunflower. In a preferred embodiment, said plant is corn.

BREVE DESCRIÇÃO DAS FIGURASBRIEF DESCRIPTION OF FIGURES

[0089] As Figuras 1A, 1B e 1C ilustram as etapas de diversas realizações para realizar modificação genética do tipo selvagem, a fim de expressar a proteína em alto nível na planta.[0089] Figures 1A, 1B and 1C illustrate the steps of various embodiments to perform genetic modification of the wild type in order to express the protein at a high level in the plant.

[0090] As Figuras 2A, B, C e D ilustram a aplicação do método à sequência de codificação de Bacillus thuringiensis Axmi028.[0090] Figures 2A, B, C and D illustrate the application of the method to the Bacillus thuringiensis Axmi028 coding sequence.

[0091] As Figuras 3A, B, C e D ilustram os resultados de PASPA sobre Axmi028.[0091] Figures 3A, B, C and D illustrate the results of PASPA on Axmi028.

[0092] As Figuras 4A, B, C e D ilustram a aplicação do método à sequência de codificação de Bacillus thuringiensis Axmi100.[0092] Figures 4A, B, C and D illustrate the application of the method to the Bacillus thuringiensis Axmi100 coding sequence.

[0093] As Figuras 5A, B, C e D ilustram os resultados de PASPA sobre Axmi100.[0093] Figures 5A, B, C and D illustrate the results of PASPA on Axmi100.

[0094] As Figuras 6A e B exibem os níveis de expressão de luciferase das fusões de Axmi028-LUC (A) e das fusões de Axmi100-LUC (B) em testes transitórios em folhas de milho.[0094] Figures 6A and B show the luciferase expression levels of Axmi028-LUC fusions (A) and Axmi100-LUC fusions (B) in transient tests in corn leaves.

[0095] A Figura 7 exibe análise Western Blot de transformadores de milho Axmi028 independentes utilizando um anticorpo de marca C Myc (A) e transformadores de milho Axmi100 independentes utilizando um anticorpo policlonal (B). Na Figura 7A, linha 1, marcadores de tamanho molecular; linha 2, milho não transformado; linhas 3-4, transformadores 028-WT+GUS; linhas 5-6, transformadores 028-opt+GUS; linhas 7-8, transformadores 028-opt+pA+GUS e linhas 9-10; transformadores 028-opt+3pA+GUS. Foram carregados 10 μg de proteína para cada amostra vegetal.[0095] Figure 7 displays Western Blot analysis of independent Axmi028 corn transformants using a Myc C-tag antibody (A) and independent Axmi100 corn transformants using a polyclonal antibody (B). In Figure 7A, line 1, molecular size markers; line 2, unprocessed corn; lines 3-4, 028-WT+GUS transformers; lines 5-6, transformers 028-opt+GUS; lines 7-8, transformers 028-opt+pA+GUS and lines 9-10; 028-opt+3pA+GUS transformers. 10 μg of protein was loaded for each plant sample.

[0096] Na Figura 7B, linhas 1, 26, 27 e 52, marcadores de tamanho molecular; linhas 2-11, transformadores 100-WT+GUS; linhas 12 e 38, milho não transformado; linhas 13 e 39; extrato de proteína de linhagem bacteriana que expressa Axmi100; linhas 14-23, transformadores 100-opt+pA+GUS; linhas 2837, transformadores 100-opt+3pA+GUS e linhas 40-49, transformadores 100- opt+GUS. Foram carregados 5 μg de proteína para cada amostra vegetal.[0096] In Figure 7B, lines 1, 26, 27 and 52, molecular size markers; lines 2-11, 100-WT+GUS transformers; lines 12 and 38, unprocessed corn; lines 13 and 39; protein extract from bacterial strain expressing Axmi100; lines 14-23, 100-opt+pA+GUS transformers; lines 2837, 100-opt+3pA+GUS transformers and lines 40-49, 100-opt+GUS transformers. 5 μg of protein was loaded for each plant sample.

[0097] A Figura 8 ilustra a intensidade de expressão relativa da proteína com comprimento total Axmi028 em teste transitório de protoplastas de milho. Em todas as linhas, a intensidade dos sinais de marcas c-Myc e His detectados foi definida com relação ao sinal nptII, conforme calculado por meio do software Image Lab 5.2.1, BioRad.[0097] Figure 8 illustrates the relative expression intensity of the full-length protein Axmi028 in a transient test of corn protoplasts. In all lines, the intensity of the detected c-Myc and His tag signals was defined with respect to the nptII signal, as calculated using Image Lab 5.2.1 software, BioRad.

[0098] A Figura 9 exibe o nível de expressão de RNA por meio de PCR QRT de genes otimizados Axmi028 e Axmi100 em transformadores de milho. A) par de primers 3’; e B) par de primers 5’.[0098] Figure 9 displays the level of RNA expression through QRT PCR of optimized genes Axmi028 and Axmi100 in maize transformers. A) 3’ primer pair; and B) 5’ primer pair.

EXEMPLOSEXAMPLES EXEMPLO 1EXAMPLE 1

[0099] Sequências de aprimoramento da expressão genética por meio de otimização de genes de regiões laterais a motivos de poliadenilação:[0099] Sequences for improving gene expression through optimization of genes in regions lateral to polyadenylation motifs:

[0100] Axmi028:[0100] Axmi028:

[0101] A região de codificação do tipo selvagem de genes ricos em AT, Axmi028 de Bacillus thuringiensis (US 8.314.292 B2) que contém o domínio de cristal C-terminal, foi analisada para determinar os motivos de poliadenilação relacionados na Tabela 1.[0101] The coding region of the wild-type AT-rich gene, Axmi028 from Bacillus thuringiensis (US 8,314,292 B2) which contains the C-terminal crystal domain, was analyzed to determine the polyadenylation motifs listed in Table 1.

[0102] Essa sequência de codificação do tipo selvagem truncada (028-WT; SEQ ID N° 1) contém 31 desses locais (Figura 2A). Em primeiro lugar, foi sintetizada uma sequência Axmi028 otimizada por códons, conforme descrito em US 8.314.292 B2, que não contém 30 dos 31 locais poliA descritos em SEQ ID N° 2 (028-opt, Figura 2B). Esta sequência foi otimizada para expressão de milho. Uma sequência adicional (028-opt+pA, SEQ ID N° 3; Figura 2C) foi projetada, na qual as trinta supostas sequências de motivos de poliadenilação foram reintroduzidas nessa sequência 028-opt otimizada, de tal forma que a sequência de aminoácidos da sequência Axmi028 seja conservada.[0102] This truncated wild-type coding sequence (028-WT; SEQ ID NO. 1) contains 31 such sites (Figure 2A). First, a codon-optimized Axmi028 sequence was synthesized as described in US 8,314,292 B2, which does not contain 30 of the 31 polyA sites described in SEQ ID No. 2 (028-opt, Figure 2B). This sequence has been optimized for maize expression. An additional sequence (028-opt+pA, SEQ ID No. 3; Figure 2C) was designed, in which the thirty putative polyadenylation motif sequences were reintroduced into this optimized 028-opt sequence, such that the amino acid sequence of the Axmi028 sequence is conserved.

[0103] Em dois casos, a reintrodução do motivo de poliadenilação resultou em alteração da sequência de aminoácidos. Isso foi corrigido por meio da introdução de três outras pares de bases da sequência do tipo selvagem 5’ desses motivos de poliadenilação. Além disso, a sequência foi examinada para determinar a presença de sequências adicionais que poderão reduzir a expressão que pode haver sido criada por meio da justaposição dos motivos otimizados e de poliadenilação (locais de divisão crípticos GGTAAG, GGTGAT, GTAAAA e GTAAGT e/ou sequências poliA e poliT e/ou sete ou mais pares de bases repetidos). Nenhum desses motivos foi encontrado na sequência 028- opt+pA. Este processo é descrito na Figura 1A.[0103] In two cases, the reintroduction of the polyadenylation motif resulted in a change in the amino acid sequence. This was corrected by introducing three additional base pairs from the wild-type sequence 5′ of these polyadenylation motifs. Additionally, the sequence was examined to determine the presence of additional sequences that may reduce expression that may have been created through the juxtaposition of the optimized and polyadenylation motifs (cryptic division sites GGTAAG, GGTGAT, GTAAAA, and GTAAGT and/or sequences polyA and polyT and/or seven or more repeated base pairs). None of these motifs were found in the sequence 028- opt+pA. This process is described in Figure 1A.

[0104] Foram realizadas diversas tentativas na técnica de prever a posição de locais de poliadenilação em genes vegetais. Ji et al (2015) desenvolveram o algoritmo PASPA (Previsão de Local PoliA em Plantas e Algas; http://bmi.xmu.edu.cn/paspa). Este algoritmo foi aplicado às sequências 028- WT, 028-opt e 028-opt+pA, utilizando parâmetros definidos para arroz. A Figura 3 exibe o resultado desta análise. Pode-se observar que a probabilidade de poliadenilação prematura, conforme previsto por meio de PASPA, é maior para a sequência 028-WT (Figura 3A) e menor para a sequência 028-opt (Figura 3B). A sequência 028-opt+pA (Figura 3C) possui redução significativa da probabilidade de poliadenilação prematura em comparação com a sequência 028-WT.[0104] Several attempts have been made in the technique of predicting the position of polyadenylation sites in plant genes. Ji et al (2015) developed the PASPA algorithm (PolyA Site Prediction in Plants and Algae; http://bmi.xmu.edu.cn/paspa). This algorithm was applied to the 028-WT, 028-opt and 028-opt+pA sequences, using parameters defined for rice. Figure 3 displays the result of this analysis. It can be seen that the probability of premature polyadenylation, as predicted using PASPA, is highest for the 028-WT sequence (Figure 3A) and lowest for the 028-opt sequence (Figure 3B). The 028-opt+pA sequence (Figure 3C) has a significantly reduced probability of premature polyadenylation compared to the 028-WT sequence.

[0105] Axmi100:[0105] Axmi100:

[0106] Segundo gene de Bacillus thuringiensis rico em AT, Axmi100 (US 20100005543) também foi modificado. Com relação a Axmi028, para expressão em plantas, o domínio de cristal C-terminal foi removido. Esta sequência de codificação do tipo selvagem truncada, conforme descrito em SEQ ID N° 4 (100-WT, Figura 4A), contém 25 motivos de poliadenilação. Foi sintetizada uma sequência Axmi100 otimizada por códons (US 20100005543) que não contém 24 dos 25 motivos de poliadenilação do tipo selvagem (100-opt ou SEQ ID N° 5, Figura 4B). Esta sequência, otimizada para expressão de milho, possui, entretanto, cinco motivos de poliadenilação adicionais não presentes na sequência de tipo selvagem. Foi sintetizada uma sequência adicional, conforme descrito em SEQ ID N° 6 (100-opt+pA, Figura 4C), em que os 24 supostos motivos de poliadenilação foram reintroduzidos nessa sequência de 100 opt otimizada na mesma posição nucleica identificada na sequência de codificação do tipo selvagem. Esta sequência conserva a sequência de aminoácidos de Axmi100 e não contém local de divisão críptica, motivos poliA ou poliT (locais de divisão crípticos GGTAAG, GGTGAT, GTAAAA e GTAAGT e/ou sequências poliA e poliT e/ou sete ou mais pares de bases repetidos).[0106] Second AT-rich Bacillus thuringiensis gene, Axmi100 (US 20100005543) was also modified. Regarding Axmi028, for expression in plants, the C-terminal crystal domain was removed. This truncated wild-type coding sequence, as described in SEQ ID NO: 4 (100-WT, Figure 4A), contains 25 polyadenylation motifs. A codon-optimized Axmi100 sequence (US 20100005543) was synthesized that does not contain 24 of the 25 wild-type polyadenylation motifs (100-opt or SEQ ID NO: 5, Figure 4B). This sequence, optimized for maize expression, does, however, have five additional polyadenylation motifs not present in the wild-type sequence. An additional sequence was synthesized as described in SEQ ID NO: 6 (100-opt+pA, Figure 4C), in which the 24 putative polyadenylation motifs were reintroduced into this optimized 100 opt sequence at the same nucleic position identified in the coding sequence. wild type. This sequence conserves the amino acid sequence of Axmi100 and does not contain a cryptic division site, polyA or polyT motifs (cryptic division sites GGTAAG, GGTGAT, GTAAAA and GTAAGT and/or polyA and polyT sequences and/or seven or more repeated base pairs ).

[0107] O algoritmo PASPA foi aplicado às sequências 100-WT, 100-opt e 100-opt+pA, utilizando parâmetros definidos para arroz. A Figura 5 exibe o resultado desta análise. Pode-se observar que a probabilidade de poliadenilação prematura, conforme previsto por meio de PASPA, é maior para a sequência 100-WT (Figura 5A) e menor para a sequência 100-opt (Figura 5B). A sequência 100-opt+pA (Figura 5C) possui, entretanto, redução significativa da probabilidade de poliadenilação prematura em comparação com a sequência 100-WT.[0107] The PASPA algorithm was applied to the 100-WT, 100-opt and 100-opt+pA sequences, using parameters defined for rice. Figure 5 displays the result of this analysis. It can be seen that the probability of premature polyadenylation, as predicted using PASPA, is highest for the 100-WT sequence (Figure 5A) and lowest for the 100-opt sequence (Figure 5B). The 100-opt+pA sequence (Figure 5C) does, however, have a significantly reduced probability of premature polyadenylation compared to the 100-WT sequence.

EXEMPLO 2EXAMPLE 2

[0108] Teste de expressão transitória de genes otimizados em regiões laterais a motivos de poliadenilação em milho e fumo:[0108] Transient expression test of optimized genes in regions lateral to polyadenylation motifs in corn and tobacco:

[0109] Axmi028:[0109] Axmi028:

[0110] Foram empregados dois sistemas transitórios. O primeiro foi um sistema de teste indireto, em que as três sequências Axmi028 diferentes (028-WT, 028-opt e 028-opt+pA) foram fundidas em quadro ao gene luciferase de vaga-lume (LUC) e colocadas sob o controle do promotor de Ubiquitina de milho constitutivo (SEQ ID N° 7, SEQ ID N° 8 e SEQ ID N° 9). O raciocínio é que qualquer poliadenilação prematura na sequência de Axmi028 encerrará a transcrição, evitando a possibilidade de criação de transcrito que contém a fusão Axmi028+Luc completa. Redução do sinal de Luc dos genes de fusão 028-WT- Luc ou 028-opt-pA-Luc em comparação com o controle 028-opt-Luc pode ser então atribuída a aumento da ocorrência de poliadenilação prematura. Plasmídeos que contêm essas fusões são cobombardeados em tecido de folha de milho com construto de luciferase 35S-Renilla controle. Depois de 24 horas, a luminescência das luciferases de Renilla e vaga-lume é medida e o sinal da luc de vaga-lume é normalizado utilizando o sinal luc de Renilla controle. O sinal luc de vaga-lume normalizado do gene 028-WT-Luc é comparado em seguida com o dos genes 028-opt-Luc e 028-opt-pA-Luc (Figura 6A).[0110] Two transient systems were employed. The first was an indirect test system, in which the three different Axmi028 sequences (028-WT, 028-opt and 028-opt+pA) were fused in frame to the firefly luciferase gene (LUC) and placed under control. of the constitutive corn Ubiquitin promoter (SEQ ID NO. 7, SEQ ID NO. 8 and SEQ ID NO. 9). The reasoning is that any premature polyadenylation in the Axmi028 sequence will terminate transcription, preventing the possibility of creating a transcript that contains the full Axmi028+Luc fusion. Reduced Luc signal from the 028-WT-Luc or 028-opt-pA-Luc fusion genes compared to the 028-opt-Luc control can therefore be attributed to increased occurrence of premature polyadenylation. Plasmids containing these fusions are cobombarded into corn leaf tissue with control 35S-Renilla luciferase construct. After 24 hours, the luminescence of Renilla and firefly luciferases is measured and the firefly luc signal is normalized using the control Renilla luc signal. The normalized firefly luc signal from the 028-WT-Luc gene is next compared with that from the 028-opt-Luc and 028-opt-pA-Luc genes (Figure 6A).

[0111] O segundo sistema transitório é por meio de agroinfiltração de construções de plasmídeos binários que contêm versões Axmi028 no fumo N. benthamiana. Os genes 028-WT, 028-opt e 028-opt+pA retirados do promotor CsVMV viral constitutivo (Verdaguer et al (1996)) são clonados em um vetor binário derivado de SB11 (Komari et al (1996)) que também contém o gene relator fluorescente AnCyan (CloneTech) expresso a partir do promotor de Ubiquitina de milho constitutivo que forma os plasmídeos 028-WT+Cyan, 028- opt+Cyan e 028-opt+pA+Cyan. Estes três vetores binários mais o controle SB11+Cyan vazio são transferidos para a linhagem de Agrobacterium LBA4404 (pSB1) de acordo com Komari et al (1996). Realiza-se agroinfiltração com essas quatro linhagens, essencialmente conforme descrito por Leckie e Steward (2011). Quatro folhas de cinco plantas são infiltradas, em que cada folha é infiltrada com as quatro linhagens em diferentes partes da folha. Após três dias, as zonas que expressam AnCyan são visualizadas e extirpadas em seguida. As zonas infiltradas com a mesma linhagem agrobacteriana em cada planta são reunidas e congeladas em nitrogênio líquido. Amostras são retiradas para medição dos níveis de transcrito do gene Axmi28 e do gene AnCyan por meio de PCR QRT e para análise Western utilizando anticorpos contra Axmi028 e AnCyan. Pares de primers para análise de PCR QR são projetados na região 3’ das sequências de codificação das sequências genéticas de Axmi028. A expressão de transcritos de 028-WT/AnCyan é comparada em seguida com a de 028-opt/AnCyan e a de 028-opt+pA/AnCyan, a fim de determinar o efeito do término de transcrição utilizando motivos de poliadenilação críptica antes da posição dos primers utilizados para a reação de PCR QRT.[0111] The second transient system is through agroinfiltration of binary plasmid constructs that contain Axmi028 versions in N. benthamiana tobacco. The 028-WT, 028-opt and 028-opt+pA genes taken from the constitutive viral CsVMV promoter (Verdaguer et al (1996)) are cloned into an SB11-derived binary vector (Komari et al (1996)) that also contains the fluorescent reporter gene AnCyan (CloneTech) expressed from the constitutive maize Ubiquitin promoter forming plasmids 028-WT+Cyan, 028- opt+Cyan and 028-opt+pA+Cyan. These three binary vectors plus the empty SB11+Cyan control are transferred into the Agrobacterium strain LBA4404 (pSB1) according to Komari et al (1996). Agroinfiltration is carried out with these four strains, essentially as described by Leckie and Steward (2011). Four leaves of five plants are infiltrated, wherein each leaf is infiltrated with the four strains in different parts of the leaf. After three days, the areas expressing AnCyan are visualized and then excised. Zones infiltrated with the same agrobacterial strain on each plant are pooled and frozen in liquid nitrogen. Samples are taken to measure the transcript levels of the Axmi28 gene and the AnCyan gene using QRT PCR and for Western analysis using antibodies against Axmi028 and AnCyan. Primer pairs for QR PCR analysis are designed in the 3' region of the coding sequences of the Axmi028 genetic sequences. The expression of 028-WT/AnCyan transcripts is then compared with that of 028-opt/AnCyan and 028-opt+pA/AnCyan in order to determine the effect of transcription termination using cryptic polyadenylation motifs prior to position of the primers used for the QRT PCR reaction.

[0112] Resultados similares podem ser obtidos quando o nível de proteína Axmi028, normalizado para expressão da proteína AnCyan, for comparado entre as três construções de Axmi028.[0112] Similar results can be obtained when the Axmi028 protein level, normalized to AnCyan protein expression, is compared between the three Axmi028 constructs.

[0113] Foram elaboradas construções genéticas adicionais, em que cada uma das versões Axmi028 possui marca His N-terminal adicional e marca C- Myc C-terminal, permitindo a visualização das proteínas Axmi028 em Western Blots, utilizando anticorpos HisTAG ou C-MycTAG. Essas versões de Axmi028 são 028- h(WT)m (SEQ ID N° 17), 028-h(opt)m (SEQ ID N° 18) e 028-h(opt+pA)m (SEQ ID N° 19). Os genes 028-h(WT)m, 028-h(opt)m e 028-h(opt+pA)m dirigidos do promotor CsVMV viral constitutivo (Verdaguer et al (1996)) foram clonados em um vetor binário derivado de SB11 (Komari et al (1996)) que também contém o gene relator beta glucuronidase (GUS) (Jefferson et al, 1987) expresso a partir do promotor de Ubiquitina de milho constitutivo que forma os plasmídeos 028-WT+GUS, 028- opt+GUS e 028-opt+pA+GUS. Estes três vetores binários mais o controle SB11+GUS vazio foram transferidos para a linhagem de Agrobacterium LBA4404 (pSB1) de acordo com Komari et al (1996). Conforme descrito acima, os testes transitórios são realizados em N. benthamiana. Amostras de RNA e proteína são também extraídas de 20 a 25 embriões de milho imaturos cocultivados por sete dias com as linhagens agrobacterianas que contêm as construções Axmi028+GUS diferentes. Para compensar potenciais diferenças de fornecimento de T-DNA durante o cocultivo entre as diferentes amostras, testes de atividade fluorimétrica de GUS utilizando 4-metilumbeliferilbeta-D-glucuronida (MUG) foram realizados em cada amostra de proteína. As quantidades de proteína utilizadas em Western foram ajustadas em seguida para gerar atividade de GUS igual por amostra. Com relação à análise de expressão transitória em N. benthamiana, análise dessas amostras permite a comparação da expressão das diferentes versões de Axmi028.[0113] Additional genetic constructs were created, in which each of the Axmi028 versions has an additional N-terminal His tag and a C-terminal C-Myc tag, allowing the visualization of Axmi028 proteins in Western Blots, using HisTAG or C-MycTAG antibodies. These versions of Axmi028 are 028-h(WT)m (SEQ ID No. 17), 028-h(opt)m (SEQ ID No. 18) and 028-h(opt+pA)m (SEQ ID No. 19 ). The genes 028-h(WT)m, 028-h(opt)m and 028-h(opt+pA)m driven from the constitutive viral CsVMV promoter (Verdaguer et al (1996)) were cloned into a binary vector derived from SB11 ( Komari et al (1996)) which also contains the beta glucuronidase (GUS) reporter gene (Jefferson et al, 1987) expressed from the constitutive maize Ubiquitin promoter forming plasmids 028-WT+GUS, 028- opt+GUS and 028-opt+pA+GUS. These three binary vectors plus the empty SB11+GUS control were transferred into the Agrobacterium strain LBA4404 (pSB1) according to Komari et al (1996). As described above, transient tests are performed on N. benthamiana. RNA and protein samples are also extracted from 20 to 25 immature maize embryos cocultured for seven days with the agrobacterial strains containing the different Axmi028+GUS constructs. To compensate for potential differences in T-DNA supply during co-cultivation between different samples, GUS fluorimetric activity tests using 4-methylumbelliferylbeta-D-glucuronide (MUG) were performed on each protein sample. The amounts of protein used in Western were then adjusted to generate equal GUS activity per sample. Regarding the analysis of transient expression in N. benthamiana, analysis of these samples allows comparison of the expression of different versions of Axmi028.

[0114] Axmi100:[0114] Axmi100:

[0115] De forma idêntica à descrita acima para Axmi028, as sequências 100-WT, 100-opt e 100-opt+pA são testadas por meio de testes transitórios em milho (SEQ ID N° 10, SEQ ID N° 11 e SEQ ID N° 12) e fumo. A expressão de 100-WT é comparada, portanto, com a de 100-opt e a de 100- opt+pA (Figura 6B).[0115] In an identical manner to that described above for Axmi028, the 100-WT, 100-opt and 100-opt+pA sequences are tested through transient tests in corn (SEQ ID No. 10, SEQ ID No. 11 and SEQ ID No. 12) and smoke. The expression of 100-WT is therefore compared with that of 100-opt and 100-opt+pA (Figure 6B).

[0116] Realizou-se análise Western Blot sobre as mesmas amostras, utilizando um anticorpo policlonal levantado contra proteína Axmi100. O resultado é alinhado com o resultado ilustrado na Figura 6: a presença de sinais de poliadenilação possibilita a obtenção de boa expressão da proteína, melhor que a expressão da proteína otimizada na qual não se adicionou poliadenilação, e a expressão da proteína otimizada na qual toda a poliadenilação do tipo selvagem foi adicionada, enquanto a proteína de tipo selvagem não é expressa adequadamente (dados não exibidos).[0116] Western Blot analysis was performed on the same samples, using a polyclonal antibody raised against the Axmi100 protein. The result is in line with the result illustrated in Figure 6: the presence of polyadenylation signals makes it possible to obtain good expression of the protein, better than the expression of the optimized protein in which no polyadenylation was added, and the expression of the optimized protein in which all wild-type polyadenylation has been added, whereas the wild-type protein is not expressed properly (data not shown).

[0117] As versões Axmi100 também são expressas como versões marca His N-terminal e marca C-Myc C-terminal; 100-h(WT)m, 100-h(opt)m e 100- h(opt+pA)m (SEQ ID N° 20, SEQ ID N° 21 e SEQ ID N° 22) em testes transitórios em fumo e embriões de milho imaturos. A expressão de 100-h(WT)m é, portanto, comparada com a de 100-h(opt)m e a de 100-h(opt+pA)m.[0117] Axmi100 versions are also expressed as N-terminal His tag and C-terminal C-Myc tag versions; 100-h(WT)m, 100-h(opt)m and 100-h(opt+pA)m (SEQ ID N° 20, SEQ ID N° 21 and SEQ ID N° 22) in transient tests in smoke and embryos of immature corn. The expression of 100-h(WT)m is therefore compared with that of 100-h(opt)m and that of 100-h(opt+pA)m.

EXEMPLO 3EXAMPLE 3

[0118] Expressão estável em milho de genes otimizados em regiões laterais a motivos de poliadenilação:[0118] Stable expression in maize of genes optimized in regions lateral to polyadenylation motifs:

[0119] Axmi028:[0119] Axmi028:

[0120] As linhagens descritas no Exemplo 2 (028-WT+GUS, 028- WT+Cyan, 028-opt+GUS, 028-opt+Cyan, 028-opt+pA+GUS e 028-opt+pA+Cyan) são transformadas em milho, essencialmente conforme descrito por Ishida et al (1996). Pelo menos dez transformadores de cópia simples individuais com T-DNA intacto são produzidos para cada construto. Análises PCR QRT e Western são realizadas sobre material de folha T0. A expressão de Axim028 de folhas e os níveis de proteína das plantas 028-WT são comparados com os transformadores 028-opt e 028-opt+pA como no exemplo anterior (Figura 7A).[0120] The strains described in Example 2 (028-WT+GUS, 028- WT+Cyan, 028-opt+GUS, 028-opt+Cyan, 028-opt+pA+GUS and 028-opt+pA+Cyan) are transformed into corn, essentially as described by Ishida et al (1996). At least ten individual single-copy transformants with intact T-DNA are produced for each construct. QRT and Western PCR analyzes are performed on T0 sheet material. Leaf Axim028 expression and protein levels of 028-WT plants are compared with 028-opt and 028-opt+pA transformants as in the previous example (Figure 7A).

[0121] Axmi100:[0121] Axmi100:

[0122]Conforme descrito acima para Axmi028, as diferentes versões de Axmi100 são transformadas em milho. A expressão de Axmi100 de folhas e os níveis de proteína das plantas 100-WT são comparados com os transformadores 100-opt e 100-opt+pA como no exemplo anterior (Figura 7B).[0122] As described above for Axmi028, the different versions of Axmi100 are transformed into corn. Leaf Axmi100 expression and protein levels of 100-WT plants are compared with 100-opt and 100-opt+pA transformants as in the previous example (Figure 7B).

EXEMPLO 4EXAMPLE 4

[0123] Identificação de motivos de poliadenilação fracos que podem permanecer em sequências otimizadas por códons:[0123] Identification of weak polyadenylation motifs that may remain in codon-optimized sequences:

[0124] Aprimoramento adicional do procedimento acima é deixar apenas motivos de poliadenilação fracos na sequência otimizada. Embora a reintrodução de todos os motivos de poliadenilação identificados na Tabela 1 na sequência otimizada aumente significativamente a expressão a níveis similares ao obtido por uma sequência totalmente otimizada, o procedimento pode não ser ideal em todos os casos. Isso ocorre porque, à medida que o número de motivos de poliadenilação aumenta na sequência de tipo selvagem, parte maior da sequência não pode ser otimizada e mais potencial existe para sequências indesejáveis criadas nas junções de sequências otimizadas e de poliadenilação. Utilizou-se abordagem in silico para identificar sequências de poliadenilação fracas e fortes em milho. Esta abordagem é baseada na ideia de que motivos de poliadenilação fortes serão subrepresentados nas sequências de codificação de genes de milho e, particularmente, em genes de alta expressão. Por outro lado, motivos de poliadenilação fracos não deverão ser subrepresentados. A ocorrência de motivo pode também depender, entretanto, dos aminoácidos que pode codificar. Motivos que “codificam” aminoácidos utilizados com frequência e com códons frequentemente utilizados para aquele aminoácido serão sobrerrepresentados. Por isso, a manutenção dos motivos “fracos” que são mais sobrerrepresentados em comparação com o cálculo teórico deverá selecionar motivos que: a. não são sinais de poliadenilação fortes; e b. são utilizados com frequência, pois eles codificam aminoácidos que são frequentemente utilizados ou códons que são frequentemente utilizados em milho.[0124] Further improvement of the above procedure is to leave only weak polyadenylation motifs in the optimized sequence. Although reintroduction of all polyadenylation motifs identified in Table 1 into the optimized sequence significantly increases expression to levels similar to that achieved by a fully optimized sequence, the procedure may not be ideal in all cases. This is because as the number of polyadenylation motifs increases in the wild-type sequence, more of the sequence cannot be optimized and more potential exists for undesirable sequences created at the junctions of optimized and polyadenylation sequences. An in silico approach was used to identify weak and strong polyadenylation sequences in maize. This approach is based on the idea that strong polyadenylation motifs will be underrepresented in the coding sequences of maize genes and particularly in highly expressed genes. On the other hand, weak polyadenylation motifs should not be underrepresented. The occurrence of a motif may also depend, however, on the amino acids it may encode. Motifs that “encode” frequently used amino acids and with frequently used codons for that amino acid will be overrepresented. Therefore, maintaining the “weak” motives that are more overrepresented compared to the theoretical calculation should select motives that: a. are not strong polyadenylation signals; and b. are frequently used because they encode amino acids that are frequently used or codons that are frequently used in maize.

TABELA 1TABLE 1

[0125] Ocorrência de motivos de poliadenilação em sequência de codificação de milho: [0125] Occurrence of polyadenylation motifs in maize coding sequence:

a. Análise de CDSs em milho: banco CDS v3:The. Analysis of CDSs in corn: CDS v3 bank:

[0126] Em primeiro lugar, as regiões de codificação de milho completas previstas foram analisadas (banco de dados de CDS de milho v3, ftp://ftp.ensemblgenomes.org/pub/release-27/plants/fasta/zea_mays/cds/). O número previsto de cada motivo de poliadenilação foi determinado neste conjunto de dados utilizando o tamanho observado do conjunto de dados (63279365 bp) e a composição de par de bases deste conjunto de dados (54,95% GC). A quantidade real de ocorrências foi determinada em seguida e foi calculada a razão entre ocorrências reais e previstas (vide a Tabela 1). Os resultados demonstram que alguns motivos de poliadenilação são significativamente subrepresentados e alguns são significativamente sobrerrepresentados.[0126] First, the predicted complete maize coding regions were analyzed (Maize CDS database v3, ftp://ftp.ensemblgenomes.org/pub/release-27/plants/fasta/zea_mays/cds /). The predicted number of each polyadenylation motif was determined in this dataset using the observed size of the dataset (63279365 bp) and the base pair composition of this dataset (54.95% GC). The actual number of occurrences was then determined and the ratio between actual and predicted occurrences was calculated (see Table 1). The results demonstrate that some polyadenylation motifs are significantly underrepresented and some are significantly overrepresented.

[0127] No conjunto de dados CDS v3 de milho, quatro motivos são 150% ou mais sobrerrepresentados. Estes que são sobrerrepresentados são candidatos para sequências que são motivos de poliadenilação fracos e sequências que permitem boa expressão genética. Estas sequências de poliadenilação podem ser mantidas em sequências otimizadas com baixa probabilidade de comprometerem a expressão genética. Este protocolo é descrito na Figura 1b.[0127] In the corn CDS v3 dataset, four motifs are 150% or more overrepresented. These that are overrepresented are candidates for sequences that are weak polyadenylation motifs and sequences that allow good gene expression. These polyadenylation sequences can be maintained in optimized sequences with a low probability of compromising gene expression. This protocol is described in Figure 1b.

b. Análise de CDS em monocotiledôneas:B. CDS analysis in monocots:

[0128] Realizou-se pesquisa específica de safras em busca de motivos de poliadenilação relacionados na Tabela 1 para definir os motivos que ocorrem com altos níveis no CDS da safra de interesse correspondente. Com este propósito, CDS de duas linhas de milho definidas (B73, AGPv3.22) foram analisados postulando-se que, como no exemplo anterior, o CDS contém códons que são frequentemente utilizados para codificar certos aminoácidos na safra. Motivos de poliadenilação que estão presentes em códons do CDS não são fortes, mas apenas pouco funcionais ou provavelmente, não funcionais. Por isso, esses motivos de ocorrência natural podem permanecer em qualquer transgene, pois eles não influenciariam a sua expressão estável na safra de interesse e serão denominados motivos fracos específicos de safras.[0128] Crop-specific research was carried out looking for polyadenylation motifs listed in Table 1 to define the motifs that occur at high levels in the CDS of the corresponding crop of interest. For this purpose, CDS from two defined corn lines (B73, AGPv3.22) were analyzed postulating that, as in the previous example, the CDS contains codons that are frequently used to encode certain amino acids in the crop. Polyadenylation motifs that are present in CDS codons are not strong, but only poorly functional or probably nonfunctional. Therefore, these naturally occurring motifs can remain in any transgene as they would not influence its stable expression in the crop of interest and will be termed weak crop-specific motifs.

[0129] Em primeiro lugar, a presença de motivos de poliadenilação foi analisada nesses conjuntos de dados de milho diferentes. Para verificações de contagem, utilizou-se OligoCounter (http://webhost1.mh- hannover.de/davenport/oligocounter/, laboratório Tümmler da Faculdade de Medicina de Hannover, Alemanha) e JBrowse (Skinner et al, Genome Res. 2009. 19: 1630-1638) para verificar as distribuições de motivos nos genomas. Estas contagens foram normalizadas na quantidade total de transcrito previsto por conjunto de dados de CDS.[0129] First, the presence of polyadenylation motifs was analyzed in these different maize data sets. For count checks, OligoCounter (http://webhost1.mh- hannover.de/davenport/oligocounter/, Tümmler laboratory at the Faculty of Medicine Hannover, Germany) and JBrowse (Skinner et al, Genome Res. 2009) were used. 19: 1630-1638) to verify motif distributions across genomes. These counts were normalized to the total amount of predicted transcript per CDS data set.

[0130] A Tabela 2 exibe o percentual de CDS que contém o dado motivo de poliadenilação para o conjunto de dados AGPv3.22 e B73. Para facilitar a comparação, adiciona-se a coluna “ocorrência de motivo CDSv3 de milho” da Tabela 1. Ela representa, em percentual, a ocorrência de motivo real no conjunto de dados de milho v3 completo dividida pela ocorrência teórica no conjunto de dados. A distribuição de motivos de poliadenilação foi muito similar em todos os conjuntos de dados de milho com poucas variações nas suas avaliações. É interessante observar que os cinco motivos de poliadenilação superiores ATGAAA, AAGCAT, AACCAA, AATCAA e AAAATA ocorrem em transcritos de milho com frequência relativamente alta (>10% de CDS que contém esses motivos no conjunto de dados B73). Este resultado é consistente com as frequências encontradas no experimento descrito acima no capítulo a.[0130] Table 2 displays the percentage of CDS that contain the given polyadenylation motif for the AGPv3.22 and B73 data set. To facilitate comparison, the column “corn CDSv3 motif occurrence” is added to Table 1. It represents, in percentage, the actual motif occurrence in the complete corn v3 dataset divided by the theoretical occurrence in the dataset. The distribution of polyadenylation motifs was very similar across all maize datasets with little variation in their assessments. Interestingly, the top five polyadenylation motifs ATGAAA, AAGCAT, AACCAA, AATCAA, and AAAATA occur in maize transcripts with relatively high frequency (>10% of CDS containing these motifs in the B73 data set). This result is consistent with the frequencies found in the experiment described above in chapter a.

[0131] Muito embora esta análise não seja considerada como fornecendo lista completa de todos os motivos de poliadenilação fracos, pode-se concluir que os cinco motivos de poliadenilação identificados são confirmados como motivos fracos em milho.[0131] Although this analysis is not considered to provide a complete list of all weak polyadenylation motifs, it can be concluded that the five polyadenylation motifs identified are confirmed as weak motifs in maize.

[0132] Além dos conjuntos de dados de milho, analisou-se outra safra de monocotiledônea Sorghum bicolor (Sbicolor_255_v2.1) (Tabela 2). De forma análoga a milho, esses conjuntos de CDS foram analisados para determinar sua abundância total de contagens de motivos de poliadenilação (vide a Tabela 2). Estas contagens foram normalizadas na quantidade total de transcrito previsto por conjunto de dados de CDS. Notadamente, as duas safras de monocotiledôneas diferentes exibem abundância relativa muito similar de todos os motivos de poliadenilação, em que os cinco motivos mais abundantes são exatamente idênticos.[0132] In addition to the corn datasets, another monocot crop Sorghum bicolor (Sbicolor_255_v2.1) was analyzed (Table 2). Analogous to maize, these CDS sets were analyzed to determine their total abundance of polyadenylation motif counts (see Table 2). These counts were normalized to the total amount of predicted transcript per CDS data set. Notably, the two different monocot crops exhibit very similar relative abundance of all polyadenylation motifs, where the five most abundant motifs are exactly identical.

[0133] Segundo esses dados, os motivos de poliadenilação ATGAAA, AAGCAT, AACCAA, AATCAA e AAAATA podem permanecer em qualquer transgene expresso em monocotiledôneas, pois eles não influenciariam sua expressão estável na safra de interesse e serão denominados motivos de poliadenilação fracos específicos de monocotiledôneas.[0133] According to these data, the polyadenylation motifs ATGAAA, AAGCAT, AACCAA, AATCAA and AAAATA can remain in any transgene expressed in monocots, as they would not influence its stable expression in the crop of interest and will be called monocot-specific weak polyadenylation motifs .

[0134] De forma interessante, os seis motivos de poliadenilação mais fortes ATAAAA, CATAAA, ATACTA, ATTAAA e ATTAAT também são consistentes entre as monocotiledôneas.[0134] Interestingly, the six strongest polyadenylation motifs ATAAAA, CATAAA, ATACTA, ATTAAA and ATTAAT are also consistent among monocots.

c. Comparação entre motivos de poliadenilação fracos de monocotiledôneas e dicotiledôneas:w. Comparison between weak polyadenylation motifs of monocots and dicots:

[0135] Além dos conjuntos de dados de monocotiledôneas, analisou-se uma safra dicotiledônea Beta vulgaris (RefBeet-1.2). A Tabela 2 demonstra que B. vulgaris apresenta distribuição similar de motivos, dos motivos mais fracos até os mais fortes. Um motivo AATAAT foi encontrado com mais frequência no conjunto de dados de CDS que nos CDSs de monocotiledôneas. Existe sobreposição clara, entretanto, nos motivos mais abundantes entre todos os conjuntos de dados de safras analisados.[0135] In addition to the monocot datasets, a dicotyledonous crop Beta vulgaris (RefBeet-1.2) was analyzed. Table 2 demonstrates that B. vulgaris presents a similar distribution of motifs, from the weakest to the strongest motifs. An AATAAT motif was found more frequently in the CDS data set than in monocot CDSs. There is clear overlap, however, in the most abundant motifs among all crop data sets analyzed.

[0136] Estes dados sugerem que os três motivos de poliadenilação ATGAAA, AAGCAT e AATCAA podem provavelmente permanecer em qualquer transgene expresso em plantas em floração.[0136] These data suggest that the three polyadenylation motifs ATGAAA, AAGCAT and AATCAA may likely remain in any transgene expressed in flowering plants.

[0137] Os dados gerais demonstram que a identificação dos cinco motivos ATGAAA, AAGCAT, AACCAA, AATCAA e AAAATA como motivos de poliadenilação fracos é robusta no reino vegetal.[0137] The general data demonstrate that the identification of the five motifs ATGAAA, AAGCAT, AACCAA, AATCAA and AAAATA as weak polyadenylation motifs is robust in the plant kingdom.

TABELA 2TABLE 2

[0138] Ocorrência de motivos de poliadenilação em monocotiledôneas e dicotiledôneas: os resultados exibidos na coluna “ocorrência de motivos em CDSv3 de milho” é uma extração da Tabela 1. [0138] Occurrence of polyadenylation motifs in monocots and dicots: the results displayed in the column “occurrence of motifs in maize CDSv3” is an extraction from Table 1.

d. Análise de motivos de poliadenilação em transgene expressos in planta:d. Analysis of transgene polyadenylation motifs expressed in planta:

[0139] A fim de determinar a presença de motivos de poliadenilação em transgenes expressos in planta, foram analisadas 21 sequências de genes bacterianos e cinco sequências genéticas de organismos eucarióticos. Demonstrou-se que esses genes são expressos in planta. A quantidade total de motivos de poliadenilação foi contada para identificar os motivos em transgenes que foram descritos como funcionais e/ou expressos in planta (demonstrado por meio de análise dos níveis de expressão de transgenes ou por meio de novos fenótipos detectados em plantas transgênicas). Com base nessas quantidades de motivos de poliadenilação contadas nos transgenes, foi calculada a abundância de qualquer motivo (número de motivos/número de genes analisados). Segundo sua abundância calculada ao longo dos genes, as espécies de safras de origem e expressão dos motivos de poliadenilação foram agrupadas: sinais com alta abundância (> 50% em todos os genes analisados) são avaliados como sinais de poliadenilação não funcionais ou muito fracos e esses sinais com abundância média (> 25% em todos os genes analisados) são avaliados como sinais de poliadenilação fracos ou com menor funcionalidade. Sinais com baixa abundância (> 0% em todos os genes analisados) são avaliados como sinais poliA fortes ou funcionais.[0139] In order to determine the presence of polyadenylation motifs in transgenes expressed in planta, 21 bacterial gene sequences and five genetic sequences from eukaryotic organisms were analyzed. These genes have been shown to be expressed in planta. The total number of polyadenylation motifs was counted to identify motifs in transgenes that were described as functional and/or expressed in planta (demonstrated through analysis of transgene expression levels or through novel phenotypes detected in transgenic plants). Based on these quantities of polyadenylation motifs counted in the transgenes, the abundance of any motif was calculated (number of motifs/number of genes analyzed). According to their calculated abundance across genes, crop species of origin and expression of polyadenylation motifs were grouped: signals with high abundance (>50% in all analyzed genes) are evaluated as non-functional or very weak polyadenylation signals and these signals with medium abundance (>25% in all genes analyzed) are evaluated as weak polyadenylation signals or with lower functionality. Signals with low abundance (>0% across all genes analyzed) are evaluated as strong or functional polyA signals.

[0140] Para determinar se motivos específicos foram excluídos em genes otimizados para expressão de transgene in planta com frequência mais alta, foi calculado o percentual de motivos de poliadenilação que permaneceram após a otimização. Muito embora esta análise não seja considerada como fornecendo identificação completa de todos os motivos de poliadenilação fracos existentes em plantas, a retenção de motivos além de alta abundância nesta variedade de genes é indicação valiosa do seu impacto fraco sobre a estabilidade de transcritos. Os dois motivos AATCAA e ATGAAA exibem abundância mais alta ao longo de todos os genes e permaneceram homogêneos em sequências otimizadas em alto percentual. Além desses dois motivos, o motivo AAAATA também exibe alta abundância no conjunto de genes analisados.[0140] To determine whether specific motifs were deleted in genes optimized for higher frequency in planta transgene expression, the percentage of polyadenylation motifs that remained after optimization was calculated. Although this analysis is not considered to provide complete identification of all existing weak polyadenylation motifs in plants, the retention of motifs beyond high abundance in this variety of genes is a valuable indication of their weak impact on transcript stability. The two motifs AATCAA and ATGAAA exhibit higher abundance throughout all genes and remained homogeneous in high percentage optimized sequences. In addition to these two motifs, the AAAATA motif also exhibits high abundance in the set of genes analyzed.

[0141] Segundo estes dados, estes motivos de poliadenilação não são propensos a influenciar a expressão de transgene em nenhuma safra de interesse.[0141] According to these data, these polyadenylation motifs are not likely to influence transgene expression in any crop of interest.

EXEMPLO 5EXAMPLE 5

[0142] Expressão transitória de teste de genes que são otimizados por códons de milho, mas contêm pelo menos três motivos de poliadenilação na posição de tipo selvagem:[0142] Test transient expression of genes that are optimized by maize codons but contain at least three polyadenylation motifs in the wild-type position:

a. Sistema de expressão transitória realizado no Exemplo 2:The. Transient expression system carried out in Example 2:

[0143] Axmi028:[0143] Axmi028:

[0144] Axmi028 do tipo selvagem, mas com sequência truncada C- terminal, foi examinado para determinar a presença de motivos de poliadenilação fracos que podem permanecer na sequência otimizada. Foram encontrados dois motivos ATGAAA e quatro AATCAA, que são os motivos mais sobrerrepresentados no banco de dados CDSv3 de milho. A sequência otimizada já contém um motivo AATACA presente na sua posição do tipo selvagem de 626 bp. Este motivo não é sobrerrepresentado nem subrepresentado no conjunto de dados CDS v3 de milho (104% do real/teórico). Dois dos quatro motivos AATCAA foram introduzidos na sequência otimizada (posições 1036 bp e 1232 bp), fornecendo, ao todo, três motivos fracos que são identificados na posição de tipo selvagem da sequência de codificação otimizada modificada. Esta sequência 028opt+3pA, conforme descrito em SEQ ID N° 13 (Figura 2D), não compreende nenhum dos motivos de poliadenilação mais fortes ATAAAA, CATAAA, ATACTA, ATTAAA, AATTAA e ATTAAT. Ela foi analisada por meio de PASPA (Figura 3D) e concluiu-se que fornece uma curva de probabilidade idêntica de poliadenilação como a sequência totalmente otimizada (Figura 3B). Este exemplo demonstra que a adição de motivos fracos na sua posição de tipo selvagem na sequência de codificação otimizada não possui efeito sobre o nível de previsibilidade dos motivos de poliadenilação em comparação com o da sequência otimizada modificada.[0144] Wild-type Axmi028, but with a C-terminal truncated sequence, was examined to determine the presence of weak polyadenylation motifs that may remain in the optimized sequence. Two ATGAAA and four AATCAA motifs were found, which are the most overrepresented motifs in the maize CDSv3 database. The optimized sequence already contains an AATACA motif present at its 626 bp wild-type position. This motif is neither overrepresented nor underrepresented in the corn CDS v3 dataset (104% of actual/theoretical). Two of the four AATCAA motifs were introduced into the optimized sequence (positions 1036 bp and 1232 bp), providing, in total, three weak motifs that are identified in the wild-type position of the modified optimized coding sequence. This 028opt+3pA sequence, as described in SEQ ID NO: 13 (Figure 2D), does not comprise any of the stronger polyadenylation motifs ATAAAA, CATAAA, ATACTA, ATTAAA, AATTAA and ATTAAT. It was analyzed using PASPA (Figure 3D) and was found to provide an identical polyadenylation probability curve as the fully optimized sequence (Figure 3B). This example demonstrates that the addition of weak motifs to their wild-type position in the optimized coding sequence has no effect on the level of predictability of the polyadenylation motifs compared to that of the modified optimized sequence.

[0145] Esta sequência 028-opt+3pA é analisada no milho (SEQ ID N° 15) e sistemas de teste transitórios de embriões de milho e fumo (SEQ ID N° 23) conforme descrito nos Exemplos 2 e 3. O nível de expressão de proteínas e RNA obtido a partir da sequência 028-opt+3pA é comparado em seguida com o obtido a partir da sequência 028+opt.[0145] This 028-opt+3pA sequence is analyzed in corn (SEQ ID NO. 15) and corn and tobacco embryo transient test systems (SEQ ID NO. 23) as described in Examples 2 and 3. The level of expression of proteins and RNA obtained from the 028-opt+3pA sequence is then compared with that obtained from the 028+opt sequence.

b. Sistema de expressão transitória do gene Axmi028 em protoplastas de milho:B. Transient expression system of the Axmi028 gene in maize protoplasts:

[0146] Diferentes versões de Axmi028 foram transformadas em protoplastas de milho por meio de transfecção transitória. Os genes 028-WT, 028-opt, 028-optpA e 028-opt3pA fornecidos a partir da versão dobrada de promotor 35S viral constitutivo (Guilley et al, 1982) são clonados em um vetor derivado de pD35 (http://www.dna-cloning.com/) que adiciona uma marca His N- terminal e uma marca Myc C-terminal a cada uma das versões de Axmi028. Ele também contém o gene neomicina fosfotransferase nptII referente à resistência à canamicina expresso a partir do promotor nos constitutivo (Depicker et al, 1982), formando os plasmídeos pD35-nH-cM-Axmi028-wt, pD35-nH-cM- Axmi028-opt, pD35-nH-cM-Axmi028-optpA, pD35-nH-cM-Axmi028-opt3pA (SEQ ID N° 29, SEQ ID N° 30, SEQ ID N° 31 e SEQ ID N° 32, respectivamente). Estes quatro vetores, mais um vetor controle que não expressa Axmi028, mas gene relator td-tomate (SEQ ID N° 33), são transfectados em protoplastas de milho da linhagem de milho A188 de acordo com o protocolo de transformação mediada por PEG de protoplastas vegetais (Sheen, 2002). 48 horas após a transfecção, os protoplastas foram colhidos por meio de centrifugação, a proteína total foi analisada para determinar a presença de versões Axmi028 por meio de análise Western, utilizando um anticorpo primário anti-6X His IgG marcado com tintura fluorescente CF680 (detecção com marca His N-terminal por meio do filtro Alexa 680), um anticorpo primário anti-c-Myc-Cy3 marcado com tintura fluorescente Cy3 (detecção de marca Myc C-terminal por meio do filtro Alexa 546) e anticorpo nptII com anticorpo conjugado a HRP secundário para detecção de nptII como controle interno. O nível de proteína Axmi028, normalizado para expressão da proteína nptII, é comparado entre as quatro construções de Axmi028. A Figura 8 ilustra a intensidade de expressão relativa de proteína Axmi028. A detecção das versões de Axmi028 com comprimento total é realizada por meio da marca His N-terminal (detecção: filtro de fluorescência Alexa680) e a marca Myc C-terminal (detecção: filtro de fluorescência Alexa546). Detecção de nptII (detecção: quimioluminescência) como controle de transformação interno foi possível em todas as amostras. Em todas as linhas, a intensidade dos sinais c-Myc e 6His detectados foi definida com relação ao sinal nptII, conforme calculado por meio do software Image Lab 5.2.1, BioRad.[0146] Different versions of Axmi028 were transformed into corn protoplasts through transient transfection. Genes 028-WT, 028-opt, 028-optpA and 028-opt3pA provided from the folded version of constitutive viral 35S promoter (Guilley et al, 1982) are cloned into a vector derived from pD35 (http://www. dna-cloning.com/) which adds an N-terminal His tag and a C-terminal Myc tag to each of the versions of Axmi028. It also contains the neomycin phosphotransferase nptII gene for kanamycin resistance expressed from the constitutive nos promoter (Depicker et al, 1982), forming the plasmids pD35-nH-cM-Axmi028-wt, pD35-nH-cM-Axmi028-opt , pD35-nH-cM-Axmi028-optpA, pD35-nH-cM-Axmi028-opt3pA (SEQ ID NO. 29, SEQ ID NO. 30, SEQ ID NO. 31 and SEQ ID NO. 32, respectively). These four vectors, plus a control vector that does not express Axmi028, but td-tomato reporter gene (SEQ ID NO. 33), are transfected into maize protoplasts of the A188 maize line according to the protocol for PEG-mediated transformation of protoplasts. vegetables (Sheen, 2002). 48 hours after transfection, protoplasts were harvested via centrifugation, total protein was analyzed to determine the presence of Axmi028 versions via Western analysis using an anti-6X His IgG primary antibody labeled with CF680 fluorescent dye (detection with N-terminal His tag via Alexa 680 filter), an anti-c-Myc-Cy3 primary antibody labeled with Cy3 fluorescent dye (detection of C-terminal Myc tag via Alexa 546 filter) and nptII antibody with antibody conjugated to Secondary HRP for nptII detection as internal control. The Axmi028 protein level, normalized to nptII protein expression, is compared between the four Axmi028 constructs. Figure 8 illustrates the relative expression intensity of Axmi028 protein. Detection of full-length versions of Axmi028 is performed using the N-terminal His tag (detection: Alexa680 fluorescence filter) and the C-terminal Myc tag (detection: Alexa546 fluorescence filter). Detection of nptII (detection: chemiluminescence) as an internal transformation control was possible in all samples. In all lines, the intensity of the detected c-Myc and 6His signals was defined with respect to the nptII signal, as calculated using Image Lab 5.2.1 software, BioRad.

[0147] Conclusões sobre os testes transitórios de Axmi028:[0147] Conclusions on Axmi028 transient tests:

[0148] A Figura 6A demonstra que, no teste de milho 028-Luc transitório, a expressão de luciferase da sequência 028-WT-Luc é 10% da sequência 028-opt-Luc. A adição de três ou todos os motivos poliA à sequência otimizada não reduziu a expressão de luciferase em comparação com a obtida a partir da sequência 028-opt-Luc.[0148] Figure 6A demonstrates that, in the transient 028-Luc corn test, luciferase expression from the 028-WT-Luc sequence is 10% of the 028-opt-Luc sequence. Addition of three or all polyA motifs to the optimized sequence did not reduce luciferase expression compared to that obtained from the 028-opt-Luc sequence.

[0149] A Figura 8 exibe a expressão de proteína de Axmi028-WT, 028-opt, 028-optpA e 028-opt3pA em protoplastas de milho após transformação transitória. A detecção de sinal somente foi possível para as versões otimizadas, mas não para o tipo selvagem. A adição de três motivos de poliadenilação à sequência otimizada não reduziu a expressão em comparação com a obtida a partir da sequência 028-opt. Neste teste, a adição de três motivos de poliadenilação fornece níveis de expressão de proteínas mais altos que a expressão de 028-opt e 028-opt-pA. Por outro lado, a expressão de 028-opt-pA foi mais baixa que a de 028-opt.[0149] Figure 8 displays the protein expression of Axmi028-WT, 028-opt, 028-optpA and 028-opt3pA in maize protoplasts after transient transformation. Signal detection was only possible for the optimized versions, but not for the wild type. The addition of three polyadenylation motifs to the optimized sequence did not reduce expression compared to that obtained from the 028-opt sequence. In this test, the addition of three polyadenylation motifs provides higher protein expression levels than expression of 028-opt and 028-opt-pA. On the other hand, the expression of 028-opt-pA was lower than that of 028-opt.

[0150] Axmi100:[0150] Axmi100:

[0151] Axmi100 do tipo selvagem, mas com sequência truncada C- terminal, foi examinado para determinar a presença de motivos de poliadenilação fracos que podem permanecer na sequência otimizada. Foram encontrados três motivos AATCAA, que são os motivos sobrerrepresentados no banco de dados CDSv3 de milho. A sequência otimizada já contém um motivo AAGCAT presente na sua posição do tipo selvagem de 1788 bp. Este motivo é sobrerrepresentado no conjunto de dados CDS v3 de milho (152% do real/teórico). Os primeiros dois dos três motivos AATCAA foram introduzidos na sequência otimizada (posições 13 bp e 1192 bp), fornecendo três motivos de poliadenilação fracos identificados na sequência de codificação otimizada na posição de tipo selvagem. Essa sequência 100opt+3pA, conforme descrito em SEQ ID N° 14 (Figura 4D) compreende finalmente seis motivos de poliadenilação fracos e não compreende nenhum dos motivos de poliadenilação mais fortes ATAAAA, CATAAA, ATACTA, ATTAAA, AATTAA e ATTAAT. Ela foi analisada por meio de PASPA (Figura 5D) e para Axmi028+3pA, concluindo-se que fornece curva de probabilidade idêntica de poliadenilação como a sequência totalmente otimizada (Figura 5B).[0151] Wild-type Axmi100, but with a C-terminal truncated sequence, was examined to determine the presence of weak polyadenylation motifs that may remain in the optimized sequence. Three AATCAA motifs were found, which are the overrepresented motifs in the maize CDSv3 database. The optimized sequence already contains an AAGCAT motif present at its wild-type position of 1788 bp. This motif is overrepresented in the corn CDS v3 dataset (152% of actual/theoretical). The first two of the three AATCAA motifs were introduced into the optimized sequence (positions 13 bp and 1192 bp), providing three weak polyadenylation motifs identified in the optimized coding sequence at the wild-type position. This 100opt+3pA sequence, as described in SEQ ID NO: 14 (Figure 4D) ultimately comprises six weak polyadenylation motifs and does not comprise any of the stronger polyadenylation motifs ATAAAA, CATAAA, ATACTA, ATTAAA, AATTAA and ATTAAT. It was analyzed using PASPA (Figure 5D) and for Axmi028+3pA, concluding that it provides identical polyadenylation probability curve as the fully optimized sequence (Figure 5B).

[0152] Esta sequência 100-opt+3pA é analisada no milho (SEQ ID N° 16) e sistemas de teste transitórios de embriões de milho e fumo (SEQ ID N° 24) conforme descrito nos Exemplos 2 e 3. O nível de expressão de proteínas e RNA obtido a partir da sequência 100-opt+3pA é comparado em seguida com o obtido a partir da sequência 100-opt.[0152] This 100-opt+3pA sequence is analyzed in corn (SEQ ID NO. 16) and corn and tobacco embryo transient test systems (SEQ ID NO. 24) as described in Examples 2 and 3. The level of expression of proteins and RNA obtained from the 100-opt+3pA sequence is then compared with that obtained from the 100-opt sequence.

[0153] Realizou-se análise Western Blot sobre as mesmas amostras, utilizando um anticorpo policlonal levantado contra proteína Axmi100. O resultado é alinhado com o resultado ilustrado na Figura 6: a presença de sinais de poliadenilação possibilita a obtenção de boa expressão da proteína, melhor que a expressão da proteína otimizada na qual não se adicionou poliadenilação e a expressão da proteína otimizada na qual toda a poliadenilação do tipo selvagem foi adicionada, enquanto a proteína de tipo selvagem não é expressa adequadamente (dados não exibidos).[0153] Western Blot analysis was performed on the same samples, using a polyclonal antibody raised against the Axmi100 protein. The result is in line with the result illustrated in Figure 6: the presence of polyadenylation signals makes it possible to obtain good expression of the protein, better than the expression of the optimized protein in which no polyadenylation was added and the expression of the optimized protein in which all wild-type polyadenylation was added, whereas the wild-type protein is not expressed properly (data not shown).

[0154] Conclusão sobre a expressão de Axmi100 em teste transitório:[0154] Conclusion on Axmi100 expression in transient test:

[0155] A Figura 6B demonstra que, no teste Axmi100-Luc transitório, a expressão de luciferase da sequência 100-WT-Luc é 17% da sequência 100-opt-Luc. A adição de três motivos poliA à sequência otimizada não reduziu a expressão de luciferase em comparação com a obtida a partir da sequência 100-opt-Luc. A adição de todos os motivos poliA, entretanto, reduziu a expressão de luciferase para 11% da sequência 100-opt-Luc.[0155] Figure 6B demonstrates that, in the transient Axmi100-Luc test, luciferase expression from the 100-WT-Luc sequence is 17% of the 100-opt-Luc sequence. The addition of three polyA motifs to the optimized sequence did not reduce luciferase expression compared to that obtained from the 100-opt-Luc sequence. Addition of all polyA motifs, however, reduced luciferase expression to 11% of the 100-opt-Luc sequence.

[0156] Western Blot, que examina a quantidade de proteína e não a atividade, confirma os resultados exibidos na Figura 6B.[0156] Western Blot, which examines the amount of protein and not the activity, confirms the results shown in Figure 6B.

EXEMPLO 6EXAMPLE 6

[0157] Teste da expressão estável de genes que são otimizados por códons de milho, mas contêm pelo menos três motivos de poliadenilação:[0157] Testing the stable expression of genes that are optimized by maize codons but contain at least three polyadenylation motifs:

[0158] Axmi028:[0158] Axmi028:

[0159] As linhagens descritas nos Exemplos 2 e 5 (028-WT+GUS, 028-WT+Cyan, 028-opt+GUS, 028-opt+Cyan, 028-opt+pA+GUS, 028- opt+pA+Cyan, 028-opt+3pA+GUS e 028-opt+3pA+Cyan) são transformadas em milho, essencialmente conforme descrito por Ishida et al (1996). Pelo menos dez transformadores de cópia simples individuais com T-DNA intacto são produzidos para cada construto. Análises PCR QRT e Western são realizadas sobre material de folha T0. Os níveis de proteína e expressão de Axim028 em folhas das plantas 028-WT são comparados com os transformadores 028-opt e 028-opt+3pA.[0159] The strains described in Examples 2 and 5 (028-WT+GUS, 028-WT+Cyan, 028-opt+GUS, 028-opt+Cyan, 028-opt+pA+GUS, 028- opt+pA+ Cyan, 028-opt+3pA+GUS and 028-opt+3pA+Cyan) are transformed into maize, essentially as described by Ishida et al (1996). At least ten individual single-copy transformants with intact T-DNA are produced for each construct. QRT and Western PCR analyzes are performed on T0 sheet material. Protein and expression levels of Axim028 in leaves of 028-WT plants are compared with 028-opt and 028-opt+3pA transformants.

[0160] As análises de Western Blot sobre extratos de proteína de folhas de milho de plantas transformadas com construções Axmi028+GUS (Figura 7A) foram realizadas com um anticorpo contra o C-Myc TAG ([9E10] - grau chip ab32” (abcam)). Proteína Axmi028 não pôde ser detectada em plantas transformadas com o gene 028-WT. A expressão da proteína Axmi028 pôde ser observada em plantas transformadas com as sequências 028-opt, 028-opt+3pA e 028-opt+pA. Esta expressão pareceu ser a mais alta em plantas transformadas com 028-opt+3pA.[0160] Western Blot analyzes on protein extracts from corn leaves of plants transformed with Axmi028+GUS constructs (Figure 7A) were performed with an antibody against the C-Myc TAG ([9E10] - grade chip ab32” (abcam )). Axmi028 protein could not be detected in plants transformed with the 028-WT gene. The expression of the Axmi028 protein could be observed in plants transformed with the sequences 028-opt, 028-opt+3pA and 028-opt+pA. This expression appeared to be the highest in plants transformed with 028-opt+3pA.

[0161] Axmi100:[0161] Axmi100:

[0162] Conforme descrito acima para Axmi028, as diferentes versões de Axmi100 são transformadas em milho. Os níveis de resistência de lepidópteros em plantas transformadas com 100-opt e 100-opt+3pA são comparados com os níveis de transformadores 100-WT em testes de alimentação de folhas.[0162] As described above for Axmi028, the different versions of Axmi100 are processed into corn. Lepidoptera resistance levels in 100-opt and 100-opt+3pA transformed plants are compared to levels in 100-WT transformers in leaf feeding tests.

[0163] Análises de Western Blot sobre extratos de proteína de folhas de milho de plantas transformadas com construções Axmi100+GUS (Figura 7B) foram realizadas com um anticorpo policlonal Axmi100. Proteína Axmi100 não pôde ser detectada em plantas transformadas com o gene 100-WT. A expressão da proteína Axmi100 pôde ser observada em plantas transformadas com as sequências 100-opt, 100-opt+3pA e 100-opt+pA. A expressão pareceu menos robusta em transformadores 100-opt+pA, nos quais apenas cinco de dez plantas transformadas expressaram níveis significativos de proteína Axmi100. Análises QPCR RT utilizando pares de primers 3’ e 5’ (SEQ ID N° 25-28) também demonstraram que os níveis de transcrito de 100-opt+pA em transformadores de milho foram inferiores aos obtidos em transformadores 100-opt e 100-opt+3pA (Figura 9).[0163] Western blot analyzes on corn leaf protein extracts from plants transformed with Axmi100+GUS constructs (Figure 7B) were performed with an Axmi100 polyclonal antibody. Axmi100 protein could not be detected in plants transformed with the 100-WT gene. The expression of the Axmi100 protein could be observed in plants transformed with the sequences 100-opt, 100-opt+3pA and 100-opt+pA. Expression appeared less robust in 100-opt+pA transformants, in which only five of ten transformed plants expressed significant levels of Axmi100 protein. QPCR RT analyzes using 3' and 5' primer pairs (SEQ ID NO. 25-28) also demonstrated that 100-opt+pA transcript levels in maize transformers were lower than those obtained in 100-opt and 100- transformers. opt+3pA (Figure 9).

[0164] Pode-se concluir a partir destes resultados que a otimização genética é necessária para obter expressão de proteínas Axmi028 e Axmi100. A adição de motivos de poliadenilação fracos não prejudica a expressão de proteínas. A presença de três ou mais alguns motivos de poliadenilação fracos nas sequências otimizadas não prejudica a expressão de proteínas ou pode aumentar a expressão em comparação com a sequência genética otimizada. A reintrodução de todos os motivos poliA na sequência otimizada pode, entretanto, reduzir a possibilidade de obter nível de expressão de proteínas equivalente ao obtido a partir do gene otimizado.[0164] It can be concluded from these results that genetic optimization is necessary to obtain expression of Axmi028 and Axmi100 proteins. Addition of weak polyadenylation motifs does not impair protein expression. The presence of three or more weak polyadenylation motifs in the optimized sequences does not impair protein expression or may increase expression compared to the optimized gene sequence. The reintroduction of all polyA motifs into the optimized sequence may, however, reduce the possibility of obtaining a protein expression level equivalent to that obtained from the optimized gene.

[0165] Referências: Campbell e Gowri (1990). Codon usage in higher plants, green algae and cyanobacteries. Plant Physiol. 92: 1-11. Colgan, D. F., Manley, J. L. (1997). Mechanism and regulation of mRNA polyadenylation. Genes Dev. 11 (21): 2755-66. Guilley, H., Dudley, R. K., Jonard, G., Balazs, E., Richards, K. E. Transcription of Cauliflower mosaic virus DNA: detection of promoter sequences, and characterization of transcripts. Cell. 1982, 30: 763-773. Lu. A., Diehn, S. e Cigan, M. (2015). Maize Protein Expression. In Recent Advancements in Gene Expression and Enabling Technologies in Crop Plants. Editores: Kasi Azhakanandam, Aron Silverstone, Henry Daniell e Michael R. Davey. Springer ISBN 978-1-4939-2201-7; ISBN 978-1-4939-2202-4 (eBook); DOI 10.1007/978-1-4939-2202-4. Graber, J. H., Cantor, C. R., Mohr, S. C., Smith, T. F. (1999). In silico detection of control signals: mRNA 3'-end-processing sequences in diverse species. Proc. Natl. Acad. Sci. U. S. A. 96: 14055-60. Ishida, Y., Saito, H., Ohta, S., Hiei, Y., Komari, T., Kumashiro, T. (1996). High efficiency transformation of maize (Zea mays L.) mediated by Agrobacterium tumefaciens. Nature Biotechnol. 14, 745-50. Jefferson, R. A., Kavanagh, T. A. e Bevan, M. W. (1987). GUS fusions: beta-glucuronidase as a sensitive and versatile gene fusion marker in higher plants. EMBO J. 6: 3901-3907. Ji, G., Li, L., Li, Q. Q., Wu, X., Fu, J., Chen, G., Wu X. (2015). PASPA: a web server for mRNA poly(A) site predictions in plants and algae. Bioinformatics 31: 1671-3. Joshi, C. P. (1987). Putative polyadenylation signals in nuclear genes of higher plants: a compilation and analysis. Nucleic Acids Res. 15 (23): 9627-40. Komari, T., Hiei, Y., Saito, Y., Murai, N., Kumashiro, T. (1996). Vectors carrying two separate T-DNAs for co-transformation of higher plants mediated by Agrobacterium tumefaciens and segregation of transformants free from selection markers. Plant J. 10: 165-74. Leckie, B. M., Neal Stewart, C. Jr. (2011). Agroinfiltration as a technique for rapid assays for evaluating candidate insect resistance transgenes in plants. Plant Cell Rep. 30 (3): 325-34. Mogen, B. D., MacDonald, M. H., Graybosch, R., Hunt, A. G. (1990). Upstream sequences other than AAUAAA are required for efficient messenger RNA 3'-end formation in plants. Plant Cell. 2 (12): 1261-72. Murray, E. E. et al. (1989). Codon usage in plant genes. Nucleic Acids Res. 17: 477-498. Sanfaçon, H., Brodmann, P., Hohn, T. (1991). A dissection of the cauliflower mosaic virus polyadenylation signal. Genes Dev. 5 (1): 141-9. Sheen, J. 2002. A transient expression assay using Arabidopsis mesophyll protoplasts. http://genetics.mgh.harvard.edu/sheenweb/. Tzanis, G. et al (2011). PolyA-iEP: A data mining method for the effective prediction of polyadenylation sites. Expert Syst. Appl. 38 (10) 12398-12408. Verdaguer, B., de Kochko, A., Beachy, R. N., Fauquet, C. (1996). Isolation and expression in transgenic tobacco and rice plants, of the cassava vein mosaic virus (CVMV) promoter. Plant Mol. Biol. 31: 1129-39 Wu, X. et al (2012). Comprehensive recognition of messenger RNA polyadenylation pattern in plants. African Journal of Biotechnology, vol. 11 (14), págs. 3215-3234.[0165] References: Campbell and Gowri (1990). Codon usage in higher plants, green algae and cyanobacteria. Plant Physiol. 92: 1-11. Colgan, D. F., Manley, J. L. (1997). Mechanism and regulation of mRNA polyadenylation. Genes Dev 11 (21): 2755-66. Guilley, H., Dudley, R. K., Jonard, G., Balazs, E., Richards, K. E. Transcription of Cauliflower mosaic virus DNA: detection of promoter sequences, and characterization of transcripts. Cell. 1982, 30: 763-773. Lu. A., Diehn, S., and Cigan, M. (2015). Maize Protein Expression. In Recent Advancements in Gene Expression and Enabling Technologies in Crop Plants. Editors: Kasi Azhakanandam, Aron Silverstone, Henry Daniell, and Michael R. Davey. Springer ISBN 978-1-4939-2201-7; ISBN 978-1-4939-2202-4 (eBook); DOI 10.1007/978-1-4939-2202-4. Graber, J. H., Singer, C. R., Mohr, S. C., Smith, T. F. (1999). In silico detection of control signals: mRNA 3'-end-processing sequences in diverse species. Proc. Natl. Academic. Sci. U. S. A. 96: 14055-60. Ishida, Y., Saito, H., Ohta, S., Hiei, Y., Komari, T., Kumashiro, T. (1996). High efficiency transformation of maize (Zea mays L.) mediated by Agrobacterium tumefaciens. Nature Biotechnol. 14, 745-50. Jefferson, R. A., Kavanagh, T. A., & Bevan, M. W. (1987). GUS fusions: beta-glucuronidase as a sensitive and versatile gene fusion marker in higher plants. EMBO J. 6: 3901-3907. Ji, G., Li, L., Li, Q. Q., Wu, X., Fu, J., Chen, G., Wu X. (2015). PASPA: a web server for mRNA poly(A) site predictions in plants and algae. Bioinformatics 31: 1671-3. Joshi, C. P. (1987). Putative polyadenylation signals in nuclear genes of higher plants: a compilation and analysis. Nucleic Acids Res 15 (23): 9627-40. Komari, T., Hiei, Y., Saito, Y., Murai, N., Kumashiro, T. (1996). Vectors carrying two separate T-DNAs for co-transformation of higher plants mediated by Agrobacterium tumefaciens and segregation of transformants free from selection markers. Plant J. 10: 165-74. Leckie, B. M., Neal Stewart, C. Jr. (2011). Agroinfiltration as a technique for rapid assays for evaluating candidate insect resistance transgenes in plants. Plant Cell Rep. 30 (3): 325-34. Mogen, B. D., MacDonald, M. H., Graybosch, R., Hunt, A. G. (1990). Upstream sequences other than AAUAAA are required for efficient messenger RNA 3'-end formation in plants. Plant Cell. 2 (12): 1261-72. Murray, E. E. et al. (1989). Codon usage in plant genes. Nucleic Acids Res 17: 477-498. Sanfaçon, H., Brodmann, P., Hohn, T. (1991). A dissection of the cauliflower mosaic virus polyadenylation signal. Genes Dev 5 (1): 141-9. Sheen, J. 2002. A transient expression assay using Arabidopsis mesophyll protoplasts. http://genetics.mgh.harvard.edu/sheenweb/. Tzanis, G. et al (2011). PolyA-iEP: A data mining method for the effective prediction of polyadenylation sites. Expert Syst. Appl. 38 (10) 12398-12408. Verdaguer, B., de Kochko, A., Beachy, R. N., Fauquet, C. (1996). Isolation and expression in transgenic tobacco and rice plants, of the cassava vein mosaic virus (CVMV) promoter. Plant Mol. Biol. 31: 1129-39 Wu, X. et al (2012). Comprehensive recognition of messenger RNA polyadenylation pattern in plants. African Journal of Biotechnology, vol. 11 (14), pp. 3215-3234.

Claims (6)

1. MÉTODO DE MODIFICAÇÃO DE SEQUÊNCIAS DE CODIFICAÇÃO que codificam proteínas não vegetais, caracterizado por compreender as etapas de: (a) identificação de cada sequência de motivos de poliadenilação do tipo selvagem dentre AAAATA, AACCAA, AAGCAT, AATAAA, AATAAT, AATACA, AATCAA, AATTAA, ATAAAA, ATACAT, ATACTA, ATATAA, ATGAAA, ATTAAA, ATTAAT e CATAAA, e sua posição dentro da mencionada sequência de codificação; (b) otimização da mencionada sequência de codificação por meio de substituição de códons para expressão vegetal, de forma a obter uma sequência de codificação otimizada que codifica a mencionada proteína não vegetal, em que a otimização leva à remoção de um ou mais motivos de poliadenilação; e (c) reintrodução, na sequência de codificação otimizada, de pelo menos uma sequência de motivos de poliadenilação selecionado a partir do grupo que consiste em ATGAAA, AATCAA, AAAATA, AAGCAT, AACCAA, ATAAAA, AATAAT, AATAAA, AATACA e ATACAT, de forma a obter uma sequência de codificação modificada que compreende pelo menos três, mas não todos os motivos de poliadenilação do tipo selvagem e a mencionada sequência de codificação modificada que codifica a mencionada proteína não vegetal.1. METHOD FOR MODIFYING CODING SEQUENCES that encode non-plant proteins, characterized by comprising the steps of: (a) identification of each sequence of wild-type polyadenylation motifs among AAAATA, AACCAA, AAGCAT, AATAAA, AATAAT, AATACA, AATCAA , AATTAA, ATAAAA, ATACAT, ATACTA, ATATAA, ATGAAA, ATTAAA, ATTAAT and CATAAA, and their position within said coding sequence; (b) optimizing said coding sequence by means of codon substitution for plant expression, so as to obtain an optimized coding sequence encoding said non-plant protein, wherein the optimization leads to the removal of one or more polyadenylation motifs ; and (c) reintroducing, into the optimized coding sequence, at least one polyadenylation motif sequence selected from the group consisting of ATGAAA, AATCAA, AAAATA, AAGCAT, AACCAA, ATAAAA, AATAAT, AATAAA, AATACA and ATACAT, of in order to obtain a modified coding sequence comprising at least three, but not all of the wild-type polyadenylation motifs and said modified coding sequence encoding said non-plant protein. 2. MÉTODO, de acordo a reivindicação 1, caracterizado por cada motivo de poliadenilação introduzido dentro da mencionada sequência otimizada da etapa (c) ser introduzido em uma posição de ácido nucleico correspondente à sua posição dentro da sequência de codificação.2. METHOD, according to claim 1, characterized in that each polyadenylation motif introduced within said optimized sequence of step (c) is introduced into a nucleic acid position corresponding to its position within the coding sequence. 3. MÉTerizado pela sequência de motivo de poliadenilação introduzida na etapa (c) ser uma sequência de motivo de poliadenilação selecionada dentre os motivos ATGAAODO, de acordo com qualquer uma das reivindicações 1 a 2, caractA, AAGCAT, AACCAA, AATCAA e AAAATA.3. METERIZED by the polyadenylation motif sequence introduced in step (c) being a polyadenylation motif sequence selected from the ATGAAODO motifs according to any one of claims 1 to 2, charactA, AAGCAT, AACCAA, AATCAA and AAAATA. 4. MÉTODO, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pela sequência de codificação modificada compreender uma combinação de três a dez motivos de poliadenilação e, mais preferivelmente, três a seis motivos de poliadenilação selecionados dentre os motivos ATGAAA, AAGCAT, AACCAA, AATCAA e AAAATA, e em que a sequência de codificação modificada compreende uma combinação de pelo menos três motivos de poliadenilação conforme identificado na sequência de codificação do tipo selvagem.4. METHOD according to any one of claims 1 to 3, characterized in that the modified coding sequence comprises a combination of three to ten polyadenylation motifs and, more preferably, three to six polyadenylation motifs selected from the motifs ATGAAA, AAGCAT, AACCAA, AATCAA and AAAATA, and wherein the modified coding sequence comprises a combination of at least three polyadenylation motifs as identified in the wild-type coding sequence. 5. MÉTODO DE ELABORAÇÃO DE CASSETE DE EXPRESSÃO, caracterizado por compreender uma sequência de codificação modificada que codifica uma proteína não vegetal, em que o método compreende: (a) aplicação do método, conforme definido em qualquer uma das reivindicações 1 a 4, a uma sequência de codificação que codifica a mencionada proteína não vegetal; e (b) operavelmente ligar um promotor e um terminador à mencionada sequência de codificação modificada para obter um construto para expressão em planta.5. METHOD FOR PREPARING AN EXPRESSION CASSETTE, characterized in that it comprises a modified coding sequence that encodes a non-vegetable protein, wherein the method comprises: (a) applying the method, as defined in any one of claims 1 to 4, to a coding sequence encoding said non-vegetable protein; and (b) operably linking a promoter and a terminator to said modified coding sequence to obtain a construct for expression in planta. 6. MÉTODO, de acordo com a reivindicação 5, caracterizado pela sequência de codificação codificar uma proteína inseticida de Bacillus thuringiensis.6. METHOD, according to claim 5, characterized in that the coding sequence encodes an insecticidal protein from Bacillus thuringiensis.
BR112018000262-3A 2015-07-06 2016-07-06 METHOD FOR MODIFYING CODING SEQUENCES AND METHOD FOR PREPARING AN EXPRESSION CASSETTE BR112018000262B1 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP15306105.6A EP3115458A1 (en) 2015-07-06 2015-07-06 Method for gene optimization
EP15306105.6 2015-07-06
PCT/EP2016/066045 WO2017005819A1 (en) 2015-07-06 2016-07-06 Method for gene optimization

Publications (2)

Publication Number Publication Date
BR112018000262A2 BR112018000262A2 (en) 2018-09-04
BR112018000262B1 true BR112018000262B1 (en) 2023-07-25

Family

ID=

Similar Documents

Publication Publication Date Title
Diamos et al. 5′ and 3′ untranslated regions strongly enhance performance of geminiviral replicons in Nicotiana benthamiana leaves
Egelkrout et al. Overproduction of recombinant proteins in plants
Mann et al. Gateway‐compatible vectors for high‐throughput gene functional analysis in switchgrass (Panicum virgatum L.) and other monocot species
AU2005206283B2 (en) Two-component RNA virus-derived plant expression system
CA2439199C (en) Processes and vectors for amplification or expression of nucleic acid sequences of interest in plants
AU2009321351B2 (en) Method for the transformation of plant cell plastids
Bouaziz et al. Ectopic expression of dehydration responsive element binding proteins (StDREB2) confers higher tolerance to salt stress in potato
Shah et al. Comparison of expression vectors for transient expression of recombinant proteins in plants
US20110138495A1 (en) Methods and Compositions for Expressing Proteins In Plants
US10941409B2 (en) Method for gene optimization
AU2002302475A1 (en) Processes and vectors for amplification or expression of nucleic acid sequences of interest in plants
CA3027812A1 (en) Polypeptide sequence
Wang et al. Development of new potato virus X-based vectors for gene over-expression and gene silencing assay
Wang et al. Isolation and functional analysis of the poplar RbcS gene promoter
Mitra et al. The intergenic region of Arabidopsis thaliana cab 1 and cab 2 divergent genes functions as a bidirectional promoter
US20050246787A1 (en) Globulin-1 regulatory region and method of using same
Niemeyer et al. Inducible expression of p50 from TMV for increased resistance to bacterial crown gall disease in tobacco
Li et al. Isolation of five rice nonendosperm tissue‐expressed promoters and evaluation of their activities in transgenic rice
BR112018000262B1 (en) METHOD FOR MODIFYING CODING SEQUENCES AND METHOD FOR PREPARING AN EXPRESSION CASSETTE
CN105820220A (en) Stress resistance relevant protein and application of coding gene in regulating alkali resistance of plants
US9944937B2 (en) Regulatory region having increased expression and method of using same
Aronson et al. In planta protein–protein interactions assessed using a nanovirus‐based replication and expression system
Zhang et al. Development of Tomato bushy stunt virus-based vectors for fusion and non-fusion expression of heterologous proteins in an alternative host Nicotiana excelsiana
Li et al. Isolation of pea matrix attachment region and study on its function in transgenic tobaccos
WO2024053585A1 (en) Method for producing desired substance using plant having suppressed resistance