BR112018006884B1 - METHODS AND SYSTEMS FOR PREDICTING THE RISK OF TRANSGENE S-LEARNING - Google Patents

METHODS AND SYSTEMS FOR PREDICTING THE RISK OF TRANSGENE S-LEARNING Download PDF

Info

Publication number
BR112018006884B1
BR112018006884B1 BR112018006884-5A BR112018006884A BR112018006884B1 BR 112018006884 B1 BR112018006884 B1 BR 112018006884B1 BR 112018006884 A BR112018006884 A BR 112018006884A BR 112018006884 B1 BR112018006884 B1 BR 112018006884B1
Authority
BR
Brazil
Prior art keywords
plant
transgene
acetylation
h3k9me2
gene
Prior art date
Application number
BR112018006884-5A
Other languages
Portuguese (pt)
Other versions
BR112018006884A2 (en
Inventor
Pohao Wang
Shreedharan Sriram
Lakshmi Sastrydent
Original Assignee
Dow Agrosciences Llc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dow Agrosciences Llc filed Critical Dow Agrosciences Llc
Priority claimed from PCT/US2016/058633 external-priority patent/WO2017083092A1/en
Publication of BR112018006884A2 publication Critical patent/BR112018006884A2/en
Publication of BR112018006884B1 publication Critical patent/BR112018006884B1/en

Links

Abstract

MÉTODOS E SISTEMAS PARA PREVISÃO DO RISCO DE SILENCIAMENTO DE TRANSGENE. A presente invenção baseia-se no uso dos níveis de metilação de H3K9me2 em genomas de planta para prever o silenciamento do transgene, a estabilidade do transgene e/ou o nível de expressão do transgene. São fornecidos métodos e/ou sistemas para gerar mapas H3K9me2 de genoma completo e seu uso com um valor limite designado para prever o silenciamento de genes. Os métodos e/ou sistemas aqui fornecidos podem ser usados em configurações de alto rendimento para triagem de grande número de eventos transformados em um período de tempo relativamente curto em comparação com as tecnologias existentes.METHODS AND SYSTEMS FOR PREDICTING THE RISK OF TRANSGENE SILENCE. The present invention is based on the use of H3K9me2 methylation levels in plant genomes to predict transgene silencing, transgene stability and/or transgene expression level. Methods and/or systems for generating whole-genome H3K9me2 maps and their use with a designated threshold value to predict gene silencing are provided. The methods and/or systems provided herein can be used in high-throughput settings for screening large numbers of transformed events in a relatively short period of time compared to existing technologies.

Description

REFERÊNCIA CRUZADA A PEDIDOS RELACIONADOSCROSS REFERENCE TO RELATED ORDERS

[0001] Este pedido reivindica o benefício do Pedido de Patente Provisório N° de Série US 62/253,213, depositado em 10 de novembro de 2015.[0001] This application claims the benefit of Provisional Patent Application Serial No. US 62/253,213, filed on November 10, 2015.

FUNDAMENTOS DA INVENÇÃOBASICS OF THE INVENTION

[0002] O genoma de plantas, por exemplo, plantas de soja ou milho, foi transformado com sucesso com os transgenes nos anos 90. Nos últimos vinte anos, numerosas metodologias foram desenvolvidas para transformar o genoma de plantas, em que um transgene é integrado de forma estável no genoma de plantas. A evolução das metodologias de transformação de plantas resultou na capacidade de introduzir com sucesso um transgene compreendendo uma característica agronômica dentro do genoma de plantas. A introdução de resistência a insetos e características tolerantes a herbicidas nas plantas proporcionou aos produtores uma inovação tecnológica nova e conveniente para o controle de insetos e um amplo espectro de ervas daninhas, o que não tinha paralelo nos métodos de cultivo.[0002] The genome of plants, for example soybean or corn plants, was successfully transformed with transgenes in the 1990s. In the last twenty years, numerous methodologies have been developed to transform the genome of plants, in which a transgene is integrated stably in the plant genome. The evolution of plant transformation methodologies has resulted in the ability to successfully introduce a transgene comprising an agronomic trait into the plant genome. The introduction of insect resistance and herbicide tolerant traits in plants provided growers with a new and convenient technological innovation for controlling insects and a broad spectrum of weeds, which was unparalleled in cultivation methods.

[0003] Metodologias de transformação atuais dependem da inserção aleatória de transgenes dentro do genoma de plantas. Como os eventos transgênicos podem se integrar aleatoriamente dentro das sequências transcricionais dos genes, tais eventos podem interromper a expressão de características endógenas e alterar o crescimento e o desenvolvimento da planta. Além disso, os eventos transgênicos podem se integrar indiscriminadamente em locais do genoma que são suscetíveis ao silenciamento gênico, culminando na inibição reduzida ou completa da expressão do transgene na primeira ou nas gerações subsequentes de plantas transgênicas. Finalmente, a integração aleatória de transgenes no genoma da planta requer considerável esforço e custo na identificação da localização do evento transgênico e na seleção de eventos transgênicos que funcionam como planejados, sem impacto agronômico para a planta.[0003] Current transformation methodologies rely on the random insertion of transgenes into the plant genome. As transgenic events can integrate randomly within the transcriptional sequences of genes, such events can disrupt the expression of endogenous traits and alter plant growth and development. Furthermore, transgenic events can indiscriminately integrate into locations in the genome that are susceptible to gene silencing, culminating in reduced or complete inhibition of transgene expression in the first or subsequent generations of transgenic plants. Finally, the random integration of transgenes into the plant genome requires considerable effort and cost in identifying the location of the transgenic event and in selecting transgenic events that function as designed without agronomic impact to the plant.

[0004] Por conseguinte, existe a necessidade de invenções que sejam úteis para avaliar a eficácia dos sítios de integração do transgene para expressão gênica e/ou para prever o risco de silenciamento transgênico.[0004] Therefore, there is a need for inventions that are useful for evaluating the effectiveness of transgene integration sites for gene expression and/or for predicting the risk of transgene silencing.

SUMÁRIO DA INVENÇÃOSUMMARY OF THE INVENTION

[0005] Esta invenção está relacionada com métodos e sistemas para prever o risco de silenciamento de transgenes e/ou prever níveis de expressão de transgenes e/ou prever a estabilidade e/ou eficácia dos sítios de integração de transgenes. Em um aspecto, é fornecido um método para prever o risco de silenciamento de transgenes. O método compreende: (a) gerar dados de perfil de metilação/acetilação de histona no genoma de uma planta; (b) montar os dados do perfil de metilação/acetilação de histona da etapa (a) numa base de dados de metilação/acetilação de histona que mostra os números de pico dos perfis de metilação/acetilação de histona; (c) analisar sequências de pelo menos um sítio de inserção de transgenes; e (d) comparar as sequências do sítio de inserção do transgene da etapa (c) com a base de dados de metilação/acetilação de histona da etapa (b); em que (i) se o sítio de inserção do transgene cai no pico zero ou no pico um dos perfis de metilação/acetilação, não existe risco de silenciamento do transgene, ou (11) se o sítio de inserção do transgene cai no pico dois ou mais dos perfis de metilação/acetilação de histona, não existe risco significativo de silenciamento do transgene.[0005] This invention relates to methods and systems for predicting the risk of transgene silencing and/or predicting transgene expression levels and/or predicting the stability and/or effectiveness of transgene integration sites. In one aspect, a method for predicting the risk of transgene silencing is provided. The method comprises: (a) generating histone methylation/acetylation profile data on a plant genome; (b) assembling the histone methylation/acetylation profile data from step (a) into a histone methylation/acetylation database that shows the peak numbers of the histone methylation/acetylation profiles; (c) analyzing sequences of at least one transgene insertion site; and (d) comparing the transgene insertion site sequences from step (c) with the histone methylation/acetylation database from step (b); wherein (i) if the transgene insertion site falls into peak zero or peak one of the methylation/acetylation profiles, there is no risk of transgene silencing, or (11) if the transgene insertion site falls into peak two or more of histone methylation/acetylation profiles, there is no significant risk of transgene silencing.

[0006] Em uma modalidade, os dados do perfil de metilação/acetila- ção de histona são gerados utilizando um ensaio de sequenciamento de imunoprecipitação de cromatina (ChIP-seq). Noutra modalidade, os dados do perfil de metilação/acetilação de histona estão associados à metilação/acetilação selecionada do grupo consistindo em H3K4me2, H3K4me3, H3K9/14ac, H3K9me2, H3K9me3, H3K27me1, H3K27me3 e H4K20me3 e suas combinações. Noutra modalidade, os dados do perfil de metilação/acetilação de histona estão associados à metilação/ acetilação de histona selecionada do grupo consistindo em H3K9me2, H3K9me3, H3K27me1, H3K27me3 e H4K20me3 e suas combinações. Em outra modalidade, os dados do perfil de metilação/acetilação de histona estão associados à metilação de H3K9me2. Em outra modalidade, a planta é selecionada dentre soja, milho, canola, algodão, trigo e arroz. Em outra modalidade, as sequências do sítio de inserção de transgene são obtidas por sequenciamento direto.[0006] In one embodiment, histone methylation/acetylation profile data is generated using a chromatin immunoprecipitation sequencing (ChIP-seq) assay. In another embodiment, histone methylation/acetylation profile data is associated with methylation/acetylation selected from the group consisting of H3K4me2, H3K4me3, H3K9/14ac, H3K9me2, H3K9me3, H3K27me1, H3K27me3, and H4K20me3 and combinations thereof. In another embodiment, the histone methylation/acetylation profile data is associated with histone methylation/acetylation selected from the group consisting of H3K9me2, H3K9me3, H3K27me1, H3K27me3 and H4K20me3 and combinations thereof. In another embodiment, histone methylation/acetylation profile data is associated with H3K9me2 methylation. In another embodiment, the plant is selected from soybeans, corn, canola, cotton, wheat and rice. In another embodiment, transgene insertion site sequences are obtained by direct sequencing.

[0007] Em outro aspecto, é fornecido um sistema informatizado para prever o risco de silenciamento transgênico. O sistema compreende: (a) um banco de dados de metilação/acetilação de histona mostrando os números de pico dos perfis de metilação/acetilação de histonas no genoma de uma planta; (b) um módulo de entrada em que um usuário insere sequências de pelo menos um sítio de inserção do transgene; e (c) um módulo de saída mostra a previsão do risco de silenciamento transgênico, em que a previsão é baseada na comparação das sequências introduzidas da Etapa (b) e dos perfis de metilação/acetilação de histona da Etapa (a).[0007] In another aspect, a computerized system is provided for predicting the risk of transgenic silencing. The system comprises: (a) a histone methylation/acetylation database showing the peak numbers of histone methylation/acetylation profiles in a plant genome; (b) an input module into which a user inputs sequences from at least one transgene insertion site; and (c) an output module shows the prediction of transgene silencing risk, wherein the prediction is based on the comparison of the introduced sequences from Step (b) and the histone methylation/acetylation profiles from Step (a).

[0008] Em uma modalidade, os dados do perfil de metilação/acetila- ção de histona são gerados utilizando um ensaio de sequenciamento de imunoprecipitação de cromatina (ChIP-seq). Em outra modalidade, os dados do perfil de metilação/acetilação de histona estão associados à metilação/acetilação selecionada do grupo consistindo em H3K4me2, H3K4me3, H3K9/14ac, H3K9me2, H3K9me3, H3K27me1, H3K27me3 e H4K20me3 e suas combinações. Em outra modalidade, os dados do perfil de metilação/acetilação de histona estão associados à metilação/acetilação de histona selecionada do grupo consistindo em H3K9me2, H3K9me3, H3K27me1, H3K27me3 e H4K20me3 e suas combinações. Em outra modalidade, os dados do perfil de metilação/acetilação de histona estão associados à metilação de H3K9me2. Em outra modalidade, a planta é selecionada dentre soja, milho, canola, algodão, trigo e arroz. Em outra modalidade, as sequências do sítio de inserção de transgene são obtidas por sequenciamento direto.[0008] In one embodiment, histone methylation/acetylation profile data is generated using a chromatin immunoprecipitation sequencing (ChIP-seq) assay. In another embodiment, histone methylation/acetylation profile data is associated with methylation/acetylation selected from the group consisting of H3K4me2, H3K4me3, H3K9/14ac, H3K9me2, H3K9me3, H3K27me1, H3K27me3, and H4K20me3 and combinations thereof. In another embodiment, the histone methylation/acetylation profile data is associated with histone methylation/acetylation selected from the group consisting of H3K9me2, H3K9me3, H3K27me1, H3K27me3, and H4K20me3 and combinations thereof. In another embodiment, histone methylation/acetylation profile data is associated with H3K9me2 methylation. In another embodiment, the plant is selected from soybeans, corn, canola, cotton, wheat and rice. In another embodiment, transgene insertion site sequences are obtained by direct sequencing.

[0009] Em outro aspecto, é fornecido um processo para uso em um sistema computadorizado para prever o risco de silenciamento transgênico. O processo compreende: (a) introdução de sequências de pelo menos um sítio de inserção de transgene no sistema aqui fornecido por um usuário; e (b) receber a saída do sistema aqui proporcionado para a previsão do risco de silenciamento transgênico, em que a previsão baseia-se na comparação das sequências introduzidas do sítio de inserção do transgene e dos perfis de metilação/acetilação de histona dentro do sistema.[0009] In another aspect, a process is provided for use in a computerized system to predict the risk of transgene silencing. The process comprises: (a) introducing sequences of at least one transgene insertion site into the system provided herein by a user; and (b) receiving output from the system provided herein for predicting the risk of transgene silencing, wherein the prediction is based on comparison of introduced transgene insertion site sequences and histone methylation/acetylation profiles within the system .

BREVE DESCRIÇÃO DOS DESENHOSBRIEF DESCRIPTION OF THE DRAWINGS

[00010] A Figura 1 mostra a abundância de H3K9me2 dentro das características do gene da soja (corpo do gene, 2kb a montante, 1kb a jusante) como uma função de diferentes categorias de expressão (alta, média alta, média, média baixa, baixa).[00010] Figure 1 shows the abundance of H3K9me2 within the soybean gene traits (gene body, 2kb upstream, 1kb downstream) as a function of different expression categories (high, medium high, medium, medium low, low).

DESCRIÇÃO DETALHADA DA INVENÇÃODETAILED DESCRIPTION OF THE INVENTION

[00011] A presente invenção se baseia na utilização dos níveis de metilação de H3K9me2 em genomas de plantas para prever o silenciamento do transgene, a estabilidade do transgene e/ou o nível de expressão do transgene. São fornecidos métodos e/ou sistemas para gerar mapas H3K9me2 de genoma completo e seu uso com um valor limite designado para prever o silenciamento de genes. Os métodos e/ou sistemas aqui fornecidos podem ser usados em configurações de alto rendimento para triagem de grande número de eventos transformados em um período de tempo relativamente curto em comparação com as tecnologias existentes.[00011] The present invention is based on the use of H3K9me2 methylation levels in plant genomes to predict transgene silencing, transgene stability and/or transgene expression level. Methods and/or systems for generating whole-genome H3K9me2 maps and their use with a designated threshold value to predict gene silencing are provided. The methods and/or systems provided herein can be used in high-throughput settings for screening large numbers of transformed events in a relatively short period of time compared to existing technologies.

[00012] O desempenho do transgene e a estabilidade hereditária do transgene são importantes para o sucesso dos conceitos de produtos de melhoramento genético. Várias abordagens foram utilizadas no passado para avaliar a expressão e desempenho de transgenes, incluindo técnicas de análise de expressão quantitativa, incluindo, por exemplo, RT-PCR, metilação de DNA e teste de estabilidade transgeracional. Essas abordagens demandam tempo e recursos durante o processo de desenvolvimento de melhoramentos genéticos e exigem várias gerações de rastreamento de eventos transgênicos e poderiam levar potencialmente à escolha de eventos transgênicos ruins para promover o desenvolvimento de produtos a jusante.[00012] Transgene performance and hereditary stability of the transgene are important to the success of genetic improvement product concepts. Various approaches have been used in the past to evaluate transgene expression and performance, including quantitative expression analysis techniques, including, for example, RT-PCR, DNA methylation, and transgenerational stability testing. These approaches are time and resource intensive during the genetic improvement development process and require multiple generations of tracking transgenic events and could potentially lead to the cherry-picking of poor transgenic events to promote the development of downstream products.

[00013] Marcas epigenéticas se referem a modificações químicas mediadas por enzimas do DNA e de suas proteínas de cromatina associadas. Tipicamente, as marcas epigenéticas não alteram a sequência primária do DNA, mas são importantes na regulação da função do genoma. Modificações no DNA (incluindo a metilação da citosina, modificações pós-traducionais da cauda das histonas e o núcleo das histonas e o posicionamento dos nucleossomos), podem influenciar o estado transcricional e outros aspectos funcionais da cromatina. As modificações das histonas são um sistema celular que envolve mecanismos reguladores da transcrição. Ambos as marcas de histonas do tipo ativação (por exemplo, H3K4me3 e H3K9/14ac) e do tipo repressivo (por exemplo, H3K27me3, H3K9me3, H3K9me2 e H4K20me3) foram previamente identificadas. Em particular, a metilação de uma lisina específica (K9) na histona H3, comumente conhecida como H3K9me2, foi caracterizada como uma marca epigenética indicando cromatina fechada ou repressão transcricional em escala genômica. São fornecidos métodos e sistemas para o uso de H3K9me2 como uma ferramenta diagnóstica para entender o estado da cromatina da localização genômica em torno de um transgene integrado e prever o risco potencial de silenciamento gênico em eventos transgênicos. A aplicabilidade dos métodos e sistemas fornecidos inclui, por exemplo, ordenação ou seleção de eventos no processo de desenvolvimento de melhoramentos genéticos. Especificamente, os dados para o perfilamento de H3K9me2 em todo o genoma em raízes e brotos de soja são fornecidos como exemplo. Em algumas modalidades, o nível de metilação de H3K9me2 no locus de um sítio de inserção de transgene pode ser utilizado para identificar/prever eventos com uma maior probabilidade de expressão estável.[00013] Epigenetic marks refer to enzyme-mediated chemical modifications of DNA and its associated chromatin proteins. Typically, epigenetic marks do not alter the primary sequence of DNA, but are important in regulating genome function. Modifications to DNA (including cytosine methylation, post-translational modifications of the histone tail and histone core, and nucleosome positioning), can influence the transcriptional state and other functional aspects of chromatin. Histone modifications are a cellular system that involves transcriptional regulatory mechanisms. Both activation-type (e.g., H3K4me3 and H3K9/14ac) and repressive-type (e.g., H3K27me3, H3K9me3, H3K9me2, and H4K20me3) histone marks have been previously identified. In particular, methylation of a specific lysine (K9) on histone H3, commonly known as H3K9me2, has been characterized as an epigenetic mark indicating closed chromatin or genome-scale transcriptional repression. Methods and systems are provided for using H3K9me2 as a diagnostic tool to understand the chromatin state of the genomic location around an integrated transgene and predict the potential risk of gene silencing in transgenic events. The applicability of the methods and systems provided includes, for example, ordering or selection of events in the process of developing genetic improvements. Specifically, data for genome-wide H3K9me2 profiling in soybean roots and shoots are provided as an example. In some embodiments, the level of H3K9me2 methylation at the locus of a transgene insertion site can be used to identify/predict events with a greater probability of stable expression.

[00014] Em algumas modalidades, os mapas de H3K9me2 do genoma completo são gerados para cada planta de cultura. Em alguma modalidade, um banco de dados é gerado de acordo com os mapas de H3K9me2 de todo o genoma. Em algumas modalidades, esse banco de dados pode ser usado para prever a estrutura da cromatina dentro do locus de nosso interesse de acordo com os métodos e/ou sistemas fornecidos.[00014] In some embodiments, whole genome H3K9me2 maps are generated for each crop plant. In some embodiment, a database is generated according to genome-wide H3K9me2 maps. In some embodiments, this database can be used to predict the chromatin structure within the locus of interest according to the methods and/or systems provided.

[00015] Salvo indicação contrária, todos os termos técnicos e científicos aqui utilizados possuem o mesmo significado que teriam para aquele versado na técnica da presente invenção. Os praticantes são particularmente direcionados para Sambrook et al. Clonagem Molecular: A Laboratory Manual (Second Edition), Cold Spring Harbor Press, Plainview, N.Y., 1989 e Ausubel FM et al. Current Protocols in Molecular Biology, John Wiley & Sons, New York, N.Y., 1993, para definições e termos da arte. Deve ser entendido que esta invenção não está limitada à metodologia, protocolos e reagentes específicos descritos, uma vez que estes podem variar.[00015] Unless otherwise indicated, all technical and scientific terms used herein have the same meaning as they would have for one skilled in the art of the present invention. Practitioners are particularly directed to Sambrook et al. Molecular Cloning: A Laboratory Manual (Second Edition), Cold Spring Harbor Press, Plainview, N.Y., 1989 and Ausubel FM et al. Current Protocols in Molecular Biology, John Wiley & Sons, New York, N.Y., 1993, for definitions and terms of the art. It should be understood that this invention is not limited to the specific methodology, protocols and reagents described, as these may vary.

[00016] Como usado aqui, a expressão "cerca de" se refere a maior ou menor do que o valor ou faixa de valores indicados por 10 por cento, mas não se destina a designar qualquer valor ou intervalo de valores para apenas esta definição mais ampla. Cada valor ou intervalo de valores precedidos pelo termo "cerca de" também pretende abranger a modalidade do valor absoluto declarado ou intervalo de valores[00016] As used herein, the expression "about" refers to greater or less than the value or range of values indicated by 10 percent, but is not intended to designate any value or range of values for just this definition further. broad. Each value or range of values preceded by the term "about" is also intended to encompass the modality of the declared absolute value or range of values

[00017] Como usado aqui, o termo "vetor" se refere a um pedaço de DNA, tipicamente de cadeia dupla, que pode ter inserido nele um pedaço de DNA estranho. O vetor pode ser, por exemplo, de origem plasmídica ou viral, que normalmente codifica um marcador ou transgenes selecionáveis ou triáveis. O vetor é usado para transportar o DNA estranho ou heterólogo para uma célula hospedeira adequada. Uma vez na célula hospedeira, o vetor pode replicar independentemente ou coincidir com o DNA cromossômico do hospedeiro. Alternativamente, o vetor pode direcionar a inserção do DNA estranho ou heterológo num cromossoma hospedeiro.[00017] As used herein, the term "vector" refers to a piece of DNA, typically double-stranded, which may have a piece of foreign DNA inserted into it. The vector can be, for example, of plasmid or viral origin, which normally encodes a selectable or screenable marker or transgenes. The vector is used to transport the foreign or heterologous DNA into a suitable host cell. Once in the host cell, the vector can replicate independently or match the host's chromosomal DNA. Alternatively, the vector may direct the insertion of foreign or heterologous DNA into a host chromosome.

[00018] Como usado aqui, a expressão "vetor transgene" se refere a um vetor que contém um segmento inserido de DNA, o "transgene" que é transcrito em mRNA ou replicado como um RNA dentro de uma célula hospedeira. O termo "transgene" se refere não apenas à porção do DNA inserido que é convertida em RNA, mas também àquelas porções do vetor que são necessárias para a transcrição ou replicação do RNA. Um transgene compreende tipicamente um gene de interesse, mas não necessita necessariamente compreender uma sequência polinucleotídica que contenha uma estrutura de leitura aberta capaz de produzir uma proteína.[00018] As used herein, the term "transgene vector" refers to a vector that contains an inserted segment of DNA, the "transgene" that is transcribed into mRNA or replicated as an RNA within a host cell. The term "transgene" refers not only to the portion of the inserted DNA that is converted to RNA, but also to those portions of the vector that are necessary for RNA transcription or replication. A transgene typically comprises a gene of interest, but need not necessarily comprise a polynucleotide sequence that contains an open reading frame capable of producing a protein.

[00019] Como usado aqui, o termo "transformado" ou "transformação" se refere à introdução de DNA em uma célula. Os termos "transformante" ou "transgênico" referem-se a células de plantas, plantas e similares que foram transformadas ou passaram por um processo de transformação. O DNA introduzido é geralmente na forma de um vetor contendo um pedaço de DNA inserido.[00019] As used here, the term "transformed" or "transformation" refers to the introduction of DNA into a cell. The terms "transformant" or "transgenic" refer to plant cells, plants and the like that have been transformed or have undergone a transformation process. The introduced DNA is usually in the form of a vector containing an inserted piece of DNA.

[00020] Como usado aqui, a expressão "planta transgênica" se refere a uma planta cujo genoma foi alterado pela integração estável do DNA recombinante. Uma planta transgênica inclui uma planta regenerada a partir de uma célula vegetal originalmente transformada e plantas de progênies transgênicas de gerações posteriores ou cruzamentos de uma planta transformada.[00020] As used here, the expression "transgenic plant" refers to a plant whose genome has been altered by the stable integration of recombinant DNA. A transgenic plant includes a plant regenerated from an originally transformed plant cell and plants from transgenic progeny of later generations or crosses of a transformed plant.

[00021] Como usado aqui, a expressão "DNA recombinante" se refere a DNA que foi geneticamente modificado e construído fora de uma célula, incluindo DNA contendo DNA de ocorrência natural ou cDNA ou DNA sintético.[00021] As used herein, the term "recombinant DNA" refers to DNA that has been genetically modified and constructed outside a cell, including DNA containing naturally occurring DNA or cDNA or synthetic DNA.

[00022] Como usado aqui, a frase "marcador selecionável" ou "gene marcador selecionável" se refere a um gene que é opcionalmente utilizado em transformação de plantas para, por exemplo, proteger as células vegetais de um agente seletivo ou proporcionar resistência/tolerância a um agente seletivo. Apenas aquelas células ou plantas que recebem um marcador selecionável funcional são capazes de se dividir ou crescer sob condições com um agente seletivo. Exemplos de agentes seletivos podem incluir, por exemplo, antibióticos, incluindo espectinomicina, neomicina, canamicina, paromomicina, gentamicina e higromicina. Esses marcadores selecionáveis incluem o gene para neomicina fosfotransferase (npt II), que expressa uma enzima conferindo resistência ao antibiótico canamicina e genes para os antibióticos relacionados neomicina, paromomicina, gentamicina e G418, ou o gene para fosfotransferase de higromicina (hpt), que expressa uma enzima que confere resistência à higromicina. Outros genes marcadores selecionáveis podem incluir genes que codificam a resistência a herbicidas, incluindo Bar (resistência contra BASTA® (glufosinato de amônio), ou fosfinotricina (PPT)), acetolactato sintase (ALS, resistência contra inibidores como sulfoniluréias (SUs), imidazolinonas (IMIs), triazolopirimidinas (TPs), pirimidinil oxibenzoatos (POBs) e sulfonilamino carbonil triazolinonas que impedem a primeira etapa na síntese dos aminoácidos de cadeia ramificada), glifosato, 2,4- D e resistência ou sensibilidade a metais. A expressão "marcador positivo" se refere a plantas que foram transformadas para incluir um gene marcador selecionável.[00022] As used herein, the phrase "selectable marker" or "selectable marker gene" refers to a gene that is optionally used in plant transformation to, for example, protect plant cells from a selective agent or provide resistance/tolerance to a selective agent. Only those cells or plants that receive a functional selectable marker are capable of dividing or growing under conditions with a selective agent. Examples of selective agents may include, for example, antibiotics, including spectinomycin, neomycin, kanamycin, paromomycin, gentamicin and hygromycin. These selectable markers include the gene for neomycin phosphotransferase (npt II), which expresses an enzyme conferring resistance to the antibiotic kanamycin, and genes for the related antibiotics neomycin, paromomycin, gentamicin, and G418, or the gene for hygromycin phosphotransferase (hpt), which expresses an enzyme that confers resistance to hygromycin. Other selectable marker genes may include genes encoding herbicide resistance, including Bar (resistance against BASTA® (glufosinate ammonium), or phosphinothricin (PPT)), acetolactate synthase (ALS, resistance against inhibitors such as sulfonylureas (SUs), imidazolinones ( IMIs), triazolopyrimidines (TPs), pyrimidinyl oxybenzoates (POBs) and sulfonylamino carbonyl triazolinones that impede the first step in the synthesis of branched-chain amino acids), glyphosate, 2,4-D and metal resistance or sensitivity. The term "marker positive" refers to plants that have been transformed to include a selectable marker gene.

[00023] Vários marcadores selecionáveis ou detectáveis podem ser incorporados no vetor de expressão escolhido para permitir a identificação e seleção de plantas transformadas, ou transformantes. Muitos métodos estão disponíveis para confirmar a expressão de marcadores de seleção em plantas transformadas, incluindo, por exemplo, sequenciamento de DNA e PCR (reação em cadeia da polimerase), Southern blotting, RNA blotting, métodos imunológicos para detecção de uma proteína expressa a partir do vetor, por exemplo, proteína precipitada que medeia a resistência à fosfinotricina, ou outras proteínas, tais como genes repórter, ß-glucuronidase (GUS), luciferase, proteína verde fluorescente (GFP), DsRed, ß-galactosidase, cloranfenicol acetiltransferase (CAT), fosfatase alcalina e similares (Ver Sambrook, et al., Molecular Cloning: A Laboratory Manual, Third Edition, Cold Spring Harbor Press, N.Y., 2001, cujo conteúdo é incorporado aqui por referência em sua totalidade).[00023] Various selectable or detectable markers can be incorporated into the chosen expression vector to allow the identification and selection of transformed plants, or transformants. Many methods are available to confirm the expression of selection markers in transformed plants, including, for example, DNA sequencing and PCR (polymerase chain reaction), Southern blotting, RNA blotting, immunological methods for detecting a protein expressed from of the vector, for example, precipitated protein that mediates resistance to phosphinothricin, or other proteins, such as reporter genes, ß-glucuronidase (GUS), luciferase, green fluorescent protein (GFP), DsRed, ß-galactosidase, chloramphenicol acetyltransferase (CAT ), alkaline phosphatase and the like (See Sambrook, et al., Molecular Cloning: A Laboratory Manual, Third Edition, Cold Spring Harbor Press, N.Y., 2001, the contents of which are incorporated herein by reference in their entirety).

[00024] Genes de marcadores selecionáveis são utilizados para seleção de células ou tecidos transformados. Os genes de marcadores selecionáveis incluem genes que codificam resistência a antibióticos, tais como aqueles que codificam a neomicina fosfotransferase II (NEO) e higromicina fosfotransferase (HPT), bem como os genes que conferem resistência a compostos herbicidas. Os genes de resistência a herbicidas geralmente codificam uma proteína alvo modificada insensível ao herbicida ou uma enzima que degrada ou desintoxica o herbicida na planta antes deste agir. Por exemplo, a resistência ao glifosato foi obtida através do uso de genes que codificam enzimas alvo mutantes, 5-enolpiruvilchiquimato-3-fosfato sintase (EPSPS). Os genes e mutantes para EPSPS foram divulgados nas Patentes dos EUA Nos. 4.940.835, 5.188.642, 5.310.667, 5.633.435, 5.633.448 e 6.566.587, cujo conteúdo é incorporado por referência na sua totalidade. A resistência ao glufosinato de amônio, bromoxinil e 2,4- diclorofenoxiacetato (2,4-D) foi obtida utilizando genes bacterianos que codificam fosfinotricina acetiltransferase, uma nitrilase, ou uma 2,4- diclorofenoxiacetato monooxigenase, que desintoxica os respectivos herbicidas. As enzimas/genes para resistência/tolerância a glufosinato foram divulgados nas Patentes dos EUA Nos. 5.273.894, 5.276.268, 5.550.318 e 5.561.236, cujo conteúdo é incorporado por referência na sua totalidade. As enzimas/genes para resistência a 2,4-D foram anteriormente divulgadas nas Patentes dos EUA Nos. 6.100.446 e 6.153.401, bem como nos pedidos de patente dos EUA 2009/0093366 (AAD-1) e WO 2007/053482 (AAD-12), cujos conteúdos são aqui incorporados por referência na sua totalidade. As enzimas/genes para a nitrilase foram divulgadas anteriormente nas Patentes dos EUA Nos. 4.810.648, cujo conteúdo é incorporado por referência na sua totalidade.[00024] Selectable marker genes are used for selection of transformed cells or tissues. Selectable marker genes include genes encoding antibiotic resistance, such as those encoding neomycin phosphotransferase II (NEO) and hygromycin phosphotransferase (HPT), as well as genes that confer resistance to herbicidal compounds. Herbicide resistance genes generally encode a modified herbicide-insensitive target protein or an enzyme that degrades or detoxifies the herbicide in the plant before it acts. For example, glyphosate resistance was achieved through the use of genes encoding mutant target enzymes, 5-enolpyruvylshikimate-3-phosphate synthase (EPSPS). The genes and mutants for EPSPS have been disclosed in US Patent Nos. 4,940,835, 5,188,642, 5,310,667, 5,633,435, 5,633,448 and 6,566,587, the contents of which are incorporated by reference in their entirety. Resistance to glufosinate ammonium, bromoxynil and 2,4-dichlorophenoxyacetate (2,4-D) was obtained using bacterial genes encoding phosphinothricin acetyltransferase, a nitrilase, or a 2,4-dichlorophenoxyacetate monooxygenase, which detoxifies the respective herbicides. Enzymes/genes for glufosinate resistance/tolerance have been disclosed in US Patent Nos. 5,273,894, 5,276,268, 5,550,318 and 5,561,236, the contents of which are incorporated by reference in their entirety. Enzymes/genes for 2,4-D resistance have previously been disclosed in U.S. Patent Nos. 6,100,446 and 6,153,401, as well as US patent applications 2009/0093366 (AAD-1) and WO 2007/053482 (AAD-12), the contents of which are incorporated herein by reference in their entirety. Enzymes/genes for nitrilase have been previously disclosed in U.S. Patent Nos. 4,810,648, the contents of which are incorporated by reference in their entirety.

[00025] Outros herbicidas podem inibir o ponto de crescimento ou meristema, incluindo imidazolinona ou sulfonilureia, e os genes para resistência/tolerância da acetohidroxiácido sintase (AHAS) e acetolactato sintase (ALS) para esses herbicidas foram descritos. Os genes e mutantes para AHAS e mutantes foram divulgados nas Patentes dos EUA Nos. 4.761.373, 5.304.732, 5.331.107, 5.853.973 e 5.928.937, cujos conteúdos são incorporados por referência na sua totalidade. Os genes e mutantes para ALS foram divulgados nas Patentes dos EUA Nos. 5.013.659 e 5.141.870, cujo conteúdo é incorporado por referência na sua totalidade.[00025] Other herbicides can inhibit the growth point or meristem, including imidazolinone or sulfonylurea, and genes for acetohydroxy acid synthase (AHAS) and acetolactate synthase (ALS) resistance/tolerance to these herbicides have been described. The genes and mutants for AHAS and mutants have been disclosed in U.S. Patent Nos. 4,761,373, 5,304,732, 5,331,107, 5,853,973 and 5,928,937, the contents of which are incorporated by reference in their entirety. The genes and mutants for ALS have been disclosed in US Patent Nos. 5,013,659 and 5,141,870, the contents of which are incorporated by reference in their entirety.

[00026] Os genes de resistência ao glifosato incluem genes mutantes da 5-enolpiruvilchiquimato-3-fosfato sintase (EPSPs) (via introdução de ácidos nucleicos recombinantes e/ou várias formas de mutagênese in vivo de genes EPSPs nativos), genes aroA e genes da glifosato acetil transferase (GAT), respectivamente). Genes de resistência para outros compostos fosfono incluem glufosinato (genes de fosfinotricina acetil transferase (PAT) de espécies de Streptomyces, incluindo Streptomyces hygroscopicus e Streptomyces viridichromogenes) e ácidos piridinoxi ou fenoxipropriônicos e ciclohexonas (genes codificadores de inibidores da ACCase). Os genes de resistência/tolerância a herbicidas da acetil coenzima A carboxilase (ACCase) foram descritos nas Patentes dos EUA 5.162.602 e 5.498.544, cujos conteúdos são incorporados por referência na sua totalidade.[00026] Glyphosate resistance genes include mutant 5-enolpyruvylshikimate-3-phosphate synthase (EPSPs) genes (via introduction of recombinant nucleic acids and/or various forms of in vivo mutagenesis of native EPSPs genes), aroA genes and glyphosate acetyl transferase (GAT), respectively). Resistance genes for other phosphono compounds include glufosinate (phosphinothricin acetyl transferase (PAT) genes from Streptomyces species, including Streptomyces hygroscopicus and Streptomyces viridichromogenes) and pyridinoxy or phenoxyproprionic acids and cyclohexones (genes encoding ACCase inhibitors). Acetyl coenzyme A carboxylase (ACCase) herbicide resistance/tolerance genes have been described in US Patents 5,162,602 and 5,498,544, the contents of which are incorporated by reference in their entirety.

[00027] Uma molécula de DNA codificando um gene aroA mutante pode ser obtida sob o número de acesso da ATCC 39256 e a sequência de nucleotídeos do gene mutante é descrita na Pat. dos EUA No. 4.769.061 para Comai, Pedido de Patente Europeia N° 0 333 033 para Kumada et ale Pat. dos EUA No. 4.975.374 para Goodman et al., divulgando sequências nucleotídicas de genes de glutamina sintetase que conferem resistência a herbicidas, tais como L-fosfinotricina. A sequência nucleotídica de um gene PAT é fornecida no pedido europeu N° 0 242 246 para Leemans et al. Também DeGreef et al., Bio/Technology 7:61 (1989), descreve a produção de plantas transgênicas que expressam genes de barra quimérica que codificam para a atividade de PAT. Exemplos de genes que conferem resistência a ácidos fenoxi propiônicos e ciclohexonas, incluindo sethoxydim e haloxyfop, são os genes Acc1-S1, Acc1-S2 e Acc1-S3 descritos por Marshall et al., Theon. Appl. Genet. 83:435 (1992). Os genes GAT capazes de conferir resistência ao glifosato são descritos em WO 2005012515, para Castle et al. Os genes que conferem resistência a herbicidas 2,4-D, fop e piridiloxi auxina são descritos em WO 2005107437 e no pedido de patente dos EUA No de Série 11/587.893.[00027] A DNA molecule encoding a mutant aroA gene can be obtained under ATCC accession number 39256 and the nucleotide sequence of the mutant gene is described in Pat. US Patent No. 4,769,061 to Comai, European Patent Application No. 0,333,033 to Kumada et al. Pat. US No. 4,975,374 to Goodman et al., disclosing nucleotide sequences of glutamine synthetase genes that confer resistance to herbicides, such as L-phosphinothricin. The nucleotide sequence of a PAT gene is provided in European application No. 0 242 246 to Leemans et al. Also DeGreef et al., Bio/Technology 7:61 (1989), describes the production of transgenic plants that express chimeric slash genes encoding PAT activity. Examples of genes that confer resistance to phenoxy propionic acids and cyclohexones, including sethoxydim and haloxyfop, are the Acc1-S1, Acc1-S2 and Acc1-S3 genes described by Marshall et al., Theon. Appl. Genet. 83:435 (1992). GAT genes capable of conferring resistance to glyphosate are described in WO 2005012515, to Castle et al. Genes that confer resistance to 2,4-D, fop and pyridyloxy auxin herbicides are described in WO 2005107437 and US Patent Application Serial No. 11/587,893.

[00028] Outros herbicidas podem inibir a fotossíntese, incluindo triazina (genes psbA e 1s+) ou benzonitrila (gene nitrilase). Przibila et al., Plant Cell 3: 169 (1991), descreve a transformação de Chlamydomonas com plasmídeos que codificam genes psbA mutantes. As sequências nucleotídicas para genes da nitrilase são divulgadas na Pat. dos EUA N° 4.810.648 para Stalker e as moléculas de DNA contendo estes genes estão disponíveis sob os N°s de Acesso ATCC 53435, 67441 e 67442. A clonagem e expressão de DNA que codifica uma glutationa S-transferase é descrita por Hayes et al., Biochem. J. 285:173 (1992).[00028] Other herbicides can inhibit photosynthesis, including triazine (psbA and 1s+ genes) or benzonitrile (nitrilase gene). Przibila et al., Plant Cell 3: 169 (1991), describe the transformation of Chlamydomonas with plasmids encoding mutant psbA genes. The nucleotide sequences for nitrilase genes are disclosed in U.S. Pat. US No. 4,810,648 for Stalker and DNA molecules containing these genes are available under ATCC Accession Nos. 53435, 67441 and 67442. Cloning and expression of DNA encoding a glutathione S-transferase is described by Hayes et al., Biochem. J. 285:173 (1992).

[00029] Para fins da presente invenção, os genes marcadores selecionáveis incluem, mas não se limitam a, genes que codificam: neomicina fosfotransferase II (Fraley et al. (1986) CRC Critical Reviews in Plant Science, 4:1-25); cianamida hidratase (Maier-Greiner et al. (1991) Proc. Natl. Acad. Sci. USA, 88: 4250-4264); aspartato quinase; diidrodipicolinato sintase (Perl et al. (1993) Bio/Technology, 11: 715718); tripartofano decarboxilase (Goddijn et al. (1993) Plant Mol. Bi. 22:907-912); di-hidrodipicolinato sintase e aspartade quinase dessensibilizada (Perl et al. (1993) Bio/Technology, 11:715-718); gene de barra (Toki et al. (1992) Plant Physiol., 100:1503-1507 e Meagher et al. (1996) e Crop Sci., 36: 1367); tripartofano decarboxilase (Goddijn et al. (1993) Plant Mol. Biol. 22:907-912); neomicina fosfotransferase (NEO) (Southern et al. (1982) J. Mol. Appl. Gen. 1: 327; higromicina fosfotransferase (HPT ou HYG) (Shimizu et al. (1986) Mol. Cell Biol., 6:1074); di-hidrofolato redutase (DHFR) (Kwok et al. (1986) PNAS USA 4552); fosfinotricina acetiltransferase (DeBlock et al. (1987) EMBO J., 6:2513); dehalogenase do ácido 2,2-dicloropropiônico (Buchanan- Wollatron et al. (1989) J. Cell. Biochem. 13D:330); aceto-hidroxiácido sintase (Anderson et alPatente dos EUA N° 4.761.373; Haughn et al. (1988) Mol. Genet Genet. 221:266); 5-enolpiruvil-shiquimato-fosfato sintase (aroA) (Comai et al. (1985) Nature 317:741); haloarilnitrilase (Stalker et al., pedido PCT publicado WO87/04181); acetil-coenzima A carboxilase (Parker et al. (1990) Plant Physiol. 92:1220); di- hidropteroato sintase (sul I) (Guerineau et al. (1990) Plant Mol. Biol. 15:127); e polipeptídeo fotossintético II de 32 kD (psbA) (Hirschberg et al. (1983) Science, 222: 1346).[00029] For purposes of the present invention, selectable marker genes include, but are not limited to, genes encoding: neomycin phosphotransferase II (Fraley et al. (1986) CRC Critical Reviews in Plant Science, 4:1-25); cyanamide hydratase (Maier-Greiner et al. (1991) Proc. Natl. Acad. Sci. USA, 88: 4250-4264); aspartate kinase; dihydrodipicolinate synthase (Perl et al. (1993) Bio/Technology, 11: 715718); tripartophane decarboxylase (Goddijn et al. (1993) Plant Mol. Bi. 22:907-912); dihydrodipicolinate synthase and desensitized aspartade kinase (Perl et al. (1993) Bio/Technology, 11:715-718); bar gene (Toki et al. (1992) Plant Physiol., 100:1503-1507 and Meagher et al. (1996) and Crop Sci., 36: 1367); tripartophane decarboxylase (Goddijn et al. (1993) Plant Mol. Biol. 22:907-912); neomycin phosphotransferase (NEO) (Southern et al. (1982) J. Mol. Appl. Gen. 1: 327; hygromycin phosphotransferase (HPT or HYG) (Shimizu et al. (1986) Mol. Cell Biol., 6:1074) ; dihydrofolate reductase (DHFR) (Kwok et al. (1986) PNAS USA 4552); phosphinothricin acetyltransferase (DeBlock et al. (1987) EMBO J., 6:2513); 2,2-dichloropropionic acid dehalogenase (Buchanan - Wollatron et al. (1989) J. Cell. Biochem. 13D:330); acetohydroxyacid synthase (Anderson et al. US Patent No. 4,761,373; Haughn et al. (1988) Mol. Genet Genet. 221:266 ); 5-enolpyruvyl-shikimate-phosphate synthase (aroA) (Comai et al. (1985) Nature 317:741); haloarylnitrilase (Stalker et al., published PCT application WO87/04181); acetyl-coenzyme A carboxylase (Parker et al. al. (1990) Plant Physiol. 92:1220); dihydropteroate synthase (sul I) (Guerineau et al. (1990) Plant Mol. Biol. 15:127); and 32 kD photosynthetic polypeptide II (psbA) ( Hirschberg et al. (1983) Science, 222: 1346).

[00030] Também estão incluídos os genes que codificam a resistência a: cloranfenicol (Herrera-Estrella et al. (1983) EMBO J., 2:987-992); metotrexato (Herrera-Estrella et al. (1983) Nature, 303:209213; Meijer et al. (1991) Plant Mol Bio, 16:807-820 (1991); higromicina (Waldron et al. (1985) Plant Mol. Biol. 5:103-108; Zhijian et al. (1995) Plant Science, 108: 219-227 e Meijer et al. (1991) Plant Mol. Bio 16:807820); estreptomicina (Jones et al. (1987) Mol. Gen. Genet., 210:86-91); espectinomicina (Bretagne-Sagnard et al. (1996) Transgenic Res., 5:131-137); bleomicina (Hille et al. (1986) Plant Mol. Biol. 7:171-176); sulfonamida (Guerineau et al. (1990) Plant Mol. Bio. 15:127-136); bromoxinil (Stalker et al. (1988) Science, 242:419-423); 2,4-D (Streber et al. (1989) Bio/Technology, 7: 811-816); glifosato (Shaw et al. (1986) Science, 233:478-481); e fosfinotricina (DeBlock et al. (1987) EMBO J., 6:2513-2518). Todas as referências citadas na divulgação são aqui incorporadas por referência na sua totalidade, salvo indicação contrária.[00030] Also included are genes that encode resistance to: chloramphenicol (Herrera-Estrella et al. (1983) EMBO J., 2:987-992); methotrexate (Herrera-Estrella et al. (1983) Nature, 303:209213; Meijer et al. (1991) Plant Mol Bio, 16:807-820 (1991); hygromycin (Waldron et al. (1985) Plant Mol. Biol 5:103-108; Zhijian et al. (1995) Plant Science, 108: 219-227 and Meijer et al. (1991) Plant Mol. Bio 16:807820); streptomycin (Jones et al. (1987) Mol. Gen. Genet., 210:86-91); spectinomycin (Bretagne-Sagnard et al. (1996) Transgenic Res., 5:131-137); bleomycin (Hille et al. (1986) Plant Mol. Biol. 7: 171-176); sulfonamide (Guerineau et al. (1990) Plant Mol. Bio. 15:127-136); bromoxynil (Stalker et al. (1988) Science, 242:419-423); 2,4-D ( Streber et al. (1989) Bio/Technology, 7: 811-816); glyphosate (Shaw et al. (1986) Science, 233:478-481); and phosphinothricin (DeBlock et al. (1987) EMBO J., 6:2513-2518). All references cited in the disclosure are incorporated herein by reference in their entirety, unless otherwise indicated.

[00031] A lista acima de genes marcadores e repórteres selecionáveis não pretende ser limitante. Qualquer gene repórter ou de marcador selecionável está abrangido pela presente invenção. Se necessário, esses genes podem ser sequenciados por métodos conhecidos na técnica.[00031] The above list of selectable marker and reporter genes is not intended to be limiting. Any reporter or selectable marker gene is encompassed by the present invention. If necessary, these genes can be sequenced by methods known in the art.

[00032] Os genes marcador selecionável e repórter são sintetizados para expressão ótima na planta. Ou seja, a sequência codificadora do gene foi modificada para aumentar a expressão nas plantas. O gene marcador sintético é projetado para ser expresso em plantas em um nível mais alto, resultando em maior eficiência de transformação. Métodos para otimização sintética de genes estão disponíveis na técnica. De fato, vários genes foram otimizados para aumentar a expressão do produto gênico nas plantas.[00032] Selectable marker and reporter genes are synthesized for optimal expression in the plant. That is, the gene's coding sequence was modified to increase expression in plants. The synthetic marker gene is designed to be expressed in plants at a higher level, resulting in greater transformation efficiency. Methods for synthetic optimization of genes are available in the art. In fact, several genes have been optimized to increase gene product expression in plants.

[00033] A sequência do gene marcador pode ser otimizada para expressão em uma espécie vegetal particular ou, alternativamente, pode ser modificada para expressão ótima em famílias de plantas. Os códons vegetais preferenciais podem ser determinados a partir dos códons de frequência mais alta nas proteínas expressas em maior quantidade nas espécies vegetais específicas de interesse. Ver, por exemplo, EPA 0359472; EPA 0385962; WO 91/16432; Perlak et al. (1991) Proc. Natl. Acad. Sci. USA, 88:3324-3328; e Murray et al. (1989) Nucleic Acids Research, 17: 477-498; Pat. dos EUA N° 5.380.831; e Pat. dos EUA N° 5.436.391, aqui incorporadas por referência. Desta maneira, as sequências nucleotídicas podem ser otimizadas para expressão em qualquer planta. É reconhecido que toda ou qualquer parte da sequência do gene pode ser otimizada ou sintética. Ou seja, sequências totalmente otimizadas ou parcialmente otimizadas também podem ser usadas.[00033] The marker gene sequence can be optimized for expression in a particular plant species or, alternatively, it can be modified for optimal expression in plant families. Preferred plant codons can be determined from the highest frequency codons in the proteins expressed in greatest quantities in the specific plant species of interest. See, for example, EPA 0359472; EPA 0385962; WO 91/16432; Perlak et al. (1991) Proc. Natl. academic Sci. USA, 88:3324-3328; and Murray et al. (1989) Nucleic Acids Research, 17: 477-498; Pat. US No. 5,380,831; and Pat. No. 5,436,391, incorporated herein by reference. In this way, nucleotide sequences can be optimized for expression in any plant. It is recognized that all or any part of the gene sequence can be optimized or synthetic. That is, fully optimized or partially optimized sequences can also be used.

[00034] Além disso, várias estratégias de transformação utilizando o sistema de transformação mediado por Agrobacterium foram desenvolvidas. Por exemplo, a estratégia do vetor binário é baseada em um sistema de dois plasmídeos onde o T-DNA está em um plasmídeo diferente do resto do plasmídeo Ti. Em uma estratégia de cointegração, uma pequena porção do T-DNA é colocada no mesmo vetor que o gene estranho, cujo vetor recombina subsequentemente com o plasmídeo Ti.[00034] Furthermore, several transformation strategies using the Agrobacterium-mediated transformation system have been developed. For example, the binary vector strategy is based on a two-plasmid system where the T-DNA is on a different plasmid than the rest of the Ti plasmid. In a cointegration strategy, a small portion of the T-DNA is placed on the same vector than the foreign gene, whose vector subsequently recombines with the Ti plasmid.

[00035] Como usada aqui, a expressão "planta" inclui plantas dicotiledôneas e plantas de monocotiledôneas. Exemplos de plantas dicotiledôneas incluem tabaco, Arabidopsis, soja, tomate, mamão, canola, girassol, algodão, alfafa, batata, videira, guandu, ervilha, Brassica, grão de bico, beterraba, colza, melancia, melão, pimenta, amendoim, abóbora, rabanete, espinafre, abobrinha, brócolis, repolho, cenoura, couve-flor, aipo, couve chinesa, pepino, berinjela e alface. Exemplos de plantas monocotiledôneas incluem milho, arroz, trigo, cana-de-açúcar, cevada, centeio, sorgo, orquídeas, bambu, banana, tifa, lírios, aveia, cebola, painço e triticale.[00035] As used herein, the expression "plant" includes dicotyledonous plants and monocotyledonous plants. Examples of dicotyledonous plants include tobacco, Arabidopsis, soybean, tomato, papaya, canola, sunflower, cotton, alfalfa, potato, vine, pigeon pea, pea, Brassica, chickpea, beet, rapeseed, watermelon, melon, pepper, peanut, pumpkin , radish, spinach, zucchini, broccoli, cabbage, carrots, cauliflower, celery, bok choy, cucumber, eggplant and lettuce. Examples of monocot plants include corn, rice, wheat, sugar cane, barley, rye, sorghum, orchids, bamboo, banana, cattail, lilies, oats, onion, millet, and triticale.

[00036] Como usado aqui, o termo "planta" inclui uma planta inteira e qualquer descendente, célula, tecido ou parte de uma planta. O termo "partes de planta" inclui quaisquer parte(s) de uma planta, incluindo, por exemplo, e sem limitação: semente (incluindo semente madura e semente imatura), um corte de planta: uma célula vegetal; uma cultura de células vegetais; um órgão vegetal (por exemplo, pólen, embrião, flores, frutos, galhos, folhas, raízes, caules e explantes). Um tecido de planta ou órgão vegetal pode ser uma semente, calo ou qualquer outro grupo de células de plantas que é organizado em unidade estrutural ou funcional. Uma célula de planta ou cultura de tecidos pode ser capaz de regenerar uma planta contendo as características fisiológicas e morfológicas da planta a qual a célula ou tecido foi obtida e de regenerar uma planta significativamente com o mesmo genótipo da planta. Em contraste, algumas células de plantas não são capazes de ser regeneradas para produzir plantas. Células regeneráveis em uma célula vegetal ou cultura de tecidos podem ser embriões, protoplastos, células meristemáticas, calos, pólen, folhas, anteras, pontas de raízes, cabelos, flores, sementes, espigas, sabugo, cascas ou talos.[00036] As used herein, the term "plant" includes an entire plant and any descendant, cell, tissue or part of a plant. The term "plant parts" includes any part(s) of a plant, including, for example, and without limitation: seed (including mature seed and immature seed), a plant cutting: a plant cell; a plant cell culture; a plant organ (e.g. pollen, embryo, flowers, fruits, twigs, leaves, roots, stems and explants). A plant tissue or plant organ may be a seed, callus, or any other group of plant cells that is organized into a structural or functional unit. A plant cell or tissue culture may be capable of regenerating a plant containing the physiological and morphological characteristics of the plant from which the cell or tissue was obtained and of regenerating a plant with significantly the same plant genotype. In contrast, some plant cells are not capable of being regenerated to produce plants. Regenerable cells in a plant cell or tissue culture may be embryos, protoplasts, meristematic cells, callus, pollen, leaves, anthers, root tips, hairs, flowers, seeds, cobs, cobs, barks or stalks.

[00037] Partes de plantas incluem partes que podem ser colhidas e partes úteis para propagação de plantas de progênie. Partes de plantas úteis para propagação incluem, por exemplo, e sem limitação: semente; fruto; um corte; uma muda; um bulbo e um rizoma. Uma parte que pode ser colhida de uma planta pode ser qualquer parte útil de uma planta, incluindo, por exemplo, e sem limitação: flor; pólen; muda; bulbo; folha; caule; fruto; semente e raiz.[00037] Parts of plants include parts that can be harvested and parts useful for propagating progeny plants. Plant parts useful for propagation include, for example, and without limitation: seed; fruit; a cut; a seedling; a bulb and a rhizome. A harvestable part of a plant may be any useful part of a plant, including, for example, and without limitation: flower; pollen; changes; bulb; sheet; stalk; fruit; seed and root.

[00038] Como usado aqui, a expressão "célula vegetal descrita" ou "célula vegetal transformada" se refere a uma célula vegetal que é transformada com DNA recombinante, não natural, integrado de forma estável, por exemplo, por transformação mediada por Agrobacterium ou por bombardeamento utilizando micropartículas revestidas com DNA recombinante ou outros meios. Uma célula vegetal desta invenção pode ser uma célula vegetal originalmente transformada que existe como um microrganismo ou como uma célula vegetal progênica que é regenerada em tecido diferenciado, por exemplo, em uma planta transgênica com DNA recombinante não natural, integrado de forma estável, ou semente ou pólen derivado de uma planta transgênica progênica.[00038] As used herein, the expression "described plant cell" or "transformed plant cell" refers to a plant cell that is transformed with stably integrated, non-natural, recombinant DNA, for example, by Agrobacterium-mediated transformation or by bombardment using microparticles coated with recombinant DNA or other means. A plant cell of this invention may be an originally transformed plant cell that exists as a microorganism or as a progenic plant cell that is regenerated into differentiated tissue, for example, in a transgenic plant with stably integrated non-natural recombinant DNA or seed. or pollen derived from a progenic transgenic plant.

[00039] Como usado aqui, a expressão "sequência de consenso" se refere a uma sequência artificial de aminoácidos em uma região conservada de um alinhamento de sequências de aminoácidos de proteínas homólogas, por exemplo, conforme determinado por um alinhamento CLUSTALW da sequência de aminoácidos de proteínas homólogas (funcionais).[00039] As used herein, the term "consensus sequence" refers to an artificial amino acid sequence in a conserved region of an alignment of amino acid sequences of homologous proteins, for example, as determined by a CLUSTALW alignment of the amino acid sequence of homologous (functional) proteins.

[00040] Como usado aqui, o termo "homólogo" se refere a um ácido nucleico ou uma proteína em um grupo de proteínas que desempenham a mesma função biológica, por exemplo, proteínas que pertencem à mesma família de proteínas ou ácidos nucleicos semelhantes que proporcionam uma característica aumentada comum em plantas transgênicas da presente invenção. Homólogos são expressos por genes homólogos. Com referência a genes homólogos, os homólogos incluem ortólogos, ou seja, genes expressos em diferentes espécies que evoluíram a partir de genes ancestrais comuns por especiação e codificam proteínas que retêm a mesma função, mas não incluem parálogos, ou seja, genes que estão relacionados por duplicação, mas evoluíram para codificar proteínas com diferentes funções. Genes homólogos incluem alelos que ocorrem naturalmente e variantes criadas artificialmente. A degeneração do código genético proporciona a possibilidade de substituir pelo menos uma base da sequência de codificação da proteína de um gene por uma base diferente sem fazer com que a sequência de aminoácidos do polipeptídeo produzido a partir do gene seja alterada. Quando alinhados de forma ideal, os genes homólogos têm pelo menos 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% ou mais de identidade de sequência ao longo de todo o comprimento do gene identificado como estando associado a conferir uma característica aumentada quando expresso em células vegetais. Num aspecto da invenção, os genes homólogos têm uma semelhança de sequência de ácido nucleico ou aminoácido que tem pelo menos 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade com uma sequência de consenso de proteínas, nucleotídeos e homólogos divulgados aqui.[00040] As used herein, the term "homolog" refers to a nucleic acid or a protein in a group of proteins that perform the same biological function, for example, proteins that belong to the same protein family or similar nucleic acids that provide an increased characteristic common in transgenic plants of the present invention. Homologs are expressed by homologous genes. With reference to homologous genes, homologs include orthologs, that is, genes expressed in different species that evolved from common ancestral genes by speciation and encode proteins that retain the same function, but do not include paralogs, that is, genes that are related by duplication, but have evolved to encode proteins with different functions. Homologous genes include naturally occurring alleles and artificially created variants. Degeneracy of the genetic code provides the possibility of replacing at least one base of the protein coding sequence of a gene with a different base without causing the amino acid sequence of the polypeptide produced from the gene to be altered. When optimally aligned, homologous genes have at least 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% or more sequence identity along the entire length of the gene identified as being associated with conferring an increased trait when expressed in plant cells. In one aspect of the invention, the homologous genes have a nucleic acid or amino acid sequence similarity that has at least 85%, 90%, 95%, 96%, 97%, 98% or 99% identity with a consensus sequence of proteins, nucleotides and homologues disclosed here.

[00041] Homólogos podem ser identificados por comparação da sequência de aminoácidos, por exemplo, manualmente ou por meio de uma ferramenta baseada em computador usando algoritmos de pesquisa baseados em homologia conhecidos, como os comumente conhecidos e referidos como BLAST, FASTA e Smith-Waterman. Um programa de alinhamento de sequência local, (por exemplo, Ferramenta de Pesquisa de Alinhamento Local Básico (BLAST)) pode ser usado para pesquisar um banco de dados de sequências para encontrar sequências semelhantes e o valor de Expectativa resumido (valor E) usado para medir a similaridade base da sequência. Como uma proteína atingida com o melhor valor E para um organismo em particular pode não ser necessariamente um ortólogo, ou seja, ter a mesma função, ou ser o único ortólogo, uma análise recíproca é usada para filtrar sequências de acertos com valores E significativos para identificação ortológica. A análise recíproca implica na busca dos acertos significativos contra um banco de dados de sequências de aminoácidos do organismo base que são semelhantes à sequência da proteína de análise. Um acerto pode ser identificado como um ortólogo, quando o melhor bit da análise recíproca é a própria proteína de análise ou uma proteína codificada por um gene duplicado após a especiação. Um outro aspecto dos homólogos codificados por DNA útil nas plantas transgênicas da invenção são aquelas proteínas que diferem de uma proteína divulgada como resultado da deleção ou inserção de um ou mais aminoácidos em uma sequência nativa.[00041] Homologs can be identified by amino acid sequence comparison, for example, manually or through a computer-based tool using known homology-based search algorithms such as those commonly known and referred to as BLAST, FASTA and Smith-Waterman . A local sequence alignment program, (e.g. Basic Local Alignment Search Tool (BLAST)) can be used to search a sequence database to find similar sequences and the Summary Expectation value (E value) used to measure the base similarity of the sequence. Because a protein hit with the best E-value for a particular organism may not necessarily be an ortholog, i.e., have the same function, or be the only ortholog, a reciprocal analysis is used to filter out sequences of hits with significant E-values for orthological identification. Reciprocal analysis involves searching for significant hits against a database of amino acid sequences from the base organism that are similar to the analysis protein sequence. A hit can be identified as an ortholog when the best bit of the reciprocal analysis is the analysis protein itself or a protein encoded by a gene duplicated after speciation. Another aspect of the DNA-encoded homologs useful in the transgenic plants of the invention are those proteins that differ from a disclosed protein as a result of the deletion or insertion of one or more amino acids in a native sequence.

[00042] Como usado aqui, a expressão "identidade percentual" ou "% de identidade" se refere à extensão em que as sequências de DNA ou segmentos de proteína são invariantes ao longo de uma janela de alinhamento de sequências, por exemplo, sequências nucleotídicas ou sequências de aminoácidos. Uma "fração de identidade" para uma sequência alinhada com uma sequência de referência é o número de componentes idênticos que são compartilhados pelas sequências, dividido pelo comprimento do alinhamento, não incluindo lacunas introduzidas pelo algoritmo de alinhamento. "Identidade percentual" é a fração da identidade vezes 100. A identidade percentual é calculada sobre o comprimento alinhado, de preferência usando um algoritmo de alinhamento local, por exemplo, BLASTp.[00042] As used herein, the expression "percent identity" or "% identity" refers to the extent to which DNA sequences or protein segments are invariant over a sequence alignment window, e.g., nucleotide sequences or amino acid sequences. An "identity fraction" for a sequence aligned with a reference sequence is the number of identical components that are shared by the sequences, divided by the length of the alignment, not including gaps introduced by the alignment algorithm. "Percent identity" is the fraction of the identity times 100. The percent identity is calculated over the aligned length, preferably using a local alignment algorithm, for example, BLASTp.

[00043] Como usado aqui, a expressão "atividade funcional" ou "funcionalmente ativo" se refere às proteínas/enzimas para utilização de acordo com a presente invenção que têm a capacidade de proporcionar tolerância ao stress, o que pode resultar num rendimento aumentado. A transferência da atividade funcional para sistemas vegetais ou bacterianos pode envolver uma sequência de ácido nucleico, codificando a sequência de aminoácidos para uma proteína da presente invenção, integrada num vetor de expressão proteico apropriado para o hospedeiro no qual o vetor residirá. Uma forma de obter uma sequência de ácido nucleico que codifica uma proteína com atividade funcional consiste em isolar o material genético nativo das espécies bacterianas que produzem a proteína de interesse, utilizando informação deduzida da sequência de aminoácidos da proteína, como aqui divulgado. As sequências nativas podem ser otimizadas para expressão em plantas. Polinucleotídeos otimizados podem também ser projetados com base na sequência proteica.[00043] As used herein, the expression "functional activity" or "functionally active" refers to proteins/enzymes for use in accordance with the present invention that have the ability to provide stress tolerance, which can result in increased performance. Transfer of functional activity to plant or bacterial systems may involve a nucleic acid sequence, encoding the amino acid sequence for a protein of the present invention, integrated into a protein expression vector appropriate for the host in which the vector will reside. One way to obtain a nucleic acid sequence that encodes a protein with functional activity is to isolate the native genetic material of the bacterial species that produce the protein of interest, using information deduced from the amino acid sequence of the protein, as disclosed herein. Native sequences can be optimized for expression in plants. Optimized polynucleotides can also be designed based on the protein sequence.

[00044] Como usado aqui, as expressões "sequências de controle" e "sequências reguladoras" são permutáveis e se referem a sequências de ácido nucleico úteis para a expressão de genes/transcrição em plantas. "Sequências de controle" ou "sequências reguladoras" podem incluir, mas não se limitam a, promotores, operadores, potenciadores, origens de replicação, sítios de ligação ao ribossoma, sinais de terminação e poliadenilação.[00044] As used herein, the terms "control sequences" and "regulatory sequences" are interchangeable and refer to nucleic acid sequences useful for gene expression/transcription in plants. "Control sequences" or "regulatory sequences" may include, but are not limited to, promoters, operators, enhancers, origins of replication, ribosome binding sites, termination signals and polyadenylation.

[00045] Como usado aqui, o termo "promotor" se refere ao DNA regulador para inicializar a transcrição. Um "promotor vegetal" é um promotor capaz de iniciar a transcrição em células vegetais, quer a sua origem seja ou não uma célula vegetal, por exemplo, é bem sabido que os promotores de T-DNA de Agrobacterium são funcionais em células vegetais. Assim, os promotores de plantas incluem o DNA promotor obtido a partir de plantas, vírus de plantas e bactérias, tais como bactérias Agrobacterium e Bradyrhizobium. Exemplos de promotores sob controle de desenvolvimento incluem promotores que, preferencialmente, iniciam a transcrição em determinados tecidos, incluindo folhas, raízes ou sementes. Esses promotores são mencionados como "preferenciais de tecidos". Promotores que iniciam a transcrição apenas em determinados tecidos são mencionados como "específicos de tecidos". Um promotor específico de "tipo de célula" induz primariamente a expressão em determinados tipos de células em um ou mais órgãos, por exemplo, células vasculares em raízes ou folhas. Um promotor "induzível" ou "repressível" é um promotor que está sob controle ambiental ou químico. Exemplos de condições ambientais que podem afetar a transcrição por promotores induzíveis incluem condições anaeróbicas, ou certos produtos químicos, ou a presença de luz. Promotores específicos de tecidos, preferenciais aos tecidos, específicos de tipo de célula e induzíveis pertencem à classe de promotores "não constitutivos". Um promotor "constitutivo" se refere a um promotor que é ativo na maioria das condições e na maioria dos tecidos.[00045] As used herein, the term "promoter" refers to regulatory DNA to initiate transcription. A "plant promoter" is a promoter capable of initiating transcription in plant cells, whether or not its origin is a plant cell, for example, it is well known that Agrobacterium T-DNA promoters are functional in plant cells. Thus, plant promoters include promoter DNA obtained from plants, plant viruses and bacteria, such as Agrobacterium and Bradyrhizobium bacteria. Examples of promoters under developmental control include promoters that preferentially initiate transcription in certain tissues, including leaves, roots, or seeds. These promoters are referred to as “tissue preferred.” Promoters that initiate transcription only in certain tissues are referred to as "tissue specific". A "cell type" specific promoter primarily induces expression in certain cell types in one or more organs, for example, vascular cells in roots or leaves. An "inducible" or "repressible" promoter is a promoter that is under environmental or chemical control. Examples of environmental conditions that can affect transcription by inducible promoters include anaerobic conditions, or certain chemicals, or the presence of light. Tissue-specific, tissue-preferential, cell type-specific, and inducible promoters belong to the class of “nonconstitutive” promoters. A "constitutive" promoter refers to a promoter that is active under most conditions and in most tissues.

[00046] Numerosos promotores que são ativos em células vegetais já foram descritos anteriormente. Estes incluem promotores presentes em genomas de plantas, bem como promotores de outras fontes, incluindo os promotores da promotora da nopalina sintase (NOS) e da octopina sintetase (OCS) transportados em plasmídeos indutores de tumor de Agrobacterium tumefaciens e os promotores CaMV35S do vírus do mosaico da couve-flor, como divulgado nas Patentes dos EUA 5.164, 316 e 5.322.938. Promotores úteis derivados de genes de plantas são encontrados na Patente dos EUA N° 5.641.876, que descreve um promotor de actina de arroz; Patente dos EUA N° 7.151.204, que divulga um promotor da aldolase de cloroplasto de milho e um promotor da aldolase de milho (FDA); e Publicação de Pedido de Patente dos EUA 2003/0131377 divulgando um promotor da nicotianamina sintetase de milho. Estes e numerosos outros promotores que funcionam em células vegetais são conhecidos daqueles versados na técnica e estão disponíveis para utilização em polinucleotídeos recombinantes aqui descritos para proporcionar a expressão dos genes desejados em células vegetais transgênicas.[00046] Numerous promoters that are active in plant cells have been previously described. These include promoters present in plant genomes, as well as promoters from other sources, including the nopaline synthase (NOS) and octopine synthetase (OCS) promoters carried on tumor-inducing plasmids from Agrobacterium tumefaciens and the CaMV35S promoters from Agrobacterium tumefaciens virus. cauliflower mosaic, as disclosed in US Patents 5,164, 316 and 5,322,938. Useful promoters derived from plant genes are found in US Patent No. 5,641,876, which describes a rice actin promoter; US Patent No. 7,151,204, which discloses a corn chloroplast aldolase promoter and a corn aldolase promoter (FDA); and US Patent Application Publication 2003/0131377 disclosing a corn nicotianamine synthetase promoter. These and numerous other promoters that function in plant cells are known to those skilled in the art and are available for use in the recombinant polynucleotides described herein to provide expression of the desired genes in transgenic plant cells.

[00047] Além disso, os promotores podem ser alterados para conter múltiplas "sequências potenciadoras" para ajudar a elevar a expressão genética. Tais potenciadores são conhecidos na técnica. Ao incluir uma sequência intensificadora com tais construtos, a expressão da proteína selecionada pode ser melhorada. Estes potenciadores são frequentemente encontrados 5' ao início da transcrição num promotor que funciona em células eucarióticas, mas pode frequentemente ser inserido a montante (5') ou a jusante (3') da sequência de codificação. Em alguns casos, esses elementos aprimoradores 5' são íntrons. Particularmente úteis como potenciadores são os íntrons 5' da actina 1 do arroz (ver, por exemplo, patente dos EUA N° 5.641.876) e os genes da actina 2 do arroz, o(s) íntron(s) do gene da desidrogenase do álcool de milho, o íntron do gene da proteína 70 de choque térmico do milho, por exemplo, a Patente dos EUA N° 5.593.874) e o íntron do gene 1 encolhido de milho. Ver também a publicação do pedido de patente dos EUA 2002/0192813A1, que descreve elementos 5', 3' e de íntron úteis na concepção de vetores de expressão de plantas eficazes.[00047] Additionally, promoters can be altered to contain multiple "enhancer sequences" to help elevate gene expression. Such enhancers are known in the art. By including an enhancer sequence with such constructs, expression of the selected protein can be improved. These enhancers are often found 5' to the start of transcription in a promoter that functions in eukaryotic cells, but can often be inserted upstream (5') or downstream (3') of the coding sequence. In some cases, these 5' enhancer elements are introns. Particularly useful as enhancers are the rice actin 1 5' introns (see, e.g., U.S. Patent No. 5,641,876) and the rice actin 2 genes, the intron(s) of the dehydrogenase gene. of corn alcohol, the intron of the corn heat shock protein 70 gene, e.g., U.S. Patent No. 5,593,874) and the corn shrunken gene 1 intron. See also US patent application publication 2002/0192813A1, which describes 5', 3' and intron elements useful in designing effective plant expression vectors.

[00048] Em algumas modalidades, a expressão suficiente em tecidos de sementes de plantas é desejada para afetar melhorias na composição de sementes. Promotores exemplificativos para utilização na modificação da composição de sementes incluem promotores de genes de sementes tais como napina, como divulgado na Patente dos EUA N° 5.420.034, oleosina L3 do milho, como divulgado na Patente dos EUA N° 6.433.252), zeína Z27, conforme divulgado por Russell et al. (1997) Transgenic Res. 6(2): 157-166), globulina 1, como divulgado por Belanger et al (1991) Genetics 129:863-872), glutelina 1, como divulgado por Russell (1997, supra) e antioxidante peroxirredoxina (Perl), como divulgado por Stacy et al. (1996) Plant Mol Biol. 31(6):1205- 1216.[00048] In some embodiments, sufficient expression in plant seed tissues is desired to affect improvements in seed composition. Exemplary promoters for use in modifying seed composition include seed gene promoters such as napin, as disclosed in U.S. Patent No. 5,420,034, corn oleosin L3, as disclosed in U.S. Patent No. 6,433,252), zein Z27, as disclosed by Russell et al. (1997) Transgenic Res. 6(2): 157-166), globulin 1, as disclosed by Belanger et al (1991) Genetics 129:863-872), glutelin 1, as disclosed by Russell (1997, supra) and antioxidant peroxiredoxin (Perl), as disclosed by Stacy et al. (1996) Plant Mol Biol. 31(6):1205- 1216.

[00049] Como usado aqui, a expressão "operacionalmente ligado" se refere à associação de dois ou mais fragmentos de DNA em um construto de DNA recombinante, de modo que a função de um, por exemplo, DNA codificador de proteína, é controlada pelo outro, por exemplo, um promotor.[00049] As used herein, the term "operably linked" refers to the association of two or more DNA fragments into a recombinant DNA construct, such that the function of one, e.g., protein-coding DNA, is controlled by the another, for example, a prosecutor.

[00050] Os construtos de DNA recombinante são montados utilizando modos bem conhecidos daqueles versados na técnica e tipicamente compreendem um promotor operacionalmente ligado a DNA, cuja expressão proporciona a característica agronômica melhorada. Outros componentes construtivos podem incluir elementos reguladores adicionais, incluindo líderes 5' e íntrons para melhorar a transcrição, regiões 3' não traduzidas (por exemplo, sinais e sítios de poliadenilação) e DNA para peptídeos de trânsito ou de sinal.[00050] Recombinant DNA constructs are assembled using methods well known to those skilled in the art and typically comprise a promoter operably linked to DNA, the expression of which provides the improved agronomic characteristic. Other building blocks may include additional regulatory elements, including 5' leaders and introns to enhance transcription, 3' untranslated regions (e.g., signals and polyadenylation sites), and DNA for transit or signal peptides.

[00051] Os construtos de DNA recombinante aqui descritos também incluem geralmente um elemento 3' que tipicamente contém um sinal e sítio de poliadenilação. Elementos 3' bem conhecidos incluem aqueles de genes de Agrobacterium tumefaciens, tais como nos 3', tml 3', tmr 3', tms 3', ocs 3', tr73', por exemplo, divulgados na Patente dos EUA N° 6.090.627; elementos 3' de genes de plantas como trigo (Triticum aesevitum) proteína 17 de choque térmico (Hspl 73), um gene da ubiquitina do trigo, um gene da frutose-1,6-bifosfatase do trigo, um gene da glutelina do arroz, um gene da lactato desidrogenase do arroz e um gene da beta-tubulina do arroz, todos os quais são divulgados na Publicação de Pedido de Patente dos EUA N° 2002/0192813; e o gene da ribase bifosfato carboxilase da ervilha (Pisum sativum) (rbs 3') e elementos 3' dos genes dentro da planta hospedeira.[00051] The recombinant DNA constructs described here also generally include a 3' element that typically contains a signal and polyadenylation site. Well-known 3' elements include those of Agrobacterium tumefaciens genes, such as nos 3', tml 3', tmr 3', tms 3', ocs 3', tr73', for example, disclosed in US Patent No. 6,090. 627; 3' elements of plant genes such as wheat (Triticum aesevitum) heat shock protein 17 (Hspl 73), a wheat ubiquitin gene, a wheat fructose-1,6-bisphosphatase gene, a rice glutelin gene, a rice lactate dehydrogenase gene and a rice beta-tubulin gene, all of which are disclosed in US Patent Application Publication No. 2002/0192813; and the pea (Pisum sativum) ribase bisphosphate carboxylase gene (rbs 3') and 3' elements of the genes within the host plant.

[00052] Os construtos e vetores podem também incluir um peptídeo de trânsito para direcionamento de um gene para uma organela de planta, particularmente para um cloroplasto, leucoplasto ou outra organela plastidial. Para descrições da utilização de peptídeos de trânsito de cloroplastos, ver, por exemplo, a Patente dos EUA N° 5.188.642 e a Patente dos EUA N° 5.728.925.[00052] The constructs and vectors may also include a transit peptide for directing a gene to a plant organelle, particularly to a chloroplast, leucoplast or other plastid organelle. For descriptions of the use of chloroplast transit peptides, see, for example, US Patent No. 5,188,642 and US Patent No. 5,728,925.

[00053] Como usado aqui, o termo "expresso" se refere a uma proteína que é expressa ou produzida em uma célula vegetal quando o seu DNA cognato é transcrito para mRNA que é traduzido para a proteína. Como usada aqui, a expressão "suprimido" se refere à diminuição da expressão ou atividade de uma proteína. Tipicamente, uma proteína é suprimida em uma célula vegetal quando há uma diminuição na quantidade e/ou atividade da proteína na célula da planta. A presença ou atividade da proteína pode ser diminuída em qualquer quantidade, até e incluindo uma perda total de expressão e/ou atividade da proteína.[00053] As used herein, the term "expressed" refers to a protein that is expressed or produced in a plant cell when its cognate DNA is transcribed into mRNA that is translated into protein. As used herein, the term "suppressed" refers to decreased expression or activity of a protein. Typically, a protein is suppressed in a plant cell when there is a decrease in the amount and/or activity of the protein in the plant cell. The presence or activity of the protein may be decreased by any amount, up to and including a total loss of expression and/or activity of the protein.

[00054] Como usado aqui, o termo "característica" se refere a uma característica fisiológica, morfológica, bioquímica ou física de uma planta ou material vegetal particular ou célula. Em alguns casos, esta característica é visível ao olho humano, incluindo tamanho de semente ou planta, ou pode ser medida por técnicas bioquímicas, inclusive detectando o conteúdo de proteína, amido ou óleo da semente ou folhas, ou por observação de um processo metabólico ou fisiológico, (por exemplo, medindo a absorção de dióxido de carbono), ou pela observação do nível de expressão de um gene ou genes (por exemplo, utilizando análise de Northern, RT-PCR, ensaios de expressão de genes de microarranjo), ou sistemas de expressão de gene repórter, ou por observações agrícolas incluindo tolerância ao stress, rendimento ou tolerância a patógenos.[00054] As used herein, the term "characteristic" refers to a physiological, morphological, biochemical or physical characteristic of a particular plant or plant material or cell. In some cases, this characteristic is visible to the human eye, including seed or plant size, or can be measured by biochemical techniques, including detecting the protein, starch or oil content of the seed or leaves, or by observing a metabolic process or physiological, (e.g., by measuring carbon dioxide absorption), or by observing the expression level of a gene or genes (e.g., using Northern analysis, RT-PCR, microarray gene expression assays), or reporter gene expression systems, or by agricultural observations including stress tolerance, yield or pathogen tolerance.

[00055] Como usado aqui, a expressão "superexpressão" se refere a um maior nível de expressão de um gene em uma planta, célula vegetal ou tecido vegetal, comparado à expressão em uma planta, célula ou tecido de tipo selvagem, em qualquer estágio de desenvolvimento ou temporal para o gene. A superexpressão pode ocorrer quando, por exemplo, os genes estão sob o controle de um forte sinal de expressão, incluindo um dos promotores descritos aqui ou a região de iniciação da transcrição 35S do vírus do mosaico da couve-flor conhecida na técnica. A superexpressão pode ocorrer ao longo de uma planta ou em tecidos específicos da planta, dependendo do promotor utilizado.[00055] As used herein, the term "overexpression" refers to a greater level of expression of a gene in a plant, plant cell or plant tissue, compared to expression in a wild-type plant, cell or tissue, at any stage developmental or temporal for the gene. Overexpression can occur when, for example, genes are under the control of a strong expression signal, including one of the promoters described here or the cauliflower mosaic virus 35S transcription initiation region known in the art. Overexpression can occur throughout a plant or in specific plant tissues, depending on the promoter used.

[00056] Como usado aqui, uma "sequência não gênica" ou "sequência genômica não gênica" é uma sequência de DNA nativa encontrada no genoma nuclear de uma planta, tendo um comprimento de pelo menos 1 Kb e desprovida de quaisquer estruturas de leitura abertas, sequências gênicas ou sequências reguladoras de genes. Além disso, a sequência não gênica não compreende nenhuma sequência intrônica (ou seja, os íntrons são excluídos da definição de não gênico). A sequência não gênica não pode ser transcrita ou traduzida em proteína. Muitos genomas de plantas contêm regiões não gênicas, onde até 95% do genoma podem ser não gênicos e essas regiões podem ser compostas principalmente por DNA repetitivo.[00056] As used herein, a "non-genic sequence" or "non-genic genomic sequence" is a native DNA sequence found in the nuclear genome of a plant, having a length of at least 1 Kb and devoid of any open reading frames , gene sequences or gene regulatory sequences. Furthermore, the non-genic sequence does not comprise any intronic sequences (i.e., introns are excluded from the definition of non-genic). The non-genic sequence cannot be transcribed or translated into protein. Many plant genomes contain nongenic regions, where up to 95% of the genome may be nongenic and these regions may be composed primarily of repetitive DNA.

[00057] Como usado aqui, uma "região gênica" definida como uma sequência polinucleotídica que compreende uma estrutura de leitura aberta que codifica um RNA e/ou polipetídeo. A região gênica também pode abranger quaisquer sequências nucleotídicas não codificantes 5' e 3' adjacentes identificáveis envolvidas na regulação da expressão da estrutura de leitura aberta até aproximadamente 2 Kb a montante da região codificadora e 1 Kb a jusante da região codificadora, mas possivelmente mais a montante ou a jusante. Uma região gênica inclui ainda quaisquer íntrons que possam estar presentes na região gênica. Além disso, a região gênica pode compreender uma única sequência gênica, ou múltiplas sequências gênicas intercaladas com vãos curtos (menos de 1 Kb) de sequências não gênicas.[00057] As used herein, a "gene region" is defined as a polynucleotide sequence comprising an open reading frame encoding an RNA and/or polypeptide. The gene region may also encompass any identifiable adjacent 5' and 3' non-coding nucleotide sequences involved in regulating expression of the open reading frame up to approximately 2 kb upstream of the coding region and 1 kb downstream of the coding region, but possibly further. upstream or downstream. A genic region further includes any introns that may be present in the genic region. Furthermore, the genic region may comprise a single gene sequence, or multiple gene sequences interspersed with short gaps (less than 1 Kb) of non-gene sequences.

[00058] Como usado aqui, o termo "hipometilação" ou "hipometilado", em referência a uma sequência de DNA, define um estado reduzido de resíduos nucleotídicos de DNA metilado em uma dada sequência de DNA. Tipicamente, a metilação diminuída relaciona- se com o número de resíduos metilados de adenina ou citosina, em relação ao nível médio de metilação encontrado em sequências não gênicas presentes no genoma de uma planta, por exemplo, soja ou milho.[00058] As used herein, the term "hypomethylation" or "hypomethylated", in reference to a DNA sequence, defines a reduced state of methylated DNA nucleotide residues in a given DNA sequence. Typically, decreased methylation relates to the number of methylated adenine or cytosine residues, relative to the average level of methylation found in non-genic sequences present in the genome of a plant, for example, soybean or corn.

[00059] O termo "em localização próxima a uma região gênica", quando usado em referência a uma sequência não gênica, define a localização relativa da sequência não gênica para uma região gênica. Especificamente, o número de regiões gênicas dentro de uma vizinhança de 40 Kb (isto é, dentro de 40 Kb em cada extremidade da sequência de loci genômicos de soja ideal selecionada) é analisado. O número de regiões gênicas pode variar de um mínimo de 1 gene a um máximo de 18 genes dentro da vizinhança de 40 Kb.[00059] The term "in close proximity to a genic region", when used in reference to a non-genic sequence, defines the relative location of the non-genic sequence to a genic region. Specifically, the number of genic regions within a 40 Kb neighborhood (i.e., within 40 Kb at each end of the selected optimal soybean genomic loci sequence) is analyzed. The number of gene regions can vary from a minimum of 1 gene to a maximum of 18 genes within the 40 Kb neighborhood.

[00060] O termo "evidência de recombinação", conforme usado aqui, se refere às frequências de recombinação meiótica entre qualquer par de marcadores genômicos através de uma região cromossômica compreendendo a sequência selecionada. As frequências de recombinação foram calculadas com base na razão da distância genética entre os marcadores (em centimorgan (cM)) sobre a distância física entre os marcadores (em megabases (Mb)). Para que uma sequência selecionada tenha evidência de recombinação, a sequência selecionada deve conter pelo menos um evento de recombinação entre dois marcadores flanqueando a sequência selecionada, conforme detectado usando um conjunto de dados de marcadores de alta resolução gerado a partir de múltiplas populações de mapeamento.[00060] The term "recombination evidence", as used herein, refers to the frequencies of meiotic recombination between any pair of genomic markers across a chromosomal region comprising the selected sequence. Recombination frequencies were calculated based on the ratio of the genetic distance between markers (in centimorgan (cM)) over the physical distance between markers (in megabases (Mb)). For a selected sequence to have evidence of recombination, the selected sequence must contain at least one recombination event between two markers flanking the selected sequence, as detected using a high-resolution marker dataset generated from multiple mapping populations.

[00061] Como usado aqui, o termo "valor de localização relativa" é um valor calculado que define a distância de um locus genômico a partir do seu centrômero cromossômico correspondente. Para cada sequência selecionada, a distância genômica da localização nativa da sequência selecionada ao centrômero do cromossomo em que ela está localizada é medida (em Bp). A localização relativa da sequência selecionada dentro do cromossomo é representada como a razão de sua distância genômica ao centrômero em relação ao comprimento do braço cromossômico específico (medido em Bp) em que se encontra. Esses valores relativos de localização para os loci genômicos não gênicos ideais podem ser gerados para diferentes plantas, os valores relativos de localização para o conjunto de dados podem variar de uma razão mínima de 0 a uma máxima de 0,99682 de distância genômica.[00061] As used herein, the term "relative location value" is a calculated value that defines the distance of a genomic locus from its corresponding chromosomal centromere. For each selected sequence, the genomic distance from the native location of the selected sequence to the centromere of the chromosome on which it is located is measured (in Bp). The relative location of the selected sequence within the chromosome is represented as the ratio of its genomic distance to the centromere relative to the length of the specific chromosomal arm (measured in Bp) on which it is found. These relative location values for the ideal non-genic genomic loci can be generated for different plants, the relative location values for the data set can range from a minimum ratio of 0 to a maximum of 0.99682 genomic distance.

[00062] O termo "sequência de DNA exógeno", como aqui utilizado, é qualquer sequência de ácido nucleico que foi removida da sua localização nativa e inserida em uma nova localização, alterando as sequências que flanqueiam a sequência de ácido nucleico que foi movida. Por exemplo, uma sequência de DNA exógena pode compreender uma sequência de outra espécie.[00062] The term "exogenous DNA sequence", as used herein, is any nucleic acid sequence that has been removed from its native location and inserted into a new location, altering the sequences flanking the nucleic acid sequence that has been moved. For example, an exogenous DNA sequence may comprise a sequence from another species.

[00063] "Recombinação" se refere a um processo de troca de informação genética entre dois polinucleotídeos, incluindo, mas não limitado a, captura de dador por junção de extremidade não homóloga (NHEJ) e recombinação homóloga. Como usado aqui, "recombinação homóloga (HR)" se refere à forma especializada de tal troca que ocorre, por exemplo, durante o reparo de quebras de cadeia dupla nas células via mecanismos de reparo direcionados por homologia. Este processo requer homologia de sequências nucleotídicas, usa uma molécula "doadora" para a reparação do modelo de uma molécula "alvo" (isto é, a sequência nucleotídica que sofreu a quebra da cadeia dupla) e é variadamente conhecido como "conversão gênica não cruzada", ou "conversão do gene de característica curta", porque leva à transferência de informações genéticas do doador para o alvo. Sem querer estar vinculado a qualquer teoria em particular, tal transferência pode envolver a correção de incompatibilidade de DNA heteroduplex que se forma entre o alvo quebrado e o doador e/ou "recozimento de filamento dependente de síntese", no qual o doador é usado para ressintetizar a informação genética que se tornará parte do alvo e/ou processos relacionados. Tal HR especializada resulta frequentemente em uma alteração da sequência da molécula alvo, de tal modo que parte ou a totalidade da sequência do polinucleotídeo doador é incorporada no polinucleotídeo alvo. Para a integração direcionada por HR, a molécula doadora contém pelo menos 2 regiões de homologia ao genoma ("braços de homologia") de pelo menos 50-100 pares de bases de comprimento. Ver, por exemplo, a Publicação de Patente dos EUA N° 20110281361, cujo conteúdo é aqui incorporado por referência.[00063] "Recombination" refers to a process of exchanging genetic information between two polynucleotides, including, but not limited to, donor capture by non-homologous end joining (NHEJ) and homologous recombination. As used herein, "homologous recombination (HR)" refers to the specialized form of such exchange that occurs, for example, during the repair of double-strand breaks in cells via homology-directed repair mechanisms. This process requires homology of nucleotide sequences, uses a "donor" molecule to repair the template of a "target" molecule (i.e., the nucleotide sequence that has undergone the double-strand break), and is variously known as "uncross-linked gene conversion ", or "short trait gene conversion", because it leads to the transfer of genetic information from the donor to the target. Without wishing to be bound by any particular theory, such transfer may involve correction of heteroduplex DNA mismatches that form between the broken target and the donor and/or "synthesis-dependent strand annealing", in which the donor is used to resynthesize genetic information that will become part of the target and/or related processes. Such specialized HR often results in an alteration of the sequence of the target molecule such that part or all of the sequence of the donor polynucleotide is incorporated into the target polynucleotide. For HR-directed integration, the donor molecule contains at least 2 regions of homology to the genome ("homology arms") of at least 50-100 base pairs in length. See, for example, U.S. Patent Publication No. 20110281361, the contents of which are incorporated herein by reference.

[00064] Como usado aqui, o termo "expressão gênica" se refere à conversão da informação, contida em um gene, em um produto gênico. Um produto de gene pode ser produto transcricional direto de um gene (por exemplo, mRNA, tRNA, rRNA, RNA antissenso, RNA de interferência, ribozima, RNA estrutural ou qualquer outro tipo de RNA) ou uma proteína produzida por tradução de um mRNA. Produtos de genes também incluem RNAs que são modificados por processos tais como fechamento, poliadenilação, metilação e edição e proteínas modificadas por, por exemplo, metilação, acetilação, fosforilação, ubiquitinação, ribosilação do ADP, miristilação e glicosilação.[00064] As used here, the term "gene expression" refers to the conversion of information, contained in a gene, into a gene product. A gene product can be the direct transcriptional product of a gene (e.g., mRNA, tRNA, rRNA, antisense RNA, interfering RNA, ribozyme, structural RNA, or any other type of RNA) or a protein produced by translation of an mRNA. Gene products also include RNAs that are modified by processes such as closure, polyadenylation, methylation and editing and proteins modified by, for example, methylation, acetylation, phosphorylation, ubiquitination, ADP ribosylation, myristylation and glycosylation.

[00065] Como usado aqui, o termo "substancialmente homólogo" ou "homologia substancial", com respeito a uma sequência de ácidos nucleicos contígua, se refere a sequências de nucleotídeos contíguas que hibridizam em condições rigorosas em uma sequência de ácidos nucleicos de referência. Por exemplo, sequências de ácidos nucleicos que são substancialmente homólogas a uma sequência de ácidos nucleicos de referência são aquelas sequências de ácidos nucleicos que hibridizam em condições rigorosas (por exemplo, as condições de Rigorosidade Moderada definidas acima) para a sequência de ácidos nucleicos de referência. Sequências substancialmente homólogas podem ter pelo menos 80% de identidade de sequência. Por exemplo, moléculas substancialmente homólogas podem conter de cerca de 80% a 100% de identidade de sequência, tal como cerca de 81%; cerca de 82%; cerca de 83%; cerca de 84%; cerca de 85%; cerca de 86%; cerca de 87%; cerca de 88%; cerca de 89%; cerca de 90%; cerca de 91%; cerca de 92%; cerca de 93%; cerca de 94% cerca de 95%; cerca de 96%; cerca de 97%; cerca de 98%; cerca de 98,5%; cerca de 99%; cerca de 99,5%; e cerca de 100%. A propriedade de homologia substancial está intimamente relacionada à hibridização específica. Por exemplo, uma molécula de ácidos nucleicos é especialmente hibridizável quando existe um grau suficiente de complementaridade para evitar ligação não específica do ácido nucleico com sequências não alvo em condições em que a ligação específica é desejada, por exemplo, em condições de hibridização rigorosas.[00065] As used herein, the term "substantially homologous" or "substantial homology", with respect to a contiguous nucleic acid sequence, refers to contiguous nucleotide sequences that hybridize under stringent conditions to a reference nucleic acid sequence. For example, nucleic acid sequences that are substantially homologous to a reference nucleic acid sequence are those nucleic acid sequences that hybridize under stringent conditions (e.g., the Moderate Stringency conditions defined above) to the reference nucleic acid sequence. . Substantially homologous sequences may have at least 80% sequence identity. For example, substantially homologous molecules may contain from about 80% to 100% sequence identity, such as about 81%; around 82%; around 83%; around 84%; about 85%; around 86%; around 87%; around 88%; around 89%; about 90%; around 91%; about 92%; around 93%; about 94% about 95%; about 96%; about 97%; about 98%; around 98.5%; about 99%; around 99.5%; and about 100%. The property of substantial homology is closely related to specific hybridization. For example, a nucleic acid molecule is especially hybridizable when there is a sufficient degree of complementarity to prevent non-specific binding of the nucleic acid to non-target sequences under conditions where specific binding is desired, for example, under stringent hybridization conditions.

[00066] Em alguns casos, "homólogo" pode ser usado para se referir à relação de um primeiro gene com um segundo gene por descendência de uma sequência de DNA ancestral comum. Nesses casos, o termo homólogo indica uma relação entre os genes separados pelo evento de especiação (ver ortólogo) ou a relação entre os genes separados pelo evento de duplicação genética (ver parálogo). Noutros casos, "homólogo" pode ser utilizado para referir ao nível de identidade de sequência entre uma ou mais sequências polinucleotídicas, em tais casos a uma ou mais sequências polinucleotídicas não necessariamente descendem de uma sequência ancestral de DNA comum. Aqueles versados na técnica estão cientes do significado do termo "homólogo" e apreciam a aplicação apropriada do termo.[00066] In some cases, "homologous" may be used to refer to the relationship of a first gene to a second gene by descent from a common ancestral DNA sequence. In these cases, the term homologous indicates a relationship between the genes separated by the speciation event (see ortholog) or the relationship between the genes separated by the gene duplication event (see paralog). In other cases, "homologous" may be used to refer to the level of sequence identity between one or more polynucleotide sequences, in such cases the one or more polynucleotide sequences do not necessarily descend from a common ancestral DNA sequence. Those skilled in the art are aware of the meaning of the term "homologue" and appreciate the proper application of the term.

[00067] Embora a invenção tenha sido descrita com referência a métodos e modalidades específicos, será apreciado que várias modificações e alterações podem ser feitas sem se afastar da invenção. Todas as publicações citadas aqui são expressamente incorporadas aqui por referência com o propósito de descrever e divulgar composições e metodologias que podem ser usadas em conexão com a invenção. Todas as patentes citadas, pedidos de patentes e informações de sequência em sites da web citados e bancos de dados públicos também são incorporados por referência.[00067] Although the invention has been described with reference to specific methods and embodiments, it will be appreciated that various modifications and changes can be made without departing from the invention. All publications cited herein are expressly incorporated herein by reference for the purpose of describing and disclosing compositions and methodologies that may be used in connection with the invention. All cited patents, patent applications and sequence information on cited websites and public databases are also incorporated by reference.

EXEMPLOSEXAMPLES Exemplo 1Example 1

[00068] De acordo com os métodos e/ou sistemas aqui fornecidos, dados de banco de dados e/ou mapas podem ser usados para avaliação ou previsão do desempenho e/ou estabilidade de transgenes através do perfilamento do estado da cromatina local, em particular a abundância de H3K9me2, nas vizinhanças do locus inserido por transgenes. Como previsto aqui, um valor limite pode ser atribuído para prever o risco potencial de silenciamento transgênico para a integração transgênica ocorrendo com regiões genômicas altamente enriquecidas com H3K9me2. Para avaliar a estrutura local da cromatina, um mapa de di- metilação (H3K9me2) da histona3 lisina (K) 9 em todo o genoma em soja (Glycine maxcv Maverick é construído. H3K9me2 são frequentemente observados dentro das regiões heterocromáticas silenciadas, incluindo centrômero e sequências repetitivas transportadoras de telômeros. Este mapa do genoma de H3K9me2 permite prever a estrutura da cromatina (aberta ou compactada) em qualquer locus no genoma da soja e fornece uma avaliação do potencial de silenciamento.[00068] In accordance with the methods and/or systems provided herein, database data and/or maps can be used to evaluate or predict the performance and/or stability of transgenes through local chromatin state profiling, in particular the abundance of H3K9me2, in the vicinity of the locus inserted by transgenes. As predicted here, a threshold value can be assigned to predict the potential risk of transgene silencing for transgene integration occurring with genomic regions highly enriched in H3K9me2. To assess local chromatin structure, a genome-wide histone3 lysine (K) 9 dimethylation (H3K9me2) map in soybean (Glycine maxcv Maverick is constructed. H3K9me2 are frequently observed within the silenced heterochromatic regions, including centromere and telomere-carrying repetitive sequences This H3K9me2 genome map allows prediction of chromatin structure (open or compacted) at any locus in the soybean genome and provides an assessment of silencing potential.

[00069] Os tecidos da parte aérea e da raiz da soja (Glycine max) cv Maverick são coletados no estágio v1 (~ 12 dias após o plantio) e em seguida reticulados usando formaldeído a 1%. Os tecidos reticulados são utilizados para o ensaio de imunoprecipitação da cromatina (ChIP) utilizando o anticorpo H3K9me2 (Millipore 17-648), em que o IgG de coelho normal (Millipore Cat. 12-370) é utilizado como controle negativo. Três ensaios ChIP independentes de cada tecido são realizados e o DNA ChIPado é preparado para sequenciamento usando HiSeq. As leituras de sequenciamento estão listadas na Tabela 1. [00069] Shoot and root tissues of soybean (Glycine max) cv Maverick are collected at stage v1 (~ 12 days after planting) and then cross-linked using 1% formaldehyde. The cross-linked tissues are used for the chromatin immunoprecipitation (ChIP) assay using the H3K9me2 antibody (Millipore 17-648), in which normal rabbit IgG (Millipore Cat. 12-370) is used as a negative control. Three independent ChIP assays of each tissue are performed and the ChIPated DNA is prepared for sequencing using HiSeq. Sequencing reads are listed in Table 1.

[00070] Análise dos dados ChIP-Seq - Os dados brutos de sequenciamento dos experimentos ChIP-seq de H3K9me2 são alinhados utilizando Bowtie para o genoma de Glycine Max Williams82. O algoritmo de localização de pico MACS (análise baseada em modelo ChIP-seq) pode ser usado para identificar regiões de enriquecimento de H3K9me2 sobre fundo, onde um "pico" representa um alongamento genômico que é previsto a ser enriquecido para H3K9me2 em comparação com sua vizinhança genômica. Por outro lado, um "cume" representa a localização genômica que tem o maior enriquecimento dentro de um "pico" previsto.[00070] Analysis of ChIP-Seq data - The raw sequencing data from the H3K9me2 ChIP-seq experiments are aligned using Bowtie to the Glycine Max Williams82 genome. The MACS (ChIP-seq model-based analysis) peak finding algorithm can be used to identify regions of H3K9me2 enrichment in background, where a "peak" represents a genomic stretch that is predicted to be enriched for H3K9me2 compared to its genomic neighborhood. Conversely, a "ridge" represents the genomic location that has the greatest enrichment within a predicted "peak".

[00071] De acordo com este exemplo, os dados de ChIP-seq são consistentes entre os replicados técnicos. Para reduzir a variação e o ruído resultantes dos dados de ChIP-seq, três réplicas técnicas de ChIP- seq são executadas individualmente. Para examinar se as reduções (pull-downs) ChIP de cada rodada são consistentes e refletem a modificação genuína do H3K9me2 no genoma da soja, o pull-down de cada representante técnico pode ser comparado. Entre as três réplicas técnicas, os dados ChIP-seq são consistentes entre si, indicando que os pull-downs são consistentes em cada rodada de experimentos de ChIP. Assim sendo, os protocolos CHIP-seq usados neste exemplo são altamente replicáveis em amostras de réplicas técnicas de raiz e broto.[00071] According to this example, ChIP-seq data is consistent between technical replicates. To reduce variation and noise resulting from ChIP-seq data, three technical replicates of ChIP-seq are performed individually. To examine whether the ChIP pull-downs from each round are consistent and reflect genuine H3K9me2 modification in the soybean genome, the pull-down from each technical representative can be compared. Among the three technical replicates, the ChIP-seq data are consistent with each other, indicating that the pull-downs are consistent across each round of ChIP experiments. Therefore, the CHIP-seq protocols used in this example are highly replicable in root and shoot technical replicate samples.

Exemplo 2Example 2

[00072] O enriquecimento de H3K9me2 está associado a regiões heterocromáticas e ao silenciamento de genes - H3K9me2 está associado à heterocromatina (estrutura de cromatina compacta) e uma das marcas de histonas altamente conservadas responsáveis pela repressão transcricional em eucariotos. Para determinar se H3K9me2 está associado a região heterocromática e silenciamento gênico em soja, o enriquecimento de H3K9me2 dentro da região gênica (medido como o número de "picos" H3K9me2 previstos dentro de uma região gênica - maior número de picos representa maior extensão do enriquecimento de H3K9H3K9me2) é investigado e comparado com o nível de expressão do gene correspondente (medido usando tecnologia RNAseq, em unidades de contagens de leitura normalizadas). Aqui, observamos que as regiões gênicas com zero ou um pico de H3K9me2 apresentam uma gama significativa de expressão gênica. Por outro lado, as regiões gênicas com mais de dois picos de H3K9me2 estão associadas a níveis relativamente baixos de expressão gênica. Isso indica que o maior enriquecimento de H3K9me2 está altamente associado aos menores níveis de expressão gênica na soja.[00072] H3K9me2 enrichment is associated with heterochromatic regions and gene silencing - H3K9me2 is associated with heterochromatin (compact chromatin structure) and one of the highly conserved histone marks responsible for transcriptional repression in eukaryotes. To determine whether H3K9me2 is associated with heterochromatic region and gene silencing in soybean, H3K9me2 enrichment within the genic region (measured as the number of predicted H3K9me2 "peaks" within a genic region - greater number of peaks represents greater extent of H3K9me2 enrichment) H3K9H3K9me2) is investigated and compared with the expression level of the corresponding gene (measured using RNAseq technology, in normalized read count units). Here, we observed that gene regions with zero or one H3K9me2 peak show a significant range of gene expression. On the other hand, gene regions with more than two H3K9me2 peaks are associated with relatively low levels of gene expression. This indicates that the higher enrichment of H3K9me2 is highly associated with the lower levels of gene expression in soybean.

[00073] Além de compreender o teor de H3K9me2 em regiões gênicas, nós identificamos níveis mais altos de H3K9me2 em elementos transponíveis que são frequentemente associados a regiões altamente repetitivas e transcricionalmente reprimidas dentro do genoma. Comparamos a distribuição do enriquecimento de H3K9me2 entre elementos transponíveis e genes no genoma da soja. Em média, o enriquecimento de H3K9me2 da maioria dos elementos do transposon é muito maior do que os genes normais. Estes dados demonstram ainda que o enriquecimento de H3K9me2 está altamente associado ao status repressivo do genoma da soja.[00073] In addition to understanding the content of H3K9me2 in genic regions, we identified higher levels of H3K9me2 in transposable elements that are often associated with highly repetitive and transcriptionally repressed regions within the genome. We compared the distribution of H3K9me2 enrichment between transposable elements and genes in the soybean genome. On average, the H3K9me2 enrichment of most transposon elements is much higher than that of normal genes. These data further demonstrate that H3K9me2 enrichment is highly associated with the repressive status of the soybean genome.

[00074] Com base na compreensão de como a abundância de H3K9me2 está associada à expressão gênica, categorizamos os genes com base em seus níveis de expressão em cinco categorias diferentes de expressão - Alta, Média Alta, Média, Média Baixa e Baixa - e selecionamos um número representativo de 500 genes de cada categoria (ver Figura 1). Para cada gene dentro de cada categoria, a abundância de H3K9me2 na região gênica foi calculada. A região gênica é então dividida em três seções - corpo do gene, 2kb a montante e 1kb a jusante. Um valor médio para a abundância de H3K9me2 dentro de cada seção é plotado para cada categoria de expressão na Figura 1 As categorias de expressão Alta e Média Alta podem ser diferenciadas das categorias de expressão Baixa e Média Baixa com base na abundância de H3K9me2 nas três seções gênicas. Isso fornece uma visão exclusiva e um modelo estatístico de como os dados de H3K9me2 podem ser usados para prever o nível de expressão para um transgene de interesse específico. Juntos, os dados acima indicaram que H3K9me2 é uma marca de histona repressiva conservada em soja, bem como a abundância de H3K9me2 está associada à região heterocromática e repressão transcricional na soja. Concluímos que um limiar está ligado a níveis de expressão aceitáveis, onde a região gênica tem um pico de dados de perfilamento de H3K9me2 mapeados para genomas de soja. De acordo com este exemplo, um banco de dados para o genoma da soja é estabelecido com base nos dados de perfilamento de H3K9me2.[00074] Based on our understanding of how H3K9me2 abundance is associated with gene expression, we categorize genes based on their expression levels into five different expression categories - High, High Medium, Medium, Low Medium and Low - and select a representative number of 500 genes from each category (see Figure 1). For each gene within each category, the abundance of H3K9me2 in the gene region was calculated. The gene region is then divided into three sections - gene body, 2kb upstream and 1kb downstream. A mean value for the abundance of H3K9me2 within each section is plotted for each expression category in Figure 1. The High and Medium High expression categories can be differentiated from the Low and Medium Low expression categories based on the abundance of H3K9me2 in the three sections. genes. This provides unique insight and a statistical model of how H3K9me2 data can be used to predict the expression level for a specific transgene of interest. Together, the above data indicated that H3K9me2 is a conserved repressive histone mark in soybean, as well as the abundance of H3K9me2 is associated with the heterochromatic region and transcriptional repression in soybean. We conclude that a threshold is linked to acceptable expression levels, where the gene region has a peak from H3K9me2 profiling data mapped to soybean genomes. According to this example, a database for the soybean genome is established based on H3K9me2 profiling data.

Exemplo 3Example 3

[00075] Avaliação do enriquecimento de H3K9me2 usando os eventos principais de soja para validar a predição dos níveis de expressão com base nos dados de perfilamento de H3K9me2. Para avaliar o uso prático da aplicação do mapa de H3K9me2 como uma ferramenta para avaliar o risco potencial de silenciamento de transgenes, nove eventos principais de soja a partir dos construtos Enlist e Resistência a Insetos são selecionados e listados na Tabela 2. Como os sítios de inserção desses eventos principais já são conhecidos, os perfis de enriquecimento de H3K9me2 na vizinhança (5kb) do sítio inserido no transgene são avaliados para prever o risco de silenciamento gênico. Como todos os eventos principais são selecionados com base na expressão e estabilidade do transgene estável, é esperado que o transgene seja inserido em um locus com baixo enriquecimento de H3K9me2 (n° de pico < 1). Na janela 5kb do sítio inserido por transgene entre nove eventos distintos, seis eventos mostraram pico zero e três eventos mostram um pico de H3K9me2. O baixo enriquecimento de H3K9me2 corresponde à expressão do transgene estável. Isso indica que o perfilamento de H3K9me2 fornece uma ferramenta eficaz para prever o risco de silenciamento de genes. [00075] Assessment of H3K9me2 enrichment using soybean key events to validate prediction of expression levels based on H3K9me2 profiling data. To evaluate the practical use of applying the H3K9me2 map as a tool to assess the potential risk of transgene silencing, nine major soybean events from the Enlist and Insect Resistance constructs are selected and listed in Table 2. insertion of these main events are already known, the enrichment profiles of H3K9me2 in the neighborhood (5kb) of the inserted site in the transgene are evaluated to predict the risk of gene silencing. As all key events are selected based on stable transgene expression and stability, the transgene is expected to be inserted into a locus with low H3K9me2 enrichment (peak no. < 1). In the 5kb window of the site inserted per transgene among nine distinct events, six events showed zero peak and three events showed an H3K9me2 peak. Low H3K9me2 enrichment corresponds to stable transgene expression. This indicates that H3K9me2 profiling provides an effective tool for predicting the risk of gene silencing.

Claims (7)

1. Método para prever o risco de silenciamento de transgenes, caracterizado pelo fato de que compreende: (a) gerar dados de perfil de metilação/acetilação de histona no genoma de uma planta a partir de um ensaio físico; (b) montar os dados do perfil de metilação/acetilação de histona da etapa (a) em uma base de dados de metilação/acetilação de histona que mostra os números de pico dos perfis de metilação/acetilação de histona; (c) analisar sequências de pelo menos um sítio de inserção de transgenes de um evento transgênico; (d) comparar as sequências do sítio de inserção do transgene da etapa (c) com a base de dados de metilação/acetilação de histona da etapa (b); sendo que (i) se o sítio de inserção do transgene cai no pico zero ou no pico um dos perfis de metilação/acetilação de histona, não existe risco de silenciamento do transgene, ou (ii) se o sítio de inserção do transgene cai no pico dois ou mais dos perfis de metilação/acetilação de histona, existe risco significativo de silenciamento do transgene; (e) selecionar o evento transgênico com menor probabilidade de silenciamento do transgene; e (f) obter uma planta que compreende o evento transgênico selecionado.1. Method for predicting the risk of transgene silencing, characterized by the fact that it comprises: (a) generating histone methylation/acetylation profile data in the genome of a plant from a physical assay; (b) assembling the histone methylation/acetylation profile data from step (a) into a histone methylation/acetylation database that shows the peak numbers of the histone methylation/acetylation profiles; (c) analyze sequences from at least one transgene insertion site from a transgenic event; (d) compare the transgene insertion site sequences from step (c) with the histone methylation/acetylation database from step (b); whereby (i) if the transgene insertion site falls into peak zero or peak one of the histone methylation/acetylation profiles, there is no risk of transgene silencing, or (ii) if the transgene insertion site falls into peak two or more of histone methylation/acetylation profiles, there is significant risk of transgene silencing; (e) select the transgenic event with the lowest probability of transgene silencing; and (f) obtaining a plant comprising the selected transgenic event. 2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que os dados do perfil de metilação/acetilação de histona são gerados utilizando um ensaio de sequenciamento de imunoprecipitação de cromatina (ChIP-seq).2. Method according to claim 1, characterized by the fact that histone methylation/acetylation profile data is generated using a chromatin immunoprecipitation sequencing (ChIP-seq) assay. 3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que os dados do perfil de metilação/acetilação de histona estão associados à metilação/acetilação de histona selecionada do grupo consistindo em H3K4me2, H3K4me3, H3K9/14ac, H3K9me2, H3K9me3, H3K27me1, H3K27me3 e H4K20me3 e combinações dos mesmos.3. Method according to claim 1, characterized by the fact that the histone methylation/acetylation profile data is associated with histone methylation/acetylation selected from the group consisting of H3K4me2, H3K4me3, H3K9/14ac, H3K9me2, H3K9me3 , H3K27me1, H3K27me3 and H4K20me3 and combinations thereof. 4. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que os dados do perfil de metilação/acetilação de histona estão associados à metilação/acetilação de histona selecionada do grupo consistindo em H3K9me2, H3K9me3, H3K27me1, H3K27me3 e H4K20me3 e combinações dos mesmos.4. Method according to claim 1, characterized by the fact that the histone methylation/acetylation profile data is associated with histone methylation/acetylation selected from the group consisting of H3K9me2, H3K9me3, H3K27me1, H3K27me3 and H4K20me3 and combinations of the same. 5. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que os dados do perfil de metilação/acetilação de histona estão associados à metilação de H3K9me2.5. Method according to claim 1, characterized by the fact that the histone methylation/acetylation profile data is associated with H3K9me2 methylation. 6. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a planta é selecionada dentre soja, milho, canola, algodão, trigo e arroz.6. Method, according to claim 1, characterized by the fact that the plant is selected from soybeans, corn, canola, cotton, wheat and rice. 7. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que as sequências do sítio de inserção do transgene são obtidas por sequenciamento direto.7. Method according to claim 1, characterized by the fact that the transgene insertion site sequences are obtained by direct sequencing.
BR112018006884-5A 2015-11-10 2016-10-25 METHODS AND SYSTEMS FOR PREDICTING THE RISK OF TRANSGENE S-LEARNING BR112018006884B1 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562253213P 2015-11-10 2015-11-10
US62/253,213 2015-11-10
PCT/US2016/058633 WO2017083092A1 (en) 2015-11-10 2016-10-25 Methods and systems for predicting the risk of transgene silencing

Publications (2)

Publication Number Publication Date
BR112018006884A2 BR112018006884A2 (en) 2018-10-16
BR112018006884B1 true BR112018006884B1 (en) 2023-07-18

Family

ID=

Similar Documents

Publication Publication Date Title
US10030248B2 (en) Regulatory polynucleotides and uses thereof
KR100863376B1 (en) High lysine maize compositions and methods for detection thereof
AU2017234672B2 (en) Zea mays regulatory elements and uses thereof
US20230203522A1 (en) Compositions and methods for expressing transgenes using regulatory elements from chlorophyll binding ab genes
US20200224269A1 (en) Methods and systems for predicting the risk of transgene silencing
US20210246461A1 (en) Plant regulatory elements and uses thereof
Zhao et al. The unique epigenetic features of Pack-MULEs and their impact on chromosomal base composition and expression spectrum
EA039606B1 (en) Plant regulatory elements and uses thereof
BR102015001527B1 (en) GENE EXPRESSION CASSETTE AND METHODS FOR EXPRESSION OF A CODING SEQUENCE IN A TRANSGENIC PLANT AND FOR MANUFACTURING A SYNTHETIC POLYNUCLEOTIDE SEQUENCE
BR112018003012B1 (en) NUCLEIC ACID VECTOR AND 3&#39;UTR OF ZRP2 BY ZEA MAYS
BR102016021980A2 (en) GENETICALLY MODIFIED PLANTS FOR IMPROVING CULTURAL PERFORMANCE
US9777286B2 (en) Zea mays metallothionein-like regulatory elements and uses thereof
BR112018006884B1 (en) METHODS AND SYSTEMS FOR PREDICTING THE RISK OF TRANSGENE S-LEARNING
BR112019027401A2 (en) plant promoter for transgene expression
BR112017021903B1 (en) PLANT PROMOTER FOR TRANSGENE EXPRESSION
BR112020008180A2 (en) plant promoter for transgene expression
BR112017021703B1 (en) PLANT PROMOTER FOR TRANSGENE EXPRESSION
WO2024006394A1 (en) Methods and systems for generating regulatory elements
CN114514330A (en) Compositions and methods for detecting chromosomal translocations in brassica napus
JP2021519064A (en) Regulation of reducing sugar content in plants
BR112020009457A2 (en) promoter of protein related to plant pathogenesis for transgenic expression