BR112014002342A2 - moléculas terminais, método de identificação e isolamento de moléculas terminais, método de produção de moléculas terminais recombinantes, método de produção de plantas ou suas partes com expressão amplificada, construção de expressão recombinante, vetor de expressão recombinante, célula transgênica, planta transgênica ou sua parte, cultivo de células transgênicas, sementes trasngênicas, partes ou material de propagação derivados de uma célula ou planta transgênica ou sua parte, uso da molécula terminal e método de produção de produto agrícola - Google Patents

moléculas terminais, método de identificação e isolamento de moléculas terminais, método de produção de moléculas terminais recombinantes, método de produção de plantas ou suas partes com expressão amplificada, construção de expressão recombinante, vetor de expressão recombinante, célula transgênica, planta transgênica ou sua parte, cultivo de células transgênicas, sementes trasngênicas, partes ou material de propagação derivados de uma célula ou planta transgênica ou sua parte, uso da molécula terminal e método de produção de produto agrícola Download PDF

Info

Publication number
BR112014002342A2
BR112014002342A2 BR112014002342-5A BR112014002342A BR112014002342A2 BR 112014002342 A2 BR112014002342 A2 BR 112014002342A2 BR 112014002342 A BR112014002342 A BR 112014002342A BR 112014002342 A2 BR112014002342 A2 BR 112014002342A2
Authority
BR
Brazil
Prior art keywords
seq
terminal
nucleic acid
expression
molecules
Prior art date
Application number
BR112014002342-5A
Other languages
English (en)
Inventor
Julia Verena Hartig
Alrun Nora Burgmeier
Elke Duwenig
Josef Martin Kuhn
Linda Patricia Loyall
Original Assignee
Basf Plant Science Company Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Basf Plant Science Company Gmbh filed Critical Basf Plant Science Company Gmbh
Publication of BR112014002342A2 publication Critical patent/BR112014002342A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Botany (AREA)
  • Immunology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

MOLÉCULAS TERMINAIS, MÉTODO DE IDENTIFICAÇÃO, MÉTODO PARA PRODUZIR UMA MOLÉCULA TERMINAL, MÉTODO PARA PRODUZIR UMA PLANTA, CONSTRUÇÃO DE EXPRESSÃO, VETOR DE EXPRESSÃO, MICROORGANISMOS TRANSGÊNICOS, CULTIVO DE MICROORGANISMOS TRANSGÊNICOS, USO DA MOLÉCULA TERMINAL E MÉTODO PARA A PRODUÇÃO DE UM PRODUTO AGRÍCOLA A presente invenção refere-se a construções de DNA, sistemas e métodos eficientes e de alto rendimento para identificação e isolamento de sequências terminais que causam transcrição aumenta da. A presente invenção refere-se ainda a sequências terminais isoladas com esses métodos e seu uso para aumentar a expressão genética.

Description

“MOLÉCULAS TERMINAIS, MÉTODO DE IDENTIFICAÇÃO, MÉTODO PARA PRODUZIR UMA MOLÉCULA TERMINAL, MÉTODO PARA PRODUZIR UMA PLANTA, CONSTRUÇÃO DE EXPRESSÃO, VETOR DE EXPRESSÃO, MICROORGANISMOS TRANSGÊNICOS, CULTIVO DE MICROORGANISMOS TRANSGÊNICOS, USO DA MOLÉCULA TERMINAL E MÉTODO PARA A PRODUÇÃO DE UM PRODUTO AGRÍCOLA” CAMPO DA INVENÇÃO
[001] A presente invenção refere-se a construções de DNA, sistemas e métodos eficientes e de alto rendimento para identificação e isolamento de sequências terminais que causam transcrição aumentada. A presente invenção refere-se ainda a sequências terminais isoladas com esses métodos e seu uso para aumentar a expressão genética.
ANTECEDENTES DA INVENÇÃO
[002] O objetivo da biotecnologia vegetal é a geração de plantas com propriedades inovadoras vantajosas, tais como resistência a doenças e pragas, resistência à tensão ambiental (tal como cheias, secas, calor, frio, intensidade de luz, duração do dia, substâncias etc.), qualidades aprimoradas (tais como alto rendimento de frutos, vida em armazenagem mais longa, forma e cor uniforme dos frutos, teor de açúcar mais alto, teor mais alto de vitaminas A e C, acidez mais baixa etc.) ou para a produção de certas substâncias ou produtos farmacêuticos (Dunwell, 2000). Além disso, pode-se aumentar a resistência a tensões abióticas (seca, sal) e/ou tensão biótica (insetos, fungos, infecções por nematoides). Aumento do rendimento de safra e estabilidade do rendimento podem ser atingidos por meio do desenvolvimento de plantas geneticamente elaboradas com fenótipos desejados.
[003] Para todos os campos da biotecnologia, além das sequências promotoras, sequências terminais posicionadas na 3’ UTR de genes são um pré-requisito básico para a expressão recombinante de genes específicos. Em sistemas animais, foi bem definida uma estrutura de término de transcrição (Zhao et al, 1999; Proudfoot, 1986; Kim et al, 2003; Yonaha e Proudfoot, 2000; Cramer et al, 2001; Kuerstem e Goodwin, 2003).
[004] Terminais podem, entretanto, ter mais efeito que o simples término da transcrição. Narsai et al, por exemplo, relataram que os terminais abrigam elementos de estabilização ou desestabilização de mRNA (Narsai et al, 2007). Dentre estes, podem estar elementos ricos em AU ou locais de ligação de miRNA. Além disso, término eficiente pode servir para liberar a polimerase de transcrição para reciclagem de volta para o local de início da transcrição. Isso pode causar níveis mais altos de início da transcrição (Nagaya et al, 2010; Mapendano et al, 2010). O processamento da extremidade 3’ de um mRNA pode também estar envolvido na exportação nuclear e tradução subsequente. Sequências terminais podem, portanto, influenciar o nível de expressão de transgenes positiva ou negativamente.
[005] Experimentos mutagênicos de terminais de plantas identificaram três elementos principais: elementos acima no fluxo distantes (FUEs), elementos acima no fluxo próximos (NUEs; motivos similares a AAUAAA) e um local de divisão/poliadenilação (CS). A região NUE é um elemento rico em A localizado dentro de até 30 nt do local póli(A) (Hunt, 1994).
A região FUE é uma sequência rica em U ou UG que aumenta a eficiência de processamento no CS (Mogen et al, 1990, Rothnie, 1996), que é ela própria um dinucleotídeo YA (CA ou UA) dentro de uma região rica em U na qual ocorre a poliadenilação (Bassett, 2007).
[006] Na biotecnologia vegetal, transgentes frequentemente necessitam ser expressos em altos níveis para causar efeito desejado. Para a maior parte das aplicações, considera-se que a resistência do promotor decide principalmente sobre os níveis de expressão de um transgene. A identificação e a caracterização de promotores é cara e demorada, pois todo promotor possui a sua própria resistência e padrão de expressão específicos. Além disso, o conjunto de promotores fortes apropriados é limitado. Com o processamento de biotecnologia vegetal moderno em direção à reunião de diversos conjuntos de expressão em uma construção, dobrar elementos promotores fortes idênticos para expressão genética ideal apresenta o risco de recombinação homóloga ou silenciamento de genes de transcrição. O uso de um promotor mais fraco como alternativa para eliminar este problema pode, entretanto, limitar a expressão de um gene na construção. Isso, por sua vez, dificulta a geração do fenótipo desejado na planta transgênica.
[007] No lugar de promotores fortes, podem ser utilizadas sequências terminais para atingir níveis de expressão aumentada do gene ao qual são funcionalmente ligados. Isso permite o uso de promotores mais fracos alternativos em uma construção com múltiplos genes sem comprometer os níveis de expressão gerais. Uma vantagem adicional pode ser o fato de que os padrões de expressão e especificidade de promotores não são alterados caso apenas o terminal seja modificado.
[008] É, portanto, um objeto da presente invenção fornecer um método de identificação, isolamento e teste de sequências terminais que aumentam a expressão genética em plantas. Também é um objetivo da presente invenção fornecer esses terminais que aumentam a expressão genética. Um objetivo adicional da presente invenção é o fornecimento de terminais que terminem eficientemente a transcrição. Estes objetivos são atingidos pela presente invenção.
DESCRIÇÃO DETALHADA DA INVENÇÃO
[009] Uma primeira realização da presente invenção são moléculas terminais que compreendem pelo menos um dos elementos terminais aprimoradores (ETE) conforme definido na Tabela 1 ou suas combinações conforme definido na Tabela 2 ou o complemento ou complemento reverso de qualquer um desses ETs ou combinações desses ETs, em que as moléculas terminais que compreendem os mencionados ETs ou suas combinações causam expressão aumentada de moléculas de ácido nucleico heterólogas a serem expressas, às quais as moléculas terminais são ligadas funcionalmente.
[010] Elementos terminais aprimoradores são motivos de sequência definidos por uma sequência de núcleo altamente conservada com cerca de quatro a seis nucleotídeos rodeados por uma sequência de matrizes conservadas de, ao todo, até 26 nucleotídeos dentro da fita mais ou menos do ET, que é capaz de interagir com proteínas de ligação de DNA ou moléculas de ácido nucleico de ligação de DNA. A sequência de matrizes conservadas permite alguma variabilidade de sequência sem perder a sua capacidade de ligação pelas proteínas de ligação de DNA ou ácidos nucleicos.
[011] Uma forma de descrever locais de ligação de ácidos nucleicos ou proteínas de ligação de DNA é por meio de matrizes de peso de posição ou nucleotídeos (NWM ou PWM) (para análise, vide Stormo, 2000). A definição de padrão de matrizes de peso é superior a uma sequência de consenso de IUPAC simples, pois ela representa a distribuição de nucleotídeos completa para cada posição isolada. Ela também permite a quantificação da similaridade entre a matriz de peso e um local de ligação de ácido nucleico ou proteína de ligação de DNA potencial detectado na sequência (Cartharius et al, 2005).
[012] A “sequência central” de uma matriz é definida como as quatro, cinco ou seis posições conservadas mais altas consecutivas da matriz.
[013] A similaridade de núcleos é calculada conforme descrito no presente e nos documentos relativos a MatInspector (Cartharius, K. et al (2005), Bioinformatics 21; Cartharius, K. (2005), DNA Press; Quandt, K. et al (1995), Nucleic Acids Res. 23).
[014] A similaridade máxima de núcleos de 1,0 somente é atingida quando a sequência das bases com conservação mais alta de uma matriz coincidir exatamente. Mais importante que a similaridade de núcleos é a similaridade de matrizes, que considera todas as bases ao longo de todo o comprimento de matriz.
A similaridade de matrizes é calculada conforme descrito no presente e no documento de MatInspector (Quandt, K. et al (1995), Nucleic Acids Res. 23).
Coincidência perfeita com a matriz gera avaliação de 1,00 (cada posição de sequência corresponde ao nucleotídeo com conservação mais alta naquela posição na matriz) e “boa” coincidência com a matriz possui similaridade > 0,80.
[015] Faltas de coincidência em posições altamente conservadas da matriz reduzem a similaridade de matrizes mais que faltas de coincidência em regiões menos conservadas.
[016] Em uma realização, os ETs possuem uma sequência conforme definido na Tabela 1. Em outra realização, a sequência de ETs é definida conforme descrito na Tabela 10, em que a similaridade de núcleos e matrizes de uma sequência de coincidência é calculada conforme descrito em Quandt et al (1995, NAR 23 (23) 4878-4884) nas equações 2 e 3 da coluna direita da página 4879, em que a similaridade de matrizes é de pelo menos 0,8, preferencialmente a similaridade de matrizes é de pelo menos 0,85, de maior preferência a similaridade de matrizes é de pelo menos 0,9 e, de preferência ainda maior, a similaridade de matrizes é de pelo menos 0,95. Em uma realização de preferência superior, a similaridade de matrizes é de pelo menos 1,0. Em uma realização, a similaridade de núcleos é de pelo menos 0,75, preferencialmente a similaridade de núcleos é de pelo menos 0,8, tal como 0,85, de maior preferência a similaridade de núcleos é de pelo menos 0,9 e, de preferência ainda maior, a similaridade de núcleos é de pelo menos 0,95. Em uma realização de preferência superior, a similaridade de núcleos é de pelo menos 1,0. Deve-se compreender a referência a um SEQ ID de acordo com qualquer dos ETs de acordo com a presente invenção como as sequências definidas na Tabela 1 ou conforme descrito na Tabela 10.
[017] Preferencialmente, as moléculas terminais estão compreendendo pelo menos um dos Elementos Terminais Aprimoradores (ET) definidos por SEQ ID NO: 5 ou SEQ ID NO: 6 ou a combinação de SEQ ID NO: e SEQ ID NO: 6.
[018] Preferencialmente, todos os elementos ET de um grupo (ou seja, uma linha na Tabela 2) estão presentes em um terminal definido como aumentador da expressão. Cada combinação de pelo menos dois, preferencialmente pelo menos três e, de preferência superior, todos os elementos ET de um grupo (ou seja, uma linha na Tabela 2) estão presentes em uma sequência terminal que aumenta a expressão genética.
[019] Em uma realização preferida, essas moléculas terminais são ligadas funcionalmente a outra molécula de ácido nucleico heteróloga à molécula terminal de acordo com a presente invenção. Essa molécula de ácido nucleico pode ser, por exemplo, qualquer molécula de ácido nucleico reguladora, tal como promotor, NEENA ou intron. A molécula de ácido nucleico pode também ser qualquer ácido nucleico a ser expresso tal como um gene de interesse, região de codificação ou região não codificadora, tal como 5’ ou 3’ UTR, microRNA, RNAi, RNA sem sentido e similares.
[020] Outra realização da presente invenção são moléculas terminais que compreendem uma sequência selecionada a partir do grupo que consiste de: a. as moléculas de ácido nucleico que possuem uma sequência conforme definido em SEQ ID NO: 1, 2, 3, 4, 57, 58, 59, 60, 61, 62, 63 e 64; ou b. uma molécula de ácido nucleico que contém uma sequência com identidade de pelo menos 60% ou mais a qualquer uma das sequências conforme definido por SEQ ID NO: 1, 2, 3, 4, 57, 58, 59, 60, 61, 62,
63 e 64, preferencialmente 70% ou mais a qualquer das sequências conforme definido por SEQ ID NO: 1, 2, 3, 4, 57, 58, 59, 60, 61, 62, 63 e 64, tal como
80% ou mais a qualquer das sequências conforme definido por SEQ ID NO: 1,
2, 3, 4, 57, 58, 59, 60, 61, 62, 63 e 64, de maior preferência a identidade é de
85% ou mais, de maior preferência a identidade é de 90% ou mais, de preferência ainda maior a identidade é de 95% ou mais, 96% ou mais, 97% ou mais, 98% ou mais e, na realização de preferência superior, a identidade é de
99% ou mais a qualquer das sequências conforme definido por SEQ ID NO: 1,
2, 3, 4, 57, 58, 59, 60, 61, 62, 63 e 64; ou c. um fragmento de 100 ou mais bases consecutivas,
preferencialmente 150 ou mais bases consecutivas, de maior preferência 200 bases consecutivas ou, de preferência ainda maior, 250 ou mais bases consecutivas de uma molécula de ácido nucleico de a ou b que possui atividade que aumenta a expressão, tal como 65% ou mais, preferencialmente
70% ou mais, de maior preferência 75% ou mais, de preferência ainda maior
80% ou mais, 85% ou mais ou 90% ou mais; em uma realização de preferência superior, possui 95% ou mais da atividade que aumenta a expressão, pois a molécula de ácido nucleico correspondente possui a sequência de qualquer uma das sequências conforme definido por SEQ ID NO: 1, 2, 3, 4, 57, 58, 59,
60, 61, 62, 63 e 64; ou d. uma molécula de ácido nucleico que é o complemento ou complemento reverso de qualquer das moléculas de ácido nucleico mencionadas anteriormente em a ou b; ou e. uma molécula de ácido nucleico que pode ser obtida por
PCR com DNA genômico, preferencialmente DNA genômico vegetal, de maior preferência DNA genômico de plantas monocotiledôneas utilizando primers de oligonucleotídeos descritos por SEQ ID NO: 67 a 96, conforme exibido na
Tabela 5; ou f. uma molécula de ácido nucleico de 100 nucleotídeos ou mais, 150 nucleotídeos ou mais, 200 nucleotídeos ou mais ou 250 nucleotídeos ou mais, que se hibridiza sob condições equivalentes à hibridização em 7% de dodecil sulfato de sódio (SDS), 0,5 M de NaPO4, 1 mM de EDTA a 50 ºC com lavagem em 2X SSC, 0,1% de SDS a 50 ºC ou 65 ºC, preferencialmente 65 ºC para uma molécula de ácido nucleico que compreende pelo menos 50,
preferencialmente pelo menos 100, de maior preferência pelo menos 150, de preferência ainda maior pelo menos 200, de preferência superior pelo menos
250 nucleotídeos consecutivos de um terminal que aumenta a transcrição descrito por SEQ ID NO: 1, 2, 3, 4, 57, 58, 59, 60, 61, 62, 63 e 64 ou seu complemento; preferencialmente, a mencionada molécula de ácido nucleico hibridiza-se sob condições equivalentes à hibridização em 7% de dodecilsulfato de sódio (SDS), 0,5 M de NaPO4, 1 mM de EDTA a 50 ºC com lavagem em 1 X
SSC, 0,1% de SDS a 50 ºC ou 65 ºC, preferencialmente 65 ºC para uma molécula de ácido nucleico que compreende pelo menos 50, preferencialmente pelo menos 100, de maior preferência pelo menos 150, de preferência ainda maior pelo menos 200, de preferência superior pelo menos 250 nucleotídeos consecutivos de um terminal que aumenta a transcrição descrito por SEQ ID
NO: 1, 2, 3, 4, 57, 58, 59, 60, 61, 62, 63 e 64 ou seu complemento e, de maior preferência, a mencionada molécula de ácido nucleico hibridiza-se sob condições equivalentes à hibridização em 7% de dodecilsulfato de sódio (SDS),
0,5 M de NaPO4, 1 mM de EDTA a 50 ºC com lavagem em 0,1 X SSC, 0,1% de SDS a 50 ºC ou 65 ºC, preferencialmente 65 ºC para uma molécula de ácido nucleico que compreende pelo menos 50, preferencialmente pelo menos 100,
de maior preferência pelo menos 150, de preferência ainda maior pelo menos
200 e, de preferência superior, pelo menos 250 nucleotídeos consecutivos de um terminal que aumenta a transcrição por qualquer uma das sequências conforme definido por SEQ ID NO: 1, 2, 3, 4, 57, 58, 59, 60, 61, 62, 63 e 64; em que as moléculas terminais conforme definido em a até f causam expressão aumentada de moléculas de ácido nucleico heterólogas às quais são ligadas funcionalmente.
[021] Preferencialmente, as moléculas de ácido nucleico conforme definido acima em b até f são moléculas terminais aumentadoras funcionais e, portanto, terminam a transcrição e possuem pelo menos 50% do efeito que aumenta a expressão da molécula correspondente conforme definido acima em a. De maior preferência, as moléculas de ácido nucleico conforme definido acima em b até f compreendem os elementos Terminais Aprimoradores (ET) compreendidos nas moléculas de ácido nucleico conforme definido acima em a e conforme definido na Tabela 1 ou na Tabela 10 ou suas combinações conforme definido na Tabela 2 e são moléculas terminais aumentadoras funcionais, sendo, portanto, transcrição de término, e possuem pelo menos 50% do efeito que aumenta a expressão das moléculas definidas acima em a. As moléculas de ácido nucleico conforme definido acima em b até f, por exemplo, compreendem sinais de poliadenilação funcionais e teor de AT que não se afastam em mais de 50%, preferencialmente 40%, de maior preferência 30%, de preferência ainda maior 20% e, de preferência especial, 10% do teor de AT das moléculas conforme definido acima em a. De preferência superior, elas possuem teor de AT idêntico às moléculas definidas acima em a.
[022] Uma realização adicional da presente invenção é um método de identificação e isolamento de moléculas terminais que causam expressão aumentada de moléculas de ácido nucleico heterólogas às quais as moléculas terminais são ligadas funcionalmente, que compreende as etapas de identificação de moléculas de ácido nucleico que compreendem uma sequência que compreende não mais de 500 bp, preferencialmente 400 bp, de maior preferência 300 bp, de preferência superior 250 bp, pelo menos um, preferencialmente pelo menos dois e, de maior preferência, pelo menos quatro ETs conforme definido na Tabela 1 ou conforme definido na Tabela 10. De preferência superior, elas compreendem todos os elementos de ET relacionados em uma linha da Tabela 2. Em outra etapa da presente invenção, as moléculas de ácido nucleico correspondentes são isoladas do seu ambiente natural, tais como DNA genômico, com métodos conhecidos dos técnicos no assunto ou sintetizadas.
[023] Uma realização adicional da presente invenção é um método de identificação e isolamento de moléculas terminais que causam expressão aumentada de moléculas de ácido nucleico heterólogas às quais as moléculas terminais são ligadas funcionalmente, que compreende as etapas de: a. identificação de 3’ UTR e/ou uma região transcrita tal como uma região de codificação; b. identificação de DNA genômico correspondente; c. identificação de moléculas no grupo identificado em b que contêm quaisquer dos ETs ou suas combinações conforme definido na Tabela 1 ou nas Tabelas 10 e 2 utilizando qualquer detecção de ET por computador ou análise de sequências de coincidência de conjuntos (string matching) IUPAC; e d. isolamento de pelo menos 250 bp de DNA genômico que compreende os mencionados ETs.
[024] 3’UTRs e o DNA genômico correspondente podem ser identificados por meio de qualquer método conhecido dos técnicos no assunto, tais como determinação de sequências de cDNAs de comprimento total, previsões de computação baseadas, por exemplo, na previsão de sequências de codificação em sequências de DNA genômico ou no uso de bancos de dados indicados, por exemplo, para cDNAs ou DNA genômico.
[025] A expressão “DNA genômico correspondente” deve ser compreendida como DNA genômico, preferencialmente DNA genômico vegetal, de maior preferência DNA genômico de plantas monocotiledôneas que compreende a sequência identificada como 3’UTR ou região transcrita na etapa a. O DNA genômico correspondente pode compreender uma sequência idêntica ou uma sequência que possui identidade de pelo menos 60%, preferencialmente 70% ou mais, tal como 80% ou mais, de maior preferência a identidade é de 85% ou mais, de maior preferência a identidade é de 90% ou mais, de preferência ainda maior a identidade é de 95% ou mais, 96% ou mais, 97% ou mais, 98% ou mais; na realização de preferência superior, a identidade é de 99% ou mais a qualquer das sequências de 3’UTR ou região transcrita identificada na etapa a.
[026] A identificação de moléculas no grupo identificado em b que contêm qualquer dos ETs ou suas combinações pode ser realizada, por exemplo, com ferramentas conhecidas dos técnicos no assunto, tais como MatInspector da Genomatix Software GmbH, a suíte MEME da Universidade de Queensland e da Universidade de Washington ou ferramentas comparáveis. O isolamento dos pelo menos 250 bp, tal como 300 bp, preferencialmente pelo menos 350 bp, por exemplo 400 bp, de maior preferência pelo menos 450 bp, tal como 500 bp, pode ser realizado com métodos recombinantes conhecidos na técnica, tais como PCR, clonagem de restrição ou síntese genética. As moléculas terminais que aumentam a expressão isoladas podem, em etapas subsequentes, ser ligadas funcionalmente a promotores e/ou moléculas de ácido nucleico a serem expressos. Os técnicos no assunto conhecem diversos métodos de ligação funcional de duas ou mais moléculas de ácido nucleico.
Esses métodos podem englobar a restrição/ligação, clonagem independente de ligase, engenharia de recombinação, recombinação ou síntese. Outros métodos podem ser empregados para ligar funcionalmente duas ou mais moléculas de ácido nucleico.
[027] Uma realização adicional da presente invenção é um método de produção de plantas ou suas partes com expressão aumentada, em comparação com uma planta controle correspondente ou sua parte, de uma ou mais moléculas de ácido nucleico que compreende as etapas de: a. introdução das uma ou mais moléculas terminais que aumentam a expressão conforme definido acima em uma planta ou sua parte; e, b. integração da mencionada uma ou mais moléculas terminais que aumentam a expressão no genoma da mencionada célula vegetal, planta ou sua parte, em que as mencionadas uma ou mais moléculas terminais que aumentam a expressão são ligadas funcionalmente a um ácido nucleico endógeno heterólogo para as mencionadas uma ou mais moléculas terminais que aumentam a expressão; e, opcionalmente, c. regeneração de uma planta ou sua parte que compreende os mencionados um ou mais terminais que aumentam a expressão da mencionada célula vegetal transformada, planta ou sua parte.
[028] As uma ou mais moléculas terminais que aumentam a expressão podem ser introduzidas na planta ou sua parte por meio de bombardeamento de partículas, eletroporação de protoplastas, infecção viral, transformação mediada por Agrobacterium ou qualquer outra abordagem conhecida na técnica. A molécula terminal que aumenta a expressão pode ser introduzida de forma integrada, por exemplo, em um plasmídeo, DNA viral ou RNA viral. A molécula terminal que aumenta a expressão pode também ser compreendida em um BAC, YAC ou cromossomo artificial antes da introdução na planta ou parte da planta. Ela pode também ser introduzida como molécula de ácido nucleico linear que compreende a sequência terminal que aumenta a expressão em que sequências adicionais podem estar presentes ao lado da sequência terminal que aumenta a expressão sobre a molécula de ácido nucleico. Essas sequências vizinhas à sequência terminal que aumenta a expressão podem ser de cerca de 20 bp, tal como 20 bp a várias centenas de pares de bases, tal como 100 bp ou mais e podem facilitar a integração ao genoma, por exemplo, por meio de recombinação homóloga. Qualquer outro método de integração genômica pode ser empregado, tais como abordagens de integração dirigidas, como abordagens de integração aleatória ou recombinação homóloga, tais como recombinação ilegítima.
[029] O ácido nucleico endógeno ao qual pode ser ligada a molécula terminal que aumenta a expressão pode ser qualquer molécula de ácido nucleico. A molécula de ácido nucleico pode ser uma molécula de ácido nucleico codificadora de proteínas ou uma molécula não codificadora tal como RNA sem sentido, rRNA, tRNA, miRNA, ta-siRNA, siRNA, dsRNA, snRNA, snoRNA ou qualquer outro RNA não codificador conhecido na técnica.
[030] Uma outra realização da presente invenção é um método de produção de plantas ou suas partes com expressão aumentada, em comparação com uma planta controle correspondente ou sua parte, de uma ou mais moléculas de ácido nucleico que compreende as etapas de:
1. ligação funcional de uma ou mais moléculas terminais que aumentam a expressão a uma molécula promotora e/ou de ácido nucleico que se encontra sob o controle do mencionado promotor; e
2. introdução no genoma de planta ou sua parte das mencionadas uma ou mais moléculas terminais que aumentam a expressão que compreendem ET ou suas combinações conforme definido na Tabela 1, 10 ou 2 ou uma molécula terminal conforme definido acima em a até f ligada funcionalmente ao mencionado promotor heterólogo e/ou ao mencionado ácido nucleico heterólogo a ser expresso; e
3. regeneração de uma planta ou sua parte que compreende as mencionadas uma ou mais moléculas terminais que aumentam a expressão a partir da mencionada planta transformada ou sua parte.
[031] A molécula terminal que aumenta a expressão pode ser heteróloga à molécula de ácido nucleico que se encontra sob o controle do mencionado promotor ao qual o terminal que aumenta a expressão é ligado funcionalmente ou pode ser heteróloga ao promotor e a molécula de ácido nucleico sob o controle do mencionado promotor.
[032] As uma ou mais moléculas terminais que aumentam a expressão podem ser introduzidas na planta ou sua parte por meio de bombardeamento de partículas, eletroporação de protoplastas, infecção viral, transformação mediada por Agrobacterium ou qualquer outra abordagem conhecida na técnica. A molécula terminal que aumenta a expressão pode ser introduzida de forma integrada, por exemplo, em um plasmídeo, DNA viral ou RNA viral. A molécula terminal que aumenta a expressão pode também ser compreendida em um BAC, YAC ou cromossomo artificial antes da introdução na planta ou parte da planta. Ela pode também ser introduzida como molécula de ácido nucleico linear que compreende a sequência terminal que aumenta a expressão em que sequências adicionais podem estar presentes ao lado da sequência terminal que aumenta a expressão sobre a molécula de ácido nucleico. Essas sequências vizinhas à sequência terminal que aumenta a expressão podem ser de cerca de 20 bp, tal como 20 bp a várias centenas de pares de bases, tal como 100 bp ou mais e podem facilitar a integração ao genoma, por exemplo, por meio de recombinação homóloga. Qualquer outro método de integração genômica pode ser empregado, tais como abordagens de integração dirigidas, como abordagens de integração aleatória ou recombinação homóloga, tais como recombinação ilegítima.
[033] Em uma realização dos métodos de acordo com a presente invenção definidos acima, o método compreende as etapas de: i. fornecimento de uma construção de expressão que compreende uma ou mais moléculas terminais que aumentam a expressão que compreendem ET ou suas combinações conforme definido na Tabela 1, 10 ou 2 ou molécula terminal conforme definido acima em a até f ligada funcionalmente a um promotor e a uma ou mais moléculas de ácido nucleico, em que esta última é heteróloga às mencionadas uma ou mais moléculas terminais que aumentam a expressão e encontra-se sob o controle do mencionado promotor; e ii. integração da mencionada construção de expressão que compreende as mencionadas uma ou mais moléculas terminais que aumentam a expressão ao genoma da mencionada planta ou parte dela; e, opcionalmente, iii. regeneração de uma planta ou sua parte que compreende as mencionadas uma ou mais construções de expressão da mencionada planta transformada ou sua parte.
[034] Os métodos de acordo com a presente invenção podem ser aplicados a qualquer planta, tal como gimnosperma ou angiosperma, preferencialmente angiosperma, tais como plantas dicotiledôneas ou monocotiledôneas. Plantas monocotiledôneas preferidas são, por exemplo, milho, trigo, arroz, cevada, sorgo, banana, cana de açúcar, miscanthus e brachypodium e plantas monocotiledôneas de preferência especial são milho, trigo e arroz. Plantas dicotiledôneas preferidas são, por exemplo, soja, colza, canola, linhaça, algodão, batata, beterraba, tagetes e Arabidopsis; plantas dicotiledôneas especialmente preferidas são soja, colza, canola e batata.
[035] Uma planta que exibe expressão aumentada de uma molécula de ácido nucleico da forma indicada no presente indica uma planta que possui expressão mais alta, preferencialmente mais alta de forma estatisticamente significativa, de uma molécula de ácido nucleico em comparação com uma planta controle cultivada sob as mesmas condições sem o terminal que aumenta a expressão correspondente ligado funcionalmente à molécula de ácido nucleico correspondente. Essa planta controle pode ser uma planta do tipo selvagem ou uma planta transgênica que compreende o mesmo promotor que controla o mesmo gene da planta de acordo com a presente invenção, em que o promotor e/ou o ácido nucleico a serem expressos não são ligados a um terminal que aumenta a expressão de acordo com a presente invenção.
[036] Uma construção de expressão recombinante que compreende uma ou mais moléculas terminais que aumentam a expressão que compreendem ET ou suas combinações conforme definido na Tabela 1, 10 ou 2 ou uma molécula terminal que aumenta a expressão conforme definido acima em a até f é uma realização adicional da presente invenção. A construção de expressão recombinante pode compreender adicionalmente um ou mais promotores e, opcionalmente, uma ou mais moléculas de ácido nucleico expressas às quais as uma ou mais moléculas terminais que aumentam a expressão são ligadas funcionalmente, em que pelo menos a última é heteróloga às mencionadas uma ou mais moléculas terminais que aumentam a expressão.
[037] A molécula terminal que aumenta a expressão pode ser heteróloga à molécula de ácido nucleico que se encontra sob o controle do mencionado promotor ao qual a molécula terminal que aumenta a expressão é ligada funcionalmente ou pode ser heteróloga ao promotor e para a molécula de ácido nucleico sob o controle do mencionado promotor.
[038] A construção de expressão pode compreender uma ou mais, tal como duas ou mais, por exemplo, cinco ou mais, tal como dez ou mais combinações de promotores ligados funcionalmente a uma molécula terminal que aumenta a expressão e uma molécula de ácido nucleico a ser expressa que é heteróloga à molécula terminal que aumenta a expressão correspondente. A construção de expressão pode também compreender construções de expressão adicionais que não compreendem uma molécula terminal que aumenta a expressão.
[039] Um vetor de expressão recombinante que compreende uma ou mais construções de expressão recombinantes conforme definido acima é outra realização da presente invenção. Diversos vetores de expressão que podem ser utilizados na presente invenção são conhecidos dos técnicos no assunto. Métodos de introdução desse vetor que compreende essa construção de expressão que compreende, por exemplo, um promotor ligado funcionalmente a um terminal que aumenta a expressão e, opcionalmente, outros elementos tais como promotores, UTRs, NEENAs e similares no genoma de uma planta e para recuperar plantas transgênicas de uma célula transformada também são bem conhecidos na técnica. Dependendo do método utilizado para transformação de plantas ou suas partes, todo o vetor pode ser integrado ao genoma da mencionada planta ou sua parte ou certos componentes do vetor poderão ser integrados ao genoma, tal como T-DNA.
[040] Uma célula transgênica, planta transgênica ou sua parte que compreende um vetor de expressão recombinante conforme definido acima ou uma construção de expressão recombinante conforme definido acima é outra realização da presente invenção. A célula transgênica, planta transgênica ou sua parte pode ser selecionada a partir do grupo que consiste de bactérias, fungos, leveduras, plantas ou células de plantas, insetos ou mamíferos. Células transgênicas preferidas são células de bactérias, fungos, leveduras e plantas. Bactérias preferidas são Enterobacteria, tais como E. coli e bactérias do gênero Agrobacteria, tais como Agrobacterium tumefaciens e Agrobacterium rhizogenes. Plantas preferidas são plantas monocotiledôneas ou dicotiledôneas, tais como plantas de safra monocotiledôneas ou dicotiledôneas, tais como milho, soja, canola, algodão, batata, beterraba, arroz, trigo, sorgo, cevada, banana, cana de açúcar, miscanthus e similares. Plantas de safra preferidas são milho, arroz, trigo, soja, canola, algodão ou batata.
Plantas de safra dicotiledôneas de preferência especial são soja, canola, algodão ou batata.
[041] Plantas de safra monocotiledôneas de preferência especial são milho, trigo e arroz.
[042] O cultivo de células transgênicas, sementes transgênicas, partes ou material de propagação derivados de uma célula ou planta transgênica ou sua parte conforme definido acima que compreendem a mencionada molécula terminal que aumenta a expressão heteróloga que compreende ET ou sua combinação conforme definido na Tabela 1, 10 ou 2 ou uma molécula terminal que aumenta a expressão conforme definido acima em a até f, a mencionada construção de expressão recombinante ou o mencionado vetor recombinante conforme definido acima são outras realizações da presente invenção.
[043] Partes transgênicas ou material de propagação conforme indicado no presente compreendem todos os tecidos e órgãos, tais como folhas, hastes e frutos, bem como material que é útil para a propagação e/ou regeneração de plantas tais como cortes, mudas, camadas, ramos ou brotos que compreendem a molécula terminal que aumenta a expressão, construção de expressão recombinante ou vetor recombinante correspondente.
[044] Uma realização adicional da presente invenção é o uso da molécula terminal que aumenta a expressão que compreende ET ou suas combinações conforme definido na Tabela 1, 10 ou 2 ou uma molécula terminal que aumenta a expressão conforme definido acima em a até f ou a construção recombinante ou vetor recombinante conforme definido acima para aumentar a expressão em plantas ou suas partes.
[045] Uma realização adicional da presente invenção é um método de fabricação de produtos agrícolas por meio da introdução de uma molécula terminal que aumenta a expressão que compreende ET ou uma de suas combinações conforme definido na Tabela 1, 10 ou 2 ou uma molécula terminal que aumenta a expressão conforme definido acima em a até f ou a construção recombinante ou vetor recombinante conforme definido acima em plantas, cultivo da planta, colheita e processamento da planta ou suas partes.
[046] Uma realização adicional da presente invenção é um método de produção de moléculas terminais recombinantes que aumenta a expressão de moléculas de ácido nucleico heterólogas às quais a molécula terminal é ligada funcionalmente, em que o método compreende as etapas de introdução, em uma molécula terminal que não possui a propriedade que aumenta a expressão, de pelo menos um elemento ET conforme definido na Tabela 1, Tabela 10 ou suas combinações conforme definido na Tabela 2 ou seu complemento ou complemento reverso.
[047] Em uma realização, os ETs possuem uma sequência conforme definido na Tabela 1. Em outra realização, a sequência de ETs é definida conforme descrito na Tabela 10, em que a similaridade de núcleos e matrizes de uma sequência de coincidência é calculada conforme descrito em Quandt et al (1995, NAR 23 (23) 4878-4884) nas equações 2 e 3 da coluna da direita da página 4879, em que a similaridade de matrizes é de pelo menos 0,8, preferencialmente a similaridade de matrizes é de pelo menos 0,85, de maior preferência a similaridade de matrizes é de pelo menos 0,9 e, de preferência ainda maior, a similaridade de matrizes é de pelo menos 0,95. Em uma realização de preferência superior, a similaridade de matrizes é de pelo menos 1,0. Em uma realização, a similaridade de núcleos é de pelo menos 0,75, preferencialmente a similaridade de núcleos é de pelo menos 0,8, tal como 0,85, de maior preferência a similaridade de núcleos é de pelo menos 0,9 e, de preferência ainda maior, a similaridade de núcleos é de pelo menos 0,95. Em uma realização de preferência superior, a similaridade de núcleos é de pelo menos 1,0.
[048] No método de acordo com a presente invenção, preferencialmente, pelo menos um dos elementos Terminais Aprimoradores (ET) definidos por SEQ ID NO: 5 ou SEQ ID NO: 6 ou a combinação de SEQ ID NO: 5 e SEQ ID NO: 6 é introduzida nas moléculas terminais recombinantes de acordo com a presente invenção.
[049] Em uma realização preferida do método de acordo com a presente invenção, todos os elementos ET de um grupo (ou seja, uma linha na Tabela 2) são introduzidos em um terminal recombinante de acordo com a presente invenção. Cada combinação de pelo menos dois, preferencialmente pelo menos três e, de preferência superior, todos os elementos ET de um grupo (ou seja, uma linha na Tabela 2) estão presentes em uma sequência terminal que aumenta a expressão genética que é produzida segundo o método de acordo com a presente invenção.
[050] Os técnicos no assunto conhecem métodos de produção dessas moléculas terminais recombinantes. Uma molécula terminal que não possui a capacidade de aumentar a expressão de moléculas de ácido nucleico às quais a molécula terminal é ligada funcionalmente poderá ser utilizada e os elementos ET de acordo com a presente invenção podem ser introduzidos por meio de métodos de clonagem, recombinação ou síntese da molécula terminal.
DEFINIÇÕES
[051] Abreviações: NEENA – ácido nucleico que aumenta a expressão de ácidos nucleicos; GFP – proteína fluorescente verde; GUS – betaglucuronidase; BAP – 6-benzilaminopurina; 2,4-D – ácido 2,4- diclorofenoxiacético; MS –meio de Murashige e Skoog; NAA – ácido 1- naftalenoacético; MES – ácido 2-(N-morfolino)etanossulfônico; IAA – ácido indoloacético; Kan – sulfato de canamicina; GA3 – ácido giberélico; Timentin® – tiarcilina dissódio/clavulanato potássio, microl – microlitro.
[052] Deve-se compreender que a presente invenção não é limitada à metodologia ou protocolos específicos. Deve-se também compreender que a terminologia utilizada no presente destina-se ao propósito de descrever unicamente realizações específicas e não se destina a limitar o escopo da presente invenção, que será unicamente limitado pelas reivindicações anexas. Deve-se observar que, da forma utilizada no presente e nas reivindicações anexas, as formas no singular “um”, “uma” e “o/a” incluem referências ao plural, a menos que o contexto indique claramente o contrário. Desta forma, por exemplo, referência a “um vetor” é uma referência a um ou mais vetores e inclui seus equivalentes conhecidos dos técnicos no assunto e assim por diante. A expressão “cerca de” é utilizada no presente como indicando aproximadamente, mais ou menos, por volta de ou na região de. Quando a expressão “cerca de” for utilizada em conjunto com uma faixa numérica, ela modificará aquela faixa estendendo as fronteiras acima e abaixo dos valores numéricos definidos. De forma geral, a expressão “cerca de” é utilizada no presente para modificar um valor numérico acima e abaixo do valor indicado em uma variação de 20%, preferencialmente 10% para cima ou para baixo (mais alto ou mais baixo). Da forma utilizada no presente, a palavra “ou” indica qualquer membro de uma lista específica e também inclui qualquer combinação de membros daquela lista. As expressões “compreende”, “que compreende”, “incluem”, “que inclui” e “inclui”, quando utilizadas no presente relatório descritivo e nas reivindicações a seguir, destinam-se a especificar a presença de uma ou mais características, números inteiros, componentes ou etapas indicadas, mas não dispensam a presença ou adição de uma ou mais características, números inteiros, componentes, etapas diferentes ou seus grupos. Por clareza, certos termos utilizados no relatório descritivo são definidos e utilizados conforme segue: Produto agrícola: a expressão “produto agrícola”, da forma utilizada no presente pedido, indica qualquer produto de planta que possa ser colhido. Os produtos vegetais podem ser, mas sem limitações, alimento, ração, suplemento alimentar, suplemento de ração, fibra, produto cosmético ou farmacêutico. Os alimentos são considerados composições utilizadas para nutrição ou para suplementação da nutrição. Os alimentos animais e suplementos de ração animal são particularmente considerados alimentos.
Produtos agrícolas podem ser, por exemplo, extratos vegetais, proteínas, aminoácidos, carboidratos, gorduras, óleos, polímeros tais como amido ou fibras, vitaminas, produtos vegetais secundários e similares.
[053] Antiparalelo: “antiparalelo” designa no presente duas sequências de nucleotídeos emparelhadas por meio de ligações de hidrogênio entre resíduos base complementares com ligações de fosfodiéster que correm na direção 5’-3’ em uma sequência de nucleotídeos e na direção 3’-5’ na outra sequência de nucleotídeos.
[054] Sem sentido: a expressão “sem sentido” designa uma sequência de nucleotídeos que é invertida com relação à sua orientação normal para transcrição ou função e, desta forma, expressa um transcrito de RNA que é complementar a uma molécula de mRNA de gene alvo expressa no interior da célula hospedeira (ela pode hibridizar-se, por exemplo, na molécula de mRNA de gene alvo ou DNA genômico de fita simples por meio de emparelhamento de bases Watson-Crick) ou que seja complementar a uma molécula de DNA alvo, tal como DNA genômico presente na célula hospedeira.
[055] Região de codificação: da forma utilizada no presente, a expressão “região de codificação”, quando utilizada com referência a um gene estrutural, designa as sequências de nucleotídeos que codificam os aminoácidos encontrados no polipeptídeo nascente como resultado da tradução de uma molécula de mRNA. A região de codificação é delimitada, em eucariotes, sobre o lado 5’ pelo trio de nucleotídeos “ATG” que codifica a metionina iniciadora e, sobre o lado 3’, por um dos três trios que especificam códons de parada (ou seja, TAA, TAG, TGA). Além de conter introns, formas genômicas de um gene podem também incluir sequências localizadas sobre a extremidade 5’ e 3’ das sequências que estão presentes sobre o transcrito de RNA. Estas sequências são denominadas regiões ou sequências “laterais” (essas sequências laterais são localizadas a 5’ ou 3’ das sequências não traduzidas presentes sobre o transcrito de mRNA). A região lateral 5’ pode conter sequências reguladoras tais como promotores e aumentadores que controlam ou influenciam a transcrição do gene. A região lateral 3’ pode conter sequências que dirigem o término da transcrição, divisão após a transcrição e poliadenilação.
[056] Complementar: “complementar” ou “complementaridade” designa duas sequências de nucleotídeos que compreendem sequências de nucleotídeos antiparalelas capazes de emparelhamento entre si (por meio das regras de emparelhamento de bases) mediante formação de ligações de hidrogênio entre os resíduos base complementares nas sequências de nucleotídeos antiparalelas. A sequência 5’-ATG-3’, por exemplo, é complementar à sequência 5’-ACT-3’. A complementaridade pode ser “parcial” ou “total”. Complementaridade “parcial” ocorre quando uma ou mais bases de ácidos nucleicos não são coincidentes de acordo com as regras de emparelhamento de bases. Complementaridade “total” ou “completa” entre moléculas de ácido nucleico ocorre quando toda e qualquer base de ácido nucleico coincide com outra base com base nas regras de emparelhamento de bases. O grau de complementaridade entre fitas de moléculas de ácido nucleico possui efeitos significativos sobre a eficiência e a resistência de hibridização entre fitas de moléculas de ácidos nucleicos. “Complemento” de uma sequência de ácidos nucleicos conforme utilizado no presente designa uma sequência de nucleotídeos cujas moléculas de ácidos nucleicos exibem total complementaridade com as moléculas de ácidos nucleicos da sequência de ácidos nucleicos.
[057] RNA de fita dupla: molécula de “RNA de fita dupla” ou molécula de “dsRNA” compreende um fragmento de RNA com sentido de uma sequência de nucleotídeos e um fragmento de RNA sem sentido da sequência de nucleotídeos, que compreendem sequências de nucleotídeos complementares entre si, de forma a permitir que os fragmentos de RNA com e sem sentido emparelhem-se e formem uma molécula de RNA de fita dupla.
[058] Endógeno: sequência de nucleotídeos “endógena” designa uma sequência de nucleotídeos que está presente no genoma da célula vegetal não transformada.
[059] Expressão aumentada: “aprimorar” ou “aumentar” a expressão de uma molécula de ácido nucleico em uma célula vegetal são utilizadas de forma equivalente no presente e indicam que o nível de expressão da molécula de ácido nucleico em plantas, partes de plantas ou célula vegetal após a aplicação de um método de acordo com a presente invenção é mais alto que a sua expressão na planta, parte da planta ou célula vegetal antes da aplicação do método ou em comparação com uma planta de referência que não possui uma molécula de ácido nucleico recombinante de acordo com a presente invenção. A planta de referência compreende, por exemplo, a mesma construção que não possui apenas o terminal aumentador correspondente de acordo com a presente invenção. Os termos “aprimorado” ou “aumentado”, da forma utilizada no presente, são sinônimos e indicam no presente expressão mais alta, de preferência significativamente mais alta, da molécula de ácido nucleico a ser expressa. Da forma utilizada no presente, “aprimoramento” ou “aumento” do nível de agente tal como uma proteína, mRNA ou RNA indica que o nível é mais alto com relação a uma planta substancialmente idêntica, parte de uma planta ou célula vegetal cultivada sob condições substancialmente idênticas, que não contém uma molécula de ácido nucleico recombinante de acordo com a presente invenção, por exemplo que não possui o terminal aumentador da molécula de acordo com a presente invenção, a construção recombinante ou o vetor recombinante de acordo com a presente invenção. Da forma utilizada no presente, “aprimoramento” ou “aumento” do nível do agente, tal como pré-RNA, mRNA, rRNA, tRNA, snoRNA, snRNA expresso pelo gene alvo e/ou do produto de proteína por ele codificado, indica que o nível é 20% mais alto ou mais, tal como 50% ou mais, preferencialmente 100% ou mais, de maior preferência três vezes ou mais, de preferência ainda maior quinze vezes ou mais, de preferência superior dez vezes ou mais, tal como vinte vezes mais que uma célula ou organismo que não contenha a molécula de ácido nucleico recombinante de acordo com a presente invenção. O aprimoramento ou o aumento pode ser determinado por meio de métodos com os quais os técnicos no assunto são familiares. Desta forma, o aprimoramento ou o aumento da quantidade de proteína ou ácido nucleico pode ser determinado, por exemplo, por meio de detecção imunológica da proteína. Além disso, métodos tais como teste de proteína, fluorescência, hibridização Northern, teste de proteção de nuclease, transcrição reversa (PCR RT quantitativa), ELISA (teste imunossorvente ligado por enzimas), Western Blot, radioimunoteste (RIA) ou outros imunotestes e análise de células ativadas por fluorescência (FACS) podem ser empregados para medir um RNA ou proteína específica em plantas ou células vegetais. Dependendo do tipo de produto de proteína induzido, a sua atividade ou o efeito sobre o fenótipo do organismo ou célula podem também ser determinados. Métodos de determinação da quantidade de proteína são conhecidos dos técnicos no assunto. Exemplos que podem ser mencionados são: o método micro-Biuret (Goa, J. (1953), Scand. J. Clin. Lab.
Invest. 5: 218-222), o método de Folin-Ciocalteau (Lowry, O. H. et al (1951), J.
Biol. Chem. 193: 265-275) ou medição da absorção de CBB G-250 (Bradford,
M. M. (1976), Analyt. Biochem. 72: 248-254). Como exemplo de quantificação da atividade de proteínas, a detecção da atividade de luciferase é descrita nos Exemplos abaixo.
[060] Elemento terminal aprimorador (ET): sequências de ácidos nucleicos curtas com cinco a trinta bases de comprimento que definem terminais que aumentam a expressão genética que conferem expressão aumentada a um gene ligado funcionalmente. Elas podem ser definidas como matrizes de peso de nucleotídeos. Elementos terminais aprimoradores podem exibir conservação entre sequências terminais homólogas. A presença de elementos terminais aprimoradores individuais ou suas combinações conforme definido nas Tabelas 1 e 2 é suficiente para classificar uma sequência terminal como aumentadora da expressão.
[061] Expressão: “expressão” designa a biossíntese de um produto genético, preferencialmente a transcrição e/ou tradução de uma sequência de nucleotídeos, tal como um gene endógeno ou um gene heterólogo, em uma célula. No caso de um gene estrutural, por exemplo, a expressão envolve a transcrição do gene estrutural em mRNA e, opcionalmente, a tradução subsequente de mRNA em um ou mais polipeptídeos. Em outros casos, a expressão pode indicar apenas a transcrição do DNA que abriga uma molécula de RNA.
[062] Construção de expressão: “construção de expressão”, da forma utilizada no presente, indica uma sequência de DNA capaz de dirigir a expressão de uma sequência de nucleotídeos específica em uma parte apropriada de planta ou célula vegetal, que compreende um promotor funcional na mencionada parte de planta ou célula vegetal na qual será introduzida, ligada operativamente à sequência de nucleotídeos de interesse que é opcionalmente ligada operativamente a sinais de término. Caso seja necessária a tradução, ela também compreende tipicamente sequências exigidas para tradução apropriada da sequência de nucleotídeos. A região de codificação pode codificar uma proteína de interesse, mas pode também codificar um RNA funcional de interesse, tal como RNAa, siRNA, snoRNA, snRNA, microRNA, ta-siRNA ou qualquer outro RNA regulador não codificador, na direção com ou sem sentido. A construção de expressão que compreende a sequência de nucleotídeos de interesse pode ser quimérica, o que significa que um ou mais dos seus componentes é heterólogo com relação a um ou mais dos seus outros componentes. A construção de expressão pode também ser de ocorrência natural, mas foi obtida em forma recombinante útil para expressão heteróloga. Tipicamente, entretanto, a construção de expressão é heteróloga com relação ao hospedeiro, ou seja, a sequência de DNA específica da construção de expressão não ocorre naturalmente na célula hospedeira e necessita haver sido introduzida na célula hospedeira ou um ancestral da célula hospedeira por um evento de transformação. A expressão da sequência de nucleotídeos na construção de expressão pode ocorrer sob o controle de um promotor específico de sementes e/ou preferencial para sementes ou de um promotor indutível, que inicia a transcrição apenas quando a célula hospedeira é exposta a algum estímulo externo específico. No caso de plantas, o promotor pode também ser específico de um órgão, tecido ou estágio de desenvolvimento específico.
[063] Externo: o termo “externo” designa qualquer molécula de ácido nucleico (tal como sequência genética) que seja introduzida no genoma de uma célula por meio de manipulações experimentais e pode incluir sequências encontradas naquela célula, desde que a sequência introduzida contenha alguma modificação (tal como uma mutação pontual, a presença de um gene marcador selecionável etc.) e, portanto, seja distinta com relação à sequência de ocorrência natural.
[064] Ligação funcional: a expressão “ligação funcional” ou “ligado funcionalmente” deve ser compreendida como indicando, por exemplo, a disposição sequencial de um elemento regulador (tal como um promotor) com uma sequência de ácidos nucleicos a ser expressa e, se apropriado, elementos reguladores adicionais (tais como terminal ou NEENA), de tal forma que cada um dos elementos reguladores possa desempenhar a sua função pretendida para permitir, modificar, facilitar ou influenciar de outra forma a expressão da mencionada sequência de ácidos nucleicos.
Como sinônimos, podem ser utilizadas as expressões “ligação operativa” ou “ligado operativamente”. A expressão pode resultar dependente da disposição das sequências de ácidos nucleicos com relação a RNA com ou sem sentido.
Com este propósito, não é necessariamente requerida a ligação direta no sentido químico.
Sequências de controle genético, tais como sequências aumentadoras, podem também exercer a sua função sobre a sequência alvo de posições que são mais distantes ou mesmo de outras moléculas de DNA.
Disposições preferidas são aquelas nas quais a sequência de ácidos nucleicos a ser expressa de forma recombinante é posicionada atrás da sequência que age como promotor, de tal forma que as duas sequências sejam ligadas covalentemente entre si.
A distância entre a sequência promotora e a sequência de ácidos nucleicos a ser expressa de forma recombinante é preferencialmente de menos de 200 pares de bases, de preferência especial menos de 100 pares de bases e, de preferência muito especial, menos de 50 pares de bases.
Em uma realização preferida, a sequência de ácidos nucleicos a ser transcrita está localizada atrás do promotor, de tal forma que o início da transcrição seja idêntico ao início desejado do RNA quimérico de acordo com a presente invenção.
Ligação funcional e uma construção de expressão podem ser geradas por meio de métodos costumeiros de clonagem e recombinação conforme descrito (por exemplo, em Maniatis, T., Fritsch, E.
F. e Sambrook, J. (1989), Molecular
Cloning: A Laboratory Manual, segunda edição, Cold Spring Harbor Laboratory,
Cold Spring Harbor, NY); Silhavy et al (1984), Experiments with Gene Fusions,
Cold Spring Harbor Laboratory, Cold Spring Harbor (Nova Iorque); Ausubel et al (1987), Current Protocols in Molecular Biology, Greene Publishing Assoc. e Wiley Interscience; Gelvin et al (Eds.) (1990), Plant Molecular Biology Manual; Kluwer Academic Publisher, Dordrecht, Países Baixos). Sequências adicionais que, por exemplo, agem como ligante com locais de divisão específicos para enzimas de restrição ou como peptídeo de sinal podem também ser posicionadas, entretanto, entre as duas sequências. A inserção de sequências pode também gerar a expressão de proteínas de fusão. Preferencialmente, a construção de expressão, que consiste de uma ligação de uma região reguladora, tal como uma sequência de promotor e ácido nucleico a ser expressa, pode existir em forma integrada em vetor e ser inserida em um genoma vegetal, tal como por meio de transformação.
[065] Gene: o termo “gene” designa uma região ligada operativamente a sequências reguladoras apropriadas capazes de regular a expressão do produto genético (tal como um polipeptídeo ou RNA funcional) de alguma forma. Um gene inclui regiões reguladoras de DNA sem tradução (tais como promotores, aumentadores, repressores etc.) antes (acima no fluxo) e depois (abaixo no fluxo) da região de codificação (quadro de leitura aberta, ORF), bem como, quando aplicável, sequências intervenientes (ou seja, introns) entre regiões de codificação individuais (ou seja, exons). A expressão “gene estrutural”, da forma utilizada no presente, destina-se a indicar uma sequência de DNA que é transcrita para mRNA, que é traduzido em seguida em uma sequência de aminoácidos característicos de um polipeptídeo específico.
[066] Genoma e DNA genômico: as expressões “genoma” ou “DNA genômico” designam a informação genética hereditária de um organismo hospedeiro. O mencionado DNA genômico compreende o DNA do núcleo (também denominado DNA cromossômico), mas também o DNA dos plastídeos (tais como cloroplastas) e outras organelas celulares (tais como mitocôndrias). Preferencialmente, as expressões “genoma” ou “DNA genômico” designam o DNA cromossômico do núcleo.
[067] Heterólogo: o termo “heterólogo”, com relação a uma molécula de ácido nucleico ou DNA, designa uma molécula de ácido nucleico que é ligada operativamente ou manipulada para tornar-se ligada operativamente a uma segunda molécula de ácido nucleico à qual não é ligada operativamente na natureza ou à qual é ligada operativamente em um local diferente na natureza. Uma construção de expressão heteróloga que compreende uma molécula de ácido nucleico e uma ou mais moléculas de ácido nucleico reguladoras (tais como um sinal de término de transcrição ou promotor) a ela ligadas, por exemplo, é uma construção originária de manipulações experimentais nas quais (a) a mencionada molécula de ácido nucleico; (b) a mencionada molécula de ácido nucleico reguladora; ou (c) ambas (ou seja, (a) e (b)) não estão localizadas no seu ambiente genético natural (nativo) ou foi modificada por meio de manipulações experimentais, em que um exemplo de modificação é uma substituição, adição, exclusão, inversão ou inserção de um ou mais resíduos de nucleotídeos. O ambiente genético natural designa o local cromossômico natural no organismo original ou a presença em uma biblioteca genômica. No caso de uma biblioteca genômica, o ambiente genético natural da sequência de molécula de ácido nucleico é preferencialmente retido, ao menos em parte. O ambiente ladeia a sequência de ácidos nucleicos pelo menos em um lado e possui sequência de pelo menos 50 bp, preferencialmente pelo menos 500 bp, de preferência especial pelo menos 1000 bp e, de preferência muito especial, pelo menos 5000 bp de comprimento. Uma construção de expressão de ocorrência natural (tal como a combinação de ocorrência natural de um promotor com o gene correspondente) torna-se uma construção de expressão transgênica quando é modificada por meio de métodos “artificiais” sintéticos não naturais, tais como mutagenização. Esses métodos foram descritos (US 5.565.350; WO 00/15815).
Uma molécula de ácido nucleico codificadora de proteína ligada operativamente a um promotor que não é o promotor nativo dessa molécula, por exemplo, é considerada heteróloga com relação ao promotor.
Preferencialmente, DNA heterólogo não é endógeno nem associado naturalmente à célula na qual é introduzido, mas foi obtido de outra célula ou foi sintetizado. DNA heterólogo também inclui uma sequência de DNA endógena, que contém alguma modificação, diversas cópias de ocorrência não natural de uma sequência de DNA endógena ou uma sequência de DNA que não é associada naturalmente a uma outra sequência de DNA ligada fisicamente a ela. Geralmente, embora não necessariamente, DNA heterólogo codifica RNA ou proteínas que normalmente não são produzidas pela célula na qual é expresso.
[068] Hibridização: o termo “hibridização”, da forma utilizada no presente, inclui “qualquer processo por meio do qual uma fita de molécula de ácido nucleico liga-se a uma fita complementar por meio de emparelhamento de bases”. (J. Coombs (1994), Dictionary of Biotechnology, Stockton Press, Nova Iorque). Hibridização e a resistência de hibridização (ou seja, a força da associação entre as moléculas de ácidos nucleicos) sofrem impacto de fatores tais como o grau de complementaridade entre as moléculas de ácidos nucleicos, a estringência das condições envolvidas, a Tm do híbrido formado e a razão G:C dentro das moléculas de ácido nucleico. Da forma utilizada no presente, o termo “Tm” é utilizado com referência à “temperatura de fusão”. A temperatura de fusão é a temperatura na qual uma população de moléculas de ácido nucleico de fita dupla torna-se dissociada pela metade em fitas simples.
A equação de cálculo da Tm de moléculas de ácido nucleico é bem conhecida na técnica. Conforme indicado por referências padrão, uma estimativa simples do valor da Tm pode ser calculada pela equação: Tm = 81,5 + 0,41 (% G+C),
quando uma molécula de ácido nucleico encontrar-se em solução aquosa a 1 M de NaCl (vide, por exemplo, Anderson e Young, Quantitative Filter Hybridization em Nucleic Acid Hybridization (1985)). Outras referências incluem computações mais sofisticadas, que levam características estruturais e de sequências em conta para o cálculo de Tm. Condições estringentes são conhecidas dos técnicos no assunto e podem ser encontradas em Current Protocols in Molecular Biology, John Wiley & Sons, Nova Iorque (1989), 6.3.1-
6.3.6.
[069] “Identidade”: “identidade”, quando utilizada com relação à comparação de duas ou mais moléculas de aminoácidos ou ácidos nucleicos, indica que as sequências das mencionadas moléculas compartilham um certo grau de similaridade de sequências, em que as sequências são parcialmente idênticas.
[070] Para determinar o percentual de identidade (homologia é utilizada no presente de forma intercambiável) de duas sequências de aminoácidos ou de duas moléculas de ácido nucleico, as sequências são escritas uma abaixo da outra para comparação ideal (podem, por exemplo, ser inseridos intervalos na sequência de uma proteína ou de um ácido nucleico a fim de gerar alinhamento ideal com a outra proteína ou o outro ácido nucleico).
[071] Os resíduos de aminoácidos ou moléculas de aminoácidos nas posições de aminoácidos ou posições de nucleotídeos correspondentes são comparados em seguida. Caso uma posição em uma sequência seja ocupada pelo mesmo resíduo de aminoácido ou pela mesma molécula de ácido nucleico com a posição correspondente na outra sequência, as moléculas são homólogas nessa posição (ou seja, “homologia” de aminoácidos ou ácidos nucleicos, da forma utilizada no presente contexto, corresponde a “identidade” de aminoácidos ou ácidos nucleicos. O percentual de homologia entre as duas sequências é uma função da quantidade de posições idênticas compartilhadas pelas sequências (ou seja, % homologia = quantidade de posições idênticas/número total de posições x 100). Os termos “homologia” e “identidade” devem, portanto, ser considerados sinônimos.
[072] Para determinar o percentual de identidade de dois ou mais aminoácidos ou de duas ou mais sequências de nucleotídeos, foram desenvolvidos diversos programas de software de computador. A identidade de duas ou mais sequências pode ser calculada, por exemplo, com o software Fasta, que atualmente vem sendo utilizado na versão Fasta 3 (W. R. Pearson e D. J. Lipman, PNAS 85, 2444 (1988); W. R. Pearson, Methods in Enzymology 183, 63 (1990); W. R. Pearson e D. J. Lipman, PNAS 85, 2444 (1988); W. R.
Pearson, Enzymology 183, 63 (1990)). Outro programa útil para o cálculo de identidades de sequências diferentes é o programa Blast padrão, que é incluído no software Biomax Pedant (Biomax, Munique, República Federal da Alemanha). Isso infelizmente gera às vezes resultados abaixo do ideal, pois BLAST nem sempre inclui sequências completas do objeto e da consulta.
Como este programa é muito eficiente, entretanto, ele pode ser utilizado para comparação de uma quantidade enorme de sequências. As configurações a seguir são tipicamente utilizadas para essa comparação de sequências: -p Nome do Programa [String]; -d Banco de dados [String]; padrão = nr; -i Arquivo de Consulta [File In]; padrão = stdin; -e Valor de expectativa (E) [Real]; padrão = 10,0; -m opções de vista de alinhamento: 0 = em pares; 1 = ancorado em consulta exibindo identidades; 2 = ancorado em consulta sem identidades; 3 = ancorado em consulta plana, exibe identidades; 4 = ancorado em consulta plana, sem identidades; 5 = ancorado em consulta, sem identidades e extremidades obtusas; 6 = ancorado em consulta plana, sem identidades e extremidades obtusas; 7 = XML resultado de Blast; 8 = tabular; 9 = tabular com linhas de comentários [número inteiro]; padrão = 0; -o arquivo de saída do relatório de BLAST [arquivo de saída] Opcional; padrão = stdout; -F sequência de consulta de filtro (DUST com blastn, SEG com outros) [String];
padrão = T; -G custo de abertura de intervalo (zero pede comportamento padrão) [número inteiro]; padrão = 0; -E custo de extensão de intervalo (zero pede comportamento padrão) [número inteiro]; padrão = 0; -X X valor de queda para alinhamento em intervalos (em bits) (zero pede comportamento padrão);
blastn 30, megablast 20, tblastx 0, todos os outros 15 [número inteiro]; padrão
= 0; -I exibir GIs em linhas def [T/F]; padrão = F; -q penalidade de falta de coincidência de nucleotídeo (somente blastn) [número inteiro]; padrão = -3; -r recompensa por coincidência de nucleotídeos (somente blastn) [número inteiro]; padrão = 1; -v número de sequências de banco de dados para exibir descrições de uma linha para (V) [número inteiro]; padrão = 500; -b número de sequência de banco de dados para exibir alinhamentos para (B) [número inteiro]; padrão = 250; -f limite de extensão de coincidências, padrão se for zero; blastp 11, blastn 0, blastx 12, tblastn 13; tblastx 13, megablast 0 [número inteiro]; padrão = 0; -g realizar alinhamento com intervalos (não disponível com tblastx) [T/F]; padrão = T; -Q código genético de consulta para uso [número inteiro]; padrão = 1; -D código genético DB (somente para tblast[nx]) [número inteiro]; padrão = 1; -a número de processadores para uso [número inteiro];
padrão = 1; -O arquivo SeqAlign [arquivo de saída] Opcional; -J acredite na consulta defline [T/F]; padrão = F; -M Matriz [String]; padrão = BLOSUM62; -W tamanho de palavra, padrão se zero (blastn 11, megablast 28, todos os outros
3) [número inteiro]; padrão = 0; -z comprimento efetivo do banco de dados (use zero para o tamanho real) [Real]; padrão = 0; -K número de melhores coincidências de uma região a serem mantidas (desligado como padrão, se utilizado recomenda-se valor de 100) [número inteiro]; padrão = 0; -P 0 para diversas coincidências, 1 para uma única coincidência [número inteiro]; padrão
= 0; -Y comprimento efetivo do espaço de busca (use zero para o tamanho real) [Real]; padrão = 0; -S consultar fitas para pesquisa contra banco de dados
(para blast[nx] e tblastx); 3 é ambos, 1 é superior, 2 é inferior [número inteiro]; padrão = 3; -T produzir resultado de HTML [T/F]; padrão = F; -l restringir pesquisa de banco de dados para lista de GIs [String] opcional; -U utilizar filtragem em caixa baixa de sequência FASTA [T/F] opcional: padrão = F; -y valor de queda X para extensões sem intervalos em bits (0,0 pede comportamento padrão); blastn 20, megablast 10, todos os demais 7 [Real]; padrão = 0,0; -Z valor de queda X para alinhamento com espaços final em bits (0,0 pede comportamento padrão); blastn/megablast 50, tblastx 0, todos os demais 25 [número inteiro]; padrão = 0; -R arquivo de ponto de verificação PSI- TBLASTN [arquivo de entrada] opcional; -n pesquisa MegaBlast [T/F]; padrão = F; -L local na sequência de consulta [String] opcional; -A tamanho de janela de diversas coincidências, padrão se for zero (blastn/megablast 0, todos os demais 40 [número inteiro]; padrão = 0; -w penalidade de alteração de quadros (algoritmo OOF para blastx) [número inteiro]; padrão = 0; -t comprimento do maior intron permitido em tblastn para ligação de HSPs (0 impede a ligação) [número inteiro]; padrão = 0.
[073] Resultados de alta qualidade são atingidos utilizando o algoritmo de Needleman e Wunsch ou Smith e Waterman. São preferidos, portanto, programas com base nos mencionados algoritmos.
Convenientemente, as comparações de sequências podem ser realizadas com o programa PileUp (J. Mol. Evolution, 25, 351 (1987), Higgins et al, CABIOS 5, 151 (1989)) ou preferencialmente com os programas “Gap” e “Needle”, ambos baseados nos algoritmos de Needleman e Wunsch (J. Mol. Biol. 48; 443 (1970)) e “BestFit”, que é baseado no algoritmo de Smith e Waterman (Adv.
Appl. Math. 2; 482 (1981)). “Gap” e “BestFit” são parte do pacote de software GCG (Genetics Computer Group, 575 Science Drive, Madison, Wisconsin, Estados Unidos 53711 (1991); Altschul et al (Nucleic Acids Res. 25, 3389 (1997) e “Needle” é parte da Suíte de Software Aberto European Molecular
Biology (EMBOSS) (Trends in Genetics 16 (6), 276 (2000)). Preferencialmente, portanto, os cálculos para determinar os percentuais de homologia de sequências são realizados com os programas “Gap” ou “Needle” ao longo de toda a faixa de sequências. Os ajustes padrão a seguir para comparação de sequências de ácidos nucleicos foram utilizados para “Needle”: matriz: EDNAFULL, penalidade de intervalo: 10,0, penalidade de extensão: 0,5. Os ajustes padrão a seguir para comparação de sequências de ácidos nucleicos foram utilizados para “Gap”: peso de intervalo: 50, peso de comprimento: 3, coincidência média: 10,000, falta de coincidência média: 0,000.
[074] Compreende-se, por exemplo, que uma sequência que se afirma ter 80% de identidade com a sequência SEQ ID NO: 1 no nível de ácido nucleico indique uma sequência que, mediante comparação com a sequência representada por SEQ ID NO: 1 pelo programa “Needle” acima com o conjunto de parâmetros acima, possui 80% de identidade. Preferencialmente, a homologia é calculada sobre o comprimento completo da sequência de consulta, tal como SEQ ID NO: 1.
[075] Intron: designa seções de DNA (sequências intervenientes) no interior de um gene que não codificam parte da proteína produzida pelo gene e que são divididas do mRNA que é transcrito do gene antes de ser exportado pelo núcleo da célula. Sequência intron designa a sequência de ácidos nucleicos de um intron. Desta forma, introns são as regiões de sequências de DNA que são transcritas em conjunto com a sequência de codificação (exons), mas são removidas durante a formação de mRNA maduro.
Introns podem ser posicionados dentro da região de codificação real ou nos líderes não traduzidos 5’ ou 3’ do pré-mRNA (mRNA não dividido). Introns no transcrito primário são extirpados e as sequências de codificação são ligadas de forma simultânea e precisa para formar o mRNA maduro. As junções de introns e exons formam o local de divisão. A sequência de um intron começa com GU e termina com AG. Além disso, em plantas, foram descritos dois exemplos de introns AU-AC: o décimo-quarto intron do gene de proteína similar a RecA e o sétimo intron do gene G5 de Arabidopsis thaliana encontram-se em introns AT-AC. Pré-mRNAs que contêm introns contêm três sequências curtas que são, além de outras sequências, essenciais para que o intron seja dividido com precisão. Essas sequências são o local de divisão 5’, o local de divisão 3’ e o ponto de ramificação. A divisão de mRNA é a remoção de sequências intervenientes (introns) presentes em transcritos de mRNA primários e a união ou ligação de sequências exon. Isso também é conhecido como divisão cis, que liga dois exons sobre o mesmo RNA com a remoção da sequência interveniente (intron). Os elementos funcionais de um intron compreendem sequências que são reconhecidas e ligadas pelos componentes de proteína específicos do espliceossomo (tais como sequências de consenso de divisão nas extremidades de introns). A interação dos elementos funcionais com o espliceossomo resulta na remoção da sequência de introns do mRNA prematuro e a religação das sequências de exons. Introns possuem três sequências curtas que são essenciais, embora não suficientes, para a divisão precisa do intron. Essas sequências são o local de divisão 5’, o local de divisão 3’ e o ponto de ramificação. A sequência de ponto de ramificação é importante na divisão e seleção de local de divisão em plantas. A sequência de ponto de ramificação é normalmente localizada a 10-60 nucleotídeos acima no fluxo do local de divisão 3’.
[076] Isogênico: organismos (tais como plantas) que são geneticamente idênticos, exceto pelo fato de que podem diferir na presença ou ausência de uma sequência de DNA heteróloga.
[077] Isolado: o termo “isolado” ou “isolamento”, da forma utilizada no presente, indica que um material foi removido pela ação humana, existe fora do seu ambiente nativo original e, portanto, não é um produto da natureza. Uma molécula ou material isolado (tal como uma enzima ou molécula de DNA) pode existir em forma purificada ou pode existir em ambiente não nativo, tal como em uma célula hospedeira transgênica. Um polipeptídeo ou polinucleotídeo de ocorrência natural presente em uma planta viva, por exemplo, não é isolado, mas o mesmo polinucleotídeo ou polipeptídeo, separado dos materiais coexistentes no sistema natural, no todo ou em parte, é isolado. Esses polinucleotídeos podem ser parte de um vetor e/ou esses polinucleotídeos ou polipeptídeos poderão ser parte de uma composição e seriam isolados de tal forma que esse vetor ou composição não seja parte do seu ambiente original. Preferencialmente, o termo “isolado”, da forma utilizada com relação a uma molécula de ácido nucleico, como em “uma sequência de ácidos nucleicos isolada”, designa uma sequência de ácidos nucleicos que é identificada e separada de pelo menos uma molécula de ácido nucleico contaminante com a qual é normalmente associada na sua fonte natural.
Molécula de ácido nucleico isolada é a molécula de ácido nucleico presente em uma forma ou ambiente que é diferente daquele em que ela é encontrada na natureza. Por outro lado, moléculas de ácido nucleico não isoladas são moléculas de ácido nucleico tais como DNA e RNA, que são encontradas no estado em que existem na natureza. Uma dada sequência de DNA (tal como um gene), por exemplo, é encontrada sobre o cromossomo de células hospedeiras nas proximidades de genes vizinhos; sequências de RNA, tais como uma sequência de mRNA específica que codifica uma proteína específica, são encontradas na célula na forma de mistura com diversos outros mRNAs, que codificam uma série de proteínas. Uma sequência de ácidos nucleicos isolada que compreende, por exemplo, SEQ ID NO: 1, entretanto, inclui, por exemplo, essas sequências de ácidos nucleicos em células que normalmente contêm SEQ ID NO: 1, em que a sequência de ácidos nucleicos encontra-se em local cromossômico ou extracromossômico diferente de células naturais ou é ladeada de outra forma por uma sequência de ácidos nucleicos diferente da encontrada na natureza. A sequência de ácidos nucleicos isolada pode estar presente em forma de fita simples ou fita dupla. Quando uma sequência de ácidos nucleicos isolada necessitar ser utilizada para expressar uma proteína, a sequência de ácidos nucleicos conterá, como mínimo, pelo menos uma parte da fita com sentido ou de codificação (ou seja, a sequência de ácidos nucleicos pode ter fita simples). Alternativamente, ela pode conter fitas com e sem sentido (ou seja, a sequência de ácidos nucleicos pode ter fita dupla).
[078] Promotor mínimo: elementos promotores, particularmente um elemento TATA, que são inativos ou que possuem atividade promotora grandemente reduzida na ausência de ativação acima no fluxo. Na presença de um fator de transcrição apropriado, o promotor mínimo funciona para permitir a transcrição.
[079] NEENA: veja “ácido nucleico que aumenta a expressão de ácidos nucleicos”.
[080] Não codificador: a expressão “não codificador” designa sequências de moléculas de ácidos nucleicos que não codificam, no todo ou em parte, uma proteína expressa. Sequências não codificadoras incluem, mas sem limitações, introns, aumentadores, regiões promotoras, regiões não traduzidas 3’ e regiões não traduzidas 5’.
[081] Ácido nucleico que aumenta a expressão de ácidos nucleicos (NEENA): A expressão “ácido nucleico que aumenta a expressão de ácidos nucleicos” designa uma sequência e/ou molécula de ácido nucleico de uma sequência específica que possui a propriedade intrínseca de aumentar a expressão de um ácido nucleico sob o controle de um promotor ao qual NEENA é funcionalmente ligado. Ao contrário de sequências promotoras, NEENA como tal não é capaz de dirigir a expressão. A fim de desempenhar a função de aumentar a expressão de uma molécula de ácido nucleico ligada funcionalmente ao NEENA, o próprio NEENA necessita estar ligado funcionalmente a um promotor. Ao contrário das sequências aumentadoras conhecidas na técnica, NEENA age em cis mas não em trans e necessita estar posicionado perto do local de início de transcrição do ácido nucleico a ser expresso.
[082] Ácidos nucleicos e nucleotídeos: As expressões “ácidos nucleicos” e “nucleotídeos” designam nucleotídeos ou ácidos nucleicos de ocorrência natural, sintéticos ou artificiais. As expressões “ácidos nucleicos” e “nucleotídeos” compreendem desoxirribonucleotídeos, ribonucleotídeos ou qualquer análogo de nucleotídeo e polímeros ou seus híbridos em forma de fita simples ou dupla, com ou sem sentido. A menos que indicado em contrário, uma sequência de ácidos nucleicos específica também engloba implicitamente suas variantes conservadoramente modificadas (tais como substituições de códons degeneradas) e sequências complementares, bem como a sequência indicada explicitamente. A expressão “ácido nucleico” é utilizada de forma intercambiável no presente com “gene”, “cDNA”, “mRNA”, “oligonucleotídeo” e “polinucleotídeo”. Análogos de nucleotídeos incluem nucleotídeos que contêm modificações na estrutura química da base, açúcar e/ou fosfato, incluindo, mas sem limitações, modificações de pirimidina com cinco posições, modificações de purina com oito posições, modificações de aminas exocíclicas de citosina, substituição de 5-bromouracil e similares; e modificações de açúcar na posição 2’, incluindo, mas sem limitações, ribonucleotídeos modificados com açúcar nos quais o 2’-OH é substituído por um grupo selecionado a partir de H, OR, R, halo, SH, SR, NH2, NHR, NR2 ou CN. RNAs de grampo de cabelo curto (shRNAs) podem também compreender elementos não naturais tais como bases não naturais, como ionosina e xantina, açúcares não naturais, tais como 2’-metoxirribose, ou ligações de fosfodiéster não naturais, como fosfonatos de metila, fosforotioatos e peptídeos.
[083] Sequência de ácidos nucleicos: a expressão “sequência de ácidos nucleicos” designa um polímero de fita simples ou dupla de bases de desoxirribonucleotídeo ou ribonucleotídeo lidas da extremidade 5’ para a 3’. Ela inclui DNA cromossômico, plasmídeos autorreprodutores, polímeros infecciosos de DNA ou RNA e DNA ou RNA que desempenham um papel principalmente estrutural. “Sequência de ácidos nucleicos” também indica uma lista consecutiva de abreviações, letras, caracteres ou palavras, que representam nucleotídeos. Em uma realização, um ácido nucleico pode ser uma “sonda” que é um ácido nucleico relativamente curto, normalmente com menos de cem nucleotídeos de comprimento. Frequentemente, uma sonda de ácido nucleico possui cerca de 50 nucleotídeos de comprimento a cerca de 10 nucleotídeos de comprimento. “Região alvo” de um ácido nucleico é uma parte de um ácido nucleico que é identificada como sendo de interesse. “Região de codificação” de ácido nucleico é a parte do ácido nucleico que é transcrita e traduzida de forma específica de sequência para produção em uma proteína ou polipeptídeo específico quando colocada sob o controle de sequências reguladoras apropriadas. Afirma-se que a região de codificação codifica esse polipeptídeo ou proteína.
[084] Oligonucleotídeo: o termo “oligonucleotídeo” designa um oligômero ou polímero de ácido ribonucleico (RNA), ácido desoxirribonucleico (DNA) ou suas imitações, bem como oligonucleotídeos que contêm partes de ocorrência não natural que funcionam de forma similar. Esses oligonucleotídeos modificados ou substituídos frequentemente são preferidos com relação a formas nativas devido a propriedades desejáveis, tais como absorção celular aumentada, afinidade aumentada para ácido nucleico alvo e maior estabilidade na presença de nucleases. Um oligonucleotídeo inclui preferencialmente dois ou mais nucleomonômeros acoplados covalentemente entre si por meio de ligações (tais como fosfodiésteres) ou ligações substitutas.
[085] Sobreposição: “Sobreposição” é uma sequência de nucleotídeos com fita simples relativamente curta sobre a extremidade 5’ ou 3’- hidroxila de uma molécula de oligonucleotídeo com fita dupla (também denominada “extensão”, “extremidade protuberante” ou “extremidade pegajosa”).
[086] Planta: é geralmente compreendida como indicando qualquer organismo eucariótico uni ou multicelular ou sua célula, tecido, órgão, parte ou material de propagação (tal como sementes ou frutos) que seja capaz de realizar fotossíntese. São incluídos para o propósito da presente invenção todos os gêneros e espécies de plantas superiores e inferiores do reino vegetal. São preferidas plantas anuais, perenes, monocotiledôneas e dicotiledôneas. O termo inclui as plantas maduras, sementes, brotos, mudas e suas partes derivadas, material de propagação (tais como sementes ou microesporos), órgãos da planta, tecidos, protoplastas, calos e outros cultivos, tais como cultivos celulares, e qualquer outro tipo de agrupamento de células vegetais para gerar unidades funcionais ou estruturais. Plantas maduras designam plantas em qualquer estágio de desenvolvimento desejado além da muda.
Muda designa uma planta imatura jovem em um estágio de desenvolvimento inicial.
Plantas anuais, bianuais, monocotiledôneas e dicotiledôneas são organismos hospedeiros preferidos para a geração de plantas transgênicas. A expressão de genes é ainda vantajosa em todas as plantas ornamentais, árvores úteis ou ornamentais, flores, flores de corte, arbustos ou gramados. Plantas que podem ser mencionadas como forma de exemplo mas sem limitações são angiospermas, briófitas tais como Hepaticae (hepáticas) e Musci (musgos); pteridófitos tais como samambaias, cavalinhas e Lycopodium; gimnospermas tais como coníferas, cicadas, ginkgo e Gnetatae; algas tais como Chlorophyceae, Phaeophyceae, Rhodophyceae, Myxophyceae, Xanthophyceae, Bacillariophyceae (diátomos) e Euglenophyceae. São preferidas plantas que são utilizadas para fins de alimento ou ração, tais como as famílias das leguminosas, como ervilha, alfafa e soja; gramíneas tais como arroz, milho, trigo, cevada, sorgo, milheto, centeio, triticale ou aveia; família das umbelíferas,
especialmente o gênero Daucus, muito especialmente as espécies carota (cenoura) e Apium, muito especialmente as espécies Graveolens Dulce (aipo) e muitas outras; a família das solanáceas, especialmente o gênero Lycopersicon, muito especialmente a espécie esculentum (tomate) e o gênero Solanum, muito especialmente as espécies tuberosum (batata) e melongena (berinjela) e muitas outras (tais como fumo); e o gênero Capsicum, muito especialmente a espécie annuum (pimenta) e muitas outras; a família das leguminosas, especialmente o gênero Glycine, muito especialmente a espécie max (soja), alfafa, ervilha, tremoços, feijões ou amendoim e muitos outros; e a família das crucíferas (Brassicacae), especialmente o gênero Brassica, muito especialmente as espécies napus (canola oleaginosa), campestris (beterraba), oleracea cv Tastie (repolho), oleracea cv Snowball Y (couve-flor) e oleracea cv Emperor (brócolis); e do gênero Arabidopsis, muito especialmente a espécie thaliana e muitas outras; a família das Compositae, especialmente o gênero Lactuca, muito especialmente a espécie sativa (alface) e muitas outras; a família das asteráceas, tal como girassol, tagetes, alface ou calêndula e muitas outras; e a família das cucurbitáceas, tais como melão, abóbora/moranga ou abobrinha e linhaça. São adicionalmente preferidos algodão, cana de açúcar, cânhamo, linho, pimentas e as diversas espécies de árvores, nozes e vinhas.
[087] Polipeptídeo: os termos “polipeptídeo”, “peptídeo”, “oligopeptídeo”, “polipeptídeo”, “produto genético”, “produto de expressão” e “proteína” são utilizados de forma intercambiável no presente para designar um polímero ou oligômero de resíduos de aminoácidos consecutivos.
[088] Pré-proteína: proteína, que normalmente é dirigida a uma organela celular, tal como cloroplasta e ainda compreende o seu peptídeo de trânsito.
[089] Transcrito primário: a expressão “transcrito primário”, da forma utilizada no presente, designa um transcrito de RNA prematuro de um gene. “Transcrito primário”, por exemplo, compreende ainda introns e/ou ainda não compreende uma cauda póli A ou estrutura de tampa e/ou não possui outras modificações necessárias para o seu funcionamento correto como transcrito, tal como corte ou editoração.
[090] Promotor: as expressões “promotor”ou “sequência promotora” são equivalentes e, da forma utilizada no presente, designam uma sequência de DNA que, quando ligada a uma sequência de nucleotídeos de interesse, é capaz de controlar a transcrição da sequência de nucleotídeos de interesse em RNA. Esses promotores podem ser encontrados, por exemplo, nos bancos de dados públicos a seguir: http://www.grassius.org/grasspromdb.html, http://mendel.cs.rhul.ac.uk/mendel.php?topic=plantprom e http://ppdb.gene.nagoya-u.ac.jp/cgi-bin/index.cgi. Os promotores ali relacionados podem ser abordados com os métodos de acordo com a presente invenção e são incluídos no presente como referência. Um promotor está localizado a 5’ (ou seja, acima no fluxo), perto do local de início de transcrição de uma sequência de nucleotídeos de interesse cuja transcrição em mRNA controla e fornece um local de ligação específica por polimerase de RNA e outros fatores de transcrição para início da transcrição. O mencionado promotor compreende, por exemplo, os pelo menos 10 kb, tal como 5 kb ou 2 kb perto do local de início da transcrição. Ele pode também compreender os pelo menos 1500 bp perto do local de início de transcrição, preferencialmente os pelo menos 1000 bp, de maior preferência os pelo menos 500 bp, de preferência ainda maior os pelo menos 400 bp, os pelo menos 300 bp, os pelo menos 200 bp ou os pelo menos 100 bp. Em uma realização preferida adicional, o promotor compreende os pelo menos 50 bp perto do local de início de transcrição, tal como pelo menos 25 bp. O promotor não compreende regiões exon e/ou intron ou regiões não traduzidas 5’. O promotor pode, por exemplo, ser heterólogo ou homólogo para a planta correspondente. Uma sequência de polinucleotídeos é “heteróloga a” um organismo ou uma segunda sequência de polinucleotídeos caso se origine de uma espécie externa ou, se da mesma espécie, é modificada a partir da sua forma original. Um promotor ligado operativamente a uma sequência de codificação heteróloga, por exemplo, designa uma sequência de codificação de uma espécie diferente daquela da qual foi derivado o promotor ou, se da mesma espécie, uma sequência de codificação que não é associada naturalmente ao promotor (tal como uma sequência de codificação geneticamente alterada ou um alelo de um ecotipo ou variedade diferente). Promotores apropriados podem ser derivados de genes das células hospedeiras nas quais a expressão deverá ocorrer ou de patógenos para essas células hospedeiras (tais como plantas ou patógenos vegetais como vírus de plantas). Um promotor específico de planta é um promotor apropriado para regulagem da expressão em plantas. Ele pode ser derivado de uma planta, mas também de patógenos vegetais ou poderá ser um promotor sintético projetado pelo homem. Caso o promotor seja um promotor indutível, a velocidade de transcrição aumenta em resposta a um agente indutor. Além disso, o promotor pode ser regulado de forma específica de tecido ou preferida para tecido, de tal forma que seja apenas ou predominantemente ativo na transcrição da região de codificação associada em um ou mais tipos de tecido específicos tais como folhas, raízes ou meristema.
A expressão “específico de tecido”, quando aplicada a um promotor, designa um promotor que seja capaz de dirigir a expressão seletiva de uma sequência de nucleotídeos de interesse a um tipo específico de tecido (tal como pétalas) na ausência relativa de expressão da mesma sequência de nucleotídeos de interesse em um tipo diferente de tecido (tal como raízes). A especificidade de tecido de um promotor pode ser avaliada, por exemplo, por meio de ligação operativa de um gene relator à sequência promotora para gerar uma construção relatora, introdução da construção relatora no genoma de uma planta, de tal forma que a construção relatora seja integrada em cada tecido da planta transgênica resultante, e detecção da expressão do gene relator (tal como detecção de mRNA, proteína ou atividade de proteína codificada pelo gene relator) em diferentes tecidos da planta transgênica. A detecção de um nível maior de expressão do gene relator em um ou mais tecidos com relação ao nível de expressão do gene relator em outros tecidos demonstra que o promotor é específico para os tecidos nos quais são detectados níveis maiores de expressão. A expressão “específico de tipo celular”, quando aplicada a um promotor, designa um promotor que seja capaz de dirigir a expressão seletiva de uma sequência de nucleotídeos de interesse a um tipo específico de célula na ausência relativa de expressão da mesma sequência de nucleotídeos de interesse em um tipo diferente de célula dentro do mesmo tecido. A expressão “específico de tipo celular”, quando aplicada a um promotor, também indica um promotor capaz de promover a expressão seletiva de uma sequência de nucleotídeos de interesse em uma região dentro de um único tecido. A especificidade de tipo celular de um promotor pode ser determinada utilizando métodos bem conhecidos na técnica, tais como manchas de atividade GUS, proteína GFP ou manchas imuno-histoquímicas. O termo “constitutivo”, quando elaborado com referência a um promotor ou à expressão derivada de um promotor indica que o promotor é capaz de dirigir a transcrição de uma molécula de ácido nucleico ligada operativamente na ausência de estímulos (tais como choque térmico, substâncias, luz etc.) na maior parte de tecidos vegetais e células ao longo de substancialmente toda a vida útil de uma planta ou parte de planta. Tipicamente, promotores constitutivos são capazes de dirigir a expressão de transgenes em substancialmente qualquer célula e qualquer tecido.
[091] Especificidade de promotor: o termo “especificidade”, com referência a promotor, indica o padrão de expressão conferido pelo promotor correspondente. A especificidade descreve os tecidos e/ou a situação de desenvolvimento de uma planta ou sua parte, em que o promotor confere expressão da molécula de ácido nucleico sob o controle do promotor correspondente. A especificidade de um promotor pode também compreender as condições ambientais, sob as quais o promotor pode ser ativado ou regulado para baixo, tais como indução ou repressão por tensões biológicas ou ambientais, tais como frio, seca, feridas ou infecção.
[092] Purificado: da forma utilizada no presente, o termo “purificado” designa moléculas, sequências de aminoácidos ou ácidos nucleicos que são removidas do seu ambiente natural, isoladas ou separadas.
Moléculas “substancialmente purificadas” são pelo menos 60% livres, preferencialmente pelo menos 75% livres e, de maior preferência, pelo menos 90% livres de outros componentes com os quais são naturalmente associadas.
Uma sequência de ácidos nucleicos purificada pode ser uma sequência de ácidos nucleicos isolada.
[093] Recombinante: o termo “recombinante” com relação a moléculas de ácido nucleico designa moléculas de ácido nucleico produzidas por meio de métodos de DNA recombinante. Moléculas de ácido nucleico recombinante podem também compreender moléculas que, como tais, não existem na natureza, mas são modificadas, alteradas, sofrem mutação ou são manipuladas de outra forma pelo homem.
Preferencialmente, “molécula de ácido nucleico recombinante” é uma molécula de ácido nucleico de ocorrência não natural cuja sequência difere de uma molécula de ácido nucleico de ocorrência natural em pelo menos um ácido nucleico. “Molécula de ácido nucleico recombinante” pode também compreender uma “construção recombinante” que compreende, preferencialmente ligada operativamente, uma sequência de moléculas de ácido nucleico que não ocorre naturalmente nesta ordem. Os métodos preferidos de produção da mencionada molécula de ácido nucleico recombinante podem compreender métodos de clonagem, mutagênese dirigida ou não dirigida, síntese ou recombinação.
[094] “Promotor específico de sementes”, no contexto da presente invenção, indica um promotor que regula a transcrição de uma molécula de ácido nucleico sob o controle do promotor correspondente em sementes nas quais a transcrição em qualquer tecido ou célula das sementes contribui com mais de 90%, preferencialmente mais de 95%, de maior preferência mais de 99% da quantidade completa do RNA transcrito da mencionada sequência de ácidos nucleicos em toda a planta durante qualquer dos seus estágios de desenvolvimento. A expressão “expressão específica de sementes” deve ser compreendida de forma similar.
[095] “Promotor específico de sementes”, no contexto da presente invenção, indica um promotor que regula a transcrição de uma molécula de ácido nucleico sob o controle do promotor correspondente em sementes nas quais a transcrição em qualquer tecido ou célula das sementes contribui com mais de 50%, preferencialmente mais de 70%, de maior preferência mais de 80% da quantidade completa do RNA transcrito da mencionada sequência de ácidos nucleicos em toda a planta durante qualquer dos seus estágios de desenvolvimento. A expressão “expressão específica de sementes” deve ser compreendida de forma similar.
[096] Com sentido: Compreende-se a expressão “com sentido” como indicando uma molécula de ácido nucleico que possui uma sequência que é complementar ou idêntica a uma sequência alvo, tal como uma sequência que se liga a um fator de transcrição de proteínas e que está envolvida na expressão de um dado gene. Segundo uma realização preferida, a molécula de ácido nucleico compreende um gene de interesse e elementos que permitem a expressão do mencionado gene de interesse.
[097] Aumento ou redução significativa: aumento ou redução, por exemplo, da atividade enzimática ou da expressão genética, que seja maior que a margem de erro inerente ao método de medição, preferencialmente aumento ou redução em cerca de duas vezes ou mais da atividade da enzima de controle ou expressão na célula de controle, de maior preferência aumento ou redução em cerca de cinco vezes ou mais e, de preferência superior, aumento ou redução em cerca de dez vezes ou mais.
[098] Moléculas de ácido nucleico pequenas: “moléculas de ácido nucleico pequenas” são compreendidas como moléculas que consistem de ácidos nucleicos ou seus derivados, tais como RNA ou DNA. Elas podem ter fita dupla ou fita simples e são de cerca de 15 a cerca de 30 bp, tal como de 15 a 30 bp, de maior preferência cerca de 19 a cerca de 26 bp, tal como de 19 a 26 bp, de preferência ainda maior de cerca de 20 a cerca de 25 bp, tal como de a 25 bp. Em uma realização de preferência especial, os oligonucleotídeos são de cerca de 21 a cerca de 24 bp, tal como de 21 a 24 bp. Em uma realização de preferência superior, as moléculas de ácido nucleico pequenas são de cerca de 21 bp e cerca de 24 bp, tal como de 21 bp e 24 bp.
[099] Substancialmente complementar: no seu sentido mais amplo, a expressão “substancialmente complementar”, quando utilizada no presente com relação a uma sequência de nucleotídeos com relação a uma sequência de nucleotídeos alvo ou de referência, indica uma sequência de nucleotídeos que possui percentual de identidade entre a sequência de nucleotídeos substancialmente complementar e a sequência complementar exata da mencionada sequência de nucleotídeos alvo ou de referência de pelo menos 60%, mais desejavelmente pelo menos 70%, mais desejavelmente pelo menos 80% ou 85%, preferencialmente pelo menos 90%, de maior preferência pelo menos 93%, de preferência ainda maior pelo menos 95% ou 96%, de preferência ainda maior pelo menos 97% ou 98%, de preferência ainda maior pelo menos 99% ou, de preferência superior, 100% (em que este último é equivalente ao termo “idêntico” neste contexto). Preferencialmente, a identidade é determinada ao longo de um comprimento de pelo menos 19 nucleotídeos, preferencialmente pelo menos 50 nucleotídeos, de maior preferência todo o comprimento da sequência de ácidos nucleicos para a mencionada sequência de referência (se não especificado de outra forma abaixo). São conduzidas comparações de sequências utilizando análise de GAP padrão com o aplicativo SEQWEB de GAP da Universidade de Wisconsin GCG, com base no algoritmo de Needleman e Wunsch (Needleman e Wunsch (1970), J. Mol. Biol. 48: 443-453; conforme definido acima). Uma sequência de nucleotídeos “substancialmente complementar” a uma sequência de nucleotídeos de referência hibridiza-se na sequência de nucleotídeos de referência sob condições de baixa estringência, preferencialmente condições de média estringência e, de preferência superior, condições de alta estringência (conforme definido acima).
[0100] Terminal: a expressão “terminal”, “término de transcrição” ou “sequência de término de transcrição”, da forma utilizada no presente, destina-se a indicar uma sequência localizada na 3’ UTR de um gene que faz com que uma polimerase suspenda a formação de ligações de fosfodiéster e libere o transcrito nascente. Da forma utilizada no presente, o terminal compreende toda a estrutura 3’ UTR necessária para a produção eficiente de um RNA mensageiro. A sequência de término gera ou inicia uma parada de transcrição de uma sequência de ácidos nucleicos iniciada a partir de um promotor. Preferencialmente, uma sequência de término de transcrição compreende ainda sequências que causam a poliadenilação do transcrito. Um término de transcrição pode, por exemplo, compreender uma ou mais sequências de sinais de poliadenilação, uma ou mais sequências de ligação de poliadenilação e sequências abaixo no fluxo com vários comprimentos que causam o término da transcrição. É necessário compreender que sequências abaixo no fluxo de sequências que codificam a região 3’ não traduzida de um transcrito de RNA expresso também podem ser parte de um término de transcrição, embora a própria sequência não seja expressa como parte do transcrito de RNA. Além disso, um término de transcrição pode compreender sequências adicionais, que podem influenciar a sua funcionalidade, tais como sequências não traduzidas 3’ (ou seja, sequências de um gene após o códon de parada da sequência de codificação). O término da transcrição pode envolver diversos mecanismos que incluem, mas sem limitações, dissociação induzida da polimerase de RNA II do seu modelo de DNA.
[0101] Transgene: o termo “transgene”, da forma utilizada no presnete, designa qualquer sequência de ácidos nucleicos que seja introduzida no genoma de uma célula por meio de manipulações experimentais. Um transgene pode ser uma “sequência de DNA endógena” ou uma “sequência de DNA heteróloga” (ou seja, “DNA externo”). A expressão “sequência de DNA endógena” designa uma sequência de nucleotídeos que é naturalmente encontrada na célula na qual é introduzida, desde que não contenha nenhuma modificação (tal como uma mutação pontual, a presença de um gene marcador selecionável etc.) com relação à sequência de ocorrência natural.
[0102] Transgênico: o termo transgênico com referência a um organismo indica transformado, transformado de forma preferencialmente estável, com uma molécula de DNA recombinante que compreende preferencialmente um promotor apropriado ligado operativamente a uma sequência de DNA de interesse.
[0103] Vetor: da forma utilizada no presente, o termo “vetor” designa uma molécula de ácido nucleico capaz de transportar outra molécula de ácido nucleico à qual tenha se ligado. Um tipo de vetor é um vetor integrado genômico ou “vetor integrado” que pode integrar-se ao DNA cromossômico da célula hospedeira. Outro tipo de vetor é um vetor epissomal, ou seja, uma molécula de ácido nucleico capaz de reprodução extracromossômica. Vetores capazes de dirigir a expressão de genes aos quais são ligados operativamente são denominados no presente “vetores de expressão”. No presente relatório descritivo, “plasmídeo” e “vetor” são utilizados de forma intercambiável, a menos que esteja de outra forma clara no contexto. Vetores de expressão projetados para produzir RNAs conforme descrito no presente in vitro ou in vivo podem conter sequências reconhecidas por qualquer polimerase de RNA, incluindo polimerase de RNA mitocôndrica, RNA pol I, RNA pol II e RNA pol III.
Estes vetores podem ser utilizados para transcrever a molécula de RNA desejada na célula de acordo com a presente invenção. Vetor de transformação vegetal deve ser compreendido como um vetor apropriado no processo de transformação vegetal.
[0104] Tipo selvagem: a expressão “tipo selvagem”, “natural” ou “origem natural” indica, com relação a um organismo, polipeptídeo ou sequência de ácidos nucleicos, que o mencionado organismo é de ocorrência natural ou disponível em pelo menos um organismo de ocorrência natural que não é alterado, sofre mutação nem é manipulado de outra forma pelo homem.
EXEMPLOS
[0105] Substâncias e métodos comuns: A menos que indicado em contrário, os procedimentos de clonagem conduzidos para os propósitos da presente invenção, incluindo digestão de restrição, eletroforese de gel de agarose, purificação de ácidos nucleicos, ligação de ácidos nucleicos, transformação, seleção e cultivo de células bacterianas, foram realizados conforme descrito (Sambrook et al, 1989). Análises de sequências de DNA recombinante foram realizadas com um sequenciador de DNA de fluorescência a laser (Applied Biosystems, Foster City CA, Estados Unidos) utilizando a tecnologia Sanger (Sanger et al, 1977). A menos que descrito de outra forma, substâncias e reagentes foram obtidos da Sigma Aldrich (Sigma Aldrich, St. Louis, Estados Unidos), da Promega (Madison WI, Estados Unidos), Duchefa (Haarlem, Países Baixos) ou Invitrogen (Carlsbad CA, Estados Unidos). Endonucleases de restrição foram da New England Biolabs (Ipswich MA, Estados Unidos) ou Roche Diagnostics GmbH (Penzberg, Alemanha). Oligonucleotídeos foram sintetizados pela Eurofins MWG Operon (Ebersberg, Alemanha).
EXEMPLO 1
[0106] Identificação de terminais de Oryza sativa que supostamente aumentam a expressão genética: Foram identificados elementos de sequência de terminais que aumentam a expressão de um gene ligado funcionalmente. A Tabela 1 fornece um resumo dos 43 elementos Terminais de Aprimoradores (ET).
TABELA 1
[0107] Elementos de sequências terminais que aumentam a expressão (ET): Linhagem ID ET SEQ ID NO Sequência IUPAC nº 1 ET1 SEQ ID NO: 5 NRYCTTCCCWTYWWNNTDNNNCN 2 ET2 SEQ ID NO: 6 NGTGATWTTNCWNSN 3 ET3 SEQ ID NO: 7 BTMMTTTTCCSTTV 4 ET4 SEQ ID NO: 8 DAVAGCCATCAVT 5 ET5 SEQ ID NO: 9 DCTTRNTATTTKAV 6 ET6 SEQ ID NO: 10 NADHATNTNNDKWTGGTTTGTHNNAN 7 ET7 SEQ ID NO: 11 NWANAATGASANNNNAHNAN 8 ET8 SEQ ID NO: 12 NAAAAGTAN 9 ET9 SEQ ID NO: 13 WKWNNTGGAAGCAT 10 ET10 SEQ ID NO: 14 NWNNNHNWNTGNTATTN 11 ET11 SEQ ID NO: 15 WYNNNHNNMNSNAAACTCANVAN
Linhagem ID ET SEQ ID NO Sequência IUPAC nº
12 ET12 SEQ ID NO: 16 NWWKWNTNNTHATTATGMTN 13 ET13 SEQ ID NO: 17 YGATGGCNNTAN 14 ET14 SEQ ID NO: 18 YHNNTTGTKTCNKNNKNMNNNVM 15 ET15 SEQ ID NO: 19 NHNTYNNKTGCTTTKTNDN 16 ET16 SEQ ID NO: 20 ATKTTTCCTGYDNMAY 17 ET17 SEQ ID NO: 21 WMCTATTGTNMWWWNKTA 18 ET18 SEQ ID NO: 22 TTTTCTCYTWCYTCTSMY 19 ET19 SEQ ID NO: 23 KTTGRTTCYN 20 ET20 SEQ ID NO: 24 TKATATTGYNDWAYWWR 21 ET21 SEQ ID NO: 25 WSNWAACTWGAW 22 ET22 SEQ ID NO: 26 NWTNTTATGNTM 23 ET23 SEQ ID NO: 27 WMWWBTCAATAAB 24 ET24 SEQ ID NO: 28 NTYANKDTTCYTGTGAA 25 ET25 SEQ ID NO: 29 TNNRWKNNGTGTTCTN 26 ET26 SEQ ID NO: 30 NTATTGTSRHD 27 ET27 SEQ ID NO: 31 NWTTGTTTCN 28 ET28 SEQ ID NO: 32 NWNNMCCTKTCCNNNRN 29 ET29 SEQ ID NO: 33 NTTASYKNAWTDKCACCAAN
30 ET30 SEQ ID NO: 34 NNTTACTGSNWNNNNRN
31 ET31 SEQ ID NO: 35 NRRWNTTAATAANKWT
32 ET32 SEQ ID NO: 36 NTNTCTGNTAN
33 ET33 SEQ ID NO: 37 NNNHNNTTGTTTCNNHWKNMN 34 ET34 SEQ ID NO: 38 NTYANKDTTCYTGTGAA
35 ET35 SEQ ID NO: 39 YKTNNTTGCTTTN
36 ET36 SEQ ID NO: 40 NGTGATWTTNCWNSN
37 ET37 SEQ ID NO: 41 MWNSRNNNBTNBRHGGCTTGTWN
Linhagem ID ET SEQ ID NO Sequência IUPAC nº 38 ET38 SEQ ID NO: 42 NYCTTTTSCNNNANYWAAN 39 ET39 SEQ ID NO: 43 NWTGCTACCN 40 ET40 SEQ ID NO: 44 NAWTYTGATGANNAWNAW 41 ET41 SEQ ID NO: 45 WGWNABNMKMNAGMTCCACN 42 ET42 SEQ ID NO: 46 NTCATAAGNRBA 43 ET43 SEQ ID NO: 47 DTMATTTTSY
[0108] A = adenina; C = citosina; G = guanina; T = timina; U = uracil; R = G A (purina); Y = T C (pirimidina); K = G T (ceto); M = A C (amino); S = G C; W = A T; B = G T C; D = G A T; H = A C T; V = G C A; N = A G C T (qualquer).
[0109] Os elementos ET foram utilizados para selecionar sequências de término com propriedades que aumentam a expressão genética.
Os terminais que aumentam a expressão foram definidos por uma combinação de elementos ET. A Tabela 2 relaciona grupos de combinação (uma linha representa um grupo) que foram suficientes para identificar uma molécula terminal que aumenta a expressão genética. Cada linha define um grupo de elementos ET característicos para moléculas terminais que aumentam a expressão genética.
Tabela 2
[0110] Grupos de combinação de elementos de sequência terminais aprimoradores (ET) da expressão: Linhagem Elemento Elemento Elemento Elemento Elemento Elemento nº ET 1 ET 2 ET 3 ET 4 ET 5 ET 6
SEQ ID SEQ ID 1 NO: 5 NO: 6
SEQ ID 2 NO: 5 3 SEQ ID
Linhagem Elemento Elemento Elemento Elemento Elemento Elemento nº ET 1 ET 2 ET 3 ET 4 ET 5 ET 6 NO: 6
SEQ ID SEQ ID 4 NO: 43 NO: 47
SEQ ID SEQ ID 5 NO: 44 NO: 32
SEQ ID SEQ ID 6 NO: 44 NO: 36
SEQ ID SEQ ID 7 NO: 33 NO: 44
SEQ ID SEQ ID 8 NO: 45 NO: 26
SEQ ID SEQ ID 9 NO: 46 NO: 31
SEQ ID SEQ ID 10 NO: 34 NO: 11
SEQ ID SEQ ID 11 NO: 18 NO: 46
SEQ ID SEQ ID 12 NO: 41 NO: 44
SEQ ID SEQ ID 13 NO: 30 NO: 8
SEQ ID SEQ ID SEQ ID 14 NO: 16 NO: 36 NO: 31
SEQ ID SEQ ID SEQ ID 15 NO: 16 NO: 10 NO: 31
SEQ ID SEQ ID SEQ ID 16 NO: 16 NO: 18 NO: 36
SEQ ID SEQ ID SEQ ID 17 NO: 16 NO: 18 NO: 10
SEQ ID SEQ ID SEQ ID 18 NO: 16 NO: 15 NO: 37
SEQ ID SEQ ID SEQ ID 19 NO: 20 NO: 25 NO: 32
SEQ ID SEQ ID SEQ ID 20 NO: 20 NO: 25 NO: 36 21 SEQ ID SEQ ID SEQ ID
Linhagem Elemento Elemento Elemento Elemento Elemento Elemento nº ET 1 ET 2 ET 3 ET 4 ET 5 ET 6 NO: 8 NO: 32 NO: 11
SEQ ID SEQ ID SEQ ID 22 NO: 8 NO: 22 NO: 32
SEQ ID SEQ ID SEQ ID 23 NO: 8 NO: 22 NO: 36
SEQ ID SEQ ID SEQ ID 24 NO: 8 NO: 36 NO: 11
SEQ ID SEQ ID SEQ ID 25 NO: 8 NO: 13 NO: 32
SEQ ID SEQ ID SEQ ID 26 NO: 43 NO: 11 NO: 31
SEQ ID SEQ ID SEQ ID 27 NO: 43 NO: 13 NO: 31
SEQ ID SEQ ID SEQ ID 28 NO: 43 NO: 13 NO: 18
SEQ ID SEQ ID SEQ ID 29 NO: 43 NO: 18 NO: 11
SEQ ID SEQ ID SEQ ID 30 NO: 23 NO: 14 NO: 25
SEQ ID SEQ ID SEQ ID 31 NO: 23 NO: 15 NO: 25
SEQ ID SEQ ID SEQ ID 32 NO: 33 NO: 8 NO: 22
SEQ ID SEQ ID SEQ ID 33 NO: 33 NO: 8 NO: 11
SEQ ID SEQ ID SEQ ID 34 NO: 33 NO: 27 NO: 17
SEQ ID SEQ ID SEQ ID 35 NO: 33 NO: 27 NO: 42
SEQ ID SEQ ID SEQ ID 36 NO: 33 NO: 19 NO: 25
SEQ ID SEQ ID SEQ ID 37 NO: 45 NO: 43 NO: 23
SEQ ID SEQ ID SEQ ID 38 NO: 45 NO: 46 NO: 37 39 SEQ ID SEQ ID SEQ ID
Linhagem Elemento Elemento Elemento Elemento Elemento Elemento nº ET 1 ET 2 ET 3 ET 4 ET 5 ET 6 NO: 35 NO: 36 NO: 37
SEQ ID SEQ ID SEQ ID 40 NO: 27 NO: 36 NO: 37
SEQ ID SEQ ID SEQ ID 41 NO: 27 NO: 17 NO: 32
SEQ ID SEQ ID SEQ ID 42 NO: 27 NO: 17 NO: 36
SEQ ID SEQ ID SEQ ID 43 NO: 27 NO: 17 NO: 41
SEQ ID SEQ ID SEQ ID 44 NO: 27 NO: 41 NO: 42
SEQ ID SEQ ID SEQ ID 45 NO: 27 NO: 42 NO: 32
SEQ ID SEQ ID SEQ ID 46 NO: 27 NO: 42 NO: 36
SEQ ID SEQ ID SEQ ID 47 NO: 17 NO: 9 NO: 36
SEQ ID SEQ ID SEQ ID 48 NO: 17 NO: 35 NO: 32
SEQ ID SEQ ID SEQ ID 49 NO: 17 NO: 35 NO: 36
SEQ ID SEQ ID SEQ ID 50 NO: 17 NO: 10 NO: 9
SEQ ID SEQ ID SEQ ID 51 NO: 17 NO: 10 NO: 39
SEQ ID SEQ ID SEQ ID 52 NO: 17 NO: 39 NO: 36
SEQ ID SEQ ID SEQ ID 53 NO: 17 NO: 12 NO: 9
SEQ ID SEQ ID SEQ ID 54 NO: 17 NO: 12 NO: 39
SEQ ID SEQ ID SEQ ID 55 NO: 12 NO: 16 NO: 31
SEQ ID SEQ ID SEQ ID 56 NO: 12 NO: 16 NO: 18 57 SEQ ID SEQ ID SEQ ID
Linhagem Elemento Elemento Elemento Elemento Elemento Elemento nº ET 1 ET 2 ET 3 ET 4 ET 5 ET 6 NO: 12 NO: 35 NO: 37
SEQ ID SEQ ID SEQ ID 58 NO: 12 NO: 47 NO: 25
SEQ ID SEQ ID SEQ ID 59 NO: 29 NO: 33 NO: 27
SEQ ID SEQ ID SEQ ID 60 NO: 29 NO: 9 NO: 36
SEQ ID SEQ ID SEQ ID 61 NO: 29 NO: 35 NO: 32
SEQ ID SEQ ID SEQ ID 62 NO: 29 NO: 35 NO: 36
SEQ ID SEQ ID SEQ ID 63 NO: 29 NO: 27 NO: 32
SEQ ID SEQ ID SEQ ID 64 NO: 29 NO: 27 NO: 36
SEQ ID SEQ ID SEQ ID 65 NO: 29 NO: 39 NO: 36
SEQ ID SEQ ID SEQ ID 66 NO: 29 NO: 12 NO: 9
SEQ ID SEQ ID SEQ ID 67 NO: 29 NO: 12 NO: 39
SEQ ID SEQ ID SEQ ID 68 NO: 40 NO: 17 NO: 36
SEQ ID SEQ ID SEQ ID 69 NO: 40 NO: 42 NO: 36
SEQ ID SEQ ID SEQ ID 70 NO: 41 NO: 8 NO: 11
SEQ ID SEQ ID SEQ ID 71 NO: 41 NO: 19 NO: 25
SEQ ID SEQ ID SEQ ID 72 NO: 42 NO: 9 NO: 36
SEQ ID SEQ ID SEQ ID 73 NO: 42 NO: 35 NO: 32
SEQ ID SEQ ID SEQ ID 74 NO: 42 NO: 35 NO: 36 75 SEQ ID SEQ ID SEQ ID
Linhagem Elemento Elemento Elemento Elemento Elemento Elemento nº ET 1 ET 2 ET 3 ET 4 ET 5 ET 6 NO: 42 NO: 10 NO: 9
SEQ ID SEQ ID SEQ ID 76 NO: 42 NO: 10 NO: 39
SEQ ID SEQ ID SEQ ID 77 NO: 42 NO: 39 NO: 36
SEQ ID SEQ ID SEQ ID 78 NO: 42 NO: 12 NO: 9
SEQ ID SEQ ID SEQ ID 79 NO: 42 NO: 12 NO: 39
SEQ ID SEQ ID SEQ ID 80 NO: 47 NO: 10 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID 81 NO: 22 NO: 25 NO: 36 NO: 31
SEQ ID SEQ ID SEQ ID SEQ ID 82 NO: 33 NO: 43 NO: 42 NO: 7
SEQ ID SEQ ID SEQ ID SEQ ID 83 NO: 33 NO: 45 NO: 17 NO: 46
SEQ ID SEQ ID SEQ ID SEQ ID 84 NO: 33 NO: 45 NO: 42 NO: 46
SEQ ID SEQ ID SEQ ID SEQ ID 85 NO: 33 NO: 28 NO: 15 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID 86 NO: 33 NO: 17 NO: 16 NO: 14
SEQ ID SEQ ID SEQ ID SEQ ID 87 NO: 33 NO: 17 NO: 16 NO: 15
SEQ ID SEQ ID SEQ ID SEQ ID 88 NO: 33 NO: 17 NO: 43 NO: 7
SEQ ID SEQ ID SEQ ID SEQ ID 89 NO: 33 NO: 17 NO: 35 NO: 10
SEQ ID SEQ ID SEQ ID SEQ ID 90 NO: 33 NO: 17 NO: 12 NO: 35
SEQ ID SEQ ID SEQ ID SEQ ID 91 NO: 33 NO: 38 NO: 15 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID 92 NO: 33 NO: 12 NO: 20 NO: 25 93 SEQ ID SEQ ID SEQ ID SEQ ID
Linhagem Elemento Elemento Elemento Elemento Elemento Elemento nº ET 1 ET 2 ET 3 ET 4 ET 5 ET 6 NO: 33 NO: 42 NO: 16 NO: 14
SEQ ID SEQ ID SEQ ID SEQ ID 94 NO: 33 NO: 42 NO: 16 NO: 15
SEQ ID SEQ ID SEQ ID SEQ ID 95 NO: 33 NO: 42 NO: 35 NO: 10
SEQ ID SEQ ID SEQ ID SEQ ID 96 NO: 33 NO: 42 NO: 12 NO: 35
SEQ ID SEQ ID SEQ ID SEQ ID 97 NO: 45 NO: 16 NO: 36 NO: 37
SEQ ID SEQ ID SEQ ID SEQ ID 98 NO: 45 NO: 43 NO: 13 NO: 42
SEQ ID SEQ ID SEQ ID SEQ ID 99 NO: 45 NO: 23 NO: 10 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID 100 NO: 45 NO: 28 NO: 25 NO: 32
SEQ ID SEQ ID SEQ ID SEQ ID 101 NO: 45 NO: 28 NO: 25 NO: 36
SEQ ID SEQ ID SEQ ID SEQ ID 102 NO: 45 NO: 17 NO: 16 NO: 32
SEQ ID SEQ ID SEQ ID SEQ ID 103 NO: 45 NO: 17 NO: 16 NO: 36
SEQ ID SEQ ID SEQ ID SEQ ID 104 NO: 45 NO: 17 NO: 43 NO: 13
SEQ ID SEQ ID SEQ ID SEQ ID 105 NO: 45 NO: 17 NO: 21 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID 106 NO: 45 NO: 17 NO: 41 NO: 46
SEQ ID SEQ ID SEQ ID SEQ ID 107 NO: 45 NO: 38 NO: 25 NO: 32
SEQ ID SEQ ID SEQ ID SEQ ID 108 NO: 45 NO: 38 NO: 25 NO: 36
SEQ ID SEQ ID SEQ ID SEQ ID 109 NO: 45 NO: 12 NO: 16 NO: 37
SEQ ID SEQ ID SEQ ID SEQ ID 110 NO: 45 NO: 12 NO: 23 NO: 25 111 SEQ ID SEQ ID SEQ ID SEQ ID
Linhagem Elemento Elemento Elemento Elemento Elemento Elemento nº ET 1 ET 2 ET 3 ET 4 ET 5 ET 6 NO: 45 NO: 41 NO: 42 NO: 46
SEQ ID SEQ ID SEQ ID SEQ ID 112 NO: 45 NO: 42 NO: 16 NO: 32
SEQ ID SEQ ID SEQ ID SEQ ID 113 NO: 45 NO: 42 NO: 16 NO: 36
SEQ ID SEQ ID SEQ ID SEQ ID 114 NO: 45 NO: 42 NO: 21 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID 115 NO: 25 NO: 36 NO: 11 NO: 31
SEQ ID SEQ ID SEQ ID SEQ ID 116 NO: 10 NO: 25 NO: 11 NO: 31
SEQ ID SEQ ID SEQ ID SEQ ID 117 NO: 17 NO: 16 NO: 14 NO: 32
SEQ ID SEQ ID SEQ ID SEQ ID 118 NO: 17 NO: 16 NO: 14 NO: 36
SEQ ID SEQ ID SEQ ID SEQ ID 119 NO: 17 NO: 7 NO: 25 NO: 32
SEQ ID SEQ ID SEQ ID SEQ ID 120 NO: 17 NO: 7 NO: 25 NO: 36
SEQ ID SEQ ID SEQ ID SEQ ID 121 NO: 17 NO: 13 NO: 24 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID 122 NO: 17 NO: 13 NO: 15 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID 123 NO: 17 NO: 41 NO: 16 NO: 15
SEQ ID SEQ ID SEQ ID SEQ ID 124 NO: 17 NO: 41 NO: 12 NO: 35
SEQ ID SEQ ID SEQ ID SEQ ID 125 NO: 7 NO: 25 NO: 36 NO: 37
SEQ ID SEQ ID SEQ ID SEQ ID 126 NO: 12 NO: 22 NO: 25 NO: 31
SEQ ID SEQ ID SEQ ID SEQ ID 127 NO: 12 NO: 25 NO: 11 NO: 31
SEQ ID SEQ ID SEQ ID SEQ ID 128 NO: 12 NO: 7 NO: 25 NO: 37 129 SEQ ID SEQ ID SEQ ID SEQ ID
Linhagem Elemento Elemento Elemento Elemento Elemento Elemento nº ET 1 ET 2 ET 3 ET 4 ET 5 ET 6 NO: 12 NO: 18 NO: 22 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID 130 NO: 12 NO: 18 NO: 25 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID 131 NO: 29 NO: 33 NO: 16 NO: 15
SEQ ID SEQ ID SEQ ID SEQ ID 132 NO: 29 NO: 33 NO: 45 NO: 46
SEQ ID SEQ ID SEQ ID SEQ ID 133 NO: 29 NO: 33 NO: 12 NO: 35
SEQ ID SEQ ID SEQ ID SEQ ID 134 NO: 29 NO: 45 NO: 16 NO: 32
SEQ ID SEQ ID SEQ ID SEQ ID 135 NO: 29 NO: 45 NO: 16 NO: 36
SEQ ID SEQ ID SEQ ID SEQ ID 136 NO: 29 NO: 7 NO: 25 NO: 32
SEQ ID SEQ ID SEQ ID SEQ ID 137 NO: 29 NO: 7 NO: 25 NO: 36
SEQ ID SEQ ID SEQ ID SEQ ID 138 NO: 29 NO: 13 NO: 15 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID 139 NO: 13 NO: 10 NO: 25 NO: 31
SEQ ID SEQ ID SEQ ID SEQ ID 140 NO: 13 NO: 12 NO: 25 NO: 31
SEQ ID SEQ ID SEQ ID SEQ ID 141 NO: 13 NO: 12 NO: 18 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID 142 NO: 13 NO: 18 NO: 10 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID 143 NO: 13 NO: 15 NO: 25 NO: 37
SEQ ID SEQ ID SEQ ID SEQ ID 144 NO: 13 NO: 42 NO: 24 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID 145 NO: 13 NO: 42 NO: 15 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID 146 NO: 18 NO: 22 NO: 25 NO: 36 147 SEQ ID SEQ ID SEQ ID SEQ ID
Linhagem Elemento Elemento Elemento Elemento Elemento Elemento nº ET 1 ET 2 ET 3 ET 4 ET 5 ET 6 NO: 18 NO: 25 NO: 36 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID 148 NO: 18 NO: 10 NO: 25 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID 149 NO: 41 NO: 42 NO: 16 NO: 15
SEQ ID SEQ ID SEQ ID SEQ ID 150 NO: 41 NO: 42 NO: 12 NO: 35
SEQ ID SEQ ID SEQ ID SEQ ID 151 NO: 30 NO: 45 NO: 17 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID 152 NO: 30 NO: 45 NO: 42 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID 153 NO: 15 NO: 25 NO: 37 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID 154 NO: 42 NO: 16 NO: 14 NO: 32
SEQ ID SEQ ID SEQ ID SEQ ID 155 NO: 42 NO: 16 NO: 14 NO: 36
SEQ ID SEQ ID SEQ ID SEQ ID 156 NO: 42 NO: 7 NO: 25 NO: 32
SEQ ID SEQ ID SEQ ID SEQ ID 157 NO: 42 NO: 7 NO: 25 NO: 36
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 158 NO: 33 NO: 45 NO: 43 NO: 42 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 159 NO: 33 NO: 45 NO: 17 NO: 16 NO: 10
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 160 NO: 33 NO: 45 NO: 17 NO: 43 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 161 NO: 33 NO: 45 NO: 17 NO: 12 NO: 16
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 162 NO: 33 NO: 45 NO: 38 NO: 12 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 163 NO: 33 NO: 45 NO: 12 NO: 28 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 164 NO: 33 NO: 45 NO: 42 NO: 16 NO: 10 165 SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID
Linhagem Elemento Elemento Elemento Elemento Elemento Elemento nº ET 1 ET 2 ET 3 ET 4 ET 5 ET 6 NO: 33 NO: 45 NO: 42 NO: 12 NO: 16
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 166 NO: 33 NO: 17 NO: 22 NO: 15 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 167 NO: 33 NO: 17 NO: 10 NO: 7 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 168 NO: 33 NO: 17 NO: 12 NO: 7 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 169 NO: 33 NO: 17 NO: 14 NO: 25 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 170 NO: 33 NO: 17 NO: 15 NO: 25 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 171 NO: 33 NO: 42 NO: 22 NO: 15 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 172 NO: 33 NO: 42 NO: 10 NO: 7 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 173 NO: 33 NO: 42 NO: 12 NO: 7 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 174 NO: 33 NO: 42 NO: 14 NO: 25 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 175 NO: 33 NO: 42 NO: 15 NO: 25 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 176 NO: 45 NO: 25 NO: 36 NO: 37 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 177 NO: 45 NO: 17 NO: 22 NO: 25 NO: 32
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 178 NO: 45 NO: 17 NO: 22 NO: 25 NO: 36
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 179 NO: 45 NO: 17 NO: 25 NO: 32 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 180 NO: 45 NO: 17 NO: 25 NO: 36 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 181 NO: 45 NO: 17 NO: 13 NO: 25 NO: 32
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 182 NO: 45 NO: 17 NO: 13 NO: 10 NO: 25 183 SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID
Linhagem Elemento Elemento Elemento Elemento Elemento Elemento nº ET 1 ET 2 ET 3 ET 4 ET 5 ET 6 NO: 45 NO: 17 NO: 13 NO: 12 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 184 NO: 45 NO: 17 NO: 41 NO: 12 NO: 16
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 185 NO: 45 NO: 12 NO: 25 NO: 37 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 186 NO: 45 NO: 13 NO: 12 NO: 25 NO: 37
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 187 NO: 45 NO: 13 NO: 42 NO: 25 NO: 32
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 188 NO: 45 NO: 13 NO: 42 NO: 10 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 189 NO: 45 NO: 13 NO: 42 NO: 12 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 190 NO: 45 NO: 41 NO: 42 NO: 12 NO: 16
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 191 NO: 45 NO: 42 NO: 22 NO: 25 NO: 32
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 192 NO: 45 NO: 42 NO: 22 NO: 25 NO: 36
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 193 NO: 45 NO: 42 NO: 25 NO: 32 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 194 NO: 45 NO: 42 NO: 25 NO: 36 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 195 NO: 17 NO: 24 NO: 25 NO: 36 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 196 NO: 17 NO: 13 NO: 14 NO: 25 NO: 32
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 197 NO: 17 NO: 41 NO: 12 NO: 7 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 198 NO: 17 NO: 41 NO: 15 NO: 25 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 199 NO: 17 NO: 14 NO: 25 NO: 32 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 200 NO: 17 NO: 14 NO: 25 NO: 36 NO: 11 201 SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID
Linhagem Elemento Elemento Elemento Elemento Elemento Elemento nº ET 1 ET 2 ET 3 ET 4 ET 5 ET 6 NO: 29 NO: 33 NO: 45 NO: 12 NO: 16
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 202 NO: 29 NO: 33 NO: 12 NO: 7 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 203 NO: 29 NO: 33 NO: 15 NO: 25 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 204 NO: 29 NO: 45 NO: 25 NO: 32 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 205 NO: 29 NO: 45 NO: 25 NO: 36 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 206 NO: 29 NO: 45 NO: 13 NO: 25 NO: 32
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 207 NO: 29 NO: 45 NO: 13 NO: 12 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 208 NO: 13 NO: 42 NO: 14 NO: 25 NO: 32
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 209 NO: 41 NO: 42 NO: 12 NO: 7 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 210 NO: 41 NO: 42 NO: 15 NO: 25 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 211 NO: 42 NO: 24 NO: 25 NO: 36 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 212 NO: 42 NO: 14 NO: 25 NO: 32 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 213 NO: 42 NO: 14 NO: 25 NO: 36 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 214 NO: 33 NO: 45 NO: 17 NO: 10 NO: 25 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 215 NO: 33 NO: 45 NO: 17 NO: 12 NO: 22 NO: 25
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 216 NO: 33 NO: 45 NO: 17 NO: 12 NO: 25 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 217 NO: 33 NO: 45 NO: 42 NO: 10 NO: 25 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 218 NO: 33 NO: 45 NO: 42 NO: 12 NO: 22 NO: 25 219 SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID
Linhagem Elemento Elemento Elemento Elemento Elemento Elemento nº ET 1 ET 2 ET 3 ET 4 ET 5 ET 6 NO: 33 NO: 45 NO: 42 NO: 12 NO: 25 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 220 NO: 45 NO: 17 NO: 41 NO: 12 NO: 25 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 221 NO: 45 NO: 41 NO: 42 NO: 12 NO: 25 NO: 11
SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID 222 NO: 29 NO: 33 NO: 45 NO: 12 NO: 25 NO: 11
[0111] Combinações de elementos de sequências de ácidos nucleicos curtos (elementos ET) da Tabela 2 foram utilizadas para identificar terminais de Oryza sativa que supostamente aumentam a expressão genética de um gene ligado funcionalmente. Uma pesquisa de sequências (Analisador de Genoma Genomatix; Genomatix Software GmbH, Alemanha) contra informações de genoma de Oryza sativa disponíveis ao público (www.phytozome.net) gerou quatro possíveis terminais com expressão supostamente aumentada. Terminais de controle e possíveis sem sinais de aumento curtos são relacionados na Tabela 3.
Terminais de Agrobacterium tumefaciens frequentemente utilizados em biotecnologia vegetal, t-OCS (terminal de transcrição de sintase de octopina) e t-nos (terminal de transcrição de sintase de nopalina (Genbank V00087)) são relacionados como terminais de referência na Tabela 3.
TABELA 3
[0112] Vista geral de terminais de arroz e terminais padrão t-OCS e t-nos (SEQ ID NO: vide Tabela 5): Local Local Supostos terminais que Terminais de controle Terminais padrão aumentam a expressão (O. sativa) (O. sativa) t-Os05g41900.1 t-OCS 192 bp t-Os06g47230.1 t-Os03g56790.1 t-nos 253 bp t-Os02g38920.1 t-Os02g33080.1 t-Os12g43600.1
Local Local Supostos terminais que Terminais de controle Terminais padrão aumentam a expressão (O. sativa) (O. sativa) t-Os08g10480.1 t-Os02g52290.1 t-Os05g33880.1 t-Os01g02150.1 t-Os10g33660.1 t-Os05g42424.1 t-Os03g46770.1 EXEMPLO 2
[0113] Verificação da integridade de sequências terminais por meio de PCR 3’RACE: RNA foi extraído de tecido verde de plantas de O. sativa com kit RNAeasy (QIAGEN; Hilden, Alemanha) de acordo com o protocolo do fabricante. A síntese de cDNA foi realizada utilizando o kit Quantitect (QIAGEN, Hilden, Alemanha) de acordo com o protocolo do fabricante.
[0114] Com o kit de amplificação de cDNA RACE SMARTer da BD Bioscience Clontech (Heidelberg, Alemanha), realizou-se análise 3’RACE utilizando os primers de âncora e oligo-d(T) fornecidos, bem como primers específicos de genes correspondentes relacionados na Tabela 4. Os amplicons de PCR foram clonados com o Kit de Clonagem TOPO TA da Invitrogen (Carlsbad CA, Estados Unidos) e sequenciados para determinar a posição do sinal de poliadenilação. Os comprimentos de 3’UTR confirmados estão relacionados na Tabela 4.
TABELA 4
[0115] Primers de 3’RACE específicos de genes e comprimentos de 3’UTR confirmados:
Nome do 3’ UTR Locais genômicos primer SEQ Sequência de primer confirmada por de terminais específico de ID N°
RACE gene
TATACTCGAGGCTGCCTA LOC_Os05g41900 Loy 1798 TAGATGCTCGTATGCAAT 67 225bp
ATCG
TATACTCGAGGGCCCTGG LOC_Os03g56790 Loy 1806 69 303bp
CCCTGATGATCGATCAC
TATACTCGAGTAAGGTCC LOC_Os02g33080 Loy 1810 ACCTTTGTGGAGTCATCT 71 287bp
ATCC
TATACTCGAGAATGTCATT LOC_Os08g10480 Loy 1804 TTATCTCCTGTGATATGTA 73 221bp
AAGGTTGA
TATACTCGAGGGCTGATA LOC_Os06g47230 Loy 1790 CCAATCTGTAATGCCTGA 79 129bp
AAAA
TATACTCGAGACGAGCCC LOC_Os02g38920 Loy 1808 81 225bp
TCCTCATGGA
TATACTCGAGGCGGTGG LOC_Os12g43600 Loy 1794 83 206bp
GGCCCTCATGG
TATACTCGAGACGCATCA LOC_Os02g52290 Loy 1800 TGTAATTCCGGATGGATC 85 155bp
TA
TATACTCGAGATCTAGCT LOC_Os05g33880 Loy 1802 87 271bp
CCATGGAGAGGATATG
TATACTCGAGTCGGCGAC LOC_Os01g02150 Loy 1814 GTATGGTAATTAATTACAC 89 286bp
G
TATACTCGAGAAGAGGGA LOC_Os10g33660 Loy 1812 ACTTCTCTGTAACCCAAC 91 194bp
ATTT
TATACTCGAGTCATTGATT LOC_Os05g42424 Loy 1830 93 181bp
GATGGAATTGCTGCTGTA
Nome do 3’ UTR Locais genômicos primer SEQ Sequência de primer confirmada por de terminais específico de ID N°
RACE gene
CTG
TATATACATATGTTGGTG LOC_Os03g46770 Loy 1796 95 215bp
GGGCCCATCGTGG EXEMPLO 3
[0116] Isolamento de sequências terminais por meio de Reação em Cadeia de Polimerase: DNA genômico foi extraído de tecido verde de O. sativa utilizando o Mini Kit Vegetal DNeasy da Qiagen (Qiagen, Hilden, Alemanha). Fragmentos de DNA genômicos que contêm supostas sequências terminais que aumentam a expressão foram isolados por meio de reação em cadeia de polimerase (PCR) convencional.
Além disso, foi selecionado um grupo controle de terminais que não contém nenhum sinal de aumentado da expressão (compare a Tabela 1 e a Tabela 2).
[0117] A reação em cadeia de polimerase compreendeu quinze conjuntos de primers (Tabela 5). Foram projetados 13 conjuntos de primers com base na sequência de genoma de O. sativa (www.phytozome.net) que compreende a 3’UTR completa do sinal de poliadenilação indicado e confirmado mais ~300 nt da sequência abaixo no fluxo. Um par de primers de cada foi projetado para amplificar os terminais padrão t-OCS e t-nos de Agrobacterium tumefaciens.
[0118] A reação em cadeia de polimerase seguiu o protocolo descrito por Phusion High Fidelity DNA Polymerase (Cat. nº F-540L, New England Biolabs, Ipswich MA, Estados Unidos). O DNA isolado foi utilizado como DNA modelo em amplificação por PCR utilizando os primers a seguir.
TABELA 5 Sequências de primers para terminais:
Nome Rendimento
SEQ Local do Sequência de PCR ID N° primer SEQ ID NO
TATACTCGAGGCTGCCTATAGATGCTCGTATGC Loy1798 67
AATATCG t-Os05g41900.1 1
TATAAAGCTTGGGGAGAAAACAATCTTTACATCA Loy1799 68
CATGGA
TATACTCGAGGGCCCTGGCCCTGATGATCGATC Loy1806 69
AC t-Os03g56790.1 2
TATAAAGCTTTTAGGATGGAGGGAGTAGGACAG Loy1807 70
AATAGCCTGC
TATACTCGAGTAAGGTCCACCTTTGTGGAGTCT Loy1810 71 t-Os02g33080.1 CTATCC 3 Loy1811 TATAGAATTCTGTTGTGCACTTTGATGATTTAATTG 72
TATACTCGAGAATGTCATTTTATCTCCTGTGATA Loy1804 73
TGTAAAGGTTGA t-Os08g10480.1 4
TATAAAGCTTGCATCGAAACTTTTTCTTTAATTC Loy1805 74
TTTGTCGT Loy0001 TATACTCGAGCCCTGCTTTAATGAGATATGCGAG 75 t-OCS 192bp 65 Loy0002 TATAAAGCTTGGACAATCAGTAAATTGAACGGAG 76
TATACTCGAGGATCGTTCAAACATTTGGCAATAAA Loy0003 77 t-nos 253bp G 66 Loy0004 TATAAAGCTTGATCTAGTAACATAGATGACACCG 78
TATACTCGAGGGCTGATACCAATCTGTAATGCCT Loy1790 79
GAAAAA t-Os06g47230.1 48
TATAAAGCTTTCGTTCAATTCGGTTCACAGTATGTT Loy1791 80
TCTG Loy1808 TATACTCGAGACGAGCCCTCCTCATGGA 81 t-Os02g38920.1 49 Loy1809 TATAAAGCTTATTCTAGAGATAAATCCTCGTGTGC 82 Loy1794 TATACTCGAGGCGGTGGGGCCCTCATGG 83 t-Os12g43600.1 50 Loy1795 TATAAAGCTTTGCTCCAATCTATTTGTACACAGATC 84
TATACTCGAGACGCATCATGTAATTCCGGATGGAT Loy1800 85
CTA t-Os02g52290.1 51
TATAAAGCTTATTGATTTCTGTAACTTTTCGCCGTT Loy1801 86
TGAA Loy1802 TATACTCGAGATCTAGCTCCATGGAGAGGATATG 87 t-Os05g33880.1 52 Loy1803 TATAAAGCTTCAATTGTCCATACCACTTTGTCAA 88
TATACTCGAGTCGGCGACGTATGGTAATTAATTAC Loy1814 89
ACG t-Os01g02150.1 53
TATAAAGCTTAGCGATGGAAGAATCAGAATGGTAT Loy1815 90
AGTCA
Nome Rendimento
SEQ Local do Sequência de PCR ID N° primer SEQ ID NO
TATACTCGAGAAGAGGGAACTTCTCTGTAACCCAA Loy1812 91
CATTT t-Os10g33660.1 54
TATAGAATTCAATCTAAACTTTACGCTGAACTAACC Loy1813 92
ACGG
TATACTCGAGTCATTGATTGATGGAATTGCTGCTG Loy1830 93
TACTG t-Os05g42424.1 55
TATAGAATTCAAGGCTTCAAGGCTTCAAACTTCCG Loy1831 94
A Loy1796 TATATACATATGTTGGTGGGGCCCATCGTGG 95 t-Os03g46770.1 TATAAAGCTTTCGACAATCAATCAATGATAAAAATC 56 Loy1797 96
CTCA
[0119] A amplificação durante PCR foi conduzida com a composição a seguir (50 microl): - 3,00 microl de DNA genômico de O. sativa (50 ng/microl de DNA genômico); - 10,00 microl de tampão 5x Phusion HF; - 4,00 microl de dNTP (2,5 mM); - 2,50 microl de Primer frontal (10 microM); - 2,50 microl de Primer reverso (10 microM); e - 0,50 microl de polimerase de DNA Phusion HF (2 U/microl).
[0120] Empregou-se abordagem de touch-down para PCR com os parâmetros a seguir: 98,0 ºC por 30 seg (1 ciclo), 98,0 ºC por 30 seg, 56,0 ºC por 30 seg e 72,0 ºC por 60 seg (4 ciclos), 4 ciclos adicionais cada para temperatura de combinação de 54,0 ºC, 51,0 ºC e 49,0 ºC seguidos por 20 ciclos com 98,0 ºC por 30 seg, 46,0 ºC por 30 seg e 72,0 ºC por 60 seg (4 ciclos) e 72,0 ºC por 5 min. Os produtos de amplificação foram carregados sobre gel de agarose a 2% (p/v) e separados a 80 V. Os produtos de PCR foram extirpados do gel e purificados com o Kit de Extração de Gel Qiagen (Qiagen, Hilden, Alemanha). Após digestão por restrição de DNA com endonuclease de restrição de XhoI (10 U/microl) e HindIII (10 U/microl) ou EcoRI (10 U/microl) ou SmaI (10 U/microl), os produtos digeridos foram novamente purificados com o Kit de Extração de Gel Qiagen (Qiagen, Hilden, Alemanha).
TABELA 6
[0121] Análise da digestão por restrição: Nome do Local de Nome do Local de Nome do Local de primer restrição primer restrição primer restrição Loy1798 XhoI Loy0003 XhoI Loy1802 XhoI Loy1799 HindIII Loy0004 HindIII Loy1803 HindIII Loy1806 XhoI Loy1790 XhoI Loy1814 XhoI Loy1807 HindIII Loy1791 HindIII Loy1815 HindIII Loy1810 XhoI Loy1808 XhoI Loy1812 XhoI Loy1811 EcoRI Loy1809 HindIII Loy1813 EcoRI Loy1804 XhoI Loy1794 XhoI Loy1830 XhoI Loy1805 HindIII Loy1795 HindIII Loy1831 EcoRI Loy0001 XhoI Loy1800 XhoI Loy1796 XhoI Loy0002 HindIII Loy1801 HindIII Loy1797 SmaI EXEMPLO 4
[0122] Geração de construções de vetores com sequências terminais: Utilizando o Sistema de Portal Multisite (Invitrogen, Carlsbad CA, Estados Unidos), os conjuntos de promotor::gene relator::terminal foram montados em construções binárias para transformação vegetal. O promotor p- OsGos2 de O. sativa (com o promotor indicador de prefixo p) foi utilizado na construção de gene relator e utilizou-se luciferase de vaga-lume (Promega, Madison WI, Estados Unidos) como proteína relatora para determinar quantitativamente os efeitos que aumentam a expressão das sequências terminais a serem analisadas.
[0123] Foi gerado um vetor ENTR/B que contém a sequência de codificação de luciferase de vaga-lume (Promega, Madison WI, Estados Unidos) seguida pelos terminais correspondentes (vide acima). Fragmentos de PCR terminais foram clonados separadamente abaixo no fluxo da sequência de codificação de luciferase de vaga-lume utilizando enzimas de restrição indicadas na Tabela 6. Os vetores pENTR/B resultantes estão resumidos na Tabela 7, em que as sequências de codificação possuem o prefixo c-.
TABELA 7
[0124] Todos os vetores pENTR/B: Vetor Composição do gene relator do conjunto de pENTR/B expressão parcial::SEQ ID NO LJK395 c-LUC::SEQ ID NO: 1 LJK416 c-LUC::SEQ ID NO: 2 LJK438 c-LUC::SEQ ID NO: 3 LJK415 c-LUC::SEQ ID NO: 4 LJK397 c-LUC::SEQ ID NO: 65 LJK2 c-LUC::SEQ ID NO: 66 LJK394 c-LUC::SEQ ID NO: 48 LJK396 c-LUC::SEQ ID NO: 49 LJK412 c-LUC::SEQ ID NO: 50 LJK413 c-LUC::SEQ ID NO: 51 LJK414 c-LUC::SEQ ID NO: 52 LJK417 c-LUC::SEQ ID NO: 53 LJK439 c-LUC::SEQ ID NO: 54 LJK440 c-LUC::SEQ ID NO: 55 LJK437 c-LUC::SEQ ID NO: 56
[0125] Ao realizar-se recombinação específica de local (reação de LR de local isolado) de acordo com o manual de Gateway dos fabricantes (Invitrogen, Carlsbad CA, Estados Unidos), o pENTR/B que contém o conjunto de expressão parcial (c-LUC::SEQ ID NO: 1-NO: 4, c-LUC::SEQ ID NO: 65-NO: 66 e c-LUC::SEQ ID NO: 48-NO: 56) foi combinado com um vetor de destino (VC-CCP05050-1qcz) que abriga o p-OsGos2 constitutivo acima no fluxo do local de recombinação. As reações geraram vetores binários com o promotor p- OsGos2, a sequência de codificação de luciferase de vaga-lume c-LUC e as sequências terminais correspondentes SEQ ID NO: 1-NO: 4, SEQ ID NO: 65- NO: 66 e SEQ ID NO: 48-NO: 56 abaixo no fluxo da sequência de codificação de luciferase de vaga-lume (Tabela 8), para as quais a combinação com SEQ ID NO: 1 e as construções controle (SEQ ID NO: 65 e NO: 66) é fornecida em forma de exemplo (SEQ ID NO: 97, NO: 98 e NO: 99, respectivamente). Exceto pela variação de SEQ ID NO: 2 a NO: 4 e NO: 48 a NO: 56, a sequência de nucleotídeos é idêntica em todos os vetores. Os vetores de transformação vegetal resultantes encontram-se resumidos na Tabela 8.
TABELA 8
[0126] Vetores de expressão vegetal para transformação de O. Composição do conjunto de expressão parcial Vetor de expressão vegetal SEQ ID NO p-OsGOS2::gene relator::SEQ ID NO LJK428 p-OsGOS2::c-LUC::SEQ ID NO: 1 97 LJK434 p-OsGOS2::c-LUC::SEQ ID NO: 2 LJK441 p-OsGOS2::c-LUC::SEQ ID NO: 3 LJK433 p-OsGOS2::c-LUC::SEQ ID NO: 4 LJK445 p-OsGOS2::c-LUC::SEQ ID NO: 65 98 LJK444 p-OsGOS2::c-LUC::SEQ ID NO: 66 99 LJK427 p-OsGOS2::c-LUC::SEQ ID NO: 48 LJK429 p-OsGOS2::c-LUC::SEQ ID NO: 49 LJK430 p-OsGOS2::c-LUC::SEQ ID NO: 50 LJK431 p-OsGOS2::c-LUC::SEQ ID NO: 51 LJK432 p-OsGOS2::c-LUC::SEQ ID NO: 52 LJK435 p-OsGOS2::c-LUC::SEQ ID NO: 53 LJK442 p-OsGOS2::c-LUC::SEQ ID NO: 54 LJK443 p-OsGOS2::c-LUC::SEQ ID NO: 55 LJK447 p-OsGOS2::c-LUC::SEQ ID NO: 56 sativa:
[0127] Os vetores resultantes LJK428, LJK434, LJK441, LJK433, LJK445, LJK444, LJK427, LJK429, LJK430, LJK431, LJK432, LJK435, LJK442, LJK443 e LJK447 foram utilizados em seguida para gerar plantas de O. sativa transgênicas estáveis.
EXEMPLO 5
[0128] Geração de plantas de arroz transgênicas: As células de Agrobacterium que contêm os vetores de expressão correspondentes foram utilizadas para transformar plantas de Oryza sativa.
Sementes secas do cultivar de arroz japonica Nipponbare foram descascadas.
Conduziu-se esterilização por meio de incubação por um minuto em etanol a 70%, seguida por trinta minutos em HgCl2 a 0,2%, seguido por lavagem por seis vezes por quinze minutos com água destilada estéril. As sementes estéreis germinaram sobre um meio contendo 2,4-D (meio de indução de calos). Após incubação no escuro por quatro semanas, calos embriogênicos derivados do escutelo foram extirpados e propagados sobre o mesmo meio. Após duas semanas, os calos foram multiplicados ou propagados por meio de subcultivo sobre o mesmo meio por mais duas semanas. Pedaços de calos embriogênicos foram subcultivados sobre meio novo três dias antes do cocultivo (para amplificar a atividade de divisão celular).
[0129] Linhagem LBA4404 de Agrobacterium que contém o vetor de expressão correspondente foi utilizada para cocultivo. Agrobacterium foi inoculado sobre meio AB com os antibióticos apropriados e cultivado por três dias a 28 °C. As bactérias foram recolhidas e suspensas em seguida em meio de cocultivo líquido até densidade (OD600) de cerca de 1. A suspensão foi transferida em seguida para uma placa de Petri e os calos foram imersos na suspensão por quinze minutos. Os tecidos de calos foram secos com manchas sobre um papel filtro, transferidos para meio de cocultivo solidificado e incubados por três dias no escuro a 25 °C. Calos cocultivados cresceram sobre meio contendo 2,4-D por quatro semanas no escuro a 28 °C na presença de um agente de seleção. Durante este período, desenvolveram-se ilhas de calos resistentes com crescimento rápido. Após a transferência desse material para um meio de regeneração e incubação na luz, o potencial embriogênico foi liberado e desenvolveram-se brotos nas quatro a cinco semanas seguintes.
Brotos foram extirpados dos calos e incubados por duas a três semanas sobre um meio que contém auxina do qual foram transferidos para o solo. Brotos endurecidos foram cultivados sob alta umidade e dias curtos em uma estufa.
[0130] Foram gerados cerca de 35 transformadores de arroz T0 independentes para uma construção. Os transformadores primários foram transferidos de uma câmara de cultivo de tecidos para uma estufa. Após análise de PCR quantitativa para verificar o número de cópias do inserto de T- DNA, somente plantas transgênicas de cópia única que exibiram tolerância ao agente de seleção foram mantidas para a colheita de sementes T1. As sementes foram colhidas três a cinco meses após o transplante. O método gerou transformadores de local único em taxa de mais de 50% (Aldemita e Hodges, 1996, Chan et al, 1993 e Hiei et al, 1994).
EXEMPLO 6
[0131] Análise das plantas: Material de folhas de plantas de O. sativa transgênicas adultas foi amostrado, congelado em nitrogênio líquido e submetido a testes de genes relatores de Luciferase (protocolo alterado de acordo com Ow et al, 1986).
Após a moagem, as amostras de tecido congeladas foram novamente suspensas em 800 microl de tampão I (0,1 M de tampão de fosfato, pH 7,8, 1 mM de DTT (Sigma Aldrich, St. Louis MO, Estados Unidos), 0,05% de Tween (Sigma Aldrich, St. Louis MO, Estados Unidos)), seguido por centrifugação a
10.000 g por dez minutos. 75 microl do sobrenadante aquoso foram transferidos para placas com 96 cavidades. Após a adição de 25 microl de tampão II (80 mM de glicina-glicil (Carl Roth, Karlsruhe, Alemanha), 40 mM de MgSO4 (Duchefa, Haarlem, Holanda), 60 mM de ATP (Sigma Aldrich, St. Louis MO, Estados Unidos), pH 7,8) e D-luciferina até concentração final de 0,5 mM (Cat. Nº L-8220, BioSynth, Staad, Suíça), a luminescência foi registrada em um MicroLumat Plus LB96V (Berthold Technologies, Bad Wildbad, Alemanha), gerando a unidade de luz relativa unitária RLU por minuto (RLU/min).
[0132] A fim de normalizar a atividade de luciferase entre as amostras, a concentração de proteína foi determinada no sobrenadante aquoso paralelamente à atividade de luciferase (adaptada de Bradford, 1976, Anal.
Biochem. 72, 248). 5 microl do extrato celular aquoso em tampão I foram misturados com 250 microl de reagente Bradford (Sigma Aldrich, St. Louis MO, Estados Unidos) e incubados por dez minutos à temperatura ambiente. A absorção foi determinada a 595 nm em um leitor de placas (Thermo Electron Corporation, Multiskan Ascent 354). As quantidades totais de proteína nas amostras foram calculadas com uma curva de concentração padrão gerada anteriormente. Foram calculadas as médias dos valores resultantes da razão de RLU/min e mg de proteína/ml de amostra para plantas transgênicas que abrigam construções idênticas e os valores de mudança de dobra foram calculados para determinar o impacto de sequências terminais que aumentam a expressão.
[0133] Com relação à construção de gene relator acoplada à sequência terminal t-OCS, LJK428, LJK434, LJK441 e LJK433 exibiram atividade de luciferase 2,7 vezes, 2,0 vezes, 1,7 vezes e 1,6 vezes mais alta como indicação direta dos níveis de expressão do gene relator de luciferase (Figura 1). No contexto isogênico da construção de expressão, apenas as quatro sequências terminais testadas que contêm os elementos que aumentam a expressão (Tabelas 1 e 2) causaram atividade de luciferase significativamente mais alta em comparação com o terminal t-OCS (p < 0,0005) (Figura 1).
[0134] De forma similar, com relação à construção de gene relator acoplada à sequência terminal t-nos, LJK428, LJK434, LJK441 e LJK433 exibiram atividade de luciferase 2,3 vezes, 1,7 vezes, 1,4 vezes e 1,4 vezes mais alta como indicação direta dos níveis de expressão do gene relator de luciferase (Figura 1). No contexto isogênico da construção de expressão, apenas as quatro sequências terminais testadas que contêm os elementos que aumentam a expressão (Tabelas 1 e 2) causaram atividade de luciferase significativamente mais alta em comparação com o terminal t-nos (p < 0,005) (Figura 1).
[0135] As sequências terminais nas construções LJK428, LJK434, LJK441 e LJK433 podem, portanto, servir para aumentar significativamente os níveis de expressão em comparação com os terminais padrão t-OCS e t-nos.
As sequências terminais de controle de O. sativa sem nenhum elemento de aumento curto exibiram expressão comparável com t-OCS e t-nos (Figura 1).
EXEMPLO 7
[0136] Análise por microarranjos de sequências terminais que aumentam a expressão no seu contexto nativo: Para testar se SEQ ID NO: 1 a NO: 4 também influenciaram positivamente a expressão nos seus contextos de sequências nativas de transcritos de O. sativa, plantas de arroz foram tratadas com inibidores da transcrição. A estabilidade do transcrito, testada pelo nível de transcrito após o tratamento com inibidor, foi determinada para os transcritos ligados funcionalmente de SEQ ID NO: 1-NO: 4 nos seus contextos nativos (LOC_Os05g41900.1, LOC_Os03g56790.1, LOC_Os02g33080.1 e LOC_ Os08g10480.1) por meio de análise por microarranjos (Affymetrix GeneChip Rice (48.564 transcritos); fornecido pela ATLAS-Biotech, Berlim, Alemanha).
[0137] 7.1 Tratamento de plantas de arroz transgênicas com inibidor da transcrição: A cada momento, plantas de arroz com dez dias de idade foram picadas com 40 ml de meio (1 mM de PIPES, 1 mM de citrato de sódio, 1 mM de KCl e 15 mM de sacarose; pH 6,25) por sete segundos em um misturador comercial Waring para aumentar a superfície de tratamento. 75 g/ml de actinomicina D (Sigma Aldrich, St. Louis, Estados Unidos) e 200 g/ml de cordicepina (Sigma Aldrich, St. Louis, Estados Unidos) foram adicionados ao meio e as amostras foram infiltradas a vácuo (1 x 100 mbar, sem tempo de incubação). As suspensões de tecido em líquido foram incubadas sob agitação constante (80 rpm). Amostras foram retiradas após 0 h, 6 h, 12 h, 24 h e 36 h.
[0138] 7.2 Análise por microarranjos e interpretação de dados: RNA foi extraído das amostras com o kit RNAeasy (QIAGEN; Hilden, Alemanha) e hibridizado no arroz Affymetrix Gene Chip.
[0139] O cálculo da média da análise de dados de todos os
48.564 transcritos exibiu níveis de transcrito decrescentes (cerca de três vezes) após o tratamento com inibidores no transcurso de 36 horas (Figura 2). Por outro lado, transcritos de LOC_Os05g41900.1, LOC_Os03g56790.1, LOC_Os02g33080.1 e os níveis de transcrito de LOC_ Os08g10480.1 alteraram-se em menos de 20% entre 0 h e 36 h após o tratamento com inibidor (Figura 3).
[0140] Os transcritos nativos acoplados funcionalmente a SEQ ID NO: 1 a NO: 4 exibem, portanto, estabilidade de transcrito maior que a média após o tratamento com os inibidores de transcrito Actinomicina D e Cordicepina (Figuras 2 e 3).
EXEMPLO 8
[0141] Identificação de terminais que aumentam a expressão genética em outras espécies de plantas monocotiledôneas:
Conforme descrito para O. sativa, outras espécies de plantas monocotiledôneas, ou seja, Zea mays, Sorghum bicolor e Brachypodium distachion, foram selecionadas para sequências terminais que aumentam a expressão com os elementos ET relacionados nas Tabelas 1 e 2. Foram identificadas supostas sequências terminais que aumentam a expressão (SEQ ID NO: 57-64) (Tabela 9). Análise demonstrou que SEQ ID NO: 57-64 foram ortólogas para SEQ ID NO: 1-NO: 3. As sequências ET correspondentes foram funcionalmente conservadas, portanto, entre as espécies monocotiledôneas.
TABELA 9
[0142] Sequências terminais que aumentam a expressão de Zea mays, Brachipodium distachion e Sorghum bicolor, sequências ortólogas em O.
sativa:
SEQ ID Local genético de SEQ Local genético de correspondente planta Espécie ID N° O. sativa homólogo de local de monocotiledônea O. sativa Brachipodium Bradi2g20920.1 63 distachion Sorghum LOC_Os05g41900.1 SEQ ID NO: 1 Sb09g024530.1 62 bicolor GRMZM2G113414_T01 Zea mays 64 Brachipodium Bradi1g06820.1 60 distachion LOC_Os03g56790.1 SEQ ID NO: 2 GRMZM2G130678_T02 Zea mays 61 Brachipodium Bradi3g44960.1 58 distachion Sorghum LOC_Os02g33080.1 SEQ ID NO: 3 Sb04g021790.1 57 bicolor GRMZM2G073950_T01 Zea mays 59
[0143] Sequências terminais de plantas monocotiledôneas (SEQ ID NO: 57-64) são clonadas de forma análoga e testadas em um contexto de gene relator de luciferase conforme descrito para terminal de O. sativa nos
Exemplos 2 a 6. Todos os terminais testados exibem níveis mais altos de atividade de luciferase, ou seja, expressão aumentada, em comparação com os terminais padrão t-OCS e t-nos.
BREVE DESCRIÇÃO DAS FIGURAS FIGURA 1: TESTE DE GENE RELATOR DE LUCIFERASE PARA SEQUÊNCIAS TERMINAIS DE O. SATIVA
[0144] Foram calculadas as médias dos valores da atividade de luciferase (RLU/min) para plantas transgênicas (n > 17) que abrigam construções idênticas e os valores de mudança de dobra foram calculados para determinar o impacto de sequências terminais que aumentam a expressão.
Barras cinza são utilizadas para construção terminal padrão t-OCS e t-nos.
Com relação à construção de gene relator acoplada à sequência terminal t- OCS, LJK428, LJK434, LJK441 e LJK433 exibiram atividade de luciferase 2,7 vezes, 2,0 vezes, 1,7 vezes e 1,6 vezes mais alta (p < 0,0005).
[0145] De forma similar, com relação à construção de gene relator acoplada à sequência terminal t-nos, LJK428, LJK434, LJK441 e LJK433 exibiram atividade de luciferase 2,3 vezes, 1,7 vezes, 1,4 vezes e 1,4 vezes mais alta (p < 0,005).
[0146] Expressão significativamente distinta (p < 0,005) da construção de expressão terminal t-nos é marcada por um asterisco.
Construções terminais de O. sativa controle LJK427, LJK429, LJK430, LJK431, LJK432, LJK435, LJK443 e LJK447 exibem níveis de expressão comparáveis com a construção terminal padrão t-nos. LJK442 possui níveis de atividade de luciferase significativamente mais baixos no contexto de gene relator.
FIGURA 2: INTENSIDADE MÉDIA DE SINAL DE TRANSCRITOS DE O. SATIVA EM
ANÁLISE POR MICROARRANJOS AO LONGO DO TEMPO
[0147] A intensidade média de sinal de 48.564 transcriptos sobre o arroz Affymetrix Gene Chip é medida após tratamento com inibidor da transcrição (Actinomicina D e Cordicepina). Amostras foram retiradas 0 h, 6 h, 12 h, 24 h e 36 h após o tratamento com inibidor. As intensidades médias de sinal após 36 horas caem para 1/3 da intensidade inicial antes do tratamento com inibidor. Isso reflete a estabilidade média de transcrito de transcritos de O.
sativa.
FIGURA 3: INTENSIDADES DE SINAL DE TRANSCRITOS NATIVOS ACOPLADOS A SEQUÊNCIAS TERMINAIS DE SEQ ID NO: 1-NO: 4 EM O. SATIVA; ANÁLISE POR
MICROARRANJOS APÓS TRATAMENTO COM INIBIDOR DA TRANSCRIÇÃO AO LONGO DE UM PERÍODO DE 36 HORAS.
[0148] A intensidade de sinal dos transcritos nativos acoplados às sequências terminais que aumentam a transcrição (SEQ ID NO: 1-NO: 4) é medida ao longo de um período de 36 horas após o tratamento com inibidor da transcrição. As alterações da intensidade de sinal são de menos de 20% com relação à intensidade inicial para os quatro transcritos analisados. Em comparação com a estabilidade média de transcrito (Figura 2), os transcritos acoplados a SEQ ID NO: 1-NO: 4 exibem alta estabilidade ao longo de um período de 36 horas após o tratamento com inibidor.
TABELA 10 MATRIZ DE SEQ ID NO 5
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 A 36,36 54,55 0 0 0 0 9,09 9,09 0 45,45 18,18 0 45,45 27,27 27,27 36,36 0 36,36 27,27 C 18,18 18,18 54,55 100 0 0 72,73 90,91 90,91 9,09 18,18 54,55 9,09 9,09 9,09 9,09 9,09 0 18,18 G 27,27 27,27 18,18 0 0 0 18,18 0 0 9,09 9,09 9,09 9,09 9,09 45,45 27,27 27,27 36,36 18,18 T 18,18 0 27,27 0 100 100 0 0 9,09 36,36 54,55 36,36 36,36 54,55 18,18 27,27 63,64 27,27 36,36 Pos 20 21 22 23 A 36,36 9,09 0 36,36 C 27,27 36,36 72,73 36,36 G 9,09 36,36 9,09 9,09
85/101 T 27,27 18,18 18,18 18,18 MATRIZ DE SEQ ID NO 6
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 A 16,67 41,67 50 16,67 16,67 25 0 0 25 75 8,33 0 0 16,67 41,67 33,33 16,67 16,67 0 C 33,33 16,67 8,33 41,67 0 25 0 0 0 0 8,33 0 0 33,33 33,33 41,67 16,67 41,67 8,33 G 33,33 0 25 8,33 25 8,33 0 100 0 16,67 8,33 0 0 41,67 8,33 16,67 0 16,67 16,67 T 16,67 41,67 16,67 33,33 58,33 41,67 100 0 75 8,33 75 100 100 8,33 16,67 8,33 66,67 25 75 Pos 20 A 16,67 C 33,33 G 16,67 T 33,33
MATRIZ DE SEQ ID NO 7
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 A 0 0 50 50 0 0 0 0 0 0 0 25 0 25 C 25 25 50 50 0 25 0 0 100 100 50 0 0 25 G 25 0 0 0 0 0 0 0 0 0 50 0 25 50 T 50 75 0 0 100 75 100 100 0 0 0 75 75 0 MATRIZ DE SEQ ID NO 8
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 A 25 100 25 75 25 0 0 100 0 0 75 25 25 C 0 0 25 25 0 75 100 0 0 100 0 25 0 G 25 0 50 0 75 25 0 0 0 0 25 50 0 T 50 0 0 0 0 0 0 0 100 0 0 0 75
86/101 MATRIZ DE SEQ ID NO 9
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 A 25 0 25 25 50 25 0 75 0 0 0 0 100 50 C 0 100 0 0 0 25 0 0 0 0 0 0 0 25 G 25 0 0 0 50 25 0 0 0 0 0 50 0 25 T 50 0 75 75 0 25 100 25 100 100 100 50 0 0 MATRIZ DE SEQ ID NO 10
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 A 41,67 58,33 50 50 58,33 16,67 50 0 16,67 33,33 33,33 8,33 50 0 0 0 8,33 25 0 C 33,33 8,33 0 25 8,33 16,67 16,67 25 25 33,33 0 8,33 0 0 0 0 25 0 0 G 16,67 25 25 0 8,33 8,33 25 8,33 41,67 16,67 41,67 33,33 16,67 0 100 100 8,33 16,67 0
T 8,33 8,33 25 25 25 58,33 8,33 66,67 16,67 16,67 25 50 33,33 100 0 0 58,33 58,33 100 Pos 20 21 22 23 24 25 26 A 0 16,67 25 16,67 25 75 25 C 0 8,33 33,33 41,67 8,33 0 16,67 G 100 8,33 0 16,67 33,33 8,33 25 T 0 66,67 41,67 25 33,33 16,67 33,33 MATRIZ DE SEQ ID NO 11
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 A 16,67 41,67 66,67 16,67 100 75 8,33 0 91,67 0 100 41,67 16,67 41,67 25 66,67 33,33 16,67 100 C 33,33 8,33 8,33 25 0 0 8,33 0 0 41,67 0 25 16,67 8,33 41,67 8,33 41,67 50 0 G 25 0 0 33,33 0 0 0 100 8,33 58,33 0 16,67 33,33 33,33 8,33 25 0 8,33 0 T 25 50 25 25 0 25 83,33 0 0 0 0 16,67 33,33 16,67 25 0 25 25 0 Pos 20
87/101 A 41,67 C 25 G 16,67 T 16,67 MATRIZ DE SEQ ID NO 12
Pos 1 2 3 4 5 6 7 8 9 A 16,67 75 100 100 75 0 0 100 33,33 C 16,67 0 0 0 16,67 0 0 0 16,67 G 33,33 25 0 0 8,33 100 25 0 16,67 T 33,33 0 0 0 0 0 75 0 33,33
MATRIZ DE SEQ ID NO 13
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 A 50 16,67 50 8,33 16,67 8,33 0 0 66,67 100 8,33 0 66,67 16,67 C 8,33 0 8,33 25 25 16,67 0 0 16,67 0 25 100 16,67 25 G 0 33,33 0 33,33 25 16,67 100 100 16,67 0 66,67 0 0 0 T 41,67 50 41,67 33,33 33,33 58,33 0 0 0 0 0 0 16,67 58,33 MATRIZ DE SEQ ID NO 14
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 A 8,33 50 25 25 33,33 25 25 41,67 33,33 0 0 33,33 0 91,67 0 0 25 C 50 0 8,33 41,67 8,33 50 8,33 8,33 16,67 0 0 16,67 25 0 0 0 16,67 G 16,67 0 16,67 16,67 33,33 0 41,67 8,33 41,67 0 100 41,67 0 8,33 0 0 25
88/101 T 25 50 50 16,67 25 25 25 41,67 8,33 100 0 8,33 75 0 100 100 33,33 MATRIZ DE SEQ ID NO 15
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 A 41,67 8,33 25 25 25 50 50 16,67 50 50 8,33 33,33 100 100 83,33 8,33 25 0 100 C 8,33 50 33,33 33,33 41,67 25 16,67 25 33,33 8,33 33,33 33,33 0 0 0 75 0 83,33 0 G 8,33 0 8,33 8,33 16,67 0 8,33 41,67 16,67 16,67 58,33 16,67 0 0 16,67 0 0 8,33 0 T 41,67 41,67 33,33 33,33 16,67 25 25 16,67 0 25 0 16,67 0 0 0 16,67 75 8,33 0 Pos 20 21 22 23 A 33,33 33,33 58,33 25 C 8,33 25 25 16,67 G 33,33 41,67 16,67 8,33 T 25 0 0 50
MATRIZ DE SEQ ID NO 16
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 A 16,67 50 50 8,33 41,67 8,33 16,67 33,33 25 25 25 58,33 0 0 91,67 0 25 41,67 8,33 C 16,67 0 16,67 8,33 16,67 33,33 0 41,67 50 16,67 41,67 16,67 0 0 0 0 0 50 0 G 50 8,33 0 41,67 0 16,67 16,67 16,67 8,33 0 0 16,67 0 0 0 0 75 0 0 T 16,67 41,67 33,33 41,67 41,67 41,67 66,67 8,33 16,67 58,33 33,33 8,33 100 100 8,33 100 0 8,33 91,67 Pos 20 A 25 C 41,67 G 25
89/101 T 8,33 MATRIZ DE SEQ ID NO 17
Pos 1 2 3 4 5 6 7 8 9 10 11 12 A 8,33 0 75 0 0 0 8,33 16,67 16,67 0 66,67 33,33 C 33,33 0 0 0 0 16,67 91,67 16,67 25 0 16,67 16,67 G 8,33 100 8,33 0 100 83,33 0 16,67 8,33 0 0 25 T 50 0 16,67 100 0 0 0 50 50 100 16,67 25 MATRIZ DE SEQ ID NO 18
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 A 0 30 40 30 0 0 0 0 0 0 0 10 0 20 50 0 40 40 30 C 40 40 30 10 0 0 0 0 0 0 90 30 10 40 20 0 30 40 20 G 10 0 10 20 0 10 100 0 60 0 0 30 40 20 20 40 10 20 30 T 50 30 20 40 100 90 0 100 40 100 10 30 50 20 10 60 20 0 20
Pos 20 21 22 23 A 40 20 30 40 C 10 30 40 40 G 30 10 30 10 T 20 40 0 10 MATRIZ DE SEQ ID NO 19
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 A 25 33,33 16,67 8,33 8,33 16,67 41,67 0 8,33 0 0 8,33 0 0 0 0 41,67 41,67 8,33 C 33,33 25 33,33 8,33 41,67 50 8,33 8,33 0 0 100 0 0 0 16,67 16,67 16,67 0 16,67 G 33,33 0 8,33 25 8,33 16,67 16,67 58,33 0 100 0 0 0 8,33 41,67 0 25 33,33 25
90/101 T 8,33 41,67 41,67 58,33 41,67 16,67 33,33 33,33 91,67 0 0 91,67 100 91,67 41,67 83,33 16,67 25 50 MATRIZ DE SEQ ID NO 20
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 A 71,43 14,29 0 0 0 0 0 0 0 0 0 28,57 28,57 57,14 71,43 0 C 0 0 0 0 0 0 71,43 100 0 28,57 42,86 0 28,57 42,86 14,29 42,86 G 14,29 14,29 57,14 0 0 0 28,57 0 0 71,43 0 28,57 14,29 0 14,29 14,29 T 14,29 71,43 42,86 100 100 100 0 0 100 0 57,14 42,86 28,57 0 0 42,86 MATRIZ DE SEQ ID NO 21
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 A 40 50 0 0 100 0 0 0 0 10 50 40 50 40 30 0 20 60 C 20 30 60 0 0 0 0 0 0 30 30 20 0 10 20 20 0 10 G 0 0 20 0 0 0 10 100 0 30 20 0 20 0 10 50 10 10 T 40 20 20 100 0 100 90 0 100 30 0 40 30 50 40 30 70 20
MATRIZ DE SEQ ID NO 22
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 A 22,22 0 0 0 0 11,11 11,11 0 22,22 44,44 0 11,11 22,22 22,22 11,11 0 55,56 0 C 11,11 0 0 0 100 0 77,78 55,56 11,11 0 66,67 55,56 0 55,56 22,22 44,44 44,44 44,44 G 11,11 0 0 0 0 0 11,11 0 0 22,22 11,11 0 22,22 0 11,11 33,33 0 22,22 T 55,56 100 100 100 0 88,89 0 44,44 66,67 33,33 22,22 33,33 55,56 22,22 55,56 22,22 0 33,33 MATRIZ DE SEQ ID NO 23
Pos 1 2 3 4 5 6 7 8 9 10 A 0 20 0 0 40 10 0 0 0 40 C 10 0 0 0 10 0 0 100 50 30
91/101 G 30 10 0 100 40 0 0 0 0 10 T 60 70 100 0 10 90 100 0 50 20 MATRIZ DE SEQ ID NO 24
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 A 11,11 0 100 0 77,78 0 0 0 11,11 22,22 33,33 55,56 55,56 11,11 33,33 44,44 33,33 C 11,11 0 0 0 0 0 0 0 44,44 11,11 0 0 11,11 33,33 0 11,11 0 G 22,22 44,44 0 0 0 0 0 100 0 22,22 33,33 11,11 11,11 0 11,11 0 44,44 T 55,56 55,56 0 100 22,22 100 100 0 44,44 44,44 33,33 33,33 22,22 55,56 55,56 44,44 22,22 MATRIZ DE SEQ ID NO 25
Pos 1 2 3 4 5 6 7 8 9 10 11 12 A 33,33 11,11 33,33 33,33 77,78 100 0 22,22 66,67 0 100 44,44 C 22,22 55,56 22,22 11,11 22,22 0 100 11,11 0 0 0 11,11 G 0 33,33 22,22 0 0 0 0 0 0 100 0 11,11
T 44,44 0 22,22 55,56 0 0 0 66,67 33,33 0 0 33,33 MATRIZ DE SEQ ID NO 26
Pos 1 2 3 4 5 6 7 8 9 10 11 12 A 12,5 62,5 12,5 25 12,5 0 100 0 0 37,5 12,5 37,5 C 25 0 12,5 37,5 0 0 0 0 0 12,5 0 50 G 25 0 0 25 0 0 0 0 100 25 25 0 T 37,5 37,5 75 12,5 87,5 100 0 100 0 25 62,5 12,5 MATRIZ DE SEQ ID NO 27 Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 A 42,86 28,57 42,86 42,86 0 0 0 85,71 100 0 85,71 85,71 0 C 14,29 57,14 14,29 14,29 28,57 14,29 71,43 0 0 0 0 0 42,86 G 0 14,29 0 0 28,57 0 0 14,29 0 0 14,29 0 28,57
92/101 T 42,86 0 42,86 42,86 42,86 85,71 28,57 0 0 100 0 14,29 28,57 MATRIZ DE SEQ ID NO 28
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 A 9,09 0 0 63,64 36,36 0 27,27 0 0 0 9,09 0 0 0 18,18 72,73 63,64 C 36,36 27,27 54,55 0 9,09 18,18 0 18,18 0 100 36,36 0 0 0 0 18,18 9,09 G 18,18 9,09 9,09 18,18 27,27 54,55 36,36 9,09 0 0 0 0 100 0 81,82 0 9,09 T 36,36 63,64 36,36 18,18 27,27 27,27 36,36 72,73 100 0 54,55 100 0 100 0 9,09 18,18 MATRIZ DE SEQ ID NO 29 Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 A 0 18,18 27,27 45,45 45,45 0 9,09 27,27 0 0 0 18,18 0 0 0 27,27 C 18,18 18,18 36,36 18,18 9,09 18,18 18,18 9,09 0 0 0 0 9,09 72,73 0 36,36
G 18,18 45,45 18,18 36,36 9,09 54,55 36,36 36,36 100 0 100 9,09 0 18,18 0 18,18 T 63,64 18,18 18,18 0 36,36 27,27 36,36 27,27 0 100 0 72,73 90,91 9,09 100 18,18 MATRIZ DE SEQ ID NO 30
Pos 1 2 3 4 5 6 7 8 9 10 11 A 10 0 90 0 0 0 0 10 50 30 40 C 40 0 10 0 0 0 0 50 20 30 0 G 30 0 0 0 0 100 0 40 30 0 30 T 20 100 0 100 100 0 100 0 0 40 30 MATRIZ DE SEQ ID NO 31
Pos 1 2 3 4 5 6 7 8 9 10
93/101 A 36,36 45,45 0 0 0 18,18 9,09 0 0 9,09 C 18,18 0 0 0 0 0 18,18 0 100 36,36 G 18,18 0 0 0 100 0 18,18 9,09 0 27,27 T 27,27 54,55 100 100 0 81,82 54,55 90,91 0 27,27 MATRIZ DE SEQ ID NO 32
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 A 18,18 54,55 18,18 27,27 45,45 0 0 0 0 0 0 9,09 36,36 27,27 27,27 45,45 36,36 C 9,09 0 27,27 18,18 45,45 90,91 100 0 18,18 9,09 100 72,73 27,27 18,18 45,45 18,18 18,18 G 27,27 0 27,27 36,36 0 0 0 0 27,27 0 0 9,09 18,18 18,18 18,18 36,36 9,09 T 45,45 45,45 27,27 18,18 9,09 9,09 0 100 54,55 90,91 0 9,09 18,18 36,36 9,09 0 36,36 MATRIZ DE SEQ ID NO 33
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 A 37,5 25 12,5 62,5 0 0 12,5 25 87,5 50 25 37,5 0 0 100 12,5 0 100 100
C 25 0 25 0 50 37,5 0 12,5 0 0 0 0 12,5 100 0 87,5 87,5 0 0 G 25 0 0 25 37,5 0 37,5 12,5 0 0 12,5 25 50 0 0 0 0 0 0 T 12,5 75 62,5 12,5 12,5 62,5 50 50 12,5 50 62,5 37,5 37,5 0 0 0 12,5 0 0 Pos 20 A 50 C 12,5 G 12,5 T 25 MATRIZ DE SEQ ID NO 34
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 A 20 30 0 0 100 20 0 0 10 30 60 30 20 30 30 30 30 C 10 20 0 0 0 60 0 0 50 30 0 10 40 30 20 10 30
94/101 G 50 40 0 0 0 0 0 90 30 30 0 20 20 10 10 60 10 T 20 10 100 100 0 20 100 10 10 10 40 40 20 30 40 0 30 MATRIZ DE SEQ ID NO 35
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 A 22,22 55,56 55,56 55,56 44,44 0 22,22 100 100 0 77,78 66,67 22,22 11,11 55,56 11,11 C 33,33 0 0 0 22,22 0 0 0 0 0 22,22 11,11 22,22 0 0 0 G 11,11 44,44 33,33 11,11 11,11 0 0 0 0 0 0 0 33,33 44,44 0 22,22 T 33,33 0 11,11 33,33 22,22 100 77,78 0 0 100 0 22,22 22,22 44,44 44,44 66,67 MATRIZ DE SEQ ID NO 36
Pos 1 2 3 4 5 6 7 8 9 10 11 A 11,11 11,11 22,22 22,22 0 0 0 22,22 11,11 100 22,22
C 33,33 0 11,11 11,11 100 0 0 22,22 0 0 11,11 G 33,33 0 33,33 11,11 0 0 100 44,44 11,11 0 22,22 T 22,22 88,89 33,33 55,56 0 100 0 11,11 77,78 0 44,44 MATRIZ DE SEQ ID NO 37
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 A 33,33 16,67 16,67 25 33,33 25 0 0 0 25 0 0 0 8,33 33,33 41,67 41,67 0 16,67 C 25 50 50 25 25 8,33 0 0 0 0 0 8,33 100 41,67 25 33,33 0 0 33,33 G 33,33 25 8,33 0 16,67 25 0 0 100 0 25 8,33 0 16,67 25 0 16,67 41,67 16,67 T 8,33 8,33 25 50 25 41,67 100 100 0 75 75 83,33 0 33,33 16,67 25 41,67 58,33 33,33 Pos 20 21 A 50 25
95/101 C 33,33 33,33 G 16,67 16,67 T 0 25 MATRIZ DE SEQ ID NO 38
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 A 9,09 0 0 63,64 36,36 0 27,27 0 0 0 9,09 0 0 0 18,18 72,73 63,64 C 36,36 27,27 54,55 0 9,09 18,18 0 18,18 0 100 36,36 0 0 0 0 18,18 9,09 G 18,18 9,09 9,09 18,18 27,27 54,55 36,36 9,09 0 0 0 0 100 0 81,82 0 9,09 T 36,36 63,64 36,36 18,18 27,27 27,27 36,36 72,73 100 0 54,55 100 0 100 0 9,09 18,18 MATRIZ DE SEQ ID NO 39
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 A 0 0 16,67 16,67 33,33 0 0 16,67 0 0 0 0 25
C 41,67 0 16,67 25 16,67 0 8,33 0 75 0 0 0 16,67 G 16,67 41,67 8,33 33,33 16,67 0 16,67 83,33 25 0 0 0 33,33 T 41,67 58,33 58,33 25 33,33 100 75 0 0 100 100 100 25 MATRIZ DE SEQ ID NO 40
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 A 33,33 0 0 8,33 75 0 33,33 0 0 16,67 0 33,33 33,33 0 41,67 C 16,67 0 0 16,67 0 0 0 0 0 25 58,33 8,33 25 50 16,67 G 8,33 100 0 75 0 0 0 0 16,67 25 16,67 0 25 33,33 8,33 T 41,67 0 100 0 25 100 66,67 100 83,33 33,33 25 58,33 16,67 16,67 33,33
96/101 MATRIZ DE SEQ ID NO 41
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 A 27,27 45,45 36,36 9,09 54,55 18,18 36,36 9,09 0 0 27,27 0 54,55 27,27 27,27 9,09 0 0 0 C 54,55 9,09 18,18 54,55 0 27,27 9,09 45,45 36,36 18,18 9,09 27,27 0 36,36 0 0 100 0 0 G 9,09 0 18,18 27,27 27,27 18,18 18,18 27,27 36,36 9,09 27,27 36,36 27,27 0 72,73 72,73 0 0 0 T 9,09 45,45 27,27 9,09 18,18 36,36 36,36 18,18 27,27 72,73 36,36 36,36 18,18 36,36 0 18,18 0 100 100 Pos 20 21 22 23 A 0 0 45,45 9,09 C 9,09 0 18,18 45,45 G 81,82 0 0 18,18 T 9,09 100 36,36 27,27 MATRIZ DE SEQ ID NO 42
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 A 25 16,67 0 0 0 0 8,33 0 0 41,67 41,67 8,33 58,33 33,33 8,33 50 66,67 58,33 8,33
C 8,33 50 100 0 0 8,33 8,33 50 100 25 16,67 25 8,33 25 58,33 8,33 0 16,67 33,33 G 25 0 0 0 8,33 8,33 8,33 50 0 8,33 8,33 50 25 16,67 0 0 8,33 16,67 41,67 T 41,67 33,33 0 100 91,67 83,33 75 0 0 25 33,33 16,67 8,33 25 33,33 41,67 25 8,33 16,67 MATRIZ DE SEQ ID NO 43
Pos 1 2 3 4 5 6 7 8 9 10 A 40 60 0 0 0 0 90 0 20 50 C 20 0 0 10 100 20 0 100 80 20 G 10 0 20 90 0 0 10 0 0 10 T 30 40 80 0 0 80 0 0 0 20 MATRIZ DE SEQ ID NO 44
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
97/101 A 27,27 63,64 45,45 0 0 9,09 0 63,64 0 0 54,55 36,36 36,36 72,73 54,55 45,45 63,64 45,45 C 27,27 9,09 0 0 36,36 0 0 18,18 0 0 9,09 18,18 18,18 0 9,09 18,18 18,18 0 G 18,18 0 9,09 0 0 9,09 100 18,18 0 100 18,18 9,09 9,09 9,09 9,09 27,27 18,18 18,18 T 27,27 27,27 45,45 100 63,64 81,82 0 0 100 0 18,18 36,36 36,36 18,18 27,27 9,09 0 36,36 MATRIZ DE SEQ ID NO 45
Pos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 A 50 10 50 20 60 0 30 40 20 40 20 70 0 60 10 0 20 100 10 C 10 10 0 40 20 40 10 40 0 40 30 10 0 40 0 100 80 0 70 G 10 60 20 10 10 30 40 0 40 0 40 10 100 0 0 0 0 0 20 T 30 20 30 30 10 30 20 20 40 20 10 10 0 0 90 0 0 0 0 Pos 20 A 30
C 20 G 30 T 20 MATRIZ DE SEQ ID NO 46
Pos 1 2 3 4 5 6 7 8 9 10 11 12 A 45,45 27,27 0 100 0 90,91 90,91 0 27,27 45,45 0 54,55 C 18,18 0 100 0 0 9,09 9,09 9,09 9,09 9,09 27,27 18,18 G 27,27 0 0 0 0 0 0 72,73 27,27 36,36 36,36 9,09 T 9,09 72,73 0 0 100 0 0 18,18 36,36 9,09 36,36 18,18 MATRIZ DE SEQ ID NO 47
98/101 Pos 1 2 3 4 5 6 7 8 9 10 A 33,33 0 33,33 100 0 0 0 0 0 0 C 0 0 66,67 0 0 0 0 0 66,67 66,67 G 33,33 0 0 0 0 0 0 0 33,33 0 T 33,33 100 0 0 100 100 100 100 0 33,33
[0149] Tabela 10: tabela de pesos de matriz que define a frequência de cada base A, T, G ou C em cada posição nos motivos definidos.
Pos: posição no motivo, a frequência é fornecida em %. Soma maior ou menor que 100% em uma posição deve-se a erro de arredondamento.
REFERÊNCIAS:
[0150] As referências relacionadas abaixo e todas as referências mencionadas no presente são incorporadas ao presente coom referência a fim de suplementar, explicar, fornecer antecedentes ou ensinar metodologia, métodos e/ou composições empregadas no presente.
Dunwell (2000), J. Exp. Bot. 51 Edição nº 487-96.
Zhao et al (1999), Microbiol. Mol. Biol. Rev. 63: 405-445.
Proudfoot (1986), Nature 322: 562-565.
Kim et al (2003), Biotechnology Progress 19: 1620-1622.
Yonaha & Proudfoot (2000), EMBO J. 19: 3770-3777.
Cramer et al (2001), FEBS Letters 498: 179-182.
Kuersten & Goodwin (2003), Nature Reviews Genetics 4: 626-637.
R. R. Aldemita e T. K. Hodges, Agrobacterium tumefaciens- mediated transformation of japonica and indica rice varieties, Planta 199 (4): 612-617, 1996.
M. M. Bradford, Rapid and Sensitive Method for Quantitation of Microgram Quantities of Protein Utilizing Principle of Protein-Dye Binding, Analytical Biochemistry 72 (1-2): 248-254, 1976.
M. T. Chan, H. H. Chang, S. L. Ho, W. F. Tong e S. M. Yu, Agrobacterium-Mediated Production of Transgenic Rice Plants Expressing A Chimeric Alpha-Amylase Promoter Beta-Glucuronidase Gene, Plant Molecular Biology 22 (3): 491-506, 1993.
Cartharius, K., Frech, K. e Grote, K. (2005), Matlnspector and beyond: promoter analysis based on transcription factor binding sites,
Bioinformatics 21 (13) 2933-2942.
Cartharius K (2005), DNA Press.
Genbank V00087.
Y. Hiei, S. Ohta, T. Komari e T. Kumashiro, Efficient Transformation of Rice (Oryza-Sativa L) Mediated by Agrobacterium and Sequence-Analysis of the Boundaries of the T-DNA, Plant Journal 6 (2): 271- 282, 1994.
D. W. Ow, K. V. Wood, M. Deluca, J. R. Dewet, D. R. Helinski e S.
H. Howell, Transient and Stable Expression of the Firefly Luciferase Gene in Plant-Cells and Transgenic Plants, Science 234 (4778): 856-859, 1986.
J. Sambrook, E. F. Fritsch e T. Maniatis, Molecular Cloning A Laboratory Manual, segunda edição, Vols. 1, 2 e 3.
Sambrook, J., E. F. Fritsch e T.Maniatis. Molecular Cloning: A Laboratory Manual, segunda edição, Vols. 1, 2 e 3, Xxxix + paginação varia (Vol. 1); Xxxiii + paginação varia (Vol. 2): Xxxii + paginação varia (Vol. 3), Cold Spring Harbor Laboratory Press: 1989.
F. Sanger, S. Nicklen e A. R. Coulson, DNA Sequencing with Chain-Terminating Inhibitors, Proceedings of the National Academy of Sciences of the United States of America 74 (12): 5463-5467, 1977.
www.phytozome.net.
Mapendano, C. K. et al. Crosstalk between mRNA 3 ' End Processing and Transcription Initiation, Molecular Cell 40.3 (2010): 410-22.
Nagaya, S. et al, The HSP Terminator of Arabidopsis thaliana Increases Gene Expression in Plant Cells, Plant and Cell Physiology 51.2 (2010): 328-32.
Narsai, R. et al, Genome-wide analysis of mRNA decay rates and their determinants thaliana, Plant Cell 19.11 (2007): 3418-36.
K. Quandt, K. Frech, H. Karas, E. Wingender e T. Werner (1995),
Matind and Matinspector: new fast and versatile tools for detection of consensus matches in nucleotide sequence data, Nucleic Acid Research 23
(23) 4878-4884.

Claims (17)

REIVINDICAÇÕES
1. MOLÉCULAS TERMINAIS, caracterizadas por compreenderem pelo menos um dos seguintes elementos terminais aprimoradores (ET), conforme definidos na Tabela 1, ou suas combinações, conforme definidas na Tabela 2, ou o complemento ou complemento reverso de qualquer desses ETs ou combinações desses ETs, em que as moléculas terminais que compreendem os mencionados ETs ou suas combinações causam expressão aumentada de moléculas de ácido nucleico heterólogas às quais as moléculas terminais são ligadas funcionalmente.
2. MOLÉCULAS TERMINAIS, caracterizadas por compreenderem uma sequência selecionada a partir do grupo que consiste em: (a) as moléculas de ácido nucleico que possuem uma sequência conforme definida em SEQ ID NO: 1, 2, 3, 4, 57, 58, 59, 60, 61, 62, 63 e 64; ou (b) uma molécula de ácido nucleico que contém uma sequência com uma identidade de pelo menos 60% a SEQ ID NO: 1, 2, 3, 4, 57, 58, 59, 60, 61, 62, 63 e 64; ou (c) um fragmento de 100 ou mais bases consecutivas de uma molécula de ácido nucleico de (i) ou (ii) que possui atividade que aumenta a expressão como a molécula de ácido nucleico correspondente que possui a sequência de SEQ ID NO: 1, 2, 3, 4, 57, 58, 59, 60, 61, 62, 63 e 64; ou (d) uma molécula de ácido nucleico que é o complemento ou complemento reverso de qualquer das moléculas de ácido nucleico mencionadas anteriormente em (i) ou (ii); ou (e) uma molécula de ácido nucleico que pode ser obtida por PCR utilizando primers de oligonucleotídeos descritos por SEQ ID NO: 63 a 96, conforme exibido na Tabela 5; ou (f) uma molécula de ácido nucleico de 100 nucleotídeos ou mais, que se hibridiza sob condições equivalentes à hibridização em 7% de dodecil sulfato de sódio (SDS), 0,5 M de NaPO4, 1 mM de EDTA a 50 ºC com lavagem em 2 X SSC, 0,1% de SDS a 50 ºC para uma molécula de ácido nucleico que compreende pelo menos 50 nucleotídeos consecutivos de um terminal que aumenta a transcrição descrito por SEQ ID NO: 1, 2, 3, 4, 57, 58, 59, 60, 61, 62, 63 e 64 ou seu complemento; em que as moléculas terminais causam expressão aumentada de moléculas de ácido nucleico heterólogas às quais elas são ligadas funcionalmente.
3. MÉTODO DE IDENTIFICAÇÃO e isolamento de moléculas terminais, que causam expressão aumentada de moléculas de ácido nucleico heterólogas às quais as moléculas terminais são ligadas funcionalmente, caracterizado por compreender as etapas de: (a) identificação de 3’UTR; e (b) identificação de DNA genômico correspondente; (c) identificação de moléculas no grupo identificado em (b) que contêm quaisquer dos ETs ou suas combinações, conforme definidos nas Tabelas 1 e 2, utilizando qualquer ferramenta de detecção de ET por computador ou análise de sequências de coincidência de conjuntos (string matching) IUPAC; e (d) isolamento de pelo menos 250 bp de DNA genômico que compreende os mencionados ETs.
4. MÉTODO PARA PRODUZIR UMA MOLÉCULA TERMINAL recombinante, que aumenta a expressão de moléculas de ácido nucleico heterólogas às quais a molécula terminal é ligada funcionalmente, caracterizado pelo método compreender as etapas de introdução, em uma molécula terminal que não possui a propriedade que aumenta a expressão, de pelo menos um elemento ET, conforme definido na Tabela 1 ou Tabela 10, ou suas combinações, conforme definidas na Tabela 2, ou o seu complemento ou complemento reverso.
5. MÉTODO PARA PRODUZIR UMA PLANTA ou sua parte com expressão aumentada, em comparação com uma planta controle correspondente ou sua parte, de uma ou mais moléculas de ácido nucleico, caracterizado por compreender as etapas de: (a) introdução na planta ou sua parte de uma ou mais moléculas terminais que compreendem um ET ou suas combinações, conforme definidos na Tabela 1 ou 2, ou uma molécula terminal, conforme definida na reivindicação 2 (a) a (f); e (b) ligação funcional de mencionadas uma ou mais moléculas terminais a um promotor e a uma molécula de ácido nucleico que se encontra sob o controle do mencionado promotor, em que a molécula terminal é heteróloga a mencionada molécula de ácido nucleico e/ou promotor.
6. MÉTODO, de acordo com a reivindicação 5, caracterizado por compreender as etapas de: (a) introdução da uma ou mais moléculas terminais que compreendem um ET ou suas combinações, conforme definidos na Tabela 1 ou 2, ou uma molécula terminal, conforme definida na reivindicação 2 (a) a (f) em uma planta ou sua parte; e (b) integração do mencionado um ou mais terminal no genoma da mencionada planta ou sua parte, por meio do quê os mencionados um ou mais terminais são ligados funcionalmente a um ácido nucleico expresso endógeno heterólogo aos mencionados um ou mais terminais; e, opcionalmente, (c) regeneração de uma planta ou sua parte que compreende os mencionados um ou mais terminais da mencionada célula transformada.
7. MÉTODO, de acordo com uma das reivindicações 5 a 6,
caracterizado por compreender as etapas de: (a) fornecimento de uma construção de expressão que compreende uma ou mais moléculas terminais que compreendem ET ou suas combinações, conforme definidos na Tabela 1 ou 2, ou molécula terminal, conforme definida na reivindicação 2 (a) a (f), ligada funcionalmente a um promotor e a uma ou mais moléculas de ácido nucleico, em que esta última é heteróloga às mencionadas uma ou mais moléculas terminais e encontra-se sob o controle do mencionado promotor; e (b) integração da mencionada construção de expressão que compreende as mencionadas uma ou mais moléculas terminais ao genoma da mencionada planta ou sua parte; e, opcionalmente, (c) regeneração de uma planta ou sua parte que compreende as mencionadas uma ou mais construções de expressão da mencionada planta transformada ou sua parte.
8. MÉTODO, de acordo com uma das reivindicações 5 a 7, caracterizado pela planta ser uma planta monocotiledônea ou dicotiledônea.
9. CONSTRUÇÃO DE EXPRESSÃO recombinante, caracterizada por compreender uma ou mais moléculas terminais que compreendem ET ou suas combinações, conforme definidos na Tabela 1 ou 2, ou uma molécula terminal, conforme definida na reivindicação 2 (a) a (f).
10. CONSTRUÇÃO, de acordo com a reivindicação 9, caracterizada pela molécula terminal ser ligada funcionalmente a um ou mais promotores e uma ou mais moléculas de ácido nucleico expressas, em que pelo menos esta última é heteróloga aos mencionados um ou mais terminais.
11. VETOR DE EXPRESSÃO recombinante, caracterizado por compreender uma ou mais construções de expressão recombinantes, conforme definidas em uma das reivindicações 9 a 10.
12. MICROORGANISMO TRANSGÊNICO, caracterizado por compreender uma ou mais moléculas terminais heterólogas que compreendem um ET ou suas combinações, conforme definidos na Tabela 1 ou 2, ou uma molécula terminal heteróloga, conforme definida na reivindicação 2 (a) a (f).
13. MICROORGANISMO TRANSGÊNICO, caracterizado por compreender um vetor de expressão recombinante, conforme definido na reivindicação 11, ou uma construção de expressão recombinante, conforme definida em uma das reivindicações 9 a 10.
14. MICROORGANISMO, de acordo com a reivindicação 13, caracterizado por ser selecionado ou derivado a partir do grupo que consiste em bactérias, fungos, leveduras ou plantas.
15. CULTIVO DE MICROORGANISMOS TRANSGÊNICOS, conforme definidos em uma das reivindicações 12 a 14, caracterizado por compreender o mencionado terminal heterólogo que compreende um ET ou sua combinação, conforme definidos na Tabela 1 ou 2, ou uma molécula terminal heteróloga, conforme definida na reivindicação 2 (a) a (f), a construção de expressão recombinante, conforme definida em uma das reivindicações 9 a 10, ou vetor recombinante, conforme definido na reivindicação 11.
16. USO DA MOLÉCULA TERMINAL, que compreende ET ou suas combinações, conforme definidos na Tabela 1 ou 2, ou uma molécula terminal, conforme definida na reivindicação 2 (a) a (f), ou a construção recombinante, conforme definida em uma das reivindicações 9 a 10, ou vetor recombinante, conforme definido na reivindicação 11, caracterizado por ser para aumentar a expressão em plantas ou suas partes.
17. MÉTODO PARA A PRODUÇÃO DE UM PRODUTO AGRÍCOLA, caracterizado por introduzir um ET ou sua combinação, conforme definidos na Tabela 1 ou 2, ou uma molécula terminal, conforme definida na reivindicação 2 (a) a (f), ou a construção recombinante, conforme definida em uma das reivindicações 9 a 10, ou vetor recombinante, conforme definido na reivindicação 11, em uma planta, cultivo da planta, colheita e processamento da planta ou suas partes.
BR112014002342-5A 2011-08-01 2012-07-20 moléculas terminais, método de identificação e isolamento de moléculas terminais, método de produção de moléculas terminais recombinantes, método de produção de plantas ou suas partes com expressão amplificada, construção de expressão recombinante, vetor de expressão recombinante, célula transgênica, planta transgênica ou sua parte, cultivo de células transgênicas, sementes trasngênicas, partes ou material de propagação derivados de uma célula ou planta transgênica ou sua parte, uso da molécula terminal e método de produção de produto agrícola BR112014002342A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161513682P 2011-08-01 2011-08-01
US61/513,682 2011-08-01
PCT/IB2012/053704 WO2013017982A1 (en) 2011-08-01 2012-07-20 Method for identification and isolation of terminator sequences causing enhanced transcription

Publications (1)

Publication Number Publication Date
BR112014002342A2 true BR112014002342A2 (pt) 2020-11-17

Family

ID=47628682

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112014002342-5A BR112014002342A2 (pt) 2011-08-01 2012-07-20 moléculas terminais, método de identificação e isolamento de moléculas terminais, método de produção de moléculas terminais recombinantes, método de produção de plantas ou suas partes com expressão amplificada, construção de expressão recombinante, vetor de expressão recombinante, célula transgênica, planta transgênica ou sua parte, cultivo de células transgênicas, sementes trasngênicas, partes ou material de propagação derivados de uma célula ou planta transgênica ou sua parte, uso da molécula terminal e método de produção de produto agrícola

Country Status (8)

Country Link
US (1) US20140250546A1 (pt)
EP (2) EP2739737A4 (pt)
CN (1) CN103732747A (pt)
AU (1) AU2012291737A1 (pt)
BR (1) BR112014002342A2 (pt)
CA (1) CA2842092A1 (pt)
IN (1) IN2014CN00793A (pt)
WO (1) WO2013017982A1 (pt)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170002370A1 (en) * 2013-12-20 2017-01-05 Basf Plant Science Gmbh Isolation of terminator sequences causing enhanced transcription
CN105132412B (zh) * 2015-07-29 2019-02-22 福建省农业科学院生物技术研究所 一种arf1基因3′-UTR及其在控制基因表达中的应用
CN105296485A (zh) * 2015-11-04 2016-02-03 福建省农业科学院生物技术研究所 一种aqp基因3′-utr及其在控制基因表达中的应用
WO2019046783A1 (en) * 2017-08-31 2019-03-07 Ohio State Innovation Foundation METHODS OF MAKING AND USING TANDEM MOLECULES WITH DOUBLE BAR CODES
US20200152288A1 (en) * 2018-07-07 2020-05-14 Tata Consultancy Services Limited System and method for predicting effect of genomic variations on pre-mrna splicing
GB202107598D0 (en) * 2021-05-27 2021-07-14 Leaf Expression Systems Ltd Recombinant protein production

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1048254C (zh) 1993-12-09 2000-01-12 托马斯杰弗逊大学 用于将预定的改变引入靶基因中的化合物
CA2255057A1 (en) * 1996-06-21 1997-12-31 Plant Genetic Systems, N.V. Gene expression in plants
US5994526A (en) * 1996-06-21 1999-11-30 Plant Genetic Systems Gene expression in plants
US6555732B1 (en) 1998-09-14 2003-04-29 Pioneer Hi-Bred International, Inc. Rac-like genes and methods of use
WO2003020936A1 (en) * 2001-08-31 2003-03-13 The Dow Chemical Company Nucleic acid compositions conferring altered metabolic characteristics
JP2005185101A (ja) * 2002-05-30 2005-07-14 National Institute Of Agrobiological Sciences 植物の全長cDNAおよびその利用
US7250496B2 (en) * 2002-11-14 2007-07-31 Rosetta Genomics Ltd. Bioinformatically detectable group of novel regulatory genes and uses thereof
EP1781784A2 (en) * 2004-08-02 2007-05-09 BASF Plant Science GmbH Method for isolation of transcription termination sequences
US20060168677A1 (en) * 2005-01-24 2006-07-27 Her Majesty The Queen In Right Of Canada As Represented By The Min. Of Agriculture & Agri-Food Transcriptional termination of transgene expression using host genomic terminators
US20080171361A1 (en) * 2007-01-11 2008-07-17 The Board Of Regents For Oklahoma State University CAP-Independent Translational Enhancer for Protein Synthesis in Wheat Germ Extract and Transgenic Cereals
WO2009150456A1 (en) * 2008-06-10 2009-12-17 Isis Innovation Limited Protein expression
US8080413B2 (en) * 2008-06-18 2011-12-20 E.I Du Pont De Nemours And Company Soybean transcription terminators and use in expression of transgenic genes in plants

Also Published As

Publication number Publication date
US20140250546A1 (en) 2014-09-04
AU2012291737A1 (en) 2014-01-30
WO2013017982A1 (en) 2013-02-07
EP3112465A2 (en) 2017-01-04
EP3112465A3 (en) 2017-04-12
EP2739737A1 (en) 2014-06-11
EP2739737A4 (en) 2015-08-26
CN103732747A (zh) 2014-04-16
CA2842092A1 (en) 2013-02-07
IN2014CN00793A (pt) 2015-04-03

Similar Documents

Publication Publication Date Title
US10689657B2 (en) Regulatory nucleic acid molecules for enhancing constitutive gene expression in plants
US10041083B2 (en) Regulatory nucleic acid molecules for enhancing seed-specific and/or seed-preferential gene expression in plants
US20150052636A1 (en) Regulatory Nucleic Acid Molecules for Reliable Gene Expression in Plants
US20140230087A1 (en) Regulatory Nucleic Acid Molecules for Enhancing Constitutive Gene Expression in Plants
BR112014002342A2 (pt) moléculas terminais, método de identificação e isolamento de moléculas terminais, método de produção de moléculas terminais recombinantes, método de produção de plantas ou suas partes com expressão amplificada, construção de expressão recombinante, vetor de expressão recombinante, célula transgênica, planta transgênica ou sua parte, cultivo de células transgênicas, sementes trasngênicas, partes ou material de propagação derivados de uma célula ou planta transgênica ou sua parte, uso da molécula terminal e método de produção de produto agrícola
US20150135368A1 (en) Expression Cassettes for Stress-Induced Gene Expression in Plants
AU2014369235A1 (en) Isolation of terminator sequences causing enhanced transcription

Legal Events

Date Code Title Description
B12F Other appeals [chapter 12.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B11B Dismissal acc. art. 36, par 1 of ipl - no reply within 90 days to fullfil the necessary requirements
B350 Update of information on the portal [chapter 15.35 patent gazette]