BRPI0609283A2 - métodos para identificar um ìntron com propriedades intensificadoras de expressão em plantas, para enriquecer o número de ìntrons com propriedades intensificadoras de expressão em plantas, para isolar, fornecer ou produzir um ìntron com propriedades intensificadoras de expressão em plantas, para fornecer um cassete de expressão e para intensificar a expressão de uma seqüência de ácidos nucleicos em uma planta ou uma célula de planta, algoritmo de computador, dispositivo de computador ou dispositivo de armazenamento de dados, construto de expressão de dna recombinante, vetor de expressão, célula transgênica ou organismo não humano transgênico, cultura celular, partes ou material de propagação, e, uso de um organismo transgênico ou de culturas celulares, partes de material de propagação transgênico derivadas destas - Google Patents

métodos para identificar um ìntron com propriedades intensificadoras de expressão em plantas, para enriquecer o número de ìntrons com propriedades intensificadoras de expressão em plantas, para isolar, fornecer ou produzir um ìntron com propriedades intensificadoras de expressão em plantas, para fornecer um cassete de expressão e para intensificar a expressão de uma seqüência de ácidos nucleicos em uma planta ou uma célula de planta, algoritmo de computador, dispositivo de computador ou dispositivo de armazenamento de dados, construto de expressão de dna recombinante, vetor de expressão, célula transgênica ou organismo não humano transgênico, cultura celular, partes ou material de propagação, e, uso de um organismo transgênico ou de culturas celulares, partes de material de propagação transgênico derivadas destas Download PDF

Info

Publication number
BRPI0609283A2
BRPI0609283A2 BRPI0609283-7A BRPI0609283A BRPI0609283A2 BR PI0609283 A2 BRPI0609283 A2 BR PI0609283A2 BR PI0609283 A BRPI0609283 A BR PI0609283A BR PI0609283 A2 BRPI0609283 A2 BR PI0609283A2
Authority
BR
Brazil
Prior art keywords
sequence
intron
plant
expression
seq
Prior art date
Application number
BRPI0609283-7A
Other languages
English (en)
Inventor
Marc Morra
Christian Dammann
Liqun Xing
Hee-Sook Song
Original Assignee
Basf Plant Science Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Basf Plant Science Gmbh filed Critical Basf Plant Science Gmbh
Publication of BRPI0609283A2 publication Critical patent/BRPI0609283A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/8223Vegetative tissue-specific promoters
    • C12N15/8225Leaf-specific, e.g. including petioles, stomata
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/8223Vegetative tissue-specific promoters
    • C12N15/8227Root-specific
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/823Reproductive tissue-specific promoters
    • C12N15/8234Seed-specific, e.g. embryo, endosperm

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Cell Biology (AREA)
  • Developmental Biology & Embryology (AREA)
  • Pregnancy & Childbirth (AREA)
  • Reproductive Health (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

MéTODOS PARA IDENTIFICAR UM INTRON COM PROPRIEDADES INTENSIFICADORAS DE EXPRESSãO EM PLANTAS, PARA ENRIQUECER O NUMERO DE INTRONS COM PROPRIEDADES INTENSIHCADORAS DE EXPRESSãO EM PLANTAS, PARA ISOLAR, FORNECER OU PRODUZIR UM INTRON COM PROPRIEDADES INTENSIFICADORAS DE EXPRESSãO EM PLANTAS, PARA FORNECER UM CAS SETE DE EXPRESSãO E PARA INTENSIFICAR A EXPRESSãO DE UMA SEQUENCIA DE áCIDOS NUCLEICOS EM UMA PLANTA OU UMA CELULA DE PLANTA, ALGORITMO DE COMPUTADOR, DISPOSITIVO DE COMPUTADOR OU DISPOSITIVO DE ARMAZENAMENTO DE DADOS, CONSTRUTO DE EXPRESSãO DE DNA RECOMBINANTE, VETOR DE EXPRESSãO, CéLULA TRANS GêNICA OU ORGANISMO NãO HUMANO TRANSGêNICO, CULTURA CELULAR, PARTES OU MATERIAL DE PROPAGAçãO, E, USO DE UM ORGANISMO TRANSGêNICO OU DE CULTURAS CELULARES, PARTES DE MATERIAL DE PROPAGAçãO TRANS GêNICO DERIVADAS DESTAS. A invenção se refere a métodos para a identificação e uso de introns com propriedades intensificadoras de expressão de gene. O ensinamento desta invenção possibilita a identificação de introns causando intensificação mediada por íntron (IME) de expressão de gene. A invenção se refere adicionalmente a construto de expressão recombinante e vetores compreendendo ditos introns-IME operavelmente ligados com uma seqúência de promotor e uma seqúência de ácidos nucleicos. A presente invenção também se refere a plantas transgênicas e células de planta transformadas com estes construtos ou vetores de expressão recombinante, para culturas, partes ou material de propagação derivado destas, e ao uso dos mesmos para a preparação de gêneros alimentícios, rações para animais, sementes, produtos farmacêuticos ou produtos químicos finos, para melhorar biomassa vegetal, rendimento, ou fornecer fenótipos desejáveis.

Description

"MÉTODOS PARA IDENTIFICAR UM ÍNTRON COM PROPRIEDADESINTENSIFICADORAS DE EXPRESSÃO EM PLANTAS, PARAENRIQUECER O NÚMERO DE ÍNTRONS COM PROPRIEDADESINTENSIFICADORAS DE EXPRESSÃO EM PLANTAS, PARA ISOLAR,FORNECER OU PRODUZIR UM ÍNTRON COM PROPRIEDADESINTENSIFICADORAS DE EXPRESSÃO EM PLANTAS, PARA FORNECERUM CASSETE DE EXPRESSÃO E PARA INTENSIFICAR A EXPRESSÃODE UMA SEQÜÊNCIA DE ÁCIDOS NUCLEICOS EM UMA PLANTA OUUMA CÉLULA DE PLANTA, ALGORITMO DE COMPUTADOR,DISPOSITIVO DE COMPUTADOR OU DISPOSITIVO DEARMAZENAMENTO DE DADOS, CONSTRUTO DE EXPRESSÃO DE DNARECOMBINANTE, VETOR DE EXPRESSÃO, CÉLULA TRANSGÊNICA OUORGANISMO NÃO HUMANO TRANSGÊNICO, CULTURA CELULAR,PARTES OU MATERIAL DE PROPAGAÇÃO, E, USO DE UM ORGANISMOTRANSGÊNICO OU DE CULTURAS CELULARES, PARTES DEMATERIAL DE PROPAGAÇÃO TRANSGÊNICO DERIVADAS DESTAS"
CAMPO DA INVENÇÃO
A invenção se refere a métodos para a identificação e uso deíntrons com propriedades intensificadoras de expressão gênica. Oensinamento desta invenção possibilita a identificação de íntrons causandointensificação mediada por íntron (IME) de expressão gênica. A invençãoalém disso se refere a construto de expressão recombinante e vetorescompreendendo ditos íntrons-IME operavelmente ligados com uma seqüênciade promotor e uma seqüência de ácidos nucléicos. A presente invençãotambém se refere a plantas transgênicas e células vegetais transformadas comestes construtos de expressão recombinante ou vetores, a culturas, partes oumaterial de propagação derivados a partir destas, e ao uso das mesmas para apreparação de gêneros alimentícios, rações animais, semente, farmacêuticosou químicos finos, para melhorar biomassa vegetal, rendimento, ou fornecerfenótipos desejáveis.
ARTE DE FUNDO DA INVENÇÃO
O objetivo de biotecnologia vegetal é a geração de plantas compropriedades vantajosas novas, tal como resistência a peste e doença,resistência a estresse ambiental (e.g., seca), qualidades melhoradas (e.g., altorendimento), ou para a produção de certos químicos ou farmacêuticos. Taxasde expressão gênica apropriadas desempenham um importante papel a fim deobter os fenótipos desejados. A taxa de expressão gênica é moduladaprincipalmente pelo promotor, seqüência de DNA adicional localizada naregião 5' não transcrita e 5' não traduzida e as seqüências terminadoras de umdado gene. Promotores são a porção de seqüências de DNA localizada naextremidade 5' um gene que contém sinais para que RNA polimerasescomecem transcrição de forma que uma síntese protéica possa prosseguir.Seqüências reguladoras de DNA posicionadas na região 5' não transcritamodulam expressão gênica em resposta a estímulos bióticos (e.g. infecção porpatógeno) ou abióticos (e.g. estresse salino, térmico, hídrico) específicos.Além disso, foram identificadas outras assim chamadas seqüências"intensificadoras" que elevam o nível de expressão de genes localizados porperto de uma maneira independente de posição e orientação.
Além dos elementos localizados nas regiões não transcritas deum gene (e.g. promotor, intensificador), é documentado em uma amplavariedade de organismos (e.g. nematóides, insetos, mamíferos e plantas) quealguns íntrons têm propriedades intensificadoras de expressão gênica. Emplantas, a inclusão de alguns íntrons em construtos de genes leva aacumulação aumentada de mRNA e proteína em relação a construtoscarecendo do íntron. Este efeito foi denominado "intensificação mediada poríntron" (IME) de expressão gênica (Mascarenhas et al., (1990) Plant Mol.Biol. 15:913-920). íntrons conhecidos por intensificar expressão em plantasforam identificados em genes de milho (e.g. tubAl, Adhl, Shl, Ubil (Jeon etal. (2000) Plant Physiol. 123:1005-1014; Callis et al. (1987) Genes Dev.1:1183-1200; Vasil et al. (1989) Plant Physiol 91:1575-1579; Christiansen etal. (1992) Plant Mol. Biol. 18:675-689)) e em genes de arroz (e.g. salT, tpi[McElroy et al. (1990) Plant Cell 2: 163-171; Xu et al. (1994) Plant Physiol106:459-467]). Similarmente, íntrons de genes de planta dicotiledônea tipoaqueles de petúnia (e.g. rbcS), batata (e.g. st-lsl) e de Arabidopsis thaliana(e.g. ubq3 e patl) foram encontrados elevando taxas de expressão gênica(Dean et al. (1989) Plant Cell 1:201-208; Leon et al. (1991) Plant Phyisiol.95:968-972; Norris et al. (1993) Plant Mol Biol 21:895-906; Rose and Last(1997) Plant J 11:455-464). Foi mostrado que deleções ou mutações dentrodos sítios de emenda de um íntron reduzem expressão gênica, indicando queprocessamento pode ser necessário para IME (Mascarenhas et al. (1990) PlantMol Biol 15:913-920; Clancy and Hannah (2002) Plant Physiol 130:918-929).Entretanto, que processamento por si não é requerido para uma certa IME emplantas dicotiledôneas foi mostrado por mutações pontuais dentro dos sítiosde emenda do gene patl de A. thaliana (Rose and Beliakoff (2000) PlantPhysiol 122:535-542).
Intensificação de expressão gênica por íntrons não é umfenômeno geral pois algumas inserções de íntron em cassetes de expressãorecombinante falham em intensificar expressão (e.g. íntrons de genes dedicotiledôneas (gene rbcS de ervilha, gene da faseolina de feijão e o gene stls-1 de Solanum tuberosum) e íntrons de genes de milho (o nono íntron de geneadhl, o primeiro íntron de gene hsp81)) (Chee et al. (1986) Gene 41:47-57;Kuhlemeier et al. (1988) Mol Gen Genet 212:405-411; Mascarenhas et al.(1990) Plant Mol Biol 15:913-920; Sinibaldi and Mettler (1992) In WE Cohn5K Moldave, eds, Progress in Nucleic Acid Research and Molecular Biology,Vol 42. Academic Press, New York, pp 229-257; Vancanneyt et al. 1990 MolGen Gent 220:245-250). Portanto, não é cada íntron que pode ser empregadoa fim de manipular o nível de expressão gênica de genes exógenos ou genesendógenos em plantas transgênicas. Quais características ou características deseqüências específicas devem estar presentes em uma seqüência de íntron afim de intensificar a taxa de expressão de um dado gene não são conhecidasna arte anterior e portanto a partir da arte anterior não é possível prever se umdado íntron vegetal, quando usado heterologamente, irá causar EVDE.
A introdução de um gene exógeno em um novo hospedeirovegetal nem sempre resulta em uma alta expressão do gene de entrada. Alémdisso, lidando com características complexas, às vezes é necessário modulardiversos genes com padrão de expressão diferente espacialmente outemporalmente. Introns podem principalmente fornecer tal modulação.Entretanto uso múltiplo do mesmo íntron em uma planta mostrou exibirdesvantagens. Nestes casos é necessário ter uma coleção de elementos decontrole básicos para a construção de elementos de DNA recombinanteapropriados. Entretanto, a coleção disponível de íntrons com propriedadesintensificadoras de expressão é limitada e alternativas são necessárias.
Assim, ainda existe uma demanda crescente por elementosbásicos de controle incluindo promotores, seqüências reguladoras (e.g.,elementos induzíveis, intensificadores) ou seqüências de íntron que têm umimpacto em taxas de expressão gênica. E portanto um objetivo da presenteinvenção, fornecer um método altamente reproduzível e confiável para aidentificação de íntrons com propriedades intensificadoras de expressão.
Este objetivo é atingido pelos métodos fornecidos dentro destainvenção.
SUMÁRIO DA INVENÇÃO
Um primeiro assunto da invenção portanto se refere a um métodopara identificar um íntron com propriedades intensificadoras de expressão emplantas compreendendo selecionar um íntron de um genoma vegetal, caracterizadopelo fato de que dito íntron é caracterizado por pelo menos as seguintescaracterísticasI) um comprimento de íntron mais curto do que 1.000 paresde bases, e
II) presença de um sítio de emenda 5' compreendendo aseqüência de dinucleotídeo 5 '-GT-3' (SEQ ID NO: 78), e
III) presença de um sítio de emenda 3' compreendendo aseqüência de trinucleotídeo 5-CAG-3' (SEQ ID NO: 79), e
IV) presença de um ponto de ramificação parecendo aseqüência consenso 5-CURAY-3' (SEQ ID NO:75) a montante do sítio deemenda 3e
V) um teor de adenina mais timina de pelo menos 40% sobre100 nucleotídeos a jusante do sítio de emenda 5', e
VI) um teor de adenina mais timina de pelo menos 50% sobre100 nucleotídeos a montante do sítio de emenda 3', e
VII) um teor de adenina mais timina de pelo menos 50%,e um teor de timina de pelo menos 30% sobre íntron inteiro.
Em outra forma de realização, a invenção se refere a um métodopara enriquecer o número de íntrons com propriedades intensificadoras deexpressão em plantas em uma população de íntrons vegetais para uma porcentagemde pelo menos 50% de dita população, dito método compreendendo selecionaríntrons de dita população, caracterizado pelo fato de que ditos íntrons sãocaracterizados por pelo menos as seguintes características
I) um comprimento de íntron mais curto do que 1.000 pares debases, e
II) presença de um sítio de emenda 5' compreendendo aseqüência de dinucleotídeo 5 '-GT-3' (SEQ ID NO: 78), e
III) presença de um sítio de emenda 3' compreendendo aseqüência de trinucleotídeo 5-CAG-3' (SEQ ID NO: 79), e
IV) presença de um ponto de ramificação parecendo aseqüência consenso 5 '-CURAY-3' (SEQ ID NO:75) a montante do sítio deemenda 3e
V) um teor de adenina mais timina de pelo menos 40% sobre100 nucleotídeos a jusante do sítio de emenda 5', e
VI) um teor de adenina mais timina de pelo menos 50% sobre100 nucleotídeos a montante do sítio de emenda 3', e
VII) um teor de adenina mais timina de pelo menos 50%,e um teor de timina de pelo menos 30% sobre íntron inteiro.
Preferivelmente, a população de íntrons vegetais escolhida para oenriquecimento de íntrons com propriedades intensificadoras de expressão gênicaem plantas compreende substancialmente todos os íntrons de um genoma vegetalrepresentados em um banco de dados de seqüências de DNA genômico ou umabiblioteca de DNA genômico vegetal.
Em uma forma de realização preferida, o íntron com propriedadesintensificadoras de expressão gênica em plantas ("IME-íntron") é selecionado pelométodo da invenção para identificar IME-íntrons ou o método da invenção paraenriquecer o número de IME-íntrons em uma população de íntrons vegetais.Preferivelmente, dito íntron é selecionado a partir do grupo consistindo de íntronslocalizados entre dois éxons codificando proteína ou íntrons localizados dentro daregião 5' não traduzida do gene correspondente.
Em uma forma de realização particularmente preferida, o IME-íntron é identificado ou enriquecido por um dos métodos inventivos a partir de umgrupo ou população de genes representando a fração de 10% de genes com a maiortaxa de expressão em um experimento de análise de expressão gênica realizadousando uma célula vegetal, tecido vegetal ou uma planta inteira.
A invenção além disso se refere a um método caracterizado pelofato de que a informação de seqüência gênica usada para a identificação ouenriquecimento de IME-íntrons está presente em um banco de dados de seqüênciasde DNA e as etapas de seleção para identificar ou enriquecer ditos íntrons sãorealizadas usando um processo automatizado, preferivelmente usando umdispositivo computacional e um algoritmo que define as instruções necessárias pararealizar as etapas de seleção para identificar ou enriquecer ditos íntrons.
Adicionalmente, a invenção se refere a algoritmo computacionalque define as instruções necessárias para realizar as etapas de seleção paraidentificar ou enriquecer IME-íntrons de um genoma vegetal ou uma população deíntrons selecionada a partir do grupo consistindo de íntrons localizados entre doiséxons codificando proteína, e/ou íntrons localizados dentro da região 5' nãotraduzida do gene correspondente e/ou íntrons localizados nas seqüências de DNAde genes representando a fração de 10% de genes com a maior taxa de expressãoem um experimento de análise de expressão gênica realizado usando uma célulavegetal, tecido vegetal e/ou uma planta inteira.
A invenção também se refere ao dispositivo computacional oudispositivo de armazenamento de dados compreendendo um algoritmo comodescrito acima.
Em uma forma de realização preferida, a invenção se refere amétodos para isolar, fornecer ou produzir IME-íntrons compreendendo asetapas de realizar uma identificação ou enriquecimento de IME-íntrons comodescrito acima e fornecer a informação de seqüência de ditos IME-íntronsidentificados ou enriquecidos, e fornecer a seqüência de nucleotídeos física deditos íntrons identificados ou enriquecidos e avaliar as propriedadesintensificadoras de expressão gênica dos íntrons isolados em um experimentode expressão in vivo ou in vitro, e isolar os IME-íntrons da população deíntrons testada no experimento de expressão in vivo ou in vitro.Preferivelmente, a avaliação das propriedades intensificadoras de expressãogênica do IME-íntron é feita em uma célula vegetal e caracterizada pelo fatode que IME-íntron intensifica a expressão de um dado ácido nucléico pelomenos duas vezes.
Um assunto adicional da invenção se refere a um construto deexpressão de DNA recombinante compreendendo pelo menos uma seqüênciade promotor funcionando em células vegetais, pelo menos uma seqüência deácidos nucléicos e pelo menos um íntron selecionado a partir do grupoconsistindo das seqüências descritas por SEQ ID NOs: 1, 2, 3, 5, 6, 7, 10, 11,12, 13, 14, 15, 16, 17, 18, 19, 20, 21 e 22, e equivalentes funcionais destas,caracterizado pelo fato de que dita seqüência de promotor e pelo menos umade ditas seqüências de íntron são funcionalmente ligadas à dita seqüência deácidos nucléicos e caracterizado pelo fato de que dito íntron é heterólogo àdita seqüência de ácidos nucléicos ou to dita seqüência de promotor.
Além disso, a invenção se refere a construtos de expressãorecombinante compreendendo pelo menos uma seqüência de promotorfuncionando em células vegetais, pelo menos uma seqüência de ácidosnucléicos e pelo menos um equivalente funcional de um íntron descrito porqualquer de seqüências SEQ ID NOs: 1, 2, 3, 5, 6, 7, 10, 11, 12, 13, 14, 15,16, 17, 18, 19, 20, 21 e 22, caracterizado pelo fato de que dito equivalentefuncional compreende os elementos funcionais de um íntron e é caracterizadopor
a) uma seqüência tendo pelo menos 50 pares de basesconsecutivos da seqüência de íntron descrita por qualquer de SEQ ID NOs: 1,2,3,5,6, 7, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20,21 ou 22, ou
b) tendo uma identidade de pelo menos 80% sobre umaseqüência de pelo menos 95 pares de bases de ácidos nucléicos consecutivoscom uma seqüência descrita por qualquer de SEQ ID NOs: 1, 2, 3, 5, 6, 7, 10,11,12, 13, 14, 15, 16, 17, 18, 19, 20, 21 ou 22, ou
c) hibridizando em condições estringentes altas com umfragmento de ácido nucléico de pelo menos 50 pares de bases consecutivos deuma molécula de ácido nucléico descrita por qualquer de SEQ ID NOs: 1, 2,3, 5, 6, 7, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 ou 22,caracterizado pelo fato de que dita seqüência de promotor epelo menos uma de ditas seqüências de íntron são funcionalmente ligadas àdita seqüência de ácidos nucléicos e caracterizado pelo fato de que dito íntroné heterólogo à dita seqüência de ácidos nucléicos ou à dita seqüência depromotor.
Em outra forma de realização, o construto de expressão deDNA recombinante da invenção contém adicionalmente uma ou maisseqüências reguladoras adicionais funcionalmente ligadas a promotor.Aquelas seqüências reguladoras podem ser selecionadas a partir do grupoconsistindo de elementos responsivos a choque térmico, elementosresponsivos anaeróbicos, elementos responsivos a patógeno, elementosresponsivos a seca, elementos responsivos a baixa temperatura, elementosresponsivos a ABA, região de gene 5' não traduzida, região de gene 3' nãotraduzida, terminadores de transcrição, sinais de poliadenilação eintensificadores.
A seqüência de ácidos nucléicos do construto de expressão deDNA recombinante inventivo pode resultar na expressão de uma proteína e/ouRNA sentido, antisentido ou de dupla fita codificado por dita seqüência deácidos nucléicos.
Em outra forma de realização, a seqüência de nucleotídeoscodificando o construto de expressão transgênico da invenção é de dupla fita. Emainda outra forma de realização, a seqüência de nucleotídeos codificando oconstruto de expressão transgênico da invenção é de fita simples.
Em ainda outra forma de realização alternativa da invenção, oconstruto de expressão recombinante compreende a seqüência de ácidos nucléicoscodificando para uma proteína marcadora selecionável, uma proteína marcadoramonitorável, uma proteína ativa anabólica, uma proteína ativa catabólica, umaproteína de resistência a estresse biótico ou abiótico, uma proteína de esterilidade demacho ou uma proteína afetando características agronômicas de planta.
A invenção se refere além disso a vetores contendo umconstruto de expressão transgênico da invenção. Adicionalmente, a invençãose refere a células transgênicas ou organismos não humanos transgênicos tipobactérias, fungos, leveduras ou plantas compreendendo um vetor de expressãocontendo um construto de expressão transgênico da invenção. Em uma formade realização preferida, a célula transgênica ou organismo não humanotransgênico transformado com um construto de expressão da invenção é umaplanta monocotiledônea ou é derivado de uma tal planta. Em uma forma derealização ainda mais preferida, a planta monocotiledônea é selecionada apartir do grupo consistindo dos gêneros Hordeum, Avena, Secale, Triticum,Sorghum, Zea, Saccharum, e Oryza. Formas de realização adicionais dainvenção se referem a culturas celulares, partes ou material de propagaçãoderivados de organismos não humanos tipo bactérias, fungos, leveduras e/ouplantas, preferivelmente plantas monocotiledôneas, mais preferivelmenteplantas selecionadas a partir do grupo consistindo dos gêneros Hordeum,Avena, Secale, Triticum, Sorghum, Zea, Saccharum, e Oryza, transformadascom os vetores inventivos ou contendo os construtos de expressãorecombinante inventivos.
A invenção além disso se refere a um método para fornecer umcassete de expressão para expressão intensificado de uma seqüência de ácidosnucléicos em uma planta ou uma célula vegetal, compreendendo a etapa deligar funcionalmente pelo menos uma seqüência selecionada a partir do grupoconsistindo de SEQIDNOs: 1,2,3,5, 6, 7, 10, 11, 12, 13, 14, 15, 16, 17, 18,19, 20, 21 e 22 à dita seqüência de ácidos nucléicos.
A invenção se refere adicionalmente a um método paraintensificar a expressão de uma seqüência de ácidos nucléicos em uma plantaou uma célula vegetal, compreendendo ligar funcionalmente pelo menos umaseqüência selecionada a partir do grupo consistindo de SEQ ID NOs: 1, 2, 3,5, 6, 7, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 e 22 à dita seqüência deácidos nucléicos.
Uma forma de realização adicional da invenção se refere a ummétodo
a) para fornecer um cassete de expressão para expressãointensificada de uma seqüência de ácidos nucléicos em uma planta ou umacélula vegetal, ou
b) para intensificar a expressão de uma seqüência de ácidosnucléicos em uma planta ou uma célula vegetal
dito método compreendendo ligar funcionalmente pelo menosuma seqüência selecionada a partir do grupo consistindo de SEQ ID NOs: 1,2, 3, 5, 6,7, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 e 22 à dita seqüênciade ácidos nucléicos, caracterizado pelo fato de que além disso uma seqüênciade promotor funcional em plantas é ligada à dita seqüência de ácidosnucléicos.
Preferivelmente, pelo menos uma seqüência selecionada apartir do grupo consistindo de SEQ ID NOs: 1, 2, 3, 5, 6, 7, 10, 11, 12, 13, 14,15, 16, 17, 18, 19, 20, 21 e 22 é ligada a uma seqüência de ácidos nucléicospor inserção no genoma vegetal através de recombinação homóloga.
Preferivelmente, dita recombinação homóloga está compreendendo pelomenos as etapas de
a) fornecer in vivo ou in vitro um construto de DNAcompreendendo dito íntron flanqueado por seqüências ("substrato derecombinação") permitindo recombinação homóloga em um cassete deexpressão pré-existente entre o promotor e o ácido nucléico de dito cassete deexpressão, e
b) transformar uma célula vegetal receptora compreendendodito cassete de etapa a) e regenerar uma planta transgênica, caracterizada pelofato de que dito íntron foi inserido no genoma de dita planta. Preferivelmente,o sítio de integração no genoma de dita planta é determinado pela seqüênciade DNA do substrato de recombinação de etapa a), caracterizado pelo fato deque dita seqüência compartilhando homologia suficiente (como definido nestelugar) com dita seqüência de DNA alvo genômico permitindo a integração daseqüência específica através de recombinação homóloga em dito locus deDNA alvo genômico.
Em uma forma de realização preferida da invenção, dita plantareceptora ou célula vegetal é uma planta monocotiledônea ou célula vegetal,mais preferivelmente uma planta ou célula vegetal selecionada a partir dogrupo consistindo dos gêneros Hordeum, Avena, Secale, Triticum, Sorghum,Zeai Saccharum, e Oryza, mais preferivelmente uma planta de milho.
Preferivelmente, a seqüência de ácidos nucléicos à qual umdos íntrons inventivos é funcionalmente ligada, codifica para uma proteínamarcadora selecionável, uma proteína marcadora monitorável, uma proteínaativa anabólica, uma proteína ativa catabólica, uma proteína de resistência aestresse biótico ou abiótico, uma proteína de esterilidade de macho ou umaproteína afetando características agronômicas de planta e/ou um RNA sentido,antisentido, ou de dupla fita.
Adicionalmente, a invenção se refere ao uso de um organismotransgênico da invenção ou de culturas celulares, partes de material depropagação transgênico derivados a partir destas para a produção de gênerosalimentícios, rações animais, sementes, farmacêuticos ou químicos finos.
A invenção além disso se refere a um construto de expressão deDNA recombinante compreendendo
a) pelo menos uma seqüência de promotor funcionando em plantasou células vegetais, e
b) pelo menos um íntron selecionado a partir do grupo de íntronscom propriedades intensificadoras de expressão em plantas ou células vegetaiscaracterizado por pelo menos as seguintes características
I) um comprimento de íntron mais curto do que 1.000 paresde bases, e
II) presença de um sítio de emenda 5' compreendendo aseqüência de dinucleotídeo 5'-GT-3' (SEQ ID NO: 78), e
III) presença de um sítio de emenda 3' compreendendo aseqüência de trinucleotídeo 5-CAG-3' (SEQ ID NO: 79), e
IV) presença de um ponto de ramificação parecendo aseqüência consenso 5 '-CURAY-3' (SEQ ID NO: 75) a montante do sítio deemenda 3e
V) um teor de adenina mais timina de pelo menos 40% sobre100 nucleotídeos a jusante do sítio de emenda 5', e
VI) um teor de adenina mais timina de pelo menos 50% sobre100 nucleotídeos a montante do sítio de emenda 3', e
VII) um teor de adenina mais timina de pelo menos 55%,e um teor de timina de pelo menos 30% sobre íntron inteiro, e
c) pelo menos uma seqüência de ácidos nucléicos,caracterizada pelo fato de que dita seqüência de promotor e pelo menos umade ditas seqüências de íntron são funcionalmente ligadas a dita seqüência deácidos nucléicos e caracterizada pelo fato de que dito íntron é heterólogo àdita seqüência de ácidos nucléicos e/ou à dita seqüência de promotor.
BREVE DESCRIÇÃO DAS ILUSTRAÇÕES
Fig. 1 Mapa de pBPSMM291 (SEQ ID NO: 109)
Este vetor compreende o promotor de ubiquitina do milho,seguido pelo BPSI. 1, então o GUSint ORF (incluindo o íntron [PIV]2 deinvertase de batata para prevenir expressão bacteriana), seguido porterminador de nopalina sintase (NOS). Este vetor contém os sítios attLl eattL2 para torná-lo compatível com modificação através da Tecnologia declonagem Gateway® de Invitrogen™. Este vetor é baseado no vetor deexpressão baseado em pUC pBPSMM267. O produto de PCR BPSI.ldigerido com Xmal-Rsrll foi ligado no pBPSMM267 digerido com Xmal-Rsrll para criar pBPSMM291. Os vetores pBPSMM293, pBPSMM294 epBPSMM295 foram criados por conseguinte (veja tabela 6 e 1.6.1).Fig. 2 Mapa de pBPSMM305 (SEQ ID NO: 110)
O vetor de expressão pBPSMM305 compreende o promotor delactato desidrogenase (LDH) de milho sem íntron dirigindo expressão doGUSint ORF (incluindo o íntron [PIV]2 de invertase de batata para prevenirexpressão bacteriana), seguido pelo terminador de NOS. Este vetor foi usadopara criar os vetores de expressão baseados em pUC pBPSJB041,pBPSJB042, pBPSJB043, pBPSJB044, pBPSJB045, pBPSJB046 epBPSJB050 (veja exemplos 2.3).
Fig. 3 Mapa de pBPSMM350 (SEQ ID NO:l 11):
O vetor pBPSMM350 compreende o promotor de ubiquitinado milho, seguido pelo BPSI.l, então o GUSint ORF (incluindo o íntron[PIV]2 de invertase de batata para prevenir expressão bacteriana), seguido porterminador de nopalina sintase (NOS). O cassete de expressão foi transferidodo vetor pBPSMM291 usando a Tecnologia de clonagem Gateway® deInvitrogen™. Os vetores pBPSMM353, pBPSMM312 e pBPSMM310 foramcriados por conseguinte (veja tabela 6 e exemplo 1.6.2).
Fig. 4 Mapa de pBPSLM139 (SEQ ID NO:l 12):O vetor pBPSLM139 compreende o cassete de expressão demarcador selecionável. A fim de produzir os vetores pBPSLI017 apBPSLI023, fragmentos PmelIPacl foram isolados dos vetores pBPSJB-042,-043, -044, -045, 046 e 050 e clonados no pBPSLM130 digerido com Pmel-Pacl (veja exemplo 2.3 e 2.4)
Fig. 5a-f: Algoritmo computacional para encontrar informaçãode seqüência de arquivo de banco de dados de genes NCBI.
Fig. 6 Plantas transgênicas contendo construtos de promotorcom íntron BPSI.l (todos menos pBPSLM229) ou íntron BPSI.5 (apenaspBPSLM229) foram testadas para expressão de GUS em estágios de 5 folhas(A), floração (B) e formação de semente (C). São mostrados exemplos depadrões de coloração típicos obtidos a partir de pelo menos 15 eventosindependentes. Todas as amostras foram coloridas por 16 horas em solução deGUS. Promotores nos construtos são: proteína 12 de cloroplasto de arroz(Os.CP12; pBPSMM355), a glicoproteína rica em hidroxiprolina de milho(Zm.HRGP; pBPSMM370), a p-caffeoil-CoA 3-O-metiltransferase de arroz(Os.CCoAMTl; pBPSMM358), o promotor W64A de Globulina-I de milho(Zm.Glbl; EXS1025), o promotor putativo de ATP sintase transportando H+de arroz (Os.V-ATPase; pBPSMM369), Zm.LDH (pBPSMM357), opromotor putativo de C-8,7 esterol isomerase de arroz (Os.C8,7 SI;pBPSMM366), o promotor da proteína Abundantes na Embriogênese Tardiade arroz (Os.Lea; pBPSMM371), e o promotor da lactato desidrogenase demilho (ZM.LDH; pBPSLM229).
DEFINIÇÕES GERAIS
É para ser entendido que esta invenção não é limitada ametodologia particular, protocolos, linhagens celulares, espécies ou gênerosde planta, construtos, e reagentes descritos como tais. Deve ser notado quecomo usado neste lugar e nas reivindicações anexadas, as formas singulares"um" e "o" incluem referências plurais a menos que o contexto claramentedite de outra maneira. Assim, por exemplo, referência a "um vetor" é umareferência a um ou mais vetores e inclui equivalentes destes conhecidos poraqueles versados na arte.
Cerca de: o termo "cerca de" é usado neste lugar parasignificar aproximadamente, grosso modo, por volta de, ou na região de.Quando o termo "cerca de" é usado em conjunção com uma variaçãonumérica, ele modifica aquela variação estendendo os limites acima e abaixodos valores numéricos expostos. Em geral, o termo "cerca de" é usado nestelugar para modificar um valor numérico acima e abaixo do valor determinadopor uma variância de 20 porcento, preferivelmente 10 porcento pra cima oupara baixo (maior ou menor). Como usado neste lugar, a palavra "ou"significa um membro qualquer de uma lista particular.Agrobacterium: se refere a uma bactéria fitopatogênica desolo, Gram-negativa, em forma de bastonete que causa galha de coroa. Otermo "Agrobaeterium" inclui, mas não é limitado a, as linhagensAgrobaeterium tumefaeiens, (que tipicamente causa galha de coroa em plantasinfectadas), e Agrobaeterium rhizogenes (que causa doença de raiz emcabeleira em plantas hospedeiras infectadas). Infecção de uma célula vegetalcom Agrobaeterium geralmente resulta na produção de opinas (e.g., nopalina,agropina, octopina etc.) pela célula infectada. Assim, linhagens deAgrobaeterium que causam produção de nopalina (e.g., linhagem LBA4301,C58, A208) são referidas como Agrobaetérias "tipo nopalina"; linhagens deAgrobaeterium que causam produção de octopina (e.g., linhagem LBA4404,Ach5, B6) são referidas como Agrobaetérias "tipo octopina"; e linhagens deAgrobaeterium que causam produção de agropina (e.g., linhagem EHAl05,EHAlOl, A281) são referidas como Agrobaetérias "tipo agropina".
Algoritmo: como usado neste lugar se refere à maneira quecomputadores processam informação, pois um programa de computador éessencialmente um algoritmo que diz ao computador que etapas específicas arealizar (em que ordem específica) a fim de realizar uma tarefa especificada, talcomo identificação de regiões de codificação de um conjunto de genes. Assim, umalgoritmo pode ser considerado ser qualquer seqüência de operações que pode serrealizada por um sistema computacional. Tipicamente, quando um algoritmo estáassociado com informação de processamento, dado é lido a partir de uma fonte oudispositivo de entrada, escrito para um dissipador ou dispositivo de saída, e/ouarmazenado para uso posterior. Para qualquer tal processo computacional, oalgoritmo deve ser rigorosamente definido: especificado da forma que ele se apliqueem todas as circunstâncias possíveis que possam surgir. Isto é, quaisquer etapascondicionais devem ser sistematicamente tratadas, caso a caso; os critérios paracada caso devem ser claros (e computáveis). Pelo fato de um algoritmo ser uma listaprecisa de etapas precisas, a ordem de computação irá quase sempre ser crítica parao funcionamento do algoritmo. Instruções são normalmente assumidas sendolistadas explicitamente, e são descritas como começando 'do topo1 e indo 'para ofundo', uma idéia que é descrita mais formalmente por fluxo de controle. Emaplicações computacionais, uma linguagem de computador interpretada é umprograma de computador que automatiza o tipo de tarefa que um usuário pode deoutra maneira fazer interativamente no teclado. Linguagens que são usadasbasicamente para escrever tais linguagens de computador interpretadas sãochamadas de linguagens de criação de linguagens de computador interpretadas.Muitas tais linguagens são bastante sofisticadas, e foram usadas para escreverprogramas elaborados, que ainda são freqüentemente chamados de linguagens decomputador interpretadas mesmo se eles vão bem com automatização deseqüências simples de tarefas de usuários. Linguagens computacionais são criadaspara propósitos variados e tarefas diferentes tipos e estilos de programação.Linguagens de programação de criação de linguagens de computador interpretadas(comumente chamadas de linguagens de criação de linguagens de computadorinterpretadas ou linguagens de computador interpretadas) são linguagens deprogramação computacional projetadas para "criação de linguagens de computadorinterpretadas" a operação de um computador. Linguagens de script anteriores foramfreqüentemente chamadas linguagens de em lotes ou linguagens de controle detrabalho.
Exemplos para linguagens de computador interpretadas são:ACS, ActionScript, Active Server Pages (ASP), AppleScript, Awk, BeanShell(criando linguagens de computador interpretadas para Java), bash, Brain,CobolScript, csh, ColdFusion, Dylan, Escapade (criação de linguagens decomputador interpretadas do lado de servidor), Euphoria, Groovy, Guile,Haskell, HyperTalk, ICI, IRC script, JavaScript, mIRC script, MS-DOS batch,Nwscript, Perl, PHP, Pike, ScriptBasic.
Antisentido: é entendido significando um ácido nucléico tendouma seqüência complementar a uma seqüência alvo, por exemplo um RNAmensageiro (mRNA) Como usado neste lugar, os termos "complementar" ou"complementaridade" são usados em referência a seqüências de nucleotídeosrelacionadas pelas regras de pareamento de bases. Por exemplo, a seqüência5'-AGT-3' é complementar à seqüência 5'-ACT-3\ Complementaridade podeser "parcial" ou "total." Complementaridade "parcial" é onde uma ou maisbases de ácidos nucléicos não é compatível de acordo com as regras depareamento de bases. Complementaridade "total" ou "completa" entre ácidosnucléicos é onde cada e toda base de ácido nucléico é compatível com outrabase sob as regras de pareamento de bases. O grau de complementaridadeentre fitas de ácidos nucléicos tem efeitos significantes na eficiência e forçade hibridização entre fitas de ácidos nucléicos.
Sentido: é entendido significando um ácido nucléico tendouma seqüência que é homóloga ou idêntica a uma seqüência alvo, porexemplo uma seqüência que é ligada por um fator protéico do spliceossoma.
Bombardear, "bombardeamento" e "bombardeamentobiolístico": se referem ao processo de acelerar partículas (microprojéteis) emdireção a uma amostra biológica alvo (e.g., célula, tecido, etc.) para efetuarferimento da membrana celular de uma célula na amostra biológica alvo e/ouentrada das partículas na amostra biológica alvo. Métodos parabombardeamento biolístico são conhecidos na arte (e.g., Patente Norte-Americana 5.584.807, os conteúdos da qual são neste lugar incorporadas porreferência), e são comercialmente disponíveis (e.g., o acelerador demicroprojétil dirigido a gás hélio (PDS-1000/He) (BioRad).
Célula: se refere a uma única célula. O termo "células" serefere a uma população de células. A população pode ser uma população puracompreendendo um tipo celular. Da mesma maneira, a população podecompreender mais do que um tipo celular. Na presente invenção, não existelimite no número de tipos celulares que uma população celular podecompreender. As células podem ser sincronizadas ou não sincronizadas,preferivelmente as células são sincronizadas.
DNA cromossômico ou seqüência de DNA cromossômico: épara ser entendido como o DNA genômico do núcleo celular independente doestado do ciclo celular. DNA cromossômico pode portanto ser organizado emcromossomos ou cromátides, ele pode ser condensado ou desenrolado. Umainserção no DNA cromossômico pode ser demonstrada e analisada por váriosmétodos conhecidos na arte tipo e.g., análise de reação em cadeia dapolimerase (PCR), análise Southern blot, hibridização in situ porfluorescência (FISH), e PCR in situ.
Região de codificação ou seqüência de codificação (CDS):quando usado em referência a um gene se refere às seqüências denucleotídeos que codificam os aminoácidos encontrados no polipeptídeonascente como um resultado de tradução de uma molécula de mRNA. Aregião de codificação é ligada, em eucariotos, no lado 5' pelo nucleotídeotripleto "ATG" que codifica a metionina iniciadora e no lado 3' por um dostrês tripletos, que especificam códons de parada (i.e., TAA, TAG, TGA).
Complemento de uma seqüência de ácidos nucléicos: comousado neste lugar se refere a uma seqüência de nucleotídeos cujos ácidosnucléicos mostram total complementaridade com os ácidos nucléicos daseqüência de ácidos nucléicos.
Decil: quando usado em conexão com dados estatísticos équalquer dos 10 valores que dividem dados classificados em 10 partes iguais,de forma que cada parte representa 1/10 da amostra ou população. Assim, o I0decil remove 10% mais baixos de dados, e 9o decil remove 90% mais baixosou os 10% mais altos de dados. Um quartil é qualquer dos três valores quedividem o conjunto de dados classificados em quatro partes iguais, de formaque cada parte representa 1/4 da amostra ou população (terceiro quartil =quartil superior = remove 25% mais altos de dados, ou 75% mais baixos = 75percentil). Um percentil é qualquer dos 99 valores que dividem os dadosclassificados em 100 partes iguais, de forma que cada parte representa 1/100da amostra ou população. Assim, o I0 percentil remove 1% mais baixo dedados, o 98° percentil remove 98% mais baixos de dados e o 25° percentilremove 25% mais baixos de dados.
Bancos de dados de DNA: no campo de bioinformática, umbanco de dados de seqüências de DNA é uma grande coleção de seqüênciasde DNA armazenada em um computador. Um banco de dados pode incluirseqüências de apenas um organismo, ou ele pode incluir seqüências de todosos organismos cujos DNA foram seqüenciados.
Enriquecimento ou enriquecer: quando usado em conexão coma seleção de íntrons inventivos se refere a um aumento na taxa de sucesso deidentificar íntrons com propriedades intensificadoras de expressão gênicadentro de uma população de íntrons (e.g. uma população de íntronsrepresentando todos os íntrons de um genoma vegetal presentes em um bancode dados de seqüências de DNA genômico). O enriquecimento é atingidoreduzindo o número de íntrons candidatos usando o método inventivo e oscritérios de seleção inventivos. Se, como um exemplo, a taxa de sucesso deidentificar um íntron com propriedades intensificadoras de expressão de umadada população de íntrons - usando os métodos descritos neste lugar paramedir intensificação de expressão gênica - é um de dez íntrons analisados,enriquecimento tem que ser entendido como um aumento no número deíntrons identificados com propriedades intensificadoras de expressão gênica -usando o método inventivo- para pelo menos cinco de dez íntrons analisados.Portanto, o número de íntrons necessário para ser analisado a fim deidentificar um íntron inventivo é reduzido para dois íntrons usando o métodoinventivo como um processo de pré-seleção ou filtração.
Avaliação das propriedades intensificadoras de expressão: deum íntron pode ser feita usando métodos conhecidos na arte. Por exemplo,uma seqüência de íntron candidato cujo efeito de intensificação de expressãogênica está para ser determinado pode ser inserida no 5'UTR de umaseqüência de ácidos nucléicos codificando para um gene repórter (e.g., umaproteína marcadora visível, uma proteína marcadora selecionável) sobcontrole de um promotor apropriado ativo em plantas ou células vegetais paragerar um vetor repórter. O vetor repórter e um vetor repórter de controleidêntico carecendo do íntron candidato podem ser introduzidos em um tecidovegetal usando métodos descritos neste lugar, e o nível de expressão do generepórter, em dependência da presença do íntron candidato, pode ser medido ecomparado (e.g., detectando a presença de mRNA codificado ou proteínacodificada, ou a atividade de uma proteína codificada pelo gene repórter). Umíntron com propriedades intensificadoras de expressão irá resultar em umataxa de expressão maior do que um valor de referência obtido com um vetorrepórter de controle idêntico carecendo do íntron candidato em condições nãomodificadas de outra maneira.
O gene repórter pode expressar marcadores visíveis. Sistemasde gene repórter que expressam marcadores visíveis incluem b-glucuronidasee seu substrato (X-Gluc), luciferase e seu substrato (luciferina), e b-galactosidase e seu substrato (X-Gal) que são amplamente usados não apenaspara identificar transformantes, mas também para quantificar a quantidade deexpressão protéica transitória ou estável atribuível a um sistema de vetorespecífico (Rhodes (1995) Methods Mol Biol 55:121-131). O ensaio com b-glucuronidase (GUS) sendo muito especialmente preferido (Jefferson et ai.,GUS fusions: beta-glucuronidase as a sensitive and versatile gene fusionmarker in higher plants. EMBO J. (1987) Dec 20;6(13):3901-3907).
Expressão de b-glucuronidase (GUS) é detectada por uma cor azul emincubação do tecido com 5-bromo-4-cloro-3-indolil-b-D-ácido glicorônico. Ogene marcador selecionável pode conferir resistência a antibiótico ouherbicida. Exemplos de genes repórteres incluem, mas não são limitados a, ogene dhfr, que confere resistência a metotrexato (Wigler (1980) Proc NatlAcad Sci 77:3567-3570); npt, que confere resistência aos aminoglicosídeosneomicina e G-418 (Colbere-Garapin (1981) J. Mol. Biol. 150:1-14) e ais oupat, que conferem resistência a clorsulfuron e fosfinotricina acetil transferase,respectivamente.
Valor Esperado quando usado no contexto de alinhamentos deseqüência de DNA ou buscas de banco de dados de seqüência de DNA serefere ao número de vezes que uma certa correspondência ou uma melhorseria esperado ocorrer puramente ao acaso em uma busca do banco de dadosinteiro. Assim, quanto menor o valor Esperado, maior a similaridade entre aseqüência de entrada e a correspondência. O valor Esperado (E) é umparâmetro que descreve o número de acertos que alguém pode "esperar" verapenas ao acaso quando buscando um banco de dados de um tamanhoparticular. Ele diminui exponencialmente com o Escore de Similaridade (S)que é assinalado a uma correspondência entre duas seqüências. Quanto maioro escore, menor o valor E. Essencialmente, o valor E descreve o ruído defundo aleatório que existe para compatibilidades entre seqüências. O valorEsperado é usado como uma maneira conveniente para criar um limiar designificância para relatar resultados. Um valor E de 1 assinalado a um acertopode ser interpretado como significando que em um banco de dados dotamanho atual você pode esperar ver 1 correspondência com um escoresimilar simplesmente ao acaso. O valor E é influenciado por: a) comprimentode seqüência (quanto maior a busca menor a probabilidade de que elaencontre uma seqüência no banco de dados ao acaso), b) tamanho de banco dedados (quanto maior o banco de dados maior a probabilidade de que a buscaencontre uma correspondência ao acaso), c) a matriz de pontuação (quantomenos estringente a matriz de pontuação maior a probabilidade de que abusca encontre uma seqüência no banco de dados ao acaso).
Etiqueta de seqüência expressa (EST): se refere a umaseqüência de DNA que foi obtida a partir de um seqüenciamento de DNAterminal de etapa única. Uma seqüência EST denota uma seqüência isto éderivada de um transcrito, e por isso de um gene que é transcrito.
Seqüência de ácidos nucléicos exprimivel: como usado nocontexto desta invenção é qualquer seqüência de ácidos nucléicos que é capazde ser transcrita em RNA (e.g. mRNA, RNA antisentido, RNA formandodupla fita etc.) ou traduzida em uma proteína particular.
Expressão: se refere a biossíntese de um produto de gene. Porexemplo, no caso de um gene estrutural, expressão envolve transcrição dogene estrutural em mRNA e - opcionalmente - a subseqüente tradução demRNA em um ou mais polipeptídeos.
Equivalentes funcionais: com referência aos íntrons inventivostem que ser entendido como mutações naturais ou artificiais de ditos íntronsdescritos em qualquer das SEQ ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13,14, 15, 16, 17, 18, 19, 20, 21 ou 22. Mutações podem ser inserções, deleçõesou substituições de um ou mais ácidos nucléicos que não diminuem aspropriedades intensificadoras de expressão de ditos íntrons. Estesequivalentes funcionais tendo uma identidade de pelo menos 80%,preferivelmente 85%, mais preferivelmente 90%, mais preferivelmente maisdo que 95%, muito especialmente preferivelmente pelo menos 98% deidentidade - mas menos do que 100% de identidade com as seqüências deíntron como descrito por qualquer das SEQ ED NOs: 1, 2, 3, 5, 6, 7, 10, 11,12, 13, 14, 15, 16, 17, 18, 19, 20, 21 ou 22, caracterizado pelo fato de que ditaidentidade é determinada sobre uma seqüência de pelo menos 95 pares debases consecutivos, preferivelmente pelo menos 150 pares de basesconsecutivos, mais preferivelmente pelo menos 200 pares de basesconsecutivos da seqüência como descrito por qualquer das SEQ ID NOs: 1, 2,3, 5, 6, 7, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 ou 22 e tendoessencialmente as mesmas características de efeito IME que as seqüências deíntron como mostrado em qualquer das SEQ ID NOs: 1, 2, 3, 5, 6, 7, 10, 11,12, 13, 14, 15, 16, 17, 18, 19, 20, 21 ou 22.
Equivalentes funcionais são em particular homólogos de ditosíntrons derivados de outra espécie de planta. Homólogos quando usado emreferência a íntrons se refere a íntrons com propriedades intensificadoras deexpressão isolados de uma seqüência genômica de ácidos nucléicos quecodifica para uma proteína
(i) compartilhando mais do que 60%, preferivelmente65%, 70%, 75%, 80%, mais preferivelmente 85%, 90%, 95% ou maispreferivelmente mais do que 95% identidade de seqüência em nível deaminoácidos com proteínas que são codificadas por genes a partir dos quais osíntrons inventivos com as SEQ ID NOs: 1, 2, 3, 5, 6, 7, 10, 11, 12, 13, 14, 15,16, 17, 18, 19, 20, 21 ou 22 foram isolados, ou
(ii) catalisando a mesma reação enzimática que asproteínas codificadas por genes a partir dos quais os íntrons inventivos SEQID NOs: 1, 2, 3, 5, 6, 7, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 ou 22foram isolados, ou
(iii) mostrando padrão de expressão espacial e temporalcomparável com as proteínas codificadas por genes a partir dos quais osíntrons inventivos SEQ ID NOs: 1, 2, 3, 5, 6, 7, 10, 11, 12, 13, 14, 15, 16, 17,18, 19, 20, 21 ou 22 foram isolados.
"Equivalentes funcionais" como descrito acima podem ter,comparado com os íntrons inventivos um efeito reduzido ou aumentado deintensificação da expressão gênica. Neste contexto, o efeito de intensificaçãoda expressão gênica do íntron equivalente funcional é pelo menos 50% maior,preferivelmente pelo menos 100% maior, especialmente preferivelmente pelomenos 300% maior, muito especialmente preferivelmente pelo menos 500%maior do que um valor de referência obtido com qualquer dos íntronsmostrados em SEQ IDNOs: 1, 2, 3, 5, 6, 7, 10, 11, 12, 13, 14, 15, 16, 17, 18,19, 20, 21 ou 22 em condições não modificadas de outra maneira.Funcionalmente ligado ou operavelmente ligado: é para serentendido como significando, por exemplo, o arranjo seqüencial de umelemento reguladôr (e.g. um promotor) com uma seqüência de ácidosnucléicos a ser expressa e, se apropriado, elementos reguladores adicionais(tal como e.g., um terminador) de uma maneira tal que cada um dos elementosreguladores pode cumprir sua função pretendida para permitir, modificar,facilitar ou de outra maneira influenciar expressão de dita seqüência de ácidosnucléicos. A expressão pode resultar dependendo do arranjo das seqüênciasde ácidos nucléicos em relação a RNA sentido ou antisentido. Para este fim,ligação direta no sentido químico não é necessariamente requerida.
Seqüências de controle genético tal como, por exemplo, seqüênciasintensificadoras, também podem exercer sua função na seqüência alvo a partirde posições que estão mais longe, ou de fato a partir de outras moléculas deDNA. Os termos "funcionalmente ligado", "operavelmente ligado," "emcombinação operável," e "em ordem operável" como usado neste lugar comreferência a um íntron inventivo com propriedades intensificadoras deexpressão gênica se refere à ligação de pelo menos um de ditos íntrons comumas seqüências de ácidos nucléicos de uma maneira que o efeitointensificador de expressão seja percebido e, se sítios de emenda funcionaisforam incluídos, que o íntron possa ser descartado pelos fatores celularesresponsáveis pelo procedimento de processamento. Em uma forma derealização preferida da presente invenção, o íntron é introduzido na região 5'não codificante de uma seqüência de ácidos nucléicos. Construtos deexpressão inventivos, caracterizados pelo fato de que um íntron inventivo éfuncionalmente ligado a uma seqüência de ácidos nucléicos são mostradosnos exemplos. Arranjos mais preferidos são aqueles nos quais um íntronfuncionando em intensificação de expressão mediada por íntron é inseridoentre um promotor e uma seqüência de ácidos nucléicos, preferivelmente naseqüência de ácidos nucléicos transcrita, ou em caso de uma seqüência deácidos nucléicos codificando para uma proteína, na região 5' não traduzida deuma seqüência de ácidos nucléicos. A distância entre a seqüência de promotore a seqüência de ácidos nucléicos a ser expressa recombinantemente épreferivelmente menos do que 200 pares de bases, especialmentepreferivelmente menos do que 100 pares de bases, muito especialmentepreferivelmente menos do que 50 pares de bases. Ligação operável, e umcassete de expressão, podem ser geradas por meio de técnicas derecombinação e clonagem habituais como são descritas, por exemplo, emManiatis T, Fritsch EF and Sambrook J (1989) Molecular Cloning: ALaboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor(NY), em Silhavy TJ, Berman ML and Enquist LW (1984) Experiments withGene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor (NY), emAusubel FM et al. (1987) Current Protocols in Molecular Biology, GreenePublishing Assoc. and Wiley Interscience e em Gelvin et al. (1990) In: PlantMolecular Biology Manual. Entretanto, seqüências adicionais que, porexemplo, atuam como um ligante com sítios de clivagem específicos paraenzimas de restrição, ou como um peptídeo sinal, também podem serposicionadas entre as duas seqüências. A inserção de seqüências tambémpode levar à expressão de proteínas de fusão. Preferivelmente, o construto deexpressão, consistindo de uma ligação de promotor, íntron e seqüência deácidos nucléicos a ser expressa, pode existir em uma forma integrada a vetor eser inserido em um genoma vegetal, por exemplo por transformação.
Gene: se refere a uma região de codificação operavelmenteligada a seqüências reguladoras apropriadas capazes de regular a expressão dopolipeptídeo de alguma maneira. Um gene inclui regiões reguladoras nãotraduzidas de DNA (e.g., promotores, intensificadores, repressores, etc.)precedendo a (a jusante da) e seguindo (a montante da) região de codificação(quadro aberto de leitura, ORF) assim como, onde aplicável, seqüênciasintervenientes (i.e., íntrons) entre regiões de codificação individuais (i.e.,éxons). Genes também podem incluir seqüências localizadas em ambas asextremidades 5' e 3' das seqüências, que estão presentes no RNA transcrito.
Estes seqüências são referidas como seqüências ou regiões de"flanqueamento" (estas seqüências de flanqueamento são localizadas 5' ou 3'para as seqüências não traduzidas presentes no mRNA transcrito). A regiãoflanqueadora 5' pode conter seqüências reguladoras tal como promotores eintensificadores, que controlam ou influenciam a transcrição do gene. Aregião flanqueadora 3' pode conter seqüências, que direcionam o término detranscrição, clivagem pós-transcricional e poliadenilação.
Propriedades intensificadoras de expressão gênica, efeitointensificador de expressão gênica ou intensificação de expressão gênicamediada por íntron (IME): quando feita referência a uma seqüência de íntronse refere à capacidade do íntron de intensificar quantitativamente o nível deexpressão de uma seqüência de ácidos nucléicos (e.g. um gene) que é parte deum cassete de expressão de DNA recombinante/transgênico (como definidoneste lugar), medido com base no RNA transcrito, mRNA, quantidadeprotéica ou atividade protéica comparada com o construto de expressão deoutra maneira idêntico carecendo do íntron em condições não modificadas deoutra maneira. Propriedades intensificadoras de expressão gênica em plantas:se refere a um íntron que é capaz de intensificar quantitativamente o nível deexpressão de uma seqüência de ácidos nucléicos derivada de planta em umaplanta ou célula vegetal e a taxa de intensificação de expressão gênica de umácido nucléico derivado de não planta em uma planta ou a célula vegetalcomparado com o construto de expressão de outra maneira idêntico carecendodo íntron em condições não modificadas de outra maneira. Em uma forma derealização preferida da invenção, o efeito intensificador de expressão éentendido como um aumento no nível de estado constante de RNA, no nívelde estado constante de proteína ou na atividade protéica de uma seqüência deácidos nucléicos ou a proteína correspondente (e.g. um gene repórter ouproteína) de pelo menos 50%, ou pelo menos 100%, ou pelo menos 200%,300%, 400% ou pelo menos 500%, 600%, 700%, 800%, 900% ou pelo menos1.000%, ou mais do que 1.000% comparado com o construto de expressão deoutra maneira idêntico carecendo do íntron em condições não modificadas deoutra maneira. Além disso efeito intensificador de expressão ou intensificaçãomediada por íntron tem que ser entendido como a capacidade de um íntronmudar o padrão de expressão específico do tecido, órgão ou célula de umaseqüência de ácidos nucléicos (e.g. um gene) que é parte de um cassete deexpressão inventiva. Mudar o padrão de expressão específico do tecido, órgãoou célula de uma seqüência de ácidos nucléicos que é parte de um cassete deexpressão inventiva se refere ao fato de que devido à presença de um íntroninventivo, o nível de expressão (nível de estado constante de mRNA ouproteína codificada, ou a atividade de uma proteína) do respectivo gene éaumentada acima do limiar de detecção do método de detecção usado.
Silenciamento de gene: pode ser realizado por RNAantisentido ou de dupla fita ou por co-supressão (supressão sentido). Otrabalhador versado sabe que ele pode usar cDNA alternativo ou o genecorrespondente como modelo de início para construtos antisentido adequados.O ácido nucléico "antisentido" é preferivelmente complementar à região decodificação da proteína alvo ou parte desta. Entretanto, o ácido nucléico"antisentido" também pode ser complementar à região não codificante ouparte desta. Partindo da informação de seqüência em uma proteína alvo, umácido nucléico antisentido pode ser projetado de uma maneira com a qual otrabalhador versado seja familiar, levando em consideração regras de Watsone Crick de pareamento de bases. Um ácido nucléico antisentido pode sercomplementar a toda ou parte da seqüência de ácidos nucléicos da umaproteína alvo.
Da mesma maneira abrangido é o uso das seqüências descritasacima em orientação sentido, que, como é conhecido pelo trabalhadorversado, pode levar a co-supressão (supressão sentido). Foi demonstrado queexpressão de seqüências de ácidos nucléicos sentido pode reduzir ou desligarexpressão do gene correspondente, analogamente ao que foi descrito paraabordagens antisentido (Goring (1991) Proc. Natl Acad. Sei. USA 88:1770-1774; Smith (1990) Mol. Gen. Genet. 224:447-481; Napoli (1990) Plant Cell2:279-289;Van der ICrol (1990) Plant Cell 2:291-299). Neste contexto, oconstruto introduzido pode representar o gene a ser reduzido completamenteou apenas em parte. A possibilidade de tradução não é necessária.
Especialmente preferido é o uso de métodos de regulação gênica por meio deRNAi de dupla fita ("interferência de RNA de dupla fita"), ais métodos sãoconhecidos pela pessoa versada na arte (e.g., Matzke 2000; Fire 1998; WO99/32619; WO 99/53050; WO 00/68374; WO 00/44914; WO 00/44895; WO00/49035; WO 00/63364). Os processos e métodos descritos nas referênciasdeterminadas são expressamente referidos.
Genoma e DNA genômico de um organismo como usado nestelugar é toda a informação hereditária de um organismo que é codificada noDNA (ou, para alguns vírus, RNA). Isto inclui tanto os genes como asseqüências não codificantes. Dito DNA genômico compreende o DNA donúcleo (também referido como DNA cromossômico) mas também o DNA dosplastídeos (e.g., cloroplastos) e outras organelas celulares (e.g., mitocôndria).
Preferivelmente os termos genoma ou DNA genômico está se referindo aoDNA cromossômico do núcleo. O termo "DNA cromossômico" ou"seqüência de DNA cromossômico" é para ser entendido como o DNAgenômico do núcleo celular independente do estado de ciclo celular. DNAcromossômico pode portanto ser organizado em cromossomos ou cromátides,ele pode ser condensado ou desenrolado. Uma inserção no DNAcromossômico pode ser demonstrada e analisada por vários métodosconhecidos na arte tipo e.g., análise de reação em cadeia da polimerase(PCR), análise Southern blot, hibridização in situ por fluorescência (FISH), ePCR in situ.
Heteróloga: com respeito a uma seqüência de ácidos nucléicosse refere a uma seqüência de nucleotídeos, que é ligada a uma seqüência deácidos nucléicos à qual ela não é ligada na natureza, ou à qual ela é ligada emuma localização diferente na natureza.
Hibridizar: como usado neste lugar inclui "qualquer processopelo qual uma fita de ácido nucléico se une com uma fita complementaratravés de pareamento de bases." (Coombs 1994, Dictionary ofBiotechnology, Stockton Press, New York N.Y.). Hibridização e a força dehibridização (i.e., a força da associação entre os ácidos nucléicos) é impactadapor fatores tais como o grau de complementaridade entre os ácidos nucléicos,estringência das condições envolvidas, a Tm do híbrido formado, e aproporção G:C dentro dos ácidos nucléicos. Como usado neste lugar, o termo"Tm" é usado em referência à "temperatura de fusão." A temperatura de fusãoé a temperatura na qual uma população de moléculas de ácidos nucléicos dedupla fita se torna meio dissociada em fitas simples. A equação para calculara Tm de ácidos nucléicos é bem conhecida na arte. Como indicado porreferências padrão, uma estimativa simples do valor de Tm pode ser calculadapela equação: Tm=81,5+0,41(% G+C), quando um ácido nucléico está emsolução aquosa a 1 M de NaCl [veja e.g., Anderson and Young, QuantitativeFilter Hybridization, in Nucleic Acid Hybridization (1985)]. Outrasreferências incluem computações mais sofisticadas, que levam em contacaracterísticas estruturais assim como de seqüência para o cálculo de Tm. Apessoa versada na arte sabe bem que numerosas condições de hibridizaçãopodem ser empregadas para compreender condições de estringência ou baixaou alta; fatores tal como o comprimento e natureza (DNA, RNA, composiçãode base) da sonda e natureza do alvo (DNA, RNA, composição de base,presente em solução ou imobilizado, etc.) e a concentração dos sais e outroscomponentes (e.g., a presença ou ausência de formamida, sulfato de dextran,polietilenoglicol) são considerados e a solução de hibridização pode servariada para gerar condições de estringência de hibridização ou baixa ou alta.Aqueles versados na arte sabem que estringências maiores são preferidas parareduzir ou eliminar ligação não específica entre a seqüência de nucleotídeosde um íntron inventivo e outras seqüências de ácidos nucléicos, ao passo queestringências menores são preferidas para detectar um grande número deseqüências de ácidos nucléicos tendo homologias diferentes com asseqüências de nucleotídeos inventivas. Tais condições são descritas por, e.g.,Sambrook (Molecular Cloning; A Laboratory Manual, 2nd Edition, ColdSpring Harbor Laboratory Press, Cold Spring Harbor, NY (1989)) ou emCurrent Protocols in Molecular Biology, John Wiley & Sons, N. Y. (1989)6.3.1-6.3.6. Condição de hibridização preferida é descrita na descriçãodetalhada.
Identidade: quando usado em relação a ácidos nucléicos serefere a um grau de complementaridade. Identidade entre dois ácidosnucléicos é entendida como significando a identidade da seqüência de ácidosnucléicos sobre em cada caso o comprimento completo da seqüência, que écalculado por comparação com o auxílio do algoritmo de programa GAP(Wisconsin Package Versão 10.0, University of Wisconsin, GeneticsComputer Group (GCG), Madison, USA) com os parâmetros sendo ajustadoscomo segue:
Peso de Lacuna: 12 Peso de Comprimento: 4
Correspondência Média: 2,912 Incompatibilidade Média:-2,003
Por exemplo, uma seqüência com pelo menos 95% deidentidade com a seqüência SEQ ID NO. 1 no nível de ácido nucléico éentendida como significando a seqüência que, em comparação com aseqüência SEQ ID NO. 1 pelo algoritmo de programa acima com o conjuntode parâmetros acima, tem pelo menos 95% de identidade. Pode existiridentidade parcial (i.e., identidade parcial de menos do que 100%) ouidentidade completa (i.e., identidade completa de 100%).
Introduzir um construto de expressão de DNA recombinante:em células vegetais se refere a um construto de expressão de DNArecombinante que será introduzido no genoma de uma planta portransformação e é estavelmente mantido. O termo "introduzir" abrange porexemplo métodos tal como transfecção, transdução ou transformação.
Identificação, "Identificar" ou "selecionar": em consideração atransformação de plantas tem que ser entendido como um procedimento detriagem para identificar e selecionar aquelas células vegetais nas quais oconstruto de expressão recombinante foi introduzido estavelmente nogenoma. "Identificar" em consideração a um íntron com propriedadesintensificadoras de expressão gênica se refere a um processo para a seleção dedito íntron a partir de uma população de íntrons. Preferivelmente,"identificar" se refere a um processo de seleção in silico, maispreferivelmente a um processo de seleção in silico automatizado, usando oscritérios de seleção dos métodos inventivos. Um tal processo de identificaçãoin silico pode compreender por exemplo as etapas de
(1) gerar um banco de dados de seqüências de íntron nabase de seqüências de DNA presentes em um banco de dados de seqüênciasde DNA (e.g. bancos de dados de DNA genômico disponíveis publicamenteatravés da rede mundial de computadores),
(2) triagem do banco de dados de seqüências de DNAde íntron -ou outros bancos de dados contendo seqüências de DNA genômico- para íntrons com propriedades intensificadoras de expressão gênica usandoos critérios de acordo com o método inventivo,caracterizado pelo fato de que as etapas para encontrar ougerar as seqüências de DNA, a geração de um banco de dados de seqüênciasde DNA específico de íntron e a triagem destas seqüências de DNA -usandoos critérios de acordo com o método inventivo - serão realizadas com oauxílio de algoritmos computacionais e dispositivos computacionaisapropriados.
Intron: se refere a seções de DNA (seqüências intervenientes)dentro de um gene que não codificam parte da proteína que o gene produz, eque é descartado do mRNA que é transcrito a partir do gene antes dele serexportado do núcleo celular. Seqüência de íntron se refere à seqüência deácidos nucléicos de um íntron. Assim, íntrons são aquelas regiões deseqüências de DNA que são transcritas junto com a seqüência de codificação(éxons) mas são removidas durante a formação de mRNA maduro. íntronspodem ser posicionados dentro da região de codificação atual ou nos líderesnão traduzidos ou 5' ou 3' do pré-mRNA (mRNA não processado). íntrons notranscrito primário são excisados e as seqüências de codificação sãosimultaneamente e precisamente ligadas para formar o mRNA maduro. Asjunções de íntrons e éxons formam o sítio de emenda. A seqüência de umíntron começa com GU e termina com AG. Além disso, em plantas, doisexemplos de íntrons AU-AC foram descritos: o décimo quarto íntron do genede proteína tipo RecA e o sétimo íntron do gene G5 de Arabidopsis thalianasão íntrons AT-AC. Pré-mRNAs contendo íntrons têm três seqüências curtasque são -além de outras seqüências- essenciais para que o íntron sejaacuradamente processado. Estas seqüências são o sítio de emenda 5', o sítiode emenda 3', e o ponto de ramificação. Processamento de mRNA é aremoção de seqüências intervenientes (íntrons) presentes em transcritosprimários de mRNA e união ou ligação de seqüências de éxon. Isto também éconhecido como czs-processamento que une dois éxons no mesmo RNA coma remoção da seqüência interveniente (íntron). Os elementos funcionais de umíntron compreendendo seqüências que são reconhecidas e ligadas peloscomponentes protéicos específicos do spliceossoma (e.g. processandoseqüências consenso nas extremidades de íntrons). A interação dos elementosfuncionais com o spliceossoma resulta na remoção da seqüência de íntron domRNA prematuro e a reunião das seqüências de éxon. Introns têm trêsseqüências curtas que são essenciais -embora não suficientes- para que oíntron seja acuradamente processado. Estas seqüências são o sítio de emenda5', o sítio de emenda 3' e o ponto de ramificação. A seqüência de ponto deramificação é importante em processamento e seleção de sítio de emenda emplantas. A seqüência de ponto de ramificação normalmente é localizada 10-60nucleotídeos a montante do sítio de emenda 3 \ Seqüências vegetais exibemdesvios de seqüência no ponto de ramificação, as seqüências consenso sendo5-CURAY-3' (SEQ ID NO:75) ou 5'-YURAY-3' (SEQ ID NO: 76).
"IME-íntron" ou íntron de intensificação mediada por íntron(IME): quando feito em referência a uma seqüência de íntron se refere a umíntron com propriedades intensificadoras de expressão gênica em plantascomo definido neste lugar (veja propriedades intensificadoras de expressãogênica, efeito intensificador de expressão gênica ou intensificação deexpressão gênica mediada por íntron).
Isolamento ou isolado: quando usado em relação a um íntronou gene, como em "isolamento de uma seqüência de íntron" ou "isolamentode um gene" se refere a uma seqüência de ácidos nucléicos que é identificadadentro de e isolada/separada de seu contexto de seqüência de ácidos nucléicoscromossômicos dentro do respectivo organismo fonte. Acido nucléico isoladoé ácido nucléico presente em uma forma ou ambiente que é diferente daquelana qual ele é encontrado na natureza. Em contraste, ácidos nucléicos nãoisolados são ácidos nucléicos tal como DNA e RNA, que são encontrados noestado em que eles existem na natureza. Por exemplo, uma dada seqüência deDNA (e.g. um gene) é encontrada no cromossomo de célula hospedeira emproximidade com genes vizinhos; seqüências de íntron, são embebidas naseqüência de ácidos nucléicos de um gene em uma seqüência alternante deíntrons e éxons. A seqüência de ácidos nucléicos isolados pode estar presenteem uma forma de fita simples ou de dupla fita. Quando uma seqüência deácidos nucléicos isolados é para ser utilizada para expressar uma proteína, aseqüência de ácidos nucléicos irá conter no mínimo pelo menos uma porçãoda fita sentido ou de codificação (i.e., a seqüência de ácidos nucléicos podeser de fita simples). Alternativamente, ela pode conter tanto as fitas sentidocomo anti-sentido {i.e., a seqüência de ácidos nucléicos pode ser de dupla fita).
Ácido nucléico: se refere a desoxiribonucleotídeos,ribonucleotídeos ou polímeros ou híbridos destes em forma de fita simples oudupla, sentido ou antisentido. A menos que de outra maneira indicado, umaseqüência de ácidos nucléicos particular também abrange implicitamentevariantes conservativamente modificadas destas (e.g., substituições de códondegenerado) e seqüências complementares, assim como a seqüênciaexplicitamente indicada. O termo "ácido nucléico" pode ser usado paradescrever um "gene", "cDNA", "DNA", "mRNA", "oligonucleotídeo," e"polinucleotídeo".
Seqüência de ácidos nucléicos: como usado neste lugar serefere à seqüência consecutiva de desoxiribonucleotídeos ou ribonucleotídeos(nucleotídeos) de um fragmento de DNA (oligonucleotídeo, polinucleotídeo,DNA genômico, cDNA etc.) como pode ser tornado disponível por técnicasde seqüenciamento de DNA como uma lista de abreviações, letras, caracteresou palavras, que representam nucleotídeos.
Órgão: com respeito a uma planta (ou "órgão vegetal")significa partes de uma planta e pode incluir (mas não deve ser limitado a) porexemplo raízes, frutos, brotos, caule, folhas, anteras, sépalas, pétalas, pólen,sementes, etc.
Condições não modificadas de outra maneira: significa - porexemplo - que a expressão que é iniciada por um dos construtos de expressãoa ser comparada não é modificada por combinação com seqüências decontrole genético adicionais, por exemplo seqüências intensificadoras e é feitano mesmo ambiente (e.g., a mesma espécie de planta) no mesmo estágio dedesenvolvimento e nas mesmas condições de crescimento.
Planta: geralmente é entendido como significando qualquerorganismo uni ou pluricelular ou uma célula, tecido, órgão, parte ou materialde propagação (tal como sementes ou fruto) do mesmo que é capaz defotossíntese. Incluídos para o propósito da invenção são todos os gêneros eespécies de vegetais superiores e inferiores do Reino Vegetal. Plantas anuais,perenes, monocotiledôneas e dicotiledôneas são preferidas. O termo inclui asplantas maduras, semente, brotos e plântulas e suas partes derivadas, materialde propagação (tal como sementes ou micrósporos), órgãos vegetais, tecido,protoplastos, calo e outras culturas, por exemplo culturas celulares, e qualqueroutro tipo de agrupamento de célula vegetal para gerar unidades funcionais ouestruturais. Plantas maduras se referem a plantas em qualquer estágio dedesenvolvimento desejado além daquele da plântula. Plântula se refere a umaplanta imatura jovem em um estágio de desenvolvimento precoce. Plantasanuais, bianuais, monocotiledôneas e plantas dicotiledôneas são organismoshospedeiros preferidos para a geração de plantas transgênicas. A expressão degenes é além disso vantajosa em todas as plantas ornamentais, árvores úteisou ornamentais, flores, flores de corte, arbustos ou gramíneas. Plantas quepodem ser mencionadas como forma de exemplo mas não limitação sãoangiospermas, briófitas tal como, por exemplo, Hepaticae (hepáticas) e Musci(musgos); Pteridophytes tal como samambaias, cavalinha e licopódios;gimnospermas tal como coníferas, cicadáceas, ginkgo e Gnetatae\ algas talcomo Chlorophyceae, Phaeophpyceae, Rhodophyceae, Myxophyceae,Xanthophyceae, Bacillariophyceae (diatomáceas), e Euglenophyceae. Sãopreferidas plantas que são usadas para propósito de alimento ou ração talcomo as famílias das Leguminosae tal como ervilha, alfafa e soja; Gramineaetal como arroz, milho, trigo, cevada, sorgo, milheto, centeio, triticale, ouaveia; a família das Umbelliferaei especialmente o gênero Daueus, muitoespecialmente a espécie carota (cenoura) e Apium, muito especialmente aespécie Graveolens dulce (aipo) e muitas outras; a família das Solanaceae,especialmente o gênero Lycopersicon, muito especialmente a espécieesculentum (tomate) e o gênero Solanum, muito especialmente a espécietuberosum (batata) e melongena (berinjela), e muitas outras (tal como tabaco);e o gênero Capsicum, muito especialmente a espécie annuum (pimenta) emuitas outras; a família das Leguminosae, especialmente o gênero Glicina,muito especialmente a espécie max (soja), alfafa, ervilha, luzerna, feijão ouamendoim e muitas outras; e a família das Cruciferae (.Brassicacae),especialmente o gênero Brassiea, muito especialmente a espécie napus(canola), campestris (beterraba), oleraeea cv Tastie (repolho), oleracea cvSnowball Y (couve-flor) e oleracea cv Emperor (brócolis); e do gêneroArabidopsis, muito especialmente a espécie thaliana e muitas outras; afamília das Compositae, especialmente o gênero Laetuca, muitoespecialmente a espécie sativa (alface) e muitas outras; a família dasAsteraceae tal como girassol, Tagetes, alface ou Calêndula e muitas outras; afamília das Cucurbitaeeae tal como melão, abóbora/abóbora-moranga ouabobrinha, e semente de linho. Ainda preferidas são algodão, cana-de-açúcar,cânhamo, linhaça, chilis, e as várias espécies de árvore, noz e videira.
Fornecer: quando usado em relação a um íntron como em"fornecendo fisicamente um íntron" se refere à clonagem da seqüência deDNA representando dito íntron de uma planta de interesse e a provisão de umtal íntron fisicamente em um vetor ou plasmídeo apropriado para trabalho declonagem posterior e a subseqüente aplicação de dito íntron de acordo com ainvenção.
Produzir: quando usado em relação a um íntron como em"produzir um íntron" se refere à síntese de moléculas de DNA na base deinformação de seqüência de DNA de um íntron inventivo.
Promotor, elemento de promotor, ou seqüência de promotor:como usado neste lugar, se refere a uma seqüência de DNA que quando ligadaa uma seqüência de nucleotídeos de interesse é capaz de controlar atranscrição da seqüência de nucleotídeos de interesse em mRNA. Assim, umpromotor é um sítio de reconhecimento em uma seqüência de DNA quefornece um elemento de controle de expressão para um gene e ao qual RNApolimerase se liga especificamente e inicia síntese de RNA (transcrição)daquele gene. Um promotor é tipicamente, embora não necessariamente,localizado 5' (Le., anteriormente) de uma seqüência de nucleotídeos deinteresse (e.g., próximo ao sítio de início transcricional de um geneestrutural). Promotores podem ser tecido específicos ou célula específicos. Otermo "tecido específico" quando se aplica a um promotor se refere a umpromotor isto é capaz de direcionar expressão seletiva de uma seqüência denucleotídeos de interesse para um tipo específico de tecido (e.g., pétalas) naausência relativa de expressão da mesma seqüência de nucleotídeos deinteresse em um tipo diferente de tecido (e.g., raízes). Promotores podem serconstitutivos ou reguláveis. O termo "constitutivo" quando feito em referênciaa um promotor significa que o promotor é capaz de direcionar transcrição deuma seqüência de ácidos nucléicos operavelmente ligada na ausência de umestímulo (e.g., choque térmico, químicos, luz, etc.). Tipicamente, promotoresconstitutivos são capazes de direcionar expressão de um transgene emsubstancialmente qualquer célula e qualquer tecido. Em contraste, umpromotor "regulável" é um que é capaz de direcionar um nível de transcriçãode uma seqüência de ácidos nucléicos operavelmente ligada na presença deum estímulo (e.g., choque térmico, químicos, luz, etc.) que é diferente donível de transcrição da seqüência de ácidos nucléicos operavelmente ligada naausência do estímulo. Uma seqüência de promotor funcionando em plantas éentendida como significando, em princípio, qualquer promotor que é capaz degovernar a expressão de genes, em particular genes exógenos, em plantas oupartes vegetais, células vegetais, tecidos vegetais ou culturas vegetais. Nestecontexto, expressão pode ser, por exemplo, constitutiva, induzível oudesenvolvimento-dependente. Um promotor constitutivo é um promotor ondea taxa de ligação e iniciação de RNA polimerase é aproximadamenteconstante e relativamente independente de estímulos externos. Promotoresutilizáveis são promotores constitutivos (Benfey et ai. (1989) EMBO J.8:2195-2202), tal como aqueles que se originam de vírus de plantas, tal como35S CAMV (Franck et al (1980) Cell 21:285-294), 19S CaMV (veja tambémPatente Norte-Americana 5352Ó05 e WO 84/02913), 34S FMV (Sanger et al(1990) Plant. Mol. Biol., 14:433-443), o promotor de ubiquitina de salsa, oupromotores vegetais tal como o promotor de subunidade pequena de Rubiscodescrito em Patente Norte-Americana 4.962.028 ou os promotores vegetaisPRPl [Ward et al. (1993) Plant. Mol. Biol. 22: 361-6], SSU, PGEL1, OCS[Leisner (1988) Proc Natl Acad Sci USA 85(5):2553-2557], lib4, usp, mas[Cornai (1990) Plant Mol Biol 15(3):373-381], STLS1, ScBV (Schenk (1999)Plant Mol Biol 39(6):1221-1230), B33, SADl ou SAD2 (flax promotores,Jain et al. (1999) Crop Science 39(6):1696-1701) ou nos [Shaw et al. (1984)Nucleic Acids Res. 12(20):7831-7846]. Um promotor induzível é umpromotor onde a taxa de ligação e iniciação de RNA polimerase é moduladapor estímulos externos. Tais estímulos incluem luz, calor, estresse anaeróbico,alteração em condições nutritivas, presença ou ausência de um metabólito,presença de um ligante, ataque microbiano, ferimento e os semelhantes (parauma revisão, veja Gatz (1997) Annu. Rev. Plant Physiol. Plant Mol. Biol.48:89-108). Promotores induzíveis quimicamente são particularmenteadequados quando é desejado expressar o gene de uma maneira específica detempo. Exemplos de tais promotores são um promotor induzível por ácidosalicílico (WO 95/19443), e promotor induzível por ácido abscísiclo (EP 335528), a um promotor induzível por tetraciclina (Gatz et al (1992) Plant J.2:397-404), um promotor induzível por ciclohexanol ou etanol (WO93/21334) ou outros como descrito neste lugar. Um promotor viral é umpromotor com uma seqüência de DNA substancialmente similar ao promotorencontrado na extremidade 5' de um gene viral. Um promotor viral típico éencontrado na extremidade 5' do gene codificando para a proteína p21 deMMTV descrito por Huang et al. ((1981) Cell 27:245). Um promotorsintético é um promotor que foi quimicamente sintetizado preferivelmente doque biologicamente derivado. Normalmente promotores sintéticos incorporammudanças de seqüência que otimizam a eficiência de iniciação de RNApolimerase. Um promotor temporalmente regulado é um promotor onde a taxade ligação e iniciação de RNA polimerase é modulada em um momentoespecífico durante desenvolvimento. Exemplos de promotores temporalmenteregulados são dados em Chua et al. [(1989) Science 244:174-181]. Umpromotor espacialmente regulado é um promotor onde a taxa de ligação einiciação de RNA polimerase é modulada em uma estrutura específica doorganismo tal como a folha, caule ou raiz. Exemplos de promotoresespacialmente regulados são dados em Chua et al. [(1989) Science 244:174-181]. Um promotor espaço-temporalmente regulado é um promotor onde ataxa de ligação e iniciação de RNA polimerase é modulada em uma estruturaespecífica do organismo em um momento específico durantedesenvolvimento. Um promotor espaço-temporalmente regulado típico é opromotor EPSP sintase-35S descrito por Chua et al. [(1989) Science 244:174-181]. Promotores adequados são além disso o promotor de gene napina desemente oleaginosa (Patente Norte-Americana 5.608.152), o promotor USPde Vicia faba (Bãumlein et al. (1991) Mol Gen Genet 225(3):459-67), opromotor de oleosina de Arabidopsis (WO 98/45461), o promotor defaseolina de Phaseolus vulgaris (Patente Norte-Americana 5.504.200), opromotor Bce4 de Brassica (WO 91/13980), o promotor arc5 de feijão, opromotor DcG3 de cenoura, ou o promotor B4 de Legumina (LeB4; Bãumleinet al. (1992) Plant Journal 2(2):233-9), e promotores que causam a expressãoespecífica de semente em plantas monocotiledôneas tal como milho, cevada,trigo, centeio, arroz e as semelhantes. Promotores específicos de sementevantajosos são o promotor de proteína de ligação de (WO 00/26388), opromotor de faseolina e o promotor de napina. Promotores adequados quedevem ser considerados são o promotor de gene lpt2 ou Iptl de cevada (WO95/15389 e WO 95/23230), e os promotores descritos em WO 99/16890(promotores do gene de hordeína de cevada, do gene glutelina de arroz, dogene de orizina de arroz, do gene prolamina de arroz, do gene de gliadina detrigo, do gene glutelina de trigo, do gene de zeína de milho, do gene glutelinade aveia, do gene de casirina de sorgo e do gene de secalina de centeio).
Promotores adequados adicionais são Amy32b, Amy 6-6 e Aleuraína [PatenteNorte-Americana 5.677.474], Bce4 (canola) [US 5,530,149], glicina (soja)[Patente Européia 571 741], fosfoenolpiruvato carboxilase (soja) [PatenteJaponesa 06/62870], ADRl2-2 (soja) [WO 98/08962], isocitrato liase (canola)[Patente Norte-Americana 5.689.040] ou a-amilase (cevada) [PatenteEuropéia 781 849]. Outros promotores que são disponíveis para a expressãode genes em plantas são promotores específicos de folha tal como aquelesdescritos em DE-A 19644478 ou promotores luz-regulados tal como, porexemplo, p promotor petE de ervilha. Promotores vegetais adequadosadicionais são o promotor de FBPase citosólica ou o promotor ST-LSI debatata (Stockhaus et al. (1989) EMBO J. 8:2445), o promotor defosforibosilpirofosfato amidotransferase de Glycine max (No. de Acesso deGenBank U87999) ou o promotor específico de nódulo descrito em PatenteEuropéia-A-0 249 676. Outros promotores adequados são aqueles quereagem a condições de estresse biótico ou abiótico, por exemplo o promotorde gene PRPl induzido por patógeno (Ward et al. (1993) Plant. Mol. Biol.22:361-366), o promotor hsp80 termo-induzível de tomate (Patente Norte-Americana 5.187.267), o promotor alfa-amilase induzível por frio de batata(WO 96/12814) ou o promotor pinll induzível por ferimento (PatenteEuropéia-A-0 375 091) ou outros como descrito neste lugar. Outrospromotores, que são particularmente adequados, são aqueles que causamexpressão específica de plastídeo. Promotores adequados tal como o promotorde RNA polimerase viral são descritos em WO 95/16783 e WO 97/06250, e opromotor clpP de Arabidopsis, que é descrito em WO 99/46394. Outrospromotores, que são usados para a expressão forte de seqüências heterólogasem tantos tecidos quanto possíveis, em particular também em folhas, são, emadição a diversos dos promotores virais e bacterianos mencionados acima,preferivelmente, promotores vegetais de genes de actina ou ubiquitina talcomo, por exemplo, o promotor de actinal de arroz. Exemplos adicionais depromotores vegetais constitutivos são os promotores V-ATPase de beterrabaaçucareira (WO 01/14572). Exemplos de promotores constitutivos sintéticossão o promotor Super (WO 95/14098) e promotores derivados de G-box (WO94/12015). Se apropriado, promotores induzíveis químicos podem além dissotambém ser usados, compare Patente Européia-A 388186, Patente Européia-A335528, WO 97/06268. Os promotores acima listados podem sercompreendidos de outros elementos reguladores que afetam expressão gênicaem resposta a hormônios vegetais (Xu et al., 1994, Plant Cell 6(8): 1077-1085)estímulos ambientais bióticos ou abióticos, tal como condições de estresse,como exemplificado por seca (Tran et al. (2004) Plant Cell 16(9):2481-2498),calor, resfriamento, congelamento, estresse salino, estresse oxidativo (PatenteNorte-Americana 5.290.924) ou estressores bióticos tipo bactérias, fungos ouvírus.
Polipeptídeo, peptídeo, oligopeptídeo, produto de gene,produto de expressão e proteína: são usados permutavelmente neste lugar parase referir a um polímero ou oligômero de resíduos de aminoácidosconsecutivos.
Construto de expressão de DNA recombinante ou transgênico:com respeito a, por exemplo, uma seqüência de ácidos nucléicos (construto deexpressão, cassete de expressão ou vetor compreendendo dita seqüência deácidos nucléicos) se refere a todos aqueles construtos originados demanipulações experimentais nos quais ou
a) dita seqüência de ácidos nucléicos, ou
b) uma seqüência de controle genético operavelmente ligada àdita seqüência de ácidos nucléicos (a), por exemplo um promotor, ou
c) (a) e (b)
não está localizada em seu ambiente genético natural ou foimodificada por manipulações experimentais, um exemplo de umamodificação sendo uma substituição, adição, deleção, inversão ou inserção deum ou mais resíduos de nucleotídeo. Ambiente genético natural se refere aolocus cromossômico natural no organismo de origem, ou à presença em umabiblioteca genômica. No caso de uma biblioteca genômica, o ambientegenético natural da seqüência de ácidos nucléicos é preferivelmente retido,pelo menos em parte. O ambiente flanqueia a seqüência de ácidos nucléicospelo menos em um lado e tem uma seqüência de pelo menos 50 bp,preferivelmente pelo menos 500 bp, especialmente preferivelmente pelomenos 1.000 bp, muito especialmente preferivelmente pelo menos 5.000 bp,em comprimento. Um construto de expressão naturalmente ocorrente - porexemplo a combinação naturalmente ocorrente de um promotor com o genecorrespondente - se torna um construto de expressão transgênico quando ele émodificado por métodos "artificiais" não naturais, sintéticos tal como, porexemplo, mutagênese. Tais métodos foram descritos (Patente Norte-Americana 5.565.350; WO 00/15815). Polipeptídeos ou proteínasrecombinantes: se referem a polipeptídeos ou proteínas produzidos portécnicas de DNA recombinante, i.e., produzidos a partir de célulastransformadas por um construto de DNA recombinante exógeno codificandoo polipeptídeo ou proteína desejado. Ácidos nucléicos e polipeptídeorecombinante também podem compreender moléculas que como tal nãoexistem na natureza mas são modificadas, alteradas, mutadas ou de outramaneira manipuladas por homem. Um uso importante das seqüências deíntron da invenção será a intensificação da expressão de uma seqüência deácidos nucléicos, que codifica uma proteína particular, um polipeptídeo ouseqüências de DNA que interferem em transcrição ou tradução normal, e.g.RNA de interferência ou antisentido. Em uma forma de realização da presenteinvenção, o construto de expressão de DNA recombinante confere expressãode uma ou mais moléculas de ácido nucléico. Dito construto de expressão deDNA recombinante de acordo com a invenção vantajosamente abrange umpromotor funcionando em plantas, elementos reguladores ou de controleadicionais ou seqüências funcionando em plantas, uma seqüência de íntroncom propriedades intensificadoras de expressão em plantas e um terminadorfuncionando em plantas. Adicionalmente, o construto de expressãorecombinante pode conter elementos funcionais adicionais tal como cassetesde expressão conferindo expressão de e.g. marcadores de seleção positiva enegativa, genes repórteres, recombinases ou endonucleases afetando aprodução, amplificação ou função dos cassetes de expressão, vetores ouorganismos recombinantes de acordo com a invenção. Além disso, o construtode expressão recombinante pode compreender seqüências de ácidos nucléicoshomólogas a um gene vegetal de interesse tendo um comprimento suficiente afim de induzir um evento de recombinação homóloga (HR) no locus do genede interesse depois de introdução na planta. Um cassete de expressãotransgênica recombinante da invenção (ou um vetor transgênicocompreendendo dito cassete de expressão transgênica) pode ser produzida pormeio de técnicas de recombinação e clonagem habituais como são descritas(por exemplo, em Maniatis 1989, Molecular Cloning: A Laboratory Manual,2nd Ed., Cold Spring Harbor Laboratory, Cold Spring Harbor (NY); Silhavy1984,) Experiments with Gene Fusions, Cold Spring Harbor Laboratory, ColdSpring Harbor, NY; e em Ausubel 1987, Current Protocols in MolecularBiology, Greene Publishing Assoc. and Wiley Interscience). A introdução deum cassete de expressão de acordo com a invenção em um organismo oucélulas, tecidos, órgãos, partes ou sementes deste (preferivelmente em plantasou células vegetais, tecido, órgãos, partes ou sementes) pode ser afetadavantajosamente usando vetores, que compreendem os acima descritos ácidosnucléicos, promotores, íntrons, terminadores, elementos reguladores ou decontrole e elementos funcionais.
Regeneração: como usado neste lugar, significa crescer umaplanta inteira a partir de uma célula vegetal, um grupo de células vegetais,uma parte vegetal ou um pedaço vegetal (e.g., a partir de um protoplasto, calo,corpo tipo protocórmio, ou parte de tecido).
Seqüência reguladora: se refere a promotores, intensificadorou outros segmentos de DNA onde proteínas reguladoras tal como fatores detranscrição se ligam e com isso influenciam a taxa de transcrição de um dadogene.
Substancialmente todos os íntrons de um genoma vegetalrepresentados em um banco de dados de seqüências de DNA genômico oubiblioteca de DNA genômico: se refere a mais do que 80%, preferivelmente amais do que 90%, mais preferivelmente a mais do que 95%, ainda maispreferivelmente mais do que 98% de todos os íntrons presentes no genoma daplanta usada como uma fonte para a preparação do banco de dados deseqüência de DNA genômico ou biblioteca de DNA genômico. A construçãode bibliotecas genômicas e o subseqüente seqüenciamento do DNA genômicoe a construção de um banco de dados de seqüência de DNA genômico ou degenoma usando a informação de seqüência obtida é bem estabelecida na arte(Mozo et al. (1998) Mol. Gen. Genet. 258:562-570; Choi et al. (1995) WeedsWorld 2:17-20; Lui et al. (1999) Proc. Natl. Acad. Sei. USA 96:6535-6540;The Arabidopsis Genome initiative, Nature 402:761-777 (1999); TheArabidopsis Genome initiative, Nature 408:796-826 (2000).
Gene estrutural: como usado neste lugar é pretendido parasignificar uma seqüência de DNA que é transcrita em mRNA que é entãotraduzido em uma seqüência de aminoácidos característica de umpolipeptídeo específico.
Comprimento suficiente: com respeito a uma seqüência dehomologia compreendida no construto de DNA (e.g., a seqüência dehomologia A ou B) é para ser entendido para compreender seqüências de umcomprimento de pelo menos 100 pares de bases, preferivelmente pelo menos250 pares de bases, mais preferivelmente pelo menos 500 pares de bases,especialmente preferivelmente pelo menos 1.000 pares de bases, maispreferivelmente pelo menos 2.500 pares de bases. O termo "homologiasuficiente" com respeito a uma seqüência de homologia compreendida noconstruto de DNA (e.g., a seqüência de homologia A ou B) é para serentendido para compreender seqüências tendo uma homologia com aseqüência alvo correspondente compreendida no DNA cromossômico (e.g., aseqüência alvo A' ou B') de pelo menos 70 %, preferivelmente pelo menos 80%, mais preferivelmente pelo menos 90 %, especialmente preferivelmentepelo menos 95 %, mais especialmente preferivelmente pelo menos 99%, maispreferivelmente 100 %, caracterizado pelo fato de que dita homologia seestende por um comprimento de pelo menos 50 pares de bases,preferivelmente pelo menos 100 pares de bases, mais preferivelmente pelomenos 250 pares de bases, mais preferivelmente pelo menos 500 pares debases.
Região/seqüência alvo: de uma seqüência de ácidos nucléicosé uma porção de uma seqüência de ácidos nucléicos que é identificada comosendo de interesse. Uma "região de codificação" de uma seqüência de ácidosnucléicos é a porção da seqüência de ácidos nucléicos, que é transcrita etraduzida de uma maneira específica de seqüência para produzir em umpolipeptídeo ou proteína particular quando colocada sob o controle deseqüências reguladoras apropriadas. A região de codificação é dita paracodificar um tal polipeptídeo ou proteína.
Tecido: com respeito a uma planta (ou "tecido vegetal")significa arranjo de múltiplas células vegetais incluindo tecidos diferenciadose indiferenciados de plantas. Tecidos vegetais podem constituir parte de umórgão vegetal (e.g., a epiderme de uma folha vegetal) mas também podemconstituir tecidos tumorosos e vários tipos de células em cultura (e.g., célulasúnicas, protoplastos, embriões, calos, corpos tipo protocórmio, etc.). Tecidovegetal pode ser em planta, em cultura de órgão, cultura de tecido, ou culturacelular.
Transformar ou transformação: como usado neste lugar serefere à introdução de material genético (e.g., um transgene) em uma célula.
Transformação de uma célula pode ser estável ou transitória. O termo"transformação transitória" ou "transformado transitoriamente" se refere àintrodução de um ou mais transgenes em uma célula na ausência deintegração do transgene em um genoma de célula hospedeira. Transformaçãotransitória pode ser detectada por, por exemplo, ensaio imunoabsorventeligado a enzima (ELISA) que detecta a presença de um polipeptídeocodificado por um ou mais dos transgenes. Alternativamente, transformaçãotransitória pode ser detectada por detecção da atividade da proteína (e.g., b-glucuronidase) codificada pelo transgene (e.g., o gene uidJJrri) comodemonstrado neste lugar [e.g., exemplos 1.6 e 2.4, ensaio histoquímico deatividade de enzima GUS colorindo com X-gluc que gera um precipitado azulna presença da enzima GUS; e um ensaio quimioluminescente de atividade deenzima GUS usando o kit GUS-Light (Tropix)]. O termo "transformantetransitório" se refere a uma célula em que foi transitoriamente incorporado umou mais transgenes. Em contraste, o termo "transformação estável" ou"estavelmente transformadas" se refere à introdução e integração de um oumais transgenes no genoma de uma célula, preferivelmente resultando emintegração cromossômica e herdabilidade estável através de meiose.Transformação estável de uma célula pode ser detectada por hibridizaçãoSouthern blot de DNA genômico da célula com seqüências de ácidosnucléicos, que são capazes de se ligar a um ou mais dos transgenes.Alternativamente, transformação estável de uma célula também pode serdetectada por pela reação em cadeia da polimerase de DNA genômico dacélula para amplificar seqüências de transgene. O termo "transformanteestável" se refere a uma célula que tem estavelmente integrado um ou maistransgenes no DNA genômico. Assim, um transformante estável é distinguidode um transformante transitório em que, ao passo que DNA genômico dotransformante estável contém um ou mais transgenes, DNA genômico dotransformante transitório não contém um transgene. Transformação tambéminclui introdução de material genético em células vegetais na forma de vetoresvirais de planta envolvendo replicação extracromossômica e expressãogênica, que pode exibir propriedades variáveis com respeito a estabilidademeiótica.
Transgênica ou recombinante: quando usado em referência auma célula se refere a uma célula que contém um transgene, ou cujo genomafoi alterado pela introdução de um transgene. O termo "transgênico" quandousado em referência a um tecido ou a uma planta se refere a um tecido ouplanta, respectivamente, que compreende uma ou mais células que contêm umtransgene, ou cujo genoma foi alterado pela introdução de um transgene.Células, tecidos e plantas transgênicas podem ser produzidos por diversosmétodos incluindo a introdução de um "transgene" compreendendo ácidonucléico (normalmente DNA) em uma célula alvo ou integração do transgeneem um cromossomo de uma célula alvo por meio de intervenção humana, talcomo pelos métodos descritos neste lugar.
Tipo selvagem, natural ou de origem natural: significa comrespeito a um organismo, polipeptídeo, ou seqüência de ácidos nucléicos, quedito organismo, polipeptídeo, ou seqüência de ácidos nucléicos énaturalmente ocorrente ou disponível em pelo menos um organismo,polipeptídeo, ou seqüência de ácidos nucléicos naturalmente ocorrente quenão é mudado, mutado, ou de outra maneira manipulado por homem.
Vetor: é uma molécula de DNA capaz de replicação em umacélula hospedeira. Plasmídeos e cosmídeos são vetores exemplares. Alémdisso, os termos "vetor" e "veículo" são usados permutavelmente emreferência a moléculas de ácido nucléico que transferem segmento(s) de DNAde uma célula para outra, de acordo com os quais as células nãonecessariamente pertencendo ao mesmo organismo (e.g. transferência de umsegmento de DNA de uma célula de Agrobacterium para uma célula vegetal).
O termo "vetor de expressão" como usado neste lugar se referea uma molécula de DNA recombinante contendo uma seqüência decodificação desejada e seqüências de ácidos nucléicos apropriadas necessáriaspara a expressão da seqüência de codificação operavelmente ligada em umorganismo hospedeiro particular.
DESCRIÇÃO DETALHADA DA INVENÇÃO
O ensinamento da presente invenção possibilita a identificaçãode íntrons causando intensificação mediada por íntron (IME) de expressãogênica. Além disso, a presente invenção fornece íntrons vegetais isolados que,se funcionalmente combinados com um promotor funcionando em plantas eum fragmento de ácido nucléico, pode intensificar a taxa de expressão de ditoácido nucléico em uma planta ou a célula vegetal.
Uma primeira forma de realização da presente invenção se refere aum método para identificar um íntron com propriedades intensificadoras deexpressão gênica vegetal compreendendo selecionar um íntron de um genomavegetal, caracterizado pelo fato de que dito íntron é caracterizado por pelo menos asseguintes características
I) um comprimento de íntron mais curto do que 1.000 paresde bases, eII) presença de um sítio de emenda 5' compreendendo aseqüência de dinucleotídeo 5'-GT-3' (SEQ ID NO: 78), e
III) presença de um sítio de emenda 3' compreendendo aseqüência de trinucleotídeo 5-CAG-3' (SEQ ID NO: 79), e
IV) presença de um ponto de ramificação parecendo a .seqüência consenso 5'-CURAY-3' (SEQ ID NO:75) a montante do sítio deemenda 3e
V) um teor de adenina mais timina de pelo menos 40% sobre100 nucleotídeos a jusante do sítio de emenda 5', e
VI) um teor de adenina mais timina de pelo menos 50% sobre100 nucleotídeos a montante do sítio de emenda 3', e
VII) um teor de adenina mais timina de pelo menos 50%,e um teor de timina de pelo menos 30% sobre íntron inteiro.
Em outra forma de realização, a invenção se refere a um métodopara enriquecer o número de íntrons com propriedades intensificadoras deexpressão em plantas em uma população de íntrons vegetais para uma porcentagemde pelo menos 50% de dita população, dito método compreendendo selecionaríntrons de dita população, ditos íntrons são caracterizados por pelo menos asseguintes características
I) um comprimento de íntron mais curto do que 1.000 pares debases, e
II) presença de um sítio de emenda 5' compreendendo aseqüência de dinucleotídeo 5'-GT-3' (SEQ ID NO: 78), e
III) presença de um sítio de emenda 3' compreendendo aseqüência de trinucleotídeo 5-CAG-3' (SEQ ID NO: 79), e
IV) presença de um ponto de ramificação parecendo aseqüência consenso 5 '-CURAY-3' (SEQ ID NO:75) a montante do sítio deemenda 3e
V) um teor de adenina mais timina de pelo menos 40% sobre100 nucleotídeos a jusante do sítio de emenda 5', e
VI)um teor de adenina mais timina de pelo menos 50% sobre100 nucleotídeos a montante do sítio de emenda 3', e
VII) um teor de adenina mais timina de pelo menos 50%,e um teor de timina de pelo menos 30% sobre íntron inteiro.
A inclusão de qualquer dos íntrons inventivos descritos porSEQ ID NOs: 1,2,3,5, 6, 7, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20,21 ou22 na região 5' não traduzida (UTR) do gene de b-glucuronidase (GUS)dirigido pelo promotor de Ubiquitina de Zea mays levou a forte intensificaçãode expressão do gene repórter em células de suspensão de protoplastos demilho (Black Mexican Sweet) e plantas transformadas estáveis (vejaexemplos). Além disso, pode ser mostrado que as propriedades deintensificação de expressão gênica de ditos íntrons são compráveis àquelasconhecidas a partir da literatura (e.g. o primeiro íntron do gene de Ubiquitinade Zea mays, usado como controle positivo nos ensaios de expressão).
Em uma forma de realização preferida, o número de íntrons -com propriedades intensificadoras de expressão gênica - identificados dentrode uma população de íntrons aplicando o método da invenção paraenriquecimento é enriquecido para uma porcentagem de pelo menos 50%,preferivelmente pelo menos 55%, mais preferivelmente pelo menos 60%,especialmente preferivelmente pelo menos 65%, ou muito especialmentepreferivelmente pelo menos 70% (i.e., uma dada população de 100 íntronspré-selecionados usando o método inventivo irá compreender pelo menos 50,preferivelmente pelo menos 55, mais preferivelmente pelo menos 60,especialmente preferivelmente pelo menos 65 ou 70 íntrons com propriedadesintensificadoras de expressão gênica). Mais preferivelmente, o número deíntrons - com propriedades intensificadoras de expressão gênica -identificados dentro de uma população de íntrons aplicando o método dainvenção para enriquecimento é enriquecido para uma porcentagem de pelomenos 50%, caracterizado pelo fato de que os íntrons selecionados, se partede um construto de expressão de DNA recombinante, levam a um aumento naexpressão gênica de um dado gene de pelo menos 300% comparado com oconstruto de expressão de outra maneira idêntico carecendo do íntron emcondições não modificadas de outra maneira. Mais preferivelmente, oenriquecimento é pelo menos 60% porcento, caracterizado pelo fato de que osíntrons selecionados, aumentando a transcrição de um gene dirigido por umdado promotor de pelo menos 200%. Especialmente preferivelmente, oenriquecimento é pelo menos 70%, caracterizado pelo fato de que os íntronsselecionados, aumentando a transcrição de um gene dirigido por um dadopromotor de pelo menos 50%.
Preferivelmente, o comprimento de um IME-íntron inventivo épreferivelmente mais curto do que 1.000 pares de bases, mais preferivelmentemais curto do que 900 bp, mais preferivelmente mais curto do que 800 bp. Emuma forma de realização preferida, o ponto de ramificação seqüência doíntron identificado por um método da invenção é descrito pelas seqüências denucleotídeos 5'-CURAY-3' (SEQ ID NO. 75) ou 5'-YURAY-3' (SEQ IDNO. 76), caracterizado pelo fato de que o U e A são nucleotídeos essenciais, epurinas e pirimidinas são nucleotídeos preferidos em posições 3 e 5respectivamente. Em posição 1, pirimidinas são preferidas mas também C épreferido a U. Um contexto de seqüência do sítio de emenda 5' circundando odinucleotídeo GT pode variar. São preferidos sítios de emenda 5' daseqüência 5'-RR/GT(RT)(RT)(GY)-3' (SEQ ID NO. 77), caracterizada pelofato de que R representa os nucleotídeos G ou A, Y representa os nucleotídeosC ou T. Os nucleotídeos dados em parêntese descrevendo nucleotídeosalternativos na posição respectiva.
Em uma forma de realização preferida da invenção, o teor deadenina/timina (AT) de um íntron inventivo sobre da seqüência inteira é pelomenos 50%, mais preferivelmente pelo menos 55%, ainda maispreferivelmente pelo menos 60%.
Em uma forma de realização preferida da invenção aspopulações de íntrons vegetais às quais os métodos inventivos serão aplicadoscompreendem a) substancialmente todos os íntrons de um genoma vegetalrepresentado em um banco de dados de seqüências de DNA ou b) umabiblioteca de DNA genômico vegetal. Em uma forma de realização adicionalda invenção, a população de íntrons à qual os métodos inventivos serãoaplicados é selecionada a partir do grupo consistindo de a) íntrons localizadosentre dois éxons codificando proteína, e b) íntrons localizados dentro daregião 5' não traduzida do gene correspondente. A fim de identificar umíntron com propriedades intensificadoras de expressão em plantas ou célulasvegetais localizado dentro de uma região de codificação (entre dois éxonscodificando proteína) ou na região 5' não traduzida de um dado gene, asregiões de codificação e as regiões 5' não traduzidas de um conjunto de genes(e.g., presentes em um banco de dados de seqüências) podem ser tríadas paraa presença de íntrons localizados em ditas regiões e os íntrons identificadossão subseqüentemente triados usando um dos métodos inventivos. Um talprocesso de identificação in silico usando ferramentas de bioinformáticaconhecidas pelas pessoas versadas na arte pode ser realizado triando a) bancosde dados seqüência de DNA específicos (e.g., contendo apenas regiões decodificação ou as regiões 5' não traduzidas), ou b) outros bancos de dadoscontendo seqüências de DNA genômico publicamente acessíveis. Em umaforma de realização preferida da invenção, os íntrons com propriedadesintensificadoras de expressão localizados nas regiões 5'não traduzidas sãoidentificados por um método compreendendo as etapas de:
a. identificar uma seqüência de codificação dentro de umconjunto de genes presente em um banco de dados de seqüências, e
b. identificar seqüências EST correspondendo aos genesidentificados em (a), ec. comparar ditas seqüências de codificação e seqüências ESTcom a seqüência genômica dos respectivos genes, e
d. selecionar seqüências EST compreendendo a região 5' nãotraduzida, e
e. identificar íntrons localizados em ditas regiões 5' nãotraduzidas.
Preferivelmente, as etapas de encontrar ou gerar seqüências deDNA ou a geração de banco de dados de seqüência de DNA específico e triaro mesmo (e.g. usando os critérios de acordo com os métodos inventivos)podem ser realizadas com o auxílio de algoritmos computacionais debioinformática apropriados e dispositivos computacionais apropriadosconhecidos por uma pessoa versada. Em uma forma de realização preferida,os íntrons onde selecionados a partir de uma população de íntrons derivadosde plantas monocotiledôneas, especialmente preferidas são plantasmonocotiledôneas selecionadas a partir do grupo consistindo dos gênerosHordeum, Âvena, Secale, Triticum, Sorghum, Zea, Saccharum e Oryza.
Em uma forma de realização além disso preferida da invenção,a população de íntrons à qual os métodos inventivos serão aplicados éselecionada a partir de uma população de genes vegetais representando afração de 10% (9o decil) de genes com a maior taxa de expressão em umexperimento de análise de expressão gênica realizado usando uma célulavegetal, tecido vegetal ou uma planta inteira.
Para permitir a determinação de níveis de expressão gênica,diversas técnicas diferentes foram propostas (Milosavljevic, A. et al. (1996)Genome Res. 6:132-141; Shoemaker, D. et al. (1996) Nature Genet. 14:450-456; Sikela,J.M. and Auffray5C. (1993) Nature Genet. 3:189-191; Meier-Ewert S. et al. (1998) Nucleic Acids Research 26(9):2216-2223). Portanto,diversos diferentes sistemas de análise de expressão gênica podem serempregados em conformidade com a presente invenção, incluindo, mas nãolimitados à análise de microarranjo, "padrão de expressão digital", análise dedistribuição de clone de bibliotecas de cDNA usando o "método deseqüenciamento de DNA por hibridização" (Strezoska, Z. et al. (1991) Proc.Natl. Acad. Sei. USA 88:10089-10093) e Análise Serial de Expressão Gênica(SAGE, Velculescu, V. E. et ai. (1995) Science 270:484-487).
Usando a tecnologia de hibridização de microarranjo de cDNAos perfis de expressão de milhares de genes podem ser monitoradosimediatamente. A análise de arranjo de DNA se tornou uma técnica padrão nolaboratório de biologia molecular para monitorar expressão gênica. Arranjospodem ser ou pela identificação mecânica de produtos de DNA pré-sintetizados ou pela síntese de novo de oligonucleotídeos em um substratosólido, normalmente uma lâmina de vidro derivada. Tipicamente arranjos sãousados para detectar a presença de mRNAs que podem ter sido transcritos apartir de genes diferentes e que codificam proteínas diferentes. O RNA éextraído de muitas células, ou de um único tipo de célula, então convertidopara cDNA ou cRNA. As cópias podem ser "amplificadas" por (RT-) PCR.
Etiquetas fluorescentes são enzimaticamente incorporadas nas fitasrecentemente sintetizadas ou podem ser quimicamente acopladas às novasfitas de DNA ou RNA. Uma molécula de cDNA ou cRNA que contém umaseqüência complementar a uma das seqüências de sonda de fita simples iráhibridizar, ou aderir, através de pareamento de bases ao ponto no qual assondas complementares estão fixadas. O ponto irá então fluorescer quandoexaminado usando um leitor de microarranjo. Intensidade de fluorescênciaaumentada ou diminuída indica que células na amostra transcreveramrecentemente, ou cessaram transcrição, de um gene que contém a seqüênciasondada. A intensidade da fluorescência é proporcional ao número de cópiasde um mRNA particular que estavam presentes e assim indica grosso modo aatividade ou nível de expressão daquele gene. Microarranjos (e o respectivoequipamento necessário para realizar os experimentos de análise deexpressão) que podem ser empregados em conformidade com a presenteinvenção são comercialmente disponíveis. O Arranjo de Genoma deGeneChip Arabidopsis ATH1, produzido por Affimetrix (Santa Clara, CA),contém mais do que 22.500 conjuntos de sondas representandoaproximadamente 24.000 genes. O arranjo é baseado em informação doprojeto internacional de seqüenciamento de Arabidopsis que foi formalmentecompletado em Dezembro de 2000 (http://www.affymetrix. com). Assim, ataxa de expressão dos genes analisados pode ser classificada (de acordo com aintensidade da fluorescência dos respectivos genes depois do processo dehibridização) e os genes pertencendo aos 10% de genes mostrando a maiortaxa de expressão gênica podem ser identificados usando análise demicroarranjo.
Bancos de dados contendo resultados de definição do perfil deexpressão de microarranjo estão disponíveis publicamente através da redemundial de computadores e.g. o banco de dados de microarranjo deNottingham Arabidopsis Stock Center ou o banco de dados de OSMID(informação de microarranjo de estresse osmótico). O banco de dados demicroarranjo de Nottingham Arabidopsis Stock Center contendo uma amplaseleção de dados de microarranjo de circuitos integrados de genes deAffimetrix (http://affymetrix.arabidopsis. info). O banco de dados de OSMID(http://www.osmid.org) contém os resultados de aproximadamente 100experimentos de microarranjo realizados na University of Arizona. Isto incluianálise de tratamentos de NaCl, frio, e seca de Arabidopsis thaliana, arroz(<Oryza sativa), cevada, (Hordeum vulgaris), erva-gelada{Mesembryanthemum crystallinum), e milho (Zea mays). Assim, usando osperfis expressão presentes em bancos de dados de seqüência/expressão a taxade expressão de genes pode ser classificada (de acordo com a distribuição declone do respectivo cDNA na biblioteca) e genes pertencendo aos 10% degenes mostrando a maior (abundância) taxa de expressão gênica podem seridentificados.
"Padrões de expressão digital" são gerados porseqüenciamento parcial de milhares de clones aleatoriamente selecionados apartir de bibliotecas relevantes de cDNA. Genes expressos diferentementepodem ser detectados a partir de variações nas contagens de suas etiquetas deseqüência cognata. O método baseado em etiqueta de seqüência consiste degerar um grande número (milhares) de etiquetas de seqüências expressas(ESTs) a partir de bibliotecas de cDNA não normalizadas regionais 3'direcionadas. O conceito de uma comparação "padrão de expressão digital" éo seguinte: um número de etiquetas é relatado como sendo proporcional àabundância de transcritos cognatos no tipo de tecido ou célula usado parafazer a biblioteca de cDNA. A variação na freqüência relativa destasetiquetas, armazenada em bancos de dados computacionais, é então usada praapontar a expressão diferencial dos genes correspondentes (Okubo et al.1992; Matsubara and Okubo 1994). O método SAGE é um desenvolvimentoadicional desta técnica, que requer apenas nove nucleotídeos como umaetiqueta, portanto permitindo uma maior produção. Assim, a taxa deexpressão dos genes analisados usando o método de "padrão de expressãodigital" pode ser classificada (de acordo com a abundância das etiquetas dorespectivo gene na biblioteca de cDNA) e os genes pertencendo aos 10% degenes mostrando a maior (abundância) taxa de expressão gênica podem seridentificados.
Usando o "método de seqüenciamento por hibridização"descrito nas Patentes Norte-Americanas, Patente Norte-Americana 5.667.972,Patente Norte-Americana 5.492.806, Patente Norte-Americana 5.695.940,Patente Norte-Americana 5.972.619, Patente Norte-Americana 6.018.041,Patente Norte-Americana 6.451.996, Patente Norte-Americana 6.309.824 épossível realizar análise de distribuição de clone in silico de bibliotecascompletas de cDNA. O teor total de ditas Patentes Norte-Americanas éincorporado por referência. Esta tecnologia é disponível comercialmente eexperimentos personalizados podem ser conduzidos em colaboração com acompanhia HySeq Inc.. Para determinar distribuição de clone usando o"método de seqüenciamento por hibridização", ou "tecnologia HySeq"plantas são crescidas em uma variedade de condições e tratamentos, e entãotecidos em diferentes estágios de desenvolvimentos são coletados. Isto é feitode uma maneira estratégica de forma que a probabilidade de coletar todos osgenes exprimíveis em pelo menos uma ou mais das bibliotecas sejamaximizada. mRNA é então extraído de cada uma das amostras coletadas eusado para a produção de biblioteca. As bibliotecas podem ser geradas a partirde mRNA purificado em colunas de oligo dT. Colônias de transformação dabiblioteca de cDNA em is.coli são aleatoriamente escolhidas e colocadas emplacas de microtítulo e subseqüentemente DNA colocado em uma superfície.Os insertos de cDNA de cada clone das placas de microtítulo sãoamplificados por PCR e colocados em uma membrana de náilon. Diversosoligonucleotídeos de sete MER radiomarcados com 288 "P são entãoseqüencialmente hibridizados com as membranas. Depois de cadahibridização uma imagem de blot é capturada durante uma varredura noPhosphorimager para gerar um perfil para cada oligonucleotídeo único.Identidade absoluta é mantida analisando a taxonomia molecular para cassetede imagem, filtro e orientação dentro do cassete. Os filtros são então tratadosusando condições relativamente brandas tirar as sondas ligadas e entãoretornados para as câmaras de hibridização para outro ciclo. O ciclo dehibridização e formação de imagem é repetido até que o conjunto de 288oligômeros esteja completo. Depois de conclusão de hibridizações, cadaponto (representando um inserto de cDNA) terá registrado sua quantidade desinal de rádio gerada a partir de cada um dos 288 oligonucleotídeos de seteMER. O perfil de oligômeros que se ligaram, e em qual grau, a cada insertoúnico de cDNA (uma mancha na membrana) é definido como a assinaturagerada a partir daquele clone. Cada assinatura de clone é comparada comtodas as outras assinaturas geradas a partir do mesmo organismo paraidentificar agrupamentos de assinaturas relacionadas. Este processo"classifica" todos os clones de um organismo em assim chamados"agrupamentos" antes de seqüenciamento. No processo de agrupamento,bibliotecas de cDNA complexas ou tecido específicas são "exploradas"usando uma série de 288 oligonucleotídeos de sete pares de bases. Coletandodados na assinatura de hibridização destes oligos, o conjunto aleatório declones em uma biblioteca pode ser classificado em "agrupamentos". Umagrupamento é indicativo para a abundância de cada gene em uma bibliotecaparticular e é portanto uma medida da taxa de expressão gênica de um geneindividual. Assim, a taxa de expressão de genes pode ser classificada usando atecnologia "HySeq" e os genes pertencendo aos 10% de genes mostrando amaior (abundância) taxa de expressão gênica podem ser identificados.
Os genes, cDNAs ou etiquetas de seqüências expressasescolhidos para a identificação dos íntrons inventivos, pertencendo aos 10%,preferivelmente 5%, mais preferivelmente 3% mais preferivelmente 1% degenes mostrando a maior taxa de expressão gênica em um experimento deanálise de expressão gênica, caracterizados pelo fato de que a taxa deexpressão gênica pode ser calculada indiretamente usando os métodos acimadescritos. Em uma forma de realização preferida da invenção, as seqüênciasde ácidos nucléicos dos genes pertencendo aos 10% de genes mostrando amaior taxa de expressão gênica foram usadas para isolar a seqüênciagenômica completa de DNA - incluindo as seqüências de íntron- dosrespectivos genes por triagem de e.g. bancos de dados contendo seqüências deDNA apropriadas, ou DNA genômico ou bibliotecas de DNA genômicousando métodos de hibridização ou técnicas de clonagem RACE(amplificação rápida de extremidades de cDNA), ou técnicas decaminhamento de cromossomo. Depois de determinação de seqüência doDNA genômico completa isolada do respectivo gene candidato, as seqüênciasde íntron presentes em ditos genes foram tríadas usando os critérios acimadescritos para identificar aqueles íntrons, tendo propriedades intensificadorasde expressão. Os métodos in silico descritos para a seleção de íntrons compropriedades intensificadoras de expressão têm uma alta probabilidade desucesso, mas a eficiência dos métodos descritos pode ser adicionalmenteaumentada por combinação com outros métodos. Portanto, em uma forma derealização preferida da invenção validação independente dos genesrepresentando os 10% de genes mostrando a maior taxa de expressão gênicaem um experimento de análise de expressão gênica é feita usando ferramentasalternativas de análise de expressão gênica, tipo análise Northern, ou análisede PCR em tempo real (veja exemplos).
Em uma forma de realização preferida da invenção o método para aidentificação ou enriquecimento de íntrons com propriedades intensificadoras deexpressão gênica em plantas é aplicado a bancos de dados de seqüência de DNAusando um processo automatizado, mais preferivelmente usando um dispositivocomputacional e um algoritmo que define as instruções necessárias para realizar asetapas de seleção para identificar ou enriquecer íntrons com propriedadesintensificadoras de expressão gênica em plantas dentro da população tríada deseqüências de DNA. Uma forma de realização adicional da invenção é umalgoritmo computacional que define as instruções necessárias para realizar as etapasde seleção para identificar ou enriquecer íntrons com propriedades intensificadorasde expressão gênica vegetal como descrito acima. Algoritmos computacionais úteissão bem conhecidos na arte de bioinformática ou biologia computacional.Bioinformática ou biologia computacional é o uso de técnicas matemáticas einformacionais para analisar dados de seqüências (e.g. geração de dados deseqüências, alinhamentos de seqüências, triagem de dados de seqüências)normalmente criando ou usando programas computacionais, modelos matemáticosou ambos. Uma das principais áreas de bioinformática é a exploração de dados eanálise de dados recolhidos de diferentes fontes. Outras áreas são alinhamento deseqüência, predição de estrutura protéica. Outro aspecto de bioinformática emanálise de seqüência é a busca automática por genes ou seqüências reguladorasdentro de um genoma (e.g. seqüências de íntron dentro de um trecho de DNAgenômico). Bancos de dados de seqüências podem ser buscados usando umavariedade de métodos. O mais comum é provavelmente buscar por uma seqüênciasimilar a um certo gene alvo cuja seqüência já é conhecida pelo usuário. Umprograma útil é o programa BLAST (Basic Local Alignment Search Tool) ummétodo deste tipo. BLAST é um algoritmo para comparar seqüências biológicas, talcomo seqüências de DNA de diferentes genes. Dada uma biblioteca ou banco dedados de seqüências, uma busca BLAST possibilita um pesquisador procurar porseqüências específicas. O algoritmo BLAST e um programa de computador que oimplementa foram desenvolvidos por Stephen Altschul no U.S. National Center forBiotechnology Information (NCBI) e está disponível na rede mundial decomputadores em http://www.ncbi.nlm.nih.gov/BLAST. O programa BLAST podeser ou baixado e rodado como uma utilidade de linha de comando "blastall" ouacessado gratuitamente na rede mundial de computadores. O servidor de BLAST,hospedado pelo NCBI, permite qualquer um com um navegador realizar buscas desimilaridade contra bancos de dados constantemente atualizados de proteínas eDNA que incluem mais dos organismos recentemente seqüenciados. BLAST éatualmente uma família de programas (todos incluídos no executável blastall)incluindo entre outros o BLAST Nucleotídeo-nucleotídeo (BLASTN). Esteprograma, dada uma consulta de DNA, retorna as seqüências de DNA maissimilares do banco de dados de DNA que o usuário especifica. Uma pessoa versadana arte sabe como produzir ou encontrar dados de seqüências de e.g. banco dedados de seqüências públicos e projetar algoritmos para triar o conjunto deseqüências de uma maneira personalizada (veja exemplos).
Adicionalmente, a invenção se refere a algoritmo computacionalque define as instruções necessárias para realizar as etapas de seleção paraidentificar ou enriquecer íntrons com propriedades intensificadoras de expressãogênica em plantas de um genoma vegetal ou uma população de íntrons selecionadaa partir do grupo consistindo de íntrons localizados entre dois éxons codificandoproteína, e/ou íntrons localizados dentro da região 5' não traduzida do genecorrespondente e/ou íntrons localizados nas seqüências de DNA de genesrepresentando a fração de 10% de genes com a maior taxa de expressão em umexperimento de análise de expressão gênica realizado usando uma célula vegetal,tecido vegetal e/ou uma planta inteira. Outra forma de realização da invenção é umdispositivo computacional ou dispositivo de armazenamento de dadoscompreendendo o algoritmo. Um dispositivo de armazenamento pode ser um discorígido (ou "disco duro") ou um meio ótico de armazenamento de dados tipo umCD-ROM ("Disco Compacto de Memória Somente de Leitura" (ROM)) ou DVD(disco versátil digital) ou qualquer outro meio de armazenamento de dadosmecanicamente, magneticamente, ou oticamente.
Outra forma de realização da invenção se refere a um métodopara isolar, fornecer ou produzir um íntron com propriedades intensificadorasde expressão gênica em plantas compreendendo as etapas de
a) realizar uma identificação ou enriquecimento de íntronscom propriedades intensificadoras de expressão gênica em plantas comodescrito acima e fornecer a informação de seqüência de ditos íntronsidentificados ou enriquecidos, e
b) fornecer a seqüência de nucleotídeos física de ditos íntronsidentificados ou enriquecidos em a) e
c) avaliar as propriedades intensificadoras de expressão gênicada seqüência de íntron fornecida em b) em um experimento de expressão invivo ou in vitro, e
d) isolar íntrons de dito experimento de expressão c), quedemonstram propriedades intensificadoras de expressão.
Preferivelmente, avaliação das propriedades intensificadoras deexpressão gênica dos íntrons isolados compreende,
cl) fornecer um construto de expressão recombinante ligandofuncionalmente uma seqüência de nucleotídeos individual de etapa b) com pelomenos uma seqüência de promotor funcionando em plantas ou células vegetais, epelo menos uma seqüência de ácidos nucléicos prontamente quantificável, e
c2) introduzir dito construto de expressão de DNA recombinanteem células vegetais e avaliar as propriedades intensificadoras de expressão gênicado íntron isolado.
Preferivelmente, a avaliação das propriedades intensificadoras deexpressão gênica é feita em uma célula vegetal ou plantas transformadas estáveis ecaracterizada pelo fato de que dito íntron isolado intensifica expressão de um dadogene pelo menos duas vezes (veja exemplos).
Um assunto adicional da invenção se refere a um construto deexpressão de DNA recombinante compreendendo pelo menos uma seqüênciade promotor funcionando em células vegetais, pelo menos uma seqüência deácidos nucléicos e pelo menos um íntron selecionado a partir do grupoconsistindo das seqüências descritas por SEQ ID NOs: 1, 2, 3, 5, 6, 7, 10, 11,12, 13, 14, 15, 16, 17, 18, 19, 20, 21 e 22, e equivalentes funcionais destas,caracterizado pelo fato de que dita seqüência de promotor e pelo menos umade ditas seqüências de íntrons são funcionalmente ligadas à dita seqüência deácidos nucléicos e caracterizado pelo fato de que dito íntron é heterólogo paradita seqüência de ácidos nucléicos ou para dita seqüência de promotor. Alémdisso, a invenção se refere a construtos de expressão recombinantecompreendendo pelo menos uma seqüência de promotor funcionando emcélulas vegetais, pelo menos uma seqüência de ácidos nucléicos e pelo menosum equivalente funcional de um íntron descrito por qualquer de seqüênciasSEQ ID NOs: 1, 2, 3, 5, 6, 7, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 e 22.
Preferivelmente, ditos equivalentes funcionais compreendendoos elementos funcionais de um íntron, caracterizados pelo fato de que ditaseqüência de promotor e pelo menos uma de ditas seqüências de íntrons sãofuncionalmente ligadas à dita seqüência de ácidos nucléicos e caracterizadaspelo fato de que dito íntron é heterólogo para dita seqüência de ácidosnucléicos ou para dita seqüência de promotor. Mais preferivelmente, oequivalente funcional é adicionalmente caracterizado por
i) ter pelo menos 50 pares de bases consecutivos da seqüênciade íntron descrita por qualquer de SEQ ID NOs: 1, 2, 3, 5, 6, 7, 10, 11, 12, 13,14, 15, 16, 17, 18, 19, 20, 21 ou 22, ou
ii) ter uma identidade de pelo menos 80% sobre uma seqüênciade pelo menos 95 pares de bases de ácidos nucléicos consecutivos com umaseqüência descrita por qualquer de SEQ ID NOs: 1, 2, 3, 5, 6, 7, 10, 11, 12,13, 14, 15, 16, 17, 18, 19, 20, 21 ou 22 ou
iii) hibridizar em condições estringentes altas com umfragmento de ácido nucléico de pelo menos 50 pares de bases consecutivos deuma molécula de ácido nucléico descrita por qualquer de SEQ ID NOs: 1, 2,3,5,6, 7, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20,21 ou 22,
Em uma forma de realização preferida da invenção, os íntronscompreendendo pelo menos 50 pares de bases, mais preferivelmente pelomenos 40 pares de bases, mais preferivelmente 30 pares de bases dasseqüências/éxons 5' e 3' adjacentes aos sítios de emenda 5' e 3' do íntron,respectivamente. Em outra forma de realização da invenção, o construto deexpressão de DNA recombinante da invenção compreende adicionalmenteuma ou mais seqüências reguladoras adicionais funcionalmente ligadas a umpromotor. Estas seqüências reguladoras podem ser selecionadas a partir dogrupo consistindo de elementos de choque térmico, responsivos anaeróbicos,responsivos a patógeno, responsivos a seca, responsivos a baixa temperatura,responsivos a ABA, região 5' não traduzida de gene, região 3' não traduzidade gene, terminadores de transcrição, sinais de poliadenilação eintensificadores. Fatores de atuação eis e trans envolvidos em expressãogênica induzida por ABA foram revistos por Bray (1997) Trends Plant Sei.2:48-54; Busk et al. (1998) Plant Mol. Biol. 37:425-^35 e Shinozaki andYamaguchi-Shinozaki (2000) Curr. Opin. Plant Biol. 3:217-223). Muitosgenes ABA-induzíveis contêm um elemento conservado, responsivo a ABA,de atuação eis chamado ABRE (elemento responsivo a ABA; PyACGTGGC)nas suas regiões de promotores (Guiltinan et al. (1990) Science 250:267-271;Mundy et al. (1990) Proc. Natl. Acad. Sei. USA 87:406-410). A região depromotor do gene rd29A foi analisada, e um novo elemento de atuação eisresponsável por expressão induzida por desidratação e frio foi identificado naseqüência de nucleotídeos (Yamaguchi-Shinozaki and Shinozaki (1994) PlantCell 6:251-264.). Uma seqüência conservada de 9-bp, TACCGACAT,denominada o elemento responsivo a desidratação (DRE), é essencial para aregulação de expressão gênica responsiva a desidratação. Motivosrelacionados a DRE foram relatados nas regiões de promotores de genesinduzíveis por frio e seca tal como kinl, cor6.6, e rdl7 (Wang et al. (1995)Plant Mol. Biol. 28:605-617; Iwasaki et al. (1997) Plant Physiol. 115:1287).A termoindutibilidade dos genes de choque térmico é atribuída à ativação defatores de choque térmico (HSF). HSF atuam através de um elemento depromotor de choque térmico altamente conservado (HSE) que foi definidocomo repetições adjacentes e inversas do motivo 5'-nGAAn-3' (Amin et al.(1988) Mol Cell Biol 8:3761-3769). Exemplos para elementos de resposta àdefesa ou patógeno são os elementos de W-box (TTGACY) e tipo W-box,representando sítios de ligação para fatores de transcrição WRKY específicospara plantas envolvidos em desenvolvimento vegetal e respostas vegetais aestresses ambientais (Eulgem et al. (2000) Trends Plant Sci 5:199-206;Robatzek S et al. (2001) Plant J 28:123-133), e o elemento Myc (CACATG)(Rushton PJ et al. (1998) Curr Opin Plant Biol 1:311-315). Tais seqüênciasreguladoras ou elementos que podem ser empregados em conjunção com umpromotor descrito, abrangem as regiões 5' não traduzidas, seqüênciasintensificadoras e sinais de poliadenilação vegetais. Exemplos deintensificadores de tradução, que podem ser mencionados, são a seqüêncialíder 5' do vírus do mosaico de tabaco (Gallie et al. (1987) Nucl Acids Res15:8693-8711), o intensificador do gene octopina sintase e os semelhantes.Além disso, eles podem promover especificidade para tecido (Rouster J et al.(1998) Plant J 15:435-440). O construto de expressão de DNA recombinanteirá tipicamente incluir o gene de interesse junto com uma seqüência de ácidosnucléicos de extremidade 3' que atua como um sinal para terminar transcriçãoe subseqüente poliadenilação do RNA. Sinais de poliadenilação vegetaispreferidos são aqueles, que essencialmente correspondem a sinais depoliadenilação de T-DNA de Agrobacterium tumefaciens, em particular gene3 do T-DNA (octopina sintase) do plasmídeo Ti pTiACHS (Gielen et ai.(1984) EMBO J 3:835-46) ou equivalentes funcionais destes. Exemplos deseqüências terminadoras, que são especialmente adequadas, são o terminadorde OCS (octopina sintase) e o terminador de NOS (nopalina sintase). Umcassete de expressão e os vetores dela derivados podem compreenderelementos funcionais adicionais. O termo elemento funcional é para serentendido no sentido amplo e se refere a todos aqueles elementos, que têm umefeito na geração, amplificação ou função dos cassetes de expressão, vetoresou organismos recombinantes de acordo com a invenção. Os seguintes podemser mencionados como forma de exemplo, mas não limitação:
1. Marcadores de seleção
Marcadores de seleção são úteis para selecionar e separar comsucesso células transformadas ou recombinadas homólogas. Para selecionarcélulas que passaram por recombinação homóloga bem sucedida, ou de outramaneira selecionar células transformadas, também é tipicamente necessáriointroduzir um marcador selecionável, que confere resistência a um biocida(por exemplo herbicida), um inibidor de metabolismo tal como 2-desoxiglicose-6-fosfato (WO 98/45456) ou um antibiótico para as células quepassaram por recombinação bem sucedida. O marcador de seleção permite aseleção das células transformadas a partir de umas não transformadas(McCormick et ai. (1986) Plant Cell Reports 5:81-84).
1.1 Marcadores de seleção negativa
Marcadores de seleção negativa conferem uma resistência aum composto biocida tal como um inibidor metabólico (e.g., 2-desoxiglicose-6-fosfato, WO 98/45456), antibióticos (e.g., canamicina, G 418, bleomicinaou higromicina) ou herbicidas (e.g., fosfinotricina ou glifosato). Marcadoresde seleção negativa especialmente preferidos são aqueles que conferemresistência a herbicidas. Exemplos que podem ser mencionados são:
- Fosfinotricina acetiltransferases (PAT; também chamadoresistência a Bialophos; bar; de Block et ai (1987) EMBO J 6:2513-2518)55-enolpiruvilshiquimato-3-fosfato sintase (EPSPS)conferindo resistência a Glifosato (N-(fosfonometil)glicina),
Enzimas de degradação de glifosato (Glifosatooxidoredutase; gox),
- Desalogenases de inativação de Dalapon (deh)
- Acetolactato sintases de inativação de sulfoniluréia eimidazolinona (por exemplo variantes de ALS mutadas com, por exemplo, amutação S4 e/ou Hra)
- Nitrilases de degradação de Bromoxinil (bxn)
- Genes de resistência a canamicina ou G418 (NPTII; NPTI)codificando e.g., para neomicina fosfotransferases,
- 2-Desoxiglicose-6-fosfato fosfatase (DOGRI-Produto degene; WO 98/45456; Patente Européia O 807 836) conferindo resistênciacontra 2-desoxiglicose (Randez-Gil et al., 1995 Yeast 11:1233-1240).
Marcador de seleção negativa adequado adicional são o geneaadA, que confere resistência ao antibiótico espectinomicina, o gene deestreptomicina fosfotransferase (SPT), que permite resistência aestreptomicina e o gene de higromicina fosfotransferase (HPT), que mediaresistência a higromicina. São especialmente preferidos marcadores deseleção negativa que conferem resistência contra os efeitos tóxicos impostospor D-aminoácidos tipo e.g., D-alanina e D-serina (WO 03/060133; Erikson2004). Especialmente preferidos como marcadores de seleção negativa nestecontexto são o gene dao\ (EC: 1.4. 3.3: GenBank Acc.-No.: U60066) dalevedura Rhodotorula gracilis (Rhodosporidium toruloides) e o gene dsdA deE. coli (D-serina desidratase (D-serina deaminase) [EC: 4.3. 1.18; GenBankAcc.-No.: JO1603).
1.2) Marcador de contra seleção
Marcadores de contra seleção são especialmente adequadospara selecionar organismos com seqüências deletadas definidascompreendendo dito marcador (Koprek T et al. (1999) Plant J 19(6): 719-726). Exemplos para marcador de seleção negativo compreendem timidinaquinases (TK), citosina desaminases (Gleave AP et al. (1999) Plant Mol Biol.40(2):223-35; Perera RJ et al. (1993) Plant Mol. Biol 23(4): 793-799;Stougaard J. (1993) Plant J 3:755-761), proteínas de citocromo P450 (Kopreket al. (1999) Plant J 16:719-726), desalogenases de haloalcano (Naested H(1999) Plant J 18:571-576), iaaH produtos de gene (Sundaresan V et al.(1995) Genes & Development 9:1797-1810), citosina desaminase codA(Schlaman HRM and Hooykaas PJJ (1997) Plant J 11:1377-1385), ouprodutos de gene tms2 (Fedoroff NV & Smith DL5 1993, Plant J 3:273- 289).
1.3 Marcador de seleção positiva
Além disso, marcador de seleção positiva pode ser empregado.Genes tipo isopenteniltransferase de Agrobacterium tumefaciens(linhagem:P022; Genbank Acc.-No.: AB025109) podem - como uma enzimachave da biossíntese de citocinina - facilitar regeneração de plantastransformadas (e.g., por seleção em meio livre de citocinina). Métodos deseleção correspondentes são descritos (Ebinuma 2000a,b). Marcadores deseleção positiva adicionais, que conferem uma vantagem de crescimento parauma planta transformada em comparação com uma não transformada, sãodescritos e.g., em Patente Européia-A 0 601 092. Marcadores de seleção deintensificação de crescimento podem incluir (mas não devem ser limitados a)b-Glucuronidase (em combinação com e.g., uma citocinina glucuronida),manose-6-fosfato isomerase (em combinação com manose), UDP-galactose-4-epimerase (em combinação com e.g., galactose), caracterizado pelo fato deque manose-6-fosfato isomerase em combinação com manose é especialmentepreferida.
2) Genes repórteres
Genes repórteres codificam proteínas prontamentequantificáveis e, através de sua cor ou atividade enzimática, tornam possíveluma verificação da eficácia de transformação, o sítio de expressão ou o tempode expressão. Muito especialmente preferidos neste contexto são genescodificando proteínas repórteres (Schenborn E and Groskreutz D. (1999) MolBiotechnol. 13(l):29-44) tal como a proteína verde fluorescente (GFP) (Sheenet al. (1995) Plant Journal 8(5):777-784; Haseloff et al. (1997) Proc NatlAcad Sci USA 94(6):2122-2127; Reichel et al. (1996) Proc Natl Acad SciUSA 93(12):5888-5893; Tian et al. (1997) Plant Cell Rep 16:267-27l;WO97/41228; Chui WL et al. (1996) Curr Biol 6:325-330; Leffel SM et al.(1997) Biotechniques. 23(5):912-8), cloranfenicol-transferase, uma luciferase(Ow et al. (1986) Science 234:856-859; Millar et al. (1992) Plant Mol BiolRep 10:324-414), o gene de aequorina (Prasher et al. (1985) BiochemBiophys Res Commun 126(3): 1259-1268), B-galactosidase, gene de locus R(codificando uma proteína que regula a produção de pigmentos de antocianina(coloração vermelha) em tecido vegetal e assim tornam possível a análisedireta da atividade de promotor sem adição de substâncias auxiliaresadicionais ou substratos cromogênicos; Dellaporta et al. (1988) In:Chromosome Structure and Function: Impact of New Concepts, 18o StadlerGeneties Symposium 11:263-282), com B-glucuronidase sendo muitoespecialmente preferida (Jefferson et ai (1987) EMBO J. 6:3901-3907).
3) Origens de replicação, que asseguram amplificação doscassetes de expressão ou vetores de acordo com a invenção em, por exemplo,E. coli. Exemplos que podem ser mencionados são ORI (origem de replicaçãode DNA), o pBR322 ori ou o Pl5A ori (Sambrook et al.: Molecular Cloning.A Laboratory Manual, 2a ed. Cold Spring Harbor Laboratory Press, ColdSpring Harbor, NY, 1989).
4) Elementos que são necessários para transformação de plantamediada por Agrobacterium, tal como, por exemplo, o limite direito ouesquerdo do T-DNA ou da região vir.
O construto de expressão recombinante inventivo contémseqüências de ácidos nucléicos exprimíveis em adição a, ou outras do que,seqüências de ácidos nucléicos codificando para proteínas marcadoras. Emuma forma de realização preferida da invenção o construto de expressão deDNA recombinante compreende uma seqüência de ácidos nucléicos quecodifica para i) uma proteína ou ii) uma seqüência de RNA sentido,antisentido, ou de dupla fita. Em uma forma de realização preferida adicionalda presente invenção, o construto de expressão de DNA recombinante contéma seqüência de ácidos nucléicos codificando uma proteína. Em ainda outraforma de realização da invenção o construto de expressão de DNArecombinante pode conter um DNA para o propósito de expressar transcritosde RNA que funcionam para afetar fenótipo vegetal sem ser traduzido emuma proteína. Tais seqüências que não expressam proteína compreendemmoléculas de RNA antisentido, moléculas de RNA sentido, moléculas deRNA com atividade de ribozima, moléculas de RNA formando dupla fita(RNAi). Os construtos de expressão transgênicos da invenção podem serempregados para suprimir ou reduzir expressão de genes endógenos alvo por"silenciamento de gene". O trabalhador versado conhece genes ou proteínaspreferidos cuja supressão causa um fenótipo vantajoso. Exemplos podemincluir mas não são limitados a diminuição da subunidade b de proteína G deArabidopsis para aumentar massa radicular (Ullah et al. (2003) Plant Cell15:393-409), inativar canal iônico dependente de AMPc (CNGC) paramelhorar resistência a doença (WO 2001007596), e diminuição de gene 4-coumarato-CoA ligase (4CL) para alterar teores de lignina e celulose (PatenteNorte-Americana 2002138870). Em outra forma de realização ainda preferidada invenção, os construtos de expressão transgênicos da invenção contêmácidos nucléicos, que quando transcritos, produzem enzimas de RNA(Ribozimas) que podem atuar como endonucleases e catalisar a clivagem demoléculas de RNA com seqüências selecionadas. A clivagem do RNAselecionado pode resultar na produção reduzida de seus produtos depolipeptídeos codificados. Ribozimas têm domínios catalíticos específicosque possuem atividade de endonuclease (Kim and Ceck 1987, Proc. Natl.Acad. Sei. USA, 84:8788-8792; Gerlach et al, 1987, Nature, 328:802-805;Forster and Symons, 1987, Cell, 49:211-220). Diversos diferentes motivos deribozimas foram descritos com atividade de clivagem de RNA (Symons,1992, Annu. Rev. Biochem., 61: 641-671). Exemplos incluem seqüências deíntrons de auto processamento de grupo 1 incluindo Vírus da Mancha Anularde Tabaco (Prody et al, 1986, Science, 231:1577-1580). Outras ribozimasadequadas incluem seqüências de RNaseP com atividade de clivagem (Yan etal. (1992) Proc. Natl. Acad. Sei. USA 87:4144-4148), estruturas tipo grampode ribozima (Berzal-Herranz et al. (1992) Genes and Devei. 98:1207-1210) eribozima baseada em Vírus Delta de Hepatite (Patente Norte-Americana No.5.625.047). O modelo geral e otimização de atividade de clivagem de RNAdirecionada por ribozima foram discutidos em detalhe (Haseloff and Gerlach(1988) Nature 224:585-591; Symons (1992) Annu. Rev. Biochem. 61: 641-671). A escolha de uma seqüência de ácidos nucléicos particular para serentregue a uma célula hospedeira ou planta depende do objetivo datransformação. Em geral, o principal objetivo de produzir plantas transgênicasé adicionar algumas características benéficas à planta.
Em outra forma de realização da invenção, o construto deexpressão recombinante compreende uma seqüência de ácidos nucléicoscodificando para uma proteína marcadora selecionável, uma proteínamarcadora monitorável, uma proteína ativa anabólica, uma proteína ativacatabólica, uma proteína de resistência a estresse biótico ou abiótico, umaproteína de esterilidade de macho ou uma proteína afetando característicasagronômicas de planta. Tais características incluem, mas não são limitadas a,resistência ou tolerância a herbicida, resistência ou tolerância a inseto,resistência ou tolerância a doença (viral, bacteriana, fungica, nematóide);tolerância a estresse, como exemplificado por tolerância a seca, calor,resfriamento, congelamento, estresse salino, estresse oxidativo; rendimentoaumentado, conteúdo alimentar, esterilidade de macho, quantidade equalidade de amido, conteúdo e qualidade de óleo, conteúdo e qualidade devitamina (e.g. vitamina E) e os semelhantes. Alguém pode desejar incorporaruma ou mais seqüências de ácidos nucléicos conferindo qualquer de taiscaracterísticas desejáveis. Além disso, os construtos de expressãorecombinante da invenção podem compreender fatores de transcriçãoartificiais (e.g. do tipo proteína de dedo de zinco; Beerli (2000) Proc NatlAcad Sci USA 97(4): 1495-500). Estes fatores se acoplam às regiõesreguladoras dos genes endógenos a serem expressos ou a serem reprimidos e,dependendo do modelo do fator, causam expressão ou repressão do geneendógeno. Os seguintes podem ser mencionados como forma de exemplo masnão como forma de limitação como seqüências de ácidos nucléicos oupolipeptídeos que podem ser usadas para estas aplicações:
Proteção melhorada do embrião vegetal contra estressesabióticos tal como seca, temperaturas altas ou baixas, por exemplosuperexpressando os polipeptídeos anticongelantes de Myoxocephalusseorpius (WO 00/00512), Myoxocephalus octodeeemspinosus, o ativador detranscrição CBF1 de Arabidopsis thalianum, glutamato desidrogenases (WO97/12983, WO 98/11240), um gene de embriogênese tardia (LEA), porexemplo de cevada (WO 97/13843), genes de proteína quinase dependente decálcio (WO 98/26045), calcineurinas (WO 99/05902), farnesil transferases(WO 99/06580, Pei 1998), ferritina (Deak 1999), oxalato oxidase (WO99/04013; Dunwell 1998), fator DREBlA (elemento de resposta àdesidratação B IA; Kasuga 1999), genes de síntese de manitol ou trealose, talcomo trealose-fosfato sintase ou trealose-fosfato fosfatase (WO 97/42326), ouinibindo genes tal como o gene de trealase (WO 97/50561). Ácidos nucléicosespecialmente preferidos são aqueles que codificam o ativador transcricionalCBFl de Arabidopsis thaliana (GenBank Acc. No.: U77378) ou a proteínaanticongelante de Myoxocephalus octodeeemspinosus (GenBank Acc. No.:AF306348), ou equivalentes funcionais destes. Para expressão em plantas, amolécula de ácido nucléico deve ser operavelmente ligada a um promotoradequado. O promotor vegetal específico, elemento regulador e o terminadordo construto de expressão recombinante inventivo não necessita ser de origemvegetal, e pode ser originado de vírus ou microorganismos, em particular porexemplo de vírus que atacam células vegetais.
Um assunto adicional da invenção é a introdução de umaseqüência de íntron inventiva em uma seqüência de ácidos nucléicos alvoatravés de recombinação homóloga (HR). Como um pré-requisito para a Hentre o construto de expressão recombinante e a seqüência de ácidosnucléicos alvo genômica, o construto de expressão recombinante deve conterfragmentos da seqüência de ácidos nucléicos alvo de comprimento ehomologia suficientes. Em uma forma de realização preferida da invenção, aseqüência de íntron que têm que ser inserida no gene de interesse através de Hé (dentro do construto de expressão recombinante) colocada entre um par deseqüências de DNA idênticas à região 5'e 3' para o local preferido deinserção. Neste caso, o construto de expressão recombinante podecompreender apenas a seqüência de íntron e as seqüências de ácidos nucléicosnecessárias para induzir o evento de HR. Em uma forma de realizaçãopreferida da invenção, a seqüência de íntron que é flanqueada pela seqüênciade ácidos nucléicos do DNA alvo, contém um cassete de expressão quepossibilita a expressão de uma proteína marcadora selecionável que permite aseleção de plantas transgênicas nas quais uma recombinação homóloga ouilegítima ocorreu subseqüente à transformação. O cassete de expressãodirigindo a expressão da proteína marcadora selecionável pode ser flanqueadapor seqüências de controle de H que são reconhecidas por endonucleases ourecombinases específicas, facilitando a remoção do cassete de expressão dogenoma. Tais assim chamados métodos de excisão de marcador e.g. atecnologia cre/lox permitem uma remoção específica de tecido, se apropriadoinduzível, do cassete de expressão do genoma do organismo hospedeiro(Sauer B (1998) Methods. 14(4):381-92). Neste método, seqüências deflanqueamento específicas (1 seqüências ox), que depois permitem remoçãopor meio de cre recombinase, são acopladas ao gene alvo.
Especificamente, a presente invenção se refere a cassetes deexpressão transgênicas compreendendo os seguintes íntrons com propriedadesintensificadoras de expressão gênica em plantas:
1) A seqüência do primeiro íntron (BPSI.l, SEQ ID NO: 1)isolada do gene tipo metalotioneína de Oryza sativa (No. de Acesso de GeneBank AP002540, DNA genômico de Oryza sativa (grupo de cultivarJaponica), Cromossomo 1, clone PAC: P0434B04, gene_id = "P0434B04.31,proteínaid ="BAB44010,1", seqüências complemento unidas:142304.. 142409, 143021..143098, 143683..143747; Hsieh, H.M. et al., RNAexpression patterns of a type 2 metallothioneine-like gene from rice. PlantMol. Biol. 32 (3), 525-529 (1996)). O gene compreende dois íntrons e trêséxons. O primeiro íntron do gene tipo metalotioneína de Oryza sativa(BPSI.l, SEQ ID NO:l) é flanqueado pelos sítios de emenda 5' (5'-GU-3\pares de bases (bp) 1-2 em SEQ ID NO:l) e 3' (5'-CAG-3',bp 582-584 emSEQ ID NO:l). Em uma forma de realização preferida da invenção, oprimeiro íntron do gene tipo metalotioneína de Oryza sativa (BPSI.l, SEQ IDNO:l) compreende pelo menos 28 pares de bases, mais preferivelmente pelomenos 40 pares de bases, mais preferivelmente pelo menos 50 pares de basesdas seqüências 5' e 3' adjacentes aos sítios de emenda 5' e 3' do íntron,respectivamente (SEQ ID NO: 82). Em nível de nucleotídeo, o gene tipometalotioneína de Oryza sativa compartilha alta homologia ou identidade coma região de codificação de genes ortólogos de outras plantasmonocotiledôneas ou dicotiledôneas e.g. 89% de identidade com a seqüênciade mRNA CL1155_3 de Zea mays (acc. No. AY109343), 88% de identidadecom o mRNA de proteína tipo metalotioneína tipo 2 de Poa secunda (acc. No.AF246982.1), 93% de identidade com a seqüência de codificação parcial demRNA de metalotioneína de Triticum aestivum, (acc. No.AF470355.1), 89%de identidade com o mRNA de proteína tipo metalotioneína de Nicotianaplumbaginifolia (acc. No. NPU35225), 86% de identidade com a proteína tipometalotioneína tipo 2 de Brassiea oleraeea cultivar Green King (acc. No.AF200712), 95% e 88% de identidade com o mRNA parcial de Hordeumvulgare subsp. vulgare parcial para genes mt2b (acc. No. HVU511346) emtb2a (acc. No. HVU511345) de metalotioneína tipo 2, respectivamente(identidades foram calculadas usando o algoritmo BLASTN 2.2.9 [1 de Maiode 2004] Altschul, Stephen F. et ai., (1997), Gapped BLAST and PSI-BLAST: a new generation of protein database search programs, NucleicAcids Res. 25:3389-3402).
2) A seqüência do primeiro íntron (BPSI.2, SEQ ID NO:2)isolada do gene Sacarose UDP Glucosiltransferase-2 de Oryza sativa (No. deAcesso de Gene Bank AC084380, DNA genômico Oryza sativa (grupo decultivar Japonica), cromossomo 3, BAC C)SJNBa0090P23, gene ID="OSJNBa0090P23.15",Proteína ID=AAK5219.1, união de complemento(nucleotídeo 62884 a. 65255, 65350..65594, 65693..66011, 66098..66322,66427..66593, 66677..6Ó793, 66881..67054, 67136..67231, 67316..67532,67652..67770, 67896..68088, 68209..68360, 68456..68585, 69314..69453 e70899..72082). O gene compreende 13 íntrons e 14 éxons. O primeiro íntrondo gene Sucrose UDP Glucosiltransferase-2 de Oryza sativa (BPSI.2, SEQ IDNO: 2) é flanqueado pelos sítios de emenda 5' (5'-GU-3', bp 1-2 in SEQ IDNO:2) e 3' (5'-CAG-3',bp 726-728 em SEQ ID NO: 2). Em uma forma derealização preferida da invenção, o primeiro íntron do gene Sucrose UDPGlucosiltransferase-2 de Oryza sativa (SEQ ID NO:2) compreende pelomenos 19 pares de bases da seqüência 5' para o sítio de emenda 5' e 23 paresde bases das seqüências/éxons 3' para o sítio de emenda 3' do íntron (SEQ IDNO: 83). Em uma forma de realização particularmente preferida o íntronBPSI.2 compreende pelo menos 40 pares de bases, mais preferivelmente pelomenos 50 pares de bases das seqüências 5' e 3' adjacentes aos sítios deemenda 5' e 3' do íntron, respectivamente
3) A seqüência do segundo íntron isolada do gene SucroseUDP Glucosiltransferase-2 de Oryza sativa (BPSI.3, SEQ ID NO:3). Ditosegundo íntron é flanqueado pelos sítios de emenda 5' (5'-GU-3', bp 1-2 inSEQ ID NO:3) e 3' (5'-CAG-3',bp 93-95 in SEQ ID NO: 3).
Em uma forma de realização preferida da invenção, o segundoíntron do gene Sucrose UDP Glucosiltransferase-2 de Oryza sativa (SEQ IDNO:3) compreende pelo menos 25 pares de bases da seqüência 5' para o sítiode emenda 5' e 30 pares de bases das seqüências 3' para o sítio de emenda 3'do íntron (SEQ ID NO: 84). Em uma forma de realização particularmentepreferida o íntron BPSI.3 compreende pelo menos 40 pares de bases, maispreferivelmente pelo menos 50 pares de bases das seqüências 5' e 3'adjacentes aos sítios de emenda 5' e 3' do íntron, respectivamente. Em nívelde nucleotídeo, o gene Sucrose UDP Glucosiltransferase-2 de Oryza sativacompartilha alta homologia ou identidade com a região de codificação degenes ortólogos de outras plantas monocotiledôneas ou dicotiledôneas e.g.88% de identidade com o mRNA de sucrose sintase (Susl) de Zea mays (acc.
No. L22296.1), 85% de identidade com o mRNA de Triticum aestivum parasucrose sintase tipo 2 (acc. No. AJOOO153), 85% de identidade com o mRNAde H. vulgare para sucrose sintase (acc No. X69931), 80% de identidade como mRNA de sucrose sintase-2 de Saeeharum offieinarum (acc No.AF263384.1), 95% de identidade com o mRNA de Arroz para seqüênciaparcial de sucrose sintase (gene S464) (acc. No. D10418), 79% de identidadecom o mRNA de sucrose sintase de Glyeine max (acc. No. AF03231).Identidades foram calculadas usando o algoritmo BLASTN 2.2.9 [1 de Maiode 2004] Altschul, Stephen F. et al., (1997), Gapped BLAST and PSI-BLAST: a new generation of protein database search programs, NucleicAcids Res. 25:3389-3402).
4) A seqüência do oitavo íntron (BPSI.5, SEQ ID NO:5)isolada do gene de Oryza sativa codificando para o transportador de Sucrose(No. de Acesso de Gene Bank AF 280050). Dito oitavo íntron (SEQ IDNO:5) é flanqueado pelos sítios de emenda 5' (5'-GU-3', bp 1-2 em SEQ IDNO:5) e 3' (5'-CAG-3',bp 223-225 em SEQ ID NO: 5). Em uma forma derealização preferida da invenção, o oitavo íntron do gene de Oryza sativacodificando para o transportador de Sucrose (SEQ ID NO:5) compreende pelomenos 35 pares de bases da seqüência 5' para o sítio de emenda 5' e 30 paresde bases das seqüências 3' para o sítio de emenda 3' do íntron (SEQ ED NO:86). Em uma forma de realização particularmente preferida o íntron BPSI.5compreende pelo menos 40 pares de bases, mais preferivelmente pelo menos50 pares de bases das seqüências 5' e 3' adjacentes aos sítios de emenda 5' e3' do íntron, respectivamente. Em uma forma de realização mais preferida, ossítios de emenda 5' e 3' do oitavo íntron (BPSI.5, SEQ ID NO:5) sãomodificados a fim de serem compatíveis com as seqüências consensosvegetais para sítios de emenda 5', 5 -AG: :GTAAGT-3' (SEQ ID NO: 80) esítios de emenda 3', 5'-CAG::GT-3' (SEQ ID NO: 81) usando umaabordagem de mutagênese por PCR (SEQ ID NO:87).
5) A seqüência do quarto íntron (BPSI.6, SEQ ID NO:6)isolada do gene de Oryza sativa (No. de Acesso de Gene Bank BAA94221)codificando para uma proteína desconhecida com homologia com a seqüênciade cromossomo II de A. thaliana de clones T22013, F12K2 codificando parauma lipase putativa (AC006233). Dito quarto íntron (SEQ ID NO:6) éflanqueado pelos sítios de emenda 5' (5'-GU-3\ bp 1-2 em SEQ ID NO:6) e3' (5'-CAG-3', bp 768-770 em SEQ ID NO:6). Em uma forma de realizaçãopreferida da invenção, o quarto íntron do gene de Oryza sativa (No. deAcesso BAA94221) (SEQ ID NO:6) compreende pelo menos 34 pares debases da seqüência 5' para o sítio de emenda 5' e 34 pares de bases dasseqüências 3' para o sítio de emenda 3' do íntron (SEQ ID NO: 88). Em umaforma de realização particularmente preferida o íntron BPSI.6 compreendepelo menos 40 pares de bases, mais preferivelmente pelo menos 50 pares debases das seqüências 5' e 3' adjacentes aos sítios de emenda 5' e 3' do íntron,respectivamente. Em uma forma de realização mais preferida, os sítios deemenda 5' e 3' de quarto íntron (BPSI.6, SEQ ID NO:6) são modificados afim de serem compatíveis com as seqüências consensos vegetais para sítios deemenda 5', 5 '-AG::GTAAGT-3' (SEQ ID NO: 80) e sítios de emenda 3', 5'-CAG::GT-3' (SEQ ID NO: 81) usando uma abordagem de mutagênese porPCR (SEQ ID NO:89).
6) A seqüência do quarto íntron (BPSI.7, SEQ ID NO:7)isolada do gene de Oryza sativa (No. de Acesso BAB90130) codificando parauma cinamil álcool desidrogenase putativa. Dito quarto íntron (SEQ ID NO:7)é flanqueado pelos sítios de emenda 5' (5'-GU-3\ bp 1-2 em SEQ ID NO:7) e3' (5-CAG-3', 713-715 bp em SEQ ID NO: 7). Em uma forma de realizaçãopreferida da invenção, o quarto íntron do gene de Oryza sativa (No. deAcesso BAB90130) (SEQ ID NO:7) compreende pelo menos 34 pares debases da seqüência 5' para o sítio de emenda 5' e 26 pares de bases dasseqüências 3' para o sítio de emenda 3' do íntron (SEQ ID NO: 90). Em umaforma de realização particularmente preferida o íntron BPSI.7 compreendepelo menos 40 pares de bases, mais preferivelmente pelo menos 50 pares debases das seqüências 5' e 3' adjacentes aos sítios de emenda 5' e 3' do íntron,respectivamente. Em uma forma de realização mais preferida, os sítios deemenda 5' e Ύ do quarto íntron (BPSI.7, SEQ ID NO:7) são modificados afim de serem compatíveis com as seqüências consensos vegetais para sítios deemenda 5', 5'-AG::GTAAGT-3' (SEQ ID NO: 80) e sítios de emenda 3', 5'-CAG::GT-3' (SEQ ID NO: 81) usando uma abordagem de mutagênese porPCR (SEQ ID NO:91).
7) A seqüência do terceiro íntron (BPSI.10, SEQ ID NO: 10)isolada do gene de Oryza sativa (No. de Acesso AP003300) codificando parauma proteína quinase putativa. Dito terceiro íntron (SEQ ID NO: 10) éflanqueado pelos sítios de emenda 5' (5'-GU-3', bp 1-2 em SEQ ID NO: 10) e3' (5'-CAG-3536-538 bp em SEQ ID NO: 10). Em uma forma derealização preferida da invenção, o terceiro íntron do gene de Oryza sativa(No. de Acesso AP003300) (SEQ ID NO: 10) compreende pelo menos 31pares de bases da seqüência 5' para o sítio de emenda 5' e 31 pares de basesdas seqüências 3' para o sítio de emenda 3' do íntron (SEQ ID NO: 94). Emuma forma de realização particularmente preferida o íntron BPSI.10compreende pelo menos 40 pares de bases, mais preferivelmente pelo menos50 pares de bases das seqüências 5' e 3' adjacentes aos sítios de emenda 5' e3' do íntron, respectivamente. Em uma forma de realização mais preferida, ossítios de emenda 5' e 3' do terceiro íntron (BPSI.10, SEQ ID NO: 10) sãomodificados a fim de serem compatíveis com as seqüências consensosvegetais para sítios de emenda 5', 5 -AG::GTAAGT-3' (SEQ ID NO: 80) esítios de emenda 3', 5'-CAG::GT-3' (SEQ ID NO: 81) usando umaabordagem de mutagênese por PCR (SEQ ID NO:95).
8) A seqüência do primeiro íntron (BPSI.ll, SEQ ID NO: 11)isolada do gene de Oryza sativa (No. de Acesso L37528) codificando parauma proteína MADS3 box. Dito primeiro íntron (SEQ ID NO: 11) éflanqueado pelos sítios de emenda 5' (5'-GU-3', bp 1-2 em SEQ ID NO:l 1) e3' (5'-CAG-3', bp 329-331 em SEQ ID NO: 11). Em uma forma derealização preferida da invenção, o primeiro íntron do gene de Oryza sativa(No. de Acesso L37528) (SEQ ID NO: 11) compreende pelo menos 35 paresde bases da seqüência 5' para o sítio de emenda 5' e 34 pares de bases dasseqüências 3' para o sítio de emenda 3' do íntron (SEQ ID NO: 96). Em umaforma de realização particularmente preferida o íntron BPSI. 11 compreendepelo menos 40 pares de bases, mais preferivelmente pelo menos 50 pares debases das seqüências 5' e 3' adjacentes aos sítios de emenda 5' e 3' do íntron,respectivamente. Em uma forma de realização mais preferida, os sítios deemenda 5' e 3' do primeiro íntron (BPSI.l 1, SEQ ID NO:l 1) são modificadosa fim de serem compatíveis com as seqüências consensos vegetais para sítiosde emenda 5', 5 -AG::GTAAGT-3' (SEQ ID NO: 80) e sítios de emenda 3',5'-CAG::GT-3' (SEQ ID NO: 81) usando uma abordagem de mutagênese porPCR (SEQ ID NO:97).
9) A seqüência do primeiro íntron (BPSI. 12, SEQ ID NO: 12)isolada do gene de Oryza sativa (No. de Acesso CB625805) codificando parauma Adenosilmetionina descarboxilase putativa. Dito primeiro íntron (SEQID NO: 12) é flanqueado pelos sítios de emenda 5' (5'-GU-3', bp 1-2 em SEQID NO: 12) e 3' (5-CAG-3', bp 959-961 em SEQ ID NO: 12). Em uma formade realização preferida da invenção, o primeiro íntron do gene de Oryzasativa (No. de Acesso CB625805) (SEQ ID NO: 12) compreende pelo menos26 pares de bases da seqüência 5' para o sítio de emenda 5' e 26 pares debases das seqüências 3' para o sítio de emenda 3' do íntron (SEQ ID NO: 98).Em uma forma de realização particularmente preferida o íntron BPSI.12compreende pelo menos 40 pares de bases, mais preferivelmente pelo menos50 pares de bases das seqüências 5' e 3' adjacentes aos sítios de emenda 5' e3' do íntron, respectivamente.
10) A seqüência do primeiro íntron (BPSI. 13, SEQ ID NO: 13)isolada do gene de Oryza sativa (No. de Acesso CF297669) codificando parauma Aspártico proteinase. Dito primeiro íntron (SEQ ID NO: 13) é flanqueadopelos sítios de emenda 5' (5'-GU-3\ bp 1-2 em SEQ ID NO:13) e 3' (5'-CAG-3bp 593-595 em SEQ ID NO: 13). Em uma forma de realizaçãopreferida da invenção, o primeiro íntron do gene de Oryza sativa (No. deAcesso CF297669) (SEQ ID NO: 13) compreende pelo menos 26 pares debases da seqüência 5' para o sítio de emenda 5' e 24 pares de bases dasseqüências 3' para o sítio de emenda 3' do íntron (SEQ ID NO: 99). Em umaforma de realização particularmente preferida o íntron BPSI. 13 compreendepelo menos 40 pares de bases, mais preferivelmente pelo menos 50 pares debases das seqüências 5' e 3' adjacentes aos sítios de emenda 5' e 3' do íntron,respectivamente.
11) A seqüência do primeiro íntron (BPSI. 14, SEQ ID NO: 14)isolada do gene de Oryza sativa (No. de Acesso CB674940) codificando parauma proteína Lecl4b. Dito primeiro íntron (SEQ ID NO: 14) é flanqueadopelos sítios de emenda 5' (5'-GU-3\ bp 1-2 in SEQ ID NO: 14) e 3' (5'-CAG-3', bp 143-145 in SEQ ID NO: 14). Em uma forma de realização preferida dainvenção, o primeiro íntron do gene de Oryza sativa (No. de AcessoCB674940) (SEQ ID NO: 14) compreende pelo menos 26 pares de bases daseqüência 5' para o sítio de emenda 5' e 25 pares de bases das seqüências 3'para o sítio de emenda 3' do íntron (SEQ ID NO: 100). Em uma forma derealização particularmente preferida o íntron BPSI. 14 compreende pelomenos 40 pares de bases, mais preferivelmente pelo menos 50 pares de basesdas seqüências 5' e 3' adjacentes aos sítios de emenda 5' e 3' do íntron,respectivamente.
12) A seqüência do primeiro íntron (BPSI.15, SEQ ID NO: 15)isolada do 5' UTR do gene de Oryza sativa (No. de Acesso BAD37295.1)codificando para um precursor putativo de proteína SalT. Dito primeiro íntron(SEQ ID NO: 15) é flanqueado pelos sítios de emenda 5' (5'-GU-3', bp 1-2em SEQ ID NO: 15) e 3' (5'-CAG-3', bp 312-314 em SEQ ID NO: 15). Emuma forma de realização preferida da invenção, o primeiro íntron do gene deOryza sativa (No. de AcessoBAD37295.1) (SEQ ID NO: 15) compreende pelomenos 26 pares de bases da seqüência 5' para o sítio de emenda 5' e 25 paresde bases das seqüências Ύ para o sítio de emenda 3' do íntron (SEQ ID NO:101). Em uma forma de realização particularmente preferida o íntron BPSI.15compreende pelo menos 40 pares de bases, mais preferivelmente pelo menos50 pares de bases das seqüências 5' e 3' adjacentes aos sítios de emenda 5' e3' do íntron, respectivamente.
13) A seqüência do primeiro íntron (BPSI. 16, SEQ ID NO: 16)isolada do gene de Oryza sativa (No. de Acesso BX928664) codificando paraum reticulon putativo. Dito primeiro íntron (SEQ ID NO: 16) é flanqueadopelos sítios de emenda 5' (5'-GU-3\ bp 1-2 em SEQ ID NO: 16) e 3' (5'-CAG-3', bp 650-652 em SEQ ID NO: 16). Em uma forma de realizaçãopreferida da invenção, o primeiro íntron do gene de Oryza sativa (No. deAcesso BX928664) (SEQ ID NO: 16) compreende pelo menos 26 pares debases da seqüência 5' para o sítio de emenda 5' e 23 pares de bases dasseqüências 3' para o sítio de emenda 3' do íntron (SEQ ID NO: 102). Em umaforma de realização particularmente preferida o íntron BPSI. 16 compreendepelo menos 40 pares de bases, mais preferivelmente pelo menos 50 pares debases das seqüências 5' e 3' adjacentes aos sítios de emenda 5' e 3' do íntron,respectivamente.
14) A seqüência do primeiro íntron (BPSI. 17, SEQ ID NO: 17)isolada do gene de Oryza sativa (No. de Acesso AA752970) codificando parauma glicolato oxidase. Dito primeiro íntron (SEQ ID NO: 17) é flanqueadopelos sítios de emenda 5' (5'-GU-3\ bp 1-2 em SEQ ID NO: 17) e 3' (5'-CAG-3bp 266-268 em SEQ ID NO: 17). Em uma forma de realizaçãopreferida da invenção, o primeiro íntron do gene de Oryza sativa (No. deAcesso AA752970) (SEQ ID NO: 17) compreende pelo menos 26 pares debases da seqüência 5' para o sítio de emenda 5' e 35 pares de bases dasseqüências Y para o sítio de emenda Y do íntron (SEQ ID NO: 103). Em umaforma de realização particularmente preferida o íntron BPSI.17 compreendepelo menos 40 pares de bases, mais preferivelmente pelo menos 50 pares debases das seqüências 5' e 3' adjacentes aos sítios de emenda 5' e 3' do íntron,respectivamente.
15) A seqüência do primeiro íntron (BPSI.18, SEQ ID NO: 18)isolada do clone GI 40253643 de Oryza sativa (No. de Acesso AK064428) ésimilar a AT4g33690. Dito primeiro íntron (SEQ ID NO: 18) é flanqueadopelos sítios de emenda 5' (5'-GU-3', bp 1-2 em SEQ ID NO: 18) e 3' (5'-CAG-3bp 544-546 em SEQ ID NO: 18). Em uma forma de realizaçãopreferida da invenção, o primeiro íntron do gene de Oryza sativa (No. deAcesso AK064428) (SEQ ID NO: 18) compreende pelo menos 26 pares debases da seqüência 5' para o sítio de emenda 5' e 21 pares de bases dasseqüências 3' para o sítio de emenda 3' do íntron (SEQ ID NO: 104). Em umaforma de realização particularmente preferida o íntron BPSI.18 compreendepelo menos 40 pares de bases, mais preferivelmente pelo menos 50 pares debases das seqüências 5' e 3' adjacentes aos sítios de emenda 5' e Y do íntron,respectivamente.
16) A seqüência do primeiro íntron (BPSI. 19, SEQ ID NO: 19)isolada do clone GI 51091887 de Oryza sativa (No. de Acesso AK062197)).Dito primeiro íntron (SEQ ID NO: 19) é flanqueado pelos sítios de emenda 5'(5'-GU-3\ bp 1-2 em SEQ ID NO: 19) e 3' (5'-CAG-3\ bp 810-812 em SEQID NO: 19). Em uma forma de realização preferida da invenção, o primeiroíntron do gene de Oryza sativa (No. de Acesso AK062197) (SEQ ID NO: 19)compreende pelo menos 26 pares de bases da seqüência 5' para o sítio deemenda 5' e 26 pares de bases das seqüências 3' para o sítio de emenda 3' doíntron (SEQ ID NO: 105). Em uma forma de realização particularmentepreferida o íntron BPSI.19 compreende pelo menos 40 pares de bases, maispreferivelmente pelo menos 50 pares de bases das seqüências 5' e 3'adjacentes aos sítios de emenda 5' e 3' do íntron, respectivamente.
17) A seqüência do primeiro íntron (BPSI.20, SEQ ID N0:20)isolada do gene de Oryza sativa (No. de Acesso CF279761) codificando paraum clone de proteína hipotética (GI 33657147). Dito primeiro íntron (SEQ IDN0:20) é flanqueado pelos sítios de emenda 5' (5'-GU-3', bp 1-2 em SEQ IDN0:20) e 3' (5'-CAG-3\ bp 369-371 em SEQ ID N0:20). Em uma forma derealização preferida da invenção, o primeiro íntron do gene de Oryza sativa(No. de Acesso CF279761) (SEQ ID N0:20) compreende pelo menos 26pares de bases da seqüência 5' para o sítio de emenda 5' e 27 pares de basesdas seqüências 3' para o sítio de emenda 3' do íntron (SEQ ID NO: 106). Emuma forma de realização particularmente preferida o íntron BPSI.20compreende pelo menos 40 pares de bases, mais preferivelmente pelo menos50 pares de bases das seqüências 5' e 3' adjacentes aos sítios de emenda 5' e3' do íntron, respectivamente.
18) A seqüência do primeiro íntron (BPSI.21, SEQ ID NO:21)isolada do gene de Oryza sativa (No. de Acesso CF326058) codificando paraum transportador de membrana putativo. Dito primeiro íntron (SEQ IDNO:21) é flanqueado pelos sítios de emenda 5' (5'-GU-3', bp 1-2 em SEQ IDNO:21) e 3' (5'-CAG-3\ bp 720-722 em SEQ ID NO:21). Em uma forma derealização preferida da invenção, o primeiro íntron do gene de Oryza sativa(No. de Acesso CF326058) (SEQ ID NO:21) compreende pelo menos 26pares de bases da seqüência 5' para o sítio de emenda 5' e 25 pares de basesdas seqüências 3' para o sítio de emenda 3' do íntron (SEQ ID NO: 107). Emuma forma de realização particularmente preferida o íntron BPSI.21compreende pelo menos 40 pares de bases, mais preferivelmente pelo menos50 pares de bases das seqüências 5' e 3' adjacentes aos sítios de emenda 5' e3' do íntron, respectivamente.
19) A seqüência do primeiro íntron (BPSI.22, SEQ ID NO:22)isolada do gene de Oryza sativa (No. de Acesso C26044) codificando parauma proteína putativa de repetição de domínio ACT. Dito primeiro íntron(SEQ ID NO:22) é flanqueado pelos sítios de emenda 5' (5'-GU-3', bp 1-2em SEQ ID NO:22) e 3' (5'-CAG-3', bp 386-388 em SEQ ID NO:22). Emuma forma de realização preferida da invenção, o primeiro íntron do gene deOryza sativa (No. de Acesso C26044) (SEQ ID NO:22) compreende pelomenos 26 pares de bases da seqüência 5' para o sítio de emenda 5' e 28 paresde bases das seqüências 3' para o sítio de emenda 3' do íntron (SEQ ID NO:108). Em uma forma de realização particularmente preferida o íntron BPSI.22compreende pelo menos 40 pares de bases, mais preferivelmente pelo menos50 pares de bases das seqüências 5' e 3' adjacentes aos sítios de emenda 5' e3' do íntron, respectivamente.
Tabela 1: Genes a partir dos quais os íntrons da invenção sãopreferivelmente isolados, função putativa de ditos genes, cDNA e a proteínacodificada por ditos genes.
<table>table see original document page 86</column></row><table><table>table see original document page 87</column></row><table>
É descrito pelos exemplos desta invenção, que os íntronsinventivos com as SEQ ID NOs: 1, 2, 3, 5, 6, 7, 10 e 11 têm um impacto nataxa de expressão do gene GUS em ensaios de expressão transitória e plantastransformadas estáveis, respectivamente. Pode ser mostrado que a inclusão deditos íntrons no 5' UTR do gene GUS levou a uma forte intensificação na taxade expressão deste gene em célula transformada transitoriamente eestavelmente, respectivamente, comparado com um construto controle quecarece do primeiro íntron (veja exemplos 1.6.1 (tabela 7), 1.6.2 (tabela 8), 2.4(tabela 15)).
As propriedades intensificadoras de expressão do íntrons comas SEQ ID NOs: 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 ou 22 podem serdemonstradas realizando os ensaios de expressão transitória ou estável.
Equivalentes funcionais dos íntrons inventivos podem seridentificados através de buscas de homologia em bancos de dados de ácidosnucléicos ou através de hibridização de DNA (triagem de bibliotecas de DNAgenômico) usando um fragmento de pelo menos 50 pares de basesconsecutivos da molécula de ácido nucléico descrita por qualquer das SEQ IDNOs: 1, 2, 3, 5, 6, 7, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 ou 22 econdições de hibridização estringentes. Em uma forma de realização preferidada presente invenção as condições de hibridização estringentes podem serescolhidas como segue:O tampão de hibridização contém Formamida, NaCl e PEG6000 (Polietilenoglicol MW 6000). Formamida tem um efeito desestabilizanteem moléculas de ácidos nucléicos de dupla fita, por causa disso, quando usadaem tampão de hibridização, permite a redução da temperatura de hibridizaçãopara 420C sem reduzir a estringência de hibridização. NaCl tem um impactopositivo na taxa de renaturação de um DNA duplex e a eficiência dehibridização de uma sonda de DNA com seu alvo de DNA complementar.
PEG aumenta a viscosidade do tampão de hibridização, o que tem emprincípio um impacto negativo na eficiência de hibridização. A composiçãodo tampão de hibridização é como segue:
<table>table see original document page 88</column></row><table>
A hibridização é preferivelmente realizada durante a noite a42°C. Na manhã, o filtro hibridizado será lavado 3 χ por 10 minutos com2xSSC + 0,1 % SDS. Hibridização deve vantajosamente ser realizada comfragmentos de pelo menos 50, 60, 70 ou 80 bp, preferivelmente pelo menos90 bp. Em uma forma de realização especialmente preferida, a hibridizaçãodeve ser realizada com a seqüência de ácidos nucléicos inteira com condiçõesdescritas acima.
Combinação dos íntrons da invenção com promotores vegetaisdiferentes foi claramente demonstrada suas propriedades de intensificaçãoe/ou modulação de expressão e/ou. Em uma forma de realização preferida dainvenção o construto de expressão de DNA recombinante compreende(funcionalmente ligado a um íntron da invenção) uma seqüência de promotorfuncionando em plantas ou células vegetais selecionada a partir do grupoconsistindo dea) o promotor de proteína 12 de cloroplasto de arroz(Os.CP12) como descrito por nucleotídeo 1 a 854 de SEQ ED NO: 113 (o"fragmento"), ou uma seqüência tendo pelo menos 60% (preferivelmente pelomenos 70% ou 80%, mais preferivelmente pelo menos 90% ou 95%, maispreferivelmente pelo menos 98% ou 99%) de identidade com dito fragmento,ou uma seqüência hibridizando em condições estringentes (preferivelmenteem condições equivalentes às condições de alta estringência definidas noparágrafo acima) com dito fragmento, ou uma seqüência compreendendo pelomenos 50 (preferivelmente pelo menos 100, mais preferivelmente pelo menos200 ou 300, mais preferivelmente pelo menos 400 ou 500) nucleotídeosconsecutivos de dito fragmento, e
b) o promotor de glicoproteína rica em hidroxiprolina de milho(Zm.HRGP) como descrito por nucleotídeo 1 a 1184 de SEQ ID NO: 114, ouuma seqüência tendo pelo menos 60% (preferivelmente pelo menos 70% ou80%, mais preferivelmente pelo menos 90% ou 95%, mais preferivelmentepelo menos 98% ou 99%) de identidade com dito fragmento, ou umaseqüência hibridizando em condições estringentes (preferivelmente emcondições equivalentes às condições de alta estringência definidas noparágrafo acima) com dito fragmento, ou uma seqüência compreendendo pelomenos 50 (preferivelmente pelo menos 100, mais preferivelmente pelo menos200 ou 300, mais preferivelmente pelo menos 400 ou 500) nucleotídeosconsecutivos de dito fragmento, e
c) o promotor de p-cafeoil-CoA 3-O-metiltransferase de arroz(Os.CCoAMTl) como descrito por nucleotídeo 1 a 1034 de SEQ ID NO: 115,ou uma seqüência tendo pelo menos 60% (preferivelmente pelo menos 70%ou 80%, mais preferivelmente pelo menos 90% ou 95%, mais preferivelmentepelo menos 98% ou 99%) de identidade com dito fragmento, ou umaseqüência hibridizando em condições estringentes (preferivelmente emcondições equivalentes às condições de alta estringência definidas noparágrafo acima) com dito fragmento, ou uma seqüência compreendendo pelomenos 50 (preferivelmente pelo menos 100, mais preferivelmente pelo menos200 ou 300, mais preferivelmente pelo menos 400 ou 500) nucleotídeosconsecutivos de dito fragmento, e
d) o promotor (W64A) de Globulina-I de milho (Zm.Glbl)como descrito por nucleotídeo 1 a 1440 de SEQ ID NO: 116, ou umaseqüência tendo pelo menos 60% (preferivelmente pelo menos 70% ou 80%,mais preferivelmente pelo menos 90% ou 95%, mais preferivelmente pelomenos 98% ou 99%) de identidade com dito fragmento, ou uma seqüênciahibridizando em condições estringentes (preferivelmente em condiçõesequivalentes às condições de alta estringência definidas no parágrafo acima)com dito fragmento, ou uma seqüência compreendendo pelo menos 50(preferivelmente pelo menos 100, mais preferivelmente pelo menos 200 ou300, mais preferivelmente pelo menos 400 ou 500) nucleotídeos consecutivosde dito fragmento, e
e) o promotor putativo de ATP sintase transportando H+ dearroz (Os.V-ATPase) como descrito por nucleotídeo 1 a 1589 de SEQ ID NO:117, ou uma seqüência tendo pelo menos 60% (preferivelmente pelo menos70% ou 80%, mais preferivelmente pelo menos 90% ou 95%, maispreferivelmente pelo menos 98% ou 99%) de identidade com dito fragmento,ou uma seqüência hibridizando em condições estringentes (preferivelmenteem condições equivalentes às condições de alta estringência definidas noparágrafo acima) com dito fragmento, ou uma seqüência compreendendo pelomenos 50 (preferivelmente pelo menos 100, mais preferivelmente pelo menos200 ou 300, mais preferivelmente pelo menos 400 ou 500) nucleotídeosconsecutivos de dito fragmento, e
f) o promotor putativo de C-8,7 esterol isomerase de arroz(Os.C8,7 SI) como descrito por nucleotídeo 1 a 796 de SEQ ID NO: 118, ouuma seqüência tendo pelo menos 60% (preferivelmente pelo menos 70% ou80%, mais preferivelmente pelo menos 90% ou 95%, mais preferivelmentepelo menos 98% ou 99%) de identidade com dito fragmento, ou umaseqüência hibridizando em condições estringentes (preferivelmente emcondições equivalentes às condições de alta estringência definidas noparágrafo acima) com dito fragmento, ou uma seqüência compreendendo pelomenos 50 (preferivelmente pelo menos 100, mais preferivelmente pelo menos200 ou 300, mais preferivelmente pelo menos 400 ou 500) nucleotídeosconsecutivos de dito fragmento, e
g) o promotor de lactato desidrogenase e milho (Zm.LDH)como descrito por nucleotídeo 1 a 1062 de SEQ ID NO: 119, ou umaseqüência tendo pelo menos 60% (preferivelmente pelo menos 70% ou 80%,mais preferivelmente pelo menos 90% ou 95%, mais preferivelmente pelomenos 98% ou 99%) de identidade com dito fragmento, ou uma seqüênciahibridizando em condições estringentes (preferivelmente em condiçõesequivalentes às condições de alta estringência definidas no parágrafo acima)com dito fragmento, ou uma seqüência compreendendo pelo menos 50(preferivelmente pelo menos 100, mais preferivelmente pelo menos 200 ou300, mais preferivelmente pelo menos 400 ou 500) nucleotídeos consecutivosde dito fragmento, e
h) o promotor de Abundantes em Embriogênese Tardia de arroz(Os.Lea) como descrito por nucleotídeo 1 a 1386 de SEQ ID NO: 121, ou umaseqüência tendo pelo menos 60% (preferivelmente pelo menos 70% ou 80%, maispreferivelmente pelo menos 90% ou 95%, mais preferivelmente pelo menos 98%ou 99%) de identidade com dito fragmento, ou uma seqüência hibridizando emcondições estringentes (preferivelmente em condições equivalentes às condições dealta estringência definidas no parágrafo acima) com dito fragmento, ou umaseqüência compreendendo pelo menos 50 (preferivelmente pelo menos 100, maispreferivelmente pelo menos 200 ou 300, mais preferivelmente pelo menos 400 ou500) nucleotídeos consecutivos de dito fragmento.Preferivelmente dito construto de expressão estácompreendendo uma combinação de um dos promotores acima definidos compelo menos um íntron selecionado a partir do grupo consistindo de
i) o íntron BPSI.l como descrito por nucleotídeo 888 a 1470de SEQ ID NO: 113 ou uma seqüência tendo pelo menos 60%(preferivelmente pelo menos 70% ou 80%, mais preferivelmente pelo menos90% ou 95%, mais preferivelmente pelo menos 98% ou 99%) de identidadecom dito fragmento, ou uma seqüência hibridizando em condiçõesestringentes (preferivelmente em condições equivalentes às condições de altaestringência definidas acima) com dito fragmento, ou uma seqüênciacompreendendo pelo menos 50 (preferivelmente pelo menos 100, maispreferivelmente pelo menos 200 ou 300, mais preferivelmente pelo menos400 ou 500) nucleotídeos consecutivos de dito fragmento e
ii) o íntron BPSI.5 como descrito por nucleotídeo 1068 a 1318de SEQ ID NO: 120, ou uma seqüência tendo pelo menos 60%(preferivelmente pelo menos 70% ou 80%, mais preferivelmente pelo menos90% ou 95%, mais preferivelmente pelo menos 98% ou 99%) de identidadecom dito fragmento, ou uma seqüência hibridizando em condiçõesestringentes (preferivelmente em condições equivalentes às condições de altaestringência definidas acima) com dito fragmento, ou uma seqüênciacompreendendo pelo menos 50 (preferivelmente pelo menos 100, maispreferivelmente pelo menos 200 ou 300, mais preferivelmente pelo menos400 ou 500) nucleotídeos consecutivos de dito fragmento.
Mais preferivelmente construto de expressão estácompreendendo uma combinação de promotor e íntron selecionada a partir dogrupo consistindo de
i) seqüências como descrito por qualquer de SEQ ID NO: 113,114, 115, 116, 117, 118, 119, 120, ou 121, e
ii) seqüências tendo pelo menos 50 (preferivelmente pelomenos 100, mais preferivelmente pelo menos 200 ou 300, maispreferivelmente pelo menos 400 ou 500) nucleotídeos consecutivos de umaseqüência descrita por qualquer de SEQ ID NOs: 113, 114, 115, 116, 117,118, 119, 120, ou 121, e
iii) seqüências tendo uma identidade de pelo menos 60%(preferivelmente pelo menos 70% ou 80%, mais preferivelmente pelo menos90% ou 95%, mais preferivelmente pelo menos 98% ou 99%) com umaseqüência descrita por qualquer de SEQ ID NOs: 113, 114, 115, 116, 117,118, 119, 120, ou 121, e
iv) seqüências hibridizando em condições estringentes(preferivelmente em condições equivalentes às condições de alta estringênciadefinidas acima) com seqüência descrita por qualquer de SEQ ID NOs: 113,114, 115, 116, 117, 118, 119, 120, ou 121.
Um assunto preferido da invenção, é um vetor,preferivelmente um vetor de transformação vegetal, contendo um construto deexpressão recombinante inventivo. O cassete de expressão pode serintroduzido no vetor através de um sítio de clivagem de restrição adequado. Oplasmídeo formado é primeiro introduzido em E.coli. E.coli corretamentetransformadas são selecionadas, crescidas, e o plasmídeo recombinante éobtido pelos métodos familiares para o trabalhador versado. Análise derestrição e seqüenciamento podem servir para verificar a etapa de clonagem.
Vetores preferidos são aqueles, que tornam possível integração estável docassete de expressão no genoma hospedeiro. Um construto de expressão deacordo com a invenção pode vantajosamente ser introduzido em células,preferivelmente em células vegetais, usando vetores. Em uma forma derealização, os métodos da invenção envolvem transformação de organismo oucélulas (e.g. plantas ou células vegetais) com um vetor de expressãotransgênico compreendendo pelo menos um cassete de expressão transgênicada invenção. Os métodos da invenção não são limitados aos vetores deexpressão descritos neste lugar. Qualquer vetor de expressão que é capaz deintroduzir uma seqüência de ácidos nucléicos de interesse em uma célulavegetal é contemplado como estando dentro do escopo desta invenção.Tipicamente, vetores de expressão compreendem o cassete de expressãotransgênico da invenção em combinação com elementos que permitemclonagem do vetor em um hospedeiro bacteriano ou fago. O vetorpreferivelmente, embora não necessariamente, contém uma origem dereplicação que é funcional em uma ampla variedade de hospedeirosprocarióticos. Um marcador selecionável é geralmente, mas nãonecessariamente, incluído para permitir seleção de células portando o vetordesejado. Preferidos são aqueles vetores que permitem uma integração estáveldo construto de expressão no genoma hospedeiro. No caso de injeção oueletroporação de DNA em células vegetais, o plasmídeo usado não necessitasatisfazer quaisquer requerimentos particulares. Plasmídeos simples tal comoaqueles da série pUC podem ser usados. Se plantas intactas estão para seremregeneradas a partir de células transformadas, é necessário para um genemarcador selecionável adicional estar presente no plasmídeo. Diversospossíveis plasmídeos vetores estão disponíveis para a introdução de genesexógenos em plantas, e estes plasmídeos vetores contêm, como uma regra,uma origem de replicação para multiplicação em E.coli e um gene marcadorpara a seleção de transformadas bactérias. Exemplos são pBR322, série pUC,série M13mp, pACYC184 e os semelhantes. O construto de expressão podeser introduzido no vetor através de um sítio de clivagem de restriçãoadequado. O plasmídeo formado é primeiro introduzido em E.coli. E.colicorretamente transformadas são selecionadas e crescidas, e o plasmídeorecombinante é obtido pelos métodos conhecidos pelo trabalhador versado.Análise de restrição e seqüenciamento podem ser usadas para verificar a etapade clonagem.
Dependendo do método pelo qual DNA é introduzido, genesadicionais podem ser necessários plasmídeo vetor.
Agrobacterium tumefaciens e A. rhizogenes são bactérias desolo patogênicas para plantas, que transformam geneticamente célulasvegetais. Os plasmídeos Ti e Ri de A. tumefaciens e A. rhizogenes,respectivamente, carregam genes responsáveis por transformação genética daplanta (Kado (1991) Crit Rev Plant Sci 10:1). Vetores da invenção podem serbaseados no plasmídeo Ti ou Ri de Agrobacterium e podem através dissoutilizar um sistema natural de transferência de DNA no genoma vegetal.
Como parte deste parasitismo altamente desenvolvido Agrobacteriumtransfere uma parte definida de sua informação genômica (o T-DNA;flanqueado por cerca de 25 repetições de bp, denominado borda esquerda edireita) no DNA cromossômico da célula vegetal (Zupan (2000) Plant J23(1): 11-28). Por ação combinada dos assim chamados genes vir (parte dosplasmídeos Ti originais) dita transferência de DNA é mediada. Para utilizaçãodeste sistema natural, foram desenvolvidos plasmídeos Ti que carecem dosgenes indutores de tumor originais ("vetores desarmados"). Em ummelhoramento adicional, os assim chamados "sistemas de vetor binário", o T-DNA foi fisicamente separado dos outros elementos funcionais do plasmídeoTi (e.g., os genes vir), sendo incorporado em um vetor de transferência, o quepermitiu manipulação mais fácil (Patente Européia-A 120 516; Patente Norte-Americana 4.940.838). Estes vetores binários compreendem (além do T-DNAdesarmado com suas seqüências de borda), seqüências procarióticas parareplicação tanto em Agrobacterium como E. eoli. Uma vantagem detransformação mediada por Agrobaeterium é que em geral apenas o DNAflanqueado pelas bordas é transferido no genoma e que preferencialmenteapenas uma cópia é inserida. Descrições de sistemas de vetor deAgrobaeterium e métodos para transferência gênica mediada porAgrobaeterium são conhecidos na arte (Miki 1993, "Procedures forIntroducing Foreign DNA into Plants" in METHODS IN PLANTMOLECULAR BIOLOGY AND BIOTECHNOLOGY; pp.67-88; Gruber1993, "Vectors for Plant Transformation," in METHODS IN PLANTMOLECULAR BIOLOGY AND BIOTECHNOLOGY; pp.89-119; Moloney(1989) Plant Cell Reports 8: 238-242). O uso de T-DNA para a transformaçãode células vegetais foi estudado e descrito intensivamente (Patente Européia120516; Hoekema 1985, In: The Binary Plant Vector System, OffsetdrukkerijKanters B.V., Alblasserdam, Chapter V; Fraley (1985) CRC Crit. Rev. Plant.Sei. 4:1-45; e An (1985) EMBO J. 4:277-287). Vários vetores binários sãoconhecidos, alguns dos quais são comercialmente disponíveis tal como, porexemplo, pBIN19 (Clontech Laboratories, Inc. U.S.A.). Por isso, paratransformação mediada por Agrobacterium o construto de expressãotransgênico da invenção é integrado em plasmídeos específicos, ou em umvetor de transferência ou intermediário, ou em um vetor binário. Se umplasmídeo Ti ou Ri está para ser usado para a transformação, pelo menos aborda direita, mas em mais cases a borda direita e esquerda, do T-DNA deplasmídeo Ti ou Ri é ligada ao construto de expressão transgênico para serintroduzido na forma de uma região de flanqueamento. Vetores binários sãopreferivelmente usados. Vetores binários são capazes de replicação tanto emE.eoli como em Agrobacterium. Eles podem compreender um gene marcadorde seleção e um ligante ou poliligante (para inserção de e.g. o construto deexpressão a ser transferido) flanqueado pela seqüência de borda direita eesquerda de T-DNA. Eles podem ser transferidos diretamente paraAgrobaeterium (Holsters (1978) Mol Gen Genet 163:181-187). O genemarcador de seleção permite a seleção de agrobactérias transformadas e é, porexemplo, o gene nptll, que confere resistência a canamicina. AAgrobaeterium que atua como organismo hospedeiro neste caso deve jáconter um plasmídeo com a região vir. Esta última é requerida para transferiro T-DNA para a célula vegetal. Uma Agrobaeterium transformada destamaneira pode ser usada para transformar células vegetais. O uso de T-DNApara transformar células vegetais foi estudado e descrito intensivamente(Patente Européia 120 516; Hoekema (1985) Nature 303:179-181; An (1985)EMBO J. 4:277-287; veja também abaixo). Vetores binários comuns sãobaseados em plasmídeos de "ampla variação de hospedeiro" tipo pRK252(Bevan (1984) Nucl Acid Res 12:8711-8720) ou pTJS75 (Watson (1985)EMBO J 4(2):277-284) derivado do plasmídeo RK2 tipo P. Mais destesvetores são derivados de pBIN19 (Bevan 1984, Nucl Acid Res 12:8711-8720). Vários vetores binários são conhecidos, alguns dos quais sãocomercialmente disponíveis tal como, por exemplo, pBI101.2 ou pBIN19(Clontech Laboratories, Inc. USA). Vetores adicionais foram melhorados emconsideração a tamanho e manipulação (e.g. pPZP; Hajdukiewicz (1994)Plant Mol Biol 25:989-994). Sistemas de vetor melhorados também sãodescritos em WO 02/00900. Em uma forma de realização preferida, linhagensde Agrobacterium para uso na prática da invenção incluem linhagens deoctopina, e.g., LBA4404 ou linhagens de agropina, e.g., EHAlOl ouEHAl05. Linhagens adequadas de A. tumefaciens para transferência de DNAsão por exemplo EHAlOlpEHAlOl (Hood (1986) J Bacteriol 168:1291-1301), EHA105[pEHA105] (Li (1992) Plant Mol Biol 20:1037-1048),LB A4404[p AL4404] (Hoekema (1983) Nature 303:179-181),C58Cl[pMP90] (Koncz (1986) Mol Gen Genet 204:383-396), eC58C1 [pGV2260] (Deblaere (1985) Nucl Acids Res 13:4777-4788). Outraslinhagens adequadas são Agrobacterium tumefaciens C58, uma linhagem denopalina. Outras linhagens adequadas são A. tumefaciens C58C1 (VanLarebeke (1974) Nature 252:169-170), A136 (Watson (1975) J. Bacteriol123:255-264) ou LBA4011 (Klapwijk (1980) J. Bacteriol. 141:128-136). Emuma forma de realização preferida, a linhagem de Agrobacterium usada paratransformar o tecido vegetal pré-cultivado com o composto fenólico vegetalcontém um Plasmídeo Ti tipo L,L-succinamopina, preferivelmentedesarmado, tal como pEHAlOl. Em outra forma de realização preferida, alinhagem de Agrobacterium usada para transformar o tecido vegetal pré-cultivado com o composto fenólico vegetal contém um Plasmídeo Ti tipooctopina, preferivelmente desarmado, tal como pAL4404. Geralmente,quando usando plasmídeos Ti tipo octopina ou plasmídeos auxiliares, épreferido que o gene virF seja deletado ou inativado (Jarchow (1991) Proc.Natl. Acad. Sei. USA 88:10426-10430). Em uma forma de realizaçãopreferida, a linhagem de Agrobaeterium usada para transformar o tecidovegetal pré-cultivado com o composto fenólico vegetal tal comoacetoseringona. O método da invenção também pode ser usado emcombinação com linhagens de Agrobaeterium particulares, para aumentaradicionalmente a eficiência de transformação, tal como linhagens deAgrobaeterium caracterizadas pelo fato de que expressão de gene vir e/ouindução deste é alterada devido à presença de genes virA ou virG mutantes ouquiméricos (<e.g. Hansen (1994) Proc. Natl. Acad. Sei. USA 91:7603-7607;Chen 1991 J. Bacteriol. 173:1139-1144; Scheeren-Groot (1994) J.Bacteriol 176:6418-6426). Um vetor binário ou qualquer outro vetor pode sermodificado por técnicas comuns de recombinação de DNA, multiplicado emE. eoli, e introduzido em Agrobaeterium por e.g., eletroporação ou outrastécnicas de transformação (Mozo (1991) Plant Mol. Biol. 16:917-918).Agrobaeterium é crescida e usada como descrito na arte. O vetorcompreendendo linhagem de Agrobaeterium pode, por exemplo, ser crescidopor 3 dias em meio YP (5 g/L de extrato de levedura, 10 g/L de peptona, 5g/L de cravo, 15 g/L de ágar, pH 6,8) suplementado com o antibióticoapropriado (e.g., 50 mg/L de espectinomicina). Bactérias são coletadas comuma alça do meio sólido e ressuspensas.
Um assunto adicional da invenção se refere a organismos nãohumanos transgênicos transformados com pelo menos um vetor contendo umconstruto de expressão transgênico da invenção. Em uma forma de realizaçãopreferida a invenção se refere a bactérias, fungos, leveduras, maispreferivelmente a plantas ou célula vegetal. Em uma forma de realizaçãopreferida da invenção, o organismo transgênico é uma plantamonocotiledônea. Em uma forma de realização ainda mais preferida, a plantamonocotiledônea é selecionada a partir do grupo consistindo dos gênerosHordeum, Avena, Secale, Triticum, Sorghum, Zea, Saccharum e Oryza, muitoespecialmente preferido são plantas selecionadas a partir do grupo consistindode Hordeum vulgare, Triticum aestivum, Triticum aestivum subsp.spelta,Triticale, Avena sativa, Secale cereale, Sorghum bicolor, Saccharumofficinarum, Zea mays e Oryza sativa transformadas com os vetoresinventivos ou contendo os construtos de expressão recombinante inventivos.Bactérias preferidas são bactérias do gênero Escherichia, Erwinia,Agrobacterium, Flavobacterium, Alcaligenes ou cianobactérias, por exemplodo gênero Synechocystis. Especialmente preferidos são microorganismos quesão capazes de infectar plantas e assim de transferir os construtos de acordocom a invenção. Microorganismos preferidos são aqueles do gêneroAgrobacterium e, em particular, a espécie Agrobacterium tumefaciens.Leveduras preferidas são Candida, Saccharomyces, Hansenula ou Piehia.Fungos preferidos são Aspergillus, Trichoderma, Ashbya, Neurospora,Fusarium, Beauveria ou outros fungos. Organismos vegetais são além disso,para os propósitos da invenção, outros organismos que são capazes deatividade fotossintética tal como, por exemplo, algas ou cianobactérias, etambém musgos. Algas preferidas são algas verdes tal como, por exemplo,algas do gênero Haematococcus, Phaedactylum tricornatum, Volvox ouDunaliella. Além disso a invenção se refere a culturas celulares, tecidos,órgãos (e.g., folhas, raízes e os semelhantes no caso de organismos vegetais),ou material de propagação derivado de organismos não humanos transgênicostipo bactérias, fungos, leveduras, plantas ou células vegetais transformadascom pelo menos um vetor contendo um construto de expressão transgênico dainvenção.Um assunto adicional da invenção se refere a um método parafornecer um cassete de expressão para expressão intensificado de um ácidonucléico em uma planta ou a célula vegetal, compreendendo a etapa de ligarfuncionalmente os íntrons inventivos a um cassete de expressão vegetal nãocompreendendo dito íntron. Em ainda outra forma de realização preferida, ainvenção se refere a um método para intensificar a expressão de umaseqüência de ácidos nucléicos em uma planta ou uma célula vegetal,compreendendo ligar funcionalmente os íntrons inventivos a dita seqüência deácidos nucléicos. Preferivelmente, o método para fornecer um cassete deexpressão para expressão intensificada de um ácido nucléico em uma plantaou uma célula vegetal e o método para intensificar a expressão de umaseqüência de ácidos nucléicos em uma planta ou uma célula vegetalcompreendem adicionalmente as etapas de
i) fornecer um cassete de expressão recombinante,caracterizado pelo fato de que a seqüência de ácidos nucléicos éfuncionalmente ligada com uma seqüência de promotor funcional em plantase com uma seqüência de íntron selecionada a partir do grupo consistindo deSEQ ID NOs: 1, 2, 3, 5, 6, 7, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 e 22,
ii) introduzir dita expressão recombinante em uma célulavegetal ou uma planta,
iii) identificar ou selecionar a célula vegetal transgênicacompreendendo dito construto de expressão transgênico. Em outra forma derealização preferida, o método descrito acima compreende adicionalmente asetapas de
iv) regenerar tecido vegetal transgênico a partir da célulavegetal transgênica. Em uma forma de realização preferida alternativa, ométodo compreende adicionalmente
v) regenerar uma planta transgênica a partir da célula vegetaltransgênica.
A geração de um organismo transformado ou uma célulatransformada requer introduzir o DNA em questão na célula hospedeira emquestão. Uma multiplicidade de métodos está disponível para esteprocedimento, que é denominado transformação (veja também Keown (1990)Methods in Enzymology 185:527-537). Por exemplo, o DNA pode serintroduzido diretamente por microinjeção ou por bombardeamento através demicropartículas revestidas de DNA. Também, a célula pode serpermeabilizada quimicamente, por exemplo usando polietileno glicol, deforma que o DNA pode entrar na célula por difusão. O DNA também pode serintroduzido por fusão de protoplasto com outras unidades contendo DNA talcomo minicélulas, células, lisossomos ou lipossomos. Outro métodoadequado de introduzir DNA é eletroporação, onde as células sãopermeabilizadas reversivelmente por um pulso elétrico. Métodos paraintrodução de um construto de expressão transgênico ou vetor em tecidovegetal podem incluir mas não são limitados a, e.g., eletroinjeção (Nan (1995)In "Biotechnology in Agriculture and Forestry," Ed. Υ. P. S. Bajaj, Springer-Verlag Berlin Heidelberg 34:145-155; Griesbach (1992) Hort Science27:620); fusões com lipossomos, lisossomos, células, minicélulas ou outroscorpos revestidos com lipídio fundível (Fraley (1982) Proc. Natl. Acad. Sei.USA 79:1859-1863); polietileno glicol (Krens (1982) Nature 296:72-74);químicos que aumentam absorção de DNA livre; transformação usando vírus,e os semelhantes. Além disso, o método de biolística com a pistola de gene,eletroporação, incubação de embriões secos em solução contendo DNA, emicroinjeção podem ser empregados. Métodos baseados em protoplastopodem ser empregados (e.g., para arroz), onde DNA é liberado para osprotoplastos através de lipossomos, PEG, ou eletroporação (Shimamoto(1989) Nature 338:274-276; Datta (1990) Bio/Technology 8:736-740).Transformação por eletroporação envolve a aplicação de campos elétricoscurtos de alta tensão para criar "poros" na membrana celular através dos quaisDNA é absorvido. Estes métodos são - por exemplo - usados para produzirplantas monocotiledôneas estavelmente transformadas (Paszkowski (1984)EMBO J 3:2717-2722; Shillito (1985) Bio/Technology, 3:1099-1103; Fromm(1986) Nature 319:791-793) especialmente de arroz (Shimamoto (1989)Nature 338:274-276; Datta (1990) Bio/Technology 8:736-740; Hayakawa(1992) Proc Natl Acad Sci USA 89:9865-9869). Bombardeamento departícula ou "biolística" é um método amplamente usado para a transformaçãode plantas, especialmente plantas monocotiledôneas. No método de"biolística" (entrega de DNA mediada por microprojétil) partículas demicroprojéteis são revestidas com DNA e aceleradas por um dispositivomecânico para uma velocidade alta o suficiente para penetrar a parede celulare núcleo vegetal (WO 91/02071). O DNA exógeno fica incorporado no DNAhospedeiro e resulta em uma célula transformada. Existem muitas variaçõesno método de "biolística" (Sanford (1990) Physiologia Plantarium 79:206-209; Fromm (1990) Bio/Technology 8:833-839; Christou (1988) PlantPhysiol 87:671-674; Sautter (1991) Bio/Technology 9:1080-1085). O métodofoi usado para produzir plantas monocotiledôneas estavelmente transformadasincluindo arroz, milho, trigo, cevada, e aveia (Christou (1991)Bio/Technology 9:957-962; Gordon-Kamm (1990) Plant Cell 2:603-618;Vasil (1992) Bio/Technology 10:667-674, (1993) Bio/Technology 11:1153-1158; Wan (1994) Plant Physiol. 104:3748; Somers (1992) Bio/Technology10:1589-1594). Em adição a estas técnicas de transformação "direta",transformação também pode ser efetuada por infecção bacteriana por meio deAgrobacterium tumefaeiens ou Agrobacterium rhizogenes. Estas linhagenscontêm um plasmídeo (plasmídeo Ti ou Ri) que é transferindo para a plantaseguindo infecção por Agrobacterium. Parte deste plasmídeo, denominada T-DNA (DNA transferido), é integrada no genoma da célula vegetal (veja acimapara descrição de vetores). Para transferir o DNA para a célula vegetal,explantes vegetais são co-cultivados com uma Agrobacterium tumefaciens ouAgrobacterium rhizogenes transgênica. Partindo de material vegetal infectado(por exemplo seções de folha, raiz ou caule, mas também protoplastos oususpensões de células vegetais), plantas intactas podem ser geradas usandoum meio adequado que pode conter, por exemplo, antibióticos ou biocidaspara selecionar células transformadas. As plantas obtidas podem então sertríadas para a presença do DNA introduzido, neste caso o construto deexpressão de acordo com a invenção. Assim que o DNA tenha sido integradono genoma hospedeiro, o genótipo em questão, como uma regra, é estável e ainserção em questão também é encontrada nas gerações subseqüentes. Asplantas obtidas podem ser cultivadas e hibridizadas da maneira habitual. Duasou mais gerações devem ser crescidas a fim de assegurar que a integraçãogenômica é estável e hereditária. Os métodos acima mencionados sãodescritos (por exemplo, em Jenes (1983) Techniques for Gene Transfer, in:Transgenic Plants, Vol. 1, Engineering and Utilization, editado por Kung &Wu5 Academic Press 128-143; e em Potrykus (1991) Ann Rev Plant PhysiolPlant Mol Biol 42:205-225). Alguém versado na técnica sabe que a eficiênciade transformação por Agrobacterium pode ser intensificada usando diversosmétodos conhecidos na arte. Por exemplo, a inclusão de uma molécula naturalde resposta a ferimento tal como acetoseringona (AS) para a cultura deAgrobaeterium foi mostrada intensificar eficiência de transformação comAgrobaeterium tumefaciens (Shahla (1987) Plant Mol. Biol. 8:291-298).
Alternativamente, eficiência de transformação pode ser intensificada ferindo otecido alvo a ser transformado. Ferimento de tecido vegetal pode ser atingido,por exemplo, por perfuração, maceração, bombardeamento commicroprojéteis, etc. (veja, e.g., Bidney (1992) Plant Molec. Biol. 18:301-313).Diversos outros métodos foram relatados para a transformação de plantas(especialmente plantas monocotiledôneas) incluindo, por exemplo, o "métodode tubo de pólen" (WO 93/18168; Luo (1988) Plant Mol. Biol. Rep. 6:165-174), macro-injeção de DNA em botões florais (Du (1989) Genet ManipPlants 5:8-12), injeção de Agrobacterium em cariopses em desenvolvimento(WO 00/63398), e incubação de tecido de sementes em soluções de DNA(Tõpfer (1989) Plant Cell 1:133-139). Injeção direta de DNA exógeno noóvulo vegetal fertilizado no começo de embriogênese foi descrita em WO94/00583. WO 97/48814 descreve um processo para produzir trigo fértilestavelmente transformado e um sistema de transformar trigo através deAgrobaeterium baseado em embriões imaturos recentemente isolados ou pré-cultivados, calo embriogênico e células em suspensão.
Como uma regra, o construto de expressão integrado contémum marcador de seleção, que concede uma resistência a um biocida (porexemplo um herbicida) ou um antibiótico tal como canamicina, G 418,bleomicina, higromicina ou fosfinotricina e os semelhantes para a plantatransformada. O marcador de seleção permite a seleção de célulastransformadas a partir de células não transformadas (McCormick (1986) PlantCell Reports 5:81-84). As plantas obtidas podem ser cultivadas e hibridizadasda maneira habitual. Duas ou mais gerações devem ser crescidas a fim deassegurar que a integração genômica é estável e hereditária. Os métodosacima mencionados são descritos (por exemplo, em Jenes 1983; e emPotrykus 1991). Assim que uma célula vegetal transformada tenha sidogerada, uma planta intacta pode ser obtida usando métodos conhecidos pelotrabalhador versado. Por conseguinte, a presente invenção fornece plantastransgênicas. As plantas transgênicas da invenção não são limitadas a plantasnas quais cada e toda célula expressam a seqüência de ácidos nucléicos deinteresse sob o controle das seqüências de promotor fornecidas neste lugar.Incluída dentro do escopo desta invenção está qualquer planta que contémpelo menos uma célula que expresse a seqüência de ácidos nucléicos deinteresse (e.g., plantas quiméricas). E preferido, embora não necessário, que aplanta transgênica compreenda a seqüência de ácidos nucléicos de interesseem mais do que uma célula, e mais preferivelmente em um ou mais tecidos.
Uma vez que tecido vegetal transgênico, que contém um vetor de expressão,tenha sido obtido, plantas transgênicas podem ser regeneradas a partir destetecido vegetal transgênico usando métodos conhecidos na arte. Espécies dosseguintes exemplos de gêneros de plantas podem ser regeneradas a partir deprotoplastos transformados: Fragaria, Lotus, Medicago, Onobrychis,Trifolium1 Trigonella, Vigna, Citrus, Linum, Geranium, Manihot, Daucus,Arabidopsis, Brassica, Raphanus, Sinapis, Atropa, Capsicum, Hyoscyamus,Lycopersicon, Nicotiana, Solanum, Petunia, Digitalis, Majorana, Ciohorium,Helianthus, Laetuea, Bromus, Asparagus, Antirrhinum, Hererocallis,Nemesia, Pelargonium, Panicum, Pennisetum, Ranuneulus, Seneeio,Salpiglossis, Cueumis, Browaalia, Glyeine, Pisum, Lolium, Zea, Tritieum,Sorghum, e Datura. Para regeneração de plantas transgênicas a partir deprotoplastos transformados, uma suspensão de protoplastos transformados ouuma placa de Petri contendo explantes transformados é fornecida em primeirolugar. Tecido de calo é formado e brotos podem ser induzidos a partir de caloe subseqüentemente enraizados. Alternativamente, formação de embriãosomático pode ser induzida no tecido de calo. Estes embriões somáticosgerminam como embriões naturais para formar plantas. Os meios de culturairão geralmente conter vários aminoácidos e hormônios vegetais, tal comoauxina e citocininas. Também é vantajoso adicionar ácido glutâmico e prolinaao meio, especialmente para tais espécies como milho e alfafa. Regeneraçãoeficiente irá depender do meio, do genótipo, e da história da cultura. Estas trêsvariáveis podem ser empiricamente controladas para resultar em regeneraçãoreprodutível. Plantas também podem ser regeneradas a partir de célulascultivadas ou tecidos. Plantas dicotiledôneas que mostraram ser capaz deregeneração a partir de células individuais transformadas para obter plantastransgênicas inteiras incluem, por exemplo, maça (Malus pumila), amora(.Rubus), híbrido de amora/framboesa (Rubus), framboesa vermelha (Rubus),cenoura (Daucus carota), couve-flor {Brassica oleracea), aipo {Apiumgraveolens), pepino (Cucumis sativus), berinjela {Solanum melongena), alface(Lactuca sativa), batata {Solanum tuberosum), canola {Brassica napus), sojaselvagem {Glicina canescens), soja {Glyeine max), morango {Fragariaananassa), tomate {Lyeopersieon eseulentum), noz {Juglans regia), melão{Cueumis melo), uva (Vitis vinifera), e manga {Mangifera indica). Plantasmonocotiledôneas que foram mostradas capaz de regeneração a partir decélulas individuais transformadas para obter plantas transgênicas inteirasincluem, por exemplo, arroz {Oryza sativa), centeio {Secale cereale), e milho{Zeamays).
Em adição, regeneração de plantas inteiras a partir de células(não necessariamente transformadas) também foi observada em: damasco{Prunus armeniaca), aspargos {Asparagus officinalis), banana {Musa híbrida),feijão {Phaseolus vulgaris), cereja {Prunus híbrida), uva (Vitis vinifera),manga {Mangifera indica), melão {Cueumis melo), quiabo {Abelmoschusesculentus), cebola {Allium híbrida), laranja {Citrus sinensis), mamão{Carrica papaya), pêssego {Prunus pérsica), ameixa {Prunus domestica),pera {Pyrus communis), abacaxi {Ananas comosus), melancia {Citrullusvulgaris), e trigo {Triticum aestivum). As plantas regeneradas são transferidaspara condições de solo padrão e cultivadas de uma maneira convencional.Depois que o vetor de expressão é estavelmente incorporado em plantastransgênicas regeneradas, ele pode ser transferido para outras plantas porpropagação vegetativa ou por cruzamento sexual. Por exemplo, em cultivosvegetativamente propagados, as plantas maduras transgênicas são propagadaspela retirada de estacas ou por técnicas de cultura de tecido para produzirmúltiplas plantas idênticas. Em cultivos propagados de semente, as plantasmaduras transgênicas são auto fecundadas para produzir uma plantaautofecundada homozigota que é capaz de passar o transgene para suaprogenia por herança Mendeliana. A planta autofecundada produz sementecontendo a seqüência de ácidos nucléicos de interesse. Estas sementes podemser crescidas para produzir plantas que podem produzir o fenótiposelecionado. As plantas autofecundadas também podem ser usadas paradesenvolver novos híbridos cruzando a planta autofecundada com outra plantaautofecundada para produzir um híbrido.
Confirmação da natureza transgênica das células, tecidos, eplantas pode ser realizada por análise de PCR, resistência a antibiótico ouherbicida, análise enzimática e/ou Southern blots para verificartransformação. Progenia das plantas regeneradas pode ser obtida e analisadapara verificar se os transgenes são herdáveis. Herdabilidade do transgene éconfirmação adicional da transformação estável do transgene na planta. Asplantas resultantes podem ser fecundadas da maneira habitual. Duas ou maisgerações devem ser crescidas a fim de assegurar que a integração genômica éestável e hereditária. Métodos correspondentes são descritos, (Jenes 1993;Potrykus 1991).
Também em conformidade com a invenção são células,culturas celulares, tecidos, partes, órgãos - tal como, por exemplo, raízes,folhas e os semelhantes no caso de organismos vegetais transgênicos -derivado dos organismos transgênicos descritos acima, e material depropagação transgênico tal como sementes ou frutos.
Preferivelmente, o método para intensificar a expressão deuma seqüência de ácidos nucléicos em uma planta ou uma célula vegetalcompreende adicionalmente,
ligar os íntrons com propriedades intensificadoras deexpressão ao cassete de expressão por inserção através de recombinaçãohomóloga compreendendo as seguintes etapas:
a) fornecer in vivo ou in vitro um construto de DNAcompreendendo ditos íntrons flanqueados por seqüências permitindo recombinaçãohomóloga em um cassete de expressão pré-existente entre o promotor e o ácidonucléico de dito cassete de expressão,
b) transformar uma célula vegetal receptora compreendendo ditocassete,
regenerar uma planta transgênica onde dito íntron foi inserido noDNA genômico de dito construto de ácido nucléico de promotor através derecombinação homóloga.
Duas diferentes maneiras para a integração de moléculas deDNA em genomas são possíveis: Ou regiões de identidade de seqüência entreos parceiros são usadas (recombinação homóloga (HR), "alvejamentogenético") ou nenhum requerimento seqüência específico teve que sersatisfeito (recombinação ilegítima também referida como união deextremidade não homóloga (NHEJ)). Direcionamento de gene (GT) é ageração de mutações específicas em um genoma por integração mediada porrecombinação homóloga de seqüências de DNA exógeno. Em contraste aprocessos de recombinação natural, um dos parceiros de recombinação éartificial e introduzido por transformação em direcionamento de gene. Aintegração de DNA transformado segue vias de recombinação pré-existentes.
Recombinação homóloga é uma reação entre qualquer par de seqüências deDNA tendo uma seqüência de nucleotídeos similar, onde as duas seqüênciasinteragem (recombinam) para formar uma nova espécie de DNArecombinante. A freqüência de recombinação homóloga aumenta à medidaque o comprimento das seqüências de DNA de nucleotídeos compartilhadosaumenta, e é maior com moléculas linearizadas de plasmídeo do que commoléculas circularizadas de plasmídeo. Recombinação homóloga podeocorrer entre duas seqüências de DNA que são menos do que idênticas, mas afreqüência de recombinação declina à medida que a divergência entre as duasseqüências aumenta. Seqüências de DNA introduzido podem ser direcionadasatravés de recombinação homóloga ligando uma molécula de DNA deinteresse a seqüências compartilhando homologia com seqüências endógenasda célula hospedeira. Uma vez que o DNA entra na célula, as duas seqüênciashomólogas podem interagir para inserir o DNA introduzido no sítio onde asseqüências de DNA genômico homólogas foram localizadas. Portanto, aescolha de seqüências homólogas contidas no DNA introduzido irádeterminar o sítio onde o DNA introduzido é integrado através derecombinação homóloga. Por exemplo, se a seqüência de DNA de interesse éligada a seqüências de DNA compartilhando homologia com um gene decópia única de uma célula vegetal hospedeira, a seqüência de DNA deinteresse será inserida através de recombinação homóloga em apenas aqueleúnico sítio específico. Entretanto, se a seqüência de DNA de interesse é ligadaa seqüências de DNA compartilhando homologia com um gene de múltiplascópias da célula eucariótica hospedeira, então a seqüência de DNA deinteresse pode ser inserida através de recombinação homóloga em cada umdos sítios específicos onde uma cópia do gene está localizada. Por exemplo,se alguém deseja inserir um gene exógeno no sítio genômico onde um geneselecionado está localizado, o DNA introduzido deve conter seqüênciashomólogas ao gene selecionado. Um evento de recombinação dupla pode seratingido flanqueando cada extremidade da seqüência de DNA de interesse (aseqüência pretendida para ser inserida no genoma) com seqüências de DNAhomólogas ao gene selecionado. Um evento de recombinação homólogaenvolvendo cada uma das regiões de flanqueamento homólogas irá resultar nainserção do DNA exógeno. Assim apenas aquelas seqüências de DNAlocalizadas entre as duas regiões compartilhando homologia genômica setornam integradas no genoma.
No caso de direcionamento de gene através de recombinaçãohomóloga, o íntron inventivo que tem que ser introduzido no cromossomo,preferivelmente no 5'UTR de um gene (um cassete de expressão pre-existente), é (por exemplo) localizado em um construto de DNA e é 5' e 3'flanqueado por seqüências de ácidos nucléicos de homologia suficiente com oDNA alvo (um tal construto é chamado de "substrato de direcionamento degene") nas quais o íntron deve ser integrado. Tais regiões de flanqueamentodevem ser suficientes em comprimento para tornar recombinação possível.Elas são, como uma regra, na variação de diversas centenas de bases adiversos quilo bases de comprimento (Thomas KR and Capecchi MR (1987)Cell 51:503; Strepp et ai (1998) Proc Natl Acad Sci USA 95(8):4368-4373).
Em uma forma de realização preferida da invenção, o substrato dedirecionamento de gene compreende um marcador de seleção que é co-integrado com o íntron na região genômica de interesse, permitindo a seleçãode eventos de recombinação. Preferivelmente, o substrato de direcionamentode gene é integrado através de um evento de dupla recombinação entre paresde seqüências homólogas de DNA de comprimento e homologia suficienteresultando na inserção da seqüência de íntron (e se desejado seqüências deácidos nucléicos adicionais e.g. marcador de seleção). Usando recombinaçãohomóloga, um íntron da invenção pode ser colocado na região 5' nãocodificante do gene alvo (e.g., um gene vegetal endógeno) para sertransgenicamente expresso, ligando dito íntron a seqüências de DNA que sãohomólogas a, por exemplo, seqüências endógenas antes e/ou depois do quadrode leitura do gene alvo. Depois de uma célula ter sido transformada com oconstruto de DNA em questão, as seqüências homólogas podem interagir eassim colocar o íntron da invenção no sítio desejado de forma que a seqüênciade íntron da invenção se torna operavelmente ligada ao gene alvo e constituium construto de expressão da invenção. Para recombinação homóloga oudirecionamento de gene, o organismo hospedeiro - por exemplo uma planta -é transformado com o construto de recombinação usando os métodosdescritos neste lugar, e clones, que passaram por recombinação bem sucedida,são selecionados, por exemplo usando uma resistência a antibióticos ouherbicidas. Se desejável direcionar a seqüência de ácidos nucléicos deinteresse para um locus particular no genoma vegetal, integração sítio-dirigidada seqüência de ácidos nucléicos de interesse no genoma de célula vegetalpode ser atingida por, por exemplo, recombinação homóloga usandoseqüências derivadas de Agrobacterium. Geralmente, células vegetais sãoincubadas com uma linhagem de Agrobacterium que contém um vetordirecionador no qual seqüências que são homólogas a uma seqüência de DNAdentro do locus alvo são flanqueadas por seqüências de DNA transferido (T-DNA) de Agrobacterium, como previamente descrito (Patente Norte-Americana 5.501.967, o conteúdo total da qual são neste lugar incorporadaspor referência).
Alguém versado na técnica sabe que recombinação homólogapode ser atingida usando vetores direcionadores que contêm seqüências quesão homólogas a qualquer parte do gene vegetal objetivado, quer pertencendoaos elementos reguladores do gene, ou às regiões de codificação do gene.Recombinação homóloga pode ser atingida em qualquer região de um genevegetal contanto que a seqüência de ácidos nucléicos de regiões flanqueandoo sítio a ser alvejado seja conhecida. Direcionamento de gene é um eventorelativamente raro em eucariotos superiores, especialmente em plantas.Integrações aleatórias no genoma hospedeiro predominam. Uma possibilidadepara eliminar as seqüências aleatoriamente integradas e assim aumentar onúmero de clones celulares com uma recombinação homóloga correta é o usode um sistema de recombinação específico de seqüência como descrito emPatente Norte-Americana 6.110.736, pelo o que seqüências inespecificamenteintegradas podem ser deletadas de novo, o que simplifica a seleção de eventosque integraram com sucesso através de recombinação homóloga.
Uma variante eficiente de direcionamento de gene foi relatadapara Drosophila melanogaster (Rong and Golic 2000 Science. 2000 Jun16;288(5473):2013-8). Neste método o construto para direcionamento éintegrado no genoma hospedeiro flanqueado por dois sítios dereconhecimentos de uma recombinase sítio específica e inclui um sítio parauma endonuclease de restrição de corte raro. Por expressão induzida darecombinase sítio específica um círculo de DNA é excisado do genoma. Estecírculo é então linearizado depois da enzima de restrição (neste caso l-Scel)ter sido expressa resultando em uma molécula de DNA "ativada" com ambasextremidades homólogas à seqüência alvo. Na linhagem germinativa de fêmeade Drosophila, direcionamento de gene ocorreu em cerca de uma de 500células. Seleção de eventos de direcionamento de gene a partir de eventos derecombinação ilegítima pode ser facilitada por certas combinações de técnicasde seleção positiva e negativa (WO 99/20780).
Contra seleção é uma abordagem poderosa em sistemas demamíferos e plantas para enriquecer para eventos de direcionamento de gene.Em plantas o gene bacteriano codA como um marcador de seleção negativaautônoma de célula pode ser usado para seleção em cultura de tecido(Schlaman and Hooykaas Plant J 11:1377-1385, 1997; Thykjaer et al, PlantMol Biol. 1997 Nov;35(4):523-30.). Seleção negativa em plantas permitiuuma supressão de mais do que mil vezes de integração aleatória (Risseeuw etal., Plant J. 1997 Apr;ll(4):717-28.; Gallego et al., Plant Mol Biol. 1999Jan;39(l):83-93; Terada et al., Nat Biotechnol. 2002 Oct;20(10):1030-4. Epub2002 Sep 09.). Abordagens exploratórias para aumentar direcionamento degene em plantas compreendem expressão de proteínas tipo RecA (WO97/08331) ou homólogos de RecA derivados de outras espécies tipo e.g.,Rad52 (WO 01/68882) ou proteínas de fusão RecA/VirE2 (WO 01/38504).Uso de inibidores de poli(ADPribose)polimerase demonstrou uma Haumentada em plantas (Puchta H et al. (1995) Plant J 7:203-210). Iniciação dequebras de dupla fita de DNA inespecífico para seqüência também foiencontrada aumentando eficiência de H em plantas (Puchta H et al. (1995)Plant J 7(2),203-210; Lebel EG et al. (1993) Proc Natl Acad Sci USA90(2):422-426). Entretanto, indução inespecífica para seqüência de quebras defita de DNA é desvantajosa por causa do efeito mutagênico potencial. Induçãoespecífica para seqüência de quebras de fita DNA também pode aumentareficiência de H mas é limitada a cenários artificiais (Siebert R and Puchta H(2002) PlantCell 14(5): 1121-1131>.
É especificamente contemplado pelos inventores que poderiamempregar técnicas para a integração sítio específica ou excisão de construtosde transformação preparados em conformidade com a presente invenção. Umavantagem de integração ou excisão sítio específica é que elas podem serusadas para superar problemas associados com técnicas de transformaçãoconvencionais, nas quais construtos de transformação tipicamente integramaleatoriamente em um genoma hospedeiro em cópias múltiplas. Esta inserçãoaleatória de DNA introduzido no genoma de células hospedeiras pode ser letalse o DNA exógeno se insere em um gene essencial. Em adição, a expressãode um transgene pode ser influenciada por "efeitos de posição" causados peloDNA genômico circundante. Ademais, por causa de dificuldades associadascom plantas possuindo múltiplas cópias de transgene, incluindo silenciamentode gene, recombinação e herança imprevisível, é tipicamente desejávelcontrolar o número de cópias do DNA inserido, freqüentemente desejandoapenas a inserção de uma única cópia da seqüência de DNA. Integração sítioespecífica ou excisão de transgenes ou partes de transgenes pode ser atingidaem plantas por meio de recombinação homóloga (veja, por exemplo, PatenteNorte-Americana 5.527.695). Os construtos de DNA utilizados dentro dométodo desta invenção podem compreender seqüências de ácidos nucléicosadicionais. Ditas seqüências podem ser - por exemplo - localizadas emdiferentes posições com respeito às seqüências de homologia.
Preferivelmente, as seqüências de ácidos nucléicos adicionais são localizadasentre duas seqüências de homologia e podem ser introduzidas através derecombinação homóloga no DNA cromossômico, através disso parecendouma mutação de inserção de dito DNA cromossômico. Entretanto, asseqüências adicionais também podem estar localizadas fora das seqüências dehomologia (e.g., na extremidade 5' ou 3' do construto de DNA). Em casosonde a seqüência adicional parece um marcador de contra seleção isto podepermitir uma distinção de eventos ilegítimos de inserção de eventos corretosde inserção mediada por recombinação homóloga. Marcadores negativoscorrespondentes são descritos abaixo e métodos adequados são bemconhecidos na arte (WO 99/20780).
Em uma forma de realização preferida da invenção, eficiênciado método da invenção pode ser adicionalmente aumentada por combinaçãocom outros métodos adequados para aumentar recombinação homóloga. Ditosmétodos podem incluir por exemplo expressão de proteínas intensificadorasde H (tipo e.g., RecA; WO 97/08331; Reiss B et al. (1996) Proc Natl AcadSci USA 93(7):3094-3098; Reiss B et al. (2000) Proc Natl Acad Sci USA97(7):3358-3363) ou tratamento com inibidores de PARP (Puchta H et al.(1995) Plant J. 7:203-210). Vários inibidores de PARP adequados para usodentro desta invenção são conhecidos pela pessoa versada na arte e podemincluir por exemplo preferivelmente 3- Aminobenzamida, 8-Hidroxi-2-metilquinazolin-4-ona (NU1025), 1,1 lb-Dihidro-[2H]benzopirano[4,3,2-de]isoquinolin-3-ona (GPI 6150), 5-Aminoisoquinolinona, 3,4-Dihidro-5-[4-(l-piperidinil)butoxi]-l(2H)-isoquinolinona ou compostos descritos em WO00/26192, WO 00/29384, WO 00/32579, WO 00/64878, WO 00/68206, WO00/67734,WO 01/23386 ou WO 01/23390. Além disso, o método pode sercombinado com outros métodos facilitando recombinação homóloga e/ouseleção dos recombinantes tipo e.g., seleção positiva/negativa, excisão deeventos de recombinação ilegítima ou indução de quebras de dupla fita deDNA específicas ou inespecíficas para seqüência. Em uma forma derealização preferida, o método para intensificar a expressão de uma seqüênciade ácidos nucléicos em uma planta ou uma célula vegetal adicionalmenteatravés da ligação do íntron com propriedades intensificadoras de expressãoao cassete de expressão por inserção através de recombinação homóloga éaplicado a plantas monocotiledôneas ou células vegetais, maispreferivelmente a plantas selecionadas a partir do grupo consistindo dosgêneros Hordeum, Avena, Secale, Triticum, Sorghum, Zea, Saccharum, eOryza, mais preferivelmente uma planta de milho.
A seqüência de ácidos nucléicos na qual um dos íntronsinventivos é inserido e funcionalmente ligado (através dos métodosinventivos), codifica para uma proteína marcadora selecionável, uma proteínamarcadora monitorável, uma proteína ativa anabólica, uma proteína ativacatabólica, uma proteína de resistência a estresse biótico ou abiótico, umaproteína de esterilidade de macho ou uma proteína afetando característicasagronômicas de planta como descrito acima e/ou um RNA sentido,antisentido, ou de dupla fita como descrito acima. Em uma forma derealização preferida da presente invenção, dita seqüência de ácidos nucléicoscodifica uma proteína. Em ainda outra forma de realização da invenção ométodo é aplicado a construto de expressão de DNA recombinante quecontém um DNA para o propósito de expressar transcritos de RNA quefuncionam para afetar fenótipo vegetal sem ser traduzido em uma proteína.Tais seqüências que não expressam proteína compreendendo moléculas deRNA antisentido, moléculas de RNA sentido, moléculas de RNA comatividade de ribozima, moléculas de RNA formando dupla fita (RNAi) comodescrito acima.
Adicionalmente, um assunto adicional da invenção se refere aouso do organismo transgênico descrito acima ou de culturas celulares, partesde material de propagação transgênico derivados a partir destas, produzidoscom o método inventivo, para a produção de gêneros alimentícios, raçõesanimais, sementes, farmacêuticos ou químicos finos. E preferido além disso ouso de organismos transgênicos para a produção de farmacêuticos ouquímicos finos, onde um organismo hospedeiro é transformado com um dosconstrutos de expressão descritos acima, e este construto de expressão contémum ou mais genes estruturais que codificam o químico fino desejado oucatalisam a biossíntese do químico fino desejado, o organismo hospedeirotransformado é cultivado, e o químico fino desejado é isolado do meio decultura. Este processo pode ser usado amplamente para químicos finos talcomo enzimas, vitaminas, aminoácidos, açúcares, ácidos graxos,aromatizantes naturais e sintéticos, substâncias de aroma e corantes.
Especialmente preferida é a produção de tocoferóis e tocotrienóis,carotenóides, óleos, ácidos graxos polinsaturados etc. Cultivar os organismoshospedeiros transformados, e isolamento dos organismos hospedeiros ou domeio de cultura, são realizados por métodos conhecidos pelo trabalhadorversado. A produção de farmacêuticos tal como, por exemplo, anticorpos,vacinas, enzimas ou proteínas farmaceuticamente ativas é descrita (Hood(1999) Curr Opin Biotechnol. 10(4):382-6;Ma (1999) Curr Top Microbiol.Immunol. 236:275-92; Russel (1999) Current Topics in Microbiology andImmunology 240:119-138; Cramer et ai. (1999) Current Topics inMicrobiology and Immunology 240:95-118; Gavilondo (2000) Biotechniques29(1):128-138; Holliger (1999) Câncer & Metastasis Reviews 18(4):411-419).
Além disso a presente invenção se refere um construto deexpressão de DNA recombinante compreendendo pelo menos uma seqüência depromotor funcionando em plantas ou células vegetais, pelo menos um íntron compropriedades intensificadoras de expressão em plantas ou células vegetaiscaracterizado por
VIII) um comprimento de íntron mais curto do que 1.000pares de bases, e
IX) presença de um sítio de emenda 5' compreendendo aseqüência de dinucleotídeo 5'-GT-3' (SEQ ID NO: 78), e
X) presença de um sítio de emenda 3' compreendendo aseqüência de trinucleotídeo 5'-CAG-3' (SEQ ID NO: 79), eXI) presença de um ponto de ramificação parecendo aseqüência consenso 5'-CURAY-3' (SEQ ID NO: 75) a montante do sítio deemenda 3', e
XII) um teor de adenina mais timina de pelo menos 40%sobre 100 nucleotídeos a jusante do sítio de emenda 5', e
XIII) um teor de adenina mais timina de pelo menos 50%sobre 100 nucleotídeos a montante do sítio de emenda 3', e
XIV) um teor de adenina mais timina de pelo menos 55%,e um teor de timina de pelo menos 30% sobre íntron inteiro, epelo menos uma seqüência de ácidos nucléicos,
caracterizada pelo fato de que dita seqüência de promotor epelo menos uma de ditas seqüências de íntron são funcionalmente ligadas àdita seqüência de ácidos nucléicos e caracterizada pelo fato de que dito íntroné heterólogo para dita seqüência de ácidos nucléicos e/ou para dita seqüênciade promotor.
Seqüências
1. SEQ ID NO: 1 BPSI. 1: Seqüência do primeiro íntronisolada do gene tipo metalotioneína de Oryza sativa (No. de AcessoAP002540)
2. SEQ ID NO: 2 BPSI.2: Seqüência do primeiro íntronisolada do gene Sucrose UDP Glucosiltransferase-2 de Oryza sativa (No. deAcesso AC084380)
3. SEQ ID NO: 3 BPSI.3: Seqüência do segundo íntron isoladado gene Sucrose UDP Glucosiltransferase-2 de Oryza sativa (No. de AcessoAC084380)
4. SEQ ID NO: 4 BPSI.4: Seqüência do terceiro íntron isoladado gene Sucrose UDP Glucosiltransferase-2 de Oryza sativa (No. de AcessoAC084380)
5. SEQ ID NO: 5 BPSI.5: Seqüência do oitavo íntron isoladado gene de O. sativa codificando para o transportador de Sucrose (No. deAcesso AF 280050).
6. SEQ ID NO: 6 BPSI.6: Seqüência de quarto íntron isoladado gene de Oryzasativa (No. de Acesso BAA94221) codificando para umaproteína desconhecida com homologia com a seqüência de cromossomo II deA. thaliana de clones T22013, F12K2 codificando para uma lipase putativa(AC006233).
7. SEQ ID NO: 7 BPSI.7: Seqüência do quarto íntron isoladado gene de Oryza sativa (No. de Acesso BAB90130) codificando para umacinamil álcool desidrogenase putativa.
8. SEQ ID NO: 8 BPSI.8: Seqüência do segundo íntron isoladado gene de Oryzasativa (No. de Acesso AC084766) codificando para umaribonucleoproteína putativa.
9. SEQ ID NO: 9 BPSI.9:Seqüência do quinto íntron isolada do clone GI 12061241 de Oryza sativa.
10. SEQ ID NO: 10 BPSI. 10: Seqüência do terceiro íntronisolada do gene de O. sativa (No. de Acesso AP003300) codificando para uma proteínaquinase putativa.
11. SEQ ID NO: 11 BPSI.l 1: Seqüência do primeiro íntronisolada do gene de O. sativa (No. de Acesso L37528) codificando para umaproteína MADS3 box.
12. SEQ ID NO: 12 BPSI. 12: Seqüência do primeiro íntronisolada do gene de Oryza sativa (No. de Acesso CB625805) codificando parauma Adenosilmetionina descarboxilase putativa.
13. SEQ ID NO: 13 BPSI. 13: Seqüência do primeiro íntronisolada do gene de O. sativa (No. de Acesso CF297669) codificando para umaAspártico proteinase.
14. SEQ ID NO: 14 BPSI. 14: Seqüência do primeiro íntronisolada do gene de O. sativa (No. de Acesso CB674940) codificando parauma proteína Lec 14b.
15. SEQ ID NO: 15 BPSI. 15: Seqüência do primeiro íntronisolada do gene de Oryza sativa (No. de Acesso BAD37295.1) codificandopara um precursor de proteína SalT putativa.
16. SEQ ID NO: 16 BPSI. 16: Seqüência do primeiro íntronisolada do gene de O. sativa (No. de Acesso BX928664) codificando para umReticulon putativo.
17. SEQ ID NO: 17 BPSI. 17: Seqüência do primeiro íntronisolada do gene de O. sativa (No. de Acesso AA752970) codificando parauma glicolato oxidase.
18. SEQ ID NO: 18 BPSI. 18: Seqüência do primeiro íntronisolada do clone de Oryzasativa (No. de Acesso AK06442 codificando não codificanteputativo.
19. SEQ ID NO: 19 BPSI. 19: Seqüência do primeiro íntronisolada do clone de Oryzasativa (No. de Acesso AK062197) codificando não codificanteputativo
20. SEQ ID NO: 20 BPSI.20 seqüência do primeiro íntronisolada do gene de O. sativa(No. de Acesso CF279761) codificando para uma proteínahipotética.
21. SEQ ID NO: 21 BPSI.21 Seqüência do primeiro íntronisolada do gene de Oryzasativa (No. de Acesso CF326058) codificando para umtransportador de membrana putativo.22. SEQ ID NO: 22 BPSI.22: Seqüência do primeiro íntronisolada do gene de Oryza sativa (No. de Acesso C26044) codificando parauma proteína putativa de repetição de domínio ACT.
23. SEQ ID NO: 23 Iniciador direto (for) de Sucrose-UDPglucosiltransferase 2
24. SEQ ID NO: 24 Iniciador reverso (rev) de Sucrose-UDPglucosiltransferase 2
25. SEQ ID NO: 25 Iniciador (for) de inibidor de tripsinaBowman-Kirk putativa
26. SEQ ID NO: 26 Iniciador rev de inibidor de tripsinaBowman-Kirk putativa
27. SEQ ID NO: 27 Iniciador (for) de proteína hipotética Acc.No. CF279761
28. SEQ ID NO: 28 Iniciador rev de proteína hipotética Acc.No. CF279761
29. SEQ ID NO: 29 Iniciador (for) de fenilalanina amônia-liase
30. SEQ ID NO: 30 Iniciador rev de fenilalanina amônia-liase
31. SEQ ID NO: 31 Iniciador (for) de proteína 1 tipometalotioneína
32. SEQ ID NO: 32 Iniciador rev de proteína 1 tipometalotioneína
33. SEQ ID NO: 33 Iniciador (for) de catalase
34. SEQ ID NO: 34 Iniciador rev de catalase
35. SEQ ID NO: 35 Iniciador (for) de proteína relacionada aestresse putativa
36. SEQ ID NO: 36 Iniciador rev de proteína relacionada aestresse putativa
37. SEQ ID NO: 37 Iniciador (for) de fator de início detradução putativo SUIl
38. SEQ ID NO: 38 Iniciador rev de fator de início de traduçãoputativo SUIl
39. SEQ ID NO: 39 Iniciador (for) de poliubiquitina
40. SEQ ID NO: 40 Iniciador rev de poliubiquitina
41. SEQ ID NO: 41 Iniciador (for) de glutationa S-transferase II
42. SEQ ID NO: 42 Inieiador rev de glutationa S-transferase II
43. SEQ ID NO: 43 Inieiador (for) de proteína 2 tipometalotioneína
44. SEQ ID NO: 44 Inieiador rev de proteína 2 tipometalotioneína
45. SEQ ID NO: 45 Inieiador (for) de fator de iníciotraducional elFl
46. SEQ ID NO: 46 Iniciador rev de fator de início traducionalelFl
47. SEQ ID NO: 47 Iniciador (for) de OSJNBa0024F24.10(proteína desconhecida)
48. SEQ ID NO: 48 Iniciador rev de OSJNBa0024F24.10(proteína desconhecida)
49. SEQ ID NO: 49 Iniciador (for) de proteína similar aHistona 3.2-614
50. SEQ ID NO: 50 Iniciador rev de proteína similar a Histona
51. SEQ ID NO: 51 Iniciador (for) de OSJNBa0042L16.3
52. SEQ ID NO: 52 Iniciador rev de OSJNBa0042L 16.3
53. SEQ ID NO: 53 BPSI. 1 -iniciador 5'
54. SEQ ID NO: 54 BPSI. 1-iniciador 3'
55. SEQ ID NO: 55 BPSI.2-iniciador 5'
56. SEQ ID NO: 56 BPSI.2-iniciador 3'57. SEQ ID NO: 57 BPSI.3-iniciador 5'
58. SEQ ID NO: 58 BPSI.3-iniciador 3'
59. SEQ ID NO: 59 BPSI.4-iniciador 5'
60. SEQ ID NO: 60 BPSI.4-iniciador 3'
61. SEQ ID NO: 61 BPSI.5-iniciador 5'
62. SEQID NO: 62 BPSI.5-iniciador 3'
63. SEQ ID NO: 63 BPSI.6-iniciador 5'
64. SEQ ID NO: 64 BPSI.6-iniciador 3'
65. SEQ ID NO: 65 BPSI.7-iniciador 5'
66. SEQ ID NO: 66 BPSI.7-iniciador 3'
67. SEQ ID NO: 67 BPSI.8-iniciador 5'
68. SEQ ID NO: 68 BPSI.8-iniciador 3'
69. SEQ ID NO: 69 BPSI.9-iniciador 5'
70. SEQ ID NO: 70 BPSI.9-iniciador 3'
71. SEQ ID NO: 71 BPSI. 10-iniciador 5'
72. SEQ ID NO: 72 BPSI. 10-iniciador 3'
73. SEQID NO: 73 BPSI. 11-iniciador 5'
74. SEQ ID NO: 74 BPSI. 11-iniciador 3'
75. SEQ ID NO: 75 5-CURAY-3' seqüências consenso de
ponto de ramificação vegetal 1
76. SEQ ID NO: 76 5'-YURAY-3' seqüências consenso deponto de ramificação vegetal 2
77. SEQ ID NO: 77 5 '-(AG)(AG)/GT(AGT)(AGT)(GTC)-3'sítio de emenda 5' preferido
78. SEQ ID NO: 78 dinucleotídeo 5 '-GT-3' de sítio de emenda 5'
79. SEQ ID NO: 79 trinucleotídeo 5'-CAG-3' de sítio deemenda 3'
80. SEQ ID NO: 80 seqüência consenso vegetal 5'-AG::GTAAGT-3' de sítio de emenda 5'
81. SEQ ID NO: 81 seqüência consenso vegetal 5'-CAG::GT-3' de sítio de emenda 3'
82. SEQ ID NO: 82 Seqüência do primeiro íntron isolada dogene tipo metalotioneína de Oryza sativa (No. de Acesso AP002540)incluindo seqüências 5' e 3' adjacentes aos sítios de emenda 5' e 3' daseqüência de íntron BPSI.l (SEQ ID NO:l)
83. SEQ ID NO: 83 Seqüência do primeiro íntron isolada dogene Sucrose UDP Glucosiltransferase-2 de O. sativa (No. de AcessoAC084380) incluindo seqüências 5' e 3' adjacentes aos sítios de emenda 5' e3' da seqüência de íntron BPSI.2 (SEQ ID NO:2)
84. SEQ ID NO: 84 Seqüência do segundo íntron isolada dogene Sucrose UDP Glucosiltransferase-2 de O. sativa (No. de AcessoAC084380) incluindo seqüências 5' e 3' adjacentes aos sítios de emenda 5' e3' da seqüência de íntron BPSI.3 (SEQ ID NO:3)
85. SEQ ID NO: 85 Seqüência do terceiro íntron isolada dogene Sucrose UDP Glucosiltransferase-2 de O. sativa (No. de AcessoAC084380) incluindo seqüências 5' e 3' adjacentes aos sítios de emenda 5' e3' da seqüência de íntron BPSI.4 (SEQ ID NO:4)
86. SEQ ID NO: 86 Seqüência do oitavo íntron isolada dogene de Oryza sativa codificando para o transportador de Sucrose (No. deAcesso de GenBank AF 280050) incluindo seqüências 5' e 3' adjacentes aossítios de emenda 5' e 3' da seqüência de íntron BPSI.5 (SEQ ID NO:5)
87. SEQ ID NO: 87 Seqüência do oitavo íntron isolada dogene de Oryza sativa codificando para o transportador de Sucrose (No. deAcesso AF 280050) incluindo sítios de emenda 5' e 3' modificados eseqüências 5' e 3' adjacentes aos sítios de emenda 5' e 3' da seqüência deíntron BPSI.5 (SEQ ID NO:5)
88. SEQ ID NO: 88 Seqüência do quarto íntron isolada dogene de Oryza satíva codificando para uma proteína desconhecida comhomologia com a seqüência de cromossomo II de A.thaliana de clonesT22013, F12K2 codificando para uma lipase putativa (AC006233) incluindoseqüências 5' e 3' adjacentes aos sítios de emenda 5' e 3' da seqüência deíntron BPSI.6 (SEQ ID NO:6)
89. SEQ ID NO: 89 Seqüência do quarto íntron isolada dogene de Oryza sativa codificando para uma proteína desconhecida comhomologia com a seqüência de cromossomo II de A.thaliana de clonesT22013, F12K2 codificando para uma lipase putativa (AC006233) incluindosítios de emenda 5' e 3' modificados e seqüências 5' e 3' adjacentes aos sítiosde emenda 5' e 3' da seqüência de íntron BPSI.6 (SEQ ID NO:6)
90. SEQ ID NO: 90 Seqüência do quarto íntron isolada dogene de Oryza sativa (No. de Acesso BAB90130) codificando para umacinamil álcool desidrogenase putativa incluindo seqüências 5' e 3' adjacentesaos sítios de emenda 5' e 3' da seqüência de íntron BPSI.7 (SEQ ID NO:7)
91. SEQ ID NO: 91 Seqüência do quarto íntron isolada dogene de Oryza sativa
(No. de Acesso BAB90130) codificando para uma cinamilálcool desidrogenase putativa incluindo sítios de emenda 5' e 3' modificadose seqüências 5' e 3' adjacentes aos sítios de emenda 5' e 3' da seqüência deíntron BPSI.7 (SEQ ID NO:7)
92. SEQ ID NO: 92 Seqüência do segundo íntron isolada dogene de Oryza sativa (No. de Acesso AC084766) codificando para umaribonucleoproteína putativa incluindo seqüências 5' e 3' adjacentes aos sítiosde emenda 5' e 3' da seqüência de íntron BPSI.8 (SEQ ID NO:8)
93. SEQ ID NO: 93 Seqüência do segundo íntron isolada dogene de Oryza sativa (No. de Acesso AC084766) codificando para umaribonucleoproteína putativa incluindo sítios de emenda 5' e 3' modificados eseqüências 5' e 3' adjacentes aos sítios de emenda 5' e 3' da seqüência deíntron BPSI.8 (SEQ ID NO:8)
94. SEQ ID NO: 94 Seqüência do terceiro íntron isolada dogene de Oryza sativa (No. de Acesso AP003300) codificando para umaproteína putativa incluindo seqüências 5' e 3' adjacentes aos sítios de emenda5' e 3' da seqüência de íntron BPSI.10 (SEQ ID NO: 10)
95. SEQ ID NO: 95 Seqüência do terceiro íntron isolada dogene de Oryza sativa (No. de Acesso AP003300) codificando para umaproteína putativa incluindo sítios de emenda 5' e 3' modificados e seqüências5' e 3' adjacentes aos sítios de emenda 5' e 3' da seqüência de íntron BPSI.10(SEQ ID NO: 10)
96. SEQ ID NO: 96 Seqüência do primeiro íntron isolada dogene de Oryza sativa (No. de Acesso L37528) codificando para uma proteínaMADS3 box incluindo seqüências 5' e 3' adjacentes aos sítios de emenda 5' e3' da seqüência de íntron BPSI. 11 (SEQ ID NO: 11)
97. SEQ ID NO: 97 Seqüência do primeiro íntron isolada dogene de Oryza sativa (No. de Acesso L37528) codificando para uma proteínaMADS3 box incluindo sítios de emenda 5' e 3' modificados e seqüências 5' e3' adjacentes aos sítios de emenda 5' e 3' da seqüência de íntron BPSI. 11(SEQ ID NO: 11)
98. SEQ ID NO: 98 Seqüência do primeiro íntron isolada dogene de Oryza sativa (No. de Acesso CB625805) codificando para umaAdenosilmetionina descarboxilase putativa incluindo seqüências 5' e Ύadjacentes aos sítios de emenda 5' e 3' da seqüência de íntron BPSI. 12 (SEQID NO: 12)
99. SEQ ID NO: 99 Seqüência do primeiro íntron isolada dogene de Oryza sativa (No. de Acesso CF297669) codificando para umaAspártico proteinase incluindo seqüências 5' e 3' adjacentes aos sítios deemenda 5' e 3' da seqüência de íntron BPSI. 13 (SEQ ID NO: 13)
100. SEQ ID NO: 100 Seqüência do primeiro íntronisolada do gene de Oryza sativa (No. de Acesso CB674940) codificando parauma proteína Lec 14b incluindo seqüências 5' e 3' adjacentes aos sítios deemenda 5' e 3' da seqüência de íntron BPSI. 14 (SEQ ID NO: 14)
101. SEQ ID NO: 101 Seqüência do primeiro íntronisolada do gene de O. sativa (No. de Acesso CA128696) codificando parauma lectina de arroz de ligação a manose putativa incluindo seqüências 5' e3' adjacentes aos sítios de emenda 5' e 3' da seqüência de íntron BPSI. 15(SEQ ID NO: 15)
102. SEQ ID NO: 102 Seqüência do primeiro íntronisolada do gene de Oryza sativa (No. de Acesso BX928664) codificando paraum Reticulon putativo incluindo seqüências 5' e 3' adjacentes aos sítios deemenda 5' e 3' da seqüência de íntron BPSI. 16 (SEQ ID NO: 16)
103. SEQ ID NO: 103 Seqüência do primeiro íntronisolada do gene de Oryza sativa (No. de Acesso AA752970) codificando parauma glicolato oxidase incluindo seqüências 5' e 3' adjacentes aos sítios deemenda 5' e 3' da seqüência de íntron BPSI. 17 (SEQ ID NO: 17)
104. SEQ ID NO: 104 Seqüência do primeiro íntronisolada do clone GI 34763855 de Oryza sativa incluindo seqüências 5' e 3'adjacentes aos sítios de emenda 5' e 3' da seqüência de íntron BPSI. 18 (SEQID NO: 18)
105. SEQ ID NO: 105 Seqüência do primeiro íntronisolada do clone GI 32533738 de Oryza sativa incluindo seqüências 5' e Ύadjacentes aos sítios de emenda 5' e 3' da seqüência de íntron BPSI. 19 (SEQID NO: 19)
106. SEQ ID NO: 106 Seqüência do primeiro íntronisolada do gene de Oryza sativa
(No. de Acesso CF279761) codificando para uma proteínahipotética incluindo seqüências 5' e 3' adjacentes aos sítios de emenda 5' e 3'da seqüência de íntron BPSI.20 (SEQ ID N0:20).107. SEQ ID NO: 107 Seqüência do primeiro íntronisolada do gene de O. sativa (No. de Acesso CF326058) codificando para umtransportador de membrana putativo incluindo seqüências 5' e 3' adjacentesaos sítios de emenda 5' e Y da seqüência de íntron BPSI.21 (SEQ ID NO:21).
108. SEQ ID NO: 108 Seqüência do primeiro íntronisolada do gene de O. sativa (No. de Acesso C26044) codificando para umaproteína putativa de repetição de domínio ACT incluindo seqüências 5' e 3'adjacentes aos sítios de emenda 5' e 3' da seqüência de íntron BPSI.22 (SEQID NO:22).
109. SEQ ID NO: 109 Vetor binário pBPSMM291
110. SEQ ID NO: 110 Vetor binário pBPSMM305
111. SEQ ID NO: 111 Vetor binário pBPSMM350
112. SEQ ID NO: 112 Vetor binário pBPSLM139
113. SEQ ID NO: 113 Seqüência artificial: cassete de vetorpBPSMM355 (OsCP12::BPSI.l) compreendendo promotor Os CP12 (bp 1 -
854) e íntron BPSI.l (bp 888 - 1470).
114. SEQ ID NO: 114 Seqüência artificial: cassete de vetorpBPSMM355 (ZmHRGP::BPSI.l) compreendendo promotor 5'/UTR deglicoproteína (extensina) rica em hidroxiprolina de Milho [HRGP] (bp 1 -
1184) e íntron BPSI. 1 de oryza sativa (bp 1217- 1799)
115. SEQ ID NO: 115 Seqüência artificial: cassete de vetorpBPSMM358 (OsCCoAMTl::BPSI.l)compreendendo promotor de p-cafeoil-CoA 3-O-metiltransferase [CoA-O-Metil] (bp 1 - 1034) e íntron BPSI.l (1119- 1701)
116. SEQ ID NO: 116 Seqüência artificial: cassete de vetorEXS1025 (ZmGlobulinl::BPSI.l) compreendendo promotor (W64A) deGlobulina-I de Milho [ZmGlbl] (bp 1 - 1440) e íntron BPSI.l (1443 - 1999)
117. SEQ ID NO: 117 Seqüência artificial: cassete de vetorpBPSMM369 (OsV-ATPase::BPSI.l) compreendendo promotor putativo5'AJTR de ATP sintase transportando H+ de arroz (1 - 1589) e íntron BPSI.l(1616-2198)
118. SEQ ID NO: 118 Seqüência artificial: cassete de vetorpBPSMM366 (OsC8,7SI::BPSI.l) compreendendo promotor putativo de C-8,7 Esterol isomerase de Arroz (1 - 796) e íntron BPSI. 1 (827 - 1409)
119. SEQ ID NO: 119 Seqüência artificial: cassete de vetorpBPSMM357 (ZmLDH::BPSI.l) compreendendo promotor 57UTR de geneLactato desidrogenase de milho (bp 1 - 1062) e íntron BPSI.l (bp 1095 -1677).
120. SEQ ID NO: 120 Seqüência artificial: cassete de vetorpBPSLM229 (ZmLDH::BPSI.5) compreendendo promotor 57UTR de geneLactato desidrogenase de milho (bp 1 - 1062) e íntron BPSI.5 (bp 1068 -1318).
121. SEQ ID NO: 121 Seqüência artificial: cassete de vetorpBPSMM371 (OsLea::BPSI.l) compreendendo promotor de Lea(Abundantes de Embriogênese Tardia) de arroz (bp 1 - 1386) e íntron BPSI.l(bp 1387 - 2001).
EXEMPLOS
Químicos
A menos que indicado de outra maneira, químicos e reagentesnos Exemplos foram obtidos a partir de Sigma Chemical Company (St. Louis,MO), endonucleases de restrição foram de New England Biolabs (Beverly,MA) ou Roche (Indianapolis, IN), oligonucleotídeos foram sintetizados porMWG Biotech Inc. (High Point, NC), e outras enzimas modificantes ou kitsconsiderando ensaios bioquímicos e de biologia molecular foram de Clontech(Paio Alto, CA), Pharmacia Biotech (Piscataway, NJ), Promega Corporation(Madison, WI), ou Stratagene (La Jolla, CA). Materiais para meios de culturacelular foram obtidos a partir de Gibco/BRL (Gaithersburg, MD) ou DIFCO(Detroit, MI). As etapas de clonagem realizadas para os propósitos dapresente invenção, tal como, por exemplo, clivagens de restrição, eletroforeseem gel de agarose, purificação de fragmentos de DNA, transferência deácidos nucléicos para membranas de nitrocelulose e de náilon, ligação defragmentos de DNA, transformação de células de E. coli, crescimento debactérias, multiplicação de fagos e análise de seqüência de DNArecombinante, são realizados como descrito por Sambrook (1989). Oseqüenciamento de moléculas de DNA recombinante é realizado usandoseqüenciador de DNA de fluorescência a laser ABI seguindo o método deSanger (Sanger 1977).
Exemplo 1: Identificação e caracterização de IME-íntrons emgenes altamente expressantes
1.1 Identificação de genes candidatos fortemente econstitutivamente expressos de Oryza sativa.
Usando o "método de seqüenciamento por hibridização"descrito acima análise de distribuição de clone in silico de bibliotecas decDNA de arroz foi realizada.
Os perfis de distribuição de clone de cDNA de arroz foramderivados de cerca de 7,6 milhões de clones de cDNA de arroz, que foramgerados ao longo de 23 bibliotecas de cDNA de arroz de diferentes tecidos emdiferentes estágios de desenvolvimento e tratamentos bióticos/abióticos.
Método para a produção de bibliotecas de cDNA são bem conhecidos na arte(e.g. Gubler U, e Hoffman BJ. (1983) A simple and very efficient method forgenerating cDNA libraries. Gene 25(2-3):263-269.; Jung-Hwa Oh et al.(2003) An improved method for constructing a full-length enriched cDNAlibrary using small amounts of total RNA as a starting material.EXPERIMENTAL and MOLECULAR MEDICINE 35(6):586-590;
Lanfranchi et al. (1996) Identification of 4370 expressed sequence tags firam a3'-end-specific cDNA library of human skeletal muscle by DNA sequencingand filter hibridization. Genome Res. 6(l):35-42). Além disso, uma descriçãocompreensiva de construção de biblioteca de cDNA é fornecida em 1) Cowelland Austin. cDNA Library Protocols. In Methods in Molecular Biology,Volume 69, October 1996, Humana Press, Scientific and medicai publishers,ISBN: 0-89603-383-X; e 2) Ying, Shao-Yao. Generation of cDNA Libraries,Methods and Protocols. In Methods in Molecular Biology, Volume 221,February 2003, Humana Press, Scientific and medicai publishers, ISBN: 1-58829-066-2.
Todos os clones foram agrupados em um total de 300.408agrupamentos de arroz usando a tecnologia de alta produção descrita acima(veja "método de seqüenciamento por hibridização", ou "tecnologia HySeq")de 288 marca identificadora de oligonucleotídeo de 7 MER planta específico.
Para cada agrupamento gerado, clones foram adicionalmente agrupados emdiferentes variantes usando valor de corte mais estringente da similaridadepadrão de hibridização, levando a 335.073 variantes de clone de arroz.
Portanto, dentro de cada variante para dado agrupamento, clones são maishomogêneos. A distribuição de clones de cDNA de arroz ao longo das 23bibliotecas normalizadas de cDNA para dadas variantes fornece os perfis deexpressão de variante de arroz. A biblioteca normalizada de cDNA foiproduzida ajustando primeiro o tamanho de clone de biblioteca original para otamanho de clone médio de todas as 23 bibliotecas, então ajustando o númerode clones por variante naquela biblioteca baseado no número total ajustado declones naquela biblioteca.
Clones de arroz são selecionados a partir dos agrupamentosde arroz para seqüenciamento para gerar dados de EST de arroz. Usandoos perfis de distribuição de clones de 335.073 variantes de arroz, 145variantes foram selecionadas baseado no número de clones excedendo 1%de topo da distribuição de clone através da biblioteca inteira ao longo decada uma das 23 bibliotecas, e genes foram identificados usando oshomólogos às seqüências EST derivadas das variantes. Estes genescandidatos mostraram expressão forte, constitutiva, e generalizada. Asseqüências EST de arroz homólogas a estes genes candidatos forammapeadas para as seqüências de DNA genômico de arroz. Os 15candidatos de topo dos 145 foram selecionados baseado nadisponibilidade de seqüências genômicas, anotação, e alto nível deexpressão (Tabela 2).
Tabela 2. Gene candidatos para IME-íntrons potenciais
<table>table see original document page 131</column></row><table>
1.2 Validação de genes candidatos altamente expressantesusando RT-PCR em tempo real
Níveis de expressão dos genes endógenos representando estescandidatos foram medidos nos níveis de mRNA usando LightCycler. RNAtotal foi extraído de plantas de arroz em vários estágios de desenvolvimento etecidos com e sem estresse a seca (6, 12, 24, e 48 h retendo água) usandoQiagen RNeasy Plant Mini Kit (Cat. No 74904). Qualidade e quantidade doRNA foram determinadas usando Molecular Probes RiboGreen Kit (Cat. No.R-11490) no Spectra MAX Gemini. Um μg de RNA foi usado para RT-PCR(Roche RT-PCR AMV kit, Cat. No. 1483188) na solução de reação I (1 mgde RNA, 2 μL de IOx Tampão, 4 μΐ, de 25 mM MgCl2, 2 μΐ, de 1 mM dNTPs,2 μι de 3,2 mg de Iniciadores Aleatórios, 1 μί de 50 unidades de Inibidor deRNase, 0,8 μΐ. de 20 unidades de AMV-RT polimerase, completar para 20 μΐ,com água estéril) no programa PCR otimizado (25°C 10 min, 42°C lh, 99°C 5min, 4°C reação de parada).
As amostras de RT-PCR foram usadas para a reação deLightCycler (11,6 μι de água estéril, 2,4 pL de 25mM MgCl2, 2 μΐ, demistura de Polimerase Verde SYBR, 2 μΐ, de IOmM Mistura de IniciadorEspecífico, 2 \\L de produto de reação RT-PCR) no programa otimizado(95°C 5 min, 95°C 30 seg, 610C 40 seg, Il0C 40 seg e etapas 2-4 repetidas por30 ciclos, Il0C 10 min, e 4°C reação de parada) fornecido por Roche(LightCycler FastStart DNA Master SYBR Green I, Cat. No.3003230).
Tabela 3. Seqüências de iniciadores dos genes candidatos
<table>table see original document page 132</column></row><table><table>table see original document page 133</column></row><table>
Padronizar a concentração de RNA (1 mg) em cada uma dasreações RT de PCR foi suficiente para comparar diretamente as amostras seos mesmos iniciadores foram suados para cada reação de Lightcycler. Osresultados de rendimento foram um número que corresponde ao ciclo de PCRno qual a mostra atinge o ponto de inflexão na curva Iog gerada. Quantomenor os números de ciclo maior a concentração do RNA alvo presente naamostra. Cada amostra foi repetida em triplicata e uma média foi gerada paraproduzir o valor de "interseção" de amostra. Quanto menor a interseção, maisfortemente o gene alvo foi expresso naquela amostra. (.Roche MolecularBiochemicals LightCycler System: Reference Guide May 1999 version)Baseado nos resultados de LightCycler5 11 candidatos foram selecionados(Tabela 4).
Tabela 4. Resultados de LightCycler representando expressãodos genes candidatos de arroz nos níveis de mRNA.
<table>table see original document page 133</column></row><table><table>table see original document page 134</column></row><table>
Os números representam ciclo de PCR que atinge o início dacurva exponencial do produto de PCR. O número menor indica que maior é aexpressão do gene endógeno.
1.3 Identificação de IME-íntronsíntrons candidatos foram isolados usando as seqüências deDNA genômico públicas disponíveis {e.g.http://www.ncbi.nlm.nih.gov/genomes/PLANTS/PlantList.html), levando aum total de 20 íntrons, principalmente primeiro, segundo, e/ou terceiro íntronsdos genes almejados. Estas seqüências de íntron foram tríadas pelos seguintescritérios de IME:
• sítio de emenda 5' GT, sítio de emenda 3' CAG
• Pelo menos 40% rico em AT sobre 100 nucleotídeos ajusante do sítio de emenda 5' GT
• Pelo menos 50% rico em AT sobre 100 nucleotídeos amontante do sítio de emenda 3' CAG
• Pelo menos 55% rico em AT e 35% rico em AT sobreíntron inteiro
• Ponto de ramificação CURAY
• Tamanho de íntron menor do que Ikbíntron candidatos selecionados podem reter seqüências deéxon de até 50 bp antes e depois dos sítios de emenda 5' e 3', respectivamente.
Depois de triar as seqüências de íntrons contra os critérios deIME descritos acima, quatro das 20 candidatas foram escolhidas edenominadas como segue.Tabela 5. Os íntrons candidatos
<table>table see original document page 135</column></row><table>
1.4 Isolamento dos íntrons candidatos
DNA genômico de arroz foi extraído usando o QiagenDNAeasy Plant Mini Kit (Qiagen). Regiões de DNA genômico contendoíntrons de interesse foram isoladas usando PCR convencional.Aproximadamente 0,1 μg de DNA genômico digerido foi usado para a reaçãode PCR regular (veja abaixo). Os iniciadores foram projetados baseados nasseqüências genômicas de arroz. Um μΐ. do DNA genômico digerido diluídofoi usado como o modelo de DNA na reação primária de PCR. A reaçãocompreendeu seis conjuntos de iniciadores (Tabela 6) em uma misturacontendo Tampão 3 seguindo o protocolo esboçado por um Expand LongPCR kit (Cat #1681-842, Roche-Boehringer Mannheim). O DNA isolado foiempregado como DNA modelo em uma reação de amplificação por PCRusando os seguintes iniciadores:
Tabela 6. Seqüências de iniciadores
<table>table see original document page 135</column></row><table>
Amplificação foi realizada na reação de PCR (5 mL de IOXAdvantage PCR Mix [Eppendorf], 5 mL de DNA genômico [corresponde aaproximadamente 80 ng], 2,5 mM de cada dATP, dCTP, dGTP e dTTP[Invitrogen: mistura dNTP], 1 mL de 20 mM de iniciador especifico de íntron5' 20pM, 1 mL de 20 mM iniciador especifico de íntron 3', 1 mL de misturade DNA Polimerase TripleMaster [Eppendorf], em um volume final de 50mL) no programa de PCR otimizado (1 ciclo com 15 seg a 94°C e 1 min a80°C 35 ciclos com 15 seg a 94°C, 1 min a 58°C e 1 min a 72°C) fornecidopor Termociclador (T3 Thermocycler Biometra).
O produto de PCR foi aplicado a um gel de agarose 1% (w/v) eseparado em 80V. Os produtos de PCR foram excisados do gel e purificadoscom o auxílio do Kit de Extração em Gel de Qiagen (Qiagen, Hilden,Germany). O produto de PCR pode ser clonado diretamente em vetor pCR4-TOPO (Invitrogen) seguindo as instruções do fabricante, i.e. o produto dePCR obtido foi inserido em um vetor tendo saliências T com suas saliências Ae uma topoisomerase.
1.5 Construção de Vetor
O vetor de base ao qual os íntrons candidatos foram clonadosem foi pBPSMM267. Este vetor compreende o promotor de ubiquitina domilho sem nenhuma seqüência intrônica, seguido por múltiplos sítios declonagem (MCS) a serem usados para adição de íntrons de interesse, então oORF de GUSint (incluindo o íntron [PIV]2 de invertase de batata paraprevenir expressão bacteriana), seguido por terminador de nopalina sintase(NOS). Os vetores de expressão contendo íntron foram gerados por ligação deprodutos de PCR de íntron digerido com Xmal-RsrW em pBPSMM267linearizado com Xmal-Rsrll, através disso resultando nos seguintes vetores(Tabela 7).
Tabela 7. Construtos quiméricos de GUS contendo íntrons no 5'UTR
<table>table see original document page 136</column></row><table>pBPSMM295 [ pBPSMM310 | promotor de Zm.ubiquitina::BPSI.4::GUS::NOS3'
1.6 Análise vegetal para identificar IME-íntrons
Estes experimentos foram realizados por bombardeamento detecidos vegetais ou células de cultura (Exemplo 4.1), ou por transformaçãomediada por Agrobacterium (Exemplo 4.3). Os tecidos alvo para estesexperimentos podem ser tecidos vegetais (e.g. folha ou raiz), célulascultivadas (e.g. milho BMS), ou tecidos vegetais (e.g. embriões imaturos)para protocolos de Agrobaeterium.
1.6.1 Ensaios transitórios
Para identificar IME-íntrons, quatro íntrons (BPSI.l, 2, 3, e 4)foram testados usando Bombardeamento de microprojétil. O promotor deubiquitina do milho (Zm.ubiquitina) sem qualquer seqüência intrônica foiusado como expressão basal (controle negativo). Introns de interesse foramclonados na região 5'UTR de promotor de Zm.ubiquitina. Intron de ubiquitinade milho foi usado como um controle positivo para medir os níveis relativosde expressão intensificada por íntrons de interesse baseado em expressão deGUS. Forte intensificação com íntrons BPSI.l e BPSI.2 foi detectada (Tabela8). íntron BPSI.3 mostrou níveis médios de intensificação de expressão deGUS. Nenhuma expressão foi detectada com íntron BPSI.4.
Tabela 8. Teste de expressão transitória de GUS paraintensificação mediada por íntron
<table>table see original document page 137</column></row><table>
* Ensaios histoquímicos de GUS: uma variedade de atividadesde GUS (- nenhuma expressão a ++++ alta expressão), ** Expressão relativade GUS comparada com a expressão controlada por promotor de ubiquitinade milho fusionado com íntron de Zm.ubiquitina.
1.6.2 Análise de IM£-íntrons candidatos em milhoestavelmente transformado
Os vetores binários pBPSMM350, pBPSMM353,pBPSMM312, e pBPSMM310 (Tabela 7), foram transformadas em milhousando transformação mediada por Agrobacterium (Exemplo 4.3). Os níveis epadrões de expressão de GUS controlados por íntron BPSI.l, BPSI.2, BPSI.3,ou BPSI.4 foram comparados com aqueles controlados por íntron deZm.ubiquitina. íntrons BPSI.l, BPSI.2 e BPSI.3 intensificaram expressão emraízes, folhas, e cariopses ao longo dos vários estágios de desenvolvimentoem um nível similar àquele observado em ensaios transitórios (Tabela 9).Expressão de promotor de Zm.ubiquitina sem íntron foi indetectável emraízes e folhas e foi limitado em cariopses para o endosperma. Expressão depromotor de Zm.ubiqutina com íntron BPSI.4 exibiu os mesmos padrões deexpressão que aqueles controlados por promotor de Zm.ubiquitina sem íntron.Este resultado indica que um ensaio transitório pode ser usado como umsistema modelo e é portanto um dos importantes sistemas de triagem paraidentificar íntrons que funcionam em intensificação mediada por íntron (IME)em plantas transformadas estáveis. Entretanto, os resultados obtidos com osensaios transitórios devem ser validados pela produção de plantastransformadas estáveis transgênicas.
Tabela 9. Expressão de GUS em plantas de milho transgênico
<table>table see original document page 138</column></row><table><table>table see original document page 139</column></row><table>
*Ensaios histoquímicos de GUS: uma variedade de atividadesde GUS (- nenhuma expressão a ++++ alta expressão), ** apenas emendosperma, ND: não determinado
EXEMPLO 2. IME-íntrons localizados nas seqüências deDNA anotadas
2.1 Sistema de triagem in silico
O sistema de triagem de íntron in silico para identificar íntronsque têm a IME funcional compreende três principais componentes: (1) Gerarbanco de dados de seqüências de íntrons e triar para íntrons candidatos usandoos critérios de IME funcional (indicados em Exemplo 1.3); (2) Definir osperfis de expressão destes genes candidatos dos quais íntrons foramselecionados; (3) Examinar adicionalmente as estruturas gênicas selecionadasconduzindo um mapeamento de seqüências EST na região genômica onde osgenes candidatos residem.
Mais do que 30.000 seqüências genômicas anotadas de arroz emilho foram baixadas de NCBI. Seqüências de íntron, 5'- e 3'-UTR, promotore terminador foram isoladas {in silico) daqueles genes anotados e seus bancosde dados de seqüências correspondentes foram gerados (Tabela 10, 11). Apartir do banco de dados de seqüências de íntrons gerado, mais do que111.800 íntrons (i.e., 106049 íntrons de arroz, 4587 íntrons de milho) foramtriados para elementos reguladores de intensificação de íntron potenciaisbaseados nos critérios de IME funcional (veja 1.3). Um total de 108 íntronscandidatos potenciais foram identificados, e as seqüências protéicas dos genescandidatos de íntrons foram recuperadas de NCBI. As seqüências ESThomólogas de arroz (não são descritas seqüências de milho) foramidentificadas a partir das bibliotecas de cDNA descritas em exemplo 1 usandoo algoritmo BLASTx (este programa compara os produtos de traduçãoconceituai de seis quadros de uma seqüência de consulta de nucleotídeos(ambas as fitas) contra seqüências protéicas) em um valor-E de l,0e" contraaquelas seqüências protéicas. Usando os dados de definição do perfil deexpressão de variante de arroz (veja exemplo 1), os íntrons cujos genes foramhomólogos aos genes de arroz com perfil de expressão desejável, tal comopadrão de expressão constitutivo e tecido específico, foram selecionadoscomo íntron candidatos identificados in silico finais para teste experimentalem laboratório.
Os UniGenes de arroz, que foram derivados da associação deseqüências EST, foram atualizados usando os dados públicos combinados deEST de arroz e os dados de EST obtidos usando os bancos de dados descritosem exemplo 1, e os dados de definição do perfil de expressão de UniGeneforam gerados usando os dados de definição do perfil de expressão devariante de arroz ao longo das 23 diferentes bibliotecas descritas em exemplo1. Os dados de definição do perfil de expressão de UniGene de arrozrecentemente atualizados foram usados para ajudar a selecionar os 108 íntronscandidatos finais. Linguagens de computador interpretadas "perl" foramescritas para isolar seqüências de íntron, 5'- e 3'-UTR, terminador, epromotor das seqüências de DNA genômico anotadas inteiras de arroz emilho de NCBI para criar bancos de dados de seqüências correspondentes,para triar por IME funcional, e para comparar os dados de definição do perfilde expressão (veja exemplo 5). Os íntrons foram restaurados dascaracterísticas de CDS (seqüências de codificação) dos genes anotados. Umtotal de 106.049 íntrons de arroz e 4.587 íntrons de milho foram restaurados(Tabela 10) de mais do que 30.000 genes anotados como os dados resumidosem Tabela 11 e 12.Tabela 10. Resumo de banco de dados de seqüências dearroz/milho
<table>table see original document page 141</column></row><table>
Tabela 11. Resumo de gene de arroz e milho *
<table>table see original document page 141</column></row><table>
* íntron ou extron sem nomes de gene foram excluídos docálculo.
Tabela 12. Número total de genes no banco de dados
<table>table see original document page 141</column></row><table>
Além disso, as seqüências de codificação de comprimentocompleto de todos os 108 genes candidatos, nos quais íntrons foram isolados,foram baixados de NCBI e submetidos ao arroz Hyseq e UniGenes de milhopara identificar arroz Hyseq e seqüências homólogas de milho, usando BLASTNe valor de corte-E l,0e~ . Acertos de topo de UniGenes de arroz foramselecionados, e os dados de definição do perfil de expressão gênica foramavaliados. As seqüências EST, identificadas como homólogas às seqüências decodificação de genes de íntron candidato selecionados, foram encontradas emapeadas junto com as seqüências de gene de íntron candidato para as regiõesgenômicas de arroz. Baseado nos dados de definição do perfil de expressão deUniGene e nas estruturas de gene candidato, anotados e confirmados pelosalinhamentos de seqüências EST, nove íntrons foram finalmente selecionados deum total de 108 íntrons candidatos e são sujeitos ao teste de expressão em RT-PCR em tempo real. Dentre os nove íntrons, quatro mostraram um padrão deexpressão constitutiva, três preferivelmente expressos no estágio dedesenvolvimento precoce de semente, um preferivelmente expresso em raiz, eum foi induzido na condição de seca (Tabela 13).
Tabela 13. íntrons candidatos selecionados baseado nosegundo sistema de triagem in silico
<table>table see original document page 142</column></row><table>
2.2 Isolamento do íntron candidatos
DNA genômico arroz foi extraído usando o Qiagen DNAeasyPlant Mini Kit (Qiagen). Regiões de DNA genômico contendo íntrons deinteresse foram isoladas usando PCR convencional. Aproximadamente 0,1 μg deDNA genômico digerido foi usado para a reação de PCR regular (veja abaixo).Os iniciadores foram projetados baseados nas seqüências genômicas de arroz.Cinco μΐ. do DNA genômico digerido diluído foi usado como o modelo de DNAna reação de PCR. PCR foi realizado usando o Sistema de PCR TripleMaster(Eppendorf, Hamburg, Germany) como descrito pelo fabricante.
Tabela 14. Iniciadores usados para amplificação de íntroncandidatos amplamente expressos
<table>table see original document page 142</column></row><table><table>table see original document page 143</column></row><table>
Amplificação foi realizada na reação de PCR (5 mL de 10XAdvantage PCR Mix [Eppendorf], 5 mL de DNA genômico [corresponde aaproximadamente 80 ng], 2,5 mM de cada dATP, dCTP, dGTP e dTTP[Invitrogen: mistura dNTP], 1 mL de 20 mM de iniciador especifico de íntron5' 20pM, 1 mL de 20 mM iniciador especifico de íntron 3', 1 mL de misturade DNA Polimerase TripleMaster [Eppendorf], em um volume final de 50mL) no programa de PCR otimizado (1 ciclo com 15 seg a 94°C e 1 min a80°C 35 ciclos com 15 seg a 94°C, 1 min a 58°C e 1 min a 72°C) fornecidopor Termociclador (T3 Thermocycler Biometra).
Uma coluna QIAspin foi usada para purificar os produtos dePCR como direcionado pelo fabricante (Qiagen, Valencia, CA), e os íntronsamplificados foram usados diretamente para clonagem em vetores deexpressão, como descrito abaixo.
2.3 Construção de Vetor
O vetor de expressão base para estes experimentos foipBPSMM305, que compreende o promotor de lactato desidrogenase (LDH)de milho sem íntron dirigindo expressão do gene GUSint seguido peloterminador NOS. O promotor de LDH demonstrou dirigir níveis indetectáveisde expressão de GUS por coloração colorimétrica na ausência de um íntroncapaz de fornecer IME.
Produtos de PCR de íntron foram digeridos com Sacl &BamHl e clonados em pBPSMM305 linearizado com Sacl & BamHS., gerandoos seguintes vetores de expressão LDH:íntron:GUS.Tabela 15. Construtos quiméricos de GUS contendo íntrons no 5' UTR
<table>table see original document page 144</column></row><table>
Vetor binário pBPSLI017 compreende o cassete de expressãocontendo o íntron BPSI. 5 e foi gerado ligando no fragmento Pmel-PacV depBPSJB041 em pBPSLM139 linearizado com PmeI e Pacl.
Vetor binário pBPSLI018 compreende o cassete de expressãocontendo o íntron BPSI.6 e foi gerado ligando no fragmento Pmel-Pacl depBPSJB042 em pBPSLM139 linearizado com PmeI e Pacl.
Vetor binário pBPSLI019 compreende o cassete de expressãocontendo o íntron BPSI.7 e foi gerado ligando no fragmento Pmel-Pacl depBPSJB043 em pBPSLMl39 linearizado com PmeI e Pacl.
Vetor binário pBPSLI020 compreende o cassete de expressãocontendo o íntron BPSI.8 e foi gerado ligando no fragmento Pmel-Pacl depBPSJB044 em pBPSLM139 linearizado com PmeI e Pacl.
Vetor binário pBPSLI021 compreende o cassete de expressãocontendo o íntron BPSI.9 e foi gerado ligando no fragmento Pmel-Pacl depBPSJB045 em pBPSLM139 linearizado com PmeI e Pacl.
Vetor binário pBPSLI022 compreende o cassete de expressãocontendo o íntron BPSI.10 e foi gerado ligando no fragmento Pmel-Pacl depBPSJB046 em pBPSLM139 linearizado com Pmel e Pacl.
Vetor binário pBPSLI023 compreende o cassete de expressãocontendo o íntron BPSI. 11 e foi gerado ligando no fragmento Pmel-Pacl depBPSJB050 em pBPSLM139 linearizado com PmeI e Pacl.
2.4 Ensaios transitórios para identificar o íntronfuncionando ΙΜΈEstes experimentos foram realizados por bombardeamento detecidos vegetais ou células de cultura (Exemplo 4.1), ou por transformaçãomediada por Agrobacterium (Exemplo 4.3). Os tecidos alvo para estesexperimentos podem ser tecidos vegetais (e.g. folha ou raiz), célulascultivadas (e.g. milho BMS), ou tecidos vegetais (e.g. embriões imaturos)para protocolos de Agrobacterium.
Caracterização destes íntrons por sua capacidade de dirigirIME em conjunção com o promotor de LDH foi realizada através deexpressão transitória por bombardeamento de vetores de expressão em tecidofoliar de milho e células cultivadas em BMS líquido, respectivamente.
O promotor de lactato desidrogenase de milho (ZmLDH) semqualquer seqüência intrônica foi usado como expressão basal (controlenegativo). íntrons de interesse foram clonados na região 5'UTR de promotorde ZmLDH. íntron de ubiquitina de milho foi usado como um controlepositivo para medir os níveis relativos de expressão intensificada por íntronsde interesse baseado em expressão de GUS.
Devido à capacidade muito baixa (nenhuma expressão de GUSdetectável) do promotor de ZmLDH na ausência de íntron, a presença dequalquer coloração de GUS indica que um íntron particular é capaz defornecer IME. Dos íntrons testados, íntrons BPSI.10 e BPSI.ll produziramconsistentemente a maior expressão de GUS, em um nível comparável com oconstruto de íntron de LDH::Zm.ubiquitina. Em adição a estes íntrons, íntronsBPSI.5, BPSI.6, e BPSI.7 resultaram consistentemente em um nívelintermediário de expressão de GUS em entre LDH apenas e íntron deLDH::Zm.ubiquitina. Resultados comparáveis foram obtidos em folhas demilho e células BMS, indicando que os íntrons testados conferem LME emtecidos verdes e não verdes (Tabela 16).
Tabela 16. Teste de expressão de GUS transitória paraintensificação mediada por íntron
<table>table see original document page 145</column></row><table><table>table see original document page 146</column></row><table>
* Ensaios histoquímicos de GUS: uma variedade de atividadesde GUS (- nenhuma expressão a ++++ alta expressão), ND: não determinado.
EXEMPLO 3. Identificação de IME-íntrons localizados naregião 5' não traduzida
3.1 Sistema de triagem in silico
O sistema de triagem de íntron in silico para identificar íntronsque têm a IME funcional localizada no '5 UTR compreende três componentesprincipais: (1) Mapeamento de genoma das CDS inteiras de arroz, liberadopor Institute of Genome Research em 2 de Outrubro de 2003 e as coleções deseqüências EST; (2) identificação e seleção dos íntrons localizados no 5'UTRusando tanto os critérios de IME funcional como os perfis de distribuição declone de cDNA de arroz; (3) validação dos íntrons 5'UTR selecionadosavaliando os alinhamentos de seqüência entre o DNA genômico, CDS eESTs5 o modelo de gene, quadro de leitura de seqüência e sítios deprocessamento de íntron.
Um total de 56.056 CDS de arroz anotadas foi mapeado nogenoma de arroz Japonica no qual tanto CDS de arroz como seqüências deDNA genômico foram obtidas a partir do Institute of Genome Research.422.882 seqüências EST de arroz adicionais de fontes públicas e domésticastambém foram mapeadas no genoma de arroz. Um aplicativo computacionalde alinhamento de processamento, GeneSeqer (versão de 2 de Setembro de2003 de Iowa State University Research foundation), foi usado para conduziro mapeamento do genoma inteiro. Uma vez que tanto EST como CDS forammapeadas nas suas regiões genômicas correspondentes, os coordenadores dealinhamento de seqüência [coordenadores são as posições de início e/ou fimdas seqüências genômicas onde seqüências CDS/EST se alinharam a]derivados do mapeamento de CDS e do mapeamento de EST na mesmaregião genômica fornecem oportunidade para identificar a extensão dealinhamento de seqüências EST ao longo do DNA genômico além do códonde início das CDS. Tal extensão de alinhamento de seqüência das seqüênciasEST além de CDS indica a identificação dos 5' UTRs, que não estavamcontidos nas CDS, mas nas seqüências EST. O sistema seleciona estasseqüências EST, que estendem o alinhamento de seqüência além das CDS aolongo do genoma por até 5k bases de comprimento para triagem de íntron de5'URT. Para quaisquer éxons previstos, o ultimo éxon na região 5'UTRprevista deve alinhar na mesma posição do I0 éxon das CDS. Os resultados demapeamento genômico identificaram 461 genes que têm seu 5' UTRcontendo pelo menos um íntron.
Critérios adicionais de triagem estringentes que requererampelo menos 3 seqüências EST confirmando os mesmos íntrons de 5'UTRprevistos foram usados para selecionar os genes candidatos, levando aidentificar 87 genes candidatos. Estas seqüências EST identificadas, queforam consideradas como o mesmo transcrito que as CDS de arroz, foramusadas para resgatar os dados de distribuição de clone de cDNA de arroz ouos dados de expressão de microarranjo nos quais ou os clones destasseqüências EST identificadas foram colocadas no circuito integrado demicroarranjo de arroz ou homólogos a estas seqüências EST identificadasforam identificados no circuito integrado. Para o dado perfil de distribuição declone de cDNA de arroz, um gene, que tem um tamanho deagrupamento/variante de mais do que 100 clones distribuídos por 23bibliotecas de cDNA, foi considerado altamente expresso. Para a dadaexpressão de microarranjo, um gene, que tem intensidade de sinal dehibridização excedendo o percentil de 25% de topo dentro da mesma amostra,também foi considerado altamente expresso.
Em adição aos critérios de expressão gênica usados paraseleção de gene candidato, os critérios de IME (indicados em Exemplo 1.3)foram aplicados.
Além disso, a validação dos genes candidatos selecionados foiconduzida avaliando a coincidência dos alinhamentos de seqüência entreseqüências EST, CDS e seqüência de DNA genômico. Claramente asseqüências EST necessitaram auxiliar o modelo de gene previsto a partir dasCDS. Qualquer conflito dos alinhamentos de seqüência entre EST e CDSresultaria na não seleção dos genes candidatos. Usando estes critérios, umalista final de 11 íntrons foi selecionada (Tabela 17).
Tabela 17. Introns candidatos selecionados baseado no terceirosistema de triagem in silico
<table>table see original document page 148</column></row><table>3.2 Isolamento de íntrons
DNA genômico contendo íntrons de interesse é isolado usandoamplificação por PCR convencional com iniciadores específicos de seqüência(veja 1.4) seguido por clonagem em um vetor de clonagem de PCR na arte.
3.3 Construção de vetor
Introns são amplificados por PCR a partir de DNA genômicode arroz usando iniciadores que criam um sítio Sael na extremidade 5' doíntron e um sítio BamHl na extremidade 3' da seqüência. Os produtos de PCRsão digeridos com Sacl e BamHl e ligados em pBPSMM305 linearizado com
Sacl e BamHI para gerar vetores de expressão baseados em pUCcompreendendo o promotor Zm.LDH::Intron candidato: :GUSint::NOSterminador.
Vetores binários para transformação estável de milho sãoconstruídos digerindo os vetores de expressão pUC com PmeI e Pael eligando em pBPSLM139 digerido com Pmel e PaeI.
3.4 Ensaios transitórios para identificar IME-íntrons
Estes experimentos são realizados por bombardeamento detecidos vegetais ou células de cultura (Exemplo 4.1), ou por transformaçãomediada por Agrobaeterium (Exemplo 4.3). Os tecidos alvo para estesexperimentos podem ser tecidos vegetais (e.g. folha ou raiz), célulascultivadas (e.g. milho BMS), ou tecidos vegetais (e.g. embriões imaturos)para protocolos de Agrobaeterium.
EXEMPLO 4. Ensaios para identificar IME-íntrons
Estes experimentos são realizados por bombardeamento detecidos vegetais ou células de cultura (Exemplo 4.1), por introdução mediadapor PEG (ou metodologia similar) de DNA em protoplastos vegetais(Exemplo 4.2), ou por transformação mediada por Agrobaeterium (Exemplo4.3). Os tecidos alvo para estes experimentos pode ser tecidos vegetais (e.g.folha tecido), células vegetais cultivadas (e.g. milho Black MexicanSweetcorn (BMS)), ou embriões vegetais para protocolos de Agrobacterium.
4.1 Ensaio transitório usando bombardeamento demicroprojétil
Os construtos de plasmídeos são isolados usando kit deplasmídeo de Qiagen (cat# 12143). DNA é precipitado em partículas de ourode 0,6 μΜ (Bio-Rad cat# 165-2262) de acordo com o protocolo descrito porSanford et al. (1993) e acelerado em tecidos alvo (e.g. folhas de milho deduas semanas de idade, células cultivadas de BMS, etc.) usando umdispositivo de sistema PDS-1000/He (Bio-Rad). Todas as etapas deprecipitação de DNA e bombardeamento são realizadas em condições estéreisem temperatura ambiente.
Células cultivadas em suspensão de milho black mexicansweet (bms) são propagadas em meio líquido de cultura celular de bms [saisde murashige e skoog (ms) (4,3 g/l), 3% (w/v) de sucrose, mio-inositol (100mg/1), 3 mg/l de 2,4-ácido diclorofenoxiacético (2,4-d), hidrolisado de caseína(1 g/l), tiamina (10mg/l) e 1-prolina (1,15 g/l), ph 5,8]. A cada semana 10 mlde uma cultura de células estacionárias são transferidas para 40 ml de meiofresco e cultivadas em um agitador rotatório operado a 110 rpm a 27°C emum frasco de 250 ml.
60 mg de partículas de ouro em um tubo Eppendorfsiliconizado são ressuspensos em 100% de etanol seguido por centrifugaçãoem uma Mini centrífuga C1200 (National Labnet Co. Woodbridge, NJ) por 30segundos. O pélete é enxaguado uma vez em 100% de etanol e duas vezes emágua estéril com centrifugação depois de cada lavagem. O pélete é finalmenteressuspenso em 1 mL de glicerol 50% estéril. A suspensão de ouro é entãodividida em alíquotas de 50 μί e armazenada a 4°C. Os seguintes reagentessão adicionados a uma alíquota: 5 μΐ. de 1 μg/μL de DNA total, 50 μΐ. de2,5M de CaCl2, 20μί de 0,1M de base livre de espermidina. A solução deDNA é turbilhonada por 1 minuto e colocada a -80°C por 3 min seguido porcentrifugação por 10 segundos em uma Mini centrífuga C1200. Osobrenadante é removido. O pélete é cuidadosamente ressuspenso em 1 mL deetanol 100% batendo levemente o tubo seguido por centrifugação por 10segundos. O sobrenadante é removido e o pélete é cuidadosamenteressuspenso em 50 de etanol 100% e colocado a -80°C até ser usado (30min a 4 h antes de bombardeamento). Se agregados de ouro são visíveis nasolução os tubos são sonicados por um segundo em um sonicador em banho-maria bem antes de uso.
Para bombardeamento, folhas de milho de duas semanas deidade são cortadas em pedaços de aproximadamente 1 cm de comprimento ecolocadas na face adaxial em meio de indução osmótica M-N6-702 [sais N6(3,96 g/L), 3% (w/v) de sucrose, 1,5 mg/L de 2,4-ácido diclorofenoxiacético(2,4-D), hidrolisado de caseína (100 mg/L), e L-prolina (2,9 g/L), soluçãoestoque de vitamina MS (1 mL/L), 0,2 M de manitol, 0,2 M de sorbitol, pH5,8]. Os pedaços são incubados por 1-2 horas.
No caso de células cultivadas de BMS, células em suspensãode uma semana de idade são peletizadas em 1000 g em uma centrífugaBeckman/Coulter Avanti J25 e o sobrenadante é descartado. Células sãocolocadas em filtros redondos livres de cinza No 42 Whatman como umacamada de 1/16 de polegada de espessura usando uma espátula. Os papéis defiltro segurando os materiais vegetais são colocados em meios de induçãoosmótica a 21°C na escuridão por 1-2 horas antes de bombardeamento. Logoantes de bombardeamento os filtros são removidos do meio e colocados emuma pilha de papel de filtro estéril para permitir que as superfícies dos calossequem parcialmente.
Cada placa é bombardeada com 6 mL de solução de ouro-DNA duas vezes, a 1.800 psi para materiais foliares e a 1.100 psi para ascélulas cultivadas de BMS. Para manter a posição de materiais vegetais, umatela de malha de fio esterilizada é disposta no topo da amostra. Seguindobombardeamento, os filtros contendo as amostras são transferidos para meioM-N6-702 carecendo de manitol e sorbitol e incubados por 2 dias naescuridão a 27°C antes de ensaios transitórios. Níveis de expressão transitóriados genes repórteres são determinados por coloração de GUS, quantificaçãode luminescência ou RT-PCR usando os protocolos na arte. Coloração deGUS é feita incubando os materiais vegetais em solução de GUS [100 mM deNaHP04, 10 mM de EDTA, 0,05% de Triton X100, 0,025% de solução X-Gluc (5-bromo-4-cloro-3-indolil-beta-D-ácido glicorônico dissolvido emDMSO), 10% de metanol, pH 7,0] a 37°C por 16-24 horas. Tecidos vegetaissão infiltrados a vácuo 2 vezes por 15 minutos para auxiliar coloraçãouniforme.
Níveis de expressão transitória dos genes repórteres sãodeterminados por coloração, ensaios de enzima ou rt-pcr usando os protocolosna arte.
4.2 £nsaio transitório usando protoplastos
Isolamento de protoplastos é conduzido pelo seguinteprotocolo desenvolvido por Sheen (1990). Plântulas de milho são mantidas noescuro a 25°C por 10 dias e iluminadas por 20 horas antes de preparação deprotoplasto. A parte do meio das folhas são cortadas para faixas de 0,5 mm(cerca de 6 cm de comprimento) e incubadas em uma solução de enzimacontendo 1% (w/v) de celulose RS, 0,1% (w/v) de macerozyme RlO (ambosde Yakult Honsha, Nishinomiya, Japan), 0,6 M de manitol, 10 mM de Mes(pH 5,7), 1 mM de CaCl2, 1 mM de MgCl2, 10 mM de b-mercaptoetanol, e0,1% de BSA (w/v) por 3 h a 23°C seguido por agitação suave a 80 rpm por10 min para liberar protoplastos. Protoplastos são coletados por centrifugaçãoa 100 χ g por 2 min, lavados uma vez em solução fria de 0,6 M de manitol,centrifugados, e ressuspensos em 0,6 M de manitol frio (2 χ 106/mL).
Um total de 50 μg de DNA de plasmídeo em um volume totalde 100 μΐ. de água estéril é adicionado em 0,5 mL de uma suspensão deprotoplastos de milho (1 χ IO6 células/mL) e misturado suavemente. 0,5 mLde solução de PEG (40 % de PEG 4.000, 100 mM de CaNO3, 0,5 de manitol)é adicionado e pré-aquecido a 70°C com agitação suave seguido por adição de4,5 mL de solução de MM (0,6 M de manitol, 15 mM de MgCl2, e 0,1 % deMES). Esta mistura é incubada por 15 minutos em temperatura ambiente. Osprotoplastos são lavados duas vezes peletizando a 600 rpm por 5 min eressuspendendo em 1,0 mL de solução de MMB [0,6 M de manitol, 4 mM deMes (pH 5,7), e vírus do Capim Bromo (BMV) sais (opcional)] e incubadosno escuro a 250C por 48 h. Depois da etapa de lavagem final, colete osprotoplastos em 3 mL de meio MMB, e incube no escuro a 25°C por 48 h.Níveis de expressão transitória do gene repórter são determinados porquantificação de expressão de genes repórteres ou RT-PCR usando osprotocolos na arte a fim de determinar íntron potencialmente candidatos quefuncionam em intensificação mediada por íntron.
4.3 Transformação mediada por Agrobacterium em plantasdicotiledôneas e monocotiledôneas
4.3.1 Transformação e regeneração de plantas transgênicasde Arabidopsis thaliana (Columbia)
Para gerar plantas transgênicas de Arabidopsis, Agrobacteriumtumefaeiens (linhagem C58C1 pGV2260) é transformada com os váriosconstrutos de vetores descritos acima. As linhagens Agrobaeterianas sãosubseqüentemente usadas para gerar plantas transgênicas. Para este fim, umaúnica colônia de Agrobaeterium transformada é incubada durante a noite a28°C em uma cultura de 4 mL (meio: meio YEB com 50 mg/mL decanamicina e 25 mg/mL de rifampicina). Esta cultura é subseqüentementeusada para inocular uma cultura de 400 mL no mesmo meio, e este é incubadodurante a noite (28°C, 220 rpm) e parado de girar (rotor GSA, 8.000 rpm, 20min). O pélete é ressuspenso em meio de infiltração (1/2 de meio MS; 0,5 g/Lde MES, pH 5,8; 50 g/L de sucrose). A suspensão é introduzida em uma caixavegetal (Duchefa), e 100 ml de SILWET L-77 (heptametiltrisiloxanomodificado com óxido de polialquileno; Osi Specialties Inc., Cat. P030196) éadicionado a uma concentração final de 0,02%. Em um dessecador, a caixavegetal com 8 a 12 plantas é exposta a um vácuo por 10 a 15 minutos, seguidopor aeração espontânea. Isto é repetido duas vezes ou 3 vezes. Imediatamente,todas as plantas são plantadas em vasos de plantas com solo úmido ecrescidas em condições de dia longo (temperatura durante o dia 22 a 24°C,temperatura durante a noite 19°C; umidade relativa do ar 65%). As sementessão coletadas depois de 6 semanas.
Como uma alternativa, plantas transgênicas de Arabidopsispodem ser obtidas por transformação de raiz. Brotos de raiz branca de plantascom uma idade máxima de 8 semanas são usados. Para este fim, plantas quesão mantidas em condições estéreis em 1 meio MS (1% de sucrose; lOOmg/Lde inositol; 1,0 mg/L de tiamina; 0,5 mg/L de piridoxina; 0,5 mg/L de ácidonicotínico; 0,5 g de MES, pH 5,7; 0,8 % de ágar) são usadas. Raízes sãocrescidas em meio de indução de calo por 3 dias (lx meio B5 de Gamborg;2% de glicose; 0,5 g/L de mercaptoetanol; 0,8% de ágar; 0,5 mg/L de 2,4-D(2,4-ácido diclorofenoxiacético); 0.05 mg/L de cinetina). Seções de raiz de0,5 cm de comprimento são transferidas para 10 a 20 mL de meio líquido deindução de calo (composição como descrito acima, mas sem suplementaçãode ágar), inoculadas com 1 mL da cultura noturna de Agrobacterium descritaacima (crescida a 28°C, 200 rpm em LB) e agitada por 2 minutos. Depois demeio em excesso ter sido permitido para vazar, os explantes de raiz sãotransferidos para meio de indução de calo com ágar, subseqüentemente a meiolíquido de indução de calo sem ágar (com 500 mg/L de betabactil, SmithKlineBeecham Pharma GmbH, Munich), incubados com agitação e finalmentetransferidos para meio de indução de broto (5 mg/L de 2-isopenteniladeninafosfato; 0,15 mg/L de indol-3-ácido acético; 50 mg/L de canamicina; 500mg/L de betabactil). Depois de 5 semanas, e depois de 1 ou 2 mudanças demeio, os brotos verdes pequenos são transferidos para meio de germinação (1meio MS; 1% de sucrose; 100 mg/L de inositol; 1,0 mg/L de tiamina; 0,5mg/L de piridoxina; 0,5 mg/L de ácido nicotínico; 0,5 g de MES, pH 5,7;0,8% de ágar) e regenerados em plantas.
4.3.2 Transformação e regeneração de plantas cultivadas
A transformação de planta mediada por Agrobacterium usandotécnicas padrão de transformação e regeneração também pode ser realizadapara os propósitos de transformar plantas cultivadas (Gelvin & Schilperoort(1995) Plant Molecular Biology Manual, 2a Edição, Dordrecht: KluwerAcademic Publ. ISBN 0-7923-2731-4; Glick & Thompson (1993) Methods inPlant Molecular Biology and Biotechnology, Boca Raton: CRC Press, ISBN0-8493-5164-2). Por exemplo, canola pode ser transformada portransformação de cotilédone ou hipocótilo (Moloney (1989) Plant CellReports 8: 238-242). O uso de antibióticos para a seleção de agrobactérias eplantas depende do vetor binário e da linhagem de Agrobaeterium usada paraa transformação. A seleção de canola geralmente é realizada usandocanamicina como marcador vegetal selecionável. A transferência gênicamediada por Agrobacterium em semente de linho (Linum usitatissimum) podeser realizada usando por exemplo uma técnica descrita por Mlynarova (1994)Plant Cell Report 13:282-285. A transformação de soja pode ser realizadausando, por exemplo, uma técnica descrita em Patente Européia-Al 0 424047 ou em Patente Européia-Al 0 397 687, Patente Norte-Americana5.376.543, Patente Norte-Americana 5.169.770. A transformação de milho ououtras plantas monocotiledôneas pode ser realizada usando, por exemplo, umatécnica descrita em Patente Norte-Americana 5.591.616. A transformação deplantas usando bombardeamento de partícula, absorção de DNA mediada porpolietilenoglicol ou através da técnica de fibra de carbonato de silicone édescrita, por exemplo, por Freeling & Walbot (1993) "The maize handbook"ISBN 3-540-97826-7, Springer Verlag New York.EXEMPLO 5: Algoritmo computacional para encontrarinformação de seqüência de arquivo de banco de dados de gene de NCBI.
As características chave alvo são íntron, terminador, promotor,UTR. O roteiro seguinte (escrito em linguagem computacional Pearl) estádando um exemplo para um algoritmo computacional da invenção adequadopara identificar seqüências de íntrons adequadas baseado em informação debanco de dados (veja também Fig. 5a-f):
#!/usr/local/bin/perl -w# intron.pl
open(IN,$ARGV[0]) or die "can't find output";
while (defined(my $file=<IN>)) {
#start of a single annotation
if ($file=~/L0CUS.* ?\s+(\d+)\sbp(.*)/) {my $length=$l;my $mol=l;
$mol=0 if $2 =~ /circular/;my @cdslist=();my @start=();
my $order=0; # Order=I: complementary coding.my @title=();
my StitleO=O ;my @intron=();my $id="";my @terminator=();
my Spromoter=();
my @utr5=();my @utr3=();my @origin=();my $tab="";
my $organism="";
while (defined(my $line=<IN>)) {$line=$tab.$line;
if ($line =~ /aVERSION.*?\s+(GI:\d+)/) {$id=$l;
}elsif ($line =~ /Λ\ε{2}ORGANISM\s+(.*)/){
if($l=~/0ryza sativa/i){$organism="rice";Jelsif($1=~/Zea mays/i) {$organism="maize";}elsif($1=~/Glycine max/i){
$organism="soybean";}else {
$1=~/(\w+)/;$organism=$l;
}
Jelsif($line =~ /A\s{5J(CDS\s*)/){ textract cdsmy $test=$';my $gene="N/A";my $start=l;my $product="N/A";my $gi=$id;my @cds=();my @temp=();
if ($test =~ /complement/) {$order=l ;Jelse {
$order = 0;
J
while ( my $in=<IN>) {if ($in =~ /\s\/(.*)/) {$test=$test;
if ($1=~/gene="(.*)"/) {
$gene=$l;Jelsif($l=~/note="(·*)"/) {
$product=$l;Jelse {Iast ;J
J else {
$test=$test.$in;
J
J #close while loop;
$test =~s/\w+\d+\.\d:\d+\.\.\d+//g;$test =~ s/\D/ /g;$test =~ s/\s+/ /g;$test =~ s//-\s+//;my @sort;if ($mol==0) {
@sort=split(/ /, $test);J else {
@sort=sort {$a <=> $bj split(/ /,$test);
J
# tag complement cds
if ($order==l) {
@cds = ("complement",@sort);
J elsif ($order==0) {@cds = Ssort;} #close if loop;iretreave notation if intron exist;
if (scalar(@cds) >= 4) {
while (my $in=<IN>) {$start=l;
if ($in =~ /codon_start=(\d+)/) {$start = $1;
}elsif ($in =~ /\/gene="(.*)"/){$gene=$l;
}elsif ($in =~ /\/product=(.*)/){$product=$l;$product=~ tr/""//d;
}elsif ($in =~ /db_xref="(GI:.*?)"/) {$gi = $1;
Iast ;
} elsif ($in=~ /\/(pseudo)/) {$product="pseudo";Iast;
} #close if loop
} #close while loop;push @start, $start;push @cdslist, \@cds;# retreave 5'utr if start codon > 1;my @tem=();
for (my $i=l;$i<=($#cds-l)/2;$i++) {
my $titlel=">$organismI$giIIntron_$i ";
my $title2=" $gene|$start|".($cds[2*$i-
l+$order]+1)."..".($cds[2*$i+$order]-1)."|$product\n";
my @title=($titlel,$title2);push @tem, \@title;} tclose for looppush @title, \@tem;
my $titleO=">$organism|$gi|5UTR_0
$gene|$start|". ($cds[$order]-1) ." . . " . ($cds[$order]+$start-2)."I$product\n";
push @titleO, $titleO;
} Iclose if @cds>4 loop
} elsif ($line =~ /Λ\s{5}terminator/) {
($tab,my $note,my Stermo)=&getTerminator($line);
push gterminator, $note;push @terminator, \@termo;
} elsif ($line =~ /A\s{5}promoter/) {($tab,my $note,my @prom)=&getTerminator($line);
push @promoter, $note;push @promoter, \@prom;
} elsif ($line =~ /A\s{5}5\DUTR/) {
($tab,my $note,my gtemp)=&getTerminator($line);
push @utr5,$note;push @utr5,\@temp;
elsif ($line =~ /A\s{5}3\DUTR/) {
($tab,my $note,my @temp)=&getTerminator($line);
push @utr3,$note;push @utr3,\@temp;
#get sequence @origin}
if ($line =~ /Λ (O1RIGIN)/) {$line="";
25 while (my $code=<IN>) {
if ($code =~ /\/\//) {1 a s t ;}else{
30 $line=$line.$code;
} tclose if Ioop} #close while Ioop# $line =~ s/\/\// /g;# print $line,"\n";
35 $line =~ tr/0-9//d;
$line =~ tr/ //d;$line =~ tr/\n//d;@origin = split(//,$line);
40
for (my $i=0; $i<=$#cdslist;$i++) {if ($start[$i]>2) {
45 my @first=();
my $first;
if (${$cdslist[$i]}[0] eq "complement") {
my @utr=@origin[$cdslist[$i][1]-1
($cdslist[$i][1]+$start[$i]-2)];50 print @utr,"\n";
$first=&complement(@utr);} else {
@first=@origin[$cdslist[$i][0]-1($cdslist[$i][0]+$start[$i]-2)];
$first=join('',@primeiro);} iclose if Ioop for complement
print $titleO[$i],$first,"\n\n";} #close if Ioop for $start>2;
if (${$cdslist[$i]}[0] eq "complement") {shift @{$cdslist[$i]};for (my $j=l; $j<=($#{$cdslist[$i]}-1)/2;$j++) {my @int=@origin[$cdslist[$i][2*$j-l]
$cdslist[$i][2*$j]-2];
my $intl=&complement(@int);
print $title[$i] [$j-l] [0] , scalar(@int),$title[$i] [$j-
1][1], $intl,"\n\n" if $#int<5000;
} #close 2nd for Ioop for complement
} else {
for (my $j=l; $j<=($#{$cdslist[$i]}-1)/2;$j++) {my @int=@origin[$cdslist[$i] [2*$j-l] .. $cdslist[$i] [2*$j]-
2] ;
if ($mol==0 && $cdslist[$i][2*$j-l] > $cdslist[$i][2*$j]) {@int=(Sorigin[$cdslist[$i][2*$j-l] .. $#origin],
@origin[0 .. $cdslist[$i] [2*$j]-2]);}
my $intl=join('',@int);
print $title[$i] [$j-1] [0] , scalar(@int),$title [$i] [$j-
1][1], $intl,"\n\n" if $#int < 5000;
}#close 2nd for Ioop} #close else Ioop} tclose I0 for Ioop
my $titlel=">$organismI$idIterminator" ;SgetSequence(\@terminator, \@origin,$titlel);
$titlel=">$organism|$id|promoter";SgetSequence(\@promoter,\@origin,$titlel) ;
$titlei=">$organism|$id|5utr";SgetSequence(\@utr5,\@origin,$titlel);
$titlel=">$organism|$id|3utr";&getSequence(\@utr3,\@origin,$titlel);
Iast;} else {$tab="";
} #close if $line Ioop} tclose while $line Ioopnext;
} #close if $file Ioop
} #close while $file Ioopclose IN;
tretreave complement sequncesub complement{my @code=@_;my @complemnt=();for (my $i=0;$i<=$#code;$i++) {if ($code[$#code-$i] eq "t") {
$complement[$i]= "a";} elsif ($code[$#code-$i] eq "a") {
$complement[$i]= "t";} elsif ($code[$#code-$i] eq "c") {
$complement[$i]= "g";} elsif ($code[$#code-$i] eq "g") {
$complement[$i]= "c";} else {
$complement[$i]=$code[$#code-$iJttclose if Ioop} #close for Ioopmy $comp=j oin(1',@complement);Scomplement=();return $comp;} #close sub
#get sequence reference for feature keysub getTerminator {my $line=$_[0];my $order=0;
if ($line=~/complement/) {
$order=l;} else {
} #close if Ioop$line =~ s/\d'UTR//;$line =~ s/\D/ /g;$line =~ s/\s+/ /g;$line =~ s/"\s//;my @term=split(' ',$line);
@term=("c",@termo) if $order==l;my $in;
read(IN,$in,6);my $note =" \n";
if ($in!~/\w/) {$note=<IN>;$note=~s/\s+\///;$note=~s/note=//;$note=~ tr/""//d;} #close if Ioopreturn ($in,$note,@term);} #close sub
Iretreave sequence information for feature keyssub getSequence {my @arranjo=@{$_[0]};my @code=@{$_[l]};my $id=$_[2];
for (my $i=0; $i<($#arranjo+l)/2;$i++) {my $note=$arranjo[2*$i];
my @term=@{$arranjo[2*$i+l]};if ($term[0] eq "c") {shift @term;
for (my $j=0; $j<=($#term-l)/2;$j++) {my @comp=@code[($term[2*$j]-1) .. ($term[2*$j+1]-1)] ;
my $intl=&complement(@comp);
my $title=$id."_". ($i + l) . " ".scalar(@comp) ."
$term[2*$j]..$term[2*$j+l]|$note";
print $title, $intl,"\n\n";} #close 2nd for Ioop
} else {
for (my $j=0; $j<($#termo+l)/2;$j++) {my @int=@code[($term[2*$j]-1) .. ($term[2*$j+1]-1)] ;my $intl=j oin(' ',@int);
my $title=$id."_".($i+l)." ".scalar(@int)."
$term[2*$j]..$term[2*$j+l]|$note";print $title, $intl,"\n\n";} #close 2nd for Ioop} #close if Ioop
} #close Io for Ioop
} #close sub
EXEMPLO 6 Expressão de promotores tecido específicosem combinação com IME-íntrons
BPSI.l e BPSI.5 foram fusionados com vários promotores demonocotiledôneas e demonstraram que mais destes promotores sem IME-íntron não mostram expressão de GUS, mas IME-íntrons intensificaramexpressão.
6.1 promotor Os.CP12:: íntron BPSI.l ::GUS::NOSterminador (pBPSMM355)pBPSMM355 mostra forte expressão folha específica. Estaexpressão foi detectada em todos os estágios de desenvolvimento testados.Nenhuma expressão foi detectada em qualquer outro tecido testado.
6.2 promotor Zm.HRGP:: íntron BPSI.l::GUS::NOSterminador (pBPSMM370)
pBPSMM370 é fortemente expresso em raízes. Expressãosignificante também foi detectada em serigrafia e nas camadas mais externasda cariopse que incluem a camada de aleurona e revestimento de semente.
Esta expressão foi mais forte por volta da base da cariopse. Coloração emserigrafia foi mais forte na região perto do ponto de acoplamento com acariopse e foi detectada em estágios de desenvolvimento muito precoces.
6.3 promotor Os.CCoAMTl:: íntron BPSI.l ::GUS::NOSterminador (pBPSMM358)
Promotor de Os.Cafeoil-CoA-O-metiltransferase (CCoAMTl)em combinação com BPSI.l (pBPSMM358) mostrou expressão embriãoespecífica em cariopses Tl e T2. O nível de expressão foi baixo mas muitoespecífico. Nenhuma expressão foi detectada em qualquer outro tecidotestado.
6.4 promotor Zm.GIobulinal:: íntron BPSI.l::GUS::NOSterminador (EXS1025)
EXS1025 é fortemente expresso no embrião. Esta expressãocomeça entre 5 dias depois de polinização (DAP) e IODAP. Expressão é maisforte no escutelo e mais fraca no eixo embrionário (plúmula com folhas einternos, raiz primária).
Expressão significante também foi detectada nas camadas maisexternas da cariopse que incluem a camada de aleurona. Expressão é maisforte em estágios 15DAP a 25DAP e mais fraca em 3 ODAP. Expressão fracafoi detectada algumas vezes no endosperma. Nenhuma expressão pode serdetectada em qualquer outro órgão incluindo pólen.6.5 promotor Os.V-ATPase:: íntron BPSI.l::GUS::NOSterminador (pBPSMM369)
pBPSMM369 é fortemente expresso em raízes. Esta expressãofoi detectada em todos os estágios testados. Expressão significante também foidetectada em todas as partes das cariopses e em pólen. Expressão fraca foidetectada nas folhas em estágios de desenvolvimento precoces e em floração.Expressão fraca foi variável em força e foi em diversas plantas no limite dedetecção. Em geral, expressão foi maior em plantas Tl homozigotas do que nasTO heterozigotas.
6.6 promotor Zm.LDH:: íntron BPSI.l::GUS::NOSterminador (pBPSMM357)
pBPSMM357 mostra atividade fraca em cariopses. Expressãoem cariopses foi localizada principalmente em e por volta do embrião. Expressãomuito fraca também foi detectada em raízes.
6.7 promotor Os.C8,7SI:: íntron BPSI.l::GUS::NOSterminador (pBPSMM366)
Promotor de Os.C-8,7-esterol-isomerase contendo BPSI.l(pBPSMM366) mostra atividade fraca em raízes e expressão boa em cariopses.
6.8 promotor Os.Leum:: íntron BPSI.l ::GUS::NOSterminador (pBPSMM371)
Promotor de Os.Leum em combinação com BPSI.l(pBPSMM371) mostrou forte expressão embrião específica em cariopses.Alguma expressão pode ser detectada em ápices radiculares mas nenhumaexpressão foi detectada em qualquer outro tecido testado.
6.9 promotor Zm.LDH:: íntron BPSI.5::GUS::NOSterminador (pBPSLM229)
pBPSLM229 mostra expressão fraca em endosperma e camadade aleurona, principalmente no lado superior da cariopse. Nenhuma expressãofoi detectada em qualquer outro tecido testado.Listagem de Seqüência
<110> BASF Plant Science GmbH
<120> seqüências de Intron de Intensificação de expressão
<130> PF 56400 AT / AE20040293
<160> 121
<170> PatentIn version 3.3
<210> 1
<211> 584
<212> DNA
<213> Oryza sativa
<220>
<221> Intron
<222> (1) . .(584)
<223> BPSI.1
60
<400> 1
gtaagatccg atcaccatct tctgaatttc tgttcttgat ctgtcatgta taataactgtctagtcttgg tgttggtgag atggaaattc ggtggatctc ggaagggata ttgttcgttt 120gctggggttt tttttgtgtg ttgtgatccg taatgaattt gtgtttatcc atgttgttga 180tcttggtatg tattcatgac atattgacat gcatgtgttg tatgtgtcat atgtgtgcct 240ctccttggga t£tgttttgg ataatagaac atgttatgga ctcaatagtc tgtgaacaaa 300tcttttttta gatggtggcc aaatctgatg atgatctttc ttgagaggaa aaagttcatgatagaaaaat cttttttgag atggtggctt aatgtgatga tgatcttact tgagaggaaaaaaaagattc attataggag attttgattt agctcctttc caccgttatt aaatgaggagcatgcatgct gatggctgat aaggatctga ttttttttat cccctcttct ttgaacagac 540aagaaatagg ctctgaattt ctgattgatt atttgtacat gcag 584
<210> 2
<211> 728
<212> DNA
<213> Oryza sativa
360420480
<400> 2
gttcgtgctg atttagtgat ttcccagcat tagattttgt tggtttctag tctactgcct 60
tcagatgtta ctgtattttc ttttagaagg agatgttcat ataggatctt tgttgttgag 120
attgttagat ctggccagga atggctcata tttactgaat tggatgcaat cattttgtag 180
tcactttttt tttaagtttc tgattagaat gaatatttaa gtgcggcctt ctgcagccaa 240
gattttgtac aaacctagta ctactgaata atgatgaaat atacaaatgt agttttggat 300
tactgtggac tggtagtgct agatctgact gcatgtgcat gttatttata ttatatatac 360
ggtttacaaa ctgaatacaa gtaatgaatt ctgcactggt acagatgctt gttgtggtag 420
caaagtttca caaaaaaaat aaaaaaccta catcttacta gatctattgg cgcgagcgcg 480
20040293 BaR 02.03.05 4 Fig + Seqtagatctgat tatcgcgcat atttcattaa gtçcaattaa atggtcaaaa ctaatcattt 54 0
catatctaca atgaaatttt taattcatct caatgcaaac agatcatata tggtcttttt 600
aagtggctaa tagcaaattt tcttattatg cgcaaatgct caagtgctaa aattatctta 660
ttgagatatt tataggctga gttgatagat ctggcctgat atttttgttg acactgttat 720
ttgcgcag 728
<210> 3
<211> 95
<212> DNA
<213> Oryza sativa
<400> 3
gtttgaatca gattcagatt tcattgcatc acagagatcc atctttactc taccgcttgc 60
tctaacttaa cttgtaattg ttttttatca tgcag 95
<210> 4
<211> 120
<212> DNA
<213> Oryza sativa
<400> 4
gtatgaaatc tgcataattg ggatactaaa aacatatatt cttaaaattt aaaacttaat 60
tttattattt ttcttttatc gàtatatatg tcattgtaat atctctgatg tatatttcag 120
<210> 5
<211> 225
<212> DNA
<213> Oryza sativa
<400> 5
gtaagttctg ttattacctc ataaactgcc tgctgataat actttaacaa tgtgctaata 60
ttagtctttg taataagata gtactatact gaaaatattt tagcgagtat gagtaattta 120
acttacatat tgtattgctg ttcctctttt ttcaaccctg tcatattggt tgcttttttt 180
cacagcctaa catgctcttg tttggtcatt ttcccctgtt ttcag 225
<210> 6
<211> 770
<212> DNA
<213> Oryza sativa
<400> 6
gtgagtcatt attgtctcat tatttgatcg atctctgatt ctctgattct tttcttttta 60
agcttaattg gcagccggat ggctgcaaat ccccatcgaa ggtaaatgct tgccttatat 120
atatgagtat ctctctactt tctccatcct aaaatagttt agtacgtata atactatatt 180
agaaataatc taatataatg aatctcagat atcattatta ttttatgttg taatttgtgt 240gtatatatca ttggtctgat gtactactttctatttttct actcaatttt ctttagattttgcaacgcta aattagtttc attaaatatatgtacctgaa gatacctaaa ttttacactatatatggagg tactaagttt tatactagaatgataaaatt actctaatat taaatatattattactatat tttctttata aacttaactagaaagcgacc tataacaatt ataaatggagattttctctc tttctgacgt cactagctaa
<210> 7
<211> 715
<212> DNA
<213> Oryza sativa
<400> 7
gtgagcacta tagctgtttg atgcaaaatcatctggacat ataaaaacga tcctgatgtcgtatggaagc agctttatgc agaattttagcaggataatg attattcatg tatactgagcctatccgttg ttataggtgc agtaatatacattaattatg catttggtgc agtactgtactgttggtatc ctttattgat cgtgcatttgttgggagtat ttgtgtagga ctcatgcataaccctgtatc taattccttt aatttatgaacaacattgaa tatttgaatg ttagaacatgaacaagtgat ctcacatgtt gactgaagtttctatatatt tacatttttc acgctgattt
<210> 8
<211> 334
<212> DNA
<213> Oryza sativa
<400> 8
gtgagtatat gcttccatac ttctaagtcaggctaaaaat atattgcata aagtgcgctcgcttgcattc tttcaagata actgtagctgtttaatcctt gtttgctttt agcttattcattctggcatg ttgctggaca tatgttgtgtttaactaatt tgctgatttc atttcttaaa
cctttcatat tataagtttc tcttttttcg 300gactaggttc ataaaaaaat taacaatatt 360acattgagag aaatttttgg tacatgagaa 420aaagttttga tttctcaaga tacttattag 480aatatgtatc tcttagtact ttttcaagaa 540ttgataatat gtttgctttg tgttaaaaat 600aacttaaaaa ggtttaacta ataaaatagt 660ggagcagtag cgtgaaatct gaatataatt 720cttggtcacc tacactgcag 770ataattgctg tatgttactg taatagattg 60acttattttt ttccttcaag atgtattgca 120tgcttatagg caattttcta aaggagttct 180ttaaatatat gcagtgttaa taggcaacaa 240ttcactgtgc attgcccttg gtatcctttt 300tgtactgtac tgtactgtac tgtgcactgt 360gattgccttt ttttaattcc aaggtttctc 420tatcacttat gttccatttt ataatctttc 480aaatataatc cagatattcc ctagttttaa 540atttacattc atttggctaa ctattttttt 600tcataagtaa acagtattat cttgttttct 660actccttgtt ttttaaaaaa aacag 715ttatttttgc tccatgttgg tatatgggct 60ctatttcatc tctttggttt gcatgctgtg 120aggttgctcg atatgaacct gcttgcttgt 180tgactagaaa acaaacttta atttactctt 240tatatcctat acaacatcat tgaattgtgc 300acag 334
<210> 9<211> 355<212> DNA<213> Oryza sativa
<400> 9
gtaagtccat ctcttttttt tccaggtgtc ggtatagtag tgtactgtac gttctattcttgtaaccaac atttccaatg cattttgcat ccatatatta ctacagttca agtgattaaatttgtgacat gagaaaattt atcttatttt gaacttaagg tgtatcagtg tatgttctcatgttgtcaac ttgtcatcgt cagtgctaaa gcagacactt tttttttcct tccgacagagtggaactagt gttgtttcat gaataacatc atgaagcatg caaattaatg ctttcttcttaaattcttgg caaatggact ctaactgtat attgcttctg tgcttatttt tccag
60120180240300355
<210> 10
<211> 538
<212> DNA
<213> Oryza sativa
<400> 10
gtaagaatct ttgcgtccta ctgtcagtca tttttttctt cccatttgtt gccaacagtt 60
tggagttctt tcattgttca cggtagcagt ttttcttgta gtacctgcat ttttatatgc 120
acttttctat attgtactct gctctagtga tgtagttgat tatttatttt attcatattt 180
tgtagcaatt ctgttgtact gtatacttga atgtctgaca gtttggcatt taagagttca 240
ttaagaaatg gctgacacct tactaactgt tcattacgat ttctggcagt caataagggt 300
gttaggtggt gctatgttac atgtttccaa ttccaaatga tgtatttttg gtgttttatt 360
attaccgact aaataccttg ggtgcaactc tttgttctcc tcctttagac aatgtagttt 420
atgcactgtt attgctgtgt tgcgttaaat ttggcccaac tgtttcattt cagtataact 480
ctattctgaa gtgtcttgta tttatctgat atttgtcttg gataattgta ttaaacag 538
<210> 11
<211> 331
<212> DNA
<213> Oryza sativa
<400> 11
gtaaattctg gctttcttgc ttttggataa attttgcttc ctttcttaac ttgagcacaa
gcttgtgtta tatgtggtgt gaaatcttgg ttgccatgtt gtgaggattt agctagagag
tcaagaaaga ggaatatatg ctttatgtag ataggagtag gatctctggg tctttaaaca
tcaccatgac aagcaaagat aagaacagga gagcagttct tgattattat ttttcttctc
atcaagaaat taagccggag atagacatgg cagctgcacg cagtgattca cttcttgatttcttgatttg ggttgttgcg tttgtgtcca g
60120180240300331
<210> 12<211> 961<212> DNA
<213> Oryza sativa
<400> 12gtaagatctc gcgcgacctg tttgttcttc ttggtgttct tctgcctagt tacttcgttt 60
gttttatgtt tgatctatag tcttgatgat ctgtgaagac tagttgttgt tttcggtacg 120
gatggtagga aaggtatttt cctttgttta aggaattgca agatctcgcg cgacctgttc 180
ttgatgttct gtctagtact tcgtttgttt gtttgatcta gtatgttaga tgatctatga 240
aaagtagtta ttttcggtac gaatggtagg agaagtattt tcctttgttg gcgtcaaaat 300
ataatcttta atcactcagt cttgtgaatg gtaattctga attcatattt ttcttttctg 360
atctatatcg tgttattctg tttatgattt tttgctgagt agatcccctt gtgctcgatg 420
tatgataagt tatctatatc gtaatagatt cgtatgtcaa aacttagtcg aaattttcga 480
tctcatctct tctgttagcc acaggtggct gattgaaata ttcttcaatt gagtctgaat 540
ttttatgtta tatgcaaata attgtcccgc tccagttcat atgtctgatg aaacatgaat 600
gtaaaggaat taagactttg gttatatgat tcgagtctga attttcttat gcttatgcaa 660
ataatagtcc aaaagaattg gtgatttttt tgtgtagttc atatggttga taaatatgaa 720
tgtgtctcaa aagcaacgaa gattttgatg acaagacaat ctgctatttg agtctgaaat 780
ttcttatgct tttgcaaata atagtcatag tcagaacgaa ttactgaaat ttccctccag 840
ttcatacggt tgatgaaaca tgaatgtatc tctttagtaa ttgaaacttt gacgatcaga 900
caatctgttg cattgcctag tcttgcagat tctcatcgat ccttttaatt cttctctgca 960
g
961
<210> 13
<211> 595
<212> DNA
<213> Oryza sativa
<400> 13
gtgagaacga ttgattactt tgctggctgc tcttagctac tactacaact gttttgtctt 60
aatcggttga ttacatctca tatttcatcg gtttagctcg ctctgttaag atttctcacc 120
tcctcttgga tgtattattc atgtatatgt tgtgtggtct ggctaagttt ttggtctgtc 180
ctgataaatg ctgtttaagg attctttctt tgttcttttt ttttatggac aaaatataat 240
ctttgtgcct tactgtgaat tgagtctgtt ggctatatcg ttcccggttt attggactat 300
agatgaacat gtaaccctat atgcggttgt gttttctcct tacaaagatc agtagtacct 360
aattcagcta gttagaagtg gtaccaaggc tgtaaatttc catctttttc tctgtgaggt 420
tcatttccct tttaatctct gtttcgtgag aaatacccca ctgtttgact tccagtaaat 4 80
ctgttctcta tttctagttc agttaacctg ctattattga ttctacaatt taagcataat 540
aaagattaat gtctattagt tttctcaatt gatcatgtgg cacgtatttt agcag 595
<210> 14
<211> 145
<212> DNA
<213> Oryza sativa
60
<400> 14
gtgcgaaatt tttttttgtg ggtttttttg gctgcttcca tttcgcaatc cactgatggagtacgttgct agcagtcgtt gcaatttctc agtaatttta ccgatttact atttatgcaa 120gcttacactg gtgaattttt ttcag 145<210> 15<211> 314<212> DNA<213> Oryza sativa
<400> 15
gtactatgaa tatatgtcta gttacattttcctctgcttg ttttgcatta catgtatttgaacatttaga tcttattcgg ttaatcccatacattattcc tcttcttccc taattaaataaatgattaat ttttctagtc ctctcttgtggctcatatac gcag
gcacttcaat atatatgtgt agcttctgcc 60cttgttggag aagtagatag ctatatctta 120atgcgtgaaa ttagagggga ttaattccac 180accttatagg tggaattagc cgaataagtc 240agtggattga ttaattacta cttagaattg 300 314
<210> 16
<211> 652
<212> DNA
<213> Oryza sativa
<400> 16
gtaatttttt gctccaaatc catctccttttttgctttac cttcttcttt ttttttctttttgttgttct gttccgagta aaaagaatactgtgaagctc ttcgaaagga aaaggtttagagtcgatccg gtggtgaatc gaacaatttaaaagaaaatt cctttctgtt attggtggtattcttcagaa atgatctgaa gtctgaagataactgtgatg aatatagcag cgttgactggtgtagaaaca agaaatttga tgaatataaccagcttaaaa caacactgaa gccacgttgtcatgcgaaaa tattcagtgc gacctaacct
ctcttctttt ctgctgttac ccgccgtatc 60tttttttttg cgaatccatc ttgctttagt 120ccttgatggc ctagtctgac caaaaaggag 180acaatacgag cctcagatgc tcggttgctt 240attcactgat gctgttaatc tttttcttta 300ttttcttcaa cataaacata tatctgaaga 360ttcagcgtgg cgccttagct gatttattgt 420gtacagtaca attacttgca catcctatta 480aaggaattct taatgtttat ggccttaaat 540tgttaaatga aggtgactgc taccttagtt 600aattctactg aaacgaattc ag 652
<210> 17
<211> 268
<212> DNA
<213> Oryza sativa
<400> 17
gtaaaaaact cactggagat taagaacaattccaatttac atgctctatt gaattgatggtggatttcaa caagtgttct gatgatgaaaagaatccact tgcatgtagt agagggatttcaagcagctg ttttcttgtt tggtccag
tattaatttc attcttgatt cagtacatgg 60tgtcttaatt tggaaaacat tttgcatgga 120gcctgactgt tctttacttt cttcagacaa 180gaagttattc ttatgttttc ttggttaaat 240
268
<210> 18<211> 546<212> DNA
<213> Qryza sativa
<400> 18
gtacgtacga tgaacaaaga acaaacccct aaattgctct ttctatatgc gatttctaga 60gtatttattt atttatttat gaggggggat tccgccgttc taaattggtg ggtcatagga 120gagattaggt ccgattgttc tcgtggtgaa attaatacta tgcgctcacg tacgctacct 180ctggattaat tcaccattca aacaaaatca aggcagaaca aatggtatat atctgctatt 240tttgtcagcg ccaatctgca aattaacaat gctttacata ttggagagtg tcttgctgtt 300cttcatgttt gtctcagtta gtcagttagc agcttctttt tttaatttct ttagcgaaat 360tcgttatatc tggtgacata cggacagggt cgactaatat aggttcatgg tcgcggccta 420ctgcaatctg catctgcaat ttgattcacg gtctatttgg ctccttcgta gagacattaa 480aaatattggt tgtgtttgta tgatcaagag aactttcatc tgaactttga ttggttgtgt 540tcacag 546<210> 19 <211> 812 <212> DNA <213> Oryza sativa <400> 19 gtaggaaaat tggaagcaat ttaacatgca ttatgcttat caatcatcct gtgcatgcat 60gtcagctagc ttacttcata gagcattaga gcttatagtt catctgatca gaactagttg 120tctgggaggt taattatgca tgtgtgttca agaactcagc cagctaataa cccgttctag 180ggactcgatc atcaagtgca tgaatgcatg gtgtgcatgc ttgaggttca tatggttaat 240taagatttct cagcaagatt aattgttgat gaaaaaggca agcaaattaa acatatatat 300gatcttttgg tgtgtgttgc gttgctgttc acaagtggat gtatgtgacc ctgcgtctgc 360tgttcatttt agttacatat gcctagttgt tattttgtat ggcagttact ttcaagttag 420ttaaaggctt tctaaacaag ccctatgtat atatatttct gtgttagctt aggcatcatt 480ttctttacct tttgtacaaa tttccaagtg gtcaaagcaa tcttaactct tccttgctac 540tagctctttc gcacctgact ttattagaag cttatattat aaaaaatttc tccttccttt 600ctcgagctgg cgtctgcaaa aataccgatt tttacaagca catgagtcta gtagggtgct 660ccacccgcat gcaaaaagca aatttggtcg tctataaaaa ccttttgtat agtagtgtgg 720ttttaattat ttttataatt cgcaaagttg tttttaactt ggactgttca tttggtgttt 780tcactagtta atacagtctt ttttttcttc ag 812<210> 20 <211> 371 <212> DNA <213> Oryza sativa <400> 20 gtaagttgat ctctctttct tgcttcaatc tgattgtttc cttgctagtt gaaaactact 60attatatact ctgtctttcg tccatcttga gtgatatcat gaattgatac acattctcat 120gaatgaatgt atcaaattcc atctgaaact ctggtagtag ctgcacacac atttcagaat 180tcagactttg cactagcttt gtgcattgagtgtaagagtt gttgaaatat gcttacatacgtactagtga atagtgatta caagatttaatgcaagttca g
<210> 21
<211> 722
<212> DNA
<213> Oryza sativa
<400> 21
gtaagtttat tttgctctaa ttttgggctatgactggtga gtaattttcc ccttattttaatctctttgc atcgttttcg ctttcatttgcagaaatctc tgaggactga agtgtttctcataactaaga ggaatcgaca tggggtctagcatgaatctt ccaagaaaat ctgtatctctttgcaaacta ggataaagat acaagttagtgtgttctttt ccctgcgatt tcttctgaaactttggagtg ttcttctcac ccagtggttttagtagctgc tcattaaatt gcatctttttcgcatccaat ctcttgcaat caatgtgaggggaaagaaag gtgggagtct ttaggtttctag
<210> 22
<211> 388
<212> DNA
<213> Oryza sativa
<400> 22
gtatccatcc atctctgctt tctctctccc
tggaatgtaa agtttggttc ttttttttta
ttcatttagt aacggtgtta ggaaggaagg
ttatcaattt tccttttttt atggctcacc
aaaatctgat tttttttcat atattattca
aaaaaaaata tgagagagaa gaaaaatcag
gtgaaattta atggctgcat gtggacag
<210> 23
<211> 24
<212> DNA
<213> Oryza sativa
atagagaaat taccaaagta gatgtaagca 240aaaaattgta taaaaaatat gattatgaat 300actcctaatc aattaagttt gcatcattga 360 371ccaattgggt ttatatttct ctagtggtgg 60ttgtgttgat gtgaggcctt ggggttttct 120tttagagatt tgttctttga acaaagcatg 180tctgcttgtc actttctccc caattgtgga 240tcttçcattc cacaagattt gcatcttccc 300tacttccttt ctttttctct aggtcttgtc 360agtacaagaa acagtaaagg tgaaagtctt 420aaggtcgcca ttaagaaaaa gctttgcaat 480ctctgcttgt tctcttctga ttaataacag 540ttaatttatt taatttctgt tgatgtgaaa 600ctttcattgg cgtatgagca taaaaagggg 660actcctaaaa attgtttctt tcttatgtgc 720 722tgttgtgttg ggctttcttg ttcatgtcct 60tggtaccttt gtccttcctt tcctcttgat 120atattctttc tgctctgttc ttgattttgt 180ctctttcaga tattgccata tcagaaataa 240tcatactagt tttaaccttt ttttttttga 300catgtttctt gctgttcatc agaagctgta 360 388
<400> 23tttgtgcagc ccgctttcta cgag 24
<210> 24
<211> 21
<212> DNA
<213> Oryza sativa
<400> 24
acggccaacg ggacggtgct a 21
<210> 25
<211> 20
<212> DNA
<213> Oryza sativa
<400> 25
gtcctcgccg gcatcgtcac 20
<210> 26
<211> 19
<212> DNA
<213> Oryza sativa
<400> 26
cagaacggcg ggttgatcc 19
<210> 27
<211> 17
<212> DNA
<213> Oryza sativa
<400> 27
agctcgctcg cggtctt 17
<210> 28
<211> 20
<212> DNA
<213> Oryza sativa
<400> 28
acagggccca agtcgtgtgc 20
<210> 29<211> 20<212> DNA<213> Oryza sativa
<400> 29
aggtctcgcc atcgtcaatg
20
<210> 30
<211> 15
<212> DNA
<213> Oryza sativa
<400> 30
cgagacgggc gttgt 15
<210> 31
<211> 21
<212> DNA
<213> Oryza sativa
<210> 32
<211> 22
<212> DNA
<213> Oryza sativa
<400> 32
ggggttgcag gtgcagttgt cg 22
<210> 33
<211> 20
<212> DNA
<213> Oryza sativa
<400> 31
ggctgcggag gatgcaagat g
21
<400> 33
ggcgtcaaca cctacacctt
20
<210> 34<211> 22<212> DNA
<213> Oryza sativa
<4 00> 34
tgcactgcag catcttgtcg tc
22<210> 35
<211> 22<212> DNA<213> Oryza sativa
<400> 35
ggtggatgcc acggtgcaag ag
<210> 36
<211> 17
<212> DNA
<213> Oryza sativa
<400> 36
ggggaggtac tgtgctc
<210> 37
<211> 18
<212> DNA
<213> Oryza sativa
<400> 37
tgcggaagcc aatgctga
<210> 38
<211> 22
<212> DNA
<213> Oryza sativa
<400> 38
ccagccctga actaggaacg tc
<210> 39
<211> 18
<212> DNA
<213> Oryza 'sativa
<400> 39
tcaggggagg catgcaaa
<210> 40
<211> 22
<212> DNA
<213> Oryza sativa<400> 40tgcataccac cacggagacg aa
<210> 41
<211> 22
<212> DNA
<213> Oryza sativa
<400> 41
cgatttctcc aaaggcgagc ac
<210> 42
<211> 19
<212> DNA
<213> Oryza sativa
<400> 42
tgcgggtatg cgtccaaca
<210> 43
<211> 22
<212> DNA
<213> Oryza sativa
<400> 43
acagccacca ccaagacctt cg
<210> 44
<211> 22
<212> DNA
<213> Oryza sativa
<400> 44
ctgcagctgg tgccacactt gc
<210> 45
<211> 22
<212> DNA
<213> Oryza sativa
<400> 45
tcccaactgc cttcgatccc tt
<210> 46<211> 24<212> DNA
<213> Oryza sativa
<400> 46
tggacagtgg tcaggctctt acgg
24
<210> 47
<211> 22
<212> DNA
<213> Oryza sativa
<400> 47
gagttctacc agttcagcga cc 22
<210> 48
<211> 17
<212> DNA
<213> Oryza sativa
<210> 49
<211> 16
<212> DNA
<213> Oryza sativa
<400> 49
agaccgcccg caagtc 16
<210> 50
<211> 20
<212> DNA
<213> Oryza sativa
<400> 48
aacccgaagg cgttgac
17
<400> 50
cttgggcatg atggtgacgc
20
<210> 51<211> 24<212> DNA
<213> Oryza sativa
<400> 51
ccaagaggga gtgctgtatg ccaa
24<210> 52
<211> 23
<212> DNA
<213> Oryza sativa
<400> 52
acgaggacca ccacggtacc cat
<210> 53
<211> 35
<212> DNA
<213> Oryza sativa
<400> 53
cccgggcacc ctgcggaggg taagatccga tcacc
<210> 54
<211> 30
<212> DNA
<213> Oryza sativa
<400> 54
cggaccggta catcttgcat ctgcatgtac
<210> 55
<211> 35
<212> DNA
<213> Oryza sativa
<400> 55
cccgggcacc cttcaccagg ttcgtgctga tttag
<210> 56
<211> 29
<212> DNA
<213> Oryza sativa
<400> 56
cggaccgaac cagcctgcgc aaataacag
<210> 57
<211> 32
<212> DNA
<213> Oryza sativa<400> 57
cccgggcacc tcctgaggag tgcacaggtt tg 32
<210> 58
<211> 32
<212> DNA
<213> Oryza sativa
<400> 58
cggaccggga gataacaatc ccctcctgca tg 32
<210> 59
<211> 32
<212> DNA
<213> Oryza sativa
<400> 59
cccgggcacc cagcttgtgg aagaagggta tg 32
<210> 60
<211> 31
<212> DNA
<213> Oryza sativa
<400> 60
cggaccggtt gttggtgctg aaatatacat c 31
<210> 61
<211> 46
<212> DNA
<213> Oryza sativa
<400> 61
cggggtaccg agctctctgg tggctgaggt aagttctgtt attacc 4 6
<210> 62
<211> 33
<212> DNA
<213> Oryza sativa
<400> 62
cggggatccg gacaggaaaa cctgaaaaca ggg 33
<210> 63<211> 43
<212> DNA
<213> Oryza sativa
<400> 63
cggggtaccg agctcgacga tttaggtaag tcattattgt ctc
43
<210> 64
<211> 31
<212> DNA
<213> Oryza sativa
<400> 64
cggggatcct cactgaaacc tgcagtgtag g 31
<210> 65
<211> 40
<212> DNA
<213> Oryza sativa
<210> 66
<211> 31
<212> DNA
<213> Oryza sativa
<400> 66
cggggatccg taactcaacc tgtttttttt a 31
<210> 67
<211> 41
<212> DNA
<213> Oryza sativa
<400> 65
cggggtaccg agctcgatcc taaggtaagc actctagctg
40
<400> 67
cggggtaccg agctccaatg gctaggtaag tatatgcttc c
41
<210> 68<211> 31<212> DNA
<213> Oryza sativa
<400> 68cggggatccc ccatcaagta cctgttttaa g
<210> 69
<211> 38
<212> DNA
<213> Oryza sativa
<400> 69
cggggtaccg agctcgaata cctaggtaag tccatctc
<210> 70
<211> 35
<212> DNA
<213> Oryza sativa
<400> 70
cggggatccc acacaagcga cctggaaaaa taagc
<210> 71
<211> 42
<212> DNA
<213> Oryza sativa
<400> 71
cggggtaccg agctcccatc tttttaggta agtatctttg cg
<210> 72
<211> 30
<212> DNA
<213> Oryza sativa
<400> 72
cggggatccg gtaaagaacc tgtttaatac
<210> 73
<211> 46
<212> DNA
<213> Oryza sativa
<400> 73
cggggtaccg agctctgaac aggaaggtaa gttctggctt tcttgc
<210> 74<211> 33<212> DNA<213> Oryza sativa<400> 74
cggggatcct cagatcgacc tggacacaaa cgc
<210> 75
<211> 5
<212> RNA
<213> Oryza sativa
<400> 75curay
<210> 76
<211> 5
<212> RNA
<213> Oryza sativa
<400> 76yuray
<210> 77
<211> 15
<212> DNA
< 213 > sítio de emenda 5' preferido
<400> 77agaggtagta gtgtc
<210> 78
<211> 2
<212> DNA
<213> dinucleotídeo de sítio de emenda 5'
<400> 78gt
<210> 79
<211> 3
<212> DNA
< 213 > trinucleotídeo de sítio de emenda 3'
<400> 79cag<210> 80
<211> 8
<212> DNA
<213> Oryza sativa
<400> 80aggtaagt
<210> 81
<211> 5
<212> DNA
<213> Oryza sativa.
<400> 81caggt
<210> 82
<211> 640
<212> DNA
<213> Oryza sativa
<400> 82
gctgccagtg cggcagcggc tgcggagggtttcttgatct gtcatgtata ataactgtcttggatctcgg aagggatatt gttcgtttgcatgaatttgt gtttatccat gttgttgatcatgtgttgta tgtgtcatat gtgtgcctctgttatggact caatagtctg tgaacaaatcgatctttctt gagaggaaaa agttcatgattgtgatgatg atcttacttg agaggaaaaactcctttcca ccgttattaa atgaggagcattttttatcc cctcttcttt gaacagacaattgtacatgc agatgcaaga tgtacccgga
aagatccgat caccatcttc tgaatttctg 60agtcttggtg ttggtgagat ggaaattcgg 120tggggttttt tttgtgtgtt gtgatccgta 180ttggtatgta ttcatgacat attgácatgc 240ccttgggatt tgttttggat aatagaacat 300tttttttaga tggtggccaa atctgatgat 360agaaaaatct tttttgagat ggtggcttaa 420aaagattcat tataggagat tttgatttag 480tgcatgctga tggctgataa ggatctgatt 540gaaataggct ctgaatttct gattgattat 600gatggctgag 640
<210> 83
<211> 770
<212> DNA
<213> Oryza sativa
<400> 83
tcgtcgccgt cttcaccagg ttcgtgctgaggtttctagt ctactgcctt cagatgttactaggatcttt gttgttgaga ttgttagatcggatgcaatc attttgtagt cacttttttttgcggccttc tgcagccaag attttgtaca
tttagtgatt tcccagcatt agattttgtt 60tgtattttct tttagaagga gatgttcata 120tggccaggaa tggctcatat ttactgaatt 180ttaagtttct gattagaatg aatatttaag 240aacctagtac tactgaataa tgatgaaata 300tacaaatgta gttttggatt actgtggact ggtagtgcta gatctgactg catgtgcatg 360ttatttatat tatatatacg gtttacaaac tgaatacaag taatgaattc tgcactggta 420cagatgcttg ttgtggtagc aaagtttcac aaaaaaaata aaaaacctac atcttactag 480atctattggc gcgagcgcgt agatctgatt atcgcgcata tttcattaag tccaattaaa 540tggtcaaaac taatcatttc atatctacaa tgaaattttt aattcatctc aatgcaaaca 600gatcatatat ggtcttttta agtggctaat agcaaatttt cttattatgc gcaaatgctc 660aagtgctaaa attatcttat tgagatattt ataggctgag ttgatagatc tggcctgata 720tttttgttga cactgttatt tgcgcaggct ggttaacctc ggaaagggaa 770
60120
<210> 84
<211> 150
<212> DNA
<213> Oryza sativa
<400> 84
tgaggatgtc ctgaggagtg cacaggtttg aatcagattc agatttcatt gcatcacagagatccatctt tactctaccg cttgctctaa cttaacttgt aattgttttt tatcatgcaggaggggattg ttatctcccc atgggttgcc 150
<210> 85
<211> 189
<212> DNA
<213> Oryza sativa
<400> 85
cttgcagttc aaggaacagc ttgtggaaga aggtatgaaa tctgcataat tgggatacta 60
aaaacatata ttcttaaaat ttaaaactta attttattat ttttctttta tcgatatata 120tgtcattgta atatctctga tgtatatttc agcaccaaca acaactttgt gcttgagctggatttcgag
<210> 86
<211> 290
<212> DNA
<213> Oryza sativa
<400> 86
gtgcaaattt gaaaggtgca tttctggtgg ctgtggtaag ttctgttatt acctcataaa
180189
60
ctgcctgctg ataatacttt aacaatgtgc taatattagt ctttgtaata agatagtact 120
atactgaaaa tattttagcg agtatgagta atttaactta catattgtat tgctgttcct 180
cttttttcaa ccctgtcata ttggttgctt tttttcacag cctaacatgc tcttgtttgg 240
tcattttccc ctgttttcag attttcctgt ccctgtgctt ggttataact 290
<210> 87<211> 246<212> DNA<213> Oryza sativa
<400> 87
tctggtggct gaggtaagtt ctgttattac ctcataaact gcctgctgat aatactttaa 60caatgtgcta atattagtct ttgtaataag atagtactat actgaaaata ttttagcgag 120tatgagtaat ttaacttaca tattgtattg ctgttcctct ttttcaaccc tgtcatattg 180gttgcttttt ttcacagcct aacatgctct tgtttggtca ttttcccctg ttttcaggtt 240ttcctg 246<210> 88 <211> 838 <212> DNA <213> Oryza sativa <400> 88 gtgagtcatt attgtctcat tatttgatcg atctgtgagt cattattgtc tcattatttg 60atcgatctct gattctctga ttcttttctt tttaagctta attggcagcc ggatggctgc 120aaatccccat cgaaggtaaa tgcttgcctt atatatatga gtatctctct actttctcca 180tcctaaaata gtttagtacg tataatacta tattagaaat aatctaatat aatgaatctc 240agatatcatt attattttat gttgtaattt gtgtgtatat atcattggtc tgatgtacta 300ctttcctttc atattataag tttctctttt ttcgctattt ttctactcaa ttttctttag 360atttgactag gttcataaaa aaattaacaa tatttgcaac gctaaattag tttcattaaa 420tataacattg agagaaattt ttggtacatg agaatgtacc tgaagatacc taaattttac 480actaaaagtt ttgatttctc aagatactta ttagtatatg gaggtactaa gttttatact 540agaaaatatg tatctcttag tactttttca agaatgataa aattactcta atattaaata 600tattttgata atatgtttgc tttgtgttaa aaatattact atattttctt tataaactta 660actaaactta aaaaggttta actaataaaa tagtgaaagc gacctataac aattataaat 720ggagggagca gtagcgtgaa atctgaatat aattattttc tctctttctg acgtcactag 780ctaacttggt cacctacact gcagggttca gcgagtcgtc gaagctccgg gcgtgctg 838<210> 89 <211> 788 <212> DNA <213> Oryza sativa <400> 89 gacgatttag gtaagtcatt attgtctcat tatttgatcg atctctgatt ctctgattct 60tttcttttta agcttaattg gcagccggat gctgaatccc catcgaaggt aaatgcttgc 120cttatatata tgagtatctc tctactttct ccatcctaaa atagtttagt acgtataata 180ctatattaga aataatctaa tataatgaat ctcagatatc attattattt tatgttgtaa 240tttgtgtgta tatatcattg gtctgatgta ctactttcct ttcatattat aagtttctct 300tttttcgcta tttttctact caattttctt tagatttgac taggttcata aaaaaattaa 360caatatttgc aacgctaaat tagtttcatt aaatataaca ttgagagaaa tttttggtac 420atgagaatgt acctgaagàt acctaaattt tacactaaaa gttttgattt ctcaagatac 480ttattagtat atggaggtac taagttttat actagaaaat atgtatctct tagtactttt 540tcaagaatga taaaattact ctaatattaa atatattttg ataatatgtt tgctttgtgt
taaaaatatt actatatttt ctttataaac ttaactaaac ttaaaaaggt ttaactaata
aaatagtgaa agcgacctat aacaattata aatggaggga gcagtagcgt gaaatctgaa
tataattatt ttctctcttt ctgacgtcac tagctaactt ggtcacctac actgcaggtttcagtgac
600660720780788
<210> 90
<211> 775
<212> DNA
<213> Oryza sativa
<400> 90
actagtgctg aagcaattct gaagctaatc aatggtgagc actatagctg tttgatgcaa 60
aatcataatt gctgtatgtt actgtaatag attgatctgg acatataaaa acgatcctga 120
tgtcacttat ttttttcctt caagatgtat tgcagtatgg aagcagcttt atgcagaatt 180
ttagtgctta taggcaattt tctaaaggag ttctcaggat aatgattatt catgtatact 240
gagcttaaat atatgcagtg ttaataggca acaactatcc gttgttatag gtgcagtaat 300
atacttcact gtgcattgcc cttggtatcc ttttattaat tatgcatttg gtgcagtact 360
gtactgtact gtactgtact gtactgtgca ctgttgttgg tatcctttat tgatcgtgca 420
tttggattgc ctttttttaa ttccaaggtt tctcttggga gtatttgtgt aggactcatg 480
catatatcac ttatgttcca ttttataatc tttcaccctg tatctaattc ctttaattta 540
tgaaaaatat aatccagata ttccctagtt ttaacaacat tgaatatttg aatgttagaa 600
catgatttac attcatttgg ctaactattt ttttaacaag tgatctcaca tgttgactga 660
agtttcataa gtaaacagta ttatcttgtt ttcttctata tatttacatt tttcacgctg 720
atttactcct tgttttttaa aaaaaacagg atcatcctcg acatatccta atttc 775
<210> 91
<211> 734
<212> DNA
<213> Oryza sativa
<400> 91
gatcctaagg taagtactat agctgtttga tgcaaaatca taattgctgt atgttactgt
aatagattga tctggacata taaaaacgat cctgatgtca cttatttttt tccttcaaga
tgtattgcag tatggaagca gctttatgca gaattttagt gcttataggc aattttctaa
aggagttctc aggataatga ttattcatgt atactgagct taaatatatg cagtgttaat
aggcaacaac tatccgttgt tataggtgca gtaatatact tcactgtgca ttgcccttgg
tatcctttta ttaattatgc atttggtgca gtactgtact gtactgtact gtactgtact
gtgcactgtt gttggtatcc tttattgatc gtgcatttgg attgcctttt tttaattcca
aggtttctct tgggagtatt tgtgtaggac tcatgcatat atcacttatg ttccatttta
taatctttca ccctgtatct aattccttta atttatgaaa aatataatcc agatattccc
tagttttaac aacattgaat atttgaatgt tagaacatga tttacattca tttggctaac
tattttttta acaagtgatc tcacatgttg actgaagttt cataagtaaa cagtattatc
ttgttttctt ctatatattt acatttttca cgctgattta ctccttgttt tttaaaaaaaacaggttgag ttac
60120180240300360420480540600660720734<210> 92<211> 400<212> DNA<213> Oryza sativa
<400> 92 ttgaggcagc tgtcgagcaa ttcaatggct atgtgagtat atgcttccat acttctaagt 60cattattttt gctccatgtt ggtatatggg ctggctaaaa atatattgca taaagtgcgc 120tcctatttca tctctttggt ttgcatgctg tggcttgcat tctttcaaga taactgtagc 180tgaggttgct cgatatgaac ctgcttgctt gttttaatcc ttgtttgctt ttagcttatt 240catgactaga aaacaaactt taatttactc ttttctggca tgttgctgga catatgttgt 300gttatatcct atacaacatc attgaattgt gcttaactaa tttgctgatt tcatttctta 360aaacagatac ttgatgggag atctttgagg gttaactcag 400<210> 93 <211> 356 <212> DNA <213> Oryza sativa <400> 93 caatggctag gtaagtatat gcttccatac ttctaagtca ttatttttgc tccatgttgg 60tatatgggct ggctaaaaat atattgcata aagtgcgctc ctatttcatc tctttggttt 120gcatgctgtg gcttgcattc tttcaagata actgtagctg aggttgctcg atatgaacct 180gcttgcttgt tttaatcctt gtttgctttt agcttattca tgactagaaa acaaacttta 240atttactctt ttctggcatg ttgctggaca tatgttgtgt tatatcctat acaacatcat 300tgaattgtgc ttaactaatt tgctgatttc atttcttaaa acaggtactt gatggg 356<210> 94 <211> 600 <212> DNA <213> Oryza sativa <400> 94 cgtggaagct tggagaacca tctttttagg agtaagaatc tttgcgtcct actgtcagtc 60atttttttct tcccatttgt tgccaacagt ttggagttct ttcattgttc acggtagcag 120tttttcttgt agtacctgca tttttatatg cacttttcta tattgtactc tgctctagtg 180atgtagttga ttatttattt tattcatatt ttgtagcaat tctgttgtac tgtatacttg 240aatgtctgac agtttggcat ttaagagttc attaagaaat ggctgacacc ttactaactg 300ttcattacga tttctggcag tcaataaggg tgttaggtgg tgctatgtta catgtttcca 360attccaaatg atgtattttt ggtgttttat tattaccgac taaatacctt gggtgcaact 420ctttgttctc ctcctttaga caatgtagtt tatgcactgt tattgctgtg ttgcgttaaa 480tttggcccaa ctgtttcatt tcagtataac tctattctga agtgtcttgt atttatctga 540tatttgtctt ggataattgt attaaacagg gtctttacct ctcccatggg ccatcagaat 600<210> 95<211> 560<212> DNA<213> Oryza sativa
<400> 95
ccatcttttt aggtaagtat ctttgcgtcc tactgtcagt catttttttc ttcccatttg 60ttgccaacag tttggagttc tttcattgtt cacggtagca gtttttcttg tagtacctgc 120atttttatat gcacttttct atattgtact ctgctctagt gatgtagttg attatttatt 180ttattcatat tttgtagcaa ttctgttgta ctgtatactt gaatgtctga cagtttggca 240tttaagagtt cattaagaaa tggctgacac cttactaact gttcattacg atttctggca 300gtcaataagg gtgttaggtg gtgctatgtt acatgtttcc aattccaaat gatgtatttt 360tggtgtttta ttattaccga ctaaatacct tgggtgcaac tctttgttct cctcctttag 420acaatgtagt ttatgcactg ttattgctgt gttgcgttaa atttggcccà actgtttcat 480ttcagtataa ctctattctg aagtgtcttg tatttatctg atatttgtct tggataattg 540tattaaacag gttctttacc 560<210> 96 <211> 400 <212> DNA <213> Oryza sativa <400> 96 actagttagc atacccatcc atgatgagca tgatggtaaa ttctggcttt cttgcttttg 60gataaatttt gcttcctttc ttaacttgag cacaagcttg tgttatatgt ggtgtgaaat 120cttggttgcc atgttgtgag gatttagcta gagagtcaag aaagaggaat atatgcttta 180tgtagatagg agtaggatct ctgggtcttt aaacatcacc atgacaagca aagataagaa 240caggagagca gttcttgatt attatttttc ttctcatcaa gaaattaagc cggagataga 300catggcagct gcacgcagtg attcacttct tgatttcttg atttgggttg ttgcgtttgt 360gtccagaccg atctgagctg cgggccatcg tcgatgacgg 400<210> 97 <211> 352 <212> DNA <213> Oryza sativa <400> 97 tgaacaggaa ggtaagttct ggctttcttg cttttggata aattttgctt cctttcttaa 60cttgagcaca agcttgtgtt atatgtggtg tggaatcttg gttgccatgt tgtgaggatt 120tagctagaga gtcaagaaag aggaatatat gctttatgta gataggagta ggatctctgg 180gtctttaaac atcaccatga caagcaaaga taagaacagg agagcagttc ttgattatta 240tttttcttct catcaagaaa ttaagccgga gatagacatg gcagctgcac gcagtgattc 300acttcttgat ttcttgattt gggttgttgc gtttgtgtcc aggtcgatct ga 352
<210> 98<211> 1013
<212> DNA
<213> Oryza sativa
<400> 98
atcgtaactt tatttccgag gaaattgtaa gatctcgcgc gacctgtttg ttcttcttgg 60tgttcttctg cctagttact tcgtttgttt tatgtttgat ctatagtctt gatgatctgt 120gaagactagt tgttgttttc ggtacggatg gtaggaaagg tattttcctt tgtttaagga 180attgcaagat ctcgcgcgac ctgttcttga tgttctgtct agtacttcgt ttgtttgttt 240gatctagtat gttagatgat ctatgaaaag tagttatttt cggtacgaat ggtaggagaa 300gtattttcct ttgttggcgt caaaatataa tctttaatca ctcagtcttg tgaatggtaa 360ttctgaattc atatttttct tttctgatct atatcgtgtt attctgttta tgattttttg 420ctgagtagat ccccttgtgc tcgatgtatg ataagttatc tatatcgtaa tagattcgta 480tgtcaaaact tagtcgaaat tttcgatctc atctcttctg ttagccacag gtggctgatt 540gaaatattct tcaattgagt ctgaattttt atgttatatg caaataattg tcccgctcca 600gttcatatgt ctgatgaaac atgaatgtaa aggaattaag actttggtta tatgattcga 660gtctgaattt tcttatgctt atgcaaataa tagtccaaaa gaattggtga tttttttgtg 720tagttcatat ggttgataaa tatgaatgtg tctcaaaagc aacgaagatt ttgatgacaa 780gacaatctgc tatttgagtc tgaaatttct tatgcttttg caaataatag tcatagtcag 840aacgaattac tgaaatttcc ctccagttca tacggttgat gaaacatgaa tgtatctctt 900tagtaattga aactttgacg atcagacaat ctgttgcatt gcctagtctt gcagattctc 960atcgatcctt ttaattcttc tctgcagtca acaaattgat gcactaatgg agt 1013<210> 99 <211> 645 <212> DNA <213> Oryza sativa <400> 99 cagcacaaca caccaaggaa gctgaggtga gaacgattga ttactttgct ggctgctctt 60agctactact acaactgttt tgtcttaatc ggttgattac atctcatatt tcatcggttt 120agctcgctct gttaagattt ctcacctcct cttggatgta ttattcatgt atatgttgtg 180tggtctggct aagtttttgg tctgtcctga taaatgctgt ttaaggattc tttctttgtt 240Cttttttttt atggacaaaa tataatcttt gtgccttact gtgaattgag tctgttggct 300atatcgttcc cggtttattg gactatagat gaacatgtaa ccctatatgc ggttgtgttt 360tctccttaca aagatcagta gtacctaatt cagctagtta gaagtggtac caaggctgta 420aatttccatc tttttctctg tgaggttcat ttccctttta atctctgttt cgtgagaaat 480accccactgt ttgacttcca gtaaatctgt tctctatttc tagttcagtt aacctgctat 540tattgattct acaatttaag cataataaag attaatgtct attagttttc tcaattgatc 600atgtggcacg tattttagca ggtgcgttga tttcttgata tcatg 645
<210> 100
<211> 196
<212> DNA
<213> Oryza sativa<400> 100
cctctcggca tccagggaaa accaaggtgc gaaatttttt tttgtgggtt tttttggctg 60cttccatttc gcaatccact gatggagtac gttgctagca gtcgttgcaa tttctcagta 120attttaccga tttactattt atgcaagctt acactggtga atttttttca gggtaaatta 180ggcctgcgtg attcaa 196<210> 101 <211> 365 <212> DNA <213> Oryza sativa <400> 101 tccaagtgtc aagtacttac gaaacggtac tatgaatata tgtctagtta cattttgcac 60ttcaatatat atgtgtagct tctgcccctc tgcttgtttt gcattacatg tatttgcttg 120ttggagaagt agatagctat atcttaaaca tttagatctt attcggttaa tcccatatgc 180gtgaaattag aggggattaa ttccacacat tattcctctt cttccctaat taaataacct 240tataggtgga attagccgaa taagtcaatg attaattttt ctagtcctct cttgtgagtg 300gattgattaa ttactactta gaattggctc atatacgcag aatatgccgg cattggtgaa 360gatcg 365<210> 102 <211> 701 <212> DNA <213> Oryza sativa <400> 102 ttttgttgtt ctgctggtct tgctcggtaa ttttttgctc caaatccatc tcctttctct 60tcttttctgc tgttacccgc cgtatctttg ctttaccttc ttcttttttt ttcttttttt 120tttttgcgaa tccatcttgc tttagtttgt tgttctgttc cgagtaaaaa gaataccctt 180gatggcctag tctgaccaaa aaggagtgtg aagctcttcg aaaggaaaag gtttagacaa 240tacgagcctc agatgctcgg ttgcttagtc gatccggtgg tgaatcgaac aatttaattc 300actgatgctg ttaatctttt tctttaaaag aaaattcctt tctgttattg gtggtatttt 360cttcaacata aacatatatc tgaagattct tcagaaatga tctgaagtct gaagatttca 420gcgtggcgcc ttagctgatt tattgtaact gtgatgaata tagcagcgtt gactgggtac 480agtacaatta cttgcacatc ctattatgta gaaacaagaa atttgatgaa tataacaagg 540aattcttaat gtttatggcc ttaaatcagc ttaaaacaac actgaagcca cgttgttgtt 600aaatgaaggt gactgctacc ttagttcatg cgaaaatatt cagtgcgacc taacctaatt 660ctactgaaac gaattcagcg tgcaaagaga tgccggagca c 701
<210> 103
<211> 329
<212> DNA
<213> Oryza sativa<400> 103 aggggtcagg cactgcctgc tacaaggtaa aaaactcact ggagattaag aacaattatt 60aatttcattc ttgattcagt acatggtcca atttacatgc tctattgaat tgatggtgtc 120ttaatttgga aaacattttg catggatgga tttcaacaag tgttctgatg atgaaagcct 180gactgttctt tactttcttc agacaaagaa tccacttgca tgtagtagag ggatttgaag 240ttattcttat gttttcttgg ttaaatcaag cagctgtttt cttgtttggt ccagagtggt 300gtaggtgatt cggctagctc agcgcgaag 329<210> 104 <211> 593 <212> DNA <213> Oryza sativa <400> 104 ctcgctcccg cgctgtcttc ggtgaggtac gtacgatgaa caaagaacaa acccctaaat 60tgctctttct atatgcgatt tctagagtat ttatttattt atttatgagg ggggattccg 120ccgttctaaa ttggtgggtc ataggagaga ttaggtccga ttgttctcgt ggtgaaatta 180atactatgcg ctcacgtacg ctacctctgg attaattcac cattcaaaca aaatcaaggc 240agaacaaatg gtatatatct gctatttttg tcagcgccaa tctgcaaatt aacaatgctt 300tacatattgg agagtgtctt gctgttcttc atgtttgtct cagttagtca gttagcagct 360tcttttttta atttctttag cgaaattcgt tatatctggt gacatacgga cagggtcgac 420taatataggt tcatggtcgc ggcctactgc aatctgcatc tgcaatttga ttcacggtct 480atttggctcc ttcgtagaga cattaaaaat attggttgtg tttgtatgat caagagaact 540ttcatctgaa ctttgattgg ttgtgttcac agttgctgga gttgagttag aca 593<210> 105 <211> 864 <212> DNA <213> Oryza sativa <400> 105 agacaaggaa ggccacctcc cctaaggtag gaaaattgga agcaatttaa catgcattat 60gcttatcaat catcctgtgc atgcatgtca gctagcttac ttcatagagc attagagctt 120atagttcatc tgatcagaac tagttgtctg ggaggttaat tatgcatgtg tgttcaagaa 180ctcagccagc taataacccg ttctagggac tcgatcatca agtgcatgaa tgcatggtgt 240gcatgcttga ggttcatatg gttaattaag atttctcagc aagattaatt gttgatgaaa 300aaggcaagca aattaaacat atatatgatc ttttggtgtg tgttgcgttg ctgttcacaa 360gtggatgtat gtgaccctgc gtctgctgtt cattttagtt acatatgcct agttgttatt 420ttgtatggca gttactttca agttagttaa aggctttcta aacaagccct atgtatatat 480atttctgtgt tagcttaggc atcattttct ttaccttttg tacaaatttc caagtggtca 540aagcaatctt aactcttcct tgctactagc tctttcgcac ctgactttat tagaagctta 600tattataaaa aatttctcct tcctttctcg agctggcgtc tgcaaaaata ccgattttta 660caagcacatg agtctagtag ggtgctccac ccgcatgcaa aaagcaaatt tggtcgtcta 720taaaaacctt ttgtatagta gtgtggtttt aattattttt ataattcgca aagttgtttt 780taacttggac tgttcatttg gtgttttcac tagttaatac agtctttttt ttcttcagag 840ctcaatgact agtagcacag ggcc 864<210> 106 <211> 424 <212> DNA <213> Oryza sativa <400> 106 cttattaatt tacctctaca gaagaagtaa gttgatctct ctttcttgct tcaatctgat 60tgtttccttg ctagttgaaa actactatta tatactctgt ctttcgtcca tcttgagtga 120tatcatgaat tgatacacat tctcatgaat gaatgtatca aattccatct gaaactctgg 180tagtagctgc acacacattt cagaattcag actttgcact agctttgtgc attgagatag 240agaaattacc aaagtagatg taagcatgta agagttgttg aaatatgctt acatacaaaa 300attgtataaa aaatatgatt atgaatgtac tagtgaatag tgattacaag atttaaactc 360ctaatcaatt aagtttgcat cattgatgca agttcaggca ttacagacat tgagattcat 420ttcc 424<210> 107 <211> 773 <212> DNA <213> Oryza sativa <400> 107 gcttggagct tgagctttct gaatttgtaa gtttattttg ctctaatttt gggctaccaa 60ttgggtttat atttctctag tggtggtgac tggtgagtaa ttttcccctt attttattgt 120gttgatgtga ggccttgggg ttttctatct ctttgcatcg ttttcgcttt catttgttta 180gagatttgtt ctttgaacaa agcatgcaga aatctctgag gactgaagtg tttctctctg 240cttgtcactt tctccccaat tgtggaataa ctaagaggaa tcgacatggg gtctagtctt 300ccattccaca agatttgcat cttccccatg aatcttccaa gaaaatctgt atctcttact 360tcctttcttt ttctctaggt cttgtcttgc aaactaggat aaagatacaa gttagtagta 420caagaaacag taaaggtgaa agtcttgtgt tcttttccct gcgatttctt ctgaaaaagg 480tcgccattaa gaaaaagctt tgcaatcttt ggagtgttct tctcacccag tggtttctct 540gcttgttctc ttctgattaa taacagtagt agctgctcat taaattgcat ctttttttaa 600tttatttaat ttctgttgat gtgaaacgca tccaatctct tgcaatcaat gtgaggcttt 660cattggcgta tgagcataaa aaggggggaa agaaaggtgg gagtctttag gtttctactc 720ctaaaaattg tttctttctt atgtgcagca gtcggtgtaa ctaatggggg aga 773<210> 108 <211> 442 <212> DNA <213> Oryza sativa <400> 108 ggtctcctgc tctgccatgt ccatgggtat ccatccatct ctgctttctc tctccctgtt 60gtgttgggct ttcttgttca tgtccttgga atgtaaagtt tggttctttt tttttatggt 120aectttgtcc ttcctfctcet cttgatttca tttagtaacg gtgttaggaa ggaaggatat IftO
tctttctgct ctgttcttga ttttgtttat caattttcct ttttttatgg ctcacccfcct 240
Utcagatatt gccatatcag aeataaaaaa tctgattttt tttcafcatat tattcatcat 300
actagtttta accttttttt ttttgaaasa aaaatatgag agagaagaaa aatcagcatg 360
tttcttçctg ttcátcagaa getgtagtga aatttaatgg etgcâtgtgg acagatgaag 420
ggtatggccc tacctgggac ág 442
<210> 109
<211> 67M
<212> DNA
<213 > vetor de expresso pBPSMM291 com base em puc
<220>
<2zí> íermlnaciDr
<222> <920}..(1189)
<2 2 3> sinal de polladenttaçio (temtlnedor) do gene NopeIIne sJrrtase
<220>
<221 > gene
<222> (1250)..(3255)
<223> gene de bete- ^ucxironldfe» cxMTt^tfe o Irrtron Invertas 2 da batata
<22Õ>
<221> Intioti
<222> (3311)£3894)
<223> Intron BPSL1 Inventivo (seqüência é complementar)
<220>
<221> premoter
<222> (3921)..(4356?
< 22 3 > promotor eucaieótico: promotor ds ublqidtJna de Zea mais(seqüência é complementar)
<4ÜÜ> 109
ctttcctgeç ttatcccctg attctgtggataccgctcgc cgcagccgaa cgaccgagcggcgcccaatâ cgc-aaaccgc ctctccccgccgacaggttt cccçsactgga aagcgggcagtagccaggas gagtttgtag aaacgcaaaagtttgatgcc tggcagttia tggcgggcgtâcaâegttcâ aatccgctcc cggcggattteaacagafeaa aacgaaagge ccagtcttccgcagttccct actctcgcgt taacgctageaacgaeggcc agtcttaagc tegggcceea
fcaeccgtatt accgcctttg aqtgagctga 60cagcgogtca gtçagegagg aa^cggaage 120çcgttggccg attcattaat gcagctggca 100tgagcgcaac gcaattaata cgegtaccgc 240aggccatccg tceggatggc cttctgctta 300gçtgcccgcc acccteeggg cogttgcttc 360gtcct.act.ca ggagagcgtt caççgacaaa 420gaetgagcct ttcgttttat ttgatgcctg <530atggatgttt tcccagtcac gacgttgtaa 540aataatg&tt ttattttgec tgatagtgac 600ctgttcgttg caacaaattg atgagcaatg cttttttata atgccaactt tgtacaaaaa 660agcaggctcc gcggccgccc ccttcaccgc tatcgtttaa actgaaggcg ggaaacgaca 720atctgatcca agctcaagct gctctagcat tcgccattca ggctgcgcaa ctgttgggaa 780gggcgatcgg tgcgggcctc ttcgctatta cgccagctgg cgaaaggggg atgtgctgca 840aggcgattaa gttgggtaac gccagggttt tcccagtcac gacgttgtaa aacgacggcc 900agtgccaagc ttgcatgcca attcccgatc tagtaacata gatgacaccg cgcgcgataa 960tttatcctag tttgcgcgct atattttgtt ttctatcgcg tattaaatgt ataattgcgg 1020gactctaatc ataaaaaccc atctcataaa taacgtcatg cattacatgt taattattac 1080atgcttaacg taattcaaca gaaattatat gataatcatc gcaagaccgg caacaggatt 1140caatcttaag aaactttatt gccaaatgtt tgaacgatcg gggaaattcg agctcggtag 1200caattcccga ggctgtagcc gacgatggtg cgccaggaga gttgttgatt cattgtttgc 1260ctccctgctg cggtttttca ccgaagttca tgccagtcca gcgtttttgc agcagaaaag 1320ccgccgactt cggtttgcgg tcgcgagtga agatcccttt cttgttaccg ccaacgcgca 1380atatgccttg cgaggtcgca aaatcggcga aattccatac ctgttcaccg acgacggcgc 1440tgacgcgatc aaagacgcgg tgatacatat ccagccatgc acactgatac tcttcactcc 1500acatgtcggt gtacattgag tgcagcccgg ctaacgtatc cacgccgtat tcggtgatga 1560taatcggctg atgcagtttc tcctgccagg ccagaagttc tttttccagt accttctctg 1620ccgtttccaa atcgccgctt tggacatacc atccgtaata acggttcagg cacagcacat 1680caaagagatc gctgatggta tcggtgtgag cgtcgcagaa cattacattg acgcaggtga 1740tcggacgcgt cgggtcgagt ttacgcgttg cttccgccag tggcgaaata ttcccgtgca 1800cttgcggacg ggtatccggt tcgttggcaa tactccacat caccacgctt gggtggtttt 1860tgtcacgcgc tatcagctct ttaatcgcct gtaagtgcgc ttgctgagtt tccccgttga 1920ctgcctcttc gctgtacagt tctttcggct tgttgcccgc ttcgaaacca atgcctaaag 1980agaggttaaa gccgacagca gcagtttcat caatcaccac gatgccatgt tcatctgccc 2040agtcgagcat ctcttcagcg taagggtaat gcgaggtacg gtaggagttg gccccaatcc 2100agtccattaa tgcgtggtcg tgcaccatca gcacgttatc gaatcctttg ccacgtaagt 2160ccgcatcttc atgacgacca aagccagtaa agtagaacgg tttgtggtta atcaggaact 2220gttggccctt cactgccact gaccggatgc cgacgcgaag cgggtagata tcacactctg 2280tctggctttt ggctgtgacg cacagttcat agagataacc ttcacccggt tgccagaggt 2340gcggattcac cacttgcaaa gtcccgctag tgccttgtcc agttgcaacc acctgttgat 2400ccgcatcacg cagttcaacg ctgacatcac cattggccac cacctgccag tcaacagacg 2460cgtggttaca gtcttgcgcg acatgcgtca ccacggtgat atcgtccacc caggtgttcg 2520gcgtggtgta gagcattacg ctgcgatgga ttccggcata gttaaagaaa tcatggaagt 2580aagactgctt tttcttgccg ttttcgtcgg taatcaccat tcccggcggg atagtctgcc 2640agttcagttc gttgttcaca caaacggtga tacctgcaca tcaacaaatt ttggtcatat 2700attagaaaag ttataaatta aaatatacac acttataaac tacagaaaag caattgctat 2760atactacatt cttttatttt gaaaaaaata tttgaaatat tatattacta ctaattaatg 2820ataattatta tatatatatc aaaggtagaa gcagaaactt acgtacactt ttcccggcaa 2880taacatacgg cgtgacatcg gcttcaaatg gcgtatagcc gccctgatgc tccatcactt 2940cctgattatt gacccacact ttgccgtaat gagtgaccgc atcgaaacgc agcacgatac 3000gctggcctgc ccaacctttc ggtataaaga cttcgcgctg ataccagacg ttgcccgcat 3060aattacgaat atctgcatcg gcgaactgat cgttaaaact gcctggcaca gcaattgccc 3120ggctttcttg taacgcgctt tcccaccaac gctgatcaat tccacagttt tcgcgatcca 3180gactgaatgc ccacaggccg tcgagttttt tgatttcacg ggttggggtt tctacaggac 3240gtaacataag ggactgacca cccaaacctt aaggcgatcg cgctgaggcg gaccgttgta 3300catcttgcat ctgcatgtac aaataatcaa tcagaaattc agagcctatt tcttgtctgt 3360tcaaagaaga ggggataaaa aaaatcagat ccttatcagc catcagcatg catgctcctc 3420atttaatatc ggtggaaagg' agctaaatca aaatctccta taatgaatct tttttttcct 3480ctcaagaaag atcatcatca cattaagcca ccatctcaaa aaagattttt ctatcatgaa 3540ctttttcctc tcaagaaaga tcatcatcag atttggccac catctaaaaa aagatttgtt 3600cacagactat tgagtccata acatgttcta ttatccaaaa caaatcccaa ggagaggcac 3660acatatgaca catacaacac atgcatgtca atatgtcatg aatacatacc aagatcaaca 3720acatggataa acacaaattc tctacggatc acaacacaca aaaaaaaccc cagcaaacga 3780acaatatccc ttccgagatc caccgaattt ccatctcacc aacaccaaga ctagacagtt 3840attatacatg acagatcaag aacagaaatt cagaagatgg tgatcggatc ttaccctccg 3900caggtgaagg cccggggatc tggttgtgtg tgtgtgcgct ccgaacaaca cgaggttggg 3960gaaagagggt gtggaggggg tgtctattta ttacggcggg cgaggaaggg aaagcgaagg 4020agcggtggga aaggaatccc ccgtagctgc cgtgccgtga gaggaggagg aggccgcctg 4080ccgtgccggc tcacgtctgc cgctccgcca cgcaatttct ggatgccgac agcggagcaa 4140gtccaacggt ggagcggaac tctcgagagg ggtccagagg cagcgacaga gatgccgtgc 4200cgtctgcttc gcttggcccg acgcgacgct gctggttcgc tggttggtgt ccgttagact 4260cgtcgacggc gtttaacagg ctggcattat ctactcgaaa caagaaaaat gtttccttag 4320tttttttaat ttcttaaagg gtatttgttt aatttttagt cactttattt tattctattt 4380tatatctaaa ttattaaata aaaaaactaa aatagagttt tagttttctt aatttagagg 4440ctaaaataga ataaaataga tgtactaaaa aaattagtct ataaaaacca ttaaccctaa 4500accctaaatg gatgtactaa taaaatggat gaagtattat ataggtgaag ctatttgcaa 4560aaaaaaagga gaacacatgc acactaaaaa gataaaactg tagagtcctg ttgtcaaaat 4620actcaattgt cctttagacc atgtctaact gttcatttat atgattctct aaaacactga 4680tattattgta gtactataga ttatattatt cgtagagtaa agtttaaata tatgtataaa 4740gatagataaa ctgcacttca aacaagtgtg acaaaaaaaa tatgtggtaa ttttttataa 4800cttagacatg caatgctcat tatctctaga gaggggcacg accgggtcac gctgcactgc 4860aggaattcga tggggatcct ctagagtcga cctgcaggca tgcaagcttg gcgcgccgac 4920ccagctttct tgtacaaagt tggcattata agaaagcatt gcttatcaat ttgttgcaac 4980gaacaggtca ctatcagtca aaataaaatc attatttgcc atccagctga tatcccctat 5040agtgagtcgt attacatggt catagctgtt tcctggcagc tctggcccgt gtctcaaaat 5100ctctgatgtt acattgcaca agataaaaat atatcatcat gaacaataaa actgtctgct 5160tacataaaca gtaatacaag gggtgttatg agccatattc aacgggaaac gtcgaggccg 5220cgattaaatt ccaacatgga tgctgattta tatgggtata aatgggctcg cgataatgtc 5280gggcaatcag gtgcgacaat ctatcgcttg tatgggaagc ccgatgcgcc agagttgttt 5340ctgaaacatg gcaaaggtag cgttgccaat gatgttacag atgagatggt cagactaaac 5400tggctgacgg aatttatgcc tcttccgacc atcaagcatt ttatccgtac tcctgatgat 5460gcatggttac tcaccactgc gatccccgga aaaacagcat tccaggtatt agaagaatat 5520cctgattcag gtgaaaatat tgttgatgcg ctggcagtgt tcctgcgccg gttgcattcg 5580attcctgttt gtaattgtcc ttttaacagc gatcgcgtat ttcgtctcgc tcaggcgcaa 5640tcacgaatga ataacggttt ggttgatgcg agtgattttg atgacgagcg taatggctgg 5700cctgttgaac aagtctggaa agaaatgcat aaacttttgc cattctcacc ggattcagtc 5760gtcactcatg gtgatttctc acttgataac cttatttttg acgaggggaa attaataggt 5820tgtattgatg ttggacgagt cggaatcgca gaccgatacc aggatcttgc catcctatgg 5880aactgcctcg gtgagttttc tccttcatta cagaaacggc tttttcaaaa atatggtatt 5940gataatcctg atatgaataa attgcagttt catttgatgc tcgatgagtt tttctaatca 6000gaattggtta attggttgta acactggcag agcattacgc tgacttgacg ggacggcgca 6060agctcatgac caaaatccct taacgtgagt tacgcgtcgt tccactgagc gtcagacccc 6120gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg 6180caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga gctaccaact 6240ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt ccttctagtg 6300tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata cctcgctctg 6360ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac cgggttggac 6420tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca 6480cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg tgagcattga 6540gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag cggcagggtc 6600ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct ttatagtcct 6660gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc aggggggcgg 6720agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt ttgctggcct 6780tttgctcaca tgtt 6794
<210> 110
<211> 6077
<212> DNA
<213> vetor doe expressão pBPSMM305 com base em puc
<220>
<22l> promotor
<222> (286).. (1350)
<223> promotor eucareótico: promotor da Iadato desidrogenase de milho
gene
<220>
<221> gene
<222> (1369)..(3369)
<223> gene de beta - glucoronldase contendo o Intron Inveitase 2 da batata
<220>
<221> gene
<222> (1369)..(3369)
<2 2 3 > gene de beta - glucoronldase contendo o Intron Invertase 2 da batata
<220>
<221> terminador
<222> (3403)..(3640)
<223> terminador do gene Nopallne sintase
<220>
<221> gene
<222> (4276)..(5136)
<223> gene beta-lactamase<400> 110
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 60
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct 120
cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 180
tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg ccaagctatc 240
gtttaaacct taaggcgatc gcgctgaggc ggaccgcacg tggaattcaa caaatggcgt 300
acttatataa ccacaatgta ctggtgctgc gtcattattt tatactacgc atatattatt 360
ataagtagag aaagctcaca aaaccatgcg cgcgcccccc tgtttgcttt cggtcgctaa 420
ttacaccctt tgtatcgttg gttgatgatg gtctccaccg gccgtacgag tcatcgatcg 480
ttgatttatt tttatcaccg acttgcacgc ctttcgaaca aagacgcaac aaaggaaagc 540
gaaagcacga acgaggttgt tccctgacag ttgggcgact aatacaactg caagacactg 600
aataagcagt aaaaatcaat atagattaaa gttaaacgaa catgctcaac atcgaatact 660
actcatatgt gttattatta agagaatacc accaaggtag aaaagttaaa ggacctaaac 720
tgttgtgccg ggagagttgt gcgacgaaca gatgtaaata tgataaaata agttcaaagt 780
tcatatagat agcacgatca cacttagggc tagtttgaag ccataaaaat ggaagagatt 840
aaatgagata aaattcactt atttaatttt aaataagaag agagttttaa cccctctaat 900
tctctccagt attttagctc ctaaactagc tcttacagca gtaaaagacc cttgatggta 960
gcgtatgcaa agagaaggaa ctattcaatg aattgttttt ttaatcacta gtagtatggt 1020
gggtaacgtg ttcgtcaacc ggccctatct acttcagttt agtgaagcac taaaccgcac 1080
cttggtatgt tcaaatttaa gatttttttt gaaacgaaac aattttaacc agcggctcca 1140
aaccggtgaa gtggtttggt ctttggtgtg gggccagggt attaatggaa ttgaatatat 1200
aaagagcagg gtggtggacc tttccccacc cacgagtcga gtagccattg cccattgcca 1260
ttccttcctt cctccacaga gaaatccgat ccgcggagat ttgacccaac cagatcatat 1320
cacacacgta atcccatccc attccgcccg gagctcggta cccggggatc catgttacgt 1380
cctgtagaaa ccccaacccg tgaaatcaaa aaactcgacg gcctgtgggc attcagtctg 1440
gatcgcgaaa actgtggaat tgatcagcgt tggtgggaaa gcgcgttaca agaaagccgg 1500
gcaattgctg tgccaggcag ttttaacgat cagttcgccg atgcagatat tcgtaattat 1560
gcgggcaacg tctggtatca gcgcgaagtc tttataccga aaggttgggc aggccagcgt 1620
atcgtgctgc gtttcgatgc ggtcactcat tacggcaaag tgtgggtcaa taatcaggaa 168 0
gtgatggagc atcagggcgg ctatacgcca tttgaagccg atgtcacgcc gtatgttatt 17 40
gccgggaaaa gtgtacgtaa gtttctgctt ctacctttga tatatatata ataattatca 1800
ttaattagta gtaatataat atttcaaata tttttttcaa aataaaagaa tgtagtatat 18 60
agcaattgct tttctgtagt ttataagtgt gtatatttta atttataact tttctaatat 1920
atgaccaaaa tttgttgatg tgcaggtatc accgtttgtg tgaacaacga actgaactgg 1980
cagactatcc cgccgggaat ggtgattacc gacgaaaacg gcaagaaaaa gcagtcttac 2040
ttccatgatt tctttaacta tgccggaatc catcgcagcg taatgctcta caccacgccg 2100
aacacctggg tggacgatat caccgtggtg acgcatgtcg cgcaagactg taaccacgcg 2160
tctgttgact ggcaggtggt ggccaatggt gatgtcagcg ttgaactgcg tgatgcggat 2220
caacaggtgg ttgcaactgg acaaggcact agcgggactt tgcaagtggt gaatccgcac 2280
ctctggcaac cgggtgaagg ttatctctat gaactgtgcg tcacagccaa aagccagaca 2340
gagtgtgata tctacccgct tcgcgtcggc atccggtcag tggcagtgaa gggccaacag 24 00
ttcctgatta accacaaacc gttctacttt actggctttg gtcgtcatga agatgcggac 24 60
ttacgtggca aaggattcga taacgtgctg atggtgcacg accacgcatt aatggactgg 2520
attggggcca actcctaccg tacctcgcat tacccttacg ctgaagagat gctcgactgg 2580gcagatgaac atggcatcgt ggtgattgat gaaactgctg ctgtcggctt taacctctct 2640ttaggcattg gtttcgaagc gggcaacaag ccgaaagaac tgtacagcga agaggcagtc 2700aacggggaaa ctcagcaagc gcacttacag gcgattaaag agctgatagc gcgtgacaaa 2760aaccacccaa gcgtggtgat gtggagtatt gccaacgaac cggatacccg tccgcaagtg 2820cacgggaata tttcgccact ggcggaagca acgcgtaaac tcgacccgac gcgtccgatc 2880acctgcgtca atgtaatgtt ctgcgacgct cacaccgata ccatcagcga tctctttgat 2940gtgctgtgcc tgaaccgtta ttacggatgg tatgtccaaa gcggcgattt ggaaacggca 3000gagaaggtac tggaaaaaga acttctggcc tggcaggaga aactgcatca gccgattatc 3060atcaccgaat acggcgtgga tacgttagcc gggctgcact caatgtacac cgacatgtgg 3120agtgaagagt atcagtgtgc atggctggat atgtatcacc gcgtctttga tcgcgtcagc 3180gccgtcgtcg gtgaacaggt atggaatttc gccgattttg cgacctcgca aggcatattg 3240cgcgttggcg gtaacaagaa agggatcttc actcgcgacc gcaaaccgaa gtcggcggct 3300tttctgctgc aaaaacgctg gactggcatg aacttcggtg aaaaaccgca gcagggaggc 3360aaacaatgaa gatcctctag agtcgacctg caggcatgca agcttgtttc ttaagattga 3420atcctgttgc cggtcttgcg atgattatca tataatttct gttgaattac gttaagcatg 3480taataattaa catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc 3540cgcaattata catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat 3600tatcgcgcgc ggtgtcatct atgttactag atcgggaatt ttaattaaag gcctgttaac 3660agcgctgggc ccgataattc actggccgtc gttttacaac gtcgtgactg ggaaaaccct 3720ggcgttaccc aacttaatcg ccttgcagca catccccctt tcgccagctg gcgtaatagc 3780gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc 3840ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact 3900ctcagtacaa tctgctctga tgccgcatag ttaagccagc cccgacaccc gccaacaccc 3960gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg cttacagaca agctgtgacc 4020gtctccggga gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgagacga 4080aagggcctcg tgatacgcct atttttatag gttaatgtca tgataataat ggtttcttag 4140acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa 4200atacattcaa atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat 4260tgaaaaagga agagtatgag tattcaacat ttccgtgtcg ccct,tattcc cttttttgcg 4320gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa 4380gatcagttgg gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt 4440gagagttttc gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt 4500ggcgcggtat tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat 4560tctcagaatg acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg 4620acagtaagag aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta 4680cttctgacaa cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat' 4740catgtaactc gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag 4800cgtgacacca cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa 4860ctacttactc tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca 4920ggaccacttc tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc 4980ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt 5040atcgtagtta tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc 5100gctgagatag gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat 5160atactttaga ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt 5220tttgataatc tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac 5280cccgtagaaa agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc 5340ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca 5400actctttttc cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta 5460gtgtagccgt agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct 5520ctgctaatcc tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg 5580gactcaagac gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc 5640acacagccca gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta 5700tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg 5760gtcggaacag gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt 5820cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg 5880cggagcctat ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg 5940ccttttgctc acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc 6000gcctttgagt gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg 6060agcgaggaag cggaaga 6077
<210> 111
<211> 15790
<212> DNA
<213> vetor pBPSMM350 binário
<220>
<221> misc_recomb
<222> (5254)..(5276)
<223> sitio de ligação de tecnologia de clonagem Gateway ·(seqüência é complementar)
<220>
<221> promotor
<222> (5341)..(6276)
< 2 2 3 > promotor de ubiqultina de Zea mais
<220>
<221> Intron
<222> (6303)..(6886)
<223> BPSI.1
<220>
<221> gene
<222> (6942) .. (8942)
<223> GUS gene
<220>
<22l> terminador
<222> (9003)..(9282)
<223> seqüência de terminador de napoiina sintase (NosT)<220>
<221> misc_recomb<222> (9551).. (9651)
<223> sítio de ligação de tecnologia de clonagem Gateway: attRl(seqüência é complementar)
60
240300360420480540600660
84090096010201080
<400> 111
aattgactag tggcgcgccc acgtgttaat taaggcgcgc caagcttgca tgcctgcaggcatgcaagct tccgcggctg cagtgcagcg tgacccggtc gtgcccctct ctagagataa 120tgagcattgc atgtctaagt tataaaaaat taccacatat tttttttgtc acacttgttt 180gaagtgcagt ttatctatct ttatacatat atttaaactt tactctacga ataatataatctatagtact acaataatat cagtgtttta gagaatcata taaatgaaca gttagacatggtctaaagga caattgagta ttttgacaac aggactctac agttttatct ttttagtgtgcatgtgttct cctttttttt tgcaaatagc ttcacctata taatacttca tccattttattagtacatcc atttagggtt tagggttaat ggtttttata gactaatttt tttagtacatctattttatt ctattttagc ctctaaatta agaaaactaa aactctattt tagtttttttatttaatagt ttagatataa aatagaataa aataaagtga ctaaaaatta aacaaataccctttaagaaa ttaaaaaaac taaggaaaca tttttcttgt ttcgagtaga taatgccagcctgttaaacg ccgtcgacga gtctaacgga caccaaccag cgaaccagca gcgtcgcgtc 720gggccaagcg aagcagacgg cacggcatct ctgtcgctgc ctctggaccc ctctcgagag 780ttccgctcca ccgttggact tgctccgctg tcggcatcca gaaattgcgt ggcggagcggcagacgtgag ccggcacggc aggcggcctc ctcctcctct cacggcaccg gcagctacgggggattcctt tcccaccgct ccttcgcttt cccttcctcg cccgccgtaa taaatagacaccccctccac accctctttc cccaacctcg tgttgttcgg agcgcacaca cacacaaccagatctccccc aaatccaccc gtcggcacct ccgcttcaag gtacgccgct cgtcctcccccccccccccc ctctctacct tctctagatc ggcgttccgg tccatggtta gggcccggta 1140gttctacttc tgttcatgtt tgtgttagat ccgtgtttgt gttagatccg tgctgctagc 1200gttcgtacac ggatgcgacc tgtacgtcag acacgttctg attgctaact tgccagtgtt 1260tctctttggg gaatcctggg atggctctag ccgttccgca gacgggatcg atttcatgat 1320tttttttgtt tcgttgcata gggtttggtt tgcccttttc ctttatttca atatatgccg 1380tgcacttgtt tgtcgggtca tcttttcatg cttttttttg tcttggttgt gatgatgtgg 1440tctggttggg cggtcgttct agatcggagt agaattctgt ttcaaactac ctggtggatt 1500tattaatttt ggatctgtat gtgtgtgcca tacatattca tagttacgaa ttgaagatga 1560tggatggaaa tatcgatcta ggataggtat acatgttgat gcgggtttta ctgatgcata 1620tacagagatg ctttttgttc gcttggttgt gatgatgtgg tgtggttggg cggtcgttca 1680ttcgttctag atcggagtag aatactgttt caaactacct ggtgtattta ttaattttgg 1740aactgtatgt gtgtgtcata catcttcata gttacgagtt taagatggat ggaaatatcg 1800atctaggata ggtatacatg ttgatgtggg ttttactgat gcatatacat gatggcatat 1860gcagcatcta ttcatatgct ctaaccttga gtacctatct attataataa acaagtatgt 1920tttataatta tttcgatctt gatatacttg gatgatggca tatgcagcag ctatatgtgg 1980atttttttag ccctgccttc atacgctatt tatttgcttg gtactgtttc ttttgtcgat 2040gctcaccctg ttgtttggtg ttacttctgc agggtacccc cgggggatcc actagttcta 2100gaaaccatgg ccaccgccgc cgccgcgtct accgcgctca ctggcgccac taccgctgcg 2160cccaaggcga ggcgccgggc gcacctcctg gccacccgcc gcgccctcgc cgcgcccatc 2220aggtgctcag cggcgtcacc cgccatgccg atggctcccc cggccacccc gctccggccg 2280tggggcccca ccgatccccg caagggcgcc gacatcçtcg tcgagtccct cgagcgctgc 2340ggcgtccgcg acgtcttcgc ctaccccggc ggcgcgtcca tggagatcça ccaggcactc 2400acccgctccc ccgtcatcgc caaccacctc ttccgccacg agcaagggga ggcctttgcg 2460gcctccggct acgcgcgctc ctcgggccgc gtcggcgtct gcatcgccac ctccggcccc 2520ggcgccacca accttgtctc cgcgctcgcc gacgcgctgc tcgattccgt ccccatggtc 2580gccatcacgg gacaggtgcc gcgacgcatg attggcaccg acgccttcca ggagacgccc 2640atcgtcgagg tcacccgctc catcaccaag cacaactacc tggtcctcga cgtcgacgac 2700atcccccgcg tcgtgcagga ggctttcttc ctcgcctcct ctggtcgacc ggggccggtg 2760cttgtcgaca tccccaagga catccagcag cagatggcgg tgcctgtctg ggacaagccc 2820atgagtctgc ctgggtacat tgcgcgcctt cccaagcccc ctgcgactga gttgcttgag 2880caggtgctgc gtcttgttgg tgaatcccgg cgccctgttc tttatgttgg cggtggctgc 2940gcagcatctg gtgaggagtt gcgacgcttt gtggagctga ctggaatccc ggtçacaact 3000actcttatgg gcctcggcaa cttccccagc gacgacccac tgtctctgcg catgctaggt 3060atgcatggca cggtgtatgc aaattatgca gtggataagg ccgatctgtt gcttgcactt 3120ggtgtgcggt ttgatgatcg tgtgacaggg aagattgagg cttttgcaag cagggctaag 3180attgtgcacg ttgatattga tccggctgag attggcaaga acaagcagcc acatgtgtcc 3240atctgtgcag atgttaagct tgctttgcag ggcatgaatg ctcttcttga aggaagcaca 3300tcaaagaaga gctttgactt tggctcatgg aacgatgagt tggatcagca gaagagggaa 3360ttcccccttg ggtataaaac atctaatgag gagatccagc cacaatatgc tattcaggtt 3420cttgatgagc tgacgaaagg cgaggccatc atcggcacag gtgttgggca gcaccagatg 3480tgggcggcac agtactacac ttacaagcgg ccaaggcagt ggttgtcttc agctggtctt 3540ggggctatgg gatttggttt gccggctgct gctggtgctt ctgtggccaa cccaggtgtt 3600actgttgttg acatcgatgg agatggtagc tttctcatga acgttcagga gctagctatg 3660atccgaattg agaacctccc ggtgaaggtc tttgtgctaa acaaccagca cctggggatg 3720gtggtgcagt gggaggacag gttctataag gccaacagag cgcacacata cttgggaaac 3780ccagagaatg aaagtgagat atatccagat ttcgtgacga tcgccaaagg gttcaacatt 3840ccagcggtcc gtgtgacaaa gaagaacgaa gtccgcgcag cgataaagaa gatgctcgag 3900actccagggc cgtacctctt ggatataatc gtcccacacc aggagcatgt gttgcctatg 3960atccctaatg gtggggcttt caaggatatg atcctggatg gtgatggcag gactgtgtac 4020tgatctaaaa tccagcaagc aactgatcta aaatccagca agcaccgcct ccctgctagt 4080acaagggtga tatgttttta tctgtgtgat gttctcctgt attctatctt tttttgtagg 4140ccgtcagcta tctgttatgg taatcctatg tagcttccga ccttgtaatt gtgtagtctg 4200ttgttttcct tctggcatgt gtcataagag atcatttaag tgccttttgc tacatataaa 4260taagataata agcactgcta tgcagtggtt ctgaattggc ttctgttgcc aaatttaagt 4320gtccaactgg tccttgcttt tgttttcgct atttttttcc ttttttagtt attattatat 4380tggtaatttc aactcaacat atgatgtatg gaataatgct agggctgcaa tttcaaacta 4440ttttacaaac cagaatggca ttttcgtggt ttgaggggag tgaaaaaaaa tgaggcattt 4500gactgaatta gttacctgat ccattttcgt ggtttggatc attggaatta aattccattc 4560taataatagt aattttggca tatatcaatt aagttaattc ggttttatgc aaaatatatt 4620tgtatactat tattatcaag atgtcggaga tatttatatg ctacattttt actatacagg 4680agtgagatga agagtgtcat gtaagttaca cagtagaaac aaattctatt aatgcataaa 4740atcatttcca tcatccaccc tatgaatttg agatagacct atatctaaac tttgaaaagt 4800ggttgaatat caaattccaa attaaataag ttattttatt gagtgaattc taatttctct 4860aaaacgaagg gatctaaacg ccctctaaag ctaatttgga aactcaaact ttcttagcat 4920tggaggggat tgagaaaaaa tattaattca ttttcatctc aatcattcaa tctccaaaga 4980gatttgagtt ccttattagt ctgttccatg catcaaatcg gctcaatgtg tcattatttg 5040ccatgacgat tgacgagttg ttctggggcc tagcgctttc cacgccgatg tgctggggcc 5100tggtcctgga gaagacagct tgatatttaa agctatcaat tgtttcaatt gattcccact 5160tcatttttct aaatgtagaa aacggtgacg tataagaaaa agaatgaatt aggactttta 5220ttccgtacac taatctagag cggcccgttt atcaccactt tgtacaagaa agctgggtcg 5280gcgcgccaag cttgcatgcc tgcaggtcga ctctagagga tccccatcga attcctgcag 5340tgcagcgtga cccggtcgtg cccctctcta gagataatga gcattgcatg tctaagttat 5400aaaaaattac cacatatttt ttttgtcaca cttgtttgaa gtgcagttta tctatcttta 5460tacatatatt taaactttac tctacgaata atataatcta tagtactaca ataatatcag 5520tgttttagag aatcatataa atgaacagtt agacatggtc taaaggacaa ttgagtattt 5580tgacaacagg actctacagt tttatctttt tagtgtgcat gtgttctcct ttttttttgc 5640aaatagcttc acctatataa tacttcatcc attttattag tacatccatt tagggtttag 5700ggttaatggt ttttatagac taattttttt agtacatcta ttttattcta ttttagcctc 5760taaattaaga aaactaaaac tctattttag tttttttatt taataattta gatataaaat 5820agaataaaat aaagtgacta aaaattaaac aaataccctt taagaaatta aaaaaactaa 5880ggaaacattt ttcttgtttc gagtagataa tgccagcctg ttaaacgccg tcgacgagtc 5940taacggacac caaccagcga accagcagcg tcgcgtcggg ccaagcgaag cagacggcac 6000ggcatctctg tcgctgcctc tggacccctc tcgagagttc cgctccaccg ttggacttgc 6060tccgctgtcg gcatccagaa attgcgtggc ggagcggcag acgtgagccg gcacggcagg 6120cggcctcctc ctcctctcac ggcacggcag ctacggggga ttcctttccc accgctcctt 6180cgctttccct tcctcgcccg ccgtaataaa tagacacccc ctccacaccc tctttcccca 6240acctcgtgtt gttcggagcg cacacacaca caaccagatc cccgggcctt cacctgcgga 6300gggtaagatc cgatcaccat cttctgaatt tctgttcttg atctgtcatg tataataact 6360gtctagtctt ggtgttggtg agatggaaat tcggtggatc tcggaaggga tattgttcgt 6420ttgctggggt tttttttgtg tgttgtgatc cgtagagaat ttgtgtttat ccatgttgtt 6480gatcttggta tgtattcatg acatattgac atgcatgtgt tgtatgtgtc atatgtgtgc 6540ctctccttgg gatttgtttt ggataataga acatgttatg gactcaatag tctgtgaaca 6600aatctttttt tagatggtgg ccaaatctga tgatgatctt tcttgagagg aaaaagttca 6660tgatagaaaa atcttttttg agatggtggc ttaatgtgat gatgatcttt cttgagagga 6720aaaaaaagat tcattatagg agattttgat ttagctcctt tccaccgata ttaaatgagg 6780agcatgcatg ctgatggctg ataaggatct gatttttttt atcccctctt ctttgaacag 6840acaagaaata ggctctgaat ttctgattga ttatttgtac atgcagatgc aagatgtaca 6900acggtccgcc tcagcgcgat cgccttaagg tttgggtggt catgttacgt cctgtagaaa 6960ccccaacccg tgaaatcaaa aaactcgacg gcctgtgggc attcagtctg gatcgcgaaa 7020actgtggaat tggtcagcgt tggtgggaaa gcgcgttaca agaaagccgg gcaattgctg 7080tgccaggcag ttttaacgat cagttcgccg atgcagatat tcgtaattat gcgggcaacg 7140tctggtatca gcgcgaagtc tttataccga aaggttgggc aggccagcgt atcgtgctgc 7200gtttcgatgc ggtcactcat tacggcaaag tgtgggtcaa taatcaggaa gtgatggagc 7260atcagggcgg ctatacgcca tttgaagccg atgtcacgcc gtatgttatt gccgggaaaa 7320gtgtacgtaa gtttctgctt ctacctttga tatatatata ataattatca ttaattagta 7380gtaatataat atttcaâata tttttttcaa aataaaagaa tgtagtatat agcaattgct 7440tttctgtagt ttataagtgt gtatatttta atttataact tttctaatat atgaccaaaa 7500tttgttgatg tgcaggtatc accgtttgtg tgaacaacga actgaactgg cagactatcc 7560cgccgggaat ggtgattacc gacgaaaacg gcaagaaaaa gcagtcttac ttccatgatt 7620tctttaacta tgccggaatc catcgcagcg taatgctcta caccacgccg aaçacctggg 7680tggacgatat caccgtggtg acgcatgtcg cgcaagactg taaccacgcg tctgttgact 7740ggcaggtggt ggccaatggt gatgtcagcg ttgaactgcg. tgatgcggat caacaggtgg 7800ttgcaactgg acaaggcact agcgggactt tgcaagtggt gaatccgcac ctctggcaac 7860cgggtgaagg ttatctctat gaactgtgcg tcacagccaa aagccagaca gagtgtgata 7920tctacccgct tcgcgtcggc atccggtcag tggcagtgaa gggcgaacag ttcctgatta 7980accacaaacc gttctacttt actggctttg gtcgtcatga agatgcggac ttgcgtggca 8040aaggattcga taacgtgctg atggtgcacg accacgcatt aatggactgg attggggcca 8100actcctaccg tacctcgcat tacccttacg ctgaagagat gctcgactgg gcagatgaac 8160atggcatcgt ggtgattgat gaaactgctg ctgtcggctt taacctctct ttaggcattg 8220gtttcgaagc gggcaacaag ccgaaagaac tgtacagcga agaggcagtc aacggggaaa 8280ctcagcaagc gcacttacag gcgattaaag agctgatagc gcgtgacaaa aaccacccaa 8340gcgtggtgat gtggagtatt gccaacgaac cggatacccg tccgcaaggt gcacgggaat 8400atttcgcgcc actggcggaa gcaacgcgta aactcgaccc gacgcgtccg atcacctgcg 8460tcaatgtaat gttctgcgac gctcacaccg ataccatcag cgatctcttt gatgtgctgt 8520gcctgaaccg ttattacgga tggtatgtcc aaagcggcga tttggaaacg gcagagaagg 8580tactggaaaa agaacttctg gcctggcagg agaaactgca tcagccgatt atcatcaccg 8640aatacggcgt ggatacgtta gccgggctgc actcaatgta caccgacatg tggagtgaag 8700agtatcagtg tgcatggctg gatatgtatc accgcgtctt tgatcgcgtc agcgccgtcg 8760tcggtgaaca ggtatggaat ttcgccgatt ttgcgacctc gcaaggcata ttgcgcgttg 8820gcggtaacaa gaaagggatc ttcactcgcg accgcaaacc gaagtcggcg gcttttctgc 8880tgcaaaaacg ctggactggc atgaacttcg gtgaaaaacc gcagcaggga ggcaaacaat 8940gaatcaacaa ctctcctggc gcaccatcgt cggctacagc ctcgggaatt gctaccgagc 9000tcgaatttcc ccgatcgttc aaacatttgg caataaagtt tcttaagatt gaatcctgtt 9060gccggtcttg cgatgattat catataattt ctgttgaatt acgttaagca tgtaataatt 9120aacatgtaat gcatgacgtt atttatgaga tgggttttta tgattagagt cccgcaatta 9180tacatttaat acgcgataga aaacaaaata tagcgcgcaa actaggataa attatcgcgc 9240gcggtgtcat ctatgttact agatcgggaa ttggcatgca agcttggcac tggccgtcgt 9300tttacaacgt cgtgactggg aaaaccctgg cgttacccaa cttaatcgcc ttgcagcaca 9360tccccctttc gccagctggc gtaatagcga agaggcccgc accgatcgcc cttcccaaca 9420gttgcgcagc ctgaatggcg aatgctagag cagcttgagc ttggatcaga ttgtcgtttc 9480ccgccttcag tttaaacgat agcggtgaag ggggcggccg cggcatagtg actggatatg 9540ttgtgtttta cagtattatg tagtctgttt tttatgcaaa atctaattta atatattgat 9600atttatatca ttttacgttt ctcgttcagc ttttttgtac aaacttgtga taaactatca 9660gtgtttgaca ggatatattg gcgggtaaac ctaagagaaa agagcgttta ttagaataac 9720ggatatttaa aagggcgtga aaaggtttat ccgttcgtcc atttgtatgt gcatgccaac 9780cacagggttc ccctcgggag tgcttggcat tccgtacgat aatgacttct gttcaaccac 9840ccaaacgtcg gaaagcctga cgacggagca gcattccaaa aagatccctt ggctcgtctg 9900ggtcggctag aaggtcgagt gggctgctgt ggcttgatcc ctcaacgcgg tcgcggacgt 9960agcgcagcgc cgaaaaatcc tcgatcgcaa atccgacgct gtcgaaaagc gtgatctgct 10020tgtcgctctt tcggccgacg tcctggccag tcatcacgcg ccaaagttcc gtcacaggat 10080gatctggcgc gagttgctgg atctcgcctt caatccgggt ctgtggcggg aactccacga 10140aaatatccga acgcagcaag atcgtcgacc aattcttgaa gacgaaaggg cctcgtgata 10200cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc aggtggcact 10260tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg 10320tatccgctca tgagacaata accctgataaatgagtattc aacatttccg tgtcgcccttgtttttgctc acccagaaac gctggtgaaacgagtgggtt acatcgaact ggatctcaacgaagaacgtt ttccaatgat gagcacttttcgtgttgacg ccgggcaaga gcaactcggtgttgagtact caccagtcac agaaaagcattgcagtgctg ccataaccat gagtgataacggaggaccga aggagctaac cgcttttttggatcgttggg aaccggagct gaatgaagcccctgcagggg gggggggggg ggggacatgatattgtctga agttgttttt acgttaagttcataattgat tatttgacgt ggtttgatggaatcattatc actttacggg tcctttccgggcgggttttc gctatttatg aaaattttcctaacttaatg tttttattta aaataccctcgcgaggcttt ttggcctctg tcgtttccttgaagtccccc cccccccccc cccctgcagctggcgaacta cttactctag cttcccggcaagttgcagga ccacttctgc gctcggcccttggagccggt gagcgtgggt ctcgcggtatctcccgtatc gtagttatct acacgacgggacagatcgct gagataggtg cctcactgatctcatatata ctttagattg atttaaaactgatccttttt gataatctca tgaccaaaatgtcagacccc gtagaaaaga tcaaaggatcctgctgcttg caaacaaaaa aaccaccgctgctaccaact ctttttccga aggtaactggccttctagtg tagccgtagt taggccaccacctcgctctg ctaatcctgt taccagtggccgggttggac tcaagacgat agttaccggattcgtgcaca cagcccagct tggagcgaactgagctatga gaaagcgcca cgcttcccgacggcagggtc ggaacaggag agcgcacgagttatagtcct gtcgggtttc gccacctctgaggggggcgg agcctatgga aaaacgccagttgctggcct tttgctcaca tgttctttcctattaccgcc tttgagtgag ctgataccgcgtcagtgagc gaggaagcgg aagagcgcctcggtatttca caccgcatat ggtgcactctaagccagtat acactccgct atcgctacgtccaacacccg ctgacgcgcc ctgacgggctgctgtgaccg tctccgggag ctgcatgtgtgcgaggcagc agatcccccg atcaagtagagccggaaggt gatgtttact ttcctgaaat
atgcttcaat aatattgaaa aaggaagagt 10380attccctttt ttgcggcatt ttgccttcct 10440gtaaaagatg ctgaagatca gttgggtgca 10500agcggtaaga tccttgagag ttttcgcccc 10560aaagttctgc tatgtggcgc ggtattatcc 10620cgccgcatac actattctca gaatgacttg 10680cttacggatg gcatgacagt aagagaatta 10740actgcggcca acttacttct gacaacgatc 10800cacaacatgg gggatcatgt aactcgcctt 10860ataccaaacg acgagcgtga caccacgatg 10920ggttgccccg tattcagtgt cgctgatttg 10980gatgcagatc aattaatacg atacctgcgt 11040cctccacgca cgttgtgata tgtagatgat 11100tgatccgaca ggttacgggg cggcgacctc 11160ggtttaaggc gtttccgttc ttcttcgtca 11220tgaaaagaaa ggaaacgaca ggtgctgaaa 11280tctctgtttt tgtccgtgga atgaacaatg 11340aatggcaaca acgttgcgca aactattaac 11400acaattaata gactggatgg aggcggataa 11460tccggctggc tggtttattg ctgataaatc 11520cattgcagca ctggggccag atggtaagcc 11580gagtcaggca actatggatg aacgaaatag 11640taagcattgg taactgtcag accaagttta 11700tcatttttaa tttaaaagga tctaggtgaa 11760cccttaacgt gagttttcgt tccactgagc 11820ttcttgagat CCtttttttC tgcgcgtaat 11880accagcggtg gtttgtttgc cggatcaaga 11940cttcagcaga gcgcagatac caaatactgt 12000cttcaagaac tctgtagcac cgcctacata 12060tgctgccagt ggcgataagt cgtgtcttac 12120taaggcgcag cggtcgggct gaacgggggg 12180gacctacacc gaactgagat acctacagcg 12240agggagaaag gcggacaggt atccggtaag 12300ggagcttcca gggggaaacg cctggtatct 12360acttgagcgt cgatttttgt gatgctcgtc 12420caacgcggcc tttttacggt tcctggcctt 12480tgcgttatcc cctgattctg tggataaccg 12540tcgccgcagc cgaacgaccg agcgcagcga 12600gatgcggtat tttctcctta cgcatctgtg 12660cagtacaatc tgctctgatg ccgcatagtt 12720gactgggtca tggctgcgcc ccgacacccg 12780tgtctgctcc cggcatccgc ttacagacaa 12840cagaggtttt caccgtcatc accgaaacgc 12900tacactacat atatctacaa tagacatcga 12960ccccagcaat tttaggccag tttttaccca 13020agacttcgcc tctaacataa attatagtta ccaaatctgg caaaagggtt aacaagtggc 13080
agcaacggat tcgcaaacct gtcacgcctt ttgtgccaaa agccgcgcca ggtttgcgat 13140
ccgctgtgcc aggcgttagg cgtcatatga agatttcggt gatccctgag caggtggcgg 13200
aaacattgga tgctgagaac catttcattg ttcgtgaagt gttcgatgtg cacctatccg 132 60
accaaggctt tgaactatct accagaagtg tgagccccta ccggaaggat tacatctcgg 13320
atgatgactc tgatgaagac tctgcttgct atggcgcatt catcgaccaa gagcttgtcg 13380
ggaagattga actcaactca acatggaacg atctagcctc tatcgaacac attgttgtgt 13440
cgcacacgca ccgaggcaaa ggagtcgcgc acagtctcat cgaatttgcg aaaaagtggg 13500
cactaagcag acagctcctt ggcatacgat tagagacaca aacgaacaat gtacctgcct 13560
gcaatttgta cgcaaaatgt ggctttactc tcggcggcat tgacctgttc acgtataaaa 13620
ctagacctca agtctcgaac gaaacagcga tgtactggta ctggttctcg ggagcacagg 13680
atgacgccta acaattcatt caagccgaca ccgcttcgcg gcgcggctta attcaggagt 13740
taaacatcat gagggaagcg gtgatcgccg aagtatcgac tcaactatca gaggtagttg 13800
gcgtcatcga gcgccatctc gaaccgacgt tgctggccgt acatttgtac ggctccgcag 13860
tggatggcgg cctgaagcca cacagtgata ttgatttgct ggttacggtg accgtaaggc 13920
ttgatgaaac aacgcggcga gctttgatca acgacctttt ggaaacttcg gcttcccctg 13980
gagagagcga gattctccgc gctgtagaag tcaccattgt tgtgcacgac gacatcattc 14040
cgtggcgtta tccagctaag cgcgaactgc aatttggaga atggcagcgc aatgacattc 14100
ttgcaggtat cttcgagcca gccacgatcg acattgatct ggctatcttg ctgacaaaag 14160
caagagaaca tagcgttgcc ttggtaggtc cagcggcgga ggaactcttt gatccggttc 14220
ctgaacagga tctatttgag gcgctaaatg aaaccttaac gctatggaac tcgccgcccg 14280
actgggctgg cgatgagcga aatgtagtgc ttacgttgtc ccgcatttgg tacagcgcag 1434 0
taaccggcaa aatcgcgccg aaggatgtcg ctgccgactg ggcaatggag cgcctgccgg 14400
cccagtatca gcccgtcata cttgaagcta ggcaggctta tcttggacaa gaagatcgct 144 60
tggcctcgcg cgcagatcag ttggaagaat ttgttcacta cgtgaaaggc gagatcacca 14520
aggtagtcgg caaataatgt ctaacaattc gttcaagccg acgccgcttc gcggcgcggc 14580
ttaactcaag cgttagagag ctggggaaga ctatgcgcga tctgttgaag gtggttctaa 14 64 0
gcctcgtact tgcgatggca tcggggcagg cacttgctga cctgccaatt gttttagtgg 14700
atgaagctcg tcttccctat gactactccc catccaacta cgacatttct ccaagcaact 14760
acgacaactc cataagcaat tacgacaata gtccatcaaa ttacgacaac tctgagagca 14 820
actacgataa tagttcatcc aattacgaca atagtcgcaa cggaaatcgt aggcttatat 14880
atagcgcaaa tgggtctcgc actttcgccg gctactacgt cattgccaac aatgggacaa 14 940
cgaacttctt ttccacatct ggcaaaagga tgttctacac cccaaaaggg gggcgcggcg 15000
tctatggcgg caaagatggg agcttctgcg gggcattggt cgtcataaat ggccaatttt 15060
cgcttgccct gacagataac ggcctgaaga tcatgtatct aagcaactag cctgctctct 15120
aataaaatgt taggcctcaa catctagtcg caagctgagg ggaaccacta gtgtcatacg 15180
aacctccaag agacggttac acaaacgggt acattgttga tgtcatgtat gacaatcgcc 15240
caagtaagta tccagctgtg ttcagaacgt acgtccgaat taattcatcg gggtacggtc 15300
gacgatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 15360
tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 15420
cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 154 80
caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 1554 0
gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 15600
tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 15660
cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 15720tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 15780taatgtactg 15790
<210> 112
<211> 10196
<212> DNA
<213> vetor pBPSLM139 binário
<220>
<221> gene
<222> (2178).. (4094)
<223> gene Als de Zea mais: alelo mu t a do, produto de gene insensível aherbicida
<220>
<221> Intron
<222> (8945).. (9760)
<223> primeiro intron do gene ubiquitina de Zea mais
<220>
<22l> terminador
<222> (8945)..(9760)
<220>
<221> gene
<222> (8945) .. (9760)
<223> cassete de resistência a canamicina, transposon Tn903
<400> 112 tttgtgccga gctgccggtc ggggagctgt tggctggctg gtggcaggat atattgtggt 60g.taaacaaat tgacgcttag acaacttaat aacacattgc ggacgttttt aatgtactga 120attggatccg cccgggcggt accaagcttc cgcggctgca gtgcagcgtg acccggtcgt 180gcccctctct agagataatg agcattgcat gtctaagtta taaaaaatta ccacatattt 240tttttgtcac acttgtttga agtgcagttt atctatcttt atacatatat ttaaacttta 300ctctacgaat aatataatct atagtactac aataatatca gtgttttaga gaatcatata 360aatgaacagt tagacatggt ctaaaggaca attgagtatt ttgacaacag gactctacag 420ttttatcttt ttagtgtgca tgtgttctcc tttttttttg caaatagctt cacctatata 480atacttcatc cattttatta gtacatccat ttagggttta gggttaatgg tttttataga 540ctaatttttt tagtacatct attttattct attttagcct ctaaattaag aaaactaaaa 600ctctatttta gtttttttat ttaatagttt agatataaaa tagaataaaa taaagtgact 660aaaaattaaa caaatac.cct ttaagaaatt aaaaaaacta aggaaacatt tttcttgttt 720cgagtagata atgccagcct gttaaacgcc gtcgacgagt ctaacggaca ccaaccagcg 780aaccagcagc gtcgcgtcgg gccaagcgaa gcagacggca cggcatctct gtcgctgcct 840ctggacccct ctcgagagtt ccgctccacc gttggacttg ctccgctgtc ggcatccaga 900aattgcgtgg cggagcggca gacgtgagcc ggcacggcag gcggcctcct cctcctctca 960cggcaccggc agctacgggg gattcctttccgccgtaata aatagacacc ccctccacaccgcacacaca cacaaccaga tctcccccaaacgccgctcg tcctcccccc ccccccccctcatggttagg gcccggtagt tctacttctgtagatccgtg ctgctagcgt tcgtacacggtgctaacttg ccagtgtttc tctttggggacgggatcgat ttcatgattt tttttgtttcttatttcaat atatgccgtg cacttgtttgttggttgtga tgatgtggtc tggttgggcgcaaactacct ggtggattta ttaattttgggttacgaatt gaagatgatg gatggaaatagggttttact gatgcatata cagagatgcttggttgggcg gtcgttcatt cgttctagattgtatttatt aattttggaa ctgtatgtgtagatggatgg aaatatcgat ctaggataggatatacatga tggcatatgc agcatctatttataataaac aagtatgttt tataattatttgcagcagct atatgtggat ttttttagccactgtttctt ttgtcgatgc tcaccctgttcactagttct agaaaccatg gccaccgccgctaccgctgc gcccaaggcg aggcgccgggccgcgcccat caggtgctca gcggcgtcaccgctccggcc gtggggcccc accgatcccctcgagcgctg cggcgtccgc gacgtcttcgaccaggcact cacccgctcc cccgtcatcgaggcctttgc ggcctccggc tacgcgcgctcctccggccc cggcgccacc aaccttgtcttccccatggt cgccatcacg ggacaggtgcaggagacgcc catcgtcgag gtcacccgctacgtcgacga catcccccgc gtcgtgcaggcggggccggt gcttgtcgac atccccaagggggacaagcc catgagtctg cctgggtacaagttgcttga gcaggtgctg cgtcttgttggcggtggctg cgcagcatct ggtgaggagtcggtcacaac tactcttatg ggcctcggcagcatgctagg tatgcatggc acggtgtatgtgcttgcact tggtgtgcgg tttgatgatcgcagggctaa gattgtgcac gttgatattgcacatgtgtc catctgtgca gatgttaagcaaggaagcac atcaaagaag agctttgactagaagaggga attccccctt gggtataaaactattcaggt tcttgatgag ctgacgaaagagcaccagat gtgggcggca cagtactacacagctggtct tggggctatg ggatttggtt
ccaccgctcc ttcgctttcc cttcctcgcc 1020cctctttccc caacctcgtg ttgttcggag 1080atccacccgt cggcacctcc gcttcaaggt 1140ctctaccttc tctagatcgg cgttccggtc 1200ttcatgtttg tgttagatcc gtgtttgtgt 1260atgcgacctg tacgtcagac acgttctgat 1320atcctgggat ggctctagcc gttccgcaga 1380gttgcatagg gtttggtttg cccttttcct 1440tcgggtcatc ttttcatgct tttttttgtc 1500gtcgttctag atcggagtag aattctgttt 1560atctgtatgt gtgtgccata catattcata 1620tcgatctagg ataggtatac atgttgatgc 1680ttttgttcgc ttggttgtga tgatgtggtg 1740cggagtagaa tactgtttca aactacctgg 1800gtgtcataca tcttcatagt tacgagttta 1860tatacatgtt gatgtgggtt ttactgatgc 1920catatgctct aaccttgagt acctatctat 1980tcgatcttga tatacttgga tgatggcata 2040ctgccttcat acgctattta tttgcttggt 2100gtttggtgtt acttctgcag ggtacggatc 2160ccgccgcgtc taccgcgctc actggcgcca 2220cgcacctcct ggccacccgc cgcgccctcg 2280ccgccatgcc gatggctccc ccggccaccc 2340gcaagggcgc cgacatcctc gtcgagtccc 2400cctaccccgg cggcgcgtcc atggagatcc 2460ccaaccacct cttccgccac gagcaagggg 2520cctcgggccg cgtcggcgtc tgcatcgcca 2580ccgcgctcgc cgacgcgctg ctcgattccg 2640cgcgacgcat gattggcacc gacgccttcc 2700ccatcaccaa gcacaactac ctggtcctcg 2760aggctttctt cctcgcctcc tctggtcgac 2820acatccagca gcagatggcg gtgcctgtct 2880ttgcgcgcct tcccaagccc cctgcgactg 2940gtgaatcccg gcgccctgtt ctttatgttg 3000tgcgacgctt tgtggagctg actggaatcc 3060acttccccag cgacgaccca ctgtctctgc 3120caaattatgc agtggataag gccgatctgt 3180gtgtgacagg gaagattgag gcttttgcaa 3240atccggctga gattggcaag aacaagcagc 3300ttgctttgca gggcatgaat gctcttcttg 3360ttggctcatg gaacgatgag ttggatcagc 3420catctaatga ggagatccag ccacaatatg 3480gcgaggccat catcggcaca ggtgttgggc 3540cttacaagcg gccaaggcag tggttgtctt 3600tgccggctgc tgctggtgct tctgtggcca 3660acccaggtgt tactgttgtt gacatcgatg gagatggtag ctttctcatg aacgttcagg 3720agctagctat gatccgaatt gagaacctcc cggtgaaggt ctttgtgcta aacaaccagc 3780acctggggat ggtggtgcag tgggaggaca ggttctataa ggccaacaga gcgcacacat 3840acttgggaaa cccagagaat gaaagtgaga tatatccaga tttcgtgacg atcgccaaag 3900ggttcaacat tccagcggtc cgtgtgacaa agaagaacga agtccgcgca gcgataaaga 3960agatgctcga gactccaggg ccgtacctct tggatataat cgtcccacac caggagcatg 4020tgttgcctat gatccctaat ggtggggctt tcaaggatat gatcctggat ggtgatggca 4080ggactgtgta ctgatctaaa atccagcaag caactgatct aaaatccagc aagcaccgcc 4140tccctgctag tacaagggtg atatgttttt atctgtgtga tgttctcctg tattctatct 4200ttttttgtag gccgtcagct atctgttatg gtaatcctat gtagcttccg accttgtaat 4260tgtgtagtct gttgttttcc ttctggcatg tgtcataaga gatcatttaa gtgccttttg 4320ctacatataa ataagataat aagcactgct atgcagtggt tctgaattgg cttctgttgc 4380caaatttaag tgtccaactg gtccttgctt ttgttttcgc tatttttttc cttttttagt 4440tattattata ttggtaattt caactcaaca tatgatgtat ggaataatgc tagggctgca 4500atttcaaact attttacaaa ccagaatggc attttcgtgg tttgagggga gtgaaaaaaa 4560atgaggcatt tgactgaatt agttacctga tccattttcg tggtttggat cattggaatt 4620aaattccatt ctaataatag taattttggc atatatcaat taagttaatt cggttttatg 4680caaaatatat ttgtatacta ttattatcaa gatgtcggag atatttatat gctacatttt 4740tactatacag gagtgagatg aagagtgtca tgtaagttac acagtagaaa caaattctat 4800taatgcataa aatcatttcc atcatccacc ctatgaattt gagatagacc tatatctaaa 4860ctttgaaaag tggttgaata tcaaattcca aattaaataa gttattttat tgagtgaatt 4920ctaatttctc taaaacgaag ggatctaaac gccctctaaa gctaatttgg aaactcaaac 4980tttcttagca ttggagggga ttgagaaaaa atattaattc attttcatct caatcattca 5040atctccaaag agatttgagt tccttattag tctgttccat gcatcaaatc ggctcaatgt 5100gtcattattt gccatgacga ttgacgagtt gttctggggc ctagcgcttt ccacgccgat 5160gtgctggggc ctggtcctgg agaagacagc ttgatattta aagctatcaa ttgtttcaat 5220tgattcccac ttcatttttc taaatgtaga aaacggtgac gtataagaaa aagaatgaat 5280taggactttt attccgtaca ctaatctaga gcggccgcaa gcttgtacaa cgcgtaccgg 5340ttaattaatc tagaggcgcg ccgggcccgg ccggccagat cttgattgtc gtttcccgcc 5400ttcagtttaa actatcagtg tttgacagga tatattggcg ggtaaaccta agagaaaaga 5460gcgtttatta gaataatcgg atatttaaaa gggcgtgaaa aggtttatcc gttcgtccat 5520ttgtatgtgc atgccaacca cagggttccc ctcgggagtg cttggcattc cgtgcgataa 5580tgacttctgt tcaaccaccc aaacgtcgga aagcctgacg acggagcagc attccaaaaa 5640gatcccttgg ctcgtctggg tcggctagaa ggtcgagtgg gctgctgtgg cttgatccct 5700caacgcggtc gcggacgtag cgcagcgccg aaaaatcctc gatcgcaaat ccgacgctgt 5760cgaaaagcgt gatctgcttg tcgctctttc ggccgacgtc ctggccagtc atcacgcgcc 5820aaagttccgt cacaggatga tctggcgcga gttgctggat ctcgccttca atccgggtct 5880gtggcgggaa ctccacgaaa atatccgaac gcagcaagat cgtcgaccaa ttcttgaaga 5940cgaaagggcc tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct 6000tagacgtcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc 6060taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa 6120tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 6180gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 6240gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc 6300cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta 6360tgtggcgcgg tattatcccg tgttgacgcc gggcaagagc aactcggtcg ccgcatacac 6420tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc 6480atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac 6540ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg 6600gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac 6660gagcgtgaca ccacgatgcc gggggggggg gggggggaca tgaggttgcc ccgtattcag 6720tgtcgctgat ttgtattgtc tgaagttgtt tttacgttaa gttgatgcag atcaattaat 6780acgatacctg cgtcataatt gattatttga cgtggtttga tggcctccac gcacgttgtg 6840atatgtagat gataatcatt atcactttac gggtcctttc cggtgatccg acaggttacg 6900gggcggcgac ctcgcgggtt ttcgctattt atgaaaattt tccggtttaa ggcgtttccg 6960ttcttcttcg tcataactta atgtttttat ttaaaatacc ctctgaaaag aaaggaaacg 7020acaggtgctg aaagcgagct ttttggcctc tgtcgtttcc tttctctgtt tttgtccgtg 7080gaatgaacaa tggaaccccc cccccccccc cctgcagcaa tggcaacaac gttgcgcaaa 7140ctattaactg gcgaactact tactctagct tcccggcaac aattaataga ctggatggag 7200gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct 7260gataaatctg gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat 7320ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa 7380cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac 7440caagtttact catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc 7500taggtgaaga tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc 7560cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg 7620cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg 7680gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca 7740aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg 7800cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg 7860tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 7920acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 7980ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 8040ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 8100tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 8160tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc 8220ctggcctttt gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg 8280gataaccgta ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag 8340cgcagcgagt cagtgagcga ggaagcggaa gagcgcctga tgcggtattt tctccttacg 8400catctgtgcg gtatttcaca ccgcatatgg tgcactctca gtacaatctg ctctgatgcc 8460gcatagttaa gccagtatac actccgctat cgctacgtga ctgggtcatg gctgcgcccc 8520gacacccgcc aacacccgct gacgcgccct gacgggcttg tctgctcccg gcatccgctt 8580acagacaagc tgtgaccgtc tccgggagct gcatgtgtca gaggttttca ccgtcatcac 8640cgaaacgcgc gaggcagcag atcccccgat caagtagata cactacatat atctacaata 8700gacatcgagc cggaaggtga tgtttacttt cctgaaatcc ccagcaattt taggccagtt 8760tttacccaag acttcgcctc taacataaat tatagttacc aaatctggca aaagggttga 8820ccgggggggg ggggaaagcc acgttgtgtc tcaaaatctc tgatgttaca ttgcacaaga 8880taaaaatata tcatcatgaa caataaaact gtctgcttac ataaacagta atacaagggg 8940tgttatgagc catattcaac gggaaacgtc ttgctcgagg ccgcgattaa attccaacat 9000ggatgctgat ttatatgggt ataaatgggc tcgcgataat gtcgggcaat caggtgcgac 9060aatctatcga ttgtatggga agcccgatgc gccagagttg tttctgaaac atggcaaagg 9120tagcgttgcc aatgatgtta cagatgagat ggtcagacta aactggctga cggaatttat 9180gcctcttccg accatcaagc attttatccg tactcctgat gatgcatggt tactcaccac 9240tgcgatcccc gggaaaacag cattccaggt attagaagaa tatcctgatt caggtgaaaa 9300tattgttgat gcgctggcag tgttcctgcg ccggttgcat tcgattcctg tttgtaattg 9360tccttttaac agcgatcgcg tatttcgtct cgctcaggcg caatcacgaa tgaataacgg 9420tttggttgat gcgagtgatt ttgatgacga gcgtaatggc tggcctgttg aacaagtctg 9480gaaagaaatg cataagcttt tgccattctc accggattca gtcgtcactc atggtgattt 9540ctcacttgat aaccttattt ttgacgaggg gaaattaata ggttgtattg atgttggacg 9600agtcggaatc gcagaccgat accaggatct tgccatccta tggaactgcc tcggtgagtt 9660ttctccttca ttacagaaac ggctttttca aaaatatggt attgataatc ctgatatgaa 9720taaattgcag tttcatttga tgctcgatga gtttttctaa tcagaattgg ttaattggtt 9780gtaacactgg cagagcatta cgctgacttg acgggacggc ggctttgttg aataaatcga 9840acttttgctg agttgaagga tcagatcacg catcttcccg acaacgcaga ccgttccgtg 9900gcaaagcaaa agttcaaaat caccaactgg tccacctaca acaaagctct catcaaccgt 9960ggctccctca ctttctggct ggatgatggg gcgattcagg gatcacaggc agcaacgctc 10020tgtcatcgtt acaatcaaca tgctaccctc cgcgagatca tccgtgtttc aaacccggca 10080gcttagttgc cgttcttccg aatagcatcg gtaacatgag caaagtctgc cgccttacaa 10140cggctctccc gctgacgccg tcccggactg atgggctgcc tgtatcgagt ggtgat 10196
<210> 113
<211> 1470
<212> DNA
<213> Artificial
<220>
<223> cassete de vetor pBPSMM355 (OsCP12::BPSI.1)
<220>
<221> promotor
<222> (1).. (854)
<223> Os CP12 promotor
<220>
<221> Intron
<222> (888)..(1470)
<223> IME-Intron: BPSI.l intron
<400> 113
gaattctcgg cagggtggca gcatgggcct aaggcccagt caactgtggg cctataagcg 60actaatccgg ctgtaactgg gccttgcaag aggcttgtct tgttggtccg aactcaggaa 120gtccaggttg cggggacaac ttcaaggcca tctggtttcc acttctctta ccacctcaat 180tccgctcttg atccgagcta gcttagtccc aatctaaaaa ctttacaaag aaagaaccat 240acgcacctat tgggcaaaat gaaaaataat ttgctactca ccaaataatt tgagcacctc 300tgcacctgta cactaaataa ctctgttcca ccaaaatagt tgagatatct aggacgtttc 360attttgtccg ttcttcacca aacttttcca tagtatctca gatattttcg agaccgaaagtgatctttct ggccttagac cgagttcact tccctacaag ccattctttg ctggcacaacacgaacctct acatcaattt cgtatccaac ctgaacttct gcatacatgt acacacccacagtcatctgc tcatgttttc acggtcaaat taaaactgct tctctcacct tagattcacccaagggaaaa gaaaaagatc tcctttgcca agtccccatt tcgcatgaaa tatctcaaaatacagcccac gtggcacacg acgattggct gaggaggcga taagaaacga gtgcacgtcg 720tcgaatcctc tctccccttc tcccccaccc cacggagcta tatatatata aaccccatct 780cttcaatccg tgcaacgaac gcctcgtcgc aacagctaca aacgcccaca tcacacgcagaaatccgcat caacagagct cggtacccgg gccttcacct gcggagggta agatccgatcaccatcttct gaatttctgt tcttgatctg.tcatgtataa taactgtcta gtcttggtgttggtgagatg gaaattcggt ggatctcgga agggatattg ttcgtttgct ggggtttttt 1020ttgtgtgttg tgatccgtag agaatttgtg tttatccatg ttgttgatct tggtatgtat 1080tcatgacata ttgacatgca tgtgttgtat gtgtcatatg tgtgcctctc cttgggattt 1140gttttggata atagaacatg ttatggactc aatagtctgt gaacaaatct ttttttagat 1200ggtggccaaa tctgatgatg atctttcttg agaggaaaaa gttcatgata gaaaaatctt 1260ttttgagatg gtggcttaat gtgatgatga tctttcttga gaggaaaaaa aagattcatt 1320ataggagatt ttgatttagc tcctttccac cgatattaaa tgaggagcat gcatgctgat 1380tgctgataag gatctgattt ttttatcccc tcttctttga acagacaaga aataggctct 1440gaatttctga ttgattattt gtacatgcag 1470
840900960
<210> 114
<211> 1799
<212> DNA
<213> Artificial
<220>
<223> Cassete de vetot pBPSMM355 (ZmHRGP: iBPSI.l.) promotor de Zeamays, intron de oryza sativa
<220>
<22l> promotor<222> (1).. (1184)
<223> gücoproteína rica em hidioxiprolina de milho [HRGP] (extensina)5'/ promotor UTR
<220>
<221> Intron
<222> (1217)..(1799)
<223> IME-Intron: intron BPSI. 1
<400> 114
ccggtgacct tcttgcttct tcgatcgtct ggacgtcgag gagccccgcg gcagcgcacgcgtctgcacc gttatggtgg ccgcgctcgc gatggaatag aaggggtaat gatggatccggccaggaagg ccacgacatc gacggatcca accggcaaga cggcgatccg gttaaatagacgacggatct agctgggaag gtagactcta cattaaatga ggttgcacat gccctaataactttataaat ctaatttatt cagaggcaag gtagtagtat tatctttccc aacggatagttatctgatct gccgttcagc ttgatcgata actttataaa tctaatttat tcagaggccggcggcagcgc acacgtctgc accagtaatg ttagccgcgc ctgtggcgta atagaaggggtaacgatgga tccgaccaga aaggcctcga cattgacgga tccagacggc gatccggtcaaagagacgac gaatctagcc gagaaggtag atctctcgag agagttcata ttaaatgatgttgtacatgc cataataact ctataaatct aatttattca taggcgaagg tagtagtattatctttccca gcggatcgtt atctgatctg ccgttcagct tgatcgatcc acgtcgtttgatctcggcga gcagcacatg gcggctcttc ttgtgtacag gtctcactct ctgctacttcagtgcaaggc ggagtgaatg cacacaataa cgtgagtatt gtgggaacta cttgtagatg 780caaacgatgt aaatccacct gctccaccaa gtgcccgccc ggctctatcc attccattcgtcaacatgca ggttcagact ggcccgtgct ggaccagtga gcggtgccgg tgaaccccaatgcaagcgaa gcgagtgacc atcggggaag cctcccgtgc tgcccccaca tggcttgcctgaatgcctct ctctcgccgc agtgccctct ctctctcctc ctcctctccg tcgaagggcg 1020tcacgagagc ccagagggca tccgaggccc ccaccccacc ccttcctccg tgtatataag 1080cagtggcagg gtgagcgtct ctcctcagac oaccactgcg ccattggcca gctagagcca 1140accagaagag cttgcagtta ctgagagtgt gtgtgagaga gagggagctc ggtacccggg 1200ccttcacctg cggagggtaa gatccgatca ccatcttctg aatttctgtt cttgatctgt 1260catgtataat aactgtctag tcttggtgtt ggtgagatgg aaattcggtg gatctcggaa 1320gggatattgt tcgtttgctg gggttttttt tgtgtgttgt gatccgtaga gaatttgtgt 1380ttatccatgt tgttgatctt ggtatgtatt catgacatat tgacatgcat gtgttgtatg 1440tgtcatatgt gtgcctctcc ttgggatttg ttttggataa tagaacatgt tatggactca 1500atagtctgtg aacaaatctt tttttagatg gtggccaaat ctgatgatga tctttcttga 1560gaggaaaaag ttcatgatag aaaaatcttt tttgagatgg tggcttaatg tgatgatgat 1620ctttcttgag aggaaaaaaa agattcatta taggagattt tgatttagct cctttccacc 1680gatattaaat gaggagcatg catgctgatt gctgataagg atctgatttt tttatcccct 174 0cttctttgaa cagacaagaa ataggctctg aatttctgat tgattatttg tacatgcag 17 99
<210> 115
<211> 1701
<212> DNA
<213> Artificial
<220>
<223> cassete de vetor pBPSMM358 (OsCCoAMTl::BPSI.1)
<220>
<221> promotor
<222> (1).. (1034)
<223> promotor p-cafeoli-CoA 3-o-metiltransferase
<220>
<221> Intron
<222> (1119)..(1701)
<223> IME-Intron: intron de BPSI.l<400> 115
caactactgc acggtaaaag tgataggaat cggtcggaaa cagtattaat gtttttatta
tttttacaaa aacgaattga aataattgga aattttcata tttatatatt aaactattcajtatcaactt caattcgacg tcaatagaaa ttagaaaagc ataattatac acagtaatagjcgttcaaga tattattgtt attatttagt tttgtggaaa tggtatcaac gtgatcggaaiattttgtac atgttttcac cctgcgggat atctcaattc cttctcctcc ctctaccgccitatcagcac acgttttaga gcaccaatca taacccataa atccgtgggc tactcacttazttaatttat atgtgaattc gtgacctgac tcactcacat actatcaaaa atttgtctcajtcacccatc tccttctttc ctggtccgat aagggtttat cctacggttc gacggttatcacgatagtcg tgcggttact gaggtatacc gtgatttaaa aatatgataa agttaccgcaggttttaact gcgcggtttg gtaaacctgt tcctcctcac caaccttctc ctccggtctccttatgtgtc tcaccgaggc gagccgccgc gagaccgcat ggacgcggtc cacgcacctggcggtgcacc tcctcctccc cggcgaagaa gacgtggagg agagtaaatg agcaatcaggcccacggccc aatcgccgtc caccacccac caccctcagc gacccaaaac cacctcaccaacccaactct gtaccgtact gtacccgccc tcccctccca ctgacactcc gggcccacctgtcggcgcga ctcttccacg gtccccttct ctcctcagag attttttcca cgcattttttaatttttttt tctgcagttc acatgctctt ctcccactct tccgccgcgc tatataaaccgcgcgaggcg tcgttgcctc gtcggcgaag tcaatccggc gatccccggc gagcgagagatcgaagcaag ctgcaagggc gaattctgca gatatccatc acactggcgg ccgctcgagcatgcatctag aggatccccg ggccttcacc tgcggagggt aagatccgat caccatcttctgaatttctg ttcttgatct gtcatgtata ataactgtct agtcttggtg ttggtgagatggaaattcgg tggatctcgg aagggatatt gttcgtttgc tggggttttt tttgtgtgttgtgatccgta gagaatttgt gtttatccat gttgttgatc ttggtatgta ttcatgacatattgacatgc atgtgttgta tgtgtcatat gtgtgcctct ccttgggatt tgttttggataatagaacat gttatggact caatagtctg tgaacaaatc tttttttaga tggtggccaaatctgatgat gatctttctt gagaggaaaa agttcatgat agaaaaatct tttttgagat 1500ggtggcttaa tgtgatgatg atctttcttg agaggaaaaa aaagattcat tataggagattttgatttag ctcctttcca ccgatattaa atgaggagca tgcatgctga ttgctgataaggatctgatt tttttatccc ctcttctttg aacagacaag aaataggctc tgaatttctgattgattatt tgtacatgca g
<210> 116
<211> 1999
<212> DNA
<213> Artificial
<220>
<223> cassete de vetor EXS1025 (ZmGlobulinl::BPSI.1)promotor de Zea mays, íntron de oryza sativa
6012018024030036042048054060066072078084090096010201080114012001260132013801440
1560162016801701
<220>
<22l> promotor
<222> (X)..(1440)
<223> promotor (W64A) Globulina-I de milho [ZmGlbl]<221> Intron
<222> (1443)..(1999)
<223> IME-Intron: intron de BPSI.1
<400> 116
agcttcccgg gccgagtgcc atccttggac actcgataaa gtatatttta ttttttttattttgccaacc aaactttttg tggtatgttc ctacactatg tagatctaca tgtaccattttggcacaatt acatatttac aaaaatgttt tctataaata ttagatttag ttcgtttatttgaatttctt cggaaaattc acatttaaac tgcaagtcac tcgaaacatg gaaaaccgtgcatgcaaaat aaatgatatg catgttatct agcacaagtt acgaccgatt tcagaagcagaccagaatct tcaagcacca tgctcactaa acatgaccgt gaacttgtta tctagttgtttaaaaattgt ataaaacaca aataaagtca gaaattaatg aaacttgtcc acatgtcatgatatcatata tagaggttgt gataaaaatt tgataatgtt tcggtaaagt tgtgacgtactatgtgtaga aacctaagtg acctacacat aaaatcatag agtttcaatg tagttcactcgacaaagact ttgtcaagtg tccgataaaa agtactcgac aaagaagccg ttgtcgatgtactgttcgtc gagatctctt tgtcgagtgt cacactaggc aaagtcttta cggagtgtttttcaggcttt gacactcggc aaagcgctcg attccagtag tgacagtaat ttgcatcaaa 720aatagctgag agatttaggc cccgtttcaa tctcacggga taaagtttag cttcctgcta 780aactttagct atatgaattg aagtgctaaa gtttagtttc aattaccacc attagctctcctgtttagat tacaaatggc taaaagtagc taaaaaatag ctgctaaagt ttatctcgcgagattgaaac agggccttaa aatgagtcaa ctaatagacc aactaattat tagctattagtcgttagctt ctttaatcta agctaaaacc aactaatagc ttatttgttg aattacaattagctcaacgg aattctctgt tttttctata aaaaaaggga aactgcccct catttacagcaaattgtccg ctgcctgtcg tccagataca atgaacgtac ctagtaggaa ctcttttaca 1140cgctcggtcg ctcgccgcgg atcggagtcc caggaacacg acaccactgt gtaacacgac 1200aaagtctgct cagaggcggc cacaccctgg cgtgcaccga gccggagccc ggataagcac 1260ggtaaggaga gtacggcggg acgtggcgac ccgtgtgtct gctgccacgc agccttcctc 1320cacgtagccg cgcggccgcg ccacgtacca gggcccggcg ctggtataaa tgcgcgctac 1380ctccgcttta gttctgcata cagccaaccc aaccatgtaa gatccgatca ccatcttctg 1440aatttctgtt cttgatctgt catgtataat aactgtctag tcttggtgtt ggtgagatgg 1500aaattcggtg gatctcggaa gggatattgt tcgtttgctg gggttttttt tgtgtgttgt 1560gatccgtaga gaatttgtgt ttatccatgt tgttgatctt ggtatgtatt catgacatat 1620tgacatgcat gtgttgtatg tgtcatatgt gtgcctctcc ttgggatttg ttttggataa 1680tagaacatgt tatggactca atagtctgtg aacaaatctt tttttagatg gtggccaaat 1740ctgatgatga tctttcttga gaggaaaaag ttcatgatag aaaaatcttt tttgagatgg 1800tggcttaatg tgatgatgat ctttcttgag aggaaaaaaa agattcatta taggagattt 1860tgatttagct cctttccacc gatattaaat gaggagcatg catgctgatt gctgataagg 1920atctgatttt tttatcccct cttctttgaa cagacaagaa ataggctctg aatttctgat 1980tgattatttg tacatgcag 1999
60120180240300360420480540600660
84090096010201080
<210> 117
<211> 2198
<212> DNA
<213> Artificial<220>
<223> cassete de vetor pBPSMM369 (OsV-ATPase: :BPSI.l)<220>
<22i> promotor<222> (1)..(1589)
<223> ATP sintase 5' de transporte de H+ de arroz putativa/ promotor UTR,
homologia para DNA genômico de oryza sativa #AP002S01 (grupo de cultijaponica)
<220>
<221> Intron
<222> (1616)..(219R1
<223> IMEr-Intron: intron de BPSI. 1
<400> 117
tccacaactg cacaagcaag caggcggacg gccagatcat accagctctc aaagatccaacggctcacgc atggcatgga actgttaccc tgtagcagaa tgcagcgttc tcgcgtagggtgttactgtg ggcaggaaaa ctaaagattt aatatgatat gatatgatat gatatgcacgcacagaaacc gtataaaact cttatgtgca tatgggccta aggcccaaaa tggtggttaacgttgggctt caagcccaac caaaagccga ggaggactcc gagtctccga ctaggccttggccatgctgt agtctggacg gcggtgcacg ttggccaacg tgcccagacg cttcgacaaggtggggccca caggaacaaa tcacgctgtc acgccgatcc gggccgtccg atcccgccacgtggacgacg gaaaccccct ggtctctcga acatggcgga tcaaatcggg gacgagacgacgacgcccaa aacaaaaccg ctaatctgac tggaaaccca gatcgccttc ttcgctgggggtggggcgac gaaacttgcg cgatctcccc tctcctctcc tccgctcgaa tctgcggtacgcacgcctcc ctcctcctcc tcctcctcct cctcactcct tccggccccg atcctatagctcctccgctc gccgcgggga tctgcttacg acgaggcccg gcacccccgc cgccgccgga 720tcgtggtttg gcgcttcaga cccgtgcgta gcgtgtagga tcaattggcg ctccacgttc 780cccgatgttg ccgaattttc agagtttgtt gggtagattg acccccgcta cctccactgtggaggtatgc agagctgccc gtgcgaggag atggggtttg tcgattagtg ttctgtcgagagcgctagga ctaggatctt cgtagtgttg ttgtttaaga agtgagatac agtacaaagctcgtttctgc ctcagttctt ctagggagct tacatgtaat gatcaatgtg tctgaaacatgatttttttt ttcagagatg tagggttggt ttttggacta gaaagggttc tggtgaagtacatatgattc gattggcgat gttctatcac tgccttttat gtttttactg cttactagaa 1140tagtagctca tggagctaga tccttctagt atttccagaa aattggaaca acataatctt 1200tctagagtta atcttttgct aattcgaata gcaggatagt gtttgcctat ttggcatatc 1260tactaactat acatttcacc ttgtagttga tatcagcttt agctttgtca gcatctgatt 1320gattttagat tggcaaagta tctggccttt gttgctggta atttaggaaa tatagaagtgacagttaatg ccatgaattt gttgttttaa tttctaatct aaatcgcaaa actaaaagagaagataagta tgcggccagt gaagaaaggg tttaatggtg atgcataccc catttatctagggaacttga gaaaacagat acacgacaga ttgtccatag aatattcttc tgagtatatt 1560ttattgactc aaatacttac ctacagcagg atccccgggc cttcacctgc ggagggtaag 1620atccgatcac catcttctga atttctgttc ttgatctgtc atgtataata actgtctagt 1680
60120180240300360420480540600660
84090096010201080
138014401500cttggtgttg gtgagatgga aattcggtgg atctcggaag ggatattgtt cgtttgctgg 1740ggtttttttt gtgtgttgtg atccgtagag aatttgtgtt tatccatgtt gttgatcttg 1800gtatgtattc atgacatatt gacatgcatg tgttgtatgt gtcatatgtg tgcctctcct 1860tgggatttgt tttggataat agaacátgtt atggactcaa tagtctgtga acaaatcttt ■ 1920ttttagatgg tggccaaatc tgatgatgat ctttcttgag aggaaaaagt tcatgataga 1980aaaatctttt ttgagatggt ggcttaatgt gatgatgatc tttcttgaga ggaaaaaaaa 2040gattcattat aggagatttt gatttagctc ctttccaccg atattaaatg aggagcatgc 2100atgctgattg ctgataagga tctgattttt ttatcccctc ttctttgaac agacaagaaa 2160taggctctga atttctgatt gattatttgt acatgcag 2198
<210> 118
<211> 1409
<212> DNA
<213> Artificial
<220>
<223> cassete de vetor PBPSMM366 (OsC8, 7SI: :BPSI. 1)<220>
<221> promotor
<222> (1)..(796)
<223> promotor de C-8,7 esterol isomerase de arroz putativo; 99% +homologia para DNA genômico de Oryza sativa #AP002969 (grupocultivar japonica) cromossomo 1
<220>
<221> Intron
<222> (827)..(1409)
<223> IME-Intron: intron de BPSI.l
<400> 118 cctcgattcg accgtgtaat ggaatgaagg tggtgggccc ccacccccac aagccactct 60ccacactttg gtgttcctgg tatgtcacct agaccaacaa ctatgttaag ccatatgttc 120cacagtgcaa aatctacaag accacgatac aagtaggtat ggtggactac cacattttca 180cttctctttc actttcccct ctctctcccc tctctcttcc tttcccccac cgcagagagc 240ctggcgcgcg gagacggcga cggcgccgga ccaagcagtg gtggagcgac ggcagggcga 300cagcgccgag cggcgggatg cgctcgccgg cgcaccaccc cctcctctcc cccccgagcg 360gcggggctgc tcggagcagc agggcggcgg cggcatgtcg gcggcgggca gacgacttgg 420agcgggagac ggcgacgggc ggatgcgagg cggcggtcgg cgccctcctc ccctggagtt 480cggctgcttc gccccctctc ctctctcctc tagcggtggt gtgggtccca ctgagctgag 540gagggcgcgc ggttggacga cgaggcaaag gaatactagt cttcgctttt ttgggttgag 600gctgaatgcc acgtcggccc attgtgaatg ccctttaaca aaacaagggt ttatggctat 660gggatctggc tgaggcattg acctaccttg gtccttggca gagagagaga gagactcccc 720ctcactcctt ccccgacgac ctgctcgatc cgatccaatc agctcctctc cagtccagat 780cggaaggaag ccaggagctc ggtacccggg ccttcacctg cggagggtaa gatccgatca 840ccatcttctg aatttctgtt cttgatctgt catgtataat aactgtctag tcttggtgtt 900ggtgagatgg aaattcggtg gatctcggaa gggatattgt tcgtttgctg gggttttttt 960tgtgtgttgt gatccgtaga gaatttgtgt ttatccatgt tgttgatctt ggtatgtatt 1020catgacatat tgacatgcat gtgttgtatg tgtcatatgt gtgcctctcc ttgggatttg 1080ttttggataa tagaacatgt tatggactca atagtctgtg aacaaatctt tttttagatg 1140gtggccaaat ctgatgatga tctttcttga gaggaaaaag ttcatgatag aaaaatcttt 1200tttgagatgg tggcttaatg tgatgatgat ctttcttgag aggaaaaaaa agattcatta 1260taggagattt tgatttagct cctttccacc gatattaaat gaggagcatg catgctgatt 1320gctgataagg atctgatttt tttatcccct cttctttgaa cagacaagaa ataggctctg 1380aatttctgat tgattatttg tacatgcag 1409
<210> 119
<211> 1677
<212> DNA
<213> Artificial
<220>
<223> cassete de vetor pBPSMM357 (ZmLDH: : BPSI. 1)<220>
<221> promotor
<222> (1). . (1062)
<223> lactato desigenase 5' do gene Z. mays /promotor de UTR
<220>
<221> Intron
<222> (1095)..(1677)
<223> IME-Intron: intron de BPSI.l
<400> 119 aacaaatggc gtacttatat aaccacaatg tactggtgct gcgtcattat tttatactac 60gcatatatta ttataagtag agaaagctca caaaaccatg cgcgcgcccc cctgtttgtt 120tcggtcgcta attacaccct ttgtatcgtt ggttgatgat ggtctccacc ggccgtacga 180gtcatcgatc gttgatttat ttttatcacc gacttgcacg cctttcgaac aaagacgcaa 240caaaggaaag cgaaagcgtc acgaacgagg ttgttccctg acagttgttc gactaataca 300actgcaagac actgaataag cagtaaaaat caatatagat taaagttaaa cgaacatgct 360caacatcgaa tactactcat atgtgttatt attaagagaa taccaccaag gtagaaaagt 420taaaggacct aaactgttgt gccgggagag ttgtgcgacg aacagatgta aatatgataa 480aataagttca aagttcatat agatagcacg atcacactta gggctagttt gaagccataa 540aaatggaaga gattaaatga gataaaattc acttatttaa ttttaaataa gaagagagtt 600ttaacccctc taattctctc cagtatttta gctcctaaac tagctcttac agcagtaaaa 660gacccttgat ggtagcgtat gcaaagagaa ggaactattc aatgaattgt ttttttaatc 720actagtagta tggtgggtaa ctgtcgtcaa ccggccctat ctacttcagt ttagtgaagc 780actaaaccgc accttggtat gttcaaattt aagatttttt ttgaaacgaa acaattttaa 840ccagcggctc caaaccggtg aagtggtttg gtctttggtg tggggccagg gtattaatgg 900aattgaatat ataaagagca gggtggtgga cctttcccct cccacgagtc gagtagccat 960tgcccattgc cattccttcc ttcctccaca gagaaatccg atccgcggag atttgaccca 1020accagatcat atcacacacg taatcccatc ccattccgcc cggagctcgg tacccgggcc 1080ttcacctgcg gagggtaaga tccgatcacc atcttctgaa tttctgttct tgatctgtca 1140tgtataataa ctgtctagtc ttggtgttgg tgagatggaa attcggtgga tctcggaagg 1200gatattgttc gtttgctggg gttttttttg tgtgttgtga tccgtagàga atttgtgttt 1260atccatgttg ttgatcttgg tatgtattca tgacatattg acatgcatgt gttgtatgtg 1320tcatatgtgt gcctctcctt gggatttgtt ttggataata gaacatgtta tggactcaat 1380agtctgtgaa caaatctttt tttagatggt ggccaaatct gatgatgatc tttcttgaga 1440ggaaaaagtt catgatagaa aaatcttttt tgagatggtg gcttaatgtg atgatgatct 1500ttcttgagag gaaaaaaaag attcattata ggagattttg atttagctcc tttccaccga 1560tattaaatga ggagcatgca tgctgattgc tgataaggat ctgatttttt tatcccctct 1620tctttgaaca gacaagaaat aggctctgaa tttctgattg attatttgta catgcag 1677
<210> 120
<211> 1318
<212> DNA
<213> Artificial
<220>
<223> cassete de vetor pBPSLM229 (ZmLDH: : BPS 1.5)<220>
<22l> promotor
<222> (1)..(1062)
<223> lactato desigenase 5' do gene Z. mays
<220>
<221> Intron
<222> (1068)..(1318)
<223> IME-Intron: intron deBPSI.5
<400> 120
aacaaatggc gtacttatat aaccacaatg tactggtgctgcatatatta ttataagtag agaaagctca caaaaccatgtcggtcgcta attacaccct ttgtatcgtt ggttgatgatgtcatcgatc gttgatttat ttttatcacc gacttgcacgcaaaggaaag cgaaagcgtc acgaacgagg ttgttccctgactgcaagac actgaataag cagtaaaaat caatatagatcaacatcgaa tactactcat atgtgttatt attaagagaataaaggacct aaactgttgt gccgggagag ttgtgcgacgaataagttca aagttcatat agatagcacg atcacacttaaaatggaaga gattaaatga gataaaattc acttatttaattaacccctc taattctctc cagtatttta gctcctaaacgacccttgat ggtagcgtat gcaaagagaa ggaactattc
/promotor de UTR
gcgtcattat tttatactac 60cgcgcgcccc cctgtttgtt 120ggtctccacc ggccgtacga 180cctttcgaac aaagacgcaa 240acagttgttc gactaataca 300taaagttaaa cgaacatgct 360taccaccaag gtagaaaagt 420aacagatgta aatatgataa 480gggctagttt gaagccataa 540ttttaaataa gaagagagtt 600tagctcttac agcagtaaaa 660aatgaattgt ttttttaatc 720actagtagta tggtgggtaa ctgtcgtcaa ccggccctat ctacttcagt ttagtgaagc 780actaaaccgc accttggtat gttcaaattt aagatttttt ttgaaacgaa acaattttaa 840ccagcggctc caaaccggtg aagtggtttg gtctttggtg tggggccagg gtattaatgg 900aattgaatat ataaagagca gggtggtgga cctttcccct cccacgagtc gagtagccat 960tgcccattgc cattccttcc ttcctccaca gagaaatccg atccgcggag atttgaccca 1020accagatcat atcacacacg taatcccatc ccattccgcc cggagctctc tggtggctga 1080ggtaagttct gttattacct cataaactgc ctgctgataa tactttaaca atgtgctaat 1140attagtcttt gtaataagat agtactatac tgaaaatatt ttagcgagta tgagtaattt 1200aacttacata ttgtattgct gttcctcttt ttcaaccctg tcatattggt tgcttttttt 1260cacagcctaa catgctcttg tttggtcatt ttcccctgtt ttcaggtttt cctgtccg 1318
<210> 121
<211> 2001
<212> DNA
<213> Artificial
<220>
<223> cassete de vetor PBPSMM371 (OsLea: :BPSI. 1)<220>
<221> promotor
<222> (1)..{1386)
<220>
<221> promotor
<222> (1).. (1386)
<223> promotor Lea de Oryza sativa (Embriogênese tardia abundante)
<220>
<221> Intron
<222> (1387)..(2001)
<223> IME-Intron: intron deBPSI.l
<400> 121 tcgggttgct atctggcccg tcccaagacg agttctgatc ggatccggcc cagctcagcc 60aatgccaagc tgcagatgat gaacaagaag catatggcct tatcttatct tttcgtttat 120atttatactt atcagacaaa atttaaaatt ttaacactag atttaaaact aattttcagg 180tttttctcat taaaatttgt ttttcaatct ttgcttttag gtcgttaaga acacgtatat 240aaaaatttta tccacaaatt acttctcatt tacggatatg ccgtttggcc aaccaatagg 300catctgaagg tgcaggtgac gggagcgaac aagttccagg gcctccttcc attctgctca 360agcagcagca gggggaggaa gaagtagtta ccagcagttt attaattagg ccgagtggac 420aagatcgatg gcgcagaaaa cgtacccttc cacaactgta taatctagat taaattttac 480aaaaactaca tgtattttac attatttata acaaaactat aaatttaaaa gcttgttttt 540ttcgctggga tggtgaagaa tgccgaccga tgtatattaa ggaaaaggga aaaactgtac 600aaacctcctc gggaggaggc acaaatgtag tgcatcaaaa gcaccgcctt tacaacatta 660agcaagtttc aaaggctata atctctctaa agctggtgct gcggcaacac tcaatgagct 720
aactagccct gctaattttc aagtttccca ttcatcacac atgatcgcac acagttgtgt 780
gaccgacgag cttgttttat aaaattacaa attcagcgtc tccgtttatc acgaaactag 840
acatacttcg tgcaatatat ccatcaacac agataatctc tatatcggta atcactaatt 900
agtgagcaga tcatccatca acatagataa gatctacaat taattcgtta cgaatgaccg 960
gtttcgtagt ggtggtggag agggaggccg ccgaccaaac caaggtcctg cggccgggaa 1020
aacgatgtgg cttttagtag caggagtcgg cagaaagcat gttggtcgga gaagaacata 1080
tgccgtacgt tttgtacagg tggtgcatcc agaaaaatct cgatcgcaac tagcggggac 114 0
gtgtgtccag tcctggtgtt ccgatcgatc gacgtggtgt acatgcatcg cgtccacgta 1200
acagccattc atgcatgatg atcgtcttcg tccatcgacc aaagtcgtcc aagtgcagca 1260
tatatataat cggatgcaac tcgagcaacc ttacttccca tcatacgcac tgcaagctta 1320
gcttggtgag gatcgatcga tcggagaaga tcatcagatt gataattaaa gtaagaaagg 1380
tcgagggagc tcggtacccg ggccttcacc tgcggagggt aagatccgat caccatcttc 1440
tgaatttctg ttcttgatct gtcatgtata ataactgtct agtcttggtg ttggtgagat 1500
ggaaattcgg tggatctcgg aagggatatt gttcgtttgc tggggttttt tttgtgtgtt 1560
gtgatccgta gagaatttgt gtttatccat gttgttgatc ttggtatgta ttcatgacat 1620
attgacatgc atgtgttgta tgtgtcatat gtgtgcctct ccttgggatt tgttttggat 1680
aatagaacat gttatggact caatagtctg tgaacaaatc tttttttaga tggtggccaa 1740
atctgatgat gatctttctt gagaggaaaa agttcatgat agaaaaatct tttttgagat 1800
ggtggcttaa tgtgatgatg atctttcttg agaggaaaaa aaagattcat tataggagat 1860
tttgatttag ctcctttcca ccgatattaa atgaggagca tgcatgctga ttgctgataa 1920
ggatctgatt tttttatccc ctcttctttg aacagacaag aaataggctc tgaatttctg 1980
attgattatt tgtacatgca g 2001

Claims (33)

1. Método para identificar um íntron com propriedadesintensificadoras de expressão em plantas, caracterizado pelo fato de quecompreende, selecionar um íntron de um genoma de planta, em que ditoíntron é distinguido por pelo menos as seguintes características:I) um comprimento de íntron mais curto do que 1000 pares de bases, eII) presença de um sítio de emenda 5' compreendendo a seqüência dedinucleotídeo 5'-GT-3' (SEQID NO:78), eIII) presença de um sítio de emenda 3' compreendendo a seqüência detrinucleotídeo 5 '-CAG-3' (SEQ ID NO: 79), eIV) presença de um ponto de ramificação parecendo a seqüência denucleotídeos consenso 5'-CURAY-3' (SEQ ID NO:75), a montantedo sítio de emenda 3eV) um teor de adenina mais timina de pelo menos 40% sobre 100nucleotídeos a jusante do sítio de emenda 5', eVI) um teor de adenina mais timina de pelo menos 50% sobre 100nucleotídeos a montante do sítio de emenda 3', eVII) um teor de adenina mais timina de pelo menos 50%, e um teor detimina de pelo menos 30% sobre íntron inteiro.
2. Método para enriquecer o número de íntrons compropriedades intensificadoras de expressão em plantas em uma população deíntrons de planta para uma porcentagem de pelo menos 50% de ditapopulação, caracterizado pelo fato de que compreende selecionar íntrons dedita população, em que ditos íntrons são distinguidos por pelo menos asseguintes características:I) um comprimento de íntron mais curto do que 1000 pares de bases, eII) presença de um sítio de emenda 5' compreendendo a seqüência dedinucleotídeo 5'-GT-3' (SEQ ID NO: 78), eIII) presença de um sítio de emenda 3' compreendendo a seqüência detrinucleotídeo 5'-CAG-3' (SEQ ID NO:79), eIV) presença de um ponto de ramificação parecendo a seqüência denucleotídeos consenso 5'-CURAY-3' (SEQ ID NO:75), a montantedo sítio de emenda 3eV) um teor de adenina mais timina de pelo menos 40% sobre 100nucleotídeos a jusante do sítio de emenda 5', eVI) um teor de adenina mais timina de pelo menos 50% sobre 100nucleotídeos a montante do sítio de emenda 3', eVII) um teor de adenina mais timina de pelo menos 50%, e um teor detimina de pelo menos 30% sobre íntron inteiro.
3. Método de acordo com a reivindicação 1 ou 2, caracterizadopelo fato de que dito íntron com propriedades intensificadoras de expressãoem plantas é selecionado a partir do grupo consistindo de:a) íntrons localizados entre dois éxons codificando proteína, eb) íntrons localizados dentro da região 5' não traduzida do genecorrespondente.
4. Método de acordo com qualquer uma das reivindicações 1 a-3, caracterizado pelo fato de que dito íntron com propriedadesintensificadoras de expressão em plantas é derivado de um gene do grupo degenes representando a fração de 10% de genes com a maior taxa de expressãoem um experimento de análise de expressão de gene realizado usando umacélula de planta, tecido de planta ou uma planta inteira.
5. Método de acordo com reivindicação 2, caracterizado pelofato de que dita população de íntrons de planta compreende substancialmentetodos os íntrons de um genoma de planta representados em um banco dedados de seqüências de DNA genômico ou uma biblioteca de DNA genômicovegetal.
6. Método de acordo com qualquer uma das reivindicações 1 a-5, caracterizado pelo fato de que a informação de seqüência gênica usada paraa identificação ou enriquecimento de ditos íntrons com propriedadesintensificadoras de expressão em plantas está presente em um banco de dadosde seqüências de DNA e as etapas de seleção para identificar ou enriquecerditos íntrons com propriedades intensificadoras de expressão em plantas sãorealizadas usando um processo automatizado.
7. Método de acordo com a reivindicação 6, caracterizado pelofato de que o processo automatizado é feito usando um dispositivo decomputador e um algoritmo que define as instruções necessárias para realizaras etapas de seleção para identificar ou enriquecer ditos íntrons compropriedades intensificadoras de expressão em plantas.
8. Algoritmo de computador, caracterizado por definir asinstruções necessárias para realizar as etapas de seleção para identificar ouenriquecer íntrons com propriedades intensificadoras de expressão em plantascomo definidas em qualquer das reivindicações 1 a 7.
9. Dispositivo de computador ou dispositivo dearmazenamento de dados, caracterizado pelo fato de compreender umalgoritmo como definido na reivindicação 8.
10. Método para isolar, fornecer ou produzir um íntron compropriedades intensificadoras de expressão em plantas, caracterizado pelo fatode compreender as etapas de:a) realizar uma identificação ou enriquecimento de íntrons compropriedades intensificadoras de expressão em plantas comodefinidas em qualquer das reivindicações 1 a 7 e fornecer ainformação de seqüência de ditos íntrons identificados ouenriquecidos, eb) fornecer a seqüência de nucleotídeos física de ditos íntronsidentificados ou enriquecidos em a), ec) avaliar as propriedades intensificadoras de expressão de gene dasseqüências de íntron fornecidas em b) em um experimento deexpressão in vivo ou in vitro, ed) isolar íntron de dito experimento de expressão c), que demonstrapropriedades intensificadoras de expressão.
11. Método de acordo com reivindicação 10, caracterizadopelo fato de que dita avaliação das propriedades intensificadoras de expressãoé feita em uma célula de planta e em que dito íntron isolado intensificaexpressão pelo menos duas vezes.
12. Construto de expressão de DNA recombinante,caracterizado pelo fato de compreender:a) pelo menos uma seqüência de promotor funcionando em plantas oucélulas de planta, eb) pelo menos um íntron selecionado a partir do grupo consistindo dasseqüências descritas por SEQ ID NOs: 1, 2, 3, 5, 6, 7, 10, 11, 12,-13, 14, 15, 16, 17, 18, 19, 20, 21 e 22, e equivalentes funcionaisdestas, ec) pelo menos uma seqüência de ácidos nucleicos,em que pelo menos uma de dita seqüência de promotor e pelomenos uma de ditas seqüências de íntron são funcionalmente ligadas a pelomenos uma de dita seqüência de ácidos nucleicos e em que dito íntron éheterólogo para dita seqüência de ácidos nucleicos e/ou para dita seqüência depromotor.
13. Construto de expressão de DNA recombinante de acordocom reivindicação 12, caracterizado pelo fato de que dito equivalentefuncional compreende os elementos funcionais de um íntron e é distinguidopor uma seqüência-1. tendo pelo menos 50 pares de bases consecutivos de uma seqüênciade íntron descrita por qualquer de SEQ ID NOs: 1, 2, 3, 5, 6, 7, 10,-11,12, 13, 14, 15, 16, 17, 18, 19, 20, 21 ou 22, ou-2. tendo uma identidade de pelo menos 80% sobre uma seqüência depelo menos 95 pares de bases de ácidos nucleicos consecutivos parauma seqüência descrita por qualquer de SEQ ID NOs: 1, 2, 3, 5, 6,- 7, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20,21 ou 22, ou- 3. hibridizando em condições estringentes altas com um fragmento deácido nucleico de pelo menos 50 pares de bases consecutivos deuma molécula de ácido nucleico descrita por qualquer de SEQ IDNOs: 1, 2, 3, 5, 6, 7, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 ou 22.
14. Construto de expressão de DNA recombinante de acordocom reivindicação 12 a 13, caracterizado pelo fato de que compreendeadicionalmente uma ou mais seqüências reguladoras adicionaisfuncionalmente ligadas a dito promotor.
15. Construto de expressão de DNA recombinante de acordocom reivindicação 14, caracterizado pelo fato de que a seqüência reguladora éselecionada a partir do grupo consistindo de elementos de choque térmico,responsivos anaeróbicos, responsivos a patógeno, responsivos a seca,responsivos a baixa temperatura, responsivos a ABA, região 5' não traduzidade gene, região 3' não traduzida de gene, terminadores de transcrição, sinaisde poliadenilação, e intensificadores.
16. Construto de expressão de DNA recombinante comodefinido em qualquer uma das reivindicações 12 a 15, caracterizado pelo fatode que dito ácido nucleico codifica parai) uma proteína ouii) uma seqüência de RNA sentido, anti-sentido, ou de duplofilamento.
17. Construto de expressão de DNA recombinante de acordocom qualquer uma das reivindicações 12 a 16, caracterizado pelo fato de quedita seqüência de ácidos nucleicos codifica uma proteína marcadoraselecionável, uma proteína marcadora triável, uma proteína ativa anabólica,uma proteína ativa catabólica, uma proteína de resistência a estresse bióticoou abiótico, uma proteína de esterilidade de macho, ou uma proteína afetandocaracterísticas agronômicas de planta.
18. Construto de expressão de DNA recombinante de acordocom qualquer uma das reivindicações 12 a 17, caracterizado pelo fato de quedita seqüência de promotor funcionando em plantas ou células de planta éselecionada a partir do grupo consistindo dea) o promotor de proteína 12 de cloroplasto de arroz como descrito pornucleotídeo 1 a 854 de SEQ ID NO: 113, ou uma seqüência tendopelo menos 60% de identidade para dito fragmento, ou umaseqüência hibridizando em condições estringentes para ditofragmento, ou uma seqüência compreendendo pelo menos 50nucleotídeos consecutivos de dito fragmento, eb) o promotor de glicoproteína rica em hidroxiprolina de milho comodescrito por nucleotídeo 1 a 1184 de SEQ ID NO: 114, ou umaseqüência tendo pelo menos 60% de identidade para dito fragmento,ou uma seqüência hibridizando em condições estringentes para ditofragmento, ou uma seqüência compreendendo pelo menos 50nucleotídeos consecutivos de dito fragmento, ec) o promotor de p-cafeoil-CoA 3-O-metiltransferase como descritopor nucleotídeo 1 a 1034 de SEQ ID NO: 115, ou uma seqüênciatendo pelo menos 60% de identidade para dito fragmento, ou umaseqüência hibridizando em condições estringentes para ditofragmento, ou uma seqüência compreendendo pelo menos 50nucleotídeos consecutivos de dito fragmento, ed) o promotor (W64A) de Globulina-I [ZmGlbl] de milho comodescrito por nucleotídeo 1 a 1440 de SEQ ID NO: 116, ou umaseqüência tendo pelo menos 60% de identidade para dito fragmento,ou uma seqüência hibridizando em condições estringentes para ditofragmento, ou uma seqüência compreendendo pelo menos 50nucleotídeos consecutivos de dito fragmento, ee) o promotor putativo de ATP sintase transportando H+ de arrozcomo descrito por nucleotídeo 1 a 1589 de SEQ ID NO: 117, ouuma seqüência tendo pelo menos 60% de identidade para ditofragmento, ou uma seqüência hibridizando em condiçõesestringentes para dito fragmento, ou uma seqüência compreendendopelo menos 50 nucleotídeos consecutivos de dito fragmento, ef) o promotor putativo de C-8,7 esterol isomerase de arroz comodescrito por nucleotídeo 1 a 796 de SEQ ID NO: 118, ou umaseqüência tendo pelo menos 60% de identidade para dito fragmento,ou uma seqüência hibridizando em condições estringentes para ditofragmento, ou uma seqüência compreendendo pelo menos 50nucleotídeos consecutivos de dito fragmento, eg) o promotor de lactato desidrogenase de milho como descrito pornucleotídeo 1 a 1062 de SEQ ID NO: 119, ou uma seqüência tendopelo menos 60% de identidade para dito fragmento, ou umaseqüência hibridizando em condições estringentes para ditofragmento, ou uma seqüência compreendendo pelo menos 50nucleotídeos consecutivos de dito fragmento, eh) o promotor Lea de arroz como descrito por nucleotídeo 1 a 1386 deSEQ ID NO: 121, ou uma seqüência tendo pelo menos 60% deidentidade para dito fragmento, ou uma seqüência hibridizando emcondições estringentes para dito fragmento, ou uma seqüênciacompreendendo pelo menos 50 nucleotídeos consecutivos de ditofragmento.
19. Construto de expressão de DNA recombinante de acordocom qualquer uma das reivindicações 12 a 18, caracterizado pelo fato de quedito construto de expressão está compreendendo uma combinação depromotor como definido na reivindicação 18 e íntron selecionado a partir dogrupo consistindo dei) o íntron BPSI.l como descrito por nucleotídeo 888 a 1470 de SEQID NO: 113, ou uma seqüência tendo pelo menos 60% deidentidade para dito fragmento, ou uma seqüência hibridizando emcondições estringentes para dito fragmento, ou uma seqüênciacompreendendo pelo menos 50 nucleotídeos consecutivos de ditofragmento eii) o íntron BPSI.5 como descrito por nucleotídeo 1068 a 1318 de SEQID NO: 120, ou uma seqüência tendo pelo menos 60% deidentidade para dito fragmento, ou uma seqüência hibridizando emcondições estringentes para dito fragmento, ou uma seqüênciacompreendendo pelo menos 50 nucleotídeos consecutivos de ditofragmento.
20. Construto de expressão de DNA recombinante de acordocom qualquer uma das reivindicações 12 a 19, caracterizado pelo fato de quedito construto de expressão está compreendendo uma combinação depromotor e íntron selecionado a partir do grupo consistindo dei) seqüências como descrito por qualquer de SEQ ID NO: 113, 114,-115, 116, 117, 118, 119, 120, ou 121, eii) seqüências tendo pelo menos 50 nucleotídeos consecutivos de umaseqüência descrita por qualquer de SEQ ID NOs: 113, 114, 115,-116, 117, 118, 119, 120, ou 121, eiii) seqüências tendo uma identidade de pelo menos 60% to umaseqüência descrita por qualquer de SEQ ID NOs: 113, 114, 115,-116, 117, 118, 119, 120, ou 121, eiv) seqüências hibridizando em condições estringentes com seqüênciadescrita por qualquer de SEQ ID NOs: 113, 114, 115, 116, 117,-118, 119, 120, ou 121.
21. Vetor de expressão, caracterizado pelo fato decompreender um construto de expressão recombinante como definido emqualquer uma das reivindicações 12 a 20.
22. Célula transgênica ou organismo não humano transgênico,caracterizado pelo fato de compreender um vetor de expressão como definidona reivindicação 21 ou um construto de expressão como definido em qualqueruma das reivindicações 12 a 20.
23. Célula ou organismo não humano de acordo comreivindicação 22, caracterizado pelo fato de ser selecionado a partir do grupoconsistindo de bactérias, fungos, leveduras e plantas.
24. Célula transgênica ou organismo não humano de acordocom reivindicação 22 ou 23, caracterizado pelo fato de que dita célula ouorganismo é uma célula ou organismo de planta monocotiledônea selecionadoa partir do grupo consistindo dos gêneros Hordeum, Avena, Secale, Triticum,Sorghum, Zea, Saccharum e Oryza.
25. Cultura celular, partes ou material de propagação,caracterizadaÇoXs) pelo fato de ser derivado de um organismo de célulatransgênica como definido na reivindicação 22 a 24.
26. Método para fornecer um cassete de expressão paraexpressão intensificada de uma seqüência de ácidos nucleicos em uma plantaou uma célula de planta, caracterizado pelo fato de compreender a etapa deligar funcionalmente pelo menos um íntron como definido na reivindicação-12 a 13 a dita seqüência de ácidos nucleicos.
27. Método para intensificar a expressão de uma seqüência deácidos nucleicos em uma planta ou uma célula de planta, caracterizado pelofato de compreender ligar funcionalmente pelo menos um íntron comodefinido na reivindicação 12 a 13 a dita seqüência de ácidos nucleicos.
28. Método de acordo com a reivindicação 26 a 27,caracterizado pelo fato de que adicionalmente uma seqüência de promotorfuncional em plantas é ligada a dita seqüência de ácidos nucleicos.
29. Método de acordo com a reivindicação 26 a 27,caracterizado pelo fato de que o íntron é ligado a dita seqüência de ácidosnucleicos por inserção no DNA genômico de planta através de recombinaçãohomóloga.
30. Método de acordo com qualquer uma das reivindicações-26 a 29, caracterizado pelo fato de que dita planta ou célula de planta é umaplanta ou célula de planta monocotiledônea.
31. Método de acordo com a reivindicação 26 a 30,caracterizado pelo fato de que dito ácido nucleico codifica para uma proteínacomo definida na reivindicação 17 ou um RNA sentido, anti-sentido, ou deduplo filamento.
32. Uso de um organismo transgênico como definido nareivindicação 22 a 24 ou de culturas celulares, partes de material depropagação transgênico derivadas destas como definidas na reivindicação 25,caracterizado pelo fato de ser para a produção de gêneros alimentícios, raçõespara animais, sementes, produtos farmacêuticos ou produtos químicos finos.
33. Construto de expressão de DNA recombinante,caracterizado pelo fato de compreender:a) pelo menos uma seqüência de promotor funcionando em plantas oucélulas de planta, eb) pelo menos um íntron com propriedades intensificadoras deexpressão em plantas ou células de planta distinguido por pelomenos as seguintes característicasI) um comprimento de íntron mais curto do que 1000 pares debases, eII) presença de um sítio de emenda 5' compreendendo a seqüênciade dinucleotídeo 5-GT-3' (SEQ ID NO: 78), eIII) presença de um sítio de emenda 3' compreendendo a seqüênciade trinucleotídeo 5-CAG-3' (SEQ ID NO: 79), eIV) presença de um ponto de ramificação parecendo a seqüênciaconsenso 5'-CURAY-3' (SEQ ID NO: 75) a montante do sítiode emenda 3eV) um teor de adenina mais timina de pelo menos 40% sobre 100nucleotídeos a jusante do sítio de emenda 5', eVI) um teor de adenina mais timina de pelo menos 50% sobre 100nucleotídeos a montante do sítio de emenda 3', eVII) um teor de adenina mais timina de pelo menos 55%, e um teorde timina de pelo menos 30% sobre íntron inteiro,ec) pelo menos uma seqüência de ácidos nucleicos,em que dita seqüência de promotor e pelo menos uma de ditasseqüências de íntron são funcionalmente ligadas a dita seqüência de ácidosnucleicos e em que dito íntron é heterólogo para dita seqüência de ácidosnucleicos e/ou para dita seqüência de promotor.
BRPI0609283-7A 2005-03-08 2006-03-07 métodos para identificar um ìntron com propriedades intensificadoras de expressão em plantas, para enriquecer o número de ìntrons com propriedades intensificadoras de expressão em plantas, para isolar, fornecer ou produzir um ìntron com propriedades intensificadoras de expressão em plantas, para fornecer um cassete de expressão e para intensificar a expressão de uma seqüência de ácidos nucleicos em uma planta ou uma célula de planta, algoritmo de computador, dispositivo de computador ou dispositivo de armazenamento de dados, construto de expressão de dna recombinante, vetor de expressão, célula transgênica ou organismo não humano transgênico, cultura celular, partes ou material de propagação, e, uso de um organismo transgênico ou de culturas celulares, partes de material de propagação transgênico derivadas destas BRPI0609283A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US65948205P 2005-03-08 2005-03-08
US60/659482 2005-03-08
PCT/EP2006/060513 WO2006094976A2 (en) 2005-03-08 2006-03-07 Expression enhancing intron sequences

Publications (1)

Publication Number Publication Date
BRPI0609283A2 true BRPI0609283A2 (pt) 2010-11-23

Family

ID=36593798

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0609283-7A BRPI0609283A2 (pt) 2005-03-08 2006-03-07 métodos para identificar um ìntron com propriedades intensificadoras de expressão em plantas, para enriquecer o número de ìntrons com propriedades intensificadoras de expressão em plantas, para isolar, fornecer ou produzir um ìntron com propriedades intensificadoras de expressão em plantas, para fornecer um cassete de expressão e para intensificar a expressão de uma seqüência de ácidos nucleicos em uma planta ou uma célula de planta, algoritmo de computador, dispositivo de computador ou dispositivo de armazenamento de dados, construto de expressão de dna recombinante, vetor de expressão, célula transgênica ou organismo não humano transgênico, cultura celular, partes ou material de propagação, e, uso de um organismo transgênico ou de culturas celulares, partes de material de propagação transgênico derivadas destas

Country Status (9)

Country Link
US (3) US8088971B2 (pt)
EP (7) EP2045327B8 (pt)
CN (2) CN101137752B (pt)
AT (1) ATE541043T1 (pt)
AU (1) AU2006222012B2 (pt)
BR (1) BRPI0609283A2 (pt)
CA (1) CA2599405A1 (pt)
WO (1) WO2006094976A2 (pt)
ZA (1) ZA200708512B (pt)

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2366790A1 (en) 2004-04-20 2011-09-21 Syngenta Participations AG Regulatory sequences for expressing gene products in plant reproductive tissue
KR20080052570A (ko) 2005-07-29 2008-06-11 타게티드 그로스 인코퍼레이티드 야생형 krp에 의한 활성 사이클린-cdk 복합체 억제의우성 음성 돌연변이 krp 단백질 보호
CA2637588A1 (en) 2006-02-17 2007-08-30 Monsanto Technology Llc Chimeric regulatory sequences comprising introns from dicotyledons for plant gene expression
US20110035840A1 (en) * 2007-02-16 2011-02-10 Basf Plant Science Gmbh Nucleic acid sequences for regulation of embryo-specific expression in monocotyledoneous plants
US8832581B2 (en) * 2009-03-05 2014-09-09 Ming Zhang Gene expression browser for web-based search and visualization of characteristics of gene expression
DE112010003162T5 (de) 2009-04-22 2012-08-16 Basf Plant Science Company Gmbh Gesamtsamen-spezifischer Promotor
CN111560375A (zh) * 2009-08-31 2020-08-21 巴斯夫植物科学有限公司 用于增强植物中种子特异的和/或种子优先的基因表达的调节性核酸分子
ES2736037T3 (es) * 2010-01-14 2019-12-23 Monsanto Technology Llc Elementos reguladores de las plantas y usos de los mismos
CN102933712A (zh) * 2010-06-09 2013-02-13 纳幕尔杜邦公司 用于在植物中调节转基因表达的调控序列
BR112013011855A2 (pt) * 2010-11-12 2017-11-07 Targeted Growth Inc proteínas relacionadas á kip mutante negativa dominante (krp) em zea mays, e métodos de uso das mesmas
CN102154289B (zh) * 2011-01-11 2012-08-22 吉林大学 玉米干旱诱导型基因启动子及活性分析
EP2686430B1 (en) 2011-03-18 2018-06-06 BASF Plant Science Company GmbH Promoters for regulating expression in plants
US9062323B2 (en) 2011-04-11 2015-06-23 The Regents Of The University Of California Identification and use of KRP mutants in wheat
AU2012242991B2 (en) 2011-04-11 2017-03-02 Targeted Growth, Inc. Identification and the use of KRP mutants in plants
US8951776B2 (en) 2011-10-19 2015-02-10 Massachusetts Institute Of Technology Engineered microbes and methods for microbial oil production
WO2014004638A2 (en) * 2012-06-29 2014-01-03 Monsanto Technology Llc Methods and compositions for enhancing gene expression
CA2901316A1 (en) 2013-03-15 2014-09-25 Pioneer Hi-Bred International, Inc. Phi-4 polypeptides and methods for their use
WO2015023846A2 (en) 2013-08-16 2015-02-19 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
BR102014021330A2 (pt) * 2013-08-30 2015-09-22 Dow Agrosciences Llc construtos para expressão de transgenes usando elementos reguladores de genes de ubiquitina de panicum
ES2937045T3 (es) 2013-09-13 2023-03-23 Pioneer Hi Bred Int Proteínas insecticidas y métodos para su uso
CN103555716B (zh) * 2013-11-06 2016-01-20 北京大北农科技集团股份有限公司 增强表达的内含子序列及其用途
WO2015120270A1 (en) 2014-02-07 2015-08-13 Pioneer Hi Bred International, Inc. Insecticidal proteins and methods for their use
MX2016010187A (es) 2014-02-07 2017-07-11 Pioneer Hi Bred Int Proteinas insecticidas y metodos para su uso.
CN104318131A (zh) * 2014-10-11 2015-01-28 中国农业科学院棉花研究所 电子fish的方法
BR112017007932A2 (pt) 2014-10-16 2018-01-23 Du Pont proteínas inseticidas e métodos para uso das mesmas
CA2977026A1 (en) 2015-03-11 2016-09-15 E.I. Du Pont De Nemours And Company Insecticidal combinations of pip-72 and methods of use
CN116333064A (zh) 2015-05-19 2023-06-27 先锋国际良种公司 杀昆虫蛋白及其使用方法
EP3943602A1 (en) 2015-08-06 2022-01-26 Pioneer Hi-Bred International, Inc. Plant derived insecticidal proteins and methods for their use
US20180325119A1 (en) 2015-12-18 2018-11-15 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
WO2017178367A1 (en) * 2016-04-13 2017-10-19 Bayer Cropscience Nv Seed- and funiculus-preferential promoters and uses thereof
EP3960863A1 (en) 2016-05-04 2022-03-02 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
MX2018015906A (es) 2016-07-01 2019-04-04 Pioneer Hi Bred Int Proteinas insecticidas de plantas y metodos para sus usos.
CN110088123B (zh) 2016-12-14 2023-10-20 先锋国际良种公司 杀昆虫蛋白及其使用方法
US11213028B2 (en) 2016-12-22 2022-01-04 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
MX2019009371A (es) 2017-02-08 2019-09-23 Pionner Hi Bred Int Inc Combinaciones insecticidas de proteinas insecticidas derivadas de plantas y metodos para su uso.
MX2019013321A (es) 2017-05-11 2020-02-10 Pioneer Hi Bred Int Proteinas insecticidas y metodos para su uso.
US11477970B2 (en) * 2018-02-21 2022-10-25 Nemametrix Inc. Transgenic animal phenotyping platform and uses thereof
WO2019169150A1 (en) 2018-03-02 2019-09-06 Pioneer Hi-Bred International, Inc. Plant health assay
CN111902547B (zh) 2018-03-23 2024-06-14 先锋国际良种公司 鉴定、选择和产生疾病抗性作物的方法
WO2019203942A1 (en) 2018-04-18 2019-10-24 Pioneer Hi-Bred International, Inc. Methods of identifying, selecting, and producing bacterial leaf blight resistant rice
CN108546670A (zh) * 2018-04-19 2018-09-18 贵州大学 一种高粱原生质体的制备方法及制备的原生质体的转化方法
CN108642064B (zh) * 2018-05-21 2021-11-26 安徽农业大学 小麦种子休眠持续期基因TaCNGC-2A及其功能标记
US11851668B2 (en) 2018-06-06 2023-12-26 Huazhong Agricultural University Methods of identifying, selecting, and producing southern corn rust resistant crops
EP3830261A1 (en) * 2018-08-02 2021-06-09 Novozymes A/S Preparation of combinatorial libraries of dna constructs using introns
MX2021002290A (es) 2018-08-29 2021-04-28 Pioneer Hi Bred Int Proteinas insecticidas y metodos para su uso.
SG11202103151RA (en) * 2018-09-28 2021-04-29 Voyager Therapeutics Inc Frataxin expression constructs having engineered promoters and methods of use thereof
US20220282338A1 (en) 2019-08-23 2022-09-08 Pioneer Hi-Bred International, Inc. Methods of identifying, selecting, and producing anthracnose stalk rot resistant crops
AU2020344905A1 (en) * 2019-09-12 2022-04-28 Basf Se Regulatory nucleic acid molecules for enhancing gene expression in plants
CN111153974A (zh) 2020-01-15 2020-05-15 华中农业大学 玉米抗病基因和分子标记及其应用
BR112022020714A2 (pt) 2020-04-15 2022-12-20 Pioneer Hi Bred Int Identificação de gene efetor de patógeno vegetal e de resistência à doença, composições e métodos de uso
CN111534538B (zh) * 2020-05-11 2022-02-01 山西大学 一种快速筛选非转基因定点突变植物的方法
US20230235352A1 (en) 2020-07-14 2023-07-27 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
CN113046373A (zh) * 2021-03-24 2021-06-29 中国热带农业科学院热带生物技术研究所 甘蔗UDP-糖基转移酶基因ShUGT2及其应用
CN115216554A (zh) 2021-04-16 2022-10-21 华中农业大学 植物病原体效应子和疾病抗性基因鉴定、组合物和使用方法
CN113462690B (zh) * 2021-07-02 2022-06-21 河南大学 大豆基因启动子pRPS28和pRPS28-I在大豆、拟南芥及烟草中的应用
CN118019447A (zh) 2021-08-06 2024-05-10 Kws蔬菜有限责任公司 菠菜对霜霉病的持久抗性
CN114875025B (zh) * 2022-03-25 2023-09-19 广东省科学院南繁种业研究所 一种干旱、aba诱导型启动子pscbv-yz2060及其应用
WO2023250325A1 (en) * 2022-06-21 2023-12-28 The Regents Of The University Of California Compositions and methods for treating huntington's disease

Family Cites Families (98)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US695A (en) 1838-04-16 Improved water-wheel
US5527A (en) 1848-04-25 Ship s windlass
JPH0714349B2 (ja) 1983-01-17 1995-02-22 モンサント カンパニ− 植物細胞での発現に適したキメラ遺伝子
US5352605A (en) 1983-01-17 1994-10-04 Monsanto Company Chimeric genes for transforming plant cells using viral promoters
NL8300698A (nl) 1983-02-24 1984-09-17 Univ Leiden Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; agrobacterium tumefaciens bacterien en werkwijze voor het produceren daarvan; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten.
US5504200A (en) 1983-04-15 1996-04-02 Mycogen Plant Science, Inc. Plant gene expression
US5420034A (en) 1986-07-31 1995-05-30 Calgene, Inc. Seed-specific transcriptional regulation
DK162399C (da) 1986-01-28 1992-03-23 Danisco Fremgangsmaade til ekspression af gener i baelgplanteceller, dna-fragment, rekombineret dna-fragment samt plasmid til brug ved udoevelsen af fremgangsmaaden
US4962028A (en) 1986-07-09 1990-10-09 Dna Plant Technology Corporation Plant promotors
US5290924A (en) 1987-02-06 1994-03-01 Last David I Recombinant promoter for gene expression in monocotyledonous plants
US5202231A (en) 1987-04-01 1993-04-13 Drmanac Radoje T Method of sequencing of genomes by hybridization of oligonucleotide probes
US5525464A (en) 1987-04-01 1996-06-11 Hyseq, Inc. Method of sequencing by hybridization of oligonucleotide probes
EP0397687B1 (en) 1987-12-21 1994-05-11 The University Of Toledo Agrobacterium mediated transformation of germinating plant seeds
US5614395A (en) 1988-03-08 1997-03-25 Ciba-Geigy Corporation Chemically regulatable and anti-pathogenic DNA sequences and uses thereof
NZ228320A (en) 1988-03-29 1991-06-25 Du Pont Nucleic acid promoter fragments of the promoter region homologous to the em gene of wheat, dna constructs therefrom and plants thereof
CA1341467C (en) 1988-07-29 2004-12-07 John C. Rogers Producing commercially valuable polypeptides with genetically transformed endosperm tissue
DE3843628A1 (de) 1988-12-21 1990-07-05 Inst Genbiologische Forschung Wundinduzierbare und kartoffelknollenspezifische transkriptionale regulation
KR920701453A (ko) 1989-03-17 1992-08-11 미리엄 디. 멕코나헤이 유전자발현의 외부조절
US5501967A (en) 1989-07-26 1996-03-26 Mogen International, N.V./Rijksuniversiteit Te Leiden Process for the site-directed integration of DNA into the genome of plants
JPH05501352A (ja) 1989-08-09 1993-03-18 ディカルブ ジェネティクス コーポレイション 安定な形質転換稔性単子葉植物およびそれらの細胞を製造するための方法および組成物
US5322783A (en) 1989-10-17 1994-06-21 Pioneer Hi-Bred International, Inc. Soybean transformation by microparticle bombardment
JPH04506155A (ja) 1990-03-16 1992-10-29 カルジーン,インコーポレイティド 初期種子形成において優先的に発現される新規配列およびそれに関連する方法
DE69132366T2 (de) * 1990-05-18 2001-04-05 Mycogen Plant Science Inc Rekombinanter Promoter zur Genexpression in Monokotylen
US5187267A (en) 1990-06-19 1993-02-16 Calgene, Inc. Plant proteins, promoters, coding sequences and use
DK152291D0 (da) 1991-08-28 1991-08-28 Danisco Fremgangsmaade og kemiske forbindelser
WO1993014218A1 (en) 1992-01-13 1993-07-22 Duke University Enzymatic rna molecules
IL101119A0 (en) 1992-03-03 1992-11-15 Univ Ramot Transgenic wheat
DE4208050A1 (de) 1992-03-13 1993-09-23 Bayer Ag Azolylmethyl-fluorcyclopropyl-derivate
CA2092069A1 (en) 1992-03-27 1993-09-28 Asako Iida An expression plasmid for seeds
DK0637339T3 (da) 1992-04-13 2001-12-03 Syngenta Ltd DNA-konstruktioner og planter, hvori de er inkorporeret
AU4539593A (en) 1992-06-23 1994-01-24 South Dakota State University Transformation of plants by direct injection of dna
WO1994000977A1 (en) 1992-07-07 1994-01-20 Japan Tobacco Inc. Method of transforming monocotyledon
JPH0662870A (ja) 1992-08-18 1994-03-08 Mitsui Giyousai Shokubutsu Bio Kenkyusho:Kk 大豆ホスホエノールピルビン酸カルボキシラーゼ遺伝子のプロモーター領域及び5’非翻訳領域
JPH08503853A (ja) 1992-11-30 1996-04-30 チューア,ナム−ハイ 植物における組織−及び発生−特異的な発現を付与する発現モチーフ
US5527695A (en) 1993-01-29 1996-06-18 Purdue Research Foundation Controlled modification of eukaryotic genomes
CA2174954C (en) 1993-11-19 2005-03-15 Stanton B. Gelvin Chimeric regulatory regions and gene cassettes for expression of genes in plants
GB9324707D0 (en) 1993-12-02 1994-01-19 Olsen Odd Arne Promoter
CA2178729A1 (en) 1993-12-09 1995-06-15 Eric B. Kmiec Compounds and methods for site-directed mutations in eukaryotic cells
US5576198A (en) 1993-12-14 1996-11-19 Calgene, Inc. Controlled expression of transgenic constructs in plant plastids
DK0690732T3 (da) 1994-01-21 2003-05-19 Powderject Vaccines Inc Gasdrevet genindførselsinstrument
GB9403512D0 (en) 1994-02-24 1994-04-13 Olsen Odd Arne Promoter
GB9421286D0 (en) 1994-10-21 1994-12-07 Danisco Promoter
US5689040A (en) 1995-02-23 1997-11-18 The Regents Of The University Of California Plant promoter sequences useful for gene expression in seeds and seedlings
EP0769553B1 (en) * 1995-03-29 2007-04-25 Japan Tobacco Inc. Dna fragment, recombination vector containing the same, and method of the expression of alien gene with the use of the same
DK0781849T3 (da) 1995-07-05 2008-01-14 Sapporo Breweries Fremgangsmåde, hvor der anvendes en vævsspecifik promotor
GB9516241D0 (en) 1995-08-08 1995-10-11 Zeneca Ltd Dna constructs
RU2192466C2 (ru) 1995-08-10 2002-11-10 Ратгерс Юниверсити Кодируемая ядерной днк система транскрипции в пластидах высших растений
EP0847445B1 (en) 1995-08-30 2006-06-07 BASF Plant Science GmbH STIMULATION OF HOMOLOGOUS RECOMBINATION IN plant ORGANISMS OR CELLS BY RECOMBINATION PROMOTING ENZYMES
US5879941A (en) 1995-10-06 1999-03-09 University Of Florida Polypeptides and polynucleotides relating to the α-and β-subunits of a glutamate dehydrogenase and methods of use
WO1997013843A1 (en) 1995-10-12 1997-04-17 Cornell Research Foundation, Inc. Production of water stress or salt stress tolerant transgenic cereal plants
AR006928A1 (es) 1996-05-01 1999-09-29 Pioneer Hi Bred Int Una molecula de adn aislada que codifica una proteina fluorescente verde como marcador rastreable para la transformacion de plantas, un metodo para laproduccion de plantas transgenicas, un vector de expresion, una planta transgenica y celulas de dichas plantas.
IN1997CH00924A (en) 1996-05-03 2005-03-04 Syngenta Mogen Bv Regulating metabolism by modifying the level of trehalose-6-phosphate
DE19619353A1 (de) 1996-05-14 1997-11-20 Bosch Gmbh Robert Verfahren zur Herstellung eines integriert optischen Wellenleiterbauteiles sowie Anordnung
WO1997048814A2 (en) 1996-06-21 1997-12-24 Monsanto Company Methods for the production of stably-transformed, fertile wheat employing agrobacterium-mediated transformation and compositions derived therefrom
US5981841A (en) 1996-08-30 1999-11-09 Monsanto Company Early seed 5' regulatory sequence
US6420629B1 (en) 1996-09-09 2002-07-16 B.C. Research Inc. Process of increasing plant growth and yield and modifying cellulose production in plants
DE19644478A1 (de) 1996-10-25 1998-04-30 Basf Ag Blattspezifische Expression von Genen in transgenen Pflanzen
WO1998026045A1 (en) 1996-12-13 1998-06-18 The General Hospital Corporation Stress-protected transgenic plants
US6309824B1 (en) 1997-01-16 2001-10-30 Hyseq, Inc. Methods for analyzing a target nucleic acid using immobilized heterogeneous mixtures of oligonucleotide probes
EP0870836A1 (de) 1997-04-09 1998-10-14 IPK Gatersleben 2-Desoxyglucose-6-Phosphat (2-DOG-6-P) Phosphatase DNA-Sequenzen als Selektionsmarker in Pflanzen
US5977436A (en) 1997-04-09 1999-11-02 Rhone Poulenc Agrochimie Oleosin 5' regulatory region for the modification of plant seed lipid composition
BR9809364A (pt) 1997-05-02 2001-09-11 Mogen Int Metabolismo de regulação por modificação do nìvel de trehalose-6-fosfato por inibição dos nìveis de trehalase endógena
ZA986308B (en) 1997-07-18 1999-11-24 Pioneer Hi Bred Int The induction of stress-related factors in plants.
WO1999005902A1 (en) 1997-07-30 1999-02-11 Purdue Research Foundation Transgenic plants tolerant of salinity stress
DE69827264T2 (de) 1997-08-01 2006-02-16 Performance Plants, Inc., Kingston Methode zur herstellung einer dürre-resistenten pflanze
ES2276475T5 (es) 1997-09-30 2014-07-11 The Regents Of The University Of California Producción de proteínas en semillas de plantas
ZA989497B (en) 1997-10-20 2000-04-19 Roche Diagnostics Gmbh Positive-negative selection in homologous recombination.
US6506559B1 (en) 1997-12-23 2003-01-14 Carnegie Institute Of Washington Genetic inhibition by double-stranded RNA
CA2321644A1 (en) 1998-03-11 1999-09-16 Novartis Ag Novel plant plastid promoter sequence
WO1999053050A1 (en) 1998-04-08 1999-10-21 Commonwealth Scientific And Industrial Research Organisation Methods and means for obtaining modified phenotypes
US6429293B1 (en) 1998-06-26 2002-08-06 Hsc Research And Development Limited Partnership Sculpin-type antifreeze polypeptides and nucleic acids
US6555732B1 (en) 1998-09-14 2003-04-29 Pioneer Hi-Bred International, Inc. Rac-like genes and methods of use
ES2449713T3 (es) 1998-11-03 2014-03-20 Abbvie Deutschland Gmbh & Co Kg 2-fenilbencimidazoles sustituidos y su empleo como inhibidores de PARP
DE19852195C2 (de) 1998-11-04 2000-11-02 Inst Pflanzengenetik & Kultur Neue Expressionskassette zur Expression von beliebigen Genen in Pflanzensamen
SI1131301T1 (sl) 1998-11-17 2006-02-28 Abbott Gmbh & Co Kg 2-fenilbenzimidazoli in 2-fenilindoli, njihova priprava in uporaba
AU764216B2 (en) 1998-11-27 2003-08-14 Basf Aktiengesellschaft Substituted benzimidazoles and their use as parp inhibitors
AU776150B2 (en) 1999-01-28 2004-08-26 Medical College Of Georgia Research Institute, Inc. Composition and method for (in vivo) and (in vitro) attenuation of gene expression using double stranded RNA
DE19956568A1 (de) 1999-01-30 2000-08-17 Roland Kreutzer Verfahren und Medikament zur Hemmung der Expression eines vorgegebenen Gens
WO2000049035A1 (en) 1999-02-19 2000-08-24 The General Hospital Corporation Gene silencing
WO2000050561A2 (en) 1999-02-23 2000-08-31 Health Research Inc. CaESS1: A CANDIDA ALBICANS GENE, METHODS OF MAKING AND USE
BR0011140A (pt) 1999-04-19 2002-02-26 Rhobio Método de trasformação de plantas, usos de agrobacterium em um método de transformação e tecido vegetal transformado
KR20010112944A (ko) 1999-04-21 2001-12-22 이곤 이 버그 폴리뉴클레오티드 서열의 기능을 억제하기 위한 방법 및조성물
DE19918211A1 (de) 1999-04-22 2000-10-26 Basf Ag Cycloalkylsubstituierte Benzimidazole, deren Herstellung und Anwendung
DE19920936A1 (de) 1999-05-07 2000-11-09 Basf Ag Heterozyklisch substituierte Benzimidazole, deren Herstellung und Anwendung
CA2369422A1 (en) 1999-05-10 2000-11-16 Syngenta Participations Ag Regulation of viral gene expression
DE19921567A1 (de) 1999-05-11 2000-11-16 Basf Ag Verwendung von Phthalazine-Derivaten
AU6373300A (en) 1999-07-23 2001-02-13 Wisconsin Alumni Research Foundation Arabidopsis thaliana cyclic nucleotide-gated ion channel/dnd genes; regulators of plant disease resistance and cell death
RU2002107795A (ru) 1999-08-26 2004-03-10 БАСФ ПЛАНТ САЙЕНС ГмбХ (DE) Экспрессия растительных генов под контролем конститутивных промоторов V-арт-азы растений
EP1134285A4 (en) * 1999-09-27 2004-07-28 Japan Tobacco Inc NUCLEIC ACID FRAGMENT, RECOMBINANT VECTOR CONTAINING THIS FRAGMENT AND MEDIATED METHOD FOR SUPPORTING THE EXPRESSION OF A STRUCTURAL GENE
IL143349A0 (en) 1999-09-28 2002-04-21 Basf Ag Azepinoindole derivatives, the production and use thereof
DE19946289A1 (de) 1999-09-28 2001-03-29 Basf Ag Benzodiazepin-Derivate, deren Herstellung und Anwendung
WO2001038504A2 (en) 1999-11-23 2001-05-31 Maxygen, Inc. Homologous recombination in plants
US6569681B1 (en) 2000-03-14 2003-05-27 Transkaryotic Therapies, Inc. Methods of improving homologous recombination
EP1149915A1 (en) * 2000-04-28 2001-10-31 Frommer, Wolf-Bernd Modification of gene expression in transgenic plants
ES2316461T3 (es) 2000-06-28 2009-04-16 Sungene Gmbh Vectores binarios para la transformacion mejorada de sistemas vegetales.
CA2421215A1 (en) 2000-09-05 2002-03-14 Board Of Control Of Michigan Technological University Genetic engineering of syringyl-enriched lignin in plants
GB0201043D0 (en) 2002-01-17 2002-03-06 Swetree Genomics Ab Plants methods and means
GB0201686D0 (en) * 2002-01-25 2002-03-13 Dca Design Consultants Ltd Improvements in and relating to a medicament delivery device

Also Published As

Publication number Publication date
EP2166099A2 (en) 2010-03-24
EP2166099A3 (en) 2011-06-29
US8088971B2 (en) 2012-01-03
WO2006094976A2 (en) 2006-09-14
EP2166100A9 (en) 2011-10-19
CN101137752A (zh) 2008-03-05
US20140237683A1 (en) 2014-08-21
EP2166101A3 (en) 2011-07-06
ZA200708512B (en) 2009-01-28
ATE541043T1 (de) 2012-01-15
CN102925479A (zh) 2013-02-13
US8759506B2 (en) 2014-06-24
WO2006094976A3 (en) 2006-12-28
EP2045327A3 (en) 2010-08-04
EP2166099B1 (en) 2012-12-19
EP2045327B1 (en) 2012-01-11
US20090144863A1 (en) 2009-06-04
EP2166102B1 (en) 2012-12-19
EP2169058B1 (en) 2013-01-23
US20120054922A1 (en) 2012-03-01
EP2166099A9 (en) 2011-10-19
EP2166100A3 (en) 2011-06-29
CN101137752B (zh) 2013-04-03
EP2166100B1 (en) 2012-07-18
EP2166100A2 (en) 2010-03-24
EP2166101B1 (en) 2012-12-19
EP2166102A3 (en) 2011-07-06
AU2006222012B2 (en) 2011-03-31
AU2006222012A1 (en) 2006-09-14
EP1859037A2 (en) 2007-11-28
CA2599405A1 (en) 2006-09-14
EP2166101A9 (en) 2011-10-19
EP2045327A2 (en) 2009-04-08
EP2045327B8 (en) 2012-03-14
EP2169058A3 (en) 2011-07-27
EP2166101A2 (en) 2010-03-24
EP2166102A9 (en) 2011-10-19
EP2169058A2 (en) 2010-03-31
EP2166102A2 (en) 2010-03-24
EP2169058A9 (en) 2011-10-19

Similar Documents

Publication Publication Date Title
BRPI0609283A2 (pt) métodos para identificar um ìntron com propriedades intensificadoras de expressão em plantas, para enriquecer o número de ìntrons com propriedades intensificadoras de expressão em plantas, para isolar, fornecer ou produzir um ìntron com propriedades intensificadoras de expressão em plantas, para fornecer um cassete de expressão e para intensificar a expressão de uma seqüência de ácidos nucleicos em uma planta ou uma célula de planta, algoritmo de computador, dispositivo de computador ou dispositivo de armazenamento de dados, construto de expressão de dna recombinante, vetor de expressão, célula transgênica ou organismo não humano transgênico, cultura celular, partes ou material de propagação, e, uso de um organismo transgênico ou de culturas celulares, partes de material de propagação transgênico derivadas destas
CN107406858A (zh) 用于指导rna/cas内切核酸酶复合物的调节型表达的组合物和方法
AU2005219533B2 (en) Transgenic expression constructs for vegetative plant tissue specific expression of nucleic acids
Hu et al. Functional roles of the birch BpRAV1 transcription factor in salt and osmotic stress response
JP2022515341A (ja) サイトカイニンに応答する植物のnin遺伝子の遺伝子改変方法
AU2005242196A1 (en) Expression cassettes for meristem-preferential expression in plants
AU2005239732A1 (en) Expression cassettes for mesophyll-and/or epidermis-preferential expression in plants
AU2011202966B2 (en) Expression enhancing intron sequences
Ordóñez Characterization and isolation of T-DNA tagged banana promoters active during in vitro regeneration and low temperature stress
AU2005242144A1 (en) Expression cassettes for vascular tissue-preferential expression in plants
CN117820447A (zh) 一种可提高植物耐盐性的蛋白AtSRRM1L及其应用
Rooke Studies on position effects and gene tagging in transgenic plants
CN116144616A (zh) 与水稻抗病相关的OsCYP51H4蛋白质及其编码基因与应用
WO2019106662A1 (en) Compositions and methods conferring resistance to fungal diseases
BR102013007620B1 (pt) Composições e métodos contendo promotor constitutivo para modificar a expressão de genes de interesse em plantas

Legal Events

Date Code Title Description
B06G Technical and formal requirements: other requirements [chapter 6.7 patent gazette]

Free format text: SOLICITA-SE A REGULARIZACAO DA PROCURACAO, UMA VEZ QUE BASEADO NO ARTIGO 216 1O DA LPI, O DOCUMENTO DE PROCURACAO DEVE SER APRESENTADO NO ORIGINAL, TRASLADO OU FOTOCOPIA AUTENTICADA.

B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE A 9A ANUIDADE.

B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]

Free format text: EM VIRTUDE DO ARQUIVAMENTO PUBLICADO NA RPI 2343 DE 01-12-2015 E CONSIDERANDO AUSENCIA DE MANIFESTACAO DENTRO DOS PRAZOS LEGAIS, INFORMO QUE CABE SER MANTIDO O ARQUIVAMENTO DO PEDIDO DE PATENTE, CONFORME O DISPOSTO NO ARTIGO 12, DA RESOLUCAO 113/2013.