BR102014027436A2 - sequência recombinante, bem como método para a produção de uma célula de planta transgênica - Google Patents

sequência recombinante, bem como método para a produção de uma célula de planta transgênica Download PDF

Info

Publication number
BR102014027436A2
BR102014027436A2 BR102014027436A BR102014027436A BR102014027436A2 BR 102014027436 A2 BR102014027436 A2 BR 102014027436A2 BR 102014027436 A BR102014027436 A BR 102014027436A BR 102014027436 A BR102014027436 A BR 102014027436A BR 102014027436 A2 BR102014027436 A2 BR 102014027436A2
Authority
BR
Brazil
Prior art keywords
sequence
gene
soybean
genomic
dna
Prior art date
Application number
BR102014027436A
Other languages
English (en)
Other versions
BR102014027436B1 (pt
BR102014027436A8 (pt
Inventor
Debra L Camper
Lakshmi Sastry-Dent
Shreedharan Sriram
Steven R Webb
Zehui Cao
Original Assignee
Dow Agrosciences Llc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dow Agrosciences Llc filed Critical Dow Agrosciences Llc
Publication of BR102014027436A2 publication Critical patent/BR102014027436A2/pt
Publication of BR102014027436A8 publication Critical patent/BR102014027436A8/pt
Publication of BR102014027436B1 publication Critical patent/BR102014027436B1/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Environmental Sciences (AREA)
  • Physiology (AREA)
  • Botany (AREA)
  • Developmental Biology & Embryology (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Apparatuses For Bulk Treatment Of Fruits And Vegetables And Apparatuses For Preparing Feeds (AREA)
  • Insects & Arthropods (AREA)
  • Pest Control & Pesticides (AREA)

Abstract

patente de invenção: "sequência recombinante, bem como método para a produção de uma célula de planta transgênica". conforme revelado no presente documento, os loci genô- micos nativos ótimos foram identificados em plantas dicotiledôneas, tais como plantas de soja, que representam melhores sítios para a in- serção direcionada de sequências exógenas .

Description

Relatório Descritivo da Patente de Invenção para "SEQUÊNCIA RECOMBINANTE, BEM COMO MÉTODO PARA A PRODUÇÃO DE UMA CÉLULA DE PLANTA TRANSGÊNICA".
REFERÊNCIA CRUZADA A PEDIDOS RELACIONADOS
[001] Este pedido reivindica o benefício, sob 35 U.S.C. §119(e), do Pedido de Patente Provisório n9 U.S. 61/899566, depositado em 4 de novembro de 2013 e do Pedido de Patente Provisório n- U.S. 61/889587, depositado em 4 de novembro de 2013, cujo conteúdo se encontra incorporado ao presente documento em sua totalidade a título de referência.
REFERÊNCIA A LISTAGEM DE SEQUÊNCIAS ENVIADA ELETRONICAMENTE
[002] A cópia oficial da listagem de sequências é enviada eletronicamente através de EFS-Web com uma listagem de sequências formatada como ASCII com um arquivo nomeado T,226006_ST25.txt"f criado em 2 de novembro de 2013 e que tem um tamanho de 13,7 megabytes e está depositada simultaneamente com o relatório descritivo. A listagem de sequências contida em tal documento formatado como ASCII é uma parte do relatório descritivo e está incorporada ao presente documento em sua totalidade a título de referência.
REFERÊNCIA A LISTAGEM DE TABELA ENVIADA ELETRONICAMENTE
[003] A cópia oficial da listagem de tabelas é enviada eletronicamente através de EFS-Web como uma listagem de tabelas formatada como .PDF com um arquivo nomeado "Table3,r, criado em 4 de novembro de 2013 e que tem um tamanho de 12 megabytes e está depositado simultaneamente com o relatório descritivo. A listagem de tabelas contida em tal documento formatado como .PDF é uma parte do relatório descritivo e encontra-se incorporada ao presente documento em sua totalidade a título de referência.
ANTECEDENTES
[004] O genoma de diversos tipos de pfantas dicotiledôneas, por exemplo, píantas de soja, foi transformado com sucesso com transge-nes no início da década de 90. Ao longo dos últimos vinte anos, diversas metodologias foram desenvolvidas para transformar o genoma de plantas dicotiledôneas, como a soja, em que um transgene é integrado de maneira estável ao genoma de plantas dicotiledôneas. Tal evolução de metodologias de transformação de dicotiledôneas resultou na capacidade de introduzir com sucesso um transgene que compreende um traço agronômico no genoma das plantas dicotiledôneas, tais como a soja. A introdução de traços de resistência aos insetos e tolerância a herbicidas nas plantas dicotiledôneas no final da década de 90 forneceu aos produtores uma inovação tecnológica nova e conveniente para controlar os insetos e um amplo espectro de ervas, que não era paralelo nos métodos agrícolas de cultivação. Atualmente, as plantas dicotiledôneas transgênicas estão comercialmente disponíveis mundialmente e novos produtos transgênicos, tais como a Soja Eniist™, oferecem soluções aprimoradas para os desafios de ervas constantemente crescentes. A utilização de plantas dicotiledôneas transgênicas em práticas agronômicas modernas não é possível, se não pelo desenvolvimento e aprimoramento de metodologias de transformação.
[005] Entretanto, as metodologias de transformação atuais dependem da inserção aleatória de transgenes no genoma de plantas dicotiledôneas, tais como a soja. A dependência da inserção aleatória de genes em um genoma tem diversas desvantagens. Os eventos transgênicos podem se integrar aleatoriamente nas sequências de transcrição de gene interrompendo, assim, a expressão de traços en-dógenos e alterando o crescimento e desenvolvimento da planta. Além disso, os eventos transgênicos podem se integrar indiscriminadamente em locais do genoma que estão suscetíveis ao silenciamento de gene, de modo a culminar na inibição completa ou reduzida da expressão do transgene tanto na primeira geração quanto nas gerações subsequentes de plantas transgênicas. Finalmente, a integração aleatória de transgenes no genoma de planta exige um esforço e custo consideráveis na identificação do local do evento transgênico e na seleção de eventos transgênicos que são executados conforme projetado sem impacto agronômico à planta. Os ensaios inovadores devem ser conti-nuamente desenvolvidos para determinar o local exato do transgene integrado para cada evento transgênico, tal como um evento transgênico de soja. A natureza aleatória das metodologias de transformação de planta resulta em um "efeito de posição" do transgene integrado, que dificulta a eficácia e eficiência das metodologias de transformação.
[006] A modificação direcionada do genoma de plantas é um objetivo de longa dados e elusivo tanto da pesquisa aplicada quanto da pesquisa básica. Direcionar genes e pilhas de gene a locais específicos no genoma de plantas dicotiledôneas, tais como as plantas de soja, irá aprimorar a qualidade dos eventos transgênicos, reduzir os custos associados à produção de eventos transgênicos e fornecer novos métodos para fabricar produtos de planta transgênica, tais como empi-Ihamento de gene sequencial. Em geral, direcionar os trangenes a sítios genômicos específicos é, provavelmente, comercialmente benéfico. Foram realizados avanços significativos nos últimos anos em direção ao desenvolvimento dos métodos e composições para direcionar e realizar a divagem de DNA genômico por meio de nucleases específicas quanto ao sítio (por exemplo, Nucleases Dedo de Zinco (Zinc Fín-ger Nucleases (ZFNs)), Meganucleases, Nucleases Efetoras similares a Atívador de Transcrição (Transcription Activator-Like Effector Nuce-lases (TALENS)) e Repetições Palindrômicas Curtas Agrupadas e Regularmente Interespaçadas (Clustered Regularly Interspaced Short Pa-lindromic Repeats)/Nuclease associada a CRISPR (CRISPR- associated nuclease (CRISPR/Cas)) com um crRNA elabora-do/tracrRNA), para induzir as mutagêneses direcionadas, induzir as deleções direcionadas de sequências de DNA celular e facilitar a re-combinação direcionada de um polinucleotídeo de DNA doador exó-geno no interior de um locus genômico predeterminado. Consulte, por exemplo, os Pedidos de Patente n— U.S. 20030232410; 20050208489; 20050026157; 20050064474; e 20060188987 e a Publicação de Patente Internacional n- WO 2007/014275, cujas revelações se encontram incorporadas ao presente documento em sua totalidade a título de referência para todos os propósitos. O Pedido de Patente n° U.S. 20080182332 descreve o uso de nucleases dedo de zinco não canônicas (ZFNs) para a modificação direcionada de genomas de planta e o Pedido de Patente n° U.S. 20090205083 descreve a modificação direcionada mediada por ZFN de um locus genômico de EPSPs de planta. Os métodos atuais para a inserção direcionada de DNA exógeno, tipicamente, envolvem a cotransformação do tecido de planta com um polinucleotídeo de DNA doador que contém pelo menos um transgene e uma nuclease específica quanto ao sítio (por exemplo, ZFN) que é projetada para ligar e realizar a divagem de um locus genômico específico de uma sequência de codificação transcrita ativamente. Isso faz com que o polinucleotídeo de DNA doador seja inserido de maneira estável no locus genômico clivado, resultando em adição de gene direcionado em um locus genômico especificado que compreende uma sequência de codificação transcrita ativamente.
[007] Uma abordagem alternativa é direcionar o transgene aos loci não gênicos-alvo pré-selecionados no interior do genoma de plantas de dicotiledônea como a soja. Nos últimos anos, diversas tecnologias foram desenvolvidas e aplicadas às células de planta para a entrega direcionada de um transgene no interior do genoma de plantas de dicotiledônea como a soja. Entretanto, se sabe muito menos a res- peito dos atributos de sítios genômicos que são adequados para o direcionamento. Historicamente, os sítios de integração de patogênio (viral) e genes não essenciais em genomas foram usados conforme os loci para direcionamento. A quantidade de tais sítios em genomas é bastante limitante e há, portanto, uma necessidade da identificação e caracterização de loci genômicos ótimos direcionáveis que podem ser usados para direcionar as sequências de polinucleotídeo doador. Além de serem passíveis ao direcionamento, espera-se que os loci genômicos ótimos sejam sítios neutros que podem sustentar a expressão de transgene e aplicações de reprodução. Existe uma necessidade de composições e métodos que definam critérios para identificar os loci não gênicos ótimos no genoma das plantas de dicotiledônea, por e-xemplo, plantas de soja, para integração de transgene direcionado. SUMÁRIO
[008] Uma modalidade da presente revelação está direcionada aos métodos de identificação de sítios ótimos em um genoma de dicotiledônea, incluindo, por exemplo, o genoma de soja para a inserção de sequências exógenas. Existe a documentação na literatura que sugere que as regiões cromossômicas de planta são direcionáveis e sustentam a expressão. As requerentes construíram um conjunto de critérios para identificar as regiões de sequências genômicas de soja nativa que são sítios ótimos para a inserção direcionada direcionada ao sítio. Mais especificamente, de acordo com uma modalidade, um locus ótimo deve ser não gênico, direcionável, deve sustentar a expressão de gene, deve ser agronomícamente neutro e deve ter evidência de recombinação. Conforme revelado neste documento, as requerentes constataram uma quantidade de loci no genoma de soja que satisfazem os critérios e, assim, representam os sítios ótimos para a inserção de sequências exógenas.
[009] De acordo com uma modalidade, uma sequência de soja recombinante está reveiada neste documento, em que a sequência recombinante compreende uma sequência genômica de soja não gê-nica de pelo menos 1 Kb e um DNA de interesse inserido na sequência genômica de soja não gênica, em que a sequência genômica de soja não gênica foi modificada pela inserção do DNA de interesse. Em uma modalidade, a sequência de soja não gênica nativa é hipometila-da, expressável, exemplifica a evidência de recombínação e está situada em um local próximo a uma região gênica no genoma de soja. Em uma modalidade, a sequência não gênica tem um comprimento que varia na faixa de cerca de 1 Kb a cerca de 5,7 Kb. Em uma modalidade, o DNA de interesse compreende as sequências exógenas de DNA, incluindo por exemplo, as sequências reguladoras, sítios de cfivagem de restrição, regiões de codificação de RNA ou regiões de codificação de proteína. Em uma modalidade, o DNA de interesse compreende um cassete de expressão de gene que compreende um ou mais transge-nes.
[0010] De acordo com uma modalidade, uma sequência recombinante é fornecida, sendo que a mesma compreende uma sequência genômica ótima de soja não gênica de cerca de 1 Kb a cerca de 5,7 Kb e um DNA de interesse em que a sequência genômica de soja não gênica tem 1, 2, 3, 4 ou 5 das seguintes propriedades ou características: [0011] a) tem uma sequência de codificação de soja conhecida ou prevista a 40 Kb da dita sequência genômica de soja;
[0012] b) tem uma sequência que compreende um 2 Kb a montante e/ou 1 Kb a jusante de um gene de soja conhecido a 40 Kb de uma extremidade da dita sequência genômica de soja;
[0013] c) não contém mais que 1% de metilação de DNA no interior da sequência; d) não contém uma sequência de 1 Kb que tem mais que 40% de identidade de sequência com qualquer outra sequência no interior do genoma de soja; e [0014] e) exemplifica a evidência de recombinação a uma frequência de recombinação superior a 0,01574 cM/Mb.
[0015] De acordo com uma modalidade, uma planta de soja, parte de planta de soja, ou célula de planta de soja é fornecida, de modo a compreender um DNA de interesse inserido em uma sequência genô-mica de soja não gênica identificada e direcionada da planta de soja, parte de planta de soja ou célula de planta de soja. Em uma modalidade, a sequência genômica de soja não gênica da planta de soja, parte de planta de soja, ou célula de planta de soja é hipometilada, expres-sável, exemplifica a evidência de recombinação e está situada em um local próximo a uma região gênica no genoma de soja. Em uma modalidade, a sequência genômica de soja não gênica da planta de soja, parte de planta de soja ou célula de planta de soja tem cerca de 1 Kb a cerca de 5,7 Kb de comprimento, é hipometilada e tem 1, 2, 3 ou 4 das seguintes propriedades ou características: [0016] a) tem uma sequência de codificação de soja conhecida ou prevista a 40 Kb da dita sequência genômica de soja;
[0017] b) tem uma sequência que compreende um 2 Kb a montante e/ou 1 Kb a jusante de um gene de soja conhecido a 40 Kb de uma extremidade da dita sequência genômica de soja;
[0018] c) não contém mais de 1% de metilação de DNA no interior da sequência;
[0019] d) não compreende uma sequência de 1 Kb que tem mais de 40% de identidade de sequência com qualquer outra sequência no interior do genoma de soja; e [0020] e) exemplifica a evidência de recombinação a uma frequência de recombinação superior a 0,01574 cM/Mb.
[0021] Em uma modalidade, um método para tornar uma célula de planta transgênica que compreende um DNA de interesse direcionada a uma sequência genômica de soja não gênica é fornecido, sendo que o método compreende: [0022] a) selecionar um locus genômico ótimo de soja não gênica;
[0023] b) introduzir uma nuclease específica quanto ao sítio em uma céfula de planta, em que a nuclease específica quanto ao sítio cliva a dita sequência não gênica: [0024] c) introduzir o DNA de interesse na célula de planta;
[0025] d) direcionar o DNA de interesse na dita sequência não gênica, em que a divagem da dita sequência não gênica estimula a integração da sequência de polinucleotideos na dita sequência não gêmea; e [0026] e) selecionar as células de planta transgênica que compreendem o DNA de interesse direcionado à dita sequência não gênica.
[0027] De acordo com uma modalidade, a sequência não gênica selecionada compreende 2, 3, 4, 5, 6, 7 ou 8 das seguintes características: [0028] a) a sequência não gênica não contém um polinucleotídeo metilado;
[0029] b) a sequência não gênica exibe uma taxa de 0,01574 a 83,52 cM/Mb de recombinação no interior do genoma de soja;
[0030] c) a sequência não gênica exibe um nível de 0 a 0,494 de ocupação de nucleossomo do genoma de soja;
[0031] d) a sequência não gênica compartilha menos que 40% de identidade de sequência com qualquer outra sequência de 1 Kb contida no genoma de soja;
[0032] e) a sequência não gênica tem uma razão de valor de local relativo de 0 a 0,99682 de distância genômica de um centrômero cro-mossômico de soja;
[0033] f) a sequência não gênica tem uma faixa de teor de porcentagem de guanina/citoisina de 14,36 a 45,9%;
[0034] g) a sequência não gênica está localizada de maneira pro-ximal a uma sequência gênica; e.
[0035] h) uma região de 1 Mb de sequência genômica de soja que compreende a dita sequência não gênica compreende uma ou mais sequências não gênicas.
[0036] Uma modalidade da presente revelação é direcionada aos métodos para identificar uma sequência genômica de soja não gênica que compreende as etapas de: [0037] a) identificar as sequências genômicas de soja de pelo menos 1 Kb de comprimento que não contêm um mais de 1% de nível de metilação para gerar um primeiro agrupamento de sequências;
[0038] b) eliminar quaisquer sequências genômicas de soja que codificam as transcrições de soja do primeiro agrupamento de sequências;
[0039] c) eliminar quaisquer sequências genômicas de soja que não fornecem evidência de recombinação do primeiro agrupamento de sequências;
[0040] d) eliminar quaisquer sequências genômicas de soja que compreendem uma sequência de 1 Kb que compartilha 40% ou mais de identidade de sequência com uma outra sequência de 1 Kb contida no genoma de soja do primeiro agrupamento de sequências;
[0041] e) eliminar qualquer sequência genômica de soja que não têm um gene de soja conhecido a 40 Kb da sequência identificada do primeiro agrupamento de sequências; e, [0042] f) identificar as sequências genômicas de soja restantes no agrupamento de sequências como sequência genômica de soja não gênica. Uma vez que as sequências forem identificadas, as mesmas podem ser manipuladas com o uso de conjuntos de procedimentos de recombinação para direcionar a inserção de sequências de ácido nu-cleico não encontradas nos loci no genoma nativo.
[0043] De acordo com uma modalidade, quaisquer sequências ge-nômicas de soja que nâo têm um gene de soja conhecido, ou pelo menos uma sequência de 2 Kb a montante ou 1 Kb a jusante de um gene conhecido localizado a 40 Kb da sequência genômica de soja são eliminadas de um agrupamento de sequências genômicas de soja não gênica.
[0044] De acordo com uma modalidade, quaisquer sequências genômicas de soja que não têm um gene que expressa uma proteína de soja localizada a 40 Kb da sequência genômica de soja são eliminadas do agrupamento de sequências genômicas de soja não gênica.
[0045] De acordo com uma modalidade, uma sequência de polinu-cleotídeos de soja purificada está revelada neste documento em que a sequência purificada compreende uma sequência genômica de soja não gênica de pelo menos 1 Kb Em uma modalidade, a sequência de soja não gênica é hipometilada, expressável, exemplifica a evidência de recombinação e está localizada em um local próximo a uma região gênica no genoma de soja. Em uma modalidade, a sequência não gênica tem um comprimento que varia na faixa de cerca de 1 Kb a cerca de 5,7 Kb. Em uma modalidade, o DNA de interesse compreende as sequências exógenas de DNA, incluindo por exemplo, as sequências reguladoras, sítios de divagem de restrição, regiões de codificação de RNA ou regiões de codificação de proteína. Em uma modalidade, o DNA de interesse compreende um cassete de expressão de gene que compreende um ou mais transgenes.
[0046] De acordo com uma modalidade, uma sequência de polinu-cleotídeos de soja é fornecida, sendo que a mesma compreende uma sequência genômica ótima de soja não gênica de cerca de 1 Kb a cerca de 5,7 Kb e um DNA de interesse em que a sequência de soja não gênica genômica tem 1, 2, 3, 4 ou 5 das seguintes propriedades ou características: [0047] a) tem uma sequência de codificação de soja conhecida ou prevista a 40 Kb da dita sequência recombinante;
[0048] b) tem uma sequência que compreende um 2 Kb a montante e/ou 1 Kb a jusante de um gene de soja conhecido a 40 Kb de uma extremidade do dito não gênico;
[0049] c) não contém um polinucleotídeo metilado;
[0050] d) não contém uma sequência de 1 Kb que tem mais de 40% de identidade de sequência com qualquer outra sequência no interior do genoma de soja; e [0051] e) exemplifica a evidência de recombinação a uma frequência de recombinação superior a 0,01574 cM/Mb.
[0052] De acordo com uma modalidade, uma sequência de polinu-cleotideos de soja purificada é fornecida, sendo que compreende uma sequência não gênica selecionada. A sequência não gênica selecionada compreende 2, 3, 4, 5, 6, 7 ou 8 das seguintes características: [0053] a) a sequência não gênica não contém um polinucleotídeo metilado;
[0054] b) a sequência não gênica exibe uma taxa de 0,01574 a 83,52 cM/Mb de recombinação no interior do genoma de soja;
[0055] c) a sequência não gênica exibe um nível de 0 a 0,494 de ocupação de nucleossomo do genoma de soja;
[0056] d) a sequência não gênica compartilha menos que 40% de identidade de sequência com qualquer outra sequência de 1 Kb contida no genoma de soja;
[0057] e) a sequência não gênica tem uma razão de valor de local relativo de 0 a 0,99682 de distância genômica de um centrômero cro-mossômico de soja;
[0058] f) a sequência não gênica tem uma faixa de teor de porcentagem de guanina/citoisina de 14,36 a 45,9%;
[0059] g) a sequência não gênica está localizada de maneira pro- ximal a uma sequência gêníca; e, [0060] h) uma região de 1 Mb de sequência genômica de soja que compreende a dita sequência não gênica compreende uma ou mais sequências não gênicas.
[0061] De acordo com uma modalidade, quaisquer sequências ge-nômicas de soja que não fornecem evidência de recombinação a uma frequência de recombinação superior a 0,01574 cM/Mb são eliminadas do agrupamento de sequências genômicas de soja não gênica.
[0062] De acordo com uma modalidade, a sequência não gênica selecionada compreende as seguintes características: [0063] a) a sequência não gênica não contém mais de 1% de meti-iação de DNA no interior da sequência;
[0064] b) a sequência não gênica tem uma razão de valor de local relativo de 0,211 a 0,976 de distância genômica de um centrômero cromossômico de soja;
[0065] c) a sequência não gênica tem uma faixa de teor de porcentagem de guanina/citoisina de 25,62 a 43,76%; e [0066] d) a sequência não gênica tem de cerca de 1 Kb a cerca de 4,4 Kb de comprimento.
BREVE DESCRIÇÃO DOS DESENHOS
[0067] A Figura 1 representa um gráfico tridimensional dos 7.018 loci genômicos seletos aglomerados em 32 aglomerados. Os aglomerados podem ser representados em gráficos tridimensíonalmente e dis-tinguidos através de cor ou outros indicadores. Cada aglomerado foi atribuído a um identificador peculiar para facilitar a visualização, em que todos os loci genômicos seletos com o mesmo identificador pertencem ao mesmo aglomerado. Após o processo de aglomeração, os loci genômicos seletos representativos foram escolhidos de cada a-glomerado. Isso foi realizado escolhendo-se os loci genômicos seletos, no interior de cada aglomerado, que estavam mais próximos ao cen- troide de tal aglomerado.
[0068] A Figura 2 fornece um desenho esquemático que indica a distribuição cromossômíca dos loci genômicos ótimos selecionados por serem os mais próximos ao centroide de cada um dos respectivos 32 aglomerados.
[0069] A Figura 3 fornece um desenho esquemático que indica o local cromossômico de soja dos loci genômicos ótimos selecionados para validação de direcionamento.
[0070] A Figura 4 é uma representação da sequência de polinu-cleotídeos doador universal para integração através de união terminal não homóloga (NHEJ). Dois vetores sugeridos são fornecidos em que um DNA de interesse (DNA X) compreende um ou mais (isto é, "1-N") sítios de ligação de dedo de zinco (ZFN BS) em qualquer uma das extremidades do DNA de interesse. As setas verticais mostram sítios de restrição peculiar e as setas horizontais representam sítios potenciais de iniciadores de PCR.
[0071] A Figura 5 é uma representação da sequência de polinu-cleotídeos doador universal para a integração através de reparo direcionado homólogo (HDR). Um DNA de interesse (DNA X) que compreende duas regiões de sequências homólogas (HA) que ladeiam o DNA de interesse com sítios de ligação de nucfease dedo de zinco (ZFN) suportando as sequências de DNAX e HA. As setas verticais mostram sítios de restrição pecufíar e as setas horizontais representam sítios potenciais de iniciadores de PCR, [0072] A Figura 6 é a validação de alvos de loci genômicos selecionados de soja com o uso do método de Análise de Direcionamento Rápido (RTA) com base na NHEJ, [0073] A Figura 7 é o mapa de plasmideo de pDAB 124280 (SEQ ID NO:7561). Os elementos numerados (isto é, GmPPL01ZF391R e GMPPLQ1ZF391L) correspondem às sequências de ligação de nucle- ase dedo de zinco de cerca de 20 a 35 pares de base de comprimento que são reconhecidas e clivadas correspondendo-se as proteínas de nuclease dedo de zinco. Tais sequências de ligação dedo de zinco e a "Sequência de UZI" anotada (que é uma região-modelo de 100 a 150 bp que contém sítios de restrição e sequências de DNA para projeto de iniciador ou sequências de codificação) compreendem o cassete de doador universal. Também incluído em tal projeto de plasmídeo está a "Sobreposição 104113" que são sequências que compartilham a ho-mologia ao vetor de plasmídeo para a montagem de alta produtividade dos cassetes de doador universal no interior de um vetor de plasmídeo (isto é, através da montagem de Gibson).
[0074] A Figura 8 é o mapa de plasmídeo de pDAB124281 (SEQ ID NO:7562). Os elementos numerados (isto é, GmPPI_02ZF411R e GMPPL02ZF411L) correspondem às sequências de ligação de nuclease dedo de zinco de cerca de 20 a 35 pares de base de comprimento que são reconhecidas e clivadas correspondendo-se as proteínas de nuclease dedo de zinco. Tais sequências de ligação dedo de zinco e a "Sequência de UZI" anotada (que é uma região-modelo de 100 a 150 bp que contém sítios de restrição e sequências de DNA para projeto de iniciador ou sequências de codificação) compreendem o cassete de doador universal. Também incluído em tal projeto de plasmídeo está a "Sobreposição 104113" que são sequências que compartilham a ho-mologia ao vetor de plasmídeo para a montagem de alta produtividade dos cassetes de doador universal no interior de um vetor de plasmídeo (isto é, através da montagem de Gibson).
[0075] A Figura 9 é o mapa de plasmídeo de pDAB121278 (SEQ ID NO:7563). Os elementos numerados (isto é, GmPPL18_4 e GMP-PL18_3) correspondem às sequências de ligação de nuclease dedo de zinco de cerca de 20 a 35 pares de base de comprimento que são reconhecidas e clivadas correspondendo-se as proteínas de nuclease dedo de zinco. Tais sequências de ligação dedo de zinco e a "Sequência de UZI" anotada (que é uma região-modelo de 100 a 150 bp que contém sítios de restrição e sequências de DNA para projeto de inicia-dor ou sequências de codificação) compreendem o cassete de doador universal. Tarobém incluído em tal projeto de plasmídeo está a "Sobreposição 104113" que são sequências que compartilham a homolo-gia ao vetor de plasmídeo para a montagem de alta produtividade dos cassetes de doador universal no interior de um vetor de plasmídeo (isto é, através da montagem de Gibson).
[0076] A Figura 10 é o mapa de plasmídeo de pDAB123812 (SEQ ID NO:7564). Os elementos numerados (isto ét ZF538R e ZF538L) correspondem às sequências de ligação de nuclease dedo de zinco de cerca de 20 a 35 pares de base de comprimento que são reconhecidas e clivadas correspondendo-se as proteínas de nuclease dedo de zinco. Tais sequências de ligação dedo de zinco e a "Sequência de ϋΖΓ anotada (que é uma região-modelo de 100 a 150 bp que contém sítios de restrição e sequências de DNA para projeto de iniciador ou sequências de codificação) compreendem o cassete de doador universal. Também incluído em tal projeto de plasmídeo está a "Sobreposição 104113" que são sequências que compartilham a homologia ao vetor de plasmídeo para a montagem de alta produtividade dos cassetes de doador universal no interior de um vetor de plasmídeo (isto é, através da montagem de Gibson), [0077] A Figura 11 é o mapa de plasmídeo de pDAB121937 (SEQ ID NO:7565). Os elementos numerados (isto é, GmPPL34ZF598L, GmPPL34ZF598R, GmPPL36ZF599L, GmPPL36ZF599R, GmP-PL36ZF600L e GmPPL36ZF600R) correspondem às sequências de ligação de nuclease dedo de zinco de cerca de 20 a 35 pares de base de comprimento que são reconhecidas e clivadas correspondendo-se as proteínas de nuclease dedo de zinco Tais sequências de ligação dedo de zinco e a "Sequência de UZI" anotada (que é uma região* modelo de 100 a 150 bp que contém sítios de restrição e sequências de DNA para projeto de intciador ou sequências de codificação) compreendem o cassete de doador universal. Também incluído em tal projeto de pfasmídeo está a "Sobreposição 104113" que são sequências que compartilham a homologia ao vetor de plasmídeo para a montagem de alta produtividade dos cassetes de doador universal no interior de um vetor de plasmídeo (isto é, através da montagem de Gibson), [0078] A Figura 12 é o mapa de plasmídeo de pDAB123811 (SEQ ID NO:7566). Os elementos numerados (isto é, ZF 560L e ZF 560R) correspondem às sequências de ligação de nuclease dedo de zinco de cerca de 20 a 35 pares de base de comprimento que são reconhecidas e clivadas correspondendo-se as proteínas de nuclease dedo de zinco. Tais sequências de ligação dedo de zinco e a "Sequência de UZI" anotada (que é uma região-modelo de 100 a 150 bp que contém sítios de restrição e sequências de DNA para projeto de intciador ou sequências de codificação) compreendem o cassete de doador universal. Também incluído em tal projeto de plasmídeo está a "Sobreposição 104113" que são sequências que compartilham a homologia ao vetor de plasmídeo para a montagem de alta produtividade dos cassetes de doador universal no interior de um vetor de plasmídeo (isto é, através da montagem de Gibson).
[0079] A Figura 13 é o mapa de plasmídeo de pDAB124864 (SEQ ID NO:7567). Os elementos numerados (isto é, ZF631L e ZF631R) correspondem às sequências de ligação de nuclease dedo de zinco de cerca de 20 a 35 pares de base de comprimento que são reconhecidas e clivadas correspondendo-se as proteínas de nuclease dedo de zinco. Tais sequências de ligação dedo de zinco e a "Sequência de UZI" anotada (que é uma região-modelo de 100 a 150 bp que contém sítios de restrição e sequências de DNA para projeto de inictador ou sequências de codificação) compreendem o cassete de doador universal. Também incluído em tal projeto de plasmídeo está a "Sobreposição 104113" que são sequências que compartilham a homologia ao vetor de plasmídeo para a montagem de alta produtividade dos cassetes de doador universal no interior de um vetor de plasmídeo (isto é, através da montagem de Gibson).
[0080] A Figura 14 é o mapa de plasmídeo de pDAB7221 (SEQ !D NO:7569). Tal plasmídeo contém o Cassava Vein Mosaic Vírus Promo-ter (CsVMV) que aciona a proteína GFP e é ladeado pela Agrobacteri-um tumefaciens (3’ UTR de AtuORF 24).
[0081] As Figuras 15A a 15C são histogramas de características (comprimento, expressão de região de codificação no interior de 40 Kb dos loci e frequência de recombinação) para os loci não gênicos ótimos de soja identificados. A Figura 15A ilustra uma distribuição dos comprimentos de sequência de polinucleotídeos dos loci genômicos ótimos (OGL). A Figura 15B ilustra a distribuição dos loci de milho não gênicos ótimos em relação à sua frequência de recombinação. A Figura 15C ilustra a distribuição de sequências de ácido nucleico expressas em relação à sua proximidade (escala logarítmica) em relação aos loci genômicos ótimos (OGL).
DESCRIÇÃO DETALHADA DEFINIÇÕES
[0082] Ao descrever e reivindicar a invenção, a terminologia a seguir será usada de acordo com as definições estabelecidas abaixo.
[0083] O termo "cerca de" conforme usado neste documento significa maior ou menor que o valor ou faixa de valores mencionados em 1Q porcento, mas não se destina a designar qualquer valor ou faixa de valores a apenas tal definição mais ampla. Cada valor ou faixa de valores antecedida pelo termo "cerca de" também se destina a englobar a modalidade do valor absoluto ou faixa de valores mencionados.
[0084] Conforme usado neste documento, o termo "planta" inclui uma planta inteira e qualquer descendente, célula, tecido, ou parte de uma planta. O termo "partes de planta" incluem qualquer(quaisquer) parte(s) de uma planta, incluindo, por exemplo, e sem limitação: a semente (incluindo semente madura e semente imatura); um corte de planta; uma célula de planta; uma célula de cultura de planta; um órgão de planta (por exemplo, pólen, embriões, flores, frutas, brotos, folhas, raízes, caules e explantes). Um tecido de planta ou órgão de planta pode ser uma semente, calo, ou qualquer outro grupo de células de planta que seja organizado em uma unidade estrutural ou funcional. Uma cultura de célula de planta ou tecido pode ter a capacidade de regenerar uma planta que tem as características fisiológicas ou morfológicas da planta da qual a célula ou tecido foi obtida e de regenerar uma planta que tem, substancialmente, o mesmo genótipo da planta. Por outro lado, algumas células de planta não têm a capacidade de serem regeneradas para produzir as plantas. As células regene-ráveis em uma célula de planta ou cultura de tecido podem ser embriões, protoplastos, células meristemáticas, calo, pólen, folhas, anteras, raízes, pontas de raiz, seda, flores, núcleos, espigas, sabugos, cascas, ou colmos.
[0085] As partes de planta incluem partes passíveis de colheita e partes úteis para a propagação de plantas de progênie. As partes de planta úteis para a propagação incluem, por exemplo e sem limitação: a semente; fruta; um corte; uma plântula; um bulbo; e um porta-enxerto. Uma parte passível de colheita de uma planta pode ser qualquer parte útií de uma planta, incluindo, por exemplo e sem limitação: flor; pólen; plântula; bulbo; folha; caule; fruta; semente; e raiz, [0086] Uma célula de planta ê a unidade fisiológica e estrutural da planta. As células de planta, conforme usadas neste documento, incluem protoplastos e protoplastos com uma parede de célula. Uma célula de planta pode estar sob a forma de uma célula única isolada, ou um agregado de células (por exemplo, um calo friável e uma célula cultivada) e pode ser parte de uma unidade de organização superior (por exemplo, um tecido de planta, órgão de planta e planta). Dessa forma, uma célula de planta pode ser um protoplasto, uma célula de produção de gameta, ou uma célula ou coleção de células que podem se regenerar para se tornarem uma planta inteira. De tal modo, uma semente, que compreende múltiplas células de planta e tem a capacidade de se regenerar para que se torne uma planta inteira, é considerada uma "parte de planta" em modalidades neste documento.
[0087] O termo "protoplasto", conforme usado neste documento, se refere a uma célula de planta que teve sua parede de célula completa ou parcialmente removida com a membrana de bicamada de lipí-dio da mesma nua. Tipicamente, um protoplasto é uma célula de planta isolada, sem as paredes de célula, que tem a potência para a regeneração para se tornar uma cultura de célula ou uma planta inteira, [0088] Conforme usado neste documento, os termos "nativo" ou "natural" definem uma condição encontrada na natureza. Uma "sequência de DNA nativa" é uma sequência de DNA presente na natureza que foi produzida por meios naturais ou técnicas de reprodução tradicionais, mas não geradas por elaboração genética (por exemplo, com o uso de biologia molecular/técnicas de transformação).
[0089] Conforme usado neste documento, "sequência endógena" define a forma nativa de um polinucleotídeo, gene ou polipeptídeo em seu local natural no organismo ou no genoma de um organismo.
[0090] O termo "isolado" conforme usado neste documento significa ter sido removido de seu ambiente natural.
[0091] O termo "purificado", conforme usado neste documento se refere ao isolamento de uma molécula ou composto sob uma forma que é substancialmente isenta de contaminantes normalmente assoei- ado à molécula ou composto em um ambiente natural ou nativo e significa ter sido aumentado em pureza como um resultado de ter sido separado de outros componentes da composição original. O termo "á-cido nucleico purificado" é usado neste documento para descrever uma sequência de ácido nucleico que foi separada de outros componentes que incluem, mas sem limitações: polipeptideos, lipídios e car-boidratos.
[0092] Os termos "polipeptídeo", "peptídeo" e "proteína" são usados de maneira intercambiáve! para se referir a um polímero de resíduos de aminoácido. O termo se aplica, também, aos polímeros de aminoácido em que um ou mais aminoácidos são análogos químicos ou derivados modificados de aminoácidos de ocorrência natural correspondentes.
[0093] Conforme usado neste documento, os "íoci genômicos de dicotiiedônea ótimos", "loci de dicotiledônea não gênicos ótimos", "loci não gênicos ótimos", ou "loci genômicos ótimos (OGL)M são uma sequência nativa de DNA encontrada no genoma nuclear de uma planta dicotiledônea que tem as seguintes propriedades: não gênica, hipome-tilada, direcionável e em local próximo a uma região gênica, em que a região genômica ao redor dos loci genômicos de dicotiledônea ótimos exemplifica a evidência da recombinação.
[0094] Conforme usado neste documento, os termos "loci genômicos ótimos de soja”, "loci ótimos de soja não gênicos", "loci não gênicos ótimos" ou "loci genômicos ótimos (OGL)" são usados de maneira intercambiável para designar a sequência nativa de DNA encontrada no genoma nuclear de uma planta dicotiledônea que tem as seguintes propriedades: não gênica, hipometilada, direcionável e em local próximo a uma região gênica, em que a região genômica ao redor dos loci genômicos de dicotiledônea ótimos exemplifica a evidência de recombinação.
[0095] Conforme usado neste documento, os termos "sequência de dicotiledônea não gênica" ou "sequência de dicotiledônea não gêni-ca genômica" são usados de modo intercambiável para designar uma sequência nativa de DNA encontrada no genoma nuclear de uma planta dicotiledônea que tem um comprimento de pelo menos 1 Kb e desprovida de quaisquer quadros de leitura aberta, sequências gênicas ou sequências reguladoras de gene. Ademais, a sequência de dicotiledônea não gênica não compreende qualquer sequência de íntron (isto é, os íntrons são excluídos da definição de não gênicos). A sequência não gênica não pode ser transcrita ou traduzida para proteína. Diversos genomas de planta contêm regiões não gênicas. Até 95% do genoma pode ser não gênico e tais regiões podem compreender, principalmente, DNA repetitivo.
[0096] Conforme usado neste documento, os termos "sequência de soja não gênica" ou "sequência genômica de soja não gênica" são usados de modo intercambiável para designar uma sequência nativa de DNA encontrada no genoma nuclear de uma planta de soja que tem um comprimento de pelo menos 1 Kb e desprovida de quaisquer quadros de leitura aberta, sequências gênicas ou sequências reguladoras de gene. Ademais, a sequência de soja não gênica não compreende qualquer sequência de íntron (isto é, os íntrons são excluídos da definição de não gênico). A sequência não gênica não pode ser transcrita ou traduzida para proteína. Diversos genomas de planta contêm regiões não gênicas. Até 95% do genoma pode ser não gênico e tais regiões podem compreender, principalmente, DNA repetitivo.
[0097] Conforme usado neste documento, uma "região gênica" é definida como uma sequência de polinucleotídeos que compreende um quadro de leitura aberta que codifica um RNA e/ou polipeptídeo. A região gênica também pode englobar quaisquer sequências de nucleo-tídeos que não codificam 5' e 3' adjacentes identificáveis envolvidas na regulação de expressão do quadro de leitura aberta até cerca de 2 Kb a montante da região de codificação e 1 Kb a jusante da região de codificação, porém, possivelmente mais a montante ou a jusante. Uma região gênica inclui adicionalmente quaisquer introns que possam estar presentes na região gênica. Ademais, a região gênica pode compreender uma única sequência gênica ou múltiplas sequências gêni-cas intercaladas com trechos curtos (menos de 1 Kb) de sequências não gênicas.
[0098] Conforme usado neste documento um "ácido nucleico de interesse", "DNA de interesse", ou "doador" é definido como uma sequência de DNA/ ácido nucleico que foi selecionado para a inserção direcionada direcionada ao sítio no genoma de dicotiledônea, como um genoma de soja. Um ácido nucleico de interesse pode ser de qualquer comprimento, por exemplo, entre 2 e 50.000 nucleotídeos de comprimento (ou qualquer valor inteiro entre ou acima de tal faixa), de preferência, entre cerca de 1.000 e 5.000 nucleotídeos de comprimento (ou qualquer valor inteiro entre tal faixa). Um ácido nucleico de interesse pode compreender um ou mais cassetes de expressão gênica que compreendem adicionalmente sequências gênicas ativamente transcritas e/ou traduzidas. Por outro lado, o ácido nucleico de interesse pode compreender uma sequência de polinucleotideos que não compreende um cassete de expressão gênica funcional ou um gene inteiro (por exemplo, pode simplesmente compreender sequências reguladoras tal como um promotor), ou pode não conter nenhum elemento de expressão gênica identificável ou nenhuma sequência gênica ativamente transcrita. O ácido nucleico de interesse pode, opcionalmente, conter um domínio analítico. Mediante a inserção do ácido nucleico de interesse no genoma de dicotiledônea da soja, por exemplo, as sequências inseridas são chamadas de "DNA de interesse inserido". Ademais, o ácido nucleico de interesse pode ser DNA ou RNA, pode ser linear ou circular e pode ser de filamento único ou de filamento duplo. Tal ácido pode ser entregue para a célula como ácido nuclei-co nu, como um complexo com um ou mais agentes de entrega (por exemplo, lipossomas, poloxâmeros, filamento em T encapsulado com proteínas, etc,,) ou contido em um veículo de entrega bacteriano ou viral, tal como, por exemplo, Agrobacterium tumefaciens ou um adeno-virus ou um Vírus adeno associado (AAV), respectivamente.
[0099] Conforme usado neste documento, o termo "domínio analítico" define uma sequência de ácido nucleico que contém elementos funcionais que assistem na inserção direcionada das sequências de ácido nucleico. Por exemplo, um domínio analítico pode conter sítios de enzima de restrição especificamente projetados, sítios de ligação de dedo de zinco, placas de repouso modificadas geneticamente ou plataformas de integração de transgene geneticamente modificadas e podem compreender ou não compreender elementos reguladores de gene ou um quadro de leitura aberta. Consulte, por exemplo, a Publicação de Patente n° 20110191899 incorporada ao presente documento em sua totalidade a título de referência.
[00100] Conforme usado neste documento, o termo "sequência selecionada de dicotiledôneas" define uma sequência genômica de DNA nativa de uma planta dicotiledônea que foi escolhida para análise para determinar se a sequência se qualifica como loci genômicos ótimos de dicotiledônea não gêmeos.
[00101] Conforme usado neste documento, o termo "sequência de soja selecionada" define uma sequência genômica de DNA nativa de uma planta de soja que foi escolhida para a análise para determinar se a sequência se qualifica como loci genômicos ótimos de soja nâo gê-nica.
[00102] Conforme usado neste documento, o termo "hipometilação" ou "hipometilado", referindo-se a uma sequência de DNA, define um estado reduzido de resíduos de nucleotídeo de DNA metilados em uma determinada sequência de DNA. Tipicamente, a metiíação diminuída se refere à quantidade de resíduos de citosina ou adenina metilados relacionada ao nível médio de metiíação encontrado nas sequências não gênicas presentes no genoma de uma planta dicotiledô-nea como uma planta de soja.
[00103] Conforme usado neste documento, uma "sequência dire-cionáver é uma sequência de polinucfeotídeos que é peculiar o suficiente em um genoma nuclear para permitir a inserção direcionada específica quanto ao sítio de um ácido nucleico de interesse em uma sequência específica.
[00104] Conforme usado neste documento, o termo sequência "não repetitiva" é definido como uma sequência de pelo menos 1 Kb de comprimento que compartilha menos que 40% de identidade com qualquer outra sequência no interior do genoma de uma planta dicoti-ledônea, como a soja. Os cálculos de identidade de sequência podem ser determinados com o uso de qualquer conjunto de procedimentos padrão conhecido pelos elementos versados na técnica, incluindo, por exemplo, submeter à varredura uma sequência genômica selecionada em relação ao genoma de dicotiledônea, por exemplo, o genoma de soja c.v. Williams82, com o uso de uma pesquisa de homologia com a base de BLAST™ com o uso do software NCBI BLAST™+ (versão 2.2.25) executado com o uso das definições de parâmetro padrão (Stephen F. Altschul et al (1997), "Gapped BLAST and PSLBLAST; a new generation of protein database search programs", Nudeic Acids Res. 25:3389 a 3402). Por exemplo, conforme as sequências de soja selecionadas (do genoma c.v. Wi!liams82 de Glycine max) foram analisadas, a primeira compatibilidade de BLAST™ identificada a partir de tal pesquisa representa a sequências de dicotiledônea, por exemplo, a sequência de soja c.v. Williams82, em si. A segunda compatibilidade de BLAST™ para cada sequência de soja selecionada foi identificada e a cobertura de alinhamento (representada como a porcentagem da sequência de soja selecionada coberta peía compatibilidade de BLAST™) da compatibilidade foi usada como uma medida de peculiaridade da sequência de soja selecionada no genoma de uma planta dicotiledônea, tal como a soja. Tais valores de cobertura de alinhamento para a segunda compatibilidade de BLAST™ variaram na faixa de um mínimo de 0% a um máximo de 39,97% de identidade de sequência. Quaisquer sequências que se alinharam a níveis superiores de identidade de sequência não foram consideradas.
[00105] O termo "em local próximo a uma região gênica" quando usado em referência a uma sequência não gênica define o local da sequência não gênica relativo a uma região gênica. Especificamente, a quantidade de regiões gênicas em uma vizinhança de 40 Kb (isto é, a 40 Kb de qualquer uma das extremidades da sequência selecionada de loci genômicos ótimos de soja) é analisada. Tal análise foi concluída submetendo-se a ensaios as informações de anotação de gene e os locais de genes conhecidos no genoma de uma dicotiledônea conhecida, tal como a soja, que foram extraídos de um banco de dados de genoma de monocotíledônea, por exemplo, o Banco de Dados de Genoma de Soja (Soybean Genome Database). Para cada um dos loci genômicos ótimos de soja não gênica, por exemplo, 7.018 loci genômicos ótimos de soja não gênica, uma janela de 40 Kb ao redor da sequência de loci genômicos ótimos foi definido e a quantidade de genes anotados em que os locais sobrepõem tal janela foi contada. A quantidade de regiões gênicas varia na faixa de um mínimo de 1 gene a um máximo de 18 genes na vizinhança de 40 Kb [00106] O termo "sequência de codificação de soja conhecida" conforme usado neste documento se refere a qualquer sequência de poli-nucleotídeos identificada dentre qualquer banco de dados genômico de dicotiledônea, incluindo o Banco de Dados Genômica de Soja (Soybean Genomic Database) (www.soybase.org, Shoemaker, RO. et al. SovBase. the USDA-ARS soybean qenetics and qenomics databa-se. Nucleic Acids Res. 2010 Jan;38(Database issue):D843-6.) que compreendem um quadro de leitura aberta, tanto antes quanto após o processamento de sequências de íntrons e estão transcritas em mR-NA e, opcíonalmente, traduzidas para dentro de uma sequência de proteína quando colocadas sob o controle dos elementos reguladores genéticos adequados. A sequência de codificação de soja conhecida pode ser uma sequência de cDNA ou uma sequência genômica. Em alguns casos, a sequência de codificação de soja conhecida pode ser anotada como uma proteína funcional. Em outros casos, a sequência de codificação de soja conhecida pode não ser anotada.
[00107] O termo "sequência de codificação de dicotiledônea prevista" conforme usado neste documento se refere a quaisquer sequências de polinucleotídeo de Etiqueta de Sequência Expressa (Expres-sed Sequence Tag (EST)) descrita em um banco de dados genômico de dicotiledônea, por exemplo, o Banco de Dados Genômico de Soja (Soybean Genomic Database). As ESTs são identificadas a partir de bibliotecas de cDNA construídas com o uso de iniciadores de oligo(dT) para direcionar a síntese de primeiro filamento através de transcriptase reversa. As ESTs resultantes são leituras de sequenciamento de passe único menor que 500 bp obtidas tanto a partir da extremidade 5' quanto da extremidade 3' do inserto de cDNA. Múltiplas ESTs podem ser alinhadas em um único contíguo. As sequências de EST identificadas são transferidas por upload para o banco de dados genômico de dicotiledônea, por exemplo, Banco de Dados Genômicos de Soja (Soybean Genomic Database) e podem ser pesquisados através de métodos de bioinformática para prever as sequências de polinucleoti-deo genômicas correspondentes que compreendem uma sequência de codificação que está transcrita no mRNA e, opcionalmente, traduzida para uma sequência de proteína quando colocada sob o controle dos elementos reguladores genéticos adequados.
[00108] O termo "sequência de codificação de soja prevista" conforme usado neste documento se refere a quaisquer sequências de polinucleotideo de Etiqueta de Sequência Expressa (Expressed Se-quence Tag (ESI)) descrita em um banco de dados genômico de soja, por exemplo, o Banco de Dados Genômicos de Soja (Soybean Geno-mic Database). As ESTs são identificadas a partir de bibliotecas de cDNA construídas com o uso de iniciadores de oíigo(dT) para direcionar a síntese de primeiro filamento através de transcriptase reversa. As ESTs resultantes são leituras de sequenciamento de passe único menor que 500 bp obtidas tanto a partir da extremidade 5' quanto da extremidade 3r do inserto de cDNA. Múltiplas ESTs podem ser alinhadas em um único contíguo. As sequências de EST identificadas são transferidas por upload para o banco de dados genômico de soja, por exemplo, Banco de Dados Genômicos de Soja (Soybean Genomic Database) e podem ser pesquisadas através de métodos de bioinformáti-ca para prever as sequências de polinucleotideo genômicas correspondentes que compreendem uma sequências de codificação que está transcrita no mRNA e, opcionalmente, traduzida em uma sequência de proteína quando colocada sob o controle dos elementos reguladores genéticos adequados.
[00109] O termo "evidência de recombinação" conforme usado neste documento se refere às frequências de recombinação meióticas entre quaisquer pares de marcadores genômicos de dicotüedônea, por exemplo, marcadores genômicos de soja, ao longo de uma região de cromossomo que compreende a sequência de soja selecionada. As frequências de recombinação foram calculadas com base na razão da distância genética entre os marcadores (no centimorgan (cM)) para a distância física entre os marcadores (em megabases (Mb)). Para a sequência de soja selecionada ter a evidência de recombinação, a sequência de soja selecionada deve conter pelo menos um evento de recombinação entre dois marcadores que flanqueiam a sequência de soja selecionada conforme detectada com o uso de um conjunto de dados de marcadores de alta resolução gerado a partir de múltiplas populações de mapeamento.
[00110] Conforme usado neste documento, o termo "valor de local relativo" é um valor calculado que define a distância de um locus ge-nômico de seu centrômero cromossômico correspondente. Para cada sequência de soja selecionada, a distância genômica do local nativo da sequência de soja selecionada para o centrômero do cromossomo em que a mesma está localizada é medida (em Bp). O local relativo da sequência de soja selecionada no interior do cromossomo é representado como a razão de sua distância genômica para o centrômero em relação ao comprimento do braço cromossômico específico (medido em Bp) sobre o qual o mesmo está repousado. Tais valores de local relativo para os loci genômicos ótimos de soja não gênica podem ser gerados para diferentes plantas de dicotiledônea, os valores de local relativo para o conjunto de dados de soja variam na faixa de uma razão de mínimo de 0 para um máximo de 0,99682 de distância genômi-ca.
[00111] O termo "sequência de DNA exógena" conforme usado neste documento é qualquer sequência de ácido nucleico que foi removida de seu local nativo e inserida em um novo local de modo a alterar as sequências que flanqueiam a sequência de ácido nucleico que foi movida. Por exemplo, uma sequência de DNA exógena pode compreender uma sequência de uma outra espécie.
[00112] "Ligação" se refere a uma interação específica quanto à sequência entre as macromoléculas (por exemplo, entre uma proteína e um ácido nucleico). Nem todos os componentes de uma interação de ligação precisam ser específicos quanto à sequência (por exemplo, os contatos com os resíduos de fosfato em uma cadeia principal de DNA), contanto que a interação como um todo seja específica quanto à sequência. Tais interações são, em geral, caracterizadas por uma constante de dissociação (Kd). "Afinidade" se refere à força de ligação: em que a afinidade de ligação aumentada é correlacionada a uma constante de ligação inferior (Kd).
[00113] Uma "proteína de ligação" é uma proteína que pode ser ligada a uma outra molécula. Uma proteína de ligação pode ser ligar a, por exemplo, uma molécula de DNA (uma proteína de ligação ao DNA), uma molécula de RNA (uma proteína de ligação ao RNA) e/ou uma molécula de proteína (uma proteína de ligação à proteína). No caso de uma proteína de ligação à proteína, a proteína pode ser ligar a si mesma (para formar homodímeros, homotrímeros, etc.) e/ou pode se ligar a uma ou mais moléculas de uma proteína ou proteínas diferentes. Uma proteína de ligação pode ter mais de um tipo de atividade de ligação. Por exemplo, proteínas dedo de zinco têm atividade de ligação ao DNA, ligação ao RNA e atividade de ligação à proteína.
[00114] Conforme usado neste documento, o termo "dedos de zinco," define as regiões de sequência de aminoácido no interior de um domínio de ligação à proteína de ligação ao DNA cuja estrutura é estabilizada através da coordenação de um íon de zinco.
[00115] Uma "proteína de ligação ao DNA de dedo de zinco" (ou domínio de ligação) é uma proteína ou um domínio no interior de uma proteína maior que se liga ao DNA de uma maneira específica quanto à sequência através de um ou mais dedos de zinco, que são regiões de sequência de aminoácido no interior do domínio de ligação cuja estrutura é estabilizada através da coordenação de um íon de zinco. O termo proteína de ligação ao DNA de dedo de zinco é, frequentemen- te, abreviado como proteína dedo de zinco ou ZFP Os domínios de ligação de dedo de zinco podem ser ''modificados" para se ligar a uma sequência de nucleotídeos predeterminada. Os exemplos não limitadores de métodos para modificar as proteínas dedo de zinco são o projeto e seleção. Uma proteína dedo de zinco projetada é uma proteína que não tem ocorrência na natureza, cujo projeto/composição resulta, principalmente, dos critérios racionais. Os critérios racionais para o projeto incluem a aplicação de regras de substituição e algoritmos computadorizados para processar as informações em um banco de dados que armazena as informações de projetos de ZFP existentes e dados de ligação. Consulte, por exemplo, a Patente n° U.S. 6.140.081; 6.453.242; 6.534.261 e 6.794.136; consulte, também, WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 e WO 03/016496.
[00116] Um "domínio de ligação ao DNA TALE" ou "TALE" é um polipeptídeo que compreende um ou mais domínios/unidades de repetição de TALE. Os domínios de repetição estão envolvidos na ligação do TALE à sua sequência de DNA-alvo cognata. Uma única "unidade de repetição" (também chamada de uma "repetição") tem, tipicamente, 33 a 35 aminoácidos de comprimento e exibe pelo menos alguma ho-mologia de sequência com outras sequências de repetição de TALE no interior de uma proteína de TALE de ocorrência natural. Consulte, por exemplo, a Publicação de Patente n2. 20110301073 incorporada ao presente documento em sua totalidade a título de referência.
[00117] O sistema de nuclease de CRISPR (Repetições Palindrô-micas Curtas Agrupadas e Regularmente lnterespaçadas)/Cas (Associado às CRISPR). Brevemente, um "domínio de ligação de DNA de CRISPR" em uma molécula de RNA de filamento curto que ao atuar de acordo com a enzima de CAS pode, seletivamente, reconhecer, ligar e clivar o DNA genômico. O sistema de CRISPR/Cas pode ser modificado para criar uma quebra de filamento duplo (DSB) em um alvo dese- jado em um genoma e um reparo da DSB pode ser influenciado pelo uso dos inibidores de reparo para causar um aumento no reparo propenso ao erro. Consulte, por exemplo, Jinek et al (2012) Science 337, páginas 816 a 821, Jinek et al, (2013), eLife 2:e00471, e David Segai, (2013) eLife 2:e00563).
[00118] Os domínios de ligação de dedo de zinco, CRISPR e TALE podem ser "modificados" para se ligarem a uma sequência de nucleo-tídeos predeterminada, por exemplo, através da modificação (alteração de um ou mais aminoácidos) da região helicoidal de reconhecimento de um dedo de zinco de ocorrência natural. De modo similar, os TALEs podem ser "modificados" para se ligarem a uma sequência de nucleotídeos predeterminada, por exemplo, através dos aminoácidos envolvidos na ligação de DNA (os dirresíduos de variável de repetição ou região RVD). Portanto, as proteínas de ligação de DNA (dedos de zinco ou TALEs) são proteínas que não ocorrem naturalmente. Os e-xemplos não limitadores de métodos para modificar as proteínas ligação ao DNA são o projeto e seleção. Uma proteína de ligação ao DNA projetada é uma proteína que não tem ocorrência na natureza, cujo projeto/composição resulta, principalmente, dos critérios racionais. Os critérios racionais para o projeto incluem a aplicação de regras de substituição e algoritmos computadorizados para processar as informações em um banco de dados que armazena as informações de projetos de ZFP e/ou TALE existentes e dados de ligação. Consulte, por exemplo, as Patentes de n— 6.140.081; 6.453.242; e 6.534.261; consulte, também, WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 e WO 03/016496 e as Publicações n- U.S. 20110301073, 20110239315 e 20119145940.
[00119] Uma proteína "selecionada" de dedo de zinco, CRISPR ou TALE é uma proteína não encontrada na natureza, cuja produção resulta, primariamente, de um processo empírico, tal como uma exibição de fago, captura de interação ou seleção híbrida. Consulte, por exemplo, Patentes n25 U.S. 5.789.538; 5.925.523; 6,007.988; 6.013.453; 6.200.759; WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970 WO 01/88197 e WO 02/099084 e Publicações n25 U.S. 20110301073, 20110239315 e 20119145940.
[00120] "Recombinação" se refere a um processo de troca de informações genéticas entre dois polinucleotídeos, incluindo, mas sem limitação doador; a captura através de união terminal não homóloga (NHEJ) e recombinação homóloga. Para os propósitos desta revelação, "recombinação homóloga (HR)" se refere à forma especializada de tal troca que ocorre, por exemplo, durante o reparo de quebras de filamento duplo em células através de mecanismos de reparo direcionados por homologia. Tal processo exige a homologia de sequência de nucleotídeos, usa uma molécula "doadora" para moldar o reparo de uma molécula "alvo" (isto é, a sequência de nucleotídeos que sofreu a quebra de filamento duplo) e é, aiternativamente, conhecida como "conversão de gene por não *crossover"' ou "conversão de gene de trato curto," pois a mesma leva a uma transferência de informações genéticas do doador para o alvo. Sem se ater a qualquer teoria específica, tal transferência pode envolver a correção de incompatibilidade dp DNA de heterodúplex que se forma entre o alvo quebrado e o doador e/ou "anelamento de filamento dependente de síntese," em que o doador é usado para ressintetizar as informações genéticas que irão se tornar uma parte do alvo e/ou processos relacionados. Tal HR especializada, frequentemente, resulta em uma alteração da sequência da molécula-alvo de modo que uma parte ou toda a sequência do polinu-cleotídeo doador seja incorporada ao polinucleotídeo-alvo. Para a integração direcionada por HR, a molécula doadora contém pelo menos 2 regiões de homologia ao genoma ("braços de homologia") de pelo menos 50 a 100 pares de base de comprimento. Consulte, por exemplo, a Publicação de Patente n- 20110281361.
[00121] Nos métodos da revelação, uma ou mais nucleases direcionadas conforme descrito neste documento, criam uma quebra de filamento duplo na sequência-alvo (por exemplo, cromatina celular) em um sítio predeterminado e um polinucleotídeo "doador" que tem homo-logia com a sequência de nucleotideos na região da quebra para a integração mediada por HR ou que não tem homologia com a sequência de nucleotideos na região da quebra para a integração mediada por NHEJ, pode ser introduzida na célula. Constatou-se que a presença da quebra de filamento duplo facilita a integração da sequência doadora. A sequência doadora pode ser fisicamente integrada ou, alternativamente, o polinucleotídeo doador é usado como um molde para o reparo da quebra através da recombinação homóloga, resultando na introdução de toda a sequência de nucleotideos, ou parte da mesma, como no doador, na cromatina celular. Dessa forma, uma primeira sequência na cromatina celular pode ser alterada e, em determinadas modalidades, pode ser convertida para uma sequência presente em um polinucleotídeo doador. Dessa forma, o uso dos termos "substituir" ou "substituição" pode ser entendido como a representação da substituição de uma sequência de nucleotideos por outra, (isto é, substituição de uma sequência no sentido ínformacional) e não exige, necessariamente, a substituição física ou química de um polinucleotídeo por outro.
[00122] Em qualquer um dos métodos descritos neste documento, os pares adicionais de proteínas dedo de zinco, CRISPRS ou TALEN podem ser usados para a divagem adiciona! de filamento duplo de sí-tios-alvo adicionais na célula.
[00123] Qualquer um dos métodos descritos neste documento pode ser usado para a inserção de um doador de qualquer tamanho e/ou inativação parcial ou completa de uma ou mais sequências-alvo em uma céluta através da integração direcionada da sequência doadora que perturba a expressão do{s) gene(s) de interesse. As linhagens celulares com genes parcial ou completamente inativados também são fornecidas.
[00124] Ademais, os métodos de integração direcionada conforme descritos neste documento, também podem ser usados para integrar uma ou mais sequências exógenas. As sequências exógenas de ácido nucleíco podem compreender, por exemplo, um ou mais genes ou moléculas de cDNA, ou qualquer tipo de sequência de codificação ou de não codificação, assim como um ou mais elementos de controle (por exemplo, promotores). Além disso, as sequências exógenas de ácido nucleico (transgene) podem produzir uma ou mais moléculas de RNA (por exemplo, pequenos RNAs em forma de gancho (shRNAs), RNAs inibidores (RNAis), microRNAs (miRNAs), etc.) ou proteína.
[00125] "Clivagem" conforme usado neste documento define a quebra da cadeia principal de açúcar de fosfato de uma molécula de DNA. A clivagem pode ser iniciada através de uma variedade de métodos incluindo, mas sem limitação, a hidrólise enzimática ou química de uma ligação de fosfodiéster. Tanto a clivagem de filamento único quanto a clivagem de filamento duplo são possíveis e a clivagem de filamento duplo pode ocorrer como um resultado de dois eventos de clivagem de filamento único. A clivagem de DNA pode resultar na produção tanto de extremidades cegas quanto de extremidades escalonadas. Em determinadas modalidades, os polipeptídeos de fusão são usados para clivagem de DNA de filamento duplo direcionada. Um "domínio de clivagem" compreende uma ou mais sequências de poli-peptídeo que têm atividade catalítica para a clivagem de DNA. Um domínio de clivagem pode estar contido em uma cadeia de único poli-peptídeo ou a atividade de clivagem pode resultar da associação de dois (ou mais) polipeptídeos.
[00126] Um "meio domínio de divagem" é uma sequênda de poli-peptídeo que, em conjunto com um segundo polipeptídeo (tanto idêntico quanto diferente), forma um complexo que tem a atividade de divagem (de preferência atividade de divagem de filamento duplo). Os termos "primeiro e segundo meios domínios de divagem;" "meios domínios de divagem + e -" e "meios domínios de divagem direito e esquerdo" são usados intercambiavelmente para se referir aos pares de meios domínios de divagem que dimerizam.
[00127] Um "meio domínio de divagem modificado" é um meio domínio de divagem que foi modificado de modo que forme heterodíme-ros obrigatórios com um outro meio domínio de divagem (por exemplo, um outro meio domínio de divagem modificado). Consulte, também, Publicações de Patente n— U.S. 2005/0064474, 20070218528, 2008/0131962 e 2011/0201055, incorporadas ao presente documento em sua totalidade a título de referência.
[00128] Um "sítio-alvo" ou "sequência-aivo" se refere a uma porção de um ácido nucleico ao qual uma molécula de ligação irá ligar, supondo-se que existam condições suficientes para a ligação.
[00129] Os ácidos nucleicos incluem DNA e RNA, podem ser de filamento único ou duplo; podem ser lineares, ramificados ou circulares; e podem ter qualquer comprimento. Os ácidos nucleicos incluem aqueles que podem formar dúplexes. assim como ácidos nucleicos de formação de tríplex. Consulte, por exemplo, a Patente n° U.S. 5,176.996 e 5,422.251. As proteínas incluem, mas não se limitam a, proteínas de ligação ao DNA, fatores de transcrição, fatores de remo-delagem de cromatina, proteínas de ligação ao DNA metilado, polime-rases, metiíases, desmetilases, acetilases, desacetilases, quinases, fosfatases, integrases, recombinases, ligases, topoisomerases, girases e heficases.
[00130] Um "produto de um ácido nucleico exógeno" inclui tanto os produtos de polinucleotídeo quanto de polipeptídeo, por exemplo, os produtos de transcrição (polinucleotídeos, tais como o RNA) e produtos de tradução (polipeptídeos).
[00131] Uma molécula de "fusão" é uma molécula em que duas ou mais moléculas de subunidades estão ligadas, por exemplo, covalen-temente. As moléculas de subunidades podem ser do mesmo tipo químico da molécula ou podem ser tipos químicos diferentes das moléculas. Os exemplos do primeiro tipo de molécula de fusão incluem, mas não se limitam a, proteínas de fusão (por exemplo, uma fusão entre um domínio de ligação de DNA de ZFP e um domínio de divagem) e ácidos nucleicos de fusão (por exemplo, um ácido nucleico que codifica a proteína de fusão supracitada). Os exemplos do segundo tipo de molécula de fusão incluem, mas sem limitação, uma fusão entre um ácido nucleico de formação de tríplex e um polipeptídeo e uma fusão entre um ligador de sulco minoritário e um ácido nucleico. A expressão de uma proteína de fusão em uma célula pode resultar da entrega da proteína de fusão à célula ou através da entrega de um polinucleotídeo que codifica a proteína de fusão a uma célula, em que o polinucleotídeo é transcrito e a transcrição é traduzida para gerar a proteína de fusão. A trans-excisão, divagem de polipeptídeo e ligação de polipeptídeo também podem estar envolvidas na expressão de uma proteína em uma célula. Os métodos para entrega de polinucleotídeo e polipeptídeo às células são apresentados em outras partes desta revelação.
[00132] Para os propósitos da presente revelação, um "gene” inclui uma região de DNA que codifica um produto de gene (consulte abaixo), assim como todas as regiões de DNA que regulam a produção do produto de gene, se tais sequências regulatórias são ou não adjacentes ou ligadas operacionalmente às sequências de codificação e/ou transcritas. Consequentemente, um gene inclui, mas não se timita necessariamente às sequências de promotor, terminadores, sequências regulatórias de tradução, tais como, sítios de ligação de ribossomo e sítios de entrada de ribossomo internos, intensificadores, silenciadores, isolantes, elementos de fronteira, origens de replicação, sítios de fixação de matriz e regiões de controle de locus.
[00133] A "expressão de gene" se refere à conversão das informações contidas em um gene, para um produto de gene. Um produto de gene pode ser o produto transcricional direto de um gene (por exemplo, mRNA, tRNA, rRNA, RNA antissenso, RNA de interferência, ribo-zima, RNA estrutural ou qualquer outro tipo de RNA) ou uma proteína produzida por meio de tradução de um mRNA. Os produtos de gene incluem, também, os RNAs que são modificados por meio de processos, tais como, capeamento, poliadenilação, metilação e edição e as proteínas modificadas por, por exemplo, metilação, acetilação, fosfori-lação, ubiquitinação, ribossilação de ADP, miristilação e glicosilação.
[00134] Identidade de sequência: O termo "identidade de sequência" ou "identidade," conforme usado neste documento no contexto de duas sequências de ácido nucleico ou de polipeptídeo, se refere aos resíduos nas duas sequências que são iguais quando alinhadas para a correspondência máxima sobre uma janela de comparação especificada.
[00135] Conforme usado neste documento, o termo "porcentagem de identidade de sequência" se refere ao valor determinado comparando-se duas sequências alinhadas de modo ótimo (por exemplo, sequências de ácido nucleico e sequências de aminoácidos) ao longo de uma janela de comparação, em que a porção da sequência na janela de comparação pode compreender as adições ou deleções (isto é, vãos) em comparação a uma sequência de referência (que não compreende adições ou deleções) para um alinhamento ótimo das duas sequências. A porcentagem é calculada determinando-se a quantidade de posições em que ocorre o resíduo de ácido nucleico ou de núcleo- tídeo em ambas as sequências para render a quantidade de posições correspondentes, dividindo-se a quantidade de posições correspondentes pela quantidade total de posições na janela de comparação e multiplicando-se o resultado por 100 para render a porcentagem de identidade de sequência.
[00136] Os métodos para alinhar as sequências para a comparação são bem conhecidos na técnica. Os vários programas e algoritmos de alinhamento são descritos em, por exemplo: Smith e Waterman (1981) Adv. Appl. Math. 2:482; Needleman e Wunsch (1970) J. Mol. Biol. 48:443; Pearson e Lipman (1988) Proc. Natl. Acad. Sei. EUA 85:2.444; Higgins e Sharp (1988) Gene 73:237 a 244; Higgins e Sharp (1989) CABIOS 5:151 a 153; Corpet et al. (1988) Nucleic Acids Res. 16:10.881 a 10.890; Huang et al. (1992) Comp. Appl. Biosci. 8:155 a 165; Pearson et al. (1994) Methods Mol. Biol. 24:307 a 331; Tatiana et al. (1999) FEMS Microbiol. Lett. 174:247 a 250. Uma consideração detalhada de métodos de alinhamento de sequência e cálculos de homo-logia podem ser encontrados em, por exemplo, Altschul et al. (1990) J. Mol. Biol. 215:403 a 410. O Basic Local Alignment Search Tool da National Center for Biotechnology Information (NCBI) (BLAST™; Altschul et al. 1990) está disponível junto às diversas fontes, incluindo o National Center for Biotechnology Information (Bethesda, MD) e na internet, par ao uso em relação a diversos programas de análise de sequência Uma descrição de como determinar a identidade de sequência com o uso de tal programa está disponível na internet mediante a seção "help" (ajuda) para BLAST™. Para comparações de sequências de ácido nucleico, a função de "Blast 2 sequências" (sequências de Blast 2) do programa BLAST™ (Blastn) pode ser empregada com o uso dos parâmetros predefinidos. As sequências de ácido nucléico com similaridades ainda maiores com as sequências de referência, irão mostrar uma identidade de porcentagem crescente ao serem avaliadas por meio de tal método.
[00137] Especificamente hibridizável/Especificamente complementar: Conforme usado neste documento, os termos "especificamente hibridizável" e "especificamente complementar" são termos que indicam um grau suficiente de complementaridade, de tal modo que ocorra a ligação estável e específica entre a molécula de ácido nucleico e uma molécula de ácido nucleico-alvo. A hibridização entre duas moléculas de ácido nucleico envolve a formação de um alinhamento antipa-ralelo entre as sequências de ácido nucleico das duas moléculas de ácido nucleico. As duas moléculas, então, podem formar as ligações de hidrogênio com as bases correspondentes no filamento oposto para formar uma molécula de dúplex que, se a mesma for estável o suficiente, é detectável com o uso de métodos bem conhecidos na técnica. Uma molécula de ácido nucleico não precisa de 100% de complementaridade com sua sequência-alvo para ser especificamente hibridizável. Entretanto, a quantidade da complementaridade de sequência que deve existir para que a hibridização seja específica é uma função das condições de hibridização usadas.
[00138] As condições de hibridização que resultam em determinados graus de estringência irão variar dependendo da natureza do método de hibridização escolhido e da composição e comprimento das sequências de ácido nucleico de hibridização. Em geral, a temperatura de hibridização e a força iônica (especialmente a concentração de Na+ e/ou Mg2+) do tampão de hibridização irão determinar a estringência de hibridização, embora a quantidade de lavagens também influencie a estringência. Os cálculos em relação às condições de hibridização exigidos para se obter graus específicos de estringência são conhecidos para os elementos de habilidade comum na técnica e são discutidos, por exemplo, em Sambrook et al. (ed.) Molecular Cloning: A Labo-ratory Manual, 2a edição, volume 1 a 3, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989, capítulos 9 e 11; e Hames e Higgins (eds.) Nucleic Acid Hybridization, IRL Press, Oxford, 1985. Ademais, as instruções e orientações detalhadas em relação à hibridi-zação de ácidos nucleicos podem ser encontradas, por exemplo, em Tijssen, "OverView of principies of hibridização and the strategy of nucleic acid probe assays," em Laboratory Techniques in Biochemistry and Molecular Biology- Hybridization with Nucleic Acid Probes, Parte I, Capítulo 2, Elsevier, NY, 1993; e Ausubel et al., Eds., Current Proto-cols em Molecular Biology, Capítulo 2, Greene Publishing e Wiley-Interscience, NY, 1995.
[00139] Conforme usado neste documento, as "condições estrin-gentes" englobam as condições sob as quais a hibridização apenas irá ocorrer se houver menos de 20% de incompatibilidade entre a molécula de hibridização e uma sequência no interior da molécula de ácido nucleico-alvo. As "condições estringentes" incluem determinados níveis adicionais de estringência. Dessa forma, conforme usado neste documento, as condições de "estringência moderada" são aquelas sob as quais as moléculas com mais de 20% de incompatibilidade de sequência não se hibridizam; as condições de "estringência alta" são a-quelas sob as quais as sequências com mais de 10% de incompatibilidade não se hibridizam e as condições de "estringência muito alta" são aquelas sob as quais as sequências com mais de 5% de incompatibilidade não hibridizam. A seguir estão condições de hibridização não limitadoras e representativas.
[00140] A Condição de Alta Estringência (detecta sequências que compartilham pelo menos 90% de identidade de sequência): A hibridização em 5x de tampão SSC (em que o tampão SSC contém um detergente tal como o SDS, e reagentes adicionais como o DNA de espermatozóide de salmão, EDTA, etc.) a 65 °C durante 16 horas; lavar duas vezes em 2x de tampão SSC (em que o tampão SSC contém um detergente tal como o SDS, e reagentes adicionais como o DNA de espermatozóide de salmão, EDTA, etc.) à temperatura ambiente durante 15 minutos, cada; e lavar duas vezes em 0,5x de tampão SSC (em que o tampão SSC contém um detergente tal como o SDS e reagentes adicionais como o DNA de espermatozóide de salmão, EDTA, etc.) a 65 °C durante 20 minutos cada.
[00141] A Condição de Estringência Moderada (detecta sequências que compartilham pelo menos 80% de identidade de sequência): A hibridização em 5x a 6x de tampão SSC (em que o tampão SSC contém um detergente tal como o SDS, e reagentes adicionais como o DNA de espermatozóide de salmão, EDTA, etc.) a 65 a 70 °C durante 16 a 20 horas; lavar duas vezes em 2x de tampão SSC (em que o tampão SSC contém um detergente tal como o SDS, e reagentes adicionais como o DNA de espermatozóide de salmão, EDTA, etc.) à temperatura ambiente durante 5 a 20 minutos, cada; e lavar duas vezes em 1x de tampão SSC (em que o tampão SSC contém um detergente tal como o SDS e reagentes adicionais como o DNA de espermatozóide de salmão, EDTA, etc.) a 55 a 70 °C durante 30 minutos cada.
[00142] A condição de controle de não estringência (sequências que compartilham pelo menos 50% de identidade de sequência irão hibridizar): A hibridização em 6x de tampão SSC (em que o tampão SSC contém um detergente tal como SDS e reagentes adicionais como o DNA de espermatozóide de salmão, EDTA, etc.) da temperatura ambiente a 55 °C durante 16 a 20 horas; lavar pelo menos duas vezes em 2x a 3x de tampão SSC (em que o tampão SSC contém um detergente tal como o SDS e reagentes adicionais como o DNA de espermatozóide de salmão, EDTA, etc.) da temperatura ambiente a 55 °C durante 20 a 30 minutos cada.
[00143] Conforme usado neste documento, o termo "substancial- mente homólogo" ou "homologia substancial," em relação a uma sequência contígua de ácido nucleico, se refere à sequência nucleotídica contígua que se hibridiza sob condições estringentes à sequência de ácido nucleico de referência. Por exemplo, as sequências de ácido nucleico que são substancialmente homólogas a uma sequência de ácido nucleico de referência são as sequências de ácido nucleico que se hi-bridizam sob as condições estringentes (por exemplo, as condições de Estringência Moderada estabelecidas anteriormente) à sequência de ácido nucleico de referência. As sequências substancialmente homólogas podem ter pelo menos 80% de identidade de sequência. Por e-xemplo, as sequências substancialmente homólogas podem ter de cerca de 80% a 100% de identidade de sequência, tal como cerca de 81%; cerca de 82%; cerca de 83%; cerca de 84%; cerca de 85%; cerca de 86%; cerca de 87%; cerca de 88%; cerca de 89%; cerca de 90%; cerca de 91%; cerca de 92%; cerca de 93%; cerca de 94% cerca de 95%; cerca de 96%; cerca de 97%; cerca de 98%; cerca de 98,5%; cerca de 99%; cerca de 99,5%; e cerca de 100%. A propriedade de homologia substancial é proximamente relacionada à hibridização específica. Por exemplo, uma molécula de ácido nucleico é especifica-mente hibridizável quando há um grau suficiente de complementaridade para evitar a ligação não específica do ácido nucleico às sequências não alvo sob as condições em que a ligação específica é desejada, por exemplo, sob condições de hibridização estringente.
[00144] Em alguns casos "homólogo" pode ser usado para se referi à relação de um primeiro gene a um segundo gene através de descendência de uma sequência de DNA de ancestral comum. Em tais casos, o termo, homólogo indica uma relação entre os genes separados pelo evento da especiação (consulte ortólogo) ou a relação entre genes separados pelo evento de duplicação genética (consulte parálo-gos). Em outros casos, "homólogo" pode ser usado para se referir ao nível de identidade de sequência entre uma ou mais sequências de polinucleotídeo, em tais casos, a uma ou mais sequências de polinu-cleotídeo não descendem, necessariamente de uma sequência de DNA ancestral comum. Os elementos versados na técnica sabem a respeito da qualidade intercambiávei do termo "homólogo" e é evidente para os mesmos a aplicação adequada do termo.
[00145] Conforme usado neste documento, o termo "ortólogo” (ou "ortólogos") se refere a um gene em duas ou mais espécies que se desenvolveu a partir de uma sequência de nucleotídeos ancestral comum e pode reter a mesma função nas duas ou mais espécies.
[00146] Conforme usado neste documento, o termo "parálogo" se refere aos genes relacionados através da duplicação no interior de um genoma. Os ortólogos retêm a mesma função no curso de evolução, enquanto os parálogos desenvolvem novas funções, mesmo que tais novas funções não sejam relacionadas à função do gene original.
[00147] Conforme usado neste documento, diz-se que duas sequências de moléculas de ácido nucfeico exibem "complementaridade completa" quando todos os nucleotídeos de uma sequência que são lidos na direção de 5f a 3' são complementarem a todos os nucleotídeos da outra sequência quando são fidos na direção 3‘ para 5\ Uma sequência de nucleotídeos que é complementar a uma sequência de nucleotídeos de referência irá exibir uma sequência idêntica à sequência de complemento inversa da sequência de nucleotídeos de referência. Tais termos e descrições são bem definidos na técnica e são facilmente entendidos pelos elementos de habilidade comum na técnica.
[00148] Ao determinar a porcentagem de identidade de sequência entre sequências de aminoácidos, é bem conhecido pelos elementos versados na técnica que a identidade do aminoácido em uma posição determinada fornecida por um alinhamento pode ser diferente sem afetar as propriedades desejadas dos polipeptídeos que compreendem as sequências alinhadas. Em tais casos, a porcentagem de identidade de sequência pode ser ajustada de modo a ser considerada para a similaridade entre os aminoácidos substituídos de maneira conservadora. Tais ajustes são bem conhecidos e comumente usados pelos elementos versados na técnica. Consulte, por exemplo, Myers e Miller (1988) Computer Applications in Biosciences 4:11 a 17. Os métodos estatísticos são conhecidos na técnica e podem ser usados na análise dos 7.018 loci genômicos ótimos identificados.
[00149] Como uma modalidade, os loci genômicos ótimos identificados que compreendem 7.018 sequências de loci genômicos ótimos individuais podem ser analisados através de um teste de distribuição de F. Em uma estatística e teoria de probabilidade, a distribuição de F é uma distribuição de probabilidade contínua. O teste de distribuição de F é um teste de significância estatística que tem uma distribuição de F e é usado ao comparar os modelos estatísticos que foram encaixados a um conjunto de dados para identificar o modelo que se encaixa melhor. Uma distribuição de F é uma distribuição de probabilidade contínua e também é conhecida como distribuição de F de Snedecor ou distribuição de Fisher-Snedecor. A distribuição de F surge frequentemente como a distribuição nula de uma estatística de teste, mais perceptivelmente, na análise de variância. A distribuição de F é uma distribuição inclinada para a direita. A distribuição de F é uma distribuição assimétrica que tem um valor mínimo de 0, porém, sem valor máximo. A curva alcança um pico não distante à direita de 0 e, então, alcança gradualmente o eixo geométrico horizontal quanto maior for o valor de F. A distribuição de F alcança, porém nunca encosta no eixo geométrico horizontal. Ficará evidente que em outras modalidades, as variações em tal equação, ou de fato, equações diferentes podem ser derivadas e usadas pelo elemento versado e são aplicáveis à análise de 7.018 sequências de loci genômicos ótimos individuais.
[00150] Ligado operacionalmente: Uma primeira sequência de nu-cleotídeos é "ligada operacionalmente" a uma segunda sequência de nucleotídeos quando a primeira sequência de nucleotideos está em uma relação funcional com a segunda sequência de nucleotídeo. Por exemplo, um promotor está ligado operacionalmente a uma sequência de codificação se o promotor afetar a transcrição ou expressão das sequências de codificação. Quando produzidas de modo recombinan-te, as sequências de nucleotídeos ligadas operacionalmente são em geral contíguas e, onde necessário, unem duas regiões de codificação de proteína, no mesmo quadro de leitura. Entretanto, as sequências de nucleotídeos não precisam ser contíguas para serem ligadas operacionalmente.
[00151] O termo, "ligado operacionalmente", quando usado em referência a uma sequência reguladora e uma sequência de codificação, significa que a sequência reguladora afeta a expressão das sequências de codificação ligadas. "Sequências reguladoras", "elementos reguladores" ou "elementos de controle" referem-se a sequências de nucleotídeos que influenciam a temporização e nível/quantidade de transcrição, processamento ou estabilidade de RNA, ou tradução das sequências de codificação associadas. As sequências reguladoras podem incluir promotores; sequências líder de tradução; íntrons; intensi-ficadores; estruturas de haste-laço; sequências de ligação de repres-sor; sequências de terminação; sequências de reconhecimento de po-liadenilação; etc. As sequências reguladoras particulares podem estar localizadas a montante e/ou a jusante de uma sequência de codificação ligada operacionalmente às mesmas. Além disso, as sequências reguladoras particulares ligadas operacionalmente a uma sequência de codificação podem estar localizadas no filamento complementar associado de uma de molécula de ácido nucleico de filamento duplo.
[00152] Quando usado em referência a duas ou mais sequências de amínoácidos, o termo "ligado operacionalmente" significa que a primeira sequência de aminoácido está em uma relação funcional com pelo menos uma das sequências de aminoácídos adicionais.
[00153] Os métodos e as composições revelados incluem proteínas de fusão que compreendem um domínio de divagem ligado operacionalmente a um domínio de ligação de DNA (por exemplo, um ZFP) em que o domínio de ligação de DNA por ligação a uma sequência no lo-cus genômico ótimo de soja direciona a atividade do domínio de divagem para a proximidade da sequência e, portanto, induz uma quebra de filamento duplo no locus genômico ótimo. Conforma apresentado em outra parte nesta revelação, um domínio de dedo de zinco pode ser projetado para ligação vitualmente a qualquer sequência desejada. Dessa forma, um ou mais domínios de ligação de DNA podem ser projetados para ligação a uma ou mais sequências no locus genômico ótimo. A expressão de uma proteína de fusão que compreende um domínio de ligação de DNA e um domínio de divagem em uma célula afeta a divagem em ou próximo ao sítio alvo.
MODALIDADES
[00154] Direcionar transgenes e pilhas de transgenes a Socais específicos no genoma de plantas de dicotiledônea, como uma planta de soja, aprimorará a qualidade de eventos transgênicos, reduzirá custos associados á produção de eventos transgênicos e fornecerá novos métodos para produzir produtos vegetais transgênicos, tal como empi-Ihamento de gene sequencial. Em geral, direcionar transgenes a sítios genômicos específicos provavelmente será comercialmente benéfico. Foram feitos avanços significativos nos últimos anos em relação ao desenvolvimento de nucleases com especificidade para sítio, tais como ZFNs, CRISPRs e TALENs, que podem facilitar a adição de poli-nucleotídeos doadores a sítios pré-selecionados em genomas de planta e outros. Entretanto, se sabe muito menos a respeito dos atributos de sítios genômicos que são adequados para o direcionamento. Historicamente, os sítios de integração de patogênio (viral) e genes não essenciais em genomas foram usados como os loci para direcionamento. O número de tais sítios em genomas é particularmente limitante e há, portanto, uma necessidade de identificação e caracterização de loci genômicos ótimos que podem ser usados para direcionamento de sequências de polinucleotídeo doador. Além de serem passíveis ao direcionamento, espera-se que os loci genômicos ótimos sejam sítios neutros que podem sustentar a expressão de transgene e aplicações de reprodução.
[00155] As requerentes reconheceram que critérios adicionais são desejáveis para sítios de inserção e combinaram esses critérios para identificar e selecionar sítios ótimos no genoma de dicotiledônea, como o genoma de soja, para a inserção de sequências exógenas. Para propósitos de direcionamento, o sítio de inserção selecionada precisa ser único e em uma região não repetitiva do genoma de uma planta dicotiledônea, como uma planta de soja. Similarmente, o sitio genômi-co ótimo para inserção deve possuir efeitos fenotípicos indesejados mínimos e ser suscetíveis a eventos de recombinação para facilitar a introgressão em linhagens agronomicamente de elite com o uso de técnicas tradicionais de reprodução. A fim de identificar os loci genômicos que atendem os critérios listados, o genoma de uma planta de soja foi submetido à varredura com o uso de uma abordagem de bioin-formática personalizada e conjuntos de dados de escala de genoma para identificar loci genômicos inovadores que possuem características que sejam benéficas para a integração de sequência doadora de polinucleotídeos e a expressão subsequente de uma sequência de codificação inserida.
I. IDENTIFICAÇÃO DE LOCI GENÔMICOS DE SOJA NÃO GÊNICA
[00156] De acordo com uma modalidade, é fornecido um método para identificar uma sequência genômica ótima de soja não gênica para inserção de sequências exógenas. 0 método compreende as etapas de primeiramente identificar sequências genômicas de soja de pelo menos 1 Kb de comprimento que sejam hipometüadas. Em uma modalidade, a sequência genômica hipometilada tem 1, 1.5, 2, 2,5, 3, 3,5, 4, 4,5, 5, 5,5, 6, 6,5, 7, 7,5, 8, 8,5, 9, 10, 11, 12, 13, 14, 15, 16 ou 17 Kb de comprimento. Em uma modalidade, a sequência genômica hipometilada tem cerca de 1 a cerca de 5,7 Kb de comprimento e, em uma modalidade adicional, tem cerca de 2 Kb de comprimento. Uma sequência é considerada hipometilada se a tiver menos de 1% de me-tilação de DNA dentro da sequência. Em uma modalidade, a situação de metilação é medida com base na presença de 5-metilcítosina em um ou mais dinucleotideos CpG, trinucleotídeos CHH ou CHG dentro de uma sequência de soja selecionada, em relação à quantidade de citosinas totais encontradas em dinucleotideos CpG, trinucleotídeos CHH ou CHG correspondentes dentro de uma amostra de DNA de controle normal. A metilação de CHH indica uma 5-metilcitosina seguida por dois nucleotídeos que podem não ser guanina e a metilação de CHG refere-se a uma 5-metilcitosina anterior a uma adenina, timina ou citosina baseada seguida por guanina. Mais especificamente, em uma modalidade, a sequência de soja selecionada tem pelo menos 1, 2 ou 3 nucleotídeos metilados por 500 nucleotídeos da sequência de soja selecionada. Em uma modalidade, a sequência de soja selecionada tem menos de uma, duas ou três 5-metilcitosinas em dinucleotideos CpG por 500 nucleotídeos da sequência de soja selecionada. Em uma modalidade, a sequência de soja selecionada tem 1 a 4 Kb de comprimento e compreende uma sequência de 1 Kb desprovida de 5-metilcitosinas. Em uma modalidade, a sequência de soja selecionada tem 1, 1,5, 2, 2,5, 3, 3,5, 4, 4,5, 5, 5,5, ou 6 Kb de comprimento e contém 1 ou 0 nucleotídeos metilados em seu comprimento inteiro. Em uma modalidade, a sequência de soja selecionada tem 1, 1,5, 2, 2,5, 3, 3,5, 4, 4,5, 5, 5,5, ou 6 Kb de comprimento e não contém nenhuma 5-metilcitosina em dinucleotídeos CpG dentro de seu comprimento inteiro. De acordo com uma modalidade, a metifação de uma sequência de soja selecionada pode variar com base em um tecido-fonte. Em tais modalidades, os níveis de metilação usados para determinar se uma sequência é hipometilada representam a quantidade média de metilação nas sequências isoladas de dois ou mais tecidos (por exemplo, de raiz e ramo).
[00157] Além da exigência de que um sítio genômico ótimo seja hi-pometilado, a sequência de soja selecionada também deve ser não gênica. Consequentemente, todas as sequências genômicas hipometi-ladas são, adicionalmente, tríadas para eliminar as sequências hipo-metiladas que contêm uma região gênica. Isso inclui quaisquer quadros de leitura aberta independentemente de a transcrição codificar uma proteína. As sequências genômicas hipometiladas que incluem as regiões gênicas, inclusive quaisquer sequências de nucleotídeo que não codificam 5' e 3’ adjacentes identificáveis envolvidas na regulação de expressão de um quadro de leitura aberta e quaisquer íntrons que possam estar presentes na região gênica são excluídos do locus genômico ótimo de grão de soja não gênico da presente revelação.
[00158] Os loci genômicos ótimos de soja não gênica também devem ser sequências que demonstraram evidência de recombinação. Em uma modalidade, a sequência de soja selecionada deve ser uma em que pelo menos um evento de recombinação foi detectado entre dois marcadores que flanqueiam a sequência de soja selecionada conforme detectado com o uso de um conjunto de dados de marcador de alta resolução gerados a partir de múltiplas populações de mapeamento. Em uma modalidade, o par de marcadores que flanqueiam uma sequência genômica de dicotiledôneas de 0,5, 1, 1,5 Mb, tal como uma sequência genômica de grão de soja, que compreende a sequência de soja selecionada são usados para calcular a frequência recombinante para a sequência de soja selecionada. As frequências de recombina-ção entre cada par de marcadores (medidas em centimorgan (cM)) para a distância física genômica entre os marcadores (em Mb)) deve ser maior que 0,0157 cM/Mb. Em uma modalidade, a frequência de recombinação para uma sequência genômica de grão de soja de 1 Mb que compreende a sequência de soja selecionada está dentro de uma faixa de cerca de 0,01574 cM/Mb a cerca de 83,52 cM/Mb. Em uma modalidade, os loci genômicos ótimos são uns em que os eventos de recombinação foram detectados no interior da sequência de soja selecionada.
[00159] Os loci genômicos ótimos de soja não também serão uma sequência direcionável, isto é, uma sequência que é relativamente Cínica no genoma de soja, de modo que um gene direcionado à sequência de soja selecionada apenas será inserido em um local do genoma de soja. Em uma modalidade, todo o comprimento da sequência genômica ótima compartilha menos que 30%, 35% ou 40% de identidade de sequência com uma outra sequência de comprimento similar contida no genoma de soja. Consequentemente, em uma modalidade, a sequência de soja selecionada não pode compreender uma sequência de 1 Kb que compartilhe mais que 25%, 30%, 35% ou 40% de identidade de sequência com uma outra sequência de 1 Kb contida no genoma de soja. Em uma modalidade adicional, a sequência de soja selecionada não pode compreender uma sequência de 500 bp que compartilhe mais que 30%, 35% ou 40% de identidade de sequência com uma outra sequência de 500 bp contida no genoma de soja. Em uma modalidade, a sequência de soja selecionada não pode compreender uma sequência de 1 Kb que compartilhe mais que 40% de identidade de sequência com uma outra sequência de 1 Kb contida no genoma de uma planta dicotiledônea, assim como uma planta de soja.
[00160] Os loci genômicos ótimos de soja não também estarão próximos a uma região gênica. Mais particularmente, uma sequência de soja selecionada deve estar localizada nas proximidades de uma região gênica (por exemplo, uma região gênica deve estar localizada a 40 Kb da sequência genômica que flanqueia e está contígua em relação a qualquer uma das extremidades da soja selecionada conforme obtido no genoma nativo). Em uma modalidade, uma região gênica está localizada a 10, 20, 30 ou 40 Kb da sequência genômica contígua localizada em qualquer uma das extremidades da sequência de soja selecionada conforme obtida no genoma nativo de soja. Em uma modalidade, duas ou mais regiões gênicas estão localizadas a 10, 20, 30 ou 40 Kb da sequência genômica contígua que flanqueia as duas extremidades da sequência de soja selecionada. Em uma modalidade, 1 a 18 regiões gênicas estão localizadas a 10, 20, 30 ou 40 Kb da sequência genômica contígua que flanqueia as duas extremidades da sequência de soja selecionada. Em uma modalidade, duas ou mais regiões gênicas estão localizadas em uma sequência genômica de 20, 30 ou 40 Kb que compreende a sequência de soja selecionada. Em uma modalidade, 1 a 18 regiões gênicas estão localizadas em uma sequência genômica de 40 Kb que compreende a sequência de soja selecionada. Em uma modalidade, a região gênica localizada a 10, 20, 30 ou 40 Kb da sequência genômica contígua que flanqueia a sequência de soja selecionada compreende um gene conhecido no genoma de uma planta dicotiledônea, tal como uma planta de soja.
[00161] De acordo com uma modalidade, os loci genômicos de soja não gênico modificados são fornecidos, em que os loci têm pelo menos 1 Kb de comprimento, são não gênicos, não compreendem resíduos de citosina metilada, têm uma frequência de recombinação maior que 0,01574 cM/Mb sobre uma região genômica de 1 Mb que engloba os loci genômicos de soja e uma sequência de 1 Kb dos loci genômi-cos de soja compartilha menos que 40% de identidade de sequência com qualquer outra sequência de 1 Kb contida no genoma de dicotile-dônea, em que os loci genômicos de soja não gênicos são modificados pela inserção de um DNA de interesse nos loci genômicos de soja não gênicos.
[00162] De acordo com uma modalidade, é fornecido um método para identificar os loci genômicos ótimos de dicotiledônea não gênicos, incluindo, por exemplo, os loci genômicos de soja. Em algumas moda-lidades, o método primeiramente compreende submeter o genoma de dicotiledônea à triagem para criar um primeiro estoque de sequências de soja selecionadas que têm um comprimento mínimo de 1 Kb e são hipometiladas, opcionalmente, em que a sequência genômica tem menos que 1% de metilação, opcionalmente, em que a sequência genômica é desprovida de quaisquer resíduos de citosina metilada. Tal primeiro estoque de sequências de soja selecionadas pode ser adicionalmente submetido à triagem para eliminar os loci que não satisfazem as exigências para os loci genômicos ótimos de soja não. As sequências genômicas de dicotiledôneas, tais como as obtidas a partir da soja, que codificam transcrições de dicotiledônea, compartilham mais de 40% ou mais de identidade de sequência com uma outra sequência de comprimento similar, não exibem evidência de recombinação e não têm um quadro de leitura aberta conhecido a 40 Kb da sequência de soja selecionada, são eliminadas do primeiro estoque de sequências, deixando um segundo estoque de sequências que se qualificam com loci ótimos de soja não gênica. Em uma modalidade, quaisquer sequências de soja selecionadas que não têm um gene de dicotiledônea conhecido {isto é, um gene de soja) ou uma sequência que compreende uma região de 2 Kb a montante e/ou a 1 Kb a jusante de um gene de dicotiledônea conhecido, a 40 Kb de uma extremidade da dita se- quência não gênica são eliminadas do primeiro estoque de sequências. Em uma modalidade, quaisquer sequências de soja selecionadas que não contêm um gene conhecido que expressa uma proteína a 40 Kb da sequência de soja selecionada são eliminadas. Em uma modalidade, quaisquer sequências de soja selecionadas que não têm uma frequência de recombinação maior que 0,01574 cM/Mb são eliminadas.
[00163] Com o uso de tais critérios de seleção, as requerentes identificaram loci genômicos ótimos seletos de dicotiledônea, tal como uma soja, que servem como loci genômicos ótimos de soja não, cujas sequências estão reveladas como: SEQ ID NO: 1-SEQ ID NO: 7.018. A presente revelação engloba, também, variantes naturais ou derivados modificados dos loci genômicos ótimos de soja não identificados, em que os loci variantes ou derivados compreendem uma sequência que difere de qualquer sequência de SEQ ID NO: 1-SEQ ID NO: 7.018 por 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 nucleotídeos. Em uma modalidade, os loci genômicos ótimos de soja não para o uso de acordo com a presente revelação compreende as sequências selecionadas dentre SEQ ID NO: 1-SEQ ID NO: 7.018 ou as sequências que compartilham 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com uma sequência selecionada dentre SEQ ID NO: 1 a SEQ ID NO: 7.018.
[00164] Em uma outra modalidade, as plantas dicotiledôneas para o uso de acordo com a presente revelação compreendem qualquer planta selecionada dentre o grupo que consiste em: uma planta de soja, uma planta de canola, uma planta de colza, uma planta Brassica, uma planta de algodão e uma planta de girassol. Os exemplos de plantas dicotiledôneas que podem ser usadas incluem, sem limitações: canola, algodão, batata, quinoa, amaranto, trigo sarraceno, cártamo, soja, beterraba sacarina, girassol, canola, colza, tabaco, Arabidopsis, Brassi- ca, e algodão.
[00165] Em uma outra modalidade, os loci genômicos ótimos de soja não para o uso de acordo com a presente revelação compreendem as sequências selecionadas das plantas de soja. Em uma modalidade adicional, os loci genômicos ótimos de soja não para o uso de acordo com a presente revelação compreendem as sequências selecionadas dos isogênicos de Glycine max. Consequentemente, um iso-gênico de Glycine max inclui variedades agronomicamente de elite do mesmo. Em uma modalidade subsequente, os loci genômicos ótimos de soja não para o uso de acordo com a presente revelação compreende as sequências selecionadas a partir de linhagens de soja trans-formáveis. Em uma modalidade, as linhagens de soja transformáveis representativas incluem; Maverick, Williams82, Merrill JackPeking, Su-zuyutaka, Fayette, Enrei, Mikawashima, WaseMidori, Jack, Leculus, Morocco, Serena, Maple prest, Thorne, Bert, Jungery, A3237, Williams, Wiüiams79, AC Colibri, Hefeng 25, Dongnong 42, Hienong 37, Jilin 39, Jiyu 58, A3237, Kentucky Wonder, Minidoka e derivados dos mesmos. Ficará evidente para um elemento versado na técnica que, como um resultado de divergência filogenética, vários tipos de linhagens de soja não contêm sequências de DNA genômico idênticas e que polimorfismos ou variação alélica podem estar presentes nas sequências genômicas. Em uma modalidade, a presente revelação engloba tal polimorfismo ou variações alélicas dos loci genômicos ótimos de soja não identificados, em que os polimorfismos ou variação alélica compreendem uma sequência que é diferente de qualquer sequência com SEQ ID NO: 1 a SEQ ID NO: 7 018 por 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 nucleotídeos. Em uma modalidade adicional, a presente revelação engloba tais polimorfismos ou variações alélicas dos loci genômicos ótimos de soja não identificados em que as sequências que compreendem os polimorfismos ou variação alélica compartilham 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com qualquer sequência de SEQ ID NO: 1 a SEQ ID NO: 7.018.
[00166] Os loci genômicos ótimos identificados que compreendem 7.018 sequências individuais podem ser categorizados em vários subgrupos através de análise adicional com o uso de um método de análise muftivariada. A aplicação de quaisquer programas estatísticos de análise multivariada é usada para revelar a estrutura latente (dimensões) de um conjunto de variáveis. Diversos tipos diferentes de algoritmos multivariados podem ser usados, por exemplo, o conjunto de dados pode ser analisado com o uso de análise de regressão múltipla, análise de regressão de logística, análise de discriminação, análise de variância multivariada (MANOVA), análise de fator (incluindo tanto análise de fator comum quanto análise de componente principal), análise de aglomeração, escalonamento multidímensíonal, análise de correspondência, análise conjunta, análise canônica, correlação canônica e modelagem de equação estrutural.
[00167] De acordo com uma modalidade, os loci genômicos ótimos de soja não são adicionalmente analisados com o uso de análise de dados multivariada, tal como a Análise de Componente Principal (Principal Component Analysis (PCA)). Apenas uma breve descrição será oferecida neste documento, mais informações podem ser obtidas em H. Martens, T. Naes, Multivaríate Calibration, Wiley, N.Y., 1989. A PCA avalia a dimensionalidade subjacente (variáveis latentes) dos dados e oferece uma visão geral dos padrões dominantes e tendências principais nos dados. Em uma modalidade, os loci genômicos ótimos de soja não podem ser classificados em aglomerados através de um método estatístico de análise de componente principal (PCA). A PCA é um procedimento matemático que usa uma transformação ortogonal para converter um conjunto de observações de variáveis possivelmente cor- relacionadas em um conjunto de valores de variáveis linearmente não correlacionadas chamadas de componentes principais. A quantidade de componentes principais é menor ou igual à quantidade de variáveis originais. Tal transformação é definida de tal modo que o primeiro componente principal tenha a maior variação possível (ou seja, conste como a maior variabilidade possível nos dados) e cada componente subsequente, por sua vez, tem a maior variância possível sob a ressalva de que a mesma seja ortogonal aos (isto é, não correlacionada aos) componentes anteriores. Os componentes principais são, necessariamente, independentes se o conjunto de dados for. distribuído normalmente de maneira conjunta. A PCA é sensível ao escalonamento relativo das variáveis originais. Os exemplos do uso da PCA para a-glomerar um conjunto de entidades com base nos recursos das entidades incluem; Ciampitti, I. et al., (2012) Crop Science, 52 a 56; 2.728 a 2.742, Chemometrics: A Practical Guide, Kenneth R. Beebe, Randy J. Pell e Mary Beth Seasholtz, Wiley-lnterscience, 1a edição, 1998, Patentes nQ U.S. 8.385.662 e Patente Européia ns 2.340.975.
[00168] De acordo com uma modalidade, uma análise de componente principal (PCA) foi conduzida nos 7.018 loci genômicos ótimos de soja com o uso dos seguintes 10 recursos para cada loci genômicos ótimos de soja identificados: 1. O comprimento da região hipometilada ao redor dos loci genômicos ótimos de soia (OGL) [00169] a. Os perfis de metilação de DNA de tecidos de raiz e muda isolados de uma planta dicotiledônea, por exemplo, Williams82 de cultivar de Glycine Max, foram construídos com o uso de uma abordagem de sequenciamento de genoma inteiro de alta produtividade. O DNA extraído foi submetido ao tratamento de bissulfeto que converte citosi-nas não metiladas para uracilas, porém, não afeta as citosinas metila-das e, então, sequenciado com o uso de tecnologia lllumina HiSeq (Krueger, F. et al. DNA methylome analysis using short bisulfite se-quencing data. Nature Methods 9, 145 a 151 (2012)). As leituras de sequenciamento bruto foram mapeadas para a sequência de referência de dicotiledônea, por exemplo, a sequência de referência de Glyci-ne max, com o uso do software de mapeamento Bismark™ (conforme descrito em Krueger F, Andrews SR (2011) Bismark: a flexible aligner and methylation caller for Bisulfite-Seq applications. (Bioinformatics 27: 1571 a 1572)). O comprimento da região hipometilada ao redor de cada um dos OGLs foi calculado com o uso dos perfis de metilação descritos.
2. A taxa de Recombinação em uma região de 1 MB ao redor do OGL
[00170] a. Para cada OGL, um par de marcadores em ambos os lados do OGL, em uma janela de 1 Mb, foi identificado. As frequências de recombinação entre cada par de marcadores ao longo do cromossomo foram calculadas com base na razão da distância genética entre os marcadores (em centimorgan (cM)) para a distância física genômica entre os marcadores (em Mb).
3. O nível de peculiaridade da sequência de OGL
[00171] a. Para cada OGL, a sequência de nucleotídeos dos OGL foi submetida à varredura em relação ao genoma de uma planta dicotiledônea, por exemplo, o genoma de soja de c.v. Williams82, com o uso de um BLAST com base na pesquisa de homologia. Conforme tais sequências de OGL são identificadas a partir do genoma de uma planta dicotiledônea, por exemplo, o genoma de soja de c.v. Williams82, a primeira similaridade (hit) de BLAST identificada através de tal pesquisa representa a sequência de OGL, em si. A segunda similaridade de BLAST para cada OGL foi identificada e a cobertura de alinhamento da similaridade foi usada como uma medida de peculiaridade da sequência de OGL no interior do genoma de dicotiledônea, por exemplo, o genoma de soja. 4. A distância do OGL para o gene mais próximo em sua vizinhança [00172] a. As informações de anotação de gene e o local de genes conhecidos no genoma de dicotiledônea, por exemplo, o genoma de soja de c.v. Williams82, foram extraídos de um banco de dados de genoma de dicotiledônea conhecido, por exemplo, Soybean Genome Da-tabase (Banco de Dados de Genoma de soja (www.soybase.org)). Para cada OGL, o gene anotado mais próximo em sua vizinhança a montante ou a jusante foi identificado e a distância entre a sequência de OGL e o gene foi medida (em bp).
5. GC% na vizinhança de OGL
[00173] a. Para cada OGL, a sequência de nucleotídeos foi analisada para estimar a quantidade bases de Guanina e Cistosina presentes. Tal conta foi representada com uma porcentagem da sequência comprimento de cada OGL e fornece uma medida para GC%.
6. A Quantidade de genes em uma vizinhança de 40 Kb ao redor dos OGL
[00174] a. As informações de anotação de gene e o local de genes conhecidos no genoma de dicotiledônea, por exemplo, o genoma de Williams82 de soja c.v., foram extraídas de um banco de dados genô-mico de dicotiledônea conhecida, por exemplo, Banco de Dados de Genoma de Soja (Soybean Genome Database) (www.sovbase.orq). Para cada OGL, uma janela de 40 Kb ao redor dos OGL foi definida e a quantidade de genes anotados com os locais que sobrepõem tal janela foi contada. 7. A expressão de gene média em uma vizinhança de 40 Kb ao redor dos OGL.
[00175] A expressão de nível de transcrição de genes de dicotiledônea, por exemplo, genes de soja, foi medida através da análise de dados de perfil de transcriptoma gerados a partir dos tecidos de planta dicotiledônea, por exemplo, soja c.v. Tecidos de raiz e broto de Willi- ams82, com o uso de tecnologia de RNAseq. Para cada OGL, os genes anotados no interior do genoma de dicotiledônea, genoma de Wil-Iiams82 soja c.v., que estavam presentes em uma vizinhança de 40 Kb ao redor de OGL foram identificados. Os níveis de expressão para cada um dos genes na janela foram extraídos dos perfis de transcriptoma e um nível de expressão de gene média foi calculado.
8. Nível de Ocupação de nucleossomo ao redor dos OGL
[00176] a. Discernir o nível de ocupação de nucleossomo para uma sequência de nucleotídeos específica fornece as informações a respeito das funções cromossômicas e o contexto genômico da sequência. O pacote estatístico NuPoP™ fornece uma ferramenta de fácil utilização para prever a ocupação de nucleossomo e o mapa de posicionamento de nucleossomo mais provável para as sequências genômicas de qualquer tamanho (Xi, L., Fondufe-Mittendor, Y., Xia, L., Flatow, J., Widom, J. e Wang, J.-P., Predicting nucleosome positioning using a duration Hidden Markov Model, BMC Bioinformatics, 2010, doi: 10.1186/1471-2105-11-346). Para cada OGL, a sequência de nucleotídeos foi enviada para o software NuPoP™ e uma pontuação de ocupação de nucleossomo foi calculada. 9. Local relativo no interior do cromossomo (proximidade em relação ao centrõmero) [00177] a. As informações sobre a posição do centrõmero em cada um dos cromossomos de dicotiledônea, por exemplo, cromossomos de soja e os comprimentos dos braços de cromossomo foram extraídos de um banco de dados genômico de dicotiledônea, por exemplo, Banco de Dados de Genoma de Soja (Soybean Genome Database) (www.sovbase.org)· Para cada OGL, a distância genômica da sequência de OGL para o centrõmero do cromossomo em que o mesmo está localizado é medida (em bp). O local relativo de OGL no interior do cromossomo é representado como a razão de sua distância genômica para o centrômero em relação ao comprimento do braço cromossômi-co específico sobre o quaf o mesmo está repousado.
10. Quantidade de OGLs em uma região de 1 Mb ao redor dos QGL
[00178] a. Para cada OGL, uma janela genômica de 1 Mb ao redor do local de OGL está definido e a quantidade de OGLs, no conjunto de dados de OGL de 1 Kb de dicotiledônea, cujos locais genômicos sobrepõem tal janela é pontuada.
[00179] Os resultados ou valores para a pontuação dos recursos e atributos de cada um dos loci genômicos ótimos de soja não gênica são adicionalmente descritos na Tabela 3 do Exemplo 2. O conjunto de dados resultantes foi usado no método estatístico de PCA para a-glomerar os 7.018 locí genômicos ótimos de soja não identificados nos aglomerados. Durante o processo de aglomeração, após estimar os componentes do princípio "p" dos loci genômicos ótimos, a atribuição dos loci genômicos ótimos a um dos 32 aglomerados ocorreu no espaço Euclidiano dimensional "p". Cada um dos eixos geométricos de Mp" foi dividido em intervalos de "k". Os loci genômicos ótimos atribuídos ao mesmo intervalo foram agrupados para formar os aglomerados. Com o uso de tal análise, cada eixo geométrico de PCA foi dividido em dois intervalos, que foram escolhidos com base em informações anteriores a respeito da quantidade de aglomerados exigidos para a validação experimental. Todas as análises e a visualização dos aglomerados resultantes foram executadas com o software Molecular Opera-ting Environment™ (MOE) da Chemical Computing Group Inc, (Montreal, Quebec, Canadá). A abordagem de PCA foi usada para aglomerar o conjunto de 7.018 loci genômicos ótimos de soja em 32 aglomerados distintos com base em seus valores de recurso descrito acima.
[00180] Durante o processo de PCA, cinco componentes principais (PC) foram gerados, sendo que os três primeiros PCs continham cerca de 90% da variação total no conjunto de dados (Tabela 4). Tais três PCs foram usados para representar graficamente os 32 aglomerados em uma plotagem tridimensional (consulte a Figura 1). Após a conclusão do processo de aglomeração, os loci genômicos ótimos representativos foram escolhidos de cada aglomerado. Isso foi realizado escolhendo-se o locus genômico ótimo, no interior de cada aglomerado, que estava mais próximo ao centroide de tal aglomerado através de métodos computacionais (Tabela 4). Os locais cromossômicos dos 32 loci genômicos ótimos representativos são distribuídos uniformemente dentre os cromossomos de soja conforme mostrado na Figura 2.
[00181] Em uma modalidade, uma sequência de loci genômicos ó-timos de soja não gênica purificados ou isolados é fornecida sendo selecionada dentre qualquer aglomerado descrito na Tabela 6 do E-xemplo 2. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 1. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 2. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do a-glomerado 3. Em uma modalidade, a sequência de loci genômicos ó-timos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 4. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 5. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 6. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 7. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 8. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 9. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 10. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 11. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 12. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 13. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do a-glomerado 14. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 15. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 16. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 17. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 18. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 19. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 20. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 21. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do a-glomerado 22. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 23. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 24. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 25. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 26. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 27. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 28. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 29. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do a-glomerado 30. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 31. Em uma modalidade, a sequência de loci genômicos ótimos de soja não gênica purificados ou isolados é uma sequência genômica selecionada do aglomerado 32.
[00182] De acordo com uma modalidade, os loci genômicos ótimos de soja não gênica modificados são fornecidos, em que os loci genô- micos ótimos de soja não gênica foram modificados e compreendem uma ou mais substituições, deleções ou inserções de nucleotídeo. Em uma modalidade os loci genômicos ótimos de soja não gênica são modificados através da inserção de um DNA de interesse opcionalmente acompanhado por duplicações, deleções ou inversões de nu-cleotídeos adicionais da sequência de loci genômicos.
[00183] Em uma modalidade os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada de qualquer aglomerado descrito na Tabela 6 do Exemplo 2. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do a-glomerado 2. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 3. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 4. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 5. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 6. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 7. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do a-glomerado 8. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 9. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência ge- nômica selecionada do aglomerado 10. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 11. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 12. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 13. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do a-glomerado 14. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 15. Em uma modalidade, o loci genômicos ó-timos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 16. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 17. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 18. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 19. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do a-glomerado 20. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 21. Em uma modalidade, o loci genômicos ó-timos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 22. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 23. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modifica- dos são uma sequência genômica selecionada do aglomerado 24. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 25. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do a-glomerado 26. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 27. Em uma modalidade, o loci genômicos ó-timos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 28. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 29. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 30. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 31. Em uma modalidade, o loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do a-glomerado 32.
[00184] Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 ou 31. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 ou 30. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28 ou 29. Em uma modalidade adicional, os foci genô-micos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27 ou 28. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26 ou 27. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3,4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 ou 26. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 ou 25. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16. 17, 18, 19, 20, 21, 22, 23 ou 24. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22 ou 23. Em uma outra modalidade, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 ou 22. Em uma outra modalidade, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 ou 21. Em uma outra modalidade, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do a- glomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 ou 20. Em uma modafidade adicionai, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18 ou 19. Em uma modalidade adicional, os loci genômicos ó-timos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 ou 18. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 ou 17. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 ou 16. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 ou 15. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 ou 14. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 ou 13. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 ou 12. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1,2, 3, 4, 5, 6, 7, 8, 9, 10 ou 11. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 ou 10. Em uma modalidade adicional, os loci genô-micos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8 ou 9. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7 ou 8. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6 ou 7. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5 ou 6. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4 ou 5. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3 ou 4. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2 ou 3. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1 ou 2.
[00185] Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado I, 2, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 6, 7, 8, 9, 10, II, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado I, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, II, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gêni-ca a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32, Em uma modalidade adicional, os Joci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7,8,9, 10, 11, 12, 13, 15, 16, 17, 18, 19,20,21,22,23,24,25,26,27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do a-glomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ó-timos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do a-glomerado 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4. 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ó-timos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do a-glomerado 1,2, 3,4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ó-timos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 ou 32.
[00186] Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gêmea a serem modificados são uma sequência genômica selecionada do aglomerado 1,4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32 Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24,25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do a-glomerado 1,2, 3, 4, 5, 6, 7, 8, 9, 12, 13, 14, 15, 16, 17, 18, 19,20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genô-micos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do a-glomerado 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 3U, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do a-glomerado 1,2, 3,4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1,2,3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genô-micos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do a-glomerado 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do a-glomerado 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genô-micos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do a-glomerado 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29 ou 32.
[00187] Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do a-glomerado 1, 2, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1t 2, 3, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3,4, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do a-glomerado 1, 2, 3, 4, 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1,2, 3, 4, 5, 6, 7, 8, 9, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci ge-nômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma moda- lidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1,2,3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20,21,22, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci ge-nômícos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3,4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28 ou 32.
[00188] Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do a-glomerado 1,2, 3, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20. 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os ioci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os Ioci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os Ioci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os Ioci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do a-glomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicionai, os Ioci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os Ioci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os Ioci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 30, 31 ou 32. Em uma modalidade adicional, os Ioci genômicos ó-timos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26 ou 27. Em uma modalidade adicional, os Ioci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do a-glomerado 1, 2, 3, 9, 10, 11, 12, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1,2, 3, 4, 5, 6, 7, 8, 9, 15, 16, 17, 18, 25, 26, 27, 28, 29, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 21, 22, 23, 24, 30, 31 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do a-glomerado 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30 ou 32. Em uma modalidade adicional, os loci genômicos ótimos de soja não gênica a serem modificados são uma sequência genômica selecionada do aglomerado 1,3, 5, 7, 9, 11, 13, 15, 17, 19, 21,23, 25, 27, 29 ou 31.
[00189] Em uma modalidade, os loci genômicos de soja não gêni-cos ótimos são selecionados a partir das sequências genômicas de soy_ogl_2474 (SEQ ID NO: 1), soy_ogl_J68 (SEQ ID NO: 506), soy_ogl_2063 (SEQ ID NO: 2063), soy_ogM906 (SEQ ID NO: 1029), soy_ogM112 (SEQ ID NO: 1112), soy_ogi_3574 (SEQ ID NO: 1452), soy ogl_2581 (SEQ ID NO: 1662), soy_ogl_3481 (SEQ ID NO: 1869), soy_ogl_1016 (SEQ ID NO: 2071), soy^ogl_937 (SEQ ID NO: 2481), soy_ogl_6684 (SEQ ID NO: 2614), soy__ogl_6801 (SEQ ID NO: 2874), soy_ogl_6636 (SEQ ID NO: 2970), soy_ogl_4665 (SEQ ID NO: 3508), soy_ogl_3399 (SEQ ID NO: 3676), soy_ogl_4222 (SEQ ID NO: 3993), soy_ogL2543 (SEQ ID NO: 4050), soy_ogl_275 (SEQ ID NO: 4106), soy_ogl_598 (SEQ ID NO: 4496), soy_ogl_1894 (SEQ ID NO: 4622), soy_ogl 5454 (SEQ ID NO: 4875), soy_og!_6838 (SEQ ID NO: 4888), soy_ogl_4779 (SEQ ID NO: 5063), soy_ogi_3333 (SEQ ID NO; 5122), soy_ogl_2546 (SEQ ID NO: 5520), soy_ogl_796 (SEQ ID NO: 5687), soy_ogl_873 (SEQ ID NO: 6087), soy_ogl_5475 (SEQ ID NO: 6321), soy_ogl_2115 (SEQ ID NO: 6520), soy_ogl_2518 (SEQ ID NO: 6574), soy_ogl_5551 (SEQ ID NO: 6775), e soy_ogl_4563 (SEQ ID NO: 6859).
[00190] Em uma modalidade, os loci genômicos de soja não gêni- cos ótimos são selecionados a partir das sequências genômicas de soy_ogl_308 (SEQ ID NO: 43), soy_ogl_307 (SEQ ID NO: 566), soy_ogl_2063 (SEQ ID NO: 748), soy_ogl_1906 (SEQ ID NO: 1029), soy_ogl_262 (SEQ ID NO: 1376), soy_ogl_5227 (SEQ ID NO: 1461), soy_ogl_4074 (SEQ ID NO: 1867), soy_ogl_3481 (SEQ ID NO: 1869), soy_ogl_1016 (SEQ ID NO: 2071), soy_ogl_937 (SEQ ID NO: 2481), soy_ogl_5109 (SEQ ID NO: 2639), soy_ogl_6801 (SEQ ID NO: 2874), soy_ogl_6636 (SEQ ID NO: 2970), soy_ogl_4665 (SEQ ID NO: 3508), soy_ogl_6189 (SEQ ID NO: 3682), soy_ogl_4222 (SEQ ID NO: 3993), soy_ogl_2543 (SEQ ID NO: 4050), soy_ogl_310 (SEQ ID NO: 4326), soy_ogl_2353 (SEQ ID NO: 4593), soy_ogl_1894 (SEQ ID NO: 4622), soy_ogl_3669 (SEQ ID NO: 4879), soy_ogl_3218 (SEQ ID NO: 4932), soy_ogl_5689 (SEQ ID NO: 5102), soy_ogl_3333 (SEQ ID NO: 5122), soy_ogl_2546 (SEQ ID NO: 5520), soy_ogl_1208 (SEQ ID NO: 5698), soy_ogl_873 (SEQ ID NO: 6087), soy_ogl_5957 (SEQ ID NO: 6515), soy_og!_4846 (SEQ ID NO: 6571), soy_ogl_3818 (SEQ ID NO: 6586), soy_ogl_5551 (SEQ ID NO: 6775), soy_ogl_7 (SEQ ID NO: 6935), soy_OGL_684 (SEQ ID NO: 47), soy_OGL_682 (SEQ ID NO: 2101), soy_OGL_685 (SEQ ID NO: 48), soy_OGL_1423 (SEQ ID NO: 639), soy_OGL_1434 (SEQ ID NO: 137), soy_OGL_4625 (SEQ ID NO: 76), e soy_OGL_6362 (SEQ ID NO: 440).
[00191] Em uma modalidade, os loci genômicos de soja não gêni-cos ótimos são direcionados com um DNA de interesse, em que o DNA de interesse se integra dentro ou proximal aos sítios-alvo de nu- clease dedos de zinco. De acordo com uma modalidade, os sitios-alvo dedos de zinco exemplificativos de loci genômícos selecionados de milho ótimos são proporcionados na Tabela 8. De acordo com uma modalidade, a integração de um DNA de interesse ocorre dentro ou proximaf aos sítios-alvo exemplificativos de: SEQ ID NO: 7363 e SEQ ID NO: 7364, SEQ ID NO: 7365 e SEQ ID NO: 7366, SEQ ID NO: 7367 e SEQ ID NO: 7368, SEQ ID NO: 7369 e SEQ ID NO: 7370, SEQ ID NO: 7371 e SEQ ID NO: 7372, SEQ ID NO: 7373 e SEQ ID NO: 7374, SEQ ID NO: 7375 e SEQ ID NO: 7376, SEQ ID NO: 7377 e SEQ ID NO: 7378, SEQ ID NO: 7379 e SEQ ÍD NO: 7380, SEQ ID NO: 7381 e SEQ ID NO: 7382, SEQ ID NO; 7383 e SEQ ID NO: 7384, SEQ ID NO: 7385 e SEQ ID NO: 7386, SEQ ID NO: 7387 e SEQ ID NO: 7388, SEQ ID NO: 7389 e SEQ ID NO: 7390, SEQ ID NO: 7391 e SEQ ID NO: 7392, SEQ ID NO: 7393 e SEQ ID NO: 7394, SEQ ID NO: 7395 e SEQ ID NO: 7396, SEQ ID NO: 7397 e SEQ ID NO: 7398, SEQ ID NO: 7399 e SEQ ID NO: 7400, SEQ ID NO: 7401 e SEQ ID NO: 7402, SEQ ID NO: 7403 e SEQ ID NO: 7404, SEQ ID NO: 7405 e SEQ ID NO: 7406, SEQ ID NO: 7407 e SEQ ID NO: 7408, SEQ ID NO: 7409 e SEQ ID NO: 7410, SEQ ID NO: 7411 e SEQ ID NO: 7412, SEQ ID NO: 7413 e SEQ ID NO: 7414, SEQ ID NO: 7415 e SEQ ID NO: 7416, SEQ ID NO: 7417 e SEQ ID NO: 7418. SEQ ID NO: 7419 e SEQ ID NO: 7420, SFQ ID NO: 7421 e SEQ ID NO: 7422, SEQ ID NO: 7423 e SEQ ID NO: 7424, SEQ ID NO: 7425 e SEQ ID NO: 7426.
[00192] De acordo com uma modalidade, a nuclease dedos de zinco se liga aos sítios-alvo dedos de zinco e cliva os sítios-alvo de poli-nucíeotídeo genômico de soja exclusivos, em que o DNA de interesse se integra dentro ou proximal aos sítios-alvo de polinucleotídeo genômico de soja. Em uma modalidade, a integração do DNA de interesse dentro dos sitios-alvo dedos de zinco pode resultar em rearranjos. De acordo com uma modalidade, os rearranjos podem compreender dele- ções, inserções, inversões e repetições. Em uma modalidade, a integração do DNA de interesse ocorre proximal aos sítios-alvo dedos de zinco. De acordo com um aspecto da modalidade, a integração do DNA é proximal aos sítios-alvo dedos de zinco e pode se integrar dentro de 2 Kb, 1,75 Kb, 1,5 Kb, 1,25 Kb, 1,0 Kb, 0,75 Kb, 0,5 Kb ou 0,25 Kb aos sítios-alvo dedos de zinco. A inserção dentro de uma região genômica proximal aos sítios-alvo dedos de zinco é conhecida na técnica, consulte a publicação de patente US N9 2010/0257638 A1 (incorporada no presente documento a título de referência em sua totalidade).
[00193] De acordo com uma modalidade, uma sequência não gêmea selecionada compreende as seguintes características: [00194] a) a sequência não gênica não contém mais que 1% de me-tilação de DNA dentro da sequência;
[00195] b) a sequência não gênica tem um valor de localização relativo de razão 0,211 a 0,976 da distância genômica a partir de um cen-trõmero cromossômico de soja;
[00196] c) a sequência não gênica tem uma faixa de teor percentual de guanina/citosina de 25,62 a 43,76 %; e, [00197] d) a sequência não gênica tem cerca de 1 Kb a cerca de 4,4 Kb de comprimento.
H. DERIVADOS RECOMBINANTES DE LQCI GENÓMICOS DE SOJA NÃO GÊNICOS ÓTIMOS IDENTIFICADOS
[00198] De acordo com uma modalidade, após a identificação de loci genômicos de uma planta dicotiledônea, tal como, uma planta de soja, como uma localização altamente desejável para inserir sequências doadoras de polinucleotídeo, um ou mais ácidos nucleicos de interesse podem ser inseridos no locus genômico identificado. Em uma modalidade, o ácido nucleico de interesse compreende sequências de genes exógenos ou outras sequências doadoras de polinucleotídeo desejáveis. Em outra modalidade, após a identificação de loci genômi-cos de uma planta dicotiledônea, tal como, uma planta de soja, como uma localização altamente desejável para inserir as sequências doa-doras de polinucleotídeo, um ou mais ácidos nucleicos de interesse dos loci genômicos de soja não gênicos ótimos podem ser opcionalmente eliminados, excisados ou removidos com a integração subsequente do DNA de interesse ao locus genômico identificado. Em uma modalidade, a inserção de um ácido nucleico de interesse nos loci genômicos de soja não gênicos ótimos compreende a remoção, eliminação ou excisão das sequências de genes exógenos ou outras sequências doadoras de polinucleotídeo desejáveis.
[00199] A presente descrição se refere adicionalmente a métodos e composições para a integração direcionada ao locus genômico de soja selecionado usando ZFNs e o construto doador de polinucleotídeos. Os métodos para inserir um construto doador de polinucleotídeos de interesse nos loci genômicos de soja não gênicos ótimos, exceto onde indicado em contrário, usam técnicas convencionais de biologia molecular, bioquímica, estrutura e análise de cromatina, cultura de células, DNA recombinante e campos relacionados à medida que se encontram dentro da habilidade da técnica. Essas técnicas são totalmente explicadas na literatura. Consulte, por exemplo, Sambrook et al. MOLECULAR CLONING: A LABORATORY MANUAL, Segunda edição, Cold Spring Harbor Laboratory Press, 1989 e Terceira edição, 2001; Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987 e atualizações periódicas; a série METHODS IN ENZYMOLOGY, Academic Press, San Diego; Wolfe, CHROMATIN STRUCTURE e FUNCTION, Terceira edição, Academic Press, San Diego, 1998; METHODS IN ENZYMOLOGY, Vol. 304, ”C-hromatin" (P. M. Wassarman e A. P. Wolffe, eds.), Academic Press, San Diego, 1999; e METHODS IN MOLECULAR BIOLOGY, Vol. 119, "Chromatin Protocols" (P. B. Becker, ed.) Humana Press, Totowa, 1999. Métodos para Inserção de Ácido Nucleico no Genoma da Soja [00200] Qualquer um dos procedimentos bem conhecidos para introduzir sequências doadoras de polinucleotídeo e sequências de nu-clease como um construto de DNA nas células hospedeiras pode ser usado, de acordo com a presente descrição. Os mesmos incluem o uso de métodos de transfecção com fosfato de cálcio, polibreno, fusão de protoplastos, PEG, eletroporação, ultrassônicos (por exemplo, so-noporação), lipossomas, microinjeçâo, DNA nu, vetores plasmídicos, vetores virais, tanto epissomais como integrativos, e qualquer outro método bem conhecido para introduzir DNA genômico clonado, cDNA, DNA sintético ou outro material genético estranho em uma célula hospedeira (consulte, por exemplo, Sambrook et al.} supra). É necessário apenas que o procedimento de inserção de ácido nucleico particular usado seja com capacidade para introduzir de maneira bem sucedida pelo menos um gene na célula hospedeira com capacidade para expressar a proteína de escolha.
[00201] Conforme observado acima, os construtos de DNA podem ser introduzidos no genoma de uma espécie de planta desejada através de uma variedade de técnicas convencionais. Para análises de tais técnicas consulte, por exemplo, Weissbach & Weissbach Methods for Plant Molecular Biology (1988, Academic Press, N.Y.) Section VIII, páginas 421 a 463; e Grierson & Corey, Plant Molecular Biology (1988, 2a Ed.), Blackie, Londres, Cap. 7 a 9. Um construto de DNA pode ser diretamente introduzido no DNA genômico da célula de planta usando técnicas, tais como, eletroporação e microinjeçâo de protoplastos de célula de planta, através da agitação com fibras de carboneto de silício (Consulte, por exemplo, as patentes n— U.S. 5.302.523 e 5.464.765), ou os construtos de DNA podem ser diretamente introduzidos no teci- do de planta usando métodos biolísticos, tais como, bombardeamento de partículas de DNA (consulte, por exemplo, Klein et al. (1987) Nature 327:70 a 73). De maneira alternativa, o construto de DNA pode ser introduzido na célula de planta através da transformação de nanopartí-culas (consulte, por exemplo, publicação de patente ns US 20090104700, que está incorporada ao presente documento a título de referência em sua totalidade). De maneira alternativa, os construtos de DNA podem ser combinados com regiões de borda/flanqueamento de T-DNA adequadas e introduzidas em um vetor hospedeiro Agrobacte-num tumefaciens convencional. As técnicas de transformação mediadas por Agrobacterium tumefaciens, incluindo o desarmamento e uso de vetores binários, são bem descritas na literatura científica. Consulte, por exemplo, Horsch et al. (1984) Science 233:496 a 498, e Fraley et al. (1983) Proc. Natl Acad. Sei. USA 80:4.803.
[00202] Além disso, a transferência de genes pode ser obtida usando bactérias ou vírus não Agrobacterium, tais como, Rhizobium sp. NGR234, Sinorhizoboium meliloti, Mesorhizobium loti, vírus X da batata, vírus do mosaico da couve-flor e vírus do mosaico das nervuras da mandioca e/ou vírus do mosaico do tabaco, Consulte, por exemplo, Chung et al. (2006) Trends Plant Sei. 11(1):1 a 4. As funções de virulência do hospedeiro Agrobacterium tumefaciens irão direcionar a inserção de um filamento T contendo o construto e o marcador adjacente no DNA da célula de planta quando a célula for infectada pela bactéria usando o vetor T DNA binário (Bevan (1984) Nuc. Acid Res. 12:8.711 a 8.721) ou o procedimento de cocultivo (Horsch et al. (1985) Science 227:1.229 a 1.231). Geralmente, o sistema de transformação de Agrobacterium é usado para modificar as plantas dicotiledôneas (Bevan et al. (1982) Ann. Rev. Genet. 16:357 a 384; Rogers et al. (1986) Methods Enzymol. 118:627 a 641). O sistema de transformação de Agrobacterium também pode ser usado para transformar, assim como, transferir DNA para as plantas monocotiledôneas e células de plantas. Consulte a patente n° U.S. 5.591 616; Hernalsteen et al. (1984) EMBO J. 3:3039 a 3041; Hooykass-Van Slogteren et al. (1984) Nature 311:763 a 764; Grimsley et al. (1987) Nature 325:1677 a 179; Boulton et al. (1989) Plant Mol. Biol. 12:31 a 40; e Gould et al. (1991) Plant Physiol. 95:426 a 434, [00203] Os métodos de transferência e transformação de genes alternativos incluem, porém, não se limitam a, transformação de proto-plastos através da absorção mediada por cálcio, polietileno glicol (PEG) ou eletroporação de DNA nu (consulte Paszkowski et al. (1984) EMBO J. 3:2.717 a 2.722, Potrykus et al. (1985) Molec. Gen. Genet. 199:169 a 177; Fromm et al. (1985) Proc. Nat. Acad. Sei. USA 82:5.824 a 5.828; e Shimamoto (1989) Nature 338:274 a 276) e eletroporação de tecidos de plantas (D'Haífuin et al. (1992) Plant Cells 4:1.495 a 1.505). Os métodos adicionais para a transformação de célula de planta incluem microtnjeção, absorção de DNA mediada por car-boneto de silício (Kaeppler et al. (1990) Plant Cell Repórter 9:415 a 418), e bombardeamento de microprojéteis (consulte Klein et al. (1988) Proc. Nat. Acad, Sei. USA 85:4.305 a 4.309; e Gordon-Kamm et al. (1990) Plant Cell 2:603 a 618).
[00204] Em uma modalidade, um ácido nucleico de interesse introduzido em uma célula hospedeira para a inserção direcionada no ge-noma compreende sequências de flanqueamento homólogas em uma ou ambas as extremidades do ácido nucleico direcionado de interesse. Em tal modalidade, as sequências de flanqueamento homólogas contêm níveis suficientes de identidade de sequência em uma sequência genômica de dicotiledônea, tal como, uma sequência genômica de soja para suportar a recombinação homóloga entre a mesma e a sequência genômica a qual se refere à homologia. Aproximadamente 25, 50, 100, 200, 500, 750, 1.000, 1500, ou 2.000 nucleotídeos ou mais da identidade de sequência que varia de 70% a 100% entre um doador e uma sequência genômica (ou quai valor inteiro entre 10 e 200 nucleo-tídeos, ou mais) irão suportar a recombinação homóloga entre os mesmos.
[00205] Em outra modalidade, o ácido nucleico direcionado de interesse pé desprovido de sequências de flanqueamento homólogas, e o ácido nucleico direcionado de interesse compartilha níveis baixos a muito baixos de identidade de sequência com uma sequência genômica [00206] Em outras modalidades da recombinação e/ou substituição e/ou alteração direcionada de uma sequência em uma região de interesse na cromatina celular, uma sequência cromossômica é alterada pela recombinação homóloga com uma sequência nucleotídica "doa-dora" exógena. Tal recombinação homóloga é estimulada pela presença de uma quebra de filamento duplo na cromatina celular, se sequências homólogas à região da quebra estiverem presentes. As quebras de filamento duplo na cromatina celular também podem estimular os mecanismos celulares à união terminal não homóloga. Em qualquer um dos métodos descritos no presente documento, a primeira sequência nucleotídica (a "sequência doadora") pode conter sequências que são homólogas, porém, não idênticas às sequências genômicas na região de interesse estimulando, desse modo, a recombinação homóloga a inserir uma sequência não idêntica na região de interesse. Desse modo, em determinadas modalidades, as porções da sequência doadora que são homólogas às sequências na região de interesse e-xibem entre cerca de 80, 85, 90, 95, 97,5 a 99% (ou qualquer número inteiro entre os mesmos) da identidade de sequência para a sequência genômica que é substituída. Em outras modalidades, a homologia entre o doador e a sequência genômica é superior a 99%, por exemplo, se apenas um 1 nucleotídeo diferir entre as sequências doadoras e genômicas de mais de 100 pares de bases contíguas.
[00207] Em determinados casos, uma porção não homóloga da sequência doadora pode conter sequências não presentes na região de interesse, de modo que novas sequências sejam introduzidas na região de interesse. Nesses casos, a sequência não homóloga geralmente é flanqueada pelas sequências de 50 a 2.000 pares de bases (ou qualquer valor inteiro entre os mesmos) ou qualquer número de pares de bases maior que 2.000, que sejam homólogos ou idênticos às sequências na região de interesse. Em outras modalidades, a sequência doadora é não homóloga à região de interesse, e é inserida no geno-ma por mecanismos de recombinação não homóloga.
[00208] De acordo com uma modalidade, a nuclease dedos de zinco (ZFN) é usada para introduzir uma quebra de filamento duplo em um locus genômico direcionado para facilitar a inserção de um ácido nucleico de interesse. A seleção de um sítio-alvo dentro do locus genômico selecionado para ligação através de um domínio dedos de zinco pode ser realizada, por exemplo, de acordo com os métodos revelados na patente ne U.S. 6.453.242, a descrição da mesma é incorporada no presente documento, que também revela os métodos para projetar as proteínas dedos de zinco (ZFPs) para se ligarem a uma sequência selecionada. Será evidente para aqueles versados na técnica que a inspeção visual simples de uma sequência nucleotídica também pode ser usada para a seleção de um sítio-alvo. Consequentemente, quaisquer meios para a seleção de sítio-alvo podem ser usados nos métodos descritos no presente documento.
[00209] Para domínios de ligação ao DNA ZFP, os sítios-alvo geralmente são compostos por uma pluralidade de subsítios-alvo adjacentes. A subsítio-alvo se refere à sequência, geralmente, de um tri-pleto de nucleotídeos ou quadrupleto de nucleotídeos que pode se sobrepor a um nucleotídeo com um quadrupleto adjacente que é ligado por um dedo de zinco individual. Consulte, por exemplo, o documento n- WO 02/077227, a descrição do mesmo é incorporada no presente documento. Um sítio-alvo geralmente tem um comprimento de pelo menos 9 nucleotídeos e, consequentemente, é ligado por um domínio de ligação dedos de zinco que compreendem pelo menos três dedos de zinco. Entretanto, a ligação, por exemplo, de um domínio de ligação de 4 dedos a um sítio-alvo de 12 nucleotídeos, um domínio de ligação de 5 dedos a um sítio-alvo de 15 nucleotídeos ou um domínio de ligação de 6 dedos a um sítio-alvo de 18 nucleotídeos, também é possível. Conforme será aparente, a ligação de domínios de ligação maiores (por exemplo, 7, 8, 9 dedos e mais) a sítios-alvo mais longos também é coerente com a presente descrição.
[00210] De acordo com uma modalidade, não é necessário que um sítio-alvo seja um múltiplo de três nucleotídeos. Nos casos em que as interações de filamento cruzado ocorrem (consulte, por exemplo, patente n2 U.S. 6.453.242 e n2 WO 02/077227), um ou mais dos dedos de zinco individuais de um domínio de ligação de múltiplos dedos podem se ligar aos subsítios de quadrupleto sobrepostos. Como um resultado, uma proteína de três dedos pode se ligar a uma sequência de 10 nucleotídeos, em que o décimo nucleotídeo faz parte de uma ligação de quadrupleto por um dedo terminal, uma proteína de quatro dedos pode se ligar a uma sequência de 13 nucleotídeos, em que o décimo terceiro nucleotídeo faz parte de uma ligação de quadrupleto por um dedo terminal, etc.
[00211] O comprimento e a natureza de sequências ligantes de a-minoácído entre os dedos de zinco individuais em um domínio de ligação de múltiplos dedos também afetam a ligação a uma sequência-alvo. Por exemplo, a presença de um autodenominado "ligante não canônico", "ligante longo" ou "figante estruturado" entre os dedos de zinco adjacentes em um domínio de ligação de múltiplos dedos pode permitir que esses dedos se liguem aos subsitios que não são imediatamente adjacentes. Os exemplos não limitativos de tais ligantes são descritos, por exemplo, na patente n2 U.S. 6.479.626 e n2 WO 01/53480. Consequentemente, um ou mais subsitios em um sítio-alvo para um domínio de ligação dedos de zinco podem ser separados uns dos outros por 1, 2, 3, 4, 5 ou mais nucleotídeos. Um exemplo não li-mitativo pode ser um domínio de ligação de quatro dedos que se liga a um sítio-alvo de 13 nucleotídeos que compreende, na sequência, dois subsitios de 3 nucleotídeos contíguos, um nucleotídeo intermediário e dois subsitios de tripletos contíguos.
[00212] Embora os polipeptídeos de ligação ao DNA identificados a partir das proteínas que existem na natureza se liguem tipicamente a uma sequência ou motivo de nucleotídeos distinto {por exemplo, uma sequência de reconhecimento consensual), os métodos existem e são conhecidos na técnica para modificar muitos tais polipeptídeos de ligação ao DNA para reconhecer uma sequência ou motivo de nucleotídeos diferente. Os polipeptídeos de ligação ao DNA incluem, por e-xemplo, e sem limitação: domínios de ligação ao DNA dedos de zinco; zíperes de leucina; domínios de ligação ao DNA UPA; GAL4; TAL; Le-xA; um repressor Tet; LacR; e um receptor de hormônio esteroide.
[00213] Em alguns exemplos, um polipeptídeo de ligação ao DNA é um dedo de zinco. Os motivos dedos de zinco individuais podem ser projetados para direcionar e se ligar especificamente a qualquer um de uma grande faixa de sítios de DNA. Os polipeptídeos de dedo de zinco Cys2His2 canônicos (assim como, Cys3His não canônico) se ligam ao DNA tnserindo-se uma α-hélice no sulco maior da dupla hélice de DNA alvo. O reconhecimento do DNA por um dedo de zinco é modular; cada dedo entra em contato principalmente com três pares de bases consecutivos no alvo, e alguns resíduos-chave no polipeptídeo mediam o reconhecimento. Incluindo-se múltiplos domínios de ligação de DNA dedos de zinco em uma endonuclease de direcionamento, a especificidade de ligação ao DNA da endonuclease de direcionamento pode ser adicionalmente aumentada (e, portanto, a especificidade de quaisquer efeitos reguladores do gene conferidos desse modo também pode ser aumentada). Consulte, por exemplo, Urnov et al. (2005) Na-ture 435:646 a 651. Desse modo, um ou mais polipeptídeos de ligação ao DNA dedos de zinco podem ser modificados e utilizados, de modo que uma endonuclease de direcionamento introduzida em uma célula hospedeira interaja com uma sequência de DNA que é peculiar dentro do genoma da célula hospedeira. De preferência, a proteína dedo de zinco não é de ocorrência natural pelo fato de que a mesma é modificada para se ligar a um sítio-alvo de escolha. Consulte, por exemplo, Beerli et al. (2002) Nature Biotechnol, 20:135 a 141; Pabo et af. (2001) Ann. Rev. Biochem. 70:313 a 340; Isalan et al. (2001) Nature Biotech-nol. 19:656 a 660; Segai et al. (2001) Curr. Opin. Biotechnol. 12:632 a 637; Choo et al. (2000) Curr. Opin. Struct. Biol. 10:411 a 416; patentes n- U.S. 6 453.242; 6.534.261; 6.599.692; 6.503.717; 6.689.558; 7.030.215; 6.794.136; 7.067.317; 7.262,054; 7,070.934; 7.361.635; 7.253,273; e publicações de patente n— U.S. 2005/0064474; 2007/0218528; 2005/0267061, todos incorporados no presente documento a título de referência em sua totalidade.
[00214] Um domínio de ligação dedos de zinco modificado pode ter uma nova especificidade de ligação em comparação a uma proteína dedo de zinco de ocorrência natural. Os métodos de engenharia genética incluem, porém, não se limitam a, desenho racional e diversos tipos selecionados. O desenho racional inclui, por exemplo, o uso de bancos de dados que compreendem sequências nucleotídicas de tri-pletos (ou quadrupletos) e sequências de aminoácidos dedos de zinco individuais, em que cada sequência nucieotídica de tripietos ou quadrupletos é associada a uma ou mais sequências de aminoácidos de dedos de zinco que se ligam à particular sequência de tripletos ou quadrupletos. Consulte, por exemplo, as patentes de copropriedade n— U.S. 6.453.242 e 6.534.261, incorporadas a título de referência no presente documento em suas totalidades.
[00215] De maneira alternativa, o domínio de ligação ao DNA pode ser derivado de uma nuclease. Por exemplo, as sequências de reconhecimento de endonucleases e meganucleases de migração, tais como, l-Scel, l-Ceul, Pl-Pspl, Pl-Sce, l-ScelV, l-Csml, l-Panl, l-Scell, I-Ppol, l-Scelll, l-Crel, I-Tevl, I-Tevll e Í-Tevlll são conhecidas. Consulte também a patente n9 U.S. 5.420.032; patente n9 U.S. 6.833.252; Bel-fort et al. (1997) Nucleic Acids Res, 25:3.379 a 3.388; Dujon et al. (1989) Gene 82:115 a 118; Perler et al. (1994) Nucleic Acids Res. 22, 1.125 a 1.127; Jasin (1996) Trends Genet. 12:224 a 228; Gimble et al. (1996) J. Mol. Bíol 263:163 a 180; Argast et al. (1998) J. Mol. Bíol. 280:345 a 353 e o catálogo New England Biolabs. Além disso, a especificidade de ligação ao DNA de endonucleases e meganucleases de migração pode ser modificada para ligar os sítios-alvo não naturais. Consulte, por exemplo, Chevalier et al. (2002) Molec. Cell 10:895 a 905; Epinat et al. (2003) Nucleic Acids Res. 31:2.952 a 2.962; Ashwor-th et al. (2006) Nature 441:656 a 659; Paques et al. (2007) Current Gene Therapy 7:49 a 66; publicação de patente n9 U.S. 20070117128.
[00216] Como outra alternativa, o domínio de ligação ao DNA pode ser derivado de uma proteína zíper de leucina. Os zíperes de leucina são uma classe de proteínas que está envolvida em interações proteí-na-proteína em muitas proteínas reguladoras eucarióticas que são fatores de transcrição importantes associados à expressão genética. O zíper de leucina se refere a um motivo estrutural comum compartilhado nesses fatores transcricionais através de diversos reinos incluindo a-nimais, plantas, leveduras, etc, O zíper de leucina é formado por dois polipeptídeos (homodímero ou heterodímero) que se ligam às sequên- cias de DNA específicas de uma maneira em que os resíduos de leu-cina são uniformemente espaçados através de uma α-hélice, de modo que os resíduos de leucina dos dois polipeptídeos terminem na mesma face da hélice. A especificidade de ligação DNA de zíperes de leucina pode ser utilizada nos domínios de ligação ao DNA revelados no presente documento.
[00217] Em algumas modalidades, o domínio de ligação ao DNA é um domínio modificado a partir de um efetor TAL derivado do patóge-no de planta Xanthomonas (consulte, Miller et al. (2011) Nature Biote-chnology 29(2):143 a 148; Boch et al, (2009) Science, 29 de outubro de 2009 (10.1126/science.117881) e Moscou e Bogdanove, (2009) Science, 29 de outubro de 2009 (10.1126/science.1178817; e publicações de patente n25 U.S. 20110239315, 20110145940 e 20110301073).
[00218] O sistema de nuclease CRISPR (Repetições Palindrômicas Curtas Regularmente Interespaçadas e Aglomeradas)/Cas (CRISPR Associada) é um sistema de nuclease recém-modificado baseado em um sistema bacteriano que pode ser usado para modificar o genoma. O mesmo se baseia, em parte, na resposta imune adaptável de muitas bactérias e Archea. Quando um vírus ou plasmídeo invade uma bactéria, os segmentos do DNA do invasor são convertidos em CRISPR RNAs (crRNA) através da resposta 'imune'. Esse crRNA, então, se associa, através de uma região de complementaridade parcial, a outro tipo de RNA denominado tracrRNA para guiar a nuclease Cas9 até uma região homóloga ao crRNA no DNA alvo denominado "protoespa-çador". Cas9 cliva o DNA para gerar extremidades cegas na DSB em sítios especificados por uma sequência-guia de 20 nucleotídeos contida dentro da transcrição de crRNA. Cas9 requer tanto o crRNA como o tracrRNA para o reconhecimento e divagem de DNA sítio-específica. Esse sistema agora foi modificado, de modo que o crRNA e tracrRNA possam ser combinados em uma molécula (o "RNA único guia"), e a porção equivalente de crRNA do RNA único guia possa ser modificada para guiar a nuclease Cas9 para direcionar qualquer sequência desejada (consulte Jinek et al (2012) Science 337, p. 816 a 821, Jinek et al, (2013), elife 2:e00471, e David Segai, (2013) eLife 2:e00563), Desse modo, o sistema CRISPR/Cas pode ser modificado para criar uma quebra de filamento duplo (DSB) em um alvo desejado em um geno-ma, e o reparo da DSB pode ser influenciado pelo uso de inibidores de reparo para causar um aumento no reparo sujeito a erros, [00219] Em determinadas modalidades, a proteína Cas pode ser um "derivado funcional" de uma proteína Cas de ocorrência natural. Um "derivado funcional" de um polipeptídeo de sequência nativa é um composto que tem uma propriedade biológica qualitativa em comum com um polipeptídeo de sequência nativa. Os "derivados funcionais" incluem, porém, não se limitam a, fragmentos de uma sequência nativa e derivados de um polipeptídeo de sequência nativa e seus fragmentos, desde que os mesmos tenham uma atividade biológica em comum com um polipeptídeo de sequência nativa correspondente. Uma atividade biológica contemplada no presente documento é a capacidade de o derivado funcional hidrolisar um substrato DNA em fragmentos. O termo "derivado" abrange tanto as variantes de sequência de aminoácidos de polipeptídeo como as modificações covalentes, e as fusões dos mesmos. Os derivados adequados de um polipeptídeo Cas ou um fragmento do mesmo incluem, porém, não se limitam a mu· tantes, fusões, modificações covalentes de proteína Cas ou um fragmento da mesma. A proteína Cas que inclui a proteína Cas ou um fragmento da mesma, assim como, derivados de proteína Cas ou um fragmento da mesma pode ser obtenível a partir de uma céfuta ou quimicamente sintetizada ou através de uma combinação desses dois procedimentos. A céluía pode ser uma célula que produz naturalmente a proteína Cas ou uma célula que produz naturalmente a proteína Cas e é geneticamente modificada para produzir a proteína endógena Cas em um nível de expressão mais alto ou para produzir uma proteína Cas a partir de um ácido nucleico exogenamente introduzido, cujo ácido nucleico codifica uma Cas que é igual ou diferente da Cas endógena. Em alguns casos, a célula não produz naturalmente a proteína Cas e é geneticamente modificada para produzir uma proteína Cas. A proteína Cas é implantada em células de mamíferos (e presumidamente dentro de células de plantas) ao coexpressar a nuclease Cas com o RNA guia. Duas formas de RNAs guia podem ser usadas para facilitar a divagem de genoma mediada por Cas, conforme descrito em Le Cong, F„ et al., (2013) Science 339(6121):819 a 823.
[00220] Em outras modalidades, o domínio de ligação ao DNA pode ser associado a um domínio de divagem (nuclease). Por exemplo, as endonucleases de alojamento podem ser modificadas em sua especificidade de ligação ao DNA enquanto mantêm a função da nuclease. Além disso, as proteínas dedos de zinco também podem ser fundidas em um domínio de divagem para formar uma nuclease dedos de zinco (ZFN). A porção de domínio de divagem das proteínas de fusão reveladas no presente documento pode ser obtida a partir de qualquer en-donuclease ou exonuclease. As endonucleases exemplificativas a partir das quais um domínio de divagem pode ser derivado incluem, porém, não se limitam a, endonucleases de restrição e endonucleases de alojamento. Consulte, por exemplo, 2002-2003 Catalogue, New En-gland Biolabs, Beverly, MA; e Belfort et al. (1997) Nucleic Acids Res. 25:3379 a 3388. As enzimas que clivam o DNA são conhecidas (por exemplo, Nuclease S1; nuclease do feijão mungo; DNase I pancreáti-ca; nuclease micrococcal; endonuclease HO de leveduras; consulte, também, Linn et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press, 1993). Os exemplos não limitativos de endonucleases e mega- nucieases de migração que incluem l-Scelt l-Ceul, Pl-Pspl, Pl-Sce, I-ScelV, l-Csmf, l-Panl. i-Scell, l-Ppol, I Scelll, l-Crel, !-Tevl, I-Tevll e I-Tevlll são conhecidos. Consulte, também, a patente ng U.S. 5.420.032; patente n- U.S. 6.833.252; Belfort et al. (1997) Nucleic Acids Res. 25:3.379 a 3.388; Dujon et al. (1989) Gene 82:115 a 118; Perler et al. (1994) Ácidos nucleicos Res. 22, 1.125 a 1.127; Jasin (1996) Trends Genet. 12:224 a 228; Gimble et al. (1996) J. Mol. Biol. 263:163 a 180; Argast et al. (1998) J. Mol. Biol. 280:345 a 353 e o catálogo New En-gland Biolabs. Uma ou mais dessas enzimas (ou fragmentos funcionais das mesmas) podem ser usadas como uma fonte de domínios de divagem e meio-domínios de divagem.
[00221] As endonucieases de restrição (enzimas de restrição) estão presentes em muitas espécies e são capazes de ligação à sequência específica do DNA (em um sítio de reconhecimento), e divagem de DNA no ou proximal ao sítio de ligação. Determinadas enzimas de restrição (por exemplo, Tipo HS) clivam o DNA em sítios removidos do sítio de reconhecimento e têm domínios de ligação e cítvagem separáveis. Por exemplo, a enzima Fokl Tipo IIS catalisa a divagem de filamento duplo de DNA, em 9 nucleotídeos a partir de seu sítio de reconhecimento em um filamento e 13 nucleotídeos a partir de seu sítio de reconhecimento no outro filamento. Consulte, por exemplo, as patentes US n- 5.356.802; 5.436.150 e 5.487.994; assim como, Li et al. (1992) Proc. Natl. Acad. Sei. USA 89:4.275 a 4.279; Li et al. (1993) Proc. Natl. Acad. Sei. USA 90:2764 a 2768; Kim et al. (1994a) Proc. Natl. Acad. Sei. USA 91:883 a 887; Kim et al. (1994b) J. Biol. Chem. 269:31.978 a 31.982. Desse modo, em uma modalidade, as proteínas de fusão compreendem o domínio de divagem (ou meio-domínio de divagem) a partir de pelo menos uma enzima de restrição Tipo IIS e um ou mais domínios de ligação dedos de zinco, que podem ser modificados ou não.
[00222] Uma enzima de restrição Tipo IIS exemplificativa, cujo domínio de divagem é separado do domínio de ligação, é a Fokl. Essa enzima particular é ativa como um dímero. Bitinaite et al. (1998) Proc. Natl. Acad. Sei. USA 95: 10,570 a 10,575. Consequentemente, para os propósitos da presente descrição, a porção da enzima Fokl usada nas proteínas de fusão reveladas é considerada um meio-domínio de divagem. Desse modo, para a divagem de filamento duplo direcionada e/ou substituição direcionada das sequências celular que usam funções dedo de zinco-Fokl, duas proteínas de fusão, cada uma compreendendo um meio-domínio de divagem Fokl, podem ser usadas para reconstituir um domínio de divagem catalíticamente ativo. De maneira alternativa, uma única molécula de polipeptídeo contendo um domínio de ligação dedos de zinco e dois meio-domínios de divagem Fokl também pode ser usada. Os parâmetros para a divagem direcionada e a alteração de sequência direcionada usando as fusões dedo de zinco-Fokl são proporcionados em outra parte dessa descrição.
[00223] Um domínio de divagem ou meio-domínio de divagem pode ser qualquer porção de uma proteína que mantém a atividade de divagem ou que mantém a capacidade de multimerização (por exemplo, dimerização) para formar um domínio de divagem funcional. As enzimas de restrição Tipo IIS exemplificativas são descritas na publicação internacional n2 WO 2007/014275, incorporada a título de referência no presente documento em sua totalidade.
[00224] Para acentuar a especificidade de divagem, os domínios de divagem também podem ser modificados. Em determinadas modalidades, as variantes do meio-domínio de divagem são empregadas, essas variantes minimizam ou evitam a homodimerização do meio-domínios de divagem. Os exemplos não limitativos de tais meio-domínios de divagem modificados são descritos em detalhes no documento n9 WO 2007/014275, incorporado a título de referência em sua totalidade no presente documento. Em determinadas modalidades, o domínio de divagem compreende um meio-domínio de divagem modificado (também referido como mutantes de domínio de dime-rização) que minimiza ou evita a homodimerização. Tais modalidades são conhecidas por aqueles versados na técnica e descritas, por e-xemplo, nas publicações de patente n~ U.S, 20050064474; 20060188987; 20070305346 e 20080131962, as descrições de todas as quais são incorporadas a títuio de referência em sua totalidade no presente documento. Os resíduos de aminoácidos nas posições 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537, e 538 de Fokl são todos alvos para influenciar a dimerização dos meio-domínios de divagem de Fokl.
[00225] Os meio-domínios de divagem modificados adicionais de h Fokl que formam heterodímeros obrigatórios também podem ser usa- dos nas ZFNs descritas no presente documento. Os meio-domínios de divagem modificados exemplificativos de Fok I que formam os heterodímeros obrigatórios incluem um par no qual um primeiro meio-domínio de divagem inclui mutações nos resíduos de aminoácidos nas posições 490 e 538 de Fok I e um segundo meio-domínio de divagem inclui mutações nos resíduos de aminoácidos 486 e 499. Em uma modalidade, uma mutação em 490 substitui Glu (E) por Lys (K); a mutação em 538 substitui Iso (I) por Lys (K); a mutação em 486 substitui Gin (Q) por Glu (E); e a mutação na posição 499 substitui Iso (I) por Lys (K). De maneira específica, os meio-domínios de divagem modificados descritos no presente documento foram preparados pelas posições de mutação 490 (E-+K) e 538 (I—»-K) em um meio-domínio de divagem para produzir um meio-domínio de divagem modificado designado como Έ490Κ:Ι538Κ" e pelas posições de mutação 486 (Q-»E) e 499 (I—>L) em outro meio-domínio de divagem para produzir um meio-domínio de divagem modificado designado como "Q486E:I499L". Os meto-domínios de divagem modificados descritos no presente documento são mutantes de heterodímeros obrigatórios em que a divagem anormal é minimizada ou abolida. Consulte, por exemplo, a publicação de patente nQ U.S. 2008/0131962, a descrição da mesma é incorporada a título de referência em sua totalidade para todos os propósitos. Em determinadas modalidades, o meio-domínio de divagem modificado compreende mutações nas posições 486, 499 e 496 (numeradas em relação à Fokl do tipo selvagem), por exemplo mutações que substituem o resíduo de Gin do tipo selvagem (Q) na posição 486 por um resíduo de Glu (E), o resíduo de Iso do tipo selvagem (I) na posição 499 por um resíduo de Leu (L) e o resíduo de Asn do tipo selvagem (N) na posição 496 por um resíduo de Asp (D) ou Glu (E) (também referidos como domínios "ELD" e "ELE", respectivamente). Em outras • modalidades, o meio-domínio de divagem modificado compreende mutações nas posições 490, 538 e 537 (numeradas em relação à Fokl do tipo selvagem), por exemplo mutações que substituem o resíduo de Glu do tipo selvagem (E) na posição 490 por um resíduo de Lys (K), o resíduo de Iso do tipo selvagem (!) na posição 538 por um resíduo de Lys (K), e o resíduo de His do tipo selvagem (H) na posição 537 por um resíduo de Lys (K) ou um resíduo de Arg (R) (também referido como domínios "KKK" e "KKR", respectivamente). Em outras modalidades, o meio-domínio de divagem modificado compreende mutações nas posições 490 e 537 (numeradas em relação à Fokl do tipo selvagem), por exemplo, mutações que substituem o resíduo de Glu do tipo selvagem (E) na posição 490 por um resíduo de Lys (K) e o resíduo de His do tipo selvagem (H) na posição 537 por um resíduo de Lys (K) ou um resíduo de Arg (R) (também referido como domínios MK!K" e "KIR", respectivamente). (Consulte a publicação de patente n- US 20110201055). Em outras modalidades, o meio-domínio de divagem modificado compreende as mutações "Sharkey" e/ou "Sharkey"' (con- suite Guo et al, (2010) J. Mol. Biol. 400(1):96 a 107).
[00226] Os meio-domínios de divagem modificados descritos no presente documento podem ser preparados usando qualquer método adequado, por exemplo, através da mutagênese sítio-direcionada dos meío-domíníos de divagem do tipo selvagem (Fok I), conforme descrito nas publicações de patente n— U S. 20050064474; 20080131962; e 20110201055. De maneira alternativa, as nucleases podem ser reunidas in vivo no sítio-alvo de ácido nucleico usando a autodenominada tecnologia de "enzima dividida1' (consulte, por exemplo, a publicação de patente n9 U.S. 20090068164). Os componentes de tais enzimas divididas podem ser expressos em construtos de expressão separados ou podem ser ligados a um quadro de leitura aberta onde os componentes individuais são separados, por exemplo, por um peptídeo 2A de autoclivagem ou sequência IRES. Os componentes podem ser domínios de ligação dedos de zinco individuais ou domínios de um domínio de ligação ácido nucleico de meganuclease.
[00227] As nucleases podem ser examinadas quanto à atividade antes do uso, por exemplo, em um sistema cromossômico à base de levedura, conforme descrito nos documentos n— WO 2009/042163 e 20090068164. Os construtos de expressão de nuclease podem ser prontamente projetados usando os métodos conhecidos na técnica. Consulte, por exemplo, as publicações de patente dos Estados Unidos n95 20030232410; 20050208489; 20050026157; 20050064474; 20060188987; 20060063231; e a publicação internacional n9 WO 07/014275. A expressão da nuclease pode se encontrar sob o controle de um promotor constitutivo ou um promoter induzível, por exemplo, o promotor de galactoquinase que é ativado (desreprimido) na presença de rafinose e/ou galactose e reprimido na presença de glicose.
[00228] A distância entre os sítios-alvo se refere ao número de nu-cleotídeos ou pares de nucleotídeo intermediários entre dois sítios-alvo quando medidos a partir das bordas das sequências mais próximas umas às outras. Em determinadas modalidades em que a divagem depende da ligação de duas moléculas de fusão de domínio dedos de zinco/meio-domínio de divagem para separar os sítios-alvo, os dois sítios-alvo podem se encontrar em filamentos de DNA opostos. Em outras modalidades, ambos os sítios-alvo se encontram no mesmo filamento de DNA. Para a integração direcionada no locus genômico ótimo, uma ou mais ZFPs são modificadas para se ligarem a um sítio-alvo no ou próxima! ao sítio de divagem predeterminado, e uma proteína de fusão que compreende o domínio de ligação ao DNA modificado e um domínio de divagem é expresso na célula. Mediante a ligação da porção dedo de zinco da proteína de fusão ao sítio-alvo, o DNA é clivado, preferencialmente, através de uma quebra de filamento duplo, próxima ao sítio-alvo através do domínio de divagem.
[00229] A presença de uma quebra de filamento duplo no locus genômico ótimo facilita a integração de sequências exógenas através da recombinação homóloga. Desse modo, em uma modalidade, o polinu-cleotídeo que compreende a sequência de ácido nucleico de interesse a ser inserida no locus genômico direcionado irá incíuir uma ou mais regiões de homologia com o locus genômico direcionado para facilitar a recombinação homóloga.
[00230] Além das moléculas de fusão descritas no presente documento, a substituição direcionada de uma sequência genômica selecionada também envolve a introdução de uma sequência doadora. A sequência doadora de polinucleotídeo pode ser introduzida na célula antes, de maneira simultânea ou subsequente à expressão da proteína de fusão. Em uma modalidade, o polinucleotídeo doador contém homologia suficiente para o locus genômico ótimo suportar a recombinação homóloga entre o mesmo e a sequência genômica de locus genômico ótimo a qual se refere à homologia. Aproximadamente 25, 50, 100, 200, 500, 750, 1.000, 1.500, 2.000 nucleotídeos ou mais de uma homologia de sequência entre um doador e uma sequência genômica, ou qualquer valor inteiro entre 10 e 2.000 nucleotídeos ou mais, irá suportar a recombinação homóloga. Em determinadas modalidades, os braços de homologia são menores que 1.000 pares de base de comprimento. Em outras modalidades, os braços de homologia são menores que 750 pares de bases de comprimento. Em uma modalidade as sequências de polinucleotídeos doadores podem compreender uma molécula de vetor contendo sequências que não são homólogas à região de interesse na cromatina celular. Uma molécula de polinucleotí-deo doador pode conter diversas regiões descontínuas de homologia na cromatina celular. Por exemplo, para a inserção direcionada de sequências não geralmente presentes em uma região de interesse, as ditas sequências podem estar presentes em uma molécula de ácido nucleico doador e flanqueada por regiões de homologia em sequência na região de interesse. O polinucleotídeo doador pode ser DNA ou RNA de filamento único ou filamento duplo e pode ser introduzido em uma célula na forma linear ou circular. Consulte, por exemplo, as publicações de patente n— U.S. 20100047805, 20110281361, 20110207221 e pedido n2 U.S. 13/889.162. Se introduzidas na forma linear, as extremidades da sequência doadora podem ser protegidas {por exemplo, da degradação exonucleolítica) por métodos conhecidos por aqueles versados na técnica. Por exemplo, um ou mais resíduos de didesoxinucleotídeos são adicionados ao terminal 3' de uma molécula linear e/ou oligonucleotídeos autocomplementares são ligados uns aos outros em ambas as extremidades. Consulte, por exemplo, Chang et ai (1987) Proc. Natl. Acad. Sei. USA 84:4959 a 4963; Nehls et ai (1996) Science 272:886 a 889. Os métodos adicionais para proteger os polinucleotídeos exógenos da degradação incluem, porém, não se limitam a, adição de grupo(s) amino terminal e ao uso ligações internucleotícas modificadas, tais como, por exempío, fosforotiofatos, fosforamidatos e resíduos de O-metil ribose ou desoxirribose.
[00231] De acordo com uma modalidade proporciona-se um método para preparar uma planta dicotiledônea transgênica, talo como, uma planta de soja, em que um DNA de interesse foi inserido em um locus genômico de soja não gênico ótimo, O método compreende as etapas de: [00232] a. selecionar um locus de soja não gênico ótimo como um alvo para a inserção do ácido nucleico de interesse;
[00233] b. introduzir uma nuclease específica de sitio em uma célula de planta dicotiledônea, tal como, uma célula de planta de soja, em que a nuclease específica de sítio cliva a sequência não gênica;
[00234] c. introduzir o DNA de interesse na célula de planta; e [00235] d. selecionar as células de plantas transgênicas que compreendem o DNA de interesse direcionado na dita sequência não gênica.
[00236] De acordo com uma modalidade, proporciona-se um método para preparar uma célula de protoplasto de dicotiledônea transgênica, como uma célula de protoplasto de soja, em que um DNA de interesse foi inserido em um locus genômico de soja não gênico ótimo. O método compreende as etapas de: [00237] a. selecionar um locus de soja não gênico ótimo como um alvo para a inserção do ácido nucleico de interesse;
[00238] b. introduzir uma nuclease específica de sítio em uma célula de protoplasto de dicotiledônea, como uma célula de protoplasto de soja, em que a nuclease específica de sítio cliva a sequência não gênica;
[00239] c. introduzir o DNA de interesse na célula de protoplasto de dicotiledônea, como uma célula de protoplasto de soja; e [00240] d. selecionar a célula de protoplasto de dicotiledônea trans- gênica, como uma célula de protopíasto de soja, que compreende o DNA de interesse direcionado na dita sequência não gênica.
[00241] Em uma modalidade, a nuclease específica de sítio é selecionada a partir do grupo que consiste em uma nuclease Dedos de Zinco, uma nuclease CRISPR, uma nuclease TALEN ou uma meganu-ciease er mais particularmente, em uma modalidade, a nuclease específica de sítio é uma nuclease Dedos de Zinco. De acordo com uma modalidade, o DNA de interesse é integrado à dita sequência não gênica através de um método de integração dirigido por homologia. De maneira alternativa, em algumas modalidades, o DNA de interesse é integrado à dita sequência não gênica através de um método de integração de união terminal não homóloga. Em modalidades adicionais, o DNA de interesse é integrado à dita sequência não gênica através de um método de integração não anteriormente descrito. Em uma modalidade, o método compreende selecionar um locus genômico de soja não gênico ótimo para a inserção direcionada de um DNA de interesse que tem 2, 3, 4, 5, 6, 7 ou 8 das seguintes características: [00242] a. a sequência não gênica tem pelo menos 1 Kb de comprimento e não contém mais de 1% de metilação de DNA dentro da sequência [00243] b. a sequência não gênica exibe uma taxa de 0,01574 a 83,52 de cM/Mb de recombinação dentro do genoma de dicotiledônea, como um genoma da soja;
[00244] c. a sequência não gênica exibe um nível de 0 a 0,494 de ocupação de nucleossomo do genoma de dicotiledônea, como um genoma da soja;
[00245] d. a sequência não gênica compartilha menos que 40% da identidade de sequência com qualquer outra sequência contida no genoma de dicotiledônea, como um genoma da soja;
[00246] e. a sequência não gênica tem um valor de localização rela- tivo de razão 0 a 0,99682 da distância genômica a partir de um cen-trômero cromossômico de dicotiledônea, como soja;
[00247] f. a sequência não gênica tem uma faixa de teor percentual de guanina/citosina de 14,4 a 45,9%;
[00248] g. a sequência não gênica se situa em posição proximal em relação a uma sequência gênica; e, [00249] h. uma região de 1 Mb da sequência genômica de dicotiledônea, como uma, sequência genômica de soja, que compreende a dita sequência não gênica compreende uma ou mais sequências não gênicas adicionais. Em uma modalidade, o locus de soja não gênico ótimo é selecionado a partir de loci do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11,2, 3, 4, 5, 6, 7, 8, 9, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32.
Entrega [00250] As moléculas doadoras reveladas no presente documento são integradas a um genoma de uma célula através de métodos direcionados, independentes de homologia e/ou dependentes de homolo-gia. Para tal integração direcionada, o genoma é clivado em uma localização desejada (ou localizações) usando uma nuclease, por exemplo, uma fusão entre um domínio de ligação ao DNA (por exemplo, o domínio de ligação de dedos de zinco ou domínio efetor CRISPR ou TAL é modificado para ligar um sítio-alvo ao ou próximo ao sítio de divagem predeterminado) e um domínio de nuclease (por exemplo, domínio de divagem ou meio-domínio de divagem). Em determinadas modalidades, duas proteínas de fusão, cada uma que compreende um domínio de ligação ao DNA e um meio-domínio de divagem, são expressas em células e se ligam aos sítios-alvo que são justapostos de tal modo que um domínio de divagem funcional seja reconstituído e o DNA seja clivado nas proximidades dos sítios-alvo. Em uma modalidade, a divagem ocorre entre os sítios-alvo dos dois domínios de ligação ao DNA, Um ou ambos os domínios de tigação ao DNA podem ser modificados. Consulte, também, a patente n- U.S. 7,888.121; publicação de patente n9 U.S. 20050064474 e publicações de patente internacional n— W005/084190, W005/014791 e WO 03/080809 [00251] As nucleases, conforme descrito no presente documento, podem ser introduzidas como polipeptídeos e/ou polinucleotídeos. Por exemplo, dois polinucleotídeos, cada um que compreende sequências que codificam um dos polipeptídeos anteriormente mencionados, podem ser introduzidos em uma célula, e quando os polipeptídeos forem expressos e cada um se ligar a sua sequência-alvo, a divagem ocorre na ou próximo à sequência-alvo. De maneira alternativa, um único po-iinucleotídeo que compreende sequências que codificam ambos os polipeptídeos de fusão é introduzido em uma célula. Os polinucleotídeos podem ser DNA, RNA ou quaisquer formas modificadas ou análogas ao DNA e/ou RNA
[00252] Após a introdução de uma quebra de filamento duplo na região de interesse, o transgene é integrado à região de interesse de uma maneira direcionada através dos métodos dependentes de não homologia {por exemplo, união terminal não homóloga (NHEJ)) após a línearização de uma molécula doadora de filamento duplo, conforme descrito no presente documento. O doador de filamento duplo é preferencialmente linearizado in vivo com uma nuclease, por exemplo, uma ou mais nucleases iguais ou diferentes que são usadas para introduzir a quebra de filamento duplo no genoma. A divagem sincronizada do cromossomo e do doador na célula pode limitar a degradação de DNA doador (em comparação à línearização da molécula doadora antes da introdução na célula). Os sítios-alvo de nuclease usados para a linea-rização do doador preferenciaimente não atrapalham as sequências de transgenes.
[00253] O transgene pode ser integrado ao genoma na direção es- perada pela ligação simples das saliências de nuclease (designada como orientação "direta" ou "AB") ou na direção alternada (designada como orientação "reversa" ou "BA"). Em determinadas modalidades, o transgene é integrado após a ligação precisa das saliências de doador e cromossomo. Em outras modalidades, a integração do transgene na orientação BA ou AB resulta na eliminação de diversos nucleotídeos.
[00254] Através da aplicação de técnicas, tais como essas, as células de praticamente qualquer espécie podem ser estavelmente transformadas. Em algumas modalidades, o DNA transformante é integrado ao genoma da célula hospedeira. No caso de espécies mufticelulares, as células transgênicas podem ser regeneradas em um organismo transgênico. Qualquer uma dessas técnicas pode ser usada para produzir uma planta transgênica, por exemplo, que compreende uma ou mais sequências de ácido polinucleotídico doadoras no genoma da planta transgênica.
[00255] A entrega de ácidos nucleicos pode ser introduzida em uma célula de planta nas modalidades da invenção por qualquer método conhecido por aqueles versados na técnica incluindo, por exemplo, e sem limitação: por transformação de protoplastos (Consulte, por e-xemplo, patente n- U.S. 5.508.184); por absorção de DNA mediada por dessecação/inibição (Consulte, por exemplo, Potrykus et a/. (1985) Mol. Gen. Genet. 199:183 a 188); por eletroporação (Consulte, por e-xemplo, patente n- U.S. 5.384.253); por agitação com fibras de carbo-neto de silício (Consulte, por exemplo, as patentes n— U.S. 5.302.523 e 5.464.765); por transformação mediada por Agrobacterium (Consulte, por exemplo, as patentes n— U.S. 5.563.055, 5.591.616, 5.693.512, 5.824.877, 5.981.840, e 6.384.301); por aceleração de partículas revestidas com DNA (Consulte, por exemplo, as patentes n— U.S. 5.015.580, 5.550.318, 5.538.880, 6.160.208, 6.399.861 e 6.403.865) e por nanopartículas, nanotransportadores e peptídeos de penetração de célula (WO201126644A2; W02009046384A1; WO2008148223A1) nos métodos para entregar DNA, RNA, peptídeos e/ou proteínas ou combinações de ácidos nucleicos e peptídeos nas células de plantas.
[00256] O método mais amplamente utilizado para introduzir um vetor de expressão nas plantas se baseia no sistema de transformação natural de Agrobacterium. A. tumefaciens e A. rhizogenes consiste em bactérias de solo patogênicas de plantas que transformam geneticamente as células de plantas. Os plasmídeos T, e R, de A. tumefaciens e A. rhizogenes, respectivamente, transportam genes responsáveis pela transformação genética da planta. Os plasmídeos T, (indutores de tumor) contêm um segmento grande, conhecido como T-DNA, que é transferido para as plantas transformadas. Outro segmento do plasmídeo Ti, a região vir, é responsável pela transferência de T-DNA. A região de T-DNA é delimitada pelas bordas esquerdas e direitas que são compostas por sequências nucleotídicas repetidas terminais. Em alguns vetores binários modificados, os genes indutores de tumor foram eliminados, e as funções da região vir são utilizadas para transferir o DNA estranho delimitado pelas sequências de borda de T-DNA. A região T também pode conter, por exemplo, um marcador selecionável para a recuperação eficiente de plantas e células transgênicas, e um sítio de clonagem múltipla para inserir sequências para transferência, tal como, um ácido nucleico que codifica uma proteína de fusão da invenção.
[00257] Desse modo, em algumas modalidades, um vetor de transformação de planta é derivado de um plasmídeo T, de A. tumefaciens (Consulte, por exemplo, patentes U.S. n— 4.536.475, 4.693.977, 4.886.937 e 5.501.967; e patente europeia η- EP 0 122 791) ou um plasmídeo R, de A. rhizogenes. Os vetores de transformação de planta incluem, por exemplo, e sem limitação, aqueles descritos por Herrera-Estrella et ai (1983) Nature 303:209 a 213; Bevan et al. (1983), supra\ Klee et ai (1985) Bio/Technol. 3:637 a 642; e na patente europeia n-EP 0 120 516, e aqueles derivados de qualquer um anteriormente mencionado. Outras bactérias, tais como, Sinorhizobium, Rhizobium e Mesorhizobium que interagem naturalmente com as plantas podem ser modificadas para mediar a transferência de genes para inúmeras plantas diversas. Essas bactérias simbióticas associadas à planta podem ser competentes para a transferência de genes através da aquisição tanto de um plasmídeo T, desarmado como de um vetor binário adequado. O ácido nucleico de interesse [00258] As sequências doadoras de polinucleotídeo para a inserção direcionada em um locus genômico de uma planta dicotiledônea, como uma planta de soja, se encontram tipicamente na faixa de comprimento de cerca de 10 a cerca de 5,000 nucleotídeos. Entretanto, nucleotí-deos substancialmente mais longos, até 20.000 nucleotídeos, podem ser usados, incluindo sequências de cerca de 5, 6, 7, 8, 9, 10, 11 e 12 Kb de comprimento De maneira adicional, as sequências doadoras podem compreender uma molécula de vetor contendo sequências que não são homólogas à região substituída. Em uma modalidade, o ácido nucleico de interesse irá incluir uma ou mais regiões que compartilham a homologia com os loci genômicos direcionados. Geralmente, as regiões homólogas da sequência de ácido nucleico de interesse terão pelo menos 50% da identidade de sequência para uma sequência ge-nômica com a qual a recombinação é desejada. Em determinadas modalidades, as regiões homólogas do ácido nucleico de interesse compartilham 60%, 70%, 80%, 90%, 95%, 98%, 99% ou 99,9% da identidade de sequência com as sequências situadas no locus genômico direcionado. Entretanto, qualquer valor entre 1% e 100% da identidade de sequência pode estar presente, dependendo do comprimento do ácido nucleico de interesse.
[00259] Um ácido nucleico de interesse pode conter diversas regiões descontínuas da sequência que compartilham a identidade de sequência relativamente alta com a cromatina celular. Por exemplo, para a inserção direcionada de sequências não geralmente presentes em um locus genômico direcionado, as sequências peculiares que podem estar presentes em uma molécula de ácido nucleico doador e flanque-ada por regiões de sequências que compartilham uma identidade de sequência relativamente alta com uma sequência presente no locus genômico direcionado.
[00260] Um ácido nucleico de interesse também pode ser inserido em um locus genômico direcionado para servir como um reservatório para o uso posterior Por exemplo, uma primeira sequência de ácido nucleico que compreende as sequências homólogas a uma região não gênica do genoma de uma planta dicotiledônea, como uma planta de soja, porém, que contém um ácido nucleico de interesse (que codifica, opcionalmente, uma ZFN sob o controle de um promotor induzivel), pode ser inserida em um locus genômico direcionado. Em seguida, uma segunda sequência de ácido nucleico é introduzida na célula para induzir a inserção de um DNA de interesse em um locus genômico ó-timo de uma planta dicotiledônea, como uma planta de soja não gênica. Ou primeira sequência de ácido nucleico compreende uma ZFN específica para o locus genômico ótimo de soja não gênico e a segunda sequência de ácido nucleico compreende a sequência de interesse de DNA ou vice versa. Em uma modalidade, a ZFN irá clivar tanto o locus genômico de soja não gênico ótimo como o ácido nucleico de interesse. A quebra de filamento duplo resultante no genoma pode, então, se tomar o sítio de integração para o ácido nucleico de interesse liberado a partir do locus genômico ótimo. Alternativamente, a expressão de uma ZFN já localizada no genoma pode ser induzida após a introdução do DNA de interesse para induzir uma quebra de filamen- to duplo no genoma que pode, então, se tornar o sítio de integração para o ácido nucleico de interesse introduzido. De tal maneira, a eficiência da integração direcionada de um DNA de interesse em qualquer região de interesse pode ser aprimorada devido ao fato de que o método não depende de aceitação simultânea de ambos os ácidos nucle-icos que codificam as ZFNs e o DNA de interesse.
[00261] Um ácido nucleico de interesse pode, também, ser inserido em um locus genômíco ótimo de soja não gênico para servir como um sítio-alvo para as inserções subsequentes. Por exemplo, um ácido nucleico de interesse que compreende sequências de DNA que contêm sítios de reconhecimento para projetos de ZFN adicionais podem ser inseridos no locus. Subsequentemente, os projetos de ZFN adicionais podem ser gerados e expressos nas células de modo que o ácido nucleico de interesse original seja clivado e modificado através de re-combinação homóloga ou de reparo. Desse modo, as integrações rei-terativas de ácido nucleico de interesses podem ocorrer no locus ge-nômico ótimo não gênico de uma de uma planta dicotiledônea, como uma planta de soja.
[00262] As sequências exógenas exemplificativas que podem ser inseridas em um locus genômico de soja não gênico ótimo incluem, porém, não se limitam a: qualquer sequência de codificação de poli-peptídeo (por exemplo, cDNAs), promotor, intensificador e outras sequências reguladoras (por exemplo, sequências de RNA de interferência, cassetes de expressão de shRNA, etiquetas de epítopo, genes marcadores, sítios de reconhecimento de enzima de divagem e vários tipos de consfrutos de expressão). Tais sequências podem ser prontamente obtidas com o uso de técnicas de biologia molecular padrão (clonagem, síntese, etc.) e/ou são disponíveis comercialmente.
[00263] Para expressar as ZFNs, as sequências que codificam as proteínas de fusão são, tipicamente, subclonadas em um vetor de ex- pressão que contém um promotor para direcionar a transcrição. Os promotores procarióticos e eucarióticos adequados são bem conhecidos na técnica e descritos, por exemplo, em Sambrook et al., Molecular Cloning, A Laboratory Manual (2a edição 1989; 3.sup.rd ed., 2001); Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990); e Current Protocols in Molecular Biology (Ausubel et al.), supra. Os sistemas de expressão bacteriana para expressar as ZFNs estão disponíveis em, por exemplo, E. coli, Bacillus sp., e Salmonella (Paiva et al., Gene 22:229 a 235 (1983)). Os kits para tais sistemas de expressão estão comercialmente disponíveis. Os sistemas de expressão eucarióticos para células de mamíferos, levedura, e células de inseto são bem conhecidos pelos elementos versados na técnica e também estão comercialmente disponíveis.
[00264] O vetor de expressão específico usado para transportar o material genético para o interior da célula é selecionado considerando-se o uso pretendido das proteínas de fusão, por exemplo, a expressão nas plantas, animais, bactérias, fungo, protozoários, etc. (consulte os vetores de expressão descritos abaixo). Os vetores de expressão-padrão bacterianos e animais são conhecidos na técnica e estão descritos em detalhes, por exemplo, na Publicação de patente ns U.S. 20050064474A1 e Publicações de patente Internacionais n— U.S. W005/084190, W005/014791 e W003/080809.
[00265] Os métodos-padrão de transfecção podem ser usados para produzir linhagens celulares bacterianas, de mamífero, de levedura ou de inseto que expressam grandes quantidades de proteína, que podem, então, ser purificadas com o uso de técnicas-padrão (consulte, por exemplo, Colley et al., J. Biol. Chem. 264:1.7619 a 1.7622 (1989); Guide to Protein Purification, in Methods in Enzymology, volume 182 (Deutscher, ed., 1990)). A transformação de células eucarióticas e procarióticas é realizada de acordo com as técnicas-padrão (consulte, por exemplo, Morrison, J. Bact. 132:349 a 351 (1977); Clark-Curtiss & Curtiss, Methods in Enzymology 101:347 a 362 (Wu et al., e<±, 1983).
[00266] Os métodos e composições revelados podem ser usados para inserir as sequências doadoras de polinucleotídeo em um local predeterminado, tal como, em dentre os loci genômicos de soja não gênicos ótimos. Isso é útil à medida que a expressão de um transgene introduzido no genoma de soja depende criticamente de seu sítio de integração. Consequentemente, os genes que codificam a tolerância ao herbicida, resistência a insetos, moléculas nutrientes, antibióticas ou terapêuticas podem ser inseridos através de recombinação direcionada.
[00267] Em uma modalidade, o ácido nucleico de interesse é combinado ou "empilhado" com sequências de codificação de gene que fornecem resistência adicional ou tolerância a glifosato ou um outro herbicida e/ou fornecem resistência para selecionar insetos ou doenças e/ou melhorias nutricionais e/ou características agronômicas aprimoradas e/ou proteínas ou outros produtos úteis nos usos de alimentação, alimentos, industriais, farmacêuticos ou outros usos. O "empi-Ihamento" de duas ou mais sequências de interesse de ácido nucleico dentro de um genoma de planta pode ser realizado, por exemplo, através de reprodução de planta convencional com o uso de dois ou mais eventos, transformação de uma planta com um construto que contém as sequências de interesse, retransformação de uma planta transgêni-ca ou adição de novos traços através da integração direcionada através de recombinação homóloga.
[00268] Tais sequências de interesse nucleotídicas doadoras de polinucleotídeo incluem, mas não se limitam aos exemplos fornecidos abaixo: 1. Genes ou Sequências de codificação (por exemplo. iRNA) Que Conferem Resistência a Pragas ou Doenças [00269] (A) Genes de Resistência à Doença de Planta. As defesas da planta são, frequentemente, ativadas por interação específica entre o produto de um gene de resistência à doença (R) na planta e o produto de um gene de avirulência correspondente (Avr) no patógeno. Uma variedade de plantas pode ser transformada, com gene de resistência clonado, em plantas modificadas que são resistentes a cepas de patógeno específico. Os exemplos de tais genes incluem: o gene de tomate Cf-9 por resistência ao Cladosporium fulvum (Jones et al., 1994 Science 266:789), gene de tomate Pto, que codifica uma quinase de proteína por resistência ao Pseudomonas syringae pv. em tomate (Martin et al., 1993 Science 262:1.432), e o gene Arabidopsis RSSP2 por resistência ao Pseudomonas syringae (Mindrinos et al., 1994 Cell 78:1.089).
[00270] (B) Uma proteína de Bacillus thuringiensis, um derivado da mesma ou um polipeptídeo sintético modelado na mesma, tal como, uma sequência nucleotídica de um gene Bt δ-endotoxina (Geiser et al., 1986 Gene 48:109), e um gene inseticida vegetativo (VIP) (consulte, por exemplo, Estruch et al. (1996) Proc. Natl. Acad. Sei. 93:5.389 a 5.394). Ademais, as moléculas de DNA que codificam genes δ-endotoxina podem ser adquiridas junto à American Type Culture Col-lection (Rockville, Md.), sob os números de acesso ATCC: 40098, 67136, 31995e31998.
[00271] (C) Uma lectina, tal como, sequências nucieotídicas de diversos genes de lectina de ligação à manose de Clivia miniata (Van Damme et al., 1994 Plant Molec. Biol. 24:825).
[00272] (D) Uma proteína de ligação à vitamina, tais como, avidina e homólogos de avidina que são úteis como larvicidas contra pragas de inseto. Consulte a patente n- U.S. 5.659.026.
[00273] (E) Um inibidor de enzima, por exemplo, um inibidor de pro-tease ou um inibidor de amilase. Os exemplos de tais genes incluem um inibidor de proteinase de cisíeina de arroz (Abe et a!., 1987 J. Biol. Chem. 262:16.793), um inibidor de proteinase de tabaco I (Huub et aL, 1993 Plant Molec. Biol. 21:985), e um inibidor de ct-amilase (Sumitani et aí., 1993 Biosci, Biotech. Biochem. 57:1.243).
[00274] (F) Um hormônio ou ferormônio específico de inseto, tal como, um ecdisteroide e hormônio juvenil, uma variação do mesmo, um mimético baseado no mesmo, ou um antagonista ou agonista do mesmo, tais como, expressão de baculovírus de esterase de hormônio juvenil clonada, um inativador de hormônio juvenil (Hammock et al., 1990 Nature 344:458).
[00275] (G) Um peptídeo ou neuropeptídeo específico de inseto que, mediante a expressão, perturba a fisiología da praga afetada (J. Biol. Chem. 269:9). Os exemplos de tais genes incluem um receptor de hormônio diurético de inseto (Regan, 1994), uma alostatina identificada em Diploptera punctata (Pratt, 1989) e neurotoxinas paralíticas específicas de inseto (patente ns U.S. 5.266.361).
[00276] (H) Um veneno específico de inseto produzido na natureza por uma cobra, uma vespa, etc.t tal como, um peptídeo insetotóxico de escorpião (Pang, 1992 Gene 116:165).
[00277] (I) Uma enzima responsável por um hiperacúmuío de mono-terpeno, um sesquiterpeno, um esteroide, ácido hidroxâmico, um derivado de fenilpropanoide ou uma outra molécula não proteína com atividade inseticida.
[00278] (J) Uma enzima envolvida na modificação, incluindo a modificação pós-traducional, de uma molécula biologicamente ativa; por exemplo, enzima glicolítica, uma enzima proteolítica, uma enzima li política, uma nuclease, uma ciclase, uma transaminase, uma esterase, uma hidrolase, uma fosfatase, uma quinase, uma fosforilase, uma po-limerase, uma elastase, uma quitinase e uma glicanase, quer naturais ou sintéticas. Os exemplos de tais genes incluem, um gene de calas (pedido publicado PCT n2 W093/Q2197), sequências que codificam quitinase (que podem ser obtidas, por exemplo, junto à ATCC sob os números de acesso: 3999637 e 67152), quitinase de ancilóstomo de tabaco (Kramer et a!., 1993 Insect Mofec. Biol. 23:691), e o gene ubi4-2 poliubiquitina de salsa (Kawalleck et aL, 1993 Plant Molec. Biol. 21:673).
[00279] (K) Uma molécula que estimula a transdução de sinal. Os exemplos de tais moléculas incluem as sequências nucleotídicas para clones de cDNA de calmodulina de feijão-mungo (Botella et al., 1994 Plant Molec. Biol. 24:757) e uma sequência nucleotídica de um clone de cDNA de calmodulina de soja (Griess et al., 1994 Plant Physíol. 104:1.467).
[00280] (L) Um peptídeo de momento hidrofóbico. Consulte as patentes n— U.S, 5.659.026 e 5.607,914; a última ensina sobre os peptí-deos antimicrobianos sintéticos que conferem resistência a doenças.
[00281] (M) Uma permease de membrana, um formador de canal ou um bloqueador de canal, tal como, um análogo de peptídeo cecro-pin-β lítico (Jaynes et al,, 1993 Plant Sei. 89:43) que torna plantas de tabaco transgênicas resistentes a Pseudomonas solanacearum.
[00282] (N) Uma proteína invasiva viral ou uma toxina complexa derivada da mesma. Por exemplo, o acúmulo de proteínas de revestimento virais em células de planta transformadas confere resistência à infecção viral e/ou desenvolvimento de doenças causadas pelo vírus a partir do qual o gene de proteína de revestimento é derivado, assim como, pelos vírus relacionados. A resistência mediada por proteína de revestimento foi conferida às plantas transformadas contra o vírus do mosaico de alfafa, vírus do mosaico de pepino, vírus da nervura do tabaco, vírus X da batata, vírus Y da batata, vírus "etch" de tabaco, vírus "rattle" do tabaco e vírus do mosaico do tabaco. Consulte, por exemplo, Beachyet al. (1990) Ann. Rev. Phytopathol. 28:451.
[00283] (O) Um anticorpo específico de inseto ou uma imunotoxina derivada a partir do mesmo. Desse modo, um anticorpo direcionado para uma função metabóíica crítica nas entranhas do inseto inativa uma enzima afetada, matando, assim, o inseto. Por exemplo, Taylor et al. (1994) Abstract #497, Seventh intl Symposium on Molecular Plant-Microbe Interactions mostra a inativação enzimática no tabaco trans-gênico através da produção de fragmentos de anticorpo de cadeia única.
[00284] (P) Um anticorpo específico de vírus. Consulte, por exemplo, Tavladoraki et al. (1993) Nature 266:469, que mostra que as plantas transgênicas que expressam os genes de anticorpo recombinantes são protegidas contra ataque de vírus.
[00285] (Q) Uma proteína de interrupção de desenvolvimento produzida na natureza por um patógeno ou um parasita. Dessa forma, a endo-a-l^-D-poligalacturonase fúngica facilita a colonização de fungos e a liberação de nutriente de planta solubilizando-se a parede de célula de planta homo-a-1,4-D-galacturonase (Lamb et al,, 1992) Bi-o/Technology 10:1.436. A clonagem e caracterização de um gene que codifica uma proteína inibidora de endopoligalacturonase de grão é descrita por Toubart et al. (1992 Plant J. 2:367).
[00286] (R) Uma proteína de interrupção de desenvolvimento produzida na natureza por uma planta, tal como, o gene de inativação de ribossomo de cevada que fornece uma resistência aumentada contra a doença fúngica (Longemann et al., 1992). Bio/Technology 10:3.305.
[00287] (S) A interferência de RNA, em que uma molécula de RNA é usada para inibir a expressão de um gene-alvo. Uma molécula de RNA em um exemplo é, parcial ou totalmente de filamento duplo, o que aciona uma resposta de silenciamento, que resulta na divagem de dsRNA em pequenos RNAs interferentes que são, então, incorporados em um complexo de direcionamento que destrói os mRNAs homólo- gos. Consulte, por exemplo, Fire et al., patente ns U.S. 6.506.559; Graham et al., n2 6.573.099. 2. Genes Que Conferem Resistência a um Herbicida [00288] (A) Os genes que codificam a resistência ou tolerância a um herbicida que inibe o ponto de crescimento ou meristema, tal como, um herbicida imidazalinona, sulfonanilida ou sulfonilureia. Os genes exemplificativos nesse código de categoria para acetolactato sin-tase mutante (ALS) (Lee et al., 1988 EMBOJ. 7:1.241) também conhecida como a enzima acetoidroxiácido sintase (AHAS) (Miki et al., 1990 Theor. Appl. Genet. 80:449).
[00289] (B) Um ou genes adicionais de codificação de resistência ou tolerância ao glifosato conferido pela EPSP sintase e genes aroA mutantes, ou através de inativação metabólica através de genes tais como, DGT-28, 2mEPSPS, GAT (glifosato acetiltransferase) ou GOX (glifosato oxidase) e outros compostos de fosfono, tais como, glifosina-to (genes pat, bar, e dsm-2) e ácidos ariloxifenoxipropiônico e cicloe-xanodionas (genes de codificação de inibidor de ACCase). Consulte, por exemplo, a patente n2 U.S. 4.940.835, que revela a sequência nu-cleotídica de uma forma de EPSP que pode conferir resistência ao glifosato. Uma molécula de DNA que codifica um gene aroA mutante pode ser obtida sob um número de acesso ATCC, 39256 e a sequência nucleotídica do gene mutante é revelada na patente n2 U.S. 4.769.061. O pedido de patente europeia η2 EP 0 333 033 e a patente n2 U.S. 4.975.374 revelam as sequências nucleotídicas de genes de sintetase de glutamina que conferem resistência a herbicidas, tais como, o L-fosfinotricina. A sequência nucleotídica de um gene de fosfinotriciace-til-transferase é fornecida no pedido europeu n2 0 242 246. De Greef et al. (1989) Bio/Technology 7:61 descreve a produção de plantas trans-gênicas que expressam codificação de genes bar quiméricos para atividade fosfinotricina acetil transferase. Os exemplificativos de genes que conferem resistência aos ácidos ariloxifenoxipropiônico e cicloe-xanodionas, tais como, setoxidim e haloxifope, são os genes Acc!-S1, Accl-S2 e Accl-S3 descritos por Marshall et al. (1992) Theor. Appl. Ge-net. 83:435.
[00290] (C) Os genes que codificam a resistência ou tolerância a um herbicida que inibe a fotossíntese, tal como, uma triazina (genes psbA e gs+) e uma bezonitrila (gene nitrilase). Prztbiila et al. (1991) Plant Cell 3:169 descreve o uso de plasmideos que codificam os genes psbA mutantes para transformar as Chlamydomonas. As sequências nucleotídicas para os genes nitrilase são reveladas na patente nQ U.S. 4.810.648 e as moléculas de DNA que contêm tais genes são disponíveis sob os números de acesso ATCC 53435, 67441 e 67442. A clonagem e a expressão de codificação de DNA para uma glutationa S-transferase são descritas por Hayes et al. (1992) Biochem. J. 285:173.
[00291] (D) Os genes que codificam a resistência ou tolerância a um herbicida que se liga às hidroxifenilpiruvato dioxigenases (HPPD), as enzimas que catalisam a reação em que o para-hidroxifenilpiruvato (HPP) é transformado em homogentisato. Isso inclui os herbicidas, tais como, isoxazóis (EP418175, EP470856, EP487352, EP527036, EP560482, EP682659, patente nQ U.S. 5.424.276), particularmente, o isoxaflutol, que é um herbicida seletivo para soja, dicetonitriias (EP496630, EP496631), particularmente, 2-ciano-3-ciclopropiM-(2-S02CH3-4-CF3 fenil)propano-1,3-diona e 2-ciano-3-ciclopropil-1-(2-S02CH3-4-2,3CI2fenil)propano-1,3-diona, tricetonas (EP625505, EP625508, patente n- U.S. 5.506.195), particularmente, sulcotriona, e pirazolinatos. Um gene que produz um excesso de HPPD em plantas pode fornecer a tolerância ou resistência a tais herbicidas, incluindo, por exemplo, os genes descritos nas patentes n— U.S. 6.268.549 e 6.245.968 e na publicação de pedido de patente n° U.S. 20030066102.
[00292] (E) Os genes que codificam a resistência ou tolerância aos herbicidas de fenóxi auxina, tais como, ácido 2,4-diclorofenoxiacético (2,4-D) e que também podem conferir resistência ou tolerância aos herbicidas de ariloxifenoxipropionato (AOPP). Os exemplos de tais genes incluem o gene de enzima dioxigenase dependente de a-cetoglutarato (aad-1), descrito na patente ns U.S. 7.838.733.
[00293] (F) Os genes que codificam a resistência ou tolerância aos herbicidas fenóxi auxina, tais como, o ácido 2,4-diclorofenoxiacético (2,4-D) e que também confere a resistência ou tolerância aos herbicidas piridilóxi auxina, tais como, fluoroxipir ou triclopir. Os exemplos de tais genes incluem o gene da enzima dioxigenase dependente de a-cetoglutarato (aad-12), descrito no documento n- WO 2007/053482 A2.
[00294] (G) Os genes que codificam a resistência ou tolerância ao dicamba (consulte, por exemplo, a Publicação de patente n2 U.S. No. 20030135879).
[00295] (H) Os genes que fornecem resistência ou tolerância aos herbicidas que inibem protoporfirinogênio oxidase (PPO) (consulte a patente n2 U.S. 5.767.373).
[00296] (I) Os genes que fornecem resistência ou tolerância aos herbicidas de triazina (tais como, a atrazina) e herbicidas de derivados de uréia (tais como, o diuron) que se ligam às proteínas de núcleo de centros de reação de fotossistema II (PS II) (Consulte Brussian et al., (1989) EMBO J. 1989, 8(4): 1.237 a 1.245. 3. Genes Que Conferem ou Contribuem com um Traço de Valor Adicionado [00297] (A) O metabolismo de ácido graxo modificado, por exemplo, através da transformação de soja ou Brassica com um gene antissen-so ou estearoil-ACP dessaturase para aumentar o teor de ácido esteá-rico da planta (Knultzon et al., 1992) Proc. Nat. Acad. Sei. EUA 89:2.624.
[00298] (B) Teor de fitato reduzido [00299] (1) A introdução de um gene de codificação de fitase, tal como, o gene fitase de Aspergiltus niger (Van Hartingsveldt et al., 1993 Gene 127:87), aumenta a decomposição do fitato, adicionando mais fosfato livre à planta transformada.
[00300] (2) Um gene que reduz o teor de fitato pode ser introduzido. Na dicotiledônea, isso pode ser realizado, por exemplo, através da clonagem e, então, reintrodução de DNA associado ao alelo único que é responsável por mutantes de soja caracterizados por níveis baixos de ácido fítrco (Raboy et al., 1990 Maydica 35:383).
[00301] (C) A composição de carboidrato modificado efetuada transformando-se, por exemplo, as plantas com uma codificação de gene em uma enzima que altera o padrão de ramificação de amido. Os exemplos de tais enzimas incluem, o gene frutosiltransferase de Strep-tococcus mucus (Shiroza et a!., 1988) J. Bacteriol. 170:810, gene le-vansucrase de Bacillus subtilis (Steinmetz et al., 1985 Mol. Gen. Ge-nel. 200:220), Bacillus licheniformis α-amilase (Pen et al., 1992 Bi-o/Technology 10:292), genes da invertase de tomate (Elliot et al·, 1993), gene da amilase de cevada (Sogaard et al., 1993 J. Biol. Chem. 268:22480) e enzima II de ramificação de amido de endosperma de soja (Fisher et al., 1993 Plant Physiol. 102:10.450). III. Construtos Recombinantes [00302] Conforme revelado no presente documento, a presente descrição fornece sequências genômicas recombinantes que compreendem uma sequência genômica de soja não gênica ótima de pelo menos 1 Kb e um DNA de interesse, em que o DNA de interesse inserido é inserido na dita sequência não gênica. Em uma modalidade, o DNA de interesse é um domínio analítico, uma sequência de genes ou codificação (por exemplo, iRNA) que confere resistência a pregas ou doenças, genes que conferem resistência a um herbicida ou genes que conferem ou contribuem com um traço de valor adicionado, e a sequência genômica de soja não gênica ótima compreende 1, 2, 3, 4, 5, 6, 7 ou 8 das seguintes características: [00303] a. a sequência não gênica tem cerca de 1 Kb a cerca de 5,7 Kb de comprimento e não contém um polinucleotídeo metilado;
[00304] b. a sequência não gênica exibe uma de 0,01574 a 83,52 cM/Mb de recombinação dentro do genoma de uma planta dicotiledônea, como uma planta de soja;
[00305] c. a sequência não gênica exibe um nível de 0 a 0,494 de ocupação de nucleossomo do genoma de dicotiledônea, como um genoma da soja;
[00306] d. a sequência não gênica compartilha menos que 40% da identidade de sequência com qualquer outra sequência contida no genoma de dicotiledônea, como um genoma da soja;
[00307] e. a sequência não gênica tem um valor de localização relativo da razão de 0 a 0,99682 da distância genômica a partir de um cen-trômero cromossômico de dicotiledônea, como um centro cromossô-mico de soja;
[00308] f. a sequência não gênica tem uma faixa de teor percentual de guanina/citosina de 14,4 a 45,9%;
[00309] g. a sequência não gênica se situa em posição proximal em relação a uma sequência gênica, que compreende uma sequência de codificação de dicotiledônea conhecida ou prevista, tal como, uma sequência de codificação de soja, em 40 Kb do DNA genômico contíguo que compreende a sequência nativa não gênica; e, [00310] h. a sequência não gênica se situa em uma região de 1 Mb da sequência genômica de dicotiledônea, ta! como, uma sequência genômica, que compreende pelo menos uma segunda sequência não gênica.
[00311] Em uma modalidade, a sequência genômica de soja não gênica ótima é adicionalmente caracterizada por ter uma região gênica que compreende 1 a 18 sequências de codificação de soja conhecidas ou prevista em 40 Kb do DNA genômico contíguo que compreende a sequência nativa não gênica. Em uma modalidade, o locus de soja não gênico ótimo é selecionado a partir de loci do aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 2, 3, 4, 5, 6, 7, 8, 9, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32.
IV, PLANTAS TRANSGÊNICAS
[00312] As plantas transgênicas que compreendem os loci de soja não gênicos ótimos recombinantes também são fornecidas, de acordo com uma modalidade, da presente invenção. Tais plantas transgênicas podem ser preparadas com o uso de técnicas conhecidas pelos elementos versados na técnica.
[00313] Uma célula de dicotiledônea transformada, calo, tecido ou planta pode ser identificada e isolada selecionando-se ou examinando-se o material de planta modificado para traços codificados pelos genes marcadores presentes no DNA transformante. Por exemplo, a seleção pode ser realizada por meio do cultivo do material de planta modificado em meios que contêm uma quantidade inibidora do antibiótico ou herbicida ao qual o construto de gene transformante confere resistência. Ademais, as células transformadas também podem ser identificadas examinando-se as atividades de quaisquer genes marcadores visíveis (por exemplo, a proteína de fluorescência amarela, proteína de fluorescência verde, proteína de fluorescência vermelha, beta-glicuronidase, luciferase, genes B ou C1) que podem estar presentes nos construtos de ácido nucleico recombinantes. Tais metodologias de seleção e triagem são bem conhecidas para os elementos versados na técnica.
[00314] Os métodos físicos e bioquímicos também podem ser usados para identificar os transformantes de planta ou célula de planta que contêm construtos de gene inseridos. Tais métodos incluem, porém, não se limitam a: 1) Análise Southern ou amplificação de PCR para detectar e determinar a estrutura da inserção de DNA recombi-nante; 2) Northern blot, proteção de S1 RNase, extensão de iniciador ou amplificação de PCR de transcriptase reversa para detectar e examinar as transcrições de RNA dos construtos de gene; 3) ensaios en-zimáticos para detectar a atividade de enzima ou ribozima, em que tais produtos de gene são codificados pelo construto de gene; 4) eletrofo-rese em gel de proteína, técnicas de Western blot, imunoprecipitação ou imunoensaios ligados à enzima (ELISA), em que os produtos de construto de gene são as proteínas. As técnicas adicionais, tais como, hibridização in situ, manchamento de enzima e imunomanchamento, também podem ser usados para detectar a presença ou expressão do construto recombinante em órgãos e tecidos de planta específicos. Os métodos para realizar todos esses ensaios são bem conhecidos pelos elementos versados na técnica.
[00315] Os efeitos de manipulação de gene com o uso dos métodos revelados no presente documento podem ser observados, por exemplo, através de Northern blots do RNA (por exemplo, mRNA) isolado dos tecidos de interesse. Tipicamente, se o mRNA estiver presente ou a quantidade de mRNA tiver diminuído, pode-se supor que o transge-ne correspondente está sendo expresso. Outros métodos de medição de atividade de gene e/ou polipeptídeo codificado podem ser usados. Diferentes tipos de ensaios enzimáticos podem ser usados, dependendo do substrato usado e do método de detecção do aumento ou diminuição de um produto ou subproduto de reação. Além disso, os níveis de polipeptídeo expressos podem ser imunoquimicamente medidos, isto é, ELISA, RIA, EIA e outros ensaios à base de anticorpos bem conhecidos pelos elementos versados na técnica, tais como, a-través de ensaios de detecção eletroforética (com manchamento ou western blotting). Como um exemplo não limitativo, a detecção das proteínas AAD-12 (ariloxialcanoato dioxigenase; consulte o documento n2 WO 2011/066360) e proteínas PAT (fosfinotricin-N-acetil-transferase (PAT)) com o uso de um ensaio ELISA é descrita na publicação de patente n2 U.S. 20090093366 que é incorporada no presente documento em sua totalidade a título de referência. O transgene pode ser seletivamente expresso em alguns tecidos da planta ou em alguns estágios de desenvolvimento ou o transgene pode ser substancialmente expresso em todos os tecidos de planta, substancialmente ao longo de todo o seu ciclo de vida. Entretanto, qualquer modo de expressão combinatória também é aplicável.
[00316] Um versado na técnica irá reconhecer que após a sequência doadora de polinucleotídeo exógeno ser incorporada de maneira estável nas plantas transgênicas e ser confirmada como operante, a mesma pode ser introduzida em outras plantas através de cruzamento sexual. Qualquer uma dentre inúmeras técnicas de reprodução padrão pode ser usada, dependendo das espécies a serem cruzadas.
[00317] A presente invenção também abrange as sementes das plantas transgênicas descritas acima, em que a semente tem o transgene ou construto de gene. A presente invenção abrange adicionalmente progênie, clones, linhagens de célula ou células das plantas transgênicas descritas acima, em que a progênie, clone, linhagem de célula ou célula têm o transgene ou construto de gene inserido em loci genômicos ótimos.
[00318] As células de planta transformadas que são produzidas por qualquer uma das técnicas de transformação acima podem ser cultivadas para regenerar uma planta inteira que possua o genótipo transformado e, desse modo, o fenótipo desejado. Tais técnicas de regeneração dependem da manipulação de determinados fitormônios em um meio de crescimento de cultura de tecido que depende, tipicamente, de um marcador de biocida e/ou herbicida que foi introduzido junto com as sequências nucleotídicas desejadas. A regeneração de planta dos protoplastos cultivados é descrita em Evans, et al., "Protoplasts Isolation and Culture" em Handbook of Plant Cell Culture, pp. 124 a 176, Macmillian Publishing Company, New York, 1983; e Binding, Re-generation of Plants, Plant Protoplasts, pp. 21 a 73, CRC Press, Boca Raton, 1985. A regeneração também pode ser obtida a partir de calo de planta, explantes, órgãos, polens, embriões ou partes dos mesmos. Tais técnicas de regeneração são descritas, em geral, em Kfee et al. (1987) Ann. Rev. of Plant Phys. 38:467 a 486.
[00319] Uma planta transgênica ou material de planta que compreende uma sequência nucleotídica que codifica um polipeptídeo pode, em algumas modalidades, exibir uma ou mais dentre as seguintes características: expressão do polipeptídeo em uma célula da planta; expressão de uma porção do polipeptídeo em um plastídeo de uma célula da planta; importação do polipeptídeo do citosol de uma célula da planta para o interior do plastídeo da célula; expressão específica de plastídeo do polipeptídeo em uma célula da planta; e/ou localização do polipeptídeo em uma célula da planta. Tal planta pode ter, adicionalmente, um ou mais traços desejados além da expressão do polipeptídeo codificado. Tais traços podem incluir, por exemplo: resistência a insetos, outras pragas e agentes causadores de doença; tolerâncias a herbicidas; estabilidade aumentada, rendimento ou vida em prateleira; tolerâncias ambientais; produção farmacêutica; produção de produtos industriais; e melhorias nutricionais.
[00320] De acordo com uma modalidade, proporciona-se um proto-plasto de dicotiledônea transgênica (isto é, um protoplasto de soja) que compreende um locus de soja não gêmeo recombinante ótimo. Mais particularmente, proporciona-se um protoplasto de dicotiledônea, tal como, um protoplasto de soja, que compreende um DNA de inte- resse inserido em loci genômicos de soja não gênicos ótimos do pro-topiasto de dicotiiedônea (isto é, um protoplasto de soja), em que os ditos loci genômicos de soja não gênicos têm cerca de 1 Kb a cerca de 5,7 Kb de comprimento e são desprovidos de quaisquer metilados. Em uma modalidade, o protoplasto de dicotiiedônea transgênica (isto é, um protoplato de soja transgênico), compreende um DNA de interesse inserido no locus genômico de soja não gênico ótimo em que o DNA de interesse compreende um domínio analítico e/ou um quadro de leitura aberta. Em uma modalidade, o DNA inserido de interesse codifica um peptídeo e, em uma modalidade adicional, o DNA de interesse compreende pelo menos um cassete de expressão genética que compreende um transgene.
[00321] De acordo com uma modalidade, proporciona-se uma planta dicotiiedônea transgênica, parte de planta dicotiiedônea ou célula de planta dicotiiedônea (isto é, uma planta transgênica de soja, parte de planta de soja ou célula de planta de soja) que compreende um locus de soja não gênico recombinante ótimo. Mais particularmente, proporciona-se uma planta dicotiiedônea, parte de planta dicotiiedônea ou célula de planta dicotiiedônea (isto é, uma planta de soja, parte de planta de soja ou célula de planta de soja) que compreende um DNA de interesse inserido em loci genômicos de soja não gênicos ótimos da planta dicotiiedônea, parte de planta dicotiiedônea ou célula de planta dicotiiedônea (isto é, uma planta de soja, parte de planta de soja ou célula de planta de soja), em que os ditos loci genômicos de soja não gênicos têm cerca de 1 Kb a cerca de 5,7 Kb de comprimento e são desprovidos de quaisquer nucleotídeos metilados. Em uma modalidade, a planta dicotiiedônea transgênica, parte de planta dicotiiedônea ou célula de planta dicotiiedônea (isto é, uma planta transgênica de soja, parte de planta de soja ou célula de planta de soja) compreende um DNA de interesse inserido no locus genômico de soja não gênico ótimo, em que o DNA de interesse compreende um domínio analítico e/ou um quadro de leitura aberta. Em uma modalidade, o DNA inserido de interesse codifica um peptídeo e, em uma modalidade adicional, o DNA de interesse compreende pelo menos um cassete de expressão genética que compreende um transgene.
EXEMPLOS
Exemplo 1: Identificação de Loci Genômicos Direcionáveis em Soia [00322] O genoma da soja foi examinado com uma abordagem de bioinformática que usa critérios específicos para selecionar os loci genômicos ótimos para direcionamento de um doador de polinucleotí-deos. Os critérios específicos usados para selecionar os loci genômicos foram desenvolvidos usando considerações para expressão ótima de um transgene dentro do genoma da planta, as considerações para a ligação ótima do DNA genômico a uma proteína de ligação ao DNA sítio-específica e os requisitos de desenvolvimento de produto de planta transgênica. A fim de identificar e selecionar os loci genômicos, conjuntos de dados genômicos e epigenômicos do genoma da soja foram examinados usando uma abordagem de bioinformática. Os conjuntos de dados genômicos e epigenômicos de triagem resultaram em loci selecionados que atenderam os seguintes critérios: 1) hipometilados e maiores que 1 Kb de comprimento; 2) direcionáveis através da integração mediada por nuclease específica de sítio de um doador de po-linucleotídeos; 3) agronomicamente neutros ou não gênicos; 4) regiões a partir das quais um transgene integrado pode ser expresso; e 5) regiões com recombinação dentro/ao redor do locus. Consequentemente, um total de 7.018 loci genômicos (SEQ ID NO:1 - SEQ ID NO:7.018) foi identificado usando esses critérios específicos. Os critérios específicos são adicionalmente descritos em detalhes abaixo. Hipometilacão [00323] O genoma da soja foi examinado para selecionar loci ge- nômicos ótimos maiores que 1 Kb que foram hipometilados em DNA. Os perfis de metiiação de DNA de tecidos de raiz e broto isolados de Glycine Max cultivar Williams82 foram construídos usando uma abordagem de sequenciamento de genoma inteiro de alto rendimento. O DNA extraído foi submetido ao tratamento com bissulfito que converte as citosinas não metiladas em uraciias, porém, não afeta as citosinas metiladas e, então, sequenciado usando a tecnologia lllumina HiSeq technology (Krueger, F. et al. DNA metilome analysis using short bisul-fite sequencing data. Nature Methods 9, 145 a 151 (2012)). As leituras de sequenciamento bruto foram coletadas e mapeadas no genoma de referência da soja cv. Wilfiams82 usando o software de mapeamento Bismark™, conforme descrito em Krueger F, Andrews SR (2011) Bis-mark: a flexible aligner e metiiation caller for Bisulfite-Seq applications. Bioinformatics 27: 1.571 a 1,572).
[00324] Visto que, durante o processo de conversão de bissulfito, as citosinas na sequência de DNA que são metiladas não se tornam convertidas em uraciias, a ocorrência de bases de citosina nos dados de sequenciamento indica a presença de metiiação de DNA. As leituras que foram mapeadas na sequência de referência foram analisadas para identificar as posições genômicas de resíduos de citosina com suporte para metiiação de DNA. O nível de metiiação para cada base citosina no genoma foi calculado como uma porcentagem do número de leituras metiladas que mapeiam uma localização de base citosina particular para o número total de leituras que mapeiam essa localização. A seguir, explica-se de maneira hipotética como os níveis de meti-lação foram calculados para cada base dentro do genoma da soja. Por exemplo, considera-se que exista uma base citosina na posição 100 no cromossomo 1 da sequência de referência da soja cv. Williams82. Se houver um total de 20 leituras mapeadas na base citosina na posição 100, e 10 dessas leituras forem metiladas, então, o nível de meti- lação para a base citosína na posição 100 no cromossomo 1 é estimado em 50%. Consequentemente, um perfil do nível de metilação para todos os pares de bases de DNA genômico obtidos a partir do tecido de raiz e broto da soja foi calculado. As leituras que podem não ser corretamente mapeadas em localizações peculiares no genoma da soja correspondem às sequências repetitivas que são espelhadas no genoma da soja, e são conhecidas na técnica como predominantemente metiladas.
[00325] Com o uso do protocolo descrito acima, os níveis de metiía- ção para o genoma da soja cv. Williams82 foram medidos. Desse modo, as regiões do genoma da soja que contêm as leituras metiladas indicam que essas regiões do genoma da soja foram metiladas. Inversamente, as regiões do genoma da soja que estavam ausentes das leituras metiladas indicadas nessas regiões do genoma da soja foram não metiladas. As regiões do genoma da soja a partir dos tecidos de broto e raiz que foram não metiladas e não contêm nenhuma leitura metilada são consideradas como regiões "hipometiladas". Para tornar os perfis de metilação de raiz e broto disponíveis para visualização, gráficos de oscilação (http://useastensembl.orq/info/website/upload/wiq. html) foram gerados para cada um dos cromossomos da soja cv. Williams82.
[00326] Após obter o nível de metilação de DNA na resolução de um único par de bases nos tecidos de raiz e broto, conforme descrito acima, o genoma da soja foi examinado usando janelas de 100 bp para identificar as regiões genômicas que são metiladas. Para cada janela analisada no genoma, um nível de metilação de DNA foi obtido calculando-se o nível médio de metilação em cada base citosína naquela janela. As janelas genômicas com um nível de metilação de DNA maior que 1% foram chamadas de regiões genômicas que foram metiladas. As janelas metiladas identificadas nos perfis de raiz e broto foram combinadas para criar um perfil de metilação consensual. Inversamente, as regiões no genoma que não atenderam esses critérios e não foram identificadas como as regiões metiladas no perfil consensual foram chamadas de regiões hipometiladas. A Tabela 1 resume as regiões hipometiladas identificadas. TABELA 1. Perfil de hipometilação de genoma da soia cv. Williams82. 00327] Essas regiões hipometiladas do genoma da soja c.v. WIL-LIAMS82 foram adicionalmente caracterizadas por identificar e selecionar os loci genômicos específicos, à medida que o contexto livre de metilação dessas regiões indicou a presença de cromatina aberta. Desse modo, todas as análises subsequentes foram conduzidas nas regiões hipometiladas identificadas.
Capacidade de Direcionamento [00328] Os sítios hipometilados identificados na soja c.v. WILLI-AMS82 foram adicionalmente analisados para determinar quais sítios eram direcionáveis através da integração mediada por nuclease específica de sítio de um doador de polinucleotídeos. Glycine max é conhe- cida por ser uma cultura paleopoliploide que sofreu duplicações genô-micas em seu histórico genômico (Jackson et al Genome sequence of the palaeopolyploid soybean, Nature 463, 178 a 183 (2010)). O geno-ma da soja é conhecido na técnica por conter longos trechos de DNA altamente repetitivos que são metilados e têm altos níveis de duplicação de sequência. As informações de anotação de regiões repetitivas conhecidas no genoma da soja foram coletadas a partir do Soybean Genome Database (www.sovbase.org. Shoemaker. R.C. et al. SovBa-se, the USDA-ARS soybean qenetics e qenomics database. Nucleic Acids Res. Janeiro de 2010;38(Database issue):D843 a 846.).
[00329] Consequentemente, os sítios hipometilados identificados acima foram examinados para remover quaisquer sítios que se alinharam às regiões repetitivas conhecidas anotadas no genoma da soja. Os sítios hipometilados restantes que passaram por esse primeiro e-xame foram subsequentemente examinados usando uma pesquisa de homologia baseada em BLAST™ de um banco de dados genômico de soja através do software NCBI BLAST™+ (versão 2.2.25) executado usando as configurações de parâmetro padrão (Stephen F. Altschul et al (1997) Gapped BLAST e PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 25:3.389 a 3.402). Como um resultado da triagem BLAST™, quaisquer sítios hipometilados que tiveram correspondências significativas em outro local no genoma, com cobertura de alinhamento de sequência superior a 40%, foram removidos das análises adicionais.
Aqronomicamente Neutros ou Não qênicos [00330] Os sítios hipometilados identificados na soja c.v. William82 foram adicionalmente analisados para determinar quais sítios eram agronomicamente neutros ou não gênicos. Desse modo, os sítios hipometilados descritos acima foram examinados para remover quaisquer sítios sobrepostos ou que continham quaisquer sequências de codificação de soja c.v. William82 endógenas conhecidas ou previstas. Para esse propósito, os dados de anotação de genes conhecidos e informações de mapeamento de dados de etiqueta de sequência expressa (EST) foram coletados a partir do Soybean Genomic Database (www.sovbase.org - os modelos de genes versão 1.1 foram usados, Jackson et al Genome sequence of the palaeopolyploid soybean Natu-re 463, 178 a 183 (2010)). Qualquer região genômica imediatamente 2 Kb a montante e 1 Kb a jusante a um quadro de leitura aberta também foi considerada. Essas regiões a montante e a jusante podem conter elementos reguladores conservados conhecidos ou desconhecidos que são essenciais para a função de gene. Os sítios hipometilados previamente descritos acima foram analisados para a presença dos genes conhecidos (incluindo as regiões 2 Kb a montante e 1 Kb a jusante) e ESTs. Quaisquer sítios hipometilados que se alinharam ou sobrepuseram aos genes conhecidos (incluindo as regiões 2 Kb a montante e 1 Kb a jusante) ou ESTs foram removidos de uma análise a jusante.
Expressão [00331] Os sítios hipometilados identificados na soja c.v. Williams82 foram adicionalmente analisados para determinar quais sítios se encontravam próximos a um gene de soja expresso. A expressão de nível de transcrição de genes de soja foi medida analisando-se os dados de perfilagem de transcriptoma gerados a partir dos tecidos de raiz e broto da soja c.v. Williams82 usando a tecnologia RNAseq™, conforme descrito em Mortazavi et al., Mapping and quantifying mammalian transcriptomes by RNA-Seq. Nat Methods. 2008;5(7):621 a 628, e Shoemaker RC et al., RNA-Seq Atlas of Glycine max: a guide to the soybean Transcriptome. BMC Plant Biol. 5 de agosto de 2010; 10:160. Para cada sítio hipometilado, uma análise foi concluída para identificar quaisquer genes anotados presentes dentro de uma região de 40 Kb próxima ao sítio hipometiíado, e um nível de expressão médio dos genes anotados situados próximos ao sítio hipometiíado. Os sítios hipo-metilados localizados maiores que 40 Kb a partir de um gene anotado com um nível de expressão médio não zero foram determinados a não ser proximais a um gene de soja expresso e foram removidos das análises adicionais.
Recombinacão [00332] Os sítios hipometiíados identificados na soja c.v. Williams82 foram adicionalmente analisados para determinar quais sítios apresentaram evidência de recombinação e podem facilitar a introgressão dos loci genômicos ótimos em outras linhagens de soja através da reprodução convencional. Diversos genótipos de soja são rotineiramente cruzados durante a reprodução convencional para desenvolver linhagens de soja novas e aprimoradas contendo traços de interesse agronômico. Desse modo, os traços agronômicos que são submetidos à introgressão nos loci genômicos ótimos dentro de uma linhagem de soja através da transformação mediada por planta de um transgene devem ter com capacidade para ser adicionalmente submetidos à introgressão em ouras linhagens de soja, especialmente, as linhagens de elite, através da recombinação meiótica durante a reprodução de planta convencional. Os sítios hipometiíados descritos acima foram examinados para identificar e selecionar os sítios que possuíam algum nível de recombinação meiótica. Quaisquer sítios hipometiíados que estavam presentes dentro das regiões cromossômicas caracterizadas como "pontos frios" de recombinação foram identificados e removidos. Na soja, esses pontos frios foram definidos usando um conjunto de dados marcadores gerado a partir da população de mapeamento en-dogâmica recombinante (Williams 82 x PI479752). Esse conjunto de dados consiste em -16.600 marcadores SNP que podem ser fisicamente mapeados na sequência de genoma de referência de Glycine max.
[00333] As frequências de recombinação meiótica entre qualquer par de marcadores genômicos de soja ao longo de um cromossomo foram calculadas com base na razão entre a distância genética entre os marcadores (em centimorgan (cM)) e a distância genética entre os marcadores (em megabases (Mb)). Por exemplo, se a distância genética entre um par de marcadores foi 1 cM, e a distância física entre o mesmo par de marcadores foi 2 Mb, então, a frequência de recombinação calculada foi determinada como 0,5 cM/Mb. Para cada sítio hí-pometilado identificado acima, um par de marcadores pelo menos 1 Mb distante foi escolhido e a frequência de recombinação foi calculada. A Implantação desse método foi usada para calcular a frequência de recombinação dos sítios hipometilados. Quaisquer sítios hipometi-lados com uma frequência de recombinação de 0 cM/Mb foram identificados e removidos da análise adicional. As regiões hipometiladas restantes que compreendem uma frequência de recombinação maior que 0 cM/Mb foram selecionadas para análise adicional.
Identificação de Loci genômicos ótimos [00334] A aplicação dos critérios de seleção descritos acima resultou na identificação de um total de 90.325 loci genômicos ótimos a partir do genoma da soja. A Tabela 2 resume os comprimentos dos loci genômicos ótimos identificados. Esses loci genômicos ótimos possuem as seguintes características: 1) loci genômicos hipometilados maiores que 1 Kb de comprimento; 2) loci genômicos que são direcionáveis através da integração mediada por nuclease específica de sítio de um doador de polinucleotídeos; 3) loci genômicos que são agronomica-mente neutros ou não gênicos; 4) loci genômicos a partir dos quais um transgene pode ser expresso; e 5) evidência de recombinação dentro dos loci genômicos. De todos os loci genômicos ótimos descritos na Tabela 2, apenas os loci genômicos ótimos maiores que 1 Kb foram adicionalmente analisados e utilizados para direcionamento de uma sequência polinucleotídica doadora. As sequências desses loci genô-micos ótimos são reveladas como SEQ ID NO:1 - SEQ ID NO:7.018. De maneira coletiva, esses loci genômicos ótimos são locações dentro do genoma da soja que podem ser direcionadas com uma sequência polinucleotídica doadora, conforme adicionalmente demonstrado abaixo no presente documento. TABELA 2. Listas da faixa de tamanho de loci genômicos ótimos identificados no genoma da soja que são hipometilados, mostram evidência de recombinação, direcionáveis, agronomicamente neutros ou não gê-nicos e se encontram próximos a um gene endóqeno expresso.
Exemplo 2: Distribuição F e Análise de Componentes Principais para Aglomerar Loci genômicos ótimos a partir da Soía [00335] Os 7.018 loci genômicos ótimos identificados (SEQ ID NO: 1- SEQ ID NO: 7.018) foram adicionalmente analisados com o uso dos métodos estatísticos de Análise de Componentes Principais e distribuição F para definir uma população representativa de aglomerados para agrupamento dos loci genômicos ótimos.
Análise de Distribuição F
[00336] Os 7.018 loci genômicos ótimos identificados foram estatisticamente analisados com o uso de uma análise estatística de distribuição de probabilidade contínua. Como uma modalidade da análise estatística de distribuição de probabilidade contínua, um teste de distribuição F foi concluído para determinar um número representativo dos loci genômicos ótimos. A análise de teste de distribuição F foi concluída com o uso de equações e métodos conhecidos pelos elementos versados na técnica. Para mais orientação, a análise de teste de distribui- ção F, conforme descrito em K.M Remund, D. Dixon, DL. Wright e LR. Holden. Statistical considerations in seed purity testing for transgenic traits. Seed Science Research (2001) 11, 101 a 119, incorporado no presente documento a título de referência, é um exemplo não limitativo de um teste de distribuição F. O teste de distribuição F supõe a amostragem aleatória dos loci genômicos ótimos, de modo que quaisquer loci não válidos sejam uníformemente distribuídos ao longo dos 7.018 loci genômicos ótimos, e que o número de loci genômícos ótimos a-mostrados é 10% ou menos da população total de 7.018 loci genômicos ótimos.
[00337] A análise de distribuição F indicou que 32 dos 7.018 loci genômicos ótimos forneceram um número representativo dos 7.018 foci genômicos ótimos, em um nível de confiança de 95%. Consequentemente, a análise de distribuição F mostrou que se 32 loci genômicos ótimos foram testados e todos foram direcionáveis com uma sequência polinucleotídica doadora, então, esses resultados podem indicar que 91 ou more dos 7.018 loci genômicos ótimos são positivos no nível de confiança de 95%. A melhor estimativa da validação da porcentagem total dos 7.018 loci genômicos ótimos pode ser se 100% dos 32 loci genômicos ótimos testados forem direcionáveis. Consequentemente, 91% é realmente o limite inferior da percentagem verdadeira validada no nível de confiança de 95%. Esse limite inferior se baseia no quantil 0,95 da distribuição F, para o nível de confiança de 95% (Remund K, Dixon D, Wright D, e Holden L. Statistical considerations in seed purity testing for transgenic traits. Seed Science Research (2001) 11, 101 a 119).
Análise de Componentes Principais [00338] A seguir, um método estatístico de Análise de Componentes Principais (PCA) foi concluído para avaliar e visualizar adicionalmente as similaridades e diferenças do conjunto de dados que com- preende os 7.018 loci genômicos ótimos identificados para permitir a amostragem de diversos loci para validação de direcionamento. A PCA envolve um algoritmo matemático que transforma um número maior de variáveis correlacionadas em um menor número de variáveis não correlacionadas, denominados componentes principais.
[00339] A PCA foi concluída nos 7.018 loci genômicos ótimos identificados ao gerar um conjunto de recursos ou atributos calculáveis que pode ser usado para descrever os 7.018 loci genômicos ótimos identificados. Cada recurso é numericamente calculável e é definido, de maneira específica, para capturar o contexto genômico e epigenômico dos 7,018 loci genômicos ótimos identificados. Um conjunto de 10 recursos para cada loci genômicos ótimos de soja foi identificado e é descrito em maiores detalhes abaixo. 1. Comprimento dos loci genômicos ótimos [00340] a. O comprimento dos loci genômicos ótimos nesse conjunto de dados variou de um mínimo de 1.000 Bp a um máximo de 5.713 Bp. 2. Frequência de recombinação em uma região de 1 MB ao redor dos loci genômicos ótimos [00341] a. Na soja, a frequência de recombinação para uma localização cromossômica foi definida usando um conjunto de dados marcadores de alta resolução interna gerado a partir de múltiplas populações de mapeamento.
[00342] b. as frequências de recombinação entre quaisquer pares de marcadores ao longo do cromossomo foram calculadas com base na razão entre a distância genética entre os marcadores (em centi-morgan (cM)) e a distância genética entre os marcadores (em Mb). Por exemplo, se a distância genética entre um par de marcadores for 1 cM e a distância física entre os mesmos pares de marcadores for 2 Mb, a frequência de recombinação calculada é 0,5 cM/Mb. Para cada locus genômico ótimo, um par de marcadores pelo menos 1 Mb afastado foi escolhido e a frequência de recombinação foi calculada dessa maneira. Esses valores de recombinação variaram a partir de um mínimo de 0,01574 cM/Mb a um máximo de 83,52 cM/Mb. 3. Nível de peculiaridade de sequência loci qenômicos ótimos [00343] á. Para cada locus genômico ótimo, a sequência nucleotídi-ca dos loci genômicos ótimos foi examinada contra o genoma da soja cv. Williams82 usando uma pesquisa de homologia baseada em BLAST™ usando o software NCBI BLAST™+ (versão 2.2.25) executado usando as configurações de parâmetro padrão (Stephen F. Alts-chul et al (1997), "Gapped BLAST e PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3.389 a 3.402). À medida que essas sequências de loci genômicos ótimos são identificadas a partir do genoma da soja cv. Williams82, o primeiro resultado BLAST™ identificado através dessa pesquisa representa própria sequência soja c.v. Williams82. O segundo resultado BLAST™ para cada sequência de locus genômico ótimo foi identificado e a cobertura de alinhamento (representada como a porcentagem dos loci genômicos ótimos cobertos pelo resultado BLAST™) do resultado foi usada como uma medida de peculiaridade da sequência de loci genômicos ótimos dentro do genoma da soja. Esses valores de cobertura de alinhamento para o segundo resultado BLAST™ variaram em um mínimo de 0% a um máximo de 39,97% da identidade de sequência. Quaisquer sequências que se alinharam em níveis mais altos de identidade de sequência foram consideradas. 4. Distância a partir dos loci genômicos ótimos até o gene mais próximo em sua vizinhança [00344] a. As informações de anotação de gene e a localização de genes conhecidos no genoma da Soja foram extraídas a partir do Soy-bean Genome Database (disponível em, www.sovbase.org - os mode- los de genes versão 1.1 foram usados, Jackson et al Genome sequen-ce of the palaeopolyploid soybean, Nature 463, 178 a 183 (2010)). Para cada locus genômico ótimo, o gene mais próximo anotado, considerando tanto as localizações a montante como a jusante, foi identificado e a distância entre a sequência de loci genômicos ótimos e o gene foi medida (em Bp). Por exemplo, se um locus genômico ótimo se situa no cromossomo Gm01 a partir da posição 2.500 até a posição 3.500, e o gene mais próximo a esse locus genômico ótimo se situa no cromossomo Gm01 a partir da posição 5.000 até a posição 6.000, a distância a partir dos loci genômicos ótimos até esse gene mais próximo é calculada como 1.500 Bp. Esses valores para os 7.018 do conjunto de dados de loci genômicos ótimos a partir de um mínimo de 1.001 Bp até um máximo de 39.482 Bp. 5. % de GC na sequência de loci genômicos ótimos [00345] a. Para cada locus genômico ótimo, a sequência nucleotidi-ca foi analisada para estimar o número de bases Guanina e Citosina presentes. Essa contagem foi representada como uma porcentagem do comprimento de sequência de cada locus genômico ótimo e fornece uma medida para a % de GC. Esses valores de % de GC para o conjunto de dados de loci genômicos ótimos de soja se encontram na faixa de 14,4% a 45,9%. 6. Número de genes em uma vizinhança de 40 Kb ao redor da sequência de loci genômicos ótimos [00346] a. As informações de anotação de gene e a localização de genes conhecidos no genoma da soja cv. Williams82 foram extraídas do Soybean Genome Database. Para cada uma das 7.018 sequências de loci genômicos ótimos, uma janela de 40 Kb ao redor da sequência de loci genômicos ótimos foi definida e o número de genes anotados com localizações sobrepostas a essa janela foi contado. Esses valores variaram a partir de um mínimo de 1 gene até um máximo de 18 genes dentro da vizinhança de 40 Kb. 7, Expressão genética média em uma vizinhança de 40 Kb ao redor dos toei genômicos ótimos [00347] a. A expressão de nível de transcrição de genes de soja foi medida analisando-se os dados de perfilagem de transcriptoma disponíveis gerados a partir dos tecidos de raiz e broto da soja c.v. Willi-ams82 usando a tecnologia RNAseq™. As informações de anotação de gene e a localização dos genes conhecidos no genoma da soja cv. Wil!iams82 foram extraídas a partir do Soybean Genome Database. Para cada locus genômico ótimo, os genes anotados dentro do genoma da soja cv. Williams82 que estavam presentes em uma vizinhança de 40 Kb ao redor dos loci genômicos ótimos foram identificados. Os níveis de expressão para cada um dos genes foram extraídos dos perfis de transcriptoma descritos nas citações mencionadas e um nível de expressão genética médio foi calculado. Os valores de expressão de todos os genes dentro do genoma de soja variam muito. Os valores de expressão médios para todos os 7.018 conjuntos de dados de loci ge-nômtcos ótimos variaram a partir de um mínimo de 0,000415 até um máximo de 872,7198. 8. Nível de ocupação de nucleossomo ao redor dos loci genômicos ó-timos [00348] a. O entendimento do nível de ocupação de nucleossomo para uma sequência nucleotídica particular fornece informações sobre as funções cromossômicas e o contexto genômico da sequência. O pacote estatístico NuPoP™ foi usado para prever a ocupação de nucleossomo e o mapa de posicionamento de nucleossomo mais provável para qualquer tamanho de sequências genômicas (Xi, L., Fondufe-Mittendor, Y., Xia, L, FJatow, J., Widom, J. e Wang, J.-P., Predicting nucleosome positioning using a duration Hidden Markov Model, BMC Bioinformatics, 2010, doi:101186/1471-2105-11-346.). Para cada um dos 7,018 toei genômicos ótimos, a sequência nucteotídica foi submetida à análise com o software NuPoP™ e a pontuação de ocupação de nucleossomo foi calculada, Essas pontuações de ocupação de nucle-ossomo para o conjunto de dados de loci genômicos ótimos de soja variaram a partir de um mínimo de 0 até um máximo de 0,494. 9. Localização relativa dentro do cromossomo (proximidade com o centrômero) [00349] a, Um centrômero é uma região em um cromossomo que une duas cromátides irmãs. As porções de um cromossomo em cada lado do centrômero são conhecidas como braços cromossômicos. As localizações genômicas dos centrômeros em todos os 20 cromossomos de Soja foram identificadas na sequência de referência publicada da soja cv, Wilíiams82 (Jackson et al Genome sequence of the paiae-opolyploid soybean Nature 463, 178 a 183 (2010)). As informações sobre a posição do centrômero em cada um dos cromossomos de Soja e os comprimentos dos braços cromossômicos foram extraídos a partir do Soybean Genome Database. Para cada locus genômico ótimo, a distância genômica a partir da sequência de iocus genômico ó-timo até o centrômero do cromossomo que se situa no mesmo, é medida (em Bp). A localização relativa dos loci genômicos ótimos dentro do cromossomo é representada como a razão entre sua distância genômica e o centrômero em relação ao comprimento do braço cromos-sômico específico que se situa no mesmo. Esses valores de localização relativos para o conjunto de dados de loci genômicos ótimos de soja variaram em uma razão partir de um mínimo de 0 até um máximo de 0,99682 da distância genômica. 10. Número de loci genômicos ótimos em uma região de 1 Mb [00350] a. Para cada locus genômico ótimo, uma janela genômica de 1 Mb ao redor da localização de loci genômicos ótimos foi definida e o número de outros loci genômicos ótimos adicionais presentes den- tro ou sobrepostos a essa região foi calculado, incluindo os loci genô-micos ótimos sob consideração. O número de loci genômicos ótimos em um 1 Mb variaram a partir de um mínimo de 1 até um máximo de 49.
[00351] Todos os 7.018 loci genômicos ótimos foram analisados usando os recursos e atributos descritos acima. Os resultados ou valores para a pontuação dos recursos e atributos de cada locus genômico ótimo são adicionalmente descritos na Tabela 3 (incorporados no presente documento a título de referência como um arquivamento eletrônico separado). O conjunto de dados resultante foi usado no método estatístico PCA para aglomerar os 7.018 loci genômicos ótimos identificados nos aglomerados. Durante o processo de aglomeração, após estimar os componentes principais "p" dos loci genômicos ótimos, a atribuição dos loci genômicos ótimos a um dos 32 aglomerados prosseguiu no espaço euclidiano "p" dimensional. Cada um dos eixos "p" foi dividido em intervalos "k”. Os loci genômicos ótimos atribuídos ao mesmo intervalo foram agrupados em conjunto para formar os aglomerados. Com o uso dessa análise, cada eixo geométrico PCA foi dividido em dois intervalos, que são escolhidos com base em informações a priori que se referem ao número de aglomerados requerido para a validação experimental. Toda a análise e a visualização dos aglomerados resultantes foram realizadas com o software Molecular Operating Environment™ (MOE) disponível junto à Chemical Computing Group Inc. (Montreal, Quebec, Canadá).
[00352] A abordagem PCA foi usada para aglomerar o conjunto de 7.018 loci genômicos ótimos identificados em 32 aglomerados distintos com base em seus valores de recurso, conforme descrito acima. Durante o processo PCA, cinco componentes principais (PC) foram gerados, com os três primeiros PCs contendo cerca de 90% da variação total no conjunto de dados (Tabela 4). Esses três PCAs foram usados para representar graficamente os 32 aglomerados em uma representação gráfica tridimensional (Figura 1). Após o processo de aglomeração ser concluído, um locus genômico ótimo representativo foi escolhido a partir de cada aglomerado. Isso foi realizado escolhendo-se um locus genômico ótimo selecionado dentro de cada cluster que se encontra mais próximo ao centroide desse aglomerado (Tabela 4). As localizações cromossômicas dos 32 loci genômicos ótimos representativos são uniformemente distribuídas entre os 20 cromossomos de soja e não são orientadas em direção a nenhuma localização genômica particular, conforme mostrado na Figura 2.
TABELA 4. Descrição dos 32 loci genômicos ótimos representativos de soia identificados a partir da PCA
Seleção Final de Loci Genômicos para Direcionamento de uma Sequência Polinucleotídica Doadora de Polinucleotídeos [00353] Um total de 32 loci genômicos foi identificado e selecionado para direcionamento com uma sequência polinucleotídica doadora a partir dos 7.018 loci genômicos que foram aglomerados dentro de 32 aglomerados distintos. Para cada um dos 32 aglomerados, um locus genômico representativo (mais próximo ao centroide do aglomerado, conforme descrito acima, na Tabela 4) ou um locus adicional com linhagem de homologia a direcionamento foi escolhido. Os loci genômicos ótimos adicionais foram selecionados pela primeira triagem de todas as 7.018 sequências genômicas ótimas selecionadas contra um banco de dados de genoma inteiro que consiste em dados de sequência de DNA genômico tanto para Glycine max c.v. Maverick (linhagem de triagem de transformação e direcionamento) como para Glycine max c.v. Williams82 (linhagem de referência) para determinar a cobertura (quantos loci genômicos ótimos estavam presentes em ambos os genomas) e a porcentagem da identidade de sequência no genoma de ambas as linhagens. Os loci genômicos ótimos com 100% de cobertura (todo o comprimento de sequência dos loci ótimos alinhado entre ambos os genomas) e 100% de identidade nos bancos de dados genômicos Williams82 foram selecionados para validação de direcionamento. Outros critérios, tais como, tamanho de loci genômicos, extensão de peculiaridade, teor de % de GC e distribuição cromossômica dos loci genômicos ótimos também foram levados em consideração na seleção dos loci genômicos ótimos adicionais. A localização cromossômica dos 32 loci genômicos ótimos selecionados e a configuração genômica específica de cada locus genômico ótimo de soja são mostradas na Figura 3 e na Tabela 5, respectivamente. TABELA 5. Descrição dos 32 loci genômicos ótimos selecionados de soía escolhidos para validação de direcionamento. A partir desses loci genômicos ótimos listados nessa tabela, a exemplificacão de divagem e o direcionamento de 32 loci genômicos ótimos de soia são representativos do total identificado de 7.018 loci genômicos ótimos selecionados de soía. 00354] Um grande conjunto de 7.018 localizações genômicas foi identificado no genoma da soja como loci genômicos ótimos para direcionamento com uma sequência polinucleotídica doadora que usa tecnologias de engenharia de genoma de precisão. Uma abordagem de análise estatística foi implantada para agrupar os 7.018 loci genômicos selecionados em 32 aglomerados com contextos genômicos similares e para identificar um subconjunto de 32 loci genômicos selecionados representativos do conjunto de 7.018 loci genômicos selecionados. Os 32 loci representativos foram validados como loci genômicos ótimos através do direcionamento com uma sequência polinucleotídica doadora. Realizando-se a análise estatística PCA para os valores numéricos gerados para os dez conjuntos de recursos ou atributos que são descritos acima, os dez recursos ou atributos foram computados em componentes PCA com menos dimensões. Desse modo, os componentes PCA foram reduzidos a cinco dimensões que são representativas dos dez recursos ou atributos descritos acima (Tabela 6). Cada componente PCA é equivalente a uma combinação dos dez recursos ou atributos descritos acima. A partir desses componentes PCA que compreendem cinco dimensões, quando computados usando a análise estatística PCA, os 32 aglomerados foram determinados. TABELA 6. Os cinco componentes de PCA (PCA1, PCA2. PCA3, PCA4 e PCA5) que definem cada um dos 32 aglomerados e as sequências (SEQ ID NO:1 a SEQ ID NO:7.Q18) que compftem cada aglomerado. Essas cinco dimensões sâo representativas dos dez recursos ou atributos descritos acima que são foram usados para identificar os loci qenômicos ótimos. Os valores mínimos (Min), médios, medianos e máximos (Máx) para cada componente de PCA sâo fornecidos.__________________________________________________________________________________________________________________________ EXEMPLO 3: PROJETO DE DEDOS DE ZINCO PARA LIGAR LOC1 GENÔMICOS EM SOJA
[00355] As proteínas dedo de zinco direcionadas contra as sequências de DNA identificadas dos loci genômicos representativos foram projetadas conforme descrito anteriormente. Consulte, por exemplo, Urnov et ai, (2005) Nature 435:646 a 551. As hélices de reconhecimento e sequência-alvo exemplificadoras são mostradas na Tabela 7 (projetos de regiões de hélice de reconhecimento) e Tabela 8 (sítios-alvo). Na Tabela 8, os nucleotídeos no sítio-alvo que são contatados pelas hélices de reconhecimento de ZFP são indicados em letras mai-úsculas e os nucleotídeos não contatados são indicados em letras minúsculas. Os sítios-alvo de nuclease dedo de zinco (ZFN) foram projetados para todos os 32 loci genômicos ótimos selecionados descritos anteriormente. Inúmeros projetos de ZFP foram desenvolvidos e testados para identificar os dedos que se ligam com o nível maior de eficiência aos 32 sítios-alvo de loci genômicos representativos diferentes que foram identificados e selecionados em soja, conforme descrito a-cima. As hélices de reconhecimento de ZFP específicas (Tabela 7) que se ligam com o nível maior de eficiência às sequências de reconhecimento de dedo de zinco foram usadas para o direcionamento e integração de uma sequência doadora dentro do genoma de soja. TABELA 7. Projetos de dedo de zinco para os loci qenômicos selecionados em soia (N/A indica "não aplicável"). TABELA 8. Sítio-alvo de dedo de zinco de loci qenômicos selecionados em soia [00356] Os projetos de dedo de zinco de loci genômicos representativos de soja foram incorporados em vetores de expressão de dedo de zinco que codificam uma proteína que tem pelo menos um dedo com uma estrutura CCHC. Consulte a publicação de patente n2 U.S. 2008/0182332. Em particular, o último dedo em cada proteína tinha uma cadeia principal de CCHC para a hélice de reconhecimento. As sequências de codificação de dedo de zinco não canônico foram fundidas ao domínio de nuclease da enzima de restrição Fok\ do tipo IIS (aminoácidos 384 a 579 da sequência de Wah et ai, (1998) Proc. Natl. Acad. Sei. EUA 95:10564 a 10569) através de um ligante ZC de quatro aminoácidos e um sinal de localização nuclear de opaque-2 otimizado para soja para formar nucleases de dedo de zinco (ZFNs). Consulte a patente n2 U.S. 7.888.121. Os dedos de zinco para os diversos domínios funcionais foram selecionados para o uso in vivo. Dentre as inúmeras ZFNs que foram projetadas, produzidas e testadas para se ligar ao suposto sítio-alvo genômico, as ZFNs descritas na Tabela 8 acima foram identificadas como tendo atividade in vivo e foram caracterizadas como tendo capacidade para ligar e clivar de modo eficaz os sí-tios-alvo de polinucleotídeo genômico de soja peculiar in planta. CONJUNTO DE CONSTRUTOS DE ZFN
[00357] Os vetores de plasmídeo contendo os construtos de expressão de gene de ZFN foram projetados e completos com o uso de habilidades e técnicas comumente conhecidas na técnica (consulte, por exemplo, Ausubel ou Maniatis). Cada sequência de codificação de ZFN foi fundida a uma sequência que codifica um sinal de localização nuclear de opaque-2 (Maddaloni et ai, (1989) Nuc. Acids Res. 17:7532), que foi posicionada a montante da nuclease dedo de zinco. As sequências de codificação de dedo de zinco não canônicas foram fundidas ao domínio de nuclease da enzima de restrição Fokl do tipo IIS (aminoácidos 384 a 579 da sequência de Wah et ai (1998) Proc. Natl. Acad. Sei. EUA 95:10564 a 10569). A expressão das proteínas de fusão foi conduzida por um promotor constitutivo forte a partir do vírus mosaico da nervura da mandioca. O cassete de expressão tam- bém inclui uma 3' UTR de ORF23 de Agrobacterium tumefaciens. A de auto-hidrólise 2A que codifica a sequência de nucleotídeo do vírus Thosea asigna (Szymczak et ai, (2004) Nat Biotechnol. 22:760 a 760) foi adicionada entre as duas proteínas de fusão de nuclease dedo de zinco que foram clonadas na construto.
[00358] Os vetores de pfasmídeo foram montados com o uso da IN-FUSION™ Advantage Technology (Clontech, Mountain View, CA). As endonucleases de restrição foram obtidas junto ao New England Bio-Labs (Ipswich, MA) e T4 DNA Ligase (Invitrogen, Carlsbad, CA) foi u-sada para a ligação de DNA. As preparações de piasmídeo foram executadas com o uso do kit de piasmídeo NUCLEOSPIN® (Macherey-Nagel Inc., Bethlehem, PA) ou do Plasmid Midi Kit (Qiagen) seguindo as instruções dos fornecedores. Os fragmentos de DNA foram isolados com o uso de QIAQUICK GEL EXTRACTION KIT™ (Qiagen) após a eletroforese em gel de tris-acetato e agarose. As colônias de todas as reações de ligação foram inicialmente examinadas através da digestão de restrição de minipreparação de DNA. O DNA de piasmídeo de clones selecionados foi sequenciado por um fornecedor de sequencia-mento comercial (Eurofins MWG Operon, Fluntsville, AL). Os dados de sequência foram reunidos e analisados com o uso do software SE-QUENCHER™ (Gene Codes Corp., Ann Arbor, Ml). Os plasmídeos foram construídos e confirmados através da digestão de enzima de restrição e através do sequenciamento de DNA.
CLONAGEM DE DEDO DE ZINCO ATRAVÉS DO FLUXO DE TRABALHO AUTOMATIZADO
[00359] Um subconjunto de vetores de nuclease dedo de zinco foi clonado através de um conduto de construto de DNA automatizado. Em geral, o conduto automatizado resultou em construtos de vetor com arquitetura de ZFN idêntica, conforme descrito anteriormente. Cada monômero de dedo de zinco, o qual confere a especificidade de ligação de DNA da ZFN, foi dividido em 2 a 3 sequências peculiares em um motivo de aminoácido de KPF. Tanto nas terminações 5' como 3' dos fragmentos de ZFN foram modificadas com a inclusão de um sítio de reconhecimento Bsal (GGTCTCN) e saliências derivadas. As saliências foram distribuídas de tal modo que uma montagem de 6 a 8 partes resultasse somente no clone de expressão de comprimento total desejado. Os fragmentos de DNA modificados foram sintetizados novamente (Synthetic Genomics Incorporated, La Jolla, CA). Uma única cadeia principal de dicotiledônea, pDAB118796, foi usada em todos os construtos de ZFN de soja. A mesma continha o promotor do vírus mosaico da mandioca e o Opaque2 NLS, assim como o domínio de Fokl e a 3'UTR de Orf23 a partir de Agrobacterium tumefaciens. Foi clonado entre o Opaque 2 NLS e o domínio de Fokl um gene de SacB flanqueado por Bsal a partir de Bacillus subtilis. Quando os supostos eventos de ligação foram plaqueados em meios contendo sacarose, o cassete de SacB age como um agente de seleção negativa que reduz ou elimina a contaminação de cadeia principal do vetor. Uma segunda parte utilizada repetidamente em todas as construções foi pDAB117443. Esse vetor contém o primeiro domínio Fokl de monô-mero, a sequência intermitente T2A e o segundo monômero Opaque2 NLS, todos flanqueados por sítios de Bsal.
[00360] Com o uso desses materiais como a biblioteca de partes de DNA de ZFN, um Freedom Evo 150® (TECAN, Mannedorf, Suíça) manipulou a adição de 75 a 100 ng de cada plasmídeo de DNA ou fragmento sintetizado a partir de tubos com código de barras 2D em uma placa de PCR (ThermoFisher, Waltham, MA). Bsal (NEB, Ipswich, MA) e T4 DNA ligase (NEB, Ipswich, MA) suplementado com proteína albumina de soro bovino (NEB, Ipswich, MA) e tampão de T4 DNA Ligase (NEB, Ipswich, MA) foram adicionados à reação. As reações foram submetidas a ciclos (25X) com incubações por 3 minutos a 37 °C e 4 minutos a 16 °C, C1000 Touch Thermo Cycler® (BioRad, Hercules CA). O material ligado foi transformado e examinado em Top10 cells® (Life Technologies Carlsbad, CA) com as mãos ou com o uso de um selecionador de colônia Qpix460 e LabChip GX® (Perkin Elmer, Wal-tham, MA). As colônias de digestão correta consistiram na sequência confirmada fornecida para a transformação da planta.
CONJUNTO DE CONSTRUTO DOADOR UNIVERSAL
[00361] Para suportar o teste rápido de um grande número de loci alvo, uma sequência de sistema de doador universal flexível e inovadora foi projetada e construída. A sequência de polinucleotídeo doado-ra universal foi compatível com a análise e metodologias de construto de vetor de alto rendimento. O sistema doador universal foi composto de pelo menos três domínios modulares: um domínio de ligação de ZFN variável, um domínio de recursos definidos por usuário e analítico não variável e uma cadeia principal de plasmídeo simples para o aumento de vetor. A sequência de polinucleotídeo doadora universal não variável foi comum a todos os doadores e permite o projeto de um conjunto finito de ensaios que podem ser usados através de todos os sí-tios-alvo de soja, fornecendo, assim, a uniformidade em avaliação de direcionamento e reduzindo os tempos de ciclo analítico. A natureza modular desses domínios permitiu a montagem de doador de alta taxa de rendimento. Adicionalmente, a sequência de polinucleotídeo doadora universal tem outros recursos peculiares voltados para a simplificação da análise a jusante e otimização da interpretação dos resultados. Os mesmos continham uma sequência de sítio de restrição assimétrico que permite a digestão de produtos de PCR em tamanhos diagnosticamente previstos. As sequências que compreendem estruturas secundárias, as quais se esperava que fossem problemáticas em amplificação de PCR, foram removidas. A sequência de polinucleotídeo doadora universal foi pequena em tamanho (menor que 3,0 Kb). Final- mente, a sequência de polinucleotídeo doadora universal foi construída sob a cadeia principal de pUC19 de cópia elevada que permite que uma grande quantidade de DNA de teste seja volumosa em tempo hábil.
[00362] Como uma modalidade, um plasmídeo de exemplo que compreende uma sequência de polinucleotídeo doadora universal é fornecido como pDAB124280 (SEQ ID Ν0.7561 e Figura 7). Em uma modalidade adicional, uma sequência de polinucleotídeo doadora universal é fornecida como: pDAB124281, SEQ ID NO:7562, Figura 8; pDAB121278, SEQ ID NO:7563, Figura 9; pDAB123812, SEQ ID NO:7564, Figura 10; pDAB121937, SEQ ID NO:7565, Figura 11; pDAB123811, SEQ ID NO:7566, Figura 12; e, pDAB124864 SEQ ID NO:7567, Figura 13. Em outra modalidade, as sequências adicionais que compreendem a sequência de polinucleotídeo doadora universal com sequência de codificação com expressão funcional ou sequências de codificação com expressão não funcional (sem promotor) podem ser construídas (Tabela 11). TABELA 11: As diversas sequências de domínio universal que foram transformadas nos protoplastos de célula de planta para a integração mediada por doador dentro do qenoma de soía são fornecidas. Os diversos elementos do sistema de plasmídeo de domínio universal são descritos e identificados pela posição de par de bases na SEQ ID NO: anexada. "N/A" significa não aplicável.
[00363] A sequência de polinucleotídeo doadora universal foi um sistema doador modular pequeno de 2 a 3 Kb liberado como um plas-mídeo. Esse foi um doador mínimo, que compreende 1,2, 3, 4, 5, 6t 7, 8, 9 ou mais sítios de ligação de ZFN, uma região de modelo curta de 100 a 150 bp mencionada como “DNA X" ou “Sequência UZI" (SEQ ID NO:7568) que porta sítios de restrição e sequências de DNA para sequências de codificação ou projeto de iniciador, e uma cadeia principal de plasmídeo simples (Figura 4). O píasmídeo inteiro foi inserido através de NHEJ seguindo as quebras de filamento duplo de DNA no sítio de ligação de ZFN adequado; os sítios de ligação de ZFN podem ser incorporados em conjunto. Essa modalidade de uma sequência de polinucleotídeo doadora universal foi mais adequada para a triagem rápida de sítios-afvo e ZFNs, e as sequências que foram difíceis de amplificar foram minimizadas no doador. Os doadores universais sem a sequência "UZI", mas que portam um ou mais sítios de ZFN, também têm sido gerados.
[00364] Em uma modalidade adicional, a sequência de polinucleotídeo doadora universal foi composta de pelo menos 4 módulos e porta sítios de ligação de ZFN, braços de homologia, DNA X como apenas a peça analítica de aproximadamente 100 bp ou sequências de codificação. Essa modalidade da sequência de polinucleotídeo doadora universal foi adequada para a interrogação de inserção de gene mediada por HDR em uma variedade de sítios-alvo, com várias ZFNs (Figura 5).
[00365] A sequência de polinucleotídeo doadora universal pode ser usada com todas as moléculas de direcionamento com domínios de ligação de DNA definidos, com dois modos de inserção de doador direcionado (NHEJ/HDR). Como tal, quando a sequência de polinucleotídeo doadora universal foi coliberada com o construto de expressão de ZFN adequada, o vetor doador e o genoma de soja foi cortado em um local específico estipulado pela ligação da ZFN particular. Uma vez linearizado, o doador pode ser incorporado no genoma por NHEJ ou HDR. As diferentes considerações analíticas no projeto de vetor podem ser, então, exploradas para determinar o dedo de zinco que maximiza a liberação eficaz de integração direcionada.
EXEMPLO 4: PROCEDIMENTOS DE TRANSFORMAÇÃO DE SOJA
[00366] Antes da liberação para protoplastos de Glycine Máx. c.v. Maverick, o DNA de plasmídeo para cada construto de ZFN foi preparado a partir das culturas de E. coli com o uso do PURE YIELD PLASMID MAXIPREP SYSTEM® (Promega Corporation, Madison, Wl) ou PLASMID MAXI KIT® (Qiagen, Valencia, CA), seguindo as instruções dos fornecedores.
ISOLAMENTO DE PROTOPLASTO
[00367] Os protoplastos foram isolados a partir de uma cultura de suspensão de Maverick derivada do calo produzido a partir de explan-tes de folha. As suspensões foram subcultivadas a cada 7 dias em meio de LS fresco (Linsmaier e Skoog 1965) contendo 3% (em peso por volume) de sacarose, 0,5 mg/l de 2,4-D, e 7 g de bactoagar, pH 5.7. Para o isolamento, trinta mililitros de uma cultura de suspensão de Maverick 7 dias após a subcultura foram transferidos para um tubo cônico de 50 ml e centrifugado em 200 g por 3 minutos, rendendo cerca de 10 ml de volume de célula assentado (SCV) por tubo. O sobrena-dante foi removido e vinte mililitros da solução de enzima (0,3% de pectoliase (320952; MP Biomedicals), 3% de celulase ("Onozuka" R10™; Yakult Pharmaceuticals, Japão) em solução de MMG (4 mM de MES, 0,6 M de manitol, 15 mM de MgCI2, pH 6,0) foram adicionados para cada 4 SCV de células de suspensão e os tubos foram embalados com Parafilm™. Os tubos foram colocados em uma plataforma oscilante de um dia para o outro (cerca de 16 a 18 h) e uma alíquota das células digeridas foi visualizada por meio de microscópio para as- segurar que a digestão da parede celular foi suficiente.
PURIFICAÇÃO DE PROTOPLASTO
[00368] Um método de transformação com base em protoplasto de soja (Glycine Máx. c.v. Maverick) foi desenvolvido e usado para a transformação de protoplasto de soja. Os protoplastos foram isolados a partir de uma cultura de suspensão de Maverick derivada do calo produzido a partir de explantes de folha. As técnicas fornecidas abaixo descrevem o método. As suspensões de célula de soja foram subculti-vadas a cada 7 dias por uma diluição de 1:5 em meio de LS fresco (Linsmaier e Skoog 1965) contendo 3% (peso por volume) de sacaro-se, 0,5 mg/l de 2,4-D e 7 g de bactoagar, pH 5,7 Todos os experimentos foram executados começando 7 dias após a subcultura com base no protocolo descrito abaixo.
ISOLAMENTO DE PROTOPLASTO
[00369] Trinta milímetros de uma cultura de suspensão de soja c.v. Maverick, 7 dias após a subcultura, foram transferidos para um tubo cônico de centrífuga de 50 ml e centrifugados em 200 g por 3 minutos, rendendo cerca de 10 ml de volume de célula assentada (SCV) por tubo. O sobrenadante foi removido sem perturbar o pélete de célula. Vinte milímetros da solução de enzima (0,3% de pectoliase (320952; MP Biomedicals), 3% de celulase ("Onozuka" R10™; Yakult Pharma-ceuticals, Japão) em solução de MMG (4 mM de MES, 0,6 M de mani-tol, 15 mM de MgCI2, pH 6,0) foram adicionados para cada 4 SCV de células de suspensão e os tubos foram embalados com Parafilm™. Os tubos foram colocados em uma plataforma oscilante de um dia para o outro (cerca de 16 a 18 h). Na manhã seguinte, uma alíquota das células digeridas foi visualizada por meio de microscópio para assegurar que a digestão da parede celular foi suficiente.
PURIFICAÇÃO DE PROTOPLASTO
[00370] As soluções de células/enzima foram filtradas lentamente através de um filtro celular de 100 μΜ. O filtro celular foi enxaguado com 10 ml de meios W5+ (1,82 mM de MES, 192 mM de NaCI, 154 mM de CaCI2, 4,7 mM de KCI, pH 6,0). A etapa de filtração foi repetida com o uso de uma peneira de 70 μΜ. O volume final atingiu 40 ml mediante a adição de 10 ml de meios W5+. As células foram misturadas invertendo-se o tubo. Os protoplastos foram lentamente dispostos em camada em 8 ml de uma solução de amortecimento de sacarose (500 mM de sacarose, 1 mM de CaCI2, 5 mM de MES-KOH, pH 6,0) adicionando-se a solução de amortecimento ao fundo de um tubo cônico de centrífuga de 50 ml contendo as células. Os tubos foram centrifugados em 350 x g por 15 minutos, em um rotor de caçamba móvel. Uma ponta de pipeta de 5 ml foi usada para remover lentamente a faixa de pro-toplasto (cerca de 7 a 8 ml). Os protoplastos foram, então, transferidos para um tubo cônico de 50 ml e 25 ml de lavagem de W5+ foram adicionados. Os tubos foram invertidos lentamente e centrifugados por 10 minutos em 200 g. O sobrenadante foi removido, 10 ml da solução de MMG foram adicionados e o tubo foi invertido lentamente para ressus-pender os protoplastos. A densidade do protoplasto foi determinada com o uso de um hemocitômetro ou um citômetro de fluxo. Tipicamente, 4 PCV de suspensão de células rende cerca de 2 milhões de protoplastos.
ΓRANS FORMAÇÃO DE PROTOPLASTOS COM O USO DE PEG
[00371] A concentração de protoplasto foi ajustada para 1,6 mi-Ihões/ml com MMG. As alíquotas de protoplasto de 300 μΙ (cerca de 500.000 protoplastos) foram transferidas para tubos estéreis de 2 ml. A suspensão de protoplasto foi misturada regularmente durante a transferência de protoplastos para os tubos. O DNA do plasmídeo foi adicionado às alíquotas de protoplasto de acordo com o projeto experimental. O suporte contendo os tubos de protoplastos foi lentamente invertido 3 vezes por 1 minuto cada para mistura o DNA e os proto- plastos. Os protoplastos foram incubados por 5 minutos em temperatura ambiente. Trezentos microfitros de uma solução de polietileno glicol (PEG 4000) (40% de etileno glicol (81240-Sigma Aldrich), 0,3 M de manitol, 0,4 M de CaCI2) foram adicionados aos protoplastos e o suporte de tubos foi misturado por 1 minuto e incubado por 5 minutos, com a inversão delicada duas vezes durante a incubação, Um milímetro de W5+ foi lentamente adicionado aos tubos e o suporte de tubos invertido 15 a 20 vezes. Os tubos foram, então, centrifugados em 350 g por 5 minutos e o sobrenadante removido sem perturbar o pélete. Um milímetro de meios Wl (4 mM de MES, 0,6 M de manitol, 20 mM de KCI, pH 6,0) foi adicionado a cada tubo e o suporte foi delicadamente invertido para ressuspender os péletes. O suporte foi coberto com papel alumínio e posto em seu lado para incubar de um dia para o outro a 23 °C.
MEDIÇÃO DA FREQUÊNCIA DE TRANSFORMAÇÃO E COLETA DOS PROTOPLASTOS
[00372] A quantificação de protoplastos e eficiências de transformação foram medidas com o uso de um Quanta Flow Cytometer™ (Beckman-Coulter Inc), Aproximadamente 16 a 18 horas após a transformação, 100 pl a partir de cada réplica foram amostrados, colocados em uma placa de 96 poços e diluídos 1:1 com solução de Wl. As réplicas foram ressuspensas 3 vezes e 100 μΙ foram quantificados com o uso de citometria de fluxo. Antes de submeter as amostras à análise, as amostras foram centrifugadas em 200 g por 5 minutos, os sobrena-dantes foram removidos e as amostras foram congeladas instantaneamente em nitrogênio líquido. As amostras foram, então, colocadas em um congelador de -80 °C até o processamento para a análise molecular.
TRANSFORMAÇÃO DE ZFN E DOADOR
[00373] Para cada um dos loci genômicos selecionados da Tabela 5, os protoplastos de soja foram transfectados com os construtos que compreendem um controle de expressão de gene de proteína verde fluorescente (gfp), ZFN sozinha, doador sozinho e uma mistura de ZFN e DNA doador em uma razão de 1:10 (em peso). A quantidade total de DNA para a transfecção de 0,5 milhões de protoplastos foi de 80 pg. Todos os tratamentos foram conduzidos em réplicas de três. O controle de expressão de gene de gfp usado foi pDAB7221 (Figura 14, SEQ ID NO:7569) contendo o promotor de vírus mosaico da nervura da mandioca - sequência de codificação de proteína verde fluorescente -cassetes de expressão de gene ORF24 3'UTR de Agrobacterium tumefaciens. Para fornecer uma quantidade consistente de DNA total por transfecção, esperma de salmão ou um plasmídeo contendo um gene gfp foi usado como carga, onde necessário. Em um experimento de direcionamento típico, 4 pg de ZFN sozinha ou com 36 pg de plas-mídeos doadores foram transfectados e uma quantidade adequada de esperma de salmão ou DNA de plasmídeo de pUC19 foi adicionada para a quantidade total de DNA atingir a quantidade final de 80 pg. A inclusão de plasmídeo de expressão de gene de gfp como carga permite a avaliação da qualidade de transfecção através de múltiplos loci e tratamentos duplicados.
EXEMPLO 5: CLIVAGEM DE LOCI GENÓMiCOS EM SOJA ATRAVÉS DE NUCLEASE DEDO DE ZINCO
[00374] O direcionamento em loci genômicos selecionados foi demonstrado pela divagem de DNA induzida por ZFN e inserção de doador com o uso do sistema de direcionamento rápido com base em protoplasto (RTA). Para cada locus selecionado de soja, até seis projetos de ZFN foram gerados e transformados em protoplastos sozinhos ou com um polinucleotídeo doador universal e a inserção e divagem mediada por ZFN foi medida com o uso de sequenciamento de nova geração (NGS) ou PCR de junção (entrada-saída), respectivamente.
[00375] Os protoplastos de soja transfectados com ZFN foram coletados 24 horas após a transfecção, por centrifugação em 1.600 rpm em tubos de 2 ml EPPENDORF™ e o sobrenadante foi completamente removido. O DNA genômico foi extraído dos péfetes de protoplasto com o uso do QIAGEN PLANT DNA EXTRACTION KIT™ (Qiagen, Valencia, CA). O DNA isolado foi ressuspenso em 50 μΙ de água e a concentração foi determinada por NANODROP1 (Invitrogen, Grand Island, NY). A integridade do DNA foi estimada executando-se as a-mostras em efetroforese de gel de agarose a 0,8%. Todas as amostras foram normalizadas (20 a 25 ng/μΙ) para amplificação de PCR para gerar amplicons para sequenciamento (lllumina, Inc., San Diego, CA). Os iniciadores de PCR de código de barras para amplificar as regiões que abrangem cada sequência de reconhecimento de ZFN de teste a partir das amostras tratadas e de controle foram projetados a adquiridos junto à IDT (Coralville, IA, purificadas por HPLC). As condições de amplificação ótimas foram identificadas por PCR gradiente com o uso de 0,2 μΜ de iniciadores de código de barras adequados, ACCUPRIME PFX SUPERMIX™ (Invitrogen, Carlsbad, CA) e 100 ng de DNA genômico modelo em uma reação de 23,5 μΙ. Os parâmetros de ciclagem consistiram na desnaturação inicial a 95 °C (5 minutos) seguida por 35 ciclos de desnaturação (95 °C, 15 s), recozimento (55 a 72 °C, 30 s), extensão (68 °C, 1 minuto) e uma extensão final (68 °C, 7 minutos). Os produtos de amplificação foram analisados em géis de agarose TAE a 3,5% e a temperatura de recozimento adequada para cada combinação de iniciador foi determinada e usada para amplificar os amplicons das amostradas tratadas com ZFN e de controle, conforme descrito acima. Todos os amplicons foram purificados em géis de agarose a 3,5%, eluídos em água e as concentrações foram determinadas por NANODROP™. Para o sequenciamento de nova geração, 100 ng de amplicon PCR a partir dos controles tratados com ZFN e não tratados correspondentes foram reunidos em conjunto e sequenciados com o uso do sequenciamento de nova geração Ilumina (NGS).
[00376] A atividade de divagem de ZFNs adequadas em cada íocus genômico ótimo de soja foi analisada. Os amplicons curtos que abram gem os sítios de divagem de ZFN foram amplificados a partir do DNA genômico e submetidos à NGS lllumina a partir dos protoplastos de controle e tratados com ZFN. A divagem induzida por ZFN ou quebra de filamento duplo de DNA foi resolvido pela rota de reparo de NHEJ celular através da inserção ou deleção de nucleotídeos (indels) no sítio de divagem e a presença de indels no sítio de divagem foi, desse modo, uma medida da atividade ZFN e foi determinada pelo NGS. A atividade de divagem das ZFNs alvo-específicas foi estimada como o número de sequências com indels por 1 milhão de sequências de alta qualidade usando o software de análise NGS (publicação de patente 2012-0173.153, Análise de Dados de Sequências de DNA). As atividades foram observadas para os alvos de loci genômicos selecionados de soja e foram adicionalmente confirmadas pelos alinhamentos de sequência que mostraram uma área ocupada diferente de indels em cada sítio de divagem de ZFN. Esses dados sugerem que os loci genômicos selecionados em soja eram sensíveis à divagem por ZFNs. A atividade diferencial em cada alvo foi refletiva de seu estado de croma-tina e da sensibilidade à divagem, assim como, da eficiência de expressão de cada ZFN.
EXEMPLO 6: ANÁLISE DE DIRECIONAMENTO RÁPIDO DA INTEGRAÇÃO DE UM DOADOR DE POLINUCLEOTÍDEO
[00377] A validação do direcionamento da sequência de polinucleo-tídeo doadora universal dentro dos alvos de loci genômicos selecionados em soja, através da inserção de doador mediada pela união terminal não homóloga (NHEJ), foi realizada com o uso de um método de análise de direcionamento rápido com base em protoplasto de semir- rendimento. Para cada alvo de loci genômicos selecionados em soja, em torno de 3 a 6 projetos de ZFN foram testados e o direcionamento foi avaliado medindo-se a divagem mediada por ZFN através dos métodos de sequenciamento de nova geração e da inserção de doador por PCR de entrada-saída de junção (Figura 6). Os loci genômicos selecionados em soja que eram positivos em ambos os ensaios foram identificados como um locus direcionável.
ANÁLISE DE DIRECIONAMENTO RÁPIDO DE INSERÇÃO DE DOADOR DE ZFN
[00378] Para determinar se um alvo de loci genômicos selecionados em soja pode ser direcionado para a inserção de doador, o construto de ZFN e construto de polinucleotídeo doador universal foram coapli-cados aos protoplastos de soja que foram incubados por 24 horas antes de o DNA genômico ser extraído para análise. Se a ZFN expressada fosse capaz de cortar o sítio de ligação alvo tanto no alvo de loci genômicos selecionados em soja como no doador, o doador lineariza-do podería, então, ser inserido no sitio-alvo clivado no genoma de soja através da rota de união terminal não homóloga (NHEJ). A confirmação da integração direcionada no alvo de loci genômicos selecionado em soja foi completada com base em uma estratégia de PCR de "En-trada-Saída", onde um iniciador de "Entrada" reconhece a sequência nos loci genômicos ótimos nativos e um iniciador de "Saída" se liga à sequência dentro do DNA doador. Os iniciadores foram projetados de um modo que somente quando o DNA doador fosse inserido no alvo de loci genômicos selecionados em soja, o ensaio de PCR produziría um produto de amplificação com o tamanho esperado. O ensaio de PCR de Entrada-Saída foi executado tanto na extremidade 5' como na extremidade 3' da junção de inserção. Os iniciadores usados para a análise de sequências doadoras de polinucleotídeos integradas são proporcionados na Tabela 9. INSERÇÃO DE DOADOR DE ZFN NOS LOCI-ALVOS COM O USO DE PCR DE "ENTRADA-SAÍDA ANINHADA" [00379] Todas as amplificações de PCR foram conduzidas com o uso de um kit TAKARA EX TAQ HS™ (Clonetech, Mountaín View, CA). A primeira PCR de Entrada-Saída foi realizada em volume de reação final de 25 μΙ que contém tampão 1X TAKARA EX TAQ HS™, 0,2 mM de dNTPs, 0,2 μΜ de iniciador de "Saída", 0,05 μΜ de iniciador de "Entrada" (projetado a partir do cassete doador universal descrito acima), 0,75 unidades de pofimerase TAKARA EX TAQ HS™ e 6 ng de DNA de protoplasto de soja extraído. A reação foi, então, completada com o uso de um programa de PCR que consistia em 94 °C por 3 minutos, 14 ciclos de 98 °C por 12 s e 60 °C por 30 s, seguida por 72 °C por 1 minuto, seguido de 72 °C por 10 minutos, e mantida a 4 °C. Os produtos de PCR finais foram executados em gel de agarose junto com 1KB PLUS DNA LADDER™ (Life Technologies, Grand Island, NY) para visualização.
[00380] A PCR de Entrada-Saída aninhada foi conduzida em volume de reação final de 25 μΙ que continha tampão 1X TAKARA EX TAQ HS™, 0,2 mM de dNTPs, 0,2 μΜ de iniciador de "Saída" (Tabela 9), 0,1 μΜ de iniciador de "Entrada" (projetado a partir do cassete doador universal descrito acima, Tabela 10), 0,75 de unidades de polimerase TAKARA EX TAQ HS™. e 1 μΙ do primeiro produto de PCR. A reação foi, então, completada com o uso de um programa de PCR que consistia em 94 °C por 3 minutos, 30 ciclos de 98 °C por 12 s, 60 °C por 30 s e 72 °C por 45 s, seguido de 72 °C por 10 minutos e mantida a 4 °C. Os produtos de PCR finais foram executados em gel de agarose junto com 1KB PLUS DNA LADDER™ (Life Technologies, Grand Island, NY) para visualização. TABELA 9. Lista de todos os iniciadores de "Saída" para a análise de PCR de entrada-saída aninhada de loci qenômicos ótimos. TABELA 10. Lista de todos os iniciadores de "Entrada" para a análise de PCR de "Entrada-Saida" aninha de loci qenômicos ótimos.
[00381] A implantação do ensaio de PCR de entrada-saída em um sistema de direcionamento de protoplasto foi particularmente desafiadora à medida que grandes quantidades do DNA de plasmídeo foram usadas para transfecção, e a grande quantidade de DNA permanece no sistema de direcionamento de protoplasto e foi subsequentemente extraída junto com o DNA genômico celular. O DNA de plasmídeo residual pode diluir a concentração relativa do DNA genômico e reduzir a sensibilidade total de detecção e também pode ser uma causa signifi-cante de reações de PCR anormais não específicas. A inserção de doador à base de NHEJ induzida por ZFN ocorre tipicamente em uma orientação direta ou reversa. A análise de PCR de entrada-saída de DNA para a inserção de orientação direta muitas vezes exibiu bandas de falsos positivos, possivelmente devido às regiões compartilhadas de homologia em torno do sítio de ligação de ZFN no alvo e no doador que poderia resultar em iniciação e extensão do DNA doador não integrado durante o processo de amplificação. Os falsos positivos não foram observados nas análises que sondaram os produtos de inserção de orientação reverse e, portanto, toda a análise de integração de doador direcionada foi realizada para interrogar a inserção de doador reversa na RTA. Com a finalidade de aumentar adicionalmente a especificidade e reduzir o fundo, uma estratégia de PCR aninhada também foi empregada. A estratégia de PCR aninhada usou uma segunda reação de amplificação de PCR que amplificou uma região mais curta dentro do primeiro produto de amplificação da primeira reação de P-CR. O uso de quantidades assimétricas de iniciadores de "entrada" e "saída" otimizou a PCR de junção adicionalmente para a análise de direcionamento rápido em locí genômicos selecionados.
[00382] Os resultados de análise de PCR de entrada-saída foram visualizados em um gel de agarose. Para todos os loci genômicos selecionados em soja da Tabela 12, os "tratamentos de ZFN + doador" produziram uma banda de tamanho quase esperado nas extremidades 5' e 3'. Os tratamentos de doador sozinho ou ZFN de controle foram negativos na PCR, que sugere que o método foi especificamente pontuado para a integração de doador no sítio-alvo de pelo menos 32 dos loci genômicos ótimos de soja nâo gênica. Todos os tratamentos foram conduzidos em réplicas de 3 a 6 e a presença do produto de PCR antecipada em múltiplas réplicas (> 2 em ambas as extremidades) foi u-sada par confirmar o direcionamento. A inserção de doador através de NHEJ muitas vezes produz subprodutos de intensidade inferior que foram gerados devido ao processamento das extremidades lineariza-das nos sítios de ZFN alvos e/ou doadores. Além disso, observou-se que ZFNs diferentes resultaram em níveis diferentes de eficiência para a integração direcionada, com algumas das ZFNs que produzem níveis consistentemente altos de integração de doador, algumas ZFNs que produzem níveis menos consistentes de integração de doador e outras ZFNs que resultam em nenhuma integração. Geralmente, para cada um dos alvos de loci genômicos selecionados em soja que foi testado, a integração direcionada foi demonstrada dentro dos alvos de loci genômicos representativos de soja através de uma ou mais ZFNs, o que confirma que cada um desses loci foi direcionável. Adicionalmente, cada um dos alvos de loci genômicos selecionados em soja foi adequado para a transformação de gene de precisão. A validação desses alvos de loci genômicos selecionados em soja foi repetida múltiplas vezes com resultados similares, confirmando, desse modo, a capacidade de reprodução do processo de validação que inclui projeto e construto de plasmídeo, transformação de protoplasto, processamento de amostra e análise de amostra.
CONCLUSÃO
[00383] O plasmídeo doador e uma ZFN projetada para clivar especificamente os alvos de loci genômicos selecionados em soja foram transfectados em protoplastos de soja e as células foram colhidas 24 horas depois. A análise do DNA genômico isolado do controle, tratado com ZFN e ZFN com protoplastos tratados com doador através da PCR de junção de entrada-saída mostrou a inserção direcionada do polinucleotídeo doador universal como um resultado da divagem de DNA genômico através das ZFNs (Tabela 12). Esses estudos mostraram que o sistema de polinucleotídeo doador universal pode ser usado para avaliar o direcionamento em sítios endógenos e para a triagem das ZFNs candidatas. Finalmente, uma análise de direcionamento rápido à base de protoplasto e os sistemas inovadores de sequência de polinucleotídeo doadora universal fornecem um modo rápido para e-xaminar os alvos genômicos e ZFNs para esforços de engenharia de genoma de precisão em plantas. Os métodos podem ser estendidos para avaliar a divagem sítio-especifica e a inserção de doador em alvos genômicos em qualquer sistema de interesse com o uso de qualquer nuclease que introduza quebras de filamento único ou duplo de DNA.
[00384] Acima de 7.018 loci genômicos selecionados foram identificados por diversos critérios detalhados acima. Os loci genômicos selecionados foram aglomerados com o uso da análise de componente principal com base nos dez parâmetros usados para definir os loci genômicos selecionados. Um representante dos aglomerados, adicionalmente a alguns outros loci de interesse, demonstrou ser direcioná-vel. TABELA 12. Ilustra os resultados da integração de uma sequência de polinucleotídeo doadora universal dentro dos alvos de loci qenômicos selecionados em soia. Conforme indicado pelo * abaixo, a inserção de doador dentro de OGL73 foi confirmada somente por uma reação de PCR da sequência de iuncão 5' e 3'.
REIVINDICAÇÕES

Claims (43)

1. Sequência recombinante, caracterizada pelo fato de que compreende: uma sequência genômica de soja não gênica de pelo menos 1 Kb, sendo que a dita sequência não gênica é hipometilada, dire-cionável, localizada proximal a uma região gênica dentro de um geno-ma de soja, e que exemplifica a evidência da recombinação; e um DNAde interesse, em que o DNA de interesse é inserido na dita sequência não gênica.
2. Sequência recombinante, de acordo com a reivindicação 1, caracterizada pelo fato de que a dita sequência não gênica compreende as seguintes características: a. o nível de metilação da dita sequência não gênica é de 1 % ou menos b. a dita sequência não gênica compartilha menos que 40% de identidade de sequência com qualquer outra sequência contida no genoma de soja; c. a dita sequência não gênica fica localizada dentro de uma região de 40 Kb de uma sequência de codificação de soja expressiva prevista ou conhecida ; e d. a dita sequência não gênica exibe uma frequência de recombinação dentro do genoma de soja maior que 0,01574 cM/Mb.
3. Sequência recombinante, de acordo com a reivindicação 1, caracterizada pelo fato de que a dita sequência não gênica compreende um comprimento máximo de 5,73 Kb,
4. Sequência recombinante, de acordo com a reivindicação 1, caracterizada pelo fato de que a dita sequência não gênica compreende 1% ou menos de metilação de nucleotídeo.
5. Sequência recombinante, de acordo com a reivindicação 4, caracterizada pelo fato de que a dita sequência não gênica tem 1 Kb a 5,73 Kb de comprimento e não contém resíduos de citosina metilada.
6. Sequência recombinante, de acordo com a reivindicação 5, caracterizada pelo fato de que a dita sequência não gêníca não se alinha com mais que 40% de identidade de sequência a qualquer outra sequência dentro do genoma de soja.
7. Sequência recombinante, de acordo com a reivindicação 5, caracterizada pelo fato de que a dita sequência não gênica exemplifica a evidência de recombinação em uma frequência de recombina-ção maior que 0,01574 cM/Mb.
8. Sequência recombinante, de acordo com a reivindicação 5, caracterizada pelo fato de que uma região de 40 Kb de genoma de soja nativo que compreende a dita sequência não gênica também compreende pelo menos uma sequência de codificação de soja prevista ou conhecida, ou uma sequência que compreende uma sequência de 2 Kb a montante e/ou 1 Kb a jusante de um gene de soja conhecido.
9. Sequência recombinante, de acordo com a reivindicação 8, caracterizada pelo fato de que a dita sequência de codificação de soja prevista ou conhecida expressa uma proteína de soja.
10. Sequência recombinante, de acordo com a reivindicação 1, caracterizada pelo fato de que a dita sequência não gênica não contém um polinucleotídeo metilado.
11. Sequência recombinante, de acordo com a reivindicação 1, caracterizada pelo fato de que uma extremidade da dita sequência não gênica fica dentro de 40 Kb de um gene endógeno expressado.
12. Sequência recombinante, de acordo com a reivindicação 1, caracterizada pelo fato de que o dito DNAde interesse compreende um domínio analítico.
13. Sequência recombinante, de acordo com a reivindica- ção 1, caracterizada pelo fato de que o dito DNA de interesse não codifica um peptídeo.
14. Sequência recombinante, de acordo com a reivindicação 1, caracterizada pelo fato de que o dito DNA de interesse codifica um peptídeo.
15. Sequência recombinante, de acordo com a reivindicação 14, caracterizada pelo fato de que o dito DNA de interesse compreende um cassete de expressão de gene que compreende um gene de resistência inseticida, gene de tolerância a herbicida, gene de eficiência de uso de nitrogênio, gene de eficiência de uso de água, gene de qualidade nutricional, gene de ligação de DNA e gene marcador * selecionável.
16. Sequência recombinante, de acordo com a reivindicação 1, sendo que a dita sequência recombinante é caracterizada pelo fato de que compreende as seguintes características: a. a dita sequência não gênica contém menos que 1% de metilação de DNA; b. a dita sequência não gênica exibe uma frequência de re-combinação de 0,01574 a 83,52 cM/Mb dentro do genoma de soja; c. a dita sequência não gênica exibe um nível de 0 a 0,494 de ocupação de nucleossomo do genoma de soja; d. a dita sequência não gênica compartilha menos que 40% de identidade de sequência com qualquer outra sequência contida no genoma de soja; e. a dita sequência não gênica tem um valor de local relativo da razão de 0 a 0,99682 da distância genômica a partir de um cen-trômero cromossômico de soja; f. a dita sequência não gênica tem uma faixa de teor porcento de guanina/citosina de 14,36 a 45,9%; g. a dita sequência não gênica fica localizada de maneira proximal a uma sequência gênica; e, h. a dita sequência não gênica fica localizada em uma região de 1 Mb de sequência genômica de soja que compreende uma ou mais sequências não gênicas adicionais.
17. Planta de soja, parte de planta de soja ou célula de planta de soja caracterizada pelo fato de que compreende uma sequência recombinante, conforme definida em qualquer uma das reivindicações 1 a 16.
18. Planta de soja, parte de planta de soja ou célula de planta de soja, de acordo com a reivindicação 17, caracterizada pelo fato de que a dita sequência de codificação de soja conhecida ou prevista expressa em um nível que varia de 0,000415 a 872,7198.
19. Sequência recombinante, de acordo com a reivindicação 1, caracterizada pelo fato de que o dito DNA de interesse e/ou a dita sequência não gênica são modificados durante a inserção do dito DNA de interesse na dita sequência não gênica.
20. Método para a produção de uma célula de planta trans-gênica caracterizado pelo fato de que compreende um DNA de interesse direcionado para uma sequência genômica de soja não gênica, sendo que o método compreende: a. selecionar um locus genômico de soja não gênica ótimo; b. introduzir uma nuclease específica de sítio em uma célula de planta, em que a nuclease especifica de sítio cliva a dita sequência genômica de soja não gênica; c. introduzir o DNA de interesse na célula de planta; d. direcionar o DNA de interesse no dito locus não gênico, em que a divagem da dita sequência não gênica facilita a integração da sequência de polinucleotídeo no dito locus não gênico; e e. selecionar células de planta transgênicas que compreendem o DNA de interesse direcionado para o dito locus não gênico.
21. Método para a produção de uma célula de planta trans-gênica, de acordo com a reivindicação 20, caracterizado pelo fato de que o dito DNAde interesse compreende um domínio analítico.
22. Método para a produção de uma célula de planta trans-gênica, de acordo com a reivindicação 20, caracterizado pelo fato de que o dito DNAde interesse não codifica um peptídeo.
23. Método para a produção de uma célula de planta trans-gênica, de acordo com a reivindicação 20, caracterizado pelo fato de que o dito DNA de interesse codifica um peptídeo.
24. Método para a produção de uma célula de planta trans-gênica, de acordo com a reivindicação 20, caracterizado pelo fato de que o dito DNA de interesse compreende um cassete de expressão de gene que compreende um transgene.
25. Método para a produção de uma célula de planta trans-gênica, de acordo com a reivindicação 20, caracterizado pelo fato de que a dita nuclease específica de sítio é selecionada a partir do grupo que consiste em uma nuclease dedo de zinco, uma nuclease CRISPR, uma TALEN, uma endonuclease de alojamento ou uma meganuclease.
26. Método para a produção de uma célula de planta trans-gênica, de acordo com a reivindicação 20, caracterizado pelo fato de que o dito DNA de interesse é integrado no dito locus não gênico através de um método de integração de reparação direcionada por homologia.
27. Método para a produção de uma célula de planta trans-gênica, de acordo com a reivindicação 20, caracterizado pelo fato de que o dito DNAde interesse é integrado no dito locus não gênico através de um método de integração de união terminal não homóloga.
28. Método para a produção de uma célula de planta trans-gênica, de acordo com a reivindicação 20, caracterizado pelo fato de que o dito locus não gênico selecionado compreende as seguintes características: a. o dito locus não gênico tem menos que 1% de metilação de DNA dentro da sequência; b. o dito locus não gênico exibe uma taxa de recombinação de 0,001574 a 83,52 cM/Mb dentro do genoma de soja; c. o dito locus não gênico exibe um nível de 0 a 0,494 de ocupação de nucleossomo do genoma de soja; d. o dito locus não gênico compartilha menos que 40% de identidade de sequência com qualquer outra sequência de 1 Kb contida no genoma de soja; e. o dito locus não gênico tem um valor de local relativo a partir da razão de 0 a 0,99682 da distância genômica a partir de um centrômero cromossômico de soja; f. o dito locus não gênico tem um faixa de teor porcento de guanina/citosina de 14,36 a 45,9%; g. o dito locus não gênico fica localizado de maneira proxi-mal a uma sequência gênica; e, h. uma região de 1 Mb da sequência genômica de soja, que compreende o dito locus não gênico, compreende pelo menos uma segunda sequência não gênica.
29. Método para a produção de uma célula de planta trans-gênica, de acordo com a reivindicação 28, caracterizado pelo fato de que o dito locus não gênico tem pelo menos 1 Kb de comprimento.
30. Método para a produção de uma célula de planta trans-gênica, de acordo com a reivindicação 29, caracterizado pelo fato de que uma sequência de codificação de soja prevista ou conhecida, ou uma sequência que compreende uma região a montante de 2 Kb e a jusante de 1 Kb de um gene conhecido, fica localizada dentro de 40 Kb do dito locus não gênico.
31. Método para a produção de uma célula de planta trans-gênica, de acordo com a reivindicação 20, caracterizado pelo fato de que o dito DNA de interesse e/ou o dito locus não gênico são modificados durante a dita integração da sequência de polinucleotídeo no dito locus não gênico da etapa (d).
32 Sequência genômica não gênica de soja direcionável recombinante, caracterizada pelo fato de que compreende: uma sequência não gênica de pelo menos 1 Kb selecionada a partir do grupo que consiste em aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32 ou uma sequência que compartilha 99% de identidade de sequência com uma sequência selecionada a partir do grupo que consiste em aglomerado 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32 e seus respectivos complementos dos mesmos, em que os ditos aglomerados são gerados a partir de um algoritmo estatístico de PCA que compreende valores de PCA definidos na Tabela 6; e um DNA de interesse inserido na dita sequência não gênica.
33. Sequência genômica de soja não gênica direcionável, de acordo com a reivindicação 32, caracterizada pelo fato de que o dito DNA de interesse compreende um domínio analítico.
34. Sequência genômica de soja não gênica direcionável, de acordo com a reivindicação 32, caracterizada pelo fato de que o dito DNA de interesse codifica um peptídeo.
35. Sequência genômica de soja não gênica direcionável, de acordo com a reivindicação 32, caracterizada pelo fato de que o dito DNA de interesse compreende um cassete de expressão de gene que compreende um transgene.
36. Sequência genômica de soja não gênica direcionável, de acordo com a reivindicação 32, caracterizada pelo fato de que o dito DNA de interesse compreende um sítio de divagem específico de sítio.
37. Sequência genômica de soja não gênica direcionável, de acordo com a reivindicação 36, caracterizada pelo fato de que o dito sítio de divagem específico de sítio é clivado por uma nuclease.
38. Sequência genômica de soja não gênica direcionável, de acordo com a reivindicação 37, caracterizada pelo fato de que a dita nuclease é selecionada a partir do grupo que consiste em uma nuclease dedo de zinco, uma nuclease CRISPR, uma TALEN, uma en-donuclease de alojamento ou uma meganuclease.
39. Sequência genômica de soja não gênica direcionável, de acordo com a reivindicação 32, caracterizada pelo fato de que a dita inserção do dito DNA de interesse na dita sequência não gênica resulta em uma modificação do dito DNA de interesse e das ditas sequências não gênicas.
40. Sequência genômica de soja não gênica purificada de pelo menos 1 Kb, sendo que a dita sequência não gênica é caracterizada pelo fato de que é hipometilada, direcionável, localizada proximal a uma região gênica dentro de um genoma de soja e que exemplifica a evidência de recombinação.
41. Sequência purificada, de acordo com a reivindicação 40, caracterizada pelo fato de que a dita sequência não gênica compreende as seguintes características: a. o nível de metilação da dita sequência não gênica é de 1% ou menos; b. a dita sequência não gênica compartilha menos que 40% de identidade de sequência com qualquer outra sequência contida no genoma de soja; c. a dita sequência não gênica fica localizada dentro de uma região de 40 Kb de uma sequência de codificação de soja expressiva conhecida ou prevista; e d. a dita sequência não gênica exibe uma frequência de re-combinação dentro do genoma de soja maior que 0,01574 cM/Mb.
42, Sequência purificada, de acordo com a reivindicação 40, caracterizada pelo fato de que a dita sequência não gênica compreende um comprimento máximo de 5,73 Kb.
43. Sequência purificada, de acordo com a reivindicação 40, sendo que a dita sequência é caracterizada pelo fato de que compreende as seguintes características: a. a dita sequência não gênica contém menos que 1% de metilação de DNAem seu local nativo; b. a dita sequência não gênica, em seu local nativo, exibe uma frequência de recombinação de 0,01574 a 83,52 cM/Mb dentro do genoma de soja; c. a dita sequência não gênica exibe um nível de 0 a 0,494 de ocupação de nucleossomo do genoma de soja, em seu local nativo; d. a dita sequência não gênica compartilha menos que 40% de identidade de sequência com qualquer outra sequência contida no genoma de soja; e. a dita sequência não gênica tem um valor de local relativo da razão de 0 a 0,99682 da distância genòmica a partir de um cen-trômero cromossômico de soja em seu local nativo; f. a dita sequência não gênica tem uma faixa de teor porcento de guanina/citosina de 14,36 a 45,9%; g. a dita sequência não gênica fica localizada dentro de 40 Kb de uma sequência de codificação de soja prevista ou conhecida, ou uma sequência que compreende uma região de 2 Kb a montante e 1 Kb a jusante de um gene conhecido em seu local nativo; e, h. a dita sequência não gênica fica localizada em uma região de 1 Mb da sequência genòmica de soja que compreende uma ou mais sequências não gênicas adicionais em seu local nativo.
BR102014027436-7A 2013-11-04 2014-11-03 Molécula de ácido nucleico recombinante, e método para a produção de uma célula vegetal transgênica BR102014027436B1 (pt)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US61/889,587 2013-10-11
US201361899566P 2013-11-04 2013-11-04
US201361899587P 2013-11-04 2013-11-04
US61/899,566 2013-11-04

Publications (3)

Publication Number Publication Date
BR102014027436A2 true BR102014027436A2 (pt) 2016-09-20
BR102014027436A8 BR102014027436A8 (pt) 2021-09-08
BR102014027436B1 BR102014027436B1 (pt) 2022-06-28

Family

ID=53005409

Family Applications (1)

Application Number Title Priority Date Filing Date
BR102014027436-7A BR102014027436B1 (pt) 2013-11-04 2014-11-03 Molécula de ácido nucleico recombinante, e método para a produção de uma célula vegetal transgênica

Country Status (16)

Country Link
US (2) US10233465B2 (pt)
EP (1) EP3066109A4 (pt)
JP (1) JP6634022B2 (pt)
KR (1) KR102269377B1 (pt)
CN (1) CN105980395A (pt)
AU (2) AU2014341925B2 (pt)
BR (1) BR102014027436B1 (pt)
CA (1) CA2926822C (pt)
CL (1) CL2016001066A1 (pt)
IL (2) IL245305B (pt)
MX (1) MX362066B (pt)
RU (1) RU2719150C2 (pt)
TW (1) TWI659103B (pt)
UY (1) UY35814A (pt)
WO (1) WO2015066634A2 (pt)
ZA (2) ZA201602552B (pt)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2013010911A (es) 2011-03-23 2015-03-03 Pioneer Hi Bred Int Metodos para producir un locus de rasgo transgenico complejo.
WO2013066438A2 (en) 2011-07-22 2013-05-10 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
DK3401400T3 (da) 2012-05-25 2019-06-03 Univ California Fremgangsmåder og sammensætninger til rna-styret mål-dna-modifikation og til rna-styret transskriptionsmodulering
KR101844123B1 (ko) 2012-12-06 2018-04-02 시그마-알드리치 컴퍼니., 엘엘씨 Crispr-기초된 유전체 변형과 조절
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9340800B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College Extended DNA-sensing GRNAS
US9909131B2 (en) * 2013-11-04 2018-03-06 Dow Agrosciences Llc Optimal soybean loci
US20150165054A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting caspase-9 point mutations
AU2015298571B2 (en) 2014-07-30 2020-09-03 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
MX2017002930A (es) 2014-09-12 2017-06-06 Du Pont Generacion de sitios de integracion especifica de sitio para loci de rasgos complejos en maiz y soja, y metodos de uso.
WO2016089433A1 (en) 2014-12-03 2016-06-09 Agilent Technologies, Inc. Guide rna with chemical modifications
KR20240038141A (ko) 2015-04-06 2024-03-22 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 Crispr/cas-매개 유전자 조절을 위한 화학적으로 변형된 가이드 rna
AU2016252145B2 (en) * 2015-04-20 2022-01-13 Monsanto Technology Llc Compositions and methods for altering flowering and plant architecture to improve yield potential
JP7109784B2 (ja) 2015-10-23 2022-08-01 プレジデント アンド フェローズ オブ ハーバード カレッジ 遺伝子編集のための進化したCas9蛋白質
US10767175B2 (en) 2016-06-08 2020-09-08 Agilent Technologies, Inc. High specificity genome editing using chemically modified guide RNAs
EP3494215A1 (en) 2016-08-03 2019-06-12 President and Fellows of Harvard College Adenosine nucleobase editors and uses thereof
JP7201153B2 (ja) 2016-08-09 2023-01-10 プレジデント アンド フェローズ オブ ハーバード カレッジ プログラム可能cas9-リコンビナーゼ融合タンパク質およびその使用
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
CA3035534A1 (en) * 2016-09-07 2018-03-15 Sangamo Therapeutics, Inc. Modulation of liver genes
WO2018071868A1 (en) 2016-10-14 2018-04-19 President And Fellows Of Harvard College Aav delivery of nucleobase editors
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
WO2018165504A1 (en) 2017-03-09 2018-09-13 President And Fellows Of Harvard College Suppression of pain by gene editing
WO2018165629A1 (en) 2017-03-10 2018-09-13 President And Fellows Of Harvard College Cytosine to guanine base editor
IL269458B2 (en) 2017-03-23 2024-02-01 Harvard College Nucleic base editors that include nucleic acid programmable DNA binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
SG11202109882VA (en) 2019-03-19 2021-10-28 Broad Inst Inc Methods and compositions for editing nucleotide sequences
CN111118057B (zh) * 2020-01-09 2022-07-22 中国科学院华南植物园 用于重组酶介导的特异性位点的基因叠加的大豆目标系
JP2023525304A (ja) 2020-05-08 2023-06-15 ザ ブロード インスティテュート,インコーポレーテッド 標的二本鎖ヌクレオチド配列の両鎖同時編集のための方法および組成物
WO2023039586A1 (en) 2021-09-10 2023-03-16 Agilent Technologies, Inc. Guide rnas with chemical modification for prime editing

Family Cites Families (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4535060A (en) 1983-01-05 1985-08-13 Calgene, Inc. Inhibition resistant 5-enolpyruvyl-3-phosphoshikimate synthetase, production and use
US4940835A (en) 1985-10-29 1990-07-10 Monsanto Company Glyphosate-resistant plants
US4810648A (en) 1986-01-08 1989-03-07 Rhone Poulenc Agrochimie Haloarylnitrile degrading gene, its use, and cells containing the gene
ATE57390T1 (de) 1986-03-11 1990-10-15 Plant Genetic Systems Nv Durch gentechnologie erhaltene und gegen glutaminsynthetase-inhibitoren resistente pflanzenzellen.
DK39692D0 (da) 1992-03-25 1992-03-25 Danisco Biologisk materiale
ATE310812T1 (de) 1994-01-18 2005-12-15 Scripps Research Inst Derivate von zinkfingerproteinen und methoden
US6242568B1 (en) 1994-01-18 2001-06-05 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
US6140466A (en) 1994-01-18 2000-10-31 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
GB9824544D0 (en) 1998-11-09 1999-01-06 Medical Res Council Screening system
DE69535829D1 (de) 1994-08-20 2008-10-16 Gendaq Ltd Verbesserung in bezug auf bindungsproteine bei der erkennung von dna
US5789538A (en) 1995-02-03 1998-08-04 Massachusetts Institute Of Technology Zinc finger proteins with high affinity new DNA binding specificities
US5994627A (en) 1995-03-31 1999-11-30 Common Wealth Scientific And Industrial Research Organisation Genetic sequences conferring nematode resistance in plants and uses therefor
US5925523A (en) 1996-08-23 1999-07-20 President & Fellows Of Harvard College Intraction trap assay, reagents and uses thereof
GB2338237B (en) 1997-02-18 2001-02-28 Actinova Ltd In vitro peptide or protein expression library
GB9710807D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
GB9710809D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
EP1060261B1 (en) 1998-03-02 2010-05-05 Massachusetts Institute of Technology Poly zinc finger proteins with improved linkers
US6140081A (en) 1998-10-16 2000-10-31 The Scripps Research Institute Zinc finger binding domains for GNN
US7070934B2 (en) 1999-01-12 2006-07-04 Sangamo Biosciences, Inc. Ligand-controlled regulation of endogenous gene expression
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US6453242B1 (en) 1999-01-12 2002-09-17 Sangamo Biosciences, Inc. Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
US6599692B1 (en) 1999-09-14 2003-07-29 Sangamo Bioscience, Inc. Functional genomics using zinc finger proteins
US7030215B2 (en) 1999-03-24 2006-04-18 Sangamo Biosciences, Inc. Position dependent recognition of GNN nucleotide triplets by zinc fingers
US6794136B1 (en) 2000-11-20 2004-09-21 Sangamo Biosciences, Inc. Iterative optimization in the design of binding proteins
FI19992659A (fi) * 1999-12-10 2001-06-11 Unicrop Ltd Prosessi kaksisirkkaisten siementen varastoravintoaineiden muuttamiseksi yhden tai useamman geenituotteen sisältäviksi aineosiksi
AU5077401A (en) 2000-02-08 2001-08-20 Sangamo Biosciences Inc Cells for drug discovery
US20020061512A1 (en) 2000-02-18 2002-05-23 Kim Jin-Soo Zinc finger domains and methods of identifying same
AU2001263155A1 (en) 2000-05-16 2001-11-26 Massachusetts Institute Of Technology Methods and compositions for interaction trap assays
JP2002060786A (ja) 2000-08-23 2002-02-26 Kao Corp 硬質表面用殺菌防汚剤
US7067317B2 (en) 2000-12-07 2006-06-27 Sangamo Biosciences, Inc. Regulation of angiogenesis with zinc finger proteins
GB0108491D0 (en) 2001-04-04 2001-05-23 Gendaq Ltd Engineering zinc fingers
JP2005500061A (ja) 2001-08-20 2005-01-06 ザ スクリップス リサーチ インスティテュート Cnnについての亜鉛フィンガー結合ドメイン
CA2470329A1 (en) 2001-12-20 2003-07-03 Sungene Gmbh & Co. Kgaa Methods for the transformation of vegetal plastids
US7262054B2 (en) 2002-01-22 2007-08-28 Sangamo Biosciences, Inc. Zinc finger proteins for DNA binding and gene regulation in plants
WO2003087341A2 (en) 2002-01-23 2003-10-23 The University Of Utah Research Foundation Targeted chromosomal mutagenesis using zinc finger nucleases
US20030232410A1 (en) 2002-03-21 2003-12-18 Monika Liljedahl Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
US7361635B2 (en) 2002-08-29 2008-04-22 Sangamo Biosciences, Inc. Simultaneous modulation of multiple genes
CA2497913C (en) 2002-09-05 2014-06-03 California Institute Of Technology Use of chimeric nucleases to stimulate gene targeting
CA2521284C (en) 2003-04-29 2014-07-08 Pioneer Hi-Bred International, Inc. Novel glyphosate-n-acetyltransferase (gat) genes
AU2003252483A1 (en) 2003-07-08 2005-01-21 Japan Science And Technology Corporation Method and system of constructing transgenic organism
US7888121B2 (en) 2003-08-08 2011-02-15 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
US8409861B2 (en) 2003-08-08 2013-04-02 Sangamo Biosciences, Inc. Targeted deletion of cellular DNA sequences
US7972854B2 (en) 2004-02-05 2011-07-05 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
AU2005233550B2 (en) 2004-04-08 2010-11-18 Sangamo Therapeutics, Inc. Treatment of neuropathic pain with zinc finger proteins
AU2005232665B2 (en) 2004-04-08 2010-05-13 Sangamo Therapeutics, Inc. Methods and compositions for treating neuropathic and neurodegenerative conditions
NZ580248A (en) 2004-04-30 2012-01-12 Dow Agrosciences Llc Plants comprising herbicide resistance gene encoding aryloxyalkanoate dioxygenase
EP1913149A4 (en) 2005-07-26 2009-08-05 Sangamo Biosciences Inc TARGETED INTEGRATION AND EXPRESSION OF EXOGENOUS NUCLEIC ACID SEQUENCES
EP2484202B1 (en) 2005-10-28 2017-06-07 Dow AgroSciences LLC Novel herbicide resistance genes
US7629455B2 (en) 2005-12-07 2009-12-08 Monsanto Technology Llc Zea mays NFB2 promoter
WO2007088744A1 (ja) * 2006-02-03 2007-08-09 The University Of Tokyo ゲノムdnaのメチル化状況に基づく細胞の同定方法
MX2008014615A (es) 2006-05-17 2009-01-15 Pioneer Hi Bred Int Minicromosomas artificiales de plantas.
EP2213731B1 (en) 2006-05-25 2013-12-04 Sangamo BioSciences, Inc. Variant foki cleavage half-domains
BRPI0720048A8 (pt) * 2006-12-14 2023-02-07 Dow Agrosciences Llc Proteínas de dedo de zinco não-canônicas otimizadas
JP5103621B2 (ja) * 2007-03-20 2012-12-19 国立大学法人愛媛大学 ADAT1遺伝子に特異的なsiRNA
EP2568048A1 (en) * 2007-06-29 2013-03-13 Pioneer Hi-Bred International, Inc. Methods for altering the genome of a monocot plant cell
BRPI0817560B1 (pt) 2007-09-27 2022-09-20 Dow Agrosciences Llc Proteínas de dedo de zinco (zfp) engenheiradas que têm como alvo genes de 5-enolpiruvil shiquimato-3-fosfato sintase, nuclease de dedo de zinco (zfn), vetor, bem como métodos para introdução de um transgene no genoma de uma célula de planta, para expressar o produto de um transgene em uma célula de planta, para deleção de uma sequência de gene de epsps a partir de um locus de gene epsps no genoma de uma célula de planta, e para modular expressão de um gene de epsps
WO2009042163A2 (en) 2007-09-27 2009-04-02 Sangamo Biosciences, Inc. Rapid in vivo identification of biologically active nucleases
JP2011500082A (ja) 2007-10-25 2011-01-06 サンガモ バイオサイエンシーズ, インコーポレイテッド 標的組込みのための方法および組成物
EP2281050B1 (en) 2008-04-14 2014-04-02 Sangamo BioSciences, Inc. Linear donor constructs for targeted integration
CN102159722B (zh) 2008-08-22 2014-09-03 桑格摩生物科学股份有限公司 用于靶向单链切割和靶向整合的方法和组合物
EP2370575B1 (en) 2008-12-17 2017-11-01 Dow AgroSciences LLC Targeted integration into the zp15 locus
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
US20110239315A1 (en) 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
CN102458366B (zh) * 2009-06-15 2015-02-11 阿尔尼拉姆医药品有限公司 靶向pcsk9基因的脂质配制的dsrna
NZ619886A (en) 2009-08-11 2015-03-27 Sangamo Biosciences Inc Organisms homozygous for targeted modification
NZ598599A (en) 2009-08-19 2014-06-27 Dow Agrosciences Llc Aad-1 event das-40278-9, related transgenic corn lines, and event-specific identification thereof
US8592645B2 (en) 2009-10-22 2013-11-26 Dow Agrosciences Llc Engineered zinc finger proteins targeting plant genes involved in fatty acid biosynthesis
CN104928256A (zh) * 2009-11-24 2015-09-23 陶氏益农公司 Aad-12事件416、相关的转基因大豆系及其事件特异性鉴定
HUE041436T2 (hu) 2009-12-10 2019-05-28 Univ Minnesota Tal-effektor-közvetített DNS-módosítás
GB201000184D0 (en) 2010-01-07 2010-02-24 Plant Bioscience Ltd Methods and compositions for altering temperature sensing in eukaryotic organisms
CA2787494C (en) 2010-01-22 2019-09-17 Dow Agrosciences Llc Targeted genomic alteration
BR112012018108A2 (pt) 2010-01-22 2015-10-20 Bayer Ip Gmbh combinações acaricidas e/ou inseticidas de ingredientes ativos
PT2534173T (pt) 2010-02-08 2019-10-31 Sangamo Therapeutics Inc Semidomínios de clivagem manipulados
WO2011100058A1 (en) 2010-02-09 2011-08-18 Sangamo Biosciences, Inc. Targeted genomic modification with partially single-stranded donor molecules
JP6208580B2 (ja) 2010-05-17 2017-10-04 サンガモ セラピューティクス, インコーポレイテッド 新規のdna結合タンパク質及びその使用
JP2011239708A (ja) * 2010-05-17 2011-12-01 National Institute Of Advanced Industrial Science & Technology 核酸標準物質検出用プローブの設計方法、核酸標準物質検出用プローブ及び当該核酸標準物質検出用プローブを有する核酸検出系
CN103403022A (zh) 2010-12-21 2013-11-20 纳幕尔杜邦公司 来自玉米的植物基因表达调节序列
NZ621638A (en) * 2011-08-25 2016-03-31 Clinical Genomics Pty Ltd Dna methylation in colorectal and breast cancer diagnostic methods
MX2014003698A (es) * 2011-09-30 2014-07-28 Genentech Inc Marcadores de diagnostico.
BR112014019047A2 (pt) 2012-02-08 2017-06-27 Dow Agrosciences Llc análise de dados de sequências de dna
WO2013144663A2 (en) * 2012-03-27 2013-10-03 Rudjer Boskovic Institute Method of determination of neutral dna sequences in the genome, system for targeting sequences obtained thereby and methods for use thereof
US11039586B2 (en) 2013-03-15 2021-06-22 Monsanto Technology Llc Creation and transmission of megaloci

Also Published As

Publication number Publication date
IL252148A0 (en) 2017-07-31
TWI659103B (zh) 2019-05-11
CN105980395A (zh) 2016-09-28
MX362066B (es) 2019-01-07
ZA201602552B (en) 2019-09-25
TW201518505A (zh) 2015-05-16
US10233465B2 (en) 2019-03-19
US11149287B2 (en) 2021-10-19
IL245305A0 (en) 2016-06-30
BR102014027436B1 (pt) 2022-06-28
BR102014027436A8 (pt) 2021-09-08
US20150128307A1 (en) 2015-05-07
CA2926822A1 (en) 2015-05-07
KR102269377B1 (ko) 2021-06-28
RU2016121862A (ru) 2017-12-11
EP3066109A2 (en) 2016-09-14
CA2926822C (en) 2022-12-13
JP6634022B2 (ja) 2020-01-22
WO2015066634A3 (en) 2015-06-25
KR20160079864A (ko) 2016-07-06
AU2014341925A1 (en) 2016-04-21
AU2014341925B2 (en) 2017-06-29
EP3066109A4 (en) 2017-11-29
JP2016535603A (ja) 2016-11-17
RU2016121862A3 (pt) 2018-06-28
MX2016005874A (es) 2016-10-13
ZA201901730B (en) 2020-09-30
IL252148B (en) 2019-01-31
US20190136265A1 (en) 2019-05-09
UY35814A (es) 2015-05-29
CL2016001066A1 (es) 2017-02-03
WO2015066634A2 (en) 2015-05-07
RU2719150C2 (ru) 2020-04-17
IL245305B (en) 2019-10-31
AU2017203832B2 (en) 2018-11-22

Similar Documents

Publication Publication Date Title
US11149287B2 (en) Optimal soybean loci
US20210230617A1 (en) Optimal soybean loci
US10273493B2 (en) Optimal maize loci
AU2014341927B2 (en) Optimal maize loci

Legal Events

Date Code Title Description
B03A Publication of a patent application or of a certificate of addition of invention [chapter 3.1 patent gazette]
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B03H Publication of an application: rectification [chapter 3.8 patent gazette]

Free format text: REFERENTE A RPI 2385 DE 20/09/2016,QUANTO AO ITEM (54).

B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 03/11/2014, OBSERVADAS AS CONDICOES LEGAIS

B25D Requested change of name of applicant approved

Owner name: CORTEVA AGRISCIENCE LLC (US)