BR112015004948B1 - Método para modificação de um gene fad2 em uma célula de soja, usos de célula, semente ou planta de soja e nuclease de dedo de zinco sítio- específica - Google Patents

Método para modificação de um gene fad2 em uma célula de soja, usos de célula, semente ou planta de soja e nuclease de dedo de zinco sítio- específica Download PDF

Info

Publication number
BR112015004948B1
BR112015004948B1 BR112015004948-6A BR112015004948A BR112015004948B1 BR 112015004948 B1 BR112015004948 B1 BR 112015004948B1 BR 112015004948 A BR112015004948 A BR 112015004948A BR 112015004948 B1 BR112015004948 B1 BR 112015004948B1
Authority
BR
Brazil
Prior art keywords
fad2
gene
plant
nucleic acid
dna
Prior art date
Application number
BR112015004948-6A
Other languages
English (en)
Other versions
BR112015004948A2 (pt
Inventor
William Michael Ainley
Steven R. Webb
Samuel Pon
Dmitry Y. Guschin
Jeffrey C. Miller
Lei Zhang
Original Assignee
Sangamo Biosciences, Inc.
Dow Agrosciences Llc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sangamo Biosciences, Inc., Dow Agrosciences Llc filed Critical Sangamo Biosciences, Inc.
Priority claimed from PCT/US2013/058299 external-priority patent/WO2014039702A2/en
Publication of BR112015004948A2 publication Critical patent/BR112015004948A2/pt
Publication of BR112015004948B1 publication Critical patent/BR112015004948B1/pt

Links

Abstract

LOCI DE DESEMPENHO DE FAD2 E PROTEÍNAS DE LIGAÇÃO SÍTIO-ESPECÍFICA CORRESPONDENTES AO ALVO CAPAZES DE INDUZIR QUEBRAS DIRECIONADAS. Métodos e composições de interrupção gênica, edição gênica ou empilhamento gênico dentro dos loci de FAD2 por clivagem, em uma forma direcionada ao sítio, de uma posição em um gene FAD2 em uma célula de soja, para gerar uma quebra no gene FAD2 e em seguida opcionalmente a integração na quebra de uma molécula de ácido nucleico de interesse é descrita.

Description

REFERÊNCIA CRUZADA A PEDIDOS DE PATENTE RELACIONADOS
[001] O presente pedido de patente reivindica a prioridade sobre o benefício do Pedido Provisório de Patente U.S. No. 61/697.886, depositado em 7 de setembro de 2012, a revelação do qual é por meio deste incorporada por referência em sua totalidade.
CAMPO DA REVELAÇÃO
[002] A presente revelação refere-se geralmente a composições e métodos para uso na tecnologia vegetal recombinante (por exemplo, para gerar uma planta transgênica). Mais especificamente, a presente revelação refere-se a células vegetais e plantas incluindo loci dentro dos seus genomas que podem ser usados para a introdução sítio- específica de qualquer ácido nucleico de interesse.
ANTECEDENTES
[003] Muitas plantas são geneticamente transformadas com ácidos nucleicos exógenos (por exemplo, transgenes) para introduzir traços desejáveis, por exemplo, para melhorar o valor agrícola. Exemplos de melhorias no valor agrícola que podem ser alcançadas por meio da transformação genética incluem: melhoria da qualidade nutricional, aumento da produtividade, resistência a pragas ou doenças, tolerância à seca e ao estresse, melhora da qualidade hortícola (por exemplo, melhoria da pigmentação e/ou crescimento), resistência a herbicida, produção de compostos e/ou materiais vegetais industrialmente úteis, e/ou produção de produtos farmacêuticos. A introdução de genes clonados em células vegetais e a recuperação de plantas transgênicas férteis estáveis podem ser usadas para criar uma modificação genética de uma planta estável por múltiplas gerações, e assim, permitir a engenharia genética de uma planta cultivada.
[004] Em métodos de transformação genética e produção vegetal transgênica, DNA exógeno é tipicamente introduzido aleatoriamente no DNA nuclear ou DNA plastidial de uma célula vegetal eucariótica, seguido do isolamento das células contendo o DNA exógeno integrado e a regeneração subsequente de uma planta estavelmente transformada. As plantas transgênicas eram tipicamente geradas por tecnologia de transformação mediada por Agrobacterium. Os êxitos com estas técnicas incitaram o desenvolvimento de outros métodos para introduzir uma molécula de ácido nucleico de interesse no genoma de uma planta, tal como a captação de DNA mediada por PEG em protoplastos, bombardeio de microprojétil e transformação utilizando fibras de carboneto de silício.
[005] Em todos estes métodos de transformação vegetal, entretanto, os ácidos nucleicos exógenos incorporados no genoma vegetal são integrados aleatoriamente no genoma da célula vegetal, e em número de cópias imprevisível. Terada et al. (2002) Nat Biotechnol 20 (10):1030; Terada et al. (2007) Plant Physiol 144 (2):846; D’Halluin et al. (2008) Plant Biotechnology J. 6 (1):93. Por exemplo, os transgenes estão frequentemente integrados na forma de repetições de sequência, do transgene inteiro ou de partes deste. Tal modelo de integração complexo comumente impacta adversamente o nível de expressão do ácido nucleico integrado (por exemplo, pela destruição do RNA transcrito por mecanismos de silenciamento gênico pós- transcrição, ou pela indução de metilação do DNA integrado). Além disso, a posição do sítio de integração comumente influencia no nível de expressão do ácido nucleico integrado. Além disso, a integração do DNA exógeno pode ter um efeito perturbador na região do genoma onde a integração ocorre, e, assim, influencia ou perturba a função normal daquela região alvo para produzir efeitos secundários indesejáveis. A combinação de fatores incluindo os anteriores, resulta em uma ampla variação no nível de expressão do transgene ou DNA exógeno (e qualidade agronômica global) entre diferentes células vegetais e linhagens vegetais transgênicas, até aquelas criadas pelos mesmos métodos. Como a integração é aleatória, estes efeitos não são capazes de serem controlados pelo profissional enquanto ele ou ela tentam produzir uma nova planta com características desejáveis.
[006] As considerações precedentes exigem que, sempre que os efeitos da introdução de um ácido nucleico exógeno particular em uma planta sejam investigados, um grande número de linhagens vegetais transgênicas deve ser gerado e analisado a fim de obter resultados significantes. Do mesmo modo, na geração de uma planta transgênica contendo um ácido nucleico particular integrado de modo a promover à planta transgênica um fenótipo desejado, uma grande população de linhagens vegetais transgênicas independentemente criadas deve ser criada para permitir a seleção de uma linhagem vegetal com a expressão ótima do ácido nucleico, e com o mínimo ou nenhum efeito secundário sobre o fenótipo global e o desempenho da planta transgênica. Estas considerações práticas assumem importância adicional em plantas transgênicas criadas pela inserção de múltiplos ácidos nucleicos exógenos (isto é, empilhamento gênico). Em tais plantas, os fenômenos como silenciamento gênico pós-transcrição podem ser amplificados.
[007] Vários métodos foram desenvolvidos na tentativa de controlar a inserção de transgene em plantas. Ver, por exemplo, Kumar e Fladung (2001) Trends Plant Sci. 6:155-9. Estes métodos baseiam-se na integração de transgene baseada na recombinação homóloga, que foi aplicada com sucesso tanto em procariotos como em eucariotos inferiores. Paszkowski et al. (1988) EMBO J. 7:4021-6. Entretanto, até recentemente em plantas, o mecanismo predominante de integração de transgene era baseado na recombinação ilegítima, que envolve pouca homologia entre as fitas de DNA recombinante. Um dos principais desafios nesta área, por isso, é a detecção e geração seletiva de eventos de recombinação homólogos raros, que são mascarados por eventos de integração muito mais eficientes através de recombinação ilegítima. Além disso, mesmo se a geração seletiva e a detecção de eventos de recombinação homólogos visados forem alcançadas, o evento deve ser visado em uma posição desejável no genoma do hospedeiro a fim de realizar o benefício máximo desta estratégia.
[008] Por exemplo, um benefício assumido da transformação genética direcionada é a redução da variabilidade em evento a evento da expressão do transgene, em comparação com eventos de transformação que são obtidos da integração aleatória. Um benefício adicional assumido é uma redução significativa do número de eventos requeridos para rastrear os ácidos nucleicos introduzidos, classificar os construtos de transformação, e produzir eventos que contribuem para características globais desejáveis na planta transgênica resultante. Um fator crítico requerido para realizar estes benefícios é a identificação das posições específicas no genoma onde o desempenho do transgene é consistente, e se possível, onde os efeitos adversos à planta hospedeira sejam eliminados ou minimizados.
[009] Recentemente, os métodos e as composições para a clivagem direcionada de DNA genômico foram descritos. Tais eventos de clivagem direcionada podem ser usados, por exemplo, para induzir a mutagênese direcionada, induzir deleções direcionadas de sequências de DNA celular e facilitar a recombinação direcionada e a integração em um locus cromossômico predeterminado. Ver, por exemplo, Urnov et al. (2010) Nature 435 (7042):646-51; Publicações de Patentes Americanas 20030232410; 20050208489; 20050026157; 20050064474; 20060188987; 20090263900; 20090117617; 20100047805; 20110207221; 20110301073; 2011089775; 20110239315; 20110145940; e Publicação Internacional WO 2007/014275, as revelações das quais são incorporadas por referência em suas totalidades para todos os fins. A clivagem pode ocorrer por meio do uso de nucleases específicas como nucleases dedo de zinco (ZFN) engendradas, nucleases efetoras similares a ativadores da transcrição (TALENs) ou usando o sistema CRISPR/Cas com RNA crRNA/tracr engendrado (‘RNA de guia único’) para guiar a clivagem específica. A Publicação de Patente U.S. No. 20080182332 descreve o uso de nucleases dedo de zinco não canônicas (ZFNs) para modificação direcionada de genomas vegetais; a Publicação de Patente U.S. No. 20090205083 descreve a modificação direcionada mediada por ZFN de um locus de EPSPS vegetal; a Publicação de Patente U.S. No. 20100199389 descreve a modificação direcionada de um locus de Zp15 vegetal e a Publicação de Patente U.S. No. 20110167521 descreve a modificação direcionada de genes vegetais envolvidos na biossíntese de ácidos graxos. Além disso, Moehle et al. (2007) Proc. Natl. Acad, Sci. USA 104 (9):3055-3060 descreve a utilização de ZFNs projetadas para adição gênica direcionada em um locus especificado. A Publicação de Patente U.S. 20110041195 descreve métodos de produção de organismos diploides homozigotos.
[0010] Entretanto, continua a existir uma necessidade de composições e métodos para modificar e/ou modular a expressão de genes FAD2 em plantas, incluindo a geração de plantas com inserções direcionadas de transgenes desejados no locus de FAD2.
BREVE SUMÁRIO DA REVELAÇÃO
[0011] A presente revelação descreve composições e métodos para modular a expressão de genes FAD2 (por exemplo, em plantas, algas e fungos) e o uso destes loci como sítios para a integração direcionada de uma sequência de ácido nucleico de interesse (por exemplo, uma sequência de ácido nucleico exógena) em uma célula hospedeira. Em algumas modalidades, uma célula hospedeira pode conter um ou mais genomas com uma ou mais sequências de FAD2 (por exemplo, homólogas ou parálogas), algumas ou todas das quais podem ser seletivamente modificadas e/ou interrompidas. Em exemplos específicos, a presente revelação descreve os genes FAD2 2.3 e FAD2 2.6, bem como homólogos ou parálogos correspondentes, em Glycine max (por exemplo, G. max c.v. Jack, Williams 82, X5, Westag e Maverick) e seus usos como loci de integração direcionada de uma sequência de ácido nucleico de interesse. Como descrito neste pedido, embora os genes FAD2 estejam envolvidos na biossíntese de ácidos graxos no hospedeiro, sua modificação ou interrupção (por exemplo, pela integração de um ácido nucleico exógeno na sequência de codificação de FAD2) inesperadamente pode não ter ou ter efeito adverso mínimo para o organismo hospedeiro resultante.
[0012] Também é descrito neste pedido o uso de um ou mais loci de FAD2 particulares em tandem com um polipeptídeo capaz de efetuar a clivagem e/ou a integração de sequências de ácidos nucleicos específicas dentro dos loci de FAD2. Exemplos do uso dos loci de FAD2 em tandem com um polipeptídeo capaz de efetuar a clivagem e/ou a integração dos loci de FAD2 incluem um polipeptídeo selecionado a partir do grupo consistindo de proteínas dedo de zinco, meganucleases, domínios TAL, TALENs, CRISPR-Cas9 guiado por RNA, recombinases, zíperes de leucina, CRISPr/Cas e outros conhecidos por aqueles especialistas na técnica. Exemplos particulares incluem uma proteína quimérica ("fusão") compreendendo polipeptídeo de domínio de ligação a DNA sítio-específico e polipeptídeo de domínio de clivagem (por exemplo, uma nuclease), como uma proteína ZFN compreendendo um polipeptídeo dedo de zinco e um polipeptídeo de nuclease FokI. Por exemplo, é descrito neste pedido uma demonstração da eficácia in vitro e in vivo e especificidade de ZFNs particulares concebidas para ligarem-se e induzir quebras da fita dupla nos genes FAD2 2.3 e FAD2 2.6, e em combinações destes sem clivar os homólogos ou parálogos correspondentes. Em algumas modalidades, os loci particulares de FAD2 podem ser usados com qualquer um dos polipeptídeos precedentes para efetuar a integração sítio-específica de um ácido nucleico de interesse que é posteriormente expresso no hospedeiro tendo um impacto adverso mínimo no desempenho agronômico do hospedeiro.
[0013] Em certos aspectos, são descritos neste pedido polipeptídeos compreendendo um domínio de ligação ao DNA que especificamente se liga a um gene FAD2. Em algumas modalidades tal polipeptídeo também pode compreender um domínio nuclease (clivagem) ou meio-domínio (por exemplo, uma ZFN, um recombinase, um transposase ou uma endonuclease homing, incluindo uma endonuclease homing com um domínio de ligação ao DNA modificado, domínios TAL, TALENs, CRISPR-Cas9 guiado por RNA) e/ou um domínio de ligase, tal que o polipeptídeo possa induzir uma quebra na fita dupla e/ou facilitar a recombinação de um ácido nucleico de interesse no sítio do intervalo. Em modalidades particulares, um domínio de ligação ao DNA que visa um locus de FAD2 pode ser um domínio funcional de clivagem de DNA. Os polipeptídeos precedentes podem ser usados em qualquer uma das modalidades para introduzir um ácido nucleico exógeno no genoma de um organismo hospedeiro (por exemplo, uma espécie vegetal ou animal) em um ou mais loci de FAD2. Em certas modalidades, os domínios de ligação ao DNA compreendem uma proteína dedo de zinco com um ou mais dedos de zinco (por exemplo, 2, 3, 4, 5, 6, 7, 8, 9 ou mais dedos de zinco), e podem ser engendrados (ocorrendo não naturalmente) para ligar-se a qualquer sequência dentro de um gene FAD2. Alguma das proteínas dedo de zinco descritas neste pedido podem ligar-se a um sítio alvo dentro da sequência de codificação do gene alvo ou dentro de sequências adjacentes (por exemplo, promotor ou outros elementos de expressão). Em certas modalidades, a proteína dedo de zinco liga-se a um sítio alvo em um gene FAD2, por exemplo, como mostrado na Tabela 1. As regiões de hélice de reconhecimento de dedos de zinco de ligação a FAD2 exemplares são mostradas na Tabela 2. Um ou mais dos componentes dos domínios de ligação dedo de zinco da proteína dedo de zinco podem ser um dedo de zinco canônico (C2H2) ou um dedo de zinco não canônico (por exemplo, C3H) (por exemplo, o dedo de zinco C-terminal e/ou N-terminal pode ser um dedo não canônico).
[0014] Também são descritos neste pedido métodos para interromper ou editar um gene FAD2. Adicionalmente são descritos neste pedido organismos hospedeiros geneticamente modificados (por exemplo, plantas transgênicas) produzidos por métodos de acordo com as modalidades da invenção. Em exemplos particulares, um organismo transgênico produzido por um método de acordo com uma modalidade da invenção pode ser, sem limitação, algas, um fungo, uma planta monocotiledônea, uma planta dicotiledônea, etc. Em algumas modalidades particulares, a planta dicotiledônea pode ser uma planta de soja (Glycine max).
[0015] Os genes FAD2 descritos neste pedido podem incluir os encontrados em qualquer planta, alga ou fungo que tem um ou mais genes FAD2.
[0016] O acima exposto e outras características irão tornar-se mais evidentes a partir do seguinte relatório descritivo detalhado de várias modalidades, que prossegue com referência às figuras anexadas.
BREVE DESCRIÇÃO DAS FIGURAS
[0017] A Figura 1 mostra um alinhamento das sequências de codificação de FAD2 2.3 de Williams 82 (SEQ ID NO:4), Westag (SEQ ID NO:5), X5 (SEQ ID NO:6), Jack (SEQ ID NO:7), e Maverick (SEQ ID NO:8).
[0018] A Figura 2 mostra um alinhamento das sequências de codificação de FAD2 2.6 de Williams 82 (SEQ ID NO:9), Westag (SEQ ID NO:10), X5 (SEQ ID NO:11), Jack (SEQ ID NO:12), e Maverick (SEQ ID NO:13).
[0019] A Figura 3 representa a atividade das ZFNs dos genes FAD2 2.3 e 2.6 concebidas em um ensaio de DLSSA. As ZFNs concebidas para os loci FAD2 2.3 e 2.6 foram avaliadas para a atividade de clivagem de sequências de FAD2 2.3 e 2.6 que foram clonadas em células mamíferas como repórteres.
[0020] A Figura 4 mostra um mapa plasmidial de pDAB115620.
[0021] A Figura 5 mostra um mapa plasmidial de pDAB115622.
[0022] A Figura 6 mostra um mapa plasmidial de pDAB7221.
[0023] A Figura 7 é um diagrama esquemático representando sonda/iniciadores para o ensaio de interrupção de locus. Os sítios de ligação de ZFN F2 para os genes FAD2 2.3 e 2.6 e os iniciadores usados para o ensaio de interrupção são indicados.
[0024] A Figura 8 mostra a sequência dos produtos de PCR In- Out resultantes do direcionamento de NHEJ de uma sequência doadora usando a nuclease dedo de zinco ZFN2 F2 no locus FAD2 2.3. A sequência de referência (topo da figura) representa a configuração da inserção direcionada do vetor doador em uma orientação reversa. As extremidades da fita simples dos DNAs resultantes da digestão de FokI foram preenchidas para criar a sequência de referência. As sequências de Sanger são mostradas. As sequências de ligação de ZFN F2 ZFN2 são sublinhadas. Os clones de plasmídeo com uma sequência similar à sequência especificada são listados à direita.
SEQUÊNCIAS
[0025] As sequências de ácidos nucleicos são mostradas usando abreviaturas de letra padrão para bases nucleotídicas, como definido em 37 C.F.R. § 1.822. Somente uma fita de cada sequência de ácido nucleico é mostrada, mas entende-se que a fita complementar está incluída por qualquer referência à fita exibida.
RELATÓRIO DESCRITIVO DETALHADO I. Resumo de várias modalidades
[0026] As modalidades da invenção estabelecem uma abordagem para a integração direcionada de ácidos nucleicos exógenos (por exemplo, transgenes) em um genoma hospedeiro sem um grande impacto negativo sobre os outros fenótipos do hospedeiro além dos afetados pelo ácido nucleico integrado. Algumas modalidades podem ser usadas para "empilhamento" de múltiplos ácidos nucleicos em um genoma hospedeiro único. Tal abordagem requer o desenvolvimento e a implantação de quatro tecnologias interligadas: tecnologias de direcionamento que permitem a introdução de quebras na fita dupla em posições específicas do DNA genômico (ver, por exemplo, Puchta et al. (1993) Nucleic Acids Res. 21:5034-40; Siebert e Puchta (2002) Plant Cell 14:1121-31; D’Halluin et al. (2008) Plant Biotechnol. J. 6 (1):93-102; Cai et al. (2009) Plant Mol. Biol. 69 (6):699-709; Shukla et al. (2009) Nature 459 (7245):437-41); Shan et al. (2103) Nature Biotechnol. 31:686-680; Le et al. (2013) Nature Biotechnol 31: 688- 691; Nekrasov et al. (2013) Nature Biotechnol. 31:691-693, Ainely et al. (2013) Plant Biotechnol. J. (Online 19 de agosto); tecnologias de entrega que permitem a entrega de um ácido nucleico exógeno otimizado (doador) (Bibikova et al. (2003) Science 300 (5620):764); tecnologias de integração que envolvem a modificação dos genes do hospedeiro (localizados nas vias de recombinação homóloga ou de NHEJ) para aumentar as frequências direcionadas de inserções HDR ou NHEJ do DNA doador; ferramentas analíticas para enriquecer e caracterizar os eventos de integração direcionada; e posições genômicas do hospedeiro desejado específicas ("loci de desempenho") que são geneticamente bem definidas e que suportam a expressão gênica estável através das gerações sem afetar muito negativamente o organismo hospedeiro transformado. Ver, também, as Publicações de Patentes Americanas 20030232410; 20050208489; 20050026157; 20050064474; 20060188987; 20090263900; 20090117617; 20100047805; 20110207221; 20110301073; 2011089775; 20110239315; 20110145940; 20080182332; 20090205083; 20100199389; 20110167521. Por exemplo, em plantas, um locus de desempenho é um locus onde o impacto negativo nas propriedades agronômicas ou nas propriedades de qualidade de uma planta transgênica em que um transgene tenha sido inserido no locus é insignificante ou não existente.
[0027] As modalidades descritas neste pedido aproveitam-se da descoberta inesperada de que os genes vegetais FAD2 são loci de desempenho para a inserção direcionada de ácidos nucleicos exógenos (por exemplo, gene(s); sequências de DNA não codificantes, tais como Engineered Landing Pads (ELPs) (Pedido de Patente U.S. 12/011.735) e Plataforma de Inserção de Transgene Engendrados (ETIP) (Pedido de Patente U.S. pendente No.: 61/697882); e unidade(s) de transformação vegetal). A natureza ubíqua dos loci de FAD2 em plantas e a evidência que a alteração ou o silenciamento de FAD2 em canola, milho, girassol, trigo, algodão e soja não exerce uma penalidade agronômica ou penalidade de qualidade, identificam os loci de FAD2 como uma ampla classe de loci de desempenho entre espécies de plantas comercialmente relevantes.
[0028] Algumas modalidades utilizam a clivagem do DNA de fita dupla sítio-específica em um locus de FAD2, por exemplo, resultante da entrega e expressão de uma proteína de clivagem e reconhecimento do sítio direcionado de DNA específico. Em exemplos específicos, tal proteína de clivagem e reconhecimento de DNA FAD2- específica pode ser, por exemplo, e sem limitação, uma ZFN; TALEN; CRISPR-Cas9 guiado por RNA, uma recombinase (por exemplo, Cre, Hin, RecA, Tre e FLP recombinases); uma meganuclease e uma proteína engendrada derivada de qualquer um dos precedentes ou seus equivalentes. A clivagem também pode ser efetuada usando o sistema CRISPR/Cas com RNA crRNA/tracr engendrado (‘RNA de guia único’) para guiar a clivagem específica. Em algumas modalidades, tal intervalo de fita dupla pode ser reparado através da integração de um ácido nucleico doador no sítio de clivagem dentro do locus de desempenho de FAD2, por exemplo, por Reparo Direcionado por Homologia (HDR) ou Junção de Extremidade não Homóloga (NHEJ).
[0029] Esta revelação exemplifica a utilidade dos loci de FAD2 como loci de desempenho, por exemplo, descrevendo o loci de FAD2 2.3 e FAD2 2.6 em soja (Glycine max) e ZFNs específicas para FAD2 correspondentes que podem ser utilizadas para integrar um ácido nucleico exógeno no locus de FAD2 2.3 e/ou FAD2 2.6.
[0030] As modalidades da presente invenção abordam muitos problemas não solucionados na técnica. Por exemplo, a seletividade da abordagem de integração direcionada descrita neste pedido pode reduzir ou eliminar a necessidade de testes de campo repetidos necessários para a eliminação de eventos transgênicos não desejados, testes os quais são caros devido aos recursos envolvidos e as exigências reguladoras onerosos nesta área. Além disso, as abordagens de inserção de DNA direcionada descritas neste pedido podem ser particularmente benéficas no processo de empilhamento transgênico.
[0031] Embora a sequência nucleotídica nativa em um locus de FAD2 endógeno possa ser usada para direcionar diretamente um ácido nucleico de interesse, em algumas modalidades, um ácido nucleico pode ser primeiro direcionado a pelo menos um locus de FAD2 do hospedeiro, tal que a integração de moléculas de ácidos nucleicos de interesse adicionais no hospedeiro seja facilitada. Em outros exemplos, as sequências nucleotídicas que não são homólogas a sequências nativas do organismo hospedeiro (por exemplo, sequências de ácidos nucleicos geradas essencialmente aleatoriamente) que flanqueiam um sítio de reconhecimento de DNA (por exemplo, sítios de reconhecimento de dedo de zinco) podem ser utilizadas.
II. Termos
[0032] Como usado neste pedido de patente, incluindo as reivindicações, os termos no singular e as formas singulares, "um", "uma", "o" e "a", por exemplo, incluem referentes plurais, a menos que o conteúdo claramente dite de outra maneira. Dessa forma, por exemplo, uma referência à "planta", "a planta," ou "uma planta" também se refere a uma pluralidade de plantas. Além disso, dependendo do contexto, o uso do termo "planta" também pode referir- se à progênie geneticamente similar ou idêntica daquela planta. Similarmente, o termo "ácido nucleico" pode referir-se a muitas cópias de uma molécula de ácido nucleico. Do mesmo modo, o termo "sonda" pode referir-se a muitas moléculas de sonda similares ou idênticas.
[0033] As faixas numéricas são inclusivas dos números que definem a faixa, e expressamente incluem cada número inteiro e fração de número não inteiro dentro da faixa definida. A menos que definido de outra maneira, todos os termos técnicos e científicos usados neste pedido têm o mesmo significado que comumente entendido por um especialista ordinário na técnica.
[0034] A fim de facilitar a revisão de várias modalidades descritas nesta revelação, a seguinte explicação de termos específicos é fornecida:
[0035] Isolado: Um componente biológico "isolado" (como um ácido nucleico ou proteína) foi substancialmente separado, produzido à parte ou purificado longe de outros componentes biológicos na célula do organismo no qual o componente ocorre naturalmente (isto é, outro DNA e RNA cromossômico e extracromossômico, e proteínas), ao efetuar uma modificação química ou funcional no componente (por exemplo, um ácido nucleico pode ser isolado de um cromossomo quebrando as ligações químicas que conectam o ácido nucleico ao DNA restante no cromossomo). As moléculas de ácidos nucleicos e as proteínas que foram "isoladas" incluem moléculas de ácidos nucleicos e proteínas purificadas por métodos de purificação padrão. O termo também engloba ácidos nucleicos e proteínas preparadas por expressão recombinante em uma célula hospedeira, bem como moléculas de ácidos nucleicos quimicamente sintetizadas, proteínas e peptídeos.
[0036] Cruzamento: Como usado neste pedido com respeito a plantas, o termo "cruzamento" ou "cruzado" refere-se à fusão de gametas via polinização para produzir a progênie (por exemplo, células, sementes e plantas). Este termo engloba ambos os cruzamentos sexuais (isto é, a polinização de uma planta por outra) e autopolinização (isto é, autopolinização, por exemplo, usando o pólen e o óvulo da mesma planta).
[0037] Retrocruzamento: os métodos de retrocruzamento podem ser usados para introduzir uma sequência de ácido nucleico em uma planta. Esta técnica foi largamente usada por décadas para introduzir novos traços em plantas. Jensen, N., Ed. Plant Breeding Methodology, John Wiley & Sons, Inc., 1988. Em um protocolo de retrocruzamento típico, a variedade original de interesse (parental recorrente) é cruzada com uma segunda variedade (parental não recorrente) que transporta uma sequência de ácido nucleico de interesse a ser transferido. A progênie resultante deste cruzamento então é cruzada novamente com o parental recorrente, e o processo é repetido até que uma planta seja obtida em que essencialmente todas as características morfológicas e fisiológicas desejadas da planta recorrente são recuperadas na planta convertida, além da sequência de ácido nucleico transferida do parental não recorrente.
[0038] Introgressão: Como usado neste pedido, o termo "introgressão" refere-se à transmissão de um alelo (ou alelo modificado compreendendo um ácido nucleico exógeno) em um contexto genético em um locus particular. Em algumas modalidades, a introgressão de um alelo específico no locus pode ocorrer transmitindo o alelo a pelo menos uma progênie via um híbrido sexual de dois parentais da mesma espécie, onde pelo menos um dos parentais tem a forma de alelo específica no seu genoma. A progênie que compreende o alelo específico pode ser repetidamente retrocruzada com uma linhagem que tem um contexto genético desejado. A progênie de retrocruzamento pode ser selecionada para a forma de alelo específica, para produzir uma nova variedade em que a forma de alelo específica foi fixada no contexto genético. Em algumas modalidades, a introgressão de um alelo específico pode ocorrer pela recombinação entre dois genomas de doadores (por exemplo, em um protoplasto fundido), onde pelo menos um dos genomas do doador tem a forma de alelo específica no seu genoma. A introgressão pode envolver a transmissão de uma forma de alelo específica que pode ser, por exemplo, e sem limitação, um alelo rompido ou modificado; um transgene; um PTU; e um ELP.
[0039] Germoplasma: Como usado neste pedido, o termo "germoplasma" refere-se ao material genético de uma planta individual, de um grupo de plantas (por exemplo, uma linhagem vegetal, variedade e família), e de um clone derivado de uma planta ou grupo de plantas. Um germoplasma pode ser parte de um organismo ou célula, ou pode ser separado (por exemplo, isolado) do organismo ou célula. Em geral, o germoplasma fornece o material genético de uma composição molecular específica que é a base por qualidades hereditárias da planta. Como usado neste pedido, "germoplasma" refere-se a células de uma planta específica; semente; tecido da planta específica (por exemplo, o tecido do qual as novas plantas podem ser cultivadas); e partes não semente da planta específica (por exemplo, folha, caule, pólen e células). Como usado neste pedido, o termo "germoplasma" é sinônimo a "material genético," e pode ser usado para referir-se à semente (ou outro material vegetal) do qual uma planta pode ser propagada. Um "banco de germoplasma" pode referir-se a uma coleção organizada de sementes diferentes ou outro material genético (em que cada genótipo é unicamente identificado) do qual um cultivar conhecido pode ser cultivado, e do qual um novo cultivar pode ser gerado.
[0040] Gene: Como usado neste pedido, o termo "gene" (ou "elemento genético") pode referir-se a uma sequência de DNA genômica hereditária com significância funcional. Um gene pode ser um ácido nucleico nativo ou ácido nucleico que foi integrado no genoma. O termo "gene" também pode ser usado para referir-se a, por exemplo, e sem limitação, um cDNA e/ou um mRNA codificado por uma sequência de DNA genômica hereditária.
[0041] Molécula de ácido nucleico: Como usado neste pedido, o termo "molécula de ácido nucleico" pode referir-se a uma forma polimérica de nucleotídeos (isto é, ribonucleotídeos, desoxirribonucleotídeos e/ou uma forma modificada de qualquer dos precedentes). Uma "molécula de ácido nucleico", como usado neste pedido, é sinônima para "ácido nucleico" e "polinucleotídeo". O termo inclui tanto fitas antissentido como sentido de RNA, cDNA, DNA genômico, e formas sintéticas e polímeros misturados destes. O termo inclui qualquer conformação topológica, incluindo fita simples, fita dupla, parcialmente duplexada, triplexada, em grampo, circular e conformações em cadeado. Uma molécula de ácido nucleico pode incluir um ou mais nucleotídeos que ocorrem naturalmente e modificados. Tais nucleotídeos podem ser ligados em conjunto por ligações nucleotídicas que ocorrem naturalmente e/ou que não ocorrem naturalmente.
[0042] As moléculas de ácidos nucleicos podem ser modificadas quimicamente ou bioquimicamente ou podem conter bases de nucleotídeos derivadas, como será prontamente apreciado por aqueles especialistas na técnica. Tais modificações incluem, por exemplo, e sem limitação: marcadores; metilação; substituição de um ou mais dos nucleotídeos que ocorrem naturalmente por um análogo; e modificações de internucleotídeos (por exemplo, ligações não carregadas, por exemplo, metil fosfonatos, fosfotriésteres, fosforamidatos, e carbamatos; ligações carregadas, por exemplo, fosforotioatos e fosforoditioatos; porções pendentes, por exemplo, peptídeos; intercalantes, por exemplo, acridina e psoraleno; quelantes; alquilantes; e ligações modificadas, por exemplo, alfa ácidos nucleicos anoméricos).
[0043] Exógeno: Uma molécula "exógena" é uma molécula que não é nativa para um sistema especificado (por exemplo, um germoplasma, variedade, variedade de elite e/ou planta) com respeito à sequência nucleotídica e/ou posição genômica (isto é, locus) para um polinucleotídeo (e com respeito à sequência de aminoácidos e/ou localização celular para um polipeptídeo). Em modalidades, polinucleotídeos ou polipeptídeos exógenos ou heterólogos podem ser moléculas que foram artificialmente supridas a um sistema biológico (por exemplo, uma célula vegetal, um gene vegetal, uma espécie ou variedade particular de plantas e/ou um cromossomo vegetal) e não são nativas para aquele sistema biológico particular. Dessa forma, a designação de um ácido nucleico como "exógeno" pode indicar que o ácido nucleico se originou de uma fonte além de uma fonte de ocorrência natural, ou pode indicar que o ácido nucleico tem uma configuração, posição genética ou arranjo de elementos não naturais.
[0044] Ao contrário, por exemplo, um ácido nucleico "nativo" ou "endógeno" é um ácido nucleico (por exemplo, um gene) que não contém um elemento de ácido nucleico além daqueles normalmente presentes no cromossomo ou outro material genético no qual o ácido nucleico é normalmente encontrado na natureza. Um transcrito gênico endógeno é codificado por uma sequência nucleotídica no seu locus cromossômico natural e não é artificialmente suprido à célula.
[0045] Operacionalmente ligado: Uma primeira sequência de ácido nucleico é operacionalmente ligada com uma segunda sequência de ácido nucleico quando a primeira sequência de ácido nucleico está em uma relação funcional com a segunda sequência de ácido nucleico. Por exemplo, um promotor é operacionalmente ligado com uma sequência de codificação quando o promotor afeta a transcrição ou a expressão da sequência de codificação. Quando recombinantemente produzido, as sequências de ácidos nucleicos operacionalmente ligadas são geralmente contíguas e, onde necessário para juntar duas regiões de codificação da proteína, na mesma fase de leitura. Entretanto, os elementos não têm de ser contíguos para serem operacionalmente ligados.
[0046] Promotor: Um promotor é uma região de DNA que geralmente é localizado a montante (em direção à região 5’) de um ácido nucleico que aumenta a transcrição do ácido nucleico. Os promotores permitem a ativação própria ou repressão de ácido(s) nucleico(s) com o qual são operacionalmente ligados. Um promotor contém sequências específicas que são reconhecidas por fatores de transcrição. Estes fatores ligam-se às sequências de DNA do promotor e resultam no recrutamento da RNA polimerase, a enzima que sintetiza o RNA da região de codificação do ácido nucleico. Transformado: Um vetor "transforma" ou "transduz" uma célula quando transfere moléculas de ácidos nucleicos para a célula. Uma célula é "transformada" por uma molécula de ácido nucleico quando a molécula de ácido nucleico fica estavelmente replicada pela célula, pela incorporação da molécula de ácido nucleico no genoma celular ou pela replicação epissomal. Como usado neste pedido, o termo "transformação" engloba todas as técnicas pelas quais uma molécula de ácido nucleico pode ser introduzida em uma célula. Exemplos incluem, mas não são limitados a: transfecção com vetores virais; transformação com vetores de plasmídeo; eletroporação (Fromm et al. (1986) Nature 319:791-3); lipofecção (Felgner et al. (1987) Proc. Natl. Acad. Sci. USA 84:7413-7); microinjeção (Mueller et al. (1978) Cell 15:579-85); transferência mediada por Agrobacterium (Fraley et al. (1983) Proc. Natl. Acad. Sci. USA 80:4803-7); entrada de DNA direta; e bombardeio de microprojétil (Klein et al. (1987) Nature 327:70).
[0047] Introduzido: Como usado neste pedido, o termo "introduzido", ao referir-se ao deslocamento de um ácido nucleico exógeno em uma célula, refere-se à incorporação do ácido nucleico na célula usando qualquer metodologia disponível na técnica. Este termo engloba métodos de introdução de ácido nucleico incluindo, por exemplo, e sem limitação, transfecção; transformação; e transdução.
[0048] Transgene: Como usado neste pedido, o termo "transgene" refere-se a uma sequência de codificação de ácido nucleico exógena de interesse. Por exemplo, um transgene pode codificar um composto industrialmente ou farmaceuticamente útil ou produto de expressão que contribui para um traço agrícola desejável (por exemplo, resistência a herbicidas ou resistência a pragas). Em um exemplo adicional, um transgene pode ser um ácido nucleico antissentido, em que a expressão do ácido nucleico antissentido inibe a expressão de uma sequência de ácido nucleico alvo. Um transgene pode compreender sequências reguladoras operacionalmente ligadas ao transgene (por exemplo, um promotor). Em algumas modalidades, uma molécula de ácido nucleico de interesse a ser introduzida pelo direcionamento sítio-específico em um locus de FAD2 é um transgene. Entretanto, em outras modalidades, uma molécula de ácido nucleico de interesse pode ser um PTU, um ELP, um ETIP ou uma sequência de ácido nucleico endógena (por exemplo, em que cópias genômicas adicionais, exógenas da sequência de ácido nucleico endógena são desejadas).
[0049] Os elementos também podem incluir DNA que codifica RNA estrutural, como shRNA. Tal RNA pode modificar genes exógenos ou endógenos incluindo, mas não limitado a afetar posicionamentos ou conferir resistência a herbicidas.
[0050] Recombinante: Como usado neste pedido, o termo "recombinante" refere-se a um material (por exemplo, ácido nucleico, gene, polinucleotídeo e/ou polipeptídeo) que foi alterado pela intervenção humana. Por exemplo, o arranjo das partes ou elementos de uma molécula recombinante podem não ser um arranjo nativo, e/ou a sequência primária da molécula recombinante pode ter sido modificada da sua sequência nativa, por exemplo, para otimizar sua expressão e/ou atividade. Um material pode ser alterado para produzir um material recombinante dentro ou removido do seu meio ambiente ou estado. Como um exemplo, uma região de leitura aberta de um ácido nucleico é recombinante se a sequência nucleotídica da região de leitura aberta foi removida do seu contexto natural e clonada em uma molécula de ácido nucleico artificial (por exemplo, um vetor). Os protocolos e os reagentes para produzir moléculas recombinantes (por exemplo, ácidos nucleicos recombinantes) são comuns na técnica, e seu uso é regular. O termo "recombinante" também pode referir-se neste pedido a uma célula ou organismo que compreende o material recombinante (por exemplo, uma planta e/ou célula vegetal compreendendo um ácido nucleico recombinante). Em alguns exemplos, um organismo recombinante é um organismo transgênico.
[0051] Vetor: Como usado neste pedido, o termo "vetor" refere-se a um polinucleotídeo ou outra molécula que é capaz de transferir pelo menos um segmento(s) de ácido nucleico para uma célula. Um vetor pode compreender opcionalmente componentes/elementos que medeiam a manutenção do vetor e/ou permitem seu uso desejado (por exemplo, sequências necessárias para replicação, genes que transmitem resistência a fármacos ou a antibióticos, sítio de clonagem múltiplo e/ou elementos de promotor/potencializador operacionalmente ligados que permitem a expressão de um gene clonado). Os vetores podem ser derivados, por exemplo, de plasmídeos, bacteriófagos, ou vírus animais ou vegetais. Um "vetor de clonagem" "o vetor de transferência" ou "vetor de subclonagem" geralmente compreende elementos operacionalmente ligados para facilitar etapas de clonagem ou subclonagem (por exemplo, sítio de clonagem múltiplo que contém múltiplos sítios de endonuclease de restrição).
[0052] Vetor de expressão: O termo "vetor de expressão", como usado neste pedido, refere-se a um vetor compreendendo sequências de polinucleotídeos operacionalmente ligadas que podem facilitar a expressão de uma sequência de codificação em um organismo hospedeiro particular. Por exemplo, um vetor de expressão bacteriano pode facilitar a expressão de uma sequência de codificação em uma bactéria. Do mesmo modo, um vetor de expressão vegetal pode facilitar a expressão de uma sequência de codificação em uma célula vegetal. As sequências de polinucleotídeo que facilitam a expressão em procariotos podem incluir, por exemplo, e sem limitação, um promotor; um operador; e um sítio de ligação de ribossomo. Os vetores de expressão eucariótica (por exemplo, um vetor de expressão vegetal) podem compreender, por exemplo, promotores; potencializadores; sinais de terminação; e os sinais de poliadenilação (e outras sequências) que são geralmente diferentes dos usados em vetores de expressão procarióticos.
[0053] Identidade de sequência: O termo "identidade de sequência" ou "identidade", como usado neste pedido, no contexto de dois ácidos nucleicos ou sequências polipeptídicas, refere-se aos resíduos nas duas sequências que são os mesmos quando alinhados com correspondência máxima sobre uma janela de comparação especificada. Um valor de identidade de sequência pode ser determinado comparando duas sequências otimamente alinhadas (por exemplo, sequências de ácidos nucleicos e sequências de aminoácidos) sobre uma janela de comparação, em que a porção da sequência na janela de comparação pode compreender adições ou deleções (isto é, lacunas) quando comparada com a sequência de referência (que não compreende adições ou deleções) para o alinhamento ótimo das duas sequências. A identidade de sequência é calculada como uma porcentagem determinando o número de posições nas quais o resíduo de aminoácido ou nucleotídeo idêntico ocorre em ambas as sequências para produzir o número de posições compatíveis, dividindo o número de posições compatíveis pelo número total de posições na janela de comparação, e multiplicando o resultado por 100 para produzir a porcentagem da identidade de sequência.
[0054] Os métodos para alinhamento de sequências para comparação são bem conhecidos na técnica. Vários programas e algoritmos de alinhamento são descritos em, por exemplo: Smith e Waterman (1981) Adv. Appl. Math. 2:482; Needleman e Wunsch (1970) J. Mol. Biol. 48:443; Pearson e Lipman (1988) Proc. Natl. Acad. Sci. U.S.A. 85:2444; Higgins e Sharp (1988) Gene 73:237-44; Higgins e Sharp (1989) CABIOS 5:151-3; Corpet et al. (1988) Nucleic Acids Res. 16:10881-90; Huang et al. (1992) Comp. Appl. Biosci. 8:155-65; Pearson et al. (1994) Methods Mol. Biol. 24:307-31; Tatiana et al. (1999) FEMS Microbiol. Lett. 174:247-50. Uma consideração detalhada de métodos de alinhamento de sequência e os cálculos de homologia podem ser encontrados em Altschul et al. (1990) J. Mol. Biol. 215:403-10.
[0055] O Instrumento de Pesquisa de Alinhamento Local Básico (BLAST™; Altschul et al. (1990)) do Centro Nacional de Informação Biotecnológica (NCBI) pode ser usado para alinhar sequências, e está disponível de várias fontes, incluindo o Centro Nacional de Informação Biotecnológica (Bethesda, MD), e na Internet, para o uso com relação a vários programas de análise de sequência. Uma descrição de como determinar a identidade de sequência usando este programa está disponível na Internet sob a seção "ajuda" de BLAST ™. Para comparações de sequências de ácidos nucleicos, a função "sequências Blast 2" do programa BLAST™ (Blastn) pode ser empregada usando os parâmetros pré-configurados. As sequências de ácidos nucleicos com maior similaridade com as sequências de referência mostrarão identidade de porcentagem crescente quando avaliadas por este método.
[0056] Como usado neste pedido, o termo "substancialmente idêntico" pode referir-se a sequências nucleotídicas que são mais de 80% idênticas. Por exemplo, uma sequência nucleotídica substancialmente idêntica pode ser pelo menos 85%, pelo menos 86%; pelo menos 87%; pelo menos 88%; pelo menos 89%; pelo menos 90%; pelo menos 91%; pelo menos 92%; pelo menos 93%; pelo menos 94%; pelo menos 95%; pelo menos 96%; pelo menos 97%; pelo menos 98%; pelo menos 99%; ou pelo menos 99,5% idêntica à sequência de referência.
[0057] Locus: Como usado neste pedido, o termo "locus" refere-se a uma posição quanto a um genoma que corresponde a uma característica mensurável (por exemplo, um traço). Em algumas modalidades, um locus de interesse especial é a posição genômica de um gene FAD2, onde a interrupção do gene reduz ou elimina a expressão do mRNA transcrito do gene selvagem. Um locus pode ser definido por uma sonda que se hibridiza com uma sequência nucleotídica única contida dentro do locus durante a hibridização Southern ou durante a PCR.
[0058] Marcador: Como usado neste pedido, um "marcador" refere-se a um gene ou sequência nucleotídica que pode ser usada para identificar plantas que provavelmente terão um alelo particular e/ou exibirão um traço ou fenótipo particular. Um marcador pode ser descrito como uma variação em um locus genômico dado. Um marcador genético pode ser uma sequência de DNA curta, como uma sequência que circunda uma modificação de par de bases únicas (polimorfismo de nucleotídeo único ou "SNP"), ou sequência longa, por exemplo, um minissatélite/sequência simples repetida ("SSR"). Um "alelo marcador" refere-se à versão do marcador que está presente em uma planta particular. O termo marcador, como usado neste pedido, pode referir-se a um segmento clonado do DNA cromossômico vegetal (por exemplo, um segmento que compreende um locus de FAD2 ou locus de FAD2 modificado e/ou rompido), e também pode-se referir-se alternativamente a uma molécula de DNA que é complementar a um segmento clonado de DNA cromossômico vegetal. Como é reconhecido por aqueles especialistas ordinários na técnica, o processo de obtenção da sequência nucleotídica adicional contígua para inclusão em um marcador pode ser repetido quase indefinidamente (limitado somente pelo comprimento do cromossomo), por meio disso identificando marcadores adicionais ao longo do cromossomo. Todas e quaisquer variedades descritas acima dos marcadores podem ser usadas em algumas modalidades da presente invenção.
[0059] Em algumas modalidades, a presença de um transgene ou marcador (que são caracterizados por uma sequência "alvo") em um germoplasma pode ser detectada por meio do uso de uma sonda de ácido nucleico; por exemplo, um oligonucleotídeo. Uma sonda pode ser uma molécula de DNA ou uma molécula de RNA. Uma sonda de oligonucleotídeo pode ser preparada sinteticamente ou por clonagem. Vetores de clonagem adequados são bem conhecidos por aqueles especialistas na técnica. As sondas de RNA podem ser sintetizadas por meios conhecidos na técnica, por exemplo, usando um molde de molécula de DNA.
[0060] Uma sonda oligonucleotídica pode ser marcada ou não marcada. Uma grande variedade de técnicas existe para marcar moléculas de ácidos nucleicos, incluindo, por exemplo, e sem limitação, radiomarcação por tradução por cortes; preparação aleatória; e adaptação com a desoxitransferase terminal, onde os nucleotídeos empregados são marcados, por exemplo, com 32P radioativo. Outros marcadores que podem ser usados incluem, por exemplo, e sem limitação, fluoróforos; enzimas; substratos enzimáticos; cofatores enzimáticos; e inibidores enzimáticos. Alternativamente, o uso de um marcador que fornece um sinal detectável, por si mesmo ou em conjunto com outros agentes reativos, pode ser substituído por ligantes aos quais os receptores se ligam, onde os receptores são marcados (por exemplo, pelos marcadores indicados) para fornecer sinais detectáveis, por si mesmos, ou em conjunto com outros reagentes. Ver, por exemplo, Leary et al. (1983) Proc. Natl. Acad. Sci. USA 80:4045-9.
[0061] Uma sonda pode ser uma cópia exata de um transgene ou marcador a ser detectado. Uma sonda também pode ser uma molécula de ácido nucleico compreendendo ou consistindo de uma sequência nucleotídica que é substancialmente idêntica a um segmento clonado de DNA cromossômico que compreende o transgene ou marcador a ser detectado. Uma sonda pode compreender ainda sequências de ácidos nucleicos adicionais, por exemplo, promotores; sinais de transcrição; e/ou sequências de vetor.
[0062] Uma sonda pode conter toda ou uma porção da sequência nucleotídica alvo e sequência nucleotídica adicional, contígua do genoma. Isto é referido neste pedido como uma "sonda contígua." A sequência nucleotídica adicional, contígua é referida "a montante" ou "a jusante" do alvo original, dependendo de se a sequência nucleotídica contígua do cromossomo está no lado 5’ ou 3’ do marcador original, como entendido convencionalmente. Uma sonda também pode conter uma sequência nucleotídica que não é contígua àquela do alvo original; esta sonda é referida neste pedido como uma "sonda não contígua". A sequência da sonda não contígua pode estar localizada suficientemente próxima da sequência do alvo original no cromossomo para que a sonda não contígua esteja ligada ao marcador ou transgene original.
[0063] Em algumas modalidades, uma sonda é uma molécula de ácido nucleico que é "especificamente hibridizável" ou "especificamente complementar" a uma cópia exata do alvo a ser detectado. "Especificamente hibridizável" e "especificamente complementar" são termos que indicam um grau suficiente de complementaridade, tal que a ligação estável e específica ocorra entre a molécula de ácido nucleico e o alvo. Uma molécula de ácido nucleico não tem de ser 100% complementar à sua sequência alvo para ser especificamente hibridizável. Uma molécula de ácido nucleico é especificamente hibridizável quando há um grau suficiente de complementaridade para evitar a ligação não específica do ácido nucleico para sequências não alvo sob condições onde a ligação específica é desejada, por exemplo, sob condições de hibridização estringentes.
[0064] As condições de hibridização que resultam nos graus da estringência particulares variarão dependendo da natureza do método de hibridização de escolha e a composição e o comprimento das sequências de ácidos nucleicos hibridizantes. Geralmente, a temperatura da hibridização e a força iônica (especialmente concentração de Na+ e/ou Mg++) do tampão de hibridização determinará a estringência da hibridização, embora os tempos de lavagem também influenciem na estringência. Os cálculos quanto a condições de hibridização requeridas para alcançar graus da estringência particulares são conhecidos por aqueles especialistas ordinários na técnica e são discutidos, por exemplo, em Sambrook et al. (editor). Molecular Cloning: A Laboratory Manual, 2nd ed., vol 1-3, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989, chapters 9 e 11; e Hames e Higgins (eds.) Nucleic Acid Hybridization, IRL Press, Oxford, 1985. Instrução e orientação mais detalhadas quanto à hibridização de ácidos nucleicos podem ser encontradas, por exemplo, em Tijssen, "Overview of principles of hybridization and the strategy of nucleic acid probe assays," em Laboratory Techniques in Biochemistry and Molecular Biology - Hybridization with Nucleic Acid Probes, Part I, Chapter 2, Elsevier, NY, 1993; e Ausubel et al., Eds., Current Protocols in Molecular Biology, Chapter 2, Greene Publishing e Wiley-Interscience, NY, 1995.
[0065] Como usado neste pedido, "condições estringentes" englobam condições sob as quais a hibridização somente ocorrerá se houver incompatibilidade de menos de 25% entre a molécula de hibridização e o alvo de DNA. "Condições estringentes" incluem níveis adicionais particulares de estringência. Dessa forma, como usado neste pedido, condições de "estringência moderada" são aquelas sob as quais as moléculas com incompatibilidade de sequência de mais de 25% não hibridizarão; as condições de "estringência média" são aquelas sob as quais as moléculas com incompatibilidade de mais de 15% não hibridizarão; e condições de "alta estringência" são aquelas sob as quais as sequências com incompatibilidade de mais de 10% não hibridizarão. Condições de "estringência muito alta" são aquelas sob as quais as sequências com incompatibilidade de mais de 6% não hibridizarão.
[0066] Em particulares modalidades, as condições estringentes são hibridização em 65°C em tampão de citrato de sódio salino 6x (SSC), solução de Denhardt 5x, SDS 0,5%, e 100 μg de DNA cortado de testículos de salmão, seguido de 15-30 minutos de lavagem sequencial em 65°C em tampão SSC 2x e SDS 0,5%, seguido de tampão SSC 1x e SDS 0,5%, e finalmente tampão SSC 0,2x e SDS 0,5%.
[0067] (Des)equilíbrio de ligação: Como usado neste pedido, o termo "equilíbrio de ligação" refere-se à situação onde um marcador e um segundo ácido nucleico (por exemplo, transgene, PTU e segundo marcador) segregam independentemente; isto é, o marcador e o segundo tipo de ácido nucleico se separam aleatoriamente entre a progênie. Os ácidos nucleicos que mostram o equilíbrio de ligação são considerados desunidos (se estão no mesmo cromossomo). Como usado neste pedido, o termo "desequilíbrio de ligação" refere-se à situação onde um marcador e um segundo ácido nucleico se segregam de uma maneira não aleatória; isto é, os ácidos nucleicos têm uma frequência de recombinação de menos de 50% (e dessa forma por definição, são separados em menos de 50 cM no mesmo grupo de ligação). Em alguns exemplos, os ácidos nucleicos que mostram desequilíbrio de ligação são considerados ligados.
[0068] Ligado, firmemente ligado, e extremamente firmemente ligado: Como usado neste pedido, a ligação entre um marcador e um segundo ácido nucleico (por exemplo, transgene, PTU e segundo marcador) pode referir-se ao fenômeno no qual os ácidos nucleicos em um cromossomo mostram uma probabilidade mensurável de serem transmitidos em conjunto a indivíduos na próxima geração. Dessa forma, a ligação de um marcador a um segundo ácido nucleico pode ser medida e/ou expressa como uma frequência de recombinação. Quanto mais pertos dois ácidos nucleicos estão entre si, mais próxima de "1" esta probabilidade se torna. Dessa forma, o termo "ligado" pode referir-se a um ou mais genes ou marcadores que são passados em conjunto com um segundo ácido nucleico com uma probabilidade maior do que 0,5 (que é o esperado do sorteamento independente onde os marcadores/genes estão localizados em cromossomos diferentes). Quando a presença de um gene (por exemplo, um transgene) contribui para um fenótipo em um indivíduo, pode ser dito que os marcadores que estão ligados ao gene sejam ligados ao fenótipo. Dessa forma, o termo "ligado" pode referir-se a uma relação entre um marcador e um gene, ou entre um marcador e um fenótipo.
[0069] Uma distância genética relativa (determinada por cruzamento de frequências e medida em centimorgans (cM)) é geralmente proporcional à distância física (medida em pares de base) que dois marcadores ou genes ligados estão separados entre si em um cromossomo. Um centimorgan é definido como a distância entre dois marcadores genéticos que mostram uma frequência de recombinação de 1% (isto é, um evento de cruzamento ocorre entre dois marcadores uma vez a cada 100 divisões celulares). Em geral, um marcador mais próximo é para outro marcador ou gene (se a distância entre eles é medida quanto à distância genética ou distância física,) mais firmemente são ligados. Como a distância cromossômica é aproximadamente proporcional à frequência de eventos de recombinação entre traços, há uma distância física aproximada que está em correlação com a frequência de recombinação. Esta correlação é geralmente conhecida ou prontamente determinável através das plantas de cultura principais (Helentjaris e Burr (eds.) (1989) Development and Application of Molecular Markers to Problems in Plant Genetics. Cold Spring Harbor Laboratory, Cold Spring Harbor, NY; Gresshoff (ed.) (1994) Plant Genome Analysis. CRC Press, Boca Raton, FL; Lander et al. (1987) Genomics 1:174-81; Tanksley et al. (1988) "Molecular mapping of plant chromosomes," Em Chromosome Structure and Function. Gustafson e Appels (eds.) Plenum Press, NY, pp. 157-73) e muitos outros organismos. Por exemplo, 1 cM corresponde a aproximadamente 2,5-3,0 kb na levedura, aproximadamente 140 kb em Arabidopsis, aproximadamente 400 kb no girassol e aproximadamente 350 kb no Eucalipto.
[0070] O termo "ligado" pode referir-se neste pedido a um ou mais ácidos nucleicos que mostram uma frequência de recombinação de menos de 50% (isto é, menos de 50 cM). Por exemplo, os ácidos nucleicos "ligados" podem recombinar-se com uma frequência de aproximadamente 45% ou menos, aproximadamente 40% ou menos, aproximadamente 35% ou menos, aproximadamente 30% ou menos, aproximadamente 25% ou menos, aproximadamente 20% ou menos, aproximadamente 15% ou menos e aproximadamente 10% ou menos. As distâncias físicas entre tais ácidos nucleicos no mesmo cromossomo (se espera que os ácidos nucleicos em cromossomos diferentes estejam em equilíbrio de ligação) que correspondem às frequências de recombinação precedentes dependem do genoma do hospedeiro e podem ser facilmente calculadas como apresentado, supra.
[0071] Como usado neste pedido, o termo "firmemente ligado" pode referir-se a um ou mais ácidos nucleicos que mostram uma frequência de recombinação de aproximadamente 20% ou menos (isto é, aproximadamente 20 cM ou menos). Por exemplo, "os" ácidos nucleicos firmemente ligados podem recombinar-se com uma frequência de 22% ou menos, aproximadamente 18% ou menos, aproximadamente 16% ou menos, aproximadamente 14% ou menos, aproximadamente 12% ou menos, aproximadamente 10% ou menos, aproximadamente 8% ou menos, aproximadamente 6% ou menos, aproximadamente 4% ou menos e aproximadamente 2% ou menos.
[0072] Como usado neste pedido, o termo "extremamente firmemente ligado" pode referir-se a um ou mais ácidos nucleicos que mostram uma frequência de recombinação de aproximadamente 10% ou menos (isto é, aproximadamente 10 cM ou menos). Por exemplo, ácidos nucleicos "extremamente firmemente" ligados podem recombinar-se com uma frequência de 11% ou menos, aproximadamente 9% ou menos, aproximadamente 7% ou menos, aproximadamente 5% ou menos, aproximadamente 8% ou menos, aproximadamente 6% ou menos, aproximadamente 4% ou menos, aproximadamente 3% ou menos, aproximadamente 2% ou menos e aproximadamente 1% ou menos.
[0073] Quanto mais próximo um ácido nucleico particular é de um gene que codifica um polipeptídeo que contribui para um fenótipo particular (se medido quanto à distância genética ou física), mais firmemente ligado é o ácido nucleico particular ao fenótipo. Em vista do precedente, será apreciado que os ácidos nucleicos ligados a um gene ou fenótipo particular incluam aqueles ácidos nucleicos que são firmemente ligados, e aqueles ácidos nucleicos que são extremamente firmemente ligados, ao gene ou fenótipo. Em algumas modalidades, quanto mais perto um ácido nucleico particular é de um locus de FAD2 (por exemplo, um locus de FAD2 modificado ou rompido), se medido quanto à distância genética ou física, mais firmemente ligado é o ácido nucleico particular a algum traço/fenótipo conferido por um ácido nucleico exógeno integrado no locus de FAD2 (ou a um fenótipo de FAD2 selvagem no caso de um locus não modificado). Dessa forma, os marcadores genéticos que são ligados, firmemente ligados e/ou extremamente firmemente ligados a um locus de FAD2 que compreende um ácido nucleico exógeno integrado pode ser útil em um programa MAS para identificar organismos (por exemplo, plantas e variedades de plantas) compreendendo o ácido nucleico integrado, para identificar organismos compreendendo um fenótipo conferido pelo ácido nucleico integrado e produzir tal ácido nucleico integrado e/ou um fenótipo conferido pelo ácido nucleico integrado em outros organismos compatíveis.
[0074] Melhoramento assistido por marcador: Como usado neste pedido, o termo "melhoramento de assistido por marcador" pode se referir a uma abordagem de plantas de melhoramento diretamente para um ou mais traços (por exemplo, um traço poligênico). Na prática atual, os melhoristas de plantas tentam identificar traços facilmente detectáveis, como cor da flor, aparência do revestimento da semente ou variantes de isozima que são ligadas a um traço agronomicamente desejado. Os melhoristas de plantas então seguem o traço agronômico na segregação, produzindo populações seguindo a segregação do traço facilmente detectável. Entretanto, há muito poucas destas relações de ligação entre traços de interesse e traços facilmente detectáveis disponíveis para o uso no melhoramento vegetal. Em algumas modalidades da invenção, o melhoramento assistido por marcador compreende a identificação de um ou mais marcadores genéticos (por exemplo, marcadores de SNP, isozima e/ou SSR) que são ligados a um locus de FAD2 em que um ácido nucleico exógeno que contribui para um traço de interesse foi integrado, e seguindo o traço de interesse em uma segregação, produzindo a população seguindo a segregação de um ou mais marcadores genéticos. Em alguns exemplos, a segregação de um ou mais marcadores genéticos pode ser determinada utilizando uma sonda de um ou mais marcadores genéticos analisando uma amostra genética de uma planta de progênie para a presença de um ou mais marcadores genéticos. O melhoramento assistido por marcador fornece um processo eficiente em tempo e custo para melhora das variedades vegetais.
[0075] Traço ou fenótipo: Os termos "traço" e "fenótipo" são usados intercambiavelmente neste pedido. Para os fins da presente revelação, traços de interesse especial incluem traços agronomicamente importantes, como pode ser expresso, por exemplo, em uma planta de cultura e a produção de produtos de expressão de transgene de um evento de integração visado. O termo "fenótipo molecular" pode referir-se a um fenótipo que é detectável no nível de uma população de (uma ou mais) moléculas. Em alguns exemplos, o fenótipo molecular somente pode ser detectável no nível molecular. As moléculas detectáveis do fenótipo podem ser ácidos nucleicos (por exemplo, DNA ou RNA genômico); proteínas; e/ou metabólitos. Por exemplo, um fenótipo molecular pode ser um perfil de expressão de um ou mais produtos gênicos (por exemplo, em um estágio específico do desenvolvimento vegetal, ou em resposta a uma condição ambiental ou estresse).
[0076] Locus de Traço Quantitativo: Traços que estão variando continuamente devido às influências genéticas (aditivas, dominantes e epistáticas) e ambientais são referidos comumente como "traços quantitativos." Os traços quantitativos podem ser distinguidos de traços, "qualitativos", ou "discretos" com base em dois fatores; as influências ambientais na expressão gênica que produzem uma distribuição contínua de fenótipos e o modelo de segregação complexo produzido pela herança multigênica. A identificação de uma ou mais regiões do genoma ligadas à expressão de um traço quantitativo define tais regiões como Loci de Traço Quantitativo ("QTL").
[0077] Planta: Como usado neste pedido, o termo "planta" pode referir-se a uma planta inteira, uma célula ou cultura de tecido derivada de uma planta e/ou qualquer parte de qualquer um dos precedentes. Dessa forma, o termo "planta" engloba, por exemplo, e sem limitação, plantas inteiras; componentes vegetais e/ou órgãos (por exemplo, folhas, troncos e raízes); tecido vegetal; semente; e uma célula vegetal. Uma célula vegetal pode ser, por exemplo, e sem limitação, uma célula interna e/ou de uma planta, uma célula isolada de uma planta e uma célula obtida por meio de cultura de uma célula isolada de uma planta.
[0078] Uma "planta transgênica" é uma planta compreendendo dentro de pelo menos uma das suas células um polinucleotídeo exógeno. O termo "transgênico" é usado neste pedido para referir-se a qualquer célula, linhagem celular, calo, tecido, parte vegetal ou planta, o genótipo da qual foi alterado pela presença de um ácido nucleico exógeno. Dessa forma, este termo engloba organismos e células transgênicos que foram inicialmente alterados para compreender o polinucleotídeo exógeno, e aqueles organismos e células criados por cruzamentos ou propagação assexuada do organismo ou célula transgênicos iniciais. O termo "transgênico", como usado neste pedido, não engloba alternações de genoma (cromossômico ou extracromossômico) introduzidas por métodos de melhoramento vegetal convencionais (por exemplo, cruzamentos dos organismos somente não transgênicos) ou por eventos que ocorrem naturalmente (por exemplo, Fertilização cruzada aleatória, infecção viral não recombinante, transformação bacteriana não recombinante, transposição não recombinante e mutação espontânea).
[0079] Uma "linhagem", "variedade" ou "cepa" vegetal é um grupo de plantas individuais que têm a mesma ascendência. As plantas de uma linhagem geralmente são puras até certo ponto, e são geralmente homozigotas e homogêneas na maioria dos loci genéticos (por exemplo, um locus de FAD2). Uma "sublinhagem" pode referir-se a um subconjunto puro de descendentes de um progenitor comum que são geneticamente distintos de outros subconjuntos similarmente puros descendentes do mesmo progenitor. Em algumas modalidades, uma "sublinhagem" pode ser produzida por autocruzamento da semente de uma planta transgênica individual selecionada na geração F3 à F5 até que os loci de segregação residuais sejam homozigotos na maior parte ou todos os loci.
[0080] Uma "proteína de ligação" é uma proteína que é capaz de ligar-se a outra molécula. Uma proteína de ligação pode ligar-se a, por exemplo, uma molécula de DNA (uma proteína de ligação ao DNA), uma molécula de RNA (uma proteína de ligação ao RNA) e/ou uma molécula de proteína (uma proteína de ligação à proteína). No caso de uma proteína de ligação à proteína, pode ligar-se (para formar homodímeros, homotrímeros, etc.) e/ou pode ligar-se a uma ou mais moléculas de uma proteína ou proteínas diferentes. Uma proteína de ligação pode ter mais de um tipo de atividade de ligação. Por exemplo, as proteínas dedo de zinco têm a ligação de DNA, a ligação de RNA e a atividade de ligação proteica.
[0081] A "proteína de ligação ao DNA dedo de zinco" (ou domínio de ligação) é uma proteína ou domínio dentro de uma proteína maior, que se liga ao DNA de uma maneira específica para a sequência por um ou mais dedos de zinco, que são as regiões da sequência de aminoácidos dentro do domínio de ligação cuja estrutura é estabilizada pela coordenação de um íon zinco. O termo proteína de ligação ao DNA dedo de zinco muitas vezes é abreviado como proteína dedo de zinco ou ZFP.
[0082] "Domínio de ligação de TALE ao DNA" ou "TALE" é um polipeptídeo que compreende um ou mais domínios/unidades de repetição de TALE. Os domínios repetidos estão envolvidos em ligação de TALE à sua sequência de DNA alvo cognata. Uma "unidade repetida única" (também referida como uma "repetição") tem tipicamente 33-35 aminoácidos de comprimento e exibe pelo menos alguma homologia de sequência com outras sequências de repetição de TALE dentro de uma proteína de TALE que ocorre naturalmente.
[0083] Domínios dedo de zinco e de ligação de TALE podem ser "engendrados" para se ligarem a uma sequência nucleotídica predeterminada, por exemplo, via engenharia (alterando um ou mais aminoácidos) da região de hélice de reconhecimento de um dedo de zinco que ocorre naturalmente ou proteína de TALE. Por isso, proteínas de ligação ao DNA engendradas (dedos de zinco ou TALEs) são proteínas que não ocorrem naturalmente. Exemplos não limitantes de métodos para engenharia de proteínas de ligação ao DNA são desenho e seleção. A proteína de ligação de DNA projetada é uma proteína que não ocorre na natureza cujo desenho/composição resulta principalmente de critérios racionais. Os critérios racionais de desenho incluem aplicação de regras de substituição e algoritmos computadorizados para processar a informação em uma informação de armazenamento sobre o banco de dados de ZFP existente e/ou desenhos de TALE e dados de ligação. Ver, por exemplo, Patentes US 6.140.081; 6.453.242; e 6.534.261; também ver WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 e WO 03/016496 e a Publicação U.S. No. 20110301073.
[0084] Uma proteína dedo de zinco "selecionada" ou TALE é uma proteína não encontrada na natureza cuja produção resulta principalmente de um processo empírico como exposição de fago, armadilha de interação ou seleção híbrida. Ver, por exemplo, US 5.789.538; US 5.925.523; US 6.007.988; US 6.013.453; US 6.200.759; WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970 WO 01/88197, WO 02/099084 e a Publicação U.S. No. 20110301073.
[0085] "Clivagem" refere-se à quebra do esqueleto covalente de uma molécula de DNA. A clivagem pode ser iniciada por uma variedade de métodos incluindo, mas não limitada à hidrólise enzimática ou química de uma ligação fosfodiéster. Tanto clivagem de fita simples como clivagem de fita dupla é possível, e a clivagem de fita dupla pode ocorrer em consequência de dois eventos de clivagem de fita simples distintos. A clivagem de DNA pode resultar na produção de extremidades cegas ou de extremidades irregulares. Em certas modalidades, os polipeptídeos de fusão são usados para a clivagem de DNA de fita dupla direcionada.
[0086] Um "meio-domínio de clivagem" é uma sequência polipeptídica que, em conjunto com um segundo polipeptídeo (idêntico ou diferente) forma um complexo que tem atividade de clivagem (preferencialmente atividade de clivagem de fita dupla). Os termos "primeiros e segundos meio-domínios de clivagem;" "+ e - meio- domínios de clivagem" e "meio-domínios de clivagem direita e esquerda" são usados intercambiavelmente para se referir aos pares de meio-domínios de clivagem que se dimerizam.
[0087] Um "meio-domínio de clivagem engendrado" é um meio- domínio de clivagem que foi modificado para formar ligações de heterodímeros com outro meio-domínio de clivagem (por exemplo, outro meio-domínio de clivagem engendrado). Ver, também, a Publicação de Patente U.S. No. 2005/0064474, 20070218528, 2008/0131962 e 2011/0201055, incorporadas neste pedido por referência em suas totalidades.
[0088] Meios para geração de uma quebra de DNA de fita dupla: Como usado neste pedido, o termo "meios para gerar uma quebra de DNA de fita dupla" é destinado a invocar as provisões de reivindicação especial autorizadas pelo Congresso em 35 U.S.C. § 112, sexto parágrafo. Especificamente, um "meio para gerar uma quebra de DNA de fita dupla" refere-se a uma estrutura molecular que é capaz da clivagem de ambas as fitas de uma molécula de DNA de fita dupla. Tais estruturas incluem domínios de polipeptídeos compreendidos dentro de muitas proteínas de nuclease conhecidas, por exemplo, o domínio de nuclease FokI, o domínio catalítico é selecionado a partir do grupo consistindo de proteínas Mmel, Colicina-E7 (CEA7_ECOLX), Colicina-E9, APFL, EndA, Endo I (END1_EC0LI), Endo G Humana (NUCG_HUMAN), Endo G Bovina (NUCG_BOVIN), R.HinPll, l-Basl, l- Bmol, l-Hmul, l-Tevl, l-Tevll, l-Tevlll, l-Twol, R.Mspl, R.Mval, NucA, NucM, Vvn, Vvn_CLS, nuclease de estafilocos (NUC_STAAU), nuclease de estafilocos (NUC_STAHY), nuclease de micrococus (NUC_SHIFL), Endonuclease yncB, Endodesoxirribonuclease I (ENRN_BPT7), Metnase, Nb.BsrDI, BsrDI A, Nt.BspD6l (grande subunidade de R.BspD6l), ss. BspD6l (pequena subunidade de R.BspD6l), R.PIel, Mlyl, Alwl, Mval269l, Bsrl, Bsml, Nb.BtsCI, Nt. BtsCI, Rl. Btsl, R2. Btsl, subunidade de BbvCI 1, subunidade de BbvCI 2, subunidade alfa de BpulOI, subunidade beta de BpulOI, Bmrl, Bfil, l- Crel, hExol (EX01JHUMAN), Exol de Levedura (EX01_YEAST), Exol de E.coli, TREX2 Humano, TREX1 de Camundongo, TREX1 Humano, TREX1 Bovina, TREX1 de Rato, DNA2 Humano, DNA2 de Levedura (DNA2_YEAST).
[0089] Meios para reparação de uma quebra de DNA de fita dupla: Como usado neste pedido, o termo "meios para reparação de uma quebra de DNA de fita dupla" também é destinado a invocar as provisões de reivindicação especial autorizadas pelo Congresso em 35 U.S.C. § 112, sexto parágrafo. Especificamente, um "meio para reparação de uma quebra de DNA de fita dupla" refere-se a uma estrutura molecular que é capaz de facilitar/catalisar a junção das extremidades de moléculas de DNA de fita dupla, por exemplo, juntando extremidades geradas clivando uma molécula única de DNA de fita dupla, ou juntando uma extremidade gerada clivando uma molécula única de DNA de fita dupla com a extremidade de uma molécula única de DNA de fita dupla exógena. Tais estruturas incluem domínios de polipeptídeos compreendidos dentro de muitas proteínas ligase conhecidas, por exemplo, Cre recombinase. Em alguns exemplos, a mesma estrutura molecular pode servir tanto de um meio para gerar uma quebra de DNA de fita dupla como de um meio para consertar uma quebra de DNA de fita dupla, onde a mesma estrutura facilita tanto a clivagem como reparo de moléculas de DNA de fita dupla (por exemplo, Hin recombinase).
[0090] A indução de quebras de fita dupla sítio-específicas no genoma induz a via de reparo de DNA celular da planta hospedeira que resolve a quebra de fita dupla através de reparo de junção de extremidade não homóloga (NHEJ) ou reparo direcionado por homologia (HDR). Em plantas, a literatura científica relata que o gene exato ou a integração de DNA de doador em posições genômicas nativas ou em pré-engendradas envolveu construto(s) de DNA de doador de entrada que compreendem quantidades variadas da sequência homóloga às sequências que flanqueiam a quebra direcionada de fita dupla. A integração de tais doadores no locus alvo específico presumivelmente dependeu da via de HDR. Depender exclusivamente da abordagem de HDR do direcionamento gênico em plantas pode ter limitações devido a relatos que a via de reparo de HDR não é a via de reparo de DNA dominante quando comparada com NHEJ. A literatura científica de plantas publicada utilizando quebras de DNA alvo específicas (ZFN, TALeNs ou Meganucleases Engendradas, etc.) a via NHEJ foi relatada como o método para introduzir mutações pontuais específicas (inserções ou deleções) no genoma. Neste pedido relatamos que quebras de fita dupla sítio- específicas (induzido pela ZFN, TALeNs, etc.) presentes de vários desenhos do DNA doador com regiões de homologia de 0 a <10 bp podem ser especificamente inseridas na quebra direcionada através da via de reparo de NHEJ em plantas. Uma variedade de diferentes desenhos de DNA doador com homologia zero a pequena variação de 1-10 bp de fita linear até a circular, fita única para fita dupla pode ser direcionada a posições específicas usando a via de NHEJ. Direcionamento de genoma de planta de DNA doador baseado em NHEJ pode ser baseado em "captura de extremidade adesiva", onde o intervalo de fita dupla visado no genoma gerado por Fok1 (ou outros domínios de endonuclease Tipo II) e as extremidades adesivas correspondentes está nos desenhos de DNA doador de NHEJ. DNA doador de extremidades adesivas pode ser entregue diretamente à célula como DNA doador linear com protuberâncias predestinadas. Uma abordagem alternativa é produzir extremidades adesivas de DNA doador in vivo co-entregando à ZFN alvo do hospedeiro e uma molécula doadora de DNA circular que contém pelo menos um sítio de reconhecimento de ZFN que é idêntico ao sítio de reconhecimento alvo. A expressão de pelo menos uma ZFN corta o DNA genômico do hospedeiro (nativo ou pré-engendrado) e DNA doador circular para produzir extremidades adesivas que são resolvidas usando as via de reparo de NHEJ dos hospedeiros.
[0091] É possível ter um ou mais sítios de cortes de ZFN na molécula doadora (um sítio de corte de ZFN único para linearizar a molécula doadora inteira, 2 dos mesmos sítios de ZFN para liberar um fragmento de DNA doador menor ou 2 sítios de ZFN diferentes para liberar um fragmento do doador e um fragmento correspondente do DNA genômico do hospedeiro (substituição de DNA).
[0092] Dessa forma, o polinucleotídeo doador pode ser DNA ou RNA, de fita simples e/ou fita dupla e pode ser introduzido em uma célula na forma linear ou circular. Ver, por exemplo, a Publicação de Patente U.S. No. 20100047805 e 20110207221. Em certas modalidades da presente invenção, também podem incluir ácido(s) nucleico(s) linear(es) exógeno(s) (doador), composições que compreendem estes ácidos nucleicos e os métodos da criação e utilização destas moléculas doadoras lineares. Em certas modalidades, a molécula doadora linear estavelmente persiste na célula na qual é introduzida. Em outras modalidades, a molécula doadora linear é modificada para resistir a clivagem exonucleolítica, por exemplo, pela colocação de um ou mais ligações fosfodiéster de fosforotioato entre um ou mais pares de base nas extremidades da molécula doadora. O ácido nucleico exógeno linear também pode incluir DNA específico de fita única.
III. Loci de desempenho de FAD2
[0093] Os loci designados FAD2 (ácido graxo desaturase 2) estão incluídos em QTLs envolvidos na herança do traço multigênico complexo do conteúdo de ácido graxo em plantas. FAD2 codifica a enzima responsável pelo dessaturação de ácido oleico (18:1) a ácido linoleico (C18:2). Tanhuanpaa et al. (1998) Mol. Breed. 4:543-50; Schierholt et al. (2001) Crop Sci. 41:1444-9.
[0094] Dentro da via biossintética do óleo vegetal, ácido graxo desaturases (FADs) desempenham um papel-chave na biossíntese de lipídio vegetal e sua atividade significativamente influencia na composição de ácidos graxos. FADs é abundante em plantas, e a análise de expressão sugeriu que mRNAs de FAD são produzidos em superabundância. Além disso, os genes de FAD são expressos em vários tecidos e tipos celulares, bem como compartimentos subcelulares incluindo o plastídeo e retículo endoplasmático.
[0095] A composição de ácidos graxos de plantas e o desempenho de óleos produzidos destas em muitas aplicações, são determinados pelas concentrações relativas dos constituintes de ácido graxo principais; oleico, linoleico, e linolênico (C18:3). As concentrações destes ácidos graxos são predominantemente reguladas pela função das enzimas FAD2 e FAD3. O ácido oleico é convertido no ácido linoleico e ácido linolênico em plantas de acordo com o esquema: C18:0 ^ C18:1 ^ C18:2 ^ C18:3 FAD2 FAD3
[0096] Os genes de FAD2 foram identificados em espécies vegetais e algáceas principais incluindo, mas não limitados a milho, soja, algodão, Arabidopsis, trigo, gramas de forragem, arroz, girassol e Brassica, e a modificação da expressão de FAD2 leva a perfis de ácido graxo alterados em tais organismos. Além disso, as plantas que compreendem genes FAD2 modificados foram comercializadas, e foi mostrado que a interrupção de um gene FAD2 é capaz de melhorar as propriedades nutritivas e funcionais de óleo produzido por uma planta hospedeira sem uma penalidade agronômica à planta hospedeira. Por exemplo, variedades de canola e girassol que foram comercializadas sob a marca Nexera® (Dow AgroSciences, LLC) são caracterizados por uma composição de ácido oleico mais alta, linoleico mais baixa foi bem sucedido, e ácido linolênico mais baixa (e ácido graxo mais baixo saturado), quando em comparação com perfis selvagens de canola e girassol.
[0097] Como descrito em Chi, X., et al., ((2011) Genome-wide analysis of fatty acid desaturases in soybean (Glycine max). Plant Molecular Biology Reports 29, 769-783), neste pedido incorporado por referência; cópias gênicas funcionais conhecidas de FAD2 na soja foram filogeneticamente localizadas em nove subfamílias com as contrapartes de Arabidopsis, FAB2, FAD2, FAD3, FAD5, FAD6, FAD7, FAD8, SLD1 e DES1. Foi descoberto que vinte e nove genes de desaturase estavam distribuídos em pelo menos 15 dos 20 cromossomos de soja. As estruturas gênicas e as composições de motivo foram consideravelmente conservadas entre as subfamílias. A maioria de genes de desaturase mostrou padrões de expressão temporais e espaciais específicos através de tecidos diferentes e estágios de desenvolvimento baseados em análises de dados de microarranjo.
[0098] Os loci de FAD2 podem ser modificados e/ou interrompidos em uma planta sem afetar danosamente o valor da planta, e com muitos objetivos, com um aumento real no seu valor, incluindo alteração da expressão de FAD2, alteração de conteúdo/proporções de óleo e/ou integração e expressão de transgenes desejados. Além disso, de acordo com a natureza ubíqua de loci de FAD em plantas, os loci de FAD2 podem ser modificados e/ou interrompidos sem detrimento de pelo menos alguns alvos em muitas espécies, incluindo, por exemplo, e sem limitação: canola; soja; milho; trigo; gramas de forragem; brassica sp.; arroz, tomates, cevada; aveia; sorgo; algodão; e girassol, bem como fungos e algas. As modalidades da invenção incluem loci de FAD2, e o uso deste como loci de desempenho para integração de ácidos nucleicos exógenos. Em exemplos, um locus de FAD2 exibe pelo menos um de vários atributos que foram encontrados sendo desejáveis dentro do contexto do seu uso como um locus de desempenho, incluindo, por exemplo, e sem limitação: que haja um nível aproximadamente consistente da expressão durante o ciclo de vida do organismo hospedeiro; e surpreendentemente, aquela inserção de DNA doador em um locus de FAD2 não induz uma penalidade de aptidão ou qualidade no hospedeiro.
[0099] Em algumas modalidades da presente invenção, pelo menos um locus de FAD2 (por exemplo, um locus de FAD2 2.3 e locus de FAD2 2.6) é usado como um sítio alvo para a integração sítio- específica de um ácido nucleico exógeno (por exemplo, um ácido nucleico que compreende uma sequência nucleotídica que codifica um polipeptídeo de interesse). Em modalidades particulares, a integração do ácido nucleico exógeno resulta em um locus modificado. Por exemplo, a integração do ácido nucleico exógeno pode modificar o locus para produzir um gene interrompido (isto é, inativado) de FAD2.
[00100] Em algumas modalidades, um locus de FAD2 pode compreender uma sequência nucleotídica que é especificamente hibridizável ao complemento de uma sequência nucleotídica selecionada a partir do grupo consistindo das SEQ ID NOS: 14 a SEQ ID NO: 20. Por exemplo, um locus de FAD2 pode compreender uma sequência nucleotídica selecionada a partir do grupo consistindo das SEQ ID NOS: 14 a SEQ ID NO: 20. Em algumas modalidades, um locus de FAD2 pode compreender uma sequência nucleotídica que é substancialmente idêntica a uma sequência nucleotídica selecionada a partir do grupo consistindo das SEQ ID NOS: 14 a SEQ ID NO: 20. Por exemplo, em algumas modalidades, um locus de FAD2 é um homólogo de FAD2 (por exemplo, um ortólogo ou um parálogo) que compreende uma sequência nucleotídica que é pelo menos aproximadamente 85% idêntica a uma sequência nucleotídica selecionada a partir do grupo consistindo das SEQ ID NOS: 14 a SEQ ID NO: 20. Um homólogo de FAD2 pode compreender uma sequência nucleotídica isto é, por exemplo, e sem limitação: pelo menos 80%; pelo menos 85%; pelo menos aproximadamente 90%; pelo menos aproximadamente 91%; pelo menos aproximadamente 92%; pelo menos aproximadamente 93%; pelo menos aproximadamente 94%; pelo menos aproximadamente 95%; pelo menos aproximadamente 96%; pelo menos aproximadamente 97%; pelo menos aproximadamente 98%; pelo menos aproximadamente 99%; pelo menos aproximadamente 99,5%; 99,6%, 99,7%, 99,8% e/ou pelo menos aproximadamente 99,9% idêntica a uma sequência nucleotídica selecionada a partir do grupo consistindo das SEQ ID NOS: 14 a SEQ ID NO: 20. Tal homólogo de FAD2 pode ser prontamente identificado e isolado de qualquer genoma completo ou parcial prontamente disponível para aqueles da habilidade na técnica de uma variedade de organismos.
IV. Integração direcionada de um ácido nucleico em um locus de FAD2
[00101] A integração sítio-específica de um ácido nucleico exógeno em um locus de FAD2 pode ser realizada por qualquer técnica conhecida por aqueles especialistas na técnica. Em algumas modalidades, a integração de um ácido nucleico exógeno em um locus de FAD2 compreende colocar em contato uma célula (por exemplo, uma célula isolada ou uma célula em um tecido ou organismo) com uma molécula de ácido nucleico que compreende o ácido nucleico exógeno. Em exemplos, tal molécula de ácido nucleico pode compreender sequências nucleotídicas que flanqueiam o ácido nucleico exógeno que facilitam a recombinação homóloga entre a molécula de ácido nucleico e pelo menos um locus de FAD2. Em exemplos particulares, as sequências nucleotídicas que flanqueiam o ácido nucleico exógeno que facilitam a recombinação homóloga podem ser complementares a nucleotídeos endógenos do locus de FAD2. Em exemplos particulares, as sequências nucleotídicas que flanqueiam o ácido nucleico exógeno que facilitam a recombinação homóloga podem ser complementares a nucleotídeos exógenos anteriormente integrados. Em algumas modalidades, uma pluralidade de ácidos nucleicos exógenos pode estar integrada em um locus de FAD2, tal como no empilhamento gênico.
[00102] A integração de um ácido nucleico em um locus de FAD2 pode ser facilitada (por exemplo, catalisada) em algumas modalidades pelo maquinário celular endógeno de uma célula hospedeira, tal como, por exemplo, e sem limitação, DNA endógeno e enzimas recombinase endógenas. Em algumas modalidades, a integração de um ácido nucleico em um locus de FAD2 pode ser facilitada por um ou mais fatores (por exemplo, polipeptídeos) que são fornecidos a uma célula hospedeira. Por exemplo, polipeptídeos de nuclease(s), recombinase(s), e/ou ligase podem ser fornecidos (independentemente ou como parte de um polipeptídeo quimérico) colocando em contato os polipeptídeos com a célula hospedeira, ou expressão dos polipeptídeos dentro da célula hospedeira. Consequentemente, em alguns exemplos, um ácido nucleico que compreende uma sequência nucleotídica que codifica pelo menos um polipeptídeo de nuclease, recombinase, e/ou ligase pode ser introduzido na célula hospedeira, concorrentemente ou sequencialmente com um ácido nucleico para ser o sítio especificamente integrado em um locus de FAD2, em que pelo menos uma polipeptídeo nuclease, recombinase, e/ou ligase são expressos da sequência nucleotídica na célula hospedeira.
A. Polipeptídeos de ligação ao DNA
[00103] Em algumas modalidades, a integração sítio-específica pode ser realizada utilizando fatores que são capazes de reconhecimento e ligação a sequências nucleotídicas particulares, por exemplo, no genoma de um organismo hospedeiro. Por exemplo, muitas proteínas compreendem domínios de polipeptídeo que são capazes de reconhecimento e ligação ao DNA de uma maneira sítio- específica. Uma sequência de DNA que é reconhecida por um polipeptídeo de ligação ao DNA pode ser referida como uma sequência "alvo". Os domínios de polipeptídeo que são capazes de reconhecimento e ligação a DNA em uma maneira sítio-específica geralmente enovelam-se corretamente e funcionam independentemente para ligar-se ao DNA de uma maneira sítio- específica, mesmo quando expressos em um polipeptídeo além da proteína da qual o domínio foi originalmente isolado. Similarmente, sequências alvo para reconhecimento e ligação por polipeptídeos de ligação ao DNA são geralmente capazes de serem reconhecidas e ligadas por tais polipeptídeos, mesmo quando presentes em grandes estruturas de DNA (por exemplo, um cromossomo), particularmente quando o sítio onde a sequência alvo é localizada é um conhecido como sendo acessível a proteínas celulares solúveis (por exemplo, um gene).
[00104] Enquanto os polipeptídeos de ligação ao DNA identificados de proteínas que existem na natureza tipicamente se ligam a uma sequência nucleotídica discreta ou motivo (por exemplo, uma sequência de reconhecimento de consenso), os métodos existem e são conhecidos na técnica por modificar muitos tais polipeptídeos de ligação ao DNA para reconhecer uma sequência nucleotídica diferente ou motivo. Os polipeptídeos de ligação ao DNA incluem, por exemplo, e sem limitação: domínios de ligação de DNA de dedo de zinco; zíperes de leucina; domínios de ligação de DNA de UPA; GAL4; TAL; LexA; um repressor de Tet; LacR; e um receptor hormonal de esteroide.
[00105] Em alguns exemplos, um polipeptídeo de ligação ao DNA é um dedo de zinco. Os motivos de dedo de zinco individuais podem ser projetados para visar e ligar-se especificamente a qualquer uma de uma grande faixa de sítios de DNA. Polipeptídeos de Cys2His2 canônicos (bem como Cys3His não canônicos) de dedo de zinco ligam- se ao DNA inserindo uma a-hélice na ranhura principal da hélice dupla do DNA alvo. O reconhecimento de DNA em um dedo de zinco é modular; cada dedo entra em contato principalmente com três pares de base consecutivos no alvo e alguns resíduos-chave no polipeptídeo reconhecimento mediano. Pela inclusão de múltiplos domínios de ligação de DNA de dedo de zinco em uma endonuclease de direcionamento, a especificidade de ligação ao DNA da endonuclease de direcionamento pode ser ainda aumentada (e por isso a especificidade de quaisquer efeitos reguladores gênicos conferidos por meio disso também pode ser aumentada). Ver, por exemplo, Urnov et al. (2005) Nature 435:646-51. Dessa forma, um ou mais polipeptídeos de ligação de DNA de dedo de zinco podem ser engendrados e utilizados tais que uma endonuclease de direcionamento introduzida em uma célula hospedeira interage com uma sequência de DNA que é única dentro do genoma da célula hospedeira.
[00106] Preferencialmente, a proteína dedo de zinco que não ocorre naturalmente em que é engendrada para ligar-se a um sítio alvo da escolha. Ver, por exemplo, Ver, por exemplo, Beerli et al. (2002) Nature Biotechnol. 20:135-141; Pabo et al. (2001) Ann. Rev. Biochem. 70:313-340; Isalan et al. (2001) Nature Biotechnol. 19:656-660; Segal et al. (2001) Curr. Opin. Biotechnol. 12:632-637; Choo et al. (2000) Curr. Opin. Struct. Biol. 10:411-416; Patentes U.S. Nos. 6.453.242; 6.534.261; 6.599.692; 6.503.717; 6.689.558; 7.030.215; 6.794.136; 7.067.317; 7.262.054; 7.070.934; 7.361.635; 7.2583.273; e a Publicação de Patente U.S. No. 2005/0064474; 2007/0218528; 2005/0267061, todos incorporados neste pedido por referência nas suas totalidades.
[00107] Um domínio de ligação de dedo de zinco engendrado pode ter uma especificidade de ligação nova, em comparação com uma proteína dedo de zinco que ocorre naturalmente. Os métodos de engenharia incluem, mas não são limitados a desenho racional e vários tipos da seleção. O desenho racional inclui, por exemplo, usar bancos de dados que compreendem sequências nucleotídicas em tripleto (ou quadripleto) e sequências de aminoácidos de dedo de zinco individuais, nas quais cada sequência nucleotídica em quadripleto ou tripleto está associada com uma ou mais sequências de aminoácidos de dedos de zinco que se ligam à sequência particular em tripleto ou quadripleto. Ver, por exemplo, as Patentes U.S. co- proprietárias 6.453.242 e 6.534.261, incorporado por referência neste pedido nas suas totalidades.
[00108] Os métodos de seleção exemplares, incluindo monitor de fago e sistemas de dois híbridos, são descritos nas patentes US 5.789.538; 5.925.523; 6.007.988; 6.013.453; 6.410.248; 6.140.466; 6.200.759; e 6.242.568; bem como WO 98/37186; WO 98/53057; WO 00/27878; WO 01/88197 e GB 2.338.237. Além disso, o aumento da especificidade de ligação dos domínios de ligação dedo de zinco foi descrito, por exemplo, em WO co-proprietário 02/077227.
[00109] Além disso, como descrito nestas e outras referências, domínios de dedo de zinco e/ou proteínas dedo de zinco multidedos pode ser ligados em conjunto usando qualquer sequência ligante adequada, incluindo por exemplo, ligantes de 5 ou mais aminoácidos de comprimento. Ver, também, as Patentes U.S. Nos. 6.479.626; 6.903.185; e 7.153.949 para sequências ligantes exemplares de 6 ou mais aminoácidos de comprimento. As proteínas descritas neste pedido podem incluir qualquer combinação de ligantes adequados entre os dedos de zinco individuais da proteína.
[00110] Seleção de sítios alvo; as ZFPs e os métodos de desenho e construção de proteínas de fusão (e polinucleotídeos que codificam as mesmas) são conhecidos por aqueles especialistas na técnica e descritos detalhadamente nas patentes U.S. Nos. 6.140.0815; 789.538; 6.453.242; 6.534.261; 5.925.523; 6.007.988; 6.013.453; 6.200.759; WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970 WO 01/88197; WO 02/099084; WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 e WO 03/016496.
[00111] Além disso, como descrito nestas e outras referências, domínios de dedo de zinco e/ou proteínas dedo de zinco multidedos podem ser ligados em conjunto usando qualquer sequência ligante adequada, incluindo por exemplo, os ligantes de 5 ou mais aminoácidos de comprimento. Ver, também, as Patentes U.S. Nos. 6.479.626; 6.903.185; e 7.153.949 para sequências ligantes exemplares de 6 ou mais aminoácidos de comprimento. As proteínas descritas neste pedido podem incluir qualquer combinação de ligantes adequados entre os dedos de zinco individuais da proteína.
[00112] Em alguns exemplos, um polipeptídeo de ligação ao DNA é um domínio de ligação ao DNA de GAL4. GAL4 é um transativador modular em Saccharomyces cerevisiae, mas também opera como um transativador em muitos outros organismos. Ver, por exemplo, Sadowski et al. (1988) Nature 335:563-4. Neste sistema regulador, a expressão de genes que codificam a via metabólica de enzimas galactose em S. cerevisiae é estritamente regulada pela fonte de carbono disponível. Johnston (1987) Microbiol. Rev. 51:458-76. O controle transcricional destas enzimas metabólicas é mediado pela interação entre a proteína reguladora positiva, GAL4 e uma sequência de DNA simétrica de 17 bp à qual GAL4 especificamente se liga (o UAS).
[00113] GAL4 nativo consiste de 881 resíduos de aminoácido, com um peso molecular de 99 kDa. GAL4 compreende domínios funcionalmente autônomos, as atividades combinadas dos quais contabilizam da atividade de GAL4 in vivo. Ma e Ptashne (1987) Cell 48:847-53); Brent e Ptashne (1985) Cell 43 (3 Pt 2):729-36. Os aminoácidos do N-terminal 65 de GAL4 compreendem o domínio GAL4 de ligação ao DNA. Keegan et al. (1986) Science 231:699-704; Johnston (1987) Nature 328:353-5. A ligação específica para a sequência requer a presença de um cátion divalente coordenado por 6 resíduos Cys presentes no domínio de ligação ao DNA. O domínio coordenado que contém o cátion interage e reconhece um tripleto CCG conservado em cada extremidade de UAS de 17 bp via contatos diretos com a ranhura principal da hélice de DNA. Marmorstein et al. (1992) Nature 356:408-14. A função de ligação ao DNA do C-terminal de domínios de ativação transcricionais de posições proteicas na proximidade do promotor, tal que os domínios de ativação possam dirigir a transcrição.
[00114] Os polipeptídeos de ligação ao DNA adicionais que podem ser utilizados em certas modalidades incluem, por exemplo, e sem limitação, uma sequência de ligação de um gene AVRBS3-induzível; uma sequência consenso de ligação de um gene AVRBS3-induzível ou sequência de ligação sintética engendrada deste (por exemplo, domínio de ligação de DNA de UPA); TAL; LexA (ver, por exemplo, Brent & Ptashne (1985), supra); LacR (ver, por exemplo, Labow et al. (1990) Mol. Cell. Biol. 10:3343-56; Baim et al. (1991) Proc. Natl. Acad. Sci. USA 88 (12):5072-6); um receptor hormonal de esteroide (Ellliston et al. (1990) J. Biol. Chem. 265:11517-121); o repressor de Tet (Patente U.S. 6.271.341) e um repressor de Tet mutado que se liga a uma sequência de operador tet na presença, mas não na ausência, de tetraciclina (Tc); o domínio de ligação ao DNA de NF-KB; e os componentes do sistema regulador descritos em Wang et al. (1994) Proc. Natl. Acad. Sci. USA 91 (17):8180-4, que utiliza uma fusão de GAL4, um receptor hormonal e VP16.
[00115] Em certas modalidades, o domínio de ligação ao DNA de uma ou mais das nucleases usadas nos métodos e composições descritas neste pedido compreende um DNA efetor de ocorrência natural ou engendrado (não ocorrendo naturalmente) de domínio de ligação ao TAL. Ver, por exemplo, Publicação de Patente U.S. No. 20110301073, incorporado por referência em sua totalidade neste pedido. É conhecido que as bactérias patogênicas vegetais do gênero Xanthomonas causam muitas doenças em plantas de colheita importantes. A patogenicidade de Xanthomonas depende do sistema de secreção do tipo III conservada (T3S) que injeta mais de 25 proteínas efetoras diferentes na célula vegetal. Entre estas proteínas injetadas são efetores de transcrição similares a ativador (TAL) que mimetizam ativadores transcricionais vegetais e manipulam o transcriptoma vegetal (ver Kay et al (2007) Science 318:648-651). Estas proteínas contêm domínio de ligação ao DNA e um domínio de ativação transcricional. Um dos efetores de TAL mais bem caracterizados é AvrBs3 de Xanthomonas campestgris pv. Vesicatoria (ver Bonas et al (1989) Mol Gen Genet 218: 127-136 e WO2010079430). Os efetores de TAL contêm um domínio centralizado de repetições de tandem, cada repetição contendo aproximadamente 34 aminoácidos, que são a chave para a especificidade de ligação ao DNA destas proteínas. Além disso, contêm uma sequência de localização nuclear e um domínio de ativação transcricional acídico (para uma revisão ver Schornack S, e al (2006) J Plant Physiol 163 (3): 256-272). Além disso, nas bactérias fitopatogênicas Ralstonia solanacearum dois genes, designados brg11 e hpx17 foram encontrados sendo homólogos à família AvrBs3 no Xanthomonas R. solanacearum biovar 1 cepa GMI1000 e no biovar 4 cepa RS1000 (Ver Heuer et al (2007) Appl and Envir Micro 73 (13): 4379-4384). Estes genes são 98,9% idênticos na sequência nucleotídica entre si, mas diferenciam-se por uma deleção de 1.575 bp no domínio repetido de hpx17. Entretanto, ambos os produtos gênicos têm a identidade de sequência de menos de 40% com proteínas de família AvrBs3 de Xanthomonas. Ver, por exemplo, as Patentes U.S. Nos., 8.420.782 e 8.440.431 e Publicação de Patente U.S. No. 20110301073.
[00116] Em outras modalidades, a nuclease compreende um sistema CRISPR/Cas. O locus de CRISPR (repetições palindrômicas curtas interespaçadas agrupadas), que codifica componentes de RNA do sistema e o locus de cas (CRISPR-associado), que codifica proteínas (Jansen et al., 2002. Mol. Microbiol. 43: 1565-1575; Makarova et al., 2002. Nucleic Acids Res. 30: 482-496; Makarova et al., 2006. Biol. Direct 1: 7; Haft et al., 2005. PLoS Comput. Biol. 1: o e60) compõem as sequências gênicas do sistema de nuclease CRISPR/Cas. Os loci de CRISPR em hospedeiros microbianos contêm uma combinação de genes CRISPR-associados (Cas) bem como elementos de RNA de não codificação capazes de programar a especificidade da clivagem de ácido nucleico mediada por CRISPR.
[00117] CRISPR Tipo II é um dos sistemas mais bem caracterizados e realizam a quebra de fita dupla de DNA direcionada em quatro etapas sequenciais. Em primeiro lugar, dois RNA não codificantes, o arranjo de pré-crRNA e tracrRNA, é transcrito do locus de CRISPR. Em segundo lugar, o tracrRNA hibridiza as regiões repetidas do pré-crRNA e medeia o processamento de pré-crRNA em crRNAs maduro que contém sequências de espaçadores individuais. Em terceiro lugar, o complexo crRNA:tracrRNA maduro dirige Cas9 ao DNA alvo via pareamento de bases de Watson-Crick entre o espaçador no crRNA e o protoespaçador em DNA alvo ao lado do motivo adjacente de protoespaçador (PAM), uma exigência adicional do reconhecimento alvo. Finalmente, Cas9 medeia a clivagem de DNA alvo para criar uma quebra de fita dupla dentro do protoespaçador. A atividade do sistema CRISPR/Cas compreende três etapas: (i) a inserção de sequências de DNA alheias no CRISPR ordena para prevenir futuros ataques, em um processo chamado ‘adaptação’, (ii) expressão das proteínas relevantes, bem como expressão e processamento do arranjo, seguida de (iii) interferência mediada por RNA com ácido nucleico alheio. Dessa forma, na célula bacteriana, várias das chamadas proteínas de ‘Cas’ estão envolvidas com a função natural do sistema CRISPR/Cas e desempenham papéis em funções como a inserção de DNA alheio etc..
[00118] Em certas modalidades, a proteína Cas pode ser um "derivado funcional" de uma proteína Cas que ocorre naturalmente. Um "derivado funcional" de um polipeptídeo de sequência nativa é um composto que tem uma propriedade biológica qualitativa em comum com um polipeptídeo da sequência nativa. "Derivados funcionais" incluem, mas não são limitados a, fragmentos de uma sequência nativa e derivados de um polipeptídeo de sequência nativa e seus fragmentos, contanto que tenham uma atividade biológica em comum com um polipeptídeo de sequência nativa correspondente. Uma atividade biológica contemplada neste pedido é a capacidade do derivado funcional de hidrolisar um substrato de DNA em fragmentos. O termo "derivado" engloba tanto variantes de sequência de aminoácidos de polipeptídeo, modificações covalentes, como fusões destes. Os derivados adequados de um polipeptídeo de Cas ou um fragmento deste incluem, mas não são limitados a mutantes, fusões, modificações covalentes da proteína Cas ou um fragmento destes. A proteína Cas, que inclui a proteína Cas ou um fragmento desta, bem como os derivados da proteína Cas ou um fragmento destes, pode ser obtenível de uma célula ou sintetizada quimicamente ou por uma combinação destes dois procedimentos. A célula pode ser uma célula que produz naturalmente a proteína Cas ou célula que naturalmente produz a proteína Cas e é geneticamente engendrada para produzir a proteína Cas endógena em um nível de expressão mais alto ou produzir uma proteína Cas de um ácido nucleico introduzido exogenamente, ácido nucleico o qual codifica Cas que é a mesma ou diferente da Cas endógena. Em alguns casos, a célula não produz naturalmente a proteína Cas e é geneticamente engendrada para produzir uma proteína Cas.
[00119] Em modalidades particulares, um polipeptídeo de ligação ao DNA especificamente reconhece e se liga a uma sequência nucleotídica alvo compreendida dentro de um ácido nucleico genômico de um organismo hospedeiro. Qualquer número de exemplos discretos da sequência nucleotídica alvo pode ser encontrado no genoma do hospedeiro em alguns exemplos. A sequência nucleotídica alvo pode ser rara dentro do genoma do organismo (por exemplo, menos do que aproximadamente 10, aproximadamente 9, aproximadamente 8, aproximadamente 7, aproximadamente 6, aproximadamente 5, aproximadamente 4, aproximadamente 3, aproximadamente 2, ou aproximadamente 1 cópia(s) da sequência alvo pode existir no genoma). Por exemplo, a sequência nucleotídica alvo pode estar localizada em um sítio único dentro do genoma do organismo. As sequências nucleotídicas alvo podem ser, por exemplo, e sem limitação, aleatoriamente dispersas em todas as partes do genoma um com respeito de uma a outra; localizadas em grupos de ligação diferentes no genoma; localizadas no mesmo grupo de ligação; localizadas em cromossomos diferentes; localizadas no mesmo cromossomo; localizadas no genoma em sítios que são expressos sob condições similares no organismo (por exemplo, sob o controle do mesmo, ou substancialmente funcionalmente fatores idênticos, reguladores); e localizadas estritamente entre si no genoma (por exemplo, as sequências alvo podem ser compreendidas dentro de ácidos nucleicos integrados como concatâmeros em loci genômicos).
B. Direcionamento de endonucleases
[00120] Em modalidades particulares, um polipeptídeo de ligação ao DNA que especificamente reconhece e se liga a uma sequência nucleotídica alvo pode ser compreendido dentro de um polipeptídeo quimérico, para conferir a ligação específica à sequência alvo sobre o polipeptídeo quimérico. Em exemplos, tal polipeptídeo quimérico pode compreender, por exemplo, e sem limitação, polipeptídeos de nuclease, recombinase, e/ou ligase, conforme estes polipeptídeos são descritos acima. Os polipeptídeos quiméricos que compreendem um polipeptídeo de ligação ao DNA e uma polipeptídeo de nuclease, recombinase, e/ou ligase também podem compreender outros motivos e/ou domínios de polipeptídeo funcionais, tais como, por exemplo e sem limitação: uma sequência espaçadora posicionada entre os polipeptídeos funcionais na proteína quimérica; um peptídeo líder; um peptídeo que direciona a proteína de fusão a uma organela (por exemplo, o núcleo); os polipeptídeos que são clivados por uma enzima celular; marcadores de peptídeos (por exemplo, Myc, His, etc.) ; e outras sequências de aminoácidos que não interferem na função do polipeptídeo quimérico.
[00121] Os polipeptídeos funcionais (por exemplo, os polipeptídeos de ligação ao DNA e os polipeptídeos de nuclease) em um polipeptídeo quimérico podem ser operacionalmente ligados. Em algumas modalidades, os polipeptídeos funcionais de um polipeptídeo quimérico podem ser operacionalmente ligados pela sua expressão de um polinucleotídeo único que codifica pelo menos os polipeptídeos funcionais ligados entre si na estrutura, para criar um gene quimérico que codifica uma proteína quimérica. Em modalidades alternativas, os polipeptídeos funcionais de um polipeptídeo quimérico podem ser operacionalmente ligados por outros meios, tais como pela ligação cruzada de polipeptídeos independentemente expressos.
[00122] Em algumas modalidades, um polipeptídeo de ligação ao DNA que especificamente reconhece e se liga a uma sequência nucleotídica alvo pode estar compreendido dentro de uma proteína isolada natural (ou mutante desta), em que a proteína isolada natural ou o mutante desta também compreende um polipeptídeo de nuclease (e também pode compreender um polipeptídeo de recombinase e/ou ligase). Exemplos de tais proteínas isoladas incluem TALENs, recombinases (por exemplo, Cre, Hin, Tre e FLP recombinase), CRISPR-Cas9 guiado por RNA e meganucleases.
[00123] Como usado neste pedido, o termo "endonuclease de direcionamento" refere-se a proteínas isoladas naturais ou engendradas e mutantes destas que compreendem um polipeptídeo de ligação ao DNA e um polipeptídeo de nuclease, bem como a polipeptídeos quiméricos que compreendem um polipeptídeo de ligação ao DNA e uma nuclease. Qualquer endonuclease de direcionamento que compreende um polipeptídeo de ligação ao DNA que especificamente reconhece e se liga a uma sequência nucleotídica alvo compreendida dentro de um locus de FAD2 (por exemplo, porque a sequência alvo é compreendida dentro da sequência nativa no locus, ou porque a sequência alvo foi introduzida no locus, por exemplo, por recombinação) pode ser utilizada em certas modalidades.
[00124] Alguns exemplos de polipeptídeos quiméricos que podem ser úteis em modalidades particulares da invenção incluem, sem limitação, combinações dos seguintes polipeptídeos: polipeptídeos de ligação ao DNA de dedo de zinco; um polipeptídeo de nuclease FokI; domínios de TALE; zíperes de leucina; motivos de ligação ao DNA de fator de transcrição; e reconhecimento de DNA e/ou domínios de clivagem isolados, por exemplo, e sem limitação, de uma TALEN, uma recombinase (por exemplo, Cre, Hin, RecA, Tre e FLP recombinases), CRISPR-Cas9 guiado por RNA, meganuclease; e outros conhecidos por aqueles na técnica. Exemplos particulares incluem uma proteína quimérica que compreende polipeptídeo de ligação ao DNA sítio- específico e um polipeptídeo de nuclease. Os polipeptídeos quiméricos podem ser engendrados por métodos conhecidos por aqueles especialistas na técnica para alterar a sequência de reconhecimento de um polipeptídeo de ligação ao DNA compreendido dentro do polipeptídeo quimérico, para direcionar o polipeptídeo quimérico a uma sequência nucleotídica particular de interesse.
[00125] Em certas modalidades, o polipeptídeo quimérico compreende um domínio de ligação ao DNA (por exemplo, dedo de zinco, domínio TAL-efetor, etc.) e um domínio de nuclease (clivagem). O domínio de clivagem pode ser heterólogo ao domínio de ligação ao DNA, por exemplo, um domínio de ligação de DNA de dedo de zinco e um domínio de clivagem de uma nuclease ou um domínio TALEN de ligação ao DNA e um domínio de clivagem, ou domínio de ligação ao DNA de meganuclease e domínio de clivagem de uma nuclease diferente. Os domínios de clivagem heterólogos podem ser obtidos de qualquer endonuclease ou exonuclease. Endonuclease exemplares das quais um domínio de clivagem pode ser derivado incluem, mas não são limitadas a endonucleases de restrição e endonucleases homing. Ver, por exemplo, 2002-2003 Catálogo, New England Biolabs, Beverly, MA; e Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388. Enzimas adicionais que clivam DNA são conhecidas (por exemplo, Nuclease S1; nuclease de feijão mungo; DNase pancreática I; nuclease de micrococos; endonuclease de levedura HO; também ver Linn et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press, 1993). Uma ou mais destas enzimas (ou fragmentos funcionais destas) podem ser usadas como uma fonte de domínios de clivagem e meio- domínios de clivagem.
[00126] Similarmente um meio-domínio de clivagem pode ser derivado de qualquer nuclease ou porção desta, como apresentado acima, que requer a dimerização da atividade de clivagem. Em geral, duas proteínas de fusão são requeridas para a clivagem se as proteínas de fusão compreenderem meio-domínios de clivagem. Alternativamente, uma proteína única que compreende dois meio- domínios de clivagem pode ser usada. Os dois meio-domínios de clivagem podem ser derivados da mesma endonuclease (ou fragmentos funcionais destas), ou cada meio-domínio de clivagem pode ser derivado de uma endonuclease diferente (ou fragmentos funcionais desta). Além disso, os sítios alvo das duas proteínas de fusão são preferencialmente dispostos, um com respeito a outro, tal que a ligação das duas proteínas de fusão aos seus respectivos sítios alvo coloca os meio-domínios de clivagem em uma orientação espacial entre si que permite aos meio-domínios de clivagem formarem um domínio de clivagem funcional, por exemplo, por dimerização. Dessa forma, em certas modalidades, as bordas próximas dos sítios alvo são separadas por 5 a 8 nucleotídeos ou por 15 a 18 nucleotídeos. Entretanto qualquer número integrante de nucleotídeos ou pares de nucleotídeos pode intervir entre dois sítios alvo (por exemplo, de 2 a 50 pares de nucleotídeo ou mais). Em geral, o sítio da clivagem está entre os sítios alvo.
[00127] As endonucleases de restrição (enzimas de restrição) estão presentes em muitas espécies e são capazes da ligação específica à sequência para DNA (em um sítio de reconhecimento), e clivagem de DNA no sítio da ligação ou próximo, por exemplo, tal que uma ou mais sequências exógenas (doadoras/transgenes) estão integradas nos sítios de ligação (alvo) ou próximo. Certas enzimas de restrição (por exemplo, Tipo IIS) clivam DNA em sítios removidos do sítio de reconhecimento e têm domínios separáveis de ligação e de clivagem. Por exemplo, a enzima Fok Tipo IIS catalisa a clivagem de fita dupla de DNA, em 9 nucleotídeos do seu sítio de reconhecimento em uma fita e 13 nucleotídeos do seu sítio de reconhecimento no outro. Ver, por exemplo, as Patentes de U.S. 5.356.802; 5.436.150 e 5.487.994; bem como Li et al. (1992) Proc. Natl. Acad. Sci. USA 89:4275-4279; Li et al. (1993) Proc. Natl. Acad. Sci. USA 90:2764-2768; Kim et al. (1994a) Proc. Natl. Acad. Sci. USA 91:883-887; Kim et al. (1994b) J. Biol. Chem. 269:31.978-31.982. Dessa forma, em uma modalidade, as proteínas de fusão compreendem o domínio de clivagem (ou meio- domínio de clivagem) de pelo menos uma enzima de restrição tipo IIS e um ou mais domínios de ligação dedo de zinco, que podem ou não ser engendrados.
[00128] Enzima de restrição tipo IIS exemplar, cujo domínio de clivagem é separável do domínio de ligação, é Fok I. Esta enzima particular é ativa como um dímero. Bitinaite et al. (1998) Proc. Natl. Acad. Sci. USA 95: 10.570-10.575. Consequentemente, para os fins da presente revelação, a porção da enzima Fok I usada nas proteínas de fusão descritas é considerada um meio-domínio de clivagem. Dessa forma, para a clivagem direcionada de fita dupla e/ou substituição direcionada de sequências celulares usando fusões dedo de zinco-Fok I, duas proteínas de fusão, cada uma compreendendo um meio-domínio de clivagem de FokI, podem ser usadas para reconstituir um domínio de clivagem cataliticamente ativo. Alternativamente, uma molécula de polipeptídeo única que contém domínio de ligação ao DNA e dois meio-domínios de clivagem Fok I também pode ser usada.
[00129] Um domínio de clivagem ou meio-domínio de clivagem podem ser qualquer porção de uma proteína que conserva a atividade de clivagem, ou que conserva a capacidade de multimerizar (por exemplo, dimerizar) para formar um domínio de clivagem funcional.
[00130] Enzimas de restrição tipo IIS exemplares são descritas na Publicação de Patente U.S. No. 20070134796, incorporado neste pedido em sua totalidade. Enzimas de restrição adicionais também contêm domínios separáveis de ligação e de clivagem, e estes são contemplados pela presente revelação. Ver, por exemplo, Roberts et al. (2003) Nucleic Acids Res. 31:418-420.
[00131] Em certas modalidades, o domínio de clivagem compreende um ou mais meio-domínios de clivagem engendrados (também referidos como mutantes de domínio de dimerização) que minimizam ou evitam a homodimerização, como descrito, por exemplo, na Publicação de Patente U.S. No. 20050064474; 20060188987 e 20080131962, as revelações de todas as quais são incorporadas por referência em suas totalidades neste pedido. Resíduos de aminoácido nas posições 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537, e 538 de Fok I são todos os alvos para influenciar na dimerização de meio-domínios de clivagem Fok I.
[00132] Os meio-domínios de clivagem engendrados exemplares de Fok I que forma heterodímeros forçados incluem um par no qual um primeiro meio-domínio de clivagem inclui mutações em resíduos de aminoácidos nas posições 490 e 538 de Fok I e um segundo meio- domínio de clivagem inclui mutações em resíduos de aminoácidos 486 e 499.
[00133] Dessa forma, em uma modalidade, uma mutação em 490 substitui Glu (E) por Lys (K); a mutação em 538 substitui Iso (I) por Lys (K); a mutação em 486 Gln substitui (Q) por Glu (E); e a mutação na posição 499 substitui Iso (I) por Lys (K). Especificamente, os meio- domínios de clivagem engendrados descritos neste pedido foram preparados mutando as posições 490 (E^K) e 538 (I^K) em um meio-domínio de clivagem para produzir um meio-domínio de clivagem engendrado designado "E490K:I538K" e mutando as posições 486 (Q^E) e 499 (I^L) em outro meio-domínio de clivagem para produzir um meio-domínio de clivagem engendrado designado "Q486E:I499L". Os meio-domínios de clivagem engendrados descritos neste pedido são mutantes de heterodímero forçado nos quais a clivagem aberrante é minimizada ou eliminada. Ver, por exemplo, Publicação de Patente U.S. No. 2008/0131962, a revelação do qual é incorporada por referência em sua totalidade para todos os fins.
[00134] Em certas modalidades, o meio-domínio de clivagem engendrado compreende mutações nas posições 486, 499 e 496 (numeradas em relação à FokI selvagem), por exemplo, mutações que substituem o resíduo Gln selvagem (Q) na posição 486 por resíduo Glu (E), resíduo Iso selvagem (I) na posição 499 por resíduo Leu (L) e resíduo Asn selvagem (N) na posição 496 por Asp (D) ou resíduo Glu (E) (também referido como domínios "ELD" e "ELE", respectivamente). Em outras modalidades, o meio-domínio de clivagem engendrado compreende mutações nas posições 490, 538 e 537 (numeradas em relação à FokI selvagem), por exemplo, mutações que substituem resíduo Glu selvagem (E) na posição 490 por resíduo Lys (K), resíduo Iso selvagem (I) na posição 538 por resíduo Lys (K) e resíduo His selvagem (H) na posição 537 por resíduo Lys (K) ou um resíduo Arg (R) (também referido como domínios "KKK" e "KKR", respectivamente). Em outras modalidades, o meio-domínio de clivagem engendrado compreende mutações nas posições 490 e 537 (numeradas em relação à FokI selvagem), por exemplo, mutações que substituem resíduo Glu selvagem (E) na posição 490 por resíduo Lys (K) e o resíduo His selvagem (H) na posição 537 por resíduo Lys (K) ou um resíduo Arg(R) (também referido como domínios "KIK" e "KIR", respectivamente). (Ver a Publicação de Patente de US No. 20110201055). Os meio-domínios de clivagem engendrados descritos neste pedido podem ser preparados usando qualquer método adequado, por exemplo, pela mutagênese sítio-dirigida de meio- domínios de clivagem selvagens (Fok I) como descrito na Publicação da Patente de U.S. No. 20050064474; 20080131962; e 20110201055.
[00135] Alternativamente, as nucleases podem ser montadas in vivo no sítio alvo de ácido nucleico usando a chamada tecnologia "enzima de corte" (ver por exemplo, a Publicação de Patente U.S. No. 20090068164). Os componentes de tais enzimas de divisão podem ser expressos em construtos de expressão separados ou podem ser ligados em uma região de leitura aberta onde os componentes individuais são separados, por exemplo, por um peptídeo de autoclivagem 2A ou sequência IRES. Os componentes podem ser domínios de ligação dedo de zinco individuais ou domínios de um domínio de ligação de ácido nucleico de meganuclease.
C. Nucleases dedo de zinco
[00136] Em modalidades específicas, um polipeptídeo quimérico é uma nuclease dedo de zinco (ZFN) feita sob medida que pode ser projetada para entregar uma quebra de DNA de fita dupla sítio- específica direcionada para que um ácido nucleico exógeno ou DNA doador, possa ser integrado (Ver a a Publicação de Patente US co- proprietária 20100257638, incorporada por referência neste pedido). As ZFNs são polipeptídeos quiméricos que contêm um domínio de clivagem não específico de uma endonuclease de restrição (por exemplo, FokI) e um polipeptídeo de domínio de ligação ao DNA de dedo de zinco. Ver, por exemplo, Huang et al. (1996) J. Protein Chem. 15:481-9; Kim et al. (1997a) Proc. Natl. Acad. Sci. USA 94:3616-20; Kim et al. (1996) Proc. Natl. Acad. Sci. USA 93:1156-60; Kim et al. (1994) Proc Natl. Acad. Sci. USA 91:883-7; Kim et al. (1997b) Proc. Natl. Acad. Sci. USA 94:12875-9; Kim et al. (1997c) Gene 203:43-9; Kim et al. (1998) Biol. Chem. 379:489-95; Nahon e Raveh (1998) Nucleic Acids Res. 26:1233-9; Smith et al. (1999) Nucleic Acids Res. 27:674-81. Em algumas modalidades, as ZFNs compreendem domínios de ligação ao DNA de dedo de zinco não canônicos (ver a Publicação de Patente US co-proprietária 20080182332, incorporada por referência neste pedido). A endonuclease de restrição FokI deve dimerizar via domínio de nuclease a fim de clivar DNA e introduzir uma quebra da fita dupla. Consequentemente, as ZFNs que contêm um domínio de nuclease de tal endonuclease também requerem a dimerização do domínio de nuclease a fim de clivar o DNA alvo. Mani et al. (2005) Biochem. Biophys. Res. Commun. 334:1191-7; Smith et al. (2000) Nucleic Acids Res. 28:3361-9. A dimerização da ZFN pode ser facilitada por dois sítios de ligação de DNA adjacentes opostamente orientados. Id.
[00137] A flexibilidade e a especificidade do sistema de ZFN fornecem um nível do controle anteriormente irrealizável por estratégias de edição gênica mediadas por recombinases conhecidas. Como um exemplo, as ZFNs podem ser facilmente engendradas, por exemplo, para reconhecer sequências de ácidos nucleicos específicas. Wu et al. (2007) Cell. Mol. Life Sci. 64:2933-44 (Ver, as Publicações de Patente US 20090205083, 20110189775, 20110167521 e 20100199389, incorporadas por referência em suas totalidades neste pedido). A randomização dos códons de resíduos de reconhecimento de dedo de zinco permite a seleção de novos dedos que têm alta afinidade para sequências de DNA arbitrariamente escolhidas. Além disso, os dedos de zinco são moléculas de ligação ao DNA naturais, e foi mostrado que os dedos de zinco engendrados atuam sobre seus alvos projetados em células vivas. Dessa forma, as nucleases baseadas em dedos de zinco são apontáveis a sítios de reconhecimento específicos, mas arbitrados.
[00138] Em exemplos particulares, um método da integração sítio- específica de um ácido nucleico exógeno em pelo menos um locus de desempenho de FAD2 de um hospedeiro compreende a introdução em uma célula do hospedeiro de uma ZFN, em que a ZFN reconhece e se liga a uma sequência nucleotídica alvo, em que a sequência nucleotídica alvo é compreendida dentro de pelo menos um locus de FAD2 do hospedeiro. Em certos exemplos, a sequência nucleotídica alvo não está compreendida dentro do genoma do hospedeiro em nenhuma outra posição do que pelo menos um locus de FAD2. Por exemplo, um polipeptídeo de ligação ao DNA da ZFN pode ser engendrado para reconhecer e ligar-se a uma sequência nucleotídica alvo identificada dentro de pelo menos um locus de FAD2 (por exemplo, pelo sequenciamento o locus de FAD2). Um método da integração sítio-específica de um ácido nucleico exógeno em pelo menos um locus de desempenho FAD2 de um hospedeiro que compreende a introdução em uma célula do hospedeiro de uma ZFN também pode compreender a introdução na célula de um ácido nucleico exógeno, em que a recombinação do ácido nucleico exógeno em um ácido nucleico do hospedeiro compreendendo pelo menos um locus de FAD2 é facilitada por reconhecimento sítio-específico e ligação da ZFN à sequência alvo (e clivagem subsequente do ácido nucleico que compreende o locus de FAD2).
V. Ácidos nucleicos exógenos para integração em um locus de FAD2
[00139] As modalidades da invenção podem incluir um ou mais ácidos nucleicos selecionados a partir do grupo consistindo de: um ácido nucleico exógeno de integração sítio-específica em pelo menos um locus de FAD2, por exemplo, e sem limitação, um PTU, ELP, ETIP ou uma ORF; um ácido nucleico compreendendo uma sequência nucleotídica que codifica uma endonuclease de direcionamento; e um vetor compreendendo pelo menos um ou ambos precedentes. Dessa forma, os ácidos nucleicos particulares para o uso em algumas modalidades incluem sequências nucleotídicas que codificam um polipeptídeo, sequências nucleotídicas estruturais, e/ou reconhecimento de polipeptídeo de ligação ao DNA e sítios de ligação. A. Moléculas de ácidos nucleicos exógenas de integração sítio-específica
[00140] Como observado acima, a inserção de uma sequência exógena (também chamada de uma "sequência doadora" ou "doador" ou "transgene") é fornecida, por exemplo, para expressão de um polipeptídeo, correção de um gene mutante ou para a expressão aumentada de um gene selvagem. Será prontamente evidente que a sequência doadora não é tipicamente idêntica à sequência genômica onde é colocada. Uma sequência doadora pode conter uma sequência não homóloga flanqueada por duas regiões de homologia para permitir HDR eficiente na posição de interesse. Adicionalmente, as sequências doadoras podem compreender uma molécula de vetor que contém sequências que não são homólogas à região de interesse na cromatina celular. Uma molécula doadora pode conter várias regiões descontínuas de homologia à cromatina celular. Por exemplo, para a inserção direcionada de sequências não normalmente presentes em uma região de interesse, as ditas sequências podem estar presentes em uma molécula de ácido nucleico doador e flanqueadas por regiões de homologia à sequência na região de interesse.
[00141] O polinucleotídeo doador pode ser DNA ou RNA, de fita simples ou fita dupla e pode ser introduzido em uma célula na forma linear ou circular. Ver, por exemplo, a Publicação de Patente U.S. No. 20100047805, 20110281361, 20110207221 e o Pedido de Patente U.S. No. 13/889.162. Se introduzidas em forma linear, as extremidades da sequência doadora podem ser protegidas (por exemplo, da degradação exonucleolítica) por métodos conhecidos por aqueles especialistas na técnica. Por exemplo, um ou mais resíduos de didesoxinucleotídeo são adicionados ao terminal 3’ de uma molécula linear e/ou os oligonucleotídeos autocomplementares são ligados a uma ou ambas as extremidades. Ver, por exemplo, Chang et al. (1987) Proc. Natl. Acad. Sci. USA 84:4959-4963; Nehls et al. (1996) Science 272:886-889. Métodos adicionais para proteger polinucleotídeos exógenos da degradação incluem, mas não são limitados à adição do grupo(s) amino terminal e o uso de ligações de internucleotídeos modificadas tais como, por exemplo, fosforotioatos, fosforamidatos, e resíduos O-metil ribose ou desoxirribose.
[00142] Um polinucleotídeo pode ser introduzido em uma célula como parte de uma molécula do vetor tendo sequências adicionais tais como, por exemplo, origens de replicação, promotores e genes que codificam resistência aos antibióticos. Além disso, os polinucleotídeos doadores podem ser introduzidos como ácido nucleico nu, como ácido nucleico complexado com um agente como um lipossoma ou poloxâmero, ou podem ser entregues por vírus (por exemplo, adenovírus, AAV, herpesvírus, retrovírus, lentivírus e lentivírus defectivo para integrase (IDLV)).
[00143] O doador está geralmente integrado para que sua expressão seja controlada pelo promotor endógeno no sítio de integração, ou seja, o promotor que controla a expressão do gene endógeno no qual o doador está integrado (por exemplo, FAD2). Entretanto, será evidente que o doador possa compreender um promotor e/ou potencializador, por exemplo, um promotor constitutivo ou um induzível ou promotor tecido específico.
[00144] Além disso, embora não requerido para a expressão, as sequências exógenas também podem incluir sequências reguladoras de transcrição ou de tradução, por exemplo, promotores, potencializadores, isolantes, sítios de entrada de ribossomos internos, sequências que codificam peptídeos 2A e/ou sinais de poliadenilação.
[00145] Os ácidos nucleicos exógenos que podem estar integrados de uma maneira sítio-específica em pelo menos um locus de FAD2, para modificar o locus de FAD2, em modalidades incluem, por exemplo, e sem limitação, ácidos nucleicos que compreendem uma sequência nucleotídica que codifica um polipeptídeo de interesse; ácidos nucleicos que compreendem um gene agronômico; ácidos nucleicos que compreendem uma sequência nucleotídica que codifica uma molécula de RNAi; ou os ácidos nucleicos que rompem o gene FAD2.
[00146] Em algumas modalidades, um ácido nucleico exógeno está integrado em um locus de FAD2, para modificar o locus de FAD2, em que o ácido nucleico compreende um gene agronômico ou sequência nucleotídica que codifica um polipeptídeo de interesse, tal que a sequência nucleotídica ou gene agronômico sejam expressos no hospedeiro do locus de FAD2. Em alguns exemplos, o polipeptídeo de interesse (por exemplo, uma proteína estranha) é expresso de uma sequência nucleotídica que codifica o polipeptídeo de interesse em quantidades comerciais. Em tais exemplos, o polipeptídeo de interesse pode ser extraído da célula hospedeira, tecido ou biomassa. Em algumas modalidades, o hospedeiro é uma planta, e o material vegetal fornecido para a produção comercial de um polipeptídeo de interesse pode ser uma planta, parte vegetal, tecido vegetal ou célula vegetal. Em alguns exemplos, a parte vegetal pode ser semente vegetal. A extração proteica de uma biomassa vegetal pode ser realizada por métodos conhecidos que são discutidos, por exemplo, em Heney e Orr (1981) Anal. Biochem. 114:92-6.
[00147] Do mesmo modo, os genes agronômicos podem ser expressos em células vegetais transformadas, plantas e/ou sua progênie. Por exemplo, uma planta pode ser geneticamente engendrada via métodos de modalidades particulares para expressar vários fenótipos de interesse agronômico de pelo menos um locus de FAD2.
[00148] Em algumas modalidades, os ácidos nucleicos que compreendem um gene agronômico ou sequência nucleotídica que codifica um polipeptídeo de interesse podem incluir, por exemplo, e sem limitação: um gene que confere resistência a pragas ou doença (Ver, por exemplo, Jones et al. (1994) Science 266:789 (clonagem do gene Cf-9 do tomate para resistência a Cladosporium fulvum); Martin et al. (1993) Science 262:1432; Mindrinos et al. (1994) Cell 78:1089 (gene RSP2 para resistência a Pseudomonas syringae); Publicação de Patente Internacional PCT No. WO 96/30517 (resistência a nematoide de cisto de soja); Publicação de Patente Internacional PCT No. WO 93/19181); um gene que codifica uma proteína de Bacillus thuringiensis, um derivado desta ou polipeptídeo sintético modelado nesta (Ver, por exemplo, Geiser et al. (1986) Gene 48:109 (clonagem e sequência nucleotídica de um gene de δ-endotoxina de Bt; além disso, as moléculas de DNA que codificam os genes de δ-endotoxina podem ser adquiridas de American Type Culture Collection (Manassas, VA), por exemplo, sob Acesso ATCC Nos. 40098; 67136; 31995; e 31998)); um gene que codifica uma lectina (Ver, por exemplo, Van Damme et al. (1994) Plant Molec. Biol. 24:25 (sequências nucleotídicas de vários genes de lectina de ligação à manose de Clivia miniata)); um gene que codifica uma proteína de ligação à vitamina, por exemplo, avidina (Ver Publicação de Patente Internacional PCT No. US93/06487 (o uso de avidina e homólogos de avidina como larvicidas contra pragas de insetos)); um gene que codifica um inibidor de enzima, por exemplo, uma protease, inibidor de proteinase ou inibidor de amilase (Ver, por exemplo, Abe et al. (1987) J. Biol. Chem. 262:16793 (sequência nucleotídica do inibidor de cisteína proteinase do arroz); Huub et al. (1993) Plant Molec. Biol. 21:985 (sequência nucleotídica de cDNA que codifica o inibidor de tabaco proteinase I); Sumitani et al. (1993) Biosci. Biotech. Biochem. 57:1243 (sequência nucleotídica do inibidor de alfa amilase de Streptomyces nitrosporeus) e Patente U.S. 5.494.813); um gene que codifica um hormônio específico para o inseto ou feromônio, por exemplo, um ecdisteroide ou hormônio juvenil, uma variante deste, um mimético baseado neste, ou um antagonista ou agonista deste (Ver, por exemplo, Hammock et al. (1990) Nature 344:458 (expressão de baculovírus do hormônio juvenil clonado esterase, um inativator de hormônio juvenil)); um gene que codifica um peptídeo específico para o inseto ou neuropeptídeo que, de acordo com a expressão, perturba a fisiologia da praga afetada (Ver, por exemplo, Regan (1994) J. Biol. Chem. 269:9 (clonagem de expressão produz DNA que codifica o receptor de hormônio diurético de inseto); Pratt et al. (1989) Biochem. Biophys. Res. Comm. 163:1243 (uma alostatina em Diploptera puntata); e a Patente U.S. 5.266.317 (genes que codificam neurotoxinas específicas para o inseto, paralíticas)); um gene que codifica um veneno específico para o inseto produzido na natureza por uma cobra, uma vespa ou outro organismo (Ver, por exemplo, Pang et al. (1992) Gene 116:165 (expressão heteróloga em plantas de um gene que codifica um peptídeo de escorpião insetotóxico)); um gene que codifica uma enzima responsável por um hiperacúmulo de um monoterpeno, um sesquiterpeno, um esteroide, ácido hidroxâmico, um derivado de fenilpropanoide ou outra molécula com atividade inseticida; um gene que codifica uma enzima envolvida na modificação, incluindo a modificação pós-tradução, de uma molécula biologicamente ativa, por exemplo, uma enzima glicolítica, uma enzima proteolítica, uma enzima lipolítica, uma nuclease, uma ciclase, um transaminase, uma esterase, uma hidrolase, uma fosfatase, uma quinase, uma fosforilase, uma polimerase, uma elastase, uma quitinase ou uma glicanase, ou natural ou sintética (Ver, por exemplo, Publicação de Patente Internacional PCT No. WO 93/02197 (a sequência nucleotídica de um gene de calase); além disso, as moléculas de DNA que contêm sequências que codificam quitinase podem ser obtidas, por exemplo, de ATCC, sob o Acesso N° 39637 e 67152; Kramer et al. (1993) Insect Biochem. Molec. Biol. 23:691 (sequência nucleotídica de um cDNA que codifica quitinase de Mandarová-do-fumo); e Kawalleck et al. (1993) Plant Molec. Biol. 21:673 (sequência nucleotídica do gene de poliubiquitina da salsa ubi4-2)); um gene que codifica uma molécula que estimula a transdução de sinal (Ver, por exemplo, Botella et al. (1994) Plant Molec. Biol. 24:757 (sequências nucleotídicas para clones de cDNA de calmodulina de feijão mungo); e Griess et al. (1994) Plant Physiol. 104:1467 (sequência nucleotídica para um clone de cDNA de calmodulina de milho)); um gene que codifica um peptídeo de momento hidrofóbico (Ver, por exemplo, Publicação de Patente Internacional PCT No. WO 95/16776 (derivados de peptídeo Taquiplesina que inibem patógenos vegetais fúngicos); e Publicação de Patente Internacional PCT No. WO 95/18855 (peptídeos antimicrobianos sintéticos que conferem a resistência à doenças)); um gene que codifica uma permease de membrana, um canal anterior, ou um bloqueador de canal (Ver, por exemplo, Jaynes et al. (1993) Plant Sci 89:43 (expressão heteróloga de um análogo de peptídeo lítico cecropina-β para produzir plantas de tabaco transgênicas resistentes a Pseudomonas solanacearum)); um gene que codifica uma proteína invasiva viral ou toxina complexa derivada desta (Ver, por exemplo, Beachy et al. (1990) Ann. rev. Phytopathol. 28:451); um gene que codifica um anticorpo específico para o inseto ou imunotoxina derivada deste (Ver, por exemplo, Taylor et al., Abstract #497, Seventh Int'l Symposium on Molecular Plant-Microbe Interactions (Edimburgo, Escócia) (1994) (inativação enzimática em tabaco transgênico via produção de fragmentos de anticorpo de cadeia única)); um gene que codifica um anticorpo específico para o vírus (Ver, por exemplo, Tavladoraki et al. (1993) Nature 366:469 (plantas transgênicas que expressam genes de anticorpos recombinantes são protegidas do ataque de vírus)); um gene que codifica uma proteína de atraso de desenvolvimento produzida na natureza por um patógeno ou um parasita (Ver, por exemplo, Lamb et al. (1992) Bio/Technology 10:1436 (endo α-1,4-D-poligalacturonases fúngicas facilitam a colonização fúngica e a liberação de nutrientes vegetais solubilizando homo-α-1,4- D-galacturonase da parede celular vegetal); Toubart et al. (1992) Plant J. 2:367 (clonagem e caracterização de um gene que codifica uma proteína de inibição de endopoligalacturonase de feijão)); um gene que codifica uma proteína de atraso de desenvolvimento produzida na natureza por uma planta (Ver, por exemplo, Logemann et al. (1992) Bio/Technology 10:305 (as plantas transgênicas que expressam o gene de inativação do ribossomo de cevada têm uma resistência aumentada à doença fúngica)).
[00149] Em algumas modalidades, os ácidos nucleicos que compreendem um gene agronômico ou sequência nucleotídica que codifica um polipeptídeo de interesse também podem incluir e/ou alternativamente, por exemplo, e sem limitação: os genes que conferem resistência a um herbicida, como um herbicida que inibe o ponto de crescimento ou meristema, por exemplo, uma imidazolinona ou uma sulfonilureia (genes exemplares nesta categoria codificam as enzimas mutantes ALS e AHAS, como descrito, por exemplo, por Lee et al. (1988) EMBO J. 7:1241, e Miki et al. (1990) Theor. Appl. Genet. 80:449, respectivamente); resistência a glifosato como conferido por, por exemplo, genes mutantes de 5-enolpiruvilshikimato-3-fosfato sintase (EPSPs) (via introdução de ácidos nucleicos recombinantes e/ou várias formas de mutagênese in vivo de genes de EPSPs nativos (incluindo mas não limitados a CP4, DMMG e DGT-28); genes de aroA e genes de glifosato acetil transferase (GAT), respectivamente); outros compostos fosfono, como genes de fosfinotricina glufosinato acetil transferase (PAT) de espécies Streptomyces, incluindo Streptomyces hygroscopicus e Streptomyces viridichromogenes); e ácidos piridinóxi ou fenóxi propriônico e ciclohexonas (genes que codificam o inibidor de ACCase). Ver, por exemplo, Patentes U.S. 4.940.835 e 6.248.876 (sequências nucleotídicas de formas de EPSPs que podem conferir resistência a glifosato a uma planta). Uma molécula de DNA que codifica um gene aroA mutante pode ser obtida sob o número de acesso ATCC 39256. Também ver a Pat. U.S. No. 4.769.061 (sequência nucleotídica de um gene aroA mutante). Pedido de Patente Europeia no. 0 333 033 e Pat. U.S. No. 4.975.374 descreve sequências nucleotídicas de genes de glutamina sintetase, que podem conferir resistência a herbicidas como L-fosfinotricina. As sequências nucleotídicas de genes de PAT exemplares são fornecidas no Pedido de Patente Europeia no. 0 242 246 e DeGreef et al. (1989) Bio/Technology 7:61 (a produção de plantas transgênicas que expressam genes bar quiméricos que codificam a atividade de PAT). Exemplos de genes que conferem resistência a ácidos fenóxi propriônicos e ciclohexonas, como setoxidim e haloxifop, incluem os genes Acc1-S1, Acc1-S2 e Acc1-S3 descritos por Marshall et al. (1992) Theor. Appl. Genet. 83:435. Os genes GAT capazes de conferir resistência a glifosato são descritos, por exemplo, em WO 2005012515. Os genes que conferem resistência a 2,4-D, ácido fenóxi propriônico e herbicidas piridilóxi auxina são descritos, por exemplo, em WO 2005107437 e WO 2007053482.
[00150] Os ácidos nucleicos que compreendem um gene agronômico ou sequência nucleotídica que codifica um polipeptídeo de interesse também podem incluir, por exemplo, e sem limitação: um gene conferindo resistência a um herbicida que inibe a fotossíntese, como um triazina (genes psbA e gs+) ou uma benzonitrila (gene de nitrilase). Ver, por exemplo, Przibila et al. (1991) Plant Cell 3:169 (transformação de Chlamydomonas com plasmídeos que codificam genes psbA mutantes). As sequências nucleotídicas de genes de nitrilase são descritas na Patente U.S. 4.810.648, e as moléculas de DNA que contêm estes genes estão disponíveis sob Nos. de Acesso ATCC 53435; 67441; e 67442. Também ver Hayes et al. (1992) Biochem. J. 285:173 (clonagem e expressão de DNA que codifica uma glutationa S-transferase).
[00151] Em algumas modalidades, os ácidos nucleicos que compreendem um gene agronômico ou sequência nucleotídica que codifica um polipeptídeo de interesse também podem incluir e/ou alternativamente, genes que conferem ou contribuem para um traço sobre valor adicionado, por exemplo, e sem limitação: o metabolismo de ácido graxo modificado, por exemplo, transformando uma planta com um gene antissentido de estearil-ACP dessaturase para aumentar o conteúdo de ácido esteárico da planta (Ver, por exemplo, Knultzon et al. (1992) Proc. Natl. Acad. Sci. U.S.A. 89:2624); conteúdo de fitato reduzido, por exemplo, a introdução de um gene que codifica fitase pode aumentar o esgotamento de fitato, adicionando mais fosfato livre à planta transformada (Ver, por exemplo, Van Hartingsveldt et al. (1993) Gene 127:87 (sequência nucleotídica de um gene de fitase de Aspergillus niger); um gene pode ser introduzido para reduzir o conteúdo de fitato - no milho, por exemplo, que pode ser realizado por clonagem e em seguida reintroduzindo o DNA associado com o alelo único que pode ser responsável por mutantes de milho caracterizados por níveis baixos de ácido fítico (Ver Raboy et al. (1990) Maydica 35:383)); e a composição de carboidrato modificada afetada, por exemplo, pela transformação de plantas com um gene que codifica uma enzima que altera o modelo de ramificação do amido (Ver, por exemplo, Shiroza et al. (1988) J. Bacteol. 170:810 (sequência nucleotídica do gene mutante de frutosiltransferase de Streptococcus); Steinmetz et al. (1985) Mol. Gen. Genet. 20:220 (gene de levansucrase); Pen et al. (1992) Bio/Technology 10:292 (α-amilase); Elliot et al. (1993) Plant Molec. Biol. 21:515 (sequências nucleotídicas de genes de invertase do tomate); Sogaard et al. (1993) J. Biol. Chem. 268:22480 (gene de α-amilase de cevada); e Fisher et al. (1993) Plant Physiol. 102:1045 (enzima de ramificação de amido do endosperma do milho II).
[00152] Em algumas modalidades, um ácido nucleico exógeno está integrado em um locus de FAD2, para modificar o locus de FAD2, em que o ácido nucleico compreende um PTU ou ELP, tal que, por exemplo, a integração sítio-específica subsequente de um segundo ácido nucleico exógeno no sítio do PTU ou ELP é facilitada. Ver, também, o Pedido de Patente U.S. No. 13/889.162.
[00153] A integração mediada por endonuclease de direcionamento de uma molécula de ácido nucleico de interesse em um genoma vegetal via integração direcionada requer a entrega de endonucleases direcionamento ou moléculas de ácidos nucleicos codificam a endonuclease de direcionamento, seguidas da expressão de uma proteína de endonuclease de direcionamento funcional no hospedeiro. Um ácido nucleico exógeno também está preferencialmente presente na célula hospedeira ao mesmo tempo conforme a endonuclease de direcionamento é entregue ou expressa nesta, tal que a proteína de endonuclease de direcionamento funcional induz quebras da fita dupla no sítio(s) alvo em pelo menos um locus de FAD2, que então são reparados, por exemplo, via integração controlada pela homologia do ácido nucleico exógeno no locus. Um especialista na técnica pode idealizar que a expressão de uma proteína de endonuclease de direcionamento funcional pode ser alcançada por vários métodos, incluindo, mas não limitado a, transgênese de um construto de codificação da endonuclease de direcionamento e expressão transiente de um construto que codifica a endonuclease de direcionamento. Em ambos os casos, a expressão de uma proteína de endonuclease de direcionamento funcional conforme em entrega de um ácido nucleico exógeno na célula hospedeira pode ser simultaneamente alcançada a fim de controlar a integração direcionada em um locus de FAD2.
[00154] Uma vantagem particular obtida em modalidades que utilizam ZFNs como endonucleases de direcionamento, consiste em que a exigência da dimerização de domínios de clivagem de nucleases dedo de zinco quiméricas transmite um alto nível da sequência, e por isso clivagem, especificidade. Uma vez que cada conjunto de três dedos liga-se a nove pares de bases consecutivos, duas nucleases quiméricas efetivamente exigem um alvo de 18 bp se cada domínio de dedo de zinco tiver especificidade perfeita. Qualquer sequência dada deste comprimento é predita para ser única dentro de um genoma único (assumindo aproximadamente 109 bp). Bibikova et al. (2001) Mol. Cell. Biol. 21 (1):289-97; Wu et al. (2007), supra. Além disso, dedos adicionais podem fornecer especificidade aumentada, Beerli et al. (1998) Proc. Natl. Acad. Sci. USA 95:14628-33; Kim e Pabo (1998) Proc. Natl. Acad. Sci. USA 95:2812-7; Liu et al. (1997) Proc. Natl. Acad. Sci. USA 94:5525-30, portanto o número de dedos de zinco em cada domínio de ligação ao DNA pode ser aumentado para fornecer especificidade adicional. Por exemplo, a especificidade pode ser ainda aumentada usando um par de 4, 5, 6 ou mais ZFNs de dedo que reconhecem uma sequência de 24 bp. Urnov et al. (2005) Nature 435:646-51. Dessa forma, as ZFNs podem ser usadas tal que uma sequência de reconhecimento é introduzida no genoma da planta hospedeira é único dentro do genoma. B. Moléculas de ácidos nucleicos compreendendo uma sequência nucleotídica que codifica uma endonuclease de direcionamento
[00155] Em algumas modalidades, uma sequência nucleotídica que codifica uma endonuclease de direcionamento pode ser engendrada pela manipulação (por exemplo, ligação) de sequências nucleotídicas nativas que codificam polipeptídeos compreendidos dentro da endonuclease de direcionamento. Por exemplo, a sequência nucleotídica de um gene que codifica uma proteína que compreende um polipeptídeo de ligação ao DNA pode ser inspecionada para identificar a sequência nucleotídica do gene que corresponde ao polipeptídeo de ligação ao DNA, e aquela sequência nucleotídica pode ser usada como um elemento de uma sequência nucleotídica que codifica uma endonuclease de direcionamento que compreende o polipeptídeo de ligação ao DNA. Alternativamente, a sequência de aminoácidos de uma endonuclease de direcionamento pode ser usada para deduzir uma sequência nucleotídica que codifica a endonuclease de direcionamento, por exemplo, de acordo com a degeneração do código genético.
[00156] Em moléculas de ácidos nucleicos exemplares que compreendem uma sequência nucleotídica que codifica uma endonuclease de direcionamento, o último códon de uma primeira sequência de polinucleotídeo que codifica uma polipeptídeo nuclease e o primeiro códon de uma segunda sequência de polinucleotídeo que codifica um polipeptídeo de ligação ao DNA, pode ser separado por qualquer número de tripletos de nucleotídeo, por exemplo, sem codificar para um íntron ou um "STOP". Do mesmo modo, o último códon de uma sequência nucleotídica que codifica uma primeira sequência de polinucleotídeos que codifica um polipeptídeo de ligação ao DNA e o primeiro códon de uma segunda sequência de polinucleotídeo que codifica uma polipeptídeo nuclease, pode ser separado por qualquer número de tripletos de nucleotídeo. Nestas modalidades e adicionais, o último códon do último (isto é, a maior parte 3’ na sequência de ácido nucleico) de uma primeira sequência de polinucleotídeos que codifica uma polipeptídeo nuclease e uma segunda sequência de polinucleotídeos que codifica um polipeptídeo de ligação ao DNA, podem ser fundidos no registro de fase com o primeiro códon de uma sequência de codificação de polinucleotídeo adicional diretamente contígua a esta ou separada desta por não mais do que uma sequência peptídica curta, como aquela codificada por um ligante nucleotídico sintético (por exemplo, um ligante de nucleotídeo que pode ter sido usado para alcançar a fusão). Exemplos de tais sequências de polinucleotídeos adicionais incluem, por exemplo, e sem limitação, marcações, peptídeos de direcionamento e sítios de clivagem enzimática. Do mesmo modo, o primeiro códon da maior parte 5’ (na sequência de ácido nucleico) das primeiras e segundas sequências de polinucleotídeo pode ser fundido no registro de fase com o último códon de uma sequência de codificação de polinucleotídeo adicional diretamente contígua a esta ou separada desta por não mais do que uma sequência peptídica curta.
[00157] Uma sequência que separa as sequências de polinucleotídeos que codificam polipeptídeos funcionais em uma endonuclease de direcionamento (por exemplo, um polipeptídeo de ligação ao DNA e um polipeptídeo de nuclease), por exemplo, pode consistir de qualquer sequência, tal que a sequência de aminoácidos codificada provavelmente não alterará significativamente a tradução da endonuclease de direcionamento. Devido à natureza autônoma de polipeptídeos de nuclease conhecidos e polipeptídeos de ligação ao DNA conhecidos, as sequências intervenientes não vão interferir nos exemplos nas respectivas funções destas estruturas.
C. Vetores e construtos de expressão
[00158] Em algumas modalidades, pelo menos uma molécula(s) de ácido nucleico que compreende pelo menos uma sequência de polinucleotídeos exógena que codifica um polipeptídeo de interesse e/ou uma endonuclease de direcionamento, pode ser introduzida em uma célula, tecido ou organismo para expressão nestes. Por exemplo, uma molécula de ácido nucleico que compreende uma sequência de polinucleotídeos que codifica uma endonuclease de direcionamento que especificamente reconhece uma sequência nucleotídica compreendida dentro de pelo menos um locus de FAD2 pode ser introduzida em uma célula da expressão da endonuclease de direcionamento, e uma molécula de ácido nucleico que compreende uma sequência de polinucleotídeo que codifica um polipeptídeo de interesse pode ser introduzida na célula, tal que a sequência de polinucleotídeo que codifica o polipeptídeo de interesse esteja integrada em pelo menos um locus de FAD2, por exemplo, pela recombinação homóloga após introdução de uma quebra da fita dupla no locus pela endonuclease de direcionamento expressa e o polipeptídeo de interesse é expresso da sequência de polinucleotídeos integrada.
[00159] Em algumas modalidades, uma molécula de ácido nucleico como uma das precedentes, por exemplo, pode ser um sistema de vetor incluindo, por exemplo, e sem limitação, um plasmídeo linear ou plasmídeo circular fechado. Em exemplos particulares, o vetor pode ser um vetor de expressão. As sequências de ácidos nucleicos de acordo com as modalidades particulares, por exemplo, podem estar integradas em um vetor, tal que a sequência de ácido nucleico seja operacionalmente ligada a uma ou mais sequências reguladoras. Muitos vetores estão disponíveis com esta finalidade, e a seleção do vetor particular pode depender, por exemplo, do tamanho do ácido nucleico a ser inserido no vetor, a célula hospedeira particular a ser transformada com o vetor e/ou a quantidade de qualquer polipeptídeo codificado que é desejado para ser expresso. Um vetor tipicamente contém vários componentes, a identidade dos quais dependem de uma função do vetor (por exemplo, amplificação de DNA ou expressão de DNA), e a célula(s) hospedeira particular com a qual o vetor é compatível.
[00160] Em algumas modalidades, uma sequência reguladora operacionalmente ligada a uma ou mais sequência codificantes pode ser uma sequência de promotor que atua em uma célula hospedeira, como uma célula bacteriana, célula algácea, célula fúngica ou célula vegetal, em que a molécula de ácido nucleico deve ser amplificada ou expressa. Algumas modalidades podem incluir um vetor de transformação vegetal que compreende uma sequência nucleotídica que compreende pelo menos uma sequência reguladora operacionalmente ligada a uma ou mais sequências de nucleotídeos que codificam um polipeptídeo de interesse ou uma endonuclease de direcionamento, em que uma ou mais sequências de nucleotídeos podem ser expressas, sob o controle da(s) sequência(s) reguladora(s), em uma célula vegetal, tecido ou organismo para produzir o polipeptídeo de interesse ou a endonuclease de direcionamento.
[00161] Promotores adequados para o uso em moléculas de ácidos nucleicos de acordo com algumas modalidades incluem aqueles que são induzíveis, tecido-específicos, virais, sintéticos, ou constitutivos, todos os quais são bem conhecidos na técnica. Exemplos não limitantes dos promotores que podem ser úteis nas modalidades da invenção é fornecido por: Patentes U.S. Nos. 6.437.217 (promotor de milho RS81); 5.641.876 (promotor de actina de arroz); 6.426.446 (promotor de milho RS324); 6.429.362 (promotor de milho PR-1); 6.232.526 (promotor de milho A3); 6.177.611 (promotores de milho constitutivos); 5.322.938, 5.352.605, 5.359.142, e 5.530.196 (promotor de 35); 6.433.252 (promotor de oleosina de milho de L3); 6.429.357 (promotor de actina de arroz 2 e íntron de actina de arroz 2); 6.294.714 (promotores induzíveis por luz); 6.140.078 (promotores induzíveis por sal); 6.252.138 (promotores induzíveis por patógenos); 6.175.060 (promotores induzíveis pela deficiência de fósforo); 6.388.170 (promotores bidirecionais); 6.635.806 (promotor de gama-coixina); 5.447.858 (promotor de choque térmico de soja); e Pedido de Patente U.S. No. Serial 09/757.089 (promotor de aldolase de cloroplasto de milho).
[00162] Promotores exemplares adicionais incluem o promotor de nopalina sintase (NOS) (Ebert et al. (1987) Proc. Natl. Acad. Sci. USA 84 (16):5745-9); promotor de octopina sintase (OCS) (que é carregado em plasmídeos indutores de tumor de Agrobacterium tumefaciens); os promotores de caulimovírus como o vírus de mosaico de couve-flor (CaMV) promotor 19S (Lawton et al. (1987) Plant Mol. Biol. 9:315-24); o promotor 35S de CaMV (Odell et al. (1985) Nature 313:810-2; o promotor 35S de vírus de mosaico de escrofulária (Walker et al. (1987) Proc. Natl. Acad. Sci. USA 84 (19):6624-8); o promotor de sacarose sintase (Yang e Russell (1990) Proc. Natl. Acad. Sci. USA 87:4144-8); o promotor de complexo gênico R (Chandler et al. (1989) Plant Cell 1:1175-83); promotor do gene da proteína de ligação à clorofila a/b; CaMV35S (Patentes U.S. Nos. 5.322.938, 5.352.605, 5.359.142 e 5.530.196); FMV35S (Patentes U.S. Nos. 6.051.753, e 5.378.619); um promotor PC1SV (Patente U.S. No. 5.850.019); o promotor SCP1 (Patente U.S. No. 6.677.503); e promotores AGRtu.nos (Acesso de GenBank No. V00087; Depicker et al. (1982) J. Mol. Appl. Genet. 1:561-73; Bevan et al. (1983) Nature 304:184-7).
[00163] Em modalidades particulares, as moléculas de ácidos nucleicos podem compreender um promotor tecido-específico. Um promotor tecido-específico é uma sequência nucleotídica que controla um nível mais alto de transcrição de uma sequência nucleotídica operacionalmente ligada no tecido para o qual o promotor é específico, em relação a outros tecidos do organismo. Exemplos de promotores tecido-específico incluem, sem limitação: promotores tapetum- específicos; promotores antera-específicos; os promotores pólen- específicos (Ver, por exemplo, a Patente U.S. No. 7.141.424, e a Publicação Internacional PCT No. WO 99/042587); promotores óvulo- específicos; (Ver, por exemplo, o Pedido de Patente U.S. No. 2001/047525 A1); os promotores fruta-específicos (Ver, por exemplo, as Patentes U.S. Nos. 4.943.674. e 5.753.475); e os promotores semente-específicos (Ver, por exemplo, Patentes U.S. Nos. 5.420.034. e 5.608.152). Em algumas modalidades, um promotor específico para o estágio de desenvolvimento (por exemplo, um promotor ativo em um estágio posterior no desenvolvimento) pode ser usado.
[00164] As sequências reguladoras adicionais que podem, em algumas modalidades, ser operacionalmente ligadas a uma molécula de ácido nucleico incluem 5’ UTRs localizadas entre uma sequência de promotor e uma sequência de codificação que funciona como uma sequência líder de tradução. A sequência líder de tradução está presente no mRNA totalmente processado, e pode afetar o processamento do transcrito primário e/ou a estabilidade do RNA. Exemplos de sequências líder de tradução incluem líderes de proteínas de choque térmico de milho e petúnia (Patente U.S. No. 5.362.865), líderes de proteína de revestimento de vírus vegetais, líderes de planta rubisco e outros. Ver, por exemplo, Turner e Foster (1995) Molecular Biotech. 3 (3):225-36. Exemplos não limitantes de 5’ UTRs é fornecido por: GmHsp (Patente U.S. No. 5.659.122); PhDnaK (Patente U.S. No. 5.362.865); AtAnt1; TEV (Carrington e Freed (1990) J. Virol. 64:1590-7); e AGRtunos (Acesso GenBank no. V00087; e Bevan et al. (1983), supra).
[00165] As sequências reguladoras adicionais que podem, em algumas modalidades, ser operacionalmente ligadas a uma molécula de ácido nucleico também incluem sequências não traduzidas 3’, regiões de terminação de transcrição 3’ ou regiões de poliadenilação. Estas são elementos genéticos localizados a jusante de uma sequência nucleotídica e incluem polinucleotídeos que fornecem o sinal de poliadenilação e/ou outros sinais reguladores capazes de afetar o processamento ou a transcrição do mRNA. O sinal de poliadenilação funciona em plantas para provocar a adição de nucleotídeos poliadenilados à extremidade 3’ do precursor de mRNA. A sequência de poliadenilação pode ser derivada de uma variedade de genes vegetais, ou de genes de T--DNA. Um exemplo não limitante de uma região 3’ de terminação de transcrição é a região 3’ de nopalina sintase (nos 3’; Fraley et al. (1983) Proc. Natl. Acad. Sci. USA 80:4803-7). Um exemplo do uso de regiões não traduzidas 3’ diferentes é fornecido em Ingelbrecht et al. (1989) Plant Cell 1:671-80. Exemplos não limitantes de sinais de poliadenilação incluem um gene de RbcS2 de Pisum sativum (Ps. RbcS2-E9; Coruzzi et al. (1984) EMBO J. 3:1671-9) e AGRtu.nos (Acesso GenBank no. E01312).
[00166] Informação adicional quanto a sequências reguladoras que podem ser úteis em modalidades particulares é descrita, por exemplo, em Goeddel (1990) "Gene Expression Technology," Methods Enzymol. 185, Academic Press, San Diego, CA.
[00167] Uma molécula de ácido nucleico recombinante ou vetor podem compreender um marcador selecionável que confere um fenótipo selecionável a uma célula transformada, como uma célula vegetal. Os marcadores selecionáveis também podem ser usados para selecionar células ou organismos que compreendem uma molécula de ácido nucleico que compreende o marcador selecionável. Um marcador pode codificar a resistência a biocidas, resistência a antibióticos (por exemplo, canamicina, Geneticina (G418), bleomicina e higromicina), ou resistência a herbicidas (por exemplo, glifosato). Exemplos de marcadores selecionáveis incluem, mas não são limitados a: gene neo que confere a resistência à canamicina e pode ser selecionado para uso, por exemplo, de canamicina e G418; um gene bar que confere a resistência a bialafos; um gene de EPSP sintase mutante que confere a resistência a glifosato; um gene de nitrilase que confere resistência a bromoxinil; um gene mutante de acetolactato sintase (ALS) que confere resistência à sulfonilureia ou à imidazolinona; e um gene de DHFR resistente ao metotrexato. Múltiplos marcadores selecionáveis estão disponíveis que conferem resistência a agentes químicos incluindo, por exemplo, e sem limitação, ampicilina; bleomicina; cloranfenicol; gentamicina; higromicina; canamicina; lincomicina; metotrexato; fosfinotricina; puromicina; espectinomicina; rifampicina; estreptomicina; e tetraciclina. Exemplos de tais marcadores selecionáveis são ilustrados, por exemplo, nas Patentes U.S. 5.550.318; 5.633.435; 5.780.708 e 6.118.047.
[00168] Uma molécula de ácido nucleico ou vetor também podem incluir ou alternativamente um marcador rastreável. Marcadores rastreáveis podem ser usados para monitorar a expressão. Marcadores rastreáveis exemplares incluem um gene de β- glucuronidase ou uidA (GUS) que codifica uma enzima pela qual vários substratos cromogênicos são conhecidos (Jefferson et al. (1987) Plant Mol. Biol. Rep. 5:387-405); um gene de R--locus, que codifica um produto que regula a produção de pigmentos de antocianina (cor vermelha) em tecidos vegetais (Dellaporta et al. (1988) "Molecular cloning of the maize R-nj allele by transposon tagging with Ac." Em 18th Stadler Genetics Symposium, P. Gustafson and R. Appels, eds., Plenum, NY (pp. 263-82)); um gene β-lactamase (Sutcliffe et al. (1978) Proc. Natl. Acad. Sci. USA 75:3737-41); um gene que codifica uma enzima pela qual vários substratos cromogênicos são conhecidos (por exemplo, PADAC, uma cefalosporina cromogênica); um gene de luciferase (Ow et al. (1986) Science 234:856-9); um gene xylE que codifica uma catecol dioxigenase que converte catecóis cromogênicos (Zukowski et al. (1983) Gene 46 (2-3):247-55); um gene de amilase (Ikatu et al. (1990) Bio/Technol. 8:241-2); um gene de tirosinase que codifica uma enzima capaz de oxidar tirosina à DOPA e dopaquinona, que por sua vez se condensa à melanina (Katz et al. (1983) J. Gen. Microbiol. 129:270314); e um α-galactosidase.
[00169] Todas as sequências nucleotídicas que codificam, por exemplo, um polipeptídeo de interesse particular ou uma endonuclease de direcionamento particular, serão imediatamente reconhecíveis por aqueles especialistas na técnica. A degeneração do código genético fornece um número finito de sequências codificantes de uma sequência particular de aminoácidos. A seleção de uma sequência particular para codificar um polipeptídeo de acordo com as modalidades da invenção está dentro da discrição do profissional. Sequências de codificação diferentes podem ser desejáveis em aplicações diferentes.
[00170] Em algumas modalidades, pode ser desejável modificar os nucleotídeos de um ácido nucleico, por exemplo, para aumentar a expressão de uma sequência de polinucleotídeo compreendida dentro do ácido nucleico em um hospedeiro particular. O código genético é redundante com 64 códons possíveis, mas a maioria dos organismos preferencialmente usa um subconjunto destes códons. Os códons que são utilizados muitas vezes em uma espécie são chamados códons ótimos, e os não utilizados muito muitas vezes são classificados como códons raros ou de baixo uso. Zhang et al. (1991) Gene 105:61-72. Os códons podem ser substituídos para refletir o uso de códon preferencial de um hospedeiro particular em um processo às vezes referido como "otimização de códon". As sequências de codificação otimizadas que contêm códons preferenciais por um hospedeiro particular procariótico ou eucariótico podem ser preparadas, por exemplo, para aumentar a taxa da tradução ou produzir transcritos de RNA recombinantes que têm propriedades desejáveis (por exemplo, uma meia-vida mais longa, comparando com transcritos produzidos de uma sequência não otimizada).
[00171] Os ácidos nucleicos podem ser introduzidos em uma célula hospedeira em modalidades da invenção por qualquer método conhecido por aqueles especialistas na técnica, incluindo, por exemplo, e sem limitação: pela transformação de protoplastos (Ver, por exemplo, a Patente U.S. 5.508.184); pela absorção de DNA mediada por dessecação/inibição (Ver, por exemplo, Potrykus et al. (1985) Mol. Gen. Genet. 199:183-8); pela eletroporação (Ver, por exemplo, a Patente U.S. 5.384.253); pela agitação com fibras de carboneto de silício (Ver, por exemplo, as Patentes U.S. 5.302.523 e 5.464.765); por transformação mediada por Agrobacterium (Ver, por exemplo, as Patentes U.S. 5.563.055, 5.591.616, 5.693.512, 5.824.877, 5.981.840 e 6.384.301); e pela aceleração de partículas recobertas com DNA (Ver, por exemplo, as Patentes U.S. 5.015.580, 5.550.318, 5.538.880, 6.160.208, 6.399.861 e 6.403.865). Pela aplicação de técnicas como estas, células de virtualmente qualquer espécie podem ser estavelmente transformadas. Em algumas modalidades, DNA de transformação está integrado no genoma da célula hospedeira. No caso de espécies multicelulares, as células transgênicas podem ser regeneradas em um organismo transgênico. Algumas destas técnicas podem ser usadas para produzir uma planta transgênica, por exemplo, compreendendo uma ou mais sequências de ácidos nucleicos da invenção no genoma da planta transgênica.
[00172] O método mais amplamente utilizado para introduzir um vetor de expressão em plantas é baseado no sistema de transformação natural de Agrobacterium. A. tumefaciens e A. rhizogenes são bactérias do solo patogênicas vegetais que transformam geneticamente as células vegetais. Os plasmídeos Ri e Ti de A. tumefaciens e A. rhizogenes, respectivamente, transportam genes responsáveis pela transformação genética da planta. Os plasmídeos Ti (indutores de tumor) contêm um grande segmento, conhecido como T--DNA, que é transferido para plantas transformadas. Outro segmento do plasmídeo Ti, região vir, é responsável pela transferência de T--DNA. A região de T—DNA é limitada pelas bordas à esquerda e à direita que são compostas cada uma de sequências nucleotídicas repetidas terminais. Em alguns vetores binários modificados, os genes indutores de tumor foram deletados, e as funções da região vir são utilizadas para transferir DNA estranho limitado pelas sequências de borda de T--DNA. A região T também pode conter, por exemplo, um marcador selecionável para a recuperação eficiente de plantas transgênicas e células e sítio de clonagem múltiplo para inserir sequências da transferência como um ácido nucleico que codifica uma proteína de fusão da invenção.
[00173] Dessa forma, em algumas modalidades, um vetor de transformação vegetal é derivado de um plasmídeo Ti de A. tumefaciens (Ver, por exemplo, as Patentes U.S. Nos. 4.536.475, 4.693.977, 4.886.937 e 5.501.967; e a Patente Europeia EP 0 122 791) ou um plasmídeo Ri de A. rhizogenes. Os vetores de transformação vegetais adicionais incluem, por exemplo, e sem limitação, os descritos por Herrera-Estrella et al. (1983) Nature 303:209-13; Bevan et al. (1983), supra; Klee et al. (1985) Bio/Technol. 3:637-42; e na Patente Europeia EP 0 120 516, e os derivados de qualquer um dos precedentes. Outras bactérias, como Sinorhizobium, Rhizobium e Mesorhizobium, que naturalmente interagem com plantas, podem ser modificadas para mediar a transferência gênica para diversas plantas. Estas bactérias simbióticas associadas à planta podem ser tornadas competentes para a transferência gênica pela aquisição tanto de um plasmídeo Ti desarmado como de um vetor binário adequado.
[00174] Após fornecer DNA exógeno a células de recipiente, as células transformadas são geralmente identificadas para cultura adicional e regeneração vegetal. A fim de melhorar a capacidade de identificar células transformadas, pode-se desejar empregar um gene marcador selecionável ou rastreável, como anteriormente apresentado, com o vetor usado para gerar o transformante. No caso onde um marcador selecionável é usado, as células transformadas são identificadas dentro da população celular potencialmente transformada expondo as células a um agente ou agentes seletivos. No caso onde um marcador rastreável é usado, as células podem ser rastreadas para o traço gênico do marcador desejado.
[00175] As células que sobrevivem à exposição ao agente seletivo ou células que foram marcadas positivas em um ensaio de rastreamento, podem ser cultivadas em meios que suportam a regeneração de plantas. Em algumas modalidades, qualquer meio de cultura de tecido vegetal adequado (por exemplo, meios MS e N6) pode ser modificado pela inclusão de substâncias adicionais, como reguladores de crescimento. O tecido pode ser mantido em meios básicos com reguladores de crescimento até que tecido suficiente esteja disponível para começar os esforços de regeneração vegetal, ou após ciclos repetidos de seleção manual, até que a morfologia do tecido seja adequada para a regeneração (por exemplo, pelo menos 2 semanas), em seguida transferido para meios conducentes para formação de brotos. As culturas são transferidas periodicamente até que a formação de brotos suficiente tenha ocorrido. Uma vez que os brotos são formados, são transferidos para meios conducentes para formação de raízes. Uma vez que raízes suficientes são formadas, as plantas podem ser transferidas para o solo para crescimento adicional e maturidade.
[00176] Para confirmar a presença de uma molécula de ácido nucleico de interesse (por exemplo, uma sequência nucleotídica que codifica um polipeptídeo que compreende pelo menos uma proteína de fusão da invenção) em uma planta de regeneração, uma variedade de ensaios pode ser realizada. Tais ensaios incluem, por exemplo: ensaios biológicos moleculares, como Southern ou Northern blotting, PCR e sequenciamento de ácido nucleico; ensaios bioquímicos, como detecção da presença de um produto proteico, por exemplo, por meios imunológicos (ELISA e/ou Western blots) ou por função enzimática; ensaios de partes vegetais, como ensaios de folha ou raiz; e análise do fenótipo da planta regenerada inteira.
[00177] Os eventos de integração podem ser analisados, por exemplo, por amplificação de PCR, por exemplo, usando iniciadores de oligonucleotídeos que são específicos para uma sequência nucleotídica de interesse. Entende-se que a genotipagem de PCR inclui, mas não é limitada à amplificação da reação de polimerase em cadeia (PCR) do DNA genômico derivado do tecido da planta hospedeira isolada predita conter uma molécula de ácido nucleico de interesse integrado no genoma, seguido de clonagem padrão e análise de sequência de produtos de amplificação de PCR. Os métodos de genotipagem de PCR foram bem descritos (ver, por exemplo, Rios, G. et al. (2002) Plant J. 32:243-53), e podem ser aplicados a DNA genômico derivado de qualquer espécie de plantas ou tipo de tecido, incluindo culturas de células.
[00178] Uma planta transgênica formada usando métodos de transformação dependentes de Agrobacterium tipicamente contém cópias únicas para multiplicar as de DNA recombinante. A sequência de DNA recombinante única é referida como um "evento transgênico" ou "evento de integração." Tais plantas transgênicas são heterozigotas para a sequência de DNA inserida. Em algumas modalidades, uma planta transgênica homozigota com respeito a um transgene pode ser obtida acasalando sexualmente (autopolinização) uma planta transgênica segregante independente que contém uma sequência gênica exógena única para si mesmo, por exemplo, planta F0, produzir a semente F1. Um quarto da semente F1 produzida será homozigota com respeito ao transgene. A germinação da semente F1 resulta em plantas que podem ser testadas para a heterozigosidade, tipicamente usando um ensaio de SNP ou um ensaio de amplificação térmico que permite à distinção entre heterozigotos e homozigotos (isto é, um ensaio de zigosidade).
[00179] Além da transformação direta de uma planta ou célula vegetal com uma molécula de ácido nucleico em algumas modalidades, as plantas transgênicas podem ser preparadas em modalidades particulares cruzando uma primeira planta que tem pelo menos um evento transgênico com uma segunda planta sem tal evento. Por exemplo, um ácido nucleico que compreende pelo menos um locus modificado de FAD2, em que um ácido nucleico exógeno foi integrado de uma maneira sítio-específica, pode ser introduzido em uma primeira linhagem vegetal que é acessível à transformação, para produzir uma planta transgênica, planta transgênica a qual pode ser cruzada com uma segunda linhagem vegetal para introgressão de pelo menos um locus modificado de FAD2 (e por isso o ácido nucleico exógeno) na segunda linhagem vegetal.
[00180] Para confirmar a presença de uma molécula de ácido nucleico de interesse em plantas regeneradas, uma variedade de ensaios pode ser realizada. Tais ensaios incluem, por exemplo: ensaios biológicos moleculares, como Southern ou Northern blotting e PCR; ensaios bioquímicos, como detecção da presença de um produto proteico, por exemplo, por meios imunológicos (ELISA e/ou Western blots) ou por função enzimática; ensaios de partes vegetais, como ensaios de folha ou raiz; e análise do fenótipo da planta regenerada inteira.
[00181] Os eventos de integração direcionada podem ser rastreados, por exemplo, por amplificação PCR, por exemplo, usando iniciadores de oligonucleotídeos específicos para moléculas de ácidos nucleicos de interesse. Entende-se que a genotipagem de PCR inclui, mas não é limitada à amplificação de reação de polimerase em cadeia (PCR) de DNA genômico derivado do tecido de calo da planta hospedeira isolada predita conter uma molécula de ácido nucleico de interesse integrada no genoma, seguido de clonagem padrão e análise de sequência de produtos de amplificação de PCR. Os métodos da genotipagem de PCR foram bem descritos (por exemplo, Rios, G. et al. (2002) Plant J. 32:243-53) e podem ser aplicados a DNA genômico derivado de qualquer espécie de plantas ou tipo de tecido, incluindo culturas de células. As combinações de iniciadores de oligonucleotídeo que se ligam tanto à sequência alvo como à sequência introduzida podem ser usadas sequencialmente ou multiplexadas em reações de amplificação de PCR. Os iniciadores de oligonucleotídeos projetados para se anelarem ao sítio alvo, sequências de ácidos nucleicos introduzidas e/ou combinações dos dois são factíveis. Dessa forma, as estratégias de genotipagem de PCR podem incluir (mas não são limitadas) amplificação de sequências específicas no genoma vegetal, amplificação de múltiplas sequências específicas no genoma vegetal, amplificação de sequências não específicas no genoma vegetal ou combinações destas. Um especialista na técnica pode inventar combinações adicionais de iniciadores e reações de amplificação de consulta do genoma. Por exemplo, o grupo de iniciadores de oligonucleotídeos sentido direto e reverso pode ser projetado para se anelar à(s) sequência(s) de ácido nucleico específica(s) para o alvo fora dos limites da sequência de ácido nucleico introduzida.
[00182] Iniciadores de oligonucleotídeos sentido direto e reverso podem ser projetados para se anelarem especificamente a uma molécula de ácido nucleico introduzida de interesse, por exemplo, em uma sequência que corresponde a uma região de codificação dentro da molécula de ácido nucleico de interesse ou outras partes da molécula de ácido nucleico de interesse. Estes iniciadores podem ser usados em conjunto com os iniciadores descritos acima. Os iniciadores de oligonucleotídeos podem ser sintetizados de acordo com uma sequência desejada e estão comercialmente disponíveis (por exemplo, de Integrated DNA Technologies, Inc., Coralville, IA). A amplificação pode ser seguida por clonagem e sequenciamento, ou pela análise de sequência direta dos produtos de amplificação. Um especialista na técnica poderia idealizar métodos alternativos da análise dos produtos de amplificação gerados durante a genotipagem de PCR. Em uma modalidade, os iniciadores de oligonucleotídeo específicos para o alvo gênico são empregados em amplificações de PCR.
VI. Plantas transgênicas e materiais vegetais compreendendo um ácido nucleico integrado em um locus de desempenho FAD2
[00183] Em algumas modalidades, uma planta transgênica é fornecida, em que a planta compreende uma célula vegetal que compreende pelo menos um locus modificado (por exemplo, integração rompida e/ou direcionada de uma sequência exógena) de FAD2 (por exemplo, locus FAD2 2.3 e/ou locus FAD2 2.6 de soja). Em modalidades particulares, tal planta pode ser produzida pela transformação de um tecido vegetal ou célula vegetal e regeneração de uma planta inteira. Em modalidades adicionais, tal planta pode ser obtida pela introdução de um ácido nucleico exógeno em pelo menos um locus de FAD2 em uma maneira sítio-específica, ou pela introgressão do locus de FAD2 modificado em um germoplasma. Os materiais vegetais que compreendem tal célula vegetal também são fornecidos. Tal material vegetal pode ser obtido de uma planta que compreende a célula vegetal.
[00184] Uma planta transgênica ou material vegetal compreendendo uma célula vegetal compreendendo pelo menos um locus de FAD2 modificado pode, em algumas modalidades, exibir uma ou mais das seguintes características: expressão de uma endonuclease de direcionamento em uma célula da planta; expressão de um polipeptídeo de interesse em uma célula da planta (ou em um plastídeo nesta); expressão de uma endonuclease de direcionamento no núcleo de uma célula da planta; localização de uma endonuclease de direcionamento em uma célula da planta; integração em um locus de FAD2 no genoma de uma célula da planta; integração de uma sequência nucleotídica que codifica um polipeptídeo de interesse ou um gene agronômico em um locus de FAD2 no genoma de uma célula da planta; e/ou a presença de um transcrito de RNA que corresponde a uma sequência de codificação integrada em um locus de FAD2 no genoma de uma célula da planta. Tal planta pode ter adicionalmente um ou mais traços desejáveis, incluindo, por exemplo, e sem limitação, os que resultam da expressão de uma sequência nucleotídica endógena ou transgênica, a expressão da qual é regulada por um polipeptídeo de interesse ou um gene agronômico integrado em um locus de FAD2 no genoma de uma célula da planta; resistência a insetos, outras pragas e agentes causadores de doença; tolerâncias a herbicidas; estabilidade aumentada, rendimento ou prazo de validade; tolerâncias ambientais; produção farmacêutica; produção de produto industrial; e aumentos nutritivos.
[00185] Uma planta transgênica de acordo com a invenção pode ser qualquer planta capaz de ser transformada com um ácido nucleico que é posteriormente integrado em pelo menos um locus de FAD2 de acordo com os métodos descritos neste pedido. Consequentemente, a planta pode ser uma dicotiledônea ou monocotiledônea. Exemplos não limitantes das plantas dicotiledôneas usáveis nos presentes métodos incluem Arabidopsis, alfafa, feijões, brócolis, repolho, canola, cenoura, couve-flor, aipo, repolho chinês, algodão, pepino, berinjela, alface, melão, ervilha, pimentão, amendoim, batata, abóbora-moranga, rabanete, colza, espinafre, soja, abóbora, beterraba, girassol, tabaco, tomate e melancia. Exemplos não limitantes das plantas monocotiledôneas usáveis nos presentes métodos incluem milho, cevada, cebola, arroz, sorgo, trigo, centeio, painço, cana-de-açúcar, aveia, triticale, switchgrass, e gramado. As plantas transgênicas de acordo com a invenção podem ser usadas ou cultivadas em qualquer maneira.
[00186] Algumas modalidades também fornecem produtos básicos produzidos das plantas transgênicas da invenção. Os produtos básicos incluem, por exemplo, e sem limitação: produtos alimentícios, farinhas, óleos, ou grãos ou sementes esmagados ou inteiros de uma planta que compreende uma ou mais sequências nucleotídicas integradas em pelo menos um locus de FAD2. A detecção de uma ou mais tais sequências nucleotídicas em um ou mais produtos básicos é evidência de fato que o produto básico ou pelo menos foi em parte produzido de uma planta transgênica produzida de acordo com uma modalidade da invenção. Em algumas modalidades, uma planta transgênica ou semente que compreende uma célula vegetal que compreende pelo menos um locus de FAD2 modificado pode compreender pelo menos um outro evento transgênico no seu genoma, incluindo sem limitação: um evento transgênico do qual é transcrito uma molécula de RNAi; um gene que codifica uma proteína inseticida (por exemplo, uma proteína inseticida de Bacillus thuringiensis); um gene de tolerância a herbicidas (por exemplo, um gene fornecendo tolerância a glifosato); e um gene que contribui para um fenótipo desejável na planta transgênica (por exemplo, rendimento aumentado, metabolismo de ácido graxo alterado ou restauração da esterilidade masculina citoplasmática).
[00187] Uma planta transgênica compreendendo uma célula vegetal compreendendo pelo menos um locus de FAD2 modificado pode ter um ou mais traços desejáveis. Tais traços podem incluir, por exemplo: resistência a insetos, outras pragas e agentes causadores de doença; tolerâncias a herbicidas; estabilidade aumentada, rendimento ou prazo da validade; tolerâncias ambientais; produção farmacêutica; produção de produto industrial; e aumentos nutritivos. Os traços desejáveis podem ser conferidos por uma ou mais moléculas de ácidos nucleicos integradas pela recombinação direcionada no locus de FAD2 que são expressas na planta que exibe os traços desejáveis. Dessa forma, em algumas modalidades, o traço desejado pode ser devido à presença de transgene(s) na planta, que é introduzido no genoma da planta no sítio de pelo menos um locus de FAD2 modificado. Em uma modalidade adicional, o traço desejável pode ser obtido por meio do melhoramento convencional, traço o qual pode ser conferido por uma ou mais moléculas de ácidos nucleicos integradas pela recombinação direcionada de pelo menos um locus de FAD2 modificado.
[00188] As plantas transgênicas de acordo com a invenção podem ser usadas ou cultivadas em qualquer maneira, em que a presença de pelo menos um locus modificado de FAD2 é desejável. Consequentemente, uma planta pode ser engendrada, inter alia, para ter um ou mais traços desejados, transformada com moléculas de ácidos nucleicos que são posteriormente integradas de uma maneira sítio-específica em pelo menos um locus de FAD2 de acordo com a invenção, e cultivadas por qualquer método conhecido por especialistas na técnica. VII. Melhoramento assistido por marcador de plantas transgênicas compreendendo um ácido nucleico integrado em um locus de desempenho de FAD2
[00189] São fornecidos os marcadores moleculares que são ligados (por exemplo, firmemente ligados) a fad2 em Glycine max. Por exemplo, os segmentos de DNA que contêm sequências envolvidas no traço HO (fad2) são identificados. Estes segmentos são localizados em torno e entre os marcadores que estão ligados (por exemplo, firmemente ligados) aos alelos mutantes em um grupo de ligação genômica. Dessa forma, as moléculas de ácidos nucleicos que compreendem um gene mutante FAD2 tendo uma mutação inativa também são fornecidas. Os segmentos identificados, e os marcadores destes, estão incluídos na presente matéria objeto, em parte, pela sua posição nos grupos de ligação no genoma de Glycine max.
[00190] Todas as referências, incluindo publicações, patentes e pedidos de patentes, citados neste pedido são por meio deste incorporados na medida em que são bastante consistentes com os detalhes explícitos desta revelação e são dessa forma incorporados até a mesma extensão como se cada referência fosse individualmente e especificamente indicada a ser incorporada por referência e fosse apresentada em sua totalidade neste pedido. As referências discutidas neste pedido são fornecidas somente para sua revelação antes da data de depósito do presente pedido de patente. Nada neste pedido deve ser interpretado como uma admissão que os inventores não têm direito a antedatar tal revelação em virtude da invenção prévia. Os seguintes exemplos são fornecidos para ilustrar certos atributos particulares e/ou modalidades. Exemplos não devem ser interpretados para limitar a revelação aos atributos particulares ou modalidades exemplificadas.
EXEMPLOS Exemplo 1: Sequenciamento das Sequências alvo de FAD2 de Cinco Cultivares de Soja Reações de Sequenciamento
[00191] DNA genômico foi isolado de tecidos de soja. O DNA genômico foi isolado e purificado a partir de células em suspensão embriogênicas liofilizadas de cultivares X5 e Westag e de folhas jovens de cultivares Jack, Williams 82 e Maverick. O DNA genômico foi extraído usando um Kit DNeasy Plant Mini™ (Qiagen; Carlsbad, CA) pelos protocolos de fabricante. Genes FAD2 2.3 e 2.6
[00192] As sequências de DNA genômico de FAD2 2.3 e FAD2 2.6 foram amplificadas por PCR usando os iniciadores MA49 (SEQ ID NO:1 caagggttccaaacacaaagcc) e MA51 (SEQ ID NO:2 catcaatacttgttcctgtacc) ou MA50 (SEQ ID NO:3 gaagaagcctctctcaagggttc) e MA51. A sequência de DNA genômico foi obtida de um fragmento de aproximadamente 40 a 1.140 bases do gene de 1140 bp. As condições da reação de PCR foram de 1 min a 98°C para a desnaturação inicial, então 35 ciclos de 30 s a 98°C, 15 s a 60°C, 3 min a 72°C e uma extensão final de 5 min a 72°C.
[00193] Os amplicons de PCR resultantes foram suspensos em tampão TE (1 μg no tampão TE) e foram clivados a fragmentos de aproximadamente 300 bp com o sonicador Covaris E220 System™ (Covaris; Woburn, MA) usando as configurações: pico de energia incidente de 140, fator de trabalho 10%, 200 ciclos por pulso, e tempo de tratamento de 430 segundos. As bibliotecas de sequenciamento de extremidade pareada Illumina™ (San Diego, CA) foram preparadas usando um kit PrepX DNA library™ (IntegenX; Pleasanton, CA) no Apolo 324TM Automation System™ (IntegenX) seguindo o protocolo recomendado pelo fabricante. Resumidamente, os fragmentos de DNA clivados com protuberâncias 5’ ou 3’ foram convertidos em DNA 5’ de extremidade cega fosforilada. Uma extensão de adenina única (A) foi adicionada à extremidade 3’ dos fragmentos de DNA com extremidade reparada seguida pela ligação a adaptadores de extremidade pareada Illumina™ (PE) indexados. Por fim, os produtos de biblioteca ligados aos adaptadores foram recuperados do robô e enriquecidos com PCR usando reagentes Illumina TruSeq PCR™ sob condições de ciclagem térmica de 30 s a 98°C para a desnaturação inicial, então 10 ciclos de 10 s a 98°C, 30 s a 60°C, 30 s a 72°C e uma extensão final de 5 min a 72°C. As bibliotecas enriquecidas foram normalizadas a 2 nM e agrupadas. As bibliotecas agrupadas então foram desnaturadas com hidróxido de sódio e diluídas a 6 pM em tampão de hibridização para carregamento em uma célula de fluxo fluxo Miseq™ (Illumina; San Diego, CA). Um ciclo de corrida de 2x150 com 6 ciclos de índice foi realizado no Miseq™ de acordo com o protocolo recomendado pela Illumina.
[00194] As reações de sequência resultantes produziram leituras de extremidades pareadas a partir do instrumento Illumina Miseq™ foram cortados para o TruSeq adaptador sequences™ (Illumina). Após o corte, as leituras foram mapeadas para os arcabouços de referência do cultivar Williams 82 usando o Burrows Wheeler Aligner (BWA) (Li H. e Durbin R. (2009) Fast and accurate short read alignment with Burrows-Wheeler Transform. Bioinformatics, 25:1754-60).
[00195] Cada cultivar de soja foi tratado como uma amostra separada, e por isso, as leituras do sequenciamento de cada cultivar foram mapeadas separadamente. As regiões no arcabouço onde a profundidade das leituras de sequenciamento mapeadas foi maior do que zero, foram examinadas. Em se tratando de leituras de sequenciamento a partir de amplicons, foi esperado que somente regiões específicas nos arcabouços tivessem leituras mapeadas neles. As leituras de sequenciamento foram mapeadas para os cromossomos 10 e 20 de soja entre as diferentes amostras. Para cada amostra, a sequência consenso foi obtida usando o programa de computador Mpileup. Estes resultados indicaram as leituras de sequenciamento mapeadas para dois genes FAD paralógos putativos. As leituras de sequência resultantes foram alinhadas para identificar os SNPs/variações entre as sequências gênicas paralógas putativas obtidas de cultivares X5, Westag, Jack, Williams 82 e Maverick.
[00196] O alinhamento de sequência foi feito através do programa AlignX® do programa de computador NTI Advance 11.0 (Life Technologies, Carlsbad, CA) e é mostrado na Figura 1 e na Figura 2. AlignX® usa um algoritmo Clustal W modificado para gerar múltiplos alinhamentos de sequência tanto de sequências de ácidos nucleicos como proteicas para comparações de similaridade e para anotação. Como mostrado na Figura 1 e na Figura 2, a análise das sequências isoladas indicou que as respectivas sequências de FAD2 2.3 e FAD2 2.6 compartilharam altos níveis de similaridade de sequência.
[00197] O gene FAD2 2.3 corresponde às bases 49.417.070 a 49.418.219 no cromossomo 10 na sequência genômica de referência Williams 82 (SEQ ID NO:4). As sequências dos genes dos cinco cultivares (Williams 82, Jack, Maverick, X5 e Westag) foram idênticas das bases 41 a 1140 (cobertura obtida com os iniciadores usados). O gene FAD2 2.6 corresponde às bases 34.178.330 a 34.179.475 no cromossomo 20 da sequência genômica de referência Williams 82 (SEQ ID NO:9). Diferenças de sequência foram identificadas na sequência X5 em relação à sequência de referência Williams 82 nas posições 233 (C> T), 352 (A> G), 633 (C> T), 645 (T> C), 658 (T> C), 894 (A> G). As Maverick possuíam as mesmas modificações de bases que X5 nas posições 352 e 894.
Exemplo 2: Concepção dos Domínios de Ligação Dedo de Zinco Específicos para os genes FAD2
[00198] As proteínas dedo de zinco dirigidas contra as sequências de DNA que codificam várias sequências funcionais do locus gênico FAD2 foram concebidas como anteriormente descrito. Ver, por exemplo, Urnov et al. (2005) Nature 435:646-651. A sequência alvo exemplar e as hélices de reconhecimento são mostradas na Tabela 1 (sítios alvo) e na Tabela 2 (desenhos das regiões de hélice de reconhecimento). Os sítios alvo de Nuclease Dedo de Zinco (ZFN) foram concebidos para ligar-se a sítios alvo de FAD2. Os desenhos de dedo de zinco FAD2 foram incorporados em vetores de expressão de dedo de zinco que codificam uma proteína que tem pelo menos um dedo com uma estrutura CCHC. Ver, Publicação de Patente U.S. No. 2008/0182332. Em particular, o último dedo em cada proteína possuía um esqueleto CCHC na hélice de reconhecimento. As sequências de codificação do dedo de zinco não canônicas foram fundidas ao domínio nuclease de tipo IIS da enzima de restrição FokI (aminoácidos 384 a 579 da sequência de Wah et al. (1998) Proc. Natl. Acad. Sci. USA 95:10564-10569) através de um ligante ZC de quatro aminoácido e um sinal de localização nuclear opaque-2 derivado de Zea mays para formar nucleases de dedo de zinco de FAD2 (ZFNs). Tanto os domínios FokI selvagem como eHF-FokI (ver a Publicação de Patente US No. 20110201055) foram construídas ZFNs 1 a 3, enquanto somente os domínios eHF-FokI foram usados para as ZFNs 4 a 7.
[00199] A atividade de ZFNs FAD2 2.3 e 2.6 concebidas foram testadas em um ensaio DLSSA (ver a Publicação de Pedido de Patente US No. 20110301073) para identificar as ZFNs com a atividade mais alta. A clivagem das sequências relevantes clonadas de FAD2 2.3 e 2.6 em células mamíferas pelas ZFNs foi avaliada (Figura 3). A atividade foi comparada com uma ZFN de referência altamente ativa (8266:8196); a atividade de base é indicada. Tabela 1: Sítios de Dedos de Zinco FAD2 Direcionados Tabela 2: Concepções do dedo de zinco FAD2 dos monômeros de
Exemplo 3: Nuc ease Dedo de Zinco e Construi tos Doadores Construtos ZFN
[00200] Os vetores plasmidiais contendo os construtos de expressão de ZFN das nucleases dedo de zinco exemplares, que foram identificadas usando o ensaio, como descrito no Exemplo 2, foram concebidos e completados.
[00201] Cada sequência de codificação do dedo de zinco foi fundida a uma sequência que codifica um sinal de localização nuclear opaque- 2 (Maddaloni et al. (1989) Nuc. Acids Res. 17 (18):7532), que foi posicionado a montante da nuclease dedo de zinco. Depois, a sequência de fusão sinal de localização nuclear opaque-2::nuclease dedo de zinco foi pareada com a sequência de fusão sinal de localização nuclear opaque-2::nuclease dedo de zinco complementar. Como tal, cada construto consistiu de uma região de leitura aberta única compreendida de duas sequências de fusão de sinal de localização nuclear opaque-2::nuclease dedo de zinco separadas pela sequência 2A do vírus Thosea asigna (Mattion et al. (1996) J. Virol. 70:8124-8127). A expressão das proteínas de fusão foi feita por um promotor constitutivo relativamente forte como um promotor derivado do promotor do Vírus do Mosaico de Veia de Mandioca (CsVMV) e flanqueada pela ORF23 da região 3’ não traduzida de Agrobacterium tumefaciens (AtuORF23 3’UTR).
[00202] Os vetores foram montados usando a Tecnologia INFUSION™ Advantage (Clontech, Mountain View, CA). As endonucleases de restrição foram obtidas de New England BioLabs (NEB; Ipswich, MA) e a DNA T4 Ligase (Invitrogen) foi usada para a ligação do DNA. As preparações plasmidiais foram realizadas usando o Kit NucleoSpin® Plasmid (Macherey-Nagel Inc., Bethlehem, PA) ou o Kit Plasmid Midi (Qiagen) seguindo as instruções dos fornecedores. Os fragmentos de DNA foram isolados usando o kit QIAquick Gel Extraction™ (Qiagen) apóes eletroforese em gel de agarose Tris- acetato. As colônias de todos os plasmídeos montados foram inicialmente triadas por digestão de restrição de miniprep de DNA. O DNA plasmideal dos clones selecionados foi sequenciado por um fornecedor de sequenciamento comercial (Eurofins MWG Operon, Huntsville, AL). Os dados de sequência foram reunidos e analisados usando o programa SEQUENCHER™ (Gene Codes Corp., Ann Arbor, MI).
[00203] Antes da entrega aos protoplastos de Glycine max, o DNA Plasmidial foi preparado a partir de culturas de E. coli usando Pure Yield Plasmid Maxiprep System® (Promega Corporation, Madison, WI) ou Plasmid Maxi Kit® (Qiagen, Valencia, CA) seguindo as instruções dos fornecedores.
[00204] Os onze construtos plasmidiais resultantes; pDAB115603 (contendo o construto ZFN37354 e ZFN37355 com eHF-FokI), pDAB115600 (contendo o construto ZFN37354 e ZFN37355 com FokI selvagem), pDAB115605 (contendo o construto ZFN37370 e ZFN37371 com eHF-FokI), pDAB115601 (contendo o ZFN37370 e ZFN37371 com FokI selvagem), pDAB115606 (contendo o construto ZFN37374 e ZFN37375 com eHF-FokI), pDAB115604 (contendo o construto ZFN37366 e de ZFN37367 com eHF-FokI), pDAB115607 (contendo o construto ZFN37384 e ZFN37385 com eHF-FokI), pDAB115602 (contendo o construto ZFN37384 e ZFN37385 com FokI selvagem), pDAB115609 (contendo o construto ZFN37398 e ZFN37399 com eHF-FokI), e pDAB115608 (contendo o construto ZFN37392 e ZFN37393 com eHF-FokI) foram confirmados através de digestão por enzima de restrição e através de sequenciamento do DNA.
Construtos Doadores
[00205] Os vetores doadores de FAD2 foram construídos pela combinação de partes lineares sintetizadas de novo dentro de um vetor plasmidial de alta cópia. pDAB115620 (Figura 4) e pDAB115622 (Figura 5) foram usados para a integração do doador dentro dos loci de FAD2 do genoma de soja. Ambos os vetores doadores foram sintetizados para conter domínios de ligação à nuclease dedo de zinco. pDAB115620 ("Doador 1") compreende o domínio de ligação à ZFN 37354:37355, domínio de ligação à ZFN 37366:37367, domínio de ligação à ZFN 37370:37371, e domínio de ligação à ZFN 37374:37375. pDAB115622 ("Doador 2") compreende o domínio de ligação à ZFN 37384:37385, domínio de ligação à ZFN 37392:37393, e o domínio de ligação à ZFN 37398:37399. Os domínios de ligação à ZFN são reconhecidos pela nuclease dedo de zinco expressa correspondente e são clivados durante a co-transformação em células vegetais com o vetor doador e o vetor da nuclease dedo de zinco.
Exemplo 4: Transformação de Protoplastos de Soja
[00206] Um método de transformação de soja baseado em protoplasto (por exemplo, Glycine max c.v. Maverick) foi desenvolvido. Os protoplastos foram isolados a partir de uma cultura em suspensão de Maverick derivada do calo produzido de explantes foliares. As técnicas descritas abaixo descrevem o método.
Manutenção da cultura
[00207] As suspensões celulares de soja foram subcultivadas a cada 7 dias por uma diluição 1:5 em meio LS fresco (Linsmaier e Skoog 1965) contendo sacarose 3% (p/v), 2,4-D 0,5 mg/L e 7 g de bactoagar, pH 5,7. Todos os experimentos foram realizados começando 7 dias após a subcultura baseada no protocolo descrito abaixo.
Isolamento de protoplasto
[00208] Trinta mililitros de uma cultura em suspensão de Maverick 7 dias após o subcultivo foram transferidos para um tubo cônico de centrífuga de 50 ml e centrifugado a 200 g por 3 minutos, produzindo aproximadamente 10 ml do volume celular ajustado (SCV) por tubo. O sobrenadante foi removido sem perturbar o precipitado celular. Vinte mililitros da solução enzimática (0,3% pectoliase (320952; MP Biomedicals), celulase 3% ("Onozuka" R10™; Yakult Pharmaceuticals, Japan) na solução de MMG (MES 4 mM, manitol 0,6 M, MgCl2 15 mM, pH 6,0) foram adicionados a cada 4 SCV de células em suspensão e os tubos foram enrolados com Parafilm™. Os tubos foram colocados em uma plataforma oscilatória por uma noite (aproximadamente 16 a 18 horas). Na manhã seguinte, uma alíquota das células digeridas foi examinada microscopicamente para assegurar que a digestão das paredes celulares foi suficiente.
Purificação de protoplasto
[00209] As soluções de células/enzima foram filtradas lentamente através de um filtro celular de 100 μM. O filtro celular foi enxaguado com 10 ml de meios W5+ (MES 1,82 mM, NaCl 192 mM, CaCl2154 mM, KCl 4,7 mM, pH 6,0). A etapa de filtração foi repetida usando uma tela de 70 μM. O volume final foi trazido a 40 ml pela adição de 10 ml de meio W5+. As células foram misturadas por inversão do tubo. Os protoplastos foram lentamente acondicionados em camadas em 8 ml de uma solução de gradiente de sacarose (sacarose 500 mM, CaCl2 1 mM, MES-KOH 5 mM, pH 6,0) pela adição da solução de gradiente no fundo de um tubo cônico de centrífuga de 50 ml contendo as células. Os tubos foram centrifugados a 350 g por 15 minutos em um rotor basculante. A ponta de uma pipeta de 5ml foi usada para remover lentamente a camada de protoplasto (aproximadamente 7 a 8 ml). Os protoplastos então foram transferidos para um tubo cônico de 50 ml e 25 ml de meio W5+ foram adicionados. Os tubos foram invertidos lentamente e centrifugado por 10 minutos a 200 g. O sobrenadante foi removido, 10 ml da solução MMG foram adicionados e o tubo foi invertido lentamente para ressuspender os protoplastos. A densidade de protoplasto foi determinada usando um hemocitômetro ou um citômetro de fluxo. Tipicamente, 4 PCV da suspensão de células produziram aproximadamente 2 milhões de protoplastos.
Transformação de Protoplastos usando PEG
[00210] A concentração de protoplasto foi ajustada para 1,6 milhão/ml com MMG. As alíquotas de protoplasto de 300 μl (aproximadamente 500.000 protoplastos) foram transferidas para tubos estéreis de 2 ml. A suspensão de protoplasto foi misturada regularmente durante a transferência de protoplastos nos tubos. DNA plasmidial foi adicionado às alíquotas de protoplasto de acordo com o desenho experimental. A estante contendo os tubos de protoplastos foi lentamente invertida 3 vezes por 1 minuto cada para misturar o DNA e os protoplastos. Os protoplastos foram incubados por 5 minutos à temperatura ambiente. Trezentos microlitros de uma solução de polietilenoglicol (PEG 4000) (etilenoglicol 40% (Aldrich 81240-Sigma), manitol 0,3 M, CaCl2 0,4 M) foram adicionados aos protoplastos e a estante de tubos foi misturada por 1 min e incubada por 5 min, com a inversão suave duas vezes durante a incubação. Um mililitro de W5+ foi lentamente adicionado aos tubos e a estante de tubos invertida 15 a 20 vezes. Os tubos então foram centrifugados a 350 g por 5 min e o sobrenadante removido sem perturbar o precipitado. Um mililitro do meio WI (MES 4 mM manitol 0,6 M, KCl 20 mM, pH 6,0) foi adicionado a cada tubo e a estante suavemente invertida para ressuspender os precipitados. A estante foi coberta com uma folha de alumínio e colocada para incubar durante a noite a 23°C.
Medida da Frequência de Transformação e Coleta dos Protoplastos
[00211] A quantificação dos protoplastos e as eficiências de transformação foram medidas usando um Quanta Flow Cytometer™ (Beckman-Coulter Inc). Aproximadamente 16 a 18 horas após a transformação, 100 μl de cada replicata foram amostrados, colocados em uma placa de 96 poços e diluídos 1:1 com a solução WI. As replicatas foram ressuspensas 3 vezes e 100 μl foram quantificados usando citometria de fluxo. Antes da submissão das amostras à análise, as amostras foram centrifugadas a 200 g por 5 min, os sobrenadantes foram removidos e as amostras foram congeladas instantaneamente em nitrogênio líquido. As amostras então foram colocadas em um freezer -80°C até serão processadas para a análise molecular.
Exemplo 5: Clivagem de Nuclease Dedo de Zinco e Integração do Doador
[00212] As ZFNs concebidas foram transformadas em protoplastos de soja usando a metodologia de transformação descrita acima. A eficiência de clivagem do locus de FAD2 foi avaliada para várias ZFNs através de um ensaio de interrupção de locus como descrito no Pedido Provisório de Patente US No. 61/736.856. Além disso, a integração mediada por nuclease dedo de zinco de uma sequência doadora dentro dos loci de FAD2 foi avaliada através de um ensaio de PCR in- out e os amplicons de PCR resultantes foram sequenciados para caracterizar a integração do doador dentro do genoma da soja.
[00213] Os experimentos foram compreendidos de grupos de tratamento contendo o vetor doador sozinho, o vetor de ZFN sozinho ou os vetores ZFN e doadores combinados (Tabela 3). Além disso, os experimentos incluíram grupos de tratamento controle negativos de células não transformadas ou células transformadas com um vetor controle, pDAB7221 (Figura 6), compreendendo um cassete de expressão GFP dirigido pelo promotor de CsVMV e flaqueado pela AtuORF24 3’-UTR dentro de um plasmídeo de alto número de cópias. As amostras transformadas foram coletadas aproximadamente 18 a 24 horas após transfecção. Os dados experimentais demonstraram alta atividade do plasmídeo de ZFN, pDAB115601 e este plasmídeo de ZFN foi usado como um controle positivo em todos os experimentos subsequentes.
[00214] Como detalhado na Tabela 3, os experimentos de transformação contiveram um total de 80 μg de DNA, com o plasmídeo pDAB7221 adicionado conforme necessário para trazer a concentração total de DNA de para 80 μg. A proporção do vetor doador para o plasmídeo que expressa a ZFN foi aproximadamente 10:1. Cada experimento ou tratamento consistiu de seis replicatas experimentais que foram processadas e analisadas independentemente. Os experimentos avaliando as ZFNs foram feitos em dois conjuntos de experimentos, com o plasmídeo de ZFN, pDAB115601 usado em todos os experimentos finais como um controle positivo. TABELA 3: Concepção experimental. Os plasmídeos de ZFN foram avaliados em dois conjuntos (ZFNs de F2 1-3 e ZFNs F2 47). Os vetores doadores apropriados para os plasmídeos de ZFN foram testados foram usados para os experimentos de direcionamento. Seis replicatas foram feitas para cada tratamento.
Análise do Direcionamento
[00215] As amostras de DNA dos experimentos de direcionamento foram analisadas usando um ensaio de interrupção de locus para detectar modificações nos sítios de clivagem de ZFN de FAD2 ou avaliar o direcionamento por NHEJ. Um ensaio de qPCR foi projetado para medir os sítios de ligação de ZFN intactos nos alvos de FAD2. A inserção de doador ou a clivagem mediada por ZFN seguida pelo reparo de NHEJ resulta na perda do sítio de ligação de ZFN e redução subsequente do sinal detectável da qPCR. As ZFNs que possuem a atividade de clivagem significante resultaram na produção de amplicons com um sinal reduzido em comparação ao tratamento doador sozinho. Os iniciadores e as sondas usadas no ensaio de interrupção de locus são fornecidos na Tabela 4, e suas posições relativas em relação aos loci de FAD2 são mostradas na Figura 7.
[00216] Os resultados foram comparados com o sinal obtido a partir de loci de FAD2 intactos em células de soja não tratadas. O tratamento dos protoplastos com a ZFN FAD2 2.3 ZFN2_WT (ambos os experimentos) e as ZFNs FAD2 2.6 nas quais ZFN4_HF (um experimento) e F2 ZFN5_HF (ambos os experimentos) na presença dos vetores doadores apropriados resultou um sinal mais baixo estatisticamente significativo em comparação com aquele obtido de uma sequência intacta (doador sozinho). Tabela 4: Iniciadores e sondas da PCR de interrupção PCR In-Out Locus Específica
[00217] Para confirmar a inserção do doador direcionado, DNA de todos os tratamentos foi submetido a um ensaio de PCR In-Out Locus Específica. O vetor doador nos experimentos foi concebido para conter sítios de ligação para todas as ZFNs que foram testadas quanto a integração direcionada dentro do locus de FAD2. A co-entrega da ZFN e do doador em células de soja resulta na clivagem do sítio de ligação de ZFN no alvo e no vetor doador e na integração subsequente do doador no locus de FAD2 clivado através do mecanismo de junção de extremidade não homóloga. As extremidades do sítio do cromossomo de FAD2 e do vetor doador linearizado que são gerados pela clivagem de ZFN sofrem o processamento antes da integração dentro do locus de FAD2 e podem resultar em produtos de junção de extremidade imperfeitos. A confirmação da integração direcionada no alvo foi realizada com base em uma estratégia de PCR In-Out, onde o iniciador "Out" reconhece a sequência no locus genômico nativo e o no Iniciador "In" se liga à sequência dentro do DNA doador. O ensaio de PCR In-Out foi realizado tanto nas extremidades -5’ como 3’ da ligação de inserção.
[00218] Todas das ZFNs testadas mostraram alguma evidência de direcionamento e integração de um fragmento doador no locus de soja FAD2 em pelo menos um experimento como determinado por um produto de PCR nas amostras de ZFN e do doador. Os resultados do direcionamento integrado do doador usando as seguintes ZFNs; F2 ZFN2_WT, F2 ZFN2_HF e F2 ZFN4_HF foram reprodutíveis já que os produtos de PCR foram produzidos em pelo menos 2 das 6 replicatas experimentais tanto nas extremidades 5’ como 3’ (Tabela 5). Tabela 5: Sumário do direcionamento de NHEJ no locus de FAD2 em protoplastos de soja. O número de replicatas positivo para a PCR In-Out nos experimentos de direcionamento independentes é mostrado para os experimentos ou tratamentos. Sequenciamento dos Produtos da PCR In-Out
[00219] Dois dos amplicons (do tamanho esperado) de cada um dos experimentos de direcionamento de PCR In-Out completados com pDAB1115620 e F2 ZFN2_WT ou pDAB1115620 e F2 ZFN2_HF foram clonados em um plasmídeo. O plasmídeo resultante foi sequenciado usando o método de sequenciamento de Sanger. As sequências foram alinhadas a uma sequência de referência em que as extremidades de 4 de bp da fita simples que são preditas resultar da clivagem de FokI foram duplicadas para representar todas as combinações possíveis das extremidades. Dez modelos de sequência únicos foram encontrados a partir de 23 sequências clonadas obtidas (Figura 8). Todos os modelos de sequência conservaram uma porção da sequência genômica de FAD2 de referência localizada entre os sítios de ligação de ZFN (GAAATTTC), mas os modelos de sequência também possuíram deleções em relação à sequência genômica de FAD2 de referência. As sequências 4WT1 e 4WT4 continham deleções que se estenderam dentro sítio de ligação de ZFN na extremidade 3’ da sequência GAAATTTC. Duas sequências, 1HF4 e 6HF4, possuíam inserções de bases únicas. Os modelos de sequência de DNA observados demonstram que o direcionamento de DNA doador na locus de FAD2 de soja ocorreu.
[00220] Enquanto certas modalidades exemplares foram descritas neste pedido, aqueles especialistas na técnica reconhecerão e apreciarão que muitas adições, deleções e modificações às modalidades exemplares podem ser feitas sem se afastar do escopo das reivindicações seguintes. Além disso, os atributos de uma modalidade podem ser combinados com atributos de outra modalidade.

Claims (9)

1. Método para modificação de pelo menos um gene FAD2 em uma célula de soja, caracterizado pelo fato de que compreende: clivagem, de uma maneira sítio-específica, de um sítio alvo como mostrado em qualquer uma de SEQ ID NOs: 14 a 20 em pelo menos um gene FAD2 em uma célula de soja, para gerar por meio disso uma quebra no gene FAD2; em que o gene FAD2 é modificado pela integração de uma sequência de ácido nucleico de interesse na quebra, em que o gene FAD2 é o gene FAD2 2.3 representado pela SEQ ID NO: 4, um gene FAD2 2.6 representado pela SEQ ID NO: 9, ou ambos; em que a clivagem de uma maneira sítio-específica, compreende a introdução de uma proteína de fusão compreendendo um domínio de ligação ao DNA e um domínio de clivagem ou meio-domínio de clivagem na célula ou de um polinucleotídeo que codifica a proteína de fusão, em que a proteína de fusão se liga com especificidade ao sítio alvo e cliva no sítio alvo ou próximo a ele para gerar por meio disso a quebra; e em que a integração na quebra de uma sequência de ácido nucleico de interesse compreende a introdução de um polinucleotídeo compreendendo a sequência de ácido nucleico de interesse e o sítio alvo de ligação ao domínio de ligação ao DNA.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o domínio de ligação ao DNA é um domínio de ligação ao DNA de proteína dedo de zinco.
3. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que o domínio de clivagem ou o meio-domínio de clivagem é selecionado a partir do grupo consistindo em um meio-domínio de clivagem de uma endonuclease de restrição tipo IIS, um meio-domínio de clivagem de endonuclease FokI, um meio-domínio de clivagem de endonuclease StsI, uma proteína Cas e uma endonuclease homing.
4. Método, de acordo com a reivindicação 2 ou 3, caracterizado pelo fato de que a proteína de fusão é uma nuclease de dedo de zinco, em que a nucleasse dedo de zinco compreende cinco ou seis domínios dedo de zinco ordenados de F1 a F5 ou F1 a F6, cada domínio dedo de zinco compreendendo uma região de hélice de reconhecimento, em que a proteína dedo de zinco compreende as regiões de hélice de reconhecimento ordenadas e mostradas em uma linha única da seguinte Tabela:
5. Método, de acordo com qualquer uma das reivindicações 1 a 4, caracterizado pelo fato de que a clivagem de uma maneira sítio- específica é específica para algumas, mas não todas as cópias do gene FAD2 2.3 representado pela SEQ ID NO: 4 e gene FAD2 2.6 representado pela SEQ ID NO: 9.
6. Método, de acordo com qualquer uma das reivindicações 1 a 5, caracterizado pelo fato de que a sequência de ácido nucleico de interesse compreende um ou mais genes de resistência inseticidas, um ou mais genes de tolerância a herbicidas, um ou mais genes de eficiência de uso de nitrogênio, um ou mais genes de eficiência de uso de água, um ou mais genes de qualidade nutricional, um ou mais genes de ligação ao DNA, um ou mais genes marcadores selecionáveis e combinações destes.
7. Uso de uma célula de soja, semente de soja ou planta de soja obtenível pelo método como definido em qualquer uma das reivindicações 1 a 6, caracterizado pelo fato de que é para regenerar uma planta de soja, reproduzir sexual ou clonalmente a referida planta, em que a célula, a semente ou a planta de soja é célula, semente ou planta transgênica compreendendo (i) pelo menos um gene FAD2 2.3 e/ou 2.6 rompido ou (ii) uma sequência de nucleotídeos de interesse integrada em uma ou mais cópias de pelo menos um gene FAD2 2.3 e/ou FAD2 2.6, em que o gene FAD2 2.3 é representado pela SEQ ID NO: 4 e o gene FAD2 2.6 é representado pela SEQ ID NO: 9.
8. Uso, de acordo com a reivindicação 7, caracterizado pelo fato de que a sequência de nucleotídeos é heteróloga ou homóloga à célula.
9. Nuclease dedo de zinco sítio-específica, caracterizada pelo fato de que é para uso na modificação de pelo menos um gene FAD2, em que a nuclease dedo de zinco cliva em um sítio alvo de ácido nucleico, selecionado a partir do grupo consistindo em SEQ ID NO: 14 a SEQ ID NO: 20, em que o gene FAD2 é o gene FAD2 2.3 representado pela SEQ ID NO: 4, um gene FAD2 2.6 representado pela SEQ ID NO: 9, ou ambos, em que a nuclease dedo de zinco compreende cinco ou seis domínios dedo de zinco ordenados de F1 a F5 ou F1 a F6, cada domínio dedo de zinco compreendendo uma região de hélice de reconhecimento, em que a proteína dedo de zinco compreende as regiões de hélice de reconhecimento ordenadas e mostradas em uma linha única da seguinte Tabela:
BR112015004948-6A 2012-09-07 2013-09-05 Método para modificação de um gene fad2 em uma célula de soja, usos de célula, semente ou planta de soja e nuclease de dedo de zinco sítio- específica BR112015004948B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261697886P 2012-09-07 2012-09-07
US61/697,886 2012-09-07
PCT/US2013/058299 WO2014039702A2 (en) 2012-09-07 2013-09-05 Fad2 performance loci and corresponding target site specific binding proteins capable of inducing targeted breaks

Publications (2)

Publication Number Publication Date
BR112015004948A2 BR112015004948A2 (pt) 2017-11-21
BR112015004948B1 true BR112015004948B1 (pt) 2023-08-08

Family

ID=

Similar Documents

Publication Publication Date Title
US10844389B2 (en) FAD2 performance loci and corresponding target site specific binding proteins capable of inducing targeted breaks
US10961540B2 (en) FAD3 performance loci and corresponding target site specific binding proteins capable of inducing targeted breaks
BR112015004948B1 (pt) Método para modificação de um gene fad2 em uma célula de soja, usos de célula, semente ou planta de soja e nuclease de dedo de zinco sítio- específica