BRPI0716427B1 - METHOD FOR INTRODUCING AN EXOGENOUS SEQUENCE IN THE GENOME OF A PLANT CELL - Google Patents

METHOD FOR INTRODUCING AN EXOGENOUS SEQUENCE IN THE GENOME OF A PLANT CELL Download PDF

Info

Publication number
BRPI0716427B1
BRPI0716427B1 BRPI0716427B1 BR PI0716427 B1 BRPI0716427 B1 BR PI0716427B1 BR PI0716427 B1 BRPI0716427 B1 BR PI0716427B1
Authority
BR
Brazil
Prior art keywords
sequence
sequences
target
domain
dna
Prior art date
Application number
Other languages
Portuguese (pt)
Publication date

Links

Description

Relatório Descritivo da Patente de Invenção para "MÉTODO PARA INTRODUÇÃO DE UMA SEQUÊNCIA EXÓGENA NO GENOMA DE UMA CÉLULA DE PLANTA".Report of the Invention Patent for "METHOD FOR INTRODUCING AN EXOGENOUS SEQUENCE IN THE GENOME OF A PLANT CELL".

CAMPO TÉCNICOTECHNICAL FIELD

[001] A presente descrição refere-se aos campos de projeto de genoma, direcionamento gênico, integração cromossômica e expressão de proteína direcionadas em plantas.[001] This description refers to the fields of genome design, gene targeting, chromosomal integration, and protein expression directed at plants.

ANTECEDENTESBACKGROUND

[002] Uma área maior de interesse na agricultura, especialmente à luz da determinação das sequências de nucleotídeo completas de um número de genomas de planta, é a alteração direcionada de sequências de genoma. Em particular, a capacidade de converter sequências de planta endógenas facilitaria numerosas aplicações, tais como, por exemplo, a otimização de traços de colheita que afetam o valor nutricional, rendimento, tolerância a estresse, resistência à patogenia, e resistência a agroquímicos e/ou a adaptação de plantas para o uso como fatores biológicos para a produção de compostos farmacêuticos ou químicos industriais.A major area of interest in agriculture, especially in light of determining the complete nucleotide sequences of a number of plant genomes, is the directed alteration of genome sequences. In particular, the ability to convert endogenous plant sequences would facilitate numerous applications, such as, for example, optimizing crop traits that affect nutritional value, yield, stress tolerance, pathogen resistance, and resistance to agrochemicals and / or adaptation of plants for use as biological factors for the production of pharmaceutical or industrial chemical compounds.

[003] Em eucariotas, tentativas têm sido feitas para alterar sequências genômicas em células cultivadas levando-se a vantagem do fenômeno natural de recombinação homóloga. Ver, por exemplo, Capecchi (1989) Science 244:1288-1292; Patentes dos Estados Unidos N°s 6.528.313 e 6.528.314. Se um polinucleotídeo tem homologia suficiente para a região genômica contendo a sequência a ser alterada, é possível para parte ou toda da sequência do polinucleotídeo substituir a sequência genômica por recombinação homóloga. Contudo, a frequência de recombinação homóloga sob estas circunstâncias é extremamente baixa. Além disso, a frequência de inserção do polinucleotídeo exógeno nas localizações genômicas que carece de homologia de sequência excede a frequência de recombinação homóloga por várias ordens de grandeza.In eukaryotes, attempts have been made to alter genomic sequences in cultured cells taking advantage of the natural phenomenon of homologous recombination. See, for example, Capecchi (1989) Science 244: 1288-1292; United States Patents Nos. 6,528,313 and 6,528,314. If a polynucleotide has sufficient homology to the genomic region containing the sequence to be altered, it is possible for part or all of the polynucleotide sequence to replace the genomic sequence with homologous recombination. However, the frequency of homologous recombination under these circumstances is extremely low. In addition, the frequency of insertion of the exogenous polynucleotide at genomic locations lacking sequence homology exceeds the homologous recombination frequency by several orders of magnitude.

[004] A introdução de uma quebra de filamento duplo no DNA genômico, na região do genoma que suporta homologia em um polinucleotídeo exógeno, tem sido mostrada para estimular a recombinação homóloga neste local por milhares de vezes em células cultivadas. Rouet et al. (1994) Mol. Célula. Biol. 14:8096-8106; Choulika et al. (1995) Mol. Célula. Biol. 15:1968-1973; Donoho et al. (1998) Mol. Célula. Biol. 18:4070-4078. Ver também Johnson et al. (2001) Biochem. Soc. Trans. 29:196-201; e Yanez et al. (1998) Gene Therapy 5:149-159. Nestes métodos, divagem de DNA na região genômica desejada foi acompanhada pela inserção de um local de reconhecimento para uma meganuclease (isto é, uma endonuclease cuja sequência de reconhecimento é tão grande que ela não ocorre, ou ocorre somente raramente, no genoma de interesse) na região genômica desejada.[004] The introduction of a double stranded break in genomic DNA in the region of the genome that supports homology in an exogenous polynucleotide has been shown to stimulate homologous recombination at this site thousands of times in cultured cells. Rouet et al. (1994) Mol. Cell. Biol. 14: 8096-8106; Choulika et al. (1995) Mol. Cell. Biol. 15: 1968-1973; Donoho et al. (1998) Mol. Cell. Biol. 18: 4070-4078. See also Johnson et al. (2001) Biochem. Soc. Trans. 29: 196-201; and Yanez et al. (1998) Gene Therapy 5: 149-159. In these methods, DNA splitting in the desired genomic region was accompanied by the insertion of a recognition site for a meganuclease (ie, an endonuclease whose recognition sequence is so large that it does not occur, or only rarely, in the genome of interest). in the desired genomic region.

[005] Contudo, a recombinação homóloga estimulada por divagem de meganuclease ocorre, ou na presença fortuita de, ou na inserção dirigida de um local de reconhecimento de meganuclease adequado na vizinhança da região genômica a ser alterada. Desde que os locais de reconhecimento de meganuclease são raros (ou não-existentes) em um genoma de planta típico, uma inserção de um local de reconhecimento de meganuclease adequado é contaminada com as mesmas dificuldades, conforme associadas com outras alterações genômicas, estes métodos não sendo amplamente aplicáveis.However, homologous recombination stimulated by meganuclease divaving occurs either in the fortuitous presence of, or at the directed insertion of an appropriate meganuclease recognition site in the vicinity of the genomic region to be altered. Since meganuclease recognition sites are rare (or non-existent) in a typical plant genome, an insertion of a suitable meganuclease recognition site is contaminated with the same difficulties as associated with other genomic changes, these methods do not being widely applicable.

[006] Desse modo, permanecem necessidades de composições e métodos para alteração direcionada de sequências em qualquer genoma de planta, e de composições e métodos para introdução direcionada de sequências exógenas em um genoma.Thus, there remains a need for compositions and methods for directed sequence alteration in any plant genome, and for compositions and methods for directed introduction of exogenous sequences into a genome.

SUMÁRIOSUMMARY

[007] A presente descrição proporciona composições e métodos para divagem diredonada de cromatina celular em uma região de interesse, e/ou recombinação homóloga em uma região predeterminada de interesse em células de planta. As células de planta podem ser de espécies de planta monocotiledônea (monocots) ou dicotiledôneas (dicots), e também incluem células cultivadas, células em uma planta em qualquer estágio de desenvolvimento, e células de planta que foram removidas de uma planta total, e cujas células (ou suas descendentes) serão retornadas para a planta.[007] The present disclosure provides compositions and methods for cell chromatin di-divonation in a region of interest, and / or homologous recombination in a predetermined region of interest in plant cells. Plant cells can be from monocots or dicot plants, and also include cultured cells, cells in a plant at any stage of development, and plant cells that have been removed from a total plant, and whose cells (or their descendants) will be returned to the plant.

[008] Uma região de interesse na cromatina celular pode ser, por exemplo, uma sequência genômica, ou porção desta. As composições incluem polipeptídeos de fusão compreendendo um domínio de ligação de dedo de zinco projetado (por exemplo, um domínio de ligação de dedo de zinco tendo uma nova especificidade), e um domínio de divagem, e polipeptídeos de fusão compreendendo um domínio de ligação de dedo de zinco projetado, e um meio-domínio de divagem. Os domínios de divagem e meios-domínios de divagem podem ser obtidos, por exemplo, de várias endonucleases de restrição e/ou endonucleases auto-direcionais (homing).A region of interest in cellular chromatin may be, for example, a genomic sequence, or portion thereof. Compositions include fusion polypeptides comprising a designed zinc finger binding domain (e.g., a zinc finger binding domain having a new specificity), and a splitting domain, and fusion polypeptides comprising a zinc finger binding domain. projected zinc finger, and a half-domain of divagem. Splitting domains and splitting half-domains may be obtained, for example, from various restriction endonucleases and / or homing endonucleases.

[009] Em um aspecto, é aqui descrito um vetor compreendendo primeira e segunda sequências de DNA, no qual (i) a primeira sequência é homóloga a uma terceira sequência, e a segunda sequência é homóloga a uma quarta sequência; (ii) as terceira e quarta sequências são sequências cromossômicas de DNA; e (iii) as bordas próximas das terceira e quarta sequências são separadas por pelo menos 1 par de nucleotídeos. Em certas concretizações, as terceira e quarta sequências são sequências endógenas.In one aspect, there is described herein a vector comprising first and second DNA sequences, in which (i) the first sequence is homologous to a third sequence, and the second sequence is homologous to a fourth sequence; (ii) the third and fourth sequences are chromosomal DNA sequences; and (iii) the edges near the third and fourth sequences are separated by at least 1 pair of nucleotides. In certain embodiments, the third and fourth sequences are endogenous sequences.

[0010] Em qualquer um dos vetores aqui descritos, pelo menos uma das primeira ou segunda sequências tem um comprimento de 100 nucleotídeos. Em adição, qualquer um dos vetores aqui descritos pode adicionalmente compreender uma quinta sequência, na qual a quinta sequência: (a) é interposta entre as primeira e segunda sequências; e (b) é uma sequência exógena. Em certas concretizações, a quinta sequência tem um tamanho de pelo menos 1 par de base, mas pode ser maior do que 22 kilobase de pares.In any of the vectors described herein, at least one of the first or second sequences has a length of 100 nucleotides. In addition, any of the vectors described herein may further comprise a fifth sequence, in which the fifth sequence: (a) is interposed between the first and second sequences; and (b) is an exogenous sequence. In certain embodiments, the fifth sequence has a size of at least 1 base pair, but may be larger than 22 kilobase pairs.

[0011] Os vetores (por exemplo, a quinta sequência) podem também compreender sequências que codificam uma proteína ou porções de uma proteína. Em certas concretizações, a sequência de proteína de codificação codifica um marcador selecionável (por exemplo, proteína fluorescente verde (GFP), β-glucuronidase (GUS), fosfinotricin N-acetila transferase (PAT, BAR), neomicin fosfotransferase, β-lactamase, catecol dioxigenase, α-amilase, tirosinase, β-galactosidase, luciferase, aequorin, EPSP sintase, nitrilase, acetolactato sintase (ALS), dihidrofolato redutase (DHFR), dalapon dehalogenase e antranilato sintase). Em outras concretizações, a sequência de proteína de codificação (por exemplo, a quinta sequência) codifica uma porção de proteína ou porção de proteína, por exemplo, uma sequência que é homóloga às sequências cromossômicas.Vectors (e.g., the fifth sequence) may also comprise sequences encoding a protein or portions of a protein. In certain embodiments, the coding protein sequence encodes a selectable marker (e.g. green fluorescent protein (GFP), β-glucuronidase (GUS), phosphinothricin N-acetyl transferase (PAT, BAR), neomycin phosphotransferase, β-lactamase, catechol dioxigenase, α-amylase, tyrosinase, β-galactosidase, luciferase, aequorin, EPSP synthase, nitrilase, acetolactate synthase (ALS), dihydrofolate reductase (DHFR), dalapon dehalogenase and anthranilate synthase). In other embodiments, the coding protein sequence (e.g., the fifth sequence) encodes a protein portion or protein portion, for example, a sequence that is homologous to chromosomal sequences.

[0012] Em ainda outras concretizações, os vetores (por exemplo, a quinta sequência) compreendem uma ou mais sequências regulatórias transcricionais. Em ainda outras concretizações, os vetores (por exemplo, quinta sequência) podem compreender uma equivalente tipo selvagem de uma sequência cromossômica mutante ou, alternativamente, uma equivalente mutante de uma sequência cromossômica tipo selvagem.In still other embodiments, the vectors (e.g. the fifth sequence) comprise one or more transcriptional regulatory sequences. In still other embodiments, vectors (e.g., fifth sequence) may comprise a wild-type equivalent of a mutant chromosomal sequence or, alternatively, a mutant equivalent of a wild-type chromosomal sequence.

[0013] Em qualquer um dos vetores aqui descritos, a primeira sequência pode ter pelo menos 35% de homologia à terceira sequência. Similarmente, em qualquer um dos vetores aqui descritos, a segunda sequência pode ter pelo menos 35% de homologia à quarta sequência. Em algumas concretizações, a primeira sequência tem pelo menos 35% a 50%, pelo menos 50% a 70%, pelo menos 70% a 80%, pelo menos 80% a 85%, pelo menos 85% a 90%, pelo menos 90% a 95%, pelo menos 95%, 96%, 97%, 98%, 99% ou 100% de homologia à terceira sequência. Em algumas concretizações, a segunda sequência tem pelo menos 35% a 50%, pelo menos 50% a 70%, pelo menos 70% a 80%, pelo menos 80% a 85%, pelo menos 85% a 90%, pelo menos 90% a 95%, pelo menos 95%, 96%, 97%, 98%, 99% ou 100% de homologia à quarta sequência.In any of the vectors described herein, the first sequence may have at least 35% homology to the third sequence. Similarly, in any of the vectors described herein, the second sequence may have at least 35% homology to the fourth sequence. In some embodiments, the first sequence is at least 35% to 50%, at least 50% to 70%, at least 70% to 80%, at least 80% to 85%, at least 85% to 90%, at least 90% to 95%, at least 95%, 96%, 97%, 98%, 99% or 100% homology to the third sequence. In some embodiments, the second sequence is at least 35% to 50%, at least 50% to 70%, at least 70% to 80%, at least 80% to 85%, at least 85% to 90%, at least 90% to 95%, at least 95%, 96%, 97%, 98%, 99% or 100% homology to the fourth sequence.

[0014] Em ainda outro aspecto, é aqui descrito um método para introdução de uma sequência exógena no genoma de uma célula de planta, o método compreendendo as etapas de: (a) contactar a célula com qualquer um dos vetores acima descritos; e (b) expressar uma ou mais nucleases na célula, na qual as uma ou mais nucleases clivam DNA cromossômico dentro de entre 0,4 e 3 kilobases de pares de ou da terceira ou quarta sequências; tal que divagem de DNA cromossômico na etapa (b) estimula a incorporação do vetor de direcionamento no genoma por recombinação homóloga. Em certas concretizações, uma ou mais nucleases são fusões entre o domínio de divagem de uma endonuclease de restrição Tipo IIS e um domínio de ligação de dedo de zinco projetado.In yet another aspect, a method for introducing an exogenous sequence into the genome of a plant cell is described herein, the method comprising the steps of: (a) contacting the cell with any of the vectors described above; and (b) expressing one or more nucleases in the cell, wherein one or more nucleases cleave chromosomal DNA within 0.4 to 3 kilobase pairs of or of the third or fourth sequence; such that chromosomal DNA splitting in step (b) stimulates the incorporation of the targeting vector into the genome by homologous recombination. In certain embodiments, one or more nucleases are fusions between the dividing domain of an IIS Type restriction endonuclease and a projected zinc finger binding domain.

[0015] Em ainda outro aspecto, é aqui provido um método para expressar uma proteína em uma célula de planta, o método compreendendo as etapas de: (a) contactar a célula com um vetor conforme aqui descrito e (b) expressar uma ou mais nucleases na célula, no qual as uma ou mais nucleases clivam DNA cromossômico dentro de entre 0,1 e 3 kilobases de pares de ou das terceira ou quarta sequências; tal que divagem de DNA cromossômico na etapa (b) estimula a incorporação do vetor no genoma por recombinação homóloga. Em certas concretizações, uma ou mais nucleases são fusões entre o domínio de divagem de uma endonuclease de restrição Tipo IIS e um domínio de ligação de dedo de zinco projetado.In yet another aspect, there is provided a method for expressing a protein in a plant cell, the method comprising the steps of: (a) contacting the cell with a vector as described herein and (b) expressing one or more nucleases in the cell, in which one or more nucleases cleave chromosomal DNA within 0.1 to 3 kilobases of pairs of or third or fourth sequences; such that chromosomal DNA splitting in step (b) stimulates the incorporation of the vector into the genome by homologous recombination. In certain embodiments, one or more nucleases are fusions between the dividing domain of an IIS Type restriction endonuclease and a projected zinc finger binding domain.

[0016] Em outro aspecto, é aqui descrito um vetor de direcionamento compreendendo: (a) primeira e segunda sequências de codificação; e (b) primeira, segunda e terceira sequências-alvo; no qual as sequências são dispostas na ordem: primeira sequência-alvo, primeira sequência de codificação, segunda sequência-alvo, segunda sequência de codificação, terceira sequência-alvo; adicionalmente no qual a primeira sequência-alvo é homóloga a uma primeira sequência cromossômica, e a terceira sequência-alvo é homóloga a uma segunda sequência cromossômica. A primeira e/ou segunda sequência de codificação pode codificar um marcador selecionável, ou, alternativamente, a primeira e/ou segunda sequência de codificação pode codificar uma proteína que não é um marcador selecionável. As primeira e segunda sequências cromossômicas podem ser sequências endógenas cromossômicas. Adicionalmente, os vetores podem compreender uma ou mais repetições da primeira, segunda e/ou terceira sequências-alvo.In another aspect, a targeting vector comprising: (a) first and second coding sequences is described herein; and (b) first, second and third target sequences; wherein the sequences are arranged in the order: first target sequence, first coding sequence, second target sequence, second coding sequence, third target sequence; additionally in which the first target sequence is homologous to a first chromosome sequence, and the third target sequence is homologous to a second chromosome sequence. The first and / or second coding sequence may encode a selectable marker, or alternatively, the first and / or second coding sequence may encode a protein that is not a selectable marker. The first and second chromosomal sequences may be endogenous chromosomal sequences. Additionally, the vectors may comprise one or more repeats of the first, second and / or third target sequences.

[0017] Em outro aspecto, um método para introdução de uma sequência exógena no genoma de uma célula de planta é provido, o método compreendendo as etapas de: (a) contactar a célula com um vetor de direcionamento conforme descrito no parágrafo precedente; e (b) expressar uma ou mais nucleases na célula, no qual uma ou mais nucleases clivam DNA cromossômico dentro de entre 0,1 e 3 kilobases de pares de qualquer das primeira ou segunda sequências cromossômicas; tal que a divagem de DNA cromossômico na etapa (b) estimula a incorporação do vetor-alvo no genoma por recombinação homóloga. Em certas concretizações, uma ou mais nucleases compreendem um meio-domínio de divagem; por exemplo, a nuclease é uma fusão entre o domínio de divagem de uma endonuclease de restrição Tipo IIS e um domínio de ligação de dedo de zinco projetado.In another aspect, a method for introducing an exogenous sequence into the genome of a plant cell is provided, the method comprising the steps of: (a) contacting the cell with a targeting vector as described in the preceding paragraph; and (b) expressing one or more nucleases in the cell, wherein one or more nucleases cleave chromosomal DNA within 0.1 to 3 kilobase pairs of any of the first or second chromosomal sequences; such that chromosomal DNA splitting in step (b) stimulates incorporation of the target vector into the genome by homologous recombination. In certain embodiments, one or more nucleases comprise a split half domain; for example, nuclease is a fusion between the diving domain of an IIS Type restriction endonuclease and a designed zinc finger binding domain.

[0018] Em outro aspecto, um método para expressar uma proteína em uma célula de planta é provido, o método compreendendo as etapas de: (a) contactar a célula com um vetor-alvo conforme descrito nos dois parágrafos acima; e (b) expressar uma ou mais nucleases na célula, no qual a uma ou mais nucleases clivam DNA cromossômico dentro de entre 0,1 e 3 kilobases de pares de qualquer uma das primeira ou segunda sequências cromossômicas; tal que divagem de DNA cromossômico na etapa (b) estimula a incorporação do vetor-alvo no genoma por recombinação homóloga. Em certas concretizações, uma ou mais nucleases são fusões entre o domínio de divagem de uma endonuclease de restrição Tipo IIS e um domínio de ligação de dedo de zinco projetado.In another aspect, a method for expressing a protein in a plant cell is provided, the method comprising the steps of: (a) contacting the cell with a target vector as described in the two paragraphs above; and (b) expressing one or more nucleases in the cell, wherein one or more nucleases cleave chromosomal DNA within 0.1 to 3 kilobase pairs of any of the first or second chromosomal sequences; such that chromosomal DNA splitting in step (b) stimulates the incorporation of the target vector into the genome by homologous recombination. In certain embodiments, one or more nucleases are fusions between the dividing domain of an IIS Type restriction endonuclease and a projected zinc finger binding domain.

[0019] Em um aspecto ainda adicional, uma célula transgênica de planta obtida de acordo com qualquer um dos métodos aqui descritos é também provida.In a still further aspect, a transgenic plant cell obtained according to any of the methods described herein is also provided.

[0020] Em outro aspecto, é aqui provida uma planta compreendendo uma célula transgênica de planta obtida conforme aqui descrito.In another aspect, there is provided herein a plant comprising a transgenic plant cell obtained as described herein.

[0021] Também provido é um método para retirada de sequências a partir do genoma de uma célula transgênica de planta compreendendo primeira e segunda sequências de codificação; e primeira, segunda e terceira sequências-alvo; no qual as sequências são dispostas na ordem: primeira sequência-alvo, primeira sequência de codificação, segunda sequência-alvo, segunda sequência de codificação, terceira sequência-alvo, no qual o método compreende: (a) provisão de uma célula transgênica de planta conforme aqui descrito; e (b) expressão das primeira e segunda nucleases na célula, no qual a primeira nuclease cliva na primeira sequência-alvo, e a segunda nuclease cliva na segunda sequência-alvo.Also provided is a method for removing sequences from the genome of a transgenic plant cell comprising first and second coding sequences; and first, second and third target sequences; wherein the sequences are arranged in the order: first target sequence, first coding sequence, second target sequence, second coding sequence, third target sequence, wherein the method comprises: (a) providing a transgenic plant cell as described herein; and (b) expressing the first and second nucleases in the cell, in which the first nuclease cleaves in the first target sequence and the second nuclease cleaves in the second target sequence.

[0022] Em um aspecto adicional, é aqui revelado um método para retirada de sequências a partir do genoma de uma célula transgênica de planta compreendendo primeira e segunda sequências de codificação; e primeira, segunda e terceira sequência-alvos; no qual as sequências são dispostas na ordem: primeira sequência-alvo, primeira sequência de codificação, segunda sequência-alvo, segunda sequência de codificação, terceira sequências-alvo, no qual o método compreende: (a) provisão de uma célula transgênica de planta conforme aqui descrito; e (b) expressão das primeira e segunda nucleases na célula, no qual a primeira nuclease cliva na segunda sequência-alvo, e a segunda nuclease cliva na terceira sequência-alvo.In a further aspect, disclosed herein is a method for sequencing from the genome of a transgenic plant cell comprising first and second coding sequences; and first, second and third target sequences; wherein the sequences are arranged in the order: first target sequence, first coding sequence, second target sequence, second coding sequence, third target sequences, wherein the method comprises: (a) providing a transgenic plant cell as described herein; and (b) expressing the first and second nucleases in the cell, wherein the first nuclease cleaves in the second target sequence and the second nuclease cleaves in the third target sequence.

[0023] Em ainda outro aspecto, é aqui provido um método para retirada de sequências a partir do genoma de uma célula transgênica de planta compreendendo primeira e segunda sequências de codificação; e primeira, segunda e terceira sequência-alvos; no qual as sequências são dispostas na ordem: primeira sequência-alvo, primeira sequência de codificação, segunda sequência-alvo, segunda sequência de codificação, terceira sequência-alvo, no qual o método compreende: (a) provisão de uma célula transgênica de planta conforme aqui descrito; e (b) expressão das primeira e segunda nucleases na célula, no qual a primeira nuclease cliva na primeira sequência-alvo, e a segunda nuclease cliva na terceira sequência-alvo.In yet another aspect, there is provided herein a method for sequencing from the genome of a transgenic plant cell comprising first and second coding sequences; and first, second and third target sequences; wherein the sequences are arranged in the order: first target sequence, first coding sequence, second target sequence, second coding sequence, third target sequence, wherein the method comprises: (a) providing a transgenic plant cell as described herein; and (b) expressing the first and second nucleases in the cell, wherein the first nuclease cleaves at the first target sequence and the second nuclease cleaves at the third target sequence.

[0024] Em outro aspecto, um método para recombinação homóloga intramolecular no genoma de uma célula (por exemplo, célula de planta) é provido, o método compreendendo as etapas de: (a) provisão de um segmento de DNA compreendendo uma primeira sequência que é homóloga a uma segunda sequência; e (b) contato de referido segmento de DNA com uma nuclease, no qual a nuclease cliva o segmento de DNA a uma terceira sequência. Em certas concretizações, o segmento de DNA é endógeno à célula. Em certas concretizações, recombinação homóloga ocorre em um cromossoma, por exemplo, quando DNA entre as primeira e segunda sequências é retirado a partir do cromossoma. As sequências retiradas a partir do cromossoma podem codificar, por exemplo, todo ou parte de um marcador selecionável. O DNA retirado pode ser substituído por uma sequência exógena, por exemplo, no qual o método compreende adicionalmente: introdução de um polinucleotídeo na célula, no qual o polinucleotídeo compreende: (a) quarta e quinta sequências, no qual a quarta sequência é homóloga às sequências não-retiradas em proximidade à primeira sequência, e a quinta sequência é homóloga às sequências não-retiradas em proximidade à segunda sequência; e (b) a sequência exógena (por exemplo, um marcador selecionável, uma proteína ou porção de uma proteína outra do que um marcador selecionável, um RNA tal como siRNA, etc.). Em qualquer um dos métodos aqui providos, o marcador selecionável pode ser, por exemplo, proteína fluorescente verde (GFP), β-glucuronidase (GUS), fosfinotricin N-acetila transferase (PAT, BAR), neomicin fosfotransferase, β-lactamase, catecol dioxigenase, a-amilase, tirosinase, β-galactosidase, luciferase, aequorin, EPSP sintase, nitrilase, acetolactate sintase (ALS), dihidrofolato redutase (DHFR), dalapon dehalogenase e antranilato sintase.In another aspect, a method for homologous intramolecular recombination in the genome of a cell (e.g., plant cell) is provided, the method comprising the steps of: (a) providing a DNA segment comprising a first sequence that is homologous to a second sequence; and (b) contacting said DNA segment with a nuclease, wherein the nuclease cleaves the DNA segment to a third sequence. In certain embodiments, the DNA segment is endogenous to the cell. In certain embodiments, homologous recombination occurs on a chromosome, for example, when DNA between the first and second sequences is taken from the chromosome. Sequences taken from the chromosome may encode, for example, all or part of a selectable marker. The removed DNA may be replaced by an exogenous sequence, for example, wherein the method further comprises: introducing a polynucleotide into the cell, wherein the polynucleotide comprises: (a) fourth and fifth sequences, wherein the fourth sequence is homologous to sequences not withdrawn in proximity to the first sequence, and the fifth sequence is homologous to sequences not withdrawn in proximity to the second sequence; and (b) the exogenous sequence (e.g., a selectable marker, a protein or portion of a protein other than a selectable marker, an RNA such as siRNA, etc.). In any of the methods provided herein, the selectable marker may be, for example, green fluorescent protein (GFP), β-glucuronidase (GUS), fosfinotricin N-acetyl transferase (PAT, BAR), neomycin phosphotransferase, β-lactamase, catechol. dioxigenase, α-amylase, tyrosinase, β-galactosidase, luciferase, aequorin, EPSP synthase, nitrilase, acetolactate synthase (ALS), dihydrofolate reductase (DHFR), dalapon dehalogenase and anthranilate synthase.

[0025] Em qualquer um dos métodos, a terceira sequência (isto é, a sequência clivada pela nuclease) pode ser única no genoma e/ou a nuclease pode ser um par de proteínas de fusão, no qual cada proteína de fusão é uma fusão entre um meio-domínio de divagem (por exemplo, o domínio de divagem de endonuclease de restrição Tipo IIS) e um domínio de ligação de dedo de zinco projetado. Adicionalmente, a terceira sequência pode estar entre as primeira e segunda sequências (isto é, as sequências homólogas) e/ou pelo menos 1 par de base a partir das primeira e/ou segunda sequências.In either method, the third sequence (i.e., the nuclease cleaved sequence) may be unique in the genome and / or the nuclease may be a pair of fusion proteins, in which each fusion protein is a fusion. between a dial half domain (for example, the IIS Type restriction endonuclease dial domain) and a projected zinc finger binding domain. Additionally, the third sequence may be between the first and second sequences (i.e., homologous sequences) and / or at least 1 base pair from the first and / or second sequences.

[0026] Em qualquer um dos métodos aqui descritos, uma ou ambas das primeira e segunda sequências podem ser exógenas ao organismo.In either method described herein, one or both of the first and second sequences may be exogenous to the organism.

[0027] Desse modo, a presente descrição envolve, mas não está limitada a, as seguintes concretizações numeradas: 1. Um vetor doador compreendendo primeira e segunda sequências de DNA; no qual a primeira sequência é homóloga a uma terceira sequência, e a segunda sequência é homóloga a uma quarta sequência; no qual as terceira e quarta sequências são sequências cromossômicas de DNA; e no qual as bordas próximas das terceira e quarta sequências são separadas por pelo menos 1 par de nucleotídeos. 2. O vetor de 1, no qual as terceira e quarta sequências são sequências endógenas. 3. O vetor de 1 ou 2, no qual pelo menos uma das primeira ou segunda sequências tem um comprimento de 100 nucleotídeos. 4. O vetor de qualquer de 1 a 3, compreendendo adicionalmente uma quinta sequência, no qual a quinta sequência: (a) é interposta entre as primeira e segunda sequências; e (b) é uma sequência exógena. 5. O vetor de 4, no qual a quinta sequência tem um tamanho de pelo menos 1 par de base. 6. O vetor de 4, no qual a quinta sequência compreende sequências que codificam um marcador selecionável. 7. O vetor de 6, no qual o marcador selecionável é selecionado a partir do grupo consistindo em proteína fluorescente verde (GFP), β-glucuronidase (GUS), fosfinotricin N-acetila transferase (PAT, BAR), neomicin fosfotransferase, β-lactamase, catecol dioxigenase, α-amilase, tirosinase, β-galactosidase, luciferase, aequorin, EPSP sintase, nitrilase, acetolactato sintase (ALS), dihidrofolato redutase (DHFR), dalapon dehalogenase e antranilato sintase. 8. O vetor de 4, no qual a quinta sequência compreende sequências que codificam uma outra proteína do que um marcador selecionável. 9. O vetor de 4, no qual a quinta sequência compreende uma ou mais sequências regulatórias transcricionais. 10. O vetor de 4, no qual a quinta sequência compreende sequências que codificam uma porção de uma proteína. 11.0 vetor de 10, no qual as sequências que codificam a porção da proteína compreendem sequências homólogas a sequências cromossômicas. 12. O vetor de 4, no qual a quinta sequência compreende uma equivalente tipo selvagem de uma sequência cromossômica mutante. 13. O vetor de 4, no qual a quinta sequência compreende uma equivalente mutante de uma sequência cromossômica tipo selvagem. 14. O vetor de qualquer de 1 a 13, no qual a primeira sequência tem pelo menos 35% de homologia à terceira sequência. 15. O vetor de qualquer de 1 a 14, no qual a segunda sequência tem pelo menos 35% de homologia à quarta sequência. 16. O vetor de 14, no qual a segunda sequência tem pelo menos 35% de homologia à quarta sequência. 17. Um método para introdução de uma sequência exógena no genoma de uma célula de planta, o método compreendendo as etapas de: (a) contactar a célula com um vetor-alvo de qualquer de 1 a 16; e (b) expressar uma ou mais nucleases na célula, no qual a uma ou mais nucleases clivam DNA cromossômico dentro de pares de 3 kilobases de qualquer das terceira ou quarta sequências; tal que a divagem de DNA cromossômico na etapa (b) estimula a incorporação do vetor-alvo no genoma por recombinação homóloga. 18. Um método de 17, no qual a uma ou mais nucleases são fusões entre o domínio de divagem de uma endonuclease de restrição Tipo IIS e um domínio de ligação de dedo de zinco projetado. 19. Um método para expressar uma proteína em uma célula de planta, o método compreendendo as etapas de: (a) contactar a célula com um vetor-alvo de 8; e (b) expressar uma ou mais nucleases na célula, no qual a uma ou mais nucleases clivam DNA cromossômico dentro de pares de 3 kilobases de qualquer das terceira ou quarta sequências; tal que a divagem de DNA cromossômico na etapa (b) estimula a incorporação do vetor-alvo no genoma por recombinação homóloga. 20. O método de 19, no qual a uma ou mais nucleases são fusões entre o domínio de divagem de uma endonuclease de restrição Tipo IIS e um domínio de ligação de dedo de zinco projetado. 21. Uma célula de planta transgênica obtida de acordo com o método de 17, 18, 19 ou 20. 22. Uma planta compreendendo uma célula de planta transgênica de acordo com 21. 23. Um método para recombinação homóloga intramolecular no genoma de uma célula, o método compreendendo as etapas de: (a) provisão de um segmento de DNA compreendendo uma primeira sequência que é homóloga a uma segunda sequência; e (b) contactar referido segmento de DNA com uma nuclease, no qual a nuclease cliva o segmento de DNA em uma terceira sequência. 24. Um método de 23, no qual o segmento de DNA é endógeno à célula. 25. O método de 23 ou 24, no qual a recombinação homóloga ocorre em um cromossoma. 26. O método de 25, no qual DNA entre as primeira e segunda sequências é retirado do cromossoma. 27. O método de qualquer de 23, 24, 25 ou 26, no qual a terceira sequência é única no genoma. 28. O método de qualquer de 23 a 26, no qual a célula é uma célula de planta. 29. O método de qualquer de 23 a 28, no qual a nuclease é um par de proteínas de fusão, no qual cada proteína de fusão é uma fusão entre o domínio de divagem de uma endonuclease de restrição Tipo IIS e um domínio de ligação de dedo de zinco projetado. 30. O método de qualquer de 23 a 29, no qual a terceira sequência é pelo menos 100 pares bases a partir da primeira sequência. 31. O método de qualquer de 23 a 30, no qual a terceira sequência é pelo menos 100 pares de base a partir da segunda sequência. 32. O método de qualquer de 23 a 31, no qual a terceira sequência ocorre entre as primeira e segunda sequências. 33. O método de qualquer de 23 a 32, no qual uma das primeira ou segunda sequências é exógena ao organismo. 34. O método de qualquer de 23 a 32, no qual ambas das primeira e segunda sequências são exógenas ao organismo. 35. O método de 26, no qual as sequências retiradas do cromossoma codificam toda ou parte de um marcador selecionável. 36. O método de 35, no qual o marcador selecionável é selecionado a partir do grupo consistindo em proteína fluorescente verde (GFP), β-glucuronidase (GUS), fosfinotricin N-acetila transferase (PAT, BAR), neomicin fosfotransferase, β-lactamase, catecol dioxigenase, α-amilase, tirosinase, β-galactosidase, luciferase, aequorin, EPSP sintase, nitrilase, acetolactato sintase (ALS), dihidrofolato redutase (DHFR), dalapon dehalogenase e antranilato sintase. 37. O método de 26, no qual o DNA retirado é substituído por uma sequência exógena, o método compreendendo adicionalmente: introdução de um polinucleotídeo na célula, no qual o polinucleotídeo compreende: (a) quarta e quinta sequências, no qual a quarta sequência é homóloga às sequências não-retiradas em proximidade à primeira sequência, e a quinta sequência é homóloga às sequências não-retiradas em proximidade à segunda sequência; e (b) a sequência exógena. 38. O método de 37, no qual a sequência exógena é um marcador selecionável. 39. O método de 38, no qual o marcador selecionável é selecionado a partir do grupo consistindo em proteína fluorescente verde (GFP), β-glucuronidase (GUS), fosfinotricin N-acetila transferase (PAT, BAR), neomicin fosfotransferase, β-lactamase, catecol dioxigenase, α-amilase, tirosinase, β-galactosidase, luciferase, aequorin, EPSP sintase, nitrilase, acetolactato sintase (ALS), dihidrofolato redutase (DHFR), dalapon dehalogenase e antranilato sintase. 40. O método de qualquer um de 23 a 39, no qual a sequência exógena codifica uma proteína diferente de um marcador selecionável. 41. O método de qualquer um de 23 a 39, no qual a sequência exógena codifica um RNA. 42. O método de 41, no qual o RNA é um siRNA. 43. Um vetor-alvo compreendendo: (a) primeira e segunda sequências de codificação; e (b) primeira, segunda e terceira sequências-alvo; no qual as sequências são dispostas na ordem: primeira sequência-alvo, primeira sequência de codificação, segunda sequência-alvo, segunda sequência de codificação, terceira sequência-alvo; adicionalmente no qual a primeira sequência-alvo é homóloga a uma primeira sequência cromossômica, e a terceira sequência-alvo é homóloga a uma segunda sequência cromossômica. 44. O vetor de 43, no qual a primeira sequência de codificação codifica um marcador selecionável. 45. O vetor de 43 ou 44, no qual a segunda sequência de codificação codifica um marcador selecionável. 46. O vetor de 43 ou 45, no qual a primeira sequência de codificação codifica uma proteína que não é um marcador selecionável. 47. O vetor de qualquer um de 43, 44 ou 46, no qual a segunda sequência de codificação codifica uma proteína que não é um marcador selecionável. 48. O vetor de qualquer um de 43 a 47, no qual as primeira e segunda sequências cromossômicas são sequências endógenas cromossômicas. 49. O vetor de qualquer um de 43 a 48, compreendendo adicionalmente uma ou mais repetições da primeira sequência-alvo. 50. O vetor de qualquer um de 43 a 49, compreendendo adicionalmente uma ou mais repetições da segunda sequência-alvo. 51. O vetor de qualquer um de 43 a 50, compreendendo adicionalmente uma ou mais repetições da terceira sequência-alvo. 52. Um método para introdução de uma sequência exógena no genoma de uma célula de planta, o método compreendendo as etapas de: (a) contactar a célula com um vetor-alvo de acordo com qualquer de 43 a 51; e (b) expressar uma ou mais nucleases na célula, no qual a uma ou mais nucleases clivam DNA cromossômico dentro de entre pares de 0,1 e 3 kilobases de qualquer das primeira ou segunda sequências cromossômicas; tal que a divagem de DNA cromossômico na etapa (b) estimula a incorporação do vetor-alvo no genoma por recombinação homóloga. 53. O método de 52, no qual a uma ou mais nucleases são fusões entre o domínio de divagem de uma endonuclease de restrição Tipo IIS e um domínio de ligação de dedo de zinco projetado. 54. Um método para expressar uma proteína em uma célula de planta, o método compreendendo as etapas de: (a) contactar a célula com um vetor-alvo de acordo com qualquer de 43 a 51; e (b) expressar uma ou mais nucleases na célula, no qual a uma ou mais nucleases cliva DNA cromossômico dentro de entre pares de 0,1 e 3 kilobases de qualquer das primeira ou segunda sequências cromossômicas; tal que a divagem de DNA cromossômico na etapa (b) estimula a incorporação do vetor-alvo no genoma por recombinação homóloga. 55. O método de 54, no qual a uma ou mais nucleases são fusões entre o domínio de divagem de uma endonuclease de restrição Tipo IIS e um domínio de ligação de dedo de zinco projetado. 56. Uma célula de planta transgênica obtida de acordo com o método de 52 ou 53. 57. Uma planta compreendendo uma célula de planta transgênica de acordo com 56. 58. Um método para retirar sequências a partir do genoma de uma célula de planta transgênica no qual o método compreende: (a) provisão de uma célula de planta transgênica de acordo com a 56; e (b) expressão das primeira e segunda nucleases na célula, no qual a primeira nuclease cliva na primeira sequência-alvo, e a segunda nuclease cliva na segunda sequência-alvo. 59. Um método para retirada de sequências a partir do genoma de uma célula de planta transgênica no qual o método compreende: (a) provisão de uma célula de planta transgênica de acordo com 56; e (b) expressão das primeira e segunda nucleases na célula, no qual a primeira nuclease cliva na segunda sequência-alvo, e a segunda nuclease cliva na terceira sequência-alvo. 60. Um método para retirada de sequências a partir do genoma de uma célula de planta transgênica no qual o método compreende: (a) provisão de uma célula de planta transgênica de acordo com 56; e (b) expressão das primeira e segunda nucleases na célula, no qual a primeira nuclease cliva na primeira sequência-alvo, e a segunda nuclease cliva na terceira sequência-alvo.Accordingly, the present disclosure involves, but is not limited to, the following numbered embodiments: 1. A donor vector comprising first and second DNA sequences; wherein the first sequence is homologous to a third sequence, and the second sequence is homologous to a fourth sequence; wherein the third and fourth sequences are chromosomal DNA sequences; and wherein the edges near the third and fourth sequences are separated by at least 1 pair of nucleotides. 2. The vector of 1, in which the third and fourth sequences are endogenous sequences. 3. The vector of 1 or 2, wherein at least one of the first or second sequences is 100 nucleotides in length. The vector of any 1 to 3, further comprising a fifth sequence, in which the fifth sequence: (a) is interposed between the first and second sequences; and (b) is an exogenous sequence. 5. The vector of 4, in which the fifth sequence has a size of at least 1 base pair. 6. The vector of 4, wherein the fifth sequence comprises sequences encoding a selectable marker. 7. The vector of 6, in which the selectable marker is selected from the group consisting of green fluorescent protein (GFP), β-glucuronidase (GUS), fosfinotricin N-acetyl transferase (PAT, BAR), neomycin phosphotransferase, β- lactamase, catechol dioxigenase, α-amylase, tyrosinase, β-galactosidase, luciferase, aequorin, EPSP synthase, nitrilase, acetolactate synthase (ALS), dihydrofolate reductase (DHFR), dalapon dehalogenase and anthranilate synthase. 8. The vector of 4, wherein the fifth sequence comprises sequences encoding a protein other than a selectable marker. 9. The vector of 4, wherein the fifth sequence comprises one or more transcriptional regulatory sequences. 10. The vector of 4, wherein the fifth sequence comprises sequences encoding a portion of a protein. 11 is a vector of 10, wherein the sequences encoding the protein portion comprise sequences homologous to chromosomal sequences. 12. The vector of 4, wherein the fifth sequence comprises a wild-type equivalent of a mutant chromosomal sequence. 13. The vector of 4, wherein the fifth sequence comprises a mutant equivalent of a wild-type chromosomal sequence. 14. The vector of any one from 1 to 13, wherein the first sequence is at least 35% homologous to the third sequence. 15. The vector of any one from 1 to 14, wherein the second sequence is at least 35% homologous to the fourth sequence. 16. The vector of 14, in which the second sequence is at least 35% homologous to the fourth sequence. A method for introducing an exogenous sequence into the genome of a plant cell, the method comprising the steps of: (a) contacting the cell with a target vector of any one from 1 to 16; and (b) expressing one or more nucleases in the cell, wherein one or more nucleases cleave chromosomal DNA within 3 kilobase pairs of any of the third or fourth sequences; such that chromosomal DNA splitting in step (b) stimulates incorporation of the target vector into the genome by homologous recombination. 18. A method of 17, wherein one or more nucleases are fusions between the dividing domain of an IIS Type restriction endonuclease and a projected zinc finger binding domain. 19. A method for expressing a protein in a plant cell, the method comprising the steps of: (a) contacting the cell with a target vector of 8; and (b) expressing one or more nucleases in the cell, wherein one or more nucleases cleave chromosomal DNA within 3 kilobase pairs of any of the third or fourth sequences; such that chromosomal DNA splitting in step (b) stimulates incorporation of the target vector into the genome by homologous recombination. 20. The method of 19, wherein one or more nucleases are fusions between the dividing domain of an IIS Type restriction endonuclease and a projected zinc finger binding domain. 21. A transgenic plant cell obtained according to the method of 17, 18, 19 or 20. 22. A plant comprising a transgenic plant cell according to 21. 23. A method for homologous intramolecular homologous recombination in the genome of a cell the method comprising the steps of: (a) providing a DNA segment comprising a first sequence that is homologous to a second sequence; and (b) contacting said DNA segment with a nuclease, wherein the nuclease cleaves the DNA segment into a third sequence. 24. A method of 23, in which the DNA segment is endogenous to the cell. 25. The 23 or 24 method, in which homologous recombination occurs on a chromosome. 26. The method of 25, in which DNA between the first and second sequences is taken from the chromosome. 27. The method of any of 23, 24, 25 or 26, wherein the third sequence is unique in the genome. 28. The method of any of 23 to 26, wherein the cell is a plant cell. 29. The method of any of 23 to 28, wherein the nuclease is a pair of fusion proteins, wherein each fusion protein is a fusion between the dividing domain of an IIS Type restriction endonuclease and a binding domain of Zinc finger designed. 30. The method of any of 23 to 29, wherein the third sequence is at least 100 base pairs from the first sequence. 31. The method of any of 23 to 30, wherein the third sequence is at least 100 base pairs from the second sequence. 32. The method of any of 23 to 31, wherein the third sequence occurs between the first and second sequences. 33. The method of either 23 to 32, wherein one of the first or second sequences is exogenous to the organism. 34. The method of any of 23 to 32, wherein both of the first and second sequences are exogenous to the organism. 35. The method of 26, wherein sequences taken from the chromosome encode all or part of a selectable marker. 36. The 35 method, in which the selectable marker is selected from the group consisting of green fluorescent protein (GFP), β-glucuronidase (GUS), fosfinotricin N-acetyl transferase (PAT, BAR), neomycin phosphotransferase, β- lactamase, catechol dioxigenase, α-amylase, tyrosinase, β-galactosidase, luciferase, aequorin, EPSP synthase, nitrilase, acetolactate synthase (ALS), dihydrofolate reductase (DHFR), dalapon dehalogenase and anthranilate synthase. 37. The method of 26, wherein the removed DNA is replaced by an exogenous sequence, the method further comprising: introducing a polynucleotide into the cell, wherein the polynucleotide comprises: (a) fourth and fifth sequences, wherein the fourth sequence is homologous to non-withdrawn sequences in proximity to the first sequence, and the fifth sequence is homologous to non-withdrawn sequences in proximity to the second sequence; and (b) the exogenous sequence. 38. The method of 37, wherein the exogenous sequence is a selectable marker. 39. The 38 method, in which the selectable marker is selected from the group consisting of green fluorescent protein (GFP), β-glucuronidase (GUS), fosfinotricin N-acetyl transferase (PAT, BAR), neomycin phosphotransferase, β- lactamase, catechol dioxigenase, α-amylase, tyrosinase, β-galactosidase, luciferase, aequorin, EPSP synthase, nitrilase, acetolactate synthase (ALS), dihydrofolate reductase (DHFR), dalapon dehalogenase and anthranilate synthase. 40. The method of any one from 23 to 39, wherein the exogenous sequence encodes a protein other than a selectable marker. 41. The method of anyone from 23 to 39, wherein the exogenous sequence encodes an RNA. 42. The method of 41, wherein RNA is an siRNA. 43. A target vector comprising: (a) first and second coding sequences; and (b) first, second and third target sequences; wherein the sequences are arranged in the order: first target sequence, first coding sequence, second target sequence, second coding sequence, third target sequence; additionally in which the first target sequence is homologous to a first chromosome sequence, and the third target sequence is homologous to a second chromosome sequence. 44. The vector 43, in which the first coding sequence encodes a selectable marker. 45. The vector 43 or 44, in which the second coding sequence encodes a selectable marker. 46. The 43 or 45 vector, in which the first coding sequence encodes a protein that is not a selectable marker. 47. The vector of either 43, 44 or 46, wherein the second coding sequence encodes a protein that is not a selectable marker. 48. The vector of any one from 43 to 47, wherein the first and second chromosomal sequences are endogenous chromosomal sequences. 49. The vector of any one of 43 to 48, further comprising one or more repeats of the first target sequence. 50. The vector of any one of 43 to 49, further comprising one or more repeats of the second target sequence. 51. The vector of any one from 43 to 50, further comprising one or more repeats of the third target sequence. 52. A method for introducing an exogenous sequence into the genome of a plant cell, the method comprising the steps of: (a) contacting the cell with a target vector according to any of 43 to 51; and (b) expressing one or more nucleases in the cell, wherein one or more nucleases cleave chromosomal DNA within between 0.1 and 3 kilobase pairs of any of the first or second chromosome sequences; such that chromosomal DNA splitting in step (b) stimulates incorporation of the target vector into the genome by homologous recombination. 53. The method of 52, wherein one or more nucleases are fusions between the dividing domain of an IIS Type restriction endonuclease and a projected zinc finger binding domain. 54. A method for expressing a protein in a plant cell, the method comprising the steps of: (a) contacting the cell with a target vector according to any of 43 to 51; and (b) expressing one or more nucleases in the cell, wherein one or more nucleases cleaves chromosomal DNA within between 0.1 and 3 kilobase pairs of any of the first or second chromosomal sequences; such that chromosomal DNA splitting in step (b) stimulates incorporation of the target vector into the genome by homologous recombination. 55. The method of 54, wherein one or more nucleases are fusions between the dividing domain of an IIS Type restriction endonuclease and a projected zinc finger binding domain. 56. A transgenic plant cell obtained according to the method of 52 or 53. 57. A plant comprising a transgenic plant cell according to 56. 58. A method for sequencing from the genome of a transgenic plant cell wherein the method comprises: (a) providing a transgenic plant cell according to 56; and (b) expressing the first and second nucleases in the cell, in which the first nuclease cleaves in the first target sequence and the second nuclease cleaves in the second target sequence. 59. A method for sequencing from the genome of a transgenic plant cell in which the method comprises: (a) providing a transgenic plant cell according to 56; and (b) expressing the first and second nucleases in the cell, wherein the first nuclease cleaves in the second target sequence and the second nuclease cleaves in the third target sequence. 60. A method for sequencing from the genome of a transgenic plant cell in which the method comprises: (a) providing a transgenic plant cell according to 56; and (b) expressing the first and second nucleases in the cell, wherein the first nuclease cleaves at the first target sequence and the second nuclease cleaves at the third target sequence.

BREVE DESCRIÇÃO DOS DESENHOSBRIEF DESCRIPTION OF DRAWINGS

[0028] Figuras 1A e 1B são representações esquemáticas da construção-alvo designada pDAB1585. A figura 1A é uma representação linear de vários elementos da construção. Â figura 1B é uma representação da construção circular [0029] Figuras 2A e 2B representam ZFNs exemplares e seus locais de alvo. A figura 2A representa as ZFNs e as regiões de ligação, A figura 2B representa os locais-alvo.Figures 1A and 1B are schematic representations of the target building designated pDAB1585. Figure 1A is a linear representation of various elements of the construction. Figure 1B is a representation of the circular construction. Figures 2A and 2B represent exemplary ZFNs and their target sites. Figure 2A represents the ZFNs and binding regions. Figure 2B represents the target sites.

[0030] Figura 3 é uma representação esquemática do plasmídeo PDAB1400, [0031] Figura 4 é uma representação esquemática do plasmídeo pDAB782.Figure 3 is a schematic representation of plasmid PDAB1400, Figure 4 is a schematic representation of plasmid pDAB782.

[0032] Figura 5 é uma representação esquemática do plasmídeo pDAB1582.Figure 5 is a schematic representation of plasmid pDAB1582.

[0033] Figura 6 é uma representação esquemática do plasmídeo PDAB354.Figure 6 is a schematic representation of plasmid PDAB354.

[0034] Figura 7 é uma representação esquemática do plasmídeo PDAB1583.Figure 7 is a schematic representation of plasmid PDAB1583.

[0035] Figura 8 é uma representação esquemática do plasmídeo pDAB2407.Figure 8 is a schematic representation of plasmid pDAB2407.

[0036] Figura 9 é uma representação esquemática do plasmídeo pDAB1584.Figure 9 is a schematic representation of plasmid pDAB1584.

[0037] Figura 10 é uma representação esquemática do plasmídeo pDAB2418.Figure 10 is a schematic representation of plasmid pDAB2418.

[0038] Figura 11 é uma representação esquemática do plasmídeo pDAB4045.Figure 11 is a schematic representation of plasmid pDAB4045.

[0039] Figura 12 é uma representação esquemática do plasmídeo pDAB1575.Figure 12 is a schematic representation of plasmid pDAB1575.

[0040] Figura 13 é uma representação esquemática do plasmídeo pDAB1577.Figure 13 is a schematic representation of plasmid pDAB1577.

[0041] Figura 14 é uma representação esquemática do plasmídeo pDAB1579.Figure 14 is a schematic representation of plasmid pDAB1579.

[0042] Figura 15 é uma representação esquemática do plasmídeo pDAB1580.Figure 15 is a schematic representation of plasmid pDAB1580.

[0043] Figura 16 é uma representação esquemática do plasmídeo pDAB3401.Figure 16 is a schematic representation of plasmid pDAB3401.

[0044] Figura 17 é uma representação esquemática do plasmídeo pDAB1570.Figure 17 is a schematic representation of plasmid pDAB1570.

[0045] Figura 18 é uma representação esquemática do plasmídeo pDAB1572.Figure 18 is a schematic representation of plasmid pDAB1572.

[0046] Figura 19 é uma representação esquemática do plasmídeo pDAB4003.Figure 19 is a schematic representation of plasmid pDAB4003.

[0047] Figura 20 é uma representação esquemática do plasmídeo pDAB1571.Figure 20 is a schematic representation of plasmid pDAB1571.

[0048] Figura 21 é uma representação esquemática do plasmídeo pDAB7204.Figure 21 is a schematic representation of plasmid pDAB7204.

[0049] Figura 22 é uma representação esquemática do plasmídeo pDAB1573.Figure 22 is a schematic representation of plasmid pDAB1573.

[0050] Figura 23 é uma representação esquemática do plasmídeo pDAB1574.Figure 23 is a schematic representation of plasmid pDAB1574.

[0051] Figura 24 é uma representação esquemática do plasmídeo pDAB1581.Figure 24 is a schematic representation of plasmid pDAB1581.

[0052] Figura 25 é uma representação esquemática do plasmídeo pDAB1576.Figure 25 is a schematic representation of plasmid pDAB1576.

[0053] Figuras 26A e 26B são representações esquemáticas do vetor de plasmídeo alvo designado pDAB1600. A figura 26A é uma representação linear de vários elementos do plasmídeo. A figura 26B é uma representação do plasmídeo circular.Figures 26A and 26B are schematic representations of the target plasmid vector designated pDAB1600. Figure 26A is a linear representation of various elements of the plasmid. Figure 26B is a representation of the circular plasmid.

[0054] Figura 27 é uma representação esquemática do plasmídeo pDAB7002.Figure 27 is a schematic representation of plasmid pDAB7002.

[0055] Figura 28 é uma representação esquemática do plasmídeo pDAB7025.Figure 28 is a schematic representation of plasmid pDAB7025.

[0056] Figura 29 é uma representação esquemática do plasmídeo pDAB1591.Figure 29 is a schematic representation of plasmid pDAB1591.

[0057] Figura 30 é uma representação esquemática do plasmídeo pcDNA3.1-IL1 -LO-Fokl.Figure 30 is a schematic representation of plasmid pcDNA3.1-IL1 -LO-Fokl.

[0058] Figura 31 é uma representação esquemática do plasmídeo pcDNA3.1 -SCD27-L0-Fokl.Figure 31 is a schematic representation of plasmid pcDNA3.1 -CD27-L0-Fokl.

[0059] Figura 32 é uma representação esquemática do plasmídeo pDAB1592.Figure 32 is a schematic representation of plasmid pDAB1592.

[0060] Figura 33 é uma representação esquemática do plasmídeo pDAB1594.Figure 33 is a schematic representation of plasmid pDAB1594.

[0061] Figuras 34 A, B e C são representações esquemáticas de plasmídeos pDAB1596 e pDAB1598. A figura 34A é um esquema dos plasmídeos linearizados. A figura 34B mostra pDAB1596. figura 34C mostra pDAB1598.Figures 34 A, B and C are schematic representations of plasmids pDAB1596 and pDAB1598. Figure 34A is a schematic of linearized plasmids. Figure 34B shows pDAB1596. Figure 34C shows pDAB1598.

[0062] Figura 35 é uma representação esquemática do plasmídeo pDAB1577.Figure 35 is a schematic representation of plasmid pDAB1577.

[0063] Figura 36 é uma representação esquemática do plasmídeo pDAB1578.Figure 36 is a schematic representation of plasmid pDAB1578.

[0064] Figuras 37A e B são representações esquemáticas de plasmídeo pDAB1601. A figura 37A mostra vários elementos na forma linear. A figura 37B mostra o plasmídeo circular.Figures 37A and B are schematic representations of plasmid pDAB1601. Figure 37A shows various elements in linear form. Figure 37B shows the circular plasmid.

[0065] Figura 38 é um esquema representando recombinação homóloga inter-cromossômica prognosticada estimulada pela fusão de IL-1 ZFN-Fokl.Figure 38 is a schematic depicting predicted interchromosomal homologous recombination stimulated by IL-1 ZFN-Fokl fusion.

[0066] Figura 39 é um esquema representando uma recombinação homóloga inter-cromossômica prognosticada estimulada pela fusão de Scd27 ZFN-Fokl.Figure 39 is a scheme depicting a predicted interchromosomal homologous recombination stimulated by the Scd27 ZFN-Fokl fusion.

[0067] Figura 40 mostra análise de PCR dos recombinantes. As raias 1-20 mostram eventos de recombinação homóloga a partir da transformação de NT1-240 com construção de proteína de fusão SCD27-Fokl. As raias designadas 21 e 22 mostram eventos de recombinação homóloga a partir da transformação de NT1-240 com construção de proteína de fusão SCD27-Fokl. As raias de controle são mostradas nas 3 raias mais a esquerda.Figure 40 shows PCR analysis of recombinants. Lanes 1-20 show homologous recombination events from the transformation of NT1-240 with SCD27-Fokl fusion protein construct. The designated lanes 21 and 22 show homologous recombination events from the transformation of NT1-240 with SCD27-Fokl fusion protein construct. Control lanes are shown in the left 3 lanes.

[0068] Figura 41 mostra análise de manchamento de Southern dos recombinantes. As raias designadas 1-20 mostram eventos de recombinação homóloga a partir da transformação de NT1-240 com construção de proteína de fusão SCD27-Fokl. As raias designadas 21 e 22 mostram eventos de recombinação homóloga a partir da transformação de NT1-240 com construção de proteína de fusão SCD27-Fokl. As raias de controle são mostradas nas 2 linhas mais a esquerda.Figure 41 shows Southern blot analysis of recombinants. The designated lanes 1-20 show homologous recombination events from the transformation of NT1-240 with SCD27-Fokl fusion protein construct. The designated lanes 21 and 22 show homologous recombination events from the transformation of NT1-240 with SCD27-Fokl fusion protein construct. The control lanes are shown on the leftmost 2 lines.

[0069] Figura 42 é um esquema representando recombinação homóloga intercromossômica prognosticada estimulada pela fusão de IL-1 ZFN-Fokl.Figure 42 is a scheme depicting predicted interchromosomal homologous recombination stimulated by IL-1 ZFN-Fokl fusion.

[0070] Figura 43 é análise de PCR confirmando que GFP é reconstituído em tecidos fluorescentes expressando na proteína de fusão de IL-1-Fokl.Figure 43 is PCR analysis confirming that GFP is reconstituted in fluorescent tissues expressing in the IL-1-Fokl fusion protein.

[0071] Figura 44 é uma representação esquemãtica de plasmídeo pSB11.Fig. 44 is a schematic representation of plasmid pSB11.

[0072] Figura 45 é uma representação esquemática de plasmídeo pSBl [0073] Figura 46 é uma representação esquemática do plasmídeo pDAB3872.Figure 45 is a schematic representation of plasmid pSB1. Figure 46 is a schematic representation of plasmid pDAB3872.

[0074] Figura 47 é uma representação esquemática de plasmídeo PDAB4365, DESCRIÇÃQ DETALHADAFigure 47 is a schematic representation of plasmid PDAB4365, DETAILED DESCRIPTION

[0075] Aqui revelados são composições e métodos úteis para clivagem-alvo de célula de cromatina celular de planta e para alteração alvo de uma célula de sequência de nucleotídeo celular de planta, por exemplo, por clivagem-alvo seguida por recombinação homóloga intracromossômica, ou por clivagem-alvo seguida por recombi nação homóloga entre um polinucleotídeo exógeno (compreendendo uma ou mais regiões de homologia com sequência de nucleotídeo celular), e uma sequência genômica.Disclosed herein are compositions and methods useful for target cleavage of plant cell chromatin cell and for target alteration of a plant cell nucleotide sequence cell, for example, by target cleavage followed by intrachromosomal homologous recombination, or by target cleavage followed by homologous recombination between an exogenous polynucleotide (comprising one or more cell nucleotide sequence homology regions), and a genomic sequence.

[0076] Sequências genòrrticas incluem aquelas presentes nos cromossomas, eptssomas, genomas organelares (por exemplo, mitocôndria, cloroplastos), cromossomas artificiais, e qualquer outro tipo de ácido nucléico presente em uma célula, tal como, por exemplo, sequências amplificadas, cromossomas de minuto duplos, e os genomas de bactéria endógena ou de infecção, e vírus. Sequências genômicas podem ser normais (Isto é, tipo selvagem) ou mutante; sequências mutantes podem compreender, por exemplo, inserções, retiradas, translocações, rearranjos, e/ou mutações de ponto. Uma sequência genômica pode também compreender um de um número de alelos diferentes.Genomic sequences include those present on chromosomes, eptsomes, organelle genomes (e.g., mitochondria, chloroplasts), artificial chromosomes, and any other type of nucleic acid present in a cell, such as, for example, amplified sequences, chromosomes of double minutes, and the genomes of endogenous bacteria or infection, and viruses. Genomic sequences may be normal (ie, wild type) or mutant; Mutant sequences may comprise, for example, insertions, withdrawals, translocations, rearrangements, and / or point mutations. A genomic sequence may also comprise one of a number of different alleles.

[6677] Composições úteis para clivagem-alvo e recombi nação incluem proteínas de fusão compreendendo um domínio de divagem (ou um meio-domínio de divagem) e um domínio de ligação de dedo de zinco, polinucleotídeos que codificam estas proteínas e combinações de polipeptídeos e polinucleotídeos que codificam polipeptídeo. Um domínio de ligação de dedo de zinco pode compreender um ou mais apêndices de zinco (por exemplo, 2, 3, 4, 5, 6, 7, 8, 9 ou mais apêndices de zinco), e pode ser projetado para se ligar a qualquer sequência genômica. Desse modo, pela identificação de uma região genômica alvo de interesse na qual divagem ou recombinação é desejada, pode-se, de acordo com os métodos aqui revelados, construir uma ou mais proteínas de fusão compreendendo um domínio de divagem (ou meio-domínio de divagem) e um domínio de dedo de zinco projetado para reconhecer uma sequência-alvo na referida região genômica. A presença de tal proteína de fusão (ou proteínas) em uma célula resultará na ligação da(s) proteína(s) de fusão a seu (seus) local(is) de ligação e divagem dentro ou perto de referida região genômica. Além disso, se um polinucleotídeo exógeno homólogo à região genômica está também presente em tal célula, recombinação homóloga ocorre a uma alta taxa entre a região genômica e o polinucleotídeo exógeno.[6677] Compositions useful for target cleavage and recombination include fusion proteins comprising a dividing domain (or a dividing half-domain) and a zinc finger binding domain, polynucleotides encoding these proteins, and combinations of polypeptides and polynucleotides encoding polypeptide. A zinc finger binding domain may comprise one or more zinc appendages (e.g., 2, 3, 4, 5, 6, 7, 8, 9 or more zinc appendages), and may be designed to bind to any genomic sequence. Thus, by identifying a target genomic region of interest in which dividing or recombination is desired, one may, according to the methods disclosed herein, construct one or more fusion proteins comprising a dividing domain (or half-domain). diving) and a zinc finger domain designed to recognize a target sequence in said genomic region. The presence of such fusion protein (or proteins) in a cell will result in the fusion protein (s) binding to its binding and dividing site (s) within or near said genomic region. In addition, if an exogenous polynucleotide homologous to the genomic region is also present in such a cell, homologous recombination occurs at a high rate between the genomic region and the exogenous polynucleotide.

Geral [0078] A prática dos métodos, bem como preparação e uso das composições aqui reveladas, emprega, a menos que de outro modo indicado, técnicas convencionais em biologia molecular, bioquímica, estrutura de cromatina e análise, química computacional, cultura de célula, DNA recombinante e campos relacionados conforme estão dentro do versado na técnica. Estas técnicas são totalmente explanadas na literatura. Ver, por exemplo, Sambrook et al. MOLECULAR CLONING: A LABORATORY MANUAL, Segunda edição, Cold Spring Harbor Laboratory Press, 1989, e Terceira edição, 2001; Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987, e atualizações periódicas; a série METHODS IN ENZYMOLOGY, Academic Press, San Diego; Wolffe, CHROMATIN ESTRUTURA AND FUNCTION, Terceira edição, Academic Press, San Diego, 1998; METHODS IN ENZYMOLOGY, VoL 304, "Chromatin" (P.M. Wassarman e A, P. Wolffe, eds.), Academic Press, San Diego, 1999; e METHODS IN MOLECULAR BIOLOGY, VoL 119, "Chromatin Protocols" {P.B. Becker, ed.) Humana Press, Totowa, 1999, Definições [0079] Os termos "ácido nuciéico", "polinucleotídeo", e "oligonucleotídeo" são usados permutável mente, e se referem a um polímero de deoxirribonucleotídeo ou ribonucleotídeo, em conformação linear ou circular, e na forma de filamento simples ou dupla. Para a proposta da presente descrição, estes termos não são construídos como limitantes com relação ao comprimento de um polímero. Os termos podem envolver análogos conhecidos de nucleotídeos naturais, bem como nucleotídeos que são modificados na base, porções de açúcar e/ou fosfato (por exemplo, suportes de fosforotioato). Em geral, um análogo de um nucleotídeo particular tem a mesma especificidade emparelhada de base; isto é, um análogo de A fará par-base com T.General Practice of the methods, as well as preparation and use of the compositions disclosed herein, employ, unless otherwise indicated, conventional techniques in molecular biology, biochemistry, chromatin structure and analysis, computational chemistry, cell culture, Recombinant DNA and related fields as are within the skill in the art. These techniques are fully explained in the literature. See, for example, Sambrook et al. MOLECULAR CLONING: A LABORATORY MANUAL, Second Edition, Cold Spring Harbor Laboratory Press, 1989, and Third Edition, 2001; Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987, and periodic updates; the METHODS IN ENZYMOLOGY series, Academic Press, San Diego; Wolffe, CHROMATIN STRUCTURE AND FUNCTION, Third Edition, Academic Press, San Diego, 1998; METHODS IN ENZYMOLOGY, Vol. 304, Chromatin (P.M. Wassarman and A, P. Wolffe, eds.), Academic Press, San Diego, 1999; and METHODS IN MOLECULAR BIOLOGY, Vol 119, "Chromatin Protocols" {P.B. Becker, ed.) Humana Press, Totowa, 1999, Definitions The terms "nucleic acid", "polynucleotide", and "oligonucleotide" are used interchangeably, and refer to a linearly conforming deoxyribonucleotide or ribonucleotide polymer or circular, and in the form of single or double filament. For the purpose of the present disclosure, these terms are not construed as limiting with respect to the length of a polymer. The terms may involve known analogs of natural nucleotides as well as nucleotides that are modified on the base, sugar and / or phosphate moieties (e.g., phosphorothioate supports). In general, an analog of a particular nucleotide has the same base paired specificity; that is, an analog of A will pair with T.

[0080] Os termos "polipeptídeo", "peptídeo" e "proteína11 são usados permutável mente para se referirem a um polímero de resíduos de aminoácido. O termo também se aplica a polímeros de aminoácido em que um ou mais aminoácidos são análogos químicos ou derivados modificados de aminoácidos que ocorrem naturalmente correspondentes.The terms "polypeptide", "peptide" and "protein11" are interchangeably used to refer to an amino acid residue polymer.The term also applies to amino acid polymers wherein one or more amino acids are chemical analogs or derivatives. corresponding naturally occurring amino acids.

[0081] "Ligação" se refere a uma interação não-covalente de sequência específica entre macromoléculas (por exemplo, entre uma proteína e um ácido nuciéico). Nem todos os componentes de uma interação de ligação necessitam ser sequência específica (por exemplo, contata com resíduos de fosfato em um suporte de DNA), considerando-se que a interação como um todo é sequência específica. Tais interações são geralmente caracterizadas por uma constante de dissociação (Kd) de 10"6 M"1, ou inferior. "Afinidade" se refere à resistência de ligação: afinidade de ligação aumentada sendo correlacionada com um Kd inferior."Binding" refers to a non-covalent sequence-specific interaction between macromolecules (e.g., between a protein and a nucleic acid). Not all components of a binding interaction need to be sequence specific (eg, contact phosphate residues on a DNA support), considering that the interaction as a whole is sequence specific. Such interactions are generally characterized by a dissociation constant (Kd) of 10 "6 M" 1 or less. "Affinity" refers to binding resistance: increased binding affinity being correlated with a lower Kd.

[0082] Uma "proteína de ligação" é uma proteína que é capaz de se ligar não-covalentemente a outra molécula. Uma proteína de ligação pode se ligar a, por exemplo, uma molécula de DNA (uma proteína de ligação de DNA), uma molécula de RNA (uma proteína de ligação de RNA), e/ou uma molécula de proteína (uma proteína de ligação de proteína). No caso de uma proteína de ligação de proteína, ela pode se ligar a si própria (para formar homodímeros, homotrímeros, etc.), e/ou ela pode se ligar a uma ou mais moléculas de uma proteína ou proteínas diferentes. Uma proteína de ligação pode ter mais do que um tipo de atividade de ligação. Por exemplo, proteínas de dedo de zinco têm atividade de ligação de DNA, atividade de ligação de RNA, e atividade de ligação de proteína.A "binding protein" is a protein that is capable of non-covalently binding to another molecule. A binding protein may bind to, for example, a DNA molecule (a DNA binding protein), an RNA molecule (an RNA binding protein), and / or a protein molecule (a binding protein). of protein). In the case of a protein binding protein, it may bind itself (to form homodimers, homotrimers, etc.), and / or it may bind to one or more molecules of a different protein or proteins. A binding protein may have more than one type of binding activity. For example, zinc finger proteins have DNA binding activity, RNA binding activity, and protein binding activity.

[0083] Uma "proteína de ligação de DNA de dedo de zinco" (ou domínio de ligação) é uma proteína, ou um domínio dentro de uma proteína maior, que se liga a DNA em uma maneira de sequência específica através de um ou mais apêndices de zinco, que são regiões de sequência de aminoácido dentro do domínio de ligação cuja estrutura é estabilizada através de coordenação de um íon de zinco. O termo proteína de ligação de DNA de dedo de zinco é frequentemente abreviado como proteína de dedo de zinco ou ZFP.A "zinc finger DNA binding protein" (or binding domain) is a protein, or domain within a larger protein, that binds to DNA in a specific sequence manner through one or more zinc appendages, which are amino acid sequence regions within the binding domain whose structure is stabilized through coordination of a zinc ion. The term zinc finger DNA binding protein is often abbreviated as zinc finger protein or ZFP.

[0084] O domínio de ligação de apêndices de zinco pode ser "projetado" para ligar-se a uma sequência de nucleotídeo predeterminada. Exemplos não-limitativos de métodos para projeto de proteínas de dedo de zinco são desenho e seleção. Uma proteína de dedo de zinco desenhada é a proteína que não ocorre na natureza cujo desenho/composição resulta principalmente de critério racional. O critério racional para desenho inclui aplicação de regras de substituição e algoritmos computadorizados para processamento de informação em uma base de dados que armazena informação de desenhos de ZFP existentes e dados de ligação. Ver, por exemplo, Patentes dos Estados Unidos 6.140.081; 6.453.242; 6.534.261; e 6.785.613; ver, também WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 e WO 03/016496; e Patentes dos Estados Unidos 6.746.838; 6.866.997; e 7.030.215.The zinc appendage binding domain may be "designed" to bind to a predetermined nucleotide sequence. Non-limiting examples of methods for zinc finger protein design are design and selection. A drawn zinc finger protein is the non-naturally occurring protein whose design / composition results primarily from rational criteria. Rational design criteria include application of substitution rules and computerized algorithms for processing information in a database that stores information from existing ZFP drawings and binding data. See, for example, United States Patents 6,140,081; 6,453,242; 6,534,261; and 6,785,613; see also WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 and WO 03/016496; and United States Patents 6,746,838; 6,866,997; and 7,030,215.

[0085] Uma proteína de dedo de zinco "selecionada" é uma proteína não encontrada na natureza cuja produção resulta principalmente de um processo empírico, tal como descrição de fago, armadilha de interação, ou seleção híbrida. Ver, por exemplo, US 5.789.538; US 5.925.523; US 6.007.988; US 6.013.453; US 6.200.759; US 6.733.970; US RE39.229; e W095/19431; WO96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970; WO 01/88197 e WO 02/099084.A "selected" zinc finger protein is a protein not found in nature whose production results primarily from an empirical process, such as phage description, interaction trap, or hybrid selection. See, for example, US 5,789,538; US 5,925,523; US 6,007,988; US 6,013,453; US 6,200,759; US 6,733,970; US RE39,229; and WO95 / 19431; WO96 / 06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970; WO 01/88197 and WO 02/099084.

[0086] O termo "sequência" se refere a uma sequência de nucleotídeo de qualquer comprimento, que pode ser DNA ou RNA; pode ser linear, circular ou ramificada, e pode ser, ou de fita simples, ou de fita dupla. O termo "sequência doadora" se refere a uma sequência de nucleotídeo que é inserida em um genoma. Uma sequência doadora pode ser de qualquer comprimento, por exemplo, entre 2 e 25.000 nucleotídeos de comprimento (ou qualquer valor inteiro entre estes ou acima destes), preferivelmente entre cerca de 100 e 5.000 nucleotídeos de comprimento (ou qualquer inteiro entre estes), mais preferivelmente entre cerca de 200 e 2.500 nucleotídeos de comprimento.The term "sequence" refers to a nucleotide sequence of any length, which may be DNA or RNA; it may be linear, circular or branched, and may be either single or double ribbon. The term "donor sequence" refers to a nucleotide sequence that is inserted into a genome. A donor sequence may be of any length, for example, between 2 and 25,000 nucleotides in length (or any integer between or above them), preferably between about 100 and 5,000 nucleotides in length (or any integer in between), more. preferably between about 200 and 2,500 nucleotides in length.

[0087] Uma "sequência homóloga" se refere a uma primeira sequência que compartilha um grau de identidade de sequência com uma segunda sequência, e cuja sequência pode ser idêntica àquela da segunda sequência. Uma "sequência homóloga não-idêntica" se refere a uma primeira sequência que compartilha um grau de identidade de sequência com uma segunda sequência, mas cuja sequência não é idêntica àquela da segunda sequência. Por exemplo, um polinucleotídeo compreendendo a sequência tipo selvagem de um gene mutante é homóloga e não-idêntica à sequência do gene mutante. Em certas concretizações, o grau de homologia entre as duas sequências é suficiente para permitir recombinação homóloga entre estas, utilizando-se mecanismos celulares normais. Duas sequências homólogas não-idênticas podem ser de qualquer comprimento, e seu grau de não-homologia pode ser tão pequeno quanto um nucleotídeo simples (por exemplo, para correção de uma mutação de ponto genômico pela recombinação homóloga alvo), ou maior do que 10 ou mais kilobases (por exemplo, para inserção de um gene em um local predeterminado em um cromossoma). Dois polinucleotídeos compreendendo as sequências homólogas não-idênticas não necessitam serem do mesmo comprimento. Por exemplo, um polinucleotídeo exógeno (isto é, polinucleotídeo doador) de entre 20 e 10.000 nucleotídeos, ou par de nucleotídeos, podem ser usados.A "homologous sequence" refers to a first sequence that shares a degree of sequence identity with a second sequence, and whose sequence may be identical to that of the second sequence. A "non-identical homologous sequence" refers to a first sequence that shares a degree of sequence identity with a second sequence but whose sequence is not identical to that of the second sequence. For example, a polynucleotide comprising the wild type sequence of a mutant gene is homologous and not identical to the mutant gene sequence. In certain embodiments, the degree of homology between the two sequences is sufficient to permit homologous recombination between them using normal cellular mechanisms. Two non-identical homologous sequences may be of any length, and their degree of nonhomology may be as small as a single nucleotide (for example, for correction of a genomic point mutation by target homologous recombination), or greater than 10. or more kilobases (for example, for insertion of a gene at a predetermined location on a chromosome). Two polynucleotides comprising non-identical homologous sequences need not be of the same length. For example, an exogenous polynucleotide (i.e. donor polynucleotide) of between 20 and 10,000 nucleotides, or nucleotide pair, may be used.

[0088] Técnicas para determinação de ácido nucléico e identidade de sequência de aminoácido são conhecidas na técnica. Tipicamente, tais técnicas incluem determinação da sequência de nucleotídeo do mRNA para um gene, e/ou determinação da sequência de aminoácido desse modo codificada, e comparando estas sequências a um segundo nucleotídeo, ou sequência de aminoácido. Sequências genômicas podem também ser determinadas e comparadas desse modo. Em geral, identidade se refere a uma correspondência exata de nucleotídeo para nucleotídeo ou aminoácido para aminoácido de dois polinucleotídeos ou sequências de polipeptídeo, respectiva mente. Duas ou mais sequências (polinucleotfdeo ou aminoácido) podem ser comparadas pela determinação de sua percentagem de identidade. A percentagem de identidade de duas sequências, se ácido nucléico ou sequência de aminoácidos, é o número de equiparações exatas entre duas sequências alinhadas divididas pelo comprimento das sequências mais curtas e multiplicadas por 100, Um alinhamento aproximado para sequências de ácido nucléico ê provido pelo algoritmo de homologia local de Smith e Waterman, Advances in Applied Mathematics 2:482-489 (1981). Este algoritmo pode ser aplicado á sequência de aminoácidos pelo uso de matriz de classificação desenvolvida por Dayhoff, Atlas of Protein Sequence and Estrutura. M.O. Dayhoff ed., 5 suppl. 3:353-358, National Biomedical Research Foundation, Washington, D.C., USA, e normalizada por Gribskov, Nucl. Acids Res. 14(6):6745-6763 (1986). Uma implementação exemplar deste algoritmo para determinar a percentagem de identidade de uma sequência é provida pelo Genetics Computer Group (Madison, Wl) no "BestFit" utility application. Os parâmetros de falta para este método são descritos na Wisconsín Sequence Analysts Package Program Manual, Versão 8 (1995) (disponível de Genetics Computer Group, Madison, Wl). Um método preferido de estabelecer a percentagem de identidade no contexto da presente descrição é usar o acondicionamento MPSRCH de programas protegido por direito autoral pela Universidade de Edinburgh, desenvolvido por John F. Collins e Shane S. Sturrok, e distribuído por IntelliGenetics, Inc. (Mountaín View, CA), A partir deste conjunto de acondicionamentos, o algoritmo de Smith-Waterman pode ser empregado onde parâmetros de falta são usados para a tabela de classificação (por exemplo, penalidade aberta de folga de 12, penalidade aberta de folga de um, e uma folga de seis). A partir dos dados gerados, o valor de "Equiparação" reflete a identidade de sequência. Outros programas adequados para calcular a percentagem de identidade ou similaridade entre sequências são geralmente conhecidos na técnica, por exemplo, outro programa de alinhamento é BLAST, usado com parâmetros de falta. Por exemplo, BLASTN e BLASTP podem ser usados usando-se os seguintes parâmetros de penalidade: código genético = padrão; filtro = nenhum; fita = ambos; corte = 60; espera = 10; Matriz = BLOSUM62; Descrições = 50 sequências; classificação por = HIGH SCORE; Bases de dados = não-redundante, Banco de Gene + EMBL + DDBJ + PDB + Banco de Gene CDS translações + proteína Suíça+ Spupdate + PIR. Detalhes destes programas podem ser encontrados na internet. Com relação às sequências aqui descritas, a faixa de graus desejada de identidade de sequência é aproximadamente 35% a 100%, e qualquer valor inteiro entre estes. Tipicamente as percentagens de identidades entre sequências são pelo menos 35%-40%; 40%-45%; 45%-50%; 50%-60%; 60%-70%; 70-75%, preferivelmente 80-82%, mais preferivelmente 85-90%, ainda mais preferivelmente 92%, ainda mais preferivelmente 95%, e mais preferivelmente 98% de identidade de sequência.Techniques for nucleic acid determination and amino acid sequence identity are known in the art. Typically, such techniques include determining the mRNA nucleotide sequence for a gene, and / or determining the amino acid sequence thereby encoded, and comparing these sequences to a second nucleotide, or amino acid sequence. Genomic sequences can also be determined and compared in this way. In general, identity refers to an exact nucleotide to nucleotide or amino acid to amino acid match of two polynucleotides or polypeptide sequences, respectively. Two or more sequences (polynucleotide or amino acid) may be compared by determining their percent identity. The percent identity of two sequences, whether nucleic acid or amino acid sequence, is the number of exact matches between two aligned sequences divided by the length of the shortest sequences and multiplied by 100. An approximate alignment for nucleic acid sequences is provided by the algorithm. of local homology by Smith and Waterman, Advances in Applied Mathematics 2: 482-489 (1981). This algorithm can be applied to the amino acid sequence by the use of a classification matrix developed by Dayhoff, Atlas of Protein Sequence and Structure. M.O. Dayhoff ed., 5 suppl. 3: 353-358, National Biomedical Research Foundation, Washington, D.C., USA, and standardized by Gribskov, Nucl. Acids Res. 14 (6): 6745-6763 (1986). An exemplary implementation of this algorithm for determining percent identity of a sequence is provided by the Genetics Computer Group (Madison, WI) in the "BestFit" utility application. The default parameters for this method are described in the Wisconsín Sequence Analysts Package Program Manual, Version 8 (1995) (available from Genetics Computer Group, Madison, Wl). A preferred method of establishing percent identity in the context of the present disclosure is to use copyright protected MPSRCH packaging by the University of Edinburgh developed by John F. Collins and Shane S. Sturrok and distributed by IntelliGenetics, Inc. ( Mountaín View, CA), From this set of packages, the Smith-Waterman algorithm can be employed where foul parameters are used for the classification table (eg open gap penalty of 12, open gap penalty of one , and a clearance of six). From the generated data, the value of "Match" reflects the string identity. Other suitable programs for calculating percent identity or similarity between sequences are generally known in the art, for example, another alignment program is BLAST, used with default parameters. For example, BLASTN and BLASTP can be used using the following penalty parameters: genetic code = standard; filter = none; tape = both; cut = 60; wait = 10; Array = BLOSUM62; Descriptions = 50 sequences; sort by = HIGH SCORE; Databases = non-redundant, Gene Bank + EMBL + DDBJ + PDB + Gene Bank CDS translations + Swiss protein + Spupdate + PIR. Details of these programs can be found on the internet. With respect to the sequences described herein, the desired degree range of sequence identity is approximately 35% to 100%, and any integer between them. Typically percent identities between sequences are at least 35% -40%; 40% -45%; 45% -50%; 50% -60%; 60% -70%; 70-75%, preferably 80-82%, more preferably 85-90%, even more preferably 92%, even more preferably 95%, and most preferably 98% sequence identity.

[0089] Alternativamente, o grau de similaridade de sequência entre polinucleotídeos pode ser determinado por hibridização de polinucleotídeos sob condições que permitem formação de dúplexes estáveis entre regiões homólogas, seguido por digestão com nuclease(s) específica(s) de filamento simples, e determinação de tamanho dos fragmentos digeridos. Dois ácidos nucléicos, ou duas sequências de polipeptídeo, são substancialmente homólogas uma à outra quando as sequências exibem pelo menos cerca de 70%-75%, preferivelmente 80%-82%, mais preferivelmente 85%-90%, ainda mais preferivelmente 92%, ainda mais preferivelmente 95%, e mais preferivelmente 98% de atividade de sequência sobre um comprimento definido das moléculas, conforme determinado usando-se os métodos acima. Conforme aqui usado, substancialmente homóloga também se refere a sequências que mostram identidade completa a um DNA especificado, ou sequência de polipeptídeo. Sequências de DNA que são substancialmente homólogas podem ser identificadas em um experimento de hibridização de Southern sob, por exemplo, condições estringentes, conforme definido para aquele sistema particular. A definição das condições apropriadas de hibridização está dentro do técnico do assunto. (Ver, por exemplo, Sambrook et ai., supra; Acid nucleic Hibridização: A Practical Approach, editors B.D. Hames e S.J. Higgins, (1985) Oxford; Washington, DC; IRL Press).Alternatively, the degree of sequence similarity between polynucleotides can be determined by polynucleotide hybridization under conditions that allow stable duplex formation between homologous regions, followed by single stranded specific nuclease (s) digestion, and determination. in size of the digested fragments. Two nucleic acids, or two polypeptide sequences, are substantially homologous to each other when the sequences exhibit at least about 70% -75%, preferably 80% -82%, more preferably 85% -90%, even more preferably 92%. even more preferably 95%, and most preferably 98% of sequence activity over a defined length of molecules as determined using the above methods. As used herein, substantially homologous also refers to sequences showing complete identity to a specified DNA, or polypeptide sequence. DNA sequences that are substantially homologous can be identified in a Southern hybridization experiment under, for example, stringent conditions as defined for that particular system. The definition of the appropriate hybridization conditions is within the skill of the art. (See, for example, Sambrook et al., Supra; Acid Nucleic Hybridization: A Practical Approach, editors B.D. Hames and S.J. Higgins, (1985) Oxford; Washington, DC; IRL Press).

[0090] A hibridização seletiva de dois fragmentos de ácido nucléico pode ser determinada conforme segue. O grau de identidade de sequência entre duas moléculas de ácido nucléico afeta a eficiência e resistência de eventos de hibridização entre tais moléculas. Uma sequência de ácido nucléico parcialmente idêntica inibirá pelo menos parcialmente a hibridização de uma sequência completamente idêntica a uma molécula-alvo. A inibição de hibridização da sequência completamente idêntica pode ser avaliada usando-se ensaios de hibridização que são bem conhecidos na técnica (por exemplo, Southern blotting (DNA), Northern blotting (RNA), hibridização de solução, ou similares, ver Sambrook, et ai., Molecular Cloning: A Laboratory Manual, Segunda Edição, (1989) Cold Spring Harbor, N.Y.). Tais ensaios podem ser conduzidos usando-se variação de graus de seletividade, por exemplo, usando-se condições que variam de baixa a alta estringência. Se condições de baixa estringência são empregadas, a ausência de ligação não-específica pode ser avaliada usando-se uma sonda secundária que carece de ainda um grau parcial de identidade de sequência (por exemplo, uma sonda tendo menos do que cerca de 30% de identidade de sequência com a molécula-alvo), tal que, na ausência de eventos de ligação não-específica, a sonda secundária não hibridizará para o alvo, [0091] Quando se utiliza um sistema de detecção baseado em hibridização, uma sonda de ácido nucléico é escolhida, que é complementar a uma sequência de ácido nucléico de referência, e, em seguida, por seleção de condições apropriadas da sonda, e a sequência de referência se letiva mente hibridiza, ou se liga, uma a outra, para formar uma molécula dúplex. Uma molécula de ácido nucléico que é capaz de hibridizar seletivamente a uma sequência de referência sob condições de hibridização moderadamente estringentes tipicamente hibridiza sob condições que permitem detecção de uma sequência de ácido nucléico-alvo de pelo menos cerca de 10-14 nucleotídeos de comprimento, tendo pelo menos aproximadamente 70% de identidade de sequência com a sequência da sonda de ácido nucléico selecionada. As condições de hibridização estringente tipicamente permitem detecção de sequências de ácido nucléico-alvo de pelo menos cerca de 10-14 nucleotídeos de comprimento, tendo uma identidade de sequência de mais do que cerca, de 90-95% com a sequência da sonda de ácido nucléico selecionada. As condições de hibridização úteis para a hibridização de sequência de sonda/referência, onde a sequência de sonda e de referência têm um grau específico de identidade de sequência, podem ser determinadas conforme é conhecido na técnica (ver, por exemplo, Acid nucleic Hvbridization: A Practical Approach. editors B,D, Hames e SJ, Higgins, (1985) Oxford; Washington, DC; IRL Press), [0092] As condições para hibridização são bem conhecidas àqueles versados na técnica. A estringência de hibridização se refere ao grau ao qual as condições de hibridização desfavorecem a formação de híbridos contendo nucleotídeos desequiparados, com estringència mais alta correlacionada com uma tolerância inferior para híbridos deseq ui parados. Os fatores que afetam a estringència de hibridização são bem conhecidos àqueles versados na técnica, e incluem, mas não estão limitado a, temperatura, pH, resistência iônica, e concentração de solventes orgânicos, tais como, por exemplo, formamida e dimetilsulfóxido- Conforme é conhecido àqueles versados na técnica, a estringència de hibridização é aumentada por temperaturas mais altas, resistência iônica mais baixa, e concentrações de solvente mais baixas.Selective hybridization of two nucleic acid fragments can be determined as follows. The degree of sequence identity between two nucleic acid molecules affects the efficiency and resistance of hybridization events between such molecules. A partially identical nucleic acid sequence will at least partially inhibit hybridization of a sequence completely identical to a target molecule. Inhibition of completely identical sequence hybridization can be evaluated using hybridization assays that are well known in the art (e.g. Southern blotting (DNA), Northern blotting (RNA), solution hybridization, or the like, see Sambrook, et. al., Molecular Cloning: A Laboratory Manual, Second Edition, (1989) Cold Spring Harbor, NY). Such assays may be conducted using varying degrees of selectivity, for example using conditions ranging from low to high stringency. If low stringency conditions are employed, the absence of nonspecific binding can be assessed using a secondary probe that still lacks a partial degree of sequence identity (e.g., a probe having less than about 30% of sequence identity with the target molecule) such that, in the absence of nonspecific binding events, the secondary probe will not hybridize to the target. When using a hybridization-based detection system, an acid probe The nucleic acid is chosen, which is complementary to a reference nucleic acid sequence, and then by selection of appropriate probe conditions, and the reference sequence hybridizes to or binds one another to form a nucleic acid sequence. Duplex molecule. A nucleic acid molecule that is capable of selectively hybridizing to a reference sequence under moderately stringent hybridization conditions typically hybridizes under conditions that allow detection of a target nucleic acid sequence of at least about 10-14 nucleotides in length, having at least approximately 70% sequence identity with the selected nucleic acid probe sequence. Stringent hybridization conditions typically allow detection of target nucleic acid sequences of at least about 10-14 nucleotides in length, having a sequence identity of more than about 90-95% with the acid probe sequence selected nucleic acid. Hybridization conditions useful for probe / reference sequence hybridization, where the probe and reference sequence have a specific degree of sequence identity, can be determined as known in the art (see, for example, Acid nucleic hybridization: A Practical Approach, editors B, D, Hames and SJ, Higgins, (1985) Oxford; Washington, DC; IRL Press), [0092] Conditions for hybridization are well known to those skilled in the art. Hybridization stringency refers to the degree to which hybridization conditions disadvantage the formation of unequal nucleotide-containing hybrids, with higher stringency correlated with a lower tolerance for unequal hybrids. Factors affecting hybridization stringency are well known to those skilled in the art, and include, but are not limited to, temperature, pH, ionic strength, and concentration of organic solvents such as formamide and dimethyl sulfoxide. Known to those skilled in the art, hybridization stringency is increased by higher temperatures, lower ionic resistance, and lower solvent concentrations.

[0093] Com relação às condições de estringència para hibridização, é bem conhecido na técnica que numerosas condições equivalentes podem ser empregadas para estabelecer uma estringència particular pela variação, por exemplo, dos seguintes fatores: o comprimento e natureza das sequências, composição base das várias sequências, concentrações de sais e outros componentes de solução de hibridização, a presença ou ausência de agentes de bloqueio nas soluções de hibridização (por exemplo, sulfato d extra no, e polietileno glicol), parâmetros de temperatura de reação de hibridização e de tempo, bem como, variação das condições de lavagem. A seleção de um conjunto particular de condições de hibridização é selecionada seguindo-se métodos padrão na técnica (ver, por exemplo, Sambrook, et al., Molecular Cloninq: A Laboratory Manual, Segunda Edição, (1989) Cold Spríng Harbor, ΝΎ.).With respect to stringency conditions for hybridization, it is well known in the art that numerous equivalent conditions can be employed to establish a particular stringency by varying, for example, the following factors: the length and nature of the sequences, the base composition of the various sequences, salt concentrations and other hybridization solution components, the presence or absence of blocking agents in the hybridization solutions (e.g., extra d sulfate, and polyethylene glycol), hybridization reaction temperature and time parameters, as well as variation of washing conditions. Selection of a particular set of hybridization conditions is selected by following standard methods in the art (see, for example, Sambrook, et al., Molecular Cloninq: A Laboratory Manual, Second Edition, (1989) Cold Spring Harbor, ΝΎ. ).

[0094] "Recombinaçâo" se refere a um processo de troca de informação genética entre dois polinucleotídeos. Para a proposta desta descrição, "recombi nação homóloga (HR)" se refere à forma especializada de tal troca que ocorre, por exemplo, durante reparo de quebras de filamento duplo em células. Este processo requer sequência de homologia de nucleotídeo, uso de uma molécula "doa d ora" para reparo de gabarito de uma molécula "alvo" (isto é, a molécula que experimenta a quebra de filamento duplo), e é variavelmente conhecido como "conversão de gene de não-interseção" ou "conversão de gene de trecho curto", porque isto conduz a transferência de informação genética a partir do doador para o alvo. Sem desejar estar ligado por qualquer teoria particular, tal transferência pode envolver correção de desequiparação de DNA heterodúplex que se forma entre o alvo quebrado e o doador, e/ou "recozimento de trançado dependente de síntese", em que o doador é usado para re-sintetizar informação genética que se tornar parte do alvo, e/ou processos relacionados. Tal HR especializada frequentemente resulta em uma alteração da sequência da molécula-alvo tal que parte ou toda da sequência do polinucleotídeo doador é incorporada ao polinucleotídeo."Recombination" refers to a process of exchange of genetic information between two polynucleotides. For the purpose of this disclosure, "homologous recombination (HR)" refers to the specialized form of such exchange that occurs, for example, during repair of double strand breaks in cells. This process requires nucleotide homology sequence, use of a "donor" molecule for template repair of a "target" molecule (ie, the molecule experiencing double stranded breaking), and is variably known as "conversion". non-intersecting gene "or" short stretch gene conversion "because this leads to the transfer of genetic information from the donor to the target. Without wishing to be bound by any particular theory, such a transfer may involve correction of heteroduplex DNA mismatch that forms between the broken target and the donor, and / or "synthesis dependent braided annealing", wherein the donor is used to rebuild. - synthesize genetic information that becomes part of the target, and / or related processes. Such specialized HR often results in a change in the sequence of the target molecule such that part or all of the donor polynucleotide sequence is incorporated into the polynucleotide.

[0095] "Clivagem" se refere à quebra do suporte covalente de uma molécula de DNA. A clivagem pode ser iniciada por uma variedade de métodos incluindo, mas não limitado a, hidrólise enzimática ou química de uma ligação de fosfodiéster. Ambas clivagem de filamento simples e clivagem de filamento duplo são possíveis, clivagem de filamento duplo pode ocorrer como um resultado de dois eventos distintos de clivagem de filamento duplo. A clivagem de DNA pode resultar na produção de ou extremidades moderadas ou extremidades escalonadas. Em certas concretizações, polipeptídeos de fusão são usados para clivagem de DNA de filamento duplo alvo."Cleavage" refers to the breakdown of the covalent support of a DNA molecule. Cleavage may be initiated by a variety of methods including, but not limited to, enzymatic or chemical hydrolysis of a phosphodiester bond. Both single-filament cleavage and double-filament cleavage are possible, double-filament cleavage can occur as a result of two distinct double-filament cleavage events. DNA cleavage can result in the production of either moderate ends or staggered ends. In certain embodiments, fusion polypeptides are used for double-stranded DNA cleavage.

[0096] Um "domínio de clivagem" compreende uma ou mais sequências de polipeptídeo que possuem atividade catalítica para clivagem de DNA. Um domínio de clivagem pode estar contido em uma cadeia de polipeptídeo simples, ou a atividade de clivagem pode resultar da associação de dois (ou mais) polipeptídeos.A "cleavage domain" comprises one or more polypeptide sequences that have catalytic activity for DNA cleavage. A cleavage domain may be contained within a single polypeptide chain, or cleavage activity may result from the association of two (or more) polypeptides.

[0097] Um "meio-domínio de clivagem" é uma sequência de polipeptídeo que, em conjunto um segundo polipeptídeo (ou idêntico ou diferente) forma um complexo tendo atividade de divagem (preferivelmente atividade de divagem de filamento duplo).A "cleavage half-domain" is a polypeptide sequence that together a second (or identical or different) polypeptide forms a complex having splitting activity (preferably double stranded splitting activity).

[0098] "Cromatina" é a estrutura de nucleoproteína compreendendo o genoma celular. A cromatina celular compreende ácido nucléico, principalmente DNA, e proteína, incluindo proteínas cromossômicas de histonas e não-histona. A maioria da cromatina celular eucariótica existe na forma de nucleossomas, no qual um núcleo de nucleossoma compreende aproximadamente 150 pares de bases de DNA associados com um octâmero compreendendo dois cada de histonas H2A, H2B, H3 e H4; e DNA articulador (de comprimento variável, dependendo do organismo) se estende entre núcleos de nucleossoma. Uma molécula de histona H1 está geralmente associada com o DNA articulador. Para a proposta da presente descrição, o termo "cromatina" é significativo para envolver todos os tipos de nucleoproteína celular, ambas procariótica e eucariótica. A cromatina celular inclui ambas cromatina cromossômica e epissômica."Chromatin" is the nucleoprotein structure comprising the cellular genome. Cellular chromatin comprises nucleic acid, primarily DNA, and protein, including histone and nonhistone chromosomal proteins. Most eukaryotic cell chromatin exists in the form of nucleosomes, wherein a nucleosome nucleus comprises approximately 150 base pairs of DNA associated with an octamer comprising two each of histones H2A, H2B, H3 and H4; and articulating DNA (of varying length depending on the organism) extends between nucleosome nuclei. A histone H1 molecule is usually associated with the articulating DNA. For purposes of the present disclosure, the term "chromatin" is meaningful to encompass all types of prokaryotic and eukaryotic cellular nucleoproteins. Cellular chromatin includes both chromosome and episomic chromatin.

[0099] Um "cromossoma", é um complexo de cromatina compreendendo toda ou uma porção do genoma de uma célula. O genoma de uma célula é frequentemente caracterizado por seu cariótipo, que é a coleção de todos os cromossomas que compreendem o genoma da célula. O genoma de uma célula pode compreender um ou mais cromossomas.A "chromosome" is a chromatin complex comprising all or a portion of the genome of a cell. The genome of a cell is often characterized by its karyotype, which is the collection of all chromosomes that comprise the cell genome. The genome of a cell may comprise one or more chromosomes.

[00100] Um "epissoma" é um ácido nucléico de replicação, complexo de nucleoproteína ou outra estrutura compreendendo um ácido nucléico que não é parte do cariótipo cromossômico de uma célula. Exemplos de epissomas incluem plasmídeos e certos genomas virais.An "episome" is a replicating nucleic acid, nucleoprotein complex or other structure comprising a nucleic acid that is not part of the chromosomal karyotype of a cell. Examples of episomes include plasmids and certain viral genomes.

[00101] Uma "região acessível" é um local em cromatina celular no qual um local-alvo presente no ácido nucléico pode estar ligado por uma molécula exógena que reconhece o local-alvo. Sem desejar estar ligado a qualquer teoria particular, acredita-se que uma região acessível é uma que não está acondicionada em uma estrutura nucleossomal. A estrutura distinta de uma região acessível pode frequentemente ser detectada por sua sensibilidade a sondas químicas e enzimáticas, por exemplo, nucleases.An "accessible region" is a site in cellular chromatin in which a target site present in nucleic acid may be linked by an exogenous molecule that recognizes the target site. Without wishing to be bound by any particular theory, it is believed that an accessible region is one that is not wrapped in a nucleosome structure. The distinct structure of an accessible region can often be detected by its sensitivity to chemical and enzymatic probes, for example nucleases.

[00102] Um "local-alvo" ou "sequência-alvo" é uma sequência de ácido nucléico que define uma porção de um ácido nucléico a qual uma molécula de ligação se ligará, provido que condições suficientes para ligação existam. Por exemplo, a sequência 5’-GAATTC-3’ é um local-alvo para a endonuclease de restrição de Eco RI.A "target site" or "target sequence" is a nucleic acid sequence that defines a portion of a nucleic acid to which a binding molecule will bind, provided that sufficient conditions for binding exist. For example, the 5'-GAATTC-3 'sequence is a target site for Eco RI restriction endonuclease.

[00103] Uma molécula "exógena" é uma molécula que não está normalmente presente em uma célula, mas pode ser introduzida em uma célula por um ou mais métodos genéticos, bioquímicos, ou outros. "Presença normal na célula" é determinada com relação ao estágio de desenvolvimento particular e condições ambientais da célula. Desse modo, por exemplo, uma molécula que está presente somente durante desenvolvimento embriônico de músculo é uma molécula exógena com relação a uma célula de músculo adulta. Similarmente, uma molécula induzida por choque de calor é uma molécula exógena com relação a uma célula sem choque de calor. Uma molécula exógena pode compreender, por exemplo, uma versão de funcionamento de uma molécula endógena de mau-funcionamento, ou uma versão de mau-funcionamento de uma molécula endógena que funciona normalmente.An "exogenous" molecule is a molecule that is not normally present in a cell but can be introduced into a cell by one or more genetic, biochemical, or other methods. "Normal cell presence" is determined with respect to the particular stage of development and environmental conditions of the cell. Thus, for example, a molecule that is present only during embryonic muscle development is an exogenous molecule relative to an adult muscle cell. Similarly, a heat shock induced molecule is an exogenous molecule with respect to a cell without heat shock. An exogenous molecule may comprise, for example, a working version of a malfunctioning endogenous molecule, or a malfunctioning version of a normally functioning endogenous molecule.

[00104] Uma molécula exógena pode ser, entre outras coisas, uma molécula pequena, tal como é gerada por um processo químico combinatorial, ou uma macromolécula, tal como uma proteína, ácido nucléico, carboidrato, lipídeo, glicoproteína, lipoproteína, polissacarídeo, qualquer derivado modificado das moléculas acima, ou qualquer complexo compreendendo uma ou mais das moléculas acima. Ácidos nucléicos incluem DNA e RNA, podem ser de filamento simples ou de filamento duplo; podem ser lineares, ramificados ou circulares; e podem ser de qualquer comprimento. Os ácidos nucléicos incluem aqueles capazes de formarem dúplexes, bem como ácidos nucléicos de formação de triplex. Ver, por exemplo, Patente dos Estados Unidos N°s 5.176.996 e 5.422.251. Proteínas incluem, mas não estão limitadas a, proteínas de ligação de DNA, fatores de transcrição, fatores de remodelagem de cromatina, proteínas de ligação de DNA metiladas, polimerases, metilases, demetilases, acetilases, desacetilases, cinases, fosfatases, integrases, recombinases, ligases, topoisomerases, girases e helicases.An exogenous molecule may be, among other things, a small molecule, as generated by a combinatorial chemical process, or a macromolecule, such as a protein, nucleic acid, carbohydrate, lipid, glycoprotein, lipoprotein, polysaccharide, any modified derivative of the above molecules, or any complex comprising one or more of the above molecules. Nucleic acids include DNA and RNA, may be single stranded or double stranded; may be linear, branched or circular; and can be of any length. Nucleic acids include those capable of duplexing as well as triplex-forming nucleic acids. See, for example, United States Patent Nos. 5,176,996 and 5,422,251. Proteins include, but are not limited to, DNA binding proteins, transcription factors, chromatin remodeling factors, methylated DNA binding proteins, polymerases, methylases, demethylases, acetylases, deacetylases, kinases, phosphatases, integrases, recombinases, ligases, topoisomerases, gyrases and helicases.

[00105] Uma molécula exógena pode ser o mesmo tipo de molécula como uma molécula endógena, por exemplo, uma proteína exógena, ou ácido nucléico. Por exemplo, um ácido nucléico exógeno pode compreender um genoma viral de infecção, um trançado T de Agrogacterium tumefacians, um plasmídeo ou epissoma introduzido em uma célula, ou um cromossoma que não está normalmente presente na célula. Métodos para a introdução de moléculas exógenas nas células são conhecidos àqueles versados na técnica, e incluem, mas não estão limitados a, transferência mediada por lipídeo (isto é, lipossomas, incluindo lipídeos neutros e catiônicos), eletroporação, injeção direta, fusão de célula, bombardeio de partícula, coprecipitação de fosfato de cálcio, transferência mediada por DEAE-dextrano, e transferência mediada por vetor viral.An exogenous molecule may be the same type of molecule as an endogenous molecule, for example, an exogenous protein, or nucleic acid. For example, an exogenous nucleic acid may comprise a viral genome of infection, an Agrogacterium tumefacians T-braid, a plasmid or episome introduced into a cell, or a chromosome that is not normally present in the cell. Methods for introducing exogenous molecules into cells are known to those skilled in the art, and include, but are not limited to, lipid-mediated transfer (ie, liposomes including neutral and cationic lipids), electroporation, direct injection, cell fusion. , particle bombardment, calcium phosphate coprecipitation, DEAE-dextran mediated transfer, and viral vector mediated transfer.

[00106] Por contraste, uma molécula "endógena" é uma que está normalmente presente em uma célula particular em um estágio de desenvolvimento particular sob condições ambientais particulares. Por exemplo, um ácido nucléico endógeno pode compreender um cromossoma, o genoma de uma mitocôndria, cloroplasto ou outra organela, ou um ácido nucléico epissomal que ocorre naturalmente. Moléculas endógenas adicionais podem incluir proteínas, por exemplo, fatores de transcrição e enzimas.By contrast, an "endogenous" molecule is one that is normally present in a particular cell at a particular stage of development under particular environmental conditions. For example, an endogenous nucleic acid may comprise a chromosome, the genome of a mitochondria, chloroplast or other organelle, or a naturally occurring episomal nucleic acid. Additional endogenous molecules may include proteins, for example transcription factors and enzymes.

[00107] Uma molécula de "fusão" é uma molécula na qual duas ou mais moléculas de subunidade estão ligadas, preferivelmente e covalentemente. As moléculas de subunidade podem ser do mesmo tipo químico de molécula, ou podem ser de tipos químicos diferentes de moléculas. Exemplos do primeiro tipo de molécula de fusão incluem, mas não estão limitados a, proteínas de fusão (por exemplo, uma fusão entre um domínio de ligação de ZFP DNA e um domínio de divagem), e ácidos nucléicos de fusão (por exemplo, um ácido nucléico que codifica a proteína de fusão descrita supra). Exemplos do segundo tipo de molécula de fusão incluem, mas não estão limitados a, uma fusão entre um ácido nucléico de formação de triplex e um polipeptídeo, e uma fusão entre um ligante de ranhura menor e um ácido nucléico.A "fusion" molecule is a molecule to which two or more subunit molecules are preferably and covalently linked. Subunit molecules may be of the same chemical type of molecule, or may be of different chemical types of molecules. Examples of the first type of fusion molecule include, but are not limited to, fusion proteins (e.g., a fusion between a ZFP DNA binding domain and a splice domain), and fusion nucleic acids (e.g., a nucleic acid encoding the fusion protein described above). Examples of the second type of fusion molecule include, but are not limited to, a fusion between a triplex-forming nucleic acid and a polypeptide, and a fusion between a minor slot ligand and a nucleic acid.

[00108] A expressão de uma proteína de fusão em uma célula pode resultar da distribuição da proteína de fusão à célula, ou pela distribuição de um polinucleotídeo que codifica a proteína de fusão para uma célula, no qual o polinucleotídeo é transcrito, e a transcrição é traduzida para gerar a proteína de fusão. A transunião, divagem de polipeptídeo e ligação de polipeptídeo podem também estar envolvidas na expressão de uma proteína em uma célula. Métodos para distribuição de polinucleotídeo e polipeptídeo para células são apresentados em outra parte nesta descrição.Expression of a fusion protein in a cell may result from the distribution of the fusion protein to the cell, or the distribution of a polynucleotide encoding the fusion protein to a cell into which the polynucleotide is transcribed, and transcription. is translated to generate the fusion protein. Transunion, polypeptide splitting, and polypeptide binding may also be involved in the expression of a protein in a cell. Methods for delivering polynucleotide and polypeptide to cells are presented elsewhere in this description.

[00109] Um "gene", para a proposta da presente descrição inclui uma região de DNA que codifica um produto de gene (ver infra), bem como todas as regiões de DNA que regulam a produção do produto de gene, se ou não tais sequências regulatórias são adjacentes às sequências de codificação e/ou transcritas. Consequentemente, um gene inclui, mas não é necessariamente limitado a, sequências promotoras, terminadores, sequências regulatórias translacionais, tais como locais de ligação de ribossomas e locais de entrada de ribossoma internos, intensificadores, silenciadores, isoladores, elementos de limite, origens de replicação, locais de fixação de matriz, e regiões de controle locais.A "gene" for the purpose of this disclosure includes a DNA region encoding a gene product (see below) as well as all DNA regions that regulate gene product production, whether or not such regulatory sequences are adjacent to the coding and / or transcribed sequences. Accordingly, a gene includes, but is not necessarily limited to, promoter sequences, terminators, translational regulatory sequences, such as ribosome binding sites and internal ribosome entry sites, enhancers, silencers, isolators, boundary elements, origins of replication. , matrix fixation sites, and local control regions.

[00110] "Expressão de gene" se refere à conversão da informação, contida em um gene, em um produto de gene. Um produto de gene pode ser o produto transcricional direto de um gene (por exemplo, mRNA, tRNA, rRNA, RNA de antisenso, ribozima, RNA estrutural, ou qualquer outro tipo de RNA), ou uma proteína produzida por tradução de um mRNA. O produto de genes também inclui RNAs que são modificados, por processos, tais como capeamento, poliadenilação, metilação, e edição, e proteínas modificadas por, por exemplo, metilação, acetilação, fosforilação, ubiquitinação, ADP-ribosilação, miristilação, e glicosilação."Gene expression" refers to the conversion of information, contained in a gene, into a gene product. A gene product may be the direct transcriptional product of a gene (for example, mRNA, tRNA, rRNA, antisense RNA, ribozyme, structural RNA, or any other type of RNA), or a protein produced by translation of an mRNA. The gene product also includes RNAs that are modified by processes such as capping, polyadenylation, methylation, and editing, and proteins modified by, for example, methylation, acetylation, phosphorylation, ubiquitination, ADP-ribosylation, myristylation, and glycosylation.

[00111] "Modulação" de expressão de gene se refere a uma mudança na atividade de um gene. A modulação de expressão pode incluir, mas não é limitada à, ativação de gene e repressão de gene."Modulation" of gene expression refers to a change in the activity of a gene. Expression modulation may include, but is not limited to, gene activation and gene repression.

[00112] Células de "planta" incluem, mas não estão limitadas a, células de plantas monocotiledôneas (monocots) ou dicotiledôneas (dicots). Exemplos não-limitativos de monocots incluem plantas de cereal, tais como milho, arroz, cevada, aveias, sorgo, centeio, cana de açúcar, ananás, cebola, banana, e coco. Exemplos não-limitativos de dicots incluem tabaco, tomate, girassol, algodão, beterraba de açúcar, batata, alface, melão, feijão-soja, canola (semente de colza), e alfafa. Células de planta podem ser de qualquer parte da planta, e/ou de qualquer estágio de desenvolvimento de planta."Plant" cells include, but are not limited to, monocot or dicot cells. Non-limiting examples of monocots include cereal plants such as corn, rice, barley, oats, sorghum, rye, sugar cane, pineapple, onion, banana, and coconut. Non-limiting examples of dicots include tobacco, tomato, sunflower, cotton, sugar beet, potato, lettuce, melon, soybean, canola (rapeseed), and alfalfa. Plant cells can be from any part of the plant, and / or from any stage of plant development.

[00113] Uma "região de interesse" é qualquer região de cromatina celular, tal como, por exemplo, um gene ou uma não-sequência de codificação dentro de, ou adjacente a um gene, em que é desejável para se ligar a uma molécula exógena. A ligação pode ser para a proposta de divagem de DNA-alvo, e/ou recombinação-alvo. Uma região de interesse pode estar presente em um cromossoma, em um epissoma, um genoma organelar (por exemplo, mitocondrial, cloroplasto), ou um genoma viral de infecção, por exemplo. Uma região de interesse pode estar dentro da região de codificação de um gene, dentro de regiões de não-codificação transcritas, tais como, por exemplo, sequências condutoras, sequências de rasto ou íntrons, ou dentro de regiões não-transcritas, ou a montante ou a jusante da região de codificação. Uma região de interesse pode ser tão pequena quanto um par simples de nucleotídeos ou até 25.000 pares de nucleotídeos de comprimento, ou qualquer valor integral de pares de nucleotídeos.A "region of interest" is any region of cellular chromatin, such as, for example, a gene or non-coding sequence within or adjacent to a gene, where it is desirable to bind to a molecule. exogenous. Binding may be for the purpose of target DNA splitting, and / or target recombination. A region of interest may be present in a chromosome, an episome, an organelle genome (eg, mitochondrial, chloroplast), or a viral infection genome, for example. A region of interest may be within the coding region of a gene, within transcribed non-coding regions, such as, for example, leader sequences, trailing or intron sequences, or within non-transcribed or upstream regions. or downstream of the coding region. A region of interest may be as small as a single nucleotide pair or up to 25,000 nucleotide pairs in length, or any integral value of nucleotide pairs.

[00114] Os termos "ligação operativa" e "operativamente ligado" (ou "operavelmente ligado") são usados permutavelmente com referência a uma justaposição de dois ou mais componentes (tais como elementos de sequência), em que os componentes são dispostos, tais que ambos componentes funcionam normalmente e permitem a possibilidade que pelo menos um dos componentes pode mediar uma função que é exercida sob pelo menos um dos outros componentes. Por meio de ilustração, uma sequência regulatória transcricional, tal como um promotor, está operativamente ligada a uma sequência de codificação se sequência regulatória transcricional controla o nível de transcrição da sequência de codificação em resposta à presença ou ausência de um ou mais fatores regulatórios transcricionais. Uma sequência regulatória transcricional é geralmente e operativamente ligada em cis com uma sequência de codificação, mas não necessita ser diretamente adjacente a esta. Por exemplo, um intensificador é uma sequência regulatória transcricional que é operativamente ligada a uma sequência de codificação, mesmo embora elas não sejam contíguas.The terms "operably linked" and "operably linked" (or "operably linked") are used interchangeably with reference to a juxtaposition of two or more components (such as sequence elements), wherein the components are arranged, such as whereas both components function normally and allow the possibility that at least one of the components may mediate a function that is performed under at least one of the other components. By way of illustration, a transcriptional regulatory sequence, such as a promoter, is operably linked to a coding sequence if the transcriptional regulatory sequence controls the transcriptional level of the coding sequence in response to the presence or absence of one or more transcriptional regulatory factors. A transcriptional regulatory sequence is generally operably linked in cis with a coding sequence, but need not be directly adjacent to it. For example, an enhancer is a transcriptional regulatory sequence that is operably linked to a coding sequence even though they are not contiguous.

[00115] Com relação a polipeptídeos de fusão, o termo "operativamente ligado" pode se referir ao fato que cada um dos componentes realiza a mesma função na ligação ao outro componente, conforme seria se não fosse desse modo ligado. Por exemplo, com relação a um polipeptídeo de fusão em que um domínio de ligação de ZFP DNA é fundido a um domínio de divagem, o domínio de ligação de ZFP DNA e o domínio de divagem estão em ligação operativa se, no polipeptídeo de fusão, a porção de domínio de ligação de ZFP DNA é capaz de se ligar a seu local-alvo e/ou a seu local de ligação, enquanto o domínio de divagem é capaz de clivar DNA na vizinhança do local-alvo.With respect to fusion polypeptides, the term "operably linked" may refer to the fact that each of the components performs the same function in binding to the other component as it would be if it were not thereby bound. For example, with respect to a fusion polypeptide in which a ZFP DNA binding domain is fused to a dividing domain, the ZFP DNA binding domain and the dividing domain are operatively linked if, in the fusion polypeptide, the binding domain portion of ZFP DNA is capable of binding to its target site and / or its binding site, while the divider domain is capable of cleaving DNA in the vicinity of the target site.

[00116] Um "fragmento funcional" de uma proteína, polipeptídeo ou ácido nucléico é uma proteína, polipeptídeo ou ácido nucléico cuja sequência não é idêntica à proteína de comprimento total, polipeptídeo ou ácido nucléico, ainda retém a mesma função como a proteína de comprimento total, polipeptídeo ou ácido nucléico. Um fragmento funcional pode possuir mais, menos, ou o mesmo número de resíduos conforme a molécula nativa correspondente, e/ou pode conter uma ou mais substituições de aminoácido ou nucleotídeo. Métodos para determinação da função de um ácido nucléico (por exemplo, função de codificação, capacidade de se hibridizar a outro ácido nucléico), são bem conhecidos na técnica. Similarmente, métodos para determinação de função de proteína são bem conhecidos. Por exemplo, a função de ligação de DNA de um polipeptídeo pode ser determinada, por exemplo, por ligação de filtro, alteração de mobilidade eletroforética, ou ensaios de imunoprecipitação. Clivagem de DNA pode ser ensaiada por eletroforese de gel. Ver, Ausubel et ai, supra. A capacidade de uma proteína interagir com outra proteína pode ser determinada, por exemplo, por co-imunoprecipitação, ensaios de dois híbridos ou complementação, ambos genéticos e bioquímicos. Ver, por exemplo, Fields et al. (1989) Nature 340:245-246; Patente dos Estados Unidos N° 5.585.245 e PCT WO 98/44350.A "functional fragment" of a protein, polypeptide or nucleic acid is a protein, polypeptide or nucleic acid whose sequence is not identical to the full length protein, polypeptide or nucleic acid, yet retains the same function as the length protein. polypeptide or nucleic acid. A functional fragment may have more, less, or the same number of residues as the corresponding native molecule, and / or may contain one or more amino acid or nucleotide substitutions. Methods for determining the function of one nucleic acid (e.g., coding function, ability to hybridize to another nucleic acid) are well known in the art. Similarly, methods for determining protein function are well known. For example, the DNA binding function of a polypeptide may be determined, for example, by filter binding, electrophoretic mobility alteration, or immunoprecipitation assays. DNA cleavage can be assayed by gel electrophoresis. See, Ausubel et al., Supra. The ability of a protein to interact with another protein can be determined, for example, by co-immunoprecipitation, two-hybrid assays or complementation, both genetic and biochemical. See, for example, Fields et al. (1989) Nature 340: 245-246; United States Patent No. 5,585,245 and PCT WO 98/44350.

Locais-alvo [00117] Os métodos e composições revelados incluem proteínas de fusão compreendendo um domínio de divagem (ou um meio-domínio de divagem) e um domínio de dedo de zinco, em que o domínio de dedo de zinco, por ligação a uma sequência em cromatina celular (por exemplo, um local-alvo, ou um local de ligação), direciona a atividade do domínio de divagem (ou meio-domínio de divagem) para a vizinhança da sequência e, consequentemente, induz divagem na vizinhança da sequência-alvo. Conforme colocado em algum lugar nesta descrição, um domínio de dedo de zinco pode ser projetado para se ligar virtualmente a qualquer sequência desejada. Consequentemente, após identificação de uma região de interesse contendo uma sequência na qual divagem ou recombinação é desejada, um ou mais domínios de ligação de apêndices de zinco podem ser projetados para se ligar a uma ou mais sequências na região de interesse. A expressão de uma proteína de fusão compreendendo um domínio de ligação de dedo de zinco e um domínio de divagem (ou de duas proteínas de fusão, cada uma compreendendo um domínio de ligação de dedo de zinco e um meio-domínio de divagem), em uma célula, efetua divagem na região de interesse.Target Sites The disclosed methods and compositions include fusion proteins comprising a dividing domain (or a half-dividing domain) and a zinc finger domain, wherein the zinc finger domain, by binding to a Cell chromatin sequence (for example, a target site, or a binding site) directs the activity of the diving domain (or half-domain domain) to the vicinity of the sequence and therefore induces divagem in the vicinity of the sequence. -target. As placed somewhere in this description, a zinc finger domain can be designed to bind virtually any desired sequence. Accordingly, upon identification of a region of interest containing a sequence in which splitting or recombination is desired, one or more zinc appendage binding domains may be designed to bind to one or more sequences in the region of interest. Expression of a fusion protein comprising a zinc finger binding domain and a dividing domain (or two fusion proteins each comprising a zinc finger binding domain and a half dividing domain), in a cell, divides the region of interest.

[00118] A seleção de uma sequência em cromatina celular para ligação por um domínio de dedo de zinco (por exemplo, um local-alvo) pode ser acompanhada, por exemplo, de acordo com os métodos revelados na Patente dos Estados Unidos da mesma requerente N° 6.453.242 (17 de setembro de 2002), que também revela métodos para designações de ZFPs para se ligar a uma sequência selecionada. Será claro àquele versado na técnica que inspeção visual simples de uma sequência de nucleotídeo pode também ser usada para seleção de um local-alvo. Consequentemente, qualquer meio para seleção de local-alvo pode ser usado nos métodos reivindicados.Selection of a cell chromatin sequence for binding by a zinc finger domain (e.g., a target site) may be accompanied, for example, according to the methods disclosed in the same applicant's United States Patent No. 6,453,242 (September 17, 2002), which also discloses methods for assigning ZFPs to bind to a selected sequence. It will be clear to one skilled in the art that simple visual inspection of a nucleotide sequence can also be used to select a target site. Accordingly, any means for target location selection may be used in the claimed methods.

[00119] Os locais-alvo são geralmente compostos de uma pluralidade de sublocais-alvo adjacentes. Um sublocal-alvo se refere à sequência (usualmente, ou um trio de nucleotídeo, ou um quarteto de nucleotídeo, que pode se sobrepor por um nucleotídeo com um quarteto adjacente) ligado por um dedo de zinco individual. Ver, por exemplo, WO 02/077227. Se o trançado com o qual uma proteína de dedo de zinco faz mais contato é designado o filamento-alvo "trançado de reconhecimento primário", ou "trançado de contato primário", algumas proteínas de dedo de zinco se ligam a três trios base no filamento-alvo, e a uma quarta base no trançado de não-alvo. Um local-alvo geralmente tem um comprimento de pelo menos 9 nucleotídeos e, consequentemente, é ligado por um domínio de ligação de dedo de zinco compreendendo pelo menos três apêndices de zinco. Contudo, a ligação de, por exemplo, 4 domínios de ligação de apêndice a 12 locais de alvo de nucleotídeo, 5 domínios de ligação de apêndice a 15 locais de ligação de nucleotídeo, ou 6 domínios de ligação de apêndice a 18 locais-alvo de nucleotídeo, é também possível. Conforme será aparente, a ligação de domínios de ligação maiores (por exemplo, 7-, 8-, 9-apêndice, e mais) a locais de ligação maiores, é também possível.Target sites are generally composed of a plurality of adjacent sub-targets. A sub-target refers to the sequence (usually either a nucleotide trio, or a nucleotide quartet, which may overlap with a nucleotide with an adjacent quartet) linked by an individual zinc finger. See, for example, WO 02/077227. If the braid that a zinc finger protein makes the most contact with is called the "primary recognition braid" or "primary contact braid" target filament, some zinc finger proteins bind to three base trios in the filament. target, and to a fourth base in the non-target braid. A target site generally has a length of at least 9 nucleotides and is consequently linked by a zinc finger binding domain comprising at least three zinc appendages. However, binding of, for example, 4 appendix binding domains to 12 nucleotide target sites, 5 appendix binding domains to 15 nucleotide binding sites, or 6 appendix binding domains to 18 nucleotide target sites. nucleotide is also possible. As will be apparent, binding of larger binding domains (e.g., 7-, 8-, 9-appendix, and more) to larger binding sites is also possible.

[00120] Não é necessário que local-alvo seja um múltiplo de três nucleotídeos. Por exemplo, em casos em que interações de trançado cruzado ocorrem (ver, por exemplo, Patente dos Estados Unidos 6.453.242 e WO 02/077227), um ou mais dos apêndices de zinco individuais de um domínio de ligação de multiapêndice pode se ligar a sublocais de quarteto de sobreposição. Como um resultado, uma proteína de três apêndices pode se ligar a 10 sequências de nucleotídeo, no qual o décimo nucleotídeo é parte de um quarteto ligado por um apêndice terminal, uma proteína de quatro apêndices pode se ligar a 13 sequências de nucleotídeo, no qual o décimo terceiro nucleotídeo é parte de um quarteto ligado por um apêndice terminal, etc.Target site need not be a multiple of three nucleotides. For example, in cases where cross-braided interactions occur (see, for example, U.S. Patent 6,453,242 and WO 02/077227), one or more of the individual zinc appendages of a multi-appendix binding domain may bind. to overlay quartet subplots. As a result, a three appendage protein may bind to 10 nucleotide sequences, in which the tenth nucleotide is part of a quartet linked by a terminal appendage, a four appendage protein may bind to 13 nucleotide sequences, in which the thirteenth nucleotide is part of a quartet linked by a terminal appendix, etc.

[00121] O comprimento e natureza das sequências articuladoras de aminoácido entre apêndices de zinco individuais em um domínio de ligação de multiapêndice também afeta a ligação a uma sequência-alvo. Por exemplo, a presença de um assim denominado "articulador não-canonical", "articulador longo", ou "articulador estruturado", entre apêndices de zinco adjacentes em um domínio de ligação de multiapêndice, pode permitir que aqueles apêndices se liguem a sublocais que não são imediatamente adjacentes. Exemplos não-limitativos de tais articuladores são descritos, por exemplo, na Patente dos Estados Unidos N° 6.479.626 e WO 01/53480. Consequentemente, um ou mais sublocais, em um local-alvo para um domínio de ligação de dedo de zinco, podem ser separados um do outro por 1, 2, 3, 4, 5 ou mais nucleotídeos. Para proporcionar, porém, um exemplo, um domínio de ligação de quatro apêndices pode se ligar a um local-alvo de 13 nucleotídeos compreendendo, em sequência, dois sublocais de 3 nucleotídeos contíguos, um nucleotídeo de intervenção, e dois sublocais de trios contíguos.The length and nature of amino acid linker sequences between individual zinc appendages in a multi-appendix binding domain also affect binding to a target sequence. For example, the presence of a so-called "noncanonical articulator", "long articulator", or "structured articulator" between adjacent zinc appendages in a multi-appendage binding domain may allow those appendages to bind to subplaces that they are not immediately adjacent. Non-limiting examples of such articulators are described, for example, in United States Patent No. 6,479,626 and WO 01/53480. Consequently, one or more subplots, at a target site for a zinc finger binding domain, may be separated from one another by 1, 2, 3, 4, 5 or more nucleotides. To provide one example, however, a four-appendage binding domain may bind to a 13-nucleotide target site comprising, in sequence, two contiguous 3 nucleotide sublocals, one intervention nucleotide, and two contiguous triage sublocals.

[00122] A distância entre sequências (por exemplo, locais-alvo) se refere ao número de nucleotídeos ou par de nucleotídeoss que intervém entre duas sequências, conforme medida a partir das bordas das sequências mais próximas uma da outra.Sequence distance (e.g., target sites) refers to the number of nucleotides or nucleotide pair intervening between two sequences, as measured from the edges of the sequences closest to one another.

[00123] Em certas concretizações em que divagem depende da ligação de dois domínios de dedo de zinco/moléculas de fusão de meio-domínio de divagem para separar locais-alvo, os dois locaís-alvo podem estar em trançados de DNA opostos. Em outras concretizações, ambos locais-alvo estão no mesmo trançado de DNA. Domínios de Ligação de Dedo de zinco [00124] Um domínio de ligação de dedo de zinco compreende um ou mais apêndices de zinco. Miller etal, (1985) EMBO J, 4:1609-1614; Rhodes (1993) Scientific American Feb.:56-65; Patente dos Estados Unidos N° 6.453,242, Tipicamente, um domínio simples de dedo de zinco é de cerca de 30 aminoácidos de comprimento. Estudos estruturais têm demonstrado que cada domínio de dedo de zinco (motivo) contém duas folhas beta (mantidas em uma volta beta que contém os dois resíduos de cisteína invariantes), e uma espiral alfa (contendo os dois resíduos de histidina invariantes), que são mantidas em uma conformação particular através da coordenação de um átomo de zinco pelas duas cisteínas e as duas histidinas.In certain embodiments where splitting relies on the binding of two zinc finger domains / splitting half-domain fusion molecules to separate target sites, the two target loci may be in opposite DNA strands. In other embodiments, both target sites are on the same strand of DNA. Zinc Finger Binding Domains A zinc finger binding domain comprises one or more zinc appendages. Miller etal, (1985) EMBO J, 4: 1609-1614; Rhodes (1993) Scientific American Feb.:56-65; United States Patent No. 6,453,242. Typically, a single zinc finger domain is about 30 amino acids in length. Structural studies have shown that each zinc finger domain (motif) contains two beta sheets (held on a beta loop that contains the two invariant cysteine residues), and an alpha spiral (containing the two invariant histidine residues), which are maintained in a particular conformation by the coordination of a zinc atom by the two cysteines and the two histidines.

[00125] Apêndices de zinco incluem ambos apêndices de zinco canonicais C2H2 (isto é, aqueles em que o íon de zinco é coordenado por dois resíduos de cisteína e histidina), e apêndices de zinco não-canonicais, tais como, por exemplo, apêndices de zinco C3H (aqueles em que o íon de zinco é coordenado por três resíduos de cisteína e um resíduo de histidina), e apêndices de zinco C4 (aqueles em que o íon de zinco é coordenado por quatro resíduos de cisteína). Ver também WO 02/057293.Zinc appendices include both canonical C2H2 zinc appendices (ie those in which the zinc ion is coordinated by two cysteine and histidine residues), and non-canonical zinc appendages such as, for example, appendices. zinc C3H (those where the zinc ion is coordinated by three cysteine residues and one histidine residue), and C4 zinc appendices (those where the zinc ion is coordinated by four cysteine residues). See also WO 02/057293.

[00126] Os domínios de ligação de dedo de zinco podem ser projetados para se ligarem a uma sequência de escolha. Ver, por exemplo, Beerli et ai. (2002) N ature BiotechnoL 20:135-141; Rabo et ai. (2001) Am. Rev. Biochem. 70:313-340; Isalan et ai. (2001) Nature BiotechnoL 19:656-660; Segai et af. (2001) Curr. Opín. Biotechnoi. 12:632-637; Choo etal. (2000) Curr. Opin. Struct. Biol. 10:411-416. Um domínio de ligação de dedo de zinco projetado pode ter uma especificidade de ligação, comparada a uma proteína de dedo de zinco que ocorre naturalmente. Os métodos de projeto incluem, mas não estão limitados a, desenho racional e vários tipos de seleção. O desenho racional inclui, por exemplo, uso de bases de dados compreendendo trio (ou quarteto) de sequências de nucleotídeo e sequência de dedo de zinco individual de aminoácidos, em que cada trio ou quarteto de sequências de nucleotídeo está associado com uma ou mais sequências de aminoácidos de apêndices de zinco que se ligam ao trio ou quarteto particular de sequência. Ver, por exemplo, Patentes dos Estados Unidos da requerente N° 6.453.242 e 6.534.261. Métodos de desenho adicionais são revelados, por exemplo, nas Patentes dos Estados Unidos 6.746.838; 6.785.613; 6.866.997; e 7.030.215.Zinc finger binding domains can be designed to bind to a sequence of choice. See, for example, Beerli et al. (2002) Nature BiotechnoL 20: 135-141; Rabo et al. (2001) Am. Rev. Biochem. 70: 313-340; Isalan et al. (2001) Nature Biotechnol 19: 656-660; Segai et af. (2001) Curr. Op. Biotechnoi. 12: 632-637; Choo etal. (2000) Curr. Opin. Struct. Biol. 10: 411-416. A designed zinc finger binding domain can have a binding specificity compared to a naturally occurring zinc finger protein. Design methods include, but are not limited to, rational design and various types of selection. Rational design includes, for example, use of databases comprising nucleotide sequence trio (or quartet) and individual amino acid zinc finger sequence, wherein each trio or quartet of nucleotide sequences is associated with one or more sequences. amino acids from zinc appendages that bind to the particular trio or quartet of sequence. See, for example, U.S. Patent Nos. 6,453,242 and 6,534,261. Additional design methods are disclosed, for example, in United States Patents 6,746,838; 6,785,613; 6,866,997; and 7,030,215.

[00127] Métodos de seleção exemplares, incluindo descrição de fago e sistemas de dois-híbridos, são revelados na Patente dos Estados Unidos 5.789.538; 5.925.523; 6.007.988; 6.013.453; 6.410.248; 6.140.466; 6.200.759; e 6.242.568; bem como WO 98/37186; WO 98/53057; WO 00/27878; WO 01/88197 e GB 2,338,237.Exemplary selection methods, including phage description and two-hybrid systems, are disclosed in United States Patent 5,789,538; 5,925,523; 6,007,988; 6,013,453; 6,410,248; 6,140,466; 6,200,759; and 6,242,568; as well as WO 98/37186; WO 98/53057; WO 00/27878; WO 01/88197 and GB 2,338,237.

[00128] A intensificação de especificidade de ligação para domínio de ligação de apêndices de zinco foi descrita, por exemplo, na Patente dos Estados Unidos da mesma requerente N° 6.794.136.The enhancement of binding specificity for zinc appendage binding domain has been described, for example, in U.S. Patent No. 6,794,136.

[00129] Desde que um dedo de zinco individual se ligue a uma sequência de três nucleotídeos (isto é, trio) (ou uma sequência de quatro nucleotídeos que se sobrepõe, por um nucleotídeo, com o quarto local de ligação de nucleotídeo de um dedo de zinco adjacente), o comprimento de uma sequência a qual um domínio de ligação de dedo de zinco é projetado para se ligar (por exemplo, uma sequência-alvo) determinará o número de apêndices de zinco em um domínio de ligação de dedo de zinco projetado. Por exemplo, para ZFPs em que os motivos de apêndice não se ligam a sublocais de sobreposição, uma sequência-alvo de seis nucleotídeos é ligada por um domínio de ligação de três apêndices; uma sequência-alvo de nove nucleotídeos é ligada por um domínio de ligação de três apêndices, etc. Conforme notado aqui, locais de ligação para apêndices de zinco individuais (isto é, sublocais) em um local-alvo não necessita ser contíguo, mas pode ser separado por um ou vários nucleotídeos, dependendo do comprimento e natureza das sequências de aminoácidos entre os apêndices de zinco (isto é, os articuladores de interapêndice) em um domínio de ligação de apêndice.Provided that an individual zinc finger binds to a three nucleotide sequence (i.e. trio) (or a four nucleotide sequence that overlaps with a nucleotide with the fourth nucleotide binding site of a finger) adjacent zinc), the length of a sequence to which a zinc finger binding domain is designed to bind (for example, a target sequence) will determine the number of zinc appendages in a zinc finger binding domain. designed. For example, for ZFPs where appendix motifs do not bind to overlapping sublocals, a six nucleotide target sequence is bound by a three appendage binding domain; a nine nucleotide target sequence is linked by a three appendage binding domain, etc. As noted herein, binding sites for individual (i.e. subclocal) zinc appendages at a target site need not be contiguous, but may be separated by one or more nucleotides, depending on the length and nature of amino acid sequences between the appendages. of zinc (ie inter-appendage articulators) in an appendix binding domain.

[00130] Em um domínio de ligação de dedo de zinco de multiapêndice, apêndices de zinco adjacentes podem ser separados por sequências articuladoras de aminoácido de aproximadamente 5 aminoácidos (assim denominadas articuladores interapêndice "canonicais") ou, alternativamente, por um ou mais articuladores não-canonicais. Ver, por exemplo, Patentes dos Estados Unidos da mesma requerente N°s 6.453.242 e 6.534.261. Para domínio de ligação de apêndices de zinco projetado compreendendo mais do que três apêndices, inserção de aticuladores de interapêndice mais longos ("não-canonicais") entre certos dos apêndices de zinco podem ser preferidos, visto que pode aumentar a afinidade e/ou especificidade de ligação pelo domínio de ligação. Ver, por exemplo, Patente dos Estados Unidos N° 6.479.626 e WO 01/53480. Consequentemente, domínio de ligação de apêndices de zinco de multiapêndice pode também ser caracterizado com relação a presença e localização de articuladores de interapêndice não-canonicais. Por exemplo, um domínio de ligação de dedo de zinco de seis apêndices compreendendo três apêndices (unidos por dois articuladores de interapêndice canonicais), um articulador longo, e três apêndices adicionais (unidos por dois articuladores de interapêndice canonicais) é denotado uma configuração 2x3. Similarmente, um domínio de ligação compreendendo dois apêndices (com um articulador canonical entre estes), um articulador longo, e dois apêndices adicionais (unidos por um articulador canonical), é denotado uma proteína 2x2. Uma proteína compreendendo três unidades de dois apêndices (em cada uma da qual os dois apêndices são unidos por um articulador canonical), e em que cada unidade de dois apêndices é unida a duas unidades de apêndice adjacentes por um articulador longo, é referida como uma proteína 3x2.In a multi-appendix zinc finger-binding domain, adjacent zinc appendages may be separated by approximately 5 amino acid linker amino acid sequences (so-called "canonical" inter-appendage linkers) or, alternatively, by one or more non-linkers. -canonicals. See, for example, U.S. Patent Nos. 6,453,242 and 6,534,261. For designed zinc appendage binding domain comprising more than three appendages, insertion of longer ("non-canonical") interappendicular aticulators between certain of the zinc appendages may be preferred as it may increase affinity and / or specificity. binding by the binding domain. See, for example, United States Patent No. 6,479,626 and WO 01/53480. Consequently, the multiappendix zinc appendage binding domain can also be characterized with respect to the presence and location of non-canonical interappendix articulators. For example, a six-appended zinc finger binding domain comprising three appendages (joined by two canonical inter-appendage articulators), one long articulator, and three additional appendages (joined by two canonical interappex articulators) is denoted a 2x3 configuration. Similarly, a binding domain comprising two appendages (with a canonical articulator between them), a long articulator, and two additional appendages (joined by a canonical articulator), is denoted a 2x2 protein. A protein comprising three units of two appendages (each of which the two appendages are joined by a canonical articulator), and in which each unit of two appendages is joined to two adjacent appendix units by a long articulator, is referred to as one. 3x2 protein.

[00131] A presença de um articulador interapêndice não-conical entre dois apêndices de zinco adjacentes em um domínio de ligação de multiapêndice frequentemente permite que os dois apêndices se liguem a sublocais que não são imediatamente contíguos na sequência-alvo. Consequentemente, podem existir folgas de um ou mais nucleotídeos entre sublocais em um local-alvo; isto é, um local-alvo pode conter um ou mais nucleotídeos que não são contactados por um dedo de zinco. Por exemplo, um domínio de ligação de dedo de zinco 2x2 pode se ligar a duas sequências de seis nucleotídeos separados por um nucleotídeo, isto é, ele se liga a um local-alvo de 13 nucleotídeos. Ver também Moore et ai. (2001a) Proc. Natl. Acad. Sei. USA 98:1432-1436; Moore et ai. (2001b) Proc. Natl. Acad. Sei. USA 98:1437-1441 e WO 01/53480.[00131] The presence of a nonconical inter-appendage articulator between two adjacent zinc appendages in a multi-appendix binding domain often allows the two appendages to bind to subclasses that are not immediately contiguous in the target sequence. Consequently, there may be gaps in one or more nucleotides between sub-sites at a target site; that is, a target site may contain one or more nucleotides that are not contacted by a zinc finger. For example, a 2x2 zinc finger binding domain can bind to two six nucleotide sequences separated by one nucleotide, that is, it binds to a 13 nucleotide target site. See also Moore et al. (2001a) Proc. Natl. Acad. Know. USA 98: 1432-1436; Moore et al. (2001b) Proc. Natl. Acad. Know. USA 98: 1437-1441 and WO 01/53480.

[00132] Conforme mencionado anteriormente, um sublocal-alvo é uma sequência de três ou quatro nucleotídeos que é ligada por um dedo de zinco simples. Para certas propostas, uma unidade de dois apêndices é denotada um módulo de ligação. Um módulo de ligação pode ser obtido por, por exemplo, seleção de dois apêndices adjacentes no contexto de uma proteína de multiapêndice (geralmente três apêndices) que se ligam a seis sequências de nucleotídeo alvo particulares. Alternativamente, módulos podem ser construídos por montagem de apêndices de zinco individuais. Ver também WO 98/53057 e WO 01/53480, Domínios de Clivagem [00133] A porção de domínio de divagem das proteínas de fusão aqui revelada pode ser obtida de qualquer endonudease ou exonuclease. Endonudeases exemplares da qual um domínio de divagem pode ser derivado incluem, mas não estão limitadas a, endonudeases de restrição endonudeases auto-direcionais. Ver, por exemplo, Catálogo 2002-2003, New England Biolabs, Beverly, MA; e Belfort et ai. (1997} Acíd nudeics Res. 25:3379-3388, Enzimas adicionais que clivam DNA são conhecidas (por exemplo, S1 Nuclease; nuclease de feijão mung; DNase I pancreática; nuclease micrococcal; levedura HO endonudease; ver também Línn et al. (eds.) Nudeases, Cold Spring Harbor Labo rato ry Press, 1993), Uma ou mais destas enzimas (ou fragmentos funcionais destas) podem ser usadas como uma fonte de domínios de clivagem e meios-domínios de divagem.As mentioned earlier, a sub-target is a three- or four-nucleotide sequence that is linked by a single zinc finger. For certain proposals, a two-appended unit is denoted a connector module. A binding module can be obtained by, for example, selecting two adjacent appendages in the context of a multi-appendix protein (usually three appendages) that bind to six particular target nucleotide sequences. Alternatively, modules may be constructed by mounting individual zinc appendages. See also WO 98/53057 and WO 01/53480, Cleavage Domains The domain-splice portion of the fusion proteins disclosed herein can be obtained from any endonudease or exonuclease. Exemplary endonudeases from which a dividing domain may be derived include, but are not limited to, self-directional restriction endonudeases. See, for example, Catalog 2002-2003, New England Biolabs, Beverly, MA; and Belfort et al. (1997} Acid nudeics Res. 25: 3379-3388, Additional DNA cleaving enzymes are known (e.g., S1 Nuclease; Mung bean nuclease; Pancreatic DNase I; micrococcal nuclease; HO endonudease yeast; see also Lingun et al. ( eds.) Nudeases, Cold Spring Harbor Labyrous Press, 1993), One or more of these enzymes (or functional fragments thereof) may be used as a source of cleavage domains and dividing half-domains.

[00134] Similarmente, um meio-domínio de divagem {por exemplo, proteínas de fusão compreendendo um domínio de ligação de dedo de zinco e um meio-domínio de divagem) pode ser derivado de qualquer nuclease ou porção desta, conforme colocado acima, que requer dimerização para atividade de divagem. Em geral, duas proteínas de fusão são requeridas para divagem se as proteínas de fusão compreendem meios-domínios de clivagem. Alternativamente, uma proteína simples compreendendo dois meios-domínios de clivagem pode ser usada. Os dois meios-domínios de divagem podem ser derivados da mesma endonudease (ou fragmentos funcionais desta), ou cada meio-domínio de clivagem pode ser derivado de uma endonudease diferente (ou fragmentos funcionais desta). Em adição, os locais-alvo para as duas proteínas de fusão são preferivelmente dispostos, um em relação ao outro, tal que a ligação das duas proteínas de fusões a seus respectivos locais ocorre nos meios-domínios de divagem em uma orientação espacial a cada outro, que permite que os meios-domínios de divagem formem um domínio de divagem funcional, por exemplo, por dimerização. Desse modo, em certas concretizações, as bordas próximas dos locais-alvo são separadas por 5-8 nucleotídeos, ou por 15-18 nucleotídeos. Contudo, qualquer número integral de nucleotídeos ou par de nucleotídeos pode intervir entre dois locais-alvo (por exemplo, de 2 a 50 nucleotídeos, ou mais). Em geral, o ponto de divagem ocorre entre os locais-alvo.Similarly, a dividing half-domain (e.g., fusion proteins comprising a zinc finger binding domain and a dividing half-domain) may be derived from any nuclease or portion thereof as set forth above which requires dimming for diving activity. In general, two fusion proteins are required for splitting if the fusion proteins comprise cleavage half domains. Alternatively, a simple protein comprising two cleavage half domains may be used. The two splitting half-domains may be derived from the same endonudease (or functional fragments thereof), or each cleavage half-domain may be derived from a different endonudease (or functional fragments thereof). In addition, the target sites for the two fusion proteins are preferably disposed relative to one another such that the binding of the two fusion proteins to their respective sites occurs at the half-spacing domains in a spatial orientation to each other. , which allows the splitting half-domains to form a functional splitting domain, for example by dimerization. Thus, in certain embodiments, the edges near the target sites are separated by 5-8 nucleotides, or by 15-18 nucleotides. However, any integral number of nucleotides or nucleotide pairs can intervene between two target sites (e.g., 2 to 50 nucleotides or more). In general, the dividing point occurs between the target locations.

[00135] Endonucleases de restrição (enzimas de restrição) estão presentes em muitas espécies e são capazes de ligação específica de sequência a DNA (em um local de reconhecimento), e divagem de DNA em ou perto do local de ligação. Certas enzimas de restrição (por exemplo, Tipo IIS) clivam DNA em locais removidos a partir do local de reconhecimento, e têm ligação separável e domínios de divagem. Por exemplo, a enzima Tipo IIS Fok I catalisa divagem de filamento duplo de DNA, em 9 nucleotídeos de seu local de reconhecimento em um trançado e 13 nucleotídeos de seu local de reconhecimento no outro. Ver, por exemplo, Patente dos Estados Unidos 5.356.802; 5.436.150 e 5.487.994; bem como Li et al. (1992) Proc. Natl. Acad. Sei. USA 89:4275-4279; Li et al. (1993) Proc. Natl. Acad. Sei. USA 90:2764-2768; Kim et al. (1994a) Proc. Natl. Acad. Sei. USA 91:883-887; Kim et al. (1994b) J. Biol. Chem. 269:31,978-31,982. Desse modo, em uma concretização, proteínas de fusão compreendem o domínio de divagem (ou meio-domínio de divagem) de pelo menos uma enzima de restrição Tipo IIS e um ou mais domínios de ligação de apêndices de zinco, que podem ou não serem projetados.Restriction endonucleases (restriction enzymes) are present in many species and are capable of sequence-specific DNA binding (at a recognition site), and DNA dividing at or near the binding site. Certain restriction enzymes (eg, Type IIS) cleave DNA at sites removed from the recognition site, and have detachable binding and splitting domains. For example, the IIS Fok I Type enzyme catalyzes double stranded DNA splitting into 9 nucleotides from its recognition site in one braid and 13 nucleotides from its recognition site in the other. See, for example, United States Patent 5,356,802; 5,436,150 and 5,487,994; as well as Li et al. (1992) Proc. Natl. Acad. Know. USA 89: 4275-4279; Li et al. (1993) Proc. Natl. Acad. Know. USA 90: 2764-2768; Kim et al. (1994a) Proc. Natl. Acad. Know. USA 91: 883-887; Kim et al. (1994b) J. Biol. Chem. 269: 31.978-31.982. Thus, in one embodiment, fusion proteins comprise the dividing domain (or dividing half-domain) of at least one IIS Type restriction enzyme and one or more zinc appendage binding domains, which may or may not be designed. .

[00136] Uma enzima de restrição Tipo IIS exemplar, cujo domínio de divagem é separável a partir do domínio de ligação, é Fok I. Esta enzima particular é ativa como um dímero. Bitinaite et al. (1998) Proc.An exemplary IIS Type restriction enzyme, whose dividing domain is separable from the binding domain, is Fok I. This particular enzyme is active as a dimer. Bitinaite et al. (1998) Proc.

Natl. Acad. Sei. USA 95: 10,570-10,575. Consequentemente, para a proposta da presente descrição, a porção da enzima Fok I usada nas proteínas de fusão reveladas é considerada um meio-domínio de divagem. Desse modo, para divagem de filamento duplo alvo e/ou reposição alvo de sequências celulares usando fusões de dedo de zinco-Fo/c I, duas proteínas de fusão, cada uma compreendendo um meio-domínio de divagem Fok\, podem ser usadas para reconstituir um domínio de divagem cataliticamente ativo. Alternativamente, uma molécula de polipeptídeo simples contendo um domínio de ligação de dedo de zinco e dois meios-domínios de divagem Fok\ pode também ser usada. Parâmetros para clivagem-alvo e alteração de sequência-alvo usando dedo de zinco-fusões de Fok I são providos em qualquer lugar nesta descrição.Natl. Acad. Know. USA 95: 10,570-10,575. Accordingly, for the purpose of the present disclosure, the portion of the Fok I enzyme used in the disclosed fusion proteins is considered a dividing half-domain. Thus, for double-stranded targeting and / or targeting of cell sequences using zinc-Fo / c I finger fusions, two fusion proteins, each comprising a Fok1-dividing half-domain, can be used to reconstitute a catalytically active dialing domain. Alternatively, a single polypeptide molecule containing a zinc finger binding domain and two Fok1 splitting half-domains may also be used. Parameters for target cleavage and target sequence alteration using Fok I zinc finger fusions are provided anywhere in this description.

[00137] Um domínio de divagem ou meio-domínio de divagem pode ser qualquer porção de uma proteína que retém atividade de divagem, ou que retém a capacidade de multimerizar (por exemplo, dimerizar) para formar um domínio de divagem funcional.A split domain or split half domain can be any portion of a protein that retains dividing activity, or that retains the ability to multimerize (e.g., dimerize) to form a functional divide domain.

[00138] Enzimas de restrição Tipo IIS exemplares são listadas na Tabela 1. Enzimas de restrição adicionais também contêm ligação e domínios de divagem separáveis, e estas são contempladas pela presente descrição. Ver, por exemplo, Roberts et al. (2003) Acid nucleics Res. 31:418-420.Exemplary IIS Type restriction enzymes are listed in Table 1. Additional restriction enzymes also contain linkage and separable splitting domains, and these are contemplated by the present disclosure. See, for example, Roberts et al. (2003) Acid nucleics Res. 31: 418-420.

Tabela 1: Algumas Enzimas de Restrição Tipo IIS Aar I BsrB I SspD51 Ace III BsrDI Sth1321 Aci I BstF51 Sts ITable 1: Some Restriction Enzymes Type IIS Aar I BsrB I SspD51 Ace III BsrDI Sth1321 Aci I BstF51 Sts I

Alo I Btr I TspDT IHello I Btr I TspDT I

Bae I Bts I TspGW IBae I Bts I TspGW I

Bbr71 Cdi I Tth11111 Bbv I CjeP I UbaP IBbr71 Cdi I Tth11111 Bbv I CjeP I UbaP I

Bbv II Drd II Bsa IBbv II Drd II Bsa I

BbvC I Eci I BsmB IBbvC I Eci I BsmB I

Bcc I Eco31 IBcc I Eco31 I

Bce83 I Eco57 IBce83 I Eco57 I

BceA I Eco57M IBceA I Eco57M I

Bcef I Esp3 IBcef I Esp3 I

Bcg I Fau IBcg I Fau I

BciV I Fin IBciV I Fin I

Bfi I Fok IBfi I Fok I

Bin I Gdi IIBin I Gdi II

Bmg I Gsu IBmg I Gsu I

Bpu10 I Hga IBpu10 I Hga I

BsaX I Hin4 IIBsaX I Hin4 II

Bsb I HphIBsb I HphI

BscA I Ksp632 IBscA I Ksp632 I

BscG I Mbo IIBscG I Mbo II

BseR I Mly IBseR I Mly I

BseY I Mme IBseY I Mme I

Bsi I ΜπΙ IBsi I

Bsml Pfl 1108 IBsml Pfl 1108 I

BsmA I Ple IBsmA I Ple I

BsmF I Ppi IBsmF I Ppi I

Bsp24 I Psr IBsp24 I Psr I

BspG I RleA IBspG I RleA I

BspM I Sap IBspM I Sap I

BspNC I SfaN IBspNC I SfaN I

Bsr I Sim IBsr I Yes I

Domínio de Dedo de zinco-fusões de Domínio de divagem [00139] Métodos para delineação e construção de proteínas de fusão (e polínucleotídeos que codificam as mesmas) são conhecidos àqueles versados na técnica. Por exemplo, métodos para a delineação e construção de proteína de fusão compreendendo proteínas de dedo de zinco (e polinucleotídeos que codificam as mesmas) são descritos nas Patentes dos Estados Unidos da mesma requerente 6.453.242 e 6.534.261. Em certas concretizações, polinucleotídeos que codificam tais proteínas de fusões são construídos. Estes polinucleotídeos podem ser inseridos em um vetor e o vetor pode ser introduzido em uma célula (ver abaixo para a descrição adicional com relação a vetores e métodos para introdução de polinucleotídeos em células).Diving Domain Zinc Finger-Mergers Domain Methods for delineating and constructing fusion proteins (and polynucleotides encoding them) are known to those skilled in the art. For example, methods for fusion protein delineation and construction comprising zinc finger proteins (and polynucleotides encoding them) are described in the same United States Patents 6,453,242 and 6,534,261. In certain embodiments, polynucleotides encoding such fusion proteins are constructed. These polynucleotides may be inserted into a vector and the vector may be introduced into a cell (see below for further description regarding vectors and methods for introducing polynucleotides into cells).

[00140] Em certas concretizações dos métodos aqui descritos, uma proteína de fusão compreende um domínio de ligação de dedo de zinco e um meio-domínio de divagem a partir da enzima de restrição Fok I, e duas tais proteínas de fusão são expressas em uma célula. A expressão de duas proteínas de fusões em uma célula pode resultar da distribuição de duas das proteínas para a célula; distribuição de uma proteína e um ácido nucléico que codifica uma das proteínas para a célula; distribuição de dois ácidos nucléicos, cada um que codifica uma das proteínas para a célula; ou por distribuição de um ácido nucléico simples, que codifica ambas proteínas para a célula. Em concretizações adicionais, uma proteína de fusão compreende uma cadeia de polipeptídeo simples compreendendo dois meios-domínios de divagem e um domínio de ligação de dedo de zinco. Neste caso, uma proteína de fusão simples é expressa em uma célula e, sem desejar estar ligado pela teoria, acredita-se clivar DNA como um resultado de formação de um dímero intramolecular dos meios-domínios de divagem.In certain embodiments of the methods described herein, a fusion protein comprises a zinc finger binding domain and a dividing half-domain from the restriction enzyme Fok I, and two such fusion proteins are expressed in one fusion protein. cell. Expression of two fusion proteins in a cell may result from the distribution of two of the proteins to the cell; delivery of a protein and nucleic acid encoding one of the proteins to the cell; distribution of two nucleic acids, each encoding one of the proteins to the cell; or by delivery of a single nucleic acid, which encodes both proteins to the cell. In further embodiments, a fusion protein comprises a single polypeptide chain comprising two splitting half-domains and a zinc finger binding domain. In this case, a single fusion protein is expressed in a cell and, without wishing to be bound by theory, is believed to cleave DNA as a result of formation of an intramolecular dimer of the dividing half domains.

[00141] Em certas concretizações, os componentes das proteínas de fusão (por exemplo, fusões de ZFP-Fok I) são dispostos tal que o domínio de dedo de zinco está mais perto do terminal amino da proteína de fusão, e o meio-domínio de divagem está mais perto do terminal carbóxi. Isto espelha a orientação relativa do domínio de divagem em domínios de divagem de dimerização que ocorrem naturalmente, tais como aqueles derivados da enzima Fok I, em que o domínio de ligação de DNA está mais perto do terminal amino, e o meio-domínio de divagem está mais perto do terminal carbóxi. Nestas concretizações, a dimerização dos meios-domínios de divagem para formar uma nuclease funcional é provida pela ligação das proteínas de fusão em locais nos trançados de DNA opostos, com as extremidades 5’ dos locais de ligação sendo proximais um ao outro.In certain embodiments, the fusion protein components (e.g., ZFP-Fok I fusions) are arranged such that the zinc finger domain is closer to the amino terminus of the fusion protein, and the half domain of divagem is closer to the carboxy terminal. This mirrors the relative orientation of the splitting domain in naturally occurring dimerization splitting domains, such as those derived from the Fok I enzyme, where the DNA binding domain is closer to the amino terminus, and the dividing half-domain. is closer to the carboxy terminal. In these embodiments, the dimerization of the dividing half-domains to form a functional nuclease is provided by the binding of fusion proteins to sites on opposite DNA strands, with the 5 'ends of the binding sites being proximal to one another.

[00142] Em concretizações adicionais, os componentes das proteínas de fusão (por exemplo, fusões de ZFP-Fok I) são dispostos tal que o meio-domínio de divagem está mais perto do terminal amino da proteína de fusão, e o domínio de dedo de zinco está mais perto do terminal carbóxi. Nestas concretizações, a dimerização dos meios-domínios de divagem para formar uma nuclease funcional é provida pela ligação das proteínas de fusão a locais nos trançados de DNA opostos, com as extremidades 3’ dos locais de ligação sendo proximais um ao outro.In further embodiments, the fusion protein components (e.g., ZFP-Fok I fusions) are arranged such that the dividing half domain is closer to the amino terminus of the fusion protein, and the finger domain zinc is closer to the carboxy terminal. In these embodiments, the dimerization of the dividing half-domains to form a functional nuclease is provided by the binding of fusion proteins to sites on opposite DNA strands, with the 3 'ends of the binding sites being proximal to one another.

[00143] Em concretizações ainda adicionais, uma primeira proteína de fusão contém o meio-domínio de divagem mais perto do terminal amino da proteína de fusão, e o domínio de dedo de zinco mais perto do terminal carbóxi, e uma segunda proteína de fusão é disposta, tal que o domínio de dedo de zinco está mais perto do terminal amino da proteína de fusão, e o meio-domínio de divagem está mais perto do terminal carbóxi. Nestas concretizações, ambas proteínas de fusão se ligam ao mesmo trançado de DNA, com o local de ligação da primeira proteína de fusão contendo o domínio de dedo de zinco mais perto do terminal carbóxi localizado no lado 5’ do local de ligação da segunda proteína de fusão contendo o domínio de dedo de zinco mais perto do terminal amino.In still further embodiments, a first fusion protein contains the divider half-domain closest to the amino terminus of the fusion protein, and the zinc finger domain closest to the carboxy terminus, and a second fusion protein is disposed such that the zinc finger domain is closer to the amino terminus of the fusion protein, and the dividing half-domain is closer to the carboxy terminus. In these embodiments, both fusion proteins bind to the same DNA strand, with the first fusion protein binding site containing the zinc finger domain closest to the carboxy terminal located on the 5 'side of the second fusion protein binding site. fusion containing the zinc finger domain closest to the amino terminus.

[00144] Em certas concretizações, as proteínas de fusão reveladas, a sequência de aminoácido entre o domínio de dedo de zinco e o domínio de divagem (ou meio-domínio de divagem) é denotado o "artículador ZC". O artículador ZC é para ser distinguido dos articuladores de interapêndice discutidos acima. Ver, por exemplo, Publicações de Patente dos Estados Unidos 20050064474A1 e 20030232410, e Publicação de Patente Internacional W005/084190, para detalhes na obtenção de articuladores ZC que otimizam divagem. Métodos para Clivaqem-alvo [00145] Os métodos e composições revelados podem ser usados para clivar DNA em uma região de interesse em cromatina celular (por exemplo, em um local desejado ou predeterminado em um genoma, por exemplo, em um gene, ou mutante, ou tipo selvagem). Para tal divagem de DNA alvo, um domínio de ligação de dedo de zinco é projetado para se ligar a um local-alvo em ou perto do local de divagem predeterminado, e uma proteína de fusão compreendendo o domínio de ligação de dedo de zinco projetado, e um domínio de divagem é expresso em uma célula. Após ligação da porção de dedo de zinco da proteína de fusão ao local-alvo, o DNA é clívado perto do local-alvo pelo domínio de divagem. O local exato de divagem pode depender do comprimento do artículador ZC.In certain embodiments, the fusion proteins disclosed, the amino acid sequence between the zinc finger domain and the dividing domain (or half-dividing domain) is referred to as the "ZC linker". The ZC articulator is to be distinguished from the interappendix articulators discussed above. See, for example, United States Patent Publications 20050064474A1 and 20030232410, and International Patent Publication W005 / 084190, for details on obtaining divan optimizing ZC articulators. Methods for Target Cleavage The disclosed methods and compositions may be used to cleave DNA in a region of interest in cellular chromatin (for example, at a desired or predetermined location in a genome, for example, in a gene, or mutant). , or wild type). For such target DNA splitting, a zinc finger binding domain is designed to bind to a target site at or near the predetermined dividing site, and a fusion protein comprising the designed zinc finger binding domain, and a divide domain is expressed in a cell. Upon binding of the zinc finger portion of the fusion protein to the target site, DNA is cleaved near the target site by the dividing domain. The exact dividing location may depend on the length of the ZC handler.

[00146] Alternativa mente, duas proteínas de fusão, cada uma compreendendo um domínio de ligação de dedo de zinco e um meio-domínio de divagem, são expressas em uma célula, e se ligam a locais-alvo que são justapostos em tal modo que um domínio de divagem funcional é reconstituído, e DNA é clivado na vizinhança dos locais-alvo. Em uma concretização, divagem ocorre entre os locais-alvo dos dois domínios de ligação de dedo de zincos. Um ou ambos dos domínios de ligação de dedo de zinco podem ser projetados.Alternatively, two fusion proteins, each comprising a zinc finger binding domain and a dividing half domain, are expressed in a cell, and bind to target sites that are juxtaposed in such a way that a functional dividing domain is reconstituted, and DNA is cleaved in the vicinity of the target sites. In one embodiment, splitting occurs between the target sites of the two zinc finger binding domains. One or both of the zinc finger binding domains may be designed.

[00147] Para clivagem-alvo usando um domínio de ligação de dedo de zinco-polipeptídeo de fusão de domínio de divagem, o local de ligação pode envolver o local de divagem, ou a borda próxima do local de ligação pode ser 1, 2, 3, 4, 5, 6, 10, 25, 50 ou mais nucleotídeos (ou qualquer valor integral entre 1 e 50 nucleotídeos) a partir do local de divagem. A localização exata do local de ligação com relação ao local de divagem, dependerá do domínio de divagem particular, e do comprimento do articulador ZC. Para métodos no qual dois polipeptídeos de fusão, cada um compreendendo um domínio de ligação de dedo de zinco e um meio-domínio de divagem, são usados, os locais de ligação geralmente se estendem no local de divagem. Desse modo, a borda perto do primeiro local de ligação pode ser 1, 2, 3, 4, 5, 6, 10, 25 ou mais nucleotídeos (ou qualquer valor integral entre 1 e 50 nucleotídeos), um em um lado do local de divagem, e a borda perto do segundo local de ligação pode ser 1, 2, 3, 4, 5, 6, 10, 25 ou mais nucleotídeos (ou qualquer valor integral entre 1 e 50 nucleotídeos), no outro lado do local de divagem. Métodos para mapear locais de divagem in vitro e in vivo são conhecidos àqueles versados na técnica.For target cleavage using a zinc-finger binding domain-domain-splice fusion polypeptide, the binding site may involve the divider site, or the proximal edge of the binding site may be 1, 2, 3, 4, 5, 6, 10, 25, 50 or more nucleotides (or any integer between 1 and 50 nucleotides) from the divider site. The exact location of the binding site with respect to the divider location will depend on the particular divider domain, and the length of the ZC pivot. For methods in which two fusion polypeptides, each comprising a zinc finger binding domain and a split half domain, are used, the binding sites generally extend at the split site. Thus, the border near the first binding site may be 1, 2, 3, 4, 5, 6, 10, 25 or more nucleotides (or any integral value between 1 and 50 nucleotides), one on one side of the binding site. and the border near the second binding site may be 1, 2, 3, 4, 5, 6, 10, 25 or more nucleotides (or any integer between 1 and 50 nucleotides) on the other side of the dividing site. . Methods for mapping in vitro and in vivo dividing sites are known to those skilled in the art.

[00148] Desse modo, os métodos aqui descritos podem empregar um domínio de ligação de dedo de zinco projetado fundido a um domínio de divagem. Em certos casos, o domínio de ligação é projetado para se ligar a uma sequência-alvo, em ou perto, cuja divagem é desejada. A proteína de fusão, ou um polinucleotídeo que codifica a mesma, é introduzida em uma célula de planta. Uma vez introduzida em ou expressa na célula, a proteína de fusão se liga à sequência-alvo, e cliva em ou perto da sequência-alvo. O local exato de divagem depende da natureza do domínio de divagem e/ou da presença e/ou natureza das sequências articuladoras entre a ligação e os domínios de divagem. Em casos onde duas proteínas de fusão, cada uma compreendendo um meio-domínio de divagem, são usadas, a distância entre as bordas próximas dos locais de ligação pode ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 25 ou mais nucleotídeos (ou qualquer valor integral entre 1 e 50 nucleotídeos). Níveis ótimos de divagem podem também depender de ambas a distância entre os locais de ligação das duas proteínas de fusão (ver, por exemplo, Smith et al. (2000) Acid nucleics Res. 28:3361-3369; Bibikova et al. (2001) Mol. Célula. Biol. 21:289-297), e o comprimento do articulador ZC em cada proteína de fusão. Ver também Publicação de Patente dos Estados Unidos 20050064474A1 e Publicações de Patente Internacional W005/084190, W005/014791 e W003/080809.Accordingly, the methods described herein may employ a designed zinc finger binding domain fused to a divider domain. In certain cases, the binding domain is designed to bind to a target sequence, at or near, whose splitting is desired. The fusion protein, or a polynucleotide encoding it, is introduced into a plant cell. Once introduced into or expressed in the cell, the fusion protein binds to the target sequence, and cleaves at or near the target sequence. The exact location of the divide depends on the nature of the divide domain and / or the presence and / or nature of the articulating sequences between the link and the divide domains. In cases where two fusion proteins, each comprising a dividing half-domain, are used, the distance between the edges near the binding sites may be 1, 2, 3, 4, 5, 6, 7, 8, 9. , 10, 25 or more nucleotides (or any integer between 1 and 50 nucleotides). Optimal levels of dividing may also depend on both the distance between the binding sites of the two fusion proteins (see, for example, Smith et al. (2000) Acid nucleics Res. 28: 3361-3369; Bibikova et al. (2001 ) Mol. Cell Biol. 21: 289-297), and the length of the ZC pivot on each fusion protein. See also United States Patent Publication 20050064474A1 and International Patent Publications W005 / 084190, W005 / 014791 and W003 / 080809.

[00149] Em certas concretizações, o domínio de divagem compreende dois meios-domínios de divagem, ambos dos quais são parte de um polipeptídeo simples compreendendo um domínio de ligação, um primeira meio-domínio de divagem e um segundo meio-domínio de divagem. Os meios-domínios de divagem podem ter a mesma sequência de aminoácido ou sequência de aminoácidos diferente, considerando-se que eles funcionam para clivar o DNA.In certain embodiments, the divide domain comprises two split half domains, both of which are part of a single polypeptide comprising a binding domain, a first split half domain and a second split half domain. The dividing half-domains may have the same or different amino acid sequences as they function to cleave the DNA.

[00150] Meios-domínios de divagem podem também ser providos em moléculas separadas. Por exemplo, dois polipeptídeos de fusão podem ser introduzidos em uma célula, no qual cada polipeptídeo compreende um domínio de ligação e um meio-domínio de divagem. Os meios-domínios de divagem podem ter a mesma sequência de aminoácido ou sequências de aminoácido diferentes, considerando-se que eles funcionam para clivar o DNA. Adicionalmente, os domínios de ligação se ligam às sequências-alvo que estão tipicamente dispostas de tal modo que, após ligação dos polipeptídeos de fusão, os dois meios-domínios de divagem são apresentados em uma orientação espacial um em relação ao outro, que permite reconstituição de um domínio de divagem (por exemplo, por dimerização dos meios-domínios), posicionando, desse modo, os meios-domínios um em relação ao outro para formar um domínio de divagem funcional, resultando na divagem de cromatina celular em uma região de interesse. Geralmente, divagem pelo domínio de divagem reconstituído ocorre em um local localizado entre as duas sequências-alvo. Uma ou ambas das proteínas podem ser projetadas para se ligarem a seu local-alvo.Dividing half-domains may also be provided in separate molecules. For example, two fusion polypeptides may be introduced into a cell in which each polypeptide comprises a binding domain and a half-domain of domain. The dividing half-domains may have the same amino acid sequence or different amino acid sequences, provided they function to cleave the DNA. Additionally, the binding domains bind to the target sequences that are typically arranged such that, upon binding of the fusion polypeptides, the two splitting half-domains are presented in a spatial orientation relative to each other, allowing for reconstitution. of a dividing domain (e.g., by dimerizing the half domains), thereby positioning the half domains relative to each other to form a functional dividing domain, resulting in cell chromatin splitting into a region of interest . Typically, splitting by the reconstituted splitting domain occurs at a location located between the two target sequences. One or both of the proteins may be designed to bind to their target site.

[00151] As duas proteínas de fusão podem se ligarem na região de interesse na mesma polaridade oposta, e seus locais de ligação (isto é, locais-alvo) podem ser separados por qualquer número de nucleotídeos, por exemplo, de 0 a 200 nucleotídeos, ou qualquer valor integral entre estes. Em certas concretizações, os locais de ligação para duas proteínas de fusão, cada um compreendendo um domínio de ligação de dedo de zinco e um meio-domínio de divagem, podem estar localizados entre 5 e 18 nucleotídeos separados, por exemplo, 5-8 nucleotídeos separados, ou 15-18 nucleotídeos separados, ou 6 nucleotídeos separados, ou 16 nucleotídeos separados, conforme medidos a partir da borda de cada local de ligação mais perto do outro local de ligação, e divagem ocorre entre os locais de ligação.The two fusion proteins may bind in the region of interest at the same opposite polarity, and their binding sites (ie, target sites) may be separated by any number of nucleotides, for example from 0 to 200 nucleotides. , or any full value between them. In certain embodiments, the binding sites for two fusion proteins, each comprising a zinc finger binding domain and a dividing half domain, may be located between 5 and 18 separate nucleotides, for example, 5-8 nucleotides. separated, or 15-18 separate nucleotides, or 6 separate nucleotides, or 16 separate nucleotides, as measured from the edge of each binding site closest to the other binding site, and splitting occurs between the binding sites.

[00152] O local no qual o DNA é clivado geralmente está entre os locais de ligação para as duas proteínas de fusão. Quebra de filamento duplo de DNA frequentemente resulta de duas quebras de filamento simples, ou "incisões" afastadas por 1, 2, 3, 4, 5, 6 ou mais nucleotídeos, (por exemplo, divagem de DNA de filamento duplo por Fok I nativo resulta de quebras de filamento simples afastadas por 4 nucleotídeos). Desse modo, divagem não ocorre em locais exatamente opostos em cada trançado de DNA. Em adição, a estrutura das proteínas de fusão e a distância entre os locais-alvo podem influenciar se divagem ocorre adjacente a um par simples de nucleotídeos, ou se divagem ocorre em vários locais. Contudo, para muitas aplicações, incluindo recombinação-alvo e mutagênese alvo (ver infra), divagem dentro de uma faixa de nudeotídeos é geralmente sufidente, e divagem entre pares bases particulares não é requerida.The site at which DNA is cleaved is generally between the binding sites for the two fusion proteins. Double stranded DNA breakdown often results from two single stranded breaks, or "incisions" spaced 1, 2, 3, 4, 5, 6, or more apart, (for example, native Fok I double stranded DNA splitting results from single strand breaks 4 nucleotides apart). As such, dividing does not occur at exactly opposite locations in each strand of DNA. In addition, the structure of the fusion proteins and the distance between target sites may influence whether splitting occurs adjacent to a single nucleotide pair, or if splitting occurs at multiple sites. However, for many applications, including target recombination and target mutagenesis (see below), dividing within a range of nudeotides is generally suffident, and particular base pairing is not required.

[00153] Conforme notado acima, a(s) proteína(s) de fusão pode(m) ser introduzida(s) como polipeptídeos e/ou polinucleotídeos. Por exemplo, dois polinucleotídeos, cada um compreendendo sequências que codificam um dos polipeptídeos antes mencionados, podem ser introduzidos em uma célula, e quando os polipeptídeos são expressos, e cada um se liga a sua sequência-alvo, divagem ocorre em ou perto da sequência-alvo. Alternativamente, um polinucleotídeo simples compreendendo sequências que codificam ambos polipeptídeos de fusão é introduzido em uma célula. Polinucleotídeos podem ser DNA, RNA ou quaisquer formas modificadas, ou análogos, ou DNA e/ou RNA.As noted above, the fusion protein (s) may be introduced as polypeptides and / or polynucleotides. For example, two polynucleotides, each comprising sequences encoding one of the aforementioned polypeptides, may be introduced into a cell, and when the polypeptides are expressed, and each binds to its target sequence, splitting occurs at or near the sequence. -target. Alternatively, a single polynucleotide comprising sequences encoding both fusion polypeptides is introduced into a cell. Polynucleotides may be DNA, RNA or any modified forms, or analogs, or DNA and / or RNA.

[00154] Para intensificar a especificidade de divagem, composições adicionais podem também ser empregadas nos métodos aqui descritos. Por exemplo, meios-domínios de divagem simples podem exibir atividade de divagem de filamento duplo limitada. Nos métodos em que duas proteínas de fusão, cada uma contendo domínio de dedo de zinco de três apêndices, um meio-domínio de divagem, são introduzidas na célula, ou proteína especifica um local-alvo de aproximadamente 9 nudeotídeos. Embora a sequência-alvo agregada de 18 nudeotídeos seja do mesmo modo para ser única em um genoma de mamífero, qualquer dado local-alvo de 9 nudeotídeos ocorre, na média, aproximadamente 23.000 vezes no genoma humano. Desse modo, divagem não-específica devido à ligação específica local de um meio-domínio simples, pode ocorrer. Consequentemente, os métodos aqui descritos contemplam o uso de um mutante negativo dominante de um meio-domínio de divagem tal como Fok\ (ou um ácido nucléico que codifica o mesmo) que é expresso em uma célula junto com as duas proteínas de fusão. O mutante negativo dominante é capaz de dimerizar, mas é incapaz de clivar, e também bloquear a atividade de divagem de um meio-domínio ao qual ele é dimerizado. Pela provisão do mutante negativo dominante em excesso molar para as proteínas de fusão, somente regiões em que ambas proteínas de fusão estão ligadas terão uma concentração local alta bastante de meios-domínios de divagem funcionais para dímerização e divagem ocorrerem, Nos locais onde somente uma das duas proteínas de fusão é ligada, seu meio-domínio de divagem forma um dímero com o meio-domínio de mutante negativo dominante, e indesejável mente, divagem não-específica não ocorre, [00155] Três resíduos de aminoácido catalítico no meio-domínio de divagem Fok I foram identificados: Asp 450, Asp 467 e Lys 469. Bitinaite ef al. (1998) Proc. Nati. Acad, Sei. USA 95: 10,570-10,575. Desse modo, uma ou mais mutações em um destes resíduos podem ser usadas para gerar uma mutação negativa dominante. Adicionalmente, muitos dos resíduos de aminoácido catalítico de outras endonucleases Tipo IIS são conhecidos e/ou podem ser determinados, por exemplo, por alinhamento com sequências de Fok I, e/ou por geração e teste de mutantes para atividade catalítica. Dimerização nas Mutações de Domínio no Meio-domínio de Clivaqem [00156] Métodos para clivagem-alvo que envolvem o uso de fusões entre um ZFP e um meio-domínio de divagem {tal como, por exemplo, um fusão de ZFPiFokl) requer o uso de duas tais moléculas de fusão, cada uma geralmente dirigida a uma sequência-alvo distinta. Sequências-alvo para as duas proteínas de fusão podem ser escolhidas de modo que clivagem-alvo é dirigida a um local único em um genoma, conforme discutido acima. Uma fonte potencial de especificidade de divagem reduzida pode resultar de homodimerização de um dos ZFP/fusões de meio-domínio de divagem. Isto pode ocorrer, por exemplo, devido à presença, em um genoma, de repetições invertidas das sequências-alvo para um dos dois ZFP/fusões de meio-domínio de divagem, localizados de modo a permitir que duas cópias da mesma proteína de fusão se liguem com uma orientação e espaçamento que permitem formação de um dímero funcional.To enhance divinity specificity, additional compositions may also be employed in the methods described herein. For example, single-dial media domains may exhibit limited double-filament dialing activity. In methods in which two fusion proteins, each containing three appendage zinc finger domain, a half-domain of division, are introduced into the cell, or protein specifies a target site of approximately 9 nudeotides. Although the aggregated 18 nudeotide target sequence is similarly unique in a mammalian genome, any given 9 nudeotide targeting site occurs on average approximately 23,000 times in the human genome. Thus, nonspecific splitting due to local specific binding of a simple half-domain can occur. Accordingly, the methods described herein contemplate the use of a dominant negative mutant of a dividing half-domain such as Fok (or a nucleic acid encoding the same) that is expressed in a cell together with the two fusion proteins. The dominant negative mutant is able to dimerize but is unable to cleave, as well as blocking the dividing activity of a half domain to which it is dimerized. By providing the dominant molar excess negative mutant for fusion proteins, only regions in which both fusion proteins are linked will have a fairly high local concentration of functional divider half-domains for dimerization and divider to occur. two fusion proteins are bound, their dividing half-domain forms a dimer with the dominant negative mutant half-domain, and undesirable, non-specific dividing does not occur, [00155] Three catalytic amino acid residues in the half-domain of Fok I data were identified: Asp 450, Asp 467 and Lys 469. Bitinaite ef al. (1998) Proc. Nati. Acad, I know. USA 95: 10,570-10,575. Thus, one or more mutations in one of these residues can be used to generate a dominant negative mutation. Additionally, many of the catalytic amino acid residues of other Type IIS endonucleases are known and / or may be determined, for example, by alignment with Fok I sequences, and / or by generation and testing of mutants for catalytic activity. Dimerization of Domain Mutations in Clivaqem's Mid Domain [00156] Methods for target cleavage involving the use of fusions between a ZFP and a split half domain (such as, for example, a ZFPiFokl fusion) requires the use of two such fusion molecules, each generally directed to a distinct target sequence. Target sequences for the two fusion proteins may be chosen such that target cleavage is directed to a single site in a genome, as discussed above. A potential source of reduced dividing specificity may result from homodimerization of one of the dividing half-domain ZFPs / fusions. This may be due, for example, to the presence in one genome of inverted repeats of the target sequences for one of the two ZFP / split-domain fusions located so as to allow two copies of the same fusion protein to bond with an orientation and spacing that allow formation of a functional dimer.

[00157] Uma aproximação para redução da probabilidade deste tipo de divagem aberrante em sequências outras do que o local-alvo pretendido envolve geração de variantes do meio-domínio de divagem que minimiza ou impede homodimerização. Preferivelmente, um ou mais aminoácidos na região do meio-domínio envolvida em sua dimerização são alterados. Na estrutura de cristal do dímero de proteína de Fok\, a estrutura dos meios-domínios de divagem é reportada para ser similar ao arranjo dos meios-domínios de divagem durante divagem de DNA por Fok\. Wah et ai (1998) Proc. Natl. Acad. Sei. USA 95:10564-10569. Esta estrutura indica que resíduos de aminoácido nas posições 483 e 487 desempenham um papel-chave na dimerização dos meios-domínios de divagem de Fok\. A estrutura também indica que resíduos de aminoácido nas posições 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537, e 538 são todos fechados bastante à interface de dimerização para influenciar dimerização. Consequentemente, alterações de sequência de aminoácido em uma ou mais das posições antes mencionadas do mesmo modo alterarão as propriedades de dimerização do meio-domínio de divagem. Tais mudanças podem ser introduzidas, por exemplo, pela construção de uma biblioteca contendo (ou que codifica) resíduos de aminoácido diferentes nestas posições e seleção de variantes com as propriedades desejadas, ou por mutantes individuais racionalmente delineados. Em adição a prevenção de homodimerização, é também possível que algumas destas mutações podem aumentar a eficiência de divagem acima daquela obtida com dois meios-domínios de divagem tipo selvagem.One approach to reducing the likelihood of this type of aberrant divagem in sequences other than the intended target site involves generation of divider half-domain variants that minimize or prevent homodimerization. Preferably, one or more amino acids in the mid-domain region involved in their dimerization are altered. In the crystal structure of the Fok? Protein dimer, the structure of the dividing half-domains is reported to be similar to the arrangement of the dividing half-domains during Fok? Wah et al (1998) Proc. Natl. Acad. Know. USA 95: 10564-10569. This structure indicates that amino acid residues at positions 483 and 487 play a key role in the dimerization of Fok? The structure also indicates that amino acid residues at positions 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537, and 538 are all closed tightly to the interface. of dimerization to influence dimerization. Accordingly, amino acid sequence changes at one or more of the aforementioned positions will likewise alter the dimerization properties of the dividing half domain. Such changes may be introduced, for example, by constructing a library containing (or encoding) different amino acid residues at these positions and selecting variants with the desired properties, or by rationally delineated individual mutants. In addition to homodimerization prevention, it is also possible that some of these mutations may increase the dividing efficiency above that obtained with two wild-type dividing half domains.

[00158] Consequentemente, a alteração de um meio-domínio de divagem de Fok\ em qualquer resíduo de aminoácido que afeta dimerizaçâo pode ser usada para impedir um de um par de ZFP/fusões de Fok\ de suportar homodimerização que pode conduzir a divagem em sequências indesejadas. Desse modo, para clivagem-alvo usando um par de ZFP/fusões de Fok\, uma ou ambas das proteínas de fusão podem compreender uma ou mais alterações de aminoácido que inibem autodimerização, mas permitem que heterodimerização das duas proteínas de fusão ocorra tal que divagem ocorre no local-alvo desejado. Em certas concretizações, alterações estão presentes em ambas proteínas de fusão, e as alterações têm efeitos aditivos; isto é, homodimerização de qualquer fusão, conduzindo a divagem aberrante, é minimizada ou abolida, enquanto heterodimerização das duas proteínas de fusão é facilitada comparada àquela obtida com meios-domínios de divagem tipo selvagem. Métodos para Alteração Alvo de Sequências Genômicas e Recombinacão-alvo [00159] Também descritos aqui estão métodos de substituição de uma sequência genõmica (por exemplo, uma região de interesse em cromatina celular) com uma sequência não-idêntica homóloga (isto é, recombinaçâo-alvo). Tentativas anteriores em substituir sequências particulares têm envolvido contactar uma célula com um polinucleotídeo compreendendo sequências que suportam homologia a uma região cromossômica {isto é, um DNA doador), seguido por seleção de células em que a molécula de DNA doador tinha suportado recombinação homóloga no genoma. A taxa de sucesso destes métodos é baixa devido a pobre eficiência de recombinação homóloga e uma alta frequência de inserção não-específica do DNA doador nas regiões do genoma outra do que o local-alvo.Accordingly, alteration of a Fok \ dividing half-domain into any amino acid residue that affects dimerization can be used to prevent one of a pair of ZFP / Fok \ fusions from supporting homodimerization that can lead to divodation. unwanted sequences. Thus, for target cleavage using a pair of ZFP / Fok \ fusions, one or both of the fusion proteins may comprise one or more amino acid changes that inhibit autodimerization, but allow heterodimerization of the two fusion proteins to occur such that splitting occurs. occurs at the desired target location. In certain embodiments, alterations are present in both fusion proteins, and the alterations have additive effects; that is, homodimerization of any fusion leading to aberrant splitting is minimized or abolished, while heterodimerization of the two fusion proteins is facilitated compared to that obtained with wild-type splitting half-domains. Methods for Target Alteration of Genomic Sequences and Target Recombination Also described herein are methods of replacing a genomic sequence (e.g., a region of interest in cell chromatin) with a non-identical homologous sequence (i.e. recombination). target). Previous attempts to replace particular sequences have involved contacting a cell with a polynucleotide comprising sequences that support homology to a chromosomal region (i.e., a donor DNA), followed by selection of cells in which the donor DNA molecule had supported homologous recombination in the genome. . The success rate of these methods is low due to poor homologous recombination efficiency and a high frequency of non-specific donor DNA insertion into regions of the genome other than the target site.

[00160] A presente descrição proporciona métodos de alteração de sequência-alvo caracterizado por uma eficiência maior de recombinação-alvo e uma frequência inferior de eventos de inserção não-específicos. Os métodos envolvem produção e uso de domínio de ligação de apêndices de zinco projetados fundidos em domínios de divagem (ou meios-domínios de divagem) para produzir uma ou mais quebras-alvo de filamento duplo em DNA celular. Devido as quebras de filamento duplo em DNA celular estimular mecanismos de reparo celular várias milhares de vezes na vizinhança do local de divagem, tal clivagem-alvo permite alteração ou substituição (via reparo dirigido por homologia) de sequências em virtualmente qualquer local no genoma.The present description provides methods of target sequence alteration characterized by a higher target recombination efficiency and a lower frequency of non-specific insertion events. The methods involve the production and use of engineered zinc appendage binding domain fused to divanding domains (or divaging half-domains) to produce one or more double stranded target breaks in cellular DNA. Because double stranded breaks in cellular DNA stimulate cellular repair mechanisms several thousand times in the vicinity of the dividing site, such target cleavage allows sequence alteration or substitution (via homology driven repair) at virtually any site in the genome.

[00161] Em adição às moléculas de fusão aqui descritas, a substituição-alvo de uma sequência genômica selecionada também requer a introdução da sequência de substituição (ou doadora). A sequência doadora pode ser introduzida na célula antes de, concorrentemente com, ou subsequente a expressão da(s) proteína(s) de fusão. O polinucleotídeo doador contém homologia suficiente para uma sequência genômica suportar recombinação homóloga (ou reparo dirigido por homologia) entre ela e a sequência genômica a qual ela suporta homologia. Aproximadamente 25, 50 100, 200, 500, 750, 1.000, 1.500, 2.000 nucleotídeos ou mais de homologia de sequência entre uma sequência doadora e uma sequência genômica (ou qualquer valor integral entre 10 e 2.000 nucleotídeos, ou mais) suportarão recombinação homóloga entre estes. As sequências doadoras podem variar em comprimento de 10 a 5.000 nucleotídeos (ou qualquer valor integral de nucleotídeos entre estes), ou maior. Será prontamente aparente que a sequência doadora não é tipicamente não idêntica a sequência genômica que ela substitui. Por exemplo, a sequência do polinucleotídeo doador pode conter uma ou mais mudanças bases simples, inserções, retiradas, inversões ou rearranjos com relação à sequência genômica, considerando-se que homologia suficiente com sequências cromossômicas está presente. Alternativamente, uma sequência doadora pode conter uma sequência não-homóloga flanqueada por duas regiões de homologia. Adicionalmente, sequências doadoras podem compreender uma molécula de vetor contendo sequências que não são homólogas à região de interesse na cromatina celular. Geralmente, a(s) região(ões) homóloga(s) de uma sequência doadora terão pelo menos 50% de identidade de sequência a uma sequência genômica com a qual recombinação é desejada. Em certas concretizações, 60%, 70%, 80%, 90%, 95%, 98%, 99%, ou 99.9% identidade de sequência está presente. Qualquer valor entre 1% e 100% de identidade de sequência pode estar presente, dependendo do comprimento do polinucleotídeo doador.In addition to the fusion molecules described herein, target substitution of a selected genomic sequence also requires the introduction of the substitution (or donor) sequence. The donor sequence may be introduced into the cell prior to, concurrently with or subsequent expression of the fusion protein (s). The donor polynucleotide contains sufficient homology for a genomic sequence to support homologous recombination (or homology driven repair) between it and the genomic sequence to which it supports homology. Approximately 25, 50 100, 200, 500, 750, 1,000, 1,500, 2,000 nucleotides or more of sequence homology between a donor sequence and a genomic sequence (or any integral value between 10 and 2,000 nucleotides or more) will support homologous recombination between these. Donor sequences may range in length from 10 to 5,000 nucleotides (or any integral nucleotide value in between), or greater. It will be readily apparent that the donor sequence is not typically not identical with the genomic sequence it replaces. For example, the donor polynucleotide sequence may contain one or more single base changes, insertions, withdrawals, inversions or rearrangements with respect to the genomic sequence, provided that sufficient homology to chromosomal sequences is present. Alternatively, a donor sequence may contain a non-homologous sequence flanked by two regions of homology. Additionally, donor sequences may comprise a vector molecule containing sequences that are not homologous to the region of interest in the cellular chromatin. Generally, the homologous region (s) of a donor sequence will have at least 50% sequence identity to a genomic sequence with which recombination is desired. In certain embodiments, 60%, 70%, 80%, 90%, 95%, 98%, 99%, or 99.9% sequence identity is present. Any value between 1% and 100% sequence identity may be present, depending on the length of the donor polynucleotide.

[00162] Uma molécula doadora pode conter várias regiões descontínuas de homologia à cromatina celular. Por exemplo, para inserção-alvo de sequências não normalmente presentes em uma região de interesse, referidas sequências podem estar presentes em uma molécula de ácido nucléico doadora e flanqueada por regiões de homologia à sequência na região de interesse.A donor molecule may contain several discontinuous regions of cell chromatin homology. For example, for targeting sequences not normally present in a region of interest, said sequences may be present in a donor nucleic acid molecule and flanked by regions of sequence homology in the region of interest.

[00163] Para simplificar ensaios (por exemplo, hibridização, PCR, digestão de enzima de restrição) para determinação com sucesso da sequência doadora, certas diferenças de sequência podem estar presentes na sequência doadora conforme comparado a sequência genômica. Preferivelmente, se localizada em uma região de codificação, tais diferenças de sequência de nucleotídeo não mudarão a sequência de aminoácido, ou produzirão mudanças mudas no aminoácido (isto é, mudanças que não afetam a estrutura ou função das proteína). O polinucleotídeo doador pode opcionalmente conter mudanças nas sequências correspondentes aos locais de ligação de domínio de dedo de zinco na região de interesse, para impedir divagem de sequências doadoras que foram introduzidas na cromatina celular por recombí nação homóloga.To simplify assays (e.g., hybridization, PCR, restriction enzyme digestion) for successful determination of the donor sequence, certain sequence differences may be present in the donor sequence as compared to the genomic sequence. Preferably, if located in a coding region, such nucleotide sequence differences will not change the amino acid sequence, or will produce dumb changes in the amino acid (ie, changes that do not affect protein structure or function). The donor polynucleotide may optionally contain sequence changes corresponding to the zinc finger domain binding sites in the region of interest, to prevent splitting of donor sequences that have been introduced into cell chromatin by homologous recombination.

[00164] O polinucleotídeo doador pode ser DNA ou RN A, de filamento simples ou de filamento duplo, e pode ser introduzido em uma célula na forma linear ou circular. Se introduzido na forma linear, as extremidades da sequência doadora podem ser protegidas {por exemplo, de degradação exonucleolítica) por métodos conhecidos àqueles versados na técnica. Por exemplo, um ou mais resíduos de dideoxinucleotídeo são adicionados ao terminal 3' de uma molécula linear e/ou oligonucleotídeos autocomplementares são ligados a uma ou ambas extremidades. Ver, por exemplo, Chang ef al. (1987) Proc. Natl. Acad. Sei. USA 84:4959-4963; Nehls ef ai. (1996) Science 272:886-889. Métodos adicionais para proteção de polinucleotídeos exógenos de degradação incluem, mas não estão limitados a, adição de grupo(s) amíno terminais e o uso de ligações internucleotídeo modificadas tais como, por exemplo, fosforotioatos, fosforamidatos, e O-metila ribose, ou resíduos de deoxirribose.The donor polynucleotide may be single stranded or double stranded DNA or RN A, and may be introduced into a cell in linear or circular form. If introduced in linear form, the ends of the donor sequence may be protected (e.g., from exonucleolytic degradation) by methods known to those skilled in the art. For example, one or more dideoxynucleotide residues are added to the 3 'terminus of a linear molecule and / or autocomplementary oligonucleotides are attached at one or both ends. See, for example, Chang et al. (1987) Proc. Natl. Acad. Know. USA 84: 4959-4963; Nehls et al. (1996) Science 272: 886-889. Additional methods for protection of exogenous polynucleotides from degradation include, but are not limited to, addition of terminal amino group (s) and the use of modified internucleotide bonds such as, for example, phosphorothioates, phosphoramidates, and O-methyl ribose, or residues. of deoxyribose.

[00165] Um polinucleotídeo pode ser introduzido em uma célula como parte de uma molécula de vetor tendo sequências adicionais tais como, por exemplo, origens de replicação, promotores e genes que codificam resistência a antibiótico. Além disso, polinucleotídeos doadores podem ser introduzidos como ácido nucléico exposto, como ácido nucléico complexado com um agente, tal como um lípossoma ou poloxâmero, ou podem ser distribuídos por bactérias ou vírus (por exemplo, Agrobacterium, Rhizobium sp. NGR234, Sinorbizoboium meiiiotl, Mesorhizoblum loti, vírus de mosaico de tabaco, vírus da batata X, vírus de mosaico de couve-flor e vírus de mosaico de veia de mandioca. Ver, por exemplo, Ghung et al. (2006) Trends Plant Sei. 11(1):1-4.A polynucleotide may be introduced into a cell as part of a vector molecule having additional sequences such as, for example, origins of replication, promoters, and genes encoding antibiotic resistance. In addition, donor polynucleotides may be introduced as exposed nucleic acid, as nucleic acid complexed with an agent, such as a liposome or poloxamer, or may be distributed by bacteria or viruses (e.g. Agrobacterium, Rhizobium sp. NGR234, Sinorbizoboium meiiiotl, Mesorhizoblum loti, tobacco mosaic virus, potato X virus, cauliflower mosaic virus, and cassava vein mosaic virus See, for example, Ghung et al. (2006) Trends Plant Sci 11 (1) : 1-4.

[00166] Sem estar ligado por uma teoria, parece que a presença de uma quebra de filamento duplo em uma sequência celular, acoplada com a presença de uma molécula de DNA exógena tendo homologia a uma região adjacente a, ou circundando a quebra, ativa mecanismos celulares que reparam a quebra por transferência de informação de sequência a partir da molécula doadora na sequência celular (por exemplo, genômica ou cromossômica); isto é, por um processo de reparo dirigido por homologia, também conhecido como "conversão de gene". Os métodos da requerente vantajosamente combinam as capacidades-alvo poderosas de ZFPs projetados com um domínio de divagem (ou meio-domínio de divagem) para direcionar especificamente uma quebra de filamento duplo para a região do genoma na inserção de sequências exógenas é desejado.Without being bound by theory, it appears that the presence of a double stranded break in a cell sequence, coupled with the presence of an exogenous DNA molecule having homology to a region adjacent to, or surrounding the break, activates mechanisms. cells that repair breakdown by transferring sequence information from the donor molecule to the cell sequence (e.g., genomic or chromosomal); that is, by a homology driven repair process, also known as "gene conversion". Applicant's methods advantageously combine the powerful targeting capabilities of ZFPs designed with a split domain (or split half domain) to specifically target a double stranded break to the genome region in the insertion of exogenous sequences is desired.

[00167] Para alteração de uma sequência cromossômica, não é necessário para a sequência total do doador ser copiada no cromossoma, considerando-se que muita da sequência doadora é copiada para efetuar a alteração de sequência desejada.For alteration of a chromosome sequence, it is not necessary for the total donor sequence to be copied to the chromosome, since much of the donor sequence is copied to effect the desired sequence change.

[00168] A eficiência de inserção de sequências doadoras por recombinação homóloga está inversamente relacionada à distância no DNA celular entre a quebra de trançado padrão e o local no qual recombinação é desejada. Em outras palavras, eficiências de recombinação homóloga mais altas são observadas quando a quebra de filamento duplo está mais próxima ao local no qual recombinação é desejada. Nos casos em que um local preciso de recombinação não é predeterminado (por exemplo, o evento de recombinação desejado pode ocorrer sobre um intervalo de sequência genômica), o comprimento e sequência do ácido nucléico doador, junto com o(s) local(is) de divagem, são selecionados para obter o evento de recombinação desejado. Em casos em que o evento desejado é designado para mudar a sequência de um par simples de nucleotídeos em uma sequência genômica, cromatina celular é clivada dentro de 10.000 nucleotídeos em qualquer lado daquele par de nucleotídeos. Em certas concretizações, divagem ocorre dentro de 1.000, 500, 200, 100, 90, 80, 70, 60, 50, 40, 30, 20, 10, 5, ou 2 nucleotídeos, ou qualquer valor integral entre 2 e 1.000 nucleotídeos, em qualquer lado do par de nucleotídeos cuja sequência é para ser mudada.The efficiency of insertion of donor sequences by homologous recombination is inversely related to the distance in cellular DNA between the standard braided break and the location at which recombination is desired. In other words, higher homologous recombination efficiencies are observed when the double strand break is closest to the place where recombination is desired. In cases where a precise recombination site is not predetermined (for example, the desired recombination event may occur over a genomic sequence interval), the donor nucleic acid length and sequence, together with the site (s) Divation values are selected to obtain the desired recombination event. In cases where the desired event is designed to change the sequence of a single nucleotide pair into a genomic sequence, cellular chromatin is cleaved within 10,000 nucleotides on either side of that nucleotide pair. In certain embodiments, splitting occurs within 1,000, 500, 200, 100, 90, 80, 70, 60, 50, 40, 30, 20, 10, 5, or 2 nucleotides, or any integer between 2 and 1,000 nucleotides, on either side of the nucleotide pair whose sequence is to be changed.

[00169] Conforme detalhado acima, os locais de ligação para duas proteínas de fusão, cada uma compreendendo um domínio de ligação de dedo de zinco e um meio-domínio de divagem, pode estar localizado 5-8 ou 15-18 nucleotídeos separados, conforme medido a partir da borda de cada local de ligação mais perto do outro local de ligação, e divagem ocorre entre os locais de ligação. Se divagem ocorre em um local simples ou em locais múltiplos entre os locais de ligação, é imaterial, visto que as sequências genômicas clivadas são substituídas pelas sequências doadoras. Desse modo, para alteração eficiente da sequência de um par simples de nucleotídeos por recombinação-alvo, o ponto médio da região entre os locais de ligação está dentro de 10.000 nucleotídeos daquele par de nucleotídeos, preferivelmente dentro de 1.000 nucleotídeos, ou 500 nucleotídeos, ou 200 nucleotídeos, ou 100 nucleotídeos, ou 50 nucleotídeos, ou 20 nucleotídeos, ou 10 nucleotídeos, ou 5 nucleotídeo, ou 2 nucleotídeos, ou um nucleotídeo, ou no par de nucleotídeos de interesse.As detailed above, the binding sites for two fusion proteins, each comprising a zinc finger binding domain and a half-dividing domain, may be located 5-8 or 15-18 separate nucleotides, as shown below. measured from the edge of each binding site closest to the other binding site, and dividing occurs between the binding sites. Whether splitting occurs at a single site or at multiple sites between the binding sites is immaterial, since cleaved genomic sequences are replaced by donor sequences. Thus, for efficient alteration of the sequence of a single nucleotide pair by target recombination, the midpoint of the region between the binding sites is within 10,000 nucleotides of that nucleotide pair, preferably within 1,000 nucleotides, or 500 nucleotides, or 200 nucleotides, or 100 nucleotides, or 50 nucleotides, or 20 nucleotides, or 10 nucleotides, or 5 nucleotides, or 2 nucleotides, or one nucleotide, or in the nucleotide pair of interest.

[00170] Em certas concretizações, um cromossoma homólogo pode servir como o polinucleotídeo doador. Desse modo, por exemplo, correção de uma mutação em um heterozigoto pode ser alcançada pelas proteínas de fusão projetadas que se ligam a e clivam a sequência mutante em um cromossoma, mas não clivam a sequência tipo selvagem no cromossoma homólogo. A quebra de filamento duplo no cromossoma que suporta mutação estimula um processo de "conversão de gene" baseado em homologia em que a sequência tipo selvagem a partir do cromossoma homólogo é copiada no cromossoma clivado, restaurando, desse modo, duas cópias da sequência tipo selvagem.In certain embodiments, a homologous chromosome may serve as the donor polynucleotide. Thus, for example, correction of a mutation in a heterozygote can be achieved by engineered fusion proteins that bind to and cleave the mutant sequence on a chromosome, but do not cleave the wild-type sequence on the homologous chromosome. Double stranded breakage on the mutation-bearing chromosome stimulates a homology-based "gene conversion" process in which the wild-type sequence from the homologous chromosome is copied to the cleaved chromosome, thereby restoring two copies of the wild-type sequence. .

[00171] Métodos e composições são também providos que podem aumentar os níveis de recombinação-alvo incluindo, mas não limitado а, o uso de fusões de domínio funcional-ZFP adicionais para ativar expressão de genes envolvidos na recombinação homóloga, tal como, por exemplo, membros do grupo RAD52 epistasis (por exemplo, Rad50, Rad51, Rad51B, Rad51C, Rad51D, Rad52, Rad54, Rad54B, Mre11, XRCC2, XRCC3), genes cujos produtos interagem com os produtos de gene antes mencionados (por exemplo, BRCA1, BRCA2) e/ou genes no complexo NBS1. Ver, por exemplo, Boyko et ai. (2006) Plant Physiology 141:488-497 e LaFarge et ai. (2003) Acid nucleics Res 31(4): 1148-1155. Similarmente ZFP-fusões de domínio funcionais podem ser usados, em combinação com os métodos e composições aqui revelados, para reprimir expressão de genes envolvidos em união terminal não-homóloga (por exemplo, Ku70/80, XRCC4, poli(ADP ribose) polimerase, DNA ligase 4). Ver, por exemplo, Ri ha et ai. (2002) EMBO 21:2819-2826; Freisner et ai. (2003) Plant J. 34:427-440; Chen et ai. (1994) European Journal of Biochemistry 224:135-142. Métodos para ativação e repressão de expressão de gene usando fusões entre um domínio de ligação de dedo de zinco e um domínio funcional são revelados, por exemplo, nas Patentes dos Estados Unidos da mesma requerente 6.534.261; 6.824.978 e б. 933.113. Métodos de repressão adicionais incluem o uso de oligonucleotídeos de antissenso e/ou RNA de interferência pequeno (siRNA ou RNAi) alvo para a sequência do gene a ser reprimida.Methods and compositions are also provided that may increase target recombination levels including, but not limited to, the use of additional ZFP-functional domain fusions to activate expression of genes involved in homologous recombination, such as, for example. , members of the RAD52 epistasis group (e.g. Rad50, Rad51, Rad51B, Rad51C, Rad51D, Rad52, Rad54, Rad54B, Mre11, XRCC2, XRCC3), genes whose products interact with the aforementioned gene products (e.g., BRCA1, BRCA2) and / or genes in the NBS1 complex. See, for example, Boyko et al. (2006) Plant Physiology 141: 488-497 and LaFarge et al. (2003) Acid nucleics Res 31 (4): 1148-1155. Similarly functional domain ZFP-fusions may be used, in combination with the methods and compositions disclosed herein, to suppress expression of genes involved in non-homologous terminal coupling (e.g., Ku70 / 80, XRCC4, poly (ADP ribose) polymerase, DNA ligase 4). See, for example, Riha et al. (2002) EMBO 21: 2819-2826; Freisner et al. (2003) Plant J. 34: 427-440; Chen et al. (1994) European Journal of Biochemistry 224: 135-142. Methods for activating and repressing gene expression using fusions between a zinc finger binding domain and a functional domain are disclosed, for example, in U.S. Patent Nos. 6,534,261; 6,824,978 and б. 933,113. Additional repression methods include the use of target antisense oligonucleotides and / or small interference RNA (siRNA or RNAi) targeting the gene sequence to be repressed.

[00172] Como uma alternativa a, ou em adição a ativação de expressão de produtos de gene envolvidos em recombinação homóloga, fusões destas proteínas (ou fragmentos funcionais destas) com um domínio de ligação de dedo de zinco alvo para a região de interesse, podem ser usadas para recrutar estas proteínas (proteínas de recombinação) para a região de interesse, aumentando, desse modo, sua concentração local e, adicionalmente, estimulando processos de recombinação homóloga. Alternativamente, um polipeptídeo envolvido na recombinação homóloga conforme descrito acima (ou um fragmento funcional deste) pode ser parte de uma proteína de fusão tripla compreendendo um domínio de ligação de dedo de zinco, um domínio de divagem (ou meio-domínio de divagem) e a proteína de recombinação (ou fragmento funcional desta). Proteínas adicionais envolvidas em conversão de gene e remodelagem de cromatina relacionada à recombinação, que podem ser usadas nos métodos e composições antes mencionados, incluem histona acetiltransferases (por exemplo, Esalp, Tip60), histona metiltransferases (por exemplo, Dotlp), histona cinases e histona fosfatases. Ver, também, Bhat et ai. (1999) PlantJ. 33:455-469.As an alternative to, or in addition to activation of expression of gene products involved in homologous recombination, fusions of these proteins (or functional fragments thereof) with a target zinc finger binding domain to the region of interest may be used to recruit these proteins (recombination proteins) to the region of interest, thereby increasing their local concentration and further stimulating homologous recombination processes. Alternatively, a polypeptide involved in homologous recombination as described above (or a functional fragment thereof) may be part of a triple fusion protein comprising a zinc finger binding domain, a dividing domain (or dividing half-domain) and the recombination protein (or functional fragment thereof). Additional proteins involved in recombination-related gene conversion and chromatin remodeling, which may be used in the aforementioned methods and compositions, include histone acetyltransferases (e.g., Esalp, Tip60), histone methyltransferases (e.g., Dotlp), histone kinases and histone phosphatases. See also Bhat et al. (1999) PlantJ. 33: 455-469.

[00173] Aumentos adicionais na eficiência de recombinação-alvo, em células compreendendo um dedo de zinco/molécula de fusão de nuclease e uma molécula de DNA doadora, são alcançados pelo bloqueio das células na fase G2 do ciclo de célula, quando processos de reparo de acionamento de homologia são maximamente ativos. Tais apreensões podem ser alcançadas em um número de modos. Por exemplo, células podem ser tratadas com, por exemplo, fármacos, compostos e/ou moléculas pequenas que influenciam progressão do ciclo de célula de modo a apreender células na fase G2. Moléculas exemplares deste tipo incluem, mas não estão limitadas a, compostos que afetam polimerização de microtúbulo (por exemplo, vinblastina, nocodazol, Taxol), compostos que interagem com DNA (por exemplo, dicloreto diamina c/s-platina(ll), Cisplatina, doxorrubicina) e/ou compostos que afetam a síntese de DNA (por exemplo, timidina, hidroxiureia, L-mimosina, etoposida, 5-fluorouracila). Aumentos adicionais na eficiência de recombinação são alcançados pelo uso de inibidores de histona desacetilase (HDAC) (por exemplo, butirato de sódio, tricostatina A) que alteram a estrutura de cromatina para produzir DNA genômico mais acessível à máquina de recombinação celular.Further increases in target recombination efficiency in cells comprising a zinc finger / nuclease fusion molecule and a donor DNA molecule are achieved by blocking the cells in the G2 phase of the cell cycle when repair processes are performed. drive units are maximally active. Such apprehensions can be achieved in a number of ways. For example, cells may be treated with, for example, drugs, compounds and / or small molecules that influence cell cycle progression to seize cells in the G2 phase. Exemplary molecules of this type include, but are not limited to, compounds that affect microtubule polymerization (e.g., vinblastine, nocodazole, Taxol), DNA-interacting compounds (e.g. dichloride diamine with s-platinum (ll), cisplatin). , doxorubicin) and / or compounds that affect DNA synthesis (e.g., thymidine, hydroxyurea, L-mimosin, etoposide, 5-fluorouracil). Further increases in recombination efficiency are achieved by the use of histone deacetylase inhibitors (HDAC) (eg sodium butyrate, trichostatin A) that alter the chromatin structure to produce genomic DNA more accessible to the cell recombination machine.

[00174] Métodos adicionais para apreensão de ciclo de célula incluem superexpressão de proteínas que inibem a atividade da CDK ciclo de célula cinases, por exemplo, pela introdução de um cDNA que codifica a proteína na célula, ou pela introdução na célula de um ZFP projetado que ativa expressão do gene que codifica a proteína. Apreensão de ciclo de célula é também alcançado pela inibição da atividade de ciclinas e CDKs, por exemplo, usando-se métodos de RNAi (por exemplo, Patente dos Estados Unidos N° 6.506.559), ou pela introdução na célula de um ZFP projetado que reprime expressão de um ou mais genes envolvidos na progressão de ciclo de célula tal como, por exemplo, ciclina e/ou genes CDK. Ver, por exemplo, Patente dos Estados Unidos da mesma requerente N° 6.534.261 para métodos para a síntese de proteínas de dedo de zinco projetadas para regulação de expressão de gene.Additional methods for cell cycle arrest include overexpression of proteins that inhibit CDK cell cycle kinases activity, for example by introducing a protein-encoding cDNA into the cell, or by introducing a designed ZFP into the cell. which activates expression of the gene encoding the protein. Cell cycle seizure is also achieved by inhibiting the activity of cyclins and CDKs, for example by using RNAi methods (eg, United States Patent No. 6,506,559), or by introducing a designed ZFP into the cell. which represses expression of one or more genes involved in cell cycle progression such as, for example, cyclin and / or CDK genes. See, for example, U.S. Patent No. 6,534,261 for methods for the synthesis of zinc finger proteins designed for gene expression regulation.

[00175] Alternativamente, em certos casos, clivagem-alvo é conduzida na ausência de um polinucleotídeo doador (preferivelmente na fase S ou G2), e recombinação ocorre entre cromossomas homólogos.Alternatively, in certain cases, target cleavage is conducted in the absence of a donor polynucleotide (preferably at the S or G2 phase), and recombination occurs between homologous chromosomes.

Vetores de Expressão [00176] Um ácido nucléico que codifica um ou mais ZFPs ou proteínas de fusão de ZFP pode ser clonado em um vetor para transformação em células procarióticas ou eucarióticas para replicação e/ou expressão. Vetores podem ser vetores procarióticos, por exemplo, plasmídeos, ou vetores de transporte, vetores de inseto, ou vetores eucarióticos. Um ácido nucléico que codifica um ZFP pode também ser clonado em um vetor de expressão, para administração a uma célula de planta.Expression Vectors A nucleic acid encoding one or more ZFPs or ZFP fusion proteins may be cloned into a vector for transformation into prokaryotic or eukaryotic cells for replication and / or expression. Vectors may be prokaryotic vectors, for example, plasmids, or transport vectors, insect vectors, or eukaryotic vectors. A nucleic acid encoding a ZFP can also be cloned into an expression vector for administration to a plant cell.

[00177] Para expressar os ZFPs ou proteínas de fusão de ZFP, sequências que codificam os ZFPs ou fusões de ZFP são tipicamente subclonadas em um vetor de expressão que contém um promotor para dirigir transcrição. Promotores bacterianos e eucarióticos adequados são bem conhecidos na técnica e descritos, por exemplo, em Sambrook et al., Molecular Cloning, A Laboratory Manual (2nd ed. 1989; 3rd ed., 2001); Kriegler, Gene Transfer e Expression: A Laboratory Manual (1990); e Current Protocols in Molecular Biology (Ausubel et al., supra. Sistemas de expressão bacterianos para expressar o ZFP estão disponíveis em, por exemplo, E. coli, Bacillus sp., e Salmonella (Paiva et al., Gene 22:229-235 (1983)). Kits para tais sistemas de expressão estão comercialmente disponíveis. Sistemas de expressão eucarióticos para células de mamífero, levedura, e células de inseto são bem conhecidos por aqueles versados na técnica, e estão também comercialmente disponíveis.To express ZFPs or ZFP fusion proteins, sequences encoding ZFPs or ZFP fusions are typically subcloned into an expression vector containing a promoter for directing transcription. Suitable bacterial and eukaryotic promoters are well known in the art and described, for example, in Sambrook et al., Molecular Cloning, A Laboratory Manual (2nd ed. 1989; 3rd ed., 2001); Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990); and Current Protocols in Molecular Biology (Ausubel et al., supra. Bacterial expression systems for expressing ZFP are available from, for example, E. coli, Bacillus sp., and Salmonella (Paiva et al., Gene 22: 229- 235 (1983)) Kits for such expression systems are commercially available Eukaryotic expression systems for mammalian, yeast, and insect cells are well known to those skilled in the art, and are also commercially available.

[00178] O promotor usado para dirigir expressão de um ZFP que codifica ácido nucléico depende da aplicação particular. Por exemplo, um promotor constitutivo forte adequado para célula hospedeira é tipicamente usado para expressão e purificação de ZFPs.The promoter used to direct expression of a nucleic acid-encoding ZFP depends on the particular application. For example, a suitable strong constitutive host cell promoter is typically used for expression and purification of ZFPs.

[00179] Em contraste, quando um ZFP é administrado in vivo para regulação de gene de planta (ver, "Acid nucleic Delivery to Plant Cells" seção abaixo), ou um promotor constitutivo ou um promotor induzível é usado, dependendo do uso particular do ZFP. Exemplos não-limitativos de promotores de planta incluem sequências promotoras derivadas de A. thaliana ubiquitin-3 (ubi-3) (Callis, et al., 1990, J. Biol. Chem. 265-12486-12493); A. tumifaciens mannopine sintase (Amas) (Petolino et al., Patente dos Estados Unidos N° 6.730.824); e/ou Vírus de Mosaico de Veia de Mandioca (CsVMV) (Verdaguer et al., 1996, Plant Molecular Biology 31:1129-1139). Ver também Exemplos.In contrast, when a ZFP is administered in vivo for plant gene regulation (see, "Acid nucleic delivery to plant cells" section below), either a constitutive promoter or an inducible promoter is used, depending on the particular use of the plant. ZFP. Non-limiting examples of plant promoters include promoter sequences derived from A. thaliana ubiquitin-3 (ubi-3) (Callis, et al., 1990, J. Biol. Chem. 265-12486-12493); A. tumifaciens mannopine synthase (Amas) (Petolino et al., United States Patent No. 6,730,824); and / or Cassava Vein Mosaic Virus (CsVMV) (Verdaguer et al., 1996, Plant Molecular Biology 31: 1129-1139). See also Examples.

[00180] Em adição ao promotor, o vetor de expressão tipicamente contém uma unidade de transcrição ou cassete de expressão que contém todos os elementos adicionais requeridos para a expressão do ácido nucléico em células hospedeiras, ou procarióticas ou eucarióticas. Um cassete de expressão típico, desse modo, contém um promotor operavelmente ligado, por exemplo, a uma sequência de ácido nucléico que codifica o ZFP, e sinais requeridos, por exemplo, para poliadenilação eficiente do transcrito, terminação transcricional, locais de ligação de ribossoma, ou terminação de tradução. Elementos adicionais do cassete podem incluir, por exemplo, intensificadores, e sinais de união heterólogos.In addition to the promoter, the expression vector typically contains a transcription unit or expression cassette that contains all the additional elements required for expression of nucleic acid in either prokaryotic or eukaryotic host cells. A typical expression cassette thus contains a promoter operably linked, for example, to a ZFP-encoding nucleic acid sequence, and signals required, for example, for efficient transcript polyadenylation, transcriptional termination, ribosome binding sites , or translation termination. Additional elements of the cassette may include, for example, enhancers, and heterologous coupling signals.

[00181] O vetor de expressão particular usado para transportar a informação genética na célula é selecionado com relação ao uso pretendido do ZFP, por exemplo, expressão em plantas, animais, bactéria, fungos, protozoários, etc. (ver vetores de expressão descritos abaixo). Vetores de expressão bacterianos e de animais padrões são conhecidos na técnica, e são descritos em detalhe, por exemplo, na Publicação de Patente dos Estados Unidos 20050064474A1, e Publicações de Patente Internacional 005/084190, W005/014791 e W003/080809.The particular expression vector used to carry genetic information in the cell is selected with respect to the intended use of ZFP, for example, expression in plants, animals, bacteria, fungi, protozoa, etc. (see expression vectors described below). Standard bacterial and animal expression vectors are known in the art, and are described in detail, for example, in United States Patent Publication 20050064474A1, and International Patent Publications 005/084190, W005 / 014791 and W003 / 080809.

[00182] Métodos de transfecção padrão podem ser usados para produzir linhas de célula bacterianas, de mamífero, de levedura ou de inseto que expressam grandes quantidades de proteína, que podem, em seguida, serem purificadas usando-se técnicas padrão (ver, por exemplo, Colley et al., J. Biol. Chem. 264:17619-17622 (1989); Guide to Proteína Purification, in Métodos in Enzymology, vol. 182 (Deutscher, ed., 1990)). As transformações de células eucarióticas e p roca ri óticas são realizadas de acordo com técnicas padrões (ver, por exemplo, Morrison, J. Bact. 132:349-351 (1977); Clark-Curtiss & Curtiss, Methods in Enzymoiogy 101:347-362 (Wu et al., eds., 1983).Standard transfection methods can be used to produce bacterial, mammalian, yeast or insect cell lines expressing large amounts of protein, which can then be purified using standard techniques (see, for example). , Colley et al., J. Biol. Chem. 264: 17619-17622 (1989); Guide to Protein Purification, in Methods in Enzymology, vol. 182 (Deutscher, ed., 1990)). Eukaryotic epocherotic cell transformations are performed according to standard techniques (see, for example, Morrison, J. Bact. 132: 349-351 (1977); Clark-Curtiss & Curtiss, Methods in Enzymoiogy 101: 347- 362 (Wu et al., Eds., 1983).

[00183] Qualquer um dos procedimentos bem conhecidos para introdução de sequência estranha de nucleotídeos em tais células hospedeiras pode ser usado. Estes incluem o uso de transfecção de fosfato de cálcio, polibreno, fusão de protoplasto, eletroporação, métodos ultrassônicos (por exemplo, sonoporação), lipossomas, microinjeção, DNA exposto, vetores de plasmídeo, vetores virais, ambos epissomal e integrativo, e qualquer um dos outros métodos bem conhecidos para introdução de DNA genômico clonado, cDNA, DNA sintético, ou outro material genético estranho em uma célula hospedeira (ver, por exemplo, Sambrook el al., supra). É somente necessário que o procedimento de projeto genético particular usado seja capaz de introduzir com sucesso pelo menos um gene na célula hospedeira capaz de expressar a proteína de escolha.Any of the well known procedures for introducing nucleotide foreign sequence into such host cells can be used. These include the use of calcium phosphate transfection, polybrene, protoplast fusion, electroporation, ultrasonic methods (eg, sonoporation), liposomes, microinjection, exposed DNA, plasmid vectors, viral vectors, both episomal and integrative, and any of these. of the other well-known methods for introducing cloned genomic DNA, cDNA, synthetic DNA, or other foreign genetic material into a host cell (see, for example, Sambrook et al., supra). It is only necessary that the particular genetic design procedure used be able to successfully introduce at least one gene into the host cell capable of expressing the protein of choice.

Distribuição de Ácido Nucléico a Células de Planta [00184] Conforme notado acima, construções de DNA podem ser introduzidas em {por exemplo, no genoma de) um hospedeiro de planta desejado por uma variedade de técnicas convencionais. Para revisões de tais técnicas ver, por exemplo, Weissbach & Weíssbach Methods for Plant Molecular Biology (1988, Academic Press, N.Y.) Section VIII, pp. 421-463; e Grierson & Corey, Plant Molecular Biology (1988, 2d Ed ), Blackie, London, Ch. 7-9.Nucleic Acid Distribution to Plant Cells As noted above, DNA constructs can be introduced into (e.g., into the genome of) a desired plant host by a variety of conventional techniques. For reviews of such techniques see, for example, Weissbach & Weissbach Methods for Plant Molecular Biology (1988, Academic Press, N.Y.) Section VIII, pp. 421-463; and Grierson & Corey, Plant Molecular Biology (1988, 2d Ed), Blackie, London, Ch. 7-9.

[00185] Por exemplo, a construção de DNA pode ser introduzida no DNA genômico da célula de planta usando-se técnicas, tais como eletroporação e microinjeção de protoplastos de célula de planta, ou as construçãos de DNA podem ser introduzidas direta mente ao tecido de planta usando-se métodos biolisticos, tal como bombardeio de partícula de DNA (ver, por exemplo, Klein et al (1987) Nature 327:70- 73). Alternativamente, as construções de DNA podem ser combinadas com regiões de flanqueamento de T-DNA adequadas, e introduzidos em um vetor hospedeiro convencional de Agrobacterium tumefaciens. Técnicas de transformação mediada por Agrobacterium tumefaciens, incluindo desarme e uso de vetores binários, são bem descritas na literatura científica. Ver, por exemplo, Horsch et ai (1984) Science 233:496-498, e Fraley et ai (1983) Proc. Nat'l. Acad. Sei. USA 80:4803.For example, DNA construct may be introduced into plant cell genomic DNA using techniques such as electroporation and microinjection of plant cell protoplasts, or DNA constructs may be introduced directly into plant tissue. using biological methods such as DNA particle bombardment (see, for example, Klein et al (1987) Nature 327: 70-73). Alternatively, the DNA constructs may be combined with suitable T-DNA flanking regions, and introduced into a conventional Agrobacterium tumefaciens host vector. Agrobacterium tumefaciens-mediated transformation techniques, including disarming and use of binary vectors, are well described in the scientific literature. See, for example, Horsch et al (1984) Science 233: 496-498, and Fraley et al (1983) Proc. Nat'l. Acad. Know. USA 80: 4803.

[00186] Em adição, transferência de gene pode ser alcançada usando-se vírus ou bactérias de não-Agrobacterium, tais como Rhizobium sp. NGR234, Sinorhizoboium meliloti, Mesorhizobium loti, vírus de batata X, vírus de mosaico de couve-flor, e vírus de mosaico de veia de mandioca, e/ou vírus de mosaico de tabaco, Ver, por exemplo, Chung et ai. (2006) Trends Plant Sei. 11(1):1-4.In addition, gene transfer can be achieved using non-Agrobacterium viruses or bacteria, such as Rhizobium sp. NGR234, Sinorhizoboium meliloti, Mesorhizobium loti, potato X virus, cauliflower mosaic virus, and cassava vein mosaic virus, and / or tobacco mosaic virus, See, for example, Chung et al. (2006) Trends Plant I know. 11 (1): 1-4.

[00187] As funções de virulência do hospedeiro Agrobacterium tumefaciens dirigirá a inserção da construção e marcador adjacente no DNA de célula de planta quando a célula é infectada pela bactéria usando vetor binário T DNA (Bevan (1984) Nuc. Acid Res. 12:8711-8721), ou um procedimento de cocultivo (Horsch et ai (1985) Science 227:1229-1231). Geralmente, o sistema de transformação de Agrobacterium é usado para projetar plantas dicotiledôneas (Bevan et ai (1982) Ann. Rev. Genet 16:357-384; Rogers et ai (1986) Methods Enzymol. 118:627-641). O sistema de transformação de Agrobacterium pode também ser usado para transformar, bem como transferir DNA para plantas monocotiledôneas e células de planta. Ver Patente dos Estados Unidos N° 5. 591.616; Hernalsteen et ai (1984) EMBO J 3:3039-3041; Hooykass-Van Slogteren et ai (1984) Nature 311:763-764; Grimsley et ai (1987) Nature 325:1677-179; Boulton et ai (1989) Plant Mol. Biol. 12:31-40.; e Gould et ai (1991) Plant Physiol. 95:426-434.The virulence functions of the host Agrobacterium tumefaciens will direct the insertion of the adjacent marker construct and DNA into the plant cell DNA when the cell is infected by the bacterium using binary T DNA vector (Bevan (1984) Nuc. Acid Res. 12: 8711 -8721), or a co-cultivation procedure (Horsch et al (1985) Science 227: 1229-1231). Generally, the Agrobacterium transformation system is used to design dicot plants (Bevan et al (1982) Ann. Rev. Genet 16: 357-384; Rogers et al (1986) Methods Enzymol. 118: 627-641). The Agrobacterium transformation system can also be used to transform as well as transfer DNA to monocotyledonous plants and plant cells. See United States Patent No. 5,591,616; Hernalsteen et al (1984) EMBO J 3: 3039-3041; Hooykass-Van Slogteren et al (1984) Nature 311: 763-764; Grimsley et al (1987) Nature 325: 1677-179; Boulton et al (1989) Plant Mol. Biol. 12: 31-40; and Gould et al (1991) Plant Physiol. 95: 426-434.

[00188] Métodos de transferência de gene alternativos e de transformação incluem, mas não estão limitados à, transformação de protoplasto através de cálcio-, polietileno glicol (PEG)- ou entendimento mediado por eletroporação de DNA exposto (ver Paszkowski et ai. (1984) EMBO J 3:2717-2722, Potrykus et ai. (1985) Molec. Gen. Genet. 199:169-177; Fromm et ai. (1985) Proc. Nat. Acad. Sei. USA 82:5824-5828; e Shimamoto (1989) Nature 338:274-276), e eletroporação de tecidos de planta (D'Halluin et ai. (1992) Cell of plant 4:1495-1505). Métodos adicionais para transformação de célula de planta incluem microinjeção, entendimento de DNA mediado por carbeto de silício (Kaeppler et ai. (1990) Cell of plant Repórter 9:415-418), e bombardeio de microprojétil (ver Klein et ai. (1988) Proc. Nat. Acad. Sei. USA 85:4305-4309; e Gordon-Kamm et al. (1990) Cell of plant 2:603-618).Alternative gene transfer and transformation methods include, but are not limited to, protoplast transformation via calcium-, polyethylene glycol (PEG) - or electroporation-mediated understanding of exposed DNA (see Paszkowski et al. (1984)). ) EMBO J 3: 2717-2722, Potrykus et al. (1985) Molec Gen. Genet 199: 169-177, Fromm et al. (1985) Proc. Nat. Acad. Sci. USA 82: 5824-5828; and Shimamoto (1989) Nature 338: 274-276), and plant tissue electroporation (D'Halluin et al. (1992) Cell of plant 4: 1495-1505). Additional methods for plant cell transformation include microinjection, understanding of silicon carbide mediated DNA (Kaeppler et al. (1990) Cell of plant Reporter 9: 415-418), and microprojectile bombardment (see Klein et al. (1988 ) Proc. Nat. Acad. Sci. USA 85: 4305-4309; and Gordon-Kamm et al. (1990) Cell of plant 2: 603-618).

[00189] Os métodos e composições revelados podem ser usados para inserir sequências exógenas em uma localização predeterminada em um genoma de célula de planta. Isto é útil, visto que expressão de um transgene introduzido em um genoma de planta depende criticamente de seu local de integração. Consequentemente, genes que codificam, por exemplo, nutrientes, antibióticos, ou moléculas terapêuticas, podem ser inseridos, por recombinação-alvo, nas regiões de um genoma de planta favorável a sua expressão.The disclosed methods and compositions may be used to insert exogenous sequences at a predetermined location in a plant cell genome. This is useful since expression of a transgene introduced into a plant genome critically depends on its site of integration. Accordingly, genes encoding, for example, nutrients, antibiotics, or therapeutic molecules can be inserted by target recombination into regions of a plant genome favorable for their expression.

[00190] Células de planta transformadas que são produzidas por qualquer das técnicas de transformação acima podem ser cultivadas para regenerar a planta total que possui o genótipo transformado e, desse modo, o fenótipo desejado. Tais técnicas de regeneração ocorrem na manipulação de certos fitohormônios em um meio de crescimento de cultura de tecido, tipicamente ocorrendo em um marcador de biocida e/ou herbicida que foi introduzido junto com as sequências de nucleotídeo desejadas. A regeneração de planta de protoplastos cultivados é descrita em Evans, et al., "Protoplasts Isolation e Culture" in Handbook of Cell of plant Culture, pp. 124-176, Macmillian Publishing Company, New York, 1983; e Binding, Regeneration of Plants, Plant Protoplasts, pp. 21-73, CRC Press, Boca Raton, 1985. A regeneração pode também ser obtida de calo de planta, explantes, órgãos, pólens, embriões ou partes destes. Tais técnicas de regeneração são descritas geralmente em Klee et ai (1987) Ann. Rev. of Plant Phys. 38:467-486.Transformed plant cells that are produced by any of the above transformation techniques may be cultured to regenerate the total plant having the transformed genotype and thus the desired phenotype. Such regeneration techniques occur in the manipulation of certain phytohormones in a tissue culture growth medium, typically occurring in a biocide and / or herbicide marker that has been introduced along with the desired nucleotide sequences. Plant regeneration of cultured protoplasts is described in Evans, et al., "Protoplasts Isolation and Culture" in Handbook of Cell of Plant Culture, pp. 124-176, Macmillian Publishing Company, New York, 1983; and Binding, Regeneration of Plants, Plant Protoplasts, pp. 21-73, CRC Press, Boca Raton, 1985. Regeneration may also be obtained from plant callus, explants, organs, pollens, embryos or parts thereof. Such regeneration techniques are described generally in Klee et al (1987) Ann. Rev. of Plant Phys. 38: 467-486.

[00191] Ácidos nucléicos introduzidos em uma célula de planta podem ser usados para conferir traços desejados em essencialmente qualquer planta. Uma ampla variedade de sistemas de planta pode ser projetada para as características fisiológicas e agronômicas desejadas aqui descritas usando-se as construções de ácido nucléico da presente descrição, e os vários métodos de transformação acima mencionados. Em concretizações preferidas, plantas e células de planta-alvo para projeto incluem, mas não estão limitadas a, plantas monocotiledôneas e dicotiledôneas, tais como colheitas incluindo colheitas de grão (por exemplo, trigo, arroz, painço, cevada), colheitas de fruto (por exemplo, tomate, maçã, pera, morango, laranja), colheitas de forragem (por exemplo, alfafa), colheitas de vegetal de raiz (por exemplo, cenoura, batata, betarrabas de açúcar, inhame), colheitas de vegetal folhoso (por exemplo, alface, espinafre; plantas de florescimento (por exemplo, petúnia, rosa, crisântemo), coníferas e árvores de pinho (por exemplo, pinheiro, abeto vermelho); plantas usadas em fitorremediação (por exemplo, plantas de acúmulo de metal pesado); colheitas de óleo (por exemplo, girassol, semente de colza), e plantas usadas para proposta experimental (por exemplo, Arabidopsis). Desse modo, os métodos e composições revelados têm uso sobre uma ampla faixa de plantas, incluindo, mas não limitada a, espécies do gênero Asparagus, Avena, Brassica, Citrus, Citrullus, Capsicum, Cucurbita, Daucus, Glycine, Gossypium, Hordeum, Lactuca, Lycopersicon, Malus, Manihot, Nicotiana, Oryza, Persea, Pisum, Pyrus, Prunus, Raphanus, Secale, Solanum, Sorghum, Triticum, Vitis, Vigna, e Zea.Nucleic acids introduced into a plant cell can be used to confer desired traits on essentially any plant. A wide variety of plant systems can be designed for the desired physiological and agronomic characteristics described herein using the nucleic acid constructs of the present disclosure, and the various transformation methods mentioned above. In preferred embodiments, target plant and plant cells for design include, but are not limited to, monocotyledonous and dicotyledonous plants, such as crops including grain crops (e.g., wheat, rice, millet, barley), fruit crops ( tomatoes, apples, pears, strawberries, oranges), fodder crops (eg alfalfa), root vegetable crops (eg carrots, potatoes, sugar beans, yams), leafy vegetable crops (eg lettuce, spinach; flowering plants (eg petunia, rose, chrysanthemum), conifers and pine trees (eg pine, spruce); plants used for phytoremediation (eg heavy metal accumulation plants) oil crops (eg sunflower, rapeseed), and plants used for experimental purposes (eg Arabidopsis) Thus, the disclosed methods and compositions have use over a wide range of plants, including, but not s not limited to, species of the genus Asparagus, Avena, Brassica, Citrus, Citrullus, Capsicum, Cucurbita, Daucus, Glycine, Gossypium, Hordeum, Lactuca, Lycopersicon, Malus, Manihot, Nicotiana, Oryza, Persea, Pisum, Pyrus, Prunus, Raphanus, Secale, Solanum, Sorghum, Triticum, Vitis, Vigna, and Zea.

[00192] Um versado na técnica reconhecerá que após o cassete de expressão ser estavelmente incorporado em plantas transgênicas e confirmado para ser operável, ele pode ser introduzido em outras plantas por cruzamento sexual. Qualquer de um número de técnicas de procriação padrão pode ser usado, dependendo das espécies a serem cruzadas.One skilled in the art will recognize that after the expression cassette is stably incorporated into transgenic plants and confirmed to be operable, it may be introduced into other plants by sexual crossing. Any of a number of standard breeding techniques may be used, depending on the species to be crossed.

[00193] Uma célula de planta transformada, calo, tecido ou planta podem ser identificados e isolados pela seleção ou classificação do material de planta projetado para traços codificados pelos genes marcadores presentes no DNA de transformação. Por exemplo, a seleção pode ser realizada por crescimento do material de planta projetado no meio contendo uma quantidade inibitória do antibiótico ou herbicida ao qual a construção de gene de transformação confere resistência. Adicionalmente, plantas e células de planta transformadas podem também ser identificadas por classificação das atividades de quaisquer genes marcadores visíveis (por exemplo, a β-glucuronidase, luciferase, genes B ou C1) que podem estar presentes nas construções de ácido nucléico recombinantes. Tais metodologias de seleção e classificação são bem conhecidas àqueles versados na técnica.[00193] A transformed plant cell, callus, tissue or plant can be identified and isolated by selecting or classifying plant material designed for traits encoded by the marker genes present in the transforming DNA. For example, selection may be accomplished by growing the projected plant material into the medium containing an inhibitory amount of the antibiotic or herbicide to which the transformation gene construct confers resistance. In addition, transformed plants and plant cells may also be identified by classifying the activities of any visible marker genes (e.g., β-glucuronidase, luciferase, B or C1 genes) that may be present in recombinant nucleic acid constructs. Such selection and classification methodologies are well known to those skilled in the art.

[00194] Métodos físicos e bioquímicos podem também ser usados para identificar transformantes de planta ou célula de planta contendo construções de genes inseridos. Estes métodos incluem, mas não estão limitados a: 1) análise de Southern ou amplificação de PCR para detecção e determinação da estrutura do inserto de DNA recombinante; 2) Northern blotting, proteção de S1 RNase, extensão de prímer ou amplificação de PCR- transcriptase reversa para detecção, e exame de transcritos de RNA dos construções gênicas; 3) ensaios enzimáticos para detecção de enzima ou atividade de ribozima, onde tais produtos de gene são codificados pela construção gênica; 4) eletroforese de gel de proteína, técnicas de Western blotting, imunoprecipitação, ou imunoensaios ligados por enzima, onde os produtos de construção gênica são proteínas. Técnicas adicionais, tais como hibridização in situ, blotting de enzima, e imunoblotting, também podem ser usadas para detectar a presença ou expressão da construção recombinante em órgãos e tecidos de planta específicos. Os métodos para se efetuar todos estes ensaios são bem conhecidos àqueles versados na técnica.Physical and biochemical methods may also be used to identify plant transformants or plant cells containing inserted gene constructs. These methods include, but are not limited to: 1) Southern analysis or PCR amplification for detection and determination of recombinant DNA insert structure; 2) Northern blotting, S1 RNase protection, primer extension or PCR-reverse transcriptase amplification for detection, and examination of RNA transcripts of gene constructs; 3) enzyme assays for enzyme detection or ribozyme activity, where such gene products are encoded by the gene construct; 4) protein gel electrophoresis, Western blotting techniques, immunoprecipitation, or enzyme linked immunoassays, where the gene construction products are proteins. Additional techniques, such as in situ hybridization, enzyme blotting, and immunoblotting, may also be used to detect the presence or expression of recombinant construct in specific plant organs and tissues. The methods for performing all of these assays are well known to those skilled in the art.

[00195] Efeitos na manipulação de gene usando-se os métodos aqui revelados podem ser observados por, por exemplo, northern blotting do RNA (por exemplo, mRNA) isolados a partir dos tecidos de interesse. Tipicamente, se a quantidade de mRNA aumentou, pode ser assumido que o gene endógeno correspondente está sendo expresso a uma taxa maior do que antes. Outros métodos de medição de gene e/ou atividade de CYP74B podem ser usados. Tipos diferentes de ensaios enzimáticos podem ser usados, dependendo do substrato usado e do método de detecção do aumento ou diminuição de um produto de reação ou subproduto. Em adição, os níveis de e/ou CYP74B proteína expressos podem ser medidos imunoquimicamente, isto é, ELISA, RIA, EIA e outros ensaios baseados em anticorpo bem conhecidos àqueles versados na técnica, tais como por ensaios de detecção eletroforético (ou com blotting ou western blotting). O transgene pode ser seletivamente expresso em alguns tecidos da planta ou em alguns estágios de desenvolvimento, ou o transgene pode ser expresso em substancialmente todos os tecidos de planta, substancialmente ao longo de seu ciclo de vida. Contudo, qualquer modo de expressão combinatorial é também aplicável.Effects on gene manipulation using the methods disclosed herein can be observed by, for example, northern blotting of RNA (e.g., mRNA) isolated from the tissues of interest. Typically, if the amount of mRNA has increased, it may be assumed that the corresponding endogenous gene is being expressed at a higher rate than before. Other methods of measuring gene and / or CYP74B activity may be used. Different types of enzyme assays may be used depending on the substrate used and the method of detecting the increase or decrease of a reaction product or byproduct. In addition, expressed levels of and / or CYP74B protein may be immunochemically measured, ie ELISA, RIA, EIA and other antibody based assays well known to those skilled in the art, such as by electrophoretic (or blotting or western blotting). The transgene may be selectively expressed in some plant tissues or at some stages of development, or the transgene may be expressed in substantially all plant tissues substantially throughout their life cycle. However, any combinatorial mode of expression is also applicable.

[00196] A presente descrição também envolve sementes das plantas transgênicas descritas acima no qual a semente tem uma construção de transgene ou de gene. A presente descrição envolve adicionalmente a progenia, clones, linhas de célula ou células das plantas transgênicas acima descritas no qual referida progenia, clone, linha de célula ou célula tem a construção de transgene ou de gene.The present disclosure also involves seeds of the transgenic plants described above in which the seed has a transgene or gene construct. The present disclosure further involves the above described progeny, clones, cell lines or plant cell in which said progeny, clone, cell line or cell has the transgene or gene construct.

[00197] ZFPs e vetores de expressão que codificam ZFPs podem ser administrados diretamente a planta para clivagem-alvo e/ou recombinação, [00198] A administração de quantidades eficazes é por qualquer das vias normalmente usadas para introdução de ZFP em último contato com a célula de planta a ser tratada. Os ZFPs são administrados em qualquer maneira adequada, preferivelmente com veículos farmacêutica mente aceitáveis. Métodos adequados de administração de tais moduladores estão disponíveis e bem conhecidos àqueles versados na técnica, e, embora mais do que uma via possa ser usada para administrar uma composição particular, uma via particular pode frequentemente proporcionar uma reação mais imediata e mais eficaz do que outra via.ZFPs and expression vectors encoding ZFPs may be administered directly to the plant for target cleavage and / or recombination. [00198] The administration of effective amounts is by any of the commonly used routes for introducing ZFP at last contact with the plant. plant cell to be treated. ZFPs are administered in any suitable manner, preferably with pharmaceutically acceptable carriers. Suitable methods of administering such modulators are available and well known to those skilled in the art, and while more than one route may be used to administer a particular composition, a particular route may often provide a more immediate and more effective reaction than another. via.

[00199] Veículos podem também ser usados e são determinados em parte pela composição particular sendo administrada, bem como pelo método particular usado para administrar a composição. Consequentemente, existe uma ampla variedade de formulações adequadas de composições farmacêuticas que estão disponíveis (ver, por exemplo, Remington’s Pharmaceutical Sciences, 17th ed. 1985)). Aplicações [00200] Os métodos e composições discutidos para clivagem-alvo podem ser usados para induzir mutações em uma sequência genômica. A clivagem-alvo pode também ser usada para criar eliminações de gene (por exemplo, para validação alvo ou genômicas funcionais), e para facilitar inserção-alvo de uma sequência em um genoma (isto é, eliminação de gene). A inserção pode ser por meio de substituições de sequências cromossômicas através de recombinação homóloga ou por integração-alvo, em que uma nova sequência (isto é, uma sequência não presente na região de interesse), flanqueada por sequências homólogas à região de interesse no cromossoma, é inserida em um local-alvo predeterminado. Os mesmos métodos podem também ser usados para substituir uma sequência tipo selvagem com uma sequência mutante, ou para converter um alelo em um alelo diferente.Vehicles may also be used and are determined in part by the particular composition being administered, as well as by the particular method used to administer the composition. Accordingly, there is a wide variety of suitable formulations of pharmaceutical compositions that are available (see, for example, Remington's Pharmaceutical Sciences, 17th ed. 1985)). Applications The methods and compositions discussed for target cleavage can be used to induce mutations in a genomic sequence. Target cleavage can also be used to create gene deletions (e.g., for target validation or functional genomics), and to facilitate target insertion of a sequence into a genome (ie gene deletion). Insertion may be by substitution of chromosomal sequences by homologous recombination or by target integration, wherein a new sequence (i.e. a sequence not present in the region of interest), flanked by sequences homologous to the region of interest on the chromosome , is inserted at a predetermined target location. The same methods can also be used to replace a wild type sequence with a mutant sequence, or to convert one allele to a different allele.

[00201] A clivagem-alvo de infecção ou patogenias de planta integradas pode ser usada para tratar infecções patogênicas em um hospedeiro de planta, por exemplo, por divagem do genoma da patogenia tal que sua patogenicidade é reduzida ou eliminada. Adicionalmente, a clivagem-alvo de genes que codificam receptores para vírus de planta pode ser usada para bloquear expressão de tais receptores, impedindo, desse modo, infecção viral e/ou difusão viral na planta.Target cleavage of infection or integrated plant pathogens can be used to treat pathogenic infections in a plant host, for example by dividing the pathogen genome such that its pathogenicity is reduced or eliminated. Additionally, target cleavage of genes encoding plant virus receptors may be used to block expression of such receptors, thereby preventing viral infection and / or viral diffusion in the plant.

[00202] Patogenias de planta exemplares incluem, mas não estão limitadas a, vírus de planta tais como Alfamoviruses, Alphacryptoviruses, Badnaviruses, Betacryptoviruses, Bigeminiviruses, Bromoviruses, Bymoviruses, Capilloviruses, Carlaviruses, Carmoviruses, Caulimoviruses, Closteroviruses, Comoviruses, Cucumoviruses, Cytorhabdoviruses, Dianthoviruses, Enamoviruses, Fabaviruses, Fijiviruses, Furoviruses, Hordeiviruses, Hybrigeminiviruses, Idaeoviruses, llarviruses, Ipomoviruses, Luteoviruses, Machlomoviruses, Macluraviruses, Marafiviruses, Monogeminiviruses, Nanaviruses, Necroviruses, Nepoviruses, Nucleorhabdoviruses, Oryzaviruses, Ourmiaviruses, Phytoreoviruses, Potexviruses, Potyviruses, Rymoviruses, satellite RNAs, satelliviruses, Sequiviruses, Sobemoviruses, Tenuiviruses, Tobamoviruses, Tobraviruses, Tombusviruses, Tospoviruses, Trichoviruses, Tymoviruses, Umbraviruses, Varicosaviruses e Waikaviruses; patogenias fungais tais como ferrugens (por exemplo, Ustilaginales), ferrugens (Uredinales), ferrugens (Clavicepts pupurea) e míldio; moldes (Oomycetes) tais como Phytophthora infestans (ferrugem de batata; patogenias bacterianas tais como Erwinia (por exemplo, E. herbicola), Pseudomonas (por exemplo, P. aeruginosa, P. syringae, P. fluorescense e P. putida), Ralstonia (por exemplo, R. solanacearum), Agrobacterium e Xanthomonas; nematelmintos (Nematoda); e Phytomyxea (Polymyxa e Plasmodiophora).[00202] Exemplary plant pathogens include, but are not limited to, plant viruses such as Alfamoviruses, Alphacryptoviruses, Badnaviruses, Betacryptoviruses, Bigeminiviruses, Bromoviruses, Bymoviruses, Capilloviruses, Carlaviruses, Carmoviruses, Caulimoviruses, Cyoviruses, Cyoviruses, Cyoviruses, Cyoviruses, Cyoviruses, Dianthoviruses, Enamoviruses, Fabaviruses, Fijiviruses, Furoviruses, Hordeiviruses, Hybrigeminiviruses, Idaeoviruses, llarviruses, Ipomoviruses, Luteoviruses, Machlomoviruses, Macluraviruses, Marafiviruses, Monogeminiviruses, Nanaviruses, Necroviruses, Nepoviruses, Nucleorhabdoviruses, Oryzaviruses, Ourmiaviruses, Phytoreoviruses, Potexviruses, Potyviruses, Rymoviruses, satellite RNAs, satelliviruses, Sequiviruses, Sobemoviruses, Tenuiviruses, Tobamoviruses, Tobraviruses, Tombusviruses, Tospoviruses, Trichoviruses, Tymoviruses, Umbraviruses, Varicosaviruses and Waikaviruses; fungal pathogens such as rust (e.g. Ustilaginales), rust (Uredinales), rust (Clavicepts pupurea) and downy mildew; molds (Oomycetes) such as Phytophthora infestans (potato rust; bacterial pathogens such as Erwinia (eg E. herbicola), Pseudomonas (eg P. aeruginosa, P. syringae, P. fluorescense and P. putida), Ralstonia (e.g. R. solanacearum), Agrobacterium and Xanthomonas, nematelmints (Nematoda), and Phytomyxea (Polymyxa and Plasmodiophora).

[00203] Os métodos revelados para recombinação-alvo podem ser usados para substituir qualquer sequência genômica com uma sequência não-idêntica homóloga. Por exemplo, uma sequência genômica mutante pode ser substituída por sua equivalente tipo selvagem, proporcionando, desse modo, métodos para tratamento de doenças de planta; proporciona resistência a patogenias de planta; aumenta produções de colheita, etc. No modo similar, um alelo de um gene pode ser substituído por um alelo diferente usando-se os métodos de recombinação-alvo aqui revelados.The disclosed methods for target recombination may be used to replace any genomic sequence with a non-identical homologous sequence. For example, a mutant genomic sequence may be substituted for its wild-type equivalent, thereby providing methods for treating plant diseases; provides resistance to plant pathogens; increases crop yields, etc. In the similar manner, an allele of a gene may be replaced by a different allele using the target recombination methods disclosed herein.

[00204] Em qualquer destes casos, uma região de interesse compreende uma mutação, e o polinucleotídeo doador compreende a sequência tipo selvagem correspondente. Similarmente, uma sequência genômica tipo selvagem pode ser substituída por uma sequência mutante, se tal é desejável. Por exemplo, superexpressão de um oncogene pode ser revertida, ou por mutação do gene, ou por substituição de suas sequências de controle com sequências que suportam um nível não-patogênico inferior de expressão. De fato, qualquer patologia dependente de uma sequência genômica particular, em qualquer modo, pode ser corrigida ou aliviada usando-se os métodos e composições aqui revelados.In either case, a region of interest comprises a mutation, and the donor polynucleotide comprises the corresponding wild-type sequence. Similarly, a wild-type genomic sequence may be replaced by a mutant sequence if desired. For example, overexpression of an oncogene may be reversed by either mutating the gene or replacing its control sequences with sequences that support a lower non-pathogenic level of expression. Indeed, any pathology dependent on a particular genomic sequence, in any way, can be corrected or alleviated using the methods and compositions disclosed herein.

[00205] A clivagem-alvo e recombinação-alvo podem também ser usadas para alterar não-sequências de codificação (por exemplo, sequências regulatórias tais como promotores, intensificadores, iniciadores, terminadores, locais de união) para alterar os níveis de expressão de um produto de gene. Tais métodos podem ser usados, por exemplo, para proposta terapêutica, estudos de validação de genômicos funcionais e/ou alvo.Target cleavage and target recombination may also be used to alter non-coding sequences (e.g., regulatory sequences such as promoters, enhancers, primers, terminators, binding sites) to alter the expression levels of a gene product. Such methods may be used, for example, for therapeutic purposes, validation studies of functional and / or target genomics.

[00206] A modificação-alvo de estrutura de cromatina, conforme revelada no WO 01/83793 da mesma requerente, pode ser usada para facilitar a ligação de proteínas de fusão para cromatina celular.The target modification of chromatin structure, as disclosed in the same applicant's WO 01/83793, may be used to facilitate binding of fusion proteins to cellular chromatin.

[00207] Em concretizações adicionais, uma ou mais fusões entre um domínio de ligação de dedo de zinco e uma recombinase (ou fragmento funcional destes) podem ser usadas, em adição a ou invés do dedo de zinco-fusões de domínio de divagem aqui revelados, para facilitar recombinação-alvo. Ver, por exemplo, Patente dos Estados Unidos da mesma requerente N° 6.534.261 e Akopian et ai (2003) Proc. Natl. Acad. Sei. USA 100:8688-8691.In additional embodiments, one or more fusions between a zinc finger binding domain and a recombinase (or functional fragment thereof) may be used, in addition to or instead of the zinc finger fusions of the domain domain disclosed herein. , to facilitate target recombination. See, for example, U.S. Patent No. 6,534,261 and Akopian et al (2003) Proc. Natl. Acad. Know. USA 100: 8688-8691.

[00208] Em concretizações adicionais, os métodos e composições revelados são usados para proporcionar fusões de domínios de ligação de ZFP com ativação transcricional ou domínios de repressão que requerem dimerização (ou homodimerização ou heterodimerização) para sua atividade. Nestes casos, um polipeptídeo de fusão compreende um domínio de ligação de dedo de zinco e um monômero de domínio funcional (por exemplo, um monômero de uma ativação transcricional dimérica ou domínio de repressão). A ligação de dois tais polipeptídeos de fusão para locais-alvo corretamente situados permite dimerização de modo a reconstituir uma ativação de transcrição funcional ou domínio de repressão.In further embodiments, the disclosed methods and compositions are used to provide fusions of transcriptionally activated ZFP binding domains or repression domains that require dimerization (or homodimerization or heterodimerization) for their activity. In these cases, a fusion polypeptide comprises a zinc finger binding domain and a functional domain monomer (e.g., a dimeric transcriptional activation monomer or repression domain). Binding of two such fusion polypeptides to correctly situated target sites permits dimerization to reconstitute a functional transcriptional activation or repression domain.

[00209] Adicionalmente, conforme revelado acima, os métodos e composições aqui colocados podem ser usados para integração-alvo de sequências exógenas em uma região de interesse no genoma de uma célula, por exemplo em que divagem aumenta a inserção via mecanismos dependentes de homologia (por exemplo, inserção de uma sequência doadora compreendendo uma sequência exógena junto com uma ou mais sequências que são ou idênticas, ou homólogas, mas não-idênticas, com uma sequência genômica predeterminada (isto é, um local-alvo)).Additionally, as disclosed above, the methods and compositions set forth herein may be used for targeting integration of exogenous sequences into a region of interest in the genome of a cell, for example, where divagen increases insertion via homology-dependent mechanisms ( for example, insertion of a donor sequence comprising an exogenous sequence together with one or more sequences that are either identical or homologous but not identical with a predetermined genomic sequence (i.e. a target site)).

[00210] A sequência doadora tipicamente contém homologia suficiente nas regiões de flanqueamento da sequência exógena, para suportar reparo dirigido por homologia de uma quebra de filamento duplo em uma sequência genômica, inserindo, desse modo, a sequência exógena no local-alvo genômico. Portanto, o ácido nucléico doador pode ser de qualquer tamanho suficiente para suportar integração da sequência exógena por mecanismos de reparo dependentes de homologia (por exemplo, recombinação homóloga). Sem desejar estar ligado a qualquer teoria particular, as regiões de homologia que flanqueiam a sequência exógena são pensadas proporcionar a quebra das extremidades do cromossoma com um gabarito para ressíntese da informação genética no local da quebra de filamento duplo. Em certas concretizações, duas das sequências idênticas, ou duas das sequências homólogas, mas não-idênticas (ou uma de cada) estão presentes, flanqueando a sequência exógena. Uma sequência exógena (ou ácido nucléico exógeno ou polinucleotídeo exógeno) é uma que contém uma sequência de nucleotídeo que não está normalmente na região de interesse.The donor sequence typically contains sufficient homology in the flanking regions of the exogenous sequence to support homologically directed repair of a double stranded break in a genomic sequence, thereby inserting the exogenous sequence at the genomic target site. Therefore, the donor nucleic acid may be of any size sufficient to support integration of the exogenous sequence by homology-dependent repair mechanisms (e.g., homologous recombination). Without wishing to be bound by any particular theory, the regions of homology flanking the exogenous sequence are thought to provide breakage of chromosome ends with a template for resynthesis of genetic information at the site of double stranded breakage. In certain embodiments, two of the identical sequences, or two of the homologous but non-identical sequences (or one of each) are present, flanking the exogenous sequence. An exogenous sequence (either exogenous nucleic acid or exogenous polynucleotide) is one that contains a nucleotide sequence that is not normally in the region of interest.

[00211] Sequências exógenas exemplares incluem, mas não estão limitadas a, cDNAs, sequências promotoras, sequências intensificadoras, etiquetas de epítopo, genes marcadores, locais de reconhecimento de enzima de divagem e vários tipos de construções de expressão. Ver, por exemplo, Patente dos Estados Unidos N° 6.833.252. Endocucleases unidirecionais exemplares adicionais incluem l-Cei/l, Pl-Pspl, Pl-Sce, 1-ScelV, l-Csml, l-Panl, l-Scell, l-Ppol, l-Scelll, l-Crel, \-Tev\, \-Tev\\ e \-Tev\\\. Suas sequências de reconhecimento são conhecidas. Ver também Patente dos Estados Unidos N° 5.420.032; Belfort et al. (1997) Acid nucleics Res. 25:3379-3388; Dujon et al. (1989) Gene 82:115-118; Perler et al. (1994) Acid nucleics Res. 22, 1125-1127; Jasin (1996) Trends Genet. 12:224-228; Gimble et al. (1996) J. Mol. Biol. 263:163-180; Argast et al. (1998) J. Mol. Biol. 280:345-353, e o catálogo New England Biolabs.Exemplary exogenous sequences include, but are not limited to, cDNAs, promoter sequences, enhancer sequences, epitope tags, marker genes, dividing enzyme recognition sites, and various types of expression constructs. See, for example, United States Patent No. 6,833,252. Additional exemplary unidirectional endocucleases include l-Cei / l, Pl-Pspl, Pl-Sce, 1-ScelV, l-Csml, l-Panl, l-Scell, l-Ppol, l-Scelll, l-Crel, \ -Tv \, \ -Tv \\ and \ -Tev \\\. Their recognition sequences are known. See also United States Patent No. 5,420,032; Belfort et al. (1997) Acid nucleics Res. 25: 3379-3388; Dujon et al. (1989) Gene 82: 115-118; Perler et al. (1994) Acid nucleics Res. 22, 1125-1127; Jasin (1996) Trends Genet. 12: 224-228; Gimble et al. (1996) J. Mol. Biol. 263: 163-180; Argast et al. (1998) J. Mol. Biol. 280: 345-353, and the New England Biolabs catalog.

[00212] Genes marcadores incluem, mas não estão limitados a, sequências que codificam proteínas que medeiam resistência antibiótica (por exemplo, resistência à ampicilina, resistência à neomicina, resistência à G418, resistência à puromicina), sequências que codificam proteínas coloridas ou fluorescentes ou luminescentes (por exemplo, proteína fluorescente verde, proteína fluorescente verde aumentada, proteína fluorescente vermelha, luciferase), e proteínas que medeiam crescimento de célula aumentado e/ou amplificação de gene (por exemplo, dihidrofolato redutase). Genes marcadores exemplares desse modo incluem, mas não estão limitados a, β-glucuronidase (GUS), fosfinotricin N-acetila transferase (PAT, BAR), neomicin fosfotransferase, β-lactamase, catecol dioxigenase, a-amilase, tirosinase, β-galactosidase, luciferase, aequorin, EPSP sintase, nitrilase, acetolactato sintase (ALS), dihidrofolato redutase (DHFR), dalapon dehalogenase e antranilato sintase. Em certas concretizações, integração alvo é usada para inserir uma construção de expressão de RNA, por exemplo, sequências responsáveis pela expressão regulada de micro RNA ou siRNA. Promotores, intensificadores e sequências regulatórias de transcrição adicionais, conforme descrito acima, podem também serem incorporados em uma construção de expressão de RNA.Marker genes include, but are not limited to, sequences encoding proteins that mediate antibiotic resistance (e.g. ampicillin resistance, neomycin resistance, G418 resistance, puromycin resistance), sequences encoding colored or fluorescent proteins or luminescent substances (e.g. green fluorescent protein, increased green fluorescent protein, red fluorescent protein, luciferase), and proteins that mediate increased cell growth and / or gene amplification (e.g. dihydrofolate reductase). Exemplary marker genes thus include, but are not limited to, β-glucuronidase (GUS), phosphinothricin N-acetyl transferase (PAT, BAR), neomycin phosphotransferase, β-lactamase, catechol dioxigenase, Î ± -amylase, tyrosinase, β-galactosidase , luciferase, aequorin, EPSP synthase, nitrilase, acetolactate synthase (ALS), dihydrofolate reductase (DHFR), dalapon dehalogenase and anthranilate synthase. In certain embodiments, target integration is used to insert an RNA expression construct, for example, sequences responsible for the regulated expression of microRNA or siRNA. Additional promoters, enhancers, and regulatory sequences as described above may also be incorporated into an RNA expression construct.

REIVINDICAÇÕES

Claims (6)

1. Método para introdução de uma sequência exógena no genoma de uma célula de planta, caracterizado pelo fato de que compreende as etapas de: (a) contatar a célula com um vetor de DNA doador compreendendo uma primeira, segunda e quinta sequências de DNA, e a quinta sequência compreende uma sequência exógena do vetor de DNA a ser introduzida e está interposta entre a primeira e a segunda sequências do vetor de DNA doador; em que a primeira sequência tem pelo menos 90% a 95% de homologia com a uma terceira sequência no genoma da célula de planta, a segunda sequência tem pelo menos 90% a 95% de homologia com a uma quarta sequência no genoma da célula de planta, em que a terceira e a quarta sequências no genoma da célula de planta são sequências de DNA cromossômico e as extremidades proximais das terceira e quarta sequências são separadas por pelo menos um par de nucleotídeos; e (b) expressar uma ou mais nucleases na célula, em que a uma ou mais nucleases são cada uma um par de proteínas de fusão, em que cada proteína de fusão é uma fusão entre o domínio de divagem de uma endonuclease de restrição Fok I e um domínio de ligação de dedo de zinco engenheirado, e em que a uma ou mais ou mais nucleases clivam DNA cromossômico em uma ou mais sequências alvo correspondentes entre a terceira e a quarta sequências, em que a uma ou mais nucleases clivam DNA cromossômico na localização de 0,4 a 3 kilo pares de bases da terceira ou da quarta sequências no genoma da célula de planta; tal que a divagem de DNA cromossômico na etapa (b) estimula a incorporação da quinta sequência de DNA no genoma por recombinação homóloga.Method for introducing an exogenous sequence into the genome of a plant cell, characterized in that it comprises the steps of: (a) contacting the cell with a donor DNA vector comprising a first, second and fifth DNA sequence; and the fifth sequence comprises an exogenous DNA vector sequence to be introduced and is interposed between the first and second donor DNA vector sequences; wherein the first sequence has at least 90% to 95% homology to a third sequence in the plant cell genome, the second sequence has at least 90% to 95% homology to a fourth sequence in the plant cell genome. plant, wherein the third and fourth sequences in the plant cell genome are chromosomal DNA sequences and the proximal ends of the third and fourth sequences are separated by at least one pair of nucleotides; and (b) expressing one or more nucleases in the cell, wherein one or more nucleases are each a pair of fusion proteins, wherein each fusion protein is a fusion between the dividing domain of a Fok I restriction endonuclease. and an engineered zinc finger binding domain, and wherein one or more nucleases cleave chromosomal DNA into one or more corresponding target sequences between the third and fourth sequences, wherein one or more nucleases cleave chromosomal DNA at the locating 0.4 to 3 kilo base pairs of the third or fourth sequence in the plant cell genome; such that the chromosomal DNA splitting in step (b) stimulates the incorporation of the fifth DNA sequence into the genome by homologous recombination. 2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a sequência exógena é um marcador selecionável.Method according to claim 1, characterized in that the exogenous sequence is a selectable marker. 3. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que o marcador selecionável é selecionado a partir do grupo consistindo em proteína fluorescente verde (GFP), β-glucuronidase (GUS), fosfinotricina N-acetil transferase (PAT, BAR), neomicina fosfotransferase, β-lactamase, catecol dioxigenase, a-amilase, tirosinase, β-galactosidase, luciferase, aequorina, EPSP sintase, nitrilase, acetolactato sintase (ALS), diidrofolato redutase (DHFR), dalapon desalogenase e antranilato sintase.Method according to claim 2, characterized in that the selectable marker is selected from the group consisting of green fluorescent protein (GFP), β-glucuronidase (GUS), phosphinothricin N-acetyl transferase (PAT, BAR ), neomycin phosphotransferase, β-lactamase, catechol dioxigenase, Î ± -amylase, tyrosinase, β-galactosidase, luciferase, aequorin, EPSP synthase, nitrilase, acetolactate reductase (ALS), dihydrofolate reductase (DHFR), dalapon desalogenase. 4. Método de acordo com a reivindicação 1, caracterizado pelo fato de que a quinta sequência compreende uma ou mais sequências regulatórias transcricionais.Method according to claim 1, characterized in that the fifth sequence comprises one or more transcriptional regulatory sequences. 5. Método de acordo com a reivindicação 1, caracterizado pelo fato de que a quinta sequência compreende sequências que codificam uma proteína ou uma porção de uma proteína.Method according to claim 1, characterized in that the fifth sequence comprises sequences encoding a protein or a portion of a protein. 6. Método de acordo com a reivindicação 1, caracterizado pelo fato de que a quinta sequência compreende uma equivalente selvagem de uma sequência cromossômica mutante, ou uma equivalente mutante de uma sequência cromossômica de tipo selvagem.Method according to claim 1, characterized in that the fifth sequence comprises a wild equivalent of a mutant chromosomal sequence, or a mutant equivalent of a wild-type chromosomal sequence.

Family

ID=

Similar Documents

Publication Publication Date Title
US10669551B2 (en) Zinc finger nuclease-mediated homologous recombination
JP6886433B2 (en) Methods and compositions for incorporating exogenous sequences into the plant genome
EP2370575B1 (en) Targeted integration into the zp15 locus
DK2205749T3 (en) MODIFIED PROTEINS zinc finger, which target the 5-enolpyruvylshikimate-3-phosphate synthase genes
BR112012018249A2 (en) target genomic change
AU2017216446B2 (en) Zinc finger nuclease-mediated homologous recombination
BRPI0716427B1 (en) METHOD FOR INTRODUCING AN EXOGENOUS SEQUENCE IN THE GENOME OF A PLANT CELL
AU2013216688B2 (en) Zinc finger nuclease-mediated homologous recombination