PT2412812E

PT2412812E - Optimized non-canonical zinc finger proteins

Info

Publication number: PT2412812E
Application number: PT111849410T
Authority: PT
Inventors: Nicole L Arnold; Qihua C Cai; Jeffrey Miller; Fyodor Urnov; Vipula K Shukla; Joseph F Petolino; Lisa W Baker; Robbi J Garrison; Ryan C Blue; Jon C Mitchell; Sarah E Worden
Original assignee: Dow Agrosciences Llc
Priority date: 2006-12-14
Filing date: 2007-12-13
Publication date: 2015-04-30
Also published as: CA2669746C; CR10775A; AU2007334468B2; JP5632610B2; EG26980A; NZ576800A; KR101613624B1; TWI470079B; KR101520507B1; US20160130314A1; PT2415873E; ES2586210T3; WO2008076290A3; SI2092068T1; US10662434B2; BRPI0720048A2; EP2412812A1; TW200844233A; US8921112B2; US20080182332A1

Description

DESCRIÇÃO "PROTEÍNAS COM DEDOS DE ZINCO NÃO CANÓNICAS OPTIMIZADAS"DESCRIPTION " PROTEINS WITH OPTIMIZED NON-CANONIC ZINC FINGERS "

CAMPO TÉCNICO A presente divulgação situa-se nos campos de engelharia genética, alvejamento de genes, integração cromossómica dirigida, expressão proteica e edição do epigenoma.TECHNICAL FIELD The present disclosure is in the fields of genetic engineering, gene targeting, targeted chromosomal integration, protein expression and epigenome editing.

FUNDAMENTO A ligação de proteínas a sequências específicas de DNA, RNA, proteínas e outras moléculas está envolvida numa série de processos celulares tais como, por exemplo, transcrição, replicação, estrutura da cromatina, recombinação, reparação de DNA, processamento de RNA e tradução. A especificidade da ligação das proteínas de ligação celulares que participam nas interacções proteína-DNA, proteína-RNA e proteína-proteína contribui para o desenvolvimento, diferenciação e homeostasia.BACKGROUND The binding of proteins to specific sequences of DNA, RNA, proteins and other molecules is involved in a number of cellular processes such as, for example, transcription, replication, chromatin structure, recombination, DNA repair, RNA processing and translation. The binding specificity of the cellular binding proteins that participate in the protein-DNA, protein-RNA and protein-protein interactions contributes to the development, differentiation and homeostasis.

As proteínas com dedos de zinco (ZFPs) são proteínas que podem ligar-se a DNA numa forma específica de sequência. Os dedos de zinco foram identificados pela primeira vez no factor de transcrição TFIIIA derivado de oócitos da rã de unhas africana, Xenopus laevis. Um domínio dedo de zinco desta classe de ZFPs possui cerca de 30 aminoácidos de comprimento e vários estudos estruturais demonstraram que possui uma volta beta (contendo dois resíduos de cisteína conservados) e uma hélice alfa (contendo dois resíduos de histidina conservados), os quais são mantidos numa conformação particular através da coordenação de um átomo de zinco pelas duas cisteínas e pelas duas histidinas. Esta classe de ZFPs é também conhecida como ZFPs C2H2. Outras classes de ZFPs foram igualmente sugeridas. Ver, e.g., Jiang et al. (1996) J. Biol. Chem. 271:10723-10730, para uma discussão de ZFPs Cys-Cys-His-Cys (C3H). Até agora, foram identificadas mais de 10000 sequências de dedos de zinco em várias centenas de factores de transcrição conhecidos ou putativos. Os domínios dedos de zinco estão envolvidos não só no reconhecimento de DNA, como também na ligação a RNA e na ligação proteína-proteína. As actuais estimativas apontam que esta classe de moléculas constitua cerca de 2% de todos os genes humanos. A maioria das proteínas com dedos de zinco possui resíduos de cisteína e histidina conservados que coordenam tetraedricamente um único átomo de zinco por cada domínio em dedo. Em particular, a maioria dos ZFPs são caracte-rizados por componentes em dedo com a sequência geral: -CyS- (X) 2-4- Cys-(X) 12-His-(X) 3-5-His- (SEQ ID NO : 1) , em que X representa qualquer aminoácido (as ZFPs C2H2). As sequências de coordenação de zinco desta classe mais largamente representada possuem duas cisteínas e duas histidinas com espaçamentos particulares. As estruturas enroladas de cada dedo possuem uma volta β antiparalela, uma região topo do dedo e uma hélice α antipática curta. Os ligandos da coordenação de metais ligam-se ao ião de zinco e no caso de dedos de zinco tipo zif268, a hélice α antipática curta liga-se ao sulco maior do DNA. Ainda, a estrutura em dedo de zinco é estabilizada por determinados residuos de aminoácidos hidrofóbicos conservados (e.g., o resíduo que precede directamente a primeira Cys conservada e o resíduo na posição +4 do segmento helicoidal do dedo) e pela coordenação do zinco através dos resíduos conservados de cisteína e de histidina.Zinc finger proteins (ZFPs) are proteins that can bind to DNA in a sequence specific form. Zinc fingers were first identified in the TFIIIA transcription factor derived from African nail frog oocytes, Xenopus laevis. A zinc finger domain of this class of ZFPs is about 30 amino acids in length and several structural studies have demonstrated that it has a beta loop (containing two conserved cysteine residues) and an alpha helix (containing two conserved histidine residues), which are maintained in a particular conformation by the coordination of a zinc atom by the two cysteines and by the two histidines. This class of ZFPs is also known as C2H2 ZFPs. Other classes of ZFPs were also suggested. See, e.g., Jiang et al. (1996) J. Biol. Chem. 271: 10723-10730, for a discussion of Cys-Cys-His-Cys (C3H) ZFPs. To date, more than 10000 zinc finger sequences have been identified on several hundred known or putative transcription factors. Zinc finger domains are involved not only in DNA recognition, but also in RNA binding and protein-protein binding. Current estimates indicate that this class of molecules constitutes about 2% of all human genes. Most zinc finger proteins have conserved cysteine and histidine residues that tetrahedrally coordinate a single zinc atom per finger domain. In particular, most ZFPs are characterized by finger components having the general sequence: -Cys- (X) 2-4-Cys- (X) 12-His- (X) 3-5-His- (SEQ ID NO: ID NO: 1), wherein X represents any amino acid (the C 2 H 2 ZFPs). The coordinating sequences of zinc of this most widely represented class have two cysteines and two histidines with particular spacings. The rolled structures of each finger have an antiparallel β-loop, a finger-tip region, and a short antipathic α-helix. The metal coordination ligands bind to the zinc ion and in the case of zif268 zinc fingers, the short antipathic α helix binds to the major groove of the DNA. Further, the zinc finger structure is stabilized by certain conserved hydrophobic amino acid residues (eg, the residue directly preceding the conserved first Cys and the residue at the +4 position of the helical segment of the finger) and by the coordination of the zinc through the residues conserved cysteine and histidine.

Foram descritas proteínas com dedos de zinco canónicas (C2H2) com alterações nas posições que fazem contacto directo, resíduos de "suporte" ou "buttressing" imediatamente adjacentes às posições que contactam com as bases e nas posições capazes de contactar o esqueleto de fosfatos do DNA. Ver, e.g., Patentes U.S. Nos. 6, 007, 988; 6, 013,453; 6, 140, 081; 6, 866, 997; 6, 746, 838; 6, 140, 081;Canonized zinc finger proteins (C2H2) with changes in positions that make direct contact, " support " residues have been described. or " buttressing " immediately adjacent to the positions contacting the bases and at positions capable of contacting the phosphate backbone of the DNA. See, e.g., U.S. Pat. 6, 007, 988; 6, 013,453; 6, 140, 081; 6, 866, 997; 6, 746, 838; 6, 140, 081;

6,610,512; 7,101,972; 6,453,242; 6,785,613; 7,013,219; PCT WO 98/53059; Choo et al. (2000) Curr. Opin. Struct. Biol. 10:411-416; Segai et al. (2000) Curr. Opin. Chem. Biol. 4:34-39.6,610,512; 7,101,972; 6,453,242; 6,785,613; 7,013,219; PCT WO 98/53059; Choo et al. (2000) Curr. Opin. Struct. Biol. 10: 411-416; Segai et al. (2000) Curr. Opin. Chem. Biol. 4: 34-39.

Ainda, as proteínas com dedos de zinco contendo dedos de zinco com resíduos de coordenação do zinco modificados foram igualmente descritas (ver, e.g., Pedido de Patente U.S. Nos. 20030108880, 20060246567 e 20060246588. No entanto, enquanto as proteínas com dedos de zinco contendo estes dedos de zinco não canónicos mantêm a função de regulação da transcrição, a sua capacidade para actuar como nucleases com dedos de zinco (ZFNs) é nalguns casos reduzida relativamente às proteínas consistindo em dedos de zinco possuindo exclusivamente dedos de zinco canónicos C2H2.In addition, zinc fingered zinc finger proteins with modified zinc coordination residues have also been described (see, eg, U.S. Patent Application Serial No. 20030108880, 20060246567 and 20060246588. However, while zinc finger proteins containing these non-canonical zinc fingers retain the function of regulating transcription, their ability to act as zinc finger nucleases (ZFNs) is in some cases reduced relative to proteins consisting of zinc fingers having exclusively canine zinc fingers C2H2.

Houchens et al. , descrevem RIP60 contendo quinze motivos de ligação a DNA em dedo de zinco C2H2 organizados em três grupos. WO 02/057293 descreve proteínas de ligação com dedos de zinco com locais de coordenação de metais modificados, pelo que as proteínas de ligação possuem três dedos de coordenação de zinco e um ou mais destes dedos são componentes de dedos não canónicos modificados. WO 2005/014792 descreve polipéptidos de fusão compreendendo um domínio de ligação com dedo de zinco manipulado geneticamente e um domínio de clivagem e polipéptidos de fusão compreendendo um domínio de ligação em dedo de zinco geneticamente manipulado e um semi-domínio de clivagem. WO 2006/029296 descreve polinucleótidos codificadores de 2-cinase de inositol polifosfato (IPP-k) e polipéptidos com uma actividade que modula a biossíntese do ácido fítico.Houchens et al. , describe RIP60 containing fifteen C2H2 zinc finger DNA binding motifs organized into three groups. WO 02/057293 describes zinc finger binding proteins with modified metal coordination sites, whereby the binding proteins have three zinc coordinating fingers and one or more of these fingers are components of modified non-canonical fingers. WO 2005/014792 discloses fusion polypeptides comprising a genetically manipulated zinc finger binding domain and a cleavage domain and fusion polypeptides comprising a genetically engineered zinc finger binding domain and a cleavage half domain. WO 2006/029296 discloses polynucleotides encoding inositol polyphosphate 2-kinase (IPP-k) and polypeptides with an activity that modulates phytic acid biosynthesis.

Assim, permanece a necessidade, particularmente na construção de mais nucleases com dedos de zinco, de proteínas de ligação com dedos de zinco geneticamente manipulados contendo dedos de zinco possuindo regiões de coordenação do zinco não canónicas optimizadas.Thus, the need remains, particularly in the construction of more zinc finger nucleases, of zinc finger fingers containing zinc fingers having optimized non-canonical zinc coordination regions.

SUMÁRIO A presente divulgação proporciona domínios dedos de zinco de ligação a DNA com alterações em pelo menos um resíduo da coordenação de zinco. Estes dedos de zinco podem ainda compreender alterações adicionais (substituições, inserções e/ou deleções) na vizinhança dos resíduos de coordenação de zinco, por exemplo nos resíduos que rodeiam o resíduo de coordenação de zinco mais C-terminal. São também descritos polipéptidos com dedos de zinco e proteínas de fusão compreendendo um ou mais dedos de zinco CCHC, polinucleótidos codificadores destes dedos de zinco e proteínas de fusão e métodos de utilização destes polipéptidos e/ou proteínas de fusão com dedos de zinco. 0 presente invento é descrito pelas reivindi cações 1-32. Também é divulgado o seguinte: 1. Uma proteína com dedos de zinco compreendendo um dedo de zinco não canónico (não C2H2), em que o dedo de zinco não canónico possui uma porção helicoidal envolvida na ligação a DNA e em que a região da coordenação do zinco da porção helicoidal compreende a sequência de aminoácidos HX1X2RCXL (SEQ ID N0:2); e em que a proteína com dedos de zinco é manipulada para se ligar a uma sequência alvo. 2. A proteína com dedos de zinco do item 1, em que Xi é A e X2 é Q. 3. A proteína com dedos de zinco do item 1, em que Xi é K e X2 é E. 4. A proteína com dedos de zinco do item 1, em que Xi é T e X2 é R. 5. A proteína com dedos de zinco do item 1, em que Xi é G. 6. A proteína com dedos de zinco compreendendo dois ou mais dedos de zinco, em que pelo menos um dedo de zinco compreende a sequência Cys-(Xa) 2-4-Cys-(XB) 12-His-(Xc) 3-5-Cys- (XD) 1-10 (SEQ ID NO: 3), onde Xa, Xb, Xc e XD representam qualquer aminoácido. 7. A proteína com dedos de zinco de qualquer um dos itens 1 a 6, compreendendo qualquer uma das sequências mostradas em qualquer uma das Tabelas 1, 2, 3 ou 4. 8. A proteína com dedos de zinco de qualquer um dos itens 6 ou 7, em que XD compreende a sequência QLV ou QKP. 9. A proteína com dedos de zinco do item 8, em que a sequência QLV ou QKP são os 3 resíduos de aminoácidos C-terminais do dedo de zinco. 10. A proteína cmom dedos de zinco de qualquer um dos itens 6 a 9, em que XD compreende os 1, 2 ou 3 resíduos Gly (G). 11. Uma proteína compreendendo uma pluralidade de dedos de zinco, em que pelo menos um dos dedos de zinco compreende um dedo de zinco CCHC de acordo com qualquer um dos itens 1 a 10. 12. A proteína com dedos de zinco do item 1, em que a proteína com dedos de zinco compreende 3, 4, 5 ou 6 dedos de zinco. 13. A proteína com dedos de zinco do item 11 ou 12, em qu o dedo 2 compreende o dedo de zinco CCHC. 14. A proteína com dedos de zinco de qualquer um dos itens 11 a 13, em que o dedo de zinco C-terminal compreende o dedo de zinco CCHC. 15. A proteína com dedos de zinco de qualquer um dos itens 11 a 14, em que pelo menos dois dedos de zinco C compreendem o dedo de zinco CCHC. 16. A proteína com dedos de zinco de qualquer um dos itens 11 a 15, em que a proteína com dedos de zinco compreende qualquer uma das sequências mostradas na Tabela 8 e está manipulada para se ligar a uma sequência alvo num gene IPP2-K. 17. Uma proteína de fusão compreendendo uma proteína com dedos de zinco de qualquer um dos itens 1 a 16 e um ou mais domínios funcionais. 18. Uma proteína de fusão compreendendo: (a) um semi-domínio de clivagem, (b) a proteína com dedos de zinco de qualquer um dos itens 1 a 16 e (c) um ligante ZC interposto entre o semi-domínio de clivagem e a proteína com dedos de zinco. 19. A proteína de fusão do item 18, em que o comprimento do ligante ZC é 5 aminoácidos. 20. A proteína de fusão do item 19, em que a sequência de aminoácidos do ligante ZC é GLRGS (SEQ ID NO:4). 21. A proteína de fusão do item 18, em que o comprimento do ligante ZC é 6 aminoácidos. 22. A proteína de fusão do item 21, em que a sequência de aminoácidos do ligante ZC é GGLRGS (SEQ ID NO:5). 23. Um polinucleótido codificador de uma proteína com dedos de zinco de acordo com qualquer um dos itens 1 a 16 ou uma proteína de fusão de acordo com qualquer um dos itens 17 a 22. 24. Um método para a clivagem dirigida de cromatina celular numa célula vegetal, o método compreendendo a expressão, na células, de um par de proteínas de fusão de acordo com qualquer um dos itens 18 a 2 2; em que: (a) as sequências alvo das proteínas de fusão distam dez nucleótidos uma da outra; e (b) as proteínas de fusão dimerizam e cortam DNA situado entre as sequências alvo. 25. Um método de recombinação genética dirigida numa célula hospedeira vegetal, o método compreendendo (a) expressão, na célula hospedeira, de um par de proteínas de fusão de acordo com com qualquer um dos itens 18 a 22, em que as sequências alvo das proteínas de fusão estão presentes num locus alvo seleccionado do hospedeiro, e (b) identificação de uma célula hospedeira recombinante que apresenta uma alteração da sequência no locus alvo do hospedeiro. 26. 0 método do item 19 ou da reivindicação 24 ou 25, em que a alteração da sequência é uma mutação selec-cionada do grupo consistindo numa deleção de material genético, uma inserção de material genético, uma substituição de material genético e qualquer combinação destas. 27. 0 método de qualquer um dos itens 24 a 26, compreendendo ainda a introdução de um polinucleótido exógeno na célula hospedeira. 28. 0 método do item 27, em que o polinucleótido exógeno compreende sequências homólogas do locus alvo do hospedeiro. 29. 0 método de qualquer um dos itens 24 a 28 em que a planta é seleccionada do grupo consistindo numa monocotiledónea, numa dicotiledónea, gimnospérmicas e algas eucarióticas. 30. O método do item 29, em que a planta é seleccionada do grupo consistindo em milho, arroz, trigo, batata, soja, tomate, tabaco, membros da família Brassica e Arabidopsis. 31. O método de qualquer uma dos itens 24 a 29, em que a planta é uma árvore. 32. 0 método de qualquer um dos itens 24 a 31, em que as sequências alvo estão num gene IPP2-K. 33. 0 método da reivindicação 27 para redução do nível de ácido fítico em sementes, compreendendo a inactivação ou alteração do gene IPP2-K de acordo com o item 32. 34. 0 método da reivindicação 28 para a tornar o fósforo mais metabolicamente disponível na semente, compreendendo a inactivação ou alteração do gene IPP2-K de acordo com o item 32. 35. Uma célula vegetal compreendendo uma proteína de fusão de acordo com qualquer uma dos itens 1 a 16, uma proteína de fusão de acordo com qualquer um dos itens 17 a 22 ou um polinucleótido de acordo com o item 23. 36. A célula vegetal do item 35, em que a célula é da semente. 37. A célula vegetal do item 36, em que a semente é uma semente de milho. 38. A célula vegetal de qualquer um dos itens 35 a 37, em que IPP2-K é parcialmente ou totalmente inactivado. 39. A célula vegetal do item 38, em que os níveis de ácido fítico na semente são reduzidos. 40. A célula vegetal dos itens 35 a 39, em que os níveis de fósforo metabolicamente disponíveis na célula são aumentados.SUMMARY The present disclosure provides for DNA binding zinc finger domains with changes in at least one zinc coordination residue. These zinc fingers may further comprise additional changes (substitutions, insertions and / or deletions) in the vicinity of the zinc coordination residues, for example in the residues surrounding the more C-terminal zinc coordination residue. Also described are zinc finger polypeptides and fusion proteins comprising one or more CCHC zinc fingers, polynucleotides encoding these zinc fingers and fusion proteins, and methods of using such polypeptides and / or zinc finger fusion proteins. The present invention is described by claims 1-32. The following is also disclosed: 1. A zinc finger protein comprising a non-canonical zinc finger (not C2H2), wherein the noncanonical zinc finger has a helical portion involved in DNA binding and wherein the coordination region of the zinc of the helical portion comprises the amino acid sequence HX1X2RCXL (SEQ ID NO: 2); and wherein the zinc finger protein is engineered to bind to a target sequence. 2. The zinc finger protein of item 1, wherein Xi is A and X2 is Q. 3. The zinc finger protein of item 1, wherein Xi is K and X2 is E. 4. The fingered protein of zinc of item 1, wherein X 1 is T and X 2 is R. 5. The zinc finger protein of item 1, wherein X 1 is G. 6. The zinc finger protein comprising two or more zinc fingers, in which at least one zinc finger comprises the sequence Cys- (Xa) 2-4-Cys- (XB) 12-His- (Xc) 3-5-Cys- (XD) 1-10 (SEQ ID NO: 3) ), where Xa, Xb, Xc and XD represent any amino acid. The zinc finger protein of any one of items 1 to 6, comprising any of the sequences shown in any one of Tables 1, 2, 3 or 4. 8. The zinc finger protein of any of items 6 or 7, wherein XD comprises the sequence QLV or QKP. 9. The zinc finger protein of item 8, wherein the QLV or QKP sequence is the 3 C-terminal amino acid residues of the zinc finger. The zinc finger protein of any of items 6 to 9, wherein XD comprises the 1, 2 or 3 Gly (G) residues. A protein comprising a plurality of zinc fingers, wherein at least one of the zinc fingers comprises a zinc finger CCHC according to any one of items 1 to 10. The zinc finger protein of item 1, wherein the zinc finger protein comprises 3, 4, 5 or 6 zinc fingers. The zinc finger protein of item 11 or 12, wherein the finger 2 comprises the zinc finger CCHC. The zinc finger protein of any one of items 11 to 13, wherein the C-terminal zinc finger comprises the zinc finger CCHC. The zinc finger protein of any one of items 11 to 14, wherein at least two zinc fingers C comprises the zinc finger CCHC. The zinc finger protein of any one of items 11 to 15, wherein the zinc finger protein comprises any of the sequences shown in Table 8 and is engineered to bind to a target sequence in an IPP2-K gene. A fusion protein comprising a zinc finger protein of any one of items 1 to 16 and one or more functional domains. A fusion protein comprising: (a) a cleavage half domain, (b) the zinc finger protein of any one of items 1 to 16 and (c) a ZC linker interposed between the cleavage half domain and zinc finger protein. The fusion protein of item 18, wherein the length of the ZC linker is 5 amino acids. 20. The fusion protein of item 19, wherein the amino acid sequence of the ZC linker is GLRGS (SEQ ID NO: 4). 21. The fusion protein of item 18, wherein the length of the ZC linker is 6 amino acids. 22. The fusion protein of item 21, wherein the amino acid sequence of the ZC linker is GGLRGS (SEQ ID NO: 5). A polynucleotide encoding a zinc finger protein according to any one of items 1 to 16 or a fusion protein according to any one of items 17 to 22. A method for the targeted cleavage of cellular chromatin in a The method comprises the expression, in the cells, of a pair of fusion proteins according to any one of items 18-22; wherein: (a) the target sequences of the fusion proteins are ten nucleotides apart; and (b) the fusion proteins dimerize and cleave DNA located between the target sequences. A method of directed genetic recombination in a plant host cell, the method comprising (a) expression in the host cell of a pair of fusion proteins according to any one of items 18 to 22, wherein the target sequences of the fusion proteins are present at a target locus selected from the host, and (b) identification of a recombinant host cell exhibiting a sequence change at the host target locus. 26. The method of item 19 or claim 24 or 25, wherein the sequence change is a mutation selected from the group consisting of a deletion of genetic material, an insertion of genetic material, a replacement of genetic material, and any combination thereof . The method of any one of items 24 to 26, further comprising introducing an exogenous polynucleotide into the host cell. 28. The method of item 27, wherein the exogenous polynucleotide comprises sequences homologous to the host's target locus. The method of any one of items 24 to 28 wherein the plant is selected from the group consisting of a monocotyledon, a dicotyledon, gymnosperms and eukaryotic algae. The method of item 29, wherein the plant is selected from the group consisting of maize, rice, wheat, potato, soybean, tomato, tobacco, members of the Brassica family and Arabidopsis. The method of any one of items 24 to 29, wherein the plant is a tree. 32. The method of any one of items 24 to 31, wherein the target sequences are in an IPP2-K gene. The method of claim 27 for reducing the level of phytic acid in seeds, comprising inactivating or altering the IPP2-K gene according to item 32. The method of claim 28 for rendering phosphorus more metabolically available in the comprising the inactivation or alteration of the IPP2-K gene according to item 32. A plant cell comprising a fusion protein according to any one of items 1 to 16, a fusion protein according to any one of items 17 to 22 or a polynucleotide according to item 23. 36. The plant cell of item 35, wherein the cell is the seed. 37. The plant cell of item 36, wherein the seed is a maize seed. 38. The plant cell of any of items 35 to 37, wherein IPP2-K is partially or fully inactivated. 39. The plant cell of item 38, wherein the levels of phytic acid in the seed are reduced. 40. The plant cell of items 35 to 39, wherein the phosphorus levels metabolically available in the cell are increased.

BREVE DESCRIÇÃO DOS DESENHOSBRIEF DESCRIPTION OF THE DRAWINGS

Figura 1 é um gráfico que descreve as taxas de correcção de genes, medidas pela percentagem de células que expressam GFP, num sistema de ensaio repórter como descrito na Patente U.S. N° 2005/0064474 e abaixo. As variantes ZFN são designadas "X-Y", onde "X" se refere ao número da Tabela e "Y" se refere ao número dado ao dedo de zinco na tabela particularmente seleccionada. Por exemplo, "2-21" refere-se a um ZFN com um dedo compreendendo a sequência mostrada na Tabela 2 na linha numerada como 21, nomeadamente HAQRCGLRGSQLV (SEQ ID NO:53).Figure 1 is a graph depicting the gene correction rates, measured by the percentage of cells expressing GFP, in a reporter assay system as described in U.S. Patent No. 2005/0064474 and below. ZFN variants are designated " X-Y ", where " X " refers to the number of the Table and " Y " refers to the number given to the zinc finger in the particularly selected table. For example, " 2-21 " refers to a ZFN with a finger comprising the sequence shown in Table 2 in the numbered line 21, namely HAQRCGLRGSQLV (SEQ ID NO: 53).

Figura 2 é um gráfico que descreve a percentagem de um sinal Cel-1 resultante da clivagem com vários pares de variantes ZFN. Para cada par de ZFNs, são mostrados resultados de duas experiências através da referência ao número da amostra. Os pares de variantes usados para cada amostra são apresentados na caixa no canto superior direito, enquanto "wt 5-8" e "wt 5-9" se refere a pares de ZFN canónicos descritos no Exemplo 14 (Tabela 17) do Pedido de Patente U.S. N° 2005/0064474. Nas amostras 3-12, a região C-terminal das hélices de reconhecimento do dedo 2 ou do dedo 4 do ZFN canónico 5-8 ou 5-9 estão substituídas com sequências não canónicas. A sequência parcial das variantes ZFN não canónicas designadas 20, 21, 43, 45, 47 e 48 nas amostras 3-12 e a posição do dedo destas variantes dentro da ZFN de 4 dedos é mostrada no canto superior esquerdo acima do gráfico. O asterisco acima da barra que descreve os resultados da experiência 2 das amostras 8 e 9 indica o fundo na pista, resultante de uma subestimativa da eficiência de ZFN.Figure 2 is a graph depicting the percentage of a Cel-1 signal resulting from cleavage with several pairs of ZFN variants. For each pair of ZFNs, results from two experiments are shown by reference to the sample number. The pairs of variants used for each sample are shown in the box in the upper right corner, while " wt 5-8 " and " wt 5-9 " refers to canonical ZFN pairs described in Example 14 (Table 17) of U.S. Patent Application No. 2005/0064474. In samples 3-12, the C-terminal region of finger recognition helices 2 or finger 4 of the 5-8 or 5-9 canonical ZFN are replaced with non-canonical sequences. The partial sequence of the designated non-canonical ZFN variants 20, 21, 43, 45, 47 and 48 in samples 3-12 and the finger position of these variants within the 4-finger ZFN is shown in the upper left corner above the graph. The asterisk above the bar describing the results of experiment 2 of samples 8 and 9 indicates the background in the lane, resulting from an underestimation of the efficiency of ZFN.

Figura 3 é um gráfico que descreve as taxas de correcção dos genes no sistema de ensaio repórter das células GFP descrito na Patente U.S. N° 2005/0064474 e aqui. Os pares ZFN testados em cada amostra estão apresentados abaixo da barra, onde os números dos dedos de zinco CCHC la a 10a compreendem a sequência mostrada nas Tabelas 3 e 4. Os dedos de zinco 20, 21, 7a, 8a, 9a e 10a foram usados no Dedo 4; os dedos de zinco 43, 45, 47, 48, la, 2a, 3a, 4a, 5a e 6a foram usados no Dedo 2.Figure 3 is a graph depicting the correction rates of the genes in the GFP cell reporter assay system described in U.S. Patent No. 2005/0064474 and herein. The ZFN pairs tested in each sample are shown below the bar, where the numbers of the zinc fingers CCHC 1a to 10a comprise the sequence shown in Tables 3 and 4. The zinc fingers 20, 21, 7a, 8a, 9a and 10a were used on Finger 4; the zinc fingers 43, 45, 47, 48, 1a, 2a, 3a, 4a, 5a and 6a were used in Finger 2.

Figura 4 é uma representação esquemática linear do plasmídeo pDABl585, um vector alvo para o tabaco.Figure 4 is a schematic linear representation of plasmid pDAB1585, a target vector for tobacco.

Figura 5 é uma representação esquemática do plasmídeo pDABl585, um vector alvo para o tabaco.Figure 5 is a schematic representation of plasmid pDAB1585, a target vector for tobacco.

Figuras 6A e 6B descrevem nucleases com dedos de zinco (ZFN). FIG. 6A é um esquema que descreve a ligação de ZFN. FIG. 6B mostra a sequência da sequência alvo. plasmídeo pDABl400.Figures 6A and 6B disclose zinc finger nucleases (ZFN). FIG. 6A is a scheme that describes the binding of ZFN. FIG. 6B shows the sequence of the target sequence. plasmid pDABl400.

Figura 7 é uma representação esquemática doFigure 7 is a schematic representation of the

Figura 8 é uma representação esquemática do plasmídeo pDAB782.Figure 8 is a schematic representation of plasmid pDAB782.

Figura 9 é uma representação esquemática do plasmídeo pDABl 582.Figure 9 is a schematic representation of plasmid pDAB1 582.

Figura 10 é uma representação esquemática do plasmídeo pDAB354.Figure 10 is a schematic representation of the plasmid pDAB354.

Figura 11 é uma representação esquemática do plasmídeo pDABl583.Figure 11 is a schematic representation of plasmid pDAB1503.

Figura 12 é uma representação esquemática do plasmídeo pDAB2407.Figure 12 is a schematic representation of plasmid pDAB2407.

Figura 13 é uma representação esquemática do plasmídeo pDABl584.Figure 13 is a schematic representation of plasmid pDAB1584.

Figura 14 é uma representação esquemática do plasmídeo pDAB2418.Figure 14 is a schematic representation of plasmid pDAB2418.

Figura 15 é uma representação esquemática do plasmídeo pDAB4045. plasmídeo pDAB!575.Figure 15 is a schematic representation of plasmid pDAB4045. plasmid pDAB! 575.

Figura 16 é uma representação esquemática doFigure 16 is a schematic representation of the

Figura 17 é uma representação esquemática do plasmídeo pDABl577.Figure 17 is a schematic representation of plasmid pDABl577.

Figura 18 é uma representação esquemática do plasmídeo pDABl579.Figure 18 is a schematic representation of the plasmid pDAB1579.

Figura 19 é uma representação esquemática do plasmídeo pDABl580.Figure 19 is a schematic representation of plasmid pDAB150.

Figura 20 é uma representação esquemática do plasmídeo pDAB3401.Figure 20 is a schematic representation of plasmid pDAB3401.

Figura 21 é uma representação esquemática do plasmídeo pDABl570.Figure 21 is a schematic representation of plasmid pDAB170.

Figura 22 é uma representação esquemática do plasmídeo pDABl572.Figure 22 is a schematic representation of plasmid pDAB1772.

Figura 23 é uma representação esquemática do plasmídeo pDAB4003.Figure 23 is a schematic representation of plasmid pDAB4003.

Figura 24 é uma representação esquemática do plasmídeo pDABl571.Figure 24 is a schematic representation of the plasmid pDABl71.

Figura 25 é uma representação esquemática do plasmídeo pDAB7204. plasmídeo pDAB!573.Figure 25 is a schematic representation of the plasmid pDAB7204. plasmid pDAB! 573.

Figura 26 é uma representação esquemática doFigure 26 is a schematic representation of the

Figura 27 é uma representação esquemática do plasmídeo pDABl574.Figure 27 is a schematic representation of plasmid pDAB1754.

Figura 28 é uma representação esquemática do plasmídeo pDABl581.Figure 28 is a schematic representation of the plasmid pDABl581.

Figura 29 é uma representação esquemática do plasmídeo pD AB 1576.Figure 29 is a schematic representation of the plasmid pD AB 1576.

Figura 30 são representações esquemáticas do plasmídeo pDABl600.Figure 30 are schematic representations of plasmid pDABl600.

Figura 31 é uma representação esquemática do plasmídeo pDAB3731.Figure 31 is a schematic representation of plasmid pDAB3731.

Figura 32 é uma representação esquemática do plasmídeo pDAB4322.Figure 32 is a schematic representation of plasmid pDAB4322.

Figura 33 é uma representação esquemática do plasmídeo pDAB4331.Figure 33 is a schematic representation of plasmid pDAB4331.

Figura 34 é uma representação esquemática do plasmídeo pDAB4332.Figure 34 is a schematic representation of plasmid pDAB4332.

Figura 35 é uma representação esquemática do plasmídeo pDAB4333.Figure 35 is a schematic representation of plasmid pDAB4333.

Figura 36 é uma representação esquemática do plasmídeo pDAB4334. plasmídeo pDAB4336.Figure 36 is a schematic representation of plasmid pDAB4334. plasmid pDAB4336.

Figura 37 é uma representação esquemática doFigure 37 is a schematic representation of the

Figura 38 é uma representação esquemática do plasmídeo pDAB4339.Figure 38 is a schematic representation of plasmid pDAB4339.

Figura 39 é uma representação esquemática do plasmídeo pDAB4321.Figure 39 is a schematic representation of plasmid pDAB4321.

Figura 40 é uma representação esquemática do plasmídeo pDAB4323.Figure 40 is a schematic representation of plasmid pDAB4323.

Figura 41 é uma representação esquemática do plasmídeo pDAB4341.Figure 41 is a schematic representation of the plasmid pDAB4341.

Figura 42 é uma representação esquemática do plasmídeo pDAB4342.Figure 42 is a schematic representation of plasmid pDAB4342.

Figura 43 é uma representação esquemática do plasmídeo pDAB4343.Figure 43 is a schematic representation of plasmid pDAB4343.

Figura 44 é uma representação esquemática do plasmídeo pDAB4344.Figure 44 is a schematic representation of the plasmid pDAB4344.

Figura 45 é uma representação esquemática do plasmídeo pDAB4346. plasmídeo pDAB4330.Figure 45 is a schematic representation of plasmid pDAB4346. plasmid pDAB4330.

Figura 46 é uma representação esquemática doFigure 46 is a schematic representation of the

Figura 47 é uma representação esquemática do plasmídeo pDAB4351.Figure 47 is a schematic representation of plasmid pDAB4351.

Figura 48 é uma representação esquemática do plasmídeo pDAB4356.Figure 48 is a schematic representation of plasmid pDAB4356.

Figura 49 é uma representação esquemática do plasmídeo pDAB4359.Figure 49 is a schematic representation of plasmid pDAB4359.

Figura 50 é uma representação esquemática do plasmídeo pDAB7002.Figure 50 is a schematic representation of plasmid pDAB7002.

Figura 51 é uma representação esquemática do plasmídeo pDAB7025.Figure 51 is a schematic representation of plasmid pDAB7025.

Figura 52 é uma representação esquemática do plasmídeo pDABl591.Figure 52 is a schematic representation of plasmid pDAB1591.

Figura 53 é uma representação esquemática do plasmídeo pcDNA3.l-SCD27a-L0-Fokl, a matriz de DNA usada para a amplificação por PCR de Scd27 ZFN.Figure 53 is a schematic representation of the plasmid pcDNA3.l-SCD27a-L0-Fokl, the DNA template used for PCR amplification of Scd27 ZFN.

Figura 54 é uma representação esquemática do plasmídeo pDABl594.Figure 54 is a schematic representation of plasmid pDAB1594.

Figura 55 é uma representação esquemática do plasmídeo pDAB!598.Figure 55 is a schematic representation of plasmid pDAB! 598.

Figura 56 é uma representação esquemática do plasmídeo pDABl577.Figure 56 is a schematic representation of plasmid pDABl577.

Figura 57 é uma representação esquemática do plasmídeo pDABl578.Figure 57 is a schematic representation of plasmid pDABl578.

Figura 58 é uma representação esquemática do plasmídeo pDABl601,Figure 58 is a schematic representation of plasmid pDAB1601,

Figura 59 é um esquema que descreve a recombi-nação homóloga intracromossómica prevista estimulada pela proteína de fusão IL-1-Fokl.Figure 59 is a schematic describing predicted intrachromosomal homologous recombination stimulated by the IL-1-Fok1 fusion protein.

Figura 60 é uma representação esquemática do plasmídeo pDABl590, um controlo positivo da expressão de GFP.Figure 60 is a schematic representation of plasmid pDABl590, a positive control of GFP expression.

Figura 61 é um esquema que descreve a recom-binação homóloga intercromossómica prevista, estimulada pela proteína de fusão IL-l-Fokl com dedos de zinco.Figure 61 is a schematic describing predicted interchromosomal homologous recombination stimulated by the IL-1-Fokl fusion protein with zinc fingers.

Figura 62 é um esquema que descreve a recom-binação homóloga intercromossómica prevista estimulada pela proteína de fusão Scd27-Fokl com dedos de zinco.Figure 62 is a schematic describing predicted interchromosomal homologous recombination stimulated by the Scd27-Fokl fusion protein with zinc fingers.

Figura 63 é um gel que descreve a análise por PCR dos recombinantes. As primeiras 4 pistas à esquerda estão marcadas por cima do gel. As pistas 1-5 mostram eventos HR da transformação de BY2-380 com o gene da proteína de fusão C3H IL-l-Fokl e as pistas marcadas com 6-7 mostram os eventos HR da transformação de BY2-380 com o gene da proteína de fusão C3H SCD27-Fokl.Figure 63 is a gel describing the PCR analysis of the recombinants. The first 4 lanes on the left are marked above the gel. Lanes 1-5 show HR events of the BY2-380 transformation with the C3H IL-1-Fokl fusion protein gene and the 6-7-labeled lanes show the HR events of the BY2-380 transformation with the protein gene of fusion C3H SCD27-Fokl.

Figura 64 mostra uma sequência do gene IPP2K de milho (SEQ ID NO:6), derivada da cultura de células Hill e que serviu como matriz para a manipulação genética de ZFNs tendo como alvo IPP2K de milho.Figure 64 shows a sequence of the corn IPP2K gene (SEQ ID NO: 6), derived from the Hill cell culture and which served as a matrix for the genetic manipulation of ZFNs targeting maize IPP2K.

Figuras 65, painéis A a E, descrevem um esquema de clonagem do vector de expressão de ZFN. Usou-se uma estratégia de clonagem em vários passos para gerar construções de expressão de ZFN. Os genes codificadores de ZFN individuais foram clonados nos vectores pVAX-N2A-NLSop2-EGFP-FokMono (A) e pVAX-C2A-NLSop2-EGFP-FokMono (B) para criar uma cassete para duas proteínas (C). Esta cassete foi ligada a pDAB3872 (D) para gerar um plasmídeo final (E) para a expressão do heterodímero ZFN.Figures 65, panels A to E, disclose a cloning scheme of the ZFN expression vector. A multi-step cloning strategy was used to generate ZFN expression constructs. The individual ZFN encoding genes were cloned into the vectors pVAX-N2A-NLSop2-EGFP-FokMono (A) and pVAX-C2A-NLSop2-EGFP-FokMono (B) to create a cassette for two (C) proteins. This cassette was ligated to pDAB3872 (D) to generate a final plasmid (E) for expression of the ZFN heterodimer.

Figura 66 descreve a ligação de ZFN a um gene IPP2K de milho. São necessárias duas proteínas ZFN para realizarem o corte da dupla cadeia de DNA. Está apresentada a sequência à volta do local de corte (indicado com uma seta para baixo) (SEQ ID N0:7). Uma proteína (8705) ligou-se à sequência CTGTGGGGCCAT (cadeia superior) (SEQ ID NO:8), enquanto a outra proteína (8684, 8685 ou 8686) se ligou à sequência inferior (CTTGACCAACTCAGCCAG, cadeia inferior) (SEQ ID NO:9).Figure 66 depicts the binding of ZFN to a maize IPP2K gene. Two ZFN proteins are required to perform the double-stranded DNA cut. The sequence around the cutoff site (indicated with an arrow down) is shown (SEQ ID NO: 7). A protein (8705) bound to the CTGTGGGGCCAT (upper strand) (SEQ ID NO: 8) sequence, while the other protein (8684, 8685 or 8686) bound to the lower sequence (CTTGACCAACTCAGCCAG, lower strand) (SEQ ID NO: 9).

Figura 67 descreve sequências tipo selvagem (sequência superior, SEQ ID NO: 10) e o clone ZFN 127 (sequência inferior, SEQ IS NO: 11) . O alvo de corte para este ZFN está evidenciado numa caixa cinzenta.Figure 67 depicts wild-type sequences (upper sequence, SEQ ID NO: 10) and clone ZFN 127 (lower sequence, SEQ ID NO: 11). The cutoff target for this ZFN is evidenced in a gray box.

Figura 68 mostra um alinhamento de múltiplas deleções resultantes da ligação não homóloga de extremos (NHEJ) de um corte em dsDNA, mediada por ZFN, no gene IPP2K de milho consoante detecção por sequenciação de 454. O alvo de corte para esta ZFN está evidenciado numa caixa cinzenta.Figure 68 shows an alignment of multiple deletions resulting from the non-homologous linkage (NHEJ) of a cut in dsDNA, mediated by ZFN, in the gene IPP2K of maize according to detection by sequencing of 454. The cut target for this ZFN is evidenced in a gray box.

Figura 69 é um gráfico que descreve as taxas de correcção no sistema de ensaio repórter com células GFP descrito na Patente U.S. N° 2005/0064474 e aqui. Os pares de ZFN testados em cada amostra estão apresentados por baixo de cada barra.Figure 69 is a graph depicting the correction rates in the GFP cell reporter assay system described in U.S. Patent No. 2005/0064474 and herein. The ZFN pairs tested in each sample are presented below each bar.

Figura 70 descreve o plasmídeo pDAB7471, con-truido como descrito no Exemplo 18B.Figure 70 depicts the plasmid pDAB7471, con-truted as described in Example 18B.

Figura 71 descreve o plasmídeo pDAB7451, construído como descrito no Exemplo 18C.Figure 71 depicts plasmid pDAB7451, constructed as described in Example 18C.

Figura 72 é uma descrição esquemática de uma cassete de expressão autónoma para um gene de tolerância a herbicidas. Esta construção compreende um promotor-unidade de transcrição completa (PTU) contendo um promotor, um gene de tolerância a herbicidas e a sequência de terminação e poli-adenilação (poliA) como descrito no Exemplo 18D.Figure 72 is a schematic description of an autonomous expression cassette for a herbicide tolerance gene. This construct comprises a full transcription promoter-unit (PTU) containing a promoter, a herbicide tolerance gene and the termination and polyadenylation (polyA) sequence as described in Example 18D.

Figura 73 descreve o plasmídeo pDAB7422, construído como descrito no Exemplo 18E. 0 plasmídeo inclui um promotor-unidade de transcrição completa (PTU) contendo um promotor, um gene de tolerância a herbicidas e a sequência de terminação e poli-adenilação (poliA) inserida num esqueleto de plasmídeo posição -1.Figure 73 depicts plasmid pDAB7422, constructed as described in Example 18E. The plasmid includes a complete transcription promoter (PTU) containing a promoter, a herbicide tolerance gene and the termination and polyadenylation (polyA) sequence inserted into a position 1 plasmid backbone.

Figura 74 descreve o plasmídeo pDAB7452, construído como descrito no Exemplo 18E. 0 plasmídeo inclui um promotor-unidade de transcrição completa (PTU) contendo um promotor, um gene de tolerância a herbicidas e a sequência de terminação para poli-adenilação (poliA) inserida num esqueleto de plasmídeo posição -2.Figure 74 depicts plasmid pDAB7452, constructed as described in Example 18E. The plasmid includes a complete transcription promoter (PTU) containing a promoter, a herbicide tolerance gene and the polyadenylation (polyA) termination sequence inserted into a position 2 plasmid backbone.

Figura 75 é uma descrição esquemática de uma cassete de expressão não autónoma para um gene de tolerância a herbicida. Esta construção compreende um promotor-unidade de transcrição completa (PTU) contendo um promotor, um gene de tolerância a herbicidas e a sequência de terminação para poli-adenilação (poliA) como descrito no Exemplo 18F.Figure 75 is a schematic description of a non-autonomous expression cassette for a herbicide tolerance gene. This construct comprises a full transcription promoter-unit (PTU) containing a promoter, a herbicide tolerance gene and the polyadenylation (polyA) termination sequence as described in Example 18F.

Figura 76 descreve o plasmídeo pDAB7423, construído como descrito no Exemplo 18G. Este plasmídeo inclui um promotor-unidade de transcrição (PTU) incompleta contendo um gene de tolerância a herbicida e uma sequência de terminação para poli-adenilação (poliA) inserida num esqueleto de plasmídeo posição -1.Figure 76 depicts plasmid pDAB7423, constructed as described in Example 18G. This plasmid includes an incomplete transcription promoter (PTU) containing a herbicide tolerance gene and a polyadenylation (polyA) termination sequence inserted into a position 1 plasmid backbone.

Figura 77 descreve o plasmídeo pDAB7454, construído como descrito no Exemplo 18G. 0 plasmídeo inclui um promotor- unidade de transcrição (PTU) incompleta contendo um gene de tolerância a herbicida e uma sequência de terminação para poli-adenilação (poliA) inserida num esqueleto de plasmídeo posição -2 como descrito no Exemplo 18H.Figure 77 depicts plasmid pDAB7454, constructed as described in Example 18G. The plasmid includes an incomplete transcription promoter (PTU) containing a herbicide tolerance gene and a polyadenylation (polyA) termination sequence inserted into a position 2 plasmid backbone as described in Example 18H.

Figura 78 descreve o plasmídeo pDAB7424 (um exemplo de dador autónomo posição -1 adaptado de Gateway®), construído como descrito no Exemplo 18H.#Figure 78 depicts plasmid pDAB7424 (an example of a position-1 autonomous donor adapted from Gateway®), constructed as described in Example 18H.

Figura 79 descreve o plasmídeo pDAB 7425 (um exemplo de dador autónomo posição -1 adaptado de Gateway®), construído como descrito no Exemplo 18H.Figure 79 depicts plasmid pDAB 7425 (an example of a position-1 autonomous donor adapted from Gateway®), constructed as described in Example 18H.

Figura 80 descreve o plasmídeo pDAB 7426, construído como descrito no Exemplo 18H. pADB 7426 é um plasmídeo de combinação contendo o dador autónomo posição-1 com uma cassete de expressão de ZFN.Figure 80 depicts plasmid pDAB 7426, constructed as described in Example 18H. pADB 7426 is a combination plasmid containing the position-1 autonomous donor with an ZFN expression cassette.

Figura 81 descreve o plasmídeo pDAB 7427, construído como descrito no Exemplo 18H. pADB 7427 é um plasmídeo de combinação contendo o dador autónomo posição-1 com uma cassete de expressão de ZFN. +Figura 82 descreve a amplificação de sequências específicas dadoras de DNA derivadas de DNA genómico. A presença de um produto de 317 pb é diagnóstico da presença de DNA dador contendo o gene PAT inserido no genoma de linhas de calos de milho #61-72 como descrito no Exemplo 20C. Hill indica um controlo negativo selvagem.Figure 81 depicts plasmid pDAB 7427, constructed as described in Example 18H. pADB 7427 is a combination plasmid containing the position-1 autonomous donor with an ZFN expression cassette. Figure 82 depicts the amplification of specific DNA donor sequences derived from genomic DNA. The presence of a 317 bp product is diagnostic for the presence of donor DNA containing the PAT gene inserted into the genome of corn callus lines # 61-72 as described in Example 20C. Hill indicates a wild-type negative control.

Figura 83 descreve a amplificação da fronteira 5' entre o DNA dador e as sequências genómicas de milho especificas para IPP2K. Os produtos da segunda reacção de PCR derivados da integração dirigida do dador no gene IPP2K foram diagnosticados pela presença de fragmentos de DNA de 1,65 kpb como descrito no Exemplo 21A. Hill indica um controlo negativo selvagem.Figure 83 depicts the amplification of the 5 'border between the donor DNA and the maize genomic sequences specific for IPP2K. The products of the second PCR reaction derived from the targeted integration of the donor into the IPP2K gene were diagnosed by the presence of 1.65 kbp DNA fragments as described in Example 21A. Hill indicates a wild-type negative control.

Figura 84 descreve a amplificação da fronteira 3' entre o DNA dador e sequências genómicas de milho especificas de IPP2K. Os produtos da segunda reacção de PCR derivados da integração dirigida do dador no gene IPP2K foram diagnosticados pela presença de fragmentos de DNA de 1,99 kpb como descrito no Exemplo 21A. Hill indica um controlo negativo selvagem.Figure 84 depicts the 3 'border amplification between donor DNA and specific genomic IPP2K maize sequences. The products of the second PCR reaction derived from the targeted integration of the donor into the IPP2K gene were diagnosed by the presence of 1.99 kbp DNA fragments as described in Example 21A. Hill indicates a wild-type negative control.

Figura 85 descreve a amplificação da fronteira 5' a montante entre genoma e dador. Os produtos da segunda reacção de PCR derivados da integração dirigida do dador no gene IPP2K (fronteira 5') foram diagnosticados pela presença de fragmentos de DNA de 1,35 kpb de tamanho como descrito no Exemplo 21B. Hill indica um controlo negativo selvagem.Figure 85 depicts the amplification of the 5 'upstream border between genome and donor. The products of the second PCR reaction derived from the targeted integration of the donor into the IPP2K gene (5 'border) were diagnosed by the presence of DNA fragments of 1.35 kbp in size as described in Example 21B. Hill indicates a wild-type negative control.

Figura 86 descreve a amplificação da fronteira 3' a jusante entre dador e genoma. Os produtos da segunda reacção de PCR derivados da integração dirigida do dador no gene IPP2K (fronteira 3') foram diagnosticados pela presença de fragmentos de DNA de 1,66 kpb de tamanho como descrito no Exemplo 21B. Hill indica um controlo negativo selvagem.Figure 86 depicts the amplification of the 3 'downstream border between donor and genome. The products of the second PCR reaction derived from the targeted integration of the donor into the IPP2K gene (3 'border) were diagnosed by the presence of DNA fragments of 1.66 kbp in size as described in Example 21B. Hill indicates a wild-type negative control.

Figura 87 descreve a sequência de homologia flanqueante 5' da posição -1 (SEQ ID NO:171).Figure 87 depicts the 5 'flanking homology sequence of the -1 position (SEQ ID NO: 171).

Figura 88 descreve a sequência de homologia flanqueante 3' da posição -1 (SEQ ID NO:172).Figure 88 depicts the 3 'flanking sequence of position -1 (SEQ ID NO: 172).

Figura 89 descreve a sequência de homologia flanqueante 5' da posição -2 (SEQ ID NO:139).Figure 89 depicts the 5 'flanking homology sequence of the -2 position (SEQ ID NO: 139).

Figura 90 descreve a sequência de homologia flanqueante 3' da posição -2 (SEQ ID NO:140).Figure 90 depicts the 3 'flanking sequence of position -2 (SEQ ID NO: 140).

Figura 91 descreve a sequência de uma sequência genómica (5'-) IPP2K a montante das regiões alvo de ZFN (SEQ ID NO:141).Figure 91 depicts the sequence of a genomic sequence (5'-) IPP2K upstream of the ZFN target regions (SEQ ID NO: 141).

Figura 92 descreve a sequência de uma sequência genómica (3'-) IPP2K a jusante das regiões alvo de ZFN (SEQ ID NO:142).Figure 92 depicts the sequence of a genomic sequence (3'-) IPP2K downstream of the ZFN target regions (SEQ ID NO: 142).

DESCRIÇÃO DETALHADA São aqui descritas composições compreendendo polipéptidos de ligação com dedos de zinco (ZFPs) contendo dedos de zinco não canónicos do formato Cys-Cys-His-Cys como reivindicado. Apesar da coordenação de zinco proporcionar a principal energia de enrolamento aos dedos de zinco, o ajustamento da coordenação dos dedos de zinco proporciona um meio rápido de modificação da estabilidade estrutural dos dedos, o que tem impacto numa variedade de caracteristicas funcionais importantes das proteínas com dedos de zinco, incluindo, por exemplo, a semi-vida celular, interacções com outros factores celulares, especificidade e afinidade da ligação a DNA e orientação relativa dos domínios funcionais.DETAILED DESCRIPTION Disclosed herein are compositions comprising zinc finger binding polypeptides (ZFPs) containing non-canonized zinc fingers of the Cys-Cys-His-Cys formate as claimed. Although zinc coordination provides the main zinc finger winding energy, the adjustment of the coordination of the zinc fingers provides a rapid means of modifying the structural stability of the fingers, which impacts on a variety of important functional characteristics of finger proteins including, for example, cell half-life, interactions with other cellular factors, DNA binding specificity and affinity, and relative orientation of the functional domains.

As proteínas com dedos de zinco compreendendo dedos de zinco não canónicos tais como os descritos nos Pedidos de Patente U.S. Nos20030108880; 20060246567; e 20060246588 revelaram-se capazes de se ligarem a DNA e alterar a transcrição. No entanto, quando incorporadas em nucleases com dedos de zinco (ZFNs, ver por exemplo a Publicação do Pedido de Patente U.S. N°2005/0064474), estas proteínas com dedos de zinco não canónicos anteriormente descritas podem por vezes apresentar actividade sub-óptima no corte do DNA alvo. São aqui descritas proteínas com dedos de zinco compreendendo um ou mais dedos de zinco CCHC como reivindicado, em que sequências especificas que rodeiam o par C-terminal dos resíduos de coordenação de zinco foram alteradas. São também descritas proteínas de fusão, por exemplo nucleases com dedos de zinco (ZFNs), compreendendo estes dedos de zinco não canónicos optimizados, em que os ZFNs cortam o DNA alvo com taxas comparáveis ao corte conseguido usando ZFNs compreendendo dedos de zinco canónicos (CCHH).Zinc finger proteins comprising non-canonical zinc fingers such as those described in U.S. Patent Application Serial Nos. 2,003,108,880; 20060246567; and 20060246588 have proved capable of binding to DNA and altering transcription. However, when incorporated into zinc finger nucleases (ZFNs, see for example U.S. Patent Application Serial No. 2005/0064474), these previously described noncanonical zinc finger proteins may sometimes exhibit suboptimal activity at cutting the target DNA. Described herein are zinc finger proteins comprising one or more CCHC zinc fingers as claimed, wherein specific sequences surrounding the C-terminal pair of the zinc coordination residues have been altered. Also described are fusion proteins, for example zinc finger nucleases (ZFNs), comprising these optimized non-canonical zinc fingers, wherein the ZFNs cut the target DNA at rates comparable to the cut obtained using ZFNs comprising canonical zinc fingers (CCHH ).

Os polipéptidos de fusão, como aqui descritos, podem estimular ou suprimir a transcrição de um gene e/ou cortar uma sequência alvo. São igualmente proporcionados polinucleótidos codificadores de dedos de zinco não canónicos optimizados e polinucleótidos codificadores de proteínas de fusão compreendendo um ou mais dedos de zinco não canónicos optimizados. São ainda proporcionadas composições farmacêuticas compreendendo uma quantidade eficaz em termos terapêuticos de qualquer um dos polipéptidos com dedos de zinco de ligação a nucleótidos aqui descritos ou seus fragmentos funcionais; ou uma quantidade eficaz em termos terapêuticos de uma sequência nucleotídica que codifica qualquer um dos polipéptidos de ligação a nucleótidos com dedos de zinco modificados ou seus fragmentos funcionais, em combinação com um veículo aceitável em termos farmacêuticos. São ainda proporcionadas composições agrícolas compreendendo uma quantidade eficaz em termos agronómicos de qualquer um dos polipéptidos de ligação a nucleótidos com dedos de zinco aqui descritos ou seus fragmentos funcionais; ou uma quantidade eficaz em termos agronómicos de uma sequência nucleotídica que codifica qualquer um dos polipéptidos de ligação a nucleótidos com dedos de zinco modificados ou seus fragmentos funcionais, em combinação com um veículo aceitável em termos agronómicos. São igualmente proporcionados métodos de rastreio para obtenção de um polipéptido de ligação a nucleótidos com dedos de zinco modificados que se liga a uma sequência genómica.Fusion polypeptides, as described herein, can stimulate or suppress transcription of a gene and / or cut a target sequence. Also provided are optimized non-canonized zinc finger coding polynucleotides and polynucleotides encoding fusion proteins comprising one or more optimized non-canonical zinc fingers. Also provided are pharmaceutical compositions comprising a therapeutically effective amount of any of the nucleotide-binding zinc finger polypeptides described herein or functional fragments thereof; or a therapeutically effective amount of a nucleotide sequence encoding any of the modified zinc finger nucleotide binding polypeptides or functional fragments thereof in combination with a pharmaceutically acceptable carrier. Also provided are agricultural compositions comprising an agronomically effective amount of any of the zinc finger nucleotide binding polypeptides described herein or functional fragments thereof; or an agronomically effective amount of a nucleotide sequence encoding any of the modified zinc finger nucleotide binding polypeptides or functional fragments thereof in combination with an agronomically acceptable carrier. Also provided are screening methods for obtaining a modified zinc finger nucleotide-binding polypeptide that binds to a genomic sequence.

As sequências genómicas incluem as presentes em cromossomas, epissomas, genomas de organelos (e.g., mito-côndrias, cloroplastos), cromossomas artificiais e qualquer outro tipo de ácido nucleico presente numa célula como seja, por exemplo, sequências amplificadas, cromossomas minúsculos duplos e os genomas de bactérias endógenas ou causadoras de infecção e vírus. As sequências genómicas podem ser normais (i.e., selvagens) ou mutantes; as sequências mutantes podem compreender, por exemplo, inserções, deleções, substituições, translocações, rearranjos e/ou mutações pontuais. Uma sequência genómica pode também compreender um de uma série de alelos diferentes.Genomic sequences include those present on chromosomes, episomes, organelle genomes (eg, mitochondria, chloroplasts), artificial chromosomes and any other type of nucleic acid present in a cell such as, for example, amplified sequences, small double chromosomes, and genomes of bacteria that are endogenous or that cause infection and viruses. The genomic sequences may be normal (i.e., wild) or mutant; the mutant sequences may comprise, for example, insertions, deletions, substitutions, translocations, rearrangements and / or point mutations. A genomic sequence may also comprise one of a number of different alleles.

Geral A execução dos métodos, assim como a preparação e uso das composições aqui descritas empregam, a menos que de outra forma seja indicado, técnicas convencionais de biologia molecular, bioquímica, estrutura e análise da cromatina, química computacional, culturas celulares, DNA recombinante e campos relacionados do conhecimento dos familiarizados com a técnica. Estas técnicas estão totalmente descritas na literatura. Ver, por exemplo, Sambrook et al. MOLECULAR CLONING: A LABORATORY MANUAL,General The practice of the methods, as well as the preparation and use of the compositions described herein, employ, unless otherwise indicated, conventional techniques of molecular biology, biochemistry, chromatin structure and analysis, computational chemistry, cell cultures, recombinant DNA, and related fields of knowledge of those familiar with the art. These techniques are fully described in the literature. See, for example, Sambrook et al. MOLECULAR CLONING: A LABORATORY MANUAL,

Second edition, Cold Spring Harbor Laboratory Press, 1989 e Third edition, 2001; Ausubel et al, CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987 e actualizações periódicas; a série METHODS IN ENZYMOLOGY, Academic Press, San Diego; Wolffe, CHROMATIN STRUCTURE AND FUNCTION, Third edition, Academic Press, San Diego, 1998; METHODS IN ENZYMOLOGY, Vol. 304, "Chromatin" (P.M.Second edition, Cold Spring Harbor Laboratory Press, 1989 and Third edition, 2001; Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987 and periodic updates; the series METHODS IN ENZYMOLOGY, Academic Press, San Diego; Wolffe, CHROMATIN STRUCTURE AND FUNCTION, Third edition, Academic Press, San Diego, 1998; METHODS IN ENZYMOLOGY, Vol. 304, " Chromatin " (P.M.

Wassarman and A. P. Wolffe, eds.), Academic Press, San Diego, 1999; e METHODS IN MOLECULAR BIOLOGY, Vol. 119, "Chromatin Protocols" (P.B. Becker, ed.) Humana Press, Totowa, 1999.Wassarman and A. P. Wolffe, eds.), Academic Press, San Diego, 1999; and METHODS IN MOLECULAR BIOLOGY, Vol. 119, " Chromatin Protocols " (P.B. Becker, ed.) Humana Press, Totowa, 1999.

DefiniçõesDefinitions

Os termos "ácido nucleico", "polinucleótido" e "oligonucleótido" são usados indiferentemente e referem-se a um polímero de desoxirribonucleótidos ou de ribonucleó-tidos, na conformação linear ou circular e na forma de cadeia simples ou dupla. Para fins da presente divulgação, estes termos não são considerados limitantes no que respeita ao comprimento do polímero. Os termos podem incluir análogos conhecidos de nucleótidos naturais, assim como nucleótidos que são modificados na fracção base, açúcar e/ou fosfato (e.g., esqueletos de fosforotioato). Em geral, um análogo de um nucleótido particular possui a mesma especificidade de emparelhamento de bases; i.e., um análogo de A emparelhará com T.The terms " nucleic acid ", " polynucleotide " and " oligonucleotide " are used interchangeably and refer to a polymer of deoxyribonucleotides or ribonucleotides, in the linear or circular conformation and in single or double stranded form. For purposes of the present disclosure, these terms are not considered limiting with respect to the length of the polymer. The terms may include known analogs of natural nucleotides, as well as nucleotides that are modified in the base, sugar and / or phosphate (e.g., phosphorothioate backbone) moieties. In general, an analogue of a particular nucleotide has the same base pairing specificity; i.e., an analog of A will pair with T.

Os termos "polipéptido", "péptido" e "proteína" são usados indiferentemente para referir um polímero de resíduos de aminoácidos. 0 termo também se aplica a polímeros de aminoácidos em que um ou mais aminoácidos são análogos químicos ou derivados modificados de um aminoácido natural correspondente. "Ligação" refere-se a uma interacção não cova-lente, específica de sequência, entre macromoléculas (e.g., entre uma proteína e um ácido nucleico) . Nem todos os componentes de uma interacção de ligação necessitam de ser específicos de sequência (e.g., contactos com resíduos de fosfato num esqueleto de DNA), desde que a interacção como um todo seja específica de sequência. Tais interacções são, de um modo geral, caracterizadas por uma constante de dissociação (Kd) de IO-6 M_1 ou inferior. "Afinidade" refe-re-se à força da ligação: o aumento da afinidade da ligação estando correlacionado com um Kd mais baixo.The terms " polypeptide " " " peptide " and " protein " are used interchangeably to refer to a polymer of amino acid residues. The term also applies to amino acid polymers wherein one or more amino acids are chemical analogues or modified derivatives of a corresponding natural amino acid. " Link " refers to a sequence-specific non-covalent interaction between macromolecules (e.g., between a protein and a nucleic acid). Not all components of a binding interaction need to be sequence specific (e.g., contacts with phosphate residues in a DNA backbone), provided the interaction as a whole is sequence specific. Such interactions are generally characterized by a dissociation constant (Kd) of 10-6 M -1 or less. " Affinity " refers to the strength of the bond: the increase in bond affinity being correlated with a lower Kd.

Uma "proteína de ligação" é uma proteína que é capaz de se ligar não covalentemente a uma outra molécula. Uma proteína de ligação pode ligar-se, por exemplo, a uma molécula de DNA (uma proteína de ligação a DNA), uma molécula de RNA (uma proteína de ligação a RNA) e/ou uma molécula de proteína (um proteína de ligação a proteína). No caso de uma proteína de ligação a proteína, pode ligar-se a si própria (para formar homodímeros, homotrímeros, etc.) e/ou pode ser uma ou mais moléculas de uma proteína ou proteínas diferentes. Uma proteína de ligação pode ter mais de um tipo de actividade de ligação. Por exemplo, as proteínas com dedos de zinco possuem actividade de ligação a DNA, ligação a RNA e ligação a proteína.&Quot; binding protein " is a protein that is capable of non-covalently binding to another molecule. A binding protein may bind, for example, to a DNA molecule (a DNA binding protein), an RNA molecule (an RNA binding protein) and / or a protein molecule (a binding protein the protein). In the case of a protein binding protein, it may bind itself (to form homodimers, homotrimers, etc.) and / or may be one or more molecules of a different protein or proteins. A binding protein may have more than one type of binding activity. For example, zinc finger proteins have DNA binding, RNA binding, and protein binding activity.

Uma "proteína com dedos de zinco de ligação a DNA" (ou domínio de ligação) é uma proteína ou um domínio dentro de uma proteína maior, que se liga a DNA numa forma específica de sequência através de um ou mais dedos de zinco, os quais são regiões da sequência de aminoácidos dentro do domínio de ligação cuja estrutura é estabilizada através da coordenação de um ião de zinco. 0 termo proteína com dedos de zinco de ligação a DNA é frequentemente abreviada como proteína com dedos de zinco ou ZFP.A " zinc finger binding protein " (or binding domain) is a protein or a domain within a larger protein, which binds to DNA in a sequence specific form through one or more zinc fingers, which are regions of the amino acid sequence within the binding domain whose structure is stabilized through the coordination of a zinc ion. The term DNA finger zinc finger protein is often abbreviated as zinc finger protein or ZFP.

Os domínios dedos de zinco de ligação podem ser "manipulados" para se ligarem uma sequência nucleotídica pré-determinada. Exemplos não limitantes de métodos para manipulação de proteínas com dedos de zinco são o desenho e a selecção. Uma proteína com dedos de zinco planeada é uma proteína não natural cuja desenho/composição resulta principalmente de critérios racionais. Os critérios racionais para o desenho incluem aplicação de regras de substituição e algoritmos computorizados para o processamento de informação numa base de dados de armazenamento de informação sobre os desenhos de ZFP existentes e dados de ligação. Ver, por exemplo, Patentes U.S. 6,140,081; 6,453,242;Binding zinc finger domains can be " handled " to bind a predetermined nucleotide sequence. Non-limiting examples of methods for handling zinc finger proteins are design and selection. A planned zinc finger protein is an unnatural protein whose design / composition results primarily from rational criteria. Rational criteria for the design include application of substitution rules and computer algorithms for processing information in a database of information storage on existing ZFP drawings and binding data. See, for example, U.S. Patents 6,140,081; 6,453,242;

6,534,261; e 6,785,613; ver, também WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 e WO 03/016496; e Patentes U.S. 6,746,838; 6,866,997; e 7,030,215.6,534,261; and 6,785,613; see also WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 and WO 03/016496; and U.S. Patents 6,746,838; 6,866,997; and 7,030,215.

Uma proteína com dedos de zinco "seleccionada" é uma proteína não encontrada na natureza cuja produção resulta principalmente de um processo empírico, como seja apresentação fágica, captura por interacção ou selecção de híbridos. Ver e.g., US 5,789,538; US 5,925,523; US 6,007,988; US 6,013,453; US 6,200,759; US 6,733,970; US RE 3 9,229; e WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970 WO 01/88197 e WO 02/099084.A protein with zinc fingers " selected " is a protein not found in nature whose production results primarily from an empirical process, such as phage display, capture by interaction or selection of hybrids. See e.g., US 5,789,538; US 5,925,523; US 6,007,988; US 6,013,453; US 6,200,759; US 6,733,970; US RE 3, 9.229; and WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970 WO 01/88197 and WO 02/099084.

Uma proteína com dedos de zinco "não canónica" é uma proteína compreendendo um dedo de zinco não canónico (não C2H2). Um dedo de zinco não canónico compreende assim uma substituição, adição e/ou deleção de pelo menos um aminoácido, comparativamente com uma proteína com dedo de zinco natural C2H2. Exemplos não limitantes de dedos de zinco não canónicos incluem os que compreendem resíduos de coordenação de zinco (do extremo amino para carboxilo) de Cys-Cys-His-Cys (e.g., C3H).A protein with zinc fingers " non-canonical " is a protein comprising a non-canonical zinc finger (not C2H2). A non-canonical zinc finger thus comprises a substitution, addition and / or deletion of at least one amino acid, as compared to a natural zinc finger protein C2H2. Non-limiting examples of non-canonical zinc fingers include those comprising zinc (from the amino to carboxyl terminus) coordination residues of Cys-Cys-His-Cys (e.g., C3H).

Uma "sequência homóloga" refere-se a uma primeira sequência que partilha um grau de identidade de sequências com uma segunda sequência e cuja sequência pode ser idêntica à da segunda sequência. Uma "sequência homóloga não idêntica" refere-se a uma primeira sequência que partilha um grau de identidade de sequência com uma segunda sequência, mas cuja sequência não é idêntica à da segunda sequência. Por exemplo, um polinucleótido compreendendo a sequência selvagem de um gene mutante é homólogo e não idêntico à sequência do gene mutante. Em determinadas realizações, o grau de homologia entre as duas sequências é suficiente para permitir recombinação homóloga entre elas, usando os mecanismos celulares normais. Duas sequências homólogas não idênticas podem ter qualquer comprimento e o seu grau de não homologia pode ser tão pequeno quanto um único nucleótido (e.g., para correcção de uma mutação pontual genómica através de recombinação homóloga dirigida) ou tão grande quanto 10 ou mais quilobases (e.g., para inserção de um gene num local pré-determinado num cromossoma). Dois polinucleótidos compreendendo as sequências homólogas não idênticas não necessitam de ter o mesmo comprimento. Por exemplo, pode ser usado um polinucleótido exógeno (i.e., polinucleótido dador) entre 20 e 10000 nucleótidos ou pares de nucleótidos.A " homologous sequence " refers to a first sequence that shares a degree of sequence identity with a second sequence and whose sequence may be identical to that of the second sequence. A " non-identical homologous sequence " refers to a first sequence that shares a degree of sequence identity with a second sequence but whose sequence is not identical to that of the second sequence. For example, a polynucleotide comprising the wild-type sequence of a mutant gene is homologous and not identical to the sequence of the mutant gene. In certain embodiments, the degree of homology between the two sequences is sufficient to permit homologous recombination between them, using normal cellular mechanisms. Two non-identical homologous sequences may be any length and their degree of non-homology may be as small as a single nucleotide (eg, for correction of a genomic point mutation by directed homologous recombination) or as large as 10 or more kilobases (eg , for insertion of a gene at a predetermined location on a chromosome). Two polynucleotides comprising the non-identical homologous sequences need not have the same length. For example, an exogenous polynucleotide (i.e., donor polynucleotide) between 20 and 10,000 nucleotides or nucleotide pairs may be used.

Na técnica são conhecidas técnicas para determinação da identidade de sequências de ácido nucleico e de aminoácidos. Tipicamente, tais técnicas incluem determinação da sequência nucleotidica do mRNA para um gene e/ou determinação da sequência de aminoácidos codificada e comparação destas sequências com uma segunda sequência nucleotidica ou de aminoácidos. As sequências genómicas podem também ser determinadas e comparadas desta forma. Em geral, a identidade refere-se a uma correspondência exacta nucleótido a nucleótido ou aminoácido a aminoácido de duas sequências polinucleotidicas ou polipeptidicas, respecti-vamente. Duas ou mais sequências (polinucleotidicas ou de aminoácidos) podem ser comparadas determinando-se a sua percentagem de identidade. A percentagem de identidade de duas sequências, quer sejam de ácido nucleico quer sejam de aminoácidos, é o número de correspondências exactas entre as duas sequências alinhadas dividido pelo comprimento da sequência mais curta e multiplicado por 100. Um alinhamento aproximado para sequências de ácido nucleio é proporcionado pelo algoritmo de homologia local de Smith e Waterman, Advances in Applied Mathematics 2:482-489 (1981). Este algoritmo pode ser aplicado às sequências de aminoácidos através da utilização da matriz de pontuação desenvolvida por Dayhoff, Atlas of Protein Sequences and Structure. M. 0. Dayhoff ed., 5 suppl. 3:353-358, National Biomedical Research Foundation, Washington, D. C, USA, e normalizada por Gribskov, Nucl. Acids Res. 14(6):6745-6763 (1986). Urn exemplo de implementação deste algoritmo para determinar a percentagem de identidade de uma sequência é proporcionado pelo Genetics Computer Group (Madison, WI) na aplicação da ferramenta "BestFit". Os parâmetros por defeito para este método estão descritos no Wisconsin Sequence Analysis Package Program Manual, Version 8 (1995) (disponível no Genetics Computer Group, Madison, WI) . Um exemplo de urn método de estabelecimento da percentagem de identidade no contexto da presente divulgação é usar o pacote de programas MPSRCH, cujos direitos são da Universidade deTechniques for determining the identity of nucleic acid and amino acid sequences are known in the art. Typically, such techniques include determining the nucleotide sequence of the mRNA for a gene and / or encoding the amino acid sequence and comparing these sequences with a second nucleotide or amino acid sequence. Genomic sequences can also be determined and compared in this way. In general, the identity refers to an exact match nucleotide to nucleotide or amino acid to amino acid of two polynucleotide or polypeptide sequences, respectively. Two or more sequences (polynucleotide or amino acid) can be compared by determining their percentage identity. The percentage identity of two sequences, whether nucleic acid or amino acid, is the number of exact matches between the two aligned sequences divided by the length of the shortest sequence and multiplied by 100. Approximate alignment for nucleic acid sequences is provided by the local homology algorithm of Smith and Waterman, Advances in Applied Mathematics 2: 482-489 (1981). This algorithm can be applied to the amino acid sequences through the use of the dot matrix developed by Dayhoff, Atlas of Protein Sequences and Structure. M. 0. Dayhoff ed., 5 suppl. 3: 353-358, National Biomedical Research Foundation, Washington, D.C., USA, and standardized by Gribskov, Nucl. Acids Res. 14 (6): 6745-6763 (1986). One example of implementing this algorithm to determine the percent identity of a sequence is provided by the Genetics Computer Group (Madison, WI) in the " BestFit " tool application. The default parameters for this method are described in the Wisconsin Sequence Analysis Package Program Manual, Version 8 (1995) (available from the Genetics Computer Group, Madison, WI). An example of a method of establishing percent identity in the context of the present disclosure is to use the MPSRCH program package, the rights of which are from the University of

Edimburgo, desenvolvido por John F. Collins e Shane S. Sturrok, e distribuído por IntelliGenetics, Inc. (Mountain View, CA) . A partir deste conjunto de pacotes pode ser empregue o algoritmo de Smith-Waterman em que são usados os parâmetros por defeito para a tabela de pontuações (por exemplo, a penalização por um espaço aberto de 12, a penalização pela extensão do espaço de um e um espaço de seis) . A partir dos dados gerados, o valor de "Correspondência" reflecte a identidade das sequências. Outros programas adequados para o cálculo da percentagem de identidade ou similaridade entre sequências são conhecidos na área, por exemplo, um outro programa de alinhamento é o BLAST, usado com parâmetros por defeito. Por exemplo, BLASTN e BLASTP podem ser usados com os parâmetros por defeito seguintes: código genético = padrão; filtro = nenhum; cadeia = ambas; limiar = 60; esperado = 10; Matriz = BLOSUM62; Descrições = 50 sequências; ordenar por = HIGH SCORE; Databases = não redundante, GenBank + EMBL + DDBJ + PDB + GenBank CDS translations + Swiss protein + Spupdate + PIR. Os detalhes destes programas podem ser encontrados na rede. Relativamente às sequências aqui descritas, a gama de graus de identidade de sequências pretendida é de aproximadamente 35% a 100% e qualquer valor inteiro entre eles. Tipicamente as percentagens de identidade entre sequências são pelo menos de 35%-40%; 40%-45%; 45%-50%; 50%-60%; 60%-70%; 70-75%, de preferência 80-82%, mais de preferência 85-90%, ainda mais de preferência 92%, ainda mais de preferência95%, e mais de preferência 98% de identidade de sequências.Edinburgh, developed by John F. Collins and Shane S. Sturrok, and distributed by IntelliGenetics, Inc. (Mountain View, CA). From this set of packages we can employ the Smith-Waterman algorithm in which the default parameters are used for the scoring table (for example, the penalty for an open space of 12, the penalty for extending the space of one a space of six). From the data generated, the value of " Correspondence " reflects the identity of the sequences. Other suitable programs for calculating the percentage of identity or similarity between sequences are known in the art, for example another alignment program is BLAST, used with default parameters. For example, BLASTN and BLASTP can be used with the following default parameters: genetic code = default; filter = none; chain = both; threshold = 60; expected = 10; Matrix = BLOSUM62; Descriptions = 50 sequences; sort by = HIGH SCORE; Databases = non-redundant, GenBank + EMBL + DDBJ + PDB + GenBank CDS translations + Swiss protein + Spupdate + PIR. The details of these programs can be found on the network. With respect to the sequences described herein, the range of degrees of sequence identity desired is from about 35% to 100% and any integer value therebetween. Typically percentages of identity between sequences are at least 35-40%; 40-45%; 45% -50%; 50% -60%; 60% -70%; 70-75%, preferably 80-82%, more preferably 85-90%, still more preferably 92%, still more preferably95%, and most preferably 98% sequence identity.

Como alternativa, o grau de similaridade de sequências entre polinucleótidos pode ser determinado por hibridação de polinucleótidos nas condições que permitem a formação de duplas hélices estáveis entre regiões homólogas, seguido da digestão com nucleases específicas de cadeia simples e determinação do tamanho dos fragmentos digeridos. Duas sequências de ácido nucleico ou duas sequências polipeptídicas são substancialmente homólogas uma da outra quando as sequências apresentam pelo menos cerca de 70-75%, de preferência 80%-82%, mais de preferência 85%-90%, ainda mais de preferência 92%, ainda mais de preferência 95% e mais de preferência 98% de identidade de sequências ao longo de um comprimento definido das moléculas, como determinado usando os métodos acima. Como aqui usado, substancialmente homólogo também se refere a sequências que apresentam identidade complexa com uma sequência de DNA ou de proteína especificada. As sequências de DNA que são substancialmente homólogas podem ser identificadas numa experiência de hibridação Southern, por exemplo, em condições restringentes, como definido para aquele sistema particular. Os familiarizados com a técnica sabem definir condições de hibridação adequadas. Ver, e.g., Sambrook et ai., supra; Nucleic Acid Hybridization: A Practical Approach, editors B.D. Hames and SJ. Higgins, (1985) Oxford; Washington, DC; ERL Press). A hibridação selectiva de dois fragmentos de ácido nucleico pode ser determinada como se segue. O grau de identidade das sequências entre as duas moléculas de ácido nucleico afecta a eficiência e a força dos eventos de hibridação entre tais moléculas. Uma sequência de ácido nucleico parcialmente idêntica inibirá, pelo menos parcialmente, a hibridação de uma sequência totalmente idêntica com uma molécula alvo. A inibição da hibridação da sequência completamente idêntica pode ser avaliada usando ensaios de hibridação que são conhecidos na técnica (e.g., transferência Southern (DNA), transferência Northern (RNA), hibridação em solução ou similares, ver Sambrook, et al., Molecular Cloning: A Laboratory Manual, Second Edition, (1989) Cold Spring Harbor, N. Y.). Tais ensaios podem ser conduzidos usando vários graus de selectividade, por exemplo, usando condições que variam entre restringência baixa e elevada. Se forem empregues condições de restringência baixa, a ausência de ligação não especifica pode ser avaliada usando uma sonda secundária que não possui nem mesmo um grau parcial de identidade de sequência (por exemplo, uma sonda que possui menos de cerca de 30% de identidade de sequência com a molécula alvo) de modo que, na ausência de eventos de ligação não especifica, a sonda secundária não hibridará com o alvo.Alternatively, the degree of sequence similarity between polynucleotides can be determined by hybridization of polynucleotides under conditions that allow the formation of stable double helices between homologous regions, followed by single nucleotide specific nucleases digestion and determination of the size of the digested fragments. Two nucleic acid sequences or two polypeptide sequences are substantially homologous to each other when the sequences have at least about 70-75%, preferably 80-82%, more preferably 85-90%, still more preferably 92-85%. %, still more preferably 95% and more preferably 98% sequence identity over a defined length of the molecules as determined using the above methods. As used herein, substantially homologous also refers to sequences which have complex identity with a specified DNA or protein sequence. DNA sequences that are substantially homologous may be identified in a Southern hybridization experiment, for example under stringent conditions, as defined for that particular system. Those familiar with the art know how to define suitable hybridization conditions. See, e.g., Sambrook et al., Supra; Nucleic Acid Hybridization: A Practical Approach, B.D. editors. Hames and SJ. Higgins, (1985) Oxford; Washington, DC; ERL Press). Selective hybridization of two nucleic acid fragments can be determined as follows. The degree of sequence identity between the two nucleic acid molecules affects the efficiency and strength of the hybridization events between such molecules. A partially identical nucleic acid sequence will at least partially inhibit the hybridization of a fully identical sequence to a target molecule. Inhibition of completely identical sequence hybridization can be evaluated using hybridization assays which are known in the art (eg, Southern blotting, Northern blotting, hybridisation in solution or the like, see Sambrook, et al., Molecular Cloning : A Laboratory Manual, Second Edition, (1989) Cold Spring Harbor, NY). Such assays may be conducted using varying degrees of selectivity, for example, using conditions ranging from low to high stringency. If low stringency conditions are employed, the absence of non-specific binding can be assessed using a secondary probe that does not even have a partial degree of sequence identity (e.g., a probe having less than about 30% sequence with the target molecule) so that, in the absence of non-specific binding events, the secondary probe will not hybridize to the target.

Quando se utiliza um sistema de detecção baseado em hibridação, escolhe-se uma sonda de ácido nucleico que seja complementar de uma sequência de ácido nucleico de referência e depois, através da selecção das condições adequadas, as sequências da sonda e da referência hibridam selectivamente ou ligam-se uma à outra para formar uma molécula de dupla hélice. Uma molécula de ácido nucleico que seja capaz de hibridar selectivamente com uma sequência de referência em condições moderadamente restringentes tipicamente híbrida em condições que permitem a detecção de uma sequência de ácido nucleico alvo de pelo menos cerca de 10-14 nucleótidos de comprimento, tendo pelo menos aproximadamente 70% de identidade de sequência com a sequência da sonda de ácido nucleico seleccionada. As condições de hibridação restringentes tipicamente permitem a detecção de sequências de ácido nucleico alvo de pelo menos cerca de 10-14 nucleótidos de comprimento, com uma identidade de sequência superior a cerca de 90-95% com a sequência da sonda de ácido nucleico seleccionada. As condições de hibridação úteis para a hibridação das sequências sonda/referência, em que a sonda e a referência possuem um elevado grau de identidade de sequência, podem ser determinadas como é conhecido na técnica (ver, por exemplo, Nucleic Acid Hybridization: A Practical Approach, editors B.D. Hames and SJ. Higgins, (1985) Oxford; Washington, DC; IRL Press).When a hybridization-based detection system is used, a nucleic acid probe is chosen which is complementary to a reference nucleic acid sequence and then, through the selection of suitable conditions, the probe and reference sequences hybridize selectively or bind to one another to form a double helix molecule. A nucleic acid molecule which is capable of selectively hybridizing with a reference sequence under typically stringent conditions typically hybrid under conditions allowing the detection of a target nucleic acid sequence of at least about 10-14 nucleotides in length having at least about 70% sequence identity to the selected nucleic acid probe sequence. Stringent hybridization conditions typically permit the detection of target nucleic acid sequences of at least about 10-14 nucleotides in length, with a sequence identity greater than about 90-95% with the sequence of the selected nucleic acid probe. Hybridization conditions useful for the hybridization of the probe / reference sequences, wherein the probe and reference have a high degree of sequence identity, can be determined as is known in the art (see, for example, Nucleic Acid Hybridization: A Practical Approach, editors BD Hames and SJ Higgins, (1985) Oxford, Washington, DC, IRL Press).

As condições de hibridação são conhecidas dos familiarizados com a técnica. A restringência de hibridação refere-se ao grau em que as condições de hibridação desfavorecem a formação de híbridos contendo nucleótidos sem correspondência, com a restringência mais elevada correlacionada com uma tolerância mais baixa para os híbridos sem correspondências. Os factores que afectam a restringência de hibridação são conhecidos dos familiarizados com a área e incluem, mas não lhes estão limitados, temperatura, pH, força iónica e concentração de solventes orgânicos tais como, por exemplo, formamida e dimetil-sulfóxido. Como é conhecido dos familiarizados com a técnica, a restringência de hibridação é aumentada através de temperatura mais elevada e força iónica mais baixa e concentrações de solventes mais baixas.Hybridization conditions are known to those skilled in the art. Hybridization stringency refers to the degree to which hybridization conditions disfavor the formation of uncorrected nucleotide-containing hybrids, with the highest stringency correlated with a lower tolerance for uncorrected hybrids. Factors affecting the stringency of hybridization are known to those of ordinary skill in the art and include, but are not limited to, temperature, pH, ionic strength and concentration of organic solvents such as, for example, formamide and dimethylsulfoxide. As known to those skilled in the art, the stringency of hybridization is increased through higher temperature and lower ionic strength and lower solvent concentrations.

Relativamente às condições de restringência para hibridação, é conhecido na técnica que podem ser empregues numerosas condições equivalente para estabelecer uma restringência particular através da variação, por exemplo, dos seguintes factores: o comprimento e natureza das sequências, a composição em bases das várias sequências, concentrações de sais e outros componentes da solução de hibridação, a presença ou ausência de agentes bloqueadores nas soluções de hibridação (e.g., sulfato de dextrano e polietilenoglicol), parâmetros de temperatura e tempo da reacção de hibridação, assim como, variação das condições de lavagem. A selecção de uma série particular de condições de hibridação é feita seguindo métodos convencionais na técnica (ver, por exemplo, Sambrook, et ai., Molecular Cloning: A Laboratory Manual. Second Edition, (1989) Cold Spring Harbor, N. Y.). "Recombinação" refere-se a um processo de troca de informação genética entre dois polinucleótidos. Para fins da presente divulgação "recombinação homóloga (HR) " refere-se à forma especializada em que a troca ocorre, por exemplo, durante a reparação de quebras da cadeia dupla nas células. Este processo requer homologia da sequência de nucleótidos, usa uma molécula "dadora" para moldar a reparação de uma molécula "alvo" (i.e., a que sofreu a quebra da cadeia dupla) e é conhecida como "conversão de genes sem "crossing-over"" ou "conversão de genes num segmento curto", devido a conduzir à transferência de informação genética do dador para o alvo. Sem pretender estar limitado por qualquer teoria particular, tal transferência pode envolver correcção dos desemparelha-mentos do DNA de heteroduplexes que se formam entre o alvo quebrado e o dador e/ou "emparelhamento de cadeias dependente de síntese" em que o dador é usado para re-sintetizar a informação genética que se tornará parte do alvo e/ou processos relacionados. Tal HR especializada frequentemente resulta numa alteração da sequência da molécula alvo, de forma que parte ou a totalidade da sequência do polinucleótido dador é incorporada no polinucleótido alvo. "Clivagem" refere-se à quebra do esqueleto covalente de uma molécula de DNA. A clivagem pode ser iniciada por uma variedade de métodos incluindo, mas não lhes estando limitada, hidrólise enzimática ou química de uma ligação fosfodiéster. São possíveis tanto a clivagem de cadeia simples como a clivagem de cadeia dupla e a clivagem de cadeia dupla pode ocorrer como resultado de dois eventos distintos de clivagem de cadeia simples. A clivagem do DNA pode resultar na produção de extremos cegos ou de extremos coesivos. Em determinadas realizações, os polipéptidos de fusão são usados para a clivagem dirigida de DNA de cadeia dupla.With respect to stringency conditions for hybridization, it is known in the art that numerous equivalent conditions may be employed to establish a particular stringency by varying, for example, the following factors: the length and nature of the sequences, the base composition of the various sequences, concentrations of salts and other components of the hybridization solution, the presence or absence of blocking agents in the hybridization solutions (eg, dextran sulfate and polyethylene glycol), temperature and time parameters of the hybridization reaction, as well as varying washing conditions . Selection of a particular series of hybridization conditions is done following methods conventional in the art (see, for example, Sambrook, et al., Molecular Cloning: A Laboratory Manual, Second Edition, (1989) Cold Spring Harbor, N.Y.). " Recombination " refers to a process of exchanging genetic information between two polynucleotides. For purposes of the present disclosure " homologous recombination (HR) " refers to the specialized form in which the exchange occurs, for example, during the repair of double strand breaks in cells. This process requires homology of the nucleotide sequence, uses a " donor " molecule " for shaping the repair of a " target molecule " (i.e., double stranded) and is known as " crossing-over " or " gene conversion in a short segment ", because it leads to the transfer of genetic information from the donor to the target. Without being bound by any particular theory, such transfer may involve correction of DNA mismatches of heteroduplexes that form between the broken target and the donor and / or " synthesis-dependent chain pairing " in which the donor is used to re-synthesize the genetic information that will become part of the target and / or related processes. Such specialized HR often results in a change in the sequence of the target molecule, so that part or all of the sequence of the donor polynucleotide is incorporated into the target polynucleotide. " Cleavage " refers to the breaking of the covalent backbone of a DNA molecule. Cleavage can be initiated by a variety of methods including, but not limited to, enzymatic or chemical hydrolysis of a phosphodiester bond. Both single-chain cleavage and double-stranded cleavage are possible and double-stranded cleavage may occur as a result of two distinct single-stranded cleavage events. DNA cleavage can result in the production of blunt ends or cohesive ends. In certain embodiments, the fusion polypeptides are used for the targeted cleavage of double-stranded DNA.

Um domínio de clivagem" compreende uma ou mais sequências polipeptídicas que possuem actividade catalítica para a clivagem de DNA. Um domínio de clivagem pode estar contido numa cadeia polipeptídica simples ou a actividade de clivagem pode resultar da associação de dois (ou mais) polipéptidos.A cleavage domain " comprises one or more polypeptide sequences which have catalytic activity for DNA cleavage. A cleavage domain may be contained within a single polypeptide chain or the cleavage activity may result from the combination of two (or more) polypeptides.

Um "meio domínio de clivagem" é uma sequência polipeptídica que, conjuntamente com um segundo polipéptido (idêntico ou diferente), forma um complexo com actividade de clivagem (e.g., actividade de clivagem de cadeia dupla).A " half cleavage domain " is a polypeptide sequence which together with a second (identical or different) polypeptide forms a complex with cleavage activity (e.g., double-stranded cleavage activity).

Os termos "domínio de clivagem" e "meio domínio de clivagem" incluem domínios selvagens e porções ou mutantes dos domínios de clivagem ou meios domínios de clivagem que mantêm a capacidade de multimerizar (e.g., dimerizar) para formar um domínio de clivagem funcional. "Cromatina" é a estrutura de nucleoproteína compreendendo o genoma celular. A cromatina celular compreende ácido nucleico, principalmente DNA, e proteína, incluindo histonas e proteínas cromossómicas não histonas. A maioria da cromatina celular eucariótica existe na forma de nucleossomas, em que um módulo central do nucleossoma compreende aproximadamente 150 pares de bases de DNA associadas a um octâmero compreendendo duas de cada uma das histonas H2A, H2B, H3 e H4; e o DNA ligante (de comprimento variável dependendo do organismo) estende-se entre os módulos centrais do nucleossoma. A molécula da histona Hl é geralmente associada ao DNA ligante. Para fins da presente divulgação, o termo " "cromatina" pretende englobar todos os tipos de nucleoproteina celular, procariótica e eucariótica. A cromatina celular inclui cromatina cromossómica e epissómica.The terms " cleavage domain " and " half cleavage domain " include wild-type domains and portions or mutants of the cleavage domains or cleavage domains that maintain the ability to multimerize (e.g., dimerize) to form a functional cleavage domain. " Chromatin " is the nucleoprotein structure comprising the cellular genome. Cellular chromatin comprises nucleic acid, primarily DNA, and protein, including histones and non-histone chromosomal proteins. Most eukaryotic cellular chromatin exists in the form of nucleosomes, wherein a central nucleosome module comprises approximately 150 DNA base pairs associated with an octamer comprising two of each of the histones H2A, H2B, H3 and H4; and the binder DNA (of variable length depending on the organism) extends between the central modules of the nucleosome. The histone H1 molecule is generally associated with the ligand DNA. For purposes of the present disclosure, the term " " chromatin " is intended to encompass all types of cellular, prokaryotic and eukaryotic nucleoprotein. Cellular chromatin includes chromosomal and episomal chromatin.

Um "cromossoma" é um complexo de cromatina compreendendo a totalidade ou uma porção do genoma de uma célula. 0 genoma de uma célula é frequentemente caracte-rizado pelo seu cariótipo, o qual é o conjunto de todos os cromossomas que compreendem o genoma da célula. 0 genoma de uma célula pode compreender um ou mais cromossomas.A " chromosome " is a chromatin complex comprising all or a portion of the genome of a cell. The genome of a cell is often characterized by its karyotype, which is the set of all chromosomes comprising the genome of the cell. The genome of a cell may comprise one or more chromosomes.

Um "epissoma" é um ácido nucleico que se replica, complexo de nucleoproteina ou outra estrutura compreendendo um ácido nucleico que não é parte do cariótipo cromossómico de uma célula. Exemplos de epissomas incluem plasmídeos e determinados genomas virais.An " epizome " is a replicating nucleic acid, nucleoprotein complex or other structure comprising a nucleic acid that is not part of the chromosomal karyotype of a cell. Examples of episomes include plasmids and certain viral genomes.

Uma "região acessível" é um local na cromatina celular em que um local alvo presente no ácido nucleico pode ser ligado a uma molécula exógena que reconhece o local alvo. Sem pretender estar limitado por qualquer teoria particular, crê-se que uma região acessível é uma que não está incluída numa estrutura nucleossómica. A estrutura distinta de uma região acessível pode frequen temente ser detectada pela sua sensibilidade a sondas químicas e enzimáticas, por exemplo, nucleases.An " accessible region " is a site in the cellular chromatin where a target site present on the nucleic acid can be attached to an exogenous molecule that recognizes the target site. Without wishing to be bound by any particular theory, it is believed that an accessible region is one which is not included in a nucleosomal structure. The distinct structure of an accessible region can often be detected by its sensitivity to chemical and enzymatic probes, for example, nucleases.

Um "local alvo" ou "sequência alvo" é uma sequência de ácido nucleico que define uma porção de um ácido nucleico a que uma molécula de ligação se ligará, desde que existam condições suficientes para a ligação. Por exemplo, a sequência 5'-GAATTC-3' é um local alvo da endonuclease de restrição EcoRI.A " target location " or " target sequence " is a nucleic acid sequence that defines a portion of a nucleic acid to which a binding molecule will bind, provided sufficient conditions exist for attachment. For example, the sequence 5'-GAATTC-3 'is a target site of the restriction endonuclease EcoRI.

Uma molécula "exógena" é uma molécula que normalmente não está presente numa célula, mas que pode ser introduzida numa célula através de um ou mais métodos genéticos, bioquímicos ou outros. A "presença normal na célula" é determinada relativamente à fase do desenvolvimento particular e condições ambientais da célula. Assim, por exemplo, uma molécula que está presente apenas durante o desenvolvimento embrionário do músculo é uma molécula exógena relativamente a uma célula do músculo adulto. De forma semelhante, uma molécula induzida por choque térmico é uma molécula exógena relativamente a uma célula não exposta a choque térmico. Uma molécula exógena pode compreender, por exemplo, uma versão funcional de uma molécula endógena que não esteja funcional ou uma versão que funcione mal de uma molécula endógena a funcionar normalmente.An " exogenous " is a molecule which is not normally present in a cell but which can be introduced into a cell through one or more genetic, biochemical or other methods. &Quot; normal cell presence " is determined relative to the stage of the particular development and environmental conditions of the cell. Thus, for example, a molecule which is present only during the embryonic development of the muscle is a molecule exogenous to an adult muscle cell. Similarly, a heat shock-induced molecule is a molecule exogenous to a cell not exposed to thermal shock. An exogenous molecule may comprise, for example, a functional version of an endogenous molecule that is not functional or a malfunctioning version of an endogenous normally functioning molecule.

Uma molécula exógena pode ser, entre outras coisas, uma pequena molécula, como as geradas através de um processo de química combinatória ou uma macromolécula como seja uma proteína, ácido nucleico, açúcar, lípido, glicoproteína, liproteína, polissacárido, qualquer derivado modificado das moléculas atrás ou qualquer complexo compreendendo uma ou mais das moléculas acima. Os ácidos nucleicos incluem DNA ou RNA, podem ser de cadeia simples ou dupla; podem ser lineares, ramificados ou circulares; e podem ter qualquer comprimento. Os ácidos nucleicos incluem os capazes de formar duplas hélices, assim como os ácidos nucleicos capazes de forma triplas hélices. Ver, por exemplo, Patente U.S. Nos. 5,176,996 e 5,422,251. As proteínas incluem, mas não lhes estão limitadas, proteínas de ligação a DNA, factores de transcrição, factores de remodelação da cromatina, proteínas de ligação a DNA metilado, polimerases, metilases, demetilases, acetilases, desacetilases, cinases, fosfatases, integrases, recombina-ses, ligases, topiosomerases, girases e helicases.An exogenous molecule may be, among other things, a small molecule, such as those generated by a combinatorial chemistry or macromolecule such as a protein, nucleic acid, sugar, lipid, glycoprotein, lipoprotein, polysaccharide, any modified derivative of the molecules behind or any complex comprising one or more of the above molecules. Nucleic acids include DNA or RNA, may be single or double-stranded; can be linear, branched or circular; and may have any length. Nucleic acids include those capable of forming double helices, as well as nucleic acids capable of forming triple helices. See, for example, U.S. Pat. 5,176,996 and 5,422,251. Proteins include, but are not limited to, DNA binding proteins, transcription factors, chromatin remodeling factors, methylated DNA binding proteins, polymerases, methylases, demethylases, acetylases, deacetylases, kinases, phosphatases, integrins, recombines -syles, ligases, topiosomes, gyroses and helicases.

Uma molécula exógena pode ser do mesmo tipo de uma molécula endógena, e.g., uma proteína ou ácido nucleico exógeno. Por exemplo, um ácido nucleico exógeno pode compreender um genoma virai infeccioso, uma cadeia T de Agrobacterium tumefaciens, um plasmídeo ou epissoma introduzido numa célula ou um cromossoma que normalmente não está presente na célula. Os ácidos nucleicos ou polinucleótidos exógenos podem, no entanto, possuir sequências que são homólogas ou idênticas a sequências endógenas. Relativamente a uma região genómica endógena particular, uma "sequência exógena" refere-se a uma sequência de nucleótidos que não está presente naquela região. Tal sequência exógena pode estar presente numa outra localização cromossómica endógena ou pode não estar presente numa outra localização cromossómica endógena ou pode não estar de todo presente no genoma. Assim, um polinucleótido exógeno pode conter sequências exógenas e endógenas: por exemplo, um transgene flanqueado por sequências homólogas de uma região genómica. Tais ácidos nucleicos exógenos são usados em métodos de integração dirigida e recombinação dirigida como descrito infra. Métodos para a introdução de moléculas exógenas nas células são conhecidos na técnica e incluem, mas não lhes estão limitados, transferência mediada por lípidos (i.e. lipos-somas, incluindo lipidos neutros e catiónicos), electro-poração, injecção directa, fusão celular, bombardeamento de partículas, coprecipitação com fosfato de cálcio, transferência mediada por DEAE-dextrano e transferência mediada por vectores virais.An exogenous molecule may be of the same type as an endogenous molecule, e.g., an exogenous nucleic acid or protein. For example, an exogenous nucleic acid may comprise an infectious viral genome, an Agrobacterium tumefaciens T-chain, a plasmid or episomal introduced into a cell or a chromosome that is not normally present in the cell. Exogenous nucleic acids or polynucleotides may, however, have sequences that are homologous or identical to endogenous sequences. Relative to a particular endogenous genomic region, an " exogenous sequence " refers to a nucleotide sequence that is not present in that region. Such an exogenous sequence may be present at another endogenous chromosomal location or may not be present at another endogenous chromosomal location or may not be entirely present in the genome. Thus, an exogenous polynucleotide may contain exogenous and endogenous sequences: for example, a transgene flanked by homologous sequences of a genomic region. Such exogenous nucleic acids are used in methods of directed integration and directed recombination as described infra. Methods for introducing exogenous molecules into cells are known in the art and include, but are not limited to, lipid mediated transfer (ie liposomes including neutral and cationic lipids), electroporation, direct injection, cell fusion, bombardment particle size distribution, calcium phosphate co-precipitation, DEAE-dextran mediated transfer, and viral vector mediated transfer.

Pelo contrário, uma molécula "endógena" é uma que normalmente está presente numa célula particular numa fase particular do desenvolvimento em condições ambientais particulares. Por exemplo, um ácido nucleico endógeno pode compreender um cromossoma, o genoma de uma mitocôndria, cloroplasto ou outro organelo, ou um ácido nucleico epis-sómico natural. Outras moléculas endógenas podem incluir proteínas, por exemplo, factores de transcrição e enzimas.On the contrary, an " endogenous " is one which is normally present in a particular cell at a particular stage of development under particular environmental conditions. For example, an endogenous nucleic acid may comprise a chromosome, the genome of a mitochondria, chloroplast or other organelle, or a natural episomal-like nucleic acid. Other endogenous molecules may include proteins, for example, transcription factors and enzymes.

Uma molécula de "fusão" é uma molécula em que duas ou mais moléculas de subunidades estão ligadas, por exemplo, covalentemente. As moléculas de subunidades podem ser do mesmo tipo químico de molécula ou podem ser de tipos químicos diferentes. Exemplos do primeiro tipo de molécula de fusão incluem, mas não lhes estão limitados, proteínas de fusão (por exemplo, uma fusão entre um domínio ZFP de ligação a DNA e um domínio de clivagem) e ácidos nucleicos de fusão (por exemplo, um ácido nucleico codificador da proteína de fusão descrita supra). Exemplos do segundo tipo de molécula de fusão incluem, mas não lhes estão limitados, uma fusão entre um ácido nucleico formador de triplas hélices e um polipéptido e uma fusão entre um ligante do sulco menor e um ácido nucleico. A expressão de uma proteína de fusão numa célula pode resultar da entrega da proteína de fusão à célula ou da entrega de um polinucleótido codificador da proteína de fusão a uma célula, em que o polinucleótido é transcrito e o transcrito é traduzido, para gerar a proteína de fusão. Trans-splicing, clivagem de polipéptidos e ligação de polipéptidos podem igualmente estar envolvidos na expressão de uma proteína numa célula. Métodos para a entrega de polinucleótidos e polipéptidos nas células estão apresentados algures nesta divulgação.A " fusion " is a molecule in which two or more subunit molecules are attached, for example, covalently. The subunit molecules may be of the same chemical type of molecule or may be of different chemical types. Examples of the first type of fusion molecule include, but are not limited to, fusion proteins (for example, a fusion between a DNA binding domain ZFP and a cleavage domain) and fusion nucleic acids (e.g. nucleic acid encoding the fusion protein described supra). Examples of the second type of fusion molecule include, but are not limited to, a fusion between a triple helix nucleic acid and a polypeptide and a fusion between a minor sulcus ligand and a nucleic acid. Expression of a fusion protein in a cell can result from delivery of the fusion protein to the cell or delivery of a polynucleotide encoding the fusion protein to a cell, wherein the polynucleotide is transcribed and the transcript is translated, to generate the protein of fusion. Trans-splicing, polypeptide cleavage and polypeptide binding may also be involved in the expression of a protein in a cell. Methods for delivery of polynucleotides and polypeptides to cells are shown elsewhere in this disclosure.

Um "gene" para fins da presente divulgação, inclui uma região de DNA codificadora de um produto de gene (ver infra) , assim como todas as regiões de DNA que regulam a produção do produto do gene, quer essas sequências reguladoras estejam ou não adjacentes às sequências codificadoras e/ou transcritas. Assim, um gene inclui, mas não lhes está necessariamente limitado, sequências de promotores, terminadores, sequências reguladoras da tradução, tais como locais de ligação aos ribossomas e locais internos de entrada dos ribossomas, estimuladores, silenciadores, isoladores, elementos flanqueantes, origens de replicação, locais de ligação à matriz e regiões de controlo de locus. "Expressão de genes" refere-se à conversão da informação, contida num gene, num produto de gene. Um produto de gene pode ser o produto da transcrição directa de um gene (e.g., mRNA, tRNA, rRNA, RNA anti-sentido, ribozima, RNA estrutural ou qualquer outro tipo de RNAs que sejam modificados, por processos tais como capping, poli-adenilação, metilação e edição e proteínas modificadas através, por exemplo, de metilação, acetilação, fosfori-lação, ubiquitinação, ADP-ribosilação, miristoilação e glicosilação. "Modulação da expressão de um gene" refere-se a uma alteração na actividade de um gene. A modulação da expressão pode incluir, mas não lhes está limitada, activação do gene e repressão do gene. "Células vegetais" incluem, mas não lhes estão limitadas, células de plantas monocotiledóneas (monocots) ou dicotiledóneas (dicots). Exemplos não limitantes de monocots incluem plantas de cereais tais como milho, arroz, cevada, aveia, sorgo, centeio, cana sacarina, ananás, cebola, banana e coco. Exemplos não limitantes de dicots incluem tabaco, tomate, girassol, algodão, beterraba sacarina, batata, alface, melão, soja, canola (colza) e alfafa. Aa células vegetais podem ser de qualquer parte da planta e/ou de qualquer fase do desenvolvimento da planta.A " gene " for purposes of the present disclosure, includes a DNA region encoding a gene product (see below), as well as all regions of DNA that regulate the production of the gene product, whether or not those regulatory sequences are adjacent to the coding sequences and / or transcribed. Thus, a gene includes, but is not necessarily limited to, sequences of promoters, terminators, translation regulatory sequences, such as ribosome binding sites and internal ribosome entry sites, stimulators, silencers, isolators, flanking elements, replication, matrix binding sites, and locus control regions. " Gene Expression " refers to the conversion of the information contained in a gene into a gene product. A gene product may be the product of the direct transcription of a gene (eg, mRNA, tRNA, rRNA, antisense RNA, ribozyme, structural RNA or any other type of RNAs that are modified by processes such as capping, adenylation, methylation and editing, and modified proteins by, for example, methylation, acetylation, phosphorylation, ubiquitination, ADP-ribosylation, myristoylation and glycosylation. " Modulation of gene expression " refers to a change in the activity of The expression modulation may include, but is not limited to, gene activation and gene repression. " Plant cells " include, but are not limited to, monocotyledonous or dicot cells. Non-limiting examples of monocots include cereal plants such as corn, rice, barley, oats, sorghum, rye, sugarcane, pineapple, onion, banana and coconut. ts include tobacco, tomato, sunflower, cotton, sugar beet, potato, lettuce, melon, soybean, canola and alfalfa. The plant cells may be from any part of the plant and / or from any stage of the development of the plant.

Uma "região de interesse" é qualquer região da cromatina celular, como seja, por exemplo, um gene ou uma sequência não codificadora dentro ou adjacente a um gene, em que é desejável ligar uma molécula exógena. A ligação pode ser para fins de clivagem dirigida de DNA e/ou recombinação dirigida. Uma região de interesse pode, por exemplo, estar presente num cromossoma, epissoma, genoma de organelo (e.g., mitocôndria, cloroplasto) ou genoma virai infeccioso. Uma região de interesse pode estar dentro da região codificadora de um gene, dentro de regiões transcritas não codificadoras tais como, por exemplo, sequências lider, sequências de reboque ou intrões, ou dentro de regiões não transcritas, a montante ou a jusante da região codificadora. Uma região de interesse pode ser tão pequena quanto um par de nucleótidos ou ter até 25000 pares de nucleótidos de comprimento ou qualquer valor inteiro de pares de nucleótidos.A " region of interest " is any region of the cellular chromatin, such as, for example, a gene or non-coding sequence within or adjacent to a gene, where it is desirable to link an exogenous molecule. Binding may be for purposes of directed DNA cleavage and / or targeting. A region of interest may, for example, be present on a chromosome, episomal, organelle genome (e.g., mitochondria, chloroplast) or infectious viral genome. A region of interest may be within the coding region of a gene within non-coding transcripts such as, for example, leader sequences, tow sequences or introns, or within non-transcribed regions, upstream or downstream of the coding region . One region of interest may be as small as one nucleotide pair or have up to 25,000 nucleotide pairs in length or any integer value of nucleotide pairs.

Os termos "ligação operativa" e "ligado operacionalmente" (ou "operativamente ligado") são usados indistintamente referindo-se a uma justaposição de dois ou mais componentes (tais como elementos de uma sequência) em que os componentes estão arranjados de forma que ambos os componentes funcionem normalmente e permitam a possibilidade de pelo menos um dos componentes poder mediar uma função que é exercida sobre pelo menos um dos outros componentes. A titulo ilustrativo, uma sequência reguladora da transcrição, como seja um promotor, está operacionalmente ligada a uma sequência codificadora se a sequência reguladora da transcrição controlar o nivel de transcrição da sequência codificadora como resposta à presença ou ausência de um ou mais factores reguladores da transcrição. Uma sequência reguladora da transcrição está geralmente ligada operacionalmente em cis a uma sequência codificadora, mas não necessita de estar adjacente a ela. Por exemplo, um estimulador é uma sequência reguladora da transcrição que está operacionalmente ligada a uma sequência codificadora, mesmo apesar de não ser contígua.The terms " operative link " and " operably linked " (or " operatively linked ") are used interchangeably referring to a juxtaposition of two or more components (such as elements of a sequence) wherein the components are arranged so that both components function normally and allow the possibility of at least least one of the components may mediate a function which is exerted on at least one of the other components. By way of illustration, a transcriptional regulatory sequence, such as a promoter, is operably linked to a coding sequence if the transcriptional regulatory sequence controls the level of transcription of the coding sequence in response to the presence or absence of one or more transcription regulatory factors . A transcriptional regulatory sequence is generally operably linked in cis to a coding sequence, but need not be adjacent thereto. For example, a stimulator is a transcriptional regulatory sequence that is operably linked to a coding sequence, even though it is not contiguous.

Relativamente aos polipéptidos de fusão, o termo "ligado operacionalmente" pode referir-se ao facto de cada um dos componentes desempenhar a mesma função quando ligado ao outro componente que teria se não estivesse ligado. Por exemplo, relativamente a um polipéptido de fusão em que um domínio ZFP de ligação a DNA está fundido com um domínio de clivagem, o domínio ZFP de ligação a DNA e o domínio de clivagem estão operacionalmente ligados se, num polipéptido de fusão, a porção do domínio ZFP de ligação a DNA for capaz de se ligar ao seu local alvo e/ou ao seu local de ligação, enquanto o domínio de clivagem é capaz de clivar o DNA na vizinhança do local alvo.With respect to the fusion polypeptides, the term " operably linked " may refer to the fact that each of the components perform the same function when connected to the other component it would have if it were not connected. For example, with respect to a fusion polypeptide in which a DNA binding domain ZFP is fused to a cleavage domain, the DNA binding domain ZFP and the cleavage domain are operably linked if, in a fusion polypeptide, the of the DNA binding domain ZFP is capable of binding to its target site and / or binding site, while the cleavage domain is capable of cleaving the DNA in the vicinity of the target site.

Um "fragmento funcional" de uma proteína, polipéptido ou ácido nucleico é uma proteína, polipéptido ou ácido nucleico cuja sequência não é idêntica à proteína ou ácido nucleico de tamanho completo, mantendo no entanto a mesma função da proteína, polipéptido ou ácido nucleico de tamanho completo. Um fragmento funcional pode possuir mais, menos ou o mesmo número de resíduos da correspondente molécula nativa e/ou pode conter uma ou mais substituições de aminoácidos ou nucleótidos. Os métodos para determinação da função de um ácido nucleico (e.g., função codificadora, capacidade de hibridar com um outro ácido nucleico) são conhecidos na técnica. De forma semelhante, os métodos para determinação da função da proteína são bem conhecidos. Por exemplo, a função de ligação a DNA de um polipéptido pode ser determinada, por exemplo, através da ligação a filtros, alteração da mobilidade electroforética ou ensaios de imunoprecipitação. A clivagem de DNA pode ser testada por electroforese em gel. Ver Ausubel et ai., supra. A capacidade de uma proteína para interagir com uma outra proteína pode ser determinada, por exemplo, através de co-imunoprecipitação, ensaios de duplo híbrido ou de complementação, tanto genéticos como bioquímicos. Ver, por exemplo, Fields et al. (1989) Nature 340:245-246; Patente U.S. No. 5,585,245 e PCT WO 98/44350.A " functional fragment " of a protein, polypeptide or nucleic acid is a protein, polypeptide or nucleic acid whose sequence is not identical to the full-length protein or nucleic acid, while still maintaining the same function as the full-length protein, polypeptide or nucleic acid. A functional fragment may have more, less or the same number of residues of the corresponding native molecule and / or may contain one or more amino acid or nucleotide substitutions. Methods for determining the function of a nucleic acid (e.g., coding function, ability to hybridize to another nucleic acid) are known in the art. Similarly, methods for determining the function of the protein are well known. For example, the DNA binding function of a polypeptide can be determined, for example, by binding to filters, altering electrophoretic motility or immunoprecipitation assays. DNA cleavage can be tested by gel electrophoresis. See Ausubel et al., Supra. The ability of a protein to interact with another protein can be determined, for example, by co-immunoprecipitation, double hybrid assays or complementation, both genetic and biochemical. See, for example, Fields et al. (1989) Nature 340: 245-246; U.S. Patent No. 5,585,245 and PCT WO 98/44350.

Domínios de ligação dedo de zinco São aqui descritos domínios de ligação dedo de zinco não canónicos e polinucleótidos que codificam estes domínios de ligação dedo de zinco. São aqui descritos domínios de ligação dedos de zinco não canónicos, os quais são dedos de zinco C3H, em que um dos dois resíduos de histidina conservados da coordenação do zinco é convertido em cisteína. Em realizações adicionais, o resíduo de histidina mais C-terminal é convertido num resíduo de cisteína, gerando uma "proteína CCHC".Zinc Finger Binding Domains Non-canon finger zinc binding domains and polynucleotides encoding these zinc finger binding domains are described herein. Non-canonical zinc finger binding domains, which are zinc fingers C3H, are described herein, wherein one of the two conserved histidine residues from the coordination of zinc is converted to cysteine. In further embodiments, the more C-terminal histidine residue is converted to a cysteine residue, yielding a " CCHC protein ".

Um domínio de ligação dedo de zinco pode compreender um ou mais dedos de zinco (e.g., 2, 3, 4, 5, 6, 7, 8, 9 ou mais dedos de zinco) e pode ser manipulado para se ligar a qualquer sequência alvo (e.g. uma sequência genómica). Os domínios de ligação dedos de zinco podem ligar-se a DNA, RNA e/ou proteína. Tipicamente, um domínio dedo de zinco possui cerca de 30 aminoácidos de comprimento. Os dedos de zinco incluem dedos de zinco canónicos C2H2 (i.e., aqueles em que o ião zinco é coordenado por dois resíduos de cisteína e dois resíduos de histidina) e dedos de zinco não canónicos incluindo, por exemplo, dedos de zinco C3H (aqueles em que o ião zinco é coordenado por três resíduos de cisteína e um resíduo de histidina) . Ver também os Pedidos de Patente U.S. Nos. 20030108880, 20060246567 e 20060246588.A zinc finger binding domain may comprise one or more zinc fingers (eg, 2, 3, 4, 5, 6, 7, 8, 9 or more zinc fingers) and may be manipulated to bind to any target sequence (eg a genomic sequence). The zinc finger binding domains may bind to DNA, RNA and / or protein. Typically, a zinc finger domain is about 30 amino acids in length. Zinc fingers include canonical zinc fingers C2H2 (ie, those in which the zinc ion is coordinated by two cysteine residues and two histidine residues) and noncanonic zinc fingers including, for example, C3H zinc fingers (those in that the zinc ion is coordinated by three cysteine residues and one histidine residue). See also U.S. Patent Applications Nos. 20030108880, 20060246567 and 20060246588.

Os estudos estruturais demonstraram que um domínio (motivo) dedo de zinco canónico possui duas folhas beta (mantidas numa volta beta que possui os dois resíduos de cisteína invariantes) e uma hélice alfa (contendo os dois resíduos de histidina invariantes), as quais são mantidas numa conformação particular através da coordenação de um átomo de zinco pelas duas cisteínas e as duas histidinas. Os dedos de zinco não canónicos aqui descritos mantêm esta estrutura beta-beta-alfa.Structural studies have demonstrated that a canonical zinc finger domain has two beta sheets (maintained on a beta turn containing the two invariant cysteine residues) and an alpha helix (containing the two invariant histidine residues), which are maintained in a particular conformation through the coordination of a zinc atom by the two cysteines and the two histidines. The non-canonical zinc fingers described herein maintain this beta-beta-alpha structure.

Os dedos de zinco não canónicos aqui descritos podem ser domínios de ligação dedos de zinco naturais. No entanto, mais tipicamente, os dedos de zinco não canónicos como aqui descritos incluem um ou mais componentes de dedos de zinco em que pelo menos um dos resíduos de cisteína ou de histidina da coordenação de zinco foi substituído com um ou mais aminoácidos. Por exemplo, em determinadas realizações, o resíduo de His C-terminal de um módulo de ligação do dedo de zinco canónico é substituído com um resíduo Cys.The non-canonical zinc fingers described herein may be natural zinc finger binding domains. However, more typically, noncanonic zinc fingers as described herein include one or more zinc finger components wherein at least one of the cysteine or histidine residues of the zinc coordination has been substituted with one or more amino acids. For example, in certain embodiments, the C-terminal His residue of a canonical zinc finger attachment module is substituted with a Cys residue.

Os dedos de zinco CCHC aqui descritos podem igualmente compreender uma ou mais alterações (relativamente à sequência de um dedo de zinco C2H2 natural) na sequência de resíduos de aminoácidos que não sejam os resíduos de coordenação de zinco. Tais alterações podem compreender substituições, deleções e/ou inserções. Podem ser alterados aminoácidos em qualquer lugar do dedo de zinco. Exemplos não limitantes de alterações incluem: (1) substituições de resíduos isolados que rodeiam o resíduo de coordenação de zinco alterado; (2) adição de resíduos extra antes ou após o resíduo de coordenação de zinco alterado, (e.g., nos casos em que o resíduo His mais C-terminal é convertido em Cys, a adição de resíduos de aminoácidos extra pode facilitar a coordenação de zinco através da compensação da cadeia lateral mais curta da cisteína; e/ou (3) substituições de resíduos situados entre os resíduos de His e Cys de um dedo de zinco CCHC natural na região correspondente de um dedo de zinco CCHC não canónico.The CCHC zinc fingers described herein may also comprise one or more changes (relative to the sequence of a natural C2H2 zinc finger) in the sequence of amino acid residues other than the coordinating zinc residues. Such changes may comprise substitutions, deletions and / or insertions. Amino acids can be changed anywhere on the zinc finger. Non-limiting examples of changes include: (1) isolated residue substitutions surrounding the altered zinc coordination residue; (2) addition of extra residues before or after the altered zinc coordination residue, (eg, in cases where the His plus C-terminal residue is converted to Cys, the addition of extra amino acid residues may facilitate coordination of zinc by compensating for the shorter side chain of the cysteine and / or (3) residues replacements located between the His and Cys residues of a natural CCHC zinc finger in the corresponding region of a non-canonical CCHC zinc finger.

As proteínas com dedos de zinco aqui descritas podem incluir pelo menos um dedo de zinco compreendendo um dedo de zinco não canónico (não C2H2), em que o dedo de zinco não canónico possui uma porção helicoidal envolvida na ligação a DNA e em que a região da coordenação do zinco da porção helicoidal compreende a sequência de aminoácidos HX1X2RCXL (SEQ ID N0:2); e em que a proteína com dedos de zinco é manipulada para se ligar a uma sequência alvo. Xi pode ser A ou K ou T; X2 pode ser Q ou E ou R; e XL pode ser G.The zinc finger proteins described herein may include at least one zinc finger comprising a non-canonical zinc finger (not C2H2), wherein the noncanonical zinc finger has a helical portion involved in DNA binding and wherein the region of the coordination of the zinc of the helical portion comprises the amino acid sequence HX1X2RCXL (SEQ ID NO: 2); and wherein the zinc finger protein is engineered to bind to a target sequence. X 1 may be A or K or T; X 2 may be Q or E or R; and XL may be G.

Como alternativa, os dedos de zinco não canónicos aqui descritos podem ter a estrutura geral: Cys-(Xa) 2-4-Cys-(XB)i2-His-( Xc) 3-5-Cys-(XD) 1-10 (SEQ ID NO: 3), onde Xa, Xb, Xc e XD representam qualquer aminoácido. No caso de Xc compreender 3 resíduos (i) pelo menos um destes resíduos é alterado comparativamente com um dedo de zinco canónico CCHH; e/ou (ii) XD compreende pelo menos uma deleção, substituição ou inserção comparativamente com um dedo de zinco canónico CCHH. XD pode compreender a sequência QLV ou QKP. Como alternativa, XD pode compreender um ou mais (1, 2, 3, 4, 5, 6, 7, 8, 9, ou 10) residuos Gly (G). A sequência de aminoácidos parcial (incluindo o extremo C-terminal relativamente ao 3o resíduo de coordenação de zinco) de exemplos de dedos de zinco não canónicos está apresentada nas Tabelas 1, 2, 3 e 4 abaixo. Em todas as Tabelas, os dois resíduos de coordenação de zinco mais C-terminais (i.e., o terceiro e o quarto) (H e C) estão sublinhados. As alterações (e.g. substituições, inserções, deleções) comparativamente com a sequência do dedo não canónico "selvagem" (linha 2 das Tabelas 1 e 3) estão apresentadas com duplo sublinhado.Alternatively, the non-canine zinc fingers described herein may have the general structure: Cys- (Xa) 2-4-Cys- (XB) 1-2-His- (Xc) 3-5-Cys- (X D) 1-10 (SEQ ID NO: 3), where Xa, Xb, Xc and XD represent any amino acid. In case Xc comprises 3 residues (i) at least one of these residues is altered compared to a canonical zinc finger CCHH; and / or (ii) XD comprises at least one deletion, substitution or insertion as compared to a canonical zinc finger CCHH. XD may comprise the QLV or QKP sequence. Alternatively, XD may comprise one or more (1, 2, 3, 4, 5, 6, 7, 8, 9, or 10) Gly residues (G). The partial amino acid sequence (including the C-terminal end relative to the 3rd zinc coordination residue) of non-canonical zinc finger examples is set forth in Tables 1, 2, 3 and 4 below. In all Tables, the two more C-terminal (i.e., third and fourth) zinc coordination residues (H and C) are underlined. The changes (e.g., substitutions, insertions, deletions) as compared to the non-canonical "wild" finger sequence " (line 2 of Tables 1 and 3) are presented with double underscore.

Tabela 1Table 1

(continuação)(continuation)

Tabela 2Table 2

(continuação)(continuation)

Tabela 3Table 3

Tabela 4Table 4

Como referido atrás, um ZFP pode incluir qualquer número de dominios de ligação dedo de zinco, por exemplo pelo menos 3 dedos de zinco. Ainda, um, mais de um, ou a totalidade dos dedos de zinco podem ser dedos de zinco não canónicos como aqui descrito. 0 dedo mais C-terminal de uma proteína com múltiplos dedos de zinco pode compreender um dedo de zinco canónico. Como alternativa, o dedo mais C-terminal de uma proteína com múltiplos dedos de zinco pode compreender um dedo de zinco CCHC como descrito aqui, por exemplo um dedo CCHC compreendendo uma ou mais inserções de aminoácidos C-terminais relativamente ao resíduo Cys de coordenação de zinco mais C-terminal. Ver exemplos 1-5 que descrevem proteínas com 4 dedos de zinco em que o dedo 2 (F2) e/ou o dedo 4 (F4) são dedos de zinco não canónicos como aqui descrito.As noted above, a ZFP may include any number of zinc finger binding domains, for example at least 3 zinc fingers. Yet, one, more than one, or all of the zinc fingers may be noncanonic zinc fingers as described herein. The most C-terminal finger of a zinc finger multiplier protein may comprise a canonical zinc finger. As an alternative, the more C-terminal finger of a zinc finger multiple protein may comprise a CCHC zinc finger as described herein, for example a CCHC finger comprising one or more C-terminal amino acid insertions relative to the Cys coordinating residue of zinc plus C-terminal. See examples 1-5 describing 4 finger zinc proteins wherein finger 2 (F2) and / or finger 4 (F4) are non-canonical zinc fingers as described herein.

Os domínios de ligação em dedo de zinco podem ser manipulados para se ligarem a uma sequência seleccionada. Ver, por exemplo, Beerli et al. (2002) Nature Biotechnol. 20:135-141; Pabo et al. (2001) Ann. Rev. Biochem. 70:313-340; Isalan et al. (2001) Nature Biotechnol. 19:656- 660; Segai et al. (2001) Curr. Opin. Biotechnol. 12:632-637; Choo et al. (2000) Curr. Opin. Struct. Biol. 10:411-416. Um domínio dedo de zinco manipulado pode ter uma nova especificidade de ligação, comparativamente com uma proteína com dedos de zinco naturais. Os métodos de manipulação incluem, mas não lhes estão limitados, o desenho racional e vários tipos de selecção (e.g., métodos em que uma pluralidade de diferentes sequências de dedos de zinco são testadas contra uma única sequência nucleotídica alvo). O desenho racional inclui, por exemplo, a utilização de bases de dados compreendendo sequências tripleto (ou quadrupleto) e sequências de aminoácidos de dedos de zinco individuais, em que cada sequência de nucleótidos do tripleto ou do quadrupleto está associada a uma ou mais sequências de aminoácidos de dedos de zinco. Ver, por exemplo, Patentes U.S. 6,453,242 e 6,534,261 em co-propriedade. Estão descritos métodos de adicionais de desenho, por exemplo, nas Patentes U.S. 6,746,838; 6,785,613; 6,866,997; e 7,030,215. O aumento da especificidade de ligação para os domínios dedo de zinco foram descritos, por exemplo, na Patente U.S. N° 6,794,136 em co-propriedade.Zinc finger binding domains can be manipulated to bind to a selected sequence. See, for example, Beerli et al. (2002) Nature Biotechnol. 20: 135-141; Pabo et al. (2001) Ann. Rev. Biochem. 70: 313-340; Isalan et al. (2001) Nature Biotechnol. 19: 656-660; Segai et al. (2001) Curr. Opin. Biotechnol. 12: 632-637; Choo et al. (2000) Curr. Opin. Struct. Biol. 10: 411-416. A manipulated zinc finger domain may have a novel binding specificity compared to a natural zinc finger protein. Methods of manipulation include, but are not limited to, rational design and various types of selection (e.g., methods wherein a plurality of different zinc finger sequences are tested against a single target nucleotide sequence). The rational design includes, for example, the use of databases comprising triplet (or quadrupole) sequences and individual zinc finger amino acid sequences, wherein each nucleotide sequence of the triplet or quadrupole is associated with one or more sequences of amino acids of zinc fingers. See, for example, U.S. Patents 6,453,242 and 6,534,261 in co-ownership. Additional drawing methods are described, for example, in U.S. Patents 6,746,838; 6,785,613; 6,866,997; and 7,030,215. Increased binding specificity for the zinc finger domains has been described, for example, in co-owned U.S. Patent No. 6,794,136.

Exemplos de métodos de selecção, incluindo os sistemas de apresentação fágica e de duplo híbrido, estão descritos nas Patentes U.S. 5,789,538; 5,925,523; 6,007,988; 6,013,453; 6,410,248; 6,140,466; 6,200,759; e 6,242,568; assim como em WO 98/37186; WO 98/53057; WO 00/27878; WO 01/88197 e GB 2,338,237.Examples of selection methods, including phage display and double hybrid systems, are described in U.S. Patent Nos. 5,789,538; 5,925,523; 6,007,988; 6,013,453; 6,410,248; 6,140,466; 6,200,759; and 6,242,568; as well as in WO 98/37186; WO 98/53057; WO 00/27878; WO 01/88197 and GB 2,338,237.

Uma vez que os dedos de zinco individuais se ligam a uma sequência de três nucleótidos (i.e. tripleto) (ou a uma sequência de quatro nucleótidos que pode sobrepor-se, em um nucleótido, com o local de ligação de quatro nucleótidos do dedo de zinco adjacente), o comprimento de uma sequência em que um domínio de ligação dedo de zinco foi manipulado para se ligar (e.g., a uma sequência alvo) determinará o número de dedos de zinco num domínio de ligação de dedos de zinco manipulados. Por exemplo para ZFPs em que os motivos dedo de zinco não se ligam a sublocais sobreponíveis, uma sequência alvo de seis nucleótidos liga-se a um domínio de ligação com dois dedos; uma sequência alvo de nove nucleótidos liga-se a um domínio de ligação com três dedos, etc. Os locais de ligação dedos de zinco individuais (i.e., sublocais) num local alvo não necessitam de ser contíguos, podendo ser separados por um ou vários nucleótidos, dependendo do comprimento e natureza das sequências de aminoácidos entre os dedos de zinco (i.e., os ligantes entre dedos) num domínio de ligação de múltiplos dedos. Ver, por exemplo, Patentes U.S. 6,479,626; 6,903,185 e 7,153,949 e U.S. Publicação de Pedido de Patente No. 2003/0119023.Since the individual zinc fingers bind to a sequence of three nucleotides (ie triplet) (or to a four nucleotide sequence that can overlap, at a nucleotide, with the four nucleotide binding site of the zinc finger adjacent), the length of a sequence in which a zinc finger binding domain has been manipulated to bind (eg, to a target sequence) will determine the number of zinc fingers in a manipulated zinc finger binding domain. For example for ZFPs where finger zinc motifs do not bind to overlapping sublocals, a six nucleotide target sequence binds to a two finger binding domain; a nine nucleotide target sequence binds to a three finger binding domain, etc. Individual (ie, sublocal) zinc finger binding sites at a target site need not be contiguous, and may be separated by one or more nucleotides, depending on the length and nature of the amino acid sequences between the zinc fingers (ie, between fingers) in a multiple finger binding domain. See, for example, U.S. Patents 6,479,626; 6,903,185 and 7,153,949 and U.S. Patent Application Publication No. 2003/0119023.

Num domínio de ligação com múltiplos dedos de zinco, os dedos de zinco adjacentes podem ser separados por sequências ligantes de aminoácidos de aproximadamente 5 aminoácidos (os chamados ligantes inter-dedos "canónicos") ou, como alternativa, através de uma ou mais ligantes não canónicos. Ver, e.g., Patentes U.S. 6,453,242 e 6,534,261 em co-propriedade. Para domínios de ligação dedos de zinco manipulados compreendendo mais de três dedos, a inserção de sequências ligantes inter-dedos mais longas ("não canónicas") entre alguns dos dedos de zinco pode aumentar a afinidade e/ou a especificidade da ligação através do domínio de ligação. Ver por exemplo, Patente U.S. N° 6,479,626 Publicação de Pedido de Patente U.S. No. 2003/0119023. Assim, os domínios de ligação com múltiplos dedos de zinco podem igualmente ser caracterizados relativamente à presença e localização de ligantes inter-dedos não canónicos. O uso de ligantes inter-dedos mais longos pode igualmente facilitar a ligação de uma proteína com dedos de zinco a locais alvo compreendendo nucleótidos não contíguos. Como resultado, um ou mais sublocais num local alvo para um domínio dedo de zinco, podem ser separados uns dos outros por 1, 2, 3, 4, 5 ou mais nucleótidos. Dando apenas um exemplo, um domínio de ligação com quatro dedos pode ligar-se a um local alvo de 13 nucleótidos compreendendo, sequenciadamente, dois sublocais de 3 nucleótidos contíguos, um nucleótido de intervalo e dois sublocais tripletos contíguos.In a zinc finger multiplexing domain, the adjacent zinc fingers may be separated by amino acid linker sequences of approximately 5 amino acids (so-called " canonical " interleaver binders) or, alternatively, by one or more binders not canonical. See, e.g., U.S. Patents 6,453,242 and 6,534,261 in co-ownership. For manipulated zinc finger binding domains comprising more than three fingers, insertion of longer (" non-canonical ") inter-finger ligand sequences between some of the zinc fingers may increase the affinity and / or specificity of the binding through connection domain. See for example, U.S. Patent No. 6,479,626 U.S. Patent Application Publication No. 2003/0119023. Thus, multiple finger zinc binding domains can also be characterized with respect to the presence and location of non-canon inter-finger ligands. The use of longer interfinger ligands may also facilitate attachment of a zinc finger protein to target sites comprising noncontiguous nucleotides. As a result, one or more sublocals at a target site for a zinc finger domain may be separated from each other by 1, 2, 3, 4, 5 or more nucleotides. By way of example only, a four finger binding domain can bind to a 13 nucleotide target site comprising sequentially two contiguous 3 nucleotide sublocals, one gap nucleotide and two contiguous triplet sublocals.

Um sublocal alvo é uma sequência de nucleótidos (geralmente 3 ou 4 nucleótidos) que é ligada por um único dedo de zinco. No entanto, não é necessário que um local alvo seja um múltiplo de três nucleótidos. Por exemplo, nos casos em que ocorrem interacções entre cadeias (ver, e.g., Patentes U.S. 6,453,242 e 6,794,136), um ou mais dos dedos de zinco individuais de um domínio de ligação com múltiplos dedos de zinco podem ligar-se a sublocais quadrupletos sobreponíveis. Ver também Patentes U.S. 6,746,838 e 6,866,997. Para mencionar apenas um exemplo, um domínio de três dedos pode ligar-se a um local alvo de 10 nucleótidos compreendendo três sublocais de 4 nucleótidos sobreponíveis. A selecção de uma sequência na cromatina celular para a ligação por um domínio em dedo de zinco (e.g., um local alvo) pode ser conseguida, por exemplo, de acordo com os métodos descritos nas Patente U.S. N°. 6,453,242 co-propriedade (17 de Set., 2002), que também divulga métodos para o desenho de ZFPs para se ligarem a uma sequência seleccionada. Será claro para os familiarizados com a área que a simples inspecção visual de uma sequência nucleotídica pode também ser usado para a selecção de um local alvo. Assim, quaisquer meios para a selecção de um local alvo podem ser usados nos métodos aqui descritos.A target sublocal is a nucleotide sequence (generally 3 or 4 nucleotides) that is bound by a single finger of zinc. However, a target site need not be a multiple of three nucleotides. For example, in instances where chain interactions occur (see, e.g., U.S. Patents 6,453,242 and 6,794,136), one or more of the individual zinc fingers of a multiple finger zinc binding domain may attach to overlapping quadrupole sublocals. See also U.S. Patents 6,746,838 and 6,866,997. To mention only one example, a three finger domain can bind to a 10 nucleotide target site comprising three overlapping 4 nucleotide sublocals. Selection of a sequence in the cellular chromatin for binding by a zinc finger domain (e.g., a target site) may be achieved, for example, according to the methods described in U.S. 6,453,242 co-ownership (Sept. 17, 2002), which also discloses methods for the design of ZFPs to bind to a selected sequence. It will be clear to those of skill in the art that simple visual inspection of a nucleotide sequence may also be used for the selection of a target site. Thus, any means for selecting a target site can be used in the methods described herein.

As proteínas com múltiplos dedos de zinco podem ser construídas através da ligação dos dedos de zinco individuais obtidos, por exemplo, através de desenho ou de selecção. Como alternativa, os módulos de ligação consistindo em dois dedos de zinco podem ser ligados uns aos outros, usando ligantes canónicos ou ligantes entre dedos mais longos não canónicos (ver atrás) para gerar proteínas com quatro a seis dedos. Tais módulos de dois dedos podem ser obtidos, por exemplo, através da selecção de dois dedos adjacentes, os quais se ligam a uma sequência alvo particular de seis nucleótidos, no contexto de uma proteína com múltiplos dedos (geralmente três dedos). Ver por exemplo, WO 98/53057 e a Publicação do Pedido de Patente U.S. No. 2003/0119023. Como alternativa podem ser construídos módulos de dois dedos através da montagem de dedos de zinco individuais.The zinc multiple finger proteins can be constructed by bonding the individual zinc fingers obtained, for example by drawing or selection. Alternatively, the linker modules consisting of two zinc fingers may be attached to each other using canonical linkers or longer non-canonical linkers (see above) to generate four to six-finger proteins. Such two-finger modules can be obtained, for example, by selecting two adjacent fingers, which bind to a particular target sequence of six nucleotides, in the context of a multi-fingered protein (generally three fingers). See for example, WO 98/53057 and U.S. Patent Application Publication No. 2003/0119023. Alternatively, two-finger modules can be constructed through the individual zinc finger assembly.

Assim, os domínios dedo de zinco individuais aqui descritos podem ser usados individualmente, ou em várias combinações, para construir proteínas com múltiplos dedos de zinco que se podem ligar a qualquer local alvo. A distância entre sequências (e.g., locais alvo) refere-se ao número de nucleótidos ou pares de nucleótidos no intervalo entre duas sequências, medido a partir dos extremos das sequências mais perto uns dos outros.Thus, the individual zinc finger domains described herein can be used individually, or in various combinations, to construct multiple zinc finger proteins that can bind to any target site. The distance between sequences (e.g., target sites) refers to the number of nucleotides or nucleotide pairs in the range between two sequences, measured from the ends of the sequences closest to each other.

No caso de utilização de ZFNs, por exemplo em que a clivagem depende da ligação de moléculas de fusão de dois domínios dedo de zinco/meio domínio de clivagem para separar locais alvo, os dois locais alvo podem ser cadeias de DNA opostas. Noutros casos, ambos os locais alvo estão na mesma cadeia. Ver por exemplo, WO 2005/084190. São igualmente descritos polinucleótidos codificadores de dedos de zinco ou de proteínas com dedos de zinco. Estes polinucleótidos podem ser construídos usando técnicas convencionais e inseridos num vector e o vector pode ser introduzido numa célula (ver abaixo para mais vectores relativos à divulgação e métodos para a introdução de polinucleótidos em células) de modo que a proteína codificada seja expressa na célula.In the case of use of ZFNs, for example where cleavage depends on the binding of two finger zinc domains / cleavage domain media to separate target sites, the two target sites may be opposite DNA strands. In other cases, both target sites are in the same chain. See for example, WO 2005/084190. Also described are polynucleotides encoding zinc fingers or zinc finger proteins. These polynucleotides can be constructed using standard techniques and inserted into a vector and the vector can be introduced into a cell (see below for further vectors relating to the disclosure and methods for introducing polynucleotides into cells) such that the encoded protein is expressed in the cell.

Proteínas de fusão São igualmente proporcionadas proteínas de fusão compreendendo um ou mais componentes em dedo de zinco não canónicos aqui descritos e um ou mais domínios funcionais, em que o domínio funcional compreende uma semi-domínio de clivagem como reivindicado.Fusion proteins Also provided are fusion proteins comprising one or more non-canonical zinc finger components described herein and one or more functional domains, wherein the functional domain comprises a cleavage half domain as claimed.

As moléculas de fusão são construídas através de métodos de clonagem e conjugação bioquímica bem conhecidos na técnica. As moléculas de fusão compreendem um ZFP contendo CCHC e, por exemplo, um domínio de clivagem, um domínio de activação da transcrição, um domínio de repressão da transcrição, um componente de um complexo de remodelação da cromatina, um domínio isolador, um fragmento funcional de qualquer um destes domínios; e/ou quaisquer combinações de dois ou mais domínios ou fragmentos funcionais dos mesmos.The fusion molecules are constructed by biochemical cloning and conjugation methods well known in the art. The fusion molecules comprise a CCHC-containing ZFP and, for example, a cleavage domain, a transcription activation domain, a transcription repression domain, a chromatin remodeling complex component, an isolator domain, a functional fragment of any of these domains; and / or any combinations of two or more functional domains or fragments thereof.

As moléculas de fusão podem compreender uma proteína vegetal modificada com dedos de zinco e pelo menos dois domínios funcionais (e.g., um domínio isolador ou um domínio proteico de ligação a metilo e, ainda, um domínio de activação ou repressão da transcrição) .The fusion molecules may comprise a zinc finger-modified plant protein and at least two functional domains (e.g., an isolator domain or a methyl-binding protein domain and also a transcriptional activation or repression domain).

As moléculas de fusão também compreendem, facultativamente, um sinal de localização nuclear (como seja, por exemplo, FLAG ou hemaglutinina). As proteínas de fusão (e ácidos nucleicos que as codificam) são projectadas de forma que a grelha de leitura traduzida seja preservada entre os componentes da fusão. Métodos para o desenho e construção de proteínas de fusão (e polinucleótidos codificadores das mesmas) são conhecidos dos familiarizados com a técnica. Por exemplo, métodos para o desenho e construção da proteína de fusão compreendendo proteínas com dedos de zinco (e polinucleótidos codificadores das mesmas) estão descritos nas Patentes U.S. 6,453,242 e 6,534,261 em co-propriedade.The fusion molecules also optionally comprise a nuclear localization signal (such as, for example, FLAG or hemagglutinin). The fusion proteins (and nucleic acids encoding them) are designed so that the translated reading frame is preserved among the components of the fusion. Methods for the design and construction of fusion proteins (and polynucleotides encoding the same) are known to those skilled in the art. For example, methods for designing and constructing the fusion protein comprising zinc finger proteins (and polynucleotides encoding the same) are described in U.S. Patents 6,453,242 and 6,534,261 in co-ownership.

Os polinucleótidos codificadores de tais proteínas de fusão estão igualmente dentro do âmbito da presente divulgação. Estes polinucleótidos podem ser construídos usando técnicas convencionais e inseridos num vector e o vector pode ser introduzido numa célula (ver abaixo para divulgação adicional relativa a vectores e métodos para introdução de polinucleótidos em células).Polynucleotides encoding such fusion proteins are also within the scope of the present disclosure. These polynucleotides can be constructed using standard techniques and inserted into a vector and the vector can be introduced into a cell (see below for further disclosure concerning vectors and methods for introducing polynucleotides into cells).

Um exemplo de domínio funcional para fusão com um domínio ZFP de ligação a DNA, a ser usado na repressão da expressão de genes, é um domínio de repressão KRAB da proteína humana KOX-1 (ver, e.g., Thiesen et al., New Biologist 2, 363-374 (1990); Margolin et al., Proc. Natl.An example of a functional domain for fusion with a DNA binding domain ZFP to be used for repression of gene expression is a KRAB repression domain of the human KOX-1 protein (see, eg, Thiesen et al., New Biologist 2, 363-374 (1990); Margolin et al., Proc Natl.

Acad. Sei. USA 91, 4509-4513 (1994); Pengue et al., Nucl.Acad. Know. USA 91, 4509-4513 (1994); Pengue et al., Nucl.

Acids Res. 22:2908-2914 (1994); Witzgall et al., Proc.Acids Res. 22: 2908-2914 (1994); Witzgall et al., Proc.

Natl. Acad. Sei. USA 91, 4514- 4518 (1994). O domínio KOX é também adequado para usar como domínio de repressão. Um outro domínio de repressão adequado é o domínio de ligação a metilo da proteína 2B (MBD-2B) (ver, igualmente, Hendrich et al. (1999) Mamm Genome 10:906-912 para descrição de proteínas MBD) . Um outro domínio de repressão útil é o associado com a proteína v-ErbA. Ver, por exemplo, Damm, et al. (1989) Nature 339:593-597; Evans (1989) Int. J. Cancer Suppl. 4:26-28; Pain et al. (1990) New Biol. 2:284-294; Sap et al. (1989) Nature 340:242-244; Zenke et al. (1988) Cell 52:107-119; e Zenke et al. (1990) Cell 61:1035-1049. Outros exemplos de domínios de repressão incluem, mas não lhes estão limitados, receptor de hormonas da tiróide (TR), SID, MB Dl, MBD2, MBD3, MBD4, proteínas tipo MBD, membros da família DNMT (e.g., DNMTl, DNMT3A, DNMT3B), Rb, MeCPl e MeCP2. Ver, por exemplo, Zhang et al. (2000) Ann Rev Physiol 62:439-466; Bird et al. (1999) Cell 99:451-454; Tyler et al. (1999) Cell 99:443-446; Knoepfler et al. (1999) Cell 99:447-450; e Robertson et al. (2000) Nature Genet. 25:338-342. Outros domínios de repressão exem-plificativos incluem, mas não lhes estão limitados, ROM2 e AtHD2A. Ver, por exemplo, Chern et al. (1996) Plant Cell 8:305-321; e Wu et al. (2000) Plant J. 22:19-27.Natl. Acad. Know. USA 91, 4514-4518 (1994). The KOX domain is also suitable for use as a repression domain. Another suitable domain of repression is the methyl-binding domain of protein 2B (MBD-2B) (see also Hendrich et al. (1999) Mamm Genome 10: 906-912 for description of MBD proteins). Another useful repression domain is that associated with the v-ErbA protein. See, for example, Damm, et al. (1989) Nature 339: 593-597; Evans (1989) Int. J. Cancer Suppl. 4: 26-28; Pain et al. (1990) New Biol. 2: 284-294; Sap et al. (1989) Nature 340: 242-244; Zenke et al. (1988) Cell 52: 107-119; and Zenke et al. (1990) Cell 61: 1035-1049. Other examples of repression domains include, but are not limited to, thyroid hormone receptor (TR), SID, MB D1, MBD2, MBD3, MBD4, MBD-like proteins, members of the DNMT family (eg, DNMT1, DNMT3A, DNMT3B ), Rb, MeCPl and MeCP2. See, for example, Zhang et al. (2000) Ann Rev Physiol 62: 439-466; Bird et al. (1999) Cell 99: 451-454; Tyler et al. (1999) Cell 99: 443-446; Knoepfler et al. (1999) Cell 99: 447-450; and Robertson et al. (2000) Nature Genet. 25: 338-342. Other exemplary repressive domains include, but are not limited to, ROM2 and AtHD2A. See, for example, Chern et al. (1996) Plant Cell 8: 305-321; and Wu et al. (2000) Plant J. 22: 19-27.

Domínios adequados para se conseguir activação incluem o domínio de activação da VP16 de HSV (ver, e.g., Hagmann et al., J. Virol. 71, 5952-5962 (1997)) receptores nucleares de hormonas (ver, e.g., Torchia et al., Curr. Opin. Cell. Biol. 10:373-383 (1998)); a subunidade p65 do factor nuclear kapa B (Bitko & Bank, J. Virol. 72:5610-5618 (1998) e Doyle & Hunt, Neuroreport 8:2937-2942 (1997)); Liu et al., Cancer Gene Ther. 5:3- 28 (1998)), ou domínios funcionais quiméricos artificiais tais como VP64 (Seifpal et al., EMBO J. 11, 4961-4968 (1992)).Suitable domains for achieving activation include the activation domain of HSV VP16 (see, eg, Hagmann et al., J. Virol., 71, 5952-5962 (1997)), hormone receptors (see, eg, Torchia et al , Curr. Opin Cell Biol. 10: 373-383 (1998)); the p65 subunit of kappa nuclear factor B (Bitko & Bank, J. Virol., 72: 5610-5618 (1998) and Doyle & Hunt, Neuroreport 8: 2937-2942 (1997)); Liu et al., Cancer Gene Ther. 5: 3-28 (1998)), or artificial chimeric functional domains such as VP64 (Seifpal et al., EMBO J. 11, 4961-4968 (1992)).

Outros exemplos de domínios de activação incluem, mas não lhes estão limitados, p300, CBP, PCAF, SRC1 PvALF, e ERF-2. Ver, por exemplo, Robyr et al. (2000) J Mol. Endocrinol. 14:329-347; Collingwood et al. (1999) J. Mol. Endocrinol. 23:255- 275; Leo et al. (2000) Gene 245:1-11; Manteuffel-Cymborowska (1999) Acta Biochim. Pol. 46:77-89; McKenna et al. (1999) J. Steroid Biochem. Mol. Biol. 69:3-12; Malik et al. (2000) Trends Biochem. ScL 25:277-283; e Lemon et al. (1999) Curr. Opin. Genet. Dev. 9:499-504. Outros exemplos de domínios de activação incluem, mas não lhes estão limitados, OsGAI, HALF-I, Cl, API, ARF-5, -6, -7, e -8, CPRFl, CPRF4, MYC-RP/GP, e TRABl. Ver, por exemplo, Ogawa et al. (2000) Gene 245:21-29; Okanami et al. (1996) Genes Cells 1:87-99; Goff et al (1991) Genes Dev. 5:298-309; Cho et al. (1999) Plant Mol. Biol. 40:419-429; Ulmason et al. (1999) Proc. Natl. Acad. Sei. USA 96:5844-5849; Sprenger-Haussels et al. (2000) Plant J. 22:1-8; Gong et al. (1999) Plant Mol. Biol. 41:33-44; e Hobo et al. (1999) Proc. Natl. Acad. Sci. USA 96:15,348-15,353.Other examples of activation domains include, but are not limited to, p300, CBP, PCAF, SRC1 PvALF, and ERF-2. See, for example, Robyr et al. (2000) J Mol. Endocrinol. 14: 329-347; Collingwood et al. (1999) J. Mol. Endocrinol. 23: 255-275; Leo et al. (2000) Gene 245: 1-11; Manteuffel-Cymborowska (1999) Acta Biochim. Pol. 46: 77-89; McKenna et al. (1999) J. Steroid Biochem. Mol Biol. 69: 3-12; Malik et al. (2000) Trends Biochem. ScL 25: 277-283; and Lemon et al. (1999) Curr. Opin. Genet. Dev. 9: 499-504. Other examples of activation domains include, but are not limited to, OsGAI, HALF-I, Cl, API, ARF-5, -6, -7, and -8, CPRF1, CPRF4, MYC-RP / GP, and TRAB1 . See, for example, Ogawa et al. (2000) Gene 245: 21-29; Okanami et al. (1996) Genes Cells 1: 87-99; Goff et al (1991) Genes Dev. 5: 298-309; Cho et al. (1999) Plant Mol. Biol. 40: 419-429; Ulmason et al. (1999) Proc. Natl. Acad. Know. USA 96: 5844-5849; Sprenger-Haussels et al. (2000) Plant J. 22: 1-8; Gong et al. (1999) Plant Mol. Biol. 41: 33-44; and Hobo et al. (1999) Proc. Natl. Acad. Sci. USA 96: 15,348-15,353.

Outros domínios funcionais são descritos, por exemplo, na Patente U.S. No. 6,933,113 em copropriedade. Ainda, domínios isoladores, proteínas de remodelação da cromatina tais como domínios contendo ISWI e proteínas com domínios de ligação a metilo, adequadas para usar nas moléculas de fusão, estão descritos, por exemplo, nas Publicações Internacionais WO 01/83793 e WO 02/26960 em copropriedade .Other functional domains are described, for example, in U.S. Patent No. 6,933,113 in co-ownership. In addition, isolator domains, chromatin remodeling proteins such as ISWI-containing domains and proteins with methyl-binding domains suitable for use in the fusion molecules are described, for example, in International Publication Nos. WO 01/83793 and WO 02/26960 in co-ownership.

Como alternativa, as proteínas de fusão do invento são nucleases com dedos de zinco (ZFN) compreendendo um ou mais dedos de zinco CCHC como aqui descrito e um domínio de clivagem (ou semi-domínio de clivagem). Os dedos de zinco podem ser manipulados de forma a reconhecerem uma sequência alvo em qualquer região genómica seleccionada e, quando introduzidos numa célula, resultarão na ligação das proteínas de fusão aos seus locais de ligação e clivagem dentro ou perto da referida região genómica. Tal clivagem pode resultar na alteração da sequência nucleotídica da região genómica (e.g. mutação) após ligação não homóloga de extremos. Como alternativa, se estiverem também presentes na célula sequências contendo polinucleótidos exógenos homólogas da região genómica, ocorre recombinação homóloga com uma taxa elevada entre a região genómica e o polinucleótido exógeno, após clivagem dirigida por ZFNs. A recombinação homóloga pode resultar na substituição diri- gida da sequência ou na integração dirigida de sequências exógenas, dependendo da sequência nucleotidica do poli-nucleótido exógeno.Alternatively, the fusion proteins of the invention are zinc finger nucleases (ZFN) comprising one or more zinc fingers CCHC as described herein and a cleavage domain (or cleavage half domain). Zinc fingers can be manipulated to recognize a target sequence in any selected genomic region and, when introduced into a cell, will result in binding of the fusion proteins to their binding and cleavage sites within or near said genomic region. Such cleavage may result in alteration of the nucleotide sequence of the genomic region (e.g., mutation) after non-homologous binding of ends. Alternatively, if sequences containing exogenous polynucleotides homologous to the genomic region are also present in the cell, homologous recombination occurs at a high rate between the genomic region and the exogenous polynucleotide following ZFN-directed cleavage. Homologous recombination may result in directed substitution of the sequence or in targeted integration of exogenous sequences, depending on the nucleotide sequence of the exogenous poly-nucleotide.

Os dedos de zinco não canónicos aqui descritos proporcionam melhor função de clivagem quando incorporados em ZFNs. Como descrito nos Exemplos, ZFNs com 4 dedos contendo pelo menos um dedo CCHC como aqui descrito cortam pelo menos tão bem quanto as nucleases contendo exclusivamente dedos CCHH. Nalgumas realizações, quando o dedo C-terminal compreende um dedo de zinco CCHC não canónico, os resíduos entre os terceiro e quarto resíduos de coordenação (i.e., entre os resíduos C-terminais His e Cys) são diferentes dos presentes num dedo de zinco canónico CCHH e um ou mais resíduos de glicina (e.g., 1, 2, 3, 4, 5 ou mais) são inseridos antes do resíduo Cys C-terminal. A porção do domínio de clivagem dos ZFNs aqui descritos pode ser obtida a partir de qualquer endonuclease ou exonuclease. Exemplos de endonucleases de onde pode derivar um domínio de clivagem incluem, mas não lhes estão limitados, endonucleases de restrição e endonucleases de manutenção. Ver, por exemplo, 2002-2003 Catalogue, New England Biolabs, Beverly, MA; e Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388. Conhecem-se outras enzimas que cortam o DNA (e.g., nuclease SI, nuclease de feijão; DNAse I pancreática; nuclease microcóccica; endonuclease HO de levedura; ver também Linn et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press, 1993). Uma ou mais destas enzimas (ou seu fragmentos funcionais) podem ser usadas como fonte de domínios de clivagem e de semi-domínios de clivagem.The non-canonical zinc fingers described herein provide better cleavage function when incorporated into ZFNs. As described in the Examples, 4-finger ZFNs containing at least one CCHC finger as described herein cut at least as well as nucleases containing exclusively CCHH fingers. In some embodiments, when the C-terminal finger comprises a non-canonical CCHC zinc finger, the residues between the third and fourth coordination residues (ie, between the C-terminal His and Cys residues) are different from those present on a canonical zinc finger CCHH residue and one or more glycine residues (eg, 1, 2, 3, 4, 5 or more) are inserted prior to the C-terminal Cys residue. The portion of the cleavage domain of the ZFNs described herein can be obtained from either endonuclease or exonuclease. Examples of endonucleases from which a cleavage domain may be derived include, but are not limited to, restriction endonucleases and maintenance endonucleases. See, for example, 2002-2003 Catalog, New England Biolabs, Beverly, MA; and Belfort et al. (1997) Nucleic Acids Res. 25: 3379-3388. Other enzymes that cleave the DNA (eg, nuclease S1, bean nuclease, pancreatic DNAse I, micrococyte nuclease, yeast endonuclease, see also Linn et al. (Eds.) Nucleases, Cold Spring Harbor Laboratory Press, 1993 ). One or more of these enzymes (or functional fragments thereof) can be used as a source of cleavage domains and cleavage half-domains.

De forma semelhante, um semi-domínio de clivagem pode derivar de qualquer nuclease ou porção da mesma, como atrás descrito, desde que o semi-domínio de clivagem necessite de dimerização para actividade de clivagem. Em geral, são necessárias duas proteínas de fusão para a clivagem dirigida de DNA genómico se as proteínas de fusão compreenderem semi-domínios de clivagem. Como alternativa, pode ser usada uma única proteína compreendendo dois domínios de semi-clivagem. Os dois domínios de semi-clivagem podem derivar da mesma endonuclease ou cada semi-domínio de clivagem pode derivar de uma endonuclease diferente. Ainda, os locais alvo para as duas proteínas de fusão são dispostos, uns relativamente aos outros, de forma que a ligação das duas proteínas de fusão aos respectivos locais alvo coloque os semi-domínios de clivagem numa orientação espacial, um relativamente ao outro, que permita aos semi-domínios de clivagem formarem um domínio de clivagem funcional, e.g., através de dimerização. Assim, em determinadas realizações, os extremos mais próximos dos locais alvo são separados por 5-8 pares de nucleótidos ou por 15-18 pares de nucleótidos. No entanto, qualquer número inteiro de nucleótidos ou pares de nucleótidos pode estar entre dois locais alvo (e.g., de 2 a 50 nucleótidos ou mais) . Em geral, o ponto de clivagem situa-se entre os locais alvo.Similarly, a cleavage half domain can be derived from any nuclease or portion thereof, as described above, provided that the cleavage half domain requires dimerization for cleavage activity. In general, two fusion proteins are required for the targeted cleavage of genomic DNA if the fusion proteins comprise half-domains of cleavage. Alternatively, a single protein comprising two half-cleavage domains may be used. The two half-cleavage domains may derive from the same endonuclease or each cleavage half-domain may derive from a different endonuclease. In addition, the target sites for the two fusion proteins are arranged relative to one another so that the binding of the two fusion proteins to their respective target sites places the cleavage half-domains in a spatial orientation relative to each other, which allows the cleavage half-domains to form a functional cleavage domain, eg, by dimerization. Thus, in certain embodiments, the ends closest to the target sites are separated by 5-8 nucleotide pairs or by 15-18 nucleotide pairs. However, any integer number of nucleotides or nucleotide pairs may be between two target sites (e.g., 2 to 50 nucleotides or more). In general, the cleavage point lies between the target sites.

As endonucleases de restrição (enzimas de restrição) estão presentes em muitas espécies e são capazes de ligação a DNA específica de sequência (num local de reconhecimento) e clivagem de DNA no local de ligação ou perto dele. Algumas enzimas de restrição (e.g., tipo IIS) cortam o DNA em locais que não os do local de reconhecimento e possuem domínios de ligação e de corte separáveis. Por exemplo, a enzima Tipo IIS Fokl catalisa a clivagem da cadeia dupla do DNA, distando 9 nucleótidos do seu local de reconhecimento numa cadeia e 13 nucleótidos do seu local de reconhecimento na outra. Ver por exemplo, as Patentes U.S. 5,356,802; 5,436,150 e 5,487,994; assim como Li et al. (1992) Proc. Natl. Acad. Sei. USA 89:4275-4279; Li et al. (1993) Proc. Natl. Acad. Sei. USA 90:2764-2768; Kim et al. (1994a) Proc. Natl. Acad. Sei. USA 91:883-887; Kim et al. (1994b) J. Biol. Chem. 269:31,978-31,982. Assim, numa realização, as proteínas de fusão compreendem o domínio de clivagem (ou semi-domínio de clivagem) de pelo menos uma enzima de restrição tipo IIS e um ou mais domínios de ligação em dedo de zinco, os quais podem ou não ser manipulados.Restriction endonucleases (restriction enzymes) are present in many species and are capable of binding to sequence specific DNA (at a recognition site) and DNA cleavage at or near the binding site. Some restriction enzymes (e.g., type IIS) cut the DNA at sites other than those at the recognition site and have separable binding and cleavage domains. For example, the IIS Fokl Type enzyme catalyzes the cleavage of the double strand of DNA, spacing 9 nucleotides from its recognition site into one strand and 13 nucleotides from its recognition site at the other. See, for example, U.S. Patents 5,356,802; 5,436,150 and 5,487,994; as well as Li et al. (1992) Proc. Natl. Acad. Know. USA 89: 4275-4279; Li et al. (1993) Proc. Natl. Acad. Know. USA 90: 2764-2768; Kim et al. (1994a) Proc. Natl. Acad. Know. USA 91: 883-887; Kim et al. (1994b) J. Biol. Chem. 269: 31978-31,982. Thus, in one embodiment, the fusion proteins comprise the cleavage (or semi-cleavage domain) domain of at least one IIS restriction enzyme and one or more zinc finger binding domains, which may or may not be manipulated .

Um exemplo de uma enzima de restrição tipo IIS, cujo domínio de clivagem é separável do domínio de ligação, é Fokl. Esta enzima particular é activa como um dímero. Bitinaite et al. (1998) Proc. Natl. Acad. Sei. USA 95: 10570-10575. Assim, para fins do presente invento, a porção da enzima Fokl usada nas proteínas de fusão descritas é considerada um semi-domínio de clivagem. Assim, para a clivagem dirigida de cadeia dupla e/ou substituição dirigida de sequências celulares usando ZFNs compreendendo fusões dedo de zinco-Fokl, duas proteínas de fusão, cada uma delas compreendendo um semi-domínio de clivagem Fokl, podem ser usadas para reconstituir um domínio de clivagem cataliticamente activo. Como alternativa, uma molécula polipeptídica isolada contendo um domínio de ligação em dedo de zinco e dois semi-domínios de clivagem Fokl pode ser igualmente usada. Os parâmetros para a clivagem dirigida e alteração da sequência alvo usando fusões dedo de zinco-Fokl são proporcionados algures nesta divulgação e, por exemplo, na Publicação do Pedido de Patente US N° 2005/0064474.An example of an IIS restriction enzyme whose cleavage domain is separable from the binding domain is Fok1. This particular enzyme is active as a dimer. Bitinaite et al. (1998) Proc. Natl. Acad. Know. USA 95: 10570-10575. Thus, for purposes of the present invention, the portion of the Fokl enzyme used in the described fusion proteins is considered a cleavage half domain. Thus, for directed double-stranded cleavage and / or directed substitution of cellular sequences using ZFNs comprising zinc-Fokl finger fusions, two fusion proteins, each comprising a Fokl cleavage half domain, may be used to reconstitute a catalytically active cleavage domain. Alternatively, an isolated polypeptide molecule containing a zinc finger binding domain and two Fokl cleavage half-domains may also be used. Parameters for directed cleavage and target sequence alteration using Fok-zinc finger fusions are provided some in this disclosure and, for example, in U.S. Patent Application Publication No. 2005/0064474.

Como alternativa, um semi-domínio de clivagem Fokl pode incluir uma ou mais mutações em qualquer resíduo de aminoácido que afecte a dimerização. Tais mutações podem ser úteis para evitar que um par de fusões ZFP/Fokl sofra homodimerização que possa conduzir à clivagem de sequências indesejáveis. Por exemplo, os resíduos de aminoácidos nas posições 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537 e 538 de Fokl estão todos muito perto da interface de dimerização para a influenciar. Assim, as alterações da sequência de aminoácidos numa ou mais das posições atrás referidas podem ser usadas para alterar as propriedades de dimerização do semi-domínio de clivagem. Tais alterações podem ser introduzidas, por exemplo, através da construção de uma biblioteca contendo (ou codificando) resíduos de aminoácidos diferentes nestas posições e selecção de variantes com as propriedades pretendidas ou através do desenho racional de mutantes individuais. Para além da prevenção da homodimerização, é igualmente possível que algumas destas mutações possam aumentar a eficiência de clivagem, comparativamente com a obtida com dois semi-domínios de clivagem selvagens.Alternatively, a Fok1 cleavage half domain may include one or more mutations at any amino acid residue that affects dimerization. Such mutations may be useful to prevent a pair of ZFP / Fokl fusions from undergoing homodimerization which may lead to the cleavage of undesirable sequences. For example, amino acid residues at positions 446, 447, 473, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537 and 538 of Fokl are all very close to the interface of dimerization to influence it. Thus, alterations of the amino acid sequence at one or more of the above positions can be used to alter the dimerization properties of the cleavage half domain. Such changes may be introduced, for example, by constructing a library containing (or encoding) different amino acid residues at these positions and selecting variants with the desired properties or by rationally designing individual mutants. In addition to the prevention of homodimerization, it is also possible that some of these mutations may increase the cleavage efficiency, as compared to that obtained with two wild-type cleavage domains.

Assim, para a clivagem dirigida usando um par de fusões ZFP/Fokl, uma ou ambas as proteínas de fusão podem compreender uma ou mais alterações de aminoácidos que inibam a auto-dimerização, mas permitam que ocorra a heterodimerização das duas proteínas de fusão de forma a ocorrer a clivagem no local alvo pretendido. Em determinadas realizações, as alterações estão presentes em ambas as proteínas de fusão e as alterações possuem efeitos aditivos; i.e. a homodimerização de qualquer uma das fusões, conduzindo a clivagem aberrante, é minimizada ou abolida, enquanto a heterodimerização das duas proteínas de fusão é facilitada comparativamente com a obtida com semi-domínios de clivagem tipo selvagem. 0 domínio de clivagem pode compreender dois semi-domínios de clivagem, ambos sendo parte de um único polipéptido compreendendo um domínio de ligação, um primeiro semi-domínio de clivagem e um segundo semi-domínio de clivagem. Os semi-domínios de clivagem podem ter a mesma sequência de aminoácidos ou sequências de aminoácidos diferentes, desde que funcionem para cortar o DNA.Thus, for targeted cleavage using a pair of ZFP / Fokl fusions, one or both of the fusion proteins may comprise one or more amino acid changes that inhibit self-dimerization but allow heterodimerization of the two fusion proteins to occur cleavage occurs at the intended target site. In certain embodiments, the changes are present in both fusion proteins and the changes have additive effects; i.e. homodimerization of any of the fusions, leading to aberrant cleavage, is minimized or abolished, whereas heterodimerization of the two fusion proteins is facilitated comparatively with that obtained with wild-type cleavage semi-domains. The cleavage domain may comprise two cleavage half-domains, both being part of a single polypeptide comprising a binding domain, a first cleavage half domain, and a second cleavage half domain. The cleavage half domains may have the same amino acid sequence or different amino acid sequences as long as they function to cut the DNA.

Os semi-domínios de clivagem podem ser proporcionados em moléculas separadas. Por exemplo, dois polipéptidos de fusão podem ser expressos numa célula, em que cada um dos polipéptidos compreende um domínio de ligação e um semi-domínio de clivagem. Os semi-domínios de clivagem podem ter a mesma sequência de aminoácidos ou sequências de aminoácidos diferentes, desde que funcionem para cortar o DNA. Ainda, os domínios de ligação ligam-se a sequências alvo que estão tipicamente dispostas de forma que, quando da ligação dos polipéptidos de fusão, os dois semi-domínios de clivagem sejam apresentados numa orientação espacial, um relativamente ao outro, de modo a permitir a reconstituição de um domínio de clivagem (e.g., através da dimerização dos semi-domínios) , posicionando assim os semi-domínios uns em relação aos outros para formar um domínio de clivagem funcional, resultando na clivagem da cromatina celular numa região de interesse. De um modo geral, a clivagem pelo domínio de clivagem reconstituído ocorre num local situado entre as duas sequências alvo. Uma ou ambas as proteínas podem ser manipuladas para se ligarem ao seu local alvo. A expressão de duas proteínas de fusão numa célula pode resultar da entrega das duas proteínas na célula; a entrega de uma proteína e de um ácido nucleico codificador de uma das proteínas na célula; entrega de dois ácidos nucleicos, cada um dele codificador de uma das proteínas, na célula; ou através da entrega de um único ácido nucleico, codificador de ambas as proteínas, à célula. Noutras realizações, uma proteína de fusão compreende uma única cadeia polipeptídica compreendendo dois semi-domínios de clivagem e um domínio dedo de zinco. Neste caso, uma única proteína de fusão é expressa numa célula e, sem pretender estar limitados por uma teoria, pensa-se que corte DNA como resultado da formação de um dímero intramolecular dos semi-domínios de clivagem.The cleavage half-domains may be provided in separate molecules. For example, two fusion polypeptides may be expressed in a cell, wherein each of the polypeptides comprises a binding domain and a cleavage half domain. The cleavage half domains may have the same amino acid sequence or different amino acid sequences as long as they function to cut the DNA. In addition, the binding domains bind to target sequences which are typically arranged such that, upon attachment of the fusion polypeptides, the two cleavage half domains are presented in spatial orientation relative to each other so as to allow the reconstitution of a cleavage domain (eg, through the dimerization of the half-domains), thereby positioning the half-domains relative to each other to form a functional cleavage domain, resulting in the cleavage of the cellular chromatin in a region of interest. In general, cleavage by the reconstituted cleavage domain occurs at a location between the two target sequences. One or both of the proteins may be manipulated to bind to their target site. Expression of two fusion proteins in a cell can result from the delivery of the two proteins in the cell; the delivery of a protein and a nucleic acid encoding one of the proteins in the cell; delivery of two nucleic acids, each encoding one of the proteins, into the cell; or by delivery of a single nucleic acid encoding both proteins to the cell. In other embodiments, a fusion protein comprises a single polypeptide chain comprising two cleavage half-domains and a zinc finger domain. In this case, a single fusion protein is expressed in a cell and, without being bound by a theory, is thought to cut DNA as a result of the formation of an intramolecular dimer of the cleavage half domains.

Os componentes de um ZFN podem estar arranjados arranjados de forma que o domínio dedo de zinco esteja mais perto do extremo amina da proteína de fusão e o semi-domínio de clivagem esteja mais próximo do extremo carboxilo. Isto espelha a orientação relativa do domínio de clivagem em domínios de clivagem com dimerização natural, tais como os derivados da enzima Fokl em que um domínio de ligação a DNA está mais perto do extremo amino e o semi-domínio de clivagem está mais perto do extremo carboxilo. Nestas realizações, a dimerização dos semi-domínios de clivagem para formar uma nuclease funcional é conseguida através da ligação das proteínas de fusão a locais em cadeias de DNA opostas, com os extremos 5' dos locais de ligação proximais um relativamente ao outro.The components of a ZFN can be arranged arranged so that the zinc finger domain is closer to the amino terminus of the fusion protein and the cleavage half domain is closer to the carboxyl terminus. This mirrors the relative orientation of the cleavage domain in natural dimerization cleavage domains such as those derived from the Fok1 enzyme in which a DNA binding domain is closer to the amino terminus and the cleavage half domain is closer to the carboxyl. In these embodiments, the dimerization of the cleavage half domains to form a functional nuclease is achieved by binding the fusion proteins to sites in opposing DNA strands with the 5 'ends of the proximal binding sites relative to each other.

Nesta orientação, o dedo de zinco mais C-terminal é proximal relativamente ao semi-domínio de clivagem Fokl. Foi previamente determinado que as proteínas com dedos de zinco não canónicos ligam-se aos seus alvos de DNA mais eficientemente quando um dedo de zinco tipo CCHC está presente como o dedo de zinco mais C-terminal. É portanto possível que a presença de dedos de zinco tipo CCHC previamente descritos na proximidade do semi-domínio de clivagem Fokl iniba a sua função. Se for este o caso, os dedos de zinco CCHC optimizados, presentemente descritos, aparentemente não apresentam esta actividade inibidora postulada.In this orientation, the most C-terminal zinc finger is proximal relative to the Fokl cleavage half domain. It has previously been determined that non-canonical zinc finger proteins bind to their DNA targets more efficiently when a CCHC-like zinc finger is present as the most C-terminal zinc finger. It is therefore possible that the presence of previously described CCHC-like zinc fingers in the vicinity of the Fokl cleavage half domain inhibits their function. If this is the case, the optimized CCHC zinc fingers, presently described, apparently do not exhibit this postulated inhibitory activity.

Como alternativa, os componentes das proteínas de fusão (e.g., fusões ZFP-Fokl) são arranjados de forma que o semi-domínio de clivagem esteja mais perto do extremo amino da proteína de fusão e o domínio dedo de zinco esteja mais perto do extremo carboxilo. Nestas realizações, a dimerização dos semi-domínios de clivagem para formar uma nuclease funcional é conseguida através da ligação das proteínas de fusão aos locais em cadeias de DNA opostas, com os extremos 3' dos locais de ligação sendo proximais um relativamente ao outro.Alternatively, the components of the fusion proteins (eg, ZFP-Fokl fusions) are arranged so that the cleavage half domain is closer to the amino terminus of the fusion protein and the zinc finger domain is closer to the carboxyl terminus . In these embodiments, the dimerization of the cleavage half-domains to form a functional nuclease is achieved by binding the fusion proteins to sites in opposite DNA strands, with the 3 'ends of the binding sites being proximal relative to each other.

Como alternativa, uma primeira proteína de fusão possui o semi-domínio de clivagem mais perto do extremo amina da proteína de fusão e o domínio dedo de zinco mais próximo do estremo carboxilo e uma segunda proteína de fusão está arranjada de forma que o domínio em dedo de zinco se situa mais próximo do extremo amino da proteína de fusão e o semi-domínio de clivagem está mais próximo do extremo carboxilo. Nestes casos, ambas as proteínas de fusão ligam-se à mesma cadeia de DNA, com o local de ligação da primeira proteína de fusão contendo o domínio dedo de zinco mais perto do extremo carboxilo situado no lado 5' do local de ligação da segunda proteína de fusão contendo o domínio dedo de zinco mais perto do extremo amina. Ver igualmente 2005/084190. A sequência de aminoácidos entre o domínio dedo de zinco e o domínio de clivagem (ou semi-domínio de clivagem) é designado como "ligante ZC". O ligante ZC deve ser distinguido dos ligantes inter-dedos atrás discutidos. Ver, e.g., Publicações de Patente U.S. 20050064474A1 e 20030232410, e Publicação de Patente Internacional WO 2005/084190, para detalhes na obtenção de ligantes ZC que optimizem a clivagem.Alternatively, a first fusion protein has the cleavage half domain closest to the amino terminus of the fusion protein and the zinc finger domain closest to the carboxy strand and a second fusion protein is arranged so that the finger domain of zinc is situated closer to the amino terminus of the fusion protein and the cleavage half domain is closer to the carboxyl terminus. In these cases, both fusion proteins bind to the same DNA strand with the binding site of the first zinc finger-containing fusion protein closest to the carboxyl terminus located on the 5 'side of the binding site of the second protein of the zinc finger domain containing the zinc finger domain closer to the amino terminus. See also 2005/084190. The amino acid sequence between the zinc finger domain and the cleavage domain (or cleavage half domain) is designated as " ZC linker ". The ZC linker should be distinguished from the inter-finger ligands discussed above. See, e.g., U.S. Patent Publications 20050064474A1 and 20030232410, and International Patent Publication WO 2005/084190, for details on obtaining ZC linkers that optimize cleavage.

Vectores de expressãoExpression vectors

Um ácido nucleico codificador de um ou mais ZFPs ou proteínas de fusão com ZFPs (e.g., ZFNs) pode ser clonado num vector para transformação de células procarió-ticas ou eucarióticas para replicação e/ou expressão. Os vectores podem ser vectores procarióticos ou eucarióticos, incluindo mas não estando limitados a plasmídeos, vectores vai-vem, vectores de insectos, vectores binários (ver, e.g., Patente U.S. N° 4,940,838; Horsch et ai. (1984) Science 233:496-498 e Fraley et al. (1983) Proc. Nat'1. Acad. Sei. USA 80:4803) e similares. Um ácido nucleico codificador de um ZFP pode também ser clonado num vector de expressão, para administração a uma célula vegetal.A nucleic acid encoding one or more ZFPs or fusion proteins with ZFPs (e.g., ZFNs) may be cloned into a vector for transformation of prokaryotic or eukaryotic cells for replication and / or expression. The vectors may be prokaryotic or eukaryotic vectors, including but not limited to plasmids, shuttle vectors, insect vectors, binary vectors (see, eg, U.S. Patent No. 4,940,838; Horsch et al. (1984) Science 233: 496 Et al. (1983) Proc. Natl Acad Sci USA 80: 4803) and the like. A nucleic acid encoding a ZFP may also be cloned into an expression vector, for administration to a plant cell.

Para expressar as proteínas de fusão, sequências codificadoras de ZFPs ou das fusões com ZFPs são tipicamente subclonadas num vector de expressão que possui um promotor para dirigir a transcrição. Promotores bacterianos e eucarióticos adequados são conhecidos na técnica e descritos, e.g., em Sambrook et al., Molecular Cloning, A Laboratory Manual (2nd ed. 1989; 3rd ed., 2001); Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990); e Current Protocols in Molecular Biology (Ausubel et al, supra. Sistemas de expressão bacterianos para expressão de ZFP estão disponíveis para, e.g. E. coli, Bacillus sp. , e Salmonella (Paiva et al, Gene 22:229-235 (1983)). Existem kits comerciais de tais sistemas de expressão. Os sistemas de expressão eucarióticos para células de mamífero, leveduras e células de insecto são conhecidos na técnica e podem ser comprados. O promotor usado para dirigir a expressão de um ácido nucleico codificador de ZFP depende da aplicação particular. Por exemplo, um promotor constitutivo forte adequado para a célula hospedeira é tipicamente usado para expressão e purificação de ZFPs.In order to express the fusion proteins, ZFPs or ZFP fusion sequences are typically subcloned into an expression vector that has a promoter to direct transcription. Suitable bacterial and eukaryotic promoters are known in the art and described, e.g., in Sambrook et al., Molecular Cloning, A Laboratory Manual (2nd ed., 1989, 3rd ed., 2001); Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990); and Bacterial Expression Systems for ZFP expression are available for, eg, E. coli, Bacillus sp., and Salmonella (Paiva et al, Gene 22: 229-235 (1983), and Current Protocols in Molecular Biology (Ausubel et al., supra. ) There are commercial kits of such expression systems Eukaryotic expression systems for mammalian cells, yeast and insect cells are known in the art and can be purchased The promoter used to direct the expression of a nucleic acid encoding ZFP depends For example, a strong constitutive promoter suitable for the host cell is typically used for expression and purification of ZFPs.

Pelo contrário, quando um ZFP é administrado in vivo para regulação de genes vegetais (ver, "Introdução de ácido nucleico em células vegetais" secção abaixo) é usado um promotor constitutivo ou um promotor induzível, dependendo do uso particular do ZFP. Exemplos não limitantes de promotores vegetais incluem sequências promotoras derivadas de ubiquitina-3 de A. thaliana (ubi-3) (Callis, et al., 1990, J. Biol. Chem. 265-12486-12493); manopina-sintetase de A. tumefaciens (Amas) (Petolino et al., U.S. Patent No. 6,730,824); e/ou virus mosaico das nervuras da mandioca (CsVMV) (Verdaguer et al., 1996, Plant Molecular Biology 31:1129- 1139). Ver, também, Exemplos.In contrast, when a ZFP is administered in vivo for regulation of plant genes (see " Introduction of nucleic acid in plant cells " section below) a constitutive promoter or inducible promoter is used, depending on the particular use of ZFP. Non-limiting examples of plant promoters include promoter sequences derived from A. thaliana ubiquitin-3 (ubi-3) (Callis, et al., 1990, J. Biol. Chem. 265-12486-12493); mannopine-synthetase from A. tumefaciens (Amas) (Petolino et al., U.S. Patent No. 6,730,824); and / or cassava rib mosaic virus (CsVMV) (Verdaguer et al., 1996, Plant Molecular Biology 31: 1129-1139). See, also, Examples.

Para além do promotor, o vector de expressão tipicamente possui uma unidade de transcrição ou cassete de expressão que contém todos os elementos adicionais necessários para a expressão do ácido nucleico nas células hospedeiras, procarióticas ou eucarióticas. Assim, uma cassete de expressão típica contém um promotor ligado operacionalmente, e.g., a uma sequência de ácido nucleico codificadora de ZFP e sinais necessários, e.g., para poliadenilação eficiente do transcrito, terminação da transcrição, locais de ligação aos ribossomas ou terminação da tradução. Outros elementos da cassete podem incluir, e.g., estimuladores e sinais de "splicing" heterólogos. O vector de expressão particular usado para transportar a informação genética para a célula é selec-cionado relativamente ao uso pretendido para ZFP, e.g., expressão em plantas, animais, bactérias, fungos, protozoários, etc. (ver vectores de expressão descritos abaixo). Na área são conhecidos vectores de expressão bacterianos e animais convencionais e estão descritos detalhadamente, por exemplo, na Publicação de Patente U.S. 20050064474A1 e nas Publicações de Patente Internacionais W005/084190, W005/014791 e W003/080809. Métodos convencionais de transfecção podem ser usados para produzir linhas celulares de bactérias, mamífero, levedura ou insecto que expressem grandes quantidade de proteína, a qual pode ser então purificada usando técnicas convencionais (ver, e.g., Colley et al, J. Biol. Chem. 264:17619-17622 (1989); Guide to Protein Purification, in Methods in Enzymology, vol. 182 (Deutscher, ed., 1990)). A transformação de células eucarióticas e procarióticas é realizada de acordo com técnicas convencionais (ver, e.g., Morrison, J. Bact. 132:349-351 (1977); Clark-Curtiss & Curtiss, Methods in Enzymology 101:347-362 (Wu et al., eds., 1983).In addition to the promoter, the expression vector typically has a transcription unit or expression cassette which contains all the additional elements necessary for expression of the nucleic acid in host, prokaryotic or eukaryotic cells. Thus, a typical expression cassette contains a promoter operably linked, e.g., to a ZFP-encoding nucleic acid sequence and necessary signals, e.g., for efficient transcript polyadenylation, transcription termination, ribosome binding sites or translation termination. Other elements of the cassette may include, e.g., stimulators and " splicing " heterologous. The particular expression vector used to transport the genetic information to the cell is selected relative to the intended use for ZFP, e.g., expression in plants, animals, bacteria, fungi, protozoa, etc. (see expression vectors described below). In the art, conventional bacterial and animal expression vectors are known and are described in detail, for example, in U.S. Patent Publication No. 20050064474A1 and in International Patent Publications W005 / 084190, W005 / 014791 and W003 / 080809. Conventional transfection methods can be used to produce bacterial, mammalian, yeast or insect cell lines expressing large amounts of protein, which can then be purified using standard techniques (see, eg, Colley et al, J. Biol. Chem. 264: 17619-17622 (1989); Guide to Protein Purification, in Methods in Enzymology, vol. 182 (Deutscher, ed., 1990)). The transformation of eukaryotic and prokaryotic cells is carried out according to conventional techniques (see, eg, Morrison, J. Bact., 132: 349-351 (1977), Clark-Curtiss & Curtiss, Methods in Enzymology 101: 347-362 Wu et al., Eds., 1983).

Pode ser usado qualquer um dos processos bem conhecidos para introdução de sequências nucleotídicas estranhas em tais células hospedeiras. Estas incluem o uso de transfecção com fosfato de cálcio, polibreno, fusão de protoplastos, electroporação, métodos com ultra-sons), lipossomas, microinjecção, DNA nu, vectores plasmídicos, vectores virais, epissómicos e integrativos, e qualquer um dos outros métodos conhecidos para introdução de DNA genómico, cDNA, DNA sintético ou outro material estranho numa célula hospedeira (ver, e.g., Sambrook et al., supra). É apenas necessário que o procedimento genético particular usado seja capaz de introduzir com êxito pelo menos um gene na célula hospedeira capaz de expressar a proteína pretendida.Any of the well known methods for introducing foreign nucleotide sequences into such host cells can be used. These include the use of calcium phosphate transfection, polybrene, protoplast fusion, electroporation, ultrasound methods), liposomes, microinjection, naked DNA, plasmid vectors, viral, episomal and integrative vectors, and any of the other known methods for introduction of genomic DNA, cDNA, synthetic DNA or other foreign material into a host cell (see, eg, Sambrook et al., supra). It is only necessary that the particular genetic procedure used is capable of successfully introducing at least one gene into the host cell capable of expressing the desired protein.

Introdução de ácido nucleico em células vegetaisIntroduction of nucleic acid in plant cells

Como referido atrás, as construções de DNA podem ser introduzidas nom hospedeiro vegetal pretendido (e.g. no genoma) através de uma variedade de técnicas convencionais. Para revisões de tais técnicas ver, por exemplo, Weissbach & Weissbach Methods for Plant Molecular Biology (1988, Academic Press, N. Y.) Section VIII, pp. 421-463; eAs noted above, DNA constructs may be introduced to the desired plant host (e.g., into the genome) by a variety of conventional techniques. For reviews of such techniques see, for example, Weissbach & Weissbach Methods for Plant Molecular Biology (1988, Academic Press, N.Y.) Section VIII, pp. 421-463; and

Grierson & Corey, Plant Molecular Biology (1988, 2d Ed.), Blackie, London, Ch. 7-9.Grierson & Corey, Plant Molecular Biology (1988, 2d Ed.), Blackie, London, Ch. 7-9.

Por exemplo, a construção de DNA pode ser introduzida numa célula vegetal usando técnicas tais como electroporação e microinjecção de protoplastos de células vegetais ou as construções de DNA podem ser introduzidas directamente no tecido vegetal usando métodos biolisticos, tais como bombardeamento com partículas de DNA (ver, e.g., Klein et al (1987) Nature 327:70-73). Como alternativa, as construções de DNA podem ser combinadas com regiões flan-queantes de T-DNA adequadas e introduzidas num vector hospedeiro convencional de Agrobacterium tumefaciens. Técnicas de transformação mediada por Agrobacterium tumefaciens, incluindo a remoção de braços e uso de vectores binários, estão bem descritas na literatura científica. Ver, por exemplo, Horsch et ai (1984) Science 233:496-498, e Fraley et al (1983) Proc. Natl Acad. ScL USA 80:4803.For example, the DNA construct can be introduced into a plant cell using techniques such as electroporation and microinjection of plant cell protoplasts, or DNA constructs can be introduced directly into the plant tissue using biolistic methods, such as bombardment with DNA particles (see , eg, Klein et al (1987) Nature 327: 70-73). Alternatively, the DNA constructs may be combined with suitable T-DNA flanking regions and introduced into a conventional host vector of Agrobacterium tumefaciens. Transformation techniques mediated by Agrobacterium tumefaciens, including the removal of arms and the use of binary vectors, are well described in the scientific literature. See, for example, Horsch et al (1984) Science 233: 496-498, and Fraley et al (1983) Proc. Natl Acad. ScL USA 80: 4803.

Ainda, a transferência de genes pode ser conseguida usando bactérias não Agrobacterium ou vírus tais comoIn addition, gene transfer can be accomplished using non-Agrobacterium bacteria or viruses such as

Rhizobium sp . NGR234, Sinorhizoboium meliloti, Mesorhi-zobium loti, vírus X da batateira, virus do mosaico da couve-flor e virus do mosaico das nervuras de mandioca e/ou virus do mosaico do tabaco. Ver, e.g., Chung et al. (2006) Trends Plant Sci. 11(1):1-4.Rhizobium sp. NGR234, Sinorhizoboium meliloti, Mesorhi-zobium loti, potato virus X, cauliflower mosaic virus and cassava rib mosaic virus and / or tobacco mosaic virus. See, e.g., Chung et al. (2006) Trends Plant Sci. 11 (1): 1-4.

As funções de virulência do hospedeiro Agrobacterium tumefaciens dirigirão a inserção da construção e a marca adjacente no DNA da célula vegetal quando a célula é infectada pelas bactérias usando o vector de T DNA binário (Bevan (1984) Nuc. Acid Res. 12:8711-8721) ou o procedimento de co-cultura (Horsch et al (1985) Science 227:1229-1231) . De um modo geral, o sistema de transformação de Agrobacterium é usado para a manipulação de plantas dicotiledóneas (Bevan et al (1992) Ann. Rev. Genet 16:357-384; Rogers et al (1986) Methods Enzymol. 118:627-641). 0 sistema de transformação de Agrobacterium pode ser igualmente usado para transformar, assim como para transferir, DNA para plantas monocotiledóneas e células vegetais. Ver Patente U.S. No. 5, 591,616; Hernalsteen et al (1984) EMBO J 3:3039-3041; Hooykass-Van Slogteren et al (1984) Nature 311 :763-764; Grimsley et al (1987) Nature 325:1677-179; Boulton et al (1989) Plant Mol. Biol. 12:31-40; e Gould et al (1991) Plant Physiol. 95:426-434. Métodos alternativos de transferência de genes e transformação incluem, mas não lhes estão limitados, transformação de protoplastos através da captura de DNA nu mediada por cálcio, polietilenoglicol (PEG) ou electropo- ração (ver Paszkowski et al. (1984) EMBOJ 3:2717-2722, Potrykus et al. (1985) Molec. Gen. Genet. 199:169-177; Fromm et al. (1985) Proc. Nat. Acad. Sd. USA 82:5824-5828; e Shimamoto (1989) Nature 338:274-276) e electroporação de tecidos vegetais (D'Halluin et al. (1992) Plant Cell 4:1495-1505). Outros métodos para a transformação de células vegetais incluem microinjecção, internalização de DNA mediada por carbeto de silício (Kaeppler et al. (1990) Plant Cell Reporter 9:415-418), e bombardeamento de micropro j écteis (see Klein et al. (1988) Proc. Nat. Acad. Sei USA 85:4305-430 9; e Gordon-Kamm et al. (1990) Plant Cell 2:603-618).The virulence functions of the Agrobacterium tumefaciens host will direct the insertion of the construct and the adjacent tag into the DNA of the plant cell when the cell is infected by the bacteria using the B-DNA vector (Bevan (1984) Nuc. Acid Res. 12: 8711- 8721) or the co-culture procedure (Horsch et al (1985) Science 227: 1229-1231). In general, the Agrobacterium transformation system is used for the manipulation of dicotyledonous plants (Bevan et al (1992) Ann. Rev. Genet 16: 357-384; Rogers et al. (1986) Methods Enzymol. 641). The Agrobacterium transformation system can also be used to transform, as well as to transfer, DNA to monocotyledonous plants and plant cells. See U.S. Patent No. 5,591,616; Hernalsteen et al (1984) EMBO J 3: 3039-3041; Hooykass-Van Slogteren et al (1984) Nature 311: 763-764; Grimsley et al (1987) Nature 325: 1677-179; Boulton et al (1989) Plant Mol. Biol. 12: 31-40; and Gould et al (1991) Plant Physiol. 95: 426-434. Alternative methods of gene transfer and transformation include, but are not limited to, protoplast transformation through capture of calcium-mediated, polyethylene glycol (PEG) or electroporated DNA (see Paszkowski et al. (1984) EMBOJ 3: 2717 (1985) Proc. Nat. Acad. Sd., USA 82: 5824-5828; and Shimamoto (1989) Nature 338: 274-276) and electroporation of plant tissues (D'Halluin et al. (1992) Plant Cell 4: 1495-1505). Other methods for transforming plant cells include microinjection, silicon carbide-mediated DNA internalization (Kaeppler et al. (1990) Plant Cell Reporter 9: 415-418), and bombardment of microprojectiles (see Klein et al. 1988) Proc Nat Nat. Acad Sci USA 85: 4305-4309 and Gordon-Kamm et al. (1990) Plant Cell 2: 603-618).

Os métodos e composições descritos podem ser usados para inserir sequências exógenas numa localização pré-determinada num genoma de célula vegetal. Isto é útil na medida em que a expressão de um transgene introduzido num genoma vegetal dependa criticamente do seu local de integração. Assim, genes codificadores, e.g., de nutrientes, antibióticos ou moléculas terapêuticas podem ser inseridos, através de recombinação dirigida, em regiões de um genoma vegetal favorável à sua expressão.The described methods and compositions may be used to insert exogenous sequences at a predetermined location into a plant cell genome. This is useful insofar as the expression of a transgene introduced into a plant genome depends critically on its site of integration. Thus, coding genes, e.g., of nutrients, antibiotics or therapeutic molecules can be inserted, by directed recombination, into regions of a plant genome favorable to expression thereof.

As células vegetais transformadas que são produzidas por qualquer uma das técnicas de transformação atrás referidas podem ser cultivadas para regenerar uma planta completa que possui o genótipo transformado e assim o fenótipo pretendido. Tais técnicas de regeneração baseiam-se na manipulação de determinadas fito-hormonas num meio de cultura de tecidos, tipicamente baseadas num marcador biocida e/ou herbicida que foi introduzido juntamente com as sequências nucleotídicas pretendidas. A regeneração de plantas a partir de protoplastos cultivados está descrita em Evans, et ai., "Protoplasts Isolation and Culture" in Handbook of Plant Cell Culture, pp. 124-176, MacmillianTransformed plant cells that are produced by any of the above transformation techniques can be cultured to regenerate a complete plant having the transformed genotype and thus the desired phenotype. Such regeneration techniques are based on the manipulation of certain phytohormones in a tissue culture medium, typically based on a biocidal and / or herbicidal marker that has been introduced along with the desired nucleotide sequences. Plant regeneration from cultured protoplasts is described in Evans, et al., &Quot; Protoplasts Isolation and Culture " in Handbook of Plant Cell Culture, pp. 124-176, Macmillian

Publishing Company, New York, 1983; e Binding, Regeneration of Plants, Plant Protoplasts, pp. 21-73, CRC Press, BocaPublishing Company, New York, 1983; and Binding, Regeneration of Plants, Plant Protoplasts, pp. 21-73, CRC Press, Mouth

Raton, 1985. A regeneração pode ser igualmente obtida a partir de calos vegetais, explantes, órgãos, pólens, embriões ou partes dos mesmos. Tais técnicas de regeneração estão descritas, genericamente, em Klee et al (1987) Ann. Rev. of Plant Phys. 38:467-486.Raton, 1985. Regeneration may also be obtained from plant calli, explants, organs, pollen, embryos or parts thereof. Such regeneration techniques are generally described in Klee et al (1987) Ann. Rev. of Plant Phys. 38: 467-486.

Os ácidos nucleicos introduzidos numa célula vegetal podem ser usados para conferir características pretendidas em essencialmente qualquer planta. Uma larga variedade de plantas e sistemas de células vegetais pode ser manipulada relativamente às características fisiológicas e agronómicas pretendidas aqui descritas usando construções de ácido nucleico da presente divulgação e os vários métodos de transformação atrás mencionados. Em determinadas realizações, as plantas e células vegetais alvo para manipulação incluem, mas não lhes estão limitadas, as plantas monocotiledóneas e dicotiledóneas, tais como culturas agrícolas incluindo culturas de cereais (e.g., trigo, milho, arroz, milho miúdo, cevada), fruticultura (e.g., tomate, maçã, pêra, morango, laranja), culturas forrageiras (e.g., alfafa), culturas de tubérculos (e.g., cenoura, batata, beterraba sacarina, inhame), culturas de vegetais verdes (e.g. alface, espinafre); plantas de floricultura (e.g., petúnias, rosas, crisântemos), coníferas e pinheiros (e.g., abeto, pícea); plantas usadas em fito-remediação (e.g. plantas que acumulam metais pesados); culturas de oleaginosas (e.g. girassol, colza) e plantas usadas para fins experimentais (e.g., Arabidopsis). Assim, os métodos e composições descritos possuem utilidade numa larga gama de plantas, incluindo, mas não lhes estando limitados, espécies dos géneros Asparagus, Avena, Brassica, Citrus, Citrullus, Capsicum, Cucurbita, Daucus, Glycine, Gossypium, Hordeum, Lactuca, Lycopersicon, Malus, Manihot, Nicotiana, Oryza, Persea, Pisum, Pyrus, Prunus, Raphanus, Secale, Solanum, Sorghum, Triticum, Vitis, Vigna e Zea.Nucleic acids introduced into a plant cell can be used to impart desired characteristics in essentially any plant. A wide variety of plants and plant cell systems can be manipulated relative to the desired physiological and agronomic characteristics described herein using nucleic acid constructs of the present disclosure and the various transformation methods mentioned above. In certain embodiments, target plants and plant cells for manipulation include, but are not limited to, monocotyledonous and dicotyledonous plants, such as agricultural crops including cereal crops (eg wheat, corn, rice, millet, barley), fruit growing (eg, tomato, apple, pear, strawberry, orange), forage crops (eg alfalfa), tuber crops (eg, carrot, potato, sugar beet, yams), green vegetable crops (eg lettuce, spinach); floriculture plants (e.g., petunias, roses, chrysanthemums), conifers and pines (e.g., spruce, spruce); plants used in phyto-remediation (e.g., plants accumulating heavy metals); oleaginous crops (e.g., sunflower, rapeseed) and plants used for experimental purposes (e.g., Arabidopsis). Thus, the methods and compositions disclosed have utility in a wide range of plants, including, but not limited to, species of the genera Asparagus, Avena, Brassica, Citrus, Citrus, Capsicum, Cucurbita, Daucus, Glycine, Gossypium, Hordeum, Lactuca, Lycopersicon, Malus, Manihot, Nicotiana, Oryza, Persea, Pisum, Pyrus, Prunus, Raphanus, Secale, Solanum, Sorghum, Triticum, Vitis, Vigna and Zea.

Os familiarizados com a técnica reconhecerão que após a cassete de expressão ser estavelmente incorporada em plantas transgénicas e confirmada como operacional, pode ser introduzida noutras plantas através de cruzamento sexual. Pode ser usada qualquer uma de uma série de técnicas convencionais de cruzamento, dependendo da espécie a ser cruzada.Those familiar with the art will recognize that after the expression cassette is stably incorporated into transgenic plants and confirmed as operational, it can be introduced into other plants through sexual intercrossing. Any of a number of conventional crossing techniques may be used depending on the species to be crossed.

Uma célula vegetal, calo, tecido ou planta transformada pode ser identificada e isolada através da selecção ou rastreio do material vegetal relativamente a características codificadas pelos genes marcadores presentes no DNA transformante. Por exemplo, a selecção pode ser realizada através do crescimento do material vegetal manipulado em meio contendo uma quantidade inibidora do antibiótico ou herbicida ao qual a construção do gene transformante confere resistência. Ainda, as plantas e células vegetais transformadas podem ser igualmente identificadas através do rastreio das actividades de quaisquer genes de marcas visíveis (e.g., os genes da β-glucuronidase, luciferase, B ou Cl) que podem estar presentes nas construções de ácido nucleico recombinante. Tais metodologias de selecção e rastreio são conhecidas dos familiarizados com a área. Métodos físicos e bioquímicos podem ser igualmente usados para identificar transformantes de plantas e de células vegetais contendo construções com genes inseridos. Estes métodos incluem, mas não lhes estão limitados: 1) análise Southern ou amplificação por PCR para detecção e determinação da estrutura do inserto de DNA recombinante; 2) análise Northern, protecção da RNase Sl, extensão de sequências iniciadoras ou amplificação por transcrição reversa-PCR para detecção e avaliação de transcritos de RNA das construções genéticas; 3) ensaios enzimáticos de detecção de actividade enzimática ou de ribozima, pelo que tais produtos de genes são codificados pela construção de genes; 4) electroforese em gel de proteínas, técnica de transferência Western, imunoprecipitação ou imunoensaios ligados a enzimas, em que os produtos das construções genéticas são proteínas. Outras técnicas tais como hibridação in situ, coloração enzimática e imunocoloração, podem ser igualmente usadas para detectar a presença ou expressão da construção recombinante em órgãos e tecidos específicos de plantas. Os métodos para executar todos estes ensaios são conhecidos na técnica.A plant cell, callus, tissue or transformed plant can be identified and isolated by selecting or screening the plant material for characteristics encoded by the marker genes present in the transforming DNA. For example, selection can be accomplished by growing the manipulated plant material in medium containing an antibiotic or herbicidal inhibitor amount to which the transforming gene construct confers resistance. In addition, transformed plant and plant cells can also be identified by screening the activities of any genes of visible tags (e.g., β-glucuronidase, luciferase, B or Cl genes) that may be present in the recombinant nucleic acid constructs. Such screening and screening methodologies are known to those skilled in the art. Physical and biochemical methods may also be used to identify plant and plant cell transformants containing constructs with inserted genes. These methods include, but are not limited to: 1) Southern analysis or PCR amplification for detection and determination of recombinant DNA insert structure; 2) Northern analysis, RNase I 1 protection, primer extension or reverse transcription-PCR amplification for detection and evaluation of RNA transcripts of the genetic constructs; 3) enzymatic assays for detecting enzymatic or ribozyme activity, whereby such gene products are encoded by the gene construct; 4) protein gel electrophoresis, Western blotting technique, immunoprecipitation or enzyme linked immunoassays, wherein the products of the genetic constructs are proteins. Other techniques such as in situ hybridization, enzymatic staining and immunostaining may also be used to detect the presence or expression of the recombinant construct in plant-specific organs and tissues. Methods for carrying out all of these assays are known in the art.

Os efeitos da manipulação genética usando os métodos aqui descritos podem ser observados através, por exemplo, de transferências Northern do RNA (e.g., mRNA) isolado a partir de tecidos de interesse. Tipicamente, se a quantidade de mRNA tiver aumentado, pode ser assumido que o gene endógeno correspondente está a ser expresso numa taxa superior ao que anteriormente acontecia. Podem ser usados outros métodos de medição da actividade de genes e/ou CYP74B. Podem ser usados diferentes tipos de ensaios enzimáticos, dependendo do substrato usado e do método de detecção do aumento ou decréscimo de um produto ou subproduto de reacção. Ainda, os níveis de gene e/ou proteína CYP74B expressos podem ser medidos imunoquimicamente, i.e. por ELISA, RIA, EIA e outros ensaios baseados em anticorpos conhecidos dos familiarizados com a técnica, tais como ensaios de detecção electroforética (através de coloração ou transferência Western). 0 transgene pode ser selectivamente expresso nalguns tecidos da planta ou nalgumas fases do desenvolvimento ou o transgene pode ser expresso em substancialmente todos os tecidos da planta, substancialmente ao longo de todo o seu ciclo de vida. No entanto, qualquer modo de expressão combinatória é também aplicável.The effects of genetic manipulation using the methods described herein can be observed by, for example, Northern blots of RNA (e.g., mRNA) isolated from tissues of interest. Typically, if the amount of mRNA has increased, it can be assumed that the corresponding endogenous gene is being expressed at a rate higher than previously. Other methods of measuring gene and / or CYP74B activity may be used. Different types of enzymatic assays may be used, depending on the substrate used and the method of detecting the increase or decrease of a reaction product or by-product. In addition, expressed CYP74B gene and / or protein levels can be measured immunochemically, ie by ELISA, RIA, EIA, and other antibody-based assays known to those skilled in the art, such as electrophoretic detection assays (via staining or Western blotting ). The transgene may be selectively expressed in some tissues of the plant or in some stages of development or the transgene may be expressed in substantially all tissues of the plant, substantially throughout its life cycle. However, any mode of combinatorial expression is also applicable.

Descrevem-se igualmente sementes das plantas transgénicas atrás descritas em que a semente possui a construção do transgene ou do gene. A presente divulgação ainda engloba a progénie, clones, linhas celulares ou células das plantas transgénicas atrás descritas em que a referida progénie, clone, linha celular ou célula possui o transgene ou construção genética. ZFPs e vectores de expressão codificadores de ZFPs podem ser administrados directamente na planta para clivagem e/ou recombinação dirigida. A administração de quantidades eficazes ocorre por qualquer uma das vias normalmente usadas para introdução de ZFP em contacto intimo com a célula vegetal a ser tratada. Métodos adequados de administração de tais composições estão disponíveis e são conhecidos dos familiarizados com a técnica e, ainda que possa ser usada mais de uma via para administrar uma composição particular, uma via particular pode frequentemente oferecer uma reacção mais imediata e mais eficaz que outra.Also described are seeds of the transgenic plants described above wherein the seed has the transgene or gene construct. The present disclosure further encompasses the above-described progeny, clones, cell lines or cells of the transgenic plants wherein said progeny, clone, cell line or cell has the transgene or genetic construct. ZFPs and expression vectors encoding ZFPs can be administered directly in the plant for cleavage and / or targeted recombination. Administration of effective amounts occurs by any of the routes normally used for introducing ZFP in intimate contact with the plant cell to be treated. Suitable methods of administering such compositions are available and are known to those skilled in the art, and although more than one route may be used to administer a particular composition, one particular route may often offer a more immediate and more effective reaction than another.

Podem ser igualmente usados veículos e são determinados em parte pela composição a ser administrada, assim como pelo método particular usado para administrar a composição. Assim, existe uma variedade de formulações adequadas de composições farmacêuticas que estão disponíveis (ver, e.g., Remington's Pharmaceutical Sciences, 17th ed. 1985)).Carriers may also be used and are determined in part by the composition to be administered, as well as by the particular method used to administer the composition. Thus, a variety of suitable formulations of pharmaceutical compositions are available (see, e.g., Remington's Pharmaceutical Sciences, 17th ed., 1985)).

Aplicaçõesapplications

As proteínas com dedos de zinco compreendendo um ou mais dedos de zinco não canónicos, como aqui descrito, são úteis para regulação de todo o genoma e aplicações de edição para os quais os ZFPs canónicos C2H2 são correntemente usados, incluindo mas não estando limitado a: activação de genes; repressão de genes; edição do genoma (clivagem, inserção dirigida, substituição ou deleção); e edição epigenómica (tendo como alvo modificações covalentes de histonas ou DNA). ZFNs compreendendo dedos de zinco não canónicos como aqui descritos podem ser usados para cortar DNA numa região de interesse na cromatina celular (e.g., num local pretendido ou pré-determinado num genoma, por exemplo, num gene, mutante ou selvagem) . Para tal clivagem dirigida de DNA, um domínio de ligação dedo de zinco é manipulado para se ligar a um local alvo num local de clivagem pré-determinado, ou perto dele, e uma proteína de fusão compreendendo o domínio de ligação dedo de zinco manipulado e um domínio de clivagem é expresso numa célula. Quando da ligação da porção dedo de zinco da proteína de fusão ao local alvo, o DNA é cortado perto do local alvo através do domínio de clivagem. 0 local exacto da clivagem pode depender do comprimento do ligante ZC.Zinc finger proteins comprising one or more non-canonical zinc fingers as described herein are useful for whole genome regulation and editing applications for which canonical C2H2 ZFPs are commonly used, including but not limited to: gene activation; gene repression; genome editing (cleavage, directed insertion, substitution or deletion); and epigenomic editing (targeting histone or DNA covalent modifications). ZFNs comprising non-canonical zinc fingers as described herein may be used to cut out DNA in a region of interest in cellular chromatin (e.g., at a desired or predetermined site in a genome, for example in a mutant or wild-type gene). For such targeted DNA cleavage, a zinc finger binding domain is manipulated to bind to a target site at or near a predetermined cleavage site and a fusion protein comprising the manipulated zinc finger binding domain and a cleavage domain is expressed in a cell. Upon binding of the finger portion of the fusion protein to the target site, the DNA is cut near the target site through the cleavage domain. The exact location of the cleavage may depend on the length of the ZC linker.

Como alternativa, dois ZFNs, cada um deles compreendendo um domínio de ligação dedo de zinco e um semi-domínio de clivagem, são expressos numa célula, e ligam-se a locais alvo que são justapostos, de forma que um domínio de clivagem funcional seja reconstituído e o DNA cortado na vizinhança dos locais alvo. Numa realização, a clivagem ocorre entre os locais alvo dos dois domínios de ligação dedo de zinco. Pode-se manipular um ou ambos os domínios de ligação dedo de zinco.Alternatively, two ZFNs, each comprising a zinc finger binding domain and a cleavage half domain, are expressed in a cell, and bind to target sites that are juxtaposed such that a functional cleavage domain is reconstituted DNA and the DNA cut in the vicinity of the target sites. In one embodiment, the cleavage occurs between the target sites of the two zinc finger binding domains. One or both of the zinc finger binding domains can be manipulated.

Para a clivagem dirigida usando um polipéptido de fusão domínio de ligação dedo de zinco-domínio de clivagem, o local de ligação pode incluir o local de clivagem ou o extremo proximal do local de ligação pode estar a 1, 2, 3, 4, 5, 6, 10, 25, 50 ou mais nucleótidos (ou qualquer valor inteiro entre 1 e 50 nucleótidos) do local de clivagem. A localização exacta do local de ligação, relativamente ao local de clivagem, dependerá do domínio de clivagem particular e do comprimento do ligante ZC. Para métodos em que são usados dois polipéptidos de fusão, cada um compreendendo domínio de ligação dedo de zinco e um semi-domínio de clivagem, os locais de ligação, geralmente, abrangem o local de clivagem. Assim, o extremo proximal do primeiro local de ligação pode distar 1, 2, 3, 4, 5, 6, 10, 25 ou mais nucleótidos (ou qualquer inteiro entre 1 e 50 nucleótidos) de um lado do local de ligação e o extremo proximal do segundo local de ligação pode distar 1, 2, 3, 4, 5, 6, 10, 25 ou mais nucleótidos (ou qualquer inteiro entre 1 e 50 nucleótidos) do outro lado do local de clivagem. Os métodos para mapeamento dos locais de clivagem in vitro e in vivo são conhecidos dos familiarizados com a técnica.For cleavage directed using a zinc finger cleavage domain-domain cleavage polypeptide, the binding site may include the cleavage site or the proximal end of the binding site may be 1, 2, 3, 4, 5 , 6, 10, 25, 50 or more nucleotides (or any integer value between 1 and 50 nucleotides) of the cleavage site. The exact location of the binding site, relative to the cleavage site, will depend on the particular cleavage domain and the length of the ZC linker. For methods in which two fusion polypeptides, each comprising zinc finger binding domain and a cleavage half domain, are used, the binding sites generally encompass the cleavage site. Thus, the proximal end of the first binding site may be 1, 2, 3, 4, 5, 6, 10, 25 or more nucleotides (or any integer between 1 and 50 nucleotides) on one side of the binding site and the proximal portion of the second binding site may be 1, 2, 3, 4, 5, 6, 10, 25 or more nucleotides (or any integer between 1 and 50 nucleotides) on the other side of the cleavage site. Methods for mapping the cleavage sites in vitro and in vivo are known to those skilled in the art.

Uma vez introduzida ou expressa na célula alvo, a proteína de fusão liga-se à sequência alvo e corta na sequência alvo ou perto dela. 0 local exacto do corte depende da natureza do domínio de clivagem e/ou da presença e/ou natureza das sequências ligantes entre os domínios de ligação e de clivagem. Nos casos em que são usados dois ZFNs, cada um deles compreendendo um semi-dominio de clivagem, a distância entre os extremos proximais dos locais de ligação pode ser 1, 2, 3, 4, 5, 6, 10, 25 ou mais nucleótidos (ou qualquer inteiro entre 1 e 50 nucleótidos). Os níveis óptimos de clivagem podem também depender da distância entre os locais de ligação dos dois ZFNs (ver, por exemplo, Smith et ai. (2000) Nucleic Acids Res. 28:3361-3369; Bibikova et al. (2001) Mol. Cell. Biol. 21:289-297) e o comprimento do ligante ZC em cada ZFN. Ver, também, Publicação de Patente U.S. 20050064474A1 e Publicações de Patente Internacional W005/084190, W005/014791 e W003/080809.Once introduced or expressed in the target cell, the fusion protein binds to the target sequence and cuts into or near the target sequence. The exact location of the cleavage depends on the nature of the cleavage domain and / or the presence and / or nature of the linker sequences between the binding and cleavage domains. In cases where two ZFNs are used, each comprising a cleavage half-domain, the distance between the proximal ends of the binding sites may be 1, 2, 3, 4, 5, 6, 10, 25 or more nucleotides (or any integer between 1 and 50 nucleotides). Optimal cleavage levels may also depend on the distance between the binding sites of the two ZFNs (see, for example, Smith et al. (2000) Nucleic Acids Res. 28: 3361-3369; Bibikova et al. (2001) Mol. Cell Biol. 21: 289-297) and the length of the ZC linker in each ZFN. See also, U.S. Patent Publication 20050064474A1 and International Patent Publications W005 / 084190, W005 / 014791 and W003 / 080809.

Dois ZFNs, cada um deles compreendendo um semi-dominio de clivagem, podem ligar-se na região de interesse na mesma polaridade ou na polaridade oposta e os seus locais de ligação (i.e., locais alvo) podem ser separados por qualquer número de nucleótidos, e.g., entre 0 e 50 pares de nucleótidos ou qualquer valor inteiro intermédio. Em determinadas realizações, os locais de ligação para duas proteínas de fusão, cada uma compreendendo um domínio de ligação dedo de zinco e um semi-dominio de clivagem, podem estar separados entre 5 e 18 pares de nucleótidos, por exemplo, 5-8 pares de nucleótidos ou 15-18 pares de nucleótidos ou 6 pares de nucleótidos ou 16 pares de nucleótidos ou dentro de 10 pares de nucleótidos um do outro, medido entre os extremos de cada local de ligação mais perto do outro local de ligação e a clivagem ocorre entre os locais de ligação. O local em que o DNA é cortado, geralmente, situa-se entre os locais de ligação para as duas proteínas de fusão. A quebra da dupla cadeia de DNA frequentemente resulta de dois cortes de cadeia simples ou "nicks", separados por 1, 2, 3, 4, 5, 6 ou mais nucleótidos, (por exemplo, clivagem de DNA de cadeia dupla por Fokl nativo resulta de cortes de cadeia simples separados por 4 nucleótidos). Assim, a clivagem não ocorre necessariamente em locais exactamente opostos em cada cadeia de DNA. Ainda, a estrutura das proteínas de fusão e a distância entre os locais alvo podem influenciar se a clivagem ocorre adjacente a um único par de nucleótidos ou se a clivagem ocorre em vários locais. No entanto, para muitas aplicações, incluindo recombinação dirigida e mutagénese dirigida, a clivagem dentro de uma gama de nucleótidos é geralmente suficiente e a clivagem entre pares de bases particulares não é necessária.Two ZFNs, each comprising a cleavage half-domain, may bind to the region of interest in the same polarity or opposite polarity and their binding sites (ie, target sites) may be separated by any number of nucleotides, eg, between 0 and 50 nucleotide pairs or any intermediate integer value. In certain embodiments, the binding sites for two fusion proteins, each comprising a zinc finger binding domain and a cleavage half domain, may be separated between 5 and 18 nucleotide pairs, for example, 5-8 pairs nucleotides or 15-18 nucleotide pairs or 6 nucleotide pairs or 16 nucleotide pairs or within 10 nucleotide pairs of each other, measured between the ends of each binding site closest to the other binding site and the cleavage occurs between the binding sites. The location where the DNA is cut generally lies between the binding sites for the two fusion proteins. DNA double strand breakage often results from two single-stranded cuts or " nicks ", separated by 1, 2, 3, 4, 5, 6 or more nucleotides, (for example, Fokl double-stranded DNA cleavage native results from single-stranded cuts separated by 4 nucleotides). Thus, cleavage does not necessarily occur at exactly opposite sites in each DNA strand. In addition, the structure of the fusion proteins and the distance between target sites may influence whether cleavage occurs adjacent to a single nucleotide pair or whether cleavage occurs at multiple sites. However, for many applications, including targeted recombination and site-directed mutagenesis, cleavage within a range of nucleotides is generally sufficient and cleavage between particular base pairs is not required.

Como referido atrás, uma ou mais proteínas de fusão podem ser expressas numa célula após a introdução, na célula, de polipéptidos e/ou polinucleótidos. Por exemplo, dois polinucleótidos, cada um compreendendo sequências codificadoras de um dos polipéptidos atrás referidos, podem ser introduzidos numa célula e quando os polipéptidos são expressos e cada um deles se liga à sua sequência alvo, a clivagem ocorre na sequência alvo ou perto dela. Como alternativa, é introduzido numa célula um único polinucleótido compreendendo sequências codificadoras de ambos os polipéptidos de fusão. Os polinucleótidos podem ser DNA, RNA ou quaisquer formas modificadas ou análogos ou DNA e/ou RNA. A clivagem dirigida numa região genómica por um ZFN resulta na alteração da sequência nucleotidica da região, após reparação do evento de clivagem por ligação de extremos não homólogos (NHEJ).As noted above, one or more fusion proteins may be expressed in a cell upon introduction into the cell of polypeptides and / or polynucleotides. For example, two polynucleotides, each comprising sequences encoding one of the aforementioned polypeptides, may be introduced into a cell and when the polypeptides are expressed and each of them binds to its target sequence, cleavage occurs in or near the target sequence. Alternatively, a single polynucleotide comprising sequences encoding both fusion polypeptides is introduced into a cell. The polynucleotides may be DNA, RNA or any modified or analogous forms or DNA and / or RNA. Cleavage directed at a genomic region by a ZFN results in alteration of the nucleotide sequence of the region after repair of the non-homologous linkage cleavage event (NHEJ).

Como alternativa, a clivagem dirigida numa região genómica por um ZFN pode também ser parte de um procedimento em que uma sequência genómica (e.g., uma região de interesse na cromatina celular) é substituída com uma sequência homóloga não idêntica (i.e. através de recombinação dirigida) através de mecanismos dependentes de homologia (e.g., inserção de uma sequência dadora compreendendo uma sequência exógena juntamente com uma ou mais sequências que são idênticas ou homólogas nas não idênticas, com uma sequência genómica pré-determinada (i.e., um local alvo). Devido às quebras de cadeia dupla no DNA celular estimularem mecanismos de reparação celular várias centenas de vezes na vizinhança do local de clivagem, a clivagem dirigida com ZFNs como aqui descrito permite a alteração ou substituição (via reparação dirigida por homologia) de sequências em virtualmente qualquer local no genoma. A substituição dirigida de uma sequência genómica seleccionada requer, para além dos ZFNs aqui descritos, a introdução de um polinucleótido exógeno (dador). 0 polinucleótido dador pode ser introduzido na célula antes, ao mesmo tempo ou após a expressão dos ZFNs. 0 polinucleótido dador possui homologia suficiente para uma sequência genómica suportar recombinação homóloga (ou reparação dirigida por homologia) entre ela e a sequência genómica com a qual possui homologia. Aproximadamente 25, 50 100, 200, 500, 750, 1,000, 1,500, 2,000 nucleótidos ou mais de homologia de sequências (ou qualquer valor inteiro entre 10 e 2000 nucleótidos ou mais) suportará a recombinação homóloga. Os polinucleótidos dadores podem variar de comprimento entre 10 e 5000 nucleótidos (ou qualquer valor inteiro intermédio de nucleótidos) ou mais.Alternatively, cleavage directed into a genomic region by a ZFN may also be part of a procedure in which a genomic sequence (eg, a region of interest in the cellular chromatin) is replaced with a non-identical homologue sequence (ie by directed recombination) (eg, insertion of a donor sequence comprising an exogenous sequence together with one or more sequences which are identical or homologous to the non-identical, with a predetermined genomic sequence (ie, a target site). double-strand breaks in cellular DNA stimulate cellular repair mechanisms several hundred fold in the vicinity of the cleavage site, directed cleavage with ZFNs as described herein allows the alteration or substitution (via homology-directed repair) of sequences at virtually any site in the targeting a selective genomic sequence. In addition to the ZFNs described herein, the introduction of an exogenous (donor) polynucleotide is required. The donor polynucleotide may be introduced into the cell prior to, at the same time or after expression of the ZFNs. The donor polynucleotide has sufficient homology for a genomic sequence to support homologous recombination (or homology-directed repair) between it and the genomic sequence with which it has homology. Approximately 25, 50, 100, 200, 500, 750, 1,000, 1,500, 2,000 nucleotides or more of sequence homology (or any integer value between 10 and 2000 nucleotides or more) will support homologous recombination. The donor polynucleotides may range in length from 10 to 5000 nucleotides (or any intermediate integer value of nucleotides) or more.

Será facilmente aparente que a sequência nucleotidica do polinucleótido dador é tipicamente não idêntica à da sequência genómica que substitui. Por exemplo, a sequência do polinucleótido dador pode conter uma ou mais substituições, inserções, deleções, inversões ou arranjos relativamente à sequência genómica, desde que esteja presente suficiente homologia com as sequências cromossómicas. Tais alterações de sequências podem ser de qualquer tamanho e podem ser inclusivamente um par de nucleótidos. Como alternativa, um polinucleótido dador pode conter uma sequência não homóloga (i.e., uma sequência exógena, devendo-se distinguir de um polinucleótido exógeno) flanqueada por duas regiões de homologia. Ainda, os polinucleótidos dadores podem compreender uma molécula de vector contendo sequências que não são homólogas da região de interesse na cromatina celular. De um modo geral, as regiões homólogas de um polinucleótido dador terão pelo menos 50% de identidade de sequências com uma sequência genómica com a qual se pretende recombinação. Em determinadas realizações, está presente 60%, 70%, 80%, 90%, 95%, 98%, 99% ou 99,9% de identidade de sequências. Qualquer valor entre 1% e 100% de identidade de sequências pode estar presente, dependendo do comprimento do polinucleótido dador.It will readily be apparent that the nucleotide sequence of the donor polynucleotide is typically not identical to that of the genomic sequence it replaces. For example, the sequence of the donor polynucleotide may contain one or more substitutions, insertions, deletions, inversions or arrangements relative to the genomic sequence, provided that sufficient homology to the chromosomal sequences is present. Such sequence alterations may be of any size and may even be a pair of nucleotides. Alternatively, a donor polynucleotide may contain a non-homologous sequence (i.e., an exogenous sequence, to be distinguished from an exogenous polynucleotide) flanked by two regions of homology. In addition, the donor polynucleotides may comprise a vector molecule containing sequences that are not homologous to the region of interest in the cellular chromatin. In general, the homologous regions of a donor polynucleotide will have at least 50% sequence identity to a genomic sequence with which recombination is desired. In certain embodiments, 60%, 70%, 80%, 90%, 95%, 98%, 99% or 99.9% sequence identity is present. Any value between 1% and 100% sequence identity may be present, depending on the length of the donor polynucleotide.

Uma molécula dadora pode conter várias regiões descontínuas de homologia com a cromatina celular. Por exemplo, para a inserção dirigida de sequências que normalmente não estão presentes numa região de interesse, as referidas sequências podem estar presentes numa molécula de ácido nucleico dadora e flanqueadas por regiões de homologia com a sequência na região de interesse.A donor molecule may contain several discontinuous regions of homology with the cellular chromatin. For example, for targeted insertion of sequences not normally present in a region of interest, said sequences may be present in a donor nucleic acid molecule and flanked by regions of homology with the sequence in the region of interest.

Para simplificar os ensaios (e.g., hibridação, PCR, digestão com enzimas de restição) para determinar a inserção bem sucedida de sequências do polinucleótido dador, certas diferenças de sequência podem estar presentes na sequência dadora comparativamente com a sequência genómica. De preferência, se situada numa região codificadora, tais diferenças da sequência nucleotidica não alterarão a sequência de aminoácidos ou farão alterações silenciosas de aminoácidos (i.e., alterações que não afectam a estrutura ou função da proteína). 0 polinu-cleótido dador pode, facultativamente, conter alterações nas sequências correspondentes aos locais de ligação dos domínios dedos de zinco na região de interesse, para prevenir a clivagem das sequências dadoras que foram introduzidas na cromatina celular por recombinação homóloga.To simplify assays (e.g., hybridization, PCR, digestion with restimulating enzymes) to determine the successful insertion of donor polynucleotide sequences, certain sequence differences may be present in the donor sequence as compared to the genomic sequence. Preferably, if located in a coding region, such nucleotide sequence differences will not alter the amino acid sequence or make silent amino acid changes (i.e., changes that do not affect the structure or function of the protein). The donor polynucleotide can optionally contain changes in the sequences corresponding to the zinc finger domain binding sites in the region of interest to prevent cleavage of donor sequences that have been introduced into the cellular chromatin by homologous recombination.

Um polinucleótido pode ser introduzido numa célula como parte de uma molécula vector tendo sequências adicionais tais como, por exemplo, origens de replicação, promotores e genes codificadores de resistência a antibióticos. Ainda, os polinucleótidos dadores podem ser introduzidos como ácido nucleico nu, como ácido nucleico complexado com um agente como seja um lipossoma ou poloxâmero ou podem ser entregues por bactérias ou vírus (e.g. Agrobacterium, Rhizobium sp. NGR234, Sinorhizoboium meliloti, Mesorhizobium loti, vírus do mosaico do tabaco, vírus X da batateira, vírus do mosaico da couve-flor e vírus mosaico das nervuras de mandioca. Ver, e.g., Chung et al. (2006) Trends Plant Sci. 11(1):1-4.A polynucleotide may be introduced into a cell as part of a vector molecule having additional sequences such as, for example, origins of replication, promoters, and genes encoding antibiotic resistance. Furthermore, donor polynucleotides may be introduced as naked nucleic acid, as nucleic acid complexed with an agent such as a liposome or poloxamer, or may be delivered by bacteria or viruses (eg Agrobacterium, Rhizobium sp. NGR234, Sinorhizoboium meliloti, Mesorhizobium loti, virus of tobacco mosaic, potato virus X, cauliflower mosaic virus, and mosaic virus of cassava veins, see, eg, Chung et al. (2006) Trends Plant Sci. 11 (1): 1-4.

Para alteração de uma sequência cromossómica não é necessário que toda a sequência do dador seja copiada para o cromossoma, desde que suficiente sequência dadora seja copiada para efectuar a alteração pretendida da sequência. A eficiência da inserção das sequências dadoras através de recombinação homóloga está inversamente relacionada com a distância, no DNA celular, entre a quebra da cadeia dupla e o local em que se pretende recombinação. Por outras palavras, observam-se eficiências de recombinação homóloga mais elevadas quando a quebra da cadeia dupla está mais perto do local em que se pretende a recombinação. Nos casos em que um local preciso de recombinação não é pré-determinado (e.g., o evento de recombinação pretendido pode ocorrer ao longo de um intervalo de sequência genómica), o comprimento e a sequência do ácido nucleico dador, juntamente com os locais de clivagem, são seleccionados para se obter o evento de recombinação pretendido. Nos casos em que o evento pretendido se destina a alterar a sequência de um único par de nucleótidos numa sequência genómica, a cromatina celular é cortada dentro de 10000 nucleótidos de cada lado do par de nucleótidos. Em determinadas realizações, a clivagem ocorre dentro de 1000, 500, 200, 100, 90, 80, 70, 60, 50, 40, 30, 20, 10, 5 ou 2 nucleótidos ou em qualquer valor inteiro entre 2 e 1000 nucleótidos, de cada lado do par de nucleótidos cuja sequência se pretende alterar. A inserção dirigida de sequências exógenas numa região genómica é conseguida através de clivagem dirigida na região genómica usando ZFNs, juntamente com o fornecimento de um polinucleótido exógeno (dador) contendo as sequências exógenas. O polinucleótido dador, tipicamente, também contém sequências que flanqueiam a sequência exógena, as quais possuem homologia suficiente com a região genómica para suportar a reparação dirigida por homologia da quebra da cadeia dupla na sequência genómica, inserindo assim a sequência exógena na região genómica. Assim, o ácido nucleico dador pode ser de qualquer tamanho suficiente para suportar a integração da sequência exógena através de mecanismos de reparação dependentes de homologia (e.g., recombinação homóloga). Sem pretender estar limitado por qualquer teoria particular, pensa-se que as regiões de homologia flanqueantes da sequência exógena proporcionem aos extremos partidos do cromossoma uma matriz para a nova síntese da informação genética no local de quebra da cadeia dupla. A integração dirigida de sequências exógenas, como descrito atrás, pode ser usada para inserir um gene de uma marca numa localização cromossómica escolhida. Os genes de marcas incluem, mas não lhes estão limitados, sequências codificadoras de proteínas que medeiam a resistência a antibióticos (e.g., resistência à ampicilina, resistência à neomicina, resistência a G418, resistência à puromicina), sequências codificadoras de proteínas coradas ou fluorescentes ou luminescentes (e.g., proteína fluorescente verde, proteína fluorescente verde aumentada, proteína fluorescente vermelha, luciferase) e proteínas que medeiam a estimulação do crescimento celular e/ou amplificação de genes (e.g., redutase do di-hidrofolato). Exemplos de genes de marcas incluem assim, mas não lhes estão limitados, β- glucuronidase (GUS), fosfinotricina N-acetil transferase (PAT, BAR), neomicina fosfotransferase, β-lactamase, catecol-dioxigenase, a-amilase, tirosinase, β-galactosi-dase, luciferase, aequorina, EPSP sintetase, nitrilase, acetolactato sintetase (ALS), di-hidrofolato reductase (DHFR), dalapão desalogenase e antranilato sintetase. Em determinadas realizações, a integração dirigida é usada para inserir uma construção para expressão de RNA, e.g., sequências responsáveis pela expressão regulada de micro-RNA ou si-RNA. Promotores, estimuladores e outras sequências reguladoras da transcrição podem também ser incorporadas numa construção de expressão de RNA.To change a chromosomal sequence, it is not necessary for the entire donor sequence to be copied to the chromosome, so long as sufficient donor sequence is copied to effect the desired sequence change. The efficiency of insertion of the donor sequences through homologous recombination is inversely related to the distance in the cellular DNA between the double strand break and the site where recombination is desired. In other words, higher homologous recombination efficiencies are observed when the double strand break is closer to the site where recombination is desired. In cases where a precise recombination site is not predetermined (eg, the desired recombination event may occur over a range of genomic sequence), the length and sequence of the donor nucleic acid, together with the cleavage sites , are selected to obtain the desired recombination event. In cases where the desired event is to alter the sequence of a single nucleotide pair in a genomic sequence, the cellular chromatin is cleaved within 10,000 nucleotides on each side of the nucleotide pair. In certain embodiments, cleavage occurs within 1000, 500, 200, 100, 90, 80, 70, 60, 50, 40, 30, 20, 10, 5 or 2 nucleotides or any integer between 2 and 1000 nucleotides, on each side of the nucleotide pair whose sequence is to be altered. The targeted insertion of exogenous sequences into a genomic region is achieved by directed cleavage at the genomic region using ZFNs, along with delivery of an exogenous (donor) polynucleotide containing the exogenous sequences. The donor polynucleotide typically also contains sequences flanking the exogenous sequence, which have sufficient homology to the genomic region to support homology-directed repair of the double strand break in the genomic sequence, thereby inserting the exogenous sequence into the genomic region. Thus, the donor nucleic acid may be of any size sufficient to support integration of the exogenous sequence through homology-dependent (e.g., homologous recombination) repair mechanisms. Without wishing to be bound by any particular theory, it is believed that the homology regions flanking the exogenous sequence provide the broken ends of the chromosome with a matrix for the new synthesis of the genetic information at the double-stranded breaking site. The targeted integration of exogenous sequences, as described above, can be used to insert a gene from a tag into a chosen chromosomal location. Trademark genes include, but are not limited to, protein coding sequences that measure resistance to antibiotics (eg, ampicillin resistance, neomycin resistance, G418 resistance, puromycin resistance), coding sequences for stained or fluorescent proteins or (eg, fluorescent green protein, increased green fluorescent protein, red fluorescent protein, luciferase) and proteins that mediate cell growth stimulation and / or gene amplification (eg, dihydrofolate reductase). Examples of such marker genes include, but are not limited to, β-glucuronidase (GUS), phosphinothricin N-acetyl transferase (PAT, BAR), neomycin phosphotransferase, β-lactamase, catechol dioxygenase, α-amylase, tyrosinase, β galactosidase, luciferase, aequorin, EPSP synthase, nitrilase, acetolactate synthetase (ALS), dihydrofolate reductase (DHFR), dalapon dehalogenase and anthranilate synthetase. In certain embodiments, targeted integration is used to insert a construct for RNA expression, e.g., sequences responsible for the regulated expression of micro-RNA or siRNA. Promoters, stimulators and other transcriptional regulatory sequences may also be incorporated into an RNA expression construct.

Outros aumentos na eficiência de recombinação dirigida, em células compreendendo uma molécula de fusão dedo de zinco/nuclease e uma molécula de DNA dador, foram conseguidos através do bloqueio das células na fase G2 do ciclo celular, quando os processos de reparação dirigidos por homologia estão no seu máximo de actividade. Tal paragem pode ser conseguida por uma série de formas. Por exemplo, as células podem ser tratadas com e.g., fármacos, compostos e/ou pequenas moléculas que influenciam a progressão do ciclo celular de forma a parar as células na fase G2 · Exemplos de moléculas deste tipo incluem, mas não lhes estão limitados, compostos que afectam a polimerização de microtúbulos (e.g., vinblastina, nocodazole, Taxol), compostos que interagem com DNA (e.g., cis-platina (II) diamina dicloreto, Cisplatina, doxorrubicina) e/ou compostos que afectam a síntese de DNA (e.g., timidina, hidro- xiureia, L-mimosina, etopósido, 5-fluorouracilo) . Outros aumentos na eficiência de recombinação são conseguidos através do uso de inibidores da histona-desacetilase (HDAC) (e.g., butirato de sódio, tricostatina A) que alteram a estrutura da cromatina para tornar o DNA genómico mais acessível à maquinaria de recombinação celular.Further increases in the efficiency of targeted recombination in cells comprising a zinc finger / nuclease fusion molecule and a donor DNA molecule were achieved by blocking the cells in the G2 phase of the cell cycle when homology-directed repair processes are at its maximum activity. Such a stop can be achieved in a number of ways. For example, cells can be treated with eg, drugs, compounds and / or small molecules that influence cell cycle progression in order to stop cells in the G2 phase. Examples of such molecules include, but are not limited to, compounds (eg, vinblastine, nocodazole, Taxol), compounds that interact with DNA (eg, cis-platinum (II) diamine dichloride, Cisplatin, doxorubicin) and / or compounds that affect DNA synthesis (eg, thymidine, hydroxyurea, L-mimosine, etoposide, 5-fluorouracil). Further increases in recombination efficiency are achieved through the use of histone deacetylase (HDAC) inhibitors (e.g., sodium butyrate, trichostatin A) that alter the chromatin structure to make genomic DNA more accessible to cell recombination machinery.

Outros métodos para paragem do ciclo celular incluem expressão excessiva de proteínas que inibem a actividade das cinases CDK do ciclo celular, por exemplo, através da introdução na célula de um cDNA codificador da proteína ou através da introdução na célula de ZFP que activa a expressão do gene codificador da proteína. A paragem do ciclo celular é igualmente conseguida através da inibição da actividade de ciclinas e CDKs, por exemplo, usando métodos de RNAi (e.g., Patente U.S. 6,534,261 para métodos de síntese de proteínas com dedos de zinco manipulados para regulação da expressão génica.Other methods for stopping the cell cycle include excessive expression of proteins that inhibit the activity of the cell cycle CDK kinases, for example, by introducing into the cell a cDNA encoding the protein or by introducing into the ZFP cell which activates expression of the gene encoding the protein. Cell cycle arrest is also achieved by inhibiting the activity of cyclins and CDKs, for example, using RNAi methods (e.g., U.S. Patent 6,534,261 for methods of synthesizing proteins with manipulated zinc fingers for regulation of gene expression.

Como atrás descrito, os métodos e composições divulgados para clivagem dirigida podem ser usados para induzir mutações numa sequência genómica. A clivagem dirigida pode também ser usada para criar anulações de genes (e.g. para genómica funcional ou validação de alvos) e para facilitar a inserção dirigida de uma sequência num genoma (i.e., activação de genes) . A inserção pode ser através de substituições de sequências cromossómicas através de recombinação homóloga ou através de integração dirigida, em que uma nova sequência (i.e., uma sequência não presente na região de interesse), flanqueada por sequências homólogas da região de interesse no cromossoma, é inserida num alvo pré-determinado. Os mesmos métodos podem ser igualmente usados para substituir uma sequência selvagem com uma sequência mutante, ou para converter um alelo noutro alelo diferente. A clivagem dirigida de agentes patogénicos que infectam ou estão integrados em plantas pode ser usada para tratar infecções patogénicas num hospedeiro vegetal, por exemplo, através do corte do genoma do agente patogénico de modo que a sua patogenicidade seja reduzida ou eliminada. Ainda, a clivagem dirigida de genes codificadores de receptores de virus de plantas pode ser usada para bloquear a expressão de tais receptores, prevenindo assim a infecção virai e/ou a disseminação do virus na planta.As described above, methods and compositions disclosed for targeted cleavage can be used to induce mutations in a genomic sequence. Targeted cleavage may also be used to create gene deletions (e.g. for functional genomics or target validation) and to facilitate targeted insertion of a sequence into a genome (i.e., gene activation). The insertion may be through substitutions of chromosomal sequences by homologous recombination or by directed integration, wherein a novel sequence (ie, a sequence not present in the region of interest), flanked by homologous sequences of the region of interest on the chromosome, is inserted at a predetermined target. The same methods may also be used to replace a wild-type sequence with a mutant sequence, or to convert an allele into a different allele. The targeted cleavage of pathogens that infect or are integrated into plants may be used to treat pathogenic infections in a plant host, for example, by cleaving the genome of the pathogen so that its pathogenicity is reduced or eliminated. In addition, directed cleavage of genes encoding plant virus receptors can be used to block the expression of such receptors, thereby preventing viral infection and / or virus spreading in the plant.

Exemplos de agentes patogénicos de plantas incluem, mas não lhes estão limitados, virus de plantas tais como Alfamoviruses, Alphacryptoviruses, Badnaviruses, Betacryptoviruses, Bigeminiviruses, Bromoviruses, Bymoviru-ses, Capilloviruses, Carlaviruses, Carmoviruses, Caulimovi-ruses, Closteroviruses, Comoviruses, Cucumoviruses, Cytor-habdoviruses, Dianthoviruses, Enamoviruses, Fabaviruses, Fijiviruses, Furoviruses, Hordeiviruses, Hybrigeminiviru-ses, Idaeoviruses, Ilarviruses, Ipomoviruses, Luteoviruses, Machlomoviruses, Macluraviruses, Marafiviruses, Monogemi-niviruses, Nanaviruses, Neuroviruses, Nepoviruses, Nucle-orhabdoviruses, Oryzaviruses, Ourmiaviruses, Phytoreoviru- ses, Potexviruses, Potyviruses, Rymoviruses, RNAs satélites, satelivirus, Sequiviruses, Sobemoviruses, Tenuivi-ruses, Tobamoviruses, Tobraviruses, Tombusviruses, Tospovi-ruses, Trichoviruses, Tymoviruses, Umbraviruses, Varico-saviruses e Waikaviruses; fungos patogénicos tais como fuligens (e.g. Ustilaginales), ferrugens (Uredinales), cravagens (Clavicepts pupurea) e míldios; bolores (Oomycetes) tais como Phytophthora infestans (míldio da batata); bactérias patogénicas tais como Erwinia (e.g., E. herbicola), Pseudomonas (e.g., P. aeruginosa, P. syringae, P. fluorescense e P. put ida), Ralstonia (e.g., R. solana-cearum), Agrobacterium e Xanthomonas; vermes (Nematoda); e Phytomyxea (Polymyxa e Plasmodiophora) .Examples of plant pathogens include, but are not limited to, plant viruses such as Alfamoviruses, Alphacryptoviruses, Badnaviruses, Betacryptoviruses, Bigeminiviruses, Bromoviruses, Bymoviru-ses, Capilloviruses, Carlaviruses, Carmoviruses, Caulimovi-ruses, Closteroviruses, Comoviruses, Cucumoviruses , Cytor-habdoviruses, Dianthoviruses, Enamoviruses, Fabiviruses, Furoviruses, Hordeiviruses, Hybrigeminiviru-ses, Idaeoviruses, Ilarviruses, Ipomoviruses, Luteoviruses, Machlomoviruses, Macluraviruses, Marafiviruses, Monogemi-niviruses, Nanaviruses, Neuroviruses, Nepoviruses, Nucle-orhabdoviruses, Oryzaviruses , Ourmiaviruses, Phytoreoviruses, Potexviruses, Potyviruses, Rymoviruses, satellite RNAs, satelivirus, Sequiviruses, Sobemoviruses, Tenuivi-ruses, Tobamoviruses, Tobraviruses, Tombusviruses, Tospovi-ruses, Trichoviruses, Tymoviruses, Umbraviruses, Varico-saviruses and Waikaviruses; pathogenic fungi such as fuligens (e.g. Ustilaginales), rusts (Uredinales), spikes (Clavicepts pupurea) and downy mildew; molds (Oomycetes) such as Phytophthora infestans (potato mildew); pathogenic bacteria such as Erwinia (e.g., E. herbicola), Pseudomonas (e.g., P. aeruginosa, P. syringae, P. fluorescense and P. put ida), Ralstonia (e.g., R. solana-cearum), Agrobacterium and Xanthomonas; worms (Nematoda); and Phytomyxea (Polymyxa and Plasmodiophora).

Os métodos descritos para recombinação dirigida podem ser usados para substituir qualquer sequência genómica com uma sequência homóloga não idêntica. Por exemplo, uma sequência genómica mutante pode ser substituída pela sua contraparte selvagem, proporcionando assim métodos para o tratamento de doenças de plantas; proporcionando resistência a agentes patogénicos de plantas; aumentando os rendimentos das culturas, etc. De forma semelhante, um alelo de um gene pode ser substituído por um alelo diferente usando os métodos de recombinação dirigida aqui descritos.The disclosed methods for targeted recombination can be used to replace any genomic sequence with a non-identical homologue sequence. For example, a mutant genomic sequence may be substituted for its wild-type counterpart, thus providing methods for the treatment of plant diseases; providing resistance to plant pathogens; increasing yields of crops, etc. Similarly, one allele of a gene may be replaced by a different allele using the directed recombination methods described herein.

Em muitos destes casos, uma região de interesse compreende uma mutação e o polinucleótido dador compreende a correspondente sequência selvagem. De forma semelhante, uma sequência genómica selvagem pode ser substituída por uma sequência mutante, se tal for pretendido. De facto, qualquer patologia dependente de uma sequência genómica particular, de qualquer forma, pode ser corrigida ou aliviada usando os métodos e composições aqui descritos. A clivagem dirigida e a recombinação dirigida podem ser igualmente usadas para alterar sequências não codificadoras (e.g., sequências reguladoras tais como promotores, estimuladores, iniciadores, terminadores, locais de "splicing") para alterar os níveis de expressão de um produto de gene. Tais métodos podem ser usados, por exemplo, para fins terapêuticos, alterações da fisiologia e bioquímicas celulares, genómica funcional e/ou estudos de validação de alvos.In many of these cases, one region of interest comprises a mutation and the donor polynucleotide comprises the corresponding wild sequence. Similarly, a wild-type genomic sequence may be substituted by a mutant sequence if desired. In fact, any pathology dependent on a particular genomic sequence, however, can be corrected or alleviated using the methods and compositions described herein. Targeted cleavage and targeted recombination may also be used to alter noncoding sequences (e.g., regulatory sequences such as promoters, primers, primers, terminators, " splice sites ") to alter the levels of expression of a gene product. Such methods may be used, for example, for therapeutic purposes, changes in cellular physiology and biochemistry, functional genomics and / or target validation studies.

Os métodos e composições aqui descritos podem também ser usados para activação e repressão da expressão de genes usando fusões entre um domínio de ligação dedo de zinco não canónico e um domínio funcional. Tais métodos estão descritos, por exemplo, nas Patentes U.S. 6,534,261; 6,824,978 e 6,933,113 em copropriedade.The methods and compositions described herein can also be used for activation and repression of gene expression using fusions between a non-canonical zinc finger binding domain and a functional domain. Such methods are described, for example, in U.S. Patents 6,534,261; 6,824,978 and 6,933,113 in co-ownership.

Outros métodos de repressão incluem o uso de oligonucleótidos anti-sentido e/ou pequenos RNAs de interferência (siRNA ou RNAi) dirigidos contra a sequência do gene a ser reprimido.Other methods of repression include the use of antisense oligonucleotides and / or small interfering RNAs (siRNA or RNAi) directed against the gene sequence to be repressed.

Como alternativa, uma ou mais fusões entre um domínio de ligação dedo de zinco e uma recombinase (ou fragmento funcional da mesma) podem ser usadas, para além das fusões dedo de zinco-domínio de clivagem ou em vez delas, para facilitar a recombinação dirigida. Ver, por exemplo, a Patente US N° 6,534,261 em copropriedade e Akopian et al. (2003) Proc. Natl. Acad. Sei. USA 100:8688-8691.As an alternative, one or more fusions between a zinc finger binding domain and a recombinase (or functional fragment thereof) may be used, in addition to or instead of the zinc finger-domain cleavage fusions, to facilitate targeted recombination . See, for example, U.S. Patent No. 6,534,261 in co-ownership and Akopian et al. (2003) Proc. Natl. Acad. Know. USA 100: 8688-8691.

Como alternativa, os métodos e composições descritos são usados para proporcionar fusões de domínios de ligação a ZFP com domínios de activação ou repressão da transcrição que requerem dimerização (homodimerização ou heterodimerização) para a sua actividade. Nestes casos, um polipéptido de fusão compreende um domínio de ligação dedo de zinco e um monómero do domínio funcional (e.g., um monómero de um domínio dimérico de activação ou de repressão da transcrição). A ligação de dois desses polipéptidos de fusão a locais alvo, adequadamente situados, permite a dimerização de forma a reconstituir um domínio funcional de activação ou repressão da transcrição.Alternatively, the disclosed methods and compositions are used to provide fusions of ZFP-binding domains with transcriptional activation or repression domains that require dimerization (homodimerization or heterodimerization) for their activity. In such cases, a fusion polypeptide comprises a zinc finger binding domain and a functional domain monomer (e.g., a monomer of a dimeric domain for activation or transcription repression). Binding of two of such fusion polypeptides to suitably situated target sites allows dimerization to reconstitute a functional domain of transcription activation or repression.

EXEMPLOS O presente invento é ainda definido nos Exemplos que se seguem, nos quais todas as partes e percentagens são por peso e os graus são graus Celsius, a menos que outra forma seja estabelecido. Deverá ser entendido que estes exemplos, ainda que indicando determinadas realizações do invento, são dados apenas com fins ilustrativos.EXAMPLES The present invention is further defined in the Examples which follow, in which all parts and percentages are by weight and degrees are degrees Celsius, unless otherwise stated. It will be understood that these examples, while indicating certain embodiments of the invention, are given for illustrative purposes only.

Exemplo 1: Vectores de expressão de ZFNExample 1: ZFN expression vectors

Os vectores de expressão compreendendo as sequências codificadoras de ZFNs com 4 dedos (designadas "5-8" e "5-9") como descritos nos Exemplos 2 e 114 da Publicação de Patente U.S. 2005/0064474 (Ver Exemplo 2 daquele pedido) foram modificados como se segue. Resumidamente, ZFN 5-8 e 5-9 (compreendendo 4 domínios dedo de zinco fundidos com o domínio nuclease da enzima de restrição tipo IIS Fokl (aminoácidos 384-579 da sequência de Wah et al. (1998) Proc. Natl. Acad. ScL USA 95:10564-10569) através de um ligante ZC de quatro aminoácidos) foram modificados para uma estrutura CCHC. Outras modificações (substituições e inserções) foram igualmente feitas aos resíduos entre as estruturas de coordenação de zinco His e Cys C-terminais e/ou C-terminais relativamente à Cys C-terminal relativamente ao dedo 2 e/ou dedo 4.Expression vectors comprising the 4-finger ZFN coding sequences (designated " 5-8 " and " 5-9 ") as described in Examples 2 and 114 of U.S. Patent Publication 2005/0064474 (See Example 2 of that application ) were modified as follows. Briefly, ZFN 5-8 and 5-9 (comprising 4 zinc finger domains fused to the nuclease domain of the Fokl IIS restriction enzyme (amino acids 384-579 of the sequence of Wah et al. (1998) Proc. Natl. ScL USA 95: 10564-10569) through a four amino acid ZC linker) were modified to a CCHC structure. Further modifications (substitutions and insertions) were also made to the residues between the C-terminal and / or C-terminal His and Cys zinc coordination structures relative to the C-terminal Cys relative to the finger 2 and / or finger 4.

Exemplo 2: Correcção de genes de eGFP em linhas celulares repórteres A capacidade de ZFNs compreendendo dedos de zinco CCHC, como aqui descritos, para facilitar a recombinação homóloga foi testada no sistema GFP descrito em Urnov (2005) Nature 435(7042):646-51 e Publicação de Patente U.S. No. 20050064474 (e.g., Exemplos 6-11). Resumidamente, 50 ng de cada ZFN e 500 ng do dador GFP sem promotor (Urnov (2005) Nature) foram transfectados em 500000 células repórter, usando 2 μΐ de Lipofectamine 2000 por amostra, de acordo com o protocolo da Lipofectamine 2000 da Invitrogen.Correlation of eGFP genes in reporter cell lines The ability of ZFNs comprising CCHC zinc fingers as described herein to facilitate homologous recombination was tested in the GFP system described in Urnov (2005) Nature 435 (7042): 646- 51 and U.S. Patent Publication No. 20050064474 (eg, Examples 6-11). Briefly, 50 ng of each ZFN and 500 ng of the no-promoter GFP donor (Urnov (2005) Nature) were transfected into 500,000 reporter cells using 2 μl of Lipofectamine 2000 per sample according to Invitrogen's Lipofectamine 2000 protocol.

Adicinou-se vinblastina 24 horas após transfecção numa concentração final de 0,2 μΜ e foi removida 72 horas após transfecção.Vinblastine was added 24 hours after transfection at a final concentration of 0.2 μΜ and was removed 72 hours after transfection.

As células foram testadas relativamente à expressão de GFP 5 dias após transfecção através da medição de 40000 células por transfecção no analisador FACS de bancada Guava.Cells were tested for GFP expression 5 days post-transfection by measuring 40,000 cells per transfection in the Guava bench-top FACS analyzer.

Como se mostra na Fig. 1, a maioria dos ZFNs compreendendo dedos de zinco alterados CCHC, como mostrado nas Tabelas 1 e 2 atrás, facilita a recombinação homóloga no locus do repórter (GFP), resultando em níveis de expressão de GFP acima dos dedos de zinco CCHC não modificados e vários tiveram um desempenho similar a ZFNs compreendendo dedos de zinco CCHH. A variante com melhor desempenho quando posicionada no dedo 4 (F4) compreendeu a seguinte sequência (incluindo o resíduo de coordenação de zinco His e para além deste no extremo C-terminal): HAQRCGLRGSQLV (SEQ ID NO: 53) (o dedo de zinco n Tabela 2 designado #21 e mostrado na FIG. 1 como "2-21"). A variante com melhor desempenho quando colocada no dedo 2 (F2) compreendia a seguinte sequência (incluindo o resíduo de coordenação de zinco His e para além deste no extremo C-terminal) : HIRTCTGSQKP (SEQ ID NO:75) (o dedo de zinco na Tabela 2 designado #43 e mostrado na Fig. 1 como "2-43") .As shown in Fig. 1, most ZFNs comprising CCHC-modified zinc fingers, as shown in Tables 1 and 2 above, facilitate homologous recombination at the reporter locus (GFP), resulting in levels of GFP expression above the fingers unmodified zinc and several CCHC had similar performance to ZFNs comprising zinc fingers CCHH. The best performing variant when positioned on finger 4 (F4) comprised the following sequence (including the His-zinc coordination residue and in addition at the C-terminus): HAQRCGLRGSQLV (SEQ ID NO: 53) (the zinc finger designated Table 2 # 21 and shown in Figure 1 as " 2-21 "). The best performing variant when placed on finger 2 (F2) comprised the following sequence (including the His-zinc coordination residue and beyond this at the C-terminus): HIRTCTGSQKP (SEQ ID NO: 75) (the zinc finger in designated Table 2 # 43 and shown in Fig. 1 as " 2-43 ").

Exemplo 3: Edição de vim gene IL2Ry cromossómico por recombinação dirigida ZFNs como aqui descritos foram igualmente testados no ensaio de IL2Ry endógena descrito em Urnov (2005) Nature 435(7042):646-51 e no Exemplo 2 do pedido de Patente U.S. No. 20050064474. Resumidamente, duas micro-gramas e meia de cada construção de expressão ZFN foram transfectadas para 500000 células K562 usando umExample 3: Vim chromosomal IL2Rγ gene editing by directed recombination ZFNs as described herein were also tested in the endogenous IL2Ry assay described in Urnov (2005) Nature 435 (7042): 646-51 and in Example 2 of U.S. Patent Application No. 20050064474. Briefly, two and a half micrograms of each ZFN expression construct were transfected into 500,000 K562 cells using a

Nucleofector (Amaxa). O DNA genómico foi colhido e a disrupção de genes foi testada no locus da IL2Ry endógena usando o kit de endonuclease Surveyor.Nucleofector (Amaxa). Genomic DNA was harvested and gene disruption was tested at the endogenous IL2Ry locus using the Surveyor endonuclease kit.

Os ZFNs estão apresentados no canto superior esquerdo da FIG. 2. Em particular, o dedo de zinco alterado 20 refere-se a um dedo de zinco CCHC compreendendo a sequência HAQRCGLRGSQLV (SEQ ID NO:53); o dedo de zinco 43 compreende a sequência HIRTCTGSQKP (SEQ ID NO:75); o dedo de zinco 45 compreende a sequência HERTGCTGSQKP; o dedo de zinco 47 compreende a sequência HIRRCTGSQKP; e o dedo de zinco 48 compreende a sequência HIRRGCTGSQKP. Os dedos de zinco 20 e 21 foram usados no dedo 4 dos ZFNs com 4 dedos e os dedos de zinco 43, 45, 47 e 48 foram usados no dedo de zinco 2 dos ZFNs com 4 dedos.The ZFNs are shown in the upper left corner of FIG. 2. In particular, the altered zinc finger 20 refers to a CCHC zinc finger comprising the sequence HAQRCGLRGSQLV (SEQ ID NO: 53); the zinc finger 43 comprises the sequence HIRTCTGSQKP (SEQ ID NO: 75); the zinc finger 45 comprises the sequence HERTGCTGSQKP; the zinc finger 47 comprises the sequence HIRRCTGSQKP; and the zinc finger 48 comprises the sequence HIRRGCTGSQKP. Zinc fingers 20 and 21 were used on finger 4 of ZFNs with 4 fingers and zinc fingers 43, 45, 47 and 48 were used on zinc finger 2 of ZFNs with 4 fingers.

Os pares de ZFNs testados estão apresentados na Fig. 2 do lado direito por cima do gráfico e na Tabela 5:The pairs of ZFNs tested are shown in Fig. 2 on the right side above the graph and in Table 5:

Tabela 5Table 5

Para determinar se as mutações tinham sido induzidas no local de clivagem, o produto de amplificação foi analisado usando um ensaio Cel-1, em que o produto de amplificação foi desnaturado e renaturado, seguido de tratamento com a nucleasse Cel-1 especifica de desempare-lhamentos. Ver, por exemplo, Oleykowski et al (1998) Nucleic Acids res. 26:4597- 4602; Qui et al. (2004)To determine if the mutations had been induced at the cleavage site, the amplification product was analyzed using a Cel-1 assay, where the amplification product was denatured and renatured, followed by treatment with the specific nucleotide degrading Cel-1, ments. See, for example, Oleykowski et al (1998) Nucleic Acids res. 26: 4597-4602; Qui et al. (2004)

BioTechniques 36:702-707; Yeung et al. (2005) BioTechniques 38 :749-758.BioTechniques 36: 702-707; Yeung et al. (2005) BioTechniques 38: 749-758.

Na Fig. 2 estão apresentados os resultados de duas experiências para cada amostra. A experiência #2 para as amostras #2 e #8 tinha um ruído de fundo nas pistas, o que reduziu a eficácia aparente destes ZFNs.The results of two experiments for each sample are shown in Fig. Experiment # 2 for samples # 2 and # 8 had background noise in the runways, which reduced the apparent efficacy of these ZFNs.

Como se mostra na Fig. 2, algumas variantes CCHC são essencialmente equivalentes a ZFNs selvagens C2H2. 0 dedo de zinco 21 no dedo 4 (amostras 5 e 9) produziu melhores resultados que o dedo de zinco 20 no dedo 4 (amostras 4 e 8). No Dedo 2, o dedo de zinco 43 produziu os melhores resultados.As shown in Fig. 2, some CCHC variants are essentially equivalent to wild ZFNs C2H2. The finger of zinc 21 on finger 4 (samples 5 and 9) produced better results than the finger of zinc 20 on finger 4 (samples 4 and 8). On Finger 2, the zinc finger 43 produced the best results.

Exemplo 4: Correcção de genes de eGFP em linhas celulares repórteresExample 4: Correction of eGFP genes in reporter cell lines

Com base nos resultados mostrados nas Figs. 1 e 2, foram produzidos os dedos de zinco CCHC mostrados nas Tabelas 3 e 4 atrás (designados la a 10a) . Estes dedos de zinco foram produzidos nos ZFNs 5-8 e 5-9 e testados no ensaio GFP de correcção de genes descrito no Exemplo 2 atrás. Os pares de ZFNs testados em cada amostra estão apresentados por baixo de cada barra, em que os números dos dedos de zinco 20, 21, 43, 45, 47 e 48 são os descritos no Exemplo 3 e os dedos de zinco CCHC la a 10a compreendem a sequência mostrada nas Tabelas 3 e 4 atrás. Os dedos de zinco 20, 21, 7a, 8a, 9a e 10a foram usados no Dedo 4; os dedos de zinco 43, 45, 47, 48, la, 2a, 3a, 4a, 5a e 6a foram usados no Dedo 2.Based on the results shown in Figs. 1 and 2, the CCHC zinc fingers shown in Tables 3 and 4 above (designated the 10a) were produced. These zinc fingers were produced in ZFNs 5-8 and 5-9 and tested in the GFP gene correction assay described in Example 2 above. The pairs of ZFNs tested in each sample are shown below each bar, wherein the numbers of the zinc fingers 20, 21, 43, 45, 47 and 48 are as described in Example 3 and the zinc fingers CCHC 1a to 10a comprise the sequence shown in Tables 3 and 4 above. The zinc fingers 20, 21, 7a, 8a, 9a and 10a were used in Finger 4; the zinc fingers 43, 45, 47, 48, 1a, 2a, 3a, 4a, 5a and 6a were used in Finger 2.

Os resultados estão apresentados na Fig. 3. A linha superior atrás de cada barra refere-se ao dedo de zinco incorporado em ZFN 5-8 e a linha inferior dor detrás de cada barra refere-se ao dedo de zinco incorporado em ZFN 5-9. Por exemplo, a 2a barra da esquerda no gráfico da Fig. 3 refere-se a uma amostra transfectada com ZFNs 5-8 e 5-9, em que F4 de ambos os ZFNs compreende a sequência do dedo de zinco 20. Como se mostra, muitos dos ZFNs compreendendo dedos de zinco CCHC tiveram um desempenho comparável com ZFNs selvagens (CCHH).The results are shown in Fig. 3. The upper line behind each bar refers to the zinc finger embedded in ZFN 5-8 and the bottom pain line behind each bar refers to the zinc finger embedded in ZFN 5- 9. For example, the left 2nd bar in the graph of Fig. 3 refers to a sample transfected with ZFNs 5-8 and 5-9, wherein F4 of both ZFNs comprises the sequence of the zinc finger 20. As shown , many of the ZFNs comprising CCHC zinc fingers had comparable performance with wild ZFNs (CCHH).

Exemplo 5: Desenho e geração do vector alvo A. Estrutura global da sequência alvo A construção alvo para o tabaco (uma dicotile-dónea) incluiu os seguintes 7 componentes como se mostra nas Figs. 4 e 5: i) uma cassete de expressão da fosfo-transferase de higromicina (HPT) compreendendo um promotor da ubituitina-3 (ubi-3) de A. thaliana (Callis, et al., 1990, J. Biol. Chem. 265-12486-12493) que dirige o gene HPT de E. coli (Waldron et al., 1985, Plant Moí. Biol. 18:189-200) terminado por uma região não traduzida (UTR) 3' da grelha de leitura aberta 24 de A. tumefaciens (orf-24) (Gelvin et al., 1987, EP222493); ii) sequência-1 homóloga, compreendendo a região de ligação à matriz (MAR) RB7 de N. tabacum) (Thompson et al., 1997, WO9727207); iii) um fragmento 5' do gene da proteína fluorescente verde (GFP) (Evrogen Joint Stock Company, Moscow, Russia) dirigido por um promotor modificado da manopina sintetase de A. tumefaciens (Amas) (Petolino et al., U.S. Patent No. 6,730,824); iv) uma cassete de expressão da β-glucuronidase (GUS) compreendendo um promotor do vírus mosaico das nervuras da mandioca (CsVMV) (Verdaguer et al., 1996, Plant Molecular Biology 31:1129-1139) dirigindo um gene GUS (Jefferson, 1987, Plant Mol. Biol. Rep. 5:387-405) terminado pela 3'UTR da nopalina sintetase (nos) de A. tumefaciens (DePicker et al. , 1982, J. Mol. Appl. Genet. 1:561-573); v) um fragmento 3' do gene GFP (Evrogen Joint Stock Company, Moscow, Russia) terminado por uma 3'UTR da orf-1 de A. tumefaciens (Huang et al., J. Bacteriol. 172:1814-1822); vi) sequência-2 homóloga, compreendendo ο intrão 1 da 4-coumaroil-CoA sintetase (4-CoAS) de A. thaliana (Locus At3g21320, GenBank NC 003074) e; vii) urn fragmento 3' do gene da fosfinotricina fosfotransferase (PAT) de S. viridochromogenes (Wohlleben et al., 1988, Gene 70:25-37) terminado pela 3'UTR da ORF-25/26 de A. tumefaciens (Gelvin et al., 1987, EP222493).Example 5: Design and generation of the target vector A. Overall structure of the target sequence The target construct for tobacco (a dicotyledone) included the following 7 components as shown in Figs. 4 and 5: i) a hygromycin phospho-transferase (HPT) expression cassette comprising an A. thaliana ubiquitin-3 (ubi-3) promoter (Callis, et al., 1990, J. Biol. Chem. 265-12486-12493) which directs the E. coli HPT gene (Waldron et al., 1985, Plant Mo Biol. 18: 189-200) terminated by a 3 'untranslated region (UTR) of the open reading frame 24 from A. tumefaciens (orf-24) (Gelvin et al., 1987, EP 222493); ii) homologous sequence-1, comprising the matrix binding region (MAR) RB7 from N. tabacum) (Thompson et al., 1997, WO9727207); iii) a 5 'fragment of the green fluorescent protein (GFP) gene (Evrogen Joint Stock Company, Moscow, Russia) directed by a modified manupine synthetase promoter from A. tumefaciens (Petmas) (Petolino et al., US Patent No. 6,730,824); and (iv) a β-glucuronidase (GUS) expression cassette comprising a cassava rib mosaic virus (CsVMV) promoter (Verdaguer et al., 1996, Plant Molecular Biology 31: 1129-1139) directing a GUS gene (Jefferson, 1987, Plant Mol. Biol. Rep. 5: 387-405) terminated by the 3'UTR of the nopaline synthase (nos) of A. tumefaciens (DePicker et al., 1982, J. Mol. Appl. Genet. 573); v) a 3 'fragment of the GFP gene (Evrogen Joint Stock Company, Moscow, Russia) terminated by a 3'UTR of orf-1 from A. tumefaciens (Huang et al., J. Bacteriol, 172: 1814-1822); vi) homologous sequence-2, comprising the intron 1 of 4-coumaroyl-CoA synthetase (4-CoAS) from A. thaliana (Locus At3g21320, GenBank NC 003074) and; vii) a 3 'fragment of the S. viridochromogenes phosphinotricin phosphotransferase (PAT) gene (Wohlleben et al., 1988, Gene 70: 25-37) terminated by A. tumefaciens 3'UTR of ORF-25/26 et al., 1987, EP 222493).

Urn local de ligação da proteína de fusão dedo de zinco-Fokl (IL-1-LO-Fokl) (Urnov et al. , 2005, US 2005/0064474) foi inserido a jusante do promotor CsVMV (Verdaguer et al., 1996, Plant Molecular Biology 31:1129-1139) e fundido com a sequência codificadora de GUS (Jefferson, 1987, Plant Mol. Biol. Rep. 5:387-405) no extreme N. Duas cópias de um segundo local de ligação da proteína de fusão dedo de zinco-Fokl (Scd27-L0-Fokl) (Urnov et al., 2005, US 2005/0064474) flanquearam os fragmentos 5' e 3' do gene GFP (Evrogen Joint Stock Company, Moscow, Russia). Cada local de ligação continha quatro repetições em tandem da sequência de reconhecimento da proteína de fusão particular dedo de zinco-Fokl, de forma que cada local de ligação tinha -200 pb de tamanho (Fig. 6A) . Este foi desenhado para assegurar que as sequências de reconhecimento seriam acessíveis à proteína de fusão dedo de zinco-Fokl no ambiente complexo da cromatina. Cada sequência de reconhecimento incluiu uma sequência repetida invertida, a que uma única proteína de fusão dedo de zinco-Fokl se ligou como homodímero e cortou o DNA de cadeia dupla (Fig. 6B). Os fragmentos 5' e 3' do gene GFP sobrepunham-se em 540 pb proporcionando homologia dentro da sequência alvo e um codão de paragem foi inserido no extremo 3' do fragmento 5' de GFP para assegurar tradução não funcional a partir da sequência alvo. O vector de transformação compreendendo a sequência alvo foi gerado através de um processo de clonagem de múltiplos passos como descrito abaixo. B. Construção do vector binário HPT (pDABl584) O vector pDABl400, o qual continha uma cassete de expressão de GUS, compreendendo um promotor de ubi-3 de A. thaliana (Callis, et ai., 1990, J. Biol. Chem. 265-12486-12493) dirigindo o gene GUS (Jefferson, 1987, Plant Mol. Biol. Rep. 5:387-405) terminado pela UTR da orf-1 de A. tumefaciens (Huang et al., J. Bacteriol. 172:1814-1822), foi usado como construção base de partida (Fig. 7).A binding site of zinc-Fokl (IL-1-LO-Fokl) finger fusion protein (Urnov et al., 2005, US 2005/0064474) was inserted downstream of the CsVMV promoter (Verdaguer et al., 1996, Plant Molecular Biology 31: 1129-1139) and fused to the GUS coding sequence (Jefferson, 1987, Plant Mol. Biol. Rep. 5: 387-405) at the N-terminus. Two copies of a second binding site of the Fokl zinc finger (Scd27-L0-Fokl) (Urnov et al., 2005, US 2005/0064474) flanked the 5 'and 3' fragments of the GFP gene (Evrogen Joint Stock Company, Moscow, Russia). Each binding site contained four tandem repeats of the Fokl zinc fingerprint fusion primer, so that each binding site was -200 bp in size (Fig. 6A). This was designed to ensure that the recognition sequences would be accessible to the zinc-Fokl finger fusion protein in the complex chromatin environment. Each recognition sequence included an inverted repeat sequence, to which a single zinc-Fokl finger fusion protein bound as homodimer and cut the double stranded DNA (Fig. 6B). The 5 'and 3' fragments of the GFP gene overlapped at 540 bp providing homology within the target sequence and a stop codon was inserted at the 3 'end of the GFP 5' fragment to ensure non-functional translation from the target sequence. The transformation vector comprising the target sequence was generated by a multi-step cloning process as described below. B. Construction of HPT binary vector (pDABl584) The vector pDABl400, which contained a GUS expression cassette, comprising an A. thaliana ubi-3 promoter (Callis, et al., 1990, J. Biol. Chem. 265-12486-12493) targeting the GUS gene (Jefferson, 1987, Plant Mol. Biol. Rep. 5: 387-405) terminated by A. tumefaciens orf-UTR UTR (Huang et al., J. Bacteriol. : 1814-1822), was used as the starting base construction (Fig. 7).

Para evitar quaisquer elementos reguladores repetidos desnecessários na construção alvo, a UTR da orf-1 de A. tumefaciens (Huang et al., J. Bacteriol. 172:1814-1822) em pDABl400 foi substituída pela UTR da orf-24 de A. tumefaciens (Gelvin et al., 1987, EP222493), a qual foi excisada de pDAB782 (FIG. 8) como um fragmento Sacl/Xbal e clonado nos mesmos locais em pDABl400. A construção resultante continha um promotor ubi-3 de A. thaliana (Callis, et al., 1990, J. Biol. Chem. 265-12486-12493) a dirigir o gene GUS (Jefferson, 1987, Plant Mol. Biol. Rep. 5:387-405) terminado por uma UTR da orf-24 de A. tumefaciens (Gelvin et al., 1987, EP222493) e foi designada PDAB1582 (FIG. 9). A sequência codificadora de HPT (Waldron et al., 1985, Plant Moí. Biol. 18:189-200) foi amplificada por PCR a partir do plasmídeo pDAB354 (FIG. 10) usando as sequências iniciadoras Pi e P2. Um local Bbsl foi adicionado no extreme 5' da sequência iniciadora Pl e o local Saci foi mantido no extreme 3' da sequência iniciadora P2 . O fragmento de PCR HPTII foi digerido com Bbsl/Sacl e clonado em pDABl582 digerido com NcoI-SacI para substituir o gene GUS com o gene HPT do fragmento de PCR. O plasmídeo resultante foi designado pDABl583 (Fig. 11). O fragmento ubi-3 de A. thaliana/HPTA/orf-24 de A. tumefaciens foi então excisado do pDABl583 por digestão com No 11 e tratado com DNA-polimerase de T4 para gerar extremos cegos. A cassete de expressão de HPT dotada de extremos cegos foi clonada em pDAB2407 (Fig. 12), um vector de base binário, no local Pmel resultando no plasmídeo pDABl5 8 4 (Fig. 13) . C. Construção do vector compreendendo as sequências homólogas e o local de ligação da proteína de fusão dedo de zinco Scd27-FokI (pDABl580) A UTR da orf-1 de A. tumefadens (Huang et al., J. Bacteriol. 172:1814-1822) em pDAB2418 (FIG. 14) foi substituída com a UTR da orf25/26 de A. tumefaciens (Gelvin et al. , 1987, EP222493) para evitar sequências reguladoras repetidas no vector alvo. Para fazer a troca da UTR, a UTR da orf25/26 de A. tumefaciens (Gelvin et al., 1987, EP222493) foi amplificada por PCR a partir do plasmídeo pDAB4045 (FIG. 15) usando as sequências iniciadoras P3 e P4. Os locais Smal e Agel foram adicionados ao extremo 3' do fragmento de PCR e o local Saci foi mantido no extremo 5'. 0 DNA do plasmídeo pDAB2418, que continha uma cassete de expressão do gene PAT, compreendendo o promotor da ubiquitina-10 (ubi-10) de A. thaliana (Callis, et al. , 1990, J. Biol. Chem. 265-12486-12493) dirigindo o gene PAT (Wohlleben et al, 1988, Gene 70:25-37) terminado pela UTR da orf-1 de A. tumefaciens (Huang et al., J. Bacteriol. 172:1814-1822) e uma sequência MAR RB7 de N. tabacum (Thompson et al., 1997, WO9727207), foi digerido com Saci e Agel e os dois fragmentos maiores foram recuperados. Estes fragmentos foram ligados ao produto de PCR da UTR da orf25/26 de A. tumefaciens (Gelvin et al., 1987, EP222493) digerido com Saci e Agel. 0 plasmídeo resultante foi designado pDABl575 (Fig. 16). MAR RB7 de N. tabacumTo avoid any unnecessary repeating regulatory elements in the target construct, the orf-1 RTU of A. tumefaciens (Huang et al., J. Bacteriol. 172: 1814-1822) in pDAB140 was replaced by the A. orf-24 UTR. tumefaciens (Gelvin et al., 1987, EP 222493), which was excised from pDAB782 (FIG.8) as a SacI / XbaI fragment and cloned into the same sites in pDAB140. The resulting construct contained an A. thaliana ubi-3 promoter (Callis, et al., 1990, J. Biol. Chem. 265-12486-12493) targeting the GUS gene (Jefferson, 1987, Plant Mol. Biol. Rep 5: 387-405) terminated by an ort-24 UTR of A. tumefaciens (Gelvin et al., 1987, EP222493) and was designated PDAB1582 (FIG.9). The HPT coding sequence (Waldron et al., 1985, Plant Mo Biol. 18: 189-200) was amplified by PCR from plasmid pDAB354 (FIG 10) using primers Pi and P2. A Bbs1 site was added at the 5 'end of the Pl primer sequence and the Saci site was maintained at the 3' end of the P2 primer. The HPTII PCR fragment was digested with Bbs1 / Sac1 and cloned into pDAB1,582 digested with NcoI-SacI to replace the GUS gene with the HPT gene of the PCR fragment. The resulting plasmid was designated pDAB1683 (Fig. 11). The A. thaliana / HPTA / ort-24 fragment of A. tumefaciens was then excised from pDAB1583 by digestion with No11 and treated with T4 DNA polymerase to generate blunt ends. The HPT expression cassette endowed with blunt ends was cloned into pDAB2407 (Fig. 12), a binary base vector, at the Pmel site resulting in the plasmid pDAB145 (Fig. 13). C. Construction of the vector comprising the homologous sequences and the binding site of the Scd27-FokI zinc finger fusion protein (pDABl580) The ort-1 UTR of A. tumefadens (Huang et al., J. Bacteriol., 172: 1814 -1822) in pDAB2418 (FIG.14) was replaced with the A. tumefaciens orf25 / 26 RTU (Gelvin et al., 1987, EP222493) to avoid repeated regulatory sequences in the target vector. To reverse the RTU, the ort25 / 26 RTU of A. tumefaciens (Gelvin et al., 1987, EP222493) was amplified by PCR from plasmid pDAB4045 (FIG 15) using primers P3 and P4. The Smal and Agel sites were added to the 3 'end of the PCR fragment and the Saci site was maintained at the 5' end. Plasmid pDAB2418 DNA, which contained a PAT gene expression cassette, comprising the ubiquitin-10 (ubi-10) promoter of A. thaliana (Callis, et al., 1990, J. Biol. Chem. 265-12486 -12493) by targeting the PAT gene (Wohlleben et al, 1988, Gene 70: 25-37) terminated by A. tumefaciens orf-UTR UTR (Huang et al., J. Bacteriol. 172: 1814-1822) and a MAR sequence RB7 from N. tabacum (Thompson et al., 1997, WO9727207), was digested with Saci and Agel and the two larger fragments were recovered. These fragments were ligated to the PCR product of the orf25 / 26 UTR of A. tumefaciens (Gelvin et al., 1987, EP222493) digested with Saci and Agel. The resulting plasmid was designated pDAB175 (Fig. 16). MAR RB7 of N. tabacum

Thompson et al., 1997, WO9727207) serviu como sequência homóloga 1 no vector alvo. 0 intrão 1 de 4-CoAS de Ά. thaliana (Locus At3g21320, GenBank NC 003074) foi seleccionado para servir como sequência homóloga 2 no vector alvo. A sequência codificadora do gene PAT (Wohlleben et al., 1988, Gene 70:25-37) foi analisada e 299/300 pb a jusante do codão de iniciação foi identificado como o local de inserção do intrão, de modo que os locais de "splicing" 5' e 3' adequados pudessem ser formados. O intrão de tamanho completo foi então fundido com 253 pb da sequência codificadora parcial 3' de PAT através da síntese de DNA (Picoscript Ltd., LLP, Houston, Texas). Os locais Notl e Saci foram adicionados aos extremos 5' e 3' do fragmento de DNA, respectivamente. O fragmento de DNA sintetizado foi então digerido com NotI/SacI e inserido em pDABl575 nos mesmos locais para substituir a sequência codificadora de PAT de tamanho completo. A construção resultante foi designada pDABl577 (Fig. 17).Thompson et al., 1997, WO9727207) served as homologous sequence 1 in the target vector. The 4-CoAS intron 1 of Ά. thaliana (Locus At3g21320, GenBank NC 003074) was selected to serve as homologous sequence 2 in the target vector. The coding sequence of the PAT gene (Wohlleben et al., 1988, Gene 70: 25-37) was analyzed and 299/300 bp downstream of the start codon was identified as the site of insertion of the intron, so that the sites of " splicing " 5 'and 3' could be formed. The full-length intron was then fused with 253 bp of the 3 'partial coding sequence of PAT through DNA synthesis (Picoscript Ltd., LLP, Houston, Texas). The NotI and Saci sites were added to the 5 'and 3' ends of the DNA fragment, respectively. The synthesized DNA fragment was then digested with NotI / SacI and inserted into pDAB175 at the same sites to replace the full-length PAT coding sequence. The resulting construct was designated pDAB1577 (Fig. 17).

Um fragmento de DNA de 241 pb contendo 4 repetições em tandem de locais de reconhecimento Scd27-L0-Fokl (Fig. 6) foi sintetizado (Picoscript Ltd., LLP, Houston, Texas) com um local Smal adicionado a ambos os extremos 5' e 3' do fragmento. O fragmento sintetizado contendo o local de ligação dedo de zinco-Fokl foi então digerido com Smal e inserido em pDABl577 no local MscI. 0 vector resultante foi designado pDABl579 (Fig. 18). Um segundo fragmento contendo o local de ligação dedo de zinco-Fokl digerido com Smal foi então inserido em pDABl579 no local SwaI. A construção resultante foi designada pDABl580 (Fig. 19). Este vector possui sequências homólogas 1 e 2 (RB7 MAR de N. tabacum e o intrão 1 de 4-CoAS de A. thaliana, respectivamente) e dois locais sintetizados de ligação a dedo de zinco Scd27-L0-Fokl, cada um deles contendo 4 repetições em tandem dos locais de reconhecimento Scd27-L0-Fokl. D. Construção do vector contendo dois fragmentos de GFP não funcional parcialmente duplicados (pDABl572) 0 gene GFP, CopGFP, foi adquirido a Evrogen Joint Stock Company (Moscow, Russia) e a sequência codificadora de tamanho complete foi amplificada por PCR usando as sequências iniciadoras P5 e P6. Os locais Bbsl e Saci foram adicionados aos extremos 5' e 3' do produto de PCR, respectivamente. 0 produto de PCR CopGFP foi então digerido com Bbsl/Sacl e clonado em pDAB3401 (Fig. 20) compreendendo o promotor Amas modificado de A. tumefaciens (Petolino et al., US6730824) dirigindo o gene GUS (Jefferson, 1987, Plant Mol. Biol. Rep. 5:387-405) e terminado pela UTR 3' da orf-1 de A. tumifaciens (Huang et al., J. Bacteriol. 172:1814-1822) nos locais Ncol/SacI para substituir o gene GUS. 0 vector resultante foi designado pDABl570 (Fig. 21) .A 241 bp DNA fragment containing 4 tandem repeats from Scd27-L0-Fokl recognition sites (Fig. 6) was synthesized (Picoscript Ltd., LLP, Houston, Texas) with a Smal site added at both 5 ' and 3 'of the fragment. The synthesized fragment containing the zinc-Fok1 finger binding site was then digested with SmaI and inserted into pDAB1577 at the MscI site. The resulting vector was designated pDAB1579 (Fig. 18). A second fragment containing the SmaI-digested zinc-Fokl finger binding site was then inserted into pDAB1579 at the SwaI site. The resulting construct was designated pDABl580 (Fig. 19). This vector has homologous sequences 1 and 2 (RB7 MAR from N. tabacum and intron 1 from A. thaliana 4-CoAS, respectively) and two Scd27-L0-Fokl zinc finger binding sites each containing 4 tandem repeats of the Scd27-L0-Fokl recognition sites. D. Construction of the vector containing two partially duplicated non-functional GFP fragments (pDAB1772) The GFP gene, CopGFP, was purchased from Evrogen Joint Stock Company (Moscow, Russia) and the full-length coding sequence was amplified by PCR using primers P5 and P6. The Bbs1 and Saci sites were added to the 5 'and 3' ends of the PCR product, respectively. The PCR product CopGFP was then digested with BbsI / SacI and cloned into pDAB3401 (Fig. 20) comprising the modified A. tumefaciens Amomas promoter (Petolino et al., US6730824) directing the GUS gene (Jefferson, 1987, Plant Mol. Biol. Rep. 5: 387-405) and terminated by the 3 'UTR of orf-1 from A. tumifaciens (Huang et al., J. Bacteriol. 172: 1814-1822) at the Ncol / SacI sites to replace the GUS gene . The resulting vector was designated pDAB170 (Fig. 21).

Para fazer os dois fragmentos de GFP não funcionais parcialmente duplicados, um fragmento de DNA contendo a maioria da sequência codificadora de CopGFP com uma deleção de 47 pb no extremo 5' foi amplificado por PCR usando as sequências iniciadoras P9 e PIO. Um local Apal foi adicionado a ambos os extremos 5' e 3' e um local StuI adicional foi adicionado ao extremo 5' a jusante do local Apal. 0 produto de PCR foi então digerido com Apal e inserido em pDABl570 no local Apal, criando assim dois fragmentos GFP não funcionais no mesmo vector com uma sequência duplicada de 540 pb. A construção resultante foi designada pDABl572 (Fig. 22). E. Construção do vector contendo a fusão local de ligação à proteína de fusão dedo de zinco IL-l-FokI/gene GUS (PDAB1573)To make the two partially duplicated nonfunctional GFP fragments, a DNA fragment containing the majority of the coding sequence of CopGFP with a 47 bp deletion at the 5 'end was amplified by PCR using the P9 and P10 primers. An Apal site was added to both the 5 'and 3' ends and an additional StuI site was added to the 5 'end downstream of the Apal site. The PCR product was then digested with Apal and inserted into pDAB170 at the Apal site, thereby creating two non-functional GFP fragments in the same vector with a duplicate sequence of 540 bp. The resulting construct was designated pDAB1772 (Fig. 22). E. Construction of the IL-1-FokI / GUS gene (PDAB1573) fusion finger binding site fusion fusion vector

Um fragmento de DNA de 233 pb contendo 4 repetições em tandem do local de reconhecimento ILl_L0-FokI (Fig. 6) foi sintetizado por Picoscript Ltd., LLP, (Houston, Texas) com locais Ncol e AflIII adicionados aos extremos 5' e 3', respectivamente. O fragmento sintetizado foi então digerido com NcoI/AflIII e inserido em pDAB4003 (Fig. 23), o qual continha um gene GUS (Jefferson, 1987, Plant Mol. Biol. Rep. 5:387-405) dirigido por um promotor CsVMV (Verdaguer et al., 1996, Plant Molecular Biology 31:1129-1139) terminado pela UTR 3' da orf-1 de A. tumefaciens (Huang et al., J. Bacteriol. 172:1814-1822) num local Ncol. Uma fusão N-terminal entre o local de ligação de IL-1_LO-Fokl e a sequência codificadora de GUS foi então gerado. 0 vector resultante foi designado pDABl571 (Fig. 24) .A 233 bp DNA fragment containing 4 replicates in tandem from the ILl_L0-FokI recognition site (Fig. 6) was synthesized by Picoscript Ltd., LLP, (Houston, Texas) with Ncol and AflIII sites added to the 5 'and 3' ends ', respectively. The synthesized fragment was then digested with NcoI / AflIII and inserted into pDAB4003 (Fig. 23), which contained a GUS gene (Jefferson, 1987, Plant Mol. Biol. Rep. 5: 387-405) directed by a CsVMV promoter ( Verdaguer et al., 1996, Plant Molecular Biology 31: 1129-1139) terminated by the 3 'UTR of orf-1 from A. tumefaciens (Huang et al., J. Bacteriol., 172: 1814-1822) at an Ncol site. An N-terminal fusion between the IL-1_LO-Fokl binding site and the GUS coding sequence was then generated. The resulting vector was designated pDAB1771 (Fig. 24).

Para evitar repetir os elementos da UTR 3' no vector alvo, a UTR 3' de A. tumefaciens (DePicker et al., 1982, J. Mol . Appl. Genet. 1:561-573) foi removida de pDAB7204 (FIG. 25) como um fragmento Sacl/Pmel e clonada em pDABl571, que foi digerido com Sacl/Nael, para substituir a UTR 3' da orf-1 de A. tumefaciens (Huang et al., J. Bacteriol. 172:1814-1822). 0 plasmideo resultante foi designado pDABl 573 (FIG. 26) . F. Construção do vector alvo final (pDABl585)To avoid repeating elements of the 3 'UTR in the target vector, the 3' UTR of A. tumefaciens (DePicker et al., 1982, J. Mol. Appl. Genet. 1: 561-573) was removed from pDAB7204 (FIG. 25) as a SacI / Pmel fragment and cloned into pDAB1771 which was digested with SacI / Nael to replace the 3 'UTR of A. tumefaciens orf-1 (Huang et al., J. Bacteriol, 172: 1814-1822 ). The resulting plasmid was designated pDAB1773 (FIG 26). F. Construction of the final target vector (pDAB1585)

Para fazer um vector alvo final, a cassete de expressão de GUS com a inserção do local alvo da proteína de fusão IL-l-Fokl foi removida de pDABl573 por digestão com NotI, dotada de extremos cegos e inserida em pDABl572 no local StuI. 0 vector intermediário resultante foi designado pDABl574 (Fig. 27) . Toda a cassete contendo o promotor Amas modificado (Petolino et al., US6730824), uma sequência GFP 5' parcialmente duplicada (Evrogen Joint Stock Company, Moscow, Russia), o promotor CsVMV (Verdaguer et al., 1996, Plant Molecular Biology 31 :1129-1139), uma sequência alvo da proteína de fusão IL-l-Fokl, a região codificadora do gene GUS (Jefferson, 1987, Plant Mol. Biol. Rep. 5:387-405), uma UTR 3' nos de A tumefaciens (DePicker et al., 1982, J. Mol. Appl. Genet. 1 :561- 573), uma GFP 3' parcialmente duplicada (Evrogen Joint Stock Company, Moscow, Russia) e a UTR 3' da orf-1 de A. tumefaciens (Huang et al., J. Bacteriol. 172:1814-1822) foi removida de pDABl574 e inserida em pDABl580 no local Notl. 0 plasmideo resultante foi designado pDABl581 (Fig. 28) . 0 fragmento Agel de pDAB foi então inserido em pDABl584 no local Agel criando assim a construção alvo final, pDABl585 (Figs. 4 e 5) .To make a final target vector, the GUS expression cassette with the insertion of the target site of the IL-1-Fok1 fusion protein was removed from pDAB1773 by NotI digestion, endowed with blunt ends and inserted into pDAB1772 at the StuI site. The resulting intermediate vector was designated pDAB1574 (Fig. 27). The entire cassette containing the modified Amas promoter (Petolino et al., US6730824), a partially duplicated GFP sequence (Evrogen Joint Stock Company, Moscow, Russia), the CsVMV promoter (Verdaguer et al., 1996, Plant Molecular Biology 31 : 1129-1139), a target sequence of the IL-1-Fokl fusion protein, the coding region of the GUS gene (Jefferson, 1987, Plant Mol. Biol. Rep. 5: 387-405), a 3 'UTR A tumefaciens (DePicker et al., 1982, J. Mol. Appl. Genet. 1: 561- 573), a partially duplicated 3 'GFP (Evrogen Joint Stock Company, Moscow, Russia) and the 3' UTR of orf-1 of A. tumefaciens (Huang et al., J. Bacteriol. 172: 1814-1822) was removed from pDAB1754 and inserted into pDAB150 at the NotI site. The resulting plasmid was designated pDAB1681 (Fig. 28). The Agel fragment of pDAB was then inserted into pDAB1584 at the Agel site thus creating the final target construct, pDAB1585 (Figures 4 and 5).

Exemplo 6. Geração de linhas celulares transgé-nicas com sequências alvo integradasExample 6. Generation of transgeneic cell lines with integrated target sequences

Usou-se uma cultura em suspensão de células de tabaco, referida como BY2, na qual as sequências alvo do exemplo 5 foram estavelmente integradas através da transformação de Agrobacterium. A linha celular de base, BY2, foi adquirida a Jun Ueki of Japan Tobacco, Iwata, Shizuoka, Japan. Esta cultura prolifera como células com um diâmetro de 5-10 μ, em aglomerados de 100-150 células, com um tempo de duplicação de aproximadamente 18 horas. As culturas em suspensão das células BY2 foram mantidas em meio contendo sais basais LS (PhytoTechnology Labs L689), 170 mg/1 KH2PO4, 30 g/1 de sucrose, 0,2 mg/1 de 2,4-D e 0,6 mg/L tiamina-HCl a um pH de 6,0. As células BY2 foram subcultivadas cada 7 dias através da adição de 50 ml de meio baseado em LS a 0,25 ml PCV. A cultura em suspensão de células BY2 foi mantida em frascos de 250 ml num agitador orbital a 25°C e 125 rpm. De forma a gerar uma cultura de células BY2 transgénica com sequências alvo integradas, um frasco de uma subcultura em suspensão de tabaco com quatro dias foi dividido em 10-12 aliquotas de quatro ml, que foram subcultivadas em placas de Petri de 100x25 mm com 100 μΐ de Agrobacterium estirpe LBA4404 portadora de pDABl585 crescidas durante a noite até uma DCPoo ~1,5. As placas foram envolvidas em parafilme e incubadas as 25°C com agitação durante 3 dias, após o que o liquido em excesso foi removido e substituído com 11 ml de meio basal baseado em LS contendo 500 mg/1 de carbenicilina.A suspension culture of tobacco cells, referred to as BY2, was used in which the target sequences of Example 5 were stably integrated through the transformation of Agrobacterium. The base cell line, BY2, was purchased from Jun Ueki of Japan Tobacco, Iwata, Shizuoka, Japan. This culture proliferates as cells with a diameter of 5-10 μ in clusters of 100-150 cells, with a doubling time of approximately 18 hours. Suspension cultures of BY2 cells were maintained in medium containing LS basal salts (PhytoTechnology Labs L689), 170 mg / 1 KH2 PO4, 30 g / l sucrose, 0.2 mg / l 2,4-D and 0,6 mg / L thiamine-HCl at a pH of 6.0. BY2 cells were subcultured every 7 days by the addition of 50 ml of LS-based medium to 0.25 ml PCV. Suspension culture of BY2 cells was maintained in 250 ml flasks on an orbital shaker at 25øC and 125 rpm. In order to generate a transgenic BY2 cell culture with integrated target sequences, a vial of a four day tobacco suspension subculture was divided into 10-12 aliquots of four ml, which were subcultured into 100x25 mm Petri dishes with 100 μg of Agrobacterium strain LBA4404 harboring pDAB1585 grown overnight to a DCPoo ~ 1.5. The plates were wrapped in parafilm and incubated at 25øC with shaking for 3 days, after which the excess liquid was removed and replaced with 11 ml of LS-based basal medium containing 500 mg / l of carbenicillin.

Após ressuspensão das células do tabaco, 1 ml de suspensão foi distribuído por placas de 100x25 mm com meio de base adequado contendo 500 mg/ml de carbenicilina e 200 mg/1 de higromicina solidificada com 8 g/1 de agar TC e incubadas não embrulhadas a 28°C no escuro. Isto resultou em 120-144 placas de selecção para um único tratamento. Os isolados individuais resistentes à higromicina surgiram 10-14 dias após sementeira e foram transferidos para placas individuais de 60x20 mm (um isolado por placa) onde foram mantidos como calos num protocolo de subcultura de 14 dias até necessários para análise e subsequentes experiências de retransformação.After resuspension of the tobacco cells, 1 ml of suspension was distributed into 100x25 mm plates with suitable base medium containing 500 mg / ml carbenicillin and 200 mg / l hygromycin solidified with 8 g / l TC agar and incubated un-wrapped at 28 ° C in the dark. This resulted in 120-144 selection plates for a single treatment. Individual hygromycin-resistant isolates appeared 10-14 days after seeding and were transferred to individual 60x20 mm plates (one isolate per dish) where they were maintained as callus in a 14-day subculture protocol required for analysis and subsequent retransformation experiments.

Exemplo 7: Rastreio e caracterização de eventos transgénicos alvoExample 7: Screening and characterization of transgenic target events

Os eventos transgénicos resistentes à higromicina gerados a partir da transformação do vector alvo em culturas celulares de tabaco BY2, como descrito no Exemplo 6, foram analisados como se segue.The hygromycin resistant transgenic events generated from transformation of the target vector into BY2 tobacco cell cultures as described in Example 6 were analyzed as follows.

As análises iniciais conduzidas para rastreio destes eventos transgénicos incluíram a análise da expressão de GUS para indicar a acessibilidade da sequência alvo, a análise por PCR da sequência alvo parcial e completa para confirmar a presença e integridade do vector alvo e a análise de transferências Southern para determinar o número de cópias da sequência alvo integrada. Uma sub-série de eventos transgénicos que mostrou a expressão de GUS continha apenas uma cópia da sequência alvo completa; estes foram seleccionados para restabelecimento das culturas em suspensão para gerar as linhas alvo para subsequente retransformação. Estas linhas alvo restabelecidas foram sujeitas a posterior caracterização, que incluiu uma análise de transferências Southern mais exaustiva, sequenciação para confirmação da integridade do inserto alvo e análise da sequência genómica flanqueante. 0 tecido de calo ou culturas em suspensão de tabaco transgénico, iniciadas a partir dos eventos seleccionados, foram analisados relativamente à actividade GUS através da incubação de amostras de 50 mg em 150 μΐ de tampão de ensaio durante 24-48 horas a 37°C. O tampão de ensaio consistiu em fosfato de sódio 0,2M pH 8,0, ferricianeto de potássio e ferrocianeto de potássio 0,1 mM de cada, EDTA sódico 1,0 mM, 0,5 mg/ml de 5-bromo-4-cloro-3-indolil-p-glucuroneto e 0,6% (v/v) Triton X-100 (Jefferson, 1987, Plant Mol. Biol. Rep. 5:387-405). 0 aparecimento de regiões coradas de azul foi usado como indicador da expressão do gene GUS, o que indicou que a inserção da sequência alvo estava transcricionalmente activa e assim acessível no ambiente genómico local.Initial analyzes conducted for screening for these transgenic events included analysis of GUS expression to indicate accessibility of the target sequence, PCR analysis of the partial and complete target sequence to confirm the presence and integrity of the target vector and analysis of Southern blots for determine the number of copies of the integrated target sequence. A subset of transgenic events showing the GUS expression contained only one copy of the complete target sequence; these were selected for restoration of the suspension cultures to generate the target lines for subsequent retransformation. These re-established target lines were subjected to further characterization, which included more thorough Southern blot analysis, sequencing for confirmation of target insert integrity, and flanking genomic sequence analysis. Callus tissue or transgenic tobacco suspension cultures, initiated from the selected events, were analyzed for GUS activity by incubating 50 mg samples in 150 μl of assay buffer for 24-48 hours at 37 ° C. The assay buffer consisted of 0.2M sodium phosphate pH 8.0, potassium ferricyanide and 0.1 mM potassium ferrocyanide, 1.0 mM EDTA sodium, 0.5 mg / ml 5-bromo-4 3-indolyl-β-glucuronide and 0.6% (v / v) Triton X-100 (Jefferson, 1987, Plant Mol. Biol. Rep. 5: 387-405). The appearance of stained blue regions was used as an indicator of GUS gene expression, which indicated that the insertion of the target sequence was transcriptionally active and thus accessible in the local genomic environment.

Os eventos transgénicos expressando GUS foram testados por PCR usando o par de sequências iniciadoras P15/P16 que conduziu à amplificação de um fragmento de DNA de 10 kb estendendo-se entre a UTR 3' da cassete de expressão de HTP no extremo 5' da sequência alvo e a UTR 3' da cassete do gene PAT parcial no extremo 3' da sequência alvo. Uma vez que todos os eventos foram obtidos sob selecção com higromicina, assumiu-se que a cassete de expressão de HPT estava intacta em todos os eventos alvo. Assim, apenas a UTR 3' da cassete de expressão de HPT foi coberta a análise de PCR de tamanho completo. Uma subsérie de eventos foram igualmente testados por PCR usando os pares de sequências iniciadoras P15/P17 e P18/P19 para determinar a integridade dos extremos 5' e 3' da sequência alvo, respectivamente. Todos os eventos alvo confirmados por análise de PCR foram ainda testados por análise de transferências Southern para determinar o número de cópias da sequência alvo integrada. A análise de transferências Southern foi realizada para todos os eventos alvo que passaram o rastreio da expressão de GUS e PCR de tamanho completo. Dez yg de DNA genómico foi digerido com Nsil, a qual cortava apenas uma vez dentro da sequência alvo. O DNA genómico digerido foi separado num gel de 0,8% de agarose e transferido para uma membrana de nylon. Após ligação, o DNA transferido presente na membrana foi hibridado com uma sonda do gene HPT para determinar o número de cópias do extremo 5' da sequência alvo. A mesma membrana foi então sujeita a remoção do material hibridado e re-hibridada com uma sonda do gene PAT para determinar o número de cópias do extremo 3' da sequência alvo. Múltiplos eventos que mostraram a expressão de GUS e continham uma única cópia da sequência alvo de tamanho completo foram seleccionados para posterior caracterização, o que incluiu uma análise mais exaustiva de transferências Southern, confirmação da integridade da sequência alvo e análise das sequências genómicas flan-queantes. Um evento, referido como BY2-380, foi selec-cionado com base na caracterização molecular. A cultura em suspensão foi restabelecida a partir deste evento para subsequente retransformação com vectores compreendendo DNA dador e genes das proteínas de fusão com dedos de zinco não C2H2-Fokl.The transgenic events expressing GUS were tested by PCR using the primer pair P15 / P16 which led to the amplification of a 10 kb DNA fragment extending between the 3 'UTR of the HTP expression cassette at the 5' end of the sequence and the 3 'UTR of the partial PAT gene cassette at the 3' end of the target sequence. Since all events were obtained under hygromycin selection, it was assumed that the HPT expression cassette was intact at all target events. Thus, only the 3 'UTR of the HPT expression cassette was covered by full-length PCR analysis. A subset of events were also tested by PCR using the primer pairs P15 / P17 and P18 / P19 to determine the integrity of the 5 'and 3' ends of the target sequence, respectively. All target events confirmed by PCR analysis were further tested by Southern blot analysis to determine the number of copies of the integrated target sequence. Southern blot analysis was performed for all target events that underwent full-length GUS expression and PCR screening. Ten æg of genomic DNA was digested with Nsil, which cut only once within the target sequence. The digested genomic DNA was separated on a 0.8% agarose gel and transferred to a nylon membrane. After ligation, the transferred DNA present on the membrane was hybridized with an HPT gene probe to determine the number of copies of the 5 'end of the target sequence. The same membrane was then subjected to removal of the hybridized material and re-hybridized with a PAT gene probe to determine the number of copies of the 3 'end of the target sequence. Multiple events that showed GUS expression and contained a single copy of the full-length target sequence were selected for further characterization, which included a more thorough analysis of Southern blots, confirmation of the integrity of the target sequence and analysis of the flanking genomic sequences . One event, referred to as BY2-380, was selected based on molecular characterization. The suspension culture was re-established from this event for subsequent retransformation with vectors comprising donor DNA and non-C2H2-Fok1 zinc finger fusion protein genes.

Para assegurar que a cultura em suspensão estabelecida a partir do evento alvo BY2-380 continha a sequência alvo intacta como esperado, a maioria da sequência alvo desde a UTR 3' da cassete de expressão HPT no extremo 5' da sequência alvo até à UTR 3' da cassete do gene PAT parcial no extremo 3' da sequência alvo foi amplificada por PCR usando o par de sequências iniciadoras P15/P16 e clonada no vector pCR2.1 TOPO (Invitrogen,To ensure that the suspension culture established from the target event BY2-380 contained the target sequence intact as expected, most of the target sequence from the 3 'UTR of the HPT expression cassette at the 5' end of the target sequence to the UTR 3 of the partial PAT gene cassette at the 3 'end of the target sequence was amplified by PCR using the primer pair P15 / P16 and cloned into the pCR2.1 TOPO vector (Invitrogen,

Carlsbad, California) . Os produtos de PCR inseridos no vector TOPO foram sequenciados pela Lark technology, Inc. (Houston, Texas). Os resultados de sequenciação indicaram que BY2-380 possuía as sequências alvo completas como esperado. A linha celular BY2-380 foi ainda analisada para se obter as sequências genómicas flanqueantes usando o kit Universal GenomeWalker (Clontech, Mountain View, California) . Resumidamente, 2,5 yg de DNA genómico foi digerido com enzimas de restrição geradoras de extremos cegos, EcoRV, Dral e StuI, em reacções separadas. 0 DNA digerido foi purificado através de extracção com fenol/clorofórmio e ligado ao adaptador BD GenomeWalker. A amplificação por PCR de duas reacções sucessivas foi realizada tendo a ligação como matriz e as sequências iniciadoras P20 (andamento a montante do extremo 5' do local de inserção da sequência alvo) e P21 (andamento a jusante do extremo 3' do local de inserção da sequência alvo) para a primeira reacção de PCR e as sequências iniciadoras P22 (andamento a montante do extremo 5' do local de inserção da sequência alvo) e P23 (andamento a jusante do extremo 3' do local de inserção da sequência alvo) para a segunda reacção de PCR. Os fragmentos amplificados a partir das segundas reacções de PCR foram clonados em pCR2.1 TOPO ou no vector pCR Blunt II TOPO (Invitrogen, Carlsbad, California) e sequenciados usando um kit de sequenciação Dye Terminator Cycle Sequencing Kit (Beckman Coulter, Fullerton, CA) . As sequências genómicas flanqueantes foram obtidas a partir da linha alvo BY2-380 através deste processo. As sequências iniciadoras foram projectadas com base nas sequências genómicas flanqueantes e usadas para amplificar toda a sequência alvo.Carlsbad, California). The PCR products inserted into the TOPO vector were sequenced by Lark technology, Inc. (Houston, Texas). Sequencing results indicated that BY2-380 had the complete target sequences as expected. The BY2-380 cell line was further analyzed to provide the flanking genomic sequences using the Universal Genome Walker kit (Clontech, Mountain View, California). Briefly, 2.5 .mu.g of genomic DNA was digested with restriction endpoint generating enzymes, EcoRV, Dral and StuI, in separate reactions. The digested DNA was purified by phenol / chloroform extraction and ligated to the Genome Walker BD adapter. PCR amplification of two successive reactions was performed with the template binding and primer sequences P20 (upstream of the 5 'end of the target sequence insertion site) and P21 (progression downstream of the 3' end of the insertion site ) for the first PCR reaction and primers P22 (upstream of the 5 'end of the target sequence insertion site) and P23 (upstream of the 3' end of the target sequence insertion site) to the second PCR reaction. Fragments amplified from the second PCR reactions were cloned into pCR2.1 TOPO or the pCR Blunt II TOPO vector (Invitrogen, Carlsbad, California) and sequenced using a Dye Terminator Cycle Sequencing Kit (Beckman Coulter, Fullerton, CA ). The flanking genomic sequences were obtained from the target line BY2-380 through this process. Primer sequences were designed based on the flanking genomic sequences and used to amplify the entire target sequence.

Os fragmentos amplificados obtidos a partir desta linha alvo eram do tamanho esperado. Ambos os extremos dos fragmentos amplificados foram confirmados por sequenciação.The amplified fragments obtained from this target line were of the expected size. Both ends of the amplified fragments were confirmed by sequencing.

Exemplo 8: Desenho e geração do vector dador deExample 8: Design and generation of the donor vector of

DNA A construção dadora de DNA incluiu a sequência homóloga 1 {N. tabacum RB7 MAR) (Thompson et al., 1997, WO9727207), um promotor ubilO completo de A. thaliana (Callis, et al., 1990, J. Biol. Chem. 265-12486-12493), 299 bp da sequência codificadora 5' parcial do gene PAT (Wohlleben et al., 1988, Gene 70:25-37) e a sequência homóloga 2 (intrão 1 de 4-CoAS de A. thaliana) (Locus At3g21320, GenBank NC 003074) . A sequência homóloga 1 e a sequência homóloga 2 no vector dador eram idênticas às correspondentes sequências homólogas 1 e 2 no vector alvo (pDABl5 8 5) .DNA The DNA donor construct included the homologous sequence 1 (N. tabacum RB7 MAR) (Thompson et al., 1997, WO9727207), a full-length A. thaliana promoter (Callis, et al., 1990, J. Biol. Chem. 265-12486-12493), 299 bp of the coding sequence 5 'fragment of the PAT gene (Wohlleben et al., 1988, Gene 70: 25-37) and the homologous sequence 2 (A. thaliana 4-CoAS intron 1) (Locus At3g21320, GenBank NC 003074). Homologous sequence 1 and homologous sequence 2 in the donor vector were identical to the corresponding homologous sequences 1 and 2 in the target vector (pDAB1585).

Para construir o vector dador, a sequência de 299 pb codificadora de PAT parcial 5' foi fundida com o intrão 1 completo de 4-CoAS de A. thaliana (Locus At3g21320, GenBank NC 003074) através da síntese de DNA pela Picoscript Ltd., LLP, (Houston, Texas). Os locais Ncol eTo construct the donor vector, the 299 bp sequence of partial 5 'PAT encoding was fused to the complete intron 1 of A. thaliana 4-CoAS (Locus At3g21320, GenBank NC 003074) through DNA synthesis by Picoscript Ltd., LLP, (Houston, Texas). The sites Ncol and

Xhol foram adicionados ao extremo 5' e 3' do fragmento, respectivamente. Este fragmento de DNA sintetizado foi então digerido com Ncol/Xhol e inserido em pDABl575 nos mesmos locais para substituir a sequência codificadora do gene PAT de tamanho completo e a sua UTR 3'. Esta construção resultante foi designada DAB1576 (Fig. 29). pDABl57 6 foi então digerido com Agel e todo o fragmento contendo a cassete de expressão de PAT parcial 5' flanqueada pela sequência homóloga 1 e pela sequência homóloga 2 foi inserido em pDAB2407, o vector de base binário, no mesmo local. A construção resultante foi designada pDABl600 (Fig. 30) e foi a versão binária do vector dador para a retransformação da célula vegetal.XhoI were added to the 5 'and 3' ends of the fragment, respectively. This synthesized DNA fragment was then digested with NcoI / XhoI and inserted into pDAB1575 at the same sites to replace the coding sequence of the full-length PAT gene and its 3 'UTR. This resulting construct was designated DAB1576 (Fig. 29). pDAB1657 was then digested with Agel and the whole fragment containing the 5 'partial PAT expression cassette flanked by the homologous sequence 1 and the homologous sequence 2 was inserted into pDAB2407, the binary base vector, in the same place. The resulting construct was designated pDABl600 (Fig. 30) and was the binary version of the donor vector for the retransformation of the plant cell.

Exemplo 9: Desenho e geração de vectores de expressão de nucleases com dedos de zinco O gene da proteína de fusão dedo de zinco-Fokl foi dirigido por um promotor e UTR 5' de CsVMV UTR (Verdaguer et al., 1996, Plant Molecular Biology 31:1129-1139) . Também estavam incluídos na cassete uma região não traduzida (UTR) 3' da grelha de leitura aberta 24 (orf-24) de A. tumefaciens (Gelvin et al., 1987, EP222493) .Example 9: Design and generation of zinc finger nucleases expression vectors The Fokl zinc finger fusion protein gene was driven by a promoter and 5 'UTR of CsVMV UTR (Verdaguer et al., 1996, Plant Molecular Biology 31: 1129-1139). Also included in the cassette was a 3 'untranslated region (UTR) from the open reading frame 24 (orf-24) of A. tumefaciens (Gelvin et al., 1987, EP 222493).

Para preparar estes vectores, as sequências codificadoras dos controlos C2H2 e das suas variantes C3H IL-l-Fokl e Scd27-FokI, descritas nos Exemplos 1 a 4 atrás, foram amplificadas por PCR a partir dos seus desenhos originais com locais Bbsl ou Ncol e Saci adicionados ao extremo 5' e ao extremo 3' dos fragmentos de PCR, respectivamente, e clonados em pDAB3731 (Fig. 31) digerido com Ncol-Sacl. Os plasmideos resultantes foram designados pDAB4322 (Fig. 32), pDAB4331 (FIG. 33), pDAB4332 (FIG. 34), pDAB4333 (FIG. 35) pDAB4334 (FIG. 36), pDAB4336 (FIG. 37), e pDAB4339 (FIG. 38) . Todos estes vectores continham os locais attLl e attL2 flanqueantes da cassete de expressão ZFN e eram compatíveis com o sistema de clonagem Gateway™ (Invitrogen, Carlsbad, California).To prepare these vectors, sequences encoding the C2H2 controls and their C3H IL-1-Fok1 and Scd27-FokI variants described in Examples 1 to 4 above were amplified by PCR from their original drawings with Bbs1 or NcoI sites and Saci cells added to the 5 'end and the 3' end of the PCR fragments, respectively, and cloned into Ncol-Sacl digested pDAB3731 (Fig. 31). The resulting plasmids were designated pDAB4322 (Fig. 32), pDAB4331 (FIG.33), pDAB4332 (FIG.34), pDAB4333 (FIG.35) pDAB4334 (FIG.36), pDAB4336 (FIG.37), and pDAB4339 38). All of these vectors contained the attL1 and attL2 sites flanking the ZFN expression cassette and were compatible with the Gateway ™ cloning system (Invitrogen, Carlsbad, California).

Duas séries de vectores versão binária foram construídas para a proteína de fusão IL-l-FokI. Um continha o gene da marca seleccionável PAT e o outro não continha o gene da marca seleccionável PAT. Para a proteína de fusão Scd27-FokI, apenas foi construída a versão primária do vector sem o gene da marca seleccionável PAT. Para preparar os vectores binários com o gene da marca seleccionável PAT, a cassete de expressão da proteína de fusão IL-l-Fok em pDAB4322, pDAB4331, pDAB4332, pDAB4333, pDAB4334, and pDAB4336 foram clonados em pDAB4321 (FIG. 39) através da reacção de recombinação LR usando a mistura de enzimas LR ClonaseTM Enzyme Mix (Invitrogen, Carlsbad, California). Os plasmideos resultantes foram designados pDAB4323 (FIG. 40), pDAB4341 (FIG. 41), pDAB4342 (FIG. 42), pDAB4343 (FIG. 43), pDAB4344 (FIG. 44), pDAB4346 (FIG. 45) . Para preparar os vectores binários sem o gene da marca seleccionável PAT, as cassetes de expressão C2H2 IL-l-FokI, C3H IL-l-FokI e Scd27-FokI em pDAB4331, pDAB4336 e pDAB4339, respectivamente, foram clonadas em pDAB4330 (FIG. 46) através da reacção de recombinação LR usando a mistura de enzimas LR ClonaseTM Enzyme Mix (Invitrogen, Carlsbad, California). Os plasmideos resultantes foram designados pDAB4351 (FIG. 47), pDAB4356 (FIG. 48) e pDAB4359 (FIG. 49), respectivamente.Two series of binary version vectors were constructed for the IL-1-FokI fusion protein. One contained the PAT selectable marker gene and the other did not contain the PAT selectable marker gene. For the Scd27-FokI fusion protein, only the primary version of the vector without the selectable marker gene PAT was constructed. To prepare the binary vectors with the PAT selectable marker gene, the IL-1-Fok fusion protein expression cassette in pDAB4322, pDAB4331, pDAB4332, pDAB4333, pDAB4334, and pDAB4336 were cloned into pDAB4321 (FIG. LR recombination reaction using the enzyme mixture LR Clonase ™ Enzyme Mix (Invitrogen, Carlsbad, California). The resulting plasmids were designated pDAB4323 (FIG 40), pDAB4341 (FIG 41), pDAB4342 (FIG.42), pDAB4343 (FIG.43), pDAB4344 (FIG.44), pDAB4346 (FIG45). To prepare the binary vectors without the PAT selectable marker gene, the expression cassettes C2H2 IL-1-FokI, C3H IL-1-FokI and Scd27-FokI in pDAB4331, pDAB4336 and pDAB4339, respectively, were cloned into pDAB4330 (FIG. 46) through the LR recombination reaction using the enzyme mixture LR Clonase ™ Enzyme Mix (Invitrogen, Carlsbad, California). The resulting plasmids were designated pDAB4351 (FIG.47), pDAB4356 (FIG.48) and pDAB4359 (FIG.49), respectively.

Para preparar o controlo C2H2 de SCD27-FokI, o fragmento HindIIl/SacI compreendendo o promotor CsVMV e a UTR 5' dirigindo PAT em pDAB7002 (Fig. 50) foi substituído com um fragmento compreendendo o promotor CsVMV e a UTR 5' de N. tabacum dirigindo GUS, que foi excisada a partir de pDAB7025 (Fig. 51) com HindiII/Saci. O plasmídeo resultante foi designado pDABl591 (Fig. 52). As sequências codificadoras de Scd27-L0-Fokl foram amplificadas por PCR a partir dos seus vectores originais vectors pCDNA3.l-SCD27a-L0-Fokl (FIG. 53) usando o par de sequências iniciadoras P13/P14. Os locais Bbsl e Saci foram adicionados ao extremo 5' e 3' dos fragmentos de PCR, respectivamente. O gene PAT em pDABl591 foi substituído com o fragmento de PCR do gene da proteína de fusão com dedos de zinco através da clonagem Sacl/Ncol. O plasmídeo resultante foi designado pDABl594 (Fig. 54). A versão binária deste vector foi construída através da excisão da cassete de expressão do gene da proteína de fusão com dedos de zinco do pDABl594 como um fragmento Pmel/Xhol, preenchimento dos extremos e clonagem em pDAB2407 no local Pmel. O plasmídeo resultante foi designado pDABl598 (Fig. 55). Os detalhes de todos os vectores binários usados na transformação de plantas estão resumidos na Tabela 6.To prepare the SCD27-FokI C2H2 control, the HindIII / SacI fragment comprising the CsVMV promoter and the 5 'UTR driving PAT in pDAB7002 (Fig. 50) was replaced with a fragment comprising the CsVMV promoter and the 5' UTR of N. tabacum GUS, which was excised from pDAB7025 (Fig. 51) with HindIII / Saci. The resulting plasmid was designated pDAB1591 (Fig. 52). The Scd27-L0-Fok1 coding sequences were amplified by PCR from their original vector vectors pCDNA3.l-SCD27a-L0-Fokl (FIG.53) using the primer pair P13 / P14. The Bbs1 and Saci sites were added to the 5 'and 3' ends of the PCR fragments, respectively. The PAT gene in pDAB1591 was replaced with the PCR fragment of the zinc finger fusion protein gene through Sacl / Ncol cloning. The resulting plasmid was designated pDAB1594 (Fig. 54). The binary version of this vector was constructed by excising the zinc finger fusion protein gene expression cassette of pDAB1504 as a Pmel / XhoI fragment, end-filling and cloning in pDAB2407 at the Pmel site. The resulting plasmid was designated pDAB1698 (Fig. 55). Details of all binary vectors used in plant transformation are summarized in Table 6.

Tabela 6: Vectores de expressão de nucleases com dedos de zincoTable 6: Nuclease expression vectors with zinc fingers

Exemplo 10: Desenho e geração de vector controlo positivoExample 10: Design and generation of positive control vector

Para estimar a frequência de recombinação ilegítima e servir como controlo positivo, foi usado um vector contendo a cassete de expressão do gene PAT. De forma a ser comparável com os recombinantes finais, o intrão 1 de 4-CoAS de A. thaliana (Locus At3g21320, GenBank NC 003074) foi inserido na posição 299/300 pb da sequência codificadora de PAT (Wohlleben et al., 1988, Gene 70:25-37) . Para fazer esta construção, o fragmento Swal/Clal de 2559 pb de pDABl576 foi ligado ao fragmento esqueleto de pDAB!577 (Fig. 56) que foi digerido com as mesmas enzimas de restrição. 0 vector resultante continha a cassete de expressão do gene PAT com a inserção de 1743 pb do intrão 1 de 4-CoAS de A. thaliana (Locus At3g21320, GenBank NC 003074) (Locus At3g21320, GenBank NC 003074) no meio da seguência codificadora de PAT (Wohlleben et ai., 1988, Gene 70:25-37). Este vector foi designado pDABl578 (FIG. 57).To estimate the frequency of illegitimate recombination and to serve as a positive control, a vector containing the PAT gene expression cassette was used. In order to be comparable with the final recombinants, A. thaliana 4-CoAS intron 1 (Locus At3g21320, GenBank NC 003074) was inserted at position 299/300 bp of the PAT coding sequence (Wohlleben et al., 1988, Gene 70: 25-37). To make this construct, the 2559 bp Swal / Clal fragment from pDABl576 was ligated to the backbone fragment of pDAB! 577 (Fig. 56) which was digested with the same restriction enzymes. The resulting vector contained the PAT gene expression cassette with the insertion of 1743 bp of A. thaliana 4-CoAS intron 1 (Locus At3g21320, GenBank NC 003074) (Locus At3g21320, GenBank NC 003074) in the coding sequence of PAT (Wohlleben et al., 1988, Gene 70: 25-37). This vector was designated pDAB1778 (FIG 57).

Para preparar a versão binária de pDABl578, a cassete de expressão do gene PAT com o intrão 1 de A. thaliana (Locus At3g21320, GenBank NC 003074) foi excisado de pDABl578 com Pmel/Xhol. Após o extremo 3' do fragmento ser tornado cego, ela foi inserida em pDAB2407, o vector de base binário, no local Pmel. O vector resultante foi designado pDABl601 (Fig. 58) que compreendia o gene PAT (Wohlleben et al., 1988, Gene 70:25-37) contendo a sequência do intrão de 4-CoAS de A thaliana (Locus At3g21320, GenBank NC 003074) dirigida pelo promotor ubilO de A. thaliana (Callis, et al., 1990, J. Biol. Chem. 265-12486-12493) e terminada pela UTR 3' da orf25/26 de A. tumefaciens (Gelvin et al., 1987, EP222493).To prepare the binary version of pDABl578, the PAT gene expression cassette with A. thaliana intron 1 (Locus At3g21320, GenBank NC 003074) was excised from pDABl578 with Pmel / XhoI. After the 3 'end of the fragment was rendered blind, it was inserted into pDAB2407, the binary base vector, at the Pmel site. The resulting vector was designated pDAB1601 (Fig. 58) which comprised the PAT gene (Wohlleben et al., 1988, Gene 70: 25-37) containing the 4-CoAS intron sequence of A thaliana (Locus At3g21320, GenBank NC 003074 ) by the ubilO promoter of A. thaliana (Callis, et al., 1990, J. Biol. Chem. 265-12486-12493) and terminated by the 3 'UTR of A. tumefaciens (Gelvin et al. 1987, EP 222493).

Exemplo 11: Demonstração da recomblnação homóloga intracromossómica através da retransformação de culturas celulares alvo com os genes da nuclease com dedos de zinco C3HExample 11: Demonstration of intrachromosomal homologous recombination by the retransformation of target cell cultures with the C3H zinc finger nuclease genes

Para validar a funcionalidade das nucleases com dedos de zinco C3H na estimulação da recombinação homóloga intracromossómica, dois fragmentos GFP não funcionais com sequências sobreponíveis de 540 pb foram incluídos no vector alvo como se mostra na Fig. 59. Entre estes dois fragmentos estava uma csssete de expressão de GUS. A sequência de ligação da proteína de fusão IL-l-Fokl foi fundida com a sequência codificadora de GUS no seu extremo N-terminal. Sem estar limitado por qualquer teoria, foi colocada a hipótese de na presença da proteína de fusão IL-1-FokI as sequências de ligação a IL-l-ZFN serem reconhecidas e ser induzida uma quebra na dupla cadeia do DNA, a qual estimularia o processo de reparação de DNA endógeno. Sem a presença de DNA dador, os dois fragmentos de GFP parcialmente homólogos sofreriam um processo de recombinação homóloga intracromossómico e um gene GFP funcional seria reconstituído.To validate the functionality of the C3H zinc finger nucleases in the stimulation of intrachromosomal homologous recombination, two non-functional GFP fragments with 540 bp overlap sequences were included in the target vector as shown in Fig. 59. Among these two fragments was a set of expression of GUS. The IL-1-Fokl fusion protein binding sequence was fused to the GUS coding sequence at its N-terminus. Without being bound by any theory, it was hypothesized that in the presence of the IL-1-FokI fusion protein the IL-1-ZFN binding sequences are recognized and a double-stranded DNA is induced which would stimulate the process of endogenous DNA repair. Without the presence of donor DNA, the two partially homologous GFP fragments would undergo an intracromossomic homologous recombination process and a functional GFP gene would be reconstituted.

Uma linha celular transgénica BY2-380 que continha uma única cópia de tamanho completo integrada da sequência alvo foi usada para reiniciar as culturas em suspensão colocando -250-500 ng de tecido do calo em 40-50 ml de meio basal baseado em LS, contendo 100 mg/1 de higromicina, e subcultura cada 7 dias como descrito atrás. Antes da retransformação, as culturas em suspensão foram transferidas para meio basal sem higromicina durante pelo menos duas passagens. A transformação mediada por Agrobacterium das culturas celulares alvo foi realizada como descrito atrás. Para cada experiência, 8 placas de cocultura foram geradas como se segue: uma placa continha células cocultivadas com 300 μΐ de Agrobacterium estirpe LBA4404 de base; uma placa compreendia células cocultivadas com 300 μΐ de uma estirpe de Agrobacterium portadora de pDABl590 (construção com GFP funcional); seis placas continham, cada uma, células cocultivadas com 300 μΐ de uma estirpe de Agrobacterium portadora de pDAB4323, pDAB4341, pDAB4342, pDAB4343, pDAB4344 e pDAB4346, respectivamente. Após cocultura usando os métodos descritos atrás, as células foram semeadas em oito placas contendo meio basal baseado em LS suplementado com 500 mg/1 de carbenicilina sem reagente de selecção. A expressão aparente do gene GFP funcional constituído resultou em fluorescência visível por volta dos dias 5-8 após transformação). O número de focos fluorescentes verdes por campo foi contado através da observação aleatória de 5 campos do microscópio por placa, 8 placas por construção em cada experiência e fazendo a média de 6 experiências independentes.A BY2-380 transgenic cell line containing a single full-size copy integrated into the target sequence was used to restart suspension cultures by placing -250-500 ng of callus tissue in 40-50 ml of LS-based basal medium containing 100 mg / 1 hygromycin, and subculture every 7 days as described above. Prior to retransformation, the suspension cultures were transferred to basal medium without hygromycin for at least two passages. Agrobacterium-mediated transformation of target cell cultures was performed as described above. For each experiment, 8 co-culture plates were generated as follows: one plate contained cocultivated cells with 300 μg of Agrobacterium strain LBA4404 base; one plate comprised cells cocultivated with 300 μg of an Agrobacterium strain bearing pDAB1590 (construct with functional GFP); six plates each contained 300 μ coc cocultivated cells of an Agrobacterium strain bearing pDAB4323, pDAB4341, pDAB4342, pDAB4343, pDAB4344 and pDAB4346, respectively. After coculture using the methods described above, cells were seeded into eight plates containing LS-based basal medium supplemented with 500 mg / l carbenicillin without selection reagent. The apparent expression of the constituted functional GFP gene resulted in visible fluorescence around days 5-8 after transformation). The number of green fluorescent foci per field was counted by randomly observing 5 microscope fields per plate, 8 plates per construct in each experiment and averaging 6 independent experiments.

Conforme resumido na Tabela 7, observou-se uma média de 9,50 e 7,57 focos fluorescentes verdes a partir das duas nucleases com dedos de zinco C3H, pDAB4346 e pDAB4343, respectivamente. Estes dois desenhos C3H de IL-1-Fokl tiveram melhor desempenho que os seus controlos C2H2, pDAB4341 (6,37 focos por campo) e pDAB4323 (5,53 focos por campo). Entretanto, comparativamente com os controlos C2H2, a função de outras duas variantes C3H da proteína de fusão IL-l-Fokl, pDAB4344 (4,39 focos por campo) e pDAB4342 (0,25 focos por campo) foi significativamente inibida, em particular o pDAB4342, em que a conversão C3H foi feita através da substituição da segunda histidina com cisteina no quarto dedo. Não se observou fluorescência apreciável para além de um ligeiro fundo nos controlos negativos transformados com a estirpe de base de Agrobacterium LBA4404.As summarized in Table 7, we observed a mean of 9.50 and 7.57 green fluorescent foci from the two zinc finger nucleases C3H, pDAB4346 and pDAB4343, respectively. These two IL-1-Fokl C3H designs performed better than their controls C2H2, pDAB4341 (6.37 foci per field) and pDAB4323 (5.53 foci per field). However, compared to the C2H2 controls, the function of two other C3H variants of the IL-1-Fok1 fusion protein, pDAB4344 (4.39 foci per field) and pDAB4342 (0.25 foci per field) was significantly inhibited, in particular pDAB4342, wherein the C3H conversion was made by replacing the second histidine with cysteine in the fourth finger. No appreciable fluorescence was observed beyond a slight background in the negative controls transformed with the Agrobacterium base strain LBA4404.

Tabela 7Table 7

Exemplo 12: Demonstração da recomblnação homóloga intercromossómica através da retransformação das culturas de células alvo com genes das nucleases com dedos de zinco C3H e sequências de DNA dadorExample 12: Demonstration of the interchromosomal homologous recombination through the retransformation of target cell cultures with nucleotide genes with C3H zinc fingers and donor DNA sequences

Para validar a funcionalidade da proteína de fusão dedo de zinco C3H-FokI na estimulação da recombinação homóloga intercromossómica no sistema exemplificativo do tabaco, foram desenvolvidas e testadas duas estratégias.To validate the functionality of the C3H-FokI zinc finger fusion protein in the stimulation of the homologous interchromosomal recombination in the exemplary system of tobacco, two strategies were developed and tested.

Na estratégia 1, o local de ligação para a proteína de fusão dedo de zinco-Fokl (Il-1-L0-Fokl) foi incluído no meio da construção alvo (Fig. 61). Nesta estratégia, o local de ligação foi flanqueado por ~3kb de sequências não homólogas de ambos os lados seguido da sequência homóloga 1 (MAR RB7 de N. tabacum) e da sequência homóloga 2 (intrão 1 de 4-CoAS de A. thaliana) a montante e a jusante, respectivamente. Como previamente demonstrado (e.g., Publicação de Patente US N° 20050064474) na presença da proteína de fusão dedo de zinco IL-1 C2H2-FokI, as sequências de ligação a IL-1-L0-Fokl foram reconhecidas e foi induzida uma quebra no DNA de cadeia dupla neste local específico, o que estimulou o processo de reparação de DNA endógeno. Na presença de DNA dador, que continha sequências homólogas parciais idênticas às da sequência alvo, o gene PAT parcial 5' juntamente com o seu promotor, substituiu todo o fragmento de DNA de ~6 kb entre as sequências homólogas no alvo através de recombinação homóloga. Através deste processo, as duas sequências parciais do gene PAT, com o intrão 1 de 4-CoAs de A. thaliana de permeio, reconstituiu um gene PAT funcional, resultando na expressão de PAT e num fenótipo de resistência a herbicida.In strategy 1, the binding site for zinc-Fokl finger-fusion protein (Il-1-L0-Fokl) was included in the medium of the target construct (Fig. 61). In this strategy, the binding site was flanked by ~ 3 kb of non-homologous sequences on both sides followed by the homologous sequence 1 (MAR RB7 of N. tabacum) and the homologous sequence 2 (A. thaliana 4-CoAS intron 1) upstream and downstream, respectively. As previously demonstrated (eg, U.S. Patent Publication No. 20050064474) in the presence of the IL-1 C2H2-FokI zinc finger fusion protein, the IL-1-L0-Fok1 binding sequences were recognized and a Double-stranded DNA at this specific site, which stimulated the repair process of endogenous DNA. In the presence of donor DNA, which contained partial homologous sequences identical to those of the target sequence, the partial 5 'PAT gene together with its promoter, replaced the ~6 kb DNA fragment between the homologous sequences in the target through homologous recombination. Through this process, the two partial sequences of the PAT gene, with A. thaliana 4-CoAs intron 1 of permease, reconstituted a functional PAT gene, resulting in the expression of PAT and a phenotype of herbicide resistance.

Na estratégia 2, dois locais de ligação a dedos de zinco-Fokl (Scd27-L0-Fokl) foram incluídos no vector alvo: um directamente a jusante de MAR RB7 de N. tabacum e o outro directamente a montante do intrão 1 de 4-CoAs de A. thaliana (Fig. 62) . Entre os dois locais de ligação da proteína de fusão dedos de zinco-Fokl estavam ~6 kb de sequência, as quais incluíam o fragmento 5' GFP, uma cassete de expressão de GUS e o fragmento GFP 3' . Como anteriormente demonstrado (e.g., Publicação de Patente U.S. N° 20050064474), na presença da proteína de fusão dedos de zinco Scd27-FokI, as duas sequências de ligação foram reconhecidas e as quebras de DNA de cadeia dupla foram induzidas em ambas as localizações, o que removeu o fragmento de DNA de ~6 kb entre estas duas sequências de ligação e estimulou o processo endógeno de reparação do DNA. De forma semelhante à estratégia 1, na presença de DNA dador, que continha sequências homólogas idênticas à da sequência alvo, o gene PAT parcial 5' juntamente com o seu promotor, foi inserido na sequência alvo, através de recombinação homóloga, no local onde as quebras do DNA de cadeia dupla foram induzidas. Através deste processo, as duas sequências parciais do gene PAT com o intrão 1 de 4-CoAS interposto entre elas, reconstituiu-se um gene PAT funcional, resultando na expressão de PAT e no fenótipo de resistência a herbicida. A transformação mediada por Agrobacterium da cultura de células alvo BY2-380 foi realizada como descrito atrás. Para cada experiência, 12 placas de cocultura foram geradas como se segue: uma placa continha células cocultivadas com 50 μΐ de uma estirpe de Agrobacterium portadora de pDABl600 (DNA dador) e 250 μΐ da estirpe base de Agrobacterium LBA4404; uma placa continha células cocultivadas com 50 μΐ de uma estirpe de Agrobacterium portadora de pDABl601 (marca seleccionável com PAT) e 250 μΐ de Agrobacterium estirpe base LBA4404; duas placas contendo células cocultivadas com 50 μΐ de uma estirpe de Agrobacterium portadora de pDABl600 (DNA dador) e 250 μΐ de uma estirpe de Agrobacterium portadora de pDAB4351 (C2H2 IL-1 ZFP-Fokl); três placas continham células cocultivadas com 50 μΐ de uma estirpe de Agrobacterium portadora de pDAB 1600 (DNA dador) e 250 μΐ de uma estirpe de Agrobacterium portadora de pDAB4356 (C3H IL-1 ZFP-Fokl); duas placas continham células cocultivadas com 50 μΐ de uma estirpe de Agrobacterium portadora de pDABl600 (DNA dador) e 250 μΐ de uma estirpe de Agrobacterium portadora de pDABl598 (C2H2 Scd 27a ZFP-Fokl); três placas continham células cocultivadas com 50 μΐ de uma estirpe de Agrobacterium portadora de pDABl600 (DNA dador) e 250 μΐ de uma estirpe de Agrobacterium portadora de pDAB4359 (C3H Scd27a ZFP-Fokl) . Após cocultura usando os métodos descritos atrás, as células foram semeadas em meio basal baseado em LS contendo 500 mg/1 de carbenicilina e 15 mg/1 de Bialaphos®. Isolados individuais resistentes a Bialaphos® surgiram 2-4 semanas após sementeira e foram transferidos para placas individuais de 60x20 mm (um isolado por placa) onde foram mantidos como calo num protocolo de subcultura de 14 dias até necessário para análise.In strategy 2, two Fokl zinc finger binding sites (Scd27-L0-Fok1) were included in the target vector: one directly downstream of MAR RB7 from N. tabacum and the other directly upstream of intron 1 from 4- CoAs of A. thaliana (Fig. 62). Between the two zinc-Fokl finger fusion protein binding sites were ~ 6 kb of sequence, which included the 5 'GFP fragment, a GUS expression cassette, and the 3' GFP fragment. As previously demonstrated (eg, U.S. Patent Publication No. 20050064474), in the presence of the Scd27-FokI zinc finger fusion protein, the two binding sequences were recognized and the double stranded DNA breaks were induced at both locations, which removed the ~6 kb DNA fragment between these two binding sequences and stimulated the endogenous DNA repair process. Similarly to strategy 1, in the presence of donor DNA, which contained homologous sequences identical to that of the target sequence, the 5 'partial PAT gene along with its promoter was inserted into the target sequence by homologous recombination at the site where the breaks of the double stranded DNA were induced. Through this process, the two partial sequences of the PAT gene with the 4-CoAS intron 1 interposed between them, a functional PAT gene was reconstituted, resulting in the expression of PAT and the herbicide resistance phenotype. The Agrobacterium-mediated transformation of the BY2-380 target cell culture was performed as described above. For each experiment, 12 coculture plates were generated as follows: one plate contained cells cocultivated with 50 μg of an Agrobacterium strain bearing pDABl600 (donor DNA) and 250 μg of the Agrobacterium base strain LBA4404; one plate contained cocultivated cells with 50 μg of an Agrobacterium strain bearing pDABl601 (selectable marker with PAT) and 250 μg of Agrobacterium strain base LBA4404; two plates containing 50 μg of an Agrobacterium strain bearing pDABl600 (donor DNA) and 250 μg of an Agrobacterium strain bearing pDAB4351 (C2H2 IL-1 ZFP-Fok1); three plates contained co-cultured cells with 50 μg of an Agrobacterium strain bearing pDAB 1600 (donor DNA) and 250 μg of an Agrobacterium strain bearing pDAB4356 (C3H IL-1 ZFP-Fok1); two plates contained co-cultured cells with 50 μg of an Agrobacterium strain bearing pDABl600 (donor DNA) and 250 μg of an Agrobacterium strain bearing pDABl598 (C2H2 Scd 27a ZFP-Fok1); three plates contained co-cultured cells with 50 μg of an Agrobacterium strain bearing pDABl600 (donor DNA) and 250 μg of an Agrobacterium strain bearing pDAB4359 (C3H Scd27a ZFP-Fok1). After coculture using the methods described above, the cells were seeded in LS-based basal medium containing 500 mg / l carbenicillin and 15 mg / l Bialaphos®. Individual isolates resistant to Bialaphos ® emerged 2-4 weeks after seeding and were transferred to individual 60x20 mm plates (one isolate per dish) where they were kept as callus in a 14 day subculture protocol until required for analysis.

Obtiveram-se múltiplos isolados resistentes aMultiple isolates resistant to

Bialaphos® a partir da nuclease com dedos de zinco C3H IL-1 (pDAB4356) e da nuclease com dedos de zinco C3H Scd27 (pDAB4359). Estes isolados foram analisados por PCR usando o par de sequências iniciadoras P24/25, o qual amplificou um fragmento de DNA abrangendo o gene PAT reconstituído. A sequência iniciadora P24 era homóloga do extremo 5' da sequência codificadora de PAT no DNA dador e a sequência iniciadora P25 era homóloga do extremo 3' da sequência codificadora de PAT no DNA alvo. Um fragmento de PCR de 2,3 kb resultaria se duas sequências codificadoras de PAT parciais fossem ligadas através de recombinação homóloga. Como se mostra na Fig. 63, um produto de PCR de 2,3 kb foi obtido a partir de múltiplos isolados analisados. Estes isolados foram obtidos a partir da cotransformação do gene da proteína de fusão dedo de zinco IL-1 C3H-FokI/DNA dador e do gene da proteína de fusão dedo de zinco Scd27 C3H-Fokl/DNA dador. Os produtos de PCR de 2,3 kb derivados de múltiplos isolados independentes, representativos dos derivados das transformações com genes das proteínas de fusão dedo de zinco IL-1 C3H-FokI e dedo de zinco Scd27 C3H-FokI foram purificados dos géis de agarose e clonados no vector pCR2.1 TOPO (Invitrogen, Carlsbad, California). 0 produto de PCR de 2,3 kb inserido no vector TOPO foi então sequenciado usando o kit de sequenciação Dye Terminator Cycle Sequencing Kit (Beckman Coulter). Os resultados de sequenciação confirmaram que todos os produtos de PCR clonados no vector TOPO continham a sequência recombinada como previsto, incluindo as sequências parciais 5' e 3' do gene PAT com o intrão 1 de 4-CoAS de A. thaliana intercalado. Estes resultados confirmaram a recombinação intercromossómica prevista para ambas as estratégias e exemplificaram o alvejamento de genes através da expressão de genes de proteínas de fusão dedo de zinco C3H-Fokl.BialaphosÂ® from the zinc finger nuclease C3H IL-1 (pDAB4356) and the zinc finger nuclease C3H Scd27 (pDAB4359). These isolates were analyzed by PCR using the primer pair P24 / 25, which amplified a DNA fragment spanning the reconstituted PAT gene. The P24 primer was homologous to the 5 'end of the PAT coding sequence in the donor DNA and the P25 primer was homologous to the 3' end of the PAT coding sequence in the target DNA. A 2.3 kb PCR fragment would result if two partial PAT coding sequences were ligated by homologous recombination. As shown in Fig. 63, a 2.3 kb PCR product was obtained from multiple isolates analyzed. These isolates were obtained from cotransformation of the IL-1 C3H-FokI / donor DNA zinc finger fusion protein gene and the Scd27 C3H-FokI / donor DNA zinc finger fusion protein gene. The 2.3 kb PCR products derived from multiple independent isolates representative of those derived from the IL-1 C3H-FokI zinc finger fusion proteins and the Scd27 C3H-FokI zinc finger fusion proteins were purified from agarose gels and cloned into the pCR2.1 TOPO vector (Invitrogen, Carlsbad, California). The 2.3 kb PCR product inserted into the TOPO vector was then sequenced using the Dye Terminator Cycle Sequencing Kit (Beckman Coulter) sequencing kit. Sequencing results confirmed that all PCR products cloned into the TOPO vector contained the recombined sequence as predicted, including the 5 'and 3' partial sequences of the PAT gene with the intercalated A. thaliana 4-CoAS intron 1. These results confirmed the predicted cross-chromosomal recombination for both strategies and exemplified gene targeting through the expression of C3H-Fok1 zinc finger fusion proteins.

Exemplo 13: Identificação de sequências de genes alvo em cultura de células de milho A. Identificação de sequênciasExample 13: Identification of target gene sequences in maize cell culture A. Sequence identification

Neste exemplo, sequências de DNA de um gene endógeno de milho de função conhecida foram seleccionadas como alvos para a edição de genomas usando nucleases com dedos de zinco. A estrutura genómica e a sequência deste gene, referido como IPP2-K, que deriva de uma linha singeneica de milho 5XH751 copropriedade, foi descrita em W02006/029296; cuja divulgação é aqui incluída como referência.In this example, DNA sequences from a known endogenous maize gene were selected as targets for genome editing using zinc finger nucleases. The genomic structure and sequence of this gene, referred to as IPP2-K, which is derived from a syngeneic line of 5XH751 maize co-property, has been described in WO2006 / 029296; the disclosure of which is hereby incorporated by reference.

Em particular, a sequência genómica de IPP2-K foi usada para pesquisa da base de dados do genoma do milho TIGR (disponível na rede em http://www.tigr.org/tdb/tgi/ maize/) usando algoritmos BLAST. Vários outros fragmentos genómicos foram identificados com segmentos de homologia sobreponível com IPP2-K, incluindo, mas não lhes estando limitados, os acessos AZM515213 e TC311535. Com base na sequência destes números de acesso, assim como na sequência IPP2-K, foram desenhados múltiplos oligonucleótidos curtos para usar como sequências iniciadoras de PCR usando o programa Primer3 (Rozen, S. and Skaletsky, HJ. (2000) Primer 3 on the WWW for general users and for biologist programmers. In: Krawetz S, Misener S (eds.) Bioinformatics Methods and Protocols: Methods in Molecular Biology. Humana Press, Totowa, NJ, pp 365-386; também disponível na rede). Estas sequências iniciadoras incluem, mas não lhes estão limitadas, os seguintes oligonucleótidos com orientação directa: 1. 5'-ATGGAGATGGATGGGGTTCTGCAAGCCGC-3' (SEQ ID NO:104) 2. 5'-CTTGGCAAGGTACTGCGGCTCAAGAAGATTC-3' (SEQ ID NO:161) 3. 5'-ATGAAGAAAGACAGGGAATGAAGGAC-3' (SEQ IDNO:162) 4. 5'-ATGAAGAAAGACAGGGAATGAAGGACCGCCAC-3' (SEQ ID NO:163) 5. 5'-CATGGAGGGCGACGAGCCGGTGTAGCTG-3' (SEQ ID NO :164) 6. 5'-ATCGACATGATTGGCACCCAGGTGTTG-3' (SEQ IDNO:165)In particular, the genomic sequence of IPP2-K was used to search the TIGR corn genome database (available on the web at http://www.tigr.org/tdb/tgi/ maize /) using BLAST algorithms. Several other genomic fragments were identified with overlapping homology segments with IPP2-K, including, but not limited to, AZM515213 and TC311535. Based on the sequence of these accession numbers as well as the IPP2-K sequence, multiple short oligonucleotides were designed for use as PCR primers using the Primer3 program (Rozen, S. and Skaletsky, HJ. (2000) Primer 3 on the In general, the use of biotechnology as a biolog- ical agent for the use of biolog- ical biologists is a common practice in biotechnology. These primer sequences include, but are not limited to, the following oligonucleotides with forward orientation: 1. 5'-ATGGAGATGGATGGGGTTCTGCAAGCCGC-3 '(SEQ ID NO: 104) 2. 5'-CTTGGCAAGGTACTGCGGCTCAAGAAGATTC-3' (SEQ ID NO: 161) 3. 5'-ATGAAGAAAGACAGGGAATGAAGGAC-3 '(SEQ ID NO: 162) 4. 5'-ATGAAGAAAGACAGGGAATGAAGGACCGCCAC-3' (SEQ ID NO: 163) 5. 5'-CATGGAGGGCGACGAGCCGGTGTAGCTG-3 '(SEQ ID NO: 164) '-ATCGACATGATTGGCACCCAGGTGTTG-3' (SEQ ID NO: 165)

Ainda, as sequências iniciadoras incluem, mas não lhes estão limitadas, os seguintes oligonucleótidos com orientação reversa: 7. 5'-TTTCGACAAGCTCCAGAAAATCCCTAGAAAC-3 ' (SEQ ID NO:166) 8. 5'-ACAAGCTCCAGAAAATCCCTAGAAACAC-3' (SEQ ID NO:167) 9. 5'-TTCGACAAGCTCCAGAAAATCCCTAGAAACAC-3' (SEQ ID NO:168) 10. 5'-TGCTAAGAACATTCTTTTCGACAAGCTCC-3' (SEQ ID NO:169) 11. 5'-GAACATTCTTTTCGACAAGCTCCAGAAAATCC-3' (SEQ IDNO:170)In addition, the starter sequences include, but are not limited to, the following reverse oriented oligonucleotides: 5'-TTTCGACAAGCTCCAGAAAATCCCTAGAAAC-3 '(SEQ ID NO: 166) 8. 5'-ACAAGCTCCAGAAAATCCCTAGAAACAC-3' (SEQ ID NO: (SEQ ID NO: 168). 5'-TGCTAAGAACATTCTTTTCGACAAGCTCC-3 '(SEQ ID NO: 169) 11. 5'-GAACATTCTTTTCGACAAGCTCCAGAAAATCC-3' (SEQ ID NO: 168) 9. 5'-TTCGACAAGCTCCAGAAAATCCCTAGAAACAC-3 '

Todas as sequências oligonucleotídicas iniciadoras foram sintetizadas e adquiridas a Integrated DNA Technologies (EDT, Coralville, IA). B. Cultura de células de milho HillAll primer oligonucleotide sequences were synthesized and purchased from Integrated DNA Technologies (EDT, Coralville, IA). B. Hill Corn Cell Culture

Para se obter embriões imaturos para inicio da cultura de calos, foram realizados cruzamentos Fi entre progenitores Hi-II A e B crescidos em estufa (Armstrong, C, Green, C. and Phillips, R. (1991) Maize Genet. Coop. News Lett. 65: 92-93) . Embriões de aproximadamente 1,0-1,2 mm de tamanho (-9-10 dias após polinização) foram colhidos de espigas saudáveis e esterilizados na superfície esfregando com sabão Liqui-Nox®, seguido de imersão em etanol a 70% durante 2-3 minutos, depois imersos em 20% de lixívia comercial (0,1% de hipoclorito de sódio) durante 30 minutos.In order to obtain immature embryos for the initiation of callus culture, Fi crosses were performed between greenhouse grown Hi-II A and B progenitors (Armstrong, C, Green, C. and Phillips, R. (1991) Maize Genet. Lett., 65: 92-93). Embryos of approximately 1.0-1.2 mm in size (-9-10 days after pollination) were harvested from healthy spindles and sterilized on the surface by scrubbing with Liqui-Nox® soap, followed by immersion in 70% ethanol for 2- 3 minutes, then immersed in 20% commercial bleach (0.1% sodium hypochlorite) for 30 minutes.

As espigas foram enxaguadas em água destilada estéril e os embriões zigóticos imaturos foram excisados assepticamente e cultivados em meio 15Agl0 (Meio N6 (Chu CC, Wang CC, Sun CS., Hsu C, Yin K.C, Chu CY., and Bi F. Y. (1975) Sei. Sinica 18:659-668), 1, 0 mg/1 2,4-D, 20 g/1 sucrose, 100 mg/1 de hidrolisado de caseína (digestão enzimática) , L-prolina 25 mM, 10 mg/1 de AgNCh, 2,5 g/1The spikes were rinsed in sterile distilled water and the immature zygotic embryos were excised aseptically and cultured in 15Ag0 medium (Medium N6 (Chu CC, Wang CC, Sun CS, Hsu C, Yin KC, Chu CY, and Bi FY (1975 ) Synic 18: 659-668), 1.0 mg / l 2,4-D, 20 g / 1 sucrose, 100 mg / l casein hydrolyzate (enzymatic digestion), 25 mM L-proline, 10 mg / 1 AgNCh, 2.5 g / 1

Gelrite, pH 5,8) durante 2-3 semanas com o escutelo voltado para cima relativamente ao meio. Os tecidos com a morfologia esperada (Welter, ME, Clayton, DS, Miller, MA, Petolino, JF. (1995) Plant Cell Rep: 14:725-729) foram selectivamente transferidos, com intervalos de duas semanas, para meio 15Agl0 fresco durante aproximadamente 6 semanas, depois transferidos para meio 4 (Meio N6, 1,0 mg/1 2,4-D, 20 g/1 sucrose, 100 mg/1 hidrolisado de caseínaGelrite, pH 5.8) for 2-3 weeks with the scutellum facing upwards relative to the medium. Tissues with the expected morphology (Welter, ME, Clayton, DS, Miller, MA, Petolino, JF. (1995) Plant Cell Rep: 14: 725-729) were selectively transferred, at intervals of two weeks, to fresh 15Ag0 medium for about 6 weeks, then transferred to medium 4 (Medium N6, 1.0 mg / l 2,4-D, 20 g / 1 sucrose, 100 mg / 1 casein hydrolyzate

(digestão enzimática), 6 mM L-prolina, 2,5 g/1 Gelrite, pH 5,8), em intervalos de duas semanas, durante aproxima-damente 2 meses.(enzymatic digestion), 6 mM L-proline, 2.5 g / 1 Gelrite, pH 5.8) at two week intervals for approximately 2 months.

Para iniciar culturas embrionárias em suspensão, um volume de aproximadamente 3 ml de células sedimentadas (PCV) de tecido de calo derivado de um único embrião foi adicionado a aproximadamente 30 ml de meio líquido H9PC+ (mistura de sais basais MS (Murashige T., & Skoog F. (1962) Physiol. Plant. 15:473-497), Vitaminas MS modificadas contendo 10 vezes menos ácido nicotínico e 5 vezes mais tiamina-HCl, 2,0 mg/1 2,4-D, 2,0 mg/1 ácido a- naftale- noacético (NAA) , 30 g/1 sucrose, 200 mg/1 hidrolisado de caseína (digestão com ácido), 100 mg/1 mioinositol, 6 mM L-prolina, 5% v/v água de coco (adicionado imediatamente antes da subcultura), pH 6,0). As culturas em suspensão foram mantidas no escuro em frascos Erlenmeyer de 125 ml num agitador com temperatura controlada marcado para 125 rpm a 28°C. Durante o estabelecimento da linha celular (2-3 meses), as suspensões foram cultivadas cada 3,5 dias através da adição de 3 ml PCV de células e 7 ml de meio condicionado a 20 ml de meio líquido fresco H9CP+ usando um pipeta de bico largo. Quando atingiram a maturidade, conforme evidenciado pela duplicação do crescimento, as suspensões foram aumentadas de volume e mantidas em frascos de 500 ml pelo que 12 ml de PCV de células e 28 ml de meio condicionado foram transferidos para 80 ml de meio H9CP+. Quando completado o estabelecimento da cultura em suspensão, foram criopreservadas alíquotas para utilização posterior. Ver, WO 2005/107437.To initiate suspension embryonic cultures, a volume of approximately 3 ml of calf tissue pelleted cells (PCV) derived from a single embryo was added to approximately 30 ml of H9PC + liquid medium (MS basal salt mixture (Murashige T., & MS modified vitamins containing 10 times less nicotinic acid and 5 times more thiamine-HCl, 2.0 mg / 1 2,4-D, 2.0 30 mg / 1 sucrose, 200 mg / 1 casein hydrolyzate (acid digestion), 100 mg / 1 myoinositol, 6 mM L-proline, 5% v / v water of coconut (added just before the subculture), pH 6.0). Suspension cultures were kept in the dark in 125 ml Erlenmeyer flasks on a temperature controlled shaker set at 125 rpm at 28øC. During the establishment of the cell line (2-3 months) the suspensions were cultured every 3.5 days by the addition of 3 ml PCV of cells and 7 ml of conditioned medium to 20 ml of fresh H9CP + liquid medium using a nozzle pipette long When maturity reached, as evidenced by doubling the growth, the suspensions were increased in volume and kept in 500 ml vials whereby 12 ml PCV cells and 28 ml conditioned media were transferred to 80 ml H9CP + medium. When the establishment of the suspension culture was completed, aliquots were cryopreserved for further use. See WO 2005/107437.

C. Isolamento e amplificação de DNAC. DNA isolation and amplification

Culturas de células Hill de milho como descritas atrás foram crescidas em frascos de 250 ml em meio GN6 padrão (meio N6, 2,0 mg/1 2,4-D, 30 g/1 sucrose, 2,5 g/1Corn Hill cell cultures as described above were grown in 250 ml vials in standard GN6 medium (N6 medium, 2.0 mg / l 2,4-D, 30 g / 1 sucrose, 2.5 g / l

Gelrite, pH 5,8) e o DNA genómico foi extraído usando o kit de extracção Plant DNeasy da Qiagen (Valencia, CA) de acordo com as recomendações do fabricante. As reacções de amplificação por PCR usando as sequências iniciadoras atrás descritas em todas as combinações possíveis foram realizadas nas seguintes condições: 25 μΐ de volume de reacção contendo 20ng gDNA matriz, 20pmol de cada sequência iniciadora, 1% DMSO e 10 unidades de polimerase Accuprime™ Pf (Invitrogen, Carlsbad, CA) no tampão do fabricante da enzima. Os produtos de amplificação variando entre 500 pb e 2 kb resultaram de ciclos de amplificação consistindo em 95 °C-1', (95°C-30", 57-62°C-30", 72°C-1') X 30, 72°C-5', 4°C-restante tempo. Os fragmentos amplificados foram clonados directamente em pCR2.1 (Invitrogen, Carlsbad, CA) usando o kit de clonagem TA da Invitrogen (Carlsbad, CA) de acordo com as recomendações do fabricante. D. Análise das sequências A análise anterior do gene IPP2-k em culturas singeneicas de milho 5XH751 e Hill indicaram a presença de 2-3 genes distintos compreendendo uma família pequena de genes (Sun et al., in press, Plant Physiology; W02006029296) . Assim, os fragmentos clonados isolados foram sequenciados com o kit de sequenciação CEQ Dye Terminator Cycle Sequencing Kit da Beckman Coulter (Fullerton, CA) de acordo com as recomendações do fabricante. A análise da sequência de múltiplos clones revelou que 2 fragmentos de genes distintos, derivados de 2 loci distintos e previamente caracterizados do genoma de milho, tinham sido isolados a partir de células Hill. A comparação das duas sequências isoladas a partir das células Hill cultivadas indicou que, nas regiões codificadoras previstas, existem pequenas diferenças, tais como polimorfismos em nucleótidos isolados (SNPs), entre os 2 paralogos, enquanto as regiões intrónicas e não codificadoras variam significativamente ao nível dos nucleótidos. Estas diferenças entre os 2 paralogos são notadas pois evidenciam regiões de sequências que podem ser discriminadas através de uma proteína de ligação a DNA dependente de sequência, como seja um domínio dedo de zinco. Os familiarizados com a área podem desenhar domínios de ligação a DNA dedos de zinco que se ligam a uma sequência de um gene e não a outra, sequência de um gene altamente semelhante. A sequência parcial do gene de 1,2 kb correspondendo ao paralogo de interesse (Fig. 66) foi seleccionada como matriz para o desenho de proteínas nucleases com dedos de zinco e subsequentemente sujeita à análise de domínios de ligação dedos de zinco atrás descrita.Gelrite, pH 5.8) and the genomic DNA was extracted using the Qiagen Plant DNeasy extraction kit (Valencia, CA) according to the manufacturer's recommendations. PCR amplification reactions using the primers described above in all possible combinations were performed under the following conditions: 25 μΐ reaction volume containing 20ng gDNA array, 20 pmole of each primer, 1% DMSO, and 10 units of Accuprime ™ polymerase Pf (Invitrogen, Carlsbad, CA) in the enzyme manufacturer's buffer. Amplification products ranging from 500 bp to 2 kb resulted from amplification cycles consisting of 95 ° C-1 ', (95 ° C-30 ", 57-62 ° C-30 ", 72 ° C-1') X 30, 72 ° C-5 ', 4 ° C-remainder time. The amplified fragments were cloned directly into pCR2.1 (Invitrogen, Carlsbad, CA) using the Invitrogen TA cloning kit (Carlsbad, CA) according to the manufacturer's recommendations. D. Analysis of Sequences Previous analysis of the IPP2-k gene in syngeneic cultures of 5XH751 and Hill maize indicated the presence of 2-3 distinct genes comprising a small family of genes (Sun et al., In press, Plant Physiology; WO2006029296) . Thus, isolated cloned fragments were sequenced with the Beckman Coulter CEQ Dye Terminator Cycle Sequencing Kit (Fullerton, CA) sequencing kit according to the manufacturer's recommendations. Analysis of the sequence of multiple clones revealed that 2 distinct gene fragments, derived from distinct and previously characterized loci of the maize genome, had been isolated from Hill cells. Comparison of the two isolated sequences from cultured Hill cells indicated that in the predicted coding regions, there are small differences, such as isolated nucleotide polymorphisms (SNPs), between the two paralogs, whereas the intronic and non-coding regions vary significantly at the level two nucleotides. These differences between the two paralogues are noted since they show regions of sequences that can be discriminated through a sequence dependent DNA binding protein, such as a zinc finger domain. Those skilled in the art can draw DNA finger binding domains that bind to a sequence of one gene and not to another, sequence of a highly similar gene. The partial sequence of the 1.2 kb gene corresponding to the paralog of interest (Fig. 66) was selected as the template for the design of zinc finger nucleases proteins and subsequently subjected to the analysis of zinc finger binding domains described above.

Exemplo 14: Desenho do dominlo dedo de zinco de ligação a DNA de IPP2-KExample 14: Design of the zinc-fingered domino of DNA binding of IPP2-K

Usando locais alvo identificados para IPP2-K, seleccionaram-se hélices de reconhecimento relativamente a dedos de zinco IPP2-K. Os desenhos dos dedos de zinco estão apresentados abaixo na Tabela 8:Using target sites identified for IPP2-K, recognition fingers were selected for zinc finger IPP2-K. The zinc finger designs are shown below in Table 8:

Tabela 8: Desenhos de dedos de zinco IPP2-KTable 8: Designs of zinc finger IPP2-K

Os locais alvo dos desenhos de dedos de zinco estão mostrados abaixo na Tabela 9:The target sites of the zinc finger designs are shown below in Table 9:

Tabela 8: Locais alvo dos dedos de zinco IPP2-KTable 8: Zinc finger target sites IPP2-K

Os desenhos de IPP2-K foram incorporados em vectores de expressão de dedos de zinco codificadores de uma proteína tendo a estrutura CCHC. Ver, Tabelas 1 a 4 atrás. As sequências codificadoras de dedos de zinco não canónicos foram então fundidas com o domínio de nuclease da enzima de restrição tipo IIS Fokl (aminoácidos 384-579 da sequência Wah et al. (1998) Proc. Natl. Acad. ScL USA 95:10564-10569 através de um ligante ZC de quatro aminoácidos) para formar ZFNs IPP2-K.The IPP2-K designs were incorporated into zinc finger expression vectors encoding a protein having the CCHC structure. See, Tables 1 to 4 above. The non-canonical zinc finger coding sequences were then fused to the Fokl IIS restriction enzyme nuclease domain (amino acids 384-579 of the sequence Wah et al. (1998) Proc. Natl. Acad. ScL USA 95: 10564- 10569 through a four amino acid ZC linker) to form IPP2-K ZFNs.

Exemplo 15: Correcção de genes usando dedos de zinco IPP2-K-nucleases A capacidade de ZFNs IPP2-K como aqui descrito para facilitar a recombinação homóloga foi testada no sistema GFP descrito em Urnov (2005) Nature 435(7042):646-51 e Publicação de Patente U.S. No. 20050064474 (e.g.,The ability of IPP2-K ZFNs as described herein to facilitate homologous recombination was tested in the GFP system described in Urnov (2005) Nature 435 (7042): 646-51 and U.S. Patent Publication No. 20050064474 (eg,

Exemplos 6-11) . Resumidamente, 50 ng de cada ZFN e 500 ng do dador GFP sem promotor (Urnov (2005) Nature) foram transfectados para 500000 células repórter, usando 2 μΐ de Lipofectamine 2000 por amostra, de acordo com o protocolo Lipofectamine 2000 da Invitrogen.Examples 6-11). Briefly, 50 ng of each ZFN and 500 ng of the no-promoter GFP donor (Urnov (2005) Nature) were transfected into 500,000 reporter cells using 2 μl of Lipofectamine 2000 per sample according to Invitrogen's Lipofectamine 2000 protocol.

Adicionou-se vinblastina 24 horas pós-transfecção numa concentração final de 0,2 μΜ e removeu-se 72 horas pós-transfecção.Twenty-four hours post-transfection was added to a final concentration of 0.2 μg and removed 72 hours post-transfection.

As células foram testadas relativamente à expressão de GFP 5 dias pós-transfecção através da medição de 40000 células por transfecção no analisador FACS de bancada Guava. Os resultados estão apresentados na Fig. 69.Cells were tested for GFP expression 5 days post-transfection by measuring 40,000 cells per transfection in the Guava bench-top FACS analyzer. The results are shown in Fig. 69.

Exemplo 16: Expressão de ZFNs C3H1 em células deExample 16: Expression of C3H1 ZFNs in

milho HiII A. Desenho de vectorescorn HiII A. Vector drawing

Construíram-se vectores plasmídicos para a expressão de proteínas com ZFNs em células de milho. De forma a optimizar a expressão e estequiometria relativa das 2 proteínas distintas necessárias para formar um heterodímero funcional dedo de zinco-nuclease, adoptou-se uma estratégia de expressão que resulta em grelhas de leitura abertas de ambos os monómeros ZFNs num único vector, dirigidas por um único promotor. Esta estratégia explora a funcionalidade da sequência 2A (Mattion, N.M., Harnish, E.C., Crowley, J. C. & Reilly, P.A. (1996) J. Virol. 70, 8124-8127) derivada do virus de Thesoa assigna, um sinal de localização nuclear (NLS) do gene opaque-2 (op-2) de milho (Maddaloni, M., Di Fonzo, N., Hartings, H., Lazzaroni, N., Salaminil, F., Thompson, R., & Motto M. (1989) Nucleic Acids Research Vol. 17(18):7532), e um promotor derivado do gene da ubiquitin-1 do milho (Christensen A.H., Sharrock R.A., & Quail P.H. (1992) PlantPlasmid vectors were constructed for the expression of proteins with ZFNs in maize cells. In order to optimize expression and relative stoichiometry of the 2 distinct proteins required to form a zinc-nuclease finger functional heterodimer, an expression strategy was adopted which results in open reading frames of both ZFN monomers in a single vector, directed by a single promoter. This strategy exploits the functionality of the Thesoa virus derived sequence 2A (Mattion, NM, Harnish, EC, Crowley, JC & Reilly, PA (1996) J. Virol. 70, 8124-8127), a nuclear localization signal (NLS) of the opaque-2 (op-2) gene of maize (Maddaloni, M., Di Fonzo, N., Hartings, H., Lazzaroni, N., Salaminil, F., Thompson, R., & Motto M. (1989) Nucleic Acids Research Vol. 17 (18): 7532), and a promoter derived from the corn ubiquitin-1 gene (Christensen AH, Sharrock RA, & Quail PH (1992) Plant

MoI Biol. 18(4):675-89). Seguiu-se um esquema de clonagem modular, em vários passos, para desenvolver estes vectores de expressão para qualquer par especifico de genes codificadores de ZFN seleccionados do arquivo biblioteca ou sintetizados de novo.MoI Biol. 18 (4): 675-89). A modular, multi-step cloning scheme was followed to develop these expression vectors for any specific pair of ZFN encoding genes selected from the library file or de novo synthesized.

Primeiro, um vector pVAX (ver, por exemplo, a Publicação de Patente U.S. 2005-0267061; a divulgação da qual é aqui incluída como referência) foi modificado para abranger o domínio de expressão N-terminal como se mostra na Fig. 65, painéis A a E. As características deste plasmídeo modificado (pVAX-N2A-NLSop2-EGFP-FokMono) (FIG. 65A) incluem um segmento redesenhado e sintetizado codificador de um NLS derivado de op-2 do milho (RKRKESNRESARRSRYRK, SEQ ID NO: 133) e um segmento rede senhado e sintetizado codificador do domínio de nuclease Fokl utilizando os codões mais usados pelo milho. Ainda, a inserção de um único nucleótido (C) a jusante do local único Xhol criou um local Saci extra por conveniência de clonagem.First, a pVAX vector (see, for example, U.S. Patent Publication 2005-0267061; the disclosure of which is incorporated herein by reference) was modified to encompass the N-terminal expression domain as shown in Fig. 65, panels A to E. The characteristics of this modified plasmid (pVAX-N2A-NLSop2-EGFP-FokMono) (FIG 65A) include a redesigned and synthesized segment encoding a corn op-2 derivative NLS (RKRKESNRESARRSRYRK, SEQ ID NO: 133 ) and a concatenated and synthesized network segment encoding the Fokl nuclease domain using the codons most commonly used by maize. In addition, insertion of a single nucleotide (C) downstream of the unique Xhol site has created an extra Saci site for convenience of cloning.

Segundo, um vector pVAX (ver, por exemplo, a Publicação de Patente U.S. 2005-0277061) foi igualmente modificado para abranger o domínio de expressão C-terminal As características deste plasmídeo modificado (pVAX-C2A-NLSop2-EGFP-FokMono) (FIG. 65B) incluem um segmento redesenhado e sintetizado codificador de um NLS derivado da op-2 de milho (RKRKE SNRE S ARRS RYRK, SEQ ID NO: 133) e um segmento redesenhado e sintetizado codificador do domínio nuclease Fokl usando os codões mais usados pelo milho. Ainda, a sequência 2A do vírus de Thosea asigna (EGRGSLLTCGD VEENPGP, SEQ ID NO: 134) foi introduzido no extremo N da ORF de ZFN para o fim da subsequente ligação dos domínios codificadores das 2 proteínas.Second, a pVAX vector (see, for example, U.S. Patent Publication 2005-0277061) was also modified to encompass the C-terminal expression domain The characteristics of this modified plasmid (pVAX-C2A-NLSop2-EGFP-FokMono) (FIG 65B) include a redesigned and synthesized segment encoding a corn op-2 derived NLS (RKRKE SNRE S ARRS RYRK, SEQ ID NO: 133) and a redesigned and synthesized segment encoding the Fokl nuclease domain using the codons most commonly used by corn. In addition, Sucha virus sequence 2A assigns (EGRGSLLTCGD VEENPGP, SEQ ID NO: 134) was introduced at the N-terminus of the ZFN ORF for the purpose of subsequent binding of the 2-protein coding domains.

As cassetes de genes codificadores das ORFs das proteínas individuais com dedos de zinco foram clonadas no vector N2A ou C2A através de ligação, usando as enzimas de restrição Kpnl e BamHI para criar extremos compatíveis. Em seguida, o fragmento BglII/Xhol do vector C2A foi inserido no vector N2A através dos mesmos locais de restrição, dando uma construção intermédia que possui uma cassete que inclui 2 domínios codificadores de ZFN flanqueados por locais de restrição Ncol e Saci.The gene cassettes encoding the ORFs of the individual zinc finger proteins were cloned into the N2A or C2A vector by ligation using restriction enzymes KpnI and BamHI to create compatible ends. Thereafter, the BglII / XhoI fragment of the C2A vector was inserted into the N2A vector through the same restriction sites, giving an intermediate construct having a cassette that includes 2 ZFN coding domains flanked by NcoI and SaciI restriction sites.

Finalmente, a cassete NcoI/SacI desta construção intermédia (Fig. 65C), contendo ambos os genes ZFN, foi excisada através de restrição usando aquelas enzimas e ligada ao esqueleto do plasmídeo pDAB3872 (FIG. 65D) . Os plasmídeos resultantes incluem os genes ZFN mais as sequências relevantes de promotor e terminador, mais marcas seleccionáveis para a manutenção do plasmídeo.Finally, the NcoI / SacI cassette of this intermediate construct (Fig. 65C), containing both ZFN genes, was excised by restriction using those enzymes and ligated to the backbone of plasmid pDAB3872 (FIG 65D). The resulting plasmids include the ZFN genes plus the relevant promoter and terminator sequences, plus selectable tags for the maintenance of the plasmid.

Nas construções finais, um exemplo das quais está mostrado na Fig. 65E, a cassete de expressão de ZFN (incluindo os elementos de promotor e terminador) é flanqueada por locais attL para uma manipulação conveniente usando o sistema Gateway da Invitrogen (Carlsbad, CA) . Cada uma das construções de ZFN geradas usando este esquema de clonagem foi usada para transformar células E. coli DH5a (Invitrogen, Carlsbad, CA) e subsequentemente mantida sob selecção adequada. B. Entrega de DNA e expressão transitóriaIn the final constructs, an example of which is shown in Fig. 65E, the ZFN expression cassette (including the promoter and terminator elements) is flanked by attL sites for convenient manipulation using the Invitrogen Gateway system (Carlsbad, CA) . Each of the ZFN constructs generated using this cloning scheme was used to transform E. coli DH5α cells (Invitrogen, Carlsbad, CA) and subsequently maintained under suitable selection. B. DNA delivery and transient expression

As preparações de plasmídeo dos vectores de expressão de ZFN construídos como descrito na Fig. 65E foram geradas a partir de 2 litros de cultura de células E. coli crescidas em meio LB mais dois antibióticos usando um kit Gigaprep da Qiagen (Valencia, CA) de acordo com as recomendações do fabricante. 0 DNA plasmídico foi entregue directamente a células de milho Hill em cultura usando uma variedade de métodos.The plasmid preparations of the ZFN expression vectors constructed as described in Fig. 65E were generated from 2 liters of E. coli cell culture grown in LB medium plus two antibiotics using a Gigaprep kit from Qiagen (Valencia, CA) of accordance with the manufacturer's recommendations. Plasmid DNA was delivered directly to Hill corn cells in culture using a variety of methods.

Num exemplo, as células de milho foram sujeitas a entrega de DNA através de Whoskers™. Aproximadamente 24 horas antes da entrega do DNA, 3 ml PCV de suspensão de células de milho Hill mais 7 ml de meio condicionado foram subcultivados em 20 ml de meio líquido GN6 (meio GN6 sem Gelrite) num frasco Erlenmeyer de 125 ml e colocados num agitador a 125 rpm, a 28°C, durante 24 horas. 2 ml de PCV foram removidos e adicionados a 12 ml de meio osmótico GN6 S/M (meio N6, 2,0 mg/1 2,4-D, 30 g/1 sucrose, 45,5 g/1 sorbitol, 45,5 g/1 manitol, 100 mg/L mioinositol, pH 6,0) num frasco Erlenmeyer de 125 ml. O frasco foi incubado no escuro durante 30-35 minutos, a 28°C, com agitação moderada (125 rpm). Durante este tempo, uma suspensão de 50 mg/ml de palhetas de carbeto de silício (Advanced Composite Materials, Inc., Eureka Springs, AK) foi preparada através da adição do volume apropriado de meio líquido GN6 S/M a palhetas pré-pesadas. Após incubação em GN6 S/M, os conteúdos de cada frasco foram vertidos num tubo de centrífuga cónico de 15 ml.In one example, the maize cells were subjected to DNA delivery through Whoskers ™. Approximately 24 hours prior to DNA delivery, 3 ml PCV of Hill corn cell suspension plus 7 ml of conditioned media were subcultured in 20 ml of GN6 liquid medium (GN6 medium without Gelrite) in a 125 ml Erlenmeyer flask and placed on a shaker at 125 rpm, at 28 ° C, for 24 hours. 2 ml of PCV were removed and added to 12 ml of GN6 S / M osmotic medium (N6 medium, 2.0 mg / l 2,4-D, 30 g / 1 sucrose, 45.5 g / 1 sorbitol, 5 g / 1 mannitol, 100 mg / L myoinositol, pH 6.0) in a 125 ml Erlenmeyer flask. The flask was incubated in the dark for 30-35 minutes at 28øC with moderate agitation (125 rpm). During this time, a suspension of 50 mg / ml of silicon carbide vanes (Advanced Composite Materials, Inc., Eureka Springs, AK) was prepared by adding the appropriate volume of GN6 S / M liquid medium to pre-weighed vanes . After incubation in GN6 S / M, the contents of each vial were poured into a 15 ml conical centrifuge tube.

Após sedimentação das células, todo o líquido GN6 S/M excepto 1 ml foi retirado e colhido no frasco de 125 ml para uso futuro. A suspensão pré-pesada de palhetas foi agitada com vórtex durante 60 segundos à velocidade máxima, 160 μΐ foi adicionado ao tubo de centrífuga usando uma ponta de micropipeta com filtro e de ponta larga, e adicionados 20 yg de DNA. O tubo foi agitado com vortex e imediatamente colocado num amalgamador dentário Caulk "Vari-Mix II", modificado para suportar um tubo de cultura de 17x100 mm e depois agitado durante 60 segundos a velocidade média. Após agitação, a mistura de células, meio, palhetas e DNA voltou para o frasco Erlenmeyer juntamente com 18 ml de mais meio líquido GN6. As células foram deixadas a recuperar num agitador a 125 rpm, durante 2 horas, a 28°C, no escuro.After sedimentation of the cells, all of the GN6 S / M liquid except 1 ml was withdrawn and collected in the 125 ml vial for future use. The preweighed vane suspension was vortexed for 60 seconds at full speed, 160 μΐ was added to the centrifuge tube using a broad-tip filter micropipette tip, and 20 μg of DNA added. The tube was vortexed and immediately placed in a Caulk ™ Vari-Mix II dental amalgamator modified to support a 17x100 mm culture tube and then stirred for 60 seconds at medium speed. After stirring, the mixture of cells, medium, vanes and DNA returned to the Erlenmeyer flask along with 18 ml of more GN6 liquid medium. Cells were allowed to recover on a shaker at 125 rpm for 2 hours at 28øC in the dark.

Aproximadamente 5-6 ml de suspensão dispersa foi filtrada através de um papel de filtro Whatman #4 (5,5 cm) usando uma unidade colectora de células em vidro, ligada a uma linha de vácuo, de forma a serem obtidos 5-6 filtros por amostra. Os filtros foram colocados em placas de 60 x 20 mm de meio G6N e cultivadas a 28°C no escuro. Após 24, 48 ou 72 horas, as células de 2-5 papéis de filtro foram raspadas, colhidas num tubo, colocadas em gelo seco e depois congeladas a -80°C.Approximately 5-6 ml of dispersed suspension was filtered through a Whatman # 4 (5.5 cm) filter paper using a glass cell collector unit connected to a vacuum line so that 5-6 filters per sample. The filters were plated onto 60 x 20 mm plates of G6N medium and grown at 28 ° C in the dark. After 24, 48 or 72 hours, the cells of 2-5 filter papers were scraped, collected in a tube, placed on dry ice and then frozen at -80Â ° C.

Num outro exemplo de entrega de DNA, as preparações de plasmídeo purificadas sem endonucleases foram entregues directamente a células de milho usando técnicas de bombardeamento com microprojécteis adaptadas do protocolo do fabricante do instrumento. Todos os bombardeamentos foram conduzidos com o sistema Biolistic PDS-1000/He™ (Bio-Rad Laboratories, Hercules, CA) . Para o revestimento das partículas, 3 mg de partículas de ouro com 1,0 micron de diâmetro foram lavadas uma vez com 100% de etanol, duas vezes com água estéril e ressuspensas em 50 μΐ de água num tubo Eppendorf siliconizado. Cinco microgramas de DNA plasmídico, 20 μΐ de espermidina (0,1 M) e 50 μΐ de cloreto de cálcio (2,5 M) foram adicionados à suspensão de ouro. A mistura foi incubada à temperatura ambiente durante 10 min, sedimentada a 10 Krpm durante 10 s, ressuspensa em 60 μΐ de etanol a 100% frio e 8-9 μΐ foram distribuídos por cada macroveículo. Para preparar as células para bombardeamento, grupos de células foram removidos da cultura líquida 3 dias após subcultura e colocados numa placa de petri de 2,5 cm de diâmetro contendo meio osmótico consistindo em meio de crescimento mais 0,256 M de manitol e sorbitol. As células foram incubadas em meio osmótico durante 4 h antes do bombardeamento. O bombardeamento decorreu no instrumento atrás descrito colocando-se o tecido na prateleira do meio nas condições de 1100 psi e vácuo de 27 polegadas Hg e seguindo o manual de manuseamento. Às 24 horas pós-tratamento, o conjunto de células bombardeadas foi colhido, congelado em N2 líquido e guardado a -80°C.In another example of DNA delivery, the purified plasmid preparations without endonucleases were delivered directly to maize cells using microprojectile bombardment techniques adapted from the protocol of the instrument manufacturer. All bombardments were conducted with the Biolistic PDS-1000 / He ™ system (Bio-Rad Laboratories, Hercules, CA). For coating the particles, 3 mg of 1.0 micron diameter gold particles were washed once with 100% ethanol, twice with sterile water and resuspended in 50 μl of water in a siliconized Eppendorf tube. Five micrograms of plasmid DNA, 20 μ of spermidine (0.1 M) and 50 μ of calcium chloride (2.5 M) were added to the gold suspension. The mixture was incubated at room temperature for 10 min, sedimented at 10 Krpm for 10 s, resuspended in 60 μΐ of cold 100% ethanol and 8-9 μΐ were distributed over each macroveicle. To prepare the cells for bombardment, groups of cells were removed from the liquid culture 3 days after subculture and placed in a 2.5 cm diameter petri dish containing osmotic medium consisting of growth medium plus 0.256 M mannitol and sorbitol. Cells were incubated in osmotic medium for 4 h prior to bombardment. The bombardment took place in the instrument described above by placing the fabric on the middle shelf under the conditions of 1100 psi and vacuum of 27 inches Hg and following the manual of handling. At 24 hours post-treatment, the bombarded cell pool was harvested, frozen in liquid N2 and stored at -80 ° C.

Um outro exemplo de entrega de DNA e expressão transitória de ZFNs em células de milho envolveu a utilização de preparações de protoplastos. Usando os métodos modificados de Mitchell and Petolino (1991) J. Plant. Physiol. 137: 530-536 e Lyznik et al. (1995) Plant J. 8(2): 177-186), prepararam-se protoplastos a partir de culturas de células de milho Hill. As culturas em suspensão foram colhidas 48 horas após subcultura (crescimento a meio da fase logarítmica) através de centrifugação a 1000 rpm durante 5 minutos. O meio de cultura foi removido e 5 ml PCV sedimentado foi suavemente lavado em 10 ml de meio W5 (154 mM NaCl2; 125 mM CaCl2 H2O; 5 mM KCI2; 5 mM glucose; pH 5,8) .Another example of DNA delivery and transient expression of ZFNs in maize cells involved the use of protoplast preparations. Using the modified methods of Mitchell and Petolino (1991) J. Plant. Physiol. 137: 530-536 and Lyznik et al. (1995) Plant J. 8 (2): 177-186), protoplasts were prepared from Hill corn cell cultures. Suspension cultures were harvested 48 hours after subculture (growth in the middle of the log phase) by centrifugation at 1000 rpm for 5 minutes. The culture medium was removed and 5 ml PCV pelleted was gently washed in 10 ml W5 medium (154 mM NaCl2, 125 mM CaCl2 H2O, 5 mM KCl2, 5 mM glucose, pH 5.8).

As células lavadas foram colhidas por centrifugação a 100 rpm durante 5 minutos e subsequentemente incubadas numa mistura de enzimas contendo % celulase Y-C + 0,3% pectoliase Y23 (Karlan Research Products Corp., Cottonwood, AZ) em 25 ml de meio K3 esterilizado por filtração (2,5 g KNO3; 250 mg NH4NO3; 900 mg CaCl2 (diidratado) ; 250 mg Mg2S04; 250 mg NH4SO4; 150 mg NaPCh (monobásico); 250 mg xilose; 10 ml stock sulfato ferroso/quelato (F318); 1 ml micronutriente B5 (1000X stock - 750 mg iodeto de potássio; 250 mg ácido molíbdico (sal sódico) desidratado; 25 mg cloreto de cobalto; 25 mg sulfato cúprico); 10 ml Vitaminas K3 (10OX stock - 1 g mio-inositol; 10 mg piridoxina HC1; 100 mg tiamina HC1; 10 mg ácido nicotínico);+ 0,6M manitol; pH=5,8]. As células foram incubadas a 25°C durante 5-6 horas com agitação suave (50 rpm) de modo a digerir a parede secundária da célula vegetal.The washed cells were harvested by centrifugation at 100 rpm for 5 minutes and subsequently incubated in a mixture of% cellulase YC + 0.3% pectinase Y23 (Karlan Research Products Corp., Cottonwood, AZ) in 25 ml of K3 medium sterilized by (2.5 g KNO 3, 250 mg NH 4 NO 3, 900 mg CaCl 2 (dihydrate), 250 mg MgSO 4, 250 mg NH 4 SO 4, 150 mg NaPCh (monobasic), 250 mg xylose, 10 ml ferrous sulfate / chelate stock (F318); ml micronutrient B5 (1000X stock - 750 mg potassium iodide 250 mg molybdic acid (sodium salt) dehydrated 25 mg cobalt chloride 25 mg cupric sulfate) 10 ml Vitamins K3 (10 OX stock - 1 g myo-inositol; The cells were incubated at 25Â ° C for 5-6 hours with gentle shaking (50 rpm) in vacuo. to digest the secondary wall of the plant cell.

Quando da degradação da parede celular, a mistura de enzimas-células foi filtrada através de um coador de células de 100 micron e o material não retido, contendo protoplastos e detritos celulares, foi lavado com igual volume de meio K3+0,6M manitol. Os protoplastos foram centrifugados a 800 rpm durante 5 minutos, o sobrenadante foi rejeitado e a lavagem repetida. O sedimento de protoplastos foi ressuspenso e lavado em 20 ml de solução K3 + 0,6 M manitol + 9% Ficoll 400. Dez ml desta solução foi distribuído por 2 tubos de plástico estéreis e cobriu-se suavemente a suspensão com 2 ml de meio TM (19,52 g MES; 36, 45 g manitol; 40 ml 2M CaCl2 H2O stock; pH=5,5)), formando um gradiente descontínuo.Upon cell wall degradation, the cell-enzyme mixture was filtered through a 100 micron cell strainer and the unretained stock containing protoplasts and cell debris was washed with an equal volume of K3 + 0.6M mannitol medium. The protoplasts were centrifuged at 800 rpm for 5 minutes, the supernatant discarded and repeated washing. The protoplast pellet was resuspended and washed in 20 ml K3 + 0.6 M solution mannitol + 9% Ficoll 400. Ten ml of this solution was distributed through 2 sterile plastic tubes and the suspension was gently covered with 2 ml of medium (19.52 g MES, 36.45 g mannitol, 40 ml 2M CaCl 2 H 2 O stock, pH = 5.5)), forming a discontinuous gradient.

Os protoplastos viáveis foram separados dos protoplastos não viáveis, detritos celulares e suspensão de células intactas através de centrifugação a 800 rpm durante 5 minutos. A banda de protoplastos distinta, formada na interface do gradiente, foi removida com uma pipeta e lavada com 10 ml de solução TM fresca, seguido de centrifugação a 800 rpm durante 5 minutos. O sedimento de protoplastos resultante foi ressuspenso em 1 ml de meio TM e o número de protoplastos viáveis foi quantificado por coloração com 25 mg/ml de diacetato de fluoresceína (FDA) num hemocitómetro. A solução de protoplastos foi ajustada a uma concentração final de lxlO7 protoplastos/ml em meio TM.Viable protoplasts were separated from non-viable protoplasts, cell debris and suspension of intact cells by centrifugation at 800 rpm for 5 minutes. The distinct protoplast band formed at the gradient interface was pipetted and washed with 10 ml of fresh TM solution followed by centrifugation at 800 rpm for 5 minutes. The resulting protoplast pellet was resuspended in 1 ml TM medium and the number of viable protoplasts was quantified by staining with 25 mg / ml fluorescein diacetate (FDA) on a hemocytometer. The protoplast solution was adjusted to a final concentration of 1x107 protoplasts / ml in TM medium.

Aproximadamente lxlO6 protoplastos (100 μΐ) foram transferidos para um tubo Eppendorf contendo 10-80 yg de DNA plasmídico purificado. 100 μΐ de uma solução a 40% de PEG-3350 (Sigma Chemical Co., St. Louis, MO) foi adicionada gota-a-gota e a suspensão misturada suavemente. A mistura de protoplastos/DNA foi incubada durante 30 minutos à temperatura ambiente, seguido de uma diluição gota-a-gota com 1 ml de meio de crescimento GN6. Os protoplastos diluídos foram incubados neste meio durante 24 horas, a 25°C, e subsequentemente colhidos, congelados em N2 líquido e guardados a -80°C.Approximately 1 x 106 protoplasts (100 μΐ) were transferred to an Eppendorf tube containing 10-80 μg of purified plasmid DNA. 100 μl of a 40% solution of PEG-3350 (Sigma Chemical Co., St. Louis, MO) was added dropwise and the slurry mixed gently. The protoplast / DNA mixture was incubated for 30 minutes at room temperature, followed by a dropwise dilution with 1 ml of GN6 growth medium. The diluted protoplasts were incubated in this medium for 24 hours at 25 ° C and subsequently collected, frozen in liquid N2 and stored at -80 ° C.

Exemplo 17: funcionalidade de ZFN in vivo A funcionalidade de um ZFN neste exemplo é entendida como incluindo (mas não lhe estando limitada) a capacidade de um ZFN expressar-se em células de uma espécie cultivada e desse ZFN mediar uma quebra de cadeia dupla no genoma endógeno desse cultivar, através do reconhecimento, ligação e corte do seu alvo pretendido. É também entendido que, neste exemplo, o alvo do ZFN é um gene num locus e conformação endógenos dentro do genoma do cultivar.The functionality of a ZFN in vivo in this example is understood to include (but is not limited to) the ability of a ZFN to express itself in cells of a cultured species and that ZFN mediate a double strand break in the endogenous genome of this cultivar, through the recognition, binding and cutting of its intended target. It is also understood that, in this example, the ZFN target is a gene at an endogenous locus and conformation within the genome of the cultivar.

De forma a avaliar se os ZFNs possuem funcionalidade contra o gene alvo previsto num contexto genómico, foram estabelecidos ensaios baseados em sequências de DNA. Prevê-se que as quebras de DNA de cadeia dupla induzidas por ZFNs induzam mecanismos de reparação como ligação de extremos não homólogos (NHEJ) (revisto por Cahill et al., (2006) Mechanisms Front Biosci. 1(11): 1958-76). Um desfecho de NHEJ é que uma proporção das cadeias de DNA partidas sejam reparadas numa forma imperfeita, resultando em pequenas deleções, inserções ou substituições no local de civagem. Os familiarizados com a áres podem detectar estas alterações na sequência de DNA através de uma variedade de métodos.In order to assess whether ZFNs have functionality against the predicted target gene in a genomic context, assays based on DNA sequences have been established. ZFN-induced double-stranded DNA breaks are predicted to induce repair mechanisms as non-homologous (NHEJ) binding (reviewed by Cahill et al., (2006) Mechanisms Front Biosci. 1 (11): 1958-76 ). One end of NHEJ is that a proportion of the broken DNA strands are repaired in an imperfect form, resulting in minor deletions, insertions or substitutions at the locus of DNA. Those skilled in the art can detect these changes in the DNA sequence through a variety of methods.

A. Clonagem e seguenciação baseada em PCRA. PCR-based cloning and sequencing

Num exemplo, as células de culturas Hill de milho expressando proteínas ZFN foram isoladas às 24 horas pós- transformação, congeladas e sujeitas a extracção de DNA genómico usando o kit de extracção da Qiagen (Valencia, CA) Plant DNeasy de acordo com as recomendações do fabricante. A amplificação por PCR foi realizada usando sequências iniciadoras oligonucleotídicas específicas para o gene alvo e flanqueando o local de clivagem previsto do ZFN. Uma sequência iniciadora para PCR com orientação directa (5' — GGAAGCATTATTCCAATTTGATGATAATGG-3 ') (SEQ ID NO: 135) e uma sequência iniciadora para PCR com orientação reversa (5' — CCCAAGTGTCGAGGTTGTCAATATGTTAC-3' ) (SEQ ID NO: 136) específica do paralogo do gene IPP2-K foram usadas em combinação para amplificar DNA genómico purificado nas seguintes condições: 25 μΐ de volume de reacção contendo 20ng de gDNA matriz, 20 pmol de cada sequência iniciadora, 1% DMSO e 10 unidades da polimerase Accuprime Pf (Invitrogen, Carlsbad, CA) no tampão do fabricante da enzima. Produtos de amplificação com o tamanho esperado resultaram de ciclos de amplificação consistindo em 95°C-1', (95 °C-30", 61°C-30", 72°C-1') X 30, 72°C-5', 4°C-restante.In one example, corn Hill cell cells expressing ZFN proteins were isolated at 24 hours post-processing, frozen and subjected to genomic DNA extraction using the Qiagen (Valencia, CA) Plant DNeasy extraction kit according to the recommendations of the manufacturer. PCR amplification was performed using oligonucleotide primer sequences specific for the target gene and flanking the predicted cleavage site of the ZFN. A primer with direct orientation PCR (5'-GGAAGCATTATTCCAATTTGATGATAATGG-3 ') (SEQ ID NO: 135) and a specific reverse primer PCR (5'-CCCAAGTGTCGAGGTTGTCAATATGTTAC-3') (SEQ ID NO: 136) were used in combination to amplify purified genomic DNA under the following conditions: 25 μl reaction volume containing 20ng of gDNA matrix, 20 pmol of each primer, 1% DMSO and 10 units of the Accuprime Pf polymerase ( Invitrogen, Carlsbad, CA) in the enzyme manufacturer's buffer. Amplification products of the expected size resulted from amplification cycles consisting of 95Â ° C-1 ', (95Â ° C-30Â °, 61Â ° C-30Â °, 72Â ° C-1') X 30.72Â ° C- 5 ', 4 ° C-remainder.

Os fragmentos amplificados foram clonados directamente no vector pCR2.1 (Invitrogen, Carlsbad, CA) usando o kit de clonagem TA da Invitrogen (Carlsbad, CA) . Os fragmentos clonados isolados foram sequenciados com o kit de sequenciação CEQ Dye Terminator Cycle Sequencing Kit da Beckman Coulter (Fullerton, CA) de acordo com as recomendações do fabricante num formato de 96 alvéolos. Nesta experiência, prevê-se que as proteínas ZFN se liguem a 2 sequências curtas específicas do gene IPP2-K para criar uma nuclease heterodimérica que corta o dsDNA como se mostra na Fig. 66. A análise dos resultados de sequenciação de múltiplos clones revelaram que o clone #127 continha uma pequena deleção no local de clivagem por ZFN exactamente previsto, indicando que o mecanismo NHEJ tinha mediado uma reparação imperfeita da sequência de DNA nesse local (Fig. 67) .The amplified fragments were cloned directly into the pCR2.1 vector (Invitrogen, Carlsbad, CA) using the Invitrogen TA cloning kit (Carlsbad, CA). The isolated cloned fragments were sequenced with the Beckman Coulter CEQ Dye Terminator Cycle Sequencing Kit (Fullerton, CA) according to the manufacturer's recommendations in a 96-well format. In this experiment, ZFN proteins are predicted to bind to 2 specific short sequences of the IPP2-K gene to create a heterodimeric nuclease that cleaves the dsDNA as shown in Fig. 66. Analysis of the sequencing results of multiple clones revealed that clone # 127 contained a small deletion at the exactly predicted ZFN cleavage site, indicating that the NHEJ mechanism had mediated an imperfect repair of the DNA sequence at that site (Fig.

Estes resultados demonstram a capacidade destes ZFNs manipulados para induzir quebras de cadeia dupla dirigidas, numa forma específica, num locus de um gene endógeno dentro de um cultivar. B. Análise por sequenciação massiva paralelaThese results demonstrate the ability of these ZFNs engineered to induce double stranded breaks directed, in a specific form, into a locus of an endogenous gene within a cultivar. B. Analysis by parallel mass sequencing

Num outro exemplo, uma combinação de PCR e de métodos de piro-sequenciação massiva paralela foram aplicados para questionar os genomas de múltiplas amostras de células expressando diferentes proteínas ZFN dirigidas contra esta mesma sequência. Foram sintetizadas três variantes de uma sequência iniciadora de PCR com orientação directa (5'-XXXCACCAAGTTGTATTGCCTTCTCA-3') (SEQ ID NO: 137) em que XXX=GGG, CCC ou GGC e três variantes de uma sequência inicidora de PCR de orientação reversa (5'-XXXAT AGGCTTGAGCCAAGCAATCTT-3 ' ) (SEQ ID NO: 138) em que XXX=GCC, CCG ou CGG (IDT, Coralville, IA) . As etiquetas de 3 pb no extremo 5' de cada sequência iniciadora servem como uma chave identificadora e indicam a amostra celular de onde deriva o amplicão. Pares de sequências iniciadoras com etiquetas (chaves) identificadoras correspondentes foram usados em combinação para amplificar DNA genómico purificado derivado de amostras de células de milho nas seguintes condições: 50 μΐ de volume de reacção contendo 40 ng de gDNA matriz, 20 pmoles de cada sequência iniciadora, 1% DMSO e 10 unidades de polimerase Accuprime™ Pf (Invitrogen, Carlsbad, CA) no tampão do fabricante da enzima. Os produtos de amplificação do tamanho esperado resultaram de ciclos de amplificação consistindo em 95°C-1', (95°C-30", 65°C-30", 72°C-1') X 30, 72°C-5', 4°C-restante tempo e foram purificados usando o kit de purificação da Qiagen (Valencia, CA) MinElute PCR de acordo com as recomendações do fabricante.In another example, a combination of PCR and parallel mass pyro-sequencing methods were applied to query the genomes of multiple cell samples expressing different ZFN proteins directed against this same sequence. Three variants of a direct guiding PCR primer (5'-XXXCACCAAGTTGTATTGCCTTCTCA-3 ') (SEQ ID NO: 137) where XXX = GGG, CCC or GGC were synthesized and three variants of a reverse-oriented PCR primer (5'-XXXAT AGGCTTGAGCCAAGCAATCTT-3 ') (SEQ ID NO: 138) where XXX = GCC, CCG or CGG (IDT, Coralville, IA). The 3 bp labels at the 5 'end of each primer serve as a tag and indicate the cell sample from which the amplicon is derived. Pairs of primer sequences with corresponding tag (s) were used in combination to amplify purified genomic DNA derived from maize cell samples under the following conditions: 50 μl reaction volume containing 40 ng of gDNA array, 20 pmol of each primer sequence , 1% DMSO and 10 units Accuprime ™ Pf polymerase (Invitrogen, Carlsbad, CA) in the enzyme manufacturer's buffer. The amplification products of the expected size resulted from amplification cycles consisting of 95 ° C-1 ', (95 ° C-30 ° C, 65 ° C-30 ° C, 72 ° C-1') X 30.72 ° C- 5 ', 4Â ° C-remainder time and were purified using the Qiagen (Valencia, CA) MinElute PCR purification kit according to the manufacturer's recommendations.

As reacções de piro-sequenciação paralela massiva (também conhecidas como sequenciação 454) foram realizadas directamente nos produtos de PCR como descrito em (Margulies et al. (2005) Nature 437: 376-380) por 454 Life Sciences (Branford, CT). A análise dos resultados de sequenciação 454 foi realizada através da identificação de leituras de sequências contendo deleções do tamanho e posição esperadas dentro da molécula de DNA.Mass parallel pyro-sequencing reactions (also known as 454 sequencing) were performed directly on the PCR products as described in (Margulies et al. (2005) Nature 437: 376-380) by 454 Life Sciences (Branford, CT). The analysis of sequencing results 454 was performed by identifying sequence readings containing deletions of expected size and position within the DNA molecule.

Os resultados destas análises indicaram a presença de múltiplas deleções pequenas no local de clivagem esperado para estas ZFNs, como se mostra na Fig. 68. Estas deleções estão precisamente localizadas no local alvo de ZFN e indicam que quebras ds, induzidas por ZFN, foram geradas no genoma e subsequentemente reparadas por NHEJ. Estes resultados ainda demonstram a capacidade destes ZFNs manipulados para induzir quebras de cadeia dupla dirigidas numa forma especifica num locus de gene endógeno dentro de um cultivar.The results of these analyzes indicated the presence of multiple small deletions at the expected cleavage site for these ZFNs as shown in Fig. 68. These deletions are precisely located at the target site of ZFN and indicate that ZFN induced ds breaks were generated in the genome and subsequently repaired by NHEJ. These results further demonstrate the ability of these engineered ZFNs to induce targeted double stranded breaks in a specific form at an endogenous gene locus within a cultivar.

Exemplo 18: Desenho de DNA dador para integração dirigidaExample 18: Donor DNA design for targeted integration

Neste exemplo, o DNA dador é entendido como incluindo moléculas de DNA de cadeia dupla que são entregues nas células vegetais e incorporadas no genoma nuclear. 0 mecanismo pelo qual esta incorporação ocorre pode ser via ligação de extremos não homóloga independente de homologia (NHEJ; revisto por Cahill et al., (2006) Mechanisms Front Biosci. 1:1958-76) ou um outro mecanismo semelhante no local de uma quebra na cadeia dupla no DNA nuclear. Tal incorporação do DNA dador tipo ligação conduzida por NHEJ no genoma é referida como integração aleatória, uma vez que a posição da integração do DNA dador é determinada principalmente pela presença de uma quebra de DNA de cadeia dupla. Neste mecanismo, a integração do DNA dador no genoma não está dependente da sequência de nucleótidos do genoma no local da quebra ou da sequência nucleotidica do próprio dador. Assim, durante a integração aleatória, o "endereço" no genoma onde o DNA dador é incorporado não está especificado nem previsto com base na sequência do DNA dador. A integração aleatória é o principal mecanismo pelo qual a transgenese do DNA dador ocorre durante a transformação padrão de plantas via entrega de DNA mediada por Agrobacterium ou por biolistica nas células vegetais.In this example, donor DNA is understood to include double-stranded DNA molecules that are delivered to plant cells and incorporated into the nuclear genome. The mechanism by which this incorporation occurs may be via homology-independent homology linkage (NHEJ; revised by Cahill et al., (2006) Mechanisms Front Biosci. 1: 1958-76) or another similar mechanism at the site of a breaking the double strand in nuclear DNA. Such incorporation of the NHEJ-driven binding donor DNA into the genome is referred to as random integration, since the position of the donor DNA integration is determined primarily by the presence of a double-stranded DNA break. In this mechanism, the integration of donor DNA into the genome is not dependent on the nucleotide sequence of the genome at the site of the donor's own nucleotide break or sequence. Thus, during random integration, the " address " in the genome where the donor DNA is incorporated is neither specified nor predicted based on the donor DNA sequence. Random integration is the major mechanism by which transgenesis of donor DNA occurs during standard transformation of plants via Agrobacterium-mediated DNA delivery or by biolysis in plant cells.

Ao contrário da integração aleatória, o DNA dador pode também ser incorporado no genoma através de integração dirigida. A integração dirigida é entendida como ocorrendo no local de uma quebra da cadeia dupla (posição) através de mecanismos dependentes de homologia tais como emparelhamento de cadeia simples dependente de homologia ou recombinação homóloga (revisto em van den Bosch et al. (2002) Biol Chem. 383(6): 873-892). No caso de reparação de quebras de DNA dependentes de homologia, o DNA dador que contém a sequência nucleotidica com identidade ou similaridade com o DNA do local da quebra pode ser incorporado nesse local. Assim, o "endereço" em que o DNA dador se integra no genoma está dependente da identidade de sequência de nucleótidos ou similaridade de sequências entre as moléculas do genoma e de DNA dador. Nos sistemas vegetais, sabe-se que a reparação das quebras de cadeia dupla no DNA utiliza as vias de NHEJ e dependente de homologia (revisto em Puchta (2005) J. Exp. Bot. 56: 1-14) .Unlike random integration, donor DNA can also be incorporated into the genome through targeted integration. Targeted integration is understood to occur at the site of a double-stranded breakdown (position) through homology-dependent mechanisms such as homology-dependent simple chain matching or homologous recombination (reviewed in van den Bosch et al. (2002) Biol Chem 383 (6): 873-892). In the case of repairing homology-dependent DNA breaks, the donor DNA containing the nucleotide sequence with identity or similarity to the DNA of the site of the break can be incorporated therein. Thus, the " address " wherein the donor DNA integrates into the genome is dependent on the nucleotide sequence identity or sequence similarity between the genome and donor DNA molecules. In plant systems, repair of double strand breaks in DNA is known to utilize NHEJ and homology-dependent pathways (reviewed in Puchta (2005) J. Exp. Bot. 56: 1-14).

Neste exemplo, descrevemos o desenho e construção de moléculas de DNA dador a serem integradas no genoma, via integração dirigida, no local de uma quebra de cadeia dupla induzida por proteínas ZFN especificas de sequência.In this example, we describe the design and construction of donor DNA molecules to be integrated into the genome via targeted integration at the site of a double strand break induced by sequence specific ZFN proteins.

Diferentes proteínas ZFN podem induzir quebras da cadeia dupla em diferentes nucleótidos na sequência do gene alvo; o local específico da quebra da cadeia dupla induzida é referido como a posição.Different ZFN proteins can induce double-strand breaks in different nucleotides in the target gene sequence; the specific location of the induced double strand break is referred to as the position.

Como descrito no Exemplo 13, caracterizámos a sequência nucleotídica de um gene alvo, IPP2K do milho. Subsequentemente, desenhámos proteínas ZFN para se ligarem a bases específicas daquele gene alvo (Exemplo 14) e validámos a sua actividade de ligação/clivagem naquela sequência dentro do gene alvo em ambos os sistemas heterólogos e contra o gene endógeno em células de milho (Exemplos 15-17). Aqui, descrevemos a construção de várias moléculas dadoras desenhadas para se incorporarem no genoma de milho na posição da quebra de cadeia dupla mediada por ZFN no gene IPP2K via integração dirigida. Os familiarizados com a técnica podem construir uma molécula de DNA dadora desenhada para se incorporar numa quebra de cadeia dupla, induzida por ZFN via integração dirigida conduzida por homologia, em qualquer posição em qualquer genoma para o qual seja conhecida a sequência nucleotídica e seja previsto que essa sequência contenha uma quebra de cadeia dupla.As described in Example 13, we characterize the nucleotide sequence of a target gene, maize IPP2K. Subsequently, we designed ZFN proteins to bind to specific bases of that target gene (Example 14) and validated their binding / cleavage activity in that sequence within the target gene in both heterologous systems and against the endogenous gene in maize cells (Examples 15 -17). Here we describe the construction of various donor molecules designed to incorporate into the maize genome in the position of the ZFN-mediated double-strand break in the IPP2K gene via targeted integration. Those skilled in the art can construct a donor DNA molecule designed to incorporate into a double stranded, ZFN-induced breakdown via homology driven homology at any position in any genome for which the nucleotide sequence is known and is predicted to this sequence contains a double stranded break.

Numa realização aqui descrita, a molécula de DNA dador compreende uma cassete autónoma de expressão do gene de tolerância a herbicida delimitada por segmentos de sequência nucleotídica idêntica à do gene alvo, IPP2K na posição alvo. Nesta realização, a cassete autónoma de tolerância a herbicida inclui uma unidade completa de promotor-transcrição (PTU) contendo um promotor, o gene de tolerância a herbicida e sequência terminadora funcionais em células vegetais. Os familiarizados com a técnica podem seleccionar qualquer combinação de promotor, gene e terminador para constituir a PTU autónoma. Também estão incluídos nesta construção de plasmídeo fragmentos de DNA com identidade de sequências relativamente ao gene alvo no milho (IPP2K) na posição indicada. Estes fragmentos servem como "sequências flanqueantes de homologia" do DNA dador e incorporação directa deste dador no gene alvo na posição especificada através de integração dirigida. As sequências flanqueantes de homologia são colocadas a montante e a jusante da PTU na orientação 5'-3' correcta relativamente a PTU. Os familiarizados com a técnica podem considerar sequências flanqueantes de homologia de tamanho e orientação diferentes numa construção de DNA dador.In one embodiment described herein, the donor DNA molecule comprises an autonomous herbicide tolerance gene expression cassette delimited by nucleotide sequence segments identical to that of the target gene, IPP2K at the target position. In this embodiment, the autonomous herbicide tolerance cassette includes a full promoter-transcription unit (PTU) containing a promoter, the herbicide tolerance gene and functional terminator sequence in plant cells. Those skilled in the art may select any combination of promoter, gene and terminator to constitute the autonomous PTU. Also included in this plasmid construct are DNA fragments with sequence identity to the target gene in maize (IPP2K) at the indicated position. These fragments serve as " flanking sequences of homology " of the donor DNA and direct incorporation of this donor into the target gene at the specified position through targeted integration. Homology flanking sequences are placed upstream and downstream of the PTU in the correct 5'-3 'orientation relative to PTU. Those skilled in the art may consider flanking sequences of homology of different size and orientation in a donor DNA construct.

Numa outra realização aqui descrita, a molécula de DNA dador compreende uma construção de plasmídeo contendo uma cassete de expressão do gene de tolerância a herbicida não autónoma, flanqueada por segmentos de sequência nucleotídica idênticos aos de IPP2K na posição alvo. Nesta realização, a cassete de tolerância a herbicida não autónoma inclui uma unidade de promotor-transcrição (PTU) incompleta que não possui um promotor funcional. A PTU não autónoma possui um gene de tolerância a herbicida e sequência terminadora funcional em células vegetais. Os familiarizados com a técnica podem seleccionar qualquer combinação de gene e terminador para constituir uma PTU não autónoma. Neste exemplo de um dador não autónomo, a expressão do gene da tolerância a herbicida é dependente da incorporação do segmento dador numa localização genómica próxima de um promotor funcional que pode dirigir a expressão daquele gene. Deve-se considerar a situação relativamente rara em que o dador será incorporado através de integração aleatória num locus genético onde se situe, por serendipidade, um promotor e esteja disponível para dirigir a expressão do gene de tolerância a herbicida. Como alternativa, baseado na presença de sequências flanqueantes de homologia dos fragmentos de DNA de tamanho adequado com identidade de sequência com o gene alvo numa posição especificada em milho dentro da construção de DNA dador, pode ocorrer integração dirigida precisa do DNA dador no gene alvo na posição especificada (como descrito para o dador autónomo) e portanto explora o promotor endógeno do referido gene alvo. Nesta realização, as sequências flanqueantes de homologia são colocadas a montante e a jusante da PTU na orientação correcta 5'-3' relativamente à PTU. Os familiarizados com a técnica podem considerar sequências flanqueantes de homologia de tamanho e orientação diferentes numa construção de DNA dador.In another embodiment described herein, the donor DNA molecule comprises a plasmid construct containing a non-autonomous herbicide tolerance gene expression cassette flanked by nucleotide sequence segments identical to those of IPP2K at the target position. In this embodiment, the non-autonomous herbicide tolerance cassette includes an incomplete promoter-transcription unit (PTU) which lacks a functional promoter. Non-autonomous PTU has a herbicide tolerance gene and functional terminator sequence in plant cells. Those skilled in the art may select any combination of the gene and terminator to constitute a non-autonomous PTU. In this example of a non-autonomous donor, expression of the herbicide tolerance gene is dependent upon incorporation of the donor segment at a genomic location close to a functional promoter that can direct the expression of that gene. Consideration should be given to the relatively rare situation in which the donor will be incorporated by random integration into a genetic locus where a promoter is serendipitously located and available to direct expression of the herbicide tolerance gene. As an alternative, based on the presence of flanking sequences of homology of DNA fragments of suitable size with sequence identity to the target gene at a specified position in maize within the donor DNA construct, precise targeting of donor DNA into the target gene can occur in the target gene position (as described for the autonomous donor) and therefore exploits the endogenous promoter of said target gene. In this embodiment, the homology flanking sequences are placed upstream and downstream of the PTU at the correct orientation 5'-3 'to the PTU. Those skilled in the art may consider flanking sequences of homology of different size and orientation in a donor DNA construct.

Em ambas as realizações aqui descritas (desenho de dador autónomo e não autónomo), as construções de plas-mídeo, tipicamente, possuem elementos adicionais para permitir a clonagem, expressão do gene de tolerância a herbicida e subsequente análise. Tais elementos incluem origens de replicação bacterianas, locais de restrição manipulados, etc. e são descritos abaixo. Os familiarizados com a técnica podem considerar a utilização de diferentes elementos constituintes de uma molécula de DNA dador. A. Estirpes bacterianas e condições de culturaIn both embodiments described herein (autonomous and non-autonomous donor design), plasmid constructs typically have additional elements to enable cloning, herbicide tolerance gene expression and subsequent analysis. Such elements include bacterial origins of replication, restricted restriction sites, etc. and are described below. Those skilled in the art may consider using different constituent elements of a donor DNA molecule. A. Bacterial strains and culture conditions

Estirpes de Escherichia coli (One Shot® Top 10 Chemically Competent Cells; MAX Efficiency® DH5a™ Chemically Competent Cells, Invitrogen Life Technologies, Carlsbad, CA) foram crescidas a 37°C, 16 hrs, usando meio liquido de Luria-Bertani (LB: 10 g/1 Bactotriptona, 10 g/1 NaCl, 5 g/1 extracto de levedura Bacto) , agar LB (meio liquido LB mais 15 g/1 de agar Bacto), ou meio Terrific (TB: 12 g/1 Bactotriptona, 24 g/1 extracto de leveduraEscherichia coli strains (One Shot® Top 10 Chemically Competent Cells; MAX Efficiency® DH5a ™ Chemically Competent Cells, Invitrogen Life Technologies, Carlsbad, CA) were grown at 37 ° C, 16 hrs, using Luria-Bertani liquid medium (LB 10 g / 1 NaCl, 5 g / 1 Bacto yeast extract), LB agar (LB liquid medium plus 15 g / 1 Bacto agar), or Terrific medium (TB: 12 g / 1 Bacto-tryptone , 24 g / 1 yeast extract

Bacto, 0,4% v/v glicerol, 17 mM KH2PO4, 72 mM K2HPO4) . As culturas liquidas foram agitadas a 200 rpm. Consoante necessário, foram adicionados ao meio cloranfenicol (50 pg/ml), canamicina (50 pg/ml) ou ampicilina (100 pg/ml). Todos os antibióticos, meios de cultura e reagentes tampão usados neste estudo foram adquiridos à Sigma-Aldrich Corporation (St. Louis, MO) ou à Difco Laboratories (Detroit, MI). B. Esqueleto de plasmideo posição 1Bacto, 0.4% v / v glycerol, 17 mM KH 2 PO 4, 72 mM K 2 HPO 4). The liquid cultures were shaken at 200 rpm. Chloramphenicol (50æg / ml), kanamycin (50æg / ml) or ampicillin (100æg / ml) were added as needed. All antibiotics, culture media and buffer reagents used in this study were purchased from Sigma-Aldrich Corporation (St. Louis, MO) or Difco Laboratories (Detroit, MI). B. Plasmid Skeletal Position 1

Um esqueleto de plasmideo contendo sequências flanqueantes de homologia para a posição 1 de IPP2K foi manipulado para permitir a integração da sequência de DNA dador no local alvo correspondente do gene IPP2K. Os familiarizados com a técnica podem planear esqueletos de plasmídeo usando vários locais de clonagem, elementos modulares e sequências homólogas de qualquer sequência alvo dentro do genoma de interesse. 0 esqueleto de plasmídeo aqui exemplificado tem origem no vector plasmídeo base pBC SK(-) fagemídeo (3,4 kpb) (Stratagene, La Jolla, CA). Uma síntese em quatro passos como descrita abaixo foi usada para construir o esqueleto do plasmídeo posição 1.A plasmid backbone containing homology flanking sequences for the 1-position of IPP2K was manipulated to allow integration of the donor DNA sequence at the corresponding target site of the IPP2K gene. Those skilled in the art can plan plasmid backbones using various cloning sites, modular elements and homologous sequences of any target sequence within the genome of interest. The plasmid backbone exemplified herein is derived from the plasmid vector pBC SK (-) phagemid (3.4 kbp) (Stratagene, La Jolla, CA). A four-step synthesis as described below was used to construct the 1-position plasmid backbone.

No passo #1, preparou-se o plasmídeo base. Três yg de pBC SK(-) foram linearizados usando endonucleases de restrição, 10 unidades de Spel e 10 unidades de Notl (New England Biolabs, Beverly, MA), durante 1 hr a 37°C. O DNA cortado foi sujeito a electroforese a 100 V durante 1 hr num gel de 1,0% de agarose em TAE (0,04 M Tris-acetato, 0,002 M EDTA) suplementado com 0,5% de brometo de etídeo (Sigma-Aldrich Corporation, St. Louis, MO). Os fragmentos de DNA foram visualizados com luz UV e o tamanho dos fragmentos estimados por comparação com a escada de DNA de 1 kpb (Invitrogen Life Technologies, Carlsbad, CA). O vector de subclonagem, pBC SK(-), de 3,4 kpb digerido com Spel/Notl foi removido do gel e purificado de acordo com as instruções do fabricante usando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA).In step # 1, the base plasmid was prepared. Three μg of pBC SK (-) were linearized using restriction endonucleases, 10 units of Spel and 10 units of Notl (New England Biolabs, Beverly, MA) for 1 hr at 37 ° C. The cut DNA was electrophoresed at 100 V for 1 hr on a 1.0% TAE agarose gel (0.04 M Tris-acetate, 0.002 M EDTA) supplemented with 0.5% ethidium bromide (Sigma- Aldrich Corporation, St. Louis, MO). The DNA fragments were visualized with UV light and the size of the fragments estimated by comparison to the 1 kbp DNA ladder (Invitrogen Life Technologies, Carlsbad, CA). The 3.4 kbp sub-cloning vector pBC SK (-), digested with Spel / Notl was removed from the gel and purified according to the manufacturer's instructions using the QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, HERE).

No passo #2, foram isoladas as sequências flanqueantes 5' e 3' de IPP2K posição 1. As sequências oligonucleotídicas que se seguem foram sintetizadas porIn step # 2, the 5 'and 3' flanking sequences of IPP2K position 1 were isolated. The following oligonucleotide sequences were synthesized by

Integrated DNA Technologies, Inc. (Coralville, IA) em condições padrão de desalinação e diluídas com água para uma concentração de 0,125 pg/yl: 5'-GCGGCCGCGTCTCACCGCGGCTTGGGGATTGGATACGGAGCT-3' (SEQ ID NO:143) 5'-ACTAGTGATATGGCCCCACAGGAGTTGCTCATGACTTG-3' (SEQ ID NO:144) 5'-ACTAGTCCAGAACTGGTTGAGTCGGTCAAACAAGATTGCT-3' (SEQ ID NO:145) 5'-GTCGACCTTGATGCTACCCATTGGGCTGTTGT-3' (SEQ ID NO:146)Integrated DNA Technologies, Inc. (Coralville, IA) under standard conditions of desalination and diluted with water to a concentration of 0.125 pg / L: 5'-ACGGGCCGCGTCTCACCGCGGCTTGGGGATTGGATACGGAGCT-3 '(SEQ ID NO: 143) 5'-ACTAGTGATATGGCCCCACAGGAGTTGCTCATGACTTG- (SEQ ID NO: 144) 5'-ACTAGTCCAGAACTGGTTGAGTCGGTCAAACAAGATTGCT-3 '(SEQ ID NO: 145) 5'-GTCGACCTTGATGCTACCCATTGGGCTGTTGT-3' (SEQ ID NO: 146)

As reacções de amplificação por PCR foram realizadas usando reagentes fornecidos por TaKaRaPCR amplification reactions were performed using reagents provided by TaKaRa

Biotechnology Inc., Seta 3-4-1, Otsu, Shiga, 520-2193, Japan consistindo no seguinte: Cinco μΐ de tampão 10X LA PCR™ Buffer II (Mg2 + ) , 20 ng gDNA matriz de cadeia dupla (milho HiII), 10 pmol da sequência oligonucleotidica directa, 10 pmol da sequência oligonucleotidica reversa, 8 μΐ da mistura de dNTPs (2,5 mM cada), 33,5 μΐ H2O, 0,5 μΐ (2,5 unidades) DNA-polimerase TaKaRa LA Taq™, 1 gota de óleo mineral. As reacções de PCR foram realizadas usando um termociclador Perkin-Elmer Cetus, DNA Thermal Cycler (Norwalk, CT) de 48 amostras, nas seguintes condições: 94°C, 4 min/1 ciclo; 98°C 20 sec, 65°C 1 min, 68°C 1 min/30 ciclos; 72°C, 5 min/1 ciclo; 4°C/restante. Quinze μΐ de cada reacção de PCR foram sujeitos a electroforese a 100 V durante 1 hr num gel de 1,0% de agarose em TAE agarose suplementado com 0,5% de brometo de etidio. Os fragmentos amplificados foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os produtos de amplificação esperados foram diagnosticados pela presença de fragmentos de DNA de 0,821 kpb (sequência flanqueante de homologia 5') ou 0,821 kpb (sequência flanqueante de homologia 3').Biotechnology Inc., Seta 3-4-1, Otsu, Shiga, 520-2193, Japan consisting of the following: Five μl of buffer 10X LA PCR ™ Buffer II (Mg2 +), 20 ng gDNA double-stranded matrix (HiII maize) , 10 pmol of the direct oligonucleotide sequence, 10 pmol of the reverse oligonucleotide sequence, 8 μ of the mixture of dNTPs (2.5 mM each), 33.5 μH 2 O, 0.5 μ (2.5 units) TaKaRa LA DNA polymerase Taq ™, 1 drop of mineral oil. PCR reactions were performed using a Perkin-Elmer Cetus thermal cycler, 48-sample DNA Thermal Cycler (Norwalk, CT) under the following conditions: 94øC, 4 min / 1 cycle; 98 ° C 20 sec, 65 ° C 1 min, 68 ° C 1 min / 30 cycles; 72 ° C, 5 min / 1 cycle; 4 ° C / remainder. Fifteen μΐ of each PCR reaction were electrophoresed at 100 V for 1 hr on a 1.0% agarose gel in TAE agarose supplemented with 0.5% ethidium bromide. The amplified fragments were visualized with UV light and the size of the fragments estimated by comparison with a 1 kbp DNA ladder. Expected amplification products were diagnosed by the presence of DNA fragments of 0.821 kpb (5 'homology flanking sequence) or 0.821 kbp (3' homology flanking sequence).

Estes fragmentos foram removidos do gel e purificados de acordo com as instruções do fabricante usando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA). Os fragmentos purificados foram então clonados no plasmideo pCR2.1 usando o kit de clonagem TOPO TA Cloning® Kit (com o vector pCR®2.1) e células E. coli quimicamente competentes One Shot® TOPIO (Invitrogen Life Technologies, Carlsbad, CA) de acordo com o protocolo do fabricante.These fragments were removed from the gel and purified according to the manufacturer's instructions using the QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA). The purified fragments were then cloned into plasmid pCR2.1 using the TOPO TA Cloning Kit Kit (vector pCR®2.1) and One Shot® TOPIO (Invitrogen Life Technologies, Carlsbad, CA) E. coli cells from accordance with the manufacturer's protocol.

Colónias individuais foram inoculadas num tubo Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de canamicina e incubadas 16 hrs, a 37°C, com agitação a 200 rpm. Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrifuga de 1,7 ml Costar (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmidico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid Kit (BD Biosciences/Clontech/Macherey-Nagel, Paio Alto, CA) . Três yg do plasmideo isolado a partir de plasmídeos dos clones com sequências de homologia 5' foram digeridos com 10 unidades de Spel e NotI. Os plasmídeos de clones com sequências de homologia 3' foram digeridos com 10 unidades de Spel e 20 unidades de SailIndividual colonies were inoculated into a 14 ml Falcon tube (Becton-Dickinson, Franklin Lakes, NJ) containing 2 ml TB supplemented with 50 μg / ml kanamycin and incubated 16 hrs at 37 ° C with shaking at 200 rpm. After incubation, 1.5 ml of cells were transferred to a 1.7 ml Costar (Fisher Scientific, Pittsburgh, PA) microfuge tube and pelleted at 16,000 xg for 1 min. The supernatant was removed and the plasmid DNA was isolated as described above using the NucleoSpin® Plasmid Kit (BD Biosciences / Clontech / Macherey-Nagel, Paio Alto, CA). Three æg of the plasmid isolated from plasmids from the clones with 5 'homology sequences were digested with 10 units of Spel and NotI. Plasmids of clones with 3 'homology sequences were digested with 10 Spel units and 20 Sail units

(New England Biolabs, Beverly, MA) . Todas as digestos de plasmídeos foram incubadas durante 1 hr a 37°C. 0 DNA cortado com enzimas de restrição foi sujeito a electrof orese a 100 V durante 1 hr num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etidio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os clones plasmídicos esperados foram diagnosticados pela presença de fragmentos de DNA inseridos de 0,821 kpb (sequência flanqueante de homologia 5') ou 0,821 kpb (sequência flanqueante de homologia 3') para além do vector pCR®2.1 de 3,9 kpb.(New England Biolabs, Beverly, MA). All plasmid digests were incubated for 1 hr at 37 ° C. Restricted enzyme-cut DNA was subjected to electrophoresis at 100 V for 1 hr on a 1.0% TAE agarose gel supplemented with 0.5% ethidium bromide. The fragments were visualized with UV light and the size of the fragments estimated by comparison with a ladder of 1 kbp DNA. Expected plasmid clones were diagnosed by the presence of 0.821 kpb (5 'homology flanking sequence) or 0.821 kpb (3' homology flanking sequence) insert fragments in addition to the 3.9 kbp pCR®2.1 vector.

As reacções de sequenciação de cadeia dupla dos clones plasmídicos foram realizadas como descrito pelo fabricante usando o kit CEQ™ DTCS-Quick Start Kit (Beckman-Coulter, Paio Alto, CA) . As reacções foram purificadas usando Performa DTR Gel Filtration Cartridges (Edge BioSystems, Gaithersburg, MD) como descrito pelos protocolos do fabricante. As reacções de sequenciação foram analisadas num sistema de análise de DNA Beckman-Coulter CEQ™ 2000 XL e a caracterização nucleotídica realizada usando Sequencher™ versão 4.1.4 (Gene Codes Corporation, Ann Arbor, MI). A sequência do fragmento de 0,821 kpb correspondendo à posição 1 da sequência flanqueante de homologia 5' derivada de IPP2K está apresentada na Fig. 87 (SEQ ID NO: 171) . A sequência do fragmento de 0,821 kpb correspondendo à posição 1 da sequência flanqueante de homologia 3' derivada de IPP2K está apresentada na Fig. 88 (SEQ ID NO:172).The double-stranded sequencing reactions of the plasmid clones were performed as described by the manufacturer using the CEQ ™ DTCS-Quick Start Kit kit (Beckman-Coulter, Paio Alto, CA). Reactions were purified using Performa DTR Gel Filtration Cartridges (Edge BioSystems, Gaithersburg, MD) as described by the manufacturer's protocols. Sequencing reactions were analyzed on a Beckman-Coulter CEQ ™ 2000 XL DNA analysis system and nucleotide characterization performed using Sequencher ™ version 4.1.4 (Gene Codes Corporation, Ann Arbor, MI). The sequence of the 0.821 kpb fragment corresponding to the 1 position of the 5 'homology flanking sequence derived from IPP2K is shown in Fig. 87 (SEQ ID NO: 171). The 0.821 kbp fragment sequence corresponding to position 1 of the 3 'homology flanking sequence derived from IPP2K is shown in Fig. 88 (SEQ ID NO: 172).

No passo #3 as sequências flanqueantes de homologia 5' para a posição 1 foram ligadas ao plasmideo base. Os fragmentos cortados com enzimas de restrição correspondendo aos clones que continham a sequência flanqueante de homologia 5' para a posição 1 correctos foram removidos do gel e purificados de acordo com as instruções do fabricante usando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA). Os fragmentos correspondendo à sequência flanqueante de homologia 5' para a posição 1 (0,821 kpb) foram então ligados ao plasmideo base purificado digerido com Spel/Notl (passo #1) numa proporção de 1:5 vector:inserto usando 500 unidades de DNA-ligase de T4 (Invitrogen Life Technologies, Carlsbad, CA) num volume de reacção de 20 μΐ, em condições de 16 hr de incubação num banho-maria a 16°C. Cinco μΐ da reacção de ligação foram subsequentemente usados para transformar células E. coli quimicamente competentes One Shot® TOPIO (Invitrogen Life Technologies, Carlsbad, CA) e semeados nas condições de selecção descritas pelo fabricante. Colónias individuais foram inoculadas num tubo Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de canamicina e incubadas 16 hrs, a 37°C, com agitação a 200 rpm.In step # 3 the 5 'homology flanking sequences for position 1 were attached to the base plasmid. Restriction enzyme-cleaved fragments corresponding to the clones containing the correct 5 'homology flanking sequence were removed from the gel and purified according to the manufacturer's instructions using the QIAquick Gel Extraction Kit (QIAGEN Inc. , Valencia, CA). The fragments corresponding to the 5 'homology flanking sequence for position 1 (0.821 kbp) were then ligated to the Spel / Notl digested purified base plasmid (step # 1) in a ratio of 1: 5 vector: insert using 500 units of DNA- ligase (Invitrogen Life Technologies, Carlsbad, CA) in a reaction volume of 20 μΐ under 16 hr incubation conditions in a water bath at 16 ° C. Five μΐ of the ligation reaction were subsequently used to transform One Shot® TOPIO chemically competent E. coli cells (Invitrogen Life Technologies, Carlsbad, CA) and seeded under the selection conditions described by the manufacturer. Individual colonies were inoculated into a 14 ml Falcon tube (Becton-Dickinson, Franklin Lakes, NJ) containing 2 ml TB supplemented with 50 μg / ml kanamycin and incubated 16 hrs at 37 ° C with shaking at 200 rpm.

Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrifuga de 1,7 ml Costar (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmídico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid Kit (BD Biosciences/Clontech/Macherey-Nagel, Paio Alto, CA) . Três yg de DNA plasmidico foram digeridos com 10 unidades de Spel e Notl (New England Biolabs, Beverly, MA) e incubados durante 1 hr a 37°C. O DNA cortado com enzimas de restrição foi sujeito a electrof orese a 100 V durante 1 hr num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etidio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os clones plasmidicos esperados foram diagnosticados pela presença de fragmentos de DNA inseridos de 0,821 kpb (sequência flanqueante de homologia 5') para além do plasmideo base de 3,4 kpb.After incubation, 1.5 ml of cells were transferred to a 1.7 ml Costar (Fisher Scientific, Pittsburgh, PA) microfuge tube and pelleted at 16,000 xg for 1 min. The supernatant was removed and the plasmid DNA isolated as described above using the NucleoSpin® Plasmid Kit (BD Biosciences / Clontech / Macherey-Nagel, Paio Alto, CA). Three μg of plasmid DNA were digested with 10 units of Spel and Notl (New England Biolabs, Beverly, MA) and incubated for 1 hr at 37 ° C. Restricted enzyme-cleaved DNA was electrophoresed at 100 V for 1 hr on a 1.0% TAE agarose gel supplemented with 0.5% ethidium bromide. The fragments were visualized with UV light and the size of the fragments estimated by comparison with a ladder of 1 kbp DNA. Expected plasmid clones were diagnosed by the presence of inserted 0.821 kbp DNA fragments (5 'homology flanking sequence) in addition to the 3.4 kbp base plasmid.

No passo #4, a posição 1 das sequências flanqueantes de homologia 3' foram ligadas ao produto do passo #3. Três yg do produto manipulado descrito no passo #3 foram linearizados usando enzimas de restrição, 10 unidades de Spel e 20 unidades de Sail (New England Biolabs, Beverly, MA) durante 1 hr a 37°C. O DNA cortado com enzimas de restrição foi sujeito a electroforese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE (0,04 M Tris-acetato, 0,002 M EDTA) suplementado com 0,5% de brometo de etidio (Sigma-Aldrich Corporation, St. Louis, MO). Os fragmentos de DNA foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb (Invitrogen Life Technologies, Carlsbad, CA). O produto da digestão com Spel/Sall de ~4,2 kpb do passo #3 foi retirado do gel e purificado de acordo com as instruções do fabricante usando usando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA).In step # 4, position 1 of the 3 'homology flanking sequences was ligated to the product of step # 3. Three μg of the engineered product described in step # 3 were linearized using restriction enzymes, 10 units Spel and 20 Sail units (New England Biolabs, Beverly, MA) for 1 hr at 37 ° C. Restricted enzyme-cut DNA was electrophoresed at 100 V for 1 hr on a 1.0% TAE agarose gel (0.04 M Tris-acetate, 0.002 M EDTA) supplemented with 0.5% ethidium bromide (Sigma-Aldrich Corporation, St. Louis, MO). The DNA fragments were visualized with UV light and the size of the fragments estimated by comparison with a 1 kbp DNA ladder (Invitrogen Life Technologies, Carlsbad, CA). The ~ 4.2 kpb Spel / SalI digestion product from step # 3 was taken from the gel and purified according to the manufacturer's instructions using the QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA) .

Os fragmentos isolados do dador de sequências flanqueantes de homologia 3' (0,821 kpb) gerados no passo #2 foram subsequentemente combinados com o produto do passo #3 que foi digerido com Spel/Sall e purificado como descrito atrás em 20 μΐ de reacção de ligação usando uma proporção de vector: inserto de 1:5 e 500 unidades de DNA-ligase de T4 (Invitrogen Life Technologies, Carlsbad, CA). As reacções de ligação foram incubadas durante 16 horas num banho-maria a 16°C. Após a ligação, 5 μΐ da reacção de ligação foram usados para transformar células quimicamente competentes MAX Efficiency® DH5a™ (Invitrogen Life Technologies, Carlsbad, CA) de acordo com as instruções do fabricante. Colónias individuais inoculadas num tubo Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de cloranfenicol.The isolated fragments of the 3 '(0.821 kpb) homology flanking sequences generated in step # 2 were subsequently combined with the product of step # 3 which was digested with Spel / SalI and purified as described above in 20 μl of binding reaction using a vector: insert ratio of 1: 5 and 500 units of T4 DNA ligase (Invitrogen Life Technologies, Carlsbad, CA). Binding reactions were incubated for 16 hours in a water bath at 16 ° C. After ligation, 5 μl of the binding reaction was used to transform chemically competent MAX Efficiency® DH5a ™ cells (Invitrogen Life Technologies, Carlsbad, CA) according to the manufacturer's instructions. Individual colonies inoculated into a 14 ml Falcon tube (Becton-Dickinson, Franklin Lakes, NJ) containing 2 ml of TB supplemented with 50 μg / ml chloramphenicol.

As culturas foram incubadas durante 16 hrs a 37°C com agitação a 200 rpm. Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrifuga Costar de 1,7 ml (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmídico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid (BD Biosciences/Clontech/ Macherey-Nagel, Paio Alto, CA). Três yg do plasmideo isolado foram digeridos com 10 unidades de Sail e Notl (New England Biolabs, Beverly, MA) e incubados durante 1 hr a 37°C. O DNA cortado com enzimas de restrição foi sujeito a electroforese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etidio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os clones plasmidicos esperados foram diagnosticados pela presença de dois fragmentos de DNA de 1,64 kpb (inserto) e 3,33 kb (plasmideo base de 3,4 kpb). O plasmideo resultante foi designado pDAB7471 (Fig. 70). C. Esqueleto de plasmideo posição 2Cultures were incubated for 16 hrs at 37 ° C with shaking at 200 rpm. After incubation, 1.5 ml of cells were transferred to a Costar microfuge tube of 1.7 ml (Fisher Scientific, Pittsburgh, PA) and pelleted at 16,000 xg for 1 min. The supernatant was removed and the plasmid DNA isolated as described above using the NucleoSpin® Plasmid kit (BD Biosciences / Clontech / Macherey-Nagel, Paio Alto, CA). Three æg of the isolated plasmid were digested with 10 Sail and Notl units (New England Biolabs, Beverly, MA) and incubated for 1 hr at 37øC. Restricted enzyme-cut DNA was electrophoresed at 100 V for 1 hr on a 1.0% TAE agarose gel supplemented with 0.5% ethidium bromide. The fragments were visualized with UV light and the size of the fragments estimated by comparison with a ladder of 1 kbp DNA. Expected plasmid clones were diagnosed by the presence of two DNA fragments of 1.64 kbp (insert) and 3.33 kb (plasmid base of 3.4 kbp). The resulting plasmid was designated pDAB7471 (Fig. 70). C. Plasmid Skeletal Position 2

Um esqueleto de plasmideo contendo sequências flanqueantes de homologia para a posição 2 de IPP2K foi manipulado para permitir a integração da sequência de DNA dador no local alvo correspondente do gene IPP2K. Os familiarizados com a técnica podem planear esqueletos de plasmideo usando vários locais de clonagem, elementos modulares e sequências homólogas de qualquer sequência alvo dentro do genoma de interesse. O esqueleto de plasmideo aqui exemplificado tem origem no vector plasmideo base fagemideo pBC SK(-) (3,4 kpb) (Stratagene, La Jolla, CA) . Uma síntese em quatro passos, como descrita abaixo, foi usada para construir o esqueleto do plasmideo posição 2.A plasmid backbone containing homology flanking sequences for the 2-position of IPP2K was manipulated to allow integration of the donor DNA sequence at the corresponding target site of the IPP2K gene. Those familiar with the art can plan plasmid skeletons using various cloning sites, modular elements and homologous sequences of any target sequence within the genome of interest. The plasmid backbone exemplified herein is derived from the plasmid base plasmid vector pBC SK (-) (3.4 kbp) (Stratagene, La Jolla, CA). A four-step synthesis, as described below, was used to construct the 2-position plasmid backbone.

No passo #1, preparou-se o plasmideo base. Três yg de pBC SK(-) foram linearizados usando endonucleases de restrição, 10 unidades de Spel e 10 unidades de Notl (New England Biolabs, Beverly, MA), durante 1 hr a 37°C. O DNA cortado foi sujeito a electroforese a 100 V durante 1 hr num gel de 1,0% de agarose em TAE (0,04 M Tris-acetato, 0,002 M EDTA) suplementado com 0,5% de brometo de etideo (Sigma-Aldrich Corporation, St. Louis, MO). Os fragmentos de DNA foram visualizados com luz UV e o tamanho dos fragmentos estimados por comparação com a escada de DNA de 1 kpb (Invitrogen Life Technologies, Carlsbad, CA). O vector de subclonagem, pBC SK(-) de 3,4 kpb, digerido com Spel/Notl foi removido do gel e purificado de acordo com as instruções do fabricante usando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA).In step # 1, the base plasmid was prepared. Three μg of pBC SK (-) were linearized using restriction endonucleases, 10 units of Spel and 10 units of Notl (New England Biolabs, Beverly, MA) for 1 hr at 37 ° C. The cut DNA was electrophoresed at 100 V for 1 hr on a 1.0% agarose gel in TAE (0.04 M Tris-acetate, 0.002 M EDTA) supplemented with 0.5% ethidium bromide (Sigma- Aldrich Corporation, St. Louis, MO). The DNA fragments were visualized with UV light and the size of the fragments estimated by comparison to the 1 kbp DNA ladder (Invitrogen Life Technologies, Carlsbad, CA). The 3.4 kbp, Spel / Notl digested pBC SK (-) subcloning vector was removed from the gel and purified according to the manufacturer's instructions using the QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, HERE).

No passo #2, foram isoladas as sequências flanqueantes 5' e 3' de IPP2K posição 2. As sequências oligonucleotidicas que se seguem foram sintetizadas por Integrated DNA Technologies, Inc. (Coralville, IA) em condições padrão de desalinação e diluídas com água para uma concentração de 0,125 pg/μΐ: 5'-GCGGCCGCTAGATAGCAGATGCAGATTGCT-3' (SEQ ID NO:147) 5'-ACTAGTATTGGCACCCAGGTGTTGGCTCA-3' (SEQ ED NO:148) 5'-ACTAGTCATGTCGATGGTGGGGTATGGTTCAGATTCAG-3' (SEQ ID NO:149) 5'-GTCGACGTACAATGATTTCAGGTTACGGCCTCAGGAC-3' (SEQ ID NO: 150)In step # 2, the 5 'and 3' flanking sequences of IPP2K position 2 were isolated. The following oligonucleotide sequences were synthesized by Integrated DNA Technologies, Inc. (Coralville, IA) under standard desalination conditions and diluted with water to (SEQ ID NO: 149) 5'-ACTAGTCATGTCGATGGTGGGGTATGGTTCAGATTCAG-3 '(SEQ ID NO: 149) 5'-ACTAGTATTGGCACCCAGGTGTTGGCTCA-3' (SEQ ID NO: 148) 5'-ACTAGTCATGTCGATGGTGGGGTATGGTTCAGATTCAG- 5'-GTCGACGTACAATGATTTCAGGTTACGGCCTCAGGAC-3 '(SEQ ID NO: 150)

As reacções de amplificação por PCR foram realizadas usando reagentes fornecidos por TaKaRa Biotechnology Inc., Seta 3-4-1, Otsu, Shiga, 520-2193, Japan e consistiram no seguinte: Cinco μΐ de tampão 10X LA PCR™ Buffer II (Mg2 + ) , 20 ng de gDNA matriz de cadeia dupla (milho Hill), 10 pmol da sequência oligonucleotidica directa, 10 pmol da sequência oligonucleotidica reversa, 8 μΐ da mistura de dNTPs (2,5 mM cada), 33,5 μΐ H2O, 0,5 μΐ (2,5 unidades) DNA-polimerase TaKaRa LA Taq™, 1 gota de óleo mineral. As reacções de PCR foram realizadas usando um termociclador Perkin-Elmer Cetus, DNA Thermal Cycler (Norwalk, CT) de 48 amostras, nas seguintes condições: 94°C, 4 min/1 ciclo; 98°C 20 sec, 55°C 1 min, 68°C 1 min/30 ciclos; 72°C, 5 min/1 ciclo; 4°C/restante. Quinze μΐ de cada reacção de PCR foram sujeitos a electroforese a 100 V durante 1 hr num gel de 1,0% de agarose em TAE agarose suplementado com 0,5% de brometo de etidio. Os fragmentos amplificados foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os produtos de amplificação esperados foram diagnosticados pela presença de fragmentos de DNA de 0,855 kpb (sequência flanqueante de homologia 5') ou 0,845 kpb (sequência flanqueante de homologia 3'). Estes fragmentos foram removidos do gel e purificados de acordo com as instruções do fabricante usando o kit de extraeção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA) . Os fragmentos purificados foram então clonados no plasmídeo pCR2.1 usando o kit de clonagem TOPO TA Cloning® Kit (com o vector pCR®2.1) e células E. coli quimicamente competentes One Shot® TOPIO (Invitrogen Life Technologies, Carlsbad, CA) de acordo com o protocolo do fabricante.PCR amplification reactions were performed using reagents provided by TaKaRa Biotechnology Inc., Seta 3-4-1, Otsu, Shiga, 520-2193, Japan and consisted of the following: Five μl of buffer 10X LA PCR ™ Buffer II (Mg 2 +), 20 ng of double-stranded matrix (Hill maize), 10 pmole of the direct oligonucleotide sequence, 10 pmole of the reverse oligonucleotide sequence, 8 μ of the mixture of dNTPs (2.5 mM each), 33.5 μ H 2 O, 0.5 μΐ (2.5 units) TaKaRa LA Taq ™ DNA polymerase, 1 drop of mineral oil. PCR reactions were performed using a Perkin-Elmer Cetus thermal cycler, 48-sample DNA Thermal Cycler (Norwalk, CT) under the following conditions: 94øC, 4 min / 1 cycle; 98 ° C 20 sec, 55 ° C 1 min, 68 ° C 1 min / 30 cycles; 72 ° C, 5 min / 1 cycle; 4 ° C / remainder. Fifteen μΐ of each PCR reaction were electrophoresed at 100 V for 1 hr on a 1.0% agarose gel in TAE agarose supplemented with 0.5% ethidium bromide. The amplified fragments were visualized with UV light and the size of the fragments estimated by comparison with a 1 kbp DNA ladder. Expected amplification products were diagnosed by the presence of DNA fragments of 0.855 kbp (5 'homology flanking sequence) or 0.845 kbp (3' homology flanking sequence). These fragments were removed from the gel and purified according to the manufacturer's instructions using the QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA). The purified fragments were then cloned into plasmid pCR2.1 using the TOPO TA Cloning Kit Kit (vector pCR®2.1) and One Shot® TOPIO (Invitrogen Life Technologies, Carlsbad, CA) E. coli cells from accordance with the manufacturer's protocol.

Colónias individuais foram inoculadas num tubo Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de canamicina e incubadas 16 hrs a 37°C com agitação a 200 rpm. Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrífuga de 1,7 ml Costar (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmídico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid Kit (BD Biosciences/Clontech/Macherey-Nagel, Paio Alto, CA) . Três yg do plasmídeo isolado a partir de plasmídeos dos clones com sequências de homologia 5' foram digeridos com 10 unidades de Spel e NotI. Os plasmídeos de clones com sequências de homologia 3' foram digeridos com 10 unidades de Spel e 20 unidades de Sail (New England Biolabs, Beverly, MA) . Todas as digestos de plasmídeos foram incubadas durante 1 hr a 37°C. O DNA cortado com enzimas de restrição foi sujeito a electroforese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etídio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os clones plasmídicos esperados foram diagnosticados pela presença de fragmentos de DNA inseridos de 0,855 kpb (sequência flanqueante de homologia 5') ou 0,845 kpb (sequência flanqueante de homologia 3') para além do vector pCR®2.1 de 3,9 kpb.Individual colonies were inoculated into a 14 ml Falcon tube (Becton-Dickinson, Franklin Lakes, NJ) containing 2 ml TB supplemented with 50 μg / ml kanamycin and incubated 16 hrs at 37 ° C with shaking at 200 rpm. After incubation, 1.5 ml of cells were transferred to a 1.7 ml Costar (Fisher Scientific, Pittsburgh, PA) microfuge tube and pelleted at 16,000 xg for 1 min. The supernatant was removed and the plasmid DNA isolated as described above using the NucleoSpin® Plasmid Kit (BD Biosciences / Clontech / Macherey-Nagel, Paio Alto, CA). Three æg of the plasmid isolated from plasmids from clones with 5 'homology sequences were digested with 10 units of Spel and NotI. Plasmids of clones with 3 'homology sequences were digested with 10 units of Spel and 20 units of Sail (New England Biolabs, Beverly, MA). All plasmid digests were incubated for 1 hr at 37 ° C. Restricted enzyme-cut DNA was electrophoresed at 100 V for 1 hr on a 1.0% TAE agarose gel supplemented with 0.5% ethidium bromide. The fragments were visualized with UV light and the size of the fragments estimated by comparison with a ladder of 1 kbp DNA. Expected plasmid clones were diagnosed by the presence of inserted 0.855 bpb (5 'homology flanking sequence) or 0.845 kbp (3' homology flanking sequence) inserted DNA fragments in addition to the 3.9 kbp pCR®2.1 vector.

As reacções de sequenciação de cadeia dupla dos clones plasmídicos foram realizadas como descrito pelo fabricante usando o kit CEQ™ DTCS-Quick Start Kit (Beckman-Coulter, Paio Alto, CA) . As reacções foram purificadas usando Performa DTR Gel Filtration Cartridges (Edge BioSystems, Gaithersburg, MD) como descrito pelos protocolos do fabricante. As reacções de sequenciação foram analisadas num sistema de análise de DNA Beckman-Coulter CEQ™ 2000 XL e a caracterização nucleotidica realizada usando Sequencher™ versão 4.1.4 (Gene Codes Corporation, Ann Arbor, MI) . A sequência do fragmento de 0,855 kpb correspondendo à posição 2 da sequência flanqueante de homologia 5' derivada de IPP2K está apresentada na Fig. 89 (SEQ ID NO: 139) . A sequência do fragmento de 0,845 kpb correspondendo à posição 2 da sequência flanqueante de homologia 3' derivada de IPP2K está apresentada na Fig. 90 (SEQ ID NO:140).The double-stranded sequencing reactions of the plasmid clones were performed as described by the manufacturer using the CEQ ™ DTCS-Quick Start Kit kit (Beckman-Coulter, Paio Alto, CA). Reactions were purified using Performa DTR Gel Filtration Cartridges (Edge BioSystems, Gaithersburg, MD) as described by the manufacturer's protocols. Sequencing reactions were analyzed on a Beckman-Coulter CEQ ™ 2000 XL DNA analysis system and nucleotide characterization performed using Sequencher ™ version 4.1.4 (Gene Codes Corporation, Ann Arbor, MI). The 0.855 kbp fragment sequence corresponding to the 2-position of the 5 'homology flanking sequence derived from IPP2K is shown in Fig. 89 (SEQ ID NO: 139). The sequence of the 0.845 kbp fragment corresponding to the 2-position of the 3 'homology flanking sequence derived from IPP2K is shown in Fig. 90 (SEQ ID NO: 140).

No passo #3 as sequências flanqueantes de homologia 5' para a posição 1 foram ligadas ao plasmídeo base. Os fragmentos cortados com enzimas de restrição correspondendo aos clones que continham a sequência flanqueante de homologia 5' para a posição 2 foram removidos do gel e purificados de acordo com as instruções do fabricante usando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA) . Os fragmentos correspondendo à sequência flanqueante de homologia 5' para a posição 1 (0,855 kpb) foram então ligados ao plasmídeo base purificado digerido com Spel/Notl (passo #1) numa proporção de 1:5 vector:inserto usando 500 unidades de DNA-ligase de T4 (Invitrogen Life Technologies, Carlsbad, CA) num volume de reacção de 20 μΐ em condições de 16 hr de incubação num banho-maria a 16°C.In step # 3 the 5 'homology flanking sequences for position 1 were ligated to the base plasmid. Restriction enzyme-cut fragments corresponding to the clones containing the 5 'homology flanking sequence to the 2-position were removed from the gel and purified according to the manufacturer's instructions using the QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA). Fragments corresponding to the 5 'homology flanking sequence at position 1 (0.855 kbp) were then ligated to the purified base plasmid digested with Spel / Notl (step # 1) in a ratio of 1: 5 vector: insert using 500 units of DNA- ligase (Invitrogen Life Technologies, Carlsbad, CA) in a reaction volume of 20 μΐ under 16 hr incubation conditions in a water bath at 16 ° C.

Cinco μΐ da reacção de ligação foram subsequentemente usados para transformar células E. coli quimicamente competentes One Shot® TOPlO (Invitrogen Life Technologies, Carlsbad, CA) e semeados nas condições de selecção descritas pelo fabricante. Colónias individuais foram inoculadas num tubo Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de canamicina e incubadas 16 hrs, a 37°C, com agitação a 200 rpm. Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrifuga de 1,7 ml Costar (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmídico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid Kit (BD Biosciences/ Clontech/Macherey-Nagel, Paio Alto, CA) . Três pg de DNA plasmídico foram digeridos com 10 unidades de Spel e Notl (New England Biolabs, Beverly, MA) e incubados durante 1 hr a 37°C. O DNA cortado com enzimas de restrição foi sujeito a electroforese a 100 V durante 1 hr num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etídio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os clones plasmídicos esperados foram diagnosticados pela presença de fragmentos de DNA inseridos de 0,855 kpb (sequência flanqueante de homologia 5') para além do plasmídeo base de 3,4 kpb.Five μΐ of the binding reaction were subsequently used to transform One Shot® TOPlO chemically competent E. coli cells (Invitrogen Life Technologies, Carlsbad, CA) and seeded under the selection conditions described by the manufacturer. Individual colonies were inoculated into a 14 ml Falcon tube (Becton-Dickinson, Franklin Lakes, NJ) containing 2 ml TB supplemented with 50 μg / ml kanamycin and incubated 16 hrs at 37 ° C with shaking at 200 rpm. After incubation, 1.5 ml of cells were transferred to a 1.7 ml Costar (Fisher Scientific, Pittsburgh, PA) microfuge tube and pelleted at 16,000 xg for 1 min. The supernatant was removed and the plasmid DNA isolated as described above using the NucleoSpin® Plasmid Kit (BD Biosciences / Clontech / Macherey-Nagel, Paio Alto, CA). Three pg of plasmid DNA was digested with 10 units of Spel and Notl (New England Biolabs, Beverly, MA) and incubated for 1 hr at 37 ° C. The restriction enzyme-cleaved DNA was electrophoresed at 100 V for 1 hr on a 1.0% TAE agarose gel supplemented with 0.5% ethidium bromide. The fragments were visualized with UV light and the size of the fragments estimated by comparison with a ladder of 1 kbp DNA. Expected plasmid clones were diagnosed by the presence of 0.855 kbp inserted DNA fragments (5 'homology flanking sequence) in addition to the 3.4 kbp base plasmid.

No passo #4, as sequências flanqueantes de homologia 3' para a posição 2 foram ligadas ao produto do passo #3. Três yg do produto manipulado descrito no passo #3 foram linearizados usando enzimas de restrição, 10 unidades de Spel e 20 unidades de Sail (New England Biolabs, Beverly, MA) durante 1 hr a 37°C. O DNA cortado com enzimas de restrição foi sujeito a electroforese a 100 V durante 1 hr num gel de 1,0% de agarose em TAE (0,04 M Tris-acetato, 0,002 M EDTA) suplementado com 0,5% de brometo de etidio (Sigma-Aldrich Corporation, St. Louis, MO). Os fragmentos de DNA foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb (Invitrogen Life Technologies, Carlsbad, CA). O produto da digestão com Spel/Sall de 4,25 kpb do passo #3 foi retirado do gel e purificado de acordo com as instruções do fabricante usando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA).In step # 4, the 3 'homology flanking sequences for position 2 were ligated to the product of step # 3. Three μg of the engineered product described in step # 3 were linearized using restriction enzymes, 10 units Spel and 20 Sail units (New England Biolabs, Beverly, MA) for 1 hr at 37 ° C. Restricted enzyme-cut DNA was electrophoresed at 100 V for 1 hr on a 1.0% TAE agarose gel (0.04 M Tris-acetate, 0.002 M EDTA) supplemented with 0.5% (Sigma-Aldrich Corporation, St. Louis, MO). The DNA fragments were visualized with UV light and the size of the fragments estimated by comparison with a 1 kbp DNA ladder (Invitrogen Life Technologies, Carlsbad, CA). The 4.25 kpb Spel / SalI digestion product from step # 3 was removed from the gel and purified according to the manufacturer's instructions using the QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA).

Os fragmentos isolados do dador de sequências flanqueantes de homologia 3' (0,845 kpb) gerados no passo #2 foram subsequentemente combinados com o produto do passo #3, que foi digerido com Spel/Sall e purificado como descrito atrás, em 20 μΐ de reacção de ligação usando uma proporção de vector: inserto de 1:5 e 500 unidades de DNA-ligase de T4 (Invitrogen Life Technologies, Carlsbad, CA) .The isolated fragments of the 3 '(0.845 kpb) homology flanking sequences generated in step # 2 were subsequently combined with the product of step # 3, which was digested with Spel / SalI and purified as described above, in 20 μl of reaction binding ratio using a vector: insert ratio of 1: 5 and 500 units of T4 DNA ligase (Invitrogen Life Technologies, Carlsbad, CA).

As reacções de ligação foram incubadas durante 16 horas num banho-maria a 16°C. Após a ligação, 5 μΐ da reacção de ligação foram usados para transformar células quimicamente competentes MAX Efficiency® DH5a™ (Invitrogen Life Technologies, Carlsbad, CA) de acordo com as instruções do fabricante. Colónias individuais foram inoculadas num tubo Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de cloranfenicol. As culturas foram incubadas durante 16 hrs a 37°C com agitação a 200 rpm. Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrífuga Costar de 1,7 ml (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmídico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid (BD Biosciences/Clontech/ Macherey-Nagel, Paio Alto, CA). Três yg do plasmídeo isolado foram digeridos com 10 unidades de Sail e Notl (New England Biolabs, Beverly, MA) e incubados durante 1 hr a 37°C. O DNA cortado com enzimas de restrição foi sujeito a electrof orese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etídio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os clones plasmídicos esperados foram diagnosticados pela presença de dois fragmentos de DNA de 1,7 kpb (inserto) e 3,33 kb (plasmídeo base). O plasmídeo resultante foi designado pDAB7451 (Fig. 71). D. Construção da cassete de expressão autónoma do gene de tolerância a herbicidaBinding reactions were incubated for 16 hours in a water bath at 16 ° C. After ligation, 5 μl of the binding reaction was used to transform chemically competent MAX Efficiency® DH5a ™ cells (Invitrogen Life Technologies, Carlsbad, CA) according to the manufacturer's instructions. Individual colonies were inoculated into a 14 ml Falcon tube (Becton-Dickinson, Franklin Lakes, NJ) containing 2 ml of TB supplemented with 50 μg / ml chloramphenicol. Cultures were incubated for 16 hrs at 37 ° C with shaking at 200 rpm. After incubation, 1.5 ml of cells were transferred to a Costar microcentrifuge tube of 1.7 ml (Fisher Scientific, Pittsburgh, PA) and pelleted at 16,000 xg for 1 min. The supernatant was removed and the plasmid DNA isolated as described above using the NucleoSpin® Plasmid kit (BD Biosciences / Clontech / Macherey-Nagel, Paio Alto, CA). Three μg of the isolated plasmid were digested with 10 units Sail and Notl (New England Biolabs, Beverly, MA) and incubated for 1 hr at 37 ° C. Restricted enzyme-cleaved DNA was electrophoresed at 100 V for 1 hr on a 1.0% TAE agarose gel supplemented with 0.5% ethidium bromide. The fragments were visualized with UV light and the size of the fragments estimated by comparison with a ladder of 1 kbp DNA. Expected plasmid clones were diagnosed by the presence of two 1.7 kbp (insert) and 3.33 kb (base plasmid) DNA fragments. The resulting plasmid was designated pDAB7451 (Fig. 71). D. Construction of the autonomous expression cassette of the herbicide tolerance gene

Construíu-se uma cassete de expressão autónoma do gene da tolerância a herbicida compreendendo uma unidade de promotor-transcrição (PTU) contendo promotor, gene de tolerância a herbicida e sequências de poliadenilação (poliA) e terminação (Fig. 72). Nesta realização, a sequência do promotor deriva da actina 1 de 0. sativa [McElroy et al. (Plant Cell 2, 163-171; 1990); GenBank N° de Acesso S44221 e GenBank N° de Acesso X63830]. O gene de tolerância a herbicida compreende o gene PAT (fosfino-tricina acetil-transferase) , o qual confere resistência ao herbicida bialaphos (uma versão modificada da região codificadora de PAT originalmente derivada de Streptomyces viridochromogenes (GenBank N° de Acesso M22827; Wohlleben et al. Gene 70, 25-37; 1988). As modificações da sequência original da grelha de leitura aberta mais longa de M22827 são substanciais e incluem a alteração do padrão de utilização de codões para optimizar a expressão em plantas. Exceptuando a substituição de metionina por valina como o primeiro aminoácido codificado e a adição de alanina como o segundo aminoácido codificado, a proteína codificada a partir da grelha de leitura aberta PAT de pDAB3014 é idêntica à codificada pela grelha de leitura aberta mais longa do N° de acesso M22827. A versão reconstruída de PAT é encontrada com o N° de Acesso 143995. As sequências terminadoras derivam da lipase L de Z. mays [clone de cDNA da lipase de milho com o N° de Acesso GenBank L35913, excepto um C na posição 1093 de L35913 estar substituído com um G na posição 2468 em pDAB3014. Esta sequência de milho compreende a região não traduzida 3'/região terminadora da transcrição para o geme PAT].An autonomic herbicide tolerance gene expression cassette comprising a promoter-transcription unit (PTU) containing promoter, herbicide tolerance gene, and polyadenylation (polyA) and termination sequences (Fig. 72) was constructed. In this embodiment, the promoter sequence is derived from actin 1 of 0. sativa [McElroy et al. (Plant Cell 2, 163-171, 1990); GenBank Accession No. S44221 and GenBank Accession No. X63830]. The herbicide tolerance gene comprises the PAT gene (phosphino-tricine acetyl transferase), which confers resistance to the herbicide bialaphos (a modified version of the PAT coding region originally derived from Streptomyces viridochromogenes (GenBank Accession No. M22827; Wohlleben et al. al., Gene 70, 25-37, 1988) Modifications to the original sequence of the longest open reading frame of M22827 are substantial and include changing the codon usage pattern to optimize expression in plants Except methionine substitution by valine as the first encoded amino acid and the addition of alanine as the second encoded amino acid, the protein encoded from the open reading frame PAT of pDAB3014 is identical to that encoded by the longest open reading frame of accession No. M22827. the reconstructed version of PAT is found under Accession No. 143995. The terminator sequences are derived from the lipase L of Z. mays [clone and cDNA from the corn lipase under GenBank Accession No. L35913, except a C at position 1093 of L35913 is substituted with a G at position 2468 in pDAB3014. This maize sequence comprises the 3 'untranslated region / transcription terminator region for the PAT mole].

As sequências iniciadoras oligonucleotídicas que se seguem foram sintetizadas por Integrated DNA Technologies, Inc. (Coralville, IA) nas condições padrão de desalinação e diluídas com água para uma concentração de 0,125 pg/μΐ: 5'-ACTAGTTAACTGACCTCACTCGAGGTCATTCATATGCTTGA-3' (SEQ ID NO:151) 5'-ACTAGTGTGAATTCAGCACTTAAAGATCT-3' (SEQ ID NO: 152).The following oligonucleotide primer sequences were synthesized by Integrated DNA Technologies, Inc. (Coralville, IA) under standard conditions of desalination and diluted with water to a concentration of 0.125 pg / μ: 5'-ACTAGTTAACTGACCTCACTCGAGGTCATTCATATGCTTGA-3 '(SEQ ID NO: : 151) 5'-ACTAGTGTGAATTCAGCACTTAAAGATCT-3 '(SEQ ID NO: 152).

As reacções de amplificação por PCR foram realizadas usando reagentes fornecidos por TaKaRa Biotechnology Inc., Seta 3-4-1, Otsu, Shiga, 520-2193, Japan e consistiram no seguinte: 5 μΐ de tampão 10X LA PCR™ Buffer II (Mg2+) , 20 ng de matriz de cadeia dupla [DNA do plasmídeo pDAB3014], 10 pmol da sequência oligonucleotídica directa, 10 pmol da sequência oligonucleotídica reversa, 8 μΐ da mistura de dNTPs (2,5 mM cada), 33,5 μΐ H2O, 0,5 μΐ (2,5 unidades) DNA-polimerase TaKaRa LA Taq™, 1 gota de óleo mineral. As reacções de PCR foram realizadas usando um termociclador Perkin-Elmer Cetus, DNA Thermal Cycler (Norwalk, CT) de 48 amostras, nas seguintes condições: 94°C, 4 min/1 ciclo; 98°C 20 sec, 55°C 1 min, 68°C 3 min/30 ciclos; 72°C, 5 min/1 ciclo; 4°C/restante. Quinze μΐ dePCR amplification reactions were performed using reagents provided by TaKaRa Biotechnology Inc., Seta 3-4-1, Otsu, Shiga, 520-2193, Japan and consisted of the following: 5 μl of buffer 10X LA PCR ™ Buffer II (Mg2 + ), 20 ng of double stranded template [plasmid pDAB3014 DNA], 10 pmole of the direct oligonucleotide sequence, 10 pmole of the reverse oligonucleotide sequence, 8 of the mixture of dNTPs (2.5 mM each), 33.5 μ H 2 O, 0.5 μΐ (2.5 units) TaKaRa LA Taq ™ DNA polymerase, 1 drop of mineral oil. PCR reactions were performed using a Perkin-Elmer Cetus thermal cycler, 48-sample DNA Thermal Cycler (Norwalk, CT) under the following conditions: 94øC, 4 min / 1 cycle; 98 ° C 20 sec, 55 ° C 1 min, 68 ° C 3 min / 30 cycles; 72 ° C, 5 min / 1 cycle; 4 ° C / remainder. Fifteen μΐ of

cada reacção de PCR foram sujeitos a electroforese a 100 V durante 1 hr num gel de 1,0% de agarose em TAE agarose suplementado com 0,5% de brometo de etidio.each PCR reaction was electrophoresed at 100 V for 1 hr on a 1.0% agarose gel in TAE agarose supplemented with 0.5% ethidium bromide.

Os fragmentos amplificados foram visualizados com luz UV e os tamanhos dos fragmentos estimados por comparação com uma escada de DNA de 1 kpb. Os produtos de amplificação esperados foram diagnosticados pela presença de um fragmento de DNA de 2,3 kpb. Este fragmento foi removido do gel e purificado de acordo com as instruções do fabricante usando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA) . Os fragmentos purificados foram então clonados no plasmídeo pCR2.1 usando o kit de clonagem TOPO TA Cloning® Kit (com o vector pCR®2.1) e células E. coli quimicamente competentes One Shot® TOPIO (Invitrogen Life Technologies, Carlsbad, CA) de acordo com o protocolo do fabricante.The amplified fragments were visualized with UV light and the estimated fragment sizes compared to a 1 kbp DNA ladder. Expected amplification products were diagnosed by the presence of a 2.3 kbp DNA fragment. This fragment was removed from the gel and purified according to the manufacturer's instructions using the QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA). The purified fragments were then cloned into plasmid pCR2.1 using the TOPO TA Cloning Kit Kit (vector pCR®2.1) and One Shot® TOPIO (Invitrogen Life Technologies, Carlsbad, CA) E. coli cells from accordance with the manufacturer's protocol.

Colónias individuais foram inoculadas num tubo Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de canamicina e incubadas 16 hrs a 37°C com agitação a 200 rpm. Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrífuga de 1,7 ml Costar (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmídico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid Kit (BD Biosciences/Clontech/Macherey-Nagel, Paio Alto, CA) . Três yg do plasmídeo isolado foram digeridos com 10 unidades de Spel e Notl. Todas as digestos de plasmídeos foram incubadas durante 1 hr a 37°C. 0 DNA cortado com enzimas de restrição foi sujeito a electroforese a 100 V durante 1 hr num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etidio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os clones plasmídicos esperados foram diagnosticados pela presença de um fragmento de DNA inserido de 2,325 kpb para além do vector pCR®2.1 de 3,9 kpb. As reacções de seguenciação de cadeia dupla dos clones plasmídicos foram realizadas como descrito pelo fabricante usando o kit CEQ™ DTCS-Quick Start Kit (Beckman-Coulter, Paio Alto, CA). As reacções foram purificadas usando Performa DTR Gel Filtration Cartridges (Edge BioSystems, Gaithersburg, MD) como descrito pelos protocolos do fabricante. As reacções de seguenciação foram analisadas num sistema de análise de DNA Beckman-Coulter CEQ™ 2000 XL e a caracterização nucleotídica realizada usando Seguencher™ versão 4.1.4 (Gene Codes Corporation, Ann Arbor, MI). E. Inserção da cassete autónoma do gene de tolerância a herbicidas no esgueleto plasmídico - Dador AutónomoIndividual colonies were inoculated into a 14 ml Falcon tube (Becton-Dickinson, Franklin Lakes, NJ) containing 2 ml TB supplemented with 50 μg / ml kanamycin and incubated 16 hrs at 37 ° C with shaking at 200 rpm. After incubation, 1.5 ml of cells were transferred to a 1.7 ml Costar (Fisher Scientific, Pittsburgh, PA) microfuge tube and pelleted at 16,000 xg for 1 min. The supernatant was removed and the plasmid DNA isolated as described above using the NucleoSpin® Plasmid Kit (BD Biosciences / Clontech / Macherey-Nagel, Paio Alto, CA). Three æg of the isolated plasmid were digested with 10 units of Spel and NotI. All plasmid digests were incubated for 1 hr at 37 ° C. Restricted enzyme-cleaved DNA was electrophoresed at 100 V for 1 hr on a 1.0% TAE agarose gel supplemented with 0.5% ethidium bromide. The fragments were visualized with UV light and the size of the fragments estimated by comparison with a ladder of 1 kbp DNA. Expected plasmid clones were diagnosed by the presence of a 2.325 kbp inserted DNA fragment in addition to the 3.9 kbp pCR®2.1 vector. The double-stranded sequencing reactions of the plasmid clones were performed as described by the manufacturer using the CEQ ™ DTCS-Quick Start Kit kit (Beckman-Coulter, Paio Alto, CA). Reactions were purified using Performa DTR Gel Filtration Cartridges (Edge BioSystems, Gaithersburg, MD) as described by the manufacturer's protocols. The follow-up reactions were analyzed on a Beckman-Coulter CEQ ™ 2000 XL DNA analysis system and the nucleotide characterization performed using Seguencher ™ version 4.1.4 (Gene Codes Corporation, Ann Arbor, MI). E. Insertion of the autonomic cassette of the herbicide tolerance gene in the plasmid sperm - Autonomous Donor

De forma a criar um plasmídeo dador, a cassete autónoma do gene de tolerância a herbicida descrita no Exemplo 18D foi inserida nas construções de esgueleto plasmídico descritas nos Exemplos 18B e 18C. O fragmento cortado com enzimas de restrição derivado de um clone gue possuía a sequência esperada de 2,325 kpb atrás descrita (Fig. 72) foi removido do gel e purificado de acordo com as instruções do fabricante usando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA).In order to create a donor plasmid, the autonomous cassette of the herbicide tolerance gene described in Example 18D was inserted into the plasmid spleen constructs described in Examples 18B and 18C. The restriction enzyme-cleaved fragment derived from a clone having the expected 2,325 kbp sequence described above (Fig. 72) was removed from the gel and purified according to the manufacturer's instructions using the QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA).

Este fragmento foi então combinado numa reacção de ligação com pDAB7471 purificado (esqueleto plasmídico para a posição 1, Fig. 70) ou pDAB 7451 (esqueleto plasmídico para a posição 2, Fig. 71) que tinham sido digeridos com a enzima de restrição Spel e subsequentemente desfosforilado. A ligação foi realizada nas seguintes condições: proporção vector:inserto 1:5 e 500 unidades de DNA-ligase de T4 (Invitrogen Life Technologies, Carlsbad, CA) num volume de reacção de 20 μΐ nas condições de incubação de 16 horas num banho-maria a 16°C. Cinco μΐ da reacção de ligação foi usado para transformar subsequentemente 50 μΐ de células quimicamente competentes MAX Efficiency® DH5a™ (Invitrogen Life Technologies, Carlsbad, CA) e semeadas nas condições de selecção descritas pelo fabricante.This fragment was then combined in a binding reaction with purified pDAB7471 (plasmid skeleton for position 1, Fig. 70) or pDAB 7451 (plasmid skeleton for position 2, Fig. 71) which had been digested with the restriction enzyme Spel and subsequently dephosphorylated. Binding was performed under the following conditions: vector: 1: 5 insert ratio and 500 units of T4 DNA ligase (Invitrogen Life Technologies, Carlsbad, CA) in a reaction volume of 20 μΐ under the incubation conditions of 16 hours in a flash- maria at 16 ° C. Five μΐ of the binding reaction was used to subsequently transform 50 μΐ of chemically competent MAX Efficiency® DH5α ™ cells (Invitrogen Life Technologies, Carlsbad, CA) and seeded under the selection conditions described by the manufacturer.

Colónias individuais foram inoculadas num tubo Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de cloran-fenicol. As culturas foram incubadas durante 16 hrs a 37°C com agitação a 200 rpm. Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrífuga Costar de 1,7 ml (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmídico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid (BD Biosciences/Clontech/ Macherey-Nagel, Paio Alto, CA). Três yg do plasmideo isolado foram digeridos com 10 unidades de Spel (New England Biolabs, Beverly, MA) e incubados durante 1 hr a 37°C. O DNA cortado com enzimas de restrição foi sujeito a electrof orese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etidio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os clones plasmidicos esperados foram diagnosticados pela presença de fragmentos de DNA de 2,325 kpb e ~4,9 kpb (vector pDAB7452) ou 2,325 Kpb e ~5,0 kpb (vector pDAB7 4 51) .Individual colonies were inoculated into a 14 ml Falcon tube (Becton-Dickinson, Franklin Lakes, NJ) containing 2 ml of TB supplemented with 50 μg / ml of chloramphenicol. Cultures were incubated for 16 hrs at 37 ° C with shaking at 200 rpm. After incubation, 1.5 ml of cells were transferred to a Costar microcentrifuge tube of 1.7 ml (Fisher Scientific, Pittsburgh, PA) and pelleted at 16,000 xg for 1 min. The supernatant was removed and the plasmid DNA isolated as described above using the NucleoSpin® Plasmid kit (BD Biosciences / Clontech / Macherey-Nagel, Paio Alto, CA). Three μg of the isolated plasmid were digested with 10 units of Spel (New England Biolabs, Beverly, MA) and incubated for 1 hr at 37 ° C. Restricted enzyme-cut DNA was subjected to electrophoresis at 100 V for 1 hr on a 1.0% TAE agarose gel supplemented with 0.5% ethidium bromide. The fragments were visualized with UV light and the size of the fragments estimated by comparison with a ladder of 1 kbp DNA. The expected plasmid clones were diagnosed by the presence of 2.325 kbp ~ 4.9 kbp DNA fragments (vector pDAB7452) or 2,325 Kbps and ~5.5 kbp (pDAB vector455).

Os plasmideos resultantes foram designados pDAB7422 (posição 1 dador autónomo) (Fig. 73) e pDAB7452 (posição 2 dador autónomo) (Fig. 74), respectivamente. F. Construção da cassete não autónoma de expressão do gene de tolerância a herbicidasThe resulting plasmids were designated pDAB7422 (position 1 donor autonomous) (Fig. 73) and pDAB7452 (position 2 donor autonomous) (Fig. 74), respectively. F. Construction of the Non-autonomous Expression Cassette of the Herbicide Tolerance Gene

Construiu-se uma cassete de expressão não autónoma do gene da tolerância a herbicidas compreendendo uma unidade de transcrição com promotor (PTU) (Fig. 75) . Nesta realização, usou-se uma estratégia que explora a funcionalidade de uma sequência 2A (Mattion, N.M., Harnish, E.C., Crowley, J.C. & Reilly, P.A. (1996) J. Virol. 70, 8124- 8127) derivada do virus de Thesoa assigna, um gene de tolerância a herbicida e sequências de poli-adenilação (poliA) e terminação, mas sem o promotor. Nesta realização, a sequência do sinal de terminação da tradução foi manipulada para estar na mesma grelha de tradução do gene de tolerância a herbicidas. Ainda, a sequência codificadora de 2A/ herbicida foi manipulada para coincidir com a grelha de tradução do gene IPP2K alvo. 0 gene de tolerância a herbicidas compreende o gene PAT (fosfinotricina acetil-transferase), o qual confere resistência ao herbicida bialaphos (uma versão modificada da região codificadora de PAT originalmente derivada de Streptomyces viridochromo-genes (GenBank N° de Acesso M22827; Wohlleben et ai. Gene 70, 25-37; 1988) . As modificações da sequência original da grelha de leitura aberta mais longa de M22827 são substanciais e incluem a alteração do padrão de utilização de codões para optimizar a expressão em plantas. Exceptuando a substituição de metionina por valina como o primeiro aminoácido codificado e a adição de alanina como o segundo aminoácido codificado, a proteína codificada a partir da grelha de leitura aberta PAT de pDAB3014 é idêntica à codificada pela grelha de leitura aberta mais longa do N° de acesso M22827. A versão reconstruída de PAT é encontrada com o N° de Acesso 143995. As sequências terminadoras derivam da lipase L de Z. mays [clone de cDNA da lipase de milho com o N° de Acesso GenBank L35913, excepto um C na posição 1093 de L35913 estar substituído com um G na posição 2468 em pDAB3014] . Esta sequência de milho compreende a região não traduzida 3'/região terminadora da transcrição para o gene PAT.A non-autonomous expression cassette of the herbicide tolerance gene comprising a promoter-transcription unit (PTU) (Fig. 75) was constructed. In this embodiment, a strategy was utilized which exploits the functionality of a 2A (Mattion, NM, Harnish, EC, Crowley, JC & Reilly, PA (1996) J. Virol. 70, 8124-8127) Thesoa assigns a herbicide tolerance gene and polyadenylation (polyA) sequences and termination, but without the promoter. In this embodiment, the translation termination signal sequence was manipulated to be in the same translation grid of the herbicide tolerance gene. In addition, the 2A / herbicide coding sequence was manipulated to match the translation frame of the target IPP2K gene. The herbicide tolerance gene comprises the PAT gene (phosphinothricin acetyl transferase), which confers resistance to the herbicide bialaphos (a modified version of the PAT coding region originally derived from Streptomyces viridochromos genes (GenBank Accession No. M22827; Wohlleben et al. The modifications of the original sequence of the longer open reading frame of M22827 are substantial and include changing the codon usage pattern to optimize expression in plants Except for the replacement of methionine by valine as the first encoded amino acid and the addition of alanine as the second encoded amino acid, the protein encoded from the open reading frame PAT of pDAB3014 is identical to that encoded by the longest open reading frame of accession No. M22827. The reconstructed version of PAT is found under Accession No. 143995. The terminator sequences are derived from the lipase L of Z. mays [clo ml of corn lipase cDNA with GenBank Accession No. L35913, except a C at position 1093 of L35913 is substituted with a G at position 2468 in pDAB3014]. This maize sequence comprises the 3 'untranslated region / transcriptional terminator region for the PAT gene.

As sequências iniciadoras oligonucleotidicas que se seguem foram sintetizadas por Integrated DNA Technologies, Inc. (Coralville, IA) nas condições padrão de desalinação e diluídas com água para uma concentração de 0,125 pg/μΐ: 5'- ACTAGTGGCGGCGGAGAGGGCAGAGGAAGTCTTCTAACATGC GGTGACGTGGAGGAGAATCCCGGCCCTAGGATGGCTTCTCCGGAGAGGAGAC CAGTTGA-3' (SEQ ID NO: 153) 5'-ACTAGTATGCATGTGAATTCAGCACTTAAAGATCT-3' (SEQ ID NO: 154).The following oligonucleotide primer sequences were synthesized by Integrated DNA Technologies, Inc. (Coralville, IA) under standard conditions of desalination and diluted with water to a concentration of 0.125 pg / μ: 5'-ACTAGTGGCGGCGGAGAGGGCAGAGGAAGTCTTCTAACATGCGGTGACGTGGAGGAGAATCCCGGCCCTAGGATGGCTTCTCCGGAGAGGAGAC CAGTTGA-3 '(SEQ ID NO: ID NO: 153) 5'-ACTAGTATGCATGTGAATTCAGCACTTAAAGATCT-3 '(SEQ ID NO: 154).

As reacções de amplificação por PCR foram realizadas usando reagentes fornecidos por TaKaRa Biotechnology Inc., Seta 3-4-1, Otsu, Shiga, 520-2193, Japan e consistiram no seguinte: 5 μΐ de tampão 10X LA PCR™ Buffer II (Mg2 + ) , 20 ng de matriz de cadeia dupla (DNA do plasmídeo pDAB3014), 10 pmol da sequência oligonucleotídica directa, 10 pmol da sequência oligonucleotídica reversa, 8 μΐ da mistura de dNTPs (2,5 mM cada), 33,5 μΐ fQO, 0,5 μΐ (2,5 unidades) DNA-polimerase TaKaRa LA Taq™, 1 gota de óleo mineral. As reacções de PCR foram realizadas usando um termociclador Perkin-Elmer Cetus, DNA Thermal Cycler (Norwalk, CT) de 48 amostras, nas seguintes condições: 94°C, 4 min/1 ciclo; 98°C 20 sec, 55°C 1 min, 68°C 2 min/30 ciclos; 72°C, 5 min/1 ciclo; 4°C/restante. Quinze μΐ de cada reacção de PCR foram sujeitos a electroforese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etídio. Os fragmentos amplificados foram visualizados com luz UV e os tamanhos dos fragmentos estimados por comparação com uma escada de DNA de 1 kpb. Os produtos de amplificação esperados foram diagnosticados pela presença de um fragmento de DNA de ~1 kpb. Este fragmento foi removido do gel e purificado de acordo com as instruções do fabricante usando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc. , Valencia, CA) . Os fragmentos purificados foram então clonados no plasmídeo pCR2.1 usando o kit de clonagem TOPO TA Cloning® Kit (com o vector pCR®2.1) e células E. coli quimicamente competentes One Shot® T0P10 (Invitrogen Life Technologies, Carlsbad, CA) de acordo com o protocolo do fabricante.PCR amplification reactions were performed using reagents provided by TaKaRa Biotechnology Inc., Seta 3-4-1, Otsu, Shiga, 520-2193, Japan and consisted of the following: 5 μl of buffer 10X LA PCR ™ Buffer II (Mg 2 +), 20 ng of double stranded matrix (plasmid pDAB3014 DNA), 10 pmole of the direct oligonucleotide sequence, 10 pmole of the reverse oligonucleotide sequence, 8 of the mixture of dNTPs (2.5 mM each), 33.5 , 0.5 μΐ (2.5 units) TaKaRa LA Taq ™ DNA polymerase, 1 drop of mineral oil. PCR reactions were performed using a Perkin-Elmer Cetus thermal cycler, 48-sample DNA Thermal Cycler (Norwalk, CT) under the following conditions: 94øC, 4 min / 1 cycle; 98 ° C 20 sec, 55 ° C 1 min, 68 ° C 2 min / 30 cycles; 72 ° C, 5 min / 1 cycle; 4 ° C / remainder. Fifteen μΐ of each PCR reaction were electrophoresed at 100 V for 1 hr on a 1.0% TAE agarose gel supplemented with 0.5% ethidium bromide. The amplified fragments were visualized with UV light and the estimated fragment sizes compared to a 1 kbp DNA ladder. Expected amplification products were diagnosed by the presence of ~ 1 kbp DNA fragment. This fragment was removed from the gel and purified according to the manufacturer's instructions using the QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA). The purified fragments were then cloned into plasmid pCR2.1 using the TOPO TA Cloning Kit Kit (vector pCR2.2) and One Shot® T0P10 chemically competent E. coli cells (Invitrogen Life Technologies, Carlsbad, CA) of accordance with the manufacturer's protocol.

Colónias individuais foram inoculadas num tubo Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de canamicina e incubadas 16 hrs a 37°C com agitação a 200 rpm. Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrífuga de 1,7 ml Costar (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmídico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid Kit (BD Biosciences/Clontech/Macherey-Nagel, Paio Alto, CA) . Três yg do plasmídeo isolado foram digeridos com 10 unidades de Spel. Todas as digestos de plasmídeos foram incubadas durante 1 hr a 37°C. O DNA cortado com enzimas de restrição foi sujeito a electro-forese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etídio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os clones plasmídicos esperados foram diagnosticados pela presença de um fragmento de DNA inserido de ~1,0 kpb e 3,9 kpb (vector pCR®2.1). As reacções de sequenciação de cadeia dupla dos clones plasmídicos foram realizadas como descrito pelo fabricante usando o kit CEQ™ DTCS-Quick Start Kit (Beckman-Coulter, Paio Alto, CA) . As reacções foram purificadas usando Performa DTR Gel Filtration Cartridges (Edge BioSystems, Gaithersburg, MD) como descrito pelos protocolos do fabricante. As reacções de sequenciação foram analisadas num sistema de análise de DNA Beckman-Coulter CEQ™ 2000 XL e a caracterização nucleotídica realizada usando Sequencher™ versão 4.1.4 (Gene Codes Corporation, Ann Arbor, MI). G. Inserção da cassete não autónoma do gene de tolerância a herbicidas no esqueleto plasmídico - Dador não autónomoIndividual colonies were inoculated into a 14 ml Falcon tube (Becton-Dickinson, Franklin Lakes, NJ) containing 2 ml TB supplemented with 50 μg / ml kanamycin and incubated 16 hrs at 37 ° C with shaking at 200 rpm. After incubation, 1.5 ml of cells were transferred to a 1.7 ml Costar (Fisher Scientific, Pittsburgh, PA) microfuge tube and pelleted at 16,000 xg for 1 min. The supernatant was removed and the plasmid DNA isolated as described above using the NucleoSpin® Plasmid Kit (BD Biosciences / Clontech / Macherey-Nagel, Paio Alto, CA). Three æg of the isolated plasmid were digested with 10 Spel units. All plasmid digests were incubated for 1 hr at 37 ° C. The restriction enzyme-cleaved DNA was electrophoresed at 100 V for 1 hr on a 1.0% TAE agarose gel supplemented with 0.5% ethidium bromide. The fragments were visualized with UV light and the size of the fragments estimated by comparison with a ladder of 1 kbp DNA. Expected plasmid clones were diagnosed by the presence of an inserted ~ 1.0 kbp and 3.9 kbp DNA fragment (vector pCR2.2). The double-stranded sequencing reactions of the plasmid clones were performed as described by the manufacturer using the CEQ ™ DTCS-Quick Start Kit kit (Beckman-Coulter, Paio Alto, CA). Reactions were purified using Performa DTR Gel Filtration Cartridges (Edge BioSystems, Gaithersburg, MD) as described by the manufacturer's protocols. Sequencing reactions were analyzed on a Beckman-Coulter CEQ ™ 2000 XL DNA analysis system and nucleotide characterization performed using Sequencher ™ version 4.1.4 (Gene Codes Corporation, Ann Arbor, MI). G. Insertion of the non-autonomous cassette of the herbicide tolerance gene into the plasmid skeleton - Non-autonomous donor

De forma a criar um plasmídeo dador, a cassete autónoma do gene de tolerância a herbicida descrita no Exemplo 18F foi inserida nas construções de esqueleto plasmídico descritas nos Exemplos 18B e 18C. O fragmento cortado com enzimas de restrição derivado de um clone que possuía a sequência correcta de 1 kpb foi removido do gel e purificado de acordo com as instruções do fabricante usando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA).In order to create a donor plasmid, the autonomous cassette of the herbicide tolerance gene described in Example 18F was inserted into the plasmid backbone constructs described in Examples 18B and 18C. The restriction enzyme-cleaved fragment derived from a clone having the correct 1 kbp sequence was removed from the gel and purified according to the manufacturer's instructions using the QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA) .

Este fragmento foi então combinado numa reacção de ligação com pDAB7471 purificado (esqueleto plasmidico para a posição 1, Fig. 70) ou pDAB 7451 (esqueleto plasmidico para a posição 2, Fig. 71) que tinham sido digeridos com a enzima de restrição Spel e subsequentemente desfosforilados. A ligação foi realizada nas seguintesThis fragment was then combined in a ligation reaction with purified pDAB7471 (plasmid backbone for position 1, Fig. 70) or pDAB 7451 (plasmid backbone for position 2, Fig. 71) which had been digested with the restriction enzyme Spel and subsequently dephosphorylated. The connection was made in the following

condições: proporção vector:inserto 1:5 e 500 unidades de DNA-ligase de T4 (Invitrogen Life Technologies, Carlsbad, CA) num volume de reacção de 20 μΐ nas condições de incubação de 16 horas num banho-maria a 16°C. Cinco μΐ da reacção de ligação foi usado para transformar subsequentemente 50 μΐ de células quimicamente competentes MAXconditions: vector: 1: 5 insert ratio and 500 units of T4 DNA ligase (Invitrogen Life Technologies, Carlsbad, CA) in a reaction volume of 20 μΐ under the incubation conditions of 16 hours in a 16 ° C water bath. Five μΐ of the binding reaction was used to subsequently transform 50 μΐ of MAX chemically competent cells

Efficiency® DH5a™ (Invitrogen Life Technologies, Carlsbad, CA) e semeadas nas condições de selecção descritas pelo fabricante.Efficiency® DH5a ™ (Invitrogen Life Technologies, Carlsbad, CA) and seeded under the selection conditions described by the manufacturer.

Colónias individuais foram inoculadas num tubo Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de cloranfenicol. As culturas foram incubadas durante 16 hrs, a 37°C, com agitação a 200 rpm. Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrifuga Costar de 1,7 ml (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmidico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid (BD Biosciences/Clontech/ Macherey-Nagel, Paio Alto, CA) . Três yg do plasmídeo isolado foram digeridos com 10 unidades de Spel (New EnglandIndividual colonies were inoculated into a 14 ml Falcon tube (Becton-Dickinson, Franklin Lakes, NJ) containing 2 ml of TB supplemented with 50 μg / ml chloramphenicol. Cultures were incubated for 16 hrs at 37øC with shaking at 200 rpm. After incubation, 1.5 ml of cells were transferred to a Costar microfuge tube of 1.7 ml (Fisher Scientific, Pittsburgh, PA) and pelleted at 16,000 xg for 1 min. The supernatant was removed and the plasmid DNA isolated as described above using the NucleoSpin® Plasmid kit (BD Biosciences / Clontech / Macherey-Nagel, Paio Alto, CA). Three μg of the isolated plasmid were digested with 10 units of Spel (New England

Biolabs, Beverly, MA) e incubados durante 1 hr a 37°C. 0 DNA cortado com enzimas de restrição foi sujeito a electrof orese a 100 V durante 1 hr num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etidio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os clones plasmidicos esperados foram diagnosticados pela presença de fragmentos de DNA de 1,0 kpb e 4,96 kpb (vector pDB7471) ou ~4,9 kpb (vector pDAB7452) ou 1,0 Kpb e ~5,0 kpb (vector pDAB7451). Os plasmideos resultantes foram designados pDAB7423 (posição 1 dador não autónomo) (Fig. 76) e pDAB7454 (posição 2 dador não autónomo) (Fig. 77), respectivamente. H. Posição 1 ZFN + sequências dadoras HR: Plas-mídeo de combinaçãoBiolabs, Beverly, MA) and incubated for 1 hr at 37 ° C. Restricted enzyme-cut DNA was subjected to electrophoresis at 100 V for 1 hr on a 1.0% TAE agarose gel supplemented with 0.5% ethidium bromide. The fragments were visualized with UV light and the size of the fragments estimated by comparison with a ladder of 1 kbp DNA. Expected plasmid clones were diagnosed by the presence of 1.0 kbp and 4.96 kbp DNA fragments (vector pDB7471) or ~ 4.9 kbp (vector pDAB7452) or 1.0 kbp ~ 5.0 kbp (vector pDAB7451 ). The resulting plasmids were designated pDAB7423 (non-autonomous donor position 1) (Fig. 76) and pDAB7454 (non-autonomous donor position 2) (Fig. 77), respectively. H. Position 1 ZFN + HR donor sequences: Combination plasmid

Como estratégia alternativa para a entrega de dois plasmideos separados numa célula vegetal (e.g. um plasmideo contendo elementos ZFN e um segundo contendo as sequências dadoras de tolerância a herbicidas), plasmideos isolados foram manipulados geneticamente de forma a conterem todos os elementos necessários ilustrados nesta patente. Os plasmídos de combinação descritos neste exemplo possuem ambos os ZFNs destinados a alvejar e gerar quebras da cadeia dupla no locus IPP2K especificado assim como PAT PTU autónomo e/ou 2A/PAT PTU e sequências flanqueantes dadoras desenhadas para a integração naqueles locais de quebra.As an alternative strategy for delivering two separate plasmids into a plant cell (e.g., a plasmid containing ZFN elements and a second containing the herbicide tolerant donor sequences), isolated plasmids were engineered to contain all the necessary elements illustrated in this patent. The combination plasmids described in this example have both ZFNs intended to target and generate double strand breaks at the specified IPP2K locus as well as autonomous PTT and / or 2A / PAT PTU PAT and donor flanking sequences designed for integration at those sites of breakage.

Usou-se tecnologia Gateway®, que usa recombinação específica de local baseada no fago lambda (Landy, A. (1989) Ann. Rev. Biochem. 55:913) para converter os vectores pDAB7422 e pDAB7423 (descritos nos exemplos 6E e 6G) em vectores de destino Gateway®. Uma vez convertidos, os plasmídeos contendo cassetes de expressão de ZFN (inseridas em vectores Gateway® Entry) podem ser mobilizados facilmente para o vector de destino criando um plasmídeo de combinação ZFN/dador. Um yg de cada um desses plasmídeos foi digerido com 10 unidades de Notl (New England Biolabs, Beverly, MA) durante 1 hr a 37°C. A endonuclease de restrição Notl foi inactivada pelo calor a 65°C durante 15 min e os extremos do fragmento subsequentemente desfosforilados a 37°C durante 1 hr usando 3 unidades de fosfatase alcalina de camarão (SAP) (Roche Diagnostics GmbH, Mannheim, Germany). O DNA cortado com enzimas de restrição foi sujeito a electroforese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etídio. Os fragmentos de vector (pDB7422 = 7,317 Kbp, pDAB7423 = 5,971 Kbp) foram visualizados com luz UV, o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb, removidos do gel e subsequentemente purificado de acordo com as instruções do fabricante usando o kit QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA).Gateway® technology using lambda phage-specific site recombination (Landy, A. (1989) Ann Rev. Biochem 55: 913) was used to convert the vectors pDAB7422 and pDAB7423 (described in examples 6E and 6G) gateway destination vectors. Once converted, plasmids containing ZFN expression cassettes (inserted into Gateway® Entry vectors) can be readily mobilized to the target vector by creating a ZFN / donor combination plasmid. One Âμg of each of these plasmids was digested with 10 units NotI (New England Biolabs, Beverly, MA) for 1 hr at 37Â ° C. The Notl restriction endonuclease was heat inactivated at 65 ° C for 15 min and the fragment ends subsequently dephosphorylated at 37 ° C for 1 hr using 3 units of shrimp alkaline phosphatase (SAP) (Roche Diagnostics GmbH, Mannheim, Germany) . Restricted enzyme-cut DNA was electrophoresed at 100 V for 1 hr on a 1.0% TAE agarose gel supplemented with 0.5% ethidium bromide. The vector fragments (pDB7422 = 7.317 Kbp, pDAB7423 = 5.971 Kbp) were visualized with UV light, estimated fragment size compared to a 1 kbp DNA ladder, removed from the gel and subsequently purified according to the manufacturer's instructions using the QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA).

Este fragmento vector foi então combinado com um fragmento Notl de 2,274 kpb contendo os elementos Gateway®This vector fragment was then combined with a 2.277 kbp Notl fragment containing Gateway

Technology attRl, ccdB, CmR e attR2 numa reacção de ligação realizada nas seguintes condições: proporção de 1:5 vector:inserto e 500 unidades de DNA-ligase de T4 (Invitrogen Life Technologies, Carlsbad, CA) num volume de reacção de 20 μΐ em condições de 16 hr de incubação num banho-maria a 16°C. Cinco μΐ da reacção de ligação foram subsequentemente usados para transformar células E. coli quimicamente competentes One Shot® ccdB Survival™ (Invitrogen Life Technologies, Carlsbad, CA) e semeadas nas condições de selecção descritas pelo fabricante.Technology attRl, ccdB, CmR and attR2 in a binding reaction performed under the following conditions: 1: 5 vector: insert ratio and 500 units of T4 DNA ligase (Invitrogen Life Technologies, Carlsbad, CA) in a reaction volume of 20 μΐ under conditions of 16 hr incubation in a water bath at 16 ° C. Five μΐ of the ligation reaction were subsequently used to transform chemically competent One Shot® ccdB Survival ™ (Invitrogen Life Technologies, Carlsbad, CA) E. coli cells and seeded under the selection conditions described by the manufacturer.

Colónias individuais foram inoculadas num tubo Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de canamicina e incubadas 16 hrs, a 37°C, com agitação a 200 rpm. Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrifuga de 1,7 ml Costar (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmidico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid Kit (BD Biosciences/Clontech/Macherey-Nagel, Paio Alto, CA) . Três yg de DNA plasmidico foram digeridos com 10 unidades de EcoRI (New England Biolabs, Beverly, MA) e incubados durante 1 hr a 37°C. O DNA cortado com enzimas de restrição foi sujeito a electroforese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etidio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os clones plasmídicos esperados foram diagnosticados pela presença de fragmentos de DNA inseridos de 1,448 Kbp, 1,946 Kbp e 6,197 Kbp PAT PTU autónoma posição 1 HR dador e 5,807 Kbp e 2,438 Kbp para PAT não autónoma posição 1 HR dador. Os plasmídeos resultantes foram designados pDAB7424 (dador autónomo posição 1 adaptado de Gateway®) (FIG. 78) e pDAB7425 (dador não autónomo posição 1 adaptado de Gateway®) (FIG. 79), respectivamente.Individual colonies were inoculated into a 14 ml Falcon tube (Becton-Dickinson, Franklin Lakes, NJ) containing 2 ml TB supplemented with 50 μg / ml kanamycin and incubated 16 hrs at 37 ° C with shaking at 200 rpm. After incubation, 1.5 ml of cells were transferred to a 1.7 ml Costar (Fisher Scientific, Pittsburgh, PA) microfuge tube and pelleted at 16,000 xg for 1 min. The supernatant was removed and the plasmid DNA was isolated as described above using the NucleoSpin® Plasmid Kit (BD Biosciences / Clontech / Macherey-Nagel, Paio Alto, CA). Three μg of plasmid DNA were digested with 10 units of EcoRI (New England Biolabs, Beverly, MA) and incubated for 1 hr at 37 ° C. Restricted enzyme-cut DNA was electrophoresed at 100 V for 1 hr on a 1.0% TAE agarose gel supplemented with 0.5% ethidium bromide. The fragments were visualized with UV light and the size of the fragments estimated by comparison with a ladder of 1 kbp DNA. The expected plasmid clones were diagnosed by the presence of inserted DNA fragments of 1,448 Kbp, 1,946 Kbp and 6,197 Kbp PAT PTU autonomous position 1 HR donor and 5,807 Kbp and 2,438 Kbp for non-autonomous PAT position 1 HR donor. The resulting plasmids were designated pDAB7424 (Gateway 1 proprietary autonomous donor) (FIG.78) and pDAB7425 (Gateway® non-autonomous donor position 1) (FIG. 79), respectively.

Como resultado destas manipulações de clonagem, os plasmídeos pDAB7424 e pDAB7425 foram designados como vectores de destino Gateway®. pDAB7412 possui funcionalidade como um vector de entrada Gateway® contendo os seguintes elementos: ZMJbilv.2/ZFNl2/Zm Per5 3' UTR. Para transferir uma cassete de expressão de ZFN (vector de entrada Gateway®), realizou-se uma reacção com LR Clonase™ II (Invitrogen Life Technologies, Carlsbad, CA) como descrito pelo fabricante numa proporção de 50 ng (vector de entrada):150 ng/μΐ (vector de destino). Os plasmídeos resultantes positivos para a combinação foram designados pDAB7426 (dador HR autónomo posição -1/ZFN12) (FIG. 80) & pDAB7427 (dador HR não autónomo/ZFNl2) (FIG. 81).As a result of these cloning manipulations, the plasmids pDAB7424 and pDAB7425 were designated as Gateway target vectors. pDAB7412 has functionality as a Gateway® input vector containing the following elements: ZMJbilv.2 / ZFNl2 / Zm Per5 3 'UTR. To transfer a ZFN expression cassette (Gateway entry vector), a reaction was performed with LR Clonase ™ II (Invitrogen Life Technologies, Carlsbad, CA) as described by the manufacturer at a ratio of 50 ng (input vector): 150 ng / μΐ (target vector). The resulting plasmids positive for the combination were designated pDAB7426 (autonomous HR donor position -1 / ZFN12) (FIG. 80) & pDAB7427 (non-autonomous HR donor / ZFN12) (FIG 81).

Exemplo 19: Entrega de ZFN e DNA dador em células vegetaisExample 19: Delivery of ZFN and donor DNA in plant cells

De modo a permitir a integração mediada por ZFN de DNA dador no genoma vegetal via integração dirigida, entende-se que é necessária a entrega do DNA codificador de ZFN seguida da expressão da proteína ZFN funcional na célula vegetal. É igualmente necessária a entrega concomitante de DNA dador na referida célula vegetal, de forma que a proteína ZFN possa induzir quebras na cadeia dupla no DNA alvo, as quais são então reparadas através de integração conduzida por homologia do DNA dador no locus alvo. Os familiarizados com a área podem conceber que a expressão da proteína ZFN funcional possa ser conseguida através de vários métodos, incluindo, mas não lhes estando limitados, transgénese da construção codificadora de ZFN ou expressão transitória da construção codificadora de ZFN. Em ambos os casos, a expressãoda proteína ZFN funcional e a entrega de DNA dador na célula vegetal é simultaneamente conseguida de forma a conduzir a integração dirigida.In order to allow ZFN-mediated integration of donor DNA into the plant genome via targeted integration, it is understood that delivery of ZFN-encoding DNA is required followed by expression of functional ZFN protein in the plant cell. Concomitant delivery of donor DNA into said plant cell is also required so that the ZFN protein can induce double strand breaks in the target DNA, which are then repaired by integration carried out by homology of the donor DNA at the target locus. Those skilled in the art can appreciate that the expression of the functional ZFN protein can be achieved by various methods, including, but not limited to, transgenesis of the ZFN coding construct or transient expression of the ZFN coding construct. In both cases, the expression of the functional ZFN protein and delivery of donor DNA in the plant cell is simultaneously achieved in order to conduct targeted integration.

Nos exemplos aqui citados, demonstrámos métodos para a entrega concomitante de DNA codificador de ZFN e de DNA dador em células vegetais. Os familiarizados com a técnica poderão usar qualquer um de uma variedade de métodos de entrega de DNA adequados para células vegetais, incluindo, mas não lhes estando limitados, transformação mediada por Agrobacterium, entrega de DNA baseada em biolística ou entrega de DNA mediada por Whiskers™. Numa realização aqui descrita, as experiências de entrega de DNA mediada por Whiskers™ foram realizadas usando várias combinações de DNA dador com construções de DNA codificador de ZFN. Estas combinações incluem 1) um único plasmídeo contendo sequência codificadora de ZFN e DNA dador e 2) dois plasmídeos distintos, um contendo sequência codifi cadora de ZFN e o outro contendo DNA dador. Numa outra realização, a entrega de DNA baseada em biolística foi realizada usando várias combinações de DNA dador com construções de DNA codificador de ZFN. Os familiarizados com a técnica podem deduzir que estas combinações podem incluir 1) um único plasmídeo contendo a sequência codificadora de ZFN e o DNA dador e 2) dois plasmídeos distintos, um contendo a sequência codificadora de ZFN e o outro contendo DNA dador. A. Entrega de DNA mediada por Whiskers™In the examples cited herein, we have demonstrated methods for the concomitant delivery of DNA encoding ZFN and donor DNA in plant cells. Those skilled in the art may use any of a variety of DNA delivery methods suitable for plant cells, including, but not limited to, Agrobacterium-mediated transformation, biolistic-based DNA delivery, or Whiskers ™ mediated DNA delivery . In one embodiment described herein, Whiskers ™ mediated DNA delivery experiments were performed using various combinations of donor DNA with DNA constructs encoding ZFN. These combinations include 1) a single plasmid containing ZFN coding sequence and donor DNA and 2) two distinct plasmids, one containing ZFN coding sequence and one containing donor DNA. In another embodiment, biolistic-based DNA delivery was performed using various combinations of donor DNA with DNA constructs encoding ZFN. Those skilled in the art may deduce that such combinations may include 1) a single plasmid containing the ZFN coding sequence and the donor DNA and 2) two distinct plasmids, one containing the ZFN coding sequence and the other containing donor DNA. A. Whiskers ™ mediated DNA delivery

Como aqui descrito anteriormente, foram produzidas culturas celulares embrionárias Hi-II de milho e foram usadas como fonte de células vegetais vivas em que é demonstrada a integração dirigida. Os familiarizados com a técnica podem considerar a utilização de culturas celulares derivadas de uma variedade de espécies vegetais ou tecidos vegetais diferenciados, derivados de uma variedade de espécies vegetais, como fonte de células vegetais vivas em que é demonstrada a integração dirigida.As described hereinbefore, human Hi-II embryonic cell cultures were produced and were used as a source of live plant cells in which targeted integration is demonstrated. Those skilled in the art may consider the use of cell cultures derived from a variety of plant species or differentiated plant tissues, derived from a variety of plant species, as the source of living plant cells in which targeted integration is demonstrated.

Neste exemplo, 12 ml PCV de uma linha celular anteriormente criopreservada mais 28 ml de meio condicionado foram subcultivados em 80 ml de meio líquido GN6 (Chu CC, et al.1975), 2,0 mg/1 2,4-D, 30 g/1 sucrose, pH 5,8) num frasco Erlenmeyer de 500 ml e colocados num agitador a 125 rpm a 28°C. Este passo foi repetido 2 vezes usando a mesma linha celular, de forma que um total de 36 ml PCV foi distribuído por 3 frascos. Após 24 horas, o meio líquido GN6 foi removido e substituído por 72 ml de meio osmótico GN6 S/M (N6 Medium, 2,0 mg/1 2,4-D, 30 g/1 sucrose, 45,5 g/1 sorbitol, 45,5 g/L manitol, 100 mg/1 mio-inositol, pH 6,0) . O frasco foi incubado no escuro durante 30-35 minutos, a 28°C, com agitação moderada (125 rpm). Durante o período de incubação, preparou-se uma suspensão a 50 mg/ml de palhetas de carbeto de silício (Advanced Composite Materials, LLC, Greer, SC) através da adição de 8,1 ml de meio líquido GN6/SM a 405 mg de palhetas de carbeto de silício estéreis.In this example, 12 ml of PCV from a previously cryopreserved cell line plus 28 ml of conditioned medium were subcultured into 80 ml of GN6 liquid medium (Chu CC, et al.1975), 2.0 mg / l 2,4-D, 30 g / 1 sucrose, pH 5.8) in a 500 ml Erlenmeyer flask and placed on a shaker at 125 rpm at 28 ° C. This step was repeated 2 times using the same cell line, so that a total of 36 ml PCV was distributed over 3 vials. After 24 hours, the GN6 liquid medium was removed and replaced with 72 ml of GN6 S / M osmotic medium (N6 Medium, 2.0 mg / 1 2,4-D, 30 g / 1 sucrose, 45.5 g / 1 sorbitol, 45.5 g / L mannitol, 100 mg / 1 myo-inositol, pH 6.0). The flask was incubated in the dark for 30-35 minutes at 28øC with moderate agitation (125 rpm). During the incubation period, a 50 mg / ml suspension of silicon carbide vanes (Advanced Composite Materials, LLC, Greer, SC) was prepared by adding 8.1 ml of GN6 / SM liquid medium to 405 mg of sterile silicon carbide vanes.

Após incubação em meio osmótico GN6 S/M, os conteúdos de cada frasco foram reunidos num frasco de centrífuga de 250 ml. Após todas as células no frasco terem sedimentado no fundo, o volume do conteúdo em excesso de aproximadamente 14 ml de líquido GN6 S/M foi removido e colhido num frasco estéril de 1 litro para uso posterior. A suspensão pré-molhada de palhetas foi misturada à velocidade máxima num vortex durante 60 segundo e depois adicionada ao frasco de centrífuga.After incubation in GN6 S / M osmotic medium, the contents of each vial were pooled in a 250 ml centrifuge bottle. After all cells in the flask had sedimentated at the bottom, the volume of the excess content of approximately 14 ml of GN6 S / M liquid was removed and collected in a sterile 1 liter flask for later use. The pre-wet vane suspension was blended at full speed in a vortex for 60 seconds and then added to the centrifuge vial.

Num exemplo, em que um único plasmídeo contendo a sequência codificadora de ZFN mais o DNA dador é entregue nas células vegetais, 170 yg de DNA de plasmídeo circular purificado foram adicionados ao frasco. Num exemplo alternativo, em que dois plasmídeos distintos foram co-entregues, um contendo uma sequência codificadora de ZFN e o outro contendo DNA dador, foram avaliadas múltiplas estratégias para as quantidades de DNA. Uma estratégia utilizou 85 yg de DNA dador e 85 yg de DNA codificador de dedos de zinco. Outras modificações utilizaram proporções molares de 10, 5 ou 1 vez DNA dador para 1 vez DNA dedo de zinco, baseado no tamanho (em quilopares de bases) dos plasmideos individuais, de modo que um total de 170 yg de DNA foi adicionado por frasco. Em todos os casos de co-entrega, o DNA foi reunido num tubo antes de ser adicionado ao frasco de centrífuga. Uma vez adicionado o DNA, o frasco foi imediatamente colocado num misturador de tinta comercial Red Devil 5400 modificado (Red Devil Equipment Co., Plymouth, MN) e agitado durante 10 segundos. Após agitação, a mistura de células, meio, palhetas e DNA foi adicionada ao conteúdo de um frasco de 1 litro juntamente com 125 ml de meio líquido GN6 fresco para reduzir o regulador da pressão osmótica. As células ficaram a recuperar num agitador a 125 rpm durante 2 hrs. Seis ml da suspensão dispersa foram filtrados em papel de filtro Whatman #4 (5,5 cm) usando uma unidade colectora de vidro ligada a uma linha de vácuo, de modo a obter 60 filtros por frasco. Os filtros foram colocados em placas de 60 x 20 mm de meio GN6 sólido (o mesmo de meio GN6 líquido excepto com 2,5 g/1 de agente gelificante Gelrite) e incubados a 28°C no escuro durante 1 semana. B. Entrega de DNA mediada por biolísticaIn one example, where a single plasmid containing the ZFN coding sequence plus the donor DNA is delivered into the plant cells, 170æg of purified circular plasmid DNA was added to the flask. In an alternative example, where two distinct plasmids were co-delivered, one containing a ZFN coding sequence and the other containing donor DNA, multiple strategies for the amounts of DNA were evaluated. One strategy used 85 g of donor DNA and 85 g of DNA encoding zinc fingers. Other modifications used molar ratios of 10, 5 or 1 time donor DNA to 1x finger zinc finger, based on the size (in kilopars of bases) of the individual plasmids, so that a total of 170æg of DNA was added per vial. In all co-delivery cases, the DNA was pooled into a tube before being added to the centrifuge bottle. Once the DNA was added, the vial was immediately placed in a modified Red Devil 5400 commercial paint mixer (Red Devil Equipment Co., Plymouth, MN) and shaken for 10 seconds. After stirring, the mixture of cells, medium, vanes and DNA was added to the contents of a 1 liter flask along with 125 ml of fresh GN6 liquid medium to reduce the osmotic pressure regulator. Cells were recovered on a shaker at 125 rpm for 2 hrs. Six ml of the dispersed suspension were filtered on Whatman # 4 (5.5 cm) filter paper using a glass collection unit connected to a vacuum line to obtain 60 filters per vial. Filters were plated onto 60 x 20 mm plates of solid GN6 medium (the same as GN6 liquid medium except 2.5 g / l Gelrite gelling agent) and incubated at 28øC in the dark for 1 week. B. Biolistics-mediated DNA delivery

Nos exemplos referidos atrás, as suspensões embrionárias de milho foram subcultivadas em meio líquido GN6 aproximadamente 24 horas antes da experimentação como descrito anteriormente. 0 meio liquido em excesso foi removido e aproximadamente 0,4 PCV de células foram finamente espalhadas num circulo de 2,5 cm de diâmetro no centro de uma placa de petri de 100x15 mm contendo meio GN6 S/M solidificado com 2,5 g/1 de gelrite. As células foram cultivadas no escuro durante 4 hrs. Para revestir as partículas de biolistica com DNA, 3 mg de partículas de ouro de 1,0 micron de diâmetro foram lavadas uma vez com 100% de etanol, duas vezes com água destilada estéril e ressuspensas em 50 μΐ de água num tubo Eppendorf siliconado. Um total de 5 pg de DNA plasmídico, 20 μΐ de espermidina (0,1 M) e 50 μΐ de cloreto de cálcio (2,5 M) foram adicionados separadamente à suspensão de ouro e misturados num vortex. A mistura foi incubada à temperatura ambiente durante 10 min, sedimentada a 10000 rpm numa microcentrifuga de bancada durante 10 segundos, ressuspensa em 60 μΐ de etanol a 100% frio e 8-9 μΐ foram distribuídos por cada macroveículo. O bombardeamento foi efectuado com o sistema Biolistic PDS-1000/He™ system (Bio-Rad Laboratories, Hercules, CA) . As placas contendo as células foram colocadas na prateleira do meio em condições de 1100 psi e 27 polegadas de Hg de vácuo e foram bombardeadas seguindo o manual de funcionamento. Dezasseis horas após bombardeamento, o tecido foi transferido em pequenos aglomerados para meio GN6 (1H) e cultivado durante 2-3 semanas a 28°C no escuro. As transferências continuaram cada 2-4 semanas até surgirem isolados transgénicos putativos resultantes da integração do DNA dador. A identificação, isolamento e regeneração de putativos eventos de integração de DNA dador gerados através da entrega de DNA mediada por biolistica são idênticos ao processo utilizado para putativos eventos de integração de DNA dador através da entrega de DNA mediada por Whiskers™ e descritos abaixo. C. Identificação e isolamento de putativos eventos transgénicos de integração dirigidaIn the examples mentioned above, the embryonic suspensions of corn were subcultured in GN6 liquid medium approximately 24 hours prior to the experimentation as described above. Excess liquid medium was removed and approximately 0.4 PCV of cells were finely scattered in a circle of 2.5 cm in diameter at the center of a 100x15 mm petri dish containing GN6 S / M medium solidified with 2.5 g / 1 gelrite. Cells were grown in the dark for 4 hrs. To coat the biolystic particles with DNA, 3 mg of gold particles of 1.0 micron in diameter were washed once with 100% ethanol, twice with sterile distilled water and resuspended in 50 μl of water in a siliconized Eppendorf tube. A total of 5 μg of plasmid DNA, 20 μg of spermidine (0.1 M) and 50 μl of calcium chloride (2.5 M) were added separately to the gold suspension and vortexed. The mixture was incubated at room temperature for 10 min, sedimented at 10,000 rpm in a bench microfuge for 10 seconds, resuspended in 60 μΐ of cold 100% ethanol and 8-9 μΐ were distributed over each macroveicle. The bombardment was performed with the Biolistic PDS-1000 / He ™ system (Bio-Rad Laboratories, Hercules, CA). The plates containing the cells were placed on the medium shelf under conditions of 1100 psi and 27 inches of vacuum Hg and were bombarded following the operating manual. Sixteen hours after bombardment, the tissue was transferred in small pellets to GN6 (1H) medium and cultured for 2-3 weeks at 28øC in the dark. Transfers were continued every 2-4 weeks until putative transgenic isolates from integration of the donor DNA appeared. The identification, isolation and regeneration of putative donor DNA integration events generated through the delivery of biolithic-mediated DNA are identical to the process used for putative donor DNA integration events through the delivery of DNA mediated by Whiskers ™ and described below. C. Identification and isolation of putative targeted transgenic events

Uma semana após entrega de DNA, os papéis de filtro foram transferidos para placas de 60x20 mm de meio de selecção GN6(1H) (Meio N6, 2,0 mg/1 2,4-D, 30 g/1 sucrose, 100 mg/1 mioinositol, 1,0 mg/1 de bialaphos da Herbiace (Meiji Seika, Japan), 2,5 g/1 de Gelrite, pH 5,8). Estas placas de selecção foram incubadas a 28°C durante uma semana no escuro.One week after DNA delivery, the filter papers were transferred to 60x20 mm plates of GN6 (1H) selection medium (Medium N6, 2.0 mg / 1 2,4-D, 30 g / 1 sucrose, 100 mg 1 myoinositol, 1.0 mg / l Herbiace bialaphos (Meiji Seika, Japan), 2.5 g / l Gelrite, pH 5.8). These selection plates were incubated at 28 ° C for one week in the dark.

Após 1 semana de selecção no escuro, o tecido foi embebido em meio fresco raspando metade das células de cada placa para um tubo contendo 3,0 ml de meio GN6 com agarose mantido a 37-38°C (meio N6, 2,0 mg/1 de 2,4-D, 30 g/1 sucrose, 100 mg/1 mioinositol, 7 g/1 de agarose SeaPlaque®, pH 5,8, autoclavado durante apenas 10 minutos a 121°C) e 1 mg/1 de bialaphos da Herbiace. A mistura de agarose/tecido foi partida com uma espátula e, subsequentemente, 3 ml da mistura de agarose/tecido foi vertida sobre a superfície de uma placa de petri de 100 x 15 mm contendo meio GN6 (1H) . Este processo foi repetido para as duas metades de cada placa. Uma vez embebido todo o tecido, as placas foram fechadas individualmente com Nescofilm® ou Parafilm M®, e cultivadas a 28° C no escuro até 10 semanas. Isolados putativamente transformados que cresceram nestas condições de selecção foram removidos das placas embebidas e transferidos para meio de selecção fresco em placas de 60 x 20 mm. No caso de ser evidente o crescimento sustentado após aproximadamente 2 semanas um evento foi considerado como sendo resistente ao herbicida aplicado (bialophos) e uma alíquota das células foi subsequentemente colhida para tubos Eppendorf de 2 ml para análise de genótipos.After 1 week of selection in the dark, the tissue was soaked in fresh medium by scraping half of the cells from each plate into a tube containing 3.0 ml of GN6 medium with agarose maintained at 37-38 ° C (N6 medium, 2.0 mg / 1 of 2,4-D, 30 g / 1 sucrose, 100 mg / 1 myoinositol, 7 g / 1 SeaPlaque® agarose, pH 5.8, autoclaved for only 10 minutes at 121 ° C) and 1 mg / l of Bialaphos from Herbiace. The agarose / tissue blend was split with a spatula, and subsequently 3 ml of the agarose / tissue mixture was poured onto the surface of a 100 x 15 mm petri dish containing GN6 (1H) medium. This process was repeated for the two halves of each plate. Once the whole tissue was soaked, the plates were individually closed with Nescofilm® or Parafilm®, and cultured at 28 ° C in the dark for up to 10 weeks. Putatively transformed isolates grown under these selection conditions were removed from the embedded plates and transferred to fresh selection medium in 60 x 20 mm dishes. In case sustained growth was evident after approximately 2 weeks an event was considered to be resistant to the applied herbicide (bialophos) and an aliquot of the cells was subsequently harvested into 2 ml Eppendorf tubes for genotype analysis.

Os familiarizados com a técnica poderão utilizar um gene codificador de qualquer marca seleccionável adequada no DNA dador e aplicar às células vivas condições de selecção comparáveis. Por exemplo, um gene de marca seleccionável alternativo como seja AAD-1, como descrito em WO 2005/107437 A2, poderá ser implementado como dador para a selecção e recuperação de eventos integrados em células de milho como aqui descrito.Those skilled in the art may use a gene encoding any suitable selectable marker in the donor DNA and apply comparable selection conditions to the living cells. For example, an alternative selectable marker gene such as AAD-1 as described in WO 2005/107437 A2 may be implemented as a donor for the selection and recovery of events integrated into maize cells as described herein.

Exemplo 20: Rastreio de eventos de integraçãoExample 20: Integration Event Tracing

dirigida através da genotipagem por PCRdirected by PCR genotyping

Neste exemplo, a genotipagem por PCR inclui, mas não lhes está limitado, amplificação por reacção em cadeia da polimerase (PCR) de DNA genómico derivado de tecido de calo de milho isolado, previsto como contendo DNA dador inserido no genoma, seguido de clonagem convencional e análise de sequências dos produtos de amplificação por PCR. Os métodos de genotipagem por PCR têm sido bem descritos (por exemplo, Rios, G. et al. (2002) Plant J. 32:243-253) e podem ser aplicados a DNA genómico derivado de qualquer espécie ou tipo de tecido vegetal, incluindo culturas celulares.In this example, PCR genotyping includes but is not limited to polymerase chain reaction (PCR) amplification of genomic DNA derived from isolated corn callus tissue, provided as containing donor DNA inserted into the genome, followed by conventional cloning and sequence analysis of the PCR amplification products. PCR genotyping methods have been well described (for example, Rios, G. et al. (2002) Plant J. 32: 243-253) and can be applied to genomic DNA derived from any species or type of plant tissue, including cell cultures.

Os familiarizados com a técnica podem considerar estratégias para a genotipagem por PCR que incluam (mas não lhes estão limitadas) amplificação de sequências especificas no genoma vegetal, amplificação de múltiplas sequências especificas no genoma vegetal, amplificação de sequências não especificas no genoma vegetal ou suas combinações. As amplificações podem ser seguidas de clonagem e sequenciação, como descrito neste exemplo, ou através de análise directa de sequências dos produtos de amplificação. Os familiarizados com a técnica podem considerar métodos alternativos de análise dos produtos de amplificação aqui gerados.Those skilled in the art may consider strategies for PCR genotyping which include (but are not limited to) amplification of specific sequences in the plant genome, amplification of multiple specific sequences in the plant genome, amplification of non-specific sequences in the plant genome or combinations thereof . The amplifications may be followed by cloning and sequencing as described in this example, or by direct sequence analysis of the amplification products. Those familiar with the art may consider alternative methods of analyzing the amplification products generated herein.

Numa realização aqui descrita, nas amplificações por PCR são empregues sequências oligonucleotidicas especificas para o gene alvo. Numa outra realização aqui descrita, são empregues sequências oligonucleotidicas especificas para sequências do DNA dador nas amplificações por PCR. Uma outra realização inclui uma combinação de sequências oligonucleotídicas que se ligam à sequência do gene alvo e à sequência do DNA dador. Os familiarizados com a técnica podem considerar outras combinações de sequências iniciadoras e reacções de amplificação para testar o genoma. A. Extracção de DNA genómico 0 DNA genómico (gDNA) foi extraído a partir de células de milho isoladas tolerantes a herbicida descritas no Exemplo 19 e utilizado como matriz nas experiências de genotipagem por PCR. 0 gDNA foi extraído a partir de aproximadamente 100-300 μΐ de volume de células sedimentadas (PCV) de calo Hill tolerantes a herbicida, isoladas como descrito atrás de acordo com protocolos do fabricante detalhado no kit DNeasy® 96 Plant Kit (QIAGEN Inc., Valencia, CA). O DNA genómico foi eluído em 100 μΐ do tampão de eluição fornecido com o kit, dando concentrações finais de 20-200 ng/μΐ e subsequentemente analisado através de métodos de genotipagem baseados em PCR descritos abaixo.In one embodiment described herein, oligonucleotide sequences specific for the target gene are employed in PCR amplifications. In another embodiment described herein, oligonucleotide sequences specific for donor DNA sequences are employed in the PCR amplifications. A further embodiment includes a combination of oligonucleotide sequences that bind to the target gene sequence and the donor DNA sequence. Those skilled in the art may consider other combinations of primer sequences and amplification reactions to test the genome. A. Genomic DNA Extraction Genomic DNA (gDNA) was extracted from the herbicide tolerant isolated maize cells described in Example 19 and used as template in the PCR genotyping experiments. The gDNA was extracted from approximately 100-300 μl of herbicide tolerant Hill callus sediment cell volume (PCV), isolated as described above according to the manufacturer's protocols detailed in the DNeasy® 96 Plant Kit (QIAGEN Inc., Valencia, CA). The genomic DNA was eluted in 100 μl of the elution buffer provided with the kit, yielding final concentrations of 20-200 ng / μΐ and subsequently analyzed by PCR-based genotyping methods described below.

B. Desenho de sequências iniciadoras para a genotipagem por PCRB. Design of primers for PCR genotyping

Os familiarizados com a técnica podem usar uma variedade de estratégias para o desenho e implementação de genotipagem baseada em PCR. São exequíveis sequências iniciadoras oligonucleotídicas projectadas paraThose familiar with the art can use a variety of strategies for the design and implementation of PCR-based genotyping. Exemplary oligonucleotide primer sequences designed for

emparelharem com o gene alvo, com as sequências de DNA dador e/ou combinações das duas. De modo a desenhar sequências oligonucleotidicas que possam emparelhar com o gene alvo IPP2K nas regiões não abrangidas pelas sequências flanqueantes de homologia inseridas nas moléculas de DNA dador, clones plasmídicos contendo outras sequências de genes alvo foram caracterizadas através da sequenciação de DNA. As reacções de sequenciação em cadeia dupla dos clones palsmidicos foram realizadas como descrito pelo fabricante usando o kit CEQ™ DTCS-Quick Start Kit (Beckman-Coulter, Paio Alto, CA). As reacções foram purificadas usando cassetes Performa DTR Gel Filtration Cartridges (Edge BioSystems, Gaithersburg, MD) como descrito pelos protocolos do fabricante. As reacções de sequenciação foram analisadas num sistema de análise de DNA Beckman-Coulter CEQ™ 2000 XL e a caracterização nucleotidica realizada usando Sequencher™ versão 4.1.4 (Gene Codes Corporation, Ann Arbor, MI) . Estas sequências correspondem a regiões do gene IPP2K a montante (5'-) e a jusante (3'-) das regiões alvo de ZFN e estão descritas na Fig. 91 (SEQ ID NO:141) e Fig. 92 (SEQ ID NO:142).pair with the target gene, with the donor DNA sequences and / or combinations of the two. In order to design oligonucleotide sequences that can anneal to the target gene IPP2K in regions not encompassed by the flanking homology sequences inserted into the donor DNA molecules, plasmid clones containing other target gene sequences were characterized by DNA sequencing. The double-stranded sequencing reactions of the palsic clones were performed as described by the manufacturer using the CEQ ™ DTCS-Quick Start Kit kit (Beckman-Coulter, Paio Alto, CA). Reactions were purified using Performa DTR Gel Filtration Cartridges (Edge BioSystems, Gaithersburg, MD) cassettes as described by the manufacturer's protocols. Sequencing reactions were analyzed on a Beckman-Coulter CEQ ™ 2000 XL DNA analysis system and nucleotide characterization performed using Sequencher ™ version 4.1.4 (Gene Codes Corporation, Ann Arbor, MI). Fig. 91 (SEQ ID NO: 141) and Fig. 92 (SEQ ID NO: 141). These sequences correspond to regions of the IPP2K gene upstream (5'-) and downstream (3 ') of the ZFN target regions and are described in Fig. : 142).

Nos exemplos aqui apresentados, todas as sequências oligonucleotidicas foram sintetizadas por Integrated DNA Technologies, Inc. (Coralville, IA) em condições padrão de desalinação e diluídas com água para uma concentração de 100 μΜ. A série de sequências iniciadoras oligonucleotidicas directa e reversa que se seguem foi desenhada para emparelhar com sequências de gDNA específicas do gene alvo IPP2K situadas fora das fronteiras das sequências de DNA dador. Estes oligonucleótidos são os seguintes: 5'-TGGACGGAGCGAGAGCCAGAATTCGACGCT G-3' (SEQ ID NO: 153) 5'-GTGCAAGAATGTATTGGGAATCAACCTGAT G-3' (SEQ ID NO: 154)In the examples presented herein, all oligonucleotide sequences were synthesized by Integrated DNA Technologies, Inc. (Coralville, IA) under standard conditions of desalination and diluted with water to a concentration of 100 μΜ. The series of forward and reverse oligonucleotide primer sequences that follow are designed to pair with specific gPNA sequences of the target gene IPP2K located outside the boundaries of the donor DNA sequences. These oligonucleotides are as follows: 5'-TGGCAGGAGCGAGAGCCAGAATTCGACGCT G-3 '(SEQ ID NO: 153) 5'-GTGCAAGAATGTATTGGGAATCAACCTGAT G-3' (SEQ ID NO: 154)

Uma segunda série de sequências iniciadoras oligonucleotidicas directa e reversa foi também desenhada para emparelhar com a sequência de gDNA especifica do gene alvo IPP2K fora das fronteiras das sequências de DNA dador, ainda que dentro dos limites do primeiro par: 5'-CTGTGGTACCAGTACTAGTACCAGCATC-S' (SEQ ID NO:155) 5'-TCT TGGATCAAGGCATCAAGC ATTCCAATCT-3' (SEQ ID NO: 156)A second set of forward and reverse oligonucleotide primer sequences were also designed to anneal to the target gene specific gDNA sequence IPP2K outside the borders of the donor DNA sequences, although within the limits of the first pair: 5'-CTGTGGTACCAGTACTAGTACCAGCATC-S ' (SEQ ID NO: 155) 5'-TCT TGGATCAAGGCATCAAGC ATTCCAATCT-3 '(SEQ ID NO: 156)

Desenharam-se ainda sequências iniciadoras oligonucleotidicas directa e reversa para emparelharem especificamente com DNA dador correspondendo à região codificadora do gene de tolerância a herbicida: 5'-TGGGTAACTGGCCTAACTGG-3' (SEQ ID NO:157) 5'-TGGAAGGCTAGGAACGCTTA-3' (SEQ ID NO:158) 5'-CCAGTTAGGCCAGTTACCCA-3' (SEQ ID NO:159) 5'-TAAGCGTTCCTAGCCTTCCA-3' (SEQ ID NO:160) C. Amplificação por PCR especifica do DNA dadorDirect and reverse oligonucleotide primer sequences were also designed to specifically match donor DNA corresponding to the coding region of the herbicide tolerance gene: 5'-TGGGTAACTGGCCTAACTGG-3 '(SEQ ID NO: 157) 5'-TGGAAGGCTAGGAACGCTTA-3' (SEQ ID NO: 157). ID NO: 158) 5'-CCAGTTAGGCCAGTTACCCA-3 '(SEQ ID NO: 159) 5'-TAAGCGTTCCTAGCCTTCCA-3' (SEQ ID NO: 160) C. Specific PCR amplification of the donor DNA

As primeiras reacções de amplificação por PCR foram realizadas usando reagentes fornecidos por TaKaRaThe first PCR amplification reactions were performed using reagents provided by TaKaRa

Biotechnology Inc., Seta 3-4-1, Otsu, Shiga, 520-2193, Japan e consistiram no seguinte: 2,5 μΐ de tampão 10X Ex Taq PCR™ Buffer, 40-200 ng de DNA genómico matriz de cadeia dupla, 10 μΜ da sequência oligonucleotidica directa, 10 μΜ da sequência oligonucleotidica reversa, 2 μΐ da mistura de dNTPs (2,5 mM cada), 16 μΐ SBO, 0,5 μΐ (2,5 unidades) DNA-polimerase Ex Taq™. As reacções de PCR foram realizadas usando um termociclador Bio-Rad, DNA Engine Tetrad2, Peltier Thermal Cycler (Hercules, CA) de 96 amostras, nas seguintes condições: 94°C, 3 min/1 ciclo; 94°C 30 seg, 64°C 30 seg, 72°C 5 min/35 ciclos; 72°C, 10 min/1 ciclo; 4 °C/restante.Biotechnology Inc., Seta 3-4-1, Otsu, Shiga, 520-2193, Japan and consisted of the following: 2.5 μl of buffer 10X Ex Taq PCR ™ Buffer, 40-200 ng of double stranded matrix genomic DNA, 10 μ of the forward oligonucleotide sequence, 10 μ of the reverse oligonucleotide sequence, 2 μ of the mixture of dNTPs (2.5 mM each), 16 μ SBO, 0.5 μ (2.5 units) Ex Taq ™ DNA polymerase. PCR reactions were performed using a 96-sample Bio-Rad, DNA Engine Tetrad2, Peltier Thermal Cycler (Hercules, CA) thermal cycler under the following conditions: 94øC, 3 min / 1 cycle; 94 ° C 30 sec, 64 ° C 30 sec, 72 ° C 5 min / 35 cycles; 72 ° C, 10 min / 1 cycle; 4 ° C / remainder.

Os produtos de amplificação da primeira reacção de PCR foram subsequentemente reamplifiçados numa segunda reacção de PCR constituída por: 2,5 μΐ de tampão 10X Ex Taq PCR™ Buffer, 2 μΐ de matriz (diluição 1:100 da Ia reacção de PCR em H2O) , 10 μΜ da sequência oligonucleotidica directa, 10 μΜ da sequência oligonucleotidica reversa, 2 μΐ da mistura de dNTPs (2,5 mM cada), 16 μΐ H2O, 0,5 μΐ (2,5 unidades) DNA-polimerase Ex Taq™. As reacções de PCR foram realizadas usando um termociclador Bio-Rad, DNA Engine Tetrad2, Peltier Thermal Cycler (Hercules, CA) de 96 amostras, nas seguintes condições: 94°C, 3 min/1 ciclo; 94°C 15 seg, 61°C 30 seg, 72°C 30 seg/30 ciclos; 72°C, 10 min/1 ciclo; 4°C/restante tempo. Dez μΐ de cada produto amplificado foram sujeitos a electroforese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE agarose suplementado com 0,5% de brometo de etídio. Os fragmentos amplificados foram visualizados com luz UV e os tamanhos dos fragmentos estimados por comparação com uma escada de DNA de 1 kpb. Os produtos de PCR contendo o fragmento esperado foram diagnosticados pela presença de um fragmento de DNA de 0,317 kpb, como se mostra na Fig. 82.Amplification products of the first PCR reaction were subsequently amplified in a second PCR reaction consisting of: 2.5 μl of 10X Ex Taq PCR ™ Buffer buffer, 2 μl of matrix (1: 100 dilution of the PCR reaction in H 2 O) , 10 μ of the forward oligonucleotide sequence, 10 μ of the reverse oligonucleotide sequence, 2 μ of the mixture of dNTPs (2.5 mM each), 16 μ H 2 O, 0.5 μ (2.5 units) Ex Taq ™ DNA polymerase. PCR reactions were performed using a 96-sample Bio-Rad, DNA Engine Tetrad2, Peltier Thermal Cycler (Hercules, CA) thermal cycler under the following conditions: 94øC, 3 min / 1 cycle; 94 ° C 15 sec, 61 ° C 30 sec, 72 ° C 30 sec / 30 cycles; 72 ° C, 10 min / 1 cycle; 4 ° C / rest time. Ten μg of each amplified product were electrophoresed at 100 V for 1 hr on a 1.0% agarose gel in TAE agarose supplemented with 0.5% ethidium bromide. The amplified fragments were visualized with UV light and the estimated fragment sizes compared to a 1 kbp DNA ladder. The PCR products containing the expected fragment were diagnosed by the presence of a DNA fragment of 0.317 kbp, as shown in Fig. 82.

Exemplo 21: Detecção de eventos de integração dirigidaExample 21: Detection of Directed Integration Events

De entre os eventos de tolerância a herbicida contendo uma molécula de DNA dador integrada, codificadora de uma cassete do gene de tolerância a herbicida, espera-se que alguma proporção dos referidos eventos seja o produto da integração dirigida de DNA dador no local da quebra da cadeia dupla induzida por ZFN. De forma a diferenciar estes eventos de integração dos derivados da integração aleatória da cassete do gene de tolerância a herbicida, utilizou-se uma estratégia de genotipagem baseada em PCR usando uma combinação de sequências iniciadoras de PCR específicas de genoma e subsequentemente específicas de genoma e específicas de dador. A. Amplificação específica de genoma e amplificação subsequente específica de genoma/dadorAmong the herbicide tolerance events containing an integrated donor DNA molecule, encoding a cassette of the herbicide tolerance gene, it is expected that some proportion of said events will be the product of targeted donor DNA integration at the site of the ZFN-induced double chain. In order to differentiate these integration events from those derived from the random integration of the cassette of the herbicide tolerance gene, a PCR-based genotyping strategy was used using a combination of genome-specific and subsequently specific genome-specific PCR primers of donor. A. Genome specific amplification and subsequent genome / donor specific amplification

Nesta realização, as primeiras reacções de PCR utilizaram oligonucleótidos iniciadores específicos das regiões do gene alvo IPP2K a montante e a jusante da região de integração dadora (e.g., Figs. 92 e 93) . As primeiras reacções de amplificação por PCR foram realizadas usando reagentes fornecidos por TaKaRa Biotechnology Inc., Seta 3-4-1, Otsu, Shiga, 520-2193, Japan e consistiram nos seguintes: 2,5 μΐ de tampão 10X Ex Taq PCR™ Buffer, 40-200 ng de DNA genómico matriz de cadeia dupla, 10 μΜ da sequência oligonucleotídica directa, 10 μΜ da sequência oligonucleotídica reversa, 2 μΐ da mistura de dNTPs (2,5 mM cada), 16 μΐ H2O, 0,5 μΐ (2,5 unidades) DNA-polimerase Ex Tag™. As reacções de PCR foram realizadas usando um termociclador Bio-Rad, DNA Engine Tetrad2, Peltier Thermal Cycler (Hercules, CA) de 96 amostras, nas seguintes condições: 94°C, 3 min/1 ciclo; 94°C 30 seg, 64°C 30 seg, 72°C 5 min/35 ciclos; 72°C, 10 min/1 ciclo; 4°C/restante. O produto da primeira reacção de PCR foi subsequentemente diluído a 1:100 em H2O e usado como DNA matriz em duas segundas reacções de PCR distintas. Nesta realização, as segundas reacções usam sequências iniciadoras que se ligam à região genómica de IPP2K e à molécula dadora, dando origem a um amplicão que abrange a fronteira de integração entre o genoma e o dador. A primeira reacção focou-se na fronteira 5' entre o dador e genoma. Ambas as reacções consistiram no seguinte: 2,5 μΐ de tampão 10X Ex Taq PCR™ Buffer, 2 μΐ de matriz (diluição 1:100 da Ia reacção de PCR em H2O) , 10 μΜ da sequência oligonucleotídica directa, 10 μΜ da sequência oligonucleotídica reversa, 2 μΐ da mistura de dNTPs (2,5 mM cada), 16 μΐ H2O, 0,5 μΐ (2,5 unidades) DNA-polimerase Ex Tag™. As reacções de PCR foram realizadas usando um termocicladorIn this embodiment, the first PCR reactions utilized oligonucleotide primers specific for the target gene regions IPP2K upstream and downstream of the donor integration region (e.g., Figures 92 and 93). The first PCR amplification reactions were performed using reagents provided by TaKaRa Biotechnology Inc., Seta 3-4-1, Otsu, Shiga, 520-2193, Japan and consisted of the following: 2.5 μl of 10X Ex Taq PCR ™ buffer Buffer, 40-200 ng of double stranded matrix genomic DNA, 10 μ of the direct oligonucleotide sequence, 10 μ of the reverse oligonucleotide sequence, 2 μ of the mixture of dNTPs (2.5 mM each), 16 μ H 2 O, 0.5 μ (2.5 units) Ex Tag ™ DNA polymerase. PCR reactions were performed using a 96-sample Bio-Rad, DNA Engine Tetrad2, Peltier Thermal Cycler (Hercules, CA) thermal cycler under the following conditions: 94øC, 3 min / 1 cycle; 94 ° C 30 sec, 64 ° C 30 sec, 72 ° C 5 min / 35 cycles; 72 ° C, 10 min / 1 cycle; 4 ° C / remainder. The product from the first PCR reaction was subsequently diluted 1: 100 in H2O and used as template DNA in two different second PCR reactions. In this embodiment, the second reactions use primer sequences that bind to the genomic region of IPP2K and the donor molecule, giving rise to an amplicon spanning the integration border between the genome and the donor. The first reaction focused on the 5 'border between the donor and genome. Both reactions consisted of the following: 2.5 μΐ 10X Ex Taq PCR ™ Buffer buffer, 2 μΐ matrix (1: 100 dilution of the PCR reaction in H 2 O), 10 μΜ of the direct oligonucleotide sequence, 10 μΜ of the oligonucleotide sequence 2 μg of the mixture of dNTPs (2.5 mM each), 16 μ H 2 O, 0.5 μ (2.5 units) Ex Tag ™ DNA polymerase. PCR reactions were performed using a thermal cycler

Bio-Rad, DNA Engine Tetrad2, Peltier Thermal Cycler (Hercules, CA) de 96 amostras, nas seguintes condições: 94°C, 3 min /1 ciclo; 94°C 15 seg, 60°C 30 seg, 72°C 2 min/35 ciclos; 72°C, 10 min/1 ciclo; 4°C/restante tempo. Vinte μΐ de cada 2a reacção de PCR foram sujeitos a elec-troforese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE agarose suplementado com 0,5% de brometo de etidio.Bio-Rad, DNA Engine Tetrad2, Peltier Thermal Cycler (Hercules, CA) 96 samples under the following conditions: 94øC, 3 min / 1 cycle; 94 ° C 15 sec, 60 ° C 30 sec, 72 ° C 2 min / 35 cycles; 72 ° C, 10 min / 1 cycle; 4 ° C / rest time. Twenty μΐ of each 2nd PCR reaction was electrophoresed at 100 V for 1 hr on a 1.0% agarose gel in TAE agarose supplemented with 0.5% ethidium bromide.

Os fragmentos amplificados foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb (Invitrogen Life Technologies, Carlsbad, CA) . Os produtos de PCR derivados da integração dirigida do dador no gene IPP2K foram diagnosticados pela presença de fragmentos de DNA de 1,65 kpb (fronteira 5') (Fig. 83) ou 1,99 kpb (fronteira 3') (Fig. 84). Estes fragmentos foram removidos do gel e purificados de acordo com as instruções do fabricante uando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA). Os fragmentos purificados foram então clonados no plasmideo pCR2.1 usando o kit de clonagem TOPO TA Cloning® Kit (com o vector pCR®2.1) e células E. coli quimicamente competentes One Shot® TOP10 (Invitrogen Life Technologies, Carlsbad, CA) de acordo com o protocolo do fabricante.Amplified fragments were visualized with UV light and fragment size estimated by comparison to a 1 kbp DNA ladder (Invitrogen Life Technologies, Carlsbad, CA). PCR products derived from the targeted integration of the donor into the IPP2K gene were diagnosed by the presence of DNA fragments of 1.65 kbp (Fig. 83) or 1.99 kbp (Fig. ). These fragments were removed from the gel and purified according to the manufacturer's instructions using the QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA). The purified fragments were then cloned into plasmid pCR2.1 using the TOPO TA Cloning Kit Kit (vector pCR®2.1) and One Shot® TOP10 (Invitrogen Life Technologies, Carlsbad, CA) chemically competent E. coli cells from accordance with the manufacturer's protocol.

Colónias individuais foram inoculadas num tubo Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de canamicina e incubadas 16 hrs a 37°C com agitação a 200 rpm. Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrífuga de 1,7 ml Costar (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmidico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid Kit (BD Biosciences/Clontech/Macherey-Nagel, Paio Alto, CA) . Três yg do plasmídeo isolado a partir de plasmídeos dos clones com sequências de homologia 5' foram digeridos com 10 unidades de EcoRI (New England Biolabs, Beverly, MA) . Todas as digestos de plasmídeos foram incubadas durante 1 hr a 37 °C. O DNA cortado com enzimas de restrição foi sujeito a electroforese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etídio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb (Invitrogen Life Technologies, Carlsbad, CA).Individual colonies were inoculated into a 14 ml Falcon tube (Becton-Dickinson, Franklin Lakes, NJ) containing 2 ml TB supplemented with 50 μg / ml kanamycin and incubated 16 hrs at 37 ° C with shaking at 200 rpm. After incubation, 1.5 ml of cells were transferred to a 1.7 ml Costar (Fisher Scientific, Pittsburgh, PA) microfuge tube and pelleted at 16,000 xg for 1 min. The supernatant was removed and the plasmid DNA was isolated as described above using the NucleoSpin® Plasmid Kit (BD Biosciences / Clontech / Macherey-Nagel, Paio Alto, CA). Three æg of the plasmid isolated from plasmids from the clones with 5 'homology sequences were digested with 10 units of EcoRI (New England Biolabs, Beverly, MA). All plasmid digests were incubated for 1 hr at 37 ° C. Restricted enzyme-cut DNA was electrophoresed at 100 V for 1 hr on a 1.0% TAE agarose gel supplemented with 0.5% ethidium bromide. Fragments were visualized with UV light and fragment size estimated by comparison to a 1 kbp DNA ladder (Invitrogen Life Technologies, Carlsbad, CA).

Os clones plasmídicos esperados foram diagnosticados pela presença de fragmentos de DNA inseridos do tamanho adequado para além do vector pCR®2.1 de 3,9 kpb. As reacções de sequenciação de cadeia dupla dos clones plasmídicos foram realizadas como descrito pelo fabricante usando o kit CEQ™ DTCS-Quick Start Kit (Beckman-Coulter, Paio Alto, CA). As reacções foram purificadas usando Performa DTR Gel Filtration Cartridges (Edge BioSystems, Gaithersburg, MD) como descrito nos protocolos do fabricante. As reacções de sequenciação foram analisadas num sistema de análise de DNA Beckman-Coulter CEQ™ 2000 XL e a caracterização nucleotídica realizada usandoExpected plasmid clones were diagnosed by the presence of inserted DNA fragments of appropriate size in addition to the 3.9 kbp pCR®2.1 vector. The double-stranded sequencing reactions of the plasmid clones were performed as described by the manufacturer using the CEQ ™ DTCS-Quick Start Kit kit (Beckman-Coulter, Paio Alto, CA). Reactions were purified using Performa DTR Gel Filtration Cartridges (Edge BioSystems, Gaithersburg, MD) as described in the manufacturer's protocols. Sequencing reactions were analyzed on a Beckman-Coulter CEQ ™ 2000 XL DNA analysis system and the nucleotide characterization performed using

Sequencher™ versão 4.1.4 (Gene Codes Corporation, Ann Arbor, MI). Os alinhamentos de nucleótidos foram realizados usando Vector NTi versão 10.1 (Invitrogen Life Technologies, Carlsbad, CA). A análise de dados de sequências derivados de um evento de integração dirigida (evento #073) foi conduzida como se segue. Os primeiros produtos de PCR abrangendo a totalidade do local de integração do genoma foram sujeitos a uma segunda amplificação focada na fronteira 5' ou 3' entre o genoma e o dador. O alinhamento dos fragmentos clonados correspondendo a estes produtos de amplificação da segunda reacção com a sequência genómica IPP2K selvagem, assim como a sequência esperada de um evento de integração dirigida, indicou claramente que ocorreu integração precisa do DNA dador no local alvo. A sequência nucleotidica do locus genómico IPP2K, a fronteira genoma/dador, a sequência nucleotidica das regiões dadoras correspondendo às sequências flanqueantes de homologia de IPP2K e a sequência nucleotidica da cassete de tolerância a herbicida estavam todos preservados nos múltiplos produtos de PCR clonados derivados deste evento. Assim, este evento representou um genoma em que ocorreu a reparação conduzida por homologia de uma quebra na cadeia dupla, mediada por ZFN, e a integração dirigida de um DNA dador num gene alvo especifico. Foram obtidos outros eventos transformados representando ocorrências de integração dirigida únicas, demonstrando que os métodos aqui descritos são reprodutíveis em calos de milho. Os familiarizados com a técnica poderão aplicar estes métodos a qualquer gene alvo em qualquer espécie de planta para a qual se pretenda integração dirigida. B. Amplificação específica de genoma/dador em duas reacções sucessivasSequencher ™ version 4.1.4 (Gene Codes Corporation, Ann Arbor, MI). Nucleotide alignments were performed using Vector NTi version 10.1 (Invitrogen Life Technologies, Carlsbad, CA). Analysis of sequence data derived from a directed integration event (event # 073) was conducted as follows. The first PCR products covering the entire genome integration site were subjected to a second amplification focused on the 5 'or 3' border between the genome and the donor. Alignment of the cloned fragments corresponding to these amplification products of the second reaction with the wild-type IPP2K genomic sequence, as well as the expected sequence of a directed integration event, clearly indicated that precise integration of the donor DNA occurred at the target site. The nucleotide sequence of the IPP2K genomic locus, the genome / donor border, the nucleotide sequence of the donor regions corresponding to the IPP2K homology flanking sequences and the nucleotide sequence of the herbicide tolerance cassette were all preserved in the multiple cloned PCR products derived from this event . Thus, this event represented a genome in which repair resulted from homology of a double stranded, ZFN-mediated breakdown and directed integration of a donor DNA into a specific target gene. Further transformed events representing unique instances of directed integration were obtained, demonstrating that the methods described herein are reproducible in corn calliums. Those skilled in the art may apply these methods to any target gene in any plant species for which targeted integration is desired. B. Genome / donor specific amplification in two successive reactions

Nesta realização, a primeira reacção de PCR e a segunda reacção subsequente utilizaram sequências iniciadoras oligonucleotídicas específicas das regiões do gene IPP2K a montante ou a jusante da região de integração do dador (apêndices V e VI) em combinação com sequências iniciadoras oligonucleotídicas específicas para a sequência dadora. Neste exemplo, as primeiras reacções de amplificação por PCR foram realizadas usando reagentes fornecidos por TaKaRa Biotechnology Inc., Seta 3-4-1, Otsu, Shiga, 520-2193, Japan e consistiram nos seguintes: 2,5 μΐ de tampão 10X Ex Taq PCR™ Buffer, 40-200 ng de DNA genómico matriz de cadeia dupla, 10 μΜ da sequência oligonucleo-tídica directa, 10 μΜ da sequência oligonucleotídica reversa, 2 μΐ da mistura de dNTPs (2,5 mM cada), 16 μΐ fRO, 0,5 μΐ (2,5 unidades) DNA-polimerase Ex Tag™. As reacções de PCR foram realizadas usando um termociclador Bio-Rad, DNA Engine Tetrad2, Peltier Thermal Cycler (Hercules, CA) de 96 amostras, nas seguintes condições: 94°C, 3 min/1 ciclo; 94°C 30 seg, 52°C ou 64°C 30 seg, 72°C 2 min/35 ciclos; 72°C, 10 min/1 ciclo; 4°C/restante. 0 produto da primeira reacção de PCR foi subsequentemente diluído a 1:100 em H2O e usado como DNA matriz numa segunda reacção de PCR. Nesta realização, as segundas reacções usam sequências iniciadoras que se ligam à região genómica de IPP2K e à molécula dadora, dando origem a um amplicão que abrange a fronteira de integração entre o genoma e o dador. As sequências iniciadoras específicas usadas determinam se a amplificação é focada na fronteira 5' ou 3' entre o genoma e o dador. Os reagentes para estas reacções consistiram no seguinte: 2,5 μΐ de tampão 10X Ex Taq PCR™ Buffer, 2 μΐ de matriz (diluição 1:100 da Ia reacção de PCR em H2O) , 10 μΜ da sequência oligonucleotídica directa, 10 μΜ da sequência oligonucleo-tídica reversa, 2 μΐ da mistura de dNTPs (2,5 mM cada), 16 μΐ H2O, 0,5 μΐ (2,5 unidades) DNA-polimerase Ex Tag™. As reacções de PCR foram realizadas usando um termociclador Βίο-Rad, DNA Engine Tetrad2, Peltier Thermal Cycler (Hercules, CA) de 96 amostras, nas seguintes condições: 94°C, 3 min/1 ciclo; 94°C 30 seg, 54°C ou 60°C 30 seg, 72°C 2 min/35 ciclos; 72°C, 10 min/1 ciclo; 4°C/restante tempo.In this embodiment, the first PCR reaction and the second subsequent reaction used oligonucleotide primer sequences specific for the regions of the IPP2K gene upstream or downstream of the donor integration region (appendices V and VI) in combination with oligonucleotide primer sequences specific for the sequence donor. In this example, the first PCR amplification reactions were performed using reagents provided by TaKaRa Biotechnology Inc., Seta 3-4-1, Otsu, Shiga, 520-2193, Japan and consisted of the following: 2.5 μl of 10X Ex buffer Taq PCR ™ Buffer, 40-200 ng of double stranded matrix genomic DNA, 10 μ of the direct oligonucleotide sequence, 10 μ of the reverse oligonucleotide sequence, 2 μ of the mixture of dNTPs (2.5 mM each), 16 μFRO , 0.5 μΐ (2.5 units) Ex Tag ™ DNA polymerase. PCR reactions were performed using a 96-sample Bio-Rad, DNA Engine Tetrad2, Peltier Thermal Cycler (Hercules, CA) thermal cycler under the following conditions: 94øC, 3 min / 1 cycle; 94 ° C 30 sec, 52 ° C or 64 ° C 30 sec, 72 ° C 2 min / 35 cycles; 72 ° C, 10 min / 1 cycle; 4 ° C / remainder. The product of the first PCR reaction was subsequently diluted 1: 100 in H2O and used as template DNA in a second PCR reaction. In this embodiment, the second reactions use primer sequences that bind to the genomic region of IPP2K and the donor molecule, giving rise to an amplicon spanning the integration border between the genome and the donor. The specific primers used determine whether the amplification is focused at the 5 'or 3' border between the genome and the donor. Reagents for these reactions consisted of the following: 2.5 μl of 10X Ex Taq PCR ™ Buffer buffer, 2 μl of matrix (1: 100 dilution of the PCR reaction in H2O), 10 μ of the direct oligonucleotide sequence, 10 μ of the oligonucleotide-reverse sequence, 2 μΐ of the mixture of dNTPs (2.5 mM each), 16 μΐH2O, 0.5 μΐ (2.5 units) Ex Tag ™ DNA polymerase. PCR reactions were performed using a 96-sample Βίο-Rad, DNA Engine Tetrad2, Peltier Thermal Cycler (Hercules, CA) thermal cycler under the following conditions: 94øC, 3 min / 1 cycle; 94 ° C 30 sec, 54 ° C or 60 ° C 30 sec, 72 ° C 2 min / 35 cycles; 72 ° C, 10 min / 1 cycle; 4 ° C / rest time.

Vinte μΐ de cada 2a reacção de PCR foram sujeitos a electrof orese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE agarose suplementado com 0,5% de brometo de etídio.Twenty μΐ of each 2nd PCR reaction were electrophoresed at 100 V for 1 hr on a 1.0% agarose gel in TAE agarose supplemented with 0.5% ethidium bromide.

Os fragmentos amplificados foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb (Invitrogen LifeThe amplified fragments were visualized with UV light and the size of the fragments estimated by comparison with a 1 kbp DNA ladder (Invitrogen Life

Technologies, Carlsbad, CA) . Os produtos de PCR derivados da integração dirigida de dador no gene IPP2K foram diagnosticados pela presença de fragmentos de DNA de 1,35 kpb (fronteira 5') (Fig. 85) ou 1,66 kpb (fronteira 3') (Fig. 86) . Estes fragmentos foram removidos do gel e purificados de acordo com as instruções do fabricante usando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA). Os fragmentos purificados foram então clonados no plasmideo pCR2.1 usando o kit de clonagem TOPO TA Cloning® Kit (com o vector pCR®2.1) e células E. coli quimicamente competentes One Shot® TOPIO (Invitrogen Life Technologies, Carlsbad, CA) de acordo com o protocolo do fabricante. C. Análise das sequências nucleotidicas dos produtos de PCR para genotipagemTechnologies, Carlsbad, CA). PCR products derived from targeted donor integration into the IPP2K gene were diagnosed by the presence of DNA fragments of 1.35 kbp (5 'border) (Fig. 85) or 1.66 kbp (3' border) (Fig. ). These fragments were removed from the gel and purified according to the manufacturer's instructions using the QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA). The purified fragments were then cloned into plasmid pCR2.1 using the TOPO TA Cloning Kit Kit (vector pCR®2.1) and One Shot® TOPIO (Invitrogen Life Technologies, Carlsbad, CA) E. coli cells from accordance with the manufacturer's protocol. C. Analysis of Nucleotide Sequences of PCR Products for Genotyping

Colónias individuais descritas no Exemplo 21B foram inoculadas num tubo Falcon de 14 ml (Becton-Dickin-son, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de canamicina e incubadas 16 hrs a 37 °C com agitação a 200 rpm. Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrifuga de 1,7 ml Costar (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmidico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid Kit (BD Biosciences/Clontech/Macherey-Nagel, Paio Alto, CA) . Três yg do plasmideo isolado a partir de plasmídeos dos clones com sequências de homologia 5' foram digeridos com 10 unidades de EcoRI (New EnglandIndividual colonies described in Example 21B were inoculated into a 14 ml Falcon tube (Becton-Dickinson, Franklin Lakes, NJ) containing 2 ml TB supplemented with 50 μg / ml kanamycin and incubated 16 hrs at 37 ° C with shaking at 200 rpm. After incubation, 1.5 ml of cells were transferred to a 1.7 ml Costar (Fisher Scientific, Pittsburgh, PA) microfuge tube and pelleted at 16,000 xg for 1 min. The supernatant was removed and the plasmid DNA was isolated as described above using the NucleoSpin® Plasmid Kit (BD Biosciences / Clontech / Macherey-Nagel, Paio Alto, CA). Three æg of the plasmid isolated from plasmids from clones with 5 'homology sequences were digested with 10 units of EcoRI (New England

Biolabs, Beverly, MA). Todas as digestos de plasmideos foram incubadas durante 1 hr a 37 °C. 0 DNA cortado com enzimas de restrição foi sujeito a electroforese a 100 V durante 1 hr num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etidio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb (Invitrogen Life Technologies, Carlsbad, CA).Biolabs, Beverly, MA). All plasmid digests were incubated for 1 hr at 37 ° C. Restricted enzyme-cleaved DNA was electrophoresed at 100 V for 1 hr on a 1.0% TAE agarose gel supplemented with 0.5% ethidium bromide. Fragments were visualized with UV light and fragment size estimated by comparison to a 1 kbp DNA ladder (Invitrogen Life Technologies, Carlsbad, CA).

Os clones plasmidicos foram diagnosticados pela presença de fragmentos de DNA inseridos para além do vector pCR®2.1 de 3,9 kpb. As reacções de sequenciação de cadeia dupla dos clones plasmidicos foram realizadas como descrito pelo fabricante usando o kit CEQ™ DTCS-Quick Start Kit (Beckman-Coulter, Paio Alto, CA) . As reacções foram purificadas usando Performa DTR Gel Filtration Cartridges (Edge BioSystems, Gaithersburg, MD) como descrito pelos protocolos do fabricante. As reacções de sequenciação foram analisadas num sistema de análise de DNA Beckman-Coulter CEQ™ 2000 XL e a caracterização nucleotidica realizada usando Sequencher™ versão 4.1.4 (Gene Codes Corporation, Ann Arbor, MI). Os alinhamentos de nucleótidos foram realizados usando Vector NTi versão 10.1 (Invitrogen Life Technologies, Carlsbad, CA).Plasmid clones were diagnosed by the presence of inserted DNA fragments in addition to the 3.9 kbp pCR®2.1 vector. The double-stranded sequencing reactions of the plasmid clones were performed as described by the manufacturer using the CEQ ™ DTCS-Quick Start Kit kit (Beckman-Coulter, Paio Alto, CA). Reactions were purified using Performa DTR Gel Filtration Cartridges (Edge BioSystems, Gaithersburg, MD) as described by the manufacturer's protocols. Sequencing reactions were analyzed on a Beckman-Coulter CEQ ™ 2000 XL DNA analysis system and nucleotide characterization performed using Sequencher ™ version 4.1.4 (Gene Codes Corporation, Ann Arbor, MI). Nucleotide alignments were performed using Vector NTi version 10.1 (Invitrogen Life Technologies, Carlsbad, CA).

Os dados de sequências abrangendo a fronteira entre a sequêncoa genómica IPP2K 5' a montante e o DNA dador derivado de múltiplos eventos de integração dirigida foram igualmente obtidos, incluindo os dados de sequências abrangendo a fronteira entre DNA dador e a sequência genómica IPP2K 3' derivada de múltiplos eventos de integração dirigida, assim como dados de sequências de fronteira a montante (5') derivadas de um único calo transformado (#114) . 0 evento de intergação dirigida transformado (#114) foi resultado da integração de um dador autónomo no gene alvo IPP2K.Sequence data spanning the border between the upstream 5 'IPP2K genomic sequence and the donor DNA derived from multiple directed integration events were also obtained, including sequence data spanning the border between donor DNA and the derived 3' IPP2K genomic sequence multiple directed integration events as well as upstream (5 ') border sequence data derived from a single transformed callus (# 114). The transformed targeting event (# 114) was a result of the integration of an autonomous donor into the target gene IPP2K.

Nestas análises, tanto a primeira como a segunda reacção de amplificação por PCR focaram-se na fronteira 5' ou 3' entre o genoma e o dador. 0 alinhamento dos fragmentos clonados correspondendo a estes produtos de amplificação secundários com a sequência genómica selvagem de IPP2K, assim como a sequência esperada de um evento de integração revelaram que ocorreu a integração de um DNA dador no local alvo. A sequência nucleotidica do locus genómico IPP2K, a fronteira genoma/dador, a sequência nucleotidica das regiões dadoras correspondendo às sequências flanqueantes de homologia de IPP2K e a sequência nucleotidica da cassete de tolerância a herbicida estavam todas preservadas nos múltiplos produtos de PCR clonados derivados deste evento.In these analyzes, both the first and second PCR amplification reactions focused on the 5 'or 3' border between the genome and the donor. Alignment of the cloned fragments corresponding to these secondary amplification products with the wild-type genomic sequence of IPP2K, as well as the expected sequence of an integration event, revealed that integration of a donor DNA occurred at the target site. The nucleotide sequence of the IPP2K genomic locus, the genome / donor border, the nucleotide sequence of the donor regions corresponding to the IPP2K homology flanking sequences and the nucleotide sequence of the herbicide tolerance cassette were all preserved in the multiple cloned PCR products derived from this event .

Assim, este evento representa um genoma em que ocorreu reparação conduzida por homologia de uma quebra de DNA de cadeia dupla mediada por ZFN, num gene alvo especifico. Obtiveram-se outros eventos transformados representando ocorrências únicas de integração dirigida, demonstrando que os métodos aqui descritos são reprodutíveis em calo de milho. Os familiarizados com a técnica poderão aplicar estes métodos a qualquer gene alvo em qualquer espécie de planta para a qual se pretenda integração dirigida.Thus, this event represents a genome in which repair resulted from homology of a ZFN-mediated double stranded DNA break in a specific target gene. Other transformed events were obtained representing single occurrences of targeted integration, demonstrating that the methods described herein are reproducible in corn callus. Those skilled in the art may apply these methods to any target gene in any plant species for which targeted integration is desired.

Exemplo 22: Regeneração de plantas completas férteis a partir de tecido de calo de milhoExample 22: Regeneration of fertile complete plants from corn callus tissue

Calos isolados de células de milho tolerantes a herbicida, derivados de cultura de células Hill, podem ser regenrados dando origem a plantas de milho completas férteis. Os familiarizados com a técnica poderão regenerar plantas de milho completas férteis a partir de uma variedade de culturas embrionárias de células de milho.Isolates from herbicide tolerant corn cells derived from Hill cell culture can be regenerated to yield fertile complete corn plants. Those skilled in the art will be able to regenerate fertile complete corn plants from a variety of embryonic maize cell cultures.

Neste exemplo, a regeneração de calos Hill isolados resistentes a bialophos foi iniciada por transferência de tecido de calo isolado para um meio de indução baseado em citocinina, 28 (1H), contendo sais MS e vitaminas, 30,0 g/1 sucrose, 5 mg/1 benzilaminopurina, 0,25 mg/1 de 2,4-D, 1 mg/1 bialaphos e 2,5 g/1 de Gelrite; pH 5,7. As células cresceram com pouca luz (13 pEm-2s-l) durante uma semana, seguido de transferência para condições maior intensidade de luz (40 pEm-2s-l) durante uma semana. As células foram então transferidas para meio de regeneração, 36 (1H), o qual é idêntico ao meio de indução excepto não possuir reguladores de crescimento vegetais. Pequenas plântulas (3-5 cm) foram retiradas com ferramentas manuais e colocadas em tubos de cultura de vidro de 150x25 mm contendo meio SHGA (Schenk and Hildebrandt basal salts and vitamins, 1972, Can. J. Bot 50:199-204; 1 g/1 mioinositol, 10 g/1 sucrose, 2,0 g/1 Gelrite, pH 5,8).In this example, regeneration of isolated bialophos resistant calli calli was initiated by transfer of isolated callus tissue to a cytokinin-based induction medium, 28 (1H), containing MS salts and vitamins, 30.0 g / 1 sucrose, 5 mg / l benzylaminopurine, 0.25 mg / l 2,4-D, 1 mg / l bialaphos and 2.5 g / l Gelrite; pH 5.7. Cells were grown in low light (13 pEm-2s-1) for one week, followed by transfer to higher light intensity conditions (40 pEm-2s-1) for one week. The cells were then transferred to regeneration medium, 36 (1H), which is identical to the induction medium except they lack plant growth regulators. Small seedlings (3-5 cm) were hand-picked and placed in 150x25 mm glass culture tubes containing SHGA medium (Schenk and Hildebrandt basal salts and vitamins, 1972, Can J. Bot 50: 199-204; g / 1 myoinositol, 10 g / 1 sucrose, 2.0 g / 1 Gelrite, pH 5.8).

Uma vez as plântulas desenvolvidas até um sistema radicular e de rebentos suficientemente grande e diferenciado, foram transplantadas para potes de 4 polegadas contendo meio de crescimento Metro-Mix 360 (Sun Gro Horticulture Canada Ltd.) e colocados numa estufa. As plântulas foram total ou parcialmente cobertas com copos de plástico durante 2-7 dias, depois transplantadas para vasos de 5 galões contendo uma mistura consistindo em 95% de meio Metro-Mix 360 e 5% de solo argiloso/limoso e crescidas até à maturidade. As plantas podem ser auto-polinizadas ou sofrerem polinização cruzada com uma linha singeneica de forma a produzir sementes Tl ou Fl, respectivamente. Os familiarizados com a técnica poderão auto-polinizar plantas regeneradas ou fazer polinização cruzada de plantas regeneradas com uma variedade de germoplasmas de modo a permitir a reprodução de milho.Once the seedlings developed to a sufficiently large and differentiated root and shoot system were transplanted into 4-inch pots containing Metro-Mix 360 growth medium (Sun Gro Horticulture Canada Ltd.) and placed in an oven. The seedlings were totally or partially covered with plastic cups for 2-7 days, then transplanted into 5-gallon pots containing a mixture consisting of 95% Metro-Mix 360 and 5% clayey / loam soil and grown to maturity . The plants may be self-pollinated or cross-pollinated with a syngeneic line so as to produce seeds T1 or F1, respectively. Those familiar with the technique may self-pollinate regenerated plants or cross-pollination of regenerated plants with a variety of germplasm to allow reproduction of maize.

Informação adicional relacionada com a clivagem dirigida, recombinação dirigida e integração dirigida pode ser encontrada nas publicações de pedido de patente dos Estados Unidos US-2003-0232410; US-2005-0026157; US-2005- 0064474; US-2005- 0208489; e US-2006-0188987; e em US-2007-0134796.Additional information regarding directed cleavage, directed recombination and directed integration can be found in the United States Patent Application Publication Nos. US-2003-0232410; US-2005-0026157; US-2005-0064474; US-2005-0208489; and US-2006-0188987; and in US-2007-0134796.

Lisboa, 9 de abril de 2015Lisbon, April 9, 2015

Claims

A fusion protein comprising (a) a zinc finger protein comprising a non-canonical zinc finger, wherein the noncanonical zinc finger is a non-C2H2 zinc finger and has a helical portion enclosed in the DNA linkage and wherein the zinc coordination region of the helical portion comprises the amino acid sequence HTRRCG; and wherein the zinc finger protein is engineered to bind to a target sequence, and (b) one or more functional domains, wherein a functional domain comprises a cleavage half domain, and (c) an interposed ZC linker between the cleavage half domain and the zinc finger protein, wherein the amino acid sequence between the zinc finger protein and the cleavage half domain is designated the ZC linker.

The fusion protein of claim 1 comprising a plurality of zinc fingers, wherein at least one of the zinc fingers comprises a zinc finger CCHC.

The fusion protein of claim 1 or 2, wherein at least one zinc finger comprises the sequence Cys- (XA) 2-4-Cys- (XB) 12-His- (Xc) 3-5-Cys- (XD) wherein XA, Xb, Xc and Xd may be any amino acid.

The fusion protein of any one of claims 1 to 3, comprising any of the sequences shown in any of Table 1, 2, 3 or 4.

The fusion protein of any one of claims 3 or 4, wherein (XD) is the sequence QLV or QKP.

The fusion protein of claim 5, wherein the QLV or QKP sequence is the 3 C-terminal amino acid residues of the zinc finger.

The fusion protein of any one of claims 3 to 6, wherein (X 1) is 1, 2 or 3 Gly (G) residues.

The fusion protein of any one of claims 2-7, wherein the fusion protein comprises 3, 4, 5 or 6 fingers of zinc.

The fusion protein of claims 2-8, wherein the finger 2 comprises the zinc finger CCHC.

The fusion protein of any one of claims 2-9, wherein the C-terminal zinc finger comprises the CCHC finger.

The fusion protein of any one of claims 2-10, wherein at least two fingers of zinc comprises the zinc finger CCHC.

The fusion protein of any one of claims 2-11, wherein the fusion protein comprises any of the sequences shown in Table 8 and is engineered to bind to a target sequence in an IPP2-K gene.

The fusion protein of claim 1 wherein the length of the ZC linker is 5 amino acids.

The fusion protein of claim 14, wherein the amino acid sequence of the ZC linker is GLRGS (SEQ ID NO: 4).

The fusion protein of claim 1 wherein the length of the ZC linker is 6 amino acids.

The fusion protein of claim 15, wherein the amino acid sequence of the ZC linker is GGLRGS (SEQ ID NO: 5).

A polynucleotide encoding a fusion protein according to any one of claims 1 to 16.

A method for the targeted cleavage of cellular chromatin in a plant cell, the method comprising expressing, in the cells, a pair of fusion proteins according to any one of claims 1 to 16; wherein: (a) the target sequences of the fusion proteins are ten nucleotides apart; and (b) the fusion proteins dimerize and cleave DNA located between the target sequences.

A method of genetic recombination in a plant host cell, the method comprising (a) expression in the host cell of a pair of fusion proteins according to any one of claims 1 to 16, wherein the target sequences of the proteins are present at a target locus selected from the host, and (b) identification of a recombinant host cell exhibiting a sequence change at the target host locus.

The method of claim 18 or claim 19, wherein the sequence change is a mutation selected from the group consisting of a deletion of genetic material, an insertion of genetic material, a replacement of genetic material, and any combination thereof.

The method of any one of claims 18 to 20, further comprising introducing the exogenous poly-nucleotide into the host cell.

The method of claim 21, wherein the exogenous polynucleotide comprises sequences homologous to the host's target locus.

The method of any one of claims 18 to 23 wherein the plant is selected from the group consisting of a monocotyledon, a dicotyledon, gymnosperms and eukaryotic algae.

The method of claim 23, wherein the plant is selected from the group consisting of corn, rice, wheat, potato, soybean, tomato, tobacco, members of the Brassica family and Arabidopsis.

The method of any one of claims 18 to 23, wherein the plant is a tree.

The method of any one of claims 18 to 25, wherein the target sequences are in an IPP2-K gene.

A method for reducing the level of phytic acid in seeds, comprising inactivating or altering the IPP2-K gene according to the method of claim 26.

A method for making phosphorus more metabolically available in the seed, comprising inactivating or altering the IPP2-K gene according to the method of claim 26.

A plant cell comprising a fusion protein according to any one of claims 1 to 16 or a polynucleotide according to claim 17.

The plant cell of claim 29, wherein the cell is contained in a seed.

The plant cell of claim 30, wherein the seed is a corn seed.

The plant cell of any one of claims 29 to 31, wherein IPP2-K is partially or fully inactivated. Lisbon, April 9, 2015