PT2415872T - Proteínas com dedos de zinco não canónicas optimizadas - Google Patents

Proteínas com dedos de zinco não canónicas optimizadas Download PDF

Info

Publication number
PT2415872T
PT2415872T PT111849345T PT11184934T PT2415872T PT 2415872 T PT2415872 T PT 2415872T PT 111849345 T PT111849345 T PT 111849345T PT 11184934 T PT11184934 T PT 11184934T PT 2415872 T PT2415872 T PT 2415872T
Authority
PT
Portugal
Prior art keywords
dna
sequence
zinc finger
gene
sequences
Prior art date
Application number
PT111849345T
Other languages
English (en)
Inventor
L Arnold Nicole
C Cai Qihua
Miller Jeffrey
Urnov Fyodor
K Shukla Vipula
F Petolino Joseph
W Baker Lisa
J Garrison Robbi
C Blue Ryan
C Mitchell Jon
E Worden Sarah
Original Assignee
Sangamo Biosciences Inc
Dow Agrosciences Llc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sangamo Biosciences Inc, Dow Agrosciences Llc filed Critical Sangamo Biosciences Inc
Publication of PT2415872T publication Critical patent/PT2415872T/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • C07K2319/81Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Nutrition Science (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Description

DESCRIÇÃO "PROTEÍNAS COM DEDOS DE ZINCO NÃO CANÓNICAS OPTIMIZADAS"
CAMPO TÉCNICO A presente divulgação situa-se nos campos de engelharia genética, alvejamento de genes, integração cromossómica dirigida, expressão proteica e edição do epigenoma.
FUNDAMENTO A ligação de proteínas a sequências especificas de DNA, RNA, proteínas e outras moléculas está envolvida numa série de processos celulares tais como, por exemplo, transcrição, replicação, estrutura da cromatina, recom-binação, reparação de DNA, processamento de RNA e tradução. A especificidade da ligação das proteínas de ligação celulares que participam nas interacções proteina-DNA, proteina-RNA e proteina-proteina contribui para o desenvolvimento, diferenciação e homeostasia.
As proteínas com dedos de zinco (ZFPs) são proteínas que podem ligar-se a DNA numa forma especifica de sequência. Os dedos de zinco foram identificados pela primeira vez no factor de transcrição TFIIIA derivado de oócitos da rã de unhas africana, Xenopus laevis. Um domínio dedo de zinco desta classe de ZFPs possui cerca de 30 aminoácidos de comprimento e vários estudos estruturais demonstraram que possui uma volta beta (contendo dois resíduos de cisterna conservados) e uma hélice alfa (contendo dois resíduos de histidina conservados), os quais são mantidos numa conformação particular através da coordenação de um átomo de zinco pelas duas cisternas e pelas duas histidinas. Esta classe de ZFPs é também conhecida como ZFPs C2H2. Outras classes de ZFPs foram igualmente sugeridas. Ver, e.g., Jiang et al. (1996) J. Biol. Chem. 271:10723-10730, para uma discussão de ZFPs Cys-Cys-His-Cys (C3H). Até agora, foram identificadas mais de 10000 sequências de dedos de zinco em várias centenas de factores de transcrição conhecidos ou putativos. Os domínios dedos de zinco estão envolvidos não só no reconhecimento de DNA, como também na ligação a RNA e na ligação proteína-proteína. As actuais estimativas apontam que esta classe de moléculas constitua cerca de 2% de todos os genes humanos. A maioria das proteínas com dedos de zinco possui resíduos de cisterna e histidina conservados que coordenam tetraedricamente um único átomo de zinco por cada domínio em dedo. Em particular, a maioria dos ZFPs são carac-terizados por componentes em dedo com a sequência geral: -CyS- (X) 2-4- Cys-(X) 12-His-(X) 3-5-His- (SEQ ID NO : 1) , em que X representa qualquer aminoácido (as ZFPs C2H2). As sequências de coordenação de zinco desta classe mais largamente representada possuem duas cisternas e duas histidinas com espaçamentos particulares. As estruturas enroladas de cada dedo possuem uma volta β antiparalela, uma região topo do dedo e uma hélice a antipática curta. Os ligandos da coordenação de metais ligam-se ao ião de zinco e no caso de dedos de zinco tipo zif268, a hélice α antipática curta liga-se ao sulco maior do DNA. Ainda, a estrutura em dedo de zinco é estabilizada por determinados residuos de aminoácidos hidrofóbicos conservados (e.g., o residuo que precede directamente a primeira Cys conservada e o residuo na posição +4 do segmento helicoidal do dedo) e pela coordenação do zinco através dos residuos conservados de cisterna e de histidina.
Foram descritas proteínas com dedos de zinco canónicas (C2H2) com alterações nas posições que fazem contacto directo, residuos de "suporte" ou "buttressing" imediatamente adjacentes às posições que contactam com as bases e nas posições capazes de contactar o esqueleto de fosfatos do DNA. Ver, e.g., Patentes U.S. Nos. 6,007,988; 6, 013,453; 6, 140, 081; 6, 866, 997; 6, 746, 838; 6, 140,081;
6,610,512; 7,101,972; 6,453,242; 6,785,613; 7,013,219; PCT WO 98/53059; Choo et al. (2000) Curr. Opin. Struct. Biol. 10:411-416; Segal et al. (2000) Curr. Opin. Chem. Biol. 4:34-39.
Ainda, as proteínas com dedos de zinco contendo dedos de zinco com residuos de coordenação do zinco modificados foram igualmente descritas (ver, e.g., Pedido de Patente U.S. Nos. 20030108880, 20060246567 e 20060246588; as divulgações das quais são incluídas por referência). No entanto, enquanto as proteínas com dedos de zinco contendo estes dedos de zinco não canónicos mantêm a função de regulação da transcrição, a sua capacidade para actuar como nucleases com dedos de zinco (ZFNs) é nalguns casos reduzida relativamente às proteínas consistindo em dedos de zinco possuindo exclusivamente dedos de zinco canónicos C2H2. WO 02/057293 A2 divulga proteínas de ligação com dedos de zinco com locais de coordenação de metais modificados, pelo que as proteínas de ligação possuem três dedos de coordenação de zinco e um ou mais destes dedos são componentes de dedos não canónicos modificados. WO 2005/014791 A2 está relacionada com polipé-ptidos de fusão compreendendo um domínio de ligação com dedo de zinco manipulado geneticamente e um domínio de clivagem e polipéptidos de fusão compreendendo um domínio de ligação em dedo de zinco geneticamente manipulado e o meio domínio de clivagem.
Caravec et al. (Molecular and Cellular Biology, vol. 17, n°l, 1997, p. 482-494) divulga um dedo de zinco CCHC com a sequência 945-CRHCGKKYRWKSTLRRHENVECGG-9 6 9.
Yang et al. (Chinese Journal of Biochemistry and Molecular Biology, vol. 20, 2004, p. 725-731) está relacionado com um gene de murganho designado BSG2. A proteína prevista possui 9 dedos de zinco típicos C2H2 na sua região C-terminal. Não existe informação se os dedos de zinco estão envolvidos na ligação a DNA.
Assim, permanece a necessidade, particularmente na construção de mars nucleases com dedos de zinco, de proteínas de ligação com dedos de zinco geneticamente manipulados contendo dedos de zinco possuindo regiões de coordenação do zinco não canónicas optimizadas.
SUMÁRIO 0 presente invento é definido pela série de reivindicações apensas. A presente divulgação proporciona domínios dedos de zinco de ligação a DNA com alterações em pelo menos um resíduo da coordenação de zinco. Em particular, são aqui descritos dedos de zinco CCHC. São também descritos poli-péptidos com dedos de zinco e proteínas de fusão compreendendo um ou mais dedos de zinco CCHC, polinucleótidos codificadores destes dedos de zinco e proteínas de fusão e métodos de utilização destes polipéptidos e/ou proteínas de fusão com dedos de zinco.
BREVE DESCRIÇÃO DOS DESENHOS
Figura 1 é um gráfico que descreve as taxas de correcção de genes, medidas pela percentagem de células que expressam GFP, num sistema de ensaio repórter como descrito na Patente U.S. N° 2005/0064474 e abaixo. As variantes ZFN são designadas "X-Y", onde "X" se refere ao número da Tabela e "Y" se refere ao número dado ao dedo de zinco na tabela particularmente seleccionada. Por exemplo, "2-21" refere-se a um ZFN com um dedo compreendendo a sequência mostrada na Tabela 2 na linha numerada como 21, nomeadamente HAQRCGLRGSQLV (SEQ ID NO:53).
Figura 2 é um gráfico que descreve a percentagem de um sinal Cel-1 resultante da clivagem com vários pares de variantes ZFN. Para cada par de ZFNs, são mostrados resultados de duas experiências através da referência ao número da amostra. Os pares de variantes usados para cada amostra são apresentados na caixa no canto superior direito, enquanto "wt 5-8" e "wt 5-9" se refere a pares de ZFN canónicos descritos no Exemplo 14 (Tabela 17) do Pedido de Patente U.S. N° 2005/0064474. Nas amostras 3-12, a região C-terminal das hélices de reconhecimento do dedo 2 ou do dedo 4 do ZFN canónico 5-8 ou 5-9 estão substituídas com sequências não canónicas. A sequência parcial das variantes ZFN não canónicas designadas 20, 21, 43, 45, 47 e 48 nas amostras 3-12 e a posição do dedo destas variantes dentro da ZFN de 4 dedos é mostrada no canto superior esquerdo acima do gráfico. O asterisco acima da barra que descreve os resultados da experiência 2 das amostras 8 e 9 indica o fundo na pista, resultante de uma subestimativa da eficiência de ZFN.
Figura 3 é um gráfico que descreve as taxas de correcção dos genes no sistema de ensaio repórter das células GFP descrito na Patente U.S. N° 2005/0064474 e aqui. Os pares ZFN testados em cada amostra estão apresentados abaixo da barra, onde os números dos dedos de zinco CCHC la a 10a compreendem a sequência mostrada nas Tabelas 3 e 4. Os dedos de zinco 20, 21, 7a, 8a, 9a e 10a foram usados no Dedo 4; os dedos de zinco 43, 45, 47, 48, la, 2a, 3a, 4a, 5a e 6a foram usados no Dedo 2.
Figura 4 é uma representação esquemática linear do plasmideo pDAB1585, um vector alvo para o tabaco.
Figura 5 é uma representação esquemática do plasmideo pDAB1585, um vector alvo para o tabaco.
Figuras 6A e 6B descrevem nucleases com dedos de zinco (ZFN). FIG. 6A é um esquema que descreve a ligação de ZFN. FIG. 6B mostra a sequência da sequência alvo.
Figura 7 é uma representação esquemática do plasmideo pDAB1400.
Figura 8 é uma representação esquemática do plasmideo pDAB782.
Figura 9 é uma representação esquemática do plasmideo pDABl 582.
Figura 10 é uma representação esquemática do plasmídeo pDAB354.
Figura 11 é uma representação esquemática do plasmideo pDAB1583.
Figura 12 é uma representação esquemática do plasmideo pDAB2407.
Figura 13 é uma representação esquemática do plasmideo pDAB1584.
Figura 14 é uma representação esquemática do plasmideo pDAB2418.
Figura 15 é uma representação esquemática do plasmideo pDAB4045.
Figura 16 é uma representação esquemática do plasmideo pDAB1575.
Figura 17 é uma representação esquemática do plasmideo pDAB1577.
Figura 18 é uma representação esquemática do plasmideo pDAB1579.
Figura 19 é uma representação esquemática do plasmideo pDAB1580.
Figura 20 é uma representação esquemática do plasmídeo pDAB3401.
Figura 21 é uma representação esquemática do plasmideo pDAB1570.
Figura 22 é uma representação esquemática do plasmideo pDAB1572.
Figura 23 é uma representação esquemática do plasmideo pDAB4003.
Figura 24 é uma representação esquemática do plasmideo pDAB1571.
Figura 25 é uma representação esquemática do plasmideo pDAB7204.
Figura 26 é uma representação esquemática do plasmideo pDAB1573.
Figura 27 é uma representação esquemática do plasmideo pDAB1574.
Figura 28 é uma representação esquemática do plasmideo pDAB1581.
Figura 29 é uma representação esquemática do plasmideo pD AB 1576.
Figura 30 são representações esquemáticas do plasmídeo pDAB1600.
Figura 31 é uma representação esquemática do plasmideo pDAB3731.
Figura 32 é uma representação esquemática do plasmideo pDAB4322.
Figura 33 é uma representação esquemática do plasmideo pDAB4331.
Figura 34 é uma representação esquemática do plasmideo pDAB4332.
Figura 35 é uma representação esquemática do plasmideo pDAB4333.
Figura 36 é uma representação esquemática do plasmideo pDAB4334.
Figura 37 é uma representação esquemática do plasmideo pDAB4336.
Figura 38 é uma representação esquemática do plasmideo pDAB4339.
Figura 39 é uma representação esquemática do plasmideo pDAB4321.
Figura 40 é uma representação esquemática do plasmídeo pDAB4323.
Figura 41 é uma representação esquemática do plasmideo pDAB4341.
Figura 42 é uma representação esquemática do plasmideo pDAB4342.
Figura 43 é uma representação esquemática do plasmideo pDAB4343.
Figura 44 é uma representação esquemática do plasmideo pDAB4344.
Figura 45 é uma representação esquemática do plasmideo pDAB4346.
Figura 46 é uma representação esquemática do plasmideo pDAB4330.
Figura 47 é uma representação esquemática do plasmideo pDAB4351.
Figura 48 é uma representação esquemática do plasmideo pDAB4356.
Figura 49 é uma representação esquemática do plasmideo pDAB4359.
Figura 50 é uma representação esquemática do plasmídeo pDAB7002.
Figura 51 é uma representação esquemática do plasmideo pDAB7025.
Figura 52 é uma representação esquemática do plasmideo pDAB1591.
Figura 53 é uma representação esquemática do plasmideo pcDNA3.l-SCD27a-L0-Fokl, a matriz de DNA usada para a amplificação por PCR de Scd27 ZFN.
Figura 54 é uma representação esquemática do plasmideo pDAB1594.
Figura 55 é uma representação esquemática do plasmideo pDAB1598.
Figura 56 é uma representação esquemática do plasmideo pDAB1577.
Figura 57 é uma representação esquemática do plasmideo pDAB1578.
Figura 58 é uma representação esquemática do plasmideo pDAB1601,
Figura 59 é um esquema que descreve a recombinação homóloga intracromossómica prevista estimulada pela proteína de fusão IL-1-Fokl.
Figura 60 é uma representação esquemática do plasmídeo pDAB1590, um controlo positivo da expressão de GFP.
Figura 61 é um esquema que descreve a recombinação homóloga intercromossómica prevista, estimulada pela proteína de fusão IL-l-Fokl com dedos de zinco.
Figura 62 é um esquema que descreve a recombinação homóloga intercromossómica prevista estimulada pela proteína de fusão Scd27-Fokl com dedos de zinco.
Figura 63 é um gel que descreve a análise por PCR dos recombinantes. As primeiras 4 pistas à esquerda estão marcadas por cima do gel. As pistas 1-5 mostram eventos HR da transformação de BY2-380 com o gene da proteína de fusão C3H IL-l-Fokl e as pistas marcadas com 6-7 mostram os eventos HR da transformação de BY2-380 com o gene da proteína de fusão C3H SCD27-Fokl.
Figura 64 mostra uma sequência do gene IPP2K de milho (SEQ ID NO:6), derivada da cultura de células Hill e que serviu como matriz para a manipulação genética de ZFNs tendo como alvo IPP2K de milho.
Figuras 65, painéis A a E, descrevem um esquema de clonagem do vector de expressão de ZFN. Usou-se uma estratégia de clonagem em vários passos para gerar construções de expressão de ZFN. Os genes codificadores de ZFN individuais foram clonados nos vectores pVAX-N2A-NLSop2-EGFP-FokMono (A) e pVAX-C2A-NLSop2-EGFP-FokMono (B) para criar uma cassete para duas proteínas (C). Esta cassete foi ligada a pDAB3872 (D) para gerar um plasmideo final (E) para a expressão do heterodimero ZFN.
Figura 66 descreve a ligação de ZFN a um gene IPP2K de milho. São necessárias duas proteínas ZFN para realizarem o corte da dupla cadeia de DNA. Está apresentada a sequência à volta do local de corte (indicado com uma seta para baixo) (SEQ ID N0:7) . Uma proteina (8705) ligou-se à sequência CTGTGGGGCCAT (cadeia superior) (SEQ ID NO:8), enquanto a outra proteina (8684, 8685 ou 8686) se ligou à sequência inferior (CTTGACCAACTCAGCCAG, cadeia inferior) (SEQ ID NO:9).
Figura 67 descreve sequências tipo selvagem (sequência superior, SEQ ID NO: 10) e o clone ZFN 127 (sequência inferior, SEQ IS NO: 11) . O alvo de corte para este ZFN está evidenciado numa caixa cinzenta.
Figura 68 mostra um alinhamento de múltiplas deleções resultantes da ligação não homóloga de extremos (NHEJ) de um corte em dsDNA, mediada por ZFN, no gene IPP2K de milho consoante detecção por sequenciação de 454. O alvo de corte para esta ZFN está evidenciado numa caixa cinzenta.
Figura 69 é um gráfico que descreve as taxas de correcção no sistema de ensaio repórter com células GFP descrito na Patente U.S. N° 2005/0064474 e aqui. Os pares de ZFN testados em cada amostra estão apresentados por baixo de cada barra.
Figura 70 descreve o plasmídeo pDAB7471, construído como descrito no Exemplo 18B.
Figura 71 descreve o plasmideo pDAB7451, construído como descrito no Exemplo 18C.
Figura 72 é uma descrição esquemática de uma cassete de expressão autónoma para um gene de tolerância a herbicidas. Esta construção compreende um promotor-unidade de transcrição completa (PTU) contendo um promotor, um gene de tolerância a herbicidas e a sequência de terminação e poli-adenilação (poliA) como descrito no Exemplo 18D.
Figura 73 descreve o plasmideo pDAB7422, construído como descrito no Exemplo 18E. O plasmideo inclui um promotor-unidade de transcrição completa (PTU) contendo um promotor, um gene de tolerância a herbicidas e a sequência de terminação e poli-adenilação (poliA) inserida num esqueleto de plasmideo posição -1.
Figura 74 descreve o plasmideo pDAB7452, construído como descrito no Exemplo 18E. O plasmideo inclui um promotor-unidade de transcrição completa (PTU) contendo um promotor, um gene de tolerância a herbicidas e a sequência de terminação para poli-adenilação (poliA) inserida num esqueleto de plasmideo posição -2.
Figura 75 é uma descrição esquemática de uma cassete de expressão não autónoma para um gene de tolerância a herbicida. Esta construção compreende um promotor-unidade de transcrição completa (PTU) contendo um promotor, um gene de tolerância a herbicidas e a sequência de terminação para poli-adenilação (poliA) como descrito no Exemplo 18F.
Figura 76 descreve o plasmideo pDAB7423, construído como descrito no Exemplo 18G. Este plasmideo inclui um promotor-unidade de transcrição (PTU) incompleta contendo um gene de tolerância a herbicida e uma sequência de terminação para poli-adenilação (poliA) inserida num esqueleto de plasmideo posição -1.
Figura 77 descreve o plasmideo pDAB7454, construído como descrito no Exemplo 18G. 0 plasmideo inclui um promotor- unidade de transcrição (PTU) incompleta contendo um gene de tolerância a herbicida e uma sequência de terminação para poli-adenilação (poliA) inserida num esqueleto de plasmideo posição -2 como descrito no Exemplo 18H.
Figura 78 descreve o plasmideo pDAB7424 (um exemplo de dador autónomo posição -1 adaptado de Gateway®), construído como descrito no Exemplo 18H.#
Figura 79 descreve o plasmídeo pDAB 7425 (um exemplo de dador autónomo posição -1 adaptado de Gateway®), construído como descrito no Exemplo 18H.
Figura 80 descreve o plasmídeo pDAB 7426, construído como descrito no Exemplo 18H. pADB 7426 é um plasmídeo de combinação contendo o dador autónomo posição -1 com uma cassete de expressão de ZFN.
Figura 81 descreve o plasmídeo pDAB 7427, construído como descrito no Exemplo 18H. pADB 7427 é um plasmídeo de combinação contendo o dador autónomo posição -1 com uma cassete de expressão de ZFN.
Figura 82 descreve a amplificação de sequências específicas dadoras de DNA derivadas de DNA genómico. A presença de um produto de 317 pb é diagnóstico da presença de DNA dador contendo o gene PAT inserido no genoma de linhas de calos de milho #61-72 como descrito no Exemplo 20C. Hill indica um controlo negativo selvagem.
Figura 83 descreve a amplificação da fronteira 5' entre o DNA dador e as sequências genómicas de milho específicas para IPP2K. Os produtos da segunda reacção de PCR derivados da integração dirigida do dador no gene IPP2K foram diagnosticados pela presença de fragmentos de DNA de 1,65 kpb como descrito no Exemplo 21A. Hill indica um controlo negativo selvagem.
Figura 84 descreve a amplificação da fronteira 3' entre o DNA dador e sequências genómicas de milho
especificas de IPP2K. Os produtos da segunda reacção de PCR derivados da integração dirigida do dador no gene IPP2K foram diagnosticados pela presença de fragmentos de DNA de 1,99 kpb como descrito no Exemplo 21A. Hill indica um controlo negativo selvagem.
Figura 85 descreve a amplificação da fronteira 5' a montante entre genoma e dador. Os produtos da segunda reacção de PCR derivados da integração dirigida do dador no gene IPP2K (fronteira 5') foram diagnosticados pela presença de fragmentos de DNA de 1,35 kpb de tamanho como descrito no Exemplo 21B. Hill indica um controlo negativo selvagem.
Figura 86 descreve a amplificação da fronteira 3' a jusante entre dador e genoma. Os produtos da segunda reacção de PCR derivados da integração dirigida do dador no gene IPP2K (fronteira 3') foram diagnosticados pela presença de fragmentos de DNA de 1,66 kpb de tamanho como descrito no Exemplo 21B. Hill indica um controlo negativo selvagem.
Figura 87 descreve a sequência de homologia flanqueante 5' da posição -1 (SEQ ID NO:171).
Figura 88 descreve a sequência de homologia flanqueante 3' da posição -1 (SEQ ID NO:172).
Figura 89 descreve a sequência de homologia flanqueante 5' da posição -2 (SEQ ID NO:139).
Figura 90 descreve a sequência de homologia flanqueante 3' da posição -2 (SEQ ID NO:140).
Figura 91 descreve a sequência de uma sequência genómica (5'-) IPP2K a montante das regiões alvo de ZFN (SEQ ID NO:141).
Figura 92 descreve a sequência de uma sequência genómica (3'-) IPP2K a jusante das regiões alvo de ZFN (SEQ ID NO:142).
DESCRIÇÃO DETALHADA São aqui descritas composições compreendendo polipéptidos de ligação com dedos de zinco (ZFPs) contendo dedos de zinco não canónicos do formato Cys-Cys-His-Cys como reivindicado. Apesar da coordenação de zinco proporcionar a principal energia de enrolamento aos dedos de zinco, o ajustamento da coordenação dos dedos de zinco proporciona um meio rápido de modificação da estabilidade estrutural dos dedos, o que tem impacto numa variedade de caracteristicas funcionais importantes das proteínas com dedos de zinco, incluindo, por exemplo, a semi-vida celular, interacções com outros factores celulares, especificidade e afinidade da ligação a DNA e orientação relativa dos dominios funcionais.
As proteínas com dedos de zinco compreendendo dedos de zinco não canónicos tais como os descritos nos Pedidos de Patente U.S. Nos20030108880; 20060246567; e 20060246588 revelaram-se capazes de se ligarem a DNA e alterar a transcrição. No entanto, quando incorporadas em nucleases com dedos de zinco (ZFNs, ver por exemplo a Publicação do Pedido de Patente U.S. N°2005/0064474), estas proteínas com dedos de zinco não canónicos anteriormente descritas podem por vezes apresentar actividade sub-óptima no corte do DNA alvo. São aqui descritas proteínas com dedos de zinco compreendendo um ou mais dedos de zinco CCHC como reivindicado, em que sequências especificas que rodeiam o par C-terminal dos residuos de coordenação de zinco foram alteradas. São também descritas proteínas de fusão, por exemplo nucleases com dedos de zinco (ZFNs), compreendendo estes dedos de zinco não canónicos optimizados, em que os ZFNs cortam o DNA alvo com taxas comparáveis ao corte conseguido usando ZFNs compreendendo dedos de zinco canónicos (CCHH).
Os polipéptidos de fusão, como aqui descritos, podem estimular ou suprimir a transcrição de um gene e/ou cortar uma sequência alvo. São igualmente proporcionados polinucleótidos codificadores de dedos de zinco não canónicos optimizados e polinucleótidos codificadores de proteínas de fusão compreendendo um ou mais dedos de zinco não canónicos optimizados. São ainda proporcionadas composições farmacêuticas compreendendo uma quantidade eficaz em termos terapêuticos de qualquer um dos polipéptidos com dedos de zinco de ligação a nucleótidos aqui descritos ou seus fragmentos funcionais; ou uma quantidade eficaz em termos terapêuticos de uma sequência nucleotidica que codifica qualquer um dos polipéptidos de ligação a nucleótidos com dedos de zinco modificados ou seus fragmentos funcionais, em combinação com um veiculo aceitável em termos farmacêuticos. São ainda proporcionadas composições agrícolas compreendendo uma quantidade eficaz em termos agronómicos de qualquer um dos polipéptidos de ligação a nucleótidos com dedos de zinco aqui descritos ou seus fragmentos funcionais; ou uma quantidade eficaz em termos agronómicos de uma sequência nucleotidica que codifica qualquer um dos polipéptidos de ligação a nucleótidos com dedos de zinco modificados ou seus fragmentos funcionais, em combinação com um veiculo aceitável em termos agronómicos. São igualmente proporcionados métodos de rastreio para obtenção de um polipéptido de ligação a nucleótidos com dedos de zinco modificados que se liga a uma sequência genómica.
As sequências genómicas incluem as presentes em cromossomas, epissomas, genomas de organelos (e.g., mito- côndrias, cloroplastos), cromossomas artificiais e qualquer outro tipo de ácido nucleico presente numa célula como seja, por exemplo, sequências amplificadas, cromossomas minúsculos duplos e os qenomas de bactérias endóqenas ou causadoras de infecção e virus. As sequências genómicas podem ser normais (i.e., selvagens) ou mutantes; as sequências mutantes podem compreender, por exemplo, inserções, deleções, substituições, translocações, rearranjos e/ou mutações pontuais. Uma sequência genómica pode também compreender um de uma série de alelos diferentes.
Geral A execução dos métodos, assim como a preparação e uso das composições aqui descritas empregam, a menos que de outra forma seja indicado, técnicas convencionais de biologia molecular, bioquímica, estrutura e análise da cromatina, quimica computacional, culturas celulares, DNA recombinante e campos relacionados do conhecimento dos familiarizados com a técnica. Estas técnicas estão totalmente descritas na literatura. Ver, por exemplo, Sambrook et al. MOLECULAR CLONING: A LABORATORY MANUAL, Second edition, Cold Spring Harbor Laboratory Press, 1989 e Third edition, 2001; Ausubel et al, CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987 e actualizações periódicas; a série METHODS IN ENZYMOLOGY, Academic Press, San Diego; Wolffe, CHROMATIN STRUCTURE AND FUNCTION, Third edition, Academic Press, San Diego, 1998; METHODS IN ENZYMOLOGY, Vol. 304, "Chromatin" (P.M. Wassarman and A. P. Wolffe, eds.), Academic Press, San Diego, 1999; e METHODS IN MOLECULAR BIOLOGY, Vol. 119, "Chromatin Protocols" (P.B. Becker, ed.) Humana Press, Totowa, 1999.
Definições
Os termos "ácido nucleico", "polinucleótido" e "oligonucleótido" são usados indiferentemente e referem-se a um polimero de desoxirribonucleótidos ou de ribo-nucleótidos, na conformação linear ou circular e na forma de cadeia simples ou dupla. Para fins da presente divulgação, estes termos não são considerados limitantes no que respeita ao comprimento do polimero. Os termos podem incluir análogos conhecidos de nucleótidos naturais, assim como nucleótidos que são modificados na fracção base, açúcar e/ou fosfato (e.g., esqueletos de fosforotioato). Em geral, um análogo de um nucleótido particular possui a mesma especificidade de emparelhamento de bases; i.e., um análogo de A emparelhará com T.
Os termos "polipéptido", "péptido" e "proteina" são usados indiferentemente para referir um polimero de residuos de aminoácidos. O termo também se aplica a polímeros de aminoácidos em que um ou mais aminoácidos são análogos quimicos ou derivados modificados de um aminoácido natural correspondente. "Ligação" refere-se a uma interacção não cova-lente, específica de sequência, entre macromoléculas (e.g., entre uma proteína e um ácido nucleico) . Nem todos os componentes de uma interacção de ligação necessitam de ser específicos de sequência (e.g., contactos com resíduos de fosfato num esqueleto de DNA), desde que a interacção como um todo seja específica de sequência. Tais interacções são, de um modo geral, caracterizadas por uma constante de dissociação (Kd) de IO-6 M_1 ou inferior. "Afinidade" refere-se à força da ligação: o aumento da afinidade da ligação estando correlacionado com um Kd mais baixo.
Uma "proteína de ligação" é uma proteína que é capaz de se ligar não covalentemente a uma outra molécula. Uma proteína de ligação pode ligar-se, por exemplo, a uma molécula de DNA (uma proteína de ligação a DNA), uma molécula de RNA (uma proteína de ligação a RNA) e/ou uma molécula de proteína (um proteína de ligação a proteína). No caso de uma proteína de ligação a proteína, pode ligar-se a si própria (para formar homodímeros, homotrímeros, etc.) e/ou pode ser uma ou mais moléculas de uma proteína ou proteínas diferentes. Uma proteína de ligação pode ter mais de um tipo de actividade de ligação. Por exemplo, as proteínas com dedos de zinco possuem actividade de ligação a DNA, ligação a RNA e ligação a proteína.
Uma "proteína com dedos de zinco de ligação a DNA" (ou domínio de ligação) é uma proteína ou um domínio dentro de uma proteína maior, que se liga a DNA numa forma específica de sequência através de um ou mais dedos de zinco, os quais são regiões da sequência de aminoácidos dentro do domínio de ligação cuja estrutura é estabilizada através da coordenação de um ião de zinco. 0 termo proteína com dedos de zinco de ligação a DNA é frequentemente abreviada como proteína com dedos de zinco ou ZFP.
Os domínios dedos de zinco de ligação podem ser "manipulados" para se ligarem uma sequência nucleotídica pré-determinada. Exemplos não limitantes de métodos para manipulação de proteínas com dedos de zinco são o desenho e a selecção. Uma proteína com dedos de zinco planeada é uma proteína não natural cuja desenho/composição resulta principalmente de critérios racionais. Os critérios racionais para o desenho incluem aplicação de regras de substituição e algoritmos computorizados para o processamento de informação numa base de dados de armazenamento de informação sobre os desenhos de ZFP existentes e dados de ligação. Ver, por exemplo, Patentes U.S. 6,140,081; 6,453,242; 6,534,261; e 6,785,613; ver, também WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 e WO 03/016496; e Patentes U.S. 6,746,838; 6,866,997; e 7,030,215.
Uma proteína com dedos de zinco "seleccionada" é uma proteína não encontrada na natureza cuja produção resulta principalmente de um processo empírico, como seja apresentação fágica, captura por interacção ou selecção de híbridos. Ver e.g., US 5,789,538; US 5,925,523; US 6,007,988; US 6,013,453; US 6,200,759; US 6,733,970; US RE 3 9, 229; e WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970 WO 01/88197 e WO 02/099084 .
Uma proteína com dedos de zinco "não canónica" é uma proteína compreendendo um dedo de zinco não canónico (não C2H2) . Um dedo de zinco não canónico compreende assim uma substituição, adição e/ou deleção de pelo menos um aminoácido, comparativamente com uma proteína com dedo de zinco natural C2H2. Exemplos não limitantes de dedos de zinco não canónicos incluem os que compreendem resíduos de coordenação de zinco (do extremo amino para carboxilo) de Cys-Cys-His-Cys (e.g., C3H).
Uma "sequência homóloga" refere-se a uma primeira sequência que partilha um grau de identidade de sequências com uma segunda sequência e cuja sequência pode ser idêntica à da segunda sequência. Uma "sequência homóloga não idêntica" refere-se a uma primeira sequência que partilha um grau de identidade de sequência com uma segunda sequência, mas cuja sequência não é idêntica à da segunda sequência. Por exemplo, um polinucleótido compreendendo a sequência selvagem de um gene mutante é homólogo e não idêntico à sequência do gene mutante. Em determinadas realizações, o grau de homologia entre as duas sequências é suficiente para permitir recombinação homóloga entre elas, usando os mecanismos celulares normais. Duas sequências homólogas não idênticas podem ter qualquer comprimento e o seu grau de não homologia pode ser tão pequeno quanto um único nucleótido (e.g., para correcção de uma mutação pontual genómica através de recombinação homóloga dirigida) ou tão grande quanto 10 ou mais quilobases {e.g., para inserção de um gene num local pré-determinado num cromossoma) . Dois polinucleótidos compreendendo as sequências homólogas não idênticas não necessitam de ter o mesmo comprimento. Por exemplo, pode ser usado um polinucleótido exógeno (i.e., polinucleótido dador) entre 20 e 10000 nucleótidos ou pares de nucleótidos.
Na técnica são conhecidas técnicas para determinação da identidade de sequências de ácido nucleico e de aminoácidos. Tipicamente, tais técnicas incluem determinação da sequência nucleotidica do mRNA para um gene e/ou determinação da sequência de aminoácidos codificada e comparação destas sequências com uma segunda sequência nucleotidica ou de aminoácidos. As sequências genómicas podem também ser determinadas e comparadas desta forma. Em geral, a identidade refere-se a uma correspondência exacta nucleótido a nucleótido ou aminoácido a aminoácido de duas sequências polinucleotidicas ou polipeptidicas, respectiva-mente. Duas ou mais sequências (polinucleotidicas ou de aminoácidos) podem ser comparadas determinando-se a sua percentagem de identidade. A percentagem de identidade de duas sequências, quer sejam de ácido nucleico quer sejam de aminoácidos, é o número de correspondências exactas entre as duas sequências alinhadas dividido pelo comprimento da sequência mais curta e multiplicado por 100. Um alinhamento aproximado para sequências de ácido nucleio é proporcionado pelo algoritmo de homologia local de Smith e Waterman, Advances in Applied Mathematics 2:482-489 (1981). Este algoritmo pode ser aplicado às sequências de aminoácidos através da utilização da matriz de pontuação desenvolvida por Dayhoff, Atlas of Protein Sequences and Structure. M. 0. Dayhoff ed., 5 suppl. 3:353-358, National Biomedical
Research Foundation, Washington, D. C, USA, e normalizada por Gribskov, Nucl. Acids Res. 14(6):6745-6763 (1986). Urn exemplo de implementação deste algoritmo para determinar a percentagem de identidade de uma sequência é proporcionado pelo Genetics Computer Group (Madison, WI) na aplicação da ferramenta "BestFit". Os parâmetros por defeito para este método estão descritos no Wisconsin Sequence Analysis Package Program Manual, Version 8 (1995) (disponível no
Genetics Computer Group, Madison, WI) . Um exemplo de urn método de estabelecimento da percentagem de identidade no contexto da presente divulgação é usar o pacote de programas MPSRCH, cujos direitos são da Universidade de Edimburgo, desenvolvido por John F. Collins e Shane S. Sturrok, e distribuído por IntelliGenetics, Inc. (Mountain View, CA) . A partir deste conjunto de pacotes pode ser empregue o algoritmo de Smith-Waterman em que são usados os parâmetros por defeito para a tabela de pontuações (por exemplo, a penalização por um espaço aberto de 12, a penalização pela extensão do espaço de um e um espaço de seis) . A partir dos dados gerados, o valor de "Correspondência" reflecte a identidade das sequências. Outros programas adequados para o cálculo da percentagem de identidade ou similaridade entre sequências são conhecidos na área, por exemplo, um outro programa de alinhamento é o BLAST, usado com parâmetros por defeito. Por exemplo, BLASTN e BLASTP podem ser usados com os parâmetros por defeito seguintes: código genético = padrão; filtro = nenhum; cadeia = ambas; limiar = 60; esperado = 10; Matriz = BLOSUM62; Descrições = 50 sequências; ordenar por = HIGH SCORE; Databases = não redundante, GenBank + EMBL + DDBJ + PDB + GenBank CDS translations + Swiss protein + Spupdate + PIR. Os detalhes destes programas podem ser encontrados na rede. Relativamente às sequências aqui descritas, a gama de graus de identidade de sequências pretendida é de aproximadamente 35% a 100% e qualquer valor inteiro entre eles. Tipicamente as percentagens de identidade entre sequências são pelo menos de 35%-40%; 40%-45%; 45%-50%; 50%-60%; 60%-70%; 70-75%, de preferência 80-82%, mais de preferência 85-90%, ainda mais de preferência 92%, ainda mais de preferência95%, e mais de preferência 98% de identidade de sequências.
Como alternativa, o grau de similaridade de sequências entre polinucleótidos pode ser determinado por hibridação de polinucleótidos nas condições que permitem a formação de duplas hélices estáveis entre regiões homólogas, seguido da digestão com nucleases especificas de cadeia simples e determinação do tamanho dos fragmentos digeridos. Duas sequências de ácido nucleico ou duas sequências polipeptidicas são substancialmente homólogas uma da outra quando as sequências apresentam pelo menos cerca de 70-75%, de preferência 80%-82%, mais de preferência 85%-90%, ainda mais de preferência 92%, ainda mais de preferência 95% e mais de preferência 98% de identidade de sequências ao longo de um comprimento definido das moléculas, como determinado usando os métodos acima. Como aqui usado, substancialmente homólogo também se refere a sequências que apresentam identidade complexa com uma sequência de DNA ou de proteina especificada. As sequências de DNA que são substancialmente homólogas podem ser identificadas numa experiência de hibridação Southern, por exemplo, em condições restringentes, como definido para aquele sistema particular. Os familiarizados com a técnica sabem definir condições de hibridação adequadas. Ver, e.g., Sambrook et al., supra; Nucleic Acid Hybridization: A Practical Approach, editors B.D. Hames and SJ. Higgins, (1985) Oxford; Washington, DC; ERL Press). A hibridação selectiva de dois fragmentos de ácido nucleico pode ser determinada como se segue. O grau de identidade das sequências entre as duas moléculas de ácido nucleico afecta a eficiência e a força dos eventos de hibridação entre tais moléculas. Uma sequência de ácido nucleico parcialmente idêntica inibirá, pelo menos parcialmente, a hibridação de uma sequência totalmente idêntica com uma molécula alvo. A inibição da hibridação da sequência completamente idêntica pode ser avaliada usando ensaios de hibridação que são conhecidos na técnica (e.g., transferência Southern (DNA), transferência Northern (RNA), hibridação em solução ou similares, ver Sambrook, et al.,
Molecular Cloning: A Laboratory Manual, Second Edition, (1989) Cold Spring Harbor, N. Y.). Tais ensaios podem ser conduzidos usando vários graus de selectividade, por exemplo, usando condições que variam entre restringência baixa e elevada. Se forem empregues condições de restringência baixa, a ausência de ligação não específica pode ser avaliada usando uma sonda secundária que não possui nem mesmo um grau parcial de identidade de sequência (por exemplo, uma sonda que possui menos de cerca de 30% de identidade de sequência com a molécula alvo) de modo que, na ausência de eventos de ligação não específica, a sonda secundária não hibridará com o alvo.
Quando se utiliza um sistema de detecção baseado em hibridação, escolhe-se uma sonda de ácido nucleico que seja complementar de uma sequência de ácido nucleico de referência e depois, através da selecção das condições adequadas, as sequências da sonda e da referência hibridam selectivamente ou ligam-se uma à outra para formar uma molécula de dupla hélice. Uma molécula de ácido nucleico que seja capaz de hibridar selectivamente com uma sequência de referência em condições moderadamente restringentes tipicamente hibrida em condições que permitem a detecção de uma sequência de ácido nucleico alvo de pelo menos cerca de 10-14 nucleótidos de comprimento, tendo pelo menos aproxi-madamente 70% de identidade de sequência com a sequência da sonda de ácido nucleico seleccionada. As condições de hibridação restringentes tipicamente permitem a detecção de sequências de ácido nucleico alvo de pelo menos cerca de 10-14 nucleótidos de comprimento, com uma identidade de sequência superior a cerca de 90-95% com a sequência da sonda de ácido nucleico seleccionada. As condições de hibridação úteis para a hibridação das sequências sonda/referência, em que a sonda e a referência possuem um elevado grau de identidade de sequência, podem ser determinadas como é conhecido na técnica (ver, por exemplo, Nucleic Acid Hybridization: A Practical Approach, editors B.D. Hames and SJ. Higgins, (1985) Oxford; Washington, DC; IRL Press) .
As condições de hibridação são conhecidas dos familiarizados com a técnica. A restringência de hibridação refere-se ao grau em que as condições de hibridação desfavorecem a formação de hibridos contendo nucleótidos sem correspondência, com a restringência mais elevada correlacionada com uma tolerância mais baixa para os hibridos sem correspondências. Os factores que afectam a restringência de hibridação são conhecidos dos familiarizados com a área e incluem, mas não lhes estão limitados, temperatura, pH, força iónica e concentração de solventes orgânicos tais como, por exemplo, formamida e dimetil-sulfóxido. Como é conhecido dos familiarizados com a técnica, a restringência de hibridação é aumentada através de temperatura mais elevada e força iónica mais baixa e concentrações de solventes mais baixas.
Relativamente às condições de restringência para hibridação, é conhecido na técnica que podem ser empregues numerosas condições equivalente para estabelecer uma restringência particular através da variação, por exemplo, dos seguintes factores: o comprimento e natureza das sequências, a composição em bases das várias sequências, concentrações de sais e outros componentes da solução de hibridação, a presença ou ausência de agentes bloqueadores nas soluções de hibridação (e.g., sulfato de dextrano e polietilenoglicol), parâmetros de temperatura e tempo da reacção de hibridação, assim como, variação das condições de lavagem. A selecção de uma série particular de condições de hibridação é feita seguindo métodos convencionais na técnica (ver, por exemplo, Sambrook, et ai., Molecular Cloning: A Laboratory Manual. Second Edition, (1989) Cold Spring Harbor, N. Y.). "Recombinação" refere-se a um processo de troca de informação genética entre dois polinucleótidos. Para fins da presente divulgação "recombinação homóloga (HR) " refere-se à forma especializada em que a troca ocorre, por exemplo, durante a reparação de quebras da cadeia dupla nas células. Este processo requer homologia da sequência de nucleótidos, usa uma molécula "dadora" para moldar a reparação de uma molécula "alvo" (i.e., a que sofreu a quebra da cadeia dupla) e é conhecida como "conversão de genes sem "crossing-over"" ou "conversão de genes num segmento curto", devido a conduzir à transferência de informação genética do dador para o alvo. Sem pretender estar limitado por qualquer teoria particular, tal transferência pode envolver correcção dos desemparelhamentos do DNA de heteroduplexes que se formam entre o alvo quebrado e o dador e/ou "emparelhamento de cadeias dependente de síntese" em que o dador é usado para re-sintetizar a informação qenética que se tornará parte do alvo e/ou processos relacionados. Tal HR especializada frequentemente resulta numa alteração da sequência da molécula alvo, de forma que parte ou a totalidade da sequência do polinucleótido dador é incorporada no polinucleótido alvo. "Clivagem" refere-se à quebra do esqueleto covalente de uma molécula de DNA. A clivagem pode ser iniciada por uma variedade de métodos incluindo, mas não lhes estando limitada, hidrólise enzimática ou química de uma ligação fosfodiéster. São possíveis tanto a clivagem de cadeia simples como a clivagem de cadeia dupla e a clivagem de cadeia dupla pode ocorrer como resultado de dois eventos distintos de clivagem de cadeia simples. A clivagem do DNA pode resultar na produção de extremos cegos ou de extremos coesivos. Em determinadas realizações, os polipéptidos de fusão são usados para a clivagem dirigida de DNA de cadeia dupla.
Um domínio de clivagem" compreende uma ou mais sequências polipeptídicas que possuem actividade catalítica para a clivagem de DNA. Um domínio de clivagem pode estar contido numa cadeia polipeptídica simples ou a actividade de clivagem pode resultar da associação de dois (ou mais) polipéptidos.
Um "meio domínio de clivagem" é uma sequência polipeptídica que, conjuntamente com um segundo polipéptido (idêntico ou diferente), forma um complexo com actividade de clivagem (e.g., actividade de clivagem de cadeia dupla).
Os termos "domínio de clivagem" e "meio domínio de clivagem" incluem domínios selvagens e porções ou mutantes dos domínios de clivagem ou meios domínios de clivagem que mantêm a capacidade de multimerizar (e.g., dimerizar) para formar um domínio de clivagem funcional. "Cromatina" é a estrutura de nucleoproteína compreendendo o genoma celular. A cromatina celular compreende ácido nucleico, principalmente DNA, e proteína, incluindo histonas e proteínas cromossómicas não histonas. A maioria da cromatina celular eucariótica existe na forma de nucleossomas, em que um módulo central do nucleossoma compreende aproximadamente 150 pares de bases de DNA associadas a um octâmero compreendendo duas de cada uma das histonas H2A, H2B, H3 e H4; e o DNA ligante (de comprimento variável dependendo do organismo) estende-se entre os módulos centrais do nucleossoma. A molécula da histona Hl é geralmente associada ao DNA ligante. Para fins da presente divulgação, o termo " "cromatina" pretende englobar todos os tipos de nucleoproteína celular, procariótica e eucariótica. A cromatina celular inclui cromatina cromossómica e epissómica.
Um "cromossoma" é um complexo de cromatina compreendendo a totalidade ou uma porção do genoma de uma célula. 0 genoma de uma célula é frequentemente caracte-rizado pelo seu cariótipo, o qual é o conjunto de todos os cromossomas que compreendem o genoma da célula. 0 genoma de uma célula pode compreender um ou mais cromossomas.
Um "epissoma" é um ácido nucleico que se replica, complexo de nucleoproteína ou outra estrutura compreendendo um ácido nucleico que não é parte do cariótipo cromossómico de uma célula. Exemplos de epissomas incluem plasmídeos e determinados genomas virais.
Uma "região acessível" é um local na cromatina celular em que um local alvo presente no ácido nucleico pode ser ligado a uma molécula exógena que reconhece o local alvo. Sem pretender estar limitado por qualquer teoria particular, crê-se que uma região acessível é uma que não está incluída numa estrutura nucleossómica. A estrutura distinta de uma região acessível pode frequentemente ser detectada pela sua sensibilidade a sondas químicas e enzimáticas, por exemplo, nucleases.
Um "local alvo" ou "sequência alvo" é uma sequência de ácido nucleico que define uma porção de um ácido nucleico a que uma molécula de ligação se ligará, desde que existam condições suficientes para a ligação. Por exemplo, a sequência 5'-GAATTC-3' é um local alvo da endonuclease de restrição EcoRI.
Uma molécula "exógena" é uma molécula que normalmente não está presente numa célula, mas que pode ser introduzida numa célula através de um ou mais métodos genéticos, bioquímicos ou outros. A "presença normal na célula" é determinada relativamente à fase do desenvolvimento particular e condições ambientais da célula. Assim, por exemplo, uma molécula que está presente apenas durante o desenvolvimento embrionário do músculo é uma molécula exógena relativamente a uma célula do músculo adulto. De forma semelhante, uma molécula induzida por choque térmico é uma molécula exógena relativamente a uma célula não exposta a choque térmico. Uma molécula exógena pode compreender, por exemplo, uma versão funcional de uma molécula endógena que não esteja funcional ou uma versão que funcione mal de uma molécula endógena a funcionar normalmente.
Uma molécula exógena pode ser, entre outras coisas, uma pequena molécula, como as geradas através de um processo de química combinatória ou uma macromolécula como seja uma proteína, ácido nucleico, açúcar, lípido, glicoproteína, liproteína, polissacárido, qualquer derivado modificado das moléculas atrás ou qualquer complexo compreendendo uma ou mais das moléculas acima. Os ácidos nucleicos incluem DNA ou RNA, podem ser de cadeia simples ou dupla; podem ser lineares, ramificados ou circulares; e podem ter qualquer comprimento. Os ácidos nucleicos incluem os capazes de formar duplas hélices, assim como os ácidos nucleicos capazes de forma triplas hélices. Ver, por exemplo, Patente U.S. Nos. 5,176,996 e 5,422,251. As proteínas incluem, mas não lhes estão limitadas, proteínas de ligação a DNA, factores de transcrição, factores de remodelação da cromatina, proteínas de ligação a DNA metilado, polimerases, metilases, demetilases, acetilases, desacetilases, cinases, fosfatases, integrases, recombina-ses, ligases, topiosomerases, girases e helicases.
Uma molécula exógena pode ser do mesmo tipo de uma molécula endógena, e.g., uma proteína ou ácido nucleico exógeno. Por exemplo, um ácido nucleico exógeno pode compreender um genoma virai infeccioso, uma cadeia T de Agrobacterium tumefaciens, um plasmídeo ou epissoma introduzido numa célula ou um cromossoma que normalmente não está presente na célula. Os ácidos nucleicos ou polinucleótidos exógenos podem, no entanto, possuir sequências que são homólogas ou idênticas a sequências endógenas. Relativamente a uma região genómica endógena particular, uma "sequência exógena" refere-se a uma sequência de nucleótidos que não está presente naquela região. Tal sequência exógena pode estar presente numa outra localização cromossómica endógena ou pode não estar presente numa outra localização cromossómica endógena ou pode não estar de todo presente no genoma. Assim, um polinucleótido exógeno pode conter sequências exógenas e endógenas: por exemplo, um transgene flanqueado por sequências homólogas de uma região genómica. Tais ácidos nucleicos exógenos são usados em métodos de integração dirigida e recombinação dirigida como descrito infra. Métodos para a introdução de moléculas exógenas nas células são conhecidos na técnica e incluem, mas não lhes estão limitados, transferência mediada por lipidos (i.e. lipos-somas, incluindo lipidos neutros e catiónicos), electro-poração, injecção directa, fusão celular, bombardeamento de partículas, coprecipitação com fosfato de cálcio, transferência mediada por DEAE-dextrano e transferência mediada por vectores virais.
Pelo contrário, uma molécula "endógena" é uma que normalmente está presente numa célula particular numa fase particular do desenvolvimento em condições ambientais particulares. Por exemplo, um ácido nucleico endógeno pode compreender um cromossoma, o genoma de uma mitocôndria, cloroplasto ou outro organelo, ou um ácido nucleico epissómico natural. Outras moléculas endógenas podem incluir proteínas, por exemplo, factores de transcrição e enzimas.
Uma molécula de "fusão" é uma molécula em que duas ou mais moléculas de subunidades estão ligadas, por exemplo, covalentemente. As moléculas de subunidades podem ser do mesmo tipo quimico de molécula ou podem ser de tipos quimicos diferentes. Exemplos do primeiro tipo de molécula de fusão incluem, mas não lhes estão limitados, proteínas de fusão (por exemplo, uma fusão entre um dominio ZFP de ligação a DNA e um domínio de clivagem) e ácidos nucleicos de fusão (por exemplo, um ácido nucleico codificador da proteína de fusão descrita supra). Exemplos do segundo tipo de molécula de fusão incluem, mas não lhes estão limitados, uma fusão entre um ácido nucleico formador de triplas hélices e um polipéptido e uma fusão entre um ligante do sulco menor e um ácido nucleico. A expressão de uma proteína de fusão numa célula pode resultar da entrega da proteína de fusão à célula ou da entrega de um polinucleótido codificador da proteína de fusão a uma célula, em que o polinucleótido é transcrito e o transcrito é traduzido, para gerar a proteína de fusão. Trans-splicing, clivagem de polipéptidos e ligação de polipéptidos podem igualmente estar envolvidos na expressão de uma proteína numa célula. Métodos para a entrega de polinucleótidos e polipéptidos nas células estão apresentados algures nesta divulgação.
Um "gene" para fins da presente divulgação, inclui uma região de DNA codificadora de um produto de gene (ver infra), assim como todas as regiões de DNA que regulam a produção do produto do gene, quer essas sequências reguladoras estejam ou não adjacentes às sequências codificadoras e/ou transcritas. Assim, um gene inclui, mas não lhes está necessariamente limitado, sequências de promotores, terminadores, sequências reguladoras da tradução, tais como locais de ligação aos ribossomas e locais internos de entrada dos ribossomas, estimuladores, silenciadores, isoladores, elementos flanqueantes, origens de replicação, locais de ligação à matriz e regiões de controlo de locus. "Expressão de genes" refere-se à conversão da informação, contida num gene, num produto de gene. Um produto de gene pode ser o produto da transcrição directa de um gene (e.g., mRNA, tRNA, rRNA, RNA anti-sentido, ribozima, RNA estrutural ou qualquer outro tipo de RNAs que sejam modificados, por processos tais como capping, poliadenilação, metilação e edição e proteínas modificadas através, por exemplo, de metilação, acetilação, fosforilação, ubiquitinação, ADP-ribosilação, miristoilação e glicosilação. "Modulação da expressão de um gene" refere-se a uma alteração na actividade de um gene. A modulação da expressão pode incluir, mas não lhes está limitada, activação do gene e repressão do gene. "Células vegetais" incluem, mas não lhes estão limitadas, células de plantas monocotiledóneas (monocots) ou dicotiledóneas (dicots). Exemplos não limitantes de monocots incluem plantas de cereais tais como milho, arroz, cevada, aveia, sorgo, centeio, cana sacarina, ananás, cebola, banana e coco. Exemplos não limitantes de dicots incluem tabaco, tomate, girassol, algodão, beterraba sacarina, batata, alface, melão, soja, canola (colza) e alfafa. Aa células vegetais podem ser de qualquer parte da planta e/ou de qualquer fase do desenvolvimento da planta.
Uma "região de interesse" é qualquer região da cromatina celular, como seja, por exemplo, um gene ou uma sequência não codificadora dentro ou adjacente a um gene, em que é desejável ligar uma molécula exógena. A ligação pode ser para fins de clivagem dirigida de DNA e/ou recombinação dirigida. Uma região de interesse pode, por exemplo, estar presente num cromossoma, epissoma, genoma de organelo (e.g., mitocôndria, cloroplasto) ou genoma virai infeccioso. Uma região de interesse pode estar dentro da região codificadora de um gene, dentro de regiões transcritas não codificadoras tais como, por exemplo, sequências lider, sequências de reboque ou intrões, ou dentro de regiões não transcritas, a montante ou a jusante da região codificadora. Uma região de interesse pode ser tão pequena quanto um par de nucleótidos ou ter até 25000 pares de nucleótidos de comprimento ou qualquer valor inteiro de pares de nucleótidos.
Os termos "ligação operativa" e "ligado operacionalmente" (ou "operativamente ligado") são usados indistintamente referindo-se a uma justaposição de dois ou mais componentes (tais como elementos de uma sequência) em que os componentes estão arranjados de forma que ambos os componentes funcionem normalmente e permitam a possibilidade de pelo menos um dos componentes poder mediar uma função que é exercida sobre pelo menos um dos outros componentes. A titulo ilustrativo, uma sequência reguladora da transcrição, como seja um promotor, está operacional mente ligada a uma sequência codificadora se a sequência reguladora da transcrição controlar o nível de transcrição da sequência codificadora como resposta à presença ou ausência de um ou mais factores reguladores da transcrição. Uma sequência reguladora da transcrição está geralmente ligada operacionalmente em cis a uma sequência codificadora, mas não necessita de estar adjacente a ela. Por exemplo, um estimulador é uma sequência reguladora da transcrição que está operacionalmente ligada a uma sequência codificadora, mesmo apesar de não ser contígua.
Relativamente aos polipéptidos de fusão, o termo "ligado operacionalmente" pode referir-se ao facto de cada um dos componentes desempenhar a mesma função quando ligado ao outro componente que teria se não estivesse ligado. Por exemplo, relativamente a um polipéptido de fusão em que um domínio ZFP de ligação a DNA está fundido com um domínio de clivagem, o domínio ZFP de ligação a DNA e o domínio de clivagem estão operacionalmente ligados se, num polipéptido de fusão, a porção do domínio ZFP de ligação a DNA for capaz de se ligar ao seu local alvo e/ou ao seu local de ligação, enquanto o domínio de clivagem é capaz de clivar o DNA na vizinhança do local alvo.
Um "fragmento funcional" de uma proteína, polipéptido ou ácido nucleico é uma proteína, polipéptido ou ácido nucleico cuja sequência não é idêntica à proteína ou ácido nucleico de tamanho completo, mantendo no entanto a mesma função da proteína, polipéptido ou ácido nucleico de tamanho completo. Um fragmento funcional pode possuir mais, menos ou o mesmo número de resíduos da correspondente molécula nativa e/ou pode conter uma ou mais substituições de aminoácidos ou nucleótidos. Os métodos para determinação da função de um ácido nucleico (e.g., função codificadora, capacidade de hibridar com um outro ácido nucleico) são conhecidos na técnica. De forma semelhante, os métodos para determinação da função da proteína são bem conhecidos. Por exemplo, a função de ligação a DNA de um polipéptido pode ser determinada, por exemplo, através da ligação a filtros, alteração da mobilidade electroforética ou ensaios de imunoprecipitação. A clivagem de DNA pode ser testada por electroforese em gel. Ver Ausubel et al., supra. A capacidade de uma proteína para interagir com uma outra proteína pode ser determinada, por exemplo, através de co-imunoprecipitação, ensaios de duplo híbrido ou de complementação, tanto genéticos como bioquímicos. Ver, por exemplo, Fields et al. (1989) Nature 340:245-246; Patente U.S. No. 5,585,245 e PCT WO 98/44350.
Domínios de ligação dedo de zinco São aqui descritos domínios de ligação dedo de zinco não canónicos e polinucleótidos que codificam estes domínios de ligação dedo de zinco. Em determinadas realizações, os domínios de ligação dedos de zinco não canónicos aqui descritos são dedos de zinco C3H, em que um dos dois resíduos de histidina conservados da coordenação do zinco é convertido em cisterna. Em realizações adicionais, o resíduo de histidina mais C-terminal é convertido num resíduo de cisterna, gerando uma "proteína CCHC".
Um domínio de ligação dedo de zinco pode compreender um ou mais dedos de zinco (e.g., 2, 3, 4, 5, 6, 7, 8, 9 ou mais dedos de zinco) e pode ser manipulado para se ligar a qualquer sequência alvo (e.g. uma sequência genómica). Os domínios de ligação dedos de zinco podem ligar-se a DNA, RNA e/ou proteína. Tipicamente, um domínio dedo de zinco possui cerca de 30 aminoácidos de comprimento. Os dedos de zinco incluem dedos de zinco canónicos C2H2 (i.e., aqueles em que o ião zinco é coordenado por dois resíduos de cisterna e dois resíduos de histidina) e dedos de zinco não canónicos incluindo, por exemplo, dedos de zinco C3H (aqueles em que o ião zinco é coordenado por três resíduos de cisterna e um resíduo de histidina) . Ver também os Pedidos de Patente U.S. Nos. 20030108880, 20060246567 e 20060246588.
Os estudos estruturais demonstraram que um domínio (motivo) dedo de zinco canónico possui duas folhas beta (mantidas numa volta beta que possui os dois resíduos de cisterna invariantes) e uma hélice alfa (contendo os dois resíduos de histidina invariantes), as quais são mantidas numa conformação particular através da coordenação de um átomo de zinco pelas duas cisternas e as duas histidinas. Os dedos de zinco não canónicos aqui descritos mantêm esta estrutura beta-beta-alfa.
Os dedos de zinco não canónicos aqui descritos podem ser domínios de ligação dedos de zinco naturais. No entanto, mais tipicamente, os dedos de zinco não canónicos como aqui descritos incluem um ou mais componentes de dedos de zinco em que pelo menos um dos resíduos de cisteína ou de histidina da coordenação de zinco foi substituído com um ou mais aminoácidos. Por exemplo, em determinadas realizações, o resíduo de His C-terminal de um módulo de ligação do dedo de zinco canónico é substituído com um resíduo Cys.
Os dedos de zinco CCHC aqui descritos podem igualmente compreender uma ou mais alterações (relativamente à sequência de um dedo de zinco C2H2 natural) na sequência de resíduos de aminoácidos que não sejam os resíduos de coordenação de zinco. Tais alterações podem compreender substituições, deleções e/ou inserções. Podem ser alterados aminoácidos em qualquer lugar do dedo de zinco. Exemplos não limitantes de alterações incluem: (1) substituições de resíduos isolados que rodeiam o resíduo de coordenação de zinco alterado; (2) adição de resíduos extra antes ou após o resíduo de coordenação de zinco alterado, (e.g., nos casos em que o resíduo His mais C-terminal é convertido em Cys, a adição de resíduos de aminoácidos extra pode facilitar a coordenação de zinco através da compensação da cadeia lateral mais curta da cisteína; e/ou (3) substituições de resíduos situados entre os resíduos de His e Cys de um dedo de zinco CCHC natural na região correspondente de um dedo de zinco CCHC não canónico.
As proteínas com dedos de zinco aqui descritas incluem pelo menos um dedo de zinco compreendendo um dedo de zinco não canónico (não C2H2) , em que o dedo de zinco não canónico possui uma porção helicoidal envolvida na ligação a DNA e em que pelo menos um dedo de zinco compreende a sequência: Cys-(Xa) 2-4-Cys-(XB) 12-His-( Xc) 3-5-Cys-(XD) 1-10 (SEQ ID NO: 3), onde Xa, Xb, Xc e XD representam qualquer aminoácido e His-(Xc) 3-5-Cys (XD) 1-10 compreende uma das sequências mostradas em qualquer uma de SEQ ID NOs: 14-80, 83-87 e 89-92 e ainda em que a proteina com dedos de zinco é manipulada geneticamente para se ligar a uma sequência alvo. Nas realizaç°oes em que Xc compreende 3 residuos (i) em pelo menos um destes residuos está alterado comparativamente com um dedo de zinco canónico CCHC; e/ou (ii) XD compreende a sequência QLV ou QKP. Noutras realizações XD compreende um ou mars (e.g., 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10) residuos de Gly (G). A sequência de aminoácidos parcial (incluindo o extremo C-terminal relativamente ao 3o residuo de coordenação de zinco) de exemplos de dedos de zinco não canónicos está apresentada nas Tabelas 1, 2, 3 e 4 abaixo. São matéria da invenção apenas os dedos de zinco definidos nas reivindicações. Em todas as Tabelas, os dois residuos de coordenação de zinco mais C-terminais (i.e., o terceiro e o quarto) (H e C) estão sublinhados. As alterações (e.g. substituições, inserções, deleções) comparativamente com a sequência do dedo não canónico "selvagem" (linha 2 das Tabelas 1 e 3) estão apresentadas com duplo sublinhado.
Tabela 1
Tabela 2
(continuação)
Tabela 3
Tabela 4
Como referido atrás, um ZFP pode incluir qualquer número de dominios de ligação dedo de zinco, por exemplo pelo menos 3 dedos de zinco. Ainda, um, mais de um, ou a totalidade dos dedos de zinco podem ser dedos de zinco não canónicos como aqui descrito.
Em determinadas realizações, o dedo mars C- terminal de uma proteína com múltiplos dedos de zinco compreende um dedo de zinco canónico. Noutras realizações, o dedo mais C-terminal de uma proteína com múltiplos dedos de zinco compreende um dedo de zinco CCHC como descrito aqui, por exemplo um dedo CCHC compreendendo uma ou mais inserções de aminoácidos C-terminais relativamente ao resíduo Cys de coordenação de zinco mais C-terminal. Ver exemplos 1-5 que descrevem proteínas com 4 dedos de zinco em que o dedo 2 (F2) e/ou o dedo 4 (F4) são dedos de zinco não canónicos como aqui descrito.
Os domínios de ligação em dedo de zinco podem ser manipulados para se ligarem a uma sequência seleccionada. Ver, por exemplo, Beerli et al. (2002) Nature Biotechnol. 20:135-141; Pabo et al. (2001) Ann. Rev. Biochem. 70:313-340; Isalan et al. (2001) Nature Biotechnol. 19:656- 660; Segai et al. (2001) Curr. Opin. Biotechnol. 12:632-637; Choo et al. (2000) Curr. Opin. Struct. Biol. 10:411-416. Um domínio dedo de zinco manipulado pode ter uma nova especificidade de ligação, comparativamente com uma proteína com dedos de zinco naturais. Os métodos de manipulação incluem, mas não lhes estão limitados, o desenho racional e vários tipos de selecção (e.g., métodos em que uma pluralidade de diferentes sequências de dedos de zinco são testadas contra uma única sequência nucleotídica alvo). O desenho racional inclui, por exemplo, a utilização de bases de dados compreendendo sequências tripleto (ou quadrupleto) e sequências de aminoácidos de dedos de zinco individuais, em que cada sequência de nucleótidos do tripleto ou do quadrupleto está associada a uma ou mais sequências de aminoácidos de dedos de zinco. Ver, por exemplo, Patentes U.S. 6,453,242 e 6,534,261 em co-propriedade. Estão descritos métodos de adicionais de desenho, por exemplo, nas Patentes U.S. 6,746,838; 6,785,613; 6,866,997; e 7,030,215. O aumento da especificidade de ligação para os dominios dedo de zinco foram descritos, por exemplo, na Patente U.S. N° 6,794,136 em co-propriedade.
Exemplos de métodos de selecção, incluindo os sistemas de apresentação fágica e de duplo hibrido, estão descritos nas Patentes U.S. 5,789,538; 5,925,523; 6, 007, 988; 6, 013,453; 6, 410,248; 6, 140,466; 6, 200,759; e 6,242,568; assim como em WO 98/37186; WO 98/53057; WO 00/27878; WO 01/88197 e GB 2,338,237.
Uma vez que os dedos de zinco individuais se ligam a uma sequência de três nucleótidos (i.e. tripleto) (ou a uma sequência de quatro nucleótidos que pode sobrepor-se, em um nucleótido, com o local de ligação de quatro nucleótidos do dedo de zinco adjacente), o comprimento de uma sequência em que um dominio de ligação dedo de zinco foi manipulado para se ligar (e.g., a uma sequência alvo) determinará o número de dedos de zinco num dominio de ligação de dedos de zinco manipulados. Por exemplo para ZFPs em que os motivos dedo de zinco não se ligam a sublocais sobreponiveis, uma sequência alvo de seis nucleótidos liga-se a um dominio de ligação com dois dedos; uma sequência alvo de nove nucleótidos liga-se a um domínio de ligação com três dedos, etc. Os locais de ligação dedos de zinco individuais (i.e., sublocais) num local alvo não necessitam de ser contíguos, podendo ser separados por um ou vários nucleótidos, dependendo do comprimento e natureza das sequências de aminoácidos entre os dedos de zinco (i.e., os ligantes entre dedos) num dominio de ligação de múltiplos dedos. Ver, por exemplo, Patentes U.S. 6, 479, 626; 6,903,185 e 7,153,949 e U.S. Publicação de Pedido de Patente No. 2003/0119023.
Num dominio de ligação com múltiplos dedos de zinco, os dedos de zinco adjacentes podem ser separados por sequências ligantes de aminoácidos de aproximadamente 5 aminoácidos (os chamados ligantes inter-dedos "canónicos") ou, como alternativa, através de uma ou mais ligantes não canónicos. Ver, e.g., Patentes U.S. 6,453,242 e 6,534,261 em co-propriedade. Para dominios de ligação dedos de zinco manipulados compreendendo mais de três dedos, a inserção de sequências ligantes inter-dedos mais longas ("não canónicas") entre alguns dos dedos de zinco pode aumentar a afinidade e/ou a especificidade da ligação através do dominio de ligação. Ver por exemplo, Patente U.S. N° 6,479,626 Publicação de Pedido de Patente U.S. No. 2003/0119023. Assim, os dominios de ligação com múltiplos dedos de zinco podem igualmente ser caracterizados relativamente à presença e localização de ligantes inter-dedos não canónicos. O uso de ligantes inter-dedos mais longos pode igualmente facilitar a ligação de uma proteina com dedos de zinco a locais alvo compreendendo nucleótidos não contíguos. Como resultado, um ou mais sublocais num local alvo para um domínio dedo de zinco, podem ser separados uns dos outros por 1, 2, 3, 4, 5 ou mais nucleótidos. Dando apenas um exemplo, um domínio de ligação com quatro dedos pode ligar-se a um local alvo de 13 nucleótidos compreendendo, sequenciadamente, dois sublocais de 3 nucleótidos contíguos, um nucleótido de intervalo e dois sublocais tripletos contíguos.
Um sublocal alvo é uma sequência de nucleótidos (geralmente 3 ou 4 nucleótidos) que é ligada por um único dedo de zinco. No entanto, não é necessário que um local alvo seja um múltiplo de três nucleótidos. Por exemplo, nos casos em que ocorrem interacções entre cadeias (ver, e.g., Patentes U.S. 6,453,242 e 6,794,136), um ou mais dos dedos de zinco individuais de um domínio de ligação com múltiplos dedos de zinco podem ligar-se a sublocais quadrupletos sobreponiveis. Ver também Patentes U.S. 6,746,838 e 6,866,997. Para mencionar apenas um exemplo, um domínio de três dedos pode ligar-se a um local alvo de 10 nucleótidos compreendendo três sublocais de 4 nucleótidos sobreponiveis . A selecção de uma sequência na cromatina celular para a ligação por um domínio em dedo de zinco (e.g., um local alvo) pode ser conseguida, por exemplo, de acordo com os métodos descritos nas Patente U.S. N°. 6,453,242 co-propriedade (17 de Set., 2002), que também divulga métodos para o desenho de ZFPs para se ligarem a uma sequência seleccionada. Será claro para os familiarizados com a área que a simples inspecção visual de uma sequência nucleotí-dica pode também ser usado para a selecção de um local alvo. Assim, quaisquer meios para a selecção de um local alvo podem ser usados nos métodos aqui descritos.
As proteínas com múltiplos dedos de zinco podem ser construídas através da ligação dos dedos de zinco individuais obtidos, por exemplo, através de desenho ou de selecção. Como alternativa, os módulos de ligação consistindo em dois dedos de zinco podem ser ligados uns aos outros, usando ligantes canónicos ou ligantes entre dedos mais longos não canónicos (ver atrás) para gerar proteínas com quatro a seis dedos. Tais módulos de dois dedos podem ser obtidos, por exemplo, através da selecção de dois dedos adjacentes, os quais se ligam a uma sequência alvo particular de seis nucleótidos, no contexto de uma proteína com múltiplos dedos (geralmente três dedos). Ver por exemplo, WO 98/53057 e a Publicação do Pedido de Patente U.S. No. 2003/0119023. Como alternativa podem ser construídos módulos de dois dedos através da montagem de dedos de zinco individuais.
Assim, os domínios dedo de zinco individuais aqui descritos podem ser usados individualmente, ou em várias combinações, para construir proteínas com múltiplos dedos de zinco que se podem ligar a qualquer local alvo. A distância entre sequências (e.g., locais alvo) refere-se ao número de nucleótidos ou pares de nucleótidos no intervalo entre duas sequências, medido a partir dos extremos das sequências mais perto uns dos outros.
Nas realizações que usam ZFNs, por exemplo em que a clivagem depende da ligação de moléculas de fusão de dois dominios dedo de zinco/meio dominio de clivagem para separar locais alvo, os dois locais alvo podem ser cadeias de DNA opostas. Noutras realizações, ambos os locais alvo estão na mesma cadeia. Ver por exemplo, WO 2005/084190.
Polinucleótidos codificadores de dedos de zinco ou de proteínas com dedos de zinco estão igualmente no âmbito do presente invento. Estes polinucleótidos podem ser construídos usando técnicas convencionais e inseridos num vector e o vector pode ser introduzido numa célula (ver abaixo para mais vectores relativos à divulgação e métodos para a introdução de polinucleótidos em células) de modo que a proteina codificada seja expressa na célula.
Proteínas de fusão São igualmente proporcionadas proteínas de fusão compreendendo um ou mais componentes em dedo de zinco não canónicos aqui descritos.
As moléculas de fusão são construídas através de métodos de clonagem e conjugação bioquímica bem conhecidos na técnica. As moléculas de fusão compreendem um ZFP contendo CCHC e, por exemplo, um domínio de clivagem, um domínio de activação da transcrição, um domínio de repressão da transcrição, um componente de um complexo de remodelação da cromatina, um domínio isolador, um fragmento funcional de qualquer um destes domínios; e/ou quaisquer combinações de dois ou mais domínios ou fragmentos funcionais dos mesmos.
Em determinadas realizações, as moléculas de fusão compreendem uma proteina vegetal modificada com dedos de zinco e pelo menos dois dominios funcionais (e.g., um dominio isolador ou um dominio proteico de ligação a metilo e, ainda, um dominio de activação ou repressão da transcrição).
As moléculas de fusão também compreendem, facultativamente, um sinal de localização nuclear (como seja, por exemplo, FLAG ou hemaglutinina) . As proteínas de fusão (e ácidos nucleicos que as codificam) são projectadas de forma que a grelha de leitura traduzida seja preservada entre os componentes da fusão. Métodos para o desenho e construção de proteínas de fusão (e polinucleótidos codificadores das mesmas) são conhecidos dos familiarizados com a técnica. Por exemplo, métodos para o desenho e construção da proteina de fusão compreendendo proteínas com dedos de zinco (e polinucleótidos codificadores das mesmas) estão descritos nas Patentes U.S. 6,453,242 e 6,534,261 em co-propriedade.
Os polinucleótidos codificadores de tais proteínas de fusão estão igualmente dentro do âmbito da presente divulgação. Estes polinucleótidos podem ser construídos usando técnicas convencionais e inseridos num vector e o vector pode ser introduzido numa célula (ver abaixo para divulgação adicional relativa a vectores e métodos para introdução de polinucleótidos em células) .
Um exemplo de domínio funcional para fusão com um domínio ZFP de ligação a DNA, a ser usado na repressão da expressão de genes, é um domínio de repressão KRAB da proteína humana KOX-1 (ver, e.g., Thiesen et al., New Biologist 2, 363-374 (1990); Margolin et ai., Proc. Natl. Acad. Sei. USA 91, 4509-4513 (1994); Pengue et al., Nucl. Acids Res. 22:2908-2914 (1994); Witzgall et al., Proc. Natl. Acad. Sei. USA 91, 4514- 4518 (1994). O domínio KOX é também adequado para usar como domínio de repressão. Um outro domínio de repressão adequado é o domínio de ligação a metilo da proteína 2B (MBD-2B) (ver, igualmente, Hendrich et al. (1999) Mamm Genome 10:906-912 para descrição de proteínas MBD) . Um outro domínio de repressão útil é o associado com a proteína v-ErbA. Ver, por exemplo, Damm, et al. (1989) Nature 339:593-597; Evans (1989) Int. J. Cancer Suppl. 4:26-28; Pain et al. (1990) New Biol. 2:284-294; Sap et al. (1989) Nature 340:242-244; Zenke et al. (1988) Cell 52:107-119; e Zenke et al. (1990) Cell 61:1035-1049. Outros exemplos de domínios de repressão incluem, mas não lhes estão limitados, receptor de hormonas da tiróide (TR), SID, MBD1, MBD2, MBD3, MBD4, proteínas tipo MBD, membros da família DNMT (e.g., DNMT1, DNMT3A, DNMT3B), Rb, MeCPl e MeCP2. Ver, por exemplo, Zhang et al. (2000) Ann Rev Physiol 62:439-466; Bird et al. (1999) Cell 99:451-454; Tyler et al. (1999) Cell 99:443-446; Knoepfler et al. (1999) Cell 99:447-450; e Robertson et al. (2000) Nature Genet. 25:338-342. Outros domínios de repressão exemplificativos incluem, mas não lhes estão limitados, ROM2 e AtHD2A. Ver, por exemplo, Chern et al. (1996) Plant Cell 8:305-321; e Wu et al. (2000) Plant J. 22:19-27.
Domínios adequados para se conseguir activação incluem o domínio de activação da VP16 de HSV (ver, e.g., Hagmann et al., J. Virol. 71, 5952-5962 (1997)) receptores nucleares de hormonas (ver, e.g., Torchia et al., Curr.
Opin. Cell. Biol. 10:373-383 (1998)); a subunidade p65 do factor nuclear kapa B (Bitko & Bank, J. Virol. 72:5610-5618 (1998) e Doyle & Hunt, Neuroreport 8:2937-2942 (1997)); Liu et al., Cancer Gene Ther. 5:3- 28 (1998)), ou domínios funcionais quiméricos artificiais tais como VP64 (Seifpal et al., EMBO J. 11, 4961-4968 (1992)).
Outros exemplos de domínios de activação incluem, mas não lhes estão limitados, p300, CBP, PCAF, SRC1 PvALF, e ERF-2. Ver, por exemplo, Robyr et al. (2000) J Mol.
Endocrinol. 14:329-347; Collingwood et al. (1999) J. Mol. Endocrinol. 23:255- 275; Leo et al. (2000) Gene 245:1-11;
Manteuffel-Cymborowska (1999) Acta Biochim. Pol. 46:77-89;
McKenna et al. (1999) J. Steroid Biochem. Mol. Biol. 69:3- 12; Malik et al. (2000) Trends Biochem. ScL 25:277-283; e Lemon et al. (1999) Curr. Opin. Genet. Dev. 9:499-504. Outros exemplos de domínios de activação incluem, mas não lhes estão limitados, OsGAI, HALF-I, Cl, API, ARF-5, -6, -7, e -8, CPRF1, CPRF4, MYC-RP/GP, e TRAB1. Ver, por exemplo, Ogawa et al. (2000) Gene 245:21-29; Okanami et al. (1996) Genes Cells 1:87-99; Goff et al (1991) Genes Dev. 5:298-309; Cho et al. (1999) Plant Mol. Biol. 40:419-429; Ulmason et ai. (1999) Proc. Natl. Acad. Sei. USA 96:5844-5849; Sprenger-Haussels et al. (2000) Plant J. 22:1-8; Gong et al. (1999) Plant Mol. Biol. 41:33-44; e Hobo et al. (1999) Proc. Natl. Acad. Sei. USA 96:15,348-15,353.
Outros domínios funcionais são descritos, por exemplo, na Patente U.S. No. 6,933,113 em copropriedade. Ainda, domínios isoladores, proteínas de remodelação da cromatina tais como domínios contendo ISWI e proteínas com domínios de ligação a metilo, adequadas para usar nas moléculas de fusão, estão descritos, por exemplo, nas Publicações Internacionais WO 01/83793 e WO 02/26960 em copropriedade .
Noutras realizações, a proteína de fusão é uma nuclease com dedos de zinco (ZFN) compreendendo um ou mais dedos de zinco CCHC como aqui descrito e um domínio de clivagem (ou semi-domínio de clivagem) . Os dedos de zinco podem ser manipulados de forma a reconhecerem uma sequência alvo em qualquer região genómica seleccionada e, quando introduzidos numa célula, resultarão na ligação das proteínas de fusão aos seus locais de ligação e clivagem dentro ou perto da referida região genómica. Tal clivagem pode resultar na alteração da sequência nucleotídica da região genómica (e.g. mutação) após ligação não homóloga de extremos. Como alternativa, se estiverem também presentes na célula sequências contendo polinucleótidos exógenos homólogas da região genómica, ocorre recombinação homóloga com uma taxa elevada entre a região genómica e o poli-nucleótido exógeno, após clivagem dirigida por ZFNs. A recombinação homóloga pode resultar na substituição dirigida da sequência ou na integração dirigida de sequências exógenas, dependendo da sequência nucleotídica do polinucleótido exógeno.
Os dedos de zinco não canónicos aqui descritos proporcionam melhor função de clivagem quando incorporados em ZFNs. Como descrito nos Exemplos, ZFNs com 4 dedos contendo pelo menos um dedo CCHC como aqui descrito cortam pelo menos tão bem quanto as nucleases contendo exclusivamente dedos CCHH. Nalgumas realizações, quando o dedo C-terminal compreende um dedo de zinco CCHC não canónico, os resíduos entre os terceiro e quarto resíduos de coordenação (i.e., entre os resíduos C-terminais His e Cys) são diferentes dos presentes num dedo de zinco canónico CCHH e um ou mais resíduos de glicina (e.g., 1, 2, 3, 4, 5 ou mais) são inseridos antes do resíduo Cys C- terminal. A porção do domínio de clivagem dos ZFNs aqui descritos pode ser obtida a partir de qualquer endonuclease ou exonuclease. Exemplos de endonucleases de onde pode derivar um domínio de clivagem incluem, mas não lhes estão limitados, endonucleases de restrição e endonucleases de manutenção. Ver, por exemplo, 2002-2003 Catalogue, New England Biolabs, Beverly, MA; e Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388. Conhecem-se outras enzimas que cortam o DNA (e.g., nuclease Si, nuclease de feijão; DNAse I pancreática; nuclease microcóccica; endonuclease HO de levedura; ver também Linn et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press, 1993). Uma ou mais destas enzimas (ou seu fragmentos funcionais) podem ser usadas como fonte de domínios de clivagem e de semi-dominios de clivagem.
De forma semelhante, um semi-dominio de clivagem pode derivar de qualquer nuclease ou porção da mesma, como atrás descrito, desde que o semi-dominio de clivagem necessite de dimerização para actividade de clivagem. Em geral, são necessárias duas proteínas de fusão para a clivagem dirigida de DNA genómico se as proteínas de fusão compreenderem semi-dominios de clivagem. Como alternativa, pode ser usada uma única proteína compreendendo dois domínios de semi-clivagem. Os dois dominios de semi-clivagem podem derivar da mesma endonuclease ou cada semi-dominio de clivagem pode derivar de uma endonuclease diferente. Ainda, os locais alvo para as duas proteínas de fusão são dispostos, uns relativamente aos outros, de forma que a ligação das duas proteínas de fusão aos respectivos locais alvo coloque os semi-domínios de clivagem numa orientação espacial, um relativamente ao outro, que permita aos semi-dominios de clivagem formarem um domínio de clivagem funcional, e.g., através de dimerização. Assim, em determinadas realizações, os extremos mais próximos dos locais alvo são separados por 5-8 pares de nucleótidos ou por 15-18 pares de nucleótidos. No entanto, qualquer número inteiro de nucleótidos ou pares de nucleótidos pode estar entre dois locais alvo (e.g., de 2 a 50 nucleótidos ou mais). Em geral, o ponto de clivagem situa-se entre os locais alvo.
As endonucleases de restrição (enzimas de restrição) estão presentes em muitas espécies e são capazes de ligação a DNA específica de sequência (num local de reconhecimento) e clivagem de DNA no local de ligação ou perto dele. Algumas enzimas de restrição (e.g., tipo IIS) cortam o DNA em locais que não os do local de reconhecimento e possuem domínios de ligação e de corte separáveis. Por exemplo, a enzima Tipo IIS Fokl catalisa a clivagem da cadeia dupla do DNA, distando 9 nucleótidos do seu local de reconhecimento numa cadeia e 13 nucleótidos do seu local de reconhecimento na outra. Ver por exemplo, as Patentes U.S. 5,356,802; 5,436,150 e 5,487,994; assim como Li et ai. (1992) Proc. Natl. Acad. Sei. USA 8 9:4275-427 9; Li et al. (1993) Proc. Natl. Acad. Sei. USA 90:2764-2768; Kim et al. (1994a) Proc. Natl. Acad. Sei. USA 91:883-887; Kim et al. (1994b) J. Biol. Chem. 269:31,978-31,982. Assim, numa realização, as proteínas de fusão compreendem o domínio de clivagem (ou semi-domínio de clivagem) de pelo menos uma enzima de restrição tipo IIS e um ou mais domínios de ligação em dedo de zinco, os quais podem ou não ser manipulados.
Um exemplo de uma enzima de restrição tipo IIS, cujo domínio de clivagem é separável do domínio de ligação, é Fokl. Esta enzima particular é activa como um dímero. Bitinaite et al. (1998) Proc. Natl. Acad. Sei. USA 95: 10570-10575. Assim, para fins do presente invento, a porção da enzima Fokl usada nas proteínas de fusão descritas é considerada um semi-domínio de clivagem. Assim, para a clivagem dirigida de cadeia dupla e/ou substituição dirigida de sequências celulares usando ZFNs compreendendo fusões dedo de zinco-Fokl, duas proteínas de fusão, cada uma delas compreendendo um semi-domínio de clivagem Fokl, podem ser usadas para reconstituir um domínio de clivagem cataliticamente activo. Como alternativa, uma molécula polipeptídica isolada contendo um domínio de ligação em dedo de zinco e dois semi-domínios de clivagem Fokl pode ser igualmente usada. Os parâmetros para a clivagem dirigida e alteração da sequência alvo usando fusões dedo de zinco-Fokl são proporcionados algures nesta divulgação e, por exemplo, na Publicação do Pedido de Patente US N° 2005/0064474.
Noutras realizações, um semi-domínio de clivagem Fokl pode incluir uma ou mais mutações em qualquer resíduo de aminoácido que afecte a dimerização. Tais mutações podem ser úteis para evitar que um par de fusões ZFP/Fokl sofra homodimerização que possa conduzir à clivagem de sequências indesejáveis. Por exemplo, os residuos de aminoácidos nas posições 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537 e 538 de Fokl estão todos muito perto da interface de dimerização para a influenciar. Assim, as alterações da sequência de aminoácidos numa ou mais das posições atrás referidas podem ser usadas para alterar as propriedades de dimerização do semi-domínio de clivagem. Tais alterações podem ser introduzidas, por exemplo, através da construção de uma biblioteca contendo (ou codificando) residuos de aminoácidos diferentes nestas posições e selecção de variantes com as propriedades pretendidas ou através do desenho racional de mutantes individuais. Para além da prevenção da homodimerização, é igualmente possivel que algumas destas mutações possam aumentar a eficiência de clivagem, comparativamente com a obtida com dois semi-dominios de clivagem selvagens.
Assim, para a clivagem dirigida usando um par de fusões ZFP/Fokl, uma ou ambas as proteínas de fusão podem compreender uma ou mais alterações de aminoácidos que inibam a auto-dimerização, mas permitam que ocorra a heterodimerização das duas proteínas de fusão de forma a ocorrer a clivagem no local alvo pretendido. Em determinadas realizações, as alterações estão presentes em ambas as proteínas de fusão e as alterações possuem efeitos aditivos; i.e. a homodimerização de qualquer uma das fusões, conduzindo a clivagem aberrante, é minimizada ou abolida, enquanto a heterodimerização das duas proteínas de fusão é facilitada comparativamente com a obtida com semi-dominios de clivagem tipo selvagem.
Nalgumas realizações, o dominio de clivagem compreende dois semi-dominios de clivagem, ambos sendo parte de um único polipéptido compreendendo um dominio de ligação, um primeiro semi-dominio de clivagem e um segundo semi-domínio de clivagem. Os semi-dominios de clivagem podem ter a mesma sequência de aminoácidos ou sequências de aminoácidos diferentes, desde que funcionem para cortar o DNA.
Os semi-dominios de clivagem podem ser proporcionados em moléculas separadas. Por exemplo, dois polipéptidos de fusão podem ser expressos numa célula, em que cada um dos polipéptidos compreende um dominio de ligação e um semi-dominio de clivagem. Os semi-dominios de clivagem podem ter a mesma sequência de aminoácidos ou sequências de aminoácidos diferentes, desde que funcionem para cortar o DNA. Ainda, os dominios de ligação ligam-se a sequências alvo que estão tipicamente dispostas de forma que, quando da ligação dos polipéptidos de fusão, os dois semi-dominios de clivagem sejam apresentados numa orientação espacial, um relativamente ao outro, de modo a permitir a reconstituição de um dominio de clivagem (e.g., através da dimerização dos semi-dominios) , posicionando assim os semi-dominios uns em relação aos outros para formar um dominio de clivagem funcional, resultando na clivagem da cromatina celular numa região de interesse. De um modo geral, a clivagem pelo domínio de clivagem reconstituído ocorre num local situado entre as duas sequências alvo. Uma ou ambas as proteínas podem ser manipuladas para se ligarem ao seu local alvo. A expressão de duas proteínas de fusão numa célula pode resultar da entrega das duas proteínas na célula; a entrega de uma proteína e de um ácido nucleico codificador de uma das proteínas na célula; entrega de dois ácidos nucleicos, cada um dele codificador de uma das proteínas, na célula; ou através da entrega de um único ácido nucleico, codificador de ambas as proteínas, à célula. Noutras realizações, uma proteína de fusão compreende uma única cadeia polipeptídica compreendendo dois semi-domínios de clivagem e um domínio dedo de zinco. Neste caso, uma única proteína de fusão é expressa numa célula e, sem pretender estar limitados por uma teoria, pensa-se que corte DNA como resultado da formação de um dímero intramolecular dos semi-domínios de clivagem.
Em determinadas realizações, os componentes de um ZFN estão arranjados de forma que o domínio dedo de zinco esteja mais perto do extremo amina da proteína de fusão e o semi-domínio de clivagem esteja mais próximo do extremo carboxilo. Isto espelha a orientação relativa do domínio de clivagem em domínios de clivagem com dimerização natural, tais como os derivados da enzima Fokl em que um domínio de ligação a DNA está mais perto do extremo amino e o semi- domínio de clivagem está mais perto do extremo carboxilo. Nestas realizações, a dimerização dos semi-domínios de clivagem para formar uma nuclease funcional é conseguida através da ligação das proteínas de fusão a locais em cadeias de DNA opostas, com os extremos 5' dos locais de ligação proximais um relativamente ao outro.
Nesta orientação, o dedo de zinco mais C-terminal é proximal relativamente ao semi-domínio de clivagem Fokl. Foi previamente determinado que as proteínas com dedos de zinco não canónicos ligam-se aos seus alvos de DNA mais eficientemente quando um dedo de zinco tipo CCHC está presente como o dedo de zinco mais C-terminal. É portanto possível que a presença de dedos de zinco tipo CCHC previamente descritos na proximidade do semi-domínio de clivagem Fokl iniba a sua função. Se for este o caso, os dedos de zinco CCHC optimizados, presentemente descritos, aparentemente não apresentam esta actividade inibidora postulada.
Noutras realizações, os componentes das proteínas de fusão (e.g., fusões ZFP-Fokl) são arranjados de forma que o semi-domínio de clivagem esteja mais perto do extremo amino da proteína de fusão e o domínio dedo de zinco esteja mais perto do extremo carboxilo. Nestas realizações, a dimerização dos semi-domínios de clivagem para formar uma nuclease funcional é conseguida através da ligação das proteínas de fusão aos locais em cadeias de DNA opostas, com os extremos 3' dos locais de ligação sendo proximais um relativamente ao outro.
Ainda noutras realizações adicionais, uma primeira proteina de fusão possui o semi-dominio de clivagem mais perto do extremo amina da proteina de fusão e o dominio dedo de zinco mais próximo do estremo carboxilo e uma segunda proteina de fusão está arranjada de forma que o dominio em dedo de zinco se situa mais próximo do extremo amino da proteina de fusão e o semi-dominio de clivagem está mais próximo do extremo carboxilo. Nestas realizações, ambas as proteínas de fusão ligam-se à mesma cadeia de DNA, com o local de ligação da primeira proteina de fusão contendo o dominio dedo de zinco mais perto do extremo carboxilo situado no lado 5' do local de ligação da segunda proteina de fusão contendo o dominio dedo de zinco mais perto do extremo amina. Ver igualmente 2005/084190; a divulgação da qual é incluida por referência. A sequência de aminoácidos entre o dominio dedo de zinco e o dominio de clivagem (ou semi-dominio de clivagem) é designado como "ligante ZC". O ligante ZC deve ser distinguido dos ligantes inter-dedos atrás discutidos. Ver, e.g., Publicações de Patente U.S. 20050064474A1 e 20030232410, e Publicação de Patente Internacional WO 2005/084190, para detalhes na obtenção de ligantes ZC que optimizem a clivagem.
Vectores de expressão
Um ácido nucleico codificador de um ou mais ZFPs ou proteínas de fusão com ZFPs (e.g., ZFNs) pode ser clonado num vector para transformação de células procarióticas ou eucarióticas para replicação e/ou expressão. Os vectores podem ser vectores procarióticos ou eucarióticos, incluindo mas não estando limitados a plasmídeos, vectores vai-vem, vectores de insectos, vectores binários (ver, e.g., Patente U.S. N° 4,940,838; Horsch et al. (1984) Science 233:496-498 e Fraley et al. (1983) Proc. Nat'1. Acad. Sei. USA 80:4803) e similares. Um ácido nucleico codificador de um ZFP pode também ser clonado num vector de expressão, para administração a uma célula vegetal.
Para expressar as proteínas de fusão, sequências codificadoras de ZFPs ou das fusões com ZFPs são tipicamente subclonadas num vector de expressão que possui um promotor para dirigir a transcrição. Promotores bacterianos e eucarióticos adequados são conhecidos na técnica e descritos, e.g., em Sambrook et al., Molecular Cloning, A Laboratory Manual (2nd ed. 1989; 3rd ed., 2001); Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990); e Current Protocols in Molecular Biology (Ausubel et al, supra. Sistemas de expressão bacterianos para expressão de ZFP estão disponíveis para, e.g. E. coli, Bacillus sp., e Salmonella (Paiva et al, Gene 22:229-235 (1983)). Existem kits comerciais de tais sistemas de expressão. Os sistemas de expressão eucarióticos para células de mamífero, leveduras e células de insecto são conhecidos na técnica e podem ser comprados. 0 promotor usado para dirigir a expressão de um ácido nucleico codificador de ZFP depende da aplicação particular. Por exemplo, um promotor constitutivo forte adequado para a célula hospedeira é tipicamente usado para expressão e purificação de ZFPs.
Pelo contrário, quando um ZFP é administrado in vivo para regulação de genes vegetais (ver, "Introdução de ácido nucleico em células vegetais" secção abaixo) é usado um promotor constitutivo ou um promotor induzivel, dependendo do uso particular do ZFP. Exemplos não limitantes de promotores vegetais incluem sequências promotoras derivadas de ubiquitina-3 de A. thaliana (ubi-3) (Callis, et ai., 1990, J. Biol. Chem. 265-12486-12493); manopina-sintetase de A. tumefaciens (Amas) (Petolino et ai., U.S. Patent No. 6,730,824); e/ou virus mosaico das nervuras da mandioca (CsVMV) (Verdaguer et ai., 1996, Plant Molecular Biology 31:1129- 1139). Ver, também, Exemplos.
Para além do promotor, o vector de expressão tipicamente possui uma unidade de transcrição ou cassete de expressão que contém todos os elementos adicionais necessários para a expressão do ácido nucleico nas células hospedeiras, procarióticas ou eucarióticas. Assim, uma cassete de expressão tipica contém um promotor ligado operacionalmente, e.g., a uma sequência de ácido nucleico codificadora de ZFP e sinais necessários, e.g., para poliadenilação eficiente do transcrito, terminação da transcrição, locais de ligação aos ribossomas ou terminação da tradução. Outros elementos da cassete podem incluir, e.g., estimuladores e sinais de "splicing" heterólogos. 0 vector de expressão particular usado para transportar a informação genética para a célula é seleccionado relativamente ao uso pretendido para ZFP, e.g., expressão em plantas, animais, bactérias, fungos, protozoários, etc. (ver vectores de expressão descritos abaixo). Na área são conhecidos vectores de expressão bacterianos e animais convencionais e estão descritos detalhadamente, por exemplo, na Publicação de Patente U.S. 20050064474A1 e nas Publicações de Patente Internacionais W005/084190, W005/014791 e W003/080809. Métodos convencionais de transfecção podem ser usados para produzir linhas celulares de bactérias, mamifero, levedura ou insecto que expressem grandes quantidade de proteína, a qual pode ser então purificada usando técnicas convencionais (ver, e.g., Colley et al, J. Biol. Chem. 264:17619-17622 (1989); Guide to Protein Purification, in Methods in Enzymology, vol. 182 (Deutscher, ed., 1990)). A transformação de células eucarióticas e procarióticas é realizada de acordo com técnicas convencionais (ver, e.g., Morrison, J. Bact. 132:349-351 (1977); Clark-Curtiss & Curtiss, Methods in Enzymology 101:347-362 (Wu et al., eds., 1983).
Pode ser usado qualquer um dos processos bem conhecidos para introdução de sequências nucleotidicas estranhas em tais células hospedeiras. Estas incluem o uso de transfecção com fosfato de cálcio, polibreno, fusão de protoplastos, electroporação, métodos com ultra-sons), lipossomas, microinjecção, DNA nu, vectores plasmidicos, vectores virais, epissómicos e integrativos, e qualquer um dos outros métodos conhecidos para introdução de DNA genómico, cDNA, DNA sintético ou outro material estranho numa célula hospedeira (ver, e.g., Sambrook et al., supra). É apenas necessário que o procedimento genético particular usado seja capaz de introduzir com êxito pelo menos um gene na célula hospedeira capaz de expressar a proteina pretendida.
Introdução de ácido nucleico em células vegetais
Como referido atrás, as construções de DNA podem ser introduzidas nom hospedeiro vegetal pretendido (e.g. no genoma) através de uma variedade de técnicas convencionais. Para revisões de tais técnicas ver, por exemplo, Weissbach & Weissbach Methods for Plant Molecular Biology (1988, Academic Press, N. Y.) Section VIII, pp. 421-463; e Grierson & Corey, Plant Molecular Biology (1988, 2d Ed.), Blackie, London, Ch. 7-9.
Por exemplo, a construção de DNA pode ser introduzida numa célula vegetal usando técnicas tais como electroporação e microinjecção de protoplastos de células vegetais ou as construções de DNA podem ser introduzidas directamente no tecido vegetal usando métodos biolísticos, tais como bombardeamento com partículas de DNA (ver, e.g., Klein et al (1987) Nature 327:70-73). Como alternativa, as construções de DNA podem ser combinadas com regiões flanqueantes de T-DNA adequadas e introduzidas num vector hospedeiro convencional de Agrobacterium tumefaciens. Técnicas de transformação mediada por Agrobacterium tumefaciens, incluindo a remoção de braços e uso de vectores binários, estão bem descritas na literatura cientifica. Ver, por exemplo, Horsch et al (1984) Science 233:496-498, e Fraley et al (1983) Proc. Natl Acad. ScL USA 80:4803.
Ainda, a transferência de genes pode ser conseguida usando bactérias não Agrobacterium ou virus tais como Rhizobium sp. NGR234, Sinorhizoboium meliloti, Mesorhizobium loti, virus X da batateira, virus do mosaico da couve-flor e virus do mosaico das nervuras de mandioca e/ou virus do mosaico do tabaco. Ver, e.g., Chung et al. (2006) Trends Plant Sci. 11(1):1-4.
As funções de virulência do hospedeiro Agrobac-terlum tumefaciens dirigirão a inserção da construção e a marca adjacente no DNA da célula vegetal quando a célula é infectada pelas bactérias usando o vector de T DNA binário (Bevan (1984) Nuc. Acid Res. 12:8711-8721) ou o procedimento de co-cultura (Horsch et al (1985) Science 227:122 9-1231) . De um modo geral, o sistema de transformação de Agrobacterium é usado para a manipulação de plantas dicotiledóneas (Bevan et al (1992) Ann. Rev. Genet 16:357-384; Rogers et al (1986) Methods Enzymol. 118:627-641) . 0 sistema de transformação de Agrobacterium pode ser igualmente usado para transformar, assim como para transferir, DNA para plantas monocotiledóneas e células vegetais. Ver Patente U.S. No. 5, 591,616; Hernalsteen et al (1984) EMBO J 3:3039-3041; Hooykass-Van Slogteren et al (1984) Nature 311 :763-764,- Grimsley et al (1987) Nature 325:1677-179; Boulton et al (1989) Plant Mol. Biol. 12:31-40; e Gould et al (1991) Plant Physiol. 95:426-434. Métodos alternativos de transferência de genes e transformação incluem, mas não lhes estão limitados, transformação de protoplastos através da captura de DNA nu mediada por cálcio, polietilenoglicol (PEG) ou electro-poração (ver Paszkowski et al. (1984) EMBOJ 3:2717-2722, Potrykus et al. (1985) Molec. Gen. Genet. 199:169-177; Fromm et al. (1985) Proc. Nat. Acad. Sd. USA 82:5824-5828; e Shimamoto (1989) Nature 338:274-276) e electroporação de tecidos vegetais (D'Halluin et al. (1992) Plant Cell 4:1495-1505). Outros métodos para a transformação de células vegetais incluem microinjecção, internalização de DNA mediada por carbeto de silício (Kaeppler et al. (1990) Plant Cell Reporter 9:415-418), e bombardeamento de microprojécteis (see Klein et al. (1988) Proc. Nat. Acad. Sei USA 85:4305-4309; e Gordon-Kamm et al. (1990) Plant Cell 2:603-618).
Os métodos e composições descritos podem ser usados para inserir sequências exógenas numa localização pré-determinada num genoma de célula vegetal. Isto é útil na medida em que a expressão de um transgene introduzido num genoma vegetal dependa criticamente do seu local de integração. Assim, genes codificadores, e.g., de nutrientes, antibióticos ou moléculas terapêuticas podem ser inseridos, através de recombinação dirigida, em regiões de um genoma vegetal favorável à sua expressão.
As células vegetais transformadas que são produzidas por qualquer uma das técnicas de transformação atrás referidas podem ser cultivadas para regenerar uma planta completa que possui o genótipo transformado e assim o fenótipo pretendido. Tais técnicas de regeneração baseiam-se na manipulação de determinadas fito-hormonas num meio de cultura de tecidos, tipicamente baseadas num marcador biocida e/ou herbicida que foi introduzido juntamente com as sequências nucleotidicas pretendidas. A regeneração de plantas a partir de protoplastos cultivados está descrita em Evans, et ai., "Protoplasts Isolation and Culture" in Handbook of Plant Cell Culture, pp. 124-176, Macmillian Publishing Company, New York, 1983; e Binding, Regeneration of Plants, Plant Protoplasts, pp. 21-73, CRC Press, Boca Raton, 1985. A regeneração pode ser igualmente obtida a partir de calos vegetais, explantes, órgãos, pólens, embriões ou partes dos mesmos. Tais técnicas de regeneração estão descritas, genericamente, em Klee et al (1987) Ann. Rev. of Plant Phys. 38:467-486.
Os ácidos nucleicos introduzidos numa célula vegetal podem ser usados para conferir caracteristicas pretendidas em essencialmente qualquer planta. Uma larga variedade de plantas e sistemas de células vegetais pode ser manipulada relativamente às caracteristicas fisiológicas e agronómicas pretendidas aqui descritas usando construções de ácido nucleico da presente divulgação e os vários métodos de transformação atrás mencionados. Em determinadas realizações, as plantas e células vegetais alvo para manipulação incluem, mas não lhes estão limitadas, as plantas monocotiledóneas e dicotiledóneas, tais como culturas agrícolas incluindo culturas de cereais (e.g., trigo, milho, arroz, milho miúdo, cevada), fruticultura (e.g., tomate, maçã, pêra, morango, laranja), culturas forrageiras (e.g., alfafa), culturas de tubérculos (e.g., cenoura, batata, beterraba sacarina, inhame), culturas de vegetais verdes (e.g. alface, espinafre); plantas de floricultura (e.g., petúnias, rosas, crisântemos), coníferas e pinheiros (e.g., abeto, picea); plantas usadas em fito-remediação (e.g. plantas que acumulam metais pesados); culturas de oleaginosas (e.g. girassol, colza) e plantas usadas para fins experimentais (e.g., Arabidopsis) . Assim, os métodos e composições descritos possuem utilidade numa larga gama de plantas, incluindo, mas não lhes estando limitados, espécies dos géneros Asparagus, Avena, Brassica, Citrus, Citrullus, Capsicum, Cucurbita, Daucus, Glycine, Gossypium, Hordeum, Lactuca, Lycopersicon, Malus, Manihot, Nicotiana, Oryza, Persea, Pisum, Pyrus, Prunus, Raphanus, Secale, Solanum, Sorghum, Triticum, Vitis, Vigna e Zea.
Os familiarizados com a técnica reconhecerão que após a cassete de expressão ser estavelmente incorporada em plantas transgénicas e confirmada como operacional, pode ser introduzida noutras plantas através de cruzamento sexual. Pode ser usada qualquer uma de uma série de técnicas convencionais de cruzamento, dependendo da espécie a ser cruzada.
Uma célula vegetal, calo, tecido ou planta transformada pode ser identificada e isolada através da selecção ou rastreio do material vegetal relativamente a caracteristicas codificadas pelos genes marcadores presentes no DNA transformante. Por exemplo, a selecção pode ser realizada através do crescimento do material vegetal manipulado em meio contendo uma quantidade inibi-dora do antibiótico ou herbicida ao qual a construção do gene transformante confere resistência. Ainda, as plantas e células vegetais transformadas podem ser igualmente identificadas através do rastreio das actividades de quaisquer genes de marcas visiveis (e.g., os genes da β-glucuronidase, luciferase, B ou Cl) que podem estar presentes nas construções de ácido nucleico recombinante. Tais metodologias de selecção e rastreio são conhecidas dos familiarizados com a área. Métodos fisicos e bioquímicos podem ser igualmente usados para identificar transformantes de plantas e de células vegetais contendo construções com genes inseridos. Estes métodos incluem, mas não lhes estão limitados: 1) análise Southern ou amplificação por PCR para detecção e determinação da estrutura do inserto de DNA recombinante; 2) análise Northern, protecção da RNase Sl, extensão de sequências iniciadoras ou amplificação por transcrição reversa-PCR para detecção e avaliação de transcritos de RNA das construções genéticas; 3) ensaios enzimáticos de detecção de actividade enzimática ou de ribozima, pelo que tais produtos de genes são codificados pela construção de genes; 4) electroforese em gel de proteínas, técnica de transferência Western, imunopreci-pitação ou imunoensaios ligados a enzimas, em que os produtos das construções genéticas são proteínas. Outras técnicas tais como hibridação in situ, coloração enzimática e imunocoloração, podem ser igualmente usadas para detectar a presença ou expressão da construção recombinante em órgãos e tecidos específicos de plantas. Os métodos para executar todos estes ensaios são conhecidos na técnica.
Os efeitos da manipulação genética usando os métodos aqui descritos podem ser observados através, por exemplo, de transferências Northern do RNA (e.g., mRNA) isolado a partir de tecidos de interesse. Tipicamente, se a quantidade de mRNA tiver aumentado, pode ser assumido que o gene endógeno correspondente está a ser expresso numa taxa superior ao que anteriormente acontecia. Podem ser usados outros métodos de medição da actividade de genes e/ou CYP74B. Podem ser usados diferentes tipos de ensaios enzimáticos, dependendo do substrato usado e do método de detecção do aumento ou decréscimo de um produto ou subproduto de reacção. Ainda, os niveis de gene e/ou proteina CYP74B expressos podem ser medidos imunoquimicamente, i.e. por ELISA, RIA, EIA e outros ensaios baseados em anticorpos conhecidos dos familiarizados com a técnica, tais como ensaios de detecção electroforética (através de coloração ou transferência Western). 0 transgene pode ser selecti-vamente expresso nalguns tecidos da planta ou nalgumas fases do desenvolvimento ou o transgene pode ser expresso em substancialmente todos os tecidos da planta, substancialmente ao longo de todo o seu ciclo de vida. No entanto, qualquer modo de expressão combinatória é também aplicável. A presente divulgação também abrange sementes das plantas transgénicas atrás descritas em que a semente possui a construção do transgene ou do gene. A presente divulgação ainda engloba a progénie, clones, linhas celulares ou células das plantas transgénicas atrás descritas em que a referida progénie, clone, linha celular ou célula possui o transgene ou construção genética. ZFPs e vectores de expressão codificadores de ZFPs podem ser administrados directamente na planta para clivagem e/ou recombinação dirigida. A administração de quantidades eficazes ocorre por qualquer uma das vias normalmente usadas para introdução de ZFP em contacto intimo com a célula vegetal a ser tratada. Métodos adequados de administração de tais composições estão disponíveis e são conhecidos dos familiarizados com a técnica e, ainda que possa ser usada mais de uma via para administrar uma composição particular, uma via particular pode frequentemente oferecer uma reacção mais imediata e mais eficaz que outra.
Podem ser igualmente usados veículos e são determinados em parte pela composição a ser administrada, assim como pelo método particular usado para administrar a composição. Assim, existe uma variedade de formulações adequadas de composições farmacêuticas que estão disponíveis (ver, e.g., Remington's Pharmaceutical Sciences, 17th ed. 1985)) .
Aplicações
As proteínas com dedos de zinco compreendendo um ou mais dedos de zinco não canónicos, como aqui descrito, são úteis para regulação de todo o genoma e aplicações de edição para os quais os ZFPs canónicos C2H2 são correntemente usados, incluindo mas não estando limitado a: activação de genes; repressão de genes; edição do genoma (clivagem, inserção dirigida, substituição ou deleção); e edição epigenómica (tendo como alvo modificações covalentes de histonas ou DNA). ZFNs compreendendo dedos de zinco não canónicos como aqui descritos podem ser usados para cortar DNA numa região de interesse na cromatina celular (e.g., num local pretendido ou pré-determinado num genoma, por exemplo, num gene, mutante ou selvagem) . Para tal clivagem dirigida de DNA, um dominio de ligação dedo de zinco é manipulado para se ligar a um local alvo num local de clivagem pré-determinado, ou perto dele, e uma proteína de fusão compreendendo o dominio de ligação dedo de zinco manipulado e um dominio de clivagem é expresso numa célula. Quando da ligação da porção dedo de zinco da proteina de fusão ao local alvo, o DNA é cortado perto do local alvo através do dominio de clivagem. 0 local exacto da clivagem pode depender do comprimento do ligante ZC.
Como alternativa, dois ZFNs, cada um deles compreendendo um dominio de ligação dedo de zinco e um semi-dominio de clivagem, são expressos numa célula, e ligam-se a locais alvo que são justapostos, de forma que um dominio de clivagem funcional seja reconstituído e o DNA cortado na vizinhança dos locais alvo. Numa realização, a clivagem ocorre entre os locais alvo dos dois domínios de ligação dedo de zinco. Pode-se manipular um ou ambos os dominios de ligação dedo de zinco.
Para a clivagem dirigida usando um polipéptido de fusão dominio de ligação dedo de zinco-dominio de clivagem, o local de ligação pode incluir o local de clivagem ou o extremo proximal do local de ligação pode estar a 1, 2, 3, 4, 5, 6, 10, 25, 50 ou mais nucleótidos (ou qualquer valor inteiro entre 1 e 50 nucleótidos) do local de clivagem. A localização exacta do local de ligação, relativamente ao local de clivagem, dependerá do domínio de clivagem particular e do comprimento do ligante ZC. Para métodos em que são usados dois polipéptidos de fusão, cada um compreendendo domínio de ligação dedo de zinco e um semi-domínio de clivagem, os locais de ligação, geralmente, abrangem o local de clivagem. Assim, o extremo proximal do primeiro local de ligação pode distar 1, 2, 3, 4, 5, 6, 10, 25 ou mais nucleótidos (ou qualquer inteiro entre 1 e 50 nucleótidos) de um lado do local de ligação e o extremo proximal do segundo local de ligação pode distar 1, 2, 3, 4, 5, 6, 10, 25 ou mais nucleótidos (ou qualquer inteiro entre 1 e 50 nucleótidos) do outro lado do local de clivagem. Os métodos para mapeamento dos locais de clivagem in vitro e in vivo são conhecidos dos familiarizados com a técnica.
Uma vez introduzida ou expressa na célula alvo, a proteína de fusão liga-se à sequência alvo e corta na sequência alvo ou perto dela. O local exacto do corte depende da natureza do domínio de clivagem e/ou da presença e/ou natureza das sequências ligantes entre os domínios de ligação e de clivagem. Nos casos em que são usados dois ZFNs, cada um deles compreendendo um semi-domínio de clivagem, a distância entre os extremos proximais dos locais de ligação pode ser 1, 2, 3, 4, 5, 6, 10, 25 ou mais nucleótidos (ou qualquer inteiro entre 1 e 50 nucleótidos). Os níveis óptimos de clivagem podem também depender da distância entre os locais de ligação dos dois ZFNs (ver, por exemplo, Smith et ai. (2000) Nucleic Acids Res. 28:3361-3369; Bibikova et al. (2001) Mol. Cell. Biol. 21:289-297) e o comprimento do ligante ZC em cada ZFN. Ver, também, Publicação de Patente U.S. 20050064474A1 e Publicações de Patente Internacional W005/084190, W005/014791 e W003/080809.
Dois ZFNs, cada um deles compreendendo um semi-dominio de clivagem, podem ligar-se na região de interesse na mesma polaridade ou na polaridade oposta e os seus locais de ligação (i.e., locais alvo) podem ser separados por qualquer número de nucleótidos, e.g., entre 0 e 50 pares de nucleótidos ou qualquer valor inteiro intermédio. Em determinadas realizações, os locais de ligação para duas proteínas de fusão, cada uma compreendendo um dominio de ligação dedo de zinco e um semi-dominio de clivagem, podem estar separados entre 5 e 18 pares de nucleótidos, por exemplo, 5-8 pares de nucleótidos ou 15-18 pares de nucleótidos ou 6 pares de nucleótidos ou 16 pares de nucleótidos ou dentro de 10 pares de nucleótidos um do outro, medido entre os extremos de cada local de ligação mais perto do outro local de ligação e a clivagem ocorre entre os locais de ligação. O local em que o DNA é cortado, geralmente, situa-se entre os locais de ligação para as duas proteínas de fusão. A quebra da dupla cadeia de DNA frequentemente resulta de dois cortes de cadeia simples ou "nicks", separados por 1, 2, 3, 4, 5, 6 ou mais nucleótidos, (por exemplo, clivagem de DNA de cadeia dupla por Fokl nativo resulta de cortes de cadeia simples separados por 4 nucleótidos). Assim, a clivagem não ocorre necessariamente em locais exactamente opostos em cada cadeia de DNA. Ainda, a estrutura das proteínas de fusão e a distância entre os locais alvo podem influenciar se a clivagem ocorre adjacente a um único par de nucleótidos ou se a clivagem ocorre em vários locais. No entanto, para muitas aplicações, incluindo recombinação dirigida e mutagénese dirigida, a clivagem dentro de uma gama de nucleótidos é geralmente suficiente e a clivagem entre pares de bases particulares não é necessária.
Como referido atrás, uma ou mais proteínas de fusão podem ser expressas numa célula após a introdução, na célula, de polipéptidos e/ou polinucleótidos. Por exemplo, dois polinucleótidos, cada um compreendendo sequências codificadoras de um dos polipéptidos atrás referidos, podem ser introduzidos numa célula e quando os polipéptidos são expressos e cada um deles se liga à sua sequência alvo, a clivagem ocorre na sequência alvo ou perto dela. Como alternativa, é introduzido numa célula um único polinu-cleótido compreendendo sequências codificadoras de ambos os polipéptidos de fusão. Os polinucleótidos podem ser DNA, RNA ou quaisquer formas modificadas ou análogos ou DNA e/ou RNA.
Em determinadas realizações, a clivagem dirigida numa região genómica por um ZFN resulta na alteração da sequência nucleotídica da região, após reparação do evento de clivagem por ligação de extremos não homólogos (NHEJ).
Noutras realizações, a clivagem dirigida numa região genómica por um ZFN pode também ser parte de um procedimento em que uma sequência genómica (e.g., uma região de interesse na cromatina celular) é substituída com uma sequência homóloga não idêntica (i.e. através de recombinação dirigida) através de mecanismos dependentes de homologia (e.g., inserção de uma sequência dadora compreendendo uma sequência exógena juntamente com uma ou mais sequências que são idênticas ou homólogas nas não idênticas, com uma sequência genómica pré-determinada (i.e., um local alvo) . Devido às quebras de cadeia dupla no DNA celular estimularem mecanismos de reparação celular várias centenas de vezes na vizinhança do local de clivagem, a clivagem dirigida com ZFNs como aqui descrito permite a alteração ou substituição (via reparação dirigida por homologia) de sequências em virtualmente qualquer local no genoma. A substituição dirigida de uma sequência genómica seleccionada requer, para além dos ZFNs aqui descritos, a introdução de um polinucleótido exógeno (dador). 0 polinucleótido dador pode ser introduzido na célula antes, ao mesmo tempo ou após a expressão dos ZFNs. 0 polinucleótido dador possui homologia suficiente para uma sequência genómica suportar recombinação homóloga (ou reparação dirigida por homologia) entre ela e a sequência genómica com a qual possui homologia. Aproximadamente 25, 50 100, 200, 500, 750, 1,000, 1,500, 2,000 nucleótidos ou mais de homologia de sequências (ou qualquer valor inteiro entre 10 e 2000 nucleótidos ou mais) suportará a recombinação homóloga. Os polinucleótidos dadores podem variar de comprimento entre 10 e 5000 nucleótidos (ou qualquer valor inteiro intermédio de nucleótidos) ou mais.
Será facilmente aparente que a sequência nucleo-tidica do polinucleótido dador é tipicamente não idêntica à da sequência genómica que substitui. Por exemplo, a sequência do polinucleótido dador pode conter uma ou mais substituições, inserções, deleções, inversões ou arranjos relativamente à sequência genómica, desde que esteja presente suficiente homologia com as sequências cromossó-micas. Tais alterações de sequências podem ser de qualquer tamanho e podem ser inclusivamente um par de nucleótidos. Como alternativa, um polinucleótido dador pode conter uma sequência não homóloga (i.e., uma sequência exógena, devendo-se distinguir de um polinucleótido exógeno) flanqueada por duas regiões de homologia. Ainda, os polinucleótidos dadores podem compreender uma molécula de vector contendo sequências que não são homólogas da região de interesse na cromatina celular. De um modo geral, as regiões homólogas de um polinucleótido dador terão pelo menos 50% de identidade de sequências com uma sequência genómica com a qual se pretende recombinação. Em determinadas realizações, está presente 60%, 70%, 80%, 90%, 95%, 98%, 99% ou 99,9% de identidade de sequências. Qualquer valor entre 1% e 100% de identidade de sequências pode estar presente, dependendo do comprimento do polinucleótido dador.
Uma molécula dadora pode conter várias regiões descontínuas de homologia com a cromatina celular. Por exemplo, para a inserção dirigida de sequências que normalmente não estão presentes numa região de interesse, as referidas sequências podem estar presentes numa molécula de ácido nucleico dadora e flanqueadas por regiões de homologia com a sequência na região de interesse.
Para simplificar os ensaios (e.g., hibridação, PCR, digestão com enzimas de restição) para determinar a inserção bem sucedida de sequências do polinucleótido dador, certas diferenças de sequência podem estar presentes na sequência dadora comparativamente com a sequência genómica. De preferência, se situada numa região codificadora, tais diferenças da sequência nucleotídica não alterarão a sequência de aminoácidos ou farão alterações silenciosas de aminoácidos (i.e., alterações que não afectam a estrutura ou função da proteína). 0 polinucleótido dador pode, facultativamente, conter alterações nas sequências correspondentes aos locais de ligação dos domínios dedos de zinco na região de interesse, para prevenir a clivagem das sequências dadoras que foram introduzidas na cromatina celular por recombinação homóloga.
Um polinucleótido pode ser introduzido numa célula como parte de uma molécula vector tendo sequências adicionais tais como, por exemplo, origens de replicação, promotores e genes codificadores de resistência a antibióticos. Ainda, os polinucleótidos dadores podem ser introduzidos como ácido nucleico nu, como ácido nucleico complexado com um agente como seja um lipossoma ou poloxâmero ou podem ser entregues por bactérias ou virus (e.g. Agrobacterium, Rhizobium sp. NGR234, Sinorhizoboium meliloti, Mesorhizobium loti, virus do mosaico do tabaco, virus X da batateira, virus do mosaico da couve-flor e virus mosaico das nervuras de mandioca. Ver, e.g., Chung et al. (2006) Trends Plant Sci. 11(1):1-4.
Para alteração de uma sequência cromossómica não é necessário que toda a sequência do dador seja copiada para o cromossoma, desde que suficiente sequência dadora seja copiada para efectuar a alteração pretendida da sequência. A eficiência da inserção das sequências dadoras através de recombinação homóloga está inversamente relacionada com a distância, no DNA celular, entre a quebra da cadeia dupla e o local em que se pretende recombinação. Por outras palavras, observam-se eficiências de recombinação homóloga mais elevadas quando a quebra da cadeia dupla está mais perto do local em que se pretende a recombinação. Nos casos em que um local preciso de recombinação não é pré-determinado (e.g., o evento de recombinação pretendido pode ocorrer ao longo de um intervalo de sequência genómica), o comprimento e a sequência do ácido nucleico dador, juntamente com os locais de clivagem, são seleccionados para se obter o evento de recombinação pretendido. Nos casos em que o evento pretendido se destina a alterar a sequência de um único par de nucleótidos numa sequência genómica, a cromatina celular é cortada dentro de 10000 nucleótidos de cada lado do par de nucleótidos. Em determinadas realizações, a clivagem ocorre dentro de 1000, 500, 200, 100, 90, 80, 70, 60, 50, 40, 30, 20, 10, 5 ou 2 nucleótidos ou em qualquer valor inteiro entre 2 e 1000 nucleótidos, de cada lado do par de nucleótidos cuja sequência se pretende alterar. A inserção dirigida de sequências exógenas numa região genómica é conseguida através de clivagem dirigida na região genómica usando ZFNs, juntamente com o fornecimento de um polinucleótido exógeno (dador) contendo as sequências exógenas. O polinucleótido dador, tipicamente, também contém sequências que flanqueiam a sequência exógena, as quais possuem homologia suficiente com a região genómica para suportar a reparação dirigida por homologia da quebra da cadeia dupla na sequência genómica, inserindo assim a sequência exógena na região genómica. Assim, o ácido nucleico dador pode ser de qualquer tamanho suficiente para suportar a integração da sequência exógena através de mecanismos de reparação dependentes de homologia (e.g., recombinação homóloga). Sem pretender estar limitado por qualquer teoria particular, pensa-se que as regiões de homologia flanqueantes da sequência exógena proporcionem aos extremos partidos do cromossoma uma matriz para a nova sintese da informação genética no local de quebra da cadeia dupla. A integração dirigida de sequências exógenas, como descrito atrás, pode ser usada para inserir um gene de uma marca numa localização cromossómica escolhida. Os genes de marcas incluem, mas não lhes estão limitados, sequências codificadoras de proteínas que medeiam a resistência a antibióticos (e.g., resistência à ampicilina, resistência à neomicina, resistência a G418, resistência à puromicina), sequências codificadoras de proteínas coradas ou fluorescentes ou luminescentes (e.g., proteína fluorescente verde, proteína fluorescente verde aumentada, proteína fluorescente vermelha, luciferase) e proteínas que medeiam a estimulação do crescimento celular e/ou amplificação de genes (e.g., redutase do di-hidrofolato). Exemplos de genes de marcas incluem assim, mas não lhes estão limitados, β-glucuronidase (GUS) , fosfinotricina N-acetil transferase (PAT, BAR), neomicina fosfotransferase, β-lactamase, catecol-dioxigenase, α-amilase, tirosinase, β-galacto-sidase, luciferase, aequorina, EPSP sintetase, nitrilase, acetolactato sintetase (ALS), di-hidrofolato reductase (DHFR), dalapão desalogenase e antranilato sintetase. Em determinadas realizações, a integração dirigida é usada para inserir uma construção para expressão de RNA, e.g., sequências responsáveis pela expressão regulada de micro-RNA ou si-RNA. Promotores, estimuladores e outras sequências reguladoras da transcrição podem também ser incorporadas numa construção de expressão de RNA.
Outros aumentos na eficiência de recombinação dirigida, em células compreendendo uma molécula de fusão dedo de zinco/nuclease e uma molécula de DNA dador, foram conseguidos através do bloqueio das células na fase G2 do ciclo celular, quando os processos de reparação dirigidos por homologia estão no seu máximo de actividade. Tal paragem pode ser conseguida por uma série de formas. Por exemplo, as células podem ser tratadas com e.g., fármacos, compostos e/ou pequenas moléculas que influenciam a progressão do ciclo celular de forma a parar as células na fase G2 · Exemplos de moléculas deste tipo incluem, mas não lhes estão limitados, compostos que afectam a polimerização de microtúbulos (e.g., vinblastina, nocodazole, Taxol), compostos que interagem com DNA (e.g., cis-platina (II) diamina dicloreto, Cisplatina, doxorrubicina) e/ou compostos que afectam a síntese de DNA (e.g., timidina, hidro-xiureia, L-mimosina, etopósido, 5-fluorouracilo) . Outros aumentos na eficiência de recombinação são conseguidos através do uso de inibidores da histona-desacetilase (HDAC) (e.g., butirato de sódio, tricostatina A) que alteram a estrutura da cromatina para tornar o DNA genómico mais acessível à maquinaria de recombinação celular.
Outros métodos para paragem do ciclo celular incluem expressão excessiva de proteínas que inibem a actividade das cinases CDK do ciclo celular, por exemplo, através da introdução na célula de um cDNA codificador da proteína ou através da introdução na célula de ZFP que activa a expressão do gene codificador da proteína. A paragem do ciclo celular é igualmente conseguida através da inibição da actividade de ciclinas e CDKs, por exemplo, usando métodos de RNAi (e.g., Patente U.S. 6,534,261 para métodos de síntese de proteínas com dedos de zinco manipulados para regulação da expressão génica.
Como atrás descrito, os métodos e composições divulgados para clivagem dirigida podem ser usados para induzir mutações numa sequência genómica. A clivagem dirigida pode também ser usada para criar anulações de genes (e.g. para genómica funcional ou validação de alvos) e para facilitar a inserção dirigida de uma sequência num genoma (i.e., activação de genes) . A inserção pode ser através de substituições de sequências cromossómicas através de recombinação homóloga ou através de integração dirigida, em que uma nova sequência (i.e., uma sequência não presente na região de interesse), flanqueada por sequências homólogas da região de interesse no cromossoma, é inserida num alvo pré-determinado. Os mesmos métodos podem ser igualmente usados para substituir uma sequência selvagem com uma sequência mutante, ou para converter um alelo noutro alelo diferente. A clivagem dirigida de agentes patogénicos que infectam ou estão integrados em plantas pode ser usada para tratar infecções patogénicas num hospedeiro vegetal, por exemplo, através do corte do genoma do agente patogénico de modo que a sua patogenicidade seja reduzida ou eliminada. Ainda, a clivagem dirigida de genes codificadores de receptores de vírus de plantas pode ser usada para bloquear a expressão de tais receptores, prevenindo assim a infecção viral e/ou a disseminação do vírus na planta.
Exemplos de agentes patogénicos de plantas incluem, mas não lhes estão limitados, vírus de plantas tais como Alfamoviruses, Alphacryptoviruses, Badnaviruses, Beta-cryptoviruses, Bigeminiviruses, Bromoviruses, Bymovíruses, Capilloviruses, Carlaviruses, Carmoviruses, Caulimoviruses, Closteroviruses, Comoviruses, Cucumoviruses, Cytorhabdovi-ruses, Díanthovíruses, Enamoviruses, Fabaviruses, Fijivi-ruses, Furoviruses, Hordeiviruses, Hybrigeminivlruses, Idaeoviruses, Ilarviruses, Ipomoviruses, Luteoviruses, Ma-chlomoviruses, Macluraviruses, Marafiviruses, Monogemini-viruses, Nanaviruses, Neuroviruses, Nepoviruses, Nucleor-habdoviruses, Oryzaviruses, Ourmiaviruses, Phytoreoviruses, Potexviruses, Potyviruses, Rymoviruses, RNAs satélites, satelivírus, Sequiviruses, Sobemoviruses, Tenuivíruses,
Tobamoviruses, Tobraviruses, Tombusviruses, Tospoviruses, Trichoviruses, Tymoviruses, Umbraviruses, Varicosaviruses e Waikaviruses; fungos patogénicos tais como fuligens (e.g. Ustilaginales), ferrugens (Uredinales) , cravagens (Clavice-pts pupurea) e míldios; bolores (Oomycetes) tais como Phytophthora infestans (míldio da batata); bactérias pato-génicas tais como Erwinia (e.g., E. herbicola), Pseudomonas (e.g., P. aeruginosa, P. syringae, P. fluorescense e P. putida), Ralstonia (e.g., R. solanacearum), Agrobacterium e Xanthomonas; vermes (Nematoda); e Phytomyxea (Polymyxa e Plasmodiophora) .
Os métodos descritos para recombinação dirigida podem ser usados para substituir qualquer sequência genó-mica com uma sequência homóloga não idêntica. Por exemplo, uma sequência genómica mutante pode ser substituída pela sua contraparte selvagem, proporcionando assim métodos para o tratamento de doenças de plantas; proporcionando resistência a agentes patogénicos de plantas; aumentando os rendimentos das culturas, etc. De forma semelhante, um alelo de um gene pode ser substituído por um alelo diferente usando os métodos de recombinação dirigida aqui descritos.
Em muitos destes casos, uma região de interesse compreende uma mutação e o polinucleótido dador compreende a correspondente sequência selvagem. De forma semelhante, uma sequência genómica selvagem pode ser substituída por uma sequência mutante, se tal for pretendido. De facto, qualquer patologia dependente de uma sequência genómica particular, de qualquer forma, pode ser corrigida ou aliviada usando os métodos e composições aqui descritos. A clivagem dirigida e a recombinação dirigida podem ser igualmente usadas para alterar sequências não codificadoras (e.g., sequências reguladoras tais como promotores, estimuladores, iniciadores, terminadores, locais de "splicing") para alterar os níveis de expressão de um produto de gene. Tais métodos podem ser usados, por exemplo, para fins terapêuticos, alterações da fisiologia e bioquímicas celulares, genómica funcional e/ou estudos de validação de alvos.
Os métodos e composições aqui descritos podem também ser usados para activação e repressão da expressão de genes usando fusões entre um domínio de ligação dedo de zinco não canónico e um domínio funcional. Tais métodos estão descritos, por exemplo, nas Patentes U.S. 6,534,261; 6,824,978 e 6,933,113 em copropriedade.
Outros métodos de repressão incluem o uso de oligonucleótidos anti-sentido e/ou pequenos RNAs de interferência (siRNA ou RNAi) dirigidos contra a sequência do gene a ser reprimido.
Em realizações adicionais, uma ou mais fusões entre um domínio de ligação dedo de zinco e uma recombinase (ou fragmento funcional da mesma) podem ser usadas, para além das fusões dedo de zinco-domínio de clivagem ou em vez delas, para facilitar a recombinação dirigida. Ver, por exemplo, a Patente US N° 6,534,261 em copropriedade e Akopian et al. (2003) Proc. Natl. Acad. Sei. USA 100:8688-8691.
Noutras realizações, os métodos e composições descritos são usados para proporcionar fusões de domínios de ligação a ZFP com domínios de activação ou repressão da transcrição que requerem dimerização (homodimerização ou heterodimerização) para a sua actividade. Nestes casos, um polipéptido de fusão compreende um domínio de ligação dedo de zinco e um monómero do domínio funcional (e.g., um monó-mero de um domínio dimérico de activação ou de repressão da transcrição). A ligação de dois desses polipéptidos de fusão a locais alvo, adequadamente situados, permite a dimerização de forma a reconstituir um dominio funcional de activação ou repressão da transcrição.
EXEMPLOS 0 presente invento é ainda definido nos Exemplos que se seguem, nos quais todas as partes e percentagens são por peso e os graus são graus Celsius, a menos que outra forma seja estabelecido. Deverá ser entendido que estes exemplos, ainda que indicando determinadas realizações do invento, são dados apenas com fins ilustrativos.
Exemplo 1: Vectores de expressão de ZFN
Os vectores de expressão compreendendo as sequências codificadoras de ZFNs com 4 dedos (designadas "5-8" e "5-9") como descritos nos Exemplos 2 e 114 da Publicação de Patente U.S. 2005/0064474 (Ver Exemplo 2 daquele pedido) foram modificados como se segue. Resumidamente, ZFN 5-8 e 5-9 (compreendendo 4 dominios dedo de zinco fundidos com o dominio nuclease da enzima de restrição tipo IIS Fokl (aminoácidos 384-579 da sequência de Wah et al. (1998) Proc. Natl. Acad. ScL USA 95:10564-10569) através de um ligante ZC de quatro aminoácidos) foram modificados para uma estrutura CCHC. Outras modificações (substituições e inserções) foram igualmente feitas aos residuos entre as estruturas de coordenação de zinco His e Cys C-terminais e/ou C-terminais relativamente à Cys C-terminal relativamente ao dedo 2 e/ou dedo 4.
Exemplo 2: Correcção de genes de eGFP em linhas celulares repórteres A capacidade de ZFNs compreendendo dedos de zinco CCHC, como aqui descritos, para facilitar a recombinação homóloga foi testada no sistema GFP descrito em Urnov (2005) Nature 435(7042):646-51 e Publicação de Patente U.S. No. 20050064474 (e.g., Exemplos 6-11). Resumidamente, 50 ng de cada ZFN e 500 ng do dador GFP sem promotor (Urnov (2005) Nature) foram transfectados em 500000 células repórter, usando 2 μΐ de Lipofectamine 2000 por amostra, de acordo com o protocolo da Lipofectamine 2000 da Invitrogen.
Adicinou-se vinblastina 24 horas após transfecção numa concentração final de 0,2 μΜ e foi removida 72 horas após transfecção.
As células foram testadas relativamente à expressão de GFP 5 dias após transfecção através da medição de 40000 células por transfecção no analisador FACS de bancada Guava.
Como se mostra na Fig. 1, a maioria dos ZFNs compreendendo dedos de zinco alterados CCHC, como mostrado nas Tabelas 1 e 2 atrás, facilita a recombinação homóloga no locus do repórter (GFP), resultando em niveis de expressão de GFP acima dos dedos de zinco CCHC não modificados e vários tiveram um desempenho similar a ZFNs compreendendo dedos de zinco CCHH. A variante com melhor desempenho quando posicionada no dedo 4 (F4) compreendeu a seguinte sequência (incluindo o residuo de coordenação de zinco His e para além deste no extremo C-terminal): HAQRCGLRGSQLV (SEQ ID NO :53) (o dedo de zinco n Tabela 2 designado #21 e mostrado na FIG. 1 como "2-21") . A variante com melhor desempenho quando colocada no dedo 2 (F2) compreendia a seguinte sequência (incluindo o residuo de coordenação de zinco His e para além deste no extremo C-terminal) : HIRTCTGSQKP (SEQ ID NO: 75) (o dedo de zinco na Tabela 2 designado #43 e mostrado na Fig. 1 como "2-43") .
Exemplo 3: Edição de um gene IL2Ry cromossómico por recombinação dirigida ZFNs como aqui descritos foram igualmente testados no ensaio de IL2Ry endógena descrito em Urnov (2005) Nature 435(7042):646-51 e no Exemplo 2 do pedido de Patente U.S. No. 20050064474. Resumidamente, duas micro-gramas e meia de cada construção de expressão ZFN foram transfectadas para 500000 células K562 usando um
Nucleofector (Amaxa). O DNA genómico foi colhido e a disrupção de genes foi testada no locus da IL2Ry endógena usando o kit de endonuclease Surveyor.
Os ZFNs estão apresentados no canto superior esquerdo da FIG. 2. Em particular, o dedo de zinco alterado 20 refere-se a um dedo de zinco CCHC compreendendo a sequência HAQRCGLRGSQLV (SEQ ID NO:53); o dedo de zinco 43 compreende a sequência HIRTCTGSQKP (SEQ ID NO:75); o dedo de zinco 45 compreende a sequência HERTGCTGSQKP; o dedo de zinco 47 compreende a sequência HIRRCTGSQKP; e o dedo de zinco 48 compreende a sequência HIRRGCTGSQKP. Os dedos de zinco 20 e 21 foram usados no dedo 4 dos ZFNs com 4 dedos e os dedos de zinco 43, 45, 47 e 48 foram usados no dedo de zinco 2 dos ZFNs com 4 dedos.
Os pares de ZFNs testados estão apresentados na Fig. 2 do lado direito por cima do gráfico e na Tabela 5:
Tabela 5
Para determinar se as mutações tinham sido induzidas no local de clivagem, o produto de amplificação foi analisado usando um ensaio Cel-1, em que o produto de amplificação foi desnaturado e renaturado, seguido de tra- tamento com a nucleasse Cel-1 específica de desempare-lhamentos. Ver, por exemplo, Oleykowski et al (1998) Nucleic Acids res. 26:4597- 4602; Qui et al. (2004) BioTechniques 36:702-707; Yeung et al. (2005) BioTechniques 38 :749-758.
Na Fig. 2 são apresentados os resultados de duas experiências para cada amostra. A experiência #2 para as amostras #2 e #8 tinha um ruído de fundo nas pistas, o que reduziu a eficácia aparente destes ZFNs.
Como se mostra na Fig. 2, algumas variantes CCHC são essencialmente equivalentes a ZFNs selvagens C2H2. O dedo de zinco 21 no dedo 4 (amostras 5 e 9) produziu melhores resultados que o dedo de zinco 20 no dedo 4 (amostras 4 e 8). No Dedo 2, o dedo de zinco 43 produziu os melhores resultados.
Exemplo 4: Correcção de genes de eGFP em linhas celulares repórteres
Com base nos resultados mostrados nas Figs. 1 e 2, foram produzidos os dedos de zinco CCHC mostrados nas Tabelas 3 e 4 atrás (designados la a 10a) . Estes dedos de zinco foram produzidos nos ZFNs 5-8 e 5-9 e testados no ensaio GFP de correcção de genes descrito no Exemplo 2 atrás. Os pares de ZFNs testados em cada amostra estão apresentados por baixo de cada barra, em que os números dos dedos de zinco 20, 21, 43, 45, 47 e 48 são os descritos no
Exemplo 3 e os dedos de zinco CCHC la a 10a compreendem a sequência mostrada nas Tabelas 3 e 4 atrás. Os dedos de zinco 20, 21, 7a, 8a, 9a e 10a foram usados no Dedo 4; os dedos de zinco 43, 45, 47, 48, la, 2a, 3a, 4a, 5a e 6a foram usados no Dedo 2.
Os resultados estão apresentados na Fig. 3. A linha superior atrás de cada barra refere-se ao dedo de zinco incorporado em ZFN 5-8 e a linha inferior dor detrás de cada barra refere-se ao dedo de zinco incorporado em ZFN 5-9. Por exemplo, a 2a barra da esquerda no gráfico da Fig. 3 refere-se a uma amostra transfectada com ZFNs 5-8 e 5-9, em que F4 de ambos os ZFNs compreende a sequência do dedo de zinco 20. Como se mostra, muitos dos ZFNs compreendendo dedos de zinco CCHC tiveram um desempenho comparável com ZFNs selvagens (CCHH).
Exemplo 5: Desenho e geração do vector alvo A. Estrutura global da sequência alvo A construção alvo para o tabaco (uma dicoti-ledónea) incluiu os seguintes 7 componentes como se mostra nas Figs. 4 e 5: i) uma cassete de expressão da fosfotransferase de higromicina (HPT) compreendendo um promotor da ubituitina-3 (ubi-3) de Ά. thaliana (Callis, et ai., 1990, J. Biol. Chem. 265-12486-12493) que dirige o gene HPT de E. coli (Waldron et al., 1985, Plant Moí. Biol. 18:189-200) terminado por uma região não traduzida (UTR) 3' da grelha de leitura aberta 24 de A. tumefaciens (orf-24) (Gelvin et al. , 1987, EP222493); ii) sequência-1 homóloga, compreendendo a região de ligação à matriz (MAR) RB7 de N. tabacum) (Thompson et al.r 1997, WO9727207); iii) um fragmento 5' do gene da proteína fluorescente verde (GFP) (Evrogen Joint Stock Company, Moscow, Russia) dirigido por um promotor modificado da manopina sintetase de A. tumefaciens (Amas) (Petolino et al., U.S. Patent No. 6,730,824); iv) uma cassete de expressão da β-glucuronidase (GUS) compreendendo um promotor do vírus mosaico das nervuras da mandioca (CsVMV) (Verdaguer et al., 1996, Plant Molecular Biology 31:1129-1139) dirigindo um gene GUS (Jefferson, 1987, Plant Mol. Biol. Rep. 5:387-405) terminado pela 3'UTR da nopalina sintetase (nos) de A. tumefaciens (DePicker et al. , 1982, J. Mol. Appl. Genet. 1:561-573); v) um fragmento 3' do gene GFP (Evrogen Joint Stock Company, Moscow, Russia) terminado por uma 3'UTR da orf-1 de A. tumefaciens (Huang et al., J. Bacteriol. 172:1814-1822); vi) sequência-2 homóloga, compreendendo ο intrão 1 da 4-coumaroil-CoA sintetase (4-CoAS) de A. thaliana (Locus At3g21320, GenBank NC 003074) e; vii) urn fragmento 3' do gene da fosfinotricina fosfotransferase (PAT) de S. viridochromogenes (Wohlleben et al., 1988, Gene 70:25-37) terminado pela 3'UTR da ORF-25/26 de A. tumefaciens (Gelvin et al., 1987, EP222493).
Urn local de ligação da proteína de fusão dedo de zinco-Fokl (IL-1-LO-Fokl) (Urnov et al., 2005, US
2005/0064474) foi inserido a jusante do promotor CsVMV (Verdaguer et al., 1996, Plant Molecular Biology 31:1129-1139) e fundido com a sequência codificadora de GUS (Jefferson, 1987, Plant Mol. Biol. Rep. 5:387-405) no extreme N. Duas copras de um segundo local de ligação da proteina de fusão dedo de zinco-Fokl (Scd27-L0-Fokl) (Urnov et al. , 2005, US 2005/0064474) flanquearam os fragmentos 5' e 3' do gene GFP (Evrogen Joint Stock Company, Moscow,
Russia). Cada local de ligação continha quatro repetições em tandem da sequência de reconhecimento da proteina de fusão particular dedo de zinco-Fokl, de forma que cada local de ligação tinha -200 pb de tamanho (Fig. 6A) . Este foi desenhado para assegurar que as sequências de reconhecimento seriam acessíveis à proteina de fusão dedo de zinco-Fokl no ambiente complexo da cromatina. Cada sequência de reconhecimento incluiu uma sequência repetida invertida, a que uma única proteina de fusão dedo de zinco-Fokl se ligou como homodimero e cortou o DNA de cadeia dupla (Fig. 6B). Os fragmentos 5' e 3' do gene GFP sobrepunham-se em 540 pb proporcionando homologia dentro da sequência alvo e um codão de paragem foi inserido no extremo 3' do fragmento 5' de GFP para assegurar tradução não funcional a partir da sequência alvo. O vector de transformação compreendendo a sequência alvo foi gerado através de um processo de clonagem de múltiplos passos como descrito abaixo. B. Construção do vector binário HPT (pDAB1584) O vector pDAB1400, o qual continha uma cassete de expressão de GUS, compreendendo um promotor de ubi-3 de A. thaliana (Callis, et al. , 1990, J. Biol. Chem. 265-12486-12493) dirigindo o gene GUS (Jefferson, 1987, Plant Mol. Biol. Rep. 5:387-405) terminado pela UTR da orf-1 de A. tumefaciens (Huang et al., J. Bacteriol. 172:1814-1822), foi usado como construção base de partida (Fig. 7).
Para evitar quaisquer elementos reguladores repetidos desnecessários na construção alvo, a UTR da orf-1 de A. tumefaciens (Huang et al., J. Bacteriol. 172:1814-1822) em pDAB1400 foi substituída pela UTR da orf-24 de A. tumefaciens (Gelvin et al., 1987, EP222493), a qual foi excisada de pDAB782 (FIG. 8) como um fragmento Sacl/Xbal e clonado nos mesmos locais em pDAB1400. A construção resultante continha um promotor ubi-3 de A. thaliana (Callis, et al., 1990, J. Biol. Chem. 265-12486-12493) a dirigir o gene GUS (Jefferson, 1987, Plant Mol. Biol. Rep. 5:387-405) terminado por uma UTR da orf-24 de A. tumefaciens (Gelvin et al., 1987, EP222493) e foi designada pDAB1582 (FIG. 9). A sequência codificadora de HPT (Waldron et al., 1985, Plant Moí. Biol. 18:189-200) foi amplificada por PCR a partir do plasmideo pDAB354 (FIG. 10) usando as sequências iniciadoras Pi e P2. Um local Bbsl foi adicionado no extreme 5' da sequência iniciadora PI e o local Saci foi mantido no extreme 3 ' da sequência iniciadora P2 . O fragmento de PCR HPTII foi digerido com BbsI/SacI e clonado em pDAB1582 digerido com NcoI-SacI para substituir o gene GUS com o gene HPT do fragmento de PCR. 0 plasmideo resultante foi designado pDAB1583 (Fig. 11). 0 fragmento ubi-3 de A. tbaIiana/HPTA/orf-24 de A. tumefaciens foi então excisado do pDAB1583 por digestão com Notl e tratado com DNA-polimerase de T4 para gerar extremos cegos. A cassete de expressão de HPT dotada de extremos cegos foi clonada em pDAB2407 (Fig. 12), um vector de base binário, no local Pmel resultando no plasmideo pDABl5 8 4 (Fig. 13) . C. Construção do vector compreendendo as seguências homólogas e o local de ligação da proteína de fusão dedo de zinco Scd27-FokI (pDAB1580) A UTR da orf-1 de A. tumefaciens (Huang et al.,
J. Bacteriol. 172:1814-1822) em pDAB2418 (FIG. 14) foi substituída com a UTR da orf25/26 de A. tumefaciens (Gelvin et al., 1987, EP222493) para evitar sequências reguladoras repetidas no vector alvo. Para fazer a troca da UTR, a UTR da orf25/26 de A. tumefaciens (Gelvin et al., 1987, EP222493) foi amplificada por PCR a partir do plasmideo pDAB4045 (FIG. 15) usando as sequências iniciadoras P3 e P4. Os locais Smal e Agel foram adicionados ao extremo 3' do fragmento de PCR e o local Saci foi mantido no extremo 5'. 0 DNA do plasmideo pDAB2418, que continha uma cassete de expressão do gene PAT, compreendendo o promotor da ubiquitina-10 (ubi-10) de A. thaliana (Callis, et al., 1990, J. Biol. Chem. 265-12486-12493) dirigindo o gene PAT (Wohlleben et al, 1988, Gene 70:25-37) terminado pela UTR da orf-1 de A. tumefaciens (Huang et al., J. Bacteriol. 172:1814-1822) e uma sequência MAR RB7 de N. tabacum (Thompson et al., 1997, WO9727207), foi digerido com SacI e Agel e os dois fragmentos maiores foram recuperados. Estes fragmentos foram ligados ao produto de PCR da UTR da orf25/26 de A. tumefaciens (Gelvin et al., 1987, EP222493) digerido com Saci e Agel. O plasmideo resultante foi designado pDAB1575 (Fig. 16). MAR RB7 de N. tabacum
Thompson et al., 1997, WO9727207) serviu como sequência homóloga 1 no vector alvo. O intrão 1 de 4-CoAS de A. thaliana (Locus At3g21320, GenBank NC 003074) foi seleccionado para servir como sequência homóloga 2 no vector alvo. A sequência codificadora do gene PAT (Wohlleben et al., 1988, Gene 70:25-37) foi analisada e 299/300 pb a jusante do codão de iniciação foi identificado como o local de inserção do intrão, de modo que os locais de "splicing" 5' e 3' adequados pudessem ser formados. O intrão de tamanho completo foi então fundido com 253 pb da sequência codificadora parcial 3 ' de PAT através da sintese de DNA (Picoscript Ltd., LLP, Houston, Texas) . Os locais Notl e Saci foram adicionados aos extremos 5' e 3' do fragmento de DNA, respectivamente. O fragmento de DNA sintetizado foi então digerido com NotI/SacI e inserido em pDAB1575 nos mesmos locais para substituir a sequência codificadora de PAT de tamanho completo. A construção resultante foi designada pDAB1577 (Fig. 17).
Um fragmento de DNA de 241 pb contendo 4 repetições em tandem de locais de reconhecimento Scd27-L0-Fokl (Fig. 6) foi sintetizado (Picoscript Ltd., LLP, Houston, Texas) com um local Smal adicionado a ambos os extremos 5' e 3' do fragmento. 0 fragmento sintetizado contendo o local de ligação dedo de zinco-Fokl foi então digerido com Smal e inserido em pDABl577 no local MscI. 0 vector resultante foi designado pDAB1579 (Fig. 18). Um segundo fragmento contendo o local de ligação dedo de zinco-Fokl digerido com Smal foi então inserido em pDAB1579 no local SwaI. A construção resultante foi designada pDAB1580 (Fig. 19). Este vector possui sequências homólogas 1 e 2 (RB7 MAR de N. tabacum e o intrão 1 de 4-CoAS de A. thaliana, respectivamente) e dois locais sintetizados de ligação a dedo de zinco Scd27-L0-Fokl, cada um deles contendo 4 repetições em tandem dos locais de reconhecimento Scd27-L0-Fokl. D. Construção do vector contendo dois fragmentos de GFP não funcional parcialmente duplicados (pDAB1572) 0 gene GFP, CopGFP, foi adquirido a Evrogen Joint Stock Company (Moscow, Russia) e a sequência codificadora de tamanho complete foi amplificada por PCR usando as sequências iniciadoras P5 e P6. Os locais Bbsl e Saci foram adicionados aos extremos 5' e 3' do produto de PCR, respectivamente. 0 produto de PCR CopGFP foi então digerido com BbsI/SacI e clonado em pDAB3401 (Fig. 20) compreendendo o promotor Amas modificado de A. tumefaciens (Petolino et al., US6730824) dirigindo o gene GUS (Jefferson, 1987, Plant Mol. Biol. Rep. 5:387-405) e terminado pela UTR 3' da orf-1 de A. tumifaciens (Huang et al., J. Bacteriol. 172:1814-1822) nos locais NcoI/SacI para substituir o gene GUS. 0 vector resultante foi designado pDAB1570 (Fig. 21) .
Para fazer os dois fragmentos de GFP não funcionais parcialmente duplicados, um fragmento de DNA contendo a maioria da sequência codificadora de CopGFP com uma deleção de 47 pb no extremo 5' foi amplificado por PCR usando as sequências iniciadoras P9 e PIO. Um local Apal foi adicionado a ambos os extremos 5' e 3' e um local StuI adicional foi adicionado ao extremo 5' a jusante do local Apal. O produto de PCR foi então digerido com Apal e inserido em pDAB1570 no local Apal, criando assim dois fragmentos GFP não funcionais no mesmo vector com uma sequência duplicada de 540 pb. A construção resultante foi designada pDAB1572 (Fig. 22). E. Construção do vector contendo a fusão local de ligação à proteína de fusão dedo de zinco IL-l-FokI/gene GUS (pDAB1573)
Um fragmento de DNA de 233 pb contendo 4 repetições em tandem do local de reconhecimento IL1_LO-Fokl (Fig. 6) foi sintetizado por Picoscript Ltd., LLP, (Houston, Texas) com locais Ncol e AflIII adicionados aos extremos 5' e 3', respectivamente. O fragmento sintetizado foi então digerido com NcoI/AflIII e inserido em pDAB4003 (Fig. 23), o qual continha um gene GUS (Jefferson, 1987, Plant Mol. Biol. Rep. 5:387-405) dirigido por um promotor CsVMV (Verdaguer et al., 1996, Plant Molecular Biology 31:1129-1139) terminado pela UTR 3' da orf-1 de A. tumefaciens (Huang et al., J. Bacteriol. 172:1814-1822) num local Ncol. Uma fusão N-terminal entre o local de ligação de IL-l_L0-FokI e a sequência codificadora de GUS foi então gerado. O vector resultante foi designado pDAB1571 (Fig. 24) .
Para evitar repetir os elementos da UTR 3' no vector alvo, a UTR 3' de A. tumefaciens (DePicker et al., 1982, J. Mol. Appl. Genet. 1:561-573) foi removida de pDAB7204 (FIG. 25) como um fragmento Sacl/Pmel e clonada em pDAB1571, que foi digerido com Sacl/Nael, para substituir a UTR 3' da orf-1 de A. tumefaciens (Huang et al., J. Bacteriol. 172:1814-1822). O plasmideo resultante foi designado pDABl 573 (FIG. 26) . F. Construção do vector alvo final (pDAB1585)
Para fazer um vector alvo final, a cassete de expressão de GUS com a inserção do local alvo da proteina de fusão IL-l-Fokl foi removida de pDAB1573 por digestão com Notl, dotada de extremos cegos e inserida em pDAB1572 no local StuI. O vector intermediário resultante foi designado pDAB1574 (Fig. 27) . Toda a cassete contendo o promotor Amas modificado (Petolino et al., US6730824), uma sequência GFP 5' parcialmente duplicada (Evrogen Joint Stock Company, Moscow, Russia), o promotor CsVMV (Verdaguer et al., 1996, Plant Molecular Biology 31 :1129-1139), uma sequência alvo da proteína de fusão IL-l-Fokl, a região codificadora do gene GUS (Jefferson, 1987, Plant Mol. Biol. Rep. 5:387-405), uma UTR 3' nos de A tumefaciens (DePicker et al., 1982, J. Mol. Appl. Genet. 1 :561- 573), uma GFP 3' parcialmente duplicada (Evrogen Joint Stock Company, Moscow, Russia) e a UTR 3' da orf-1 de A. tumefaciens (Huang et al., J. Bacteriol. 172:1814-1822) foi removida de pDAB1574 e inserida em pDAB1580 no local Notl. 0 plasmideo resultante foi designado pDAB1581 (Fig. 28) . O fragmento Agel de pDAB foi então inserido em pDAB1584 no local Agel criando assim a construção alvo final, pDAB1585 (Figs. 4 e 5) .
Exemplo 6. Geração de linhas celulares transgénicas com sequências alvo integradas
Usou-se uma cultura em suspensão de células de tabaco, referida como BY2, na qual as sequências alvo do exemplo 5 foram estavelmente integradas através da transformação de Agrobacterium. A linha celular de base, BY2, foi adquirida a Jun Ueki of Japan Tobacco, Iwata, Shizuoka, Japan. Esta cultura prolifera como células com um diâmetro de 5-10 μ, em aglomerados de 100-150 células, com um tempo de duplicação de aproximadamente 18 horas. As culturas em suspensão das células BY2 foram mantidas em meio contendo sais basais LS (PhytoTechnology Labs L689), 170 mg/1 KH2PO4, 30 g/1 de sacarose, 0,2 mg/1 de 2,4-D e 0,6 mg/L tiamina-HCl a um pH de 6,0. As células BY2 foram subcultivadas cada 7 dias através da adição de 50 ml de meio baseado em LS a 0,25 ml PCV. A cultura em suspensão de células BY2 foi mantida em frascos de 250 ml num agitador orbital a 25°C e 125 rpm. De forma a gerar uma cultura de células BY2 transgénica com sequências alvo integradas, um frasco de uma subcultura em suspensão de tabaco com quatro dias foi dividido em 10-12 aliquotas de quatro ml, que foram subcultivadas em placas de Petri de 100x25 mm com 100 μΐ de Agrobacterium estirpe LBA4404 portadora de pDAB1585 crescidas durante a noite até uma DCfoo ~1,5. As placas foram envolvidas em parafilme e incubadas as 25°C com agitação durante 3 dias, após o que o liquido em excesso foi removido e substituído com 11 ml de meio basal baseado em LS contendo 500 mg/1 de carbenicilina.
Após ressuspensão das células do tabaco, 1 ml de suspensão foi distribuído por placas de 100x25 mm com meio de base adequado contendo 500 mg/ml de carbenicilina e 200 mg/1 de higromicina solidificada com 8 g/1 de agar TC e incubadas não embrulhadas a 28°C no escuro. Isto resultou em 120-144 placas de selecção para um único tratamento. Os isolados individuais resistentes à higromicina surgiram 10-14 dias após sementeira e foram transferidos para placas individuais de 60x20 mm (um isolado por placa) onde foram mantidos como calos num protocolo de subcultura de 14 dias até necessários para análise e subsequentes experiências de retransformação.
Exemplo 7: Rastreio e caracterização de eventos transgénicos alvo
Os eventos transgénicos resistentes à higromicina gerados a partir da transformação do vector alvo em culturas celulares de tabaco BY2, como descrito no Exemplo 6, foram analisados como se segue.
As análises iniciais conduzidas para rastreio destes eventos transgénicos incluíram a análise da expressão de GUS para indicar a acessibilidade da sequência alvo, a análise por PCR da sequência alvo parcial e completa para confirmar a presença e integridade do vector alvo e a análise de transferências Southern para determinar o número de cópias da sequência alvo integrada. Uma sub-série de eventos transgénicos que mostrou a expressão de GUS continha apenas uma cópia da sequência alvo completa; estes foram seleccionados para restabelecimento das culturas em suspensão para gerar as linhas alvo para subsequente retransformação. Estas linhas alvo restabelecidas foram sujeitas a posterior caracterização, que incluiu uma análise de transferências Southern mais exaustiva, sequenciação para confirmação da integridade do inserto alvo e análise da sequência genómica flanqueante. 0 tecido de calo ou culturas em suspensão de tabaco transgénico, iniciadas a partir dos eventos seleccionados, foram analisados relativamente à actividade GUS através da incubação de amostras de 50 mg em 150 μΐ de tampão de ensaio durante 24-48 horas a 37°C. O tampão de ensaio consistiu em fosfato de sódio 0,2M pH 8,0, ferricianeto de potássio e ferrocianeto de potássio 0,1 mM de cada, EDTA sódico 1,0 mM, 0,5 mg/ml de 5-bromo-4-cloro- 3-indolil^-glucuroneto e 0,6% (v/v) Triton X-100 (Jefferson, 1987, Plant Mol. Biol. Rep. 5:387-405). 0 aparecimento de regiões coradas de azul foi usado como indicador da expressão do gene GUS, o que indicou que a inserção da sequência alvo estava transcricionalmente activa e assim acessível no ambiente genómico local.
Os eventos transgénicos expressando GUS foram testados por PCR usando o par de sequências iniciadoras P15/P16 que conduziu à amplificação de um fragmento de DNA de 10 kb estendendo-se entre a UTR 3' da cassete de expressão de HTP no extremo 5' da sequência alvo e a UTR 3' da cassete do gene PAT parcial no extremo 3' da sequência alvo. Uma vez que todos os eventos foram obtidos sob selecção com higromicina, assumiu-se que a cassete de expressão de HPT estava intacta em todos os eventos alvo. Assim, apenas a UTR 3' da cassete de expressão de HPT foi coberta a análise de PCR de tamanho completo. Uma subsérie de eventos foram igualmente testados por PCR usando os pares de sequências iniciadoras P15/P17 e P18/P19 para determinar a integridade dos extremos 5' e 3' da sequência alvo, respectivamente. Todos os eventos alvo confirmados por análise de PCR foram ainda testados por análise de transferências Southern para determinar o número de cópias da sequência alvo integrada. A análise de transferências Southern foi realizada para todos os eventos alvo que passaram o rastreio da expressão de GUS e PCR de tamanho completo. Dez yg de DNA genómico foi digerido com Nsil, a qual cortava apenas uma vez dentro da sequência alvo. 0 DNA genómico digerido foi separado num gel de 0,8% de agarose e transferido para uma membrana de nylon. Após ligação, o DNA transferido presente na membrana foi hibridado com uma sonda do gene HPT para determinar o número de cópias do extremo 5' da sequência alvo. A mesma membrana foi então sujeita a remoção do material hibridado e re-hibridada com uma sonda do gene PAT para determinar o número de cópias do extremo 3' da sequência alvo. Múltiplos eventos que mostraram a expressão de GUS e continham uma única cópia da sequência alvo de tamanho completo foram seleccionados para posterior caracterização, o que incluiu uma análise mais exaustiva de transferências Southern, confirmação da integridade da sequência alvo e análise das sequências genómicas flanqueantes. Um evento, referido como BY2-380, foi seleccionado com base na caracterização molecular. A cultura em suspensão foi restabelecida a partir deste evento para subsequente retransformação com vectores compreendendo DNA dador e genes das proteínas de fusão com dedos de zinco não C2H2-FokI.
Para assegurar que a cultura em suspensão estabelecida a partir do evento alvo BY2-380 continha a sequência alvo intacta como esperado, a maioria da sequência alvo desde a UTR 3' da cassete de expressão HPT no extremo 5' da sequência alvo até à UTR 3' da cassete do qene PAT parcial no extremo 3' da sequência alvo foi amplificada por PCR usando o par de sequências iniciadoras P15/P16 e clonada no vector pCR2.1 TOPO (Invitrogen, Carlsbad, California). Os produtos de PCR inseridos no vector TOPO foram sequenciados pela Lark technology, Inc. (Houston, Texas). Os resultados de sequenciação indicaram que BY2-380 possuia as sequências alvo completas como esperado. A linha celular BY2-380 foi ainda analisada para se obter as sequências genómicas flanqueantes usando o kit Universal GenomeWalker (Clontech, Mountain View, California) . Resumidamente, 2,5 yg de DNA genómico foi digerido com enzimas de restrição geradoras de extremos cegos, EcoRV, Dral e StuI, em reacções separadas. 0 DNA digerido foi purificado através de extracção com fenol/clorofórmio e ligado ao adaptador BD GenomeWalker. A amplificação por PCR de duas reacções sucessivas foi realizada tendo a ligação como matriz e as sequências iniciadoras P20 (andamento a montante do extremo 5' do local de inserção da sequência alvo) e P21 (andamento a jusante do extremo 3' do local de inserção da sequência alvo) para a primeira reacção de PCR e as sequências iniciadoras P22 (andamento a montante do extremo 5' do local de inserção da sequência alvo) e P23 (andamento a jusante do extremo 3' do local de inserção da sequência alvo) para a segunda reacção de PCR. Os fragmentos amplificados a partir das segundas reacções de PCR foram clonados em pCR2.1 TOPO ou no vector pCR Blunt II TOPO (Invitrogen, Carlsbad, California) e sequenciados usando um kit de sequenciação Dye Terminator Cycle Sequencing Kit (Beckman Coulter, Fullerton, CA) . As sequências genómicas flanqueantes foram obtidas a partir da linha alvo BY2-380 através deste processo. As sequências iniciadoras foram projectadas com base nas sequências genómicas flanqueantes e usadas para amplificar toda a sequência alvo.
Os fragmentos amplificados obtidos a partir desta linha alvo eram do tamanho esperado. Ambos os extremos dos fragmentos amplificados foram confirmados por sequenciação.
Exemplo 8: Desenho e geração do vector dador de
DNA A construção dadora de DNA incluiu a sequência homóloga 1 (N. tabacum RB7 MAR) (Thompson et al., 1997, WO9727207), um promotor ubilO completo de A. thaliana (Callis, et al., 1990, J. Biol. Chem. 265-12486-12493), 299 bp da sequência codificadora 5' parcial do gene PAT (Wohlleben et al., 1988, Gene 70:25-37) e a sequência homóloga 2 (intrão 1 de 4-CoAS de A. thaliana) (Locus At3g21320, GenBank NC 003074) . A sequência homóloga 1 e a sequência homóloga 2 no vector dador eram idênticas às correspondentes sequências homólogas 1 e 2 no vector alvo (pDABl5 8 5) .
Para construir o vector dador, a sequência de 299 pb codificadora de PAT parcial 5' foi fundida com o intrão 1 completo de 4-CoAS de A. thaliana (Locus At3g21320,
GenBank NC 003074) através da sintese de DNA pela Picoscript Ltd., LLP, (Houston, Texas) . Os locais Ncol e Xhol foram adicionados ao extremo 5' e 3' do fragmento, respectivamente. Este fragmento de DNA sintetizado foi então digerido com Ncol/Xhol e inserido em pDAB1575 nos mesmos locais para substituir a sequência codificadora do gene PAT de tamanho completo e a sua UTR 3'. Esta construção resultante foi designada DAB1576 (Fig. 29). pDAB157 6 foi então digerido com Agel e todo o fragmento contendo a cassete de expressão de PAT parcial 5' flanqueada pela sequência homóloga 1 e pela sequência homóloga 2 foi inserido em pDAB2407, o vector de base binário, no mesmo local. A construção resultante foi designada pDAB1600 (Fig. 30) e foi a versão binária do vector dador para a retransformação da célula vegetal.
Exemplo 9: Desenho e geração de vectores de expressão de nucleases com dedos de zinco O gene da proteina de fusão dedo de zinco-Fokl foi dirigido por um promotor e UTR 5' de CsVMV UTR (Verdaguer et al., 1996, Plant Molecular Biology 31:1129-1139) . Também estavam incluídos na cassete uma região não traduzida (UTR) 3' da grelha de leitura aberta 24 (orf-24) de A. tumefacíens (Gelvin et al., 1987, EP222493) .
Para preparar estes vectores, as sequências codificadoras dos controlos C2H2 e das suas variantes C3H IL-l-Fokl e Scd27-FokI, descritas nos Exemplos 1 a 4 atrás, foram amplificadas por PCR a partir dos seus desenhos originais com locais Bbsl ou Ncol e Saci adicionados ao extremo 5' e ao extremo 3' dos fragmentos de PCR, respectivamente, e clonados em pDAB3731 (Fig. 31) digerido com Ncol-Sacl. Os plasmideos resultantes foram designados pDAB4322 (Fig. 32), pDAB4331 (FIG. 33), pDAB4332 (FIG. 34), pDAB4333 (FIG. 35) pDAB4334 (FIG. 36), pDAB4336 (FIG. 37), e pDAB4339 (FIG. 38) . Todos estes vectores continham os locais attLl e attL2 flanqueantes da cassete de expressão ZFN e eram compatíveis com o sistema de clonagem Gateway™ (Invitrogen, Carlsbad, California).
Duas séries de vectores versão binária foram construídas para a proteina de fusão IL-l-Fokl. Um continha o gene da marca seleccionável PAT e o outro não continha o gene da marca seleccionável PAT. Para a proteina de fusão Scd27-FokI, apenas foi construída a versão primária do vector sem o gene da marca seleccionável PAT. Para preparar os vectores binários com o gene da marca seleccionável PAT, a cassete de expressão da proteina de fusão IL-l-Fok em pDAB4322, pDAB4331, pDAB4332, pDAB4333, pDAB4334, and pDAB4336 foram clonados em pDAB4321 (FIG. 39) através da reacção de recombinação LR usando a mistura de enzimas LR ClonaseTM Enzyme Mix (Invitrogen, Carlsbad, California). Os plasmideos resultantes foram designados pDAB4323 (FIG. 40), pDAB4341 (FIG. 41), pDAB4342 (FIG. 42), pDAB4343 (FIG. 43), pDAB4344 (FIG. 44), pDAB4346 (FIG. 45). Para preparar os vectores binários sem o gene da marca seleccionável PAT, as cassetes de expressão C2H2 IL-l-FokI, C3H IL-l-Fokl e Scd27-FokI em pDAB4331, pDAB4336 e pDAB4339, respectivamente, foram clonadas em pDAB4330 (FIG. 46) através da reacção de recombinação LR usando a mistura de enzimas LR ClonaseTM Enzyme Mix (Invitrogen, Carlsbad, California). Os plasmideos resultantes foram designados pDAB4351 (FIG. 47), pDAB4356 (FIG. 48) e pDAB4359 (FIG. 49), respectivamente.
Para preparar o controlo C2H2 de SCD27-FokI, o fragmento HindIII/SacI compreendendo o promotor CsVMV e a UTR 5' dirigindo PAT em pDAB7002 (Fig. 50) foi substituído com um fragmento compreendendo o promotor CsVMV e a UTR 5 ' de N. tabacum dirigindo GUS, que foi excisada a partir de pDAB7025 (Fig. 51) com HindiII/Saci. O plasmideo resultante foi designado pDAB1591 (Fig. 52). As sequências codificadoras de Scd27-L0-Fokl foram amplificadas por PCR a partir dos seus vectores originais vectors pCDNA3.l-SCD27a-L0-Fokl (FIG. 53) usando o par de sequências iniciadoras P13/P14. Os locais Bbsl e Saci foram adicionados ao extremo 5' e 3' dos fragmentos de PCR, respectivamente. O gene PAT em pDAB1591 foi substituído com o fragmento de PCR do gene da proteina de fusão com dedos de zinco através da clonagem Sacl/Ncol. O plasmideo resultante foi designado pDAB1594 (Fig. 54). A versão binária deste vector foi construída através da excisão da cassete de expressão do gene da proteina de fusão com dedos de zinco do pDAB1594 como um fragmento Pmel/Xhol, preenchimento dos extremos e clonagem em pDAB2407 no local Pmel. 0 plasmídeo resultante foi designado pDAB1598 (Fig. 55). Os detalhes de todos os vectores binários usados na transformação de plantas estão resumidos na Tabela 6.
Tabela 6: Vectores de expressão de nucleases com dedos de zinco
Exemplo 10: Desenho e geração de vector controlo positivo
Para estimar a frequência de recombinação ilegítima e servir como controlo positivo, foi usado um vector contendo a cassete de expressão do gene PAT. De forma a ser comparável com os recombinantes finais, o intrão 1 de 4-CoAS de A. thaliana (Locus At3g21320, GenBank NC 003074) foi inserido na posição 299/300 pb da sequência codificadora de PAT (Wohlleben et al., 1988, Gene 70:25-37) . Para fazer esta construção, o fragmento Swal/Clal de 2559 pb de pDABl576 foi ligado ao fragmento esqueleto de pDAB1577 (Fig. 56) que foi digerido com as mesmas enzimas de restrição. O vector resultante continha a cassete de expressão do gene PAT com a inserção de 1743 pb do intrão 1 de 4-CoAS de A. thaliana (Locus At3g21320, GenBank NC 003074) (Locus At3g21320, GenBank NC 003074) no meio da sequência codificadora de PAT (Wohlleben et al., 1988, Gene 70:25-37) . Este vector foi designado pDAB1578 (FIG. 57) .
Para preparar a versão binária de pDAB1578, a cassete de expressão do gene PAT com o intrão 1 de A. thaliana (Locus At3g21320, GenBank NC 003074) foi excisado de pDAB1578 com Pmel/Xhol. Após o extremo 3' do fragmento ser tornado cego, ela foi inserida em pDAB2407, o vector de base binário, no local Pmel. O vector resultante foi designado pDAB1601 (Fig. 58) que compreendia o gene PAT (Wohlleben et al., 1988, Gene 70:25-37) contendo a sequência do intrão de 4-CoAS de A thaliana (Locus At3g21320, GenBank NC 003074) dirigida pelo promotor ubilO de A. thaliana (Callis, et al., 1990, J. Biol. Chem. 265-12486-12493) e terminada pela UTR 3' da orf25/26 de A. tumefaciens (Gelvin et al., 1987, EP222493).
Exemplo 11: Demonstração da recombinação homóloga intracromossómica através da retransformação de culturas celulares alvo com os genes da nuclease com dedos de zinco C3H
Para validar a funcionalidade das nucleases com dedos de zinco C3H na estimulação da recombinação homóloga intracromossómica, dois fragmentos GFP não funcionais com sequências sobreponíveis de 540 pb foram incluídos no vector alvo como se mostra na Fig. 59. Entre estes dois fragmentos estava uma csssete de expressão de GUS. A sequência de ligação da proteína de fusão IL-l-Fokl foi fundida com a sequência codificadora de GUS no seu extremo N-terminal. Sem estar limitado por qualquer teoria, foi colocada a hipótese de na presença da proteína de fusão IL- 1-FokI as sequências de ligação a IL-l-ZFN serem reconhecidas e ser induzida uma quebra na dupla cadeia do DNA, a qual estimularia o processo de reparação de DNA endógeno. Sem a presença de DNA dador, os dois fragmentos de GFP parcialmente homólogos sofreriam um processo de recombinação homóloga intracromossómico e um gene GFP funcional seria reconstituído.
Uma linha celular transgénica BY2-380 que continha uma única cópia de tamanho completo integrada da sequência alvo foi usada para reiniciar as culturas em suspensão colocando -250-500 ng de tecido do calo em 40-50 ml de meio basal baseado em LS, contendo 100 mg/1 de higromicina, e subcultura cada 7 dias como descrito atrás. Antes da retransformação, as culturas em suspensão foram transferidas para meio basal sem higromicina durante pelo menos duas passagens. A transformação mediada por Agrobacterium das culturas celulares alvo foi realizada como descrito atrás. Para cada experiência, 8 placas de cocultura foram geradas como se segue: uma placa continha células cocultivadas com 300 μΐ de Agrobacterium estirpe LBA4404 de base; uma placa compreendia células cocultivadas com 300 μΐ de uma estirpe de Agrobacterium portadora de pDAB1590 (construção com GFP funcional); seis placas continham, cada uma, células cocultivadas com 300 μΐ de uma estirpe de Agrobacterium portadora de pDAB4323, pDAB4341, pDAB4342, pDAB4343, pDAB4344 e pDAB4346, respectivamente. Após cocultura usando os métodos descritos atrás, as células foram semeadas em oito placas contendo meio basal baseado em LS suplementado com 500 mg/1 de carbenicilina sem reagente de selecção. A expressão aparente do gene GFP funcional constituído resultou em fluorescência visível por volta dos dias 5-8 após transformação). O número de focos fluorescentes verdes por campo foi contado através da observação aleatória de 5 campos do microscópio por placa, 8 placas por construção em cada experiência e fazendo a média de 6 experiências independentes.
Conforme resumido na Tabela 7, observou-se uma média de 9,50 e 7,57 focos fluorescentes verdes a partir das duas nucleases com dedos de zinco C3H, pDAB4346 e pDAB4343, respectivamente. Estes dois desenhos C3H de IL-1-Fokl tiveram melhor desempenho que os seus controlos C2H2, pDAB4341 (6,37 focos por campo) e pDAB4323 (5,53 focos por campo). Entretanto, comparativamente com os controlos C2H2, a função de outras duas variantes C3H da proteina de fusão IL-l-Fokl, pDAB4344 (4,39 focos por campo) e pDAB4342 (0,25 focos por campo) foi significativamente inibida, em particular o pDAB4342, em que a conversão C3H foi feita através da substituição da segunda histidina com cisterna no quarto dedo. Não se observou fluorescência apreciável para além de um ligeiro fundo nos controlos negativos transformados com a estirpe de base de Agrobacterium LBA4404.
Tabela 7
(continuação)
Exemplo 12: Demonstração da recombinação homóloga intercromossómica através da retransformação das culturas de células alvo com genes das nucleases com dedos de zinco C3H e sequências de DNA dador
Para validar a funcionalidade da proteina de fusão dedo de zinco C3H-FokI na estimulação da recombinação homóloga intercromossómica no sistema exemplificativo do tabaco, foram desenvolvidas e testadas duas estratégias.
Na estratégia 1, o local de ligação para a proteina de fusão dedo de zinco-Fokl (Il-1-L0-Fokl) foi incluido no meio da construção alvo (Fig. 61). Nesta estratégia, o local de ligação foi flanqueado por ~3kb de sequências não homólogas de ambos os lados seguido da sequência homóloga 1 (MAR RB7 de N. tabacum) e da sequência homóloga 2 (intrão 1 de 4-CoAS de A. thaliana) a montante e a jusante, respectivamente. Como previamente demonstrado (e.g., Publicação de Patente US N° 20050064474) na presença da proteína de fusão dedo de zinco IL-1 C2H2-FokI, as sequências de ligação a IL-1-L0-Fokl foram reconhecidas e foi induzida uma quebra no DNA de cadeia dupla neste local específico, o que estimulou o processo de reparação de DNA endógeno. Na presença de DNA dador, que continha sequências homólogas parciais idênticas às da sequência alvo, o gene PAT parcial 5' juntamente com o seu promotor, substituiu todo o fragmento de DNA de ~6 kb entre as sequências homólogas no alvo através de recombinação homóloga. Através deste processo, as duas sequências parciais do gene PAT, com o intrão 1 de 4-CoAs de A. thaliana de permeio, reconstituiu um gene PAT funcional, resultando na expressão de PAT e num fenótipo de resistência a herbicida.
Na estratégia 2, dois locais de ligação a dedos de zinco-Fokl (Scd27-L0-Fokl) foram incluídos no vector alvo: um directamente a jusante de MAR RB7 de N. tabacum e o outro directamente a montante do intrão 1 de 4-CoAs de A. thaliana (Fig. 62) . Entre os dois locais de ligação da proteína de fusão dedos de zinco-Fokl estavam ~6 kb de sequência, as quais incluíam o fragmento 5' GFP, uma cassete de expressão de GUS e o fragmento GFP 3' . Como anteriormente demonstrado (e.g., Publicação de Patente U.S. N° 20050064474), na presença da proteína de fusão dedos de zinco Scd27-FokI, as duas sequências de ligação foram reconhecidas e as quebras de DNA de cadeia dupla foram induzidas em ambas as localizações, o que removeu o fragmento de DNA de ~6 kb entre estas duas sequências de ligação e estimulou o processo endógeno de reparação do DNA. De forma semelhante à estratégia 1, na presença de DNA dador, que continha sequências homólogas idênticas à da sequência alvo, o gene PAT parcial 5' juntamente com o seu promotor, foi inserido na sequência alvo, através de recombinação homóloga, no local onde as quebras do DNA de cadeia dupla foram induzidas. Através deste processo, as duas sequências parciais do gene PAT com o intrão 1 de 4-CoAS interposto entre elas, reconstituiu-se um gene PAT funcional, resultando na expressão de PAT e no fenótipo de resistência a herbicida. A transformação mediada por Agrobacterium da cultura de células alvo BY2-380 foi realizada como descrito atrás. Para cada experiência, 12 placas de cocultura foram geradas como se segue: uma placa continha células cocultivadas com 50 μΐ de uma estirpe de Agrobacterium portadora de pDAB1600 (DNA dador) e 250 μΐ da estirpe base de Agrobacterium LBA4404; uma placa continha células cocultivadas com 50 μΐ de uma estirpe de Agrobacterium portadora de pDAB1601 (marca seleccionável com PAT) e 250 μΐ de Agrobacterium estirpe base LBA4404; duas placas contendo células cocultivadas com 50 μΐ de uma estirpe de Agrobacterium portadora de pDAB1600 (DNA dador) e 250 μΐ de uma estirpe de Agrobacterium portadora de pDAB4351 (C2H2 IL-1 ZFP-Fokl); três placas continham células cocultivadas com 50 μΐ de uma estirpe de Agrobacterium portadora de pDAB 1600 (DNA dador) e 250 μΐ de uma estirpe de Agrobacterium portadora de pDAB4356 (C3H IL-1 ZFP-Fokl); duas placas continham células cocultivadas com 50 μΐ de uma estirpe de Agrobacterium portadora de pDAB1600 (DNA dador) e 250 μΐ de uma estirpe de Agrobacterium portadora de pDAB1598 (C2H2 Scd 27a ZFP-Fokl); três placas continham células cocultivadas com 50 μΐ de uma estirpe de Agrobacterium portadora de pDAB1600 (DNA dador) e 250 μΐ de uma estirpe de Agrobacterium portadora de pDAB4359 (C3H Scd27a ZFP-Fokl) . Após cocultura usando os métodos descritos atrás, as células foram semeadas em meio basal baseado em LS contendo 500 mg/1 de carbenicilina e 15 mg/1 de Bialaphos®. Isolados individuais resistentes a Bialaphos® surgiram 2-4 semanas após sementeira e foram transferidos para placas individuais de 60x20 mm (um isolado por placa) onde foram mantidos como calo num protocolo de subcultura de 14 dias até necessário para análise.
Obtiveram-se múltiplos isolados resistentes a Bialaphos® a partir da nuclease com dedos de zinco C3H IL-1 (pDAB4356) e da nuclease com dedos de zinco C3H Scd27 (pDAB4359). Estes isolados foram analisados por PCR usando o par de sequências iniciadoras P24/25, o qual amplificou um fragmento de DNA abrangendo o gene PAT reconstituído. A sequência iniciadora P24 era homóloga do extremo 5' da sequência codificadora de PAT no DNA dador e a sequência iniciadora P25 era homóloga do extremo 3' da sequência codificadora de PAT no DNA alvo. Um fragmento de PCR de 2,3 kb resultaria se duas sequências codificadoras de PAT parciais fossem ligadas através de recombinação homóloga. Como se mostra na Fig. 63, um produto de PCR de 2,3 kb foi obtido a partir de múltiplos isolados analisados. Estes isolados foram obtidos a partir da cotransformação do gene da proteina de fusão dedo de zinco IL-1 C3H-FokI/DNA dador e do gene da proteina de fusão dedo de zinco Scd27 C3H-Fokl/DNA dador. Os produtos de PCR de 2,3 kb derivados de múltiplos isolados independentes, representativos dos derivados das transformações com genes das proteínas de fusão dedo de zinco IL-1 C3H-FokI e dedo de zinco Scd27 C3H-FokI foram purificados dos géis de agarose e clonados no vector pCR2.1 TOPO (Invitrogen, Carlsbad, California). 0 produto de PCR de 2,3 kb inserido no vector TOPO foi então sequenciado usando o kit de sequenciação Dye Terminator Cycle Sequencing Kit (Beckman Coulter). Os resultados de sequenciação confirmaram que todos os produtos de PCR clonados no vector TOPO continham a sequência recombinada como previsto, incluindo as sequências parciais 5' e 3' do gene PAT com o intrão 1 de 4-CoAS de Ά. thaliana intercalado. Estes resultados confirmaram a recombinação intercromossómica prevista para ambas as estratégias e exemplificaram o alvejamento de genes através da expressão de genes de proteínas de fusão dedo de zinco C3H-Fokl.
Exemplo 13: Identificação de sequências de genes alvo em cultura de células de milho A. Identificação de sequências
Neste exemplo, sequências de DNA de um gene endógeno de milho de função conhecida foram seleccionadas como alvos para a edição de genomas usando nucleases com dedos de zinco. A estrutura genómica e a sequência deste gene, referido como IPP2-K, que deriva de uma linha singeneica de milho 5XH751 copropriedade, foi descrita em W02006/029296; cuja divulgação é aqui incluída como referência .
Em particular, a sequência genómica de IPP2-K foi usada para pesquisa da base de dados do genoma do milho TIGR (disponível na rede em http://www.tigr.org/tdb/tgi/ maize/) usando algoritmos BLAST. Vários outros fragmentos genómicos foram identificados com segmentos de homologia sobreponível com IPP2-K, incluindo, mas não lhes estando limitados, os acessos AZM515213 e TC311535. Com base na sequência destes números de acesso, assim como na sequência IPP2-K, foram desenhados múltiplos oligonucleótidos curtos para usar como sequências iniciadoras de PCR usando o programa Primer3 (Rozen, S. and Skaletsky, HJ. (2000) Primer 3 on the WWW for general users and for biologist programmers. In: Krawetz S, Misener S (eds.) Bioinformatics Methods and Protocols: Methods in Molecular Biology. Humana Press, Totowa, NJ, pp 365-386; também disponível na rede). Estas sequências iniciadoras incluem, mas não lhes estão limitadas, os seguintes oligonucleótidos com orientação directa: 1. 5'-ATGGAGATGGATGGGGTTCTGCAAGCCGC-3' (SEQ ID NO:104) 2. 5'-CTTGGCAAGGTACTGCGGCTCAAGAAGATTC-3' (SEQ IDNO:161) 3. 5'-ATGAAGAAAGACAGGGAATGAAGGAC-3' (SEQ ID NO :162) 4. 5'-ATGAAGAAAGACAGGGAATGAAGGACCGCCAC-3' (SEQ ID NO:163) 5. 5'-CATGGAGGGCGACGAGCCGGTGTAGCTG-3' (SEQ ID NO :164) 6. 5'-ATCGACATGATTGGCACCCAGGTGTTG-3' (SEQ ID NO:165)
Ainda, as sequências iniciadoras incluem, mas não lhes estão limitadas, os seguintes oligonucleótidos com orientação reversa: 7. 5'-TTTCGACAAGCTCCAGAAAATCCCTAGAAAC-3 ' (SEQ IDNO:166) 8. 5'-ACAAGCTCCAGAAAATCCCTAGAAACAC-3' (SEQ ID NO :167) 9. 5'-TTCGACAAGCTCCAGAAAATCCCTAGAAACAC-3' (SEQ IDNO:168) 10. 5'-TGCTAAGAACATTCTTTTCGACAAGCTCC-3' (SEQ IDNO:169) 11. 5'-GAACATTCTTTTCGACAAGCTCCAGAAAATCC-3' (SEQ IDNO:170)
Todas as sequências oligonucleotidicas iniciadoras foram sintetizadas e adquiridas a Integrated DNA Technologies (EDT, Coralville, IA). B. Cultura de células de milho Hill
Para se obter embriões imaturos para inicio da cultura de calos, foram realizados cruzamentos Fi entre progenitores Hi-II A e B crescidos em estufa (Armstrong, C, Green, C. and Phillips, R. (1991) Maize Genet. Coop. News Lett. 65: 92-93). Embriões de aproximadamente 1,0-1,2 mm de tamanho (-9-10 dias após polinização) foram colhidos de espigas saudáveis e esterilizados na superfície esfregando com sabão Liqui-Nox®, seguido de imersão em etanol a 70% durante 2-3 minutos, depois imersos em 20% de lixivia comercial (0,1% de hipoclorito de sódio) durante 30 minutos.
As espigas foram enxaguadas em água destilada estéril e os embriões zigóticos imaturos foram excisados assepticamente e cultivados em meio 15Agl0 (Meio N6 (Chu CC, Wang CC, Sun CS., Hsu C, Yin K.C, Chu CY., and Bi F. Y. (1975) Sei. Sinica 18:659-668), 1, 0 mg/1 2,4-D, 20 g/1 sacarose, 100 mg/1 de hidrolisado de caserna (digestão enzimática) , L-prolina 25 mM, 10 mg/1 de AgNCb, 2,5 g/1 Gelrite, pH 5,8) durante 2-3 semanas com o escutelo voltado para cima relativamente ao meio. Os tecidos com a morfologia esperada (Welter, ME, Clayton, DS, Miller, MA, Petolino, JF. (1995) Plant Cell Rep: 14:725-729) foram selectivamente transferidos, com intervalos de duas semanas, para meio 15Agl0 fresco durante aproximadamente 6 semanas, depois transferidos para meio 4 (Meio N6, 1,0 mg/1 2,4-D, 20 g/1 sacarose, 100 mg/1 hidrolisado de caserna (digestão enzimática), 6 mM L-prolina, 2,5 g/1 Gelrite, pH 5,8), em intervalos de duas semanas, durante aproximadamente 2 meses.
Para iniciar culturas embrionárias em suspensão, um volume de aproximadamente 3 ml de células sedimentadas (PCV) de tecido de calo derivado de um único embrião foi adicionado a aproximadamente 30 ml de meio liquido H9PC+ (mistura de sais basais MS (Murashige T., & Skoog F. (1962) Physiol. Plant. 15:473-497), Vitaminas MS modificadas contendo 10 vezes menos ácido nicotínico e 5 vezes mais tiamina-HCl, 2,0 mg/1 de 2,4-D, 2,0 mg/1 de ácido a-naftalenoacético (NAA) , 30 g/1 de sacarose, 200 mg/1 de hidrolisado de caseina (digestão com ácido), 100 mg/1 de mioinositol, 6 mM de L-prolina, 5% v/v de água de coco (adicionado imediatamente antes da subcultura), pH 6,0). As culturas em suspensão foram mantidas no escuro em frascos Erlenmeyer de 125 ml num agitador com temperatura controlada marcado para 125 rpm a 28°C. Durante o estabelecimento da linha celular (2-3 meses), as suspensões foram cultivadas cada 3,5 dias através da adição de 3 ml PCV de células e 7 ml de meio condicionado a 20 ml de meio liquido fresco H9CP+ usando um pipeta de bico largo. Quando atingiram a maturidade, conforme evidenciado pela duplicação do crescimento, as suspensões foram aumentadas de volume e mantidas em frascos de 500 ml pelo que 12 ml de PCV de células e 28 ml de meio condicionado foram transferidos para 80 ml de meio H9CP+. Quando completado o estabelecimento da cultura em suspensão, foram criopreser-vadas aliquotas para utilização posterior. Ver, WO 2005/107437 .
C. Isolamento e amplificação de DNA
Culturas de células Hill de milho como descritas atrás foram crescidas em frascos de 250 ml em meio GN6 padrão (meio N6, 2,0 mg/1 2,4-D, 30 g/1 sacarose, 2,5 g/1 Gelrite, pH 5,8) e o DNA genómico foi extraido usando o kit de extracção Plant DNeasy da Qiagen (Valencia, CA) de acordo com as recomendações do fabricante. As reacções de amplificação por PCR usando as sequências iniciadoras atrás descritas em todas as combinações possíveis foram realizadas nas seguintes condições: 25 μΐ de volume de reacção contendo 20ng gDNA matriz, 20pmol de cada sequência iniciadora, 1% DMSO e 10 unidades de polimerase Accuprime™ Pf (Invitrogen, Carlsbad, CA) no tampão do fabricante da enzima. Os produtos de amplificação variando entre 500 pb e 2 kb resultaram de ciclos de amplificação consistindo em 95 °C-1' , ( 95 °C-3 0 ", 57-62°C-30", 72°C-1') X 30, 72°C-5\ 4°C-restante tempo. Os fragmentos amplificados foram clonados directamente em pCR2.1 (Invitrogen, Carlsbad, CA) usando o kit de clonagem TA da Invitrogen (Carlsbad, CA) de acordo com as recomendações do fabricante. D. Análise das sequências A análise anterior do gene IPP2-k em culturas singeneicas de milho 5XH751 e Hill indicaram a presença de 2-3 genes distintos compreendendo uma família pequena de genes (Sun et ai., in press, Plant Physiology; W02006029296) . Assim, os fragmentos clonados isolados foram sequenciados com o kit de sequenciação CEQ Dye Terminator Cycle Sequencing Kit da Beckman Coulter (Fullerton, CA) de acordo com as recomendações do fabricante. A análise da sequência de múltiplos clones revelou que 2 fragmentos de genes distintos, derivados de 2 loci distintos e previamente caracterizados do genoma de milho, tinham sido isolados a partir de células Hill. A comparação das duas sequências isoladas a partir das células Hill cultivadas indicou que, nas regiões codificadoras previstas, existem pequenas diferenças, tais como polimorfismos em nucleótidos isolados (SNPs), entre os 2 paralogos, enquanto as regiões intrónicas e não codificadoras variam significativamente ao nivel dos nucleótidos. Estas diferenças entre os 2 paralogos são notadas pois evidenciam regiões de sequências que podem ser discriminadas através de uma proteina de ligação a DNA dependente de sequência, como seja um dominio dedo de zinco. Os familiarizados com a área podem desenhar dominios de ligação a DNA dedos de zinco que se ligam a uma sequência de um gene e não a outra, sequência de um gene altamente semelhante. A sequência parcial do gene de 1,2 kb correspondendo ao paralogo de interesse (Fig. 66) foi seleccionada como matriz para o desenho de proteínas nucleases com dedos de zinco e subsequentemente sujeita à análise de dominios de ligação dedos de zinco atrás descrita.
Exemplo 14: Desenho do dominio dedo de zinco de ligação a DNA de IPP2-K
Usando locais alvo identificados para IPP2-K, seleccionaram-se hélices de reconhecimento relativamente a dedos de zinco IPP2-K. Os desenhos dos dedos de zinco estão apresentados abaixo na Tabela 8:
Tabela 8: Desenhos de dedos de zinco IPP2-K
Os locais alvo dos desenhos de dedos de zinco estão mostrados abaixo na Tabela 9:
Tabela 8: Locais alvo dos dedos de zinco IPP2-K
Os desenhos de IPP2-K foram incorporados em vectores de expressão de dedos de zinco codificadores de uma proteina tendo a estrutura CCHC. Ver, Tabelas 1 a 4 atrás. As sequências codificadoras de dedos de zinco não canónicos foram então fundidas com o dominio de nuclease da enzima de restrição tipo IIS Fokl (aminoácidos 384-579 da sequência Wah et al. (1998) Proc. Natl. Acad. ScL USA 95:10564-10569 através de um ligante ZC de quatro aminoácidos) para formar ZFNs IPP2-K.
Exemplo 15: Correcção de genes usando dedos de zinco IPP2-K-nucleases A capacidade de ZFNs IPP2-K como aqui descrito para facilitar a recombinação homóloga foi testada no sistema GFP descrito em Urnov (2005) Nature 435(7042):646-51 e Publicação de Patente U.S. No. 20050064474 (e.g.,
Exemplos 6-11) . Resumidamente, 50 ng de cada ZFN e 500 ng do dador GFP sem promotor (Urnov (2005) Nature) foram transfectados para 500000 células repórter, usando 2 μΐ de Lipofectamine 2000 por amostra, de acordo com o protocolo Lipofectamine 2000 da Invitrogen.
Adicionou-se vinblastina 24 horas pós-transfecção numa concentração final de 0,2 μΜ e removeu-se 72 horas pós-transfecção.
As células foram testadas relativamente à expressão de GFP 5 dias pós-transfecção através da medição de 40000 células por transfecção no analisador FACS de bancada Guava. Os resultados estão apresentados na Fig. 69.
Exemplo 16: Expressão de ZFNs C3H1 em células de milho Hill A. Desenho de vectores
Construíram-se vectores plasmídicos para a expressão de proteínas com ZFNs em células de milho. De forma a optimizar a expressão e estequiometria relativa das 2 proteínas distintas necessárias para formar um heterodímero funcional dedo de zinco-nuclease, adoptou-se uma estratégia de expressão que resulta em grelhas de leitura abertas de ambos os monómeros ZFNs num único vector, dirigidas por um único promotor. Esta estratégia explora a funcionalidade da sequência 2A (Mattion, N.M., Harnish, E.C., Crowley, J. C. & Reilly, P.A. (1996) J. Virol. 70, 8124-8127) derivada do vírus de Thesoa assigna, um sinal de localização nuclear (NLS) do gene opaque-2 (op- 2) de milho (Maddaloni, M., Di Fonzo, N., Hartings, H., Lazzaroni, N., Salaminil, F., Thompson, R., & Motto M. (1989) Nucleic Acids Research Vol. 17(18):7532), e um promotor derivado do gene da ubiquitin-1 do milho (Christensen A.H., Sharrock R.A., & Quail P.H. (1992) Plant Mol Biol. 18(4):675-89). Seguiu-se um esquema de clonagem modular, em vários passos, para desenvolver estes vectores de expressão para qualquer par especifico de genes codificadores de ZFN seleccionados do arquivo biblioteca ou sintetizados de novo.
Primeiro, um vector pVAX (ver, por exemplo, a Publicação de Patente U.S. 2005-0267061; a divulgação da qual é aqui incluida como referência) foi modificado para abranger o dominio de expressão N-terminal como se mostra na Fig. 65, painéis A a E. As caracteristicas deste plas-mideo modificado (pVAX-N2A-NLSop2-EGFP-FokMono) (FIG. 65A) incluem um segmento redesenhado e sintetizado codificador de um NLS derivado de op-2 do milho(RKRKESNRESARRSRYRK, SEQ ID NO: 133) e um segmento redesenhado e sintetizado codificador do dominio de nuclease Fokl utilizando os codões mais usados pelo milho. Ainda, a inserção de um único nucleótido (C) a jusante do local único Xhol criou um local Saci extra por conveniência de clonagem.
Segundo, um vector pVAX (ver, por exemplo, a Publicação de Patente U.S. 2005-0277061) foi igualmente modificado para abranger o dominio de expressão C-terminal
As características deste plasmídeo modificado (pVAX-C2A-NLSop2-EGFP-FokMono) (FIG. 65B) incluem um segmento redesenhado e sintetizado codificador de um NLS derivado da op-2 de milho (RKRKE SNRE S ARRSRYRK, SEQ ID NO: 133) e um segmento redesenhado e sintetizado codificador do dominio nuclease Fokl usando os codões mais usados pelo milho. Ainda, a sequência 2A do virus de Thosea asigna (EGRGSLLTCGD VEENPGP, SEQ ID NO: 134) foi introduzido no extremo N da ORF de ZFN para o fim da subsequente ligação dos dominios codificadores das 2 proteínas.
As cassetes de genes codificadores das ORFs das proteínas individuais com dedos de zinco foram clonadas no vector N2A ou C2A através de ligação, usando as enzimas de restrição Kpnl e BamHI para criar extremos compatíveis. Em seguida, o fragmento BglII/Xhol do vector C2A foi inserido no vector N2A através dos mesmos locais de restrição, dando uma construção intermédia que possui uma cassete que inclui 2 dominios codificadores de ZFN flanqueados por locais de restrição Ncol e Saci.
Finalmente, a cassete NcoI/SacI desta construção intermédia (Fig. 65C), contendo ambos os genes ZFN, foi excisada através de restrição usando aquelas enzimas e ligada ao esqueleto do plasmídeo pDAB3872 (FIG. 65D) . Os plasmídeos resultantes incluem os genes ZFN mais as sequências relevantes de promotor e terminador, mais marcas seleccionáveis para a manutenção do plasmídeo.
Nas construções finais, um exemplo das quais está mostrado na Fig. 65E, a cassete de expressão de ZFN (incluindo os elementos de promotor e terminador) é flanqueada por locais attL para uma manipulação conveniente usando o sistema Gateway da Invitrogen (Carlsbad, CA) . Cada uma das construções de ZFN geradas usando este esquema de clonagem foi usada para transformar células E. coli DH5a (Invitrogen, Carlsbad, CA) e subsequentemente mantida sob selecção adequada. B. Entrega de DNA e expressão transitória
As preparações de plasmideo dos vectores de expressão de ZFN construídos como descrito na Fig. 65E foram geradas a partir de 2 litros de cultura de células E. coli crescidas em meio LB mais dois antibióticos usando um kit Gigaprep da Qiagen (Valencia, CA) de acordo com as recomendações do fabricante. 0 DNA plasmidico foi entregue directamente a células de milho Hill em cultura usando uma variedade de métodos.
Num exemplo, as células de milho foram sujeitas a entrega de DNA através de Whoskers™. Aproximadamente 24 horas antes da entrega do DNA, 3 ml de PCV de suspensão de células de milho Hill mais 7 ml de meio condicionado foram subcultivados em 20 ml de meio liquido GN6 (meio GN6 sem Gelrite) num balão Erlenmeyer de 125 ml e colocados num agitador a 125 rpm, a 28°C, durante 24 horas. 2 ml de PCV foram removidos e adicionados a 12 ml de meio osmótico GN6 S/M (meio N6, 2,0 de mg/1 2,4-D, 30 g/1 de sacarose, 45,5 g/1 de sorbitol, 45,5 g/1 de manitol, 100 mg/L de mioinositol, pH 6,0) num balão Erlenmeyer de 125 ml. O frasco foi incubado no escuro durante 30-35 minutos, a 28°C, com agitação moderada (125 rpm). Durante este tempo, uma suspensão de 50 mg/ml de palhetas de carbeto de silicio (Advanced Composite Materials, Inc., Eureka Springs, AK) foi preparada através da adição do volume apropriado de meio liquido GN6 S/M a palhetas pré-pesadas. Após incubação em GN6 S/M, os conteúdos de cada frasco foram vertidos num tubo de centrífuga cónico de 15 ml.
Após sedimentação das células, todo o liquido GN6 S/M excepto 1 ml foi retirado e colhido no frasco de 125 ml para uso futuro. A suspensão pré-pesada de palhetas foi agitada com vórtex durante 60 segundos à velocidade máxima, 160 μΐ foi adicionado ao tubo de centrífuga usando uma ponta de micropipeta com filtro e de ponta larga, e adicionados 20 yg de DNA. O tubo foi agitado com vortex e imediatamente colocado num amalgamador dentário Caulk "Vari-Mix II", modificado para suportar um tubo de cultura de 17x100 mm e depois agitado durante 60 segundos a velocidade média. Após agitação, a mistura de células, meio, palhetas e DNA voltou para o balão Erlenmeyer juntamente com 18 ml de mais meio liquido GN6. As células foram deixadas a recuperar num agitador a 125 rpm, durante 2 horas, a 28°C, no escuro.
Aproximadamente 5-6 ml de suspensão dispersa foi filtrada através de um papel de filtro Whatman #4 (5,5 cm) usando uma unidade colectora de células em vidro, ligada a uma linha de vácuo, de forma a serem obtidos 5-6 filtros por amostra. Os filtros foram colocados em placas de 60 x 20 mm de meio G6N e cultivadas a 28°C no escuro. Após 24, 48 ou 72 horas, as células de 2-5 papéis de filtro foram raspadas, colhidas num tubo, colocadas em gelo seco e depois congeladas a -80°C.
Num outro exemplo de entrega de DNA, as preparações de plasmideo purificadas sem endonucleases foram entregues directamente a células de milho usando técnicas de bombardeamento com microprojécteis adaptadas do protocolo do fabricante do instrumento. Todos os bombardeamentos foram conduzidos com o sistema Biolistic PDS-1000/He™ (Bio-Rad Laboratories, Hercules, CA) . Para o revestimento das partículas, 3 mg de partículas de ouro com 1,0 micron de diâmetro foram lavadas uma vez com 100% de etanol, duas vezes com água estéril e ressuspensas em 50 μΐ de água num tubo Eppendorf siliconizado. Cinco microgramas de DNA plasmidico, 20 μΐ de espermidina (0,1 M) e 50 μΐ de cloreto de cálcio (2,5 M) foram adicionados à suspensão de ouro. A mistura foi incubada à temperatura ambiente durante 10 min, sedimentada a 10 Krpm durante 10 s, ressuspensa em 60 μΐ de etanol a 100% frio e 8-9 μΐ foram distribuídos por cada macroveiculo. Para preparar as células para bombardeamento, grupos de células foram removidos da cultura liquida 3 dias após subcultura e colocados numa placa de petri de 2,5 cm de diâmetro contendo meio osmótico consistindo em meio de crescimento mais 0,256 M de manitol e sorbitol. As células foram incubadas em meio osmótico durante 4 h antes do bombardeamento. O bombardeamento decorreu no instrumento atrás descrito colocando-se o tecido na prateleira do meio nas condições de 1100 psi e vácuo de 27 polegadas Hg e seguindo o manual de manuseamento. Às 24 horas pós-tratamento, o conjunto de células bombardeadas foi colhido, congelado em N2 liquido e guardado a -80°C.
Um outro exemplo de entrega de DNA e expressão transitória de ZFNs em células de milho envolveu a utilização de preparações de protoplastos. Usando os métodos modificados de Mitchell and Petolino (1991) J. Plant. Physiol. 137: 530-536 e Lyznik et al. (1995) Plant J. 8(2): 177-186), prepararam-se protoplastos a partir de culturas de células de milho Hill. As culturas em suspensão foram colhidas 48 horas após subcultura (crescimento a meio da fase logarítmica) através de centrifugação a 1000 rpm durante 5 minutos. O meio de cultura foi removido e 5 ml de PCV sedimentado foi suavemente lavado em 10 ml de meio W5 (154 mM de NaCl2; 12 5 mM de CaCl2 H2O; 5 mM de KCI2; 5 mM de glucose; pH 5,8).
As células lavadas foram colhidas por centrifugação a 100 rpm durante 5 minutos e subsequentemente incubadas numa mistura de enzimas contendo % celulase Y-C + 0,3% pectoliase Y23 (Karlan Research Products Corp., Cottonwood, AZ) em 25 ml de meio K3 esterilizado por filtração (2,5 g KNO3; 250 mg de NH4NO3; 900 mg de CaCl2 (diidratado) ; 250 mg de Mg2SC>4; 250 mg de NH4SO4; 150 mg NaP04 (monobásico) ; 250 mg de xilose; 10 ml de stock sulfato ferroso/quelato (F318); 1 ml micronutriente B5 (1000X stock - 750 mg iodeto de potássio; 250 mg de ácido molibdico (sal sódico) desidratado; 25 mg de cloreto de cobalto; 25 mg de sulfato cúprico) ; 10 ml de Vitaminas K3
(10OX stock - 1 g de mio-inositol; 10 mg de piridoxina HCl; 100 mg de tiamina HCl; 10 mg de ácido nicotinico) ; + 0,6M de manitol; pH=5,8] . As células foram incubadas a 25°C durante 5-6 horas com agitação suave (50 rpm) de modo a digerir a parede secundária da célula vegetal.
Quando da degradação da parede celular, a mistura de enzimas-células foi filtrada através de um coador de células de 100 micron e o material não retido, contendo protoplastos e detritos celulares, foi lavado com igual volume de meio K3 + 0,6M manitol. Os protoplastos foram centrifugados a 800 rpm durante 5 minutos, o sobrenadante foi rejeitado e a lavagem repetida. O sedimento de protoplastos foi ressuspenso e lavado em 20 ml de solução K3 + 0,6 M de manitol + 9% de Ficoll 400. Dez ml desta solução foi distribuído por 2 tubos de plástico estéreis e cobriu-se suavemente a suspensão com 2 ml de meio TM (19,52 g de MES; 36, 45 g de manitol; 40 ml de stock CaCÍ2 2M H2O; pH=5,5)), formando um gradiente descontinuo.
Os protoplastos viáveis foram separados dos protoplastos não viáveis, detritos celulares e suspensão de células intactas através de centrifugação a 800 rpm durante 5 minutos. A banda de protoplastos distinta, formada na interface do gradiente, foi removida com uma pipeta e lavada com 10 ml de solução TM fresca, seguido de centrifugação a 800 rpm durante 5 minutos. O sedimento de protoplastos resultante foi ressuspenso em 1 ml de meio TM e o número de protoplastos viáveis foi quantificado por coloração com 25 mg/ml de diacetato de fluoresceína (FDA) num hemocitómetro. A solução de protoplastos foi ajustada a uma concentração final de lxlO7 protoplastos/ml em meio TM.
Aproximadamente lxlO6 protoplastos (100 μΐ) foram transferidos para um tubo Eppendorf contendo 10-80 yg de DNA plasmídico purificado. 100 μΐ de uma solução a 40% de PEG-3350 (Sigma Chemical Co., St. Louis, MO) foi adicionada gota-a-gota e a suspensão misturada suavemente. A mistura de protoplastos/DNA foi incubada durante 30 minutos à temperatura ambiente, seguido de uma diluição gota-a-gota com 1 ml de meio de crescimento GN6. Os protoplastos diluídos foram incubados neste meio durante 24 horas, a 25°C, e subsequentemente colhidos, congelados em N2 líquido e guardados a -80°C.
Exemplo 17: funcionalidade de ZFN in vivo A funcionalidade de um ZFN neste exemplo é entendida como incluindo (mas não lhe estando limitada) a capacidade de um ZFN expressar-se em células de uma espécie cultivada e desse ZFN mediar uma quebra de cadeia dupla no genoma endógeno desse cultivar, através do reconhecimento, ligação e corte do seu alvo pretendido. É também entendido que, neste exemplo, o alvo do ZFN é um gene num locus e conformação endógenos dentro do genoma do cultivar.
De forma a avaliar se os ZFNs possuem funcionalidade contra o gene alvo previsto num contexto genómico, foram estabelecidos ensaios baseados em sequências de DNA. Prevê-se que as quebras de DNA de cadeia dupla induzidas por ZFNs induzam mecanismos de reparação como ligação de extremos não homólogos (NHEJ) (revisto por Cahill et ai., (2006) Mechanisms Front Biosci. 1(11): 1958-76). Um desfecho de NHEJ é que uma proporção das cadeias de DNA partidas sejam reparadas numa forma imperfeita, resultando em pequenas deleções, inserções ou substituições no local de civagem. Os familiarizados com a áres podem detectar estas alterações na sequência de DNA através de uma variedade de métodos.
A. Clonagem e sequenciação baseada em PCR
Num exemplo, as células de culturas Hill de milho expressando proteínas ZFN foram isoladas às 24 horas pós-transformação, congeladas e sujeitas a extracção de DNA genómico usando o kit de extracção da Qiagen (Valencia, CA) Plant DNeasy de acordo com as recomendações do fabricante. A amplificação por PCR foi realizada usando sequências iniciadoras oligonucleotídicas específicas para o gene alvo e flanqueando o local de clivagem previsto do ZFN. Uma sequência iniciadora para PCR com orientação directa (5' — GGAAGCATTATTCCAATTTGATGATAATGG-3') (SEQ ID NO: 135) e uma sequência iniciadora para PCR com orientação reversa (5' — CCCAAGTGTCGAGGTTGTCAATATGTTAC-3') (SEQ ID NO: 136) especifica do paralogo do gene IPP2-K foram usadas em combinação para amplificar DNA genómico purificado nas seguintes condições: 25 μΐ de volume de reacção contendo 20ng de gDNA matriz, 20 pmol de cada sequência iniciadora, 1% DMSO e 10 unidades da polimerase Accuprime Pf (Invitrogen, Carlsbad, CA) no tampão do fabricante da enzima. Produtos de amplificação com o tamanho esperado resultaram de ciclos de amplificação consistindo em 95°C-1', (95°C-30", 61°C-30", 72°C-1') X 30, 72 °C-5' , 40C-restante.
Os fragmentos amplificados foram clonados directamente no vector pCR2.1 (Invitrogen, Carlsbad, CA) usando o kit de clonagem TA da Invitrogen (Carlsbad, CA) . Os fragmentos clonados isolados foram sequenciados com o kit de sequenciação CEQ Dye Terminator Cycle Sequencing Kit da Beckman Coulter (Fullerton, CA) de acordo com as recomendações do fabricante num formato de 96 alvéolos. Nesta experiência, prevê-se que as proteínas ZFN se liguem a 2 sequências curtas especificas do gene IPP2-K para criar uma nuclease heterodimérica que corta o dsDNA como se mostra na Fig. 66. A análise dos resultados de sequenciação de múltiplos clones revelaram que o clone #127 continha uma pequena deleção no local de clivagem por ZFN exactamente previsto, indicando que o mecanismo NHEJ tinha mediado uma reparação imperfeita da sequência de DNA nesse local (Fig. 67) .
Estes resultados demonstram a capacidade destes ZFNs manipulados para induzir quebras de cadeia dupla dirigidas, numa forma especifica, num locus de um gene endógeno dentro de um cultivar. B. Análise por sequenciação massiva paralela
Num outro exemplo, uma combinação de PCR e de métodos de piro-sequenciação massiva paralela foram aplicados para questionar os genomas de múltiplas amostras de células expressando diferentes proteínas ZFN dirigidas contra esta mesma sequência. Foram sintetizadas três variantes de uma sequência iniciadora de PCR com orientação directa (5'-XXXCACCAAGTTGTATTGCCTTCTCA-3') (SEQ ID NO: 137) em que XXX=GGG, CCC ou GGC e três variantes de uma sequência inicidora de PCR de orientação reversa (5'-XXXAT AGGCTTGAGCCAAGCAATCTT-3 ' ) (SEQ ID NO: 138) em que XXX=GCC, CCG ou CGG (IDT, Coralville, IA) . As etiquetas de 3 pb no extremo 5' de cada sequência iniciadora servem como uma chave identificadora e indicam a amostra celular de onde deriva o amplicão. Pares de sequências iniciadoras com etiquetas (chaves) identificadoras correspondentes foram usados em combinação para amplificar DNA genómico purificado derivado de amostras de células de milho nas seguintes condições: 50 μΐ de volume de reacção contendo 40 ng de gDNA matriz, 20 pmoles de cada sequência iniciadora, 1% DMSO e 10 unidades de polimerase Accuprime™ Pf (Invitrogen, Carlsbad, CA) no tampão do fabricante da enzima. Os produtos de amplificação do tamanho esperado resultaram de ciclos de amplificação consistindo em 95°C-1', (95°C-30", 65°C-30", 72°C-1') X 30, 72°C-5', 4°C-restante tempo e foram purificados usando o kit de purificação da Qiagen (Valencia, CA) MinElute PCR de acordo com as recomendações do fabricante.
As reacções de piro-sequenciação paralela massiva (também conhecidas como sequenciação 454) foram realizadas directamente nos produtos de PCR como descrito em (Margulies et ai. (2005) Nature 437: 376-380) por 454 Life Sciences (Branford, CT). A análise dos resultados de sequenciação 454 foi realizada através da identificação de leituras de sequências contendo deleções do tamanho e posição esperadas dentro da molécula de DNA.
Os resultados destas análises indicaram a presença de múltiplas deleções pequenas no local de clivagem esperado para estas ZFNs, como se mostra na Fig. 68. Estas deleções estão precisamente localizadas no local alvo de ZFN e indicam que quebras ds, induzidas por ZFN, foram geradas no genoma e subsequentemente reparadas por NHEJ. Estes resultados ainda demonstram a capacidade destes ZFNs manipulados para induzir quebras de cadeia dupla dirigidas numa forma especifica num locus de gene endógeno dentro de um cultivar.
Exemplo 18: Desenho de DNA dador para integração dirigida
Neste exemplo, o DNA dador é entendido como incluindo moléculas de DNA de cadeia dupla que são entregues nas células vegetais e incorporadas no genoma nuclear. 0 mecanismo pelo qual esta incorporação ocorre pode ser via ligação de extremos não homóloga independente de homologia (NHEJ; revisto por Cahill et al. , (2006) Mechanisms Front Biosci. 1:1958-76) ou um outro mecanismo semelhante no local de uma quebra na cadeia dupla no DNA nuclear. Tal incorporação do DNA dador tipo ligação conduzida por NHEJ no genoma é referida como integração aleatória, uma vez que a posição da integração do DNA dador é determinada principalmente pela presença de uma quebra de DNA de cadeia dupla. Neste mecanismo, a integração do DNA dador no genoma não está dependente da sequência de nucleótidos do genoma no local da quebra ou da sequência nucleotídica do próprio dador. Assim, durante a integração aleatória, o "endereço" no genoma onde o DNA dador é incorporado não está especificado nem previsto com base na sequência do DNA dador. A integração aleatória é o principal mecanismo pelo qual a transgenese do DNA dador ocorre durante a transformação padrão de plantas via entrega de DNA mediada por Agrobacterium ou por biolística nas células vegetais.
Ao contrário da integração aleatória, o DNA dador pode também ser incorporado no genoma através de integração dirigida. A integração dirigida é entendida como ocorrendo no local de uma quebra da cadeia dupla (posição) através de mecanismos dependentes de homologia tais como emparelha-mento de cadeia simples dependente de homologia ou recombinação homóloga (revisto em van den Bosch et al. (2002) Biol Chem. 383(6): 873-892). No caso de reparação de quebras de DNA dependentes de homologia, o DNA dador que contém a sequência nucleotidica com identidade ou similaridade com o DNA do local da quebra pode ser incorporado nesse local. Assim, o "endereço" em que o DNA dador se integra no genoma está dependente da identidade de sequência de nucleótidos ou similaridade de sequências entre as moléculas do genoma e de DNA dador. Nos sistemas vegetais, sabe-se que a reparação das quebras de cadeia dupla no DNA utiliza as vias de NHEJ e dependente de homologia (revisto em Puchta (2005) J. Exp. Bot. 56: 1-14).
Neste exemplo, descrevemos o desenho e construção de moléculas de DNA dador a serem integradas no genoma, via integração dirigida, no local de uma quebra de cadeia dupla induzida por proteínas ZFN especificas de sequência. Diferentes proteínas ZFN podem induzir quebras da cadeia dupla em diferentes nucleótidos na sequência do gene alvo; o local especifico da quebra da cadeia dupla induzida é referido como a posição.
Como descrito no Exemplo 13, caracterizámos a sequência nucleotidica de um gene alvo, IPP2K do milho.
Subsequentemente, desenhámos proteínas ZFN para se ligarem a bases específicas daquele gene alvo (Exemplo 14) e validámos a sua actividade de ligação/clivagem naquela sequência dentro do gene alvo em ambos os sistemas heteró-logos e contra o gene endógeno em células de milho (Exemplos 15-17) . Aqui, descrevemos a construção de várias moléculas dadoras desenhadas para se incorporarem no genoma de milho na posição da quebra de cadeia dupla mediada por ZFN no gene IPP2K via integração dirigida. Os familiarizados com a técnica podem construir uma molécula de DNA dadora desenhada para se incorporar numa quebra de cadeia dupla, induzida por ZFN via integração dirigida conduzida por homologia, em qualquer posição em qualquer genoma para o qual seja conhecida a sequência nucleotídica e seja previsto que essa sequência contenha uma quebra de cadeia dupla.
Numa realização aqui descrita, a molécula de DNA dador compreende uma cassete autónoma de expressão do gene de tolerância a herbicida delimitada por segmentos de sequência nucleotídica idêntica à do gene alvo, IPP2K na posição alvo. Nesta realização, a cassete autónoma de tolerância a herbicida inclui uma unidade completa de promotor-transcrição (PTU) contendo um promotor, o gene de tolerância a herbicida e sequência terminadora funcionais em células vegetais. Os familiarizados com a técnica podem seleccionar qualquer combinação de promotor, gene e terminador para constituir a PTU autónoma. Também estão incluídos nesta construção de plasmídeo fragmentos de DNA com identidade de sequências relativamente ao gene alvo no milho (IPP2K) na posição indicada. Estes fragmentos servem como "sequências flanqueantes de homologia" do DNA dador e incorporação directa deste dador no gene alvo na posição especificada através de integração dirigida. As sequências flanqueantes de homologia são colocadas a montante e a jusante da PTU na orientação 5'-3' correcta relativamente a PTU. Os familiarizados com a técnica podem considerar sequências flanqueantes de homologia de tamanho e orientação diferentes numa construção de DNA dador.
Numa outra realização aqui descrita, a molécula de DNA dador compreende uma construção de plasmideo contendo uma cassete de expressão do gene de tolerância a herbicida não autónoma, flanqueada por segmentos de sequência nucleotidica idênticos aos de IPP2K na posição alvo. Nesta realização, a cassete de tolerância a herbicida não autónoma inclui uma unidade de promotor-transcrição (PTU) incompleta que não possui um promotor funcional. A PTU não autónoma possui um gene de tolerância a herbicida e sequência terminadora funcional em células vegetais. Os familiarizados com a técnica podem seleccionar qualquer combinação de gene e terminador para constituir uma PTU não autónoma. Neste exemplo de um dador não autónomo, a expressão do gene da tolerância a herbicida é dependente da incorporação do segmento dador numa localização genómica próxima de um promotor funcional que pode dirigir a expressão daquele gene. Deve-se considerar a situação relativamente rara em que o dador será incorporado através de integração aleatória num locus genético onde se situe, por serendipidade, um promotor e esteja disponível para dirigir a expressão do gene de tolerância a herbicida. Como alternativa, baseado na presença de sequências flanqueantes de homologia dos fragmentos de DNA de tamanho adequado com identidade de sequência com o gene alvo numa posição especificada em milho dentro da construção de DNA dador, pode ocorrer integração dirigida precisa do DNA dador no gene alvo na posição especificada (como descrito para o dador autónomo) e portanto explora o promotor endógeno do referido gene alvo. Nesta realização, as sequências flanqueantes de homologia são colocadas a montante e a jusante da PTU na orientação correcta 5'-3' relativamente à PTU. Os familiarizados com a técnica podem considerar sequências flanqueantes de homologia de tamanho e orientação diferentes numa construção de DNA dador.
Em ambas as realizações aqui descritas (desenho de dador autónomo e não autónomo), as construções de plasmídeo, tipicamente, possuem elementos adicionais para permitir a clonagem, expressão do gene de tolerância a herbicida e subsequente análise. Tais elementos incluem origens de replicação bacterianas, locais de restrição manipulados, etc. e são descritos abaixo. Os familiarizados com a técnica podem considerar a utilização de diferentes elementos constituintes de uma molécula de DNA dador. A. Estirpes bacterianas e condições de cultura
Estirpes de Escherichia coli (One Shot® Top 10 Chemically Competent Cells; MAX Efficiency® DH5a™ Chemically Competent Cells, Invitrogen Life Technologies, Carlsbad, CA) foram crescidas a 37°C, 16 hrs, usando meio liquido de Luria-Bertani (LB: 10 g/1 Bactotriptona, 10 g/1 NaCl, 5 g/1 extracto de levedura Bacto) , agar LB (meio liquido LB mais 15 g/1 de agar Bacto) , ou meio Terrific (TB: 12 g/1 Bactotriptona, 24 g/1 extracto de levedura
Bacto, 0,4% v/v glicerol, 17 mM KH2PO4, 72 mM K2HPO4) . As culturas liquidas foram agitadas a 200 rpm. Consoante necessário, foram adicionados ao meio cloranfenicol (50 pg/ml), canamicina (50 pg/ml) ou ampicilina (100 pg/ml). Todos os antibióticos, meios de cultura e reagentes tampão usados neste estudo foram adquiridos à Sigma-Aldrich Corporation (St. Louis, MO) ou à Difco Laboratories (Detroit, MI). B. Esqueleto de plasmideo posição 1
Um esqueleto de plasmideo contendo sequências flanqueantes de homologia para a posição 1 de IPP2K foi manipulado para permitir a integração da sequência de DNA dador no local alvo correspondente do gene IPP2K. Os familiarizados com a técnica podem planear esqueletos de plasmideo usando vários locais de clonagem, elementos modulares e sequências homólogas de qualquer sequência alvo dentro do genoma de interesse. O esqueleto de plasmideo aqui exemplificado tem origem no vector plasmideo base pBC SK(-) fagemideo (3,4 kpb) (Stratagene, La Jolla, CA). Uma sintese em quatro passos como descrita abaixo foi usada para construir o esqueleto do plasmideo posição 1.
No passo #1, preparou-se o plasmideo base. Três yg de pBC SK(-) foram linearizados usando endonucleases de restrição, 10 unidades de Spel e 10 unidades de Notl (New England Biolabs, Beverly, MA), durante 1 hr a 37°C. O DNA cortado foi sujeito a electroforese a 100 V durante 1 hr num gel de 1,0% de agarose em TAE (0,04 M Tris-acetato, 0,002 M EDTA) suplementado com 0,5% de brometo de etideo (Sigma-Aldrich Corporation, St. Louis, MO). Os fragmentos de DNA foram visualizados com luz UV e o tamanho dos fragmentos estimados por comparação com a escada de DNA de 1 kpb (Invitrogen Life Technologies, Carlsbad, CA). O vector de subclonagem, pBC SK(-), de 3,4 kpb digerido com Spel/Notl foi removido do gel e purificado de acordo com as instruções do fabricante usando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA).
No passo #2, foram isoladas as sequências flanqueantes 5' e 3' de IPP2K posição 1. As sequências oligonucleotidicas que se seguem foram sintetizadas por Integrated DNA Technologies, Inc. (Coralville, IA) em condições padrão de desalinação e diluidas com água para uma concentração de 0,125 yg/yl: 5'-GCGGCCGCGTCTCACCGCGGCTTGGGGATTGGATACGGAGCT-3' (SEQ ID NO:143) 5'-ACTAGTGATATGGCCCCACAGGAGTTGCTCATGACTTG-3' (SEQ ID NO:144) 5'-ACTAGTCCAGAACTGGTTGAGTCGGTCAAACAAGATTGCT-3' (SEQ ID NO:145) 5'-GTCGACCTTGATGCTACCCATTGGGCTGTTGT-3' (SEQ IDNO:146)
As reacções de amplificação por PCR foram realizadas usando reagentes fornecidos por TaKaRa Biotechnology Inc., Seta 3-4-1, Otsu, Shiga, 520-2193, Japan consistindo no seguinte: Cinco μΐ de tampão 10X LA PCR™ Buffer II (Mg2 + ) , 20 ng gDNA matriz de cadeia dupla (milho Hill), 10 pmol da sequência oligonucleotídica directa, 10 pmol da sequência oligonucleotídica reversa, 8 μΐ da mistura de dNTPs (2,5 mM cada), 33,5 μΐ PRO, 0,5 μΐ (2,5 unidades) DNA-polimerase TaKaRa LA Taq™, 1 gota de óleo mineral. As reacções de PCR foram realizadas usando um termociclador Perkin-Elmer Cetus, DNA Thermal Cycler (Norwalk, CT) de 48 amostras, nas seguintes condições: 94°C, 4 min/1 ciclo; 98°C 20 sec, 65°C 1 min, 68°C 1 min/30 ciclos; 72°C, 5 min/1 ciclo; 4°C/restante. Quinze μΐ de cada reacção de PCR foram sujeitos a electroforese a 100 V durante 1 hr num gel de 1,0% de agarose em TAE agarose suplementado com 0,5% de brometo de etídio. Os fragmentos amplificados foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os produtos de amplificação esperados foram diagnosticados pela presença de fragmentos de DNA de 0,821 kpb (sequência flanqueante de homologia 5') ou 0,821 kpb (sequência flanqueante de homologia 3').
Estes fragmentos foram removidos do gel e purificados de acordo com as instruções do fabricante usando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA). Os fragmentos purificados foram então clonados no plasmídeo pCR2.1 usando o kit de clonagem TOPO TA Cloning® Kit (com o vector pCR®2.1) e células E. coli quimicamente competentes One Shot® TOPIO (Invitrogen Life Technologies, Carlsbad, CA) de acordo com o protocolo do fabricante.
Colónias individuais foram inoculadas num tubo Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de canamicina e incubadas 16 hrs, a 37°C, com agitação a 200 rpm. Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrifuga de 1,7 ml Costar (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmidico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid Kit (BD Biosciences/Clontech/Macherey-Nagel, Paio Alto, CA) . Três yg do plasmídeo isolado a partir de plasmídeos dos clones com sequências de homologia 5' foram digeridos com 10 unidades de Spel e NotI. Os plasmídeos de clones com sequências de homologia 3 ' foram digeridos com 10 unidades de Spel e 20 unidades de Sail (New England Biolabs, Beverly, MA) . Todas as digestos de plasmídeos foram incubadas durante 1 hr a 37°C. 0 DNA cortado com enzimas de restrição foi sujeito a electro-forese a 100 V durante 1 hr num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etidio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os clones plasmidicos esperados foram diagnosticados pela presença de fragmentos de DNA inseridos de 0,821 kpb (sequência flanqueante de homologia 5') ou 0,821 kpb (sequência flanqueante de homologia 3') para além do vector pCR®2.1 de 3,9 kpb.
As reacções de sequenciação de cadeia dupla dos clones plasmidicos foram realizadas como descrito pelo fabricante usando o kit CEQ™ DTCS-Quick Start Kit (Beckman-Coulter, Paio Alto, CA) . As reacções foram purificadas usando Performa DTR Gel Filtration Cartridges (Edge BioSystems, Gaithersburg, MD) como descrito pelos protocolos do fabricante. As reacções de sequenciação foram analisadas num sistema de análise de DNA Beckman-Coulter CEQ™ 2000 XL e a caracterização nucleotidica realizada usando Sequencher™ versão 4.1.4 (Gene Codes Corporation, Ann Arbor, MI) . A sequência do fragmento de 0,821 kpb correspondendo à posição 1 da sequência flanqueante de homologia 5' derivada de IPP2K está apresentada na Fig. 87 (SEQ ID NO: 171) . A sequência do fragmento de 0,821 kpb correspondendo à posição 1 da sequência flanqueante de homologia 3' derivada de IPP2K está apresentada na Fig. 88 (SEQ ID NO:172).
No passo #3 as sequências flanqueantes de homologia 5' para a posição 1 foram ligadas ao plasmideo base. Os fragmentos cortados com enzimas de restrição correspondendo aos clones que continham a sequência flanqueante de homologia 5' para a posição 1 correctos foram removidos do gel e purificados de acordo com as instruções do fabricante usando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA). Os fragmentos correspondendo à sequência flanqueante de homologia 5' para a posição 1 (0,821 kpb) foram então ligados ao plasmideo base purificado digerido com Spel/Notl (passo #1) numa proporção de 1:5 vector:inserto usando 500 unidades de DNA-ligase de T4 (Invitrogen Life Technologies, Carlsbad, CA) num volume de reacção de 20 μΐ, em condições de 16 hr de incubação num banho-maria a 16°C. Cinco μΐ da reacção de ligação foram subsequentemente usados para transformar células E. coli quimicamente competentes One Shot® TOPIO (Invitrogen Life Technologies, Carlsbad, CA) e semeados nas condições de selecção descritas pelo fabricante. Colónias individuais foram inoculadas num tubo Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de canamicina e incubadas 16 hrs, a 37°C, com agitação a 200 rpm.
Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrifuga de 1,7 ml Costar (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmídico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid Kit (BD Biosciences/Clontech/Macherey-Nagel, Paio Alto, CA) . Três yg de DNA plasmidico foram digeridos com 10 unidades de Spel e Notl (New England Biolabs, Beverly, MA) e incubados durante 1 hr a 37°C. O DNA cortado com enzimas de restrição foi sujeito a electrof orese a 100 V durante 1 hr num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etidio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os clones plasmidicos esperados foram diagnosticados pela presença de fragmentos de DNA inseridos de 0,821 kpb (sequência flanqueante de homologia 5') para além do plasmideo base de 3,4 kpb.
No passo #4, a posição 1 das sequências flanqueantes de homologia 3 ' foram ligadas ao produto do passo #3. Três yg do produto manipulado descrito no passo #3 foram linearizados usando enzimas de restrição, 10 unidades de Spel e 20 unidades de Sail (New England
Biolabs, Beverly, MA) durante 1 hr a 37°C. O DNA cortado com enzimas de restrição foi sujeito a electroforese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE (0,04 M Tris-acetato, 0,002 M EDTA) suplementado com 0,5% de brometo de etidio (Sigma-Aldrich Corporation, St. Louis, MO). Os fragmentos de DNA foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb (Invitrogen Life Technologies, Carlsbad, CA) . O produto da digestão com Spel/Sall de ~4,2 kpb do passo #3 foi retirado do gel e purificado de acordo com as instruções do fabricante usando usando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA).
Os fragmentos isolados do dador de sequências flanqueantes de homologia 3' (0,821 kpb) gerados no passo #2 foram subsequentemente combinados com o produto do passo #3 que foi digerido com Spel/Sall e purificado como descrito atrás em 20 μΐ de reacção de ligação usando uma proporção de vector: inserto de 1:5 e 500 unidades de DNA-ligase de T4 (Invitrogen Life Technologies, Carlsbad, CA) . As reacções de ligação foram incubadas durante 16 horas num banho-maria a 16°C. Após a ligação, 5 μΐ da reacção de ligação foram usados para transformar células quimicamente competentes MAX Efficiency® DH5a™ (Invitrogen Life Technologies, Carlsbad, CA) de acordo com as instruções do fabricante. Colónias individuais inoculadas num tubo Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de cloranfenicol.
As culturas foram incubadas durante 16 hrs a 37°C com agitação a 200 rpm. Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrifuga Costar de 1,7 ml (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmidico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid (BD Biosciences/Clontech/ Macherey-Nagel, Paio Alto, CA). Três yg do plasmideo isolado foram digeridos com 10 unidades de Sail e Notl (New England Biolabs, Beverly, MA) e incubados durante 1 hr a 37°C. O DNA cortado com enzimas de restrição foi sujeito a electroforese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etidio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os clones plasmidicos esperados foram diagnosticados pela presença de dois fragmentos de DNA de 1,64 kpb (inser-to) e 3,33 kb (plasmideo base de 3,4 kpb) . O plasmideo resultante foi designado pDAB7471 (Fig. 70). C. Esqueleto de plasmideo posição 2
Um esqueleto de plasmideo contendo sequências flanqueantes de homologia para a posição 2 de IPP2K foi manipulado para permitir a integração da sequência de DNA dador no local alvo correspondente do gene IPP2K. Os familiarizados com a técnica podem planear esqueletos de plasmideo usando vários locais de clonagem, elementos modulares e sequências homólogas de qualquer sequência alvo dentro do genoma de interesse. O esqueleto de plasmideo aqui exemplificado tem origem no vector plasmideo base fagemideo pBC SK(-) (3,4 kpb) (Stratagene, La Jolla, CA) . Uma sintese em quatro passos, como descrita abaixo, foi usada para construir o esqueleto do plasmideo posição 2.
No passo #1, preparou-se o plasmideo base. Três yg de pBC SK(-) foram linearizados usando endonucleases de restrição, 10 unidades de Spel e 10 unidades de Notl (New England Biolabs, Beverly, MA), durante 1 hr a 37°C. O DNA cortado foi sujeito a electroforese a 100 V durante 1 hr num gel de 1,0% de agarose em TAE (0,04 M Tris-acetato, 0,002 M EDTA) suplementado com 0,5% de brometo de etídeo (Sigma-Aldrich Corporation, St. Louis, MO). Os fragmentos de DNA foram visualizados com luz UV e o tamanho dos fragmentos estimados por comparação com a escada de DNA de 1 kpb (Invitrogen Life Technologies, Carlsbad, CA). O vector de subclonagem, pBC SK(-) de 3,4 kpb, digerido com Spel/Notl foi removido do gel e purificado de acordo com as instruções do fabricante usando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA).
No passo #2, foram isoladas as sequências flanqueantes 5' e 3' de IPP2K posição 2. As sequências oligonucleotídicas que se seguem foram sintetizadas por Integrated DNA Technologies, Inc. (Coralville, IA) em condições padrão de desalinação e diluídas com água para uma concentração de 0,125 yg/yl: 5'-GCGGCCGCTAGATAGCAGATGCAGATTGCT-3' (SEQ ID NO:147) 5'-ACTAGTATTGGCACCCAGGTGTTGGCTCA-3' (SEQ ED NO:148) 5'-ACTAGTCATGTCGATGGTGGGGTATGGTTCAGATTCAG-3' (SEQ ID NO:149) 5'-GTCGACGTACAATGATTTCAGGTTACGGCCTCAGGAC-3' (SEQ ID NO: 150)
As reacções de amplificação por PCR foram realizadas usando reagentes fornecidos por TaKaRa Biotechnology Inc., Seta 3-4-1, Otsu, Shiga, 520-2193, Japan e consistiram no seguinte: Cinco μΐ de tampão 10X LA PCR™ Buffer II (Mg2 + ) , 20 ng de gDNA matriz de cadeia dupla (milho Hill), 10 pmol da sequência oligonucleotídica directa, 10 pmol da sequência oligonucleotídica reversa, 8 μΐ da mistura de dNTPs (2,5 mM cada), 33,5 μΐ PRO, 0,5 μΐ (2,5 unidades) DNA-polimerase TaKaRa LA Taq™, 1 gota de óleo mineral. As reacções de PCR foram realizadas usando um termociclador Perkin-Elmer Cetus, DNA Thermal Cycler (Norwalk, CT) de 48 amostras, nas seguintes condições: 94°C, 4 min/1 ciclo; 98°C 20 sec, 55°C 1 min, 68°C 1 min/30 ciclos; 72°C, 5 min/1 ciclo; 4°C/restante. Quinze μΐ de cada reacção de PCR foram sujeitos a electroforese a 100 V durante 1 hr num gel de 1,0% de agarose em TAE agarose suplementado com 0,5% de brometo de etídio. Os fragmentos amplificados foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os produtos de amplificação esperados foram diagnosticados pela presença de fragmentos de DNA de 0,855 kpb (sequência flanqueante de homologia 5') ou 0,845 kpb (sequência flanqueante de homologia 3'). Estes fragmentos foram removidos do gel e purificados de acordo com as instruções do fabricante usando o kit de extraeção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA) . Os fragmentos purificados foram então clonados no plasmídeo pCR2.1 usando o kit de clonagem TOPO TA Cloning® Kit (com o vector pCR®2.1) e células E. coli quimicamente competentes
One Shot® T0P10 (Invitrogen Life Technologies, Carlsbad, CA) de acordo com o protocolo do fabricante.
Colónias individuais foram inoculadas num tubo Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de canamicina e incubadas 16 hrs a 37°C com agitação a 200 rpm. Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrifuga de 1,7 ml Costar (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmidico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid Kit (BD Biosciences/Clontech/Macherey-Nagel, Paio Alto, CA) . Três pg do plasmideo isolado a partir de plasmideos dos clones com sequências de homologia 5' foram digeridos com 10 unidades de Spel e NotI. Os plasmideos de clones com sequências de homologia 3' foram digeridos com 10 unidades de Spel e 20 unidades de Sail (New England Biolabs, Beverly, MA) . Todas as digestos de plasmideos foram incubadas durante 1 hr a 37°C. O DNA cortado com enzimas de restrição foi sujeito a electroforese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etidio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os clones plasmidicos esperados foram diagnosticados pela presença de fragmentos de DNA inseridos de 0,855 kpb (sequência flanqueante de homologia 5') ou 0,845 kpb (sequência flanqueante de homologia 3') para além do vector pCR®2.1 de 3,9 kpb.
As reacções de sequenciação de cadeia dupla dos clones plasmidicos foram realizadas como descrito pelo fabricante usando o kit CEQ™ DTCS-Quick Start Kit (Beckman-Coulter, Paio Alto, CA) . As reacções foram purificadas usando Performa DTR Gel Filtration Cartridges (Edge BioSystems, Gaithersburg, MD) como descrito pelos protocolos do fabricante. As reacções de sequenciação foram analisadas num sistema de análise de DNA Beckman-Coulter CEQ™ 2000 XL e a caracterização nucleotidica realizada usando Sequencher™ versão 4.1.4 (Gene Codes Corporation, Ann Arbor, MI) . A sequência do fragmento de 0,855 kpb correspondendo à posição 2 da sequência flanqueante de homologia 5' derivada de IPP2K está apresentada na Fig. 89 (SEQ ID NO: 139) . A sequência do fragmento de 0,845 kpb correspondendo à posição 2 da sequência flanqueante de homologia 3' derivada de IPP2K está apresentada na Fig. 90 (SEQ ID NO:140).
No passo #3 as sequências flanqueantes de homologia 5' para a posição 1 foram ligadas ao plasmideo base. Os fragmentos cortados com enzimas de restrição correspondendo aos clones que continham a sequência flanqueante de homologia 5' para a posição 2 foram removidos do gel e purificados de acordo com as instruções do fabricante usando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA) . Os fragmentos correspondendo à sequência flanqueante de homologia 5' para a posição 1 (0,855 kpb) foram então ligados ao plasmideo base purificado digerido com Spel/Notl (passo #1) numa proporção de 1:5 vector:inserto usando 500 unidades de DNA-ligase de T4 (Invitrogen Life Technologies, Carlsbad, CA) num volume de reacção de 20 μΐ em condições de 16 hr de incubação num banho-maria a 16°C.
Cinco μΐ da reacção de ligação foram subsequentemente usados para transformar células E. coli quimicamente competentes One Shot® TOPIO (Invitrogen Life Technologies, Carlsbad, CA) e semeados nas condições de selecção descritas pelo fabricante. Colónias individuais foram inoculadas num tubo Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de canamicina e incubadas 16 hrs, a 37°C, com agitação a 200 rpm. Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrifuga de 1,7 ml Costar (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmidico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid Kit (BD Biosci-ences/Clontech/Macherey-Nagel, Paio Alto, CA). Três yg de DNA plasmidico foram digeridos com 10 unidades de Spel e Notl (New England Biolabs, Beverly, MA) e incubados durante 1 hr a 37°C. O DNA cortado com enzimas de restrição foi sujeito a electroforese a 100 V durante 1 hr num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etidio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os clones plasmídicos esperados foram diagnosticados pela presença de fragmentos de DNA inseridos de 0,855 kpb (sequência flanqueante de homologia 5') para além do plasmideo base de 3,4 kpb.
No passo #4, as sequências flanqueantes de homologia 3' para a posição 2 foram ligadas ao produto do passo #3. Três pg do produto manipulado descrito no passo #3 foram linearizados usando enzimas de restrição, 10 unidades de Spel e 20 unidades de Sail (New England Biolabs, Beverly, MA) durante 1 hr a 37°C. O DNA cortado com enzimas de restrição foi sujeito a electroforese a 100 V durante 1 hr num gel de 1,0% de agarose em TAE (0,04 M Tris-acetato, 0,002 M EDTA) suplementado com 0,5% de brometo de etidio (Sigma-Aldrich Corporation, St. Louis, MO). Os fragmentos de DNA foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb (Invitrogen Life Technologies, Carlsbad, CA). O produto da digestão com Spel/Sall de 4,25 kpb do passo #3 foi retirado do gel e purificado de acordo com as instruções do fabricante usando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA).
Os fragmentos isolados do dador de sequências flanqueantes de homologia 3' (0,845 kpb) gerados no passo #2 foram subsequentemente combinados com o produto do passo #3, que foi digerido com Spel/Sall e purificado como descrito atrás, em 20 μΐ de reacção de ligação usando uma proporção de vector: inserto de 1:5 e 500 unidades de DNA-ligase de T4 (Invitrogen Life Technologies, Carlsbad, CA) . As reacções de ligação foram incubadas durante 16 horas num banho-maria a 16°C. Após a ligação, 5 μΐ da reacção de ligação foram usados para transformar células quimicamente competentes MAX Efficiency® DH5a™ (Invitrogen Life Technologies, Carlsbad, CA) de acordo com as instruções do fabricante. Colónias individuais foram inoculadas num tubo Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de cloranfenicol. As culturas foram incubadas durante 16 hrs a 37°C com agitação a 200 rpm. Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrifuga Costar de 1,7 ml (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmidico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid (BD Biosciences/ Clontech/Macherey-Nagel, Paio Alto, CA) . Três pg do plasmideo isolado foram digeridos com 10 unidades de Sail e Notl (New England Biolabs, Beverly, MA) e incubados durante 1 hr a 37°C. O DNA cortado com enzimas de restrição foi sujeito a electroforese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etidio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os clones plasmidicos esperados foram diagnosticados pela presença de dois fragmentos de DNA de 1,7 kpb (inserto) e 3,33 kb (plasmideo base) . O plasmideo resultante foi designado pDAB7451 (Fig. 71). D. Construção da cassete de expressão autónoma do gene de tolerância a herbicida
Construíu-se uma cassete de expressão autónoma do gene da tolerância a herbicida compreendendo uma unidade de promotor-transcrição (PTU) contendo promotor, gene de tolerância a herbicida e sequências de poliadenilação (poliA) e terminação (Fig. 72). Nesta realização, a sequência do promotor deriva da actina 1 de O. sativa [McElroy et al. (Plant Cell 2, 163-171; 1990); GenBank N° de Acesso S44221 e GenBank N° de Acesso X63830]. O gene de tolerância a herbicida compreende o gene PAT (fosfino-tricina acetil-transferase) , o qual confere resistência ao herbicida bialaphos (uma versão modificada da região codificadora de PAT originalmente derivada de Streptomyces viridochromogenes (GenBank N° de Acesso M22827; Wohlleben et al. Gene 70, 25-37; 1988). As modificações da sequência
original da grelha de leitura aberta mais longa de M22827 são substanciais e incluem a alteração do padrão de utilização de codões para optimizar a expressão em plantas. Exceptuando a substituição de metionina por valina como o primeiro aminoácido codificado e a adição de alanina como o segundo aminoácido codificado, a proteína codificada a partir da grelha de leitura aberta PAT de pDAB3014 é idêntica à codificada pela grelha de leitura aberta mais longa do N° de acesso M22827. A versão reconstruída de PAT é encontrada com o N° de Acesso 143995. As sequências terminadoras derivam da lipase L de Z. mays [clone de cDNA da lipase de milho com o N° de Acesso GenBank L35913, excepto um C na posição 1093 de L35913 estar substituído com um G na posição 2468 em pDAB3014. Esta sequência de milho compreende a região não traduzida 3'/região terminadora da transcrição para o geme PAT].
As sequências iniciadoras oligonucleotídicas que se seguem foram sintetizadas por Integrated DNA Technologies, Inc. (Coralville, IA) nas condições padrão de desalinação e diluídas com água para uma concentração de 0,125 gg/μΐ: 5'-ACTAGTTAACTGACCTCACTCGAGGTCATTCATATGCTTGA-3' (SEQ ID NO:151) 5'-ACTAGTGTGAATTCAGCACTTAAAGATCT-3' (SEQ ID NO: 152).
As reacções de amplificação por PCR foram realizadas usando reagentes fornecidos por TaKaRa Biotechnology Inc., Seta 3-4-1, Otsu, Shiga, 520-2193, Japan e consistiram no seguinte: 5 μΐ de tampão 10X LA PCR™ Buffer II (Mg2 + ) , 20 ng de matriz de cadeia dupla [DNA do plasmídeo pDAB3014], 10 pmol da sequência oligonucleotídica directa, 10 pmol da sequência oligonucleotídica reversa, 8 μΐ da mistura de dNTPs (2,5 mM cada), 33,5 μΐ PRO, 0,5 μΐ (2,5 unidades) DNA-polimerase TaKaRa LA Taq™, 1 gota de óleo mineral. As reacções de PCR foram realizadas usando um termociclador Perkin-Elmer Cetus, DNA Thermal Cycler (Norwalk, CT) de 48 amostras, nas seguintes condições: 94°C, 4 min/1 ciclo; 98°C 20 sec, 55°C 1 min, 68°C 3 min/30 ciclos; 72°C, 5 min/1 ciclo; 4°C/restante. Quinze μΐ de cada reacção de PCR foram sujeitos a electroforese a 100 V durante 1 hr num gel de 1,0% de agarose em TAE agarose suplementado com 0,5% de brometo de etidio.
Os fragmentos amplificados foram visualizados com luz UV e os tamanhos dos fragmentos estimados por comparação com uma escada de DNA de 1 kpb. Os produtos de amplificação esperados foram diagnosticados pela presença de um fragmento de DNA de 2,3 kpb. Este fragmento foi removido do gel e purificado de acordo com as instruções do fabricante usando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA) . Os fragmentos purificados foram então clonados no plasmídeo pCR2.1 usando o kit de clonagem TOPO TA Cloning® Kit (com o vector pCR®2.1) e células E. coli quimicamente competentes One Shot® TOPIO (Invitrogen Life Technologies, Carlsbad, CA) de acordo com o protocolo do fabricante.
Colónias individuais foram inoculadas num tubo Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de canamicina e incubadas 16 hrs a 37°C com agitação a 200 rpm. Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrifuga de 1,7 ml Costar (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmidico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid Kit (BD Biosciences/Clontech/Macherey-
Nagel, Palo Alto, CA) . Três yg do plasmídeo isolado foram digeridos com 10 unidades de Spel e NotI. Todas as digestos de plasmídeos foram incubadas durante 1 hr a 37°C. O DNA cortado com enzimas de restrição foi sujeito a electroforese a 100 V durante 1 hr num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etídio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os clones plasmídicos esperados foram diagnosticados pela presença de um fragmento de DNA inserido de 2,325 kpb para além do vector pCR®2.1 de 3,9 kpb. As reacções de sequenciação de cadeia dupla dos clones plasmídicos foram realizadas como descrito pelo fabricante usando o kit CEQ™ DTCS-Quick Start Kit (Beckman-Coulter, Paio Alto, CA). As reacções foram purificadas usando Performa DTR Gel Filtration Cartridges (Edge BioSystems, Gaithersburg, MD) como descrito pelos protocolos do fabricante. As reacções de sequenciação foram analisadas num sistema de análise de DNA Beckman-Coulter CEQ™ 2000 XL e a caracterização nucleotídica realizada usando Sequencher™ versão 4.1.4 (Gene Codes Corporation, Ann Arbor, MI). E. Inserção da cassete autónoma do gene de tolerância a herbicidas no esqueleto plasmídico - Dador Autónomo
De forma a criar um plasmídeo dador, a cassete autónoma do gene de tolerância a herbicida descrita no Exemplo 18D foi inserida nas construções de esqueleto plasmídico descritas nos Exemplos 18B e 18C. 0 fragmento cortado com enzimas de restrição derivado de um clone que possuía a sequência esperada de 2,325 kpb atrás descrita (Fig. 72) foi removido do gel e purificado de acordo com as instruções do fabricante usando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA).
Este fragmento foi então combinado numa reacção de ligação com pDAB7471 purificado (esqueleto plasmídico para a posição 1, Fig. 70) ou pDAB 7451 (esqueleto plasmídico para a posição 2, Fig. 71) que tinham sido digeridos com a enzima de restrição Spel e subsequentemente desfosforilado. A ligação foi realizada nas seguintes condições: proporção vector:inserto 1:5 e 500 unidades de DNA-ligase de T4 (Invitrogen Life Technologies, Carlsbad, CA) num volume de reacção de 20 μΐ nas condições de incubação de 16 horas num banho-maria a 16°C. Cinco μΐ da reacção de ligação foi usado para transformar subsequentemente 50 μΐ de células quimicamente competentes MAX Efficiency® DH5a™ (Invitrogen Life Technologies, Carlsbad, CA) e semeadas nas condições de selecção descritas pelo fabricante.
Colónias individuais foram inoculadas num tubo Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de cloranfenicol. As culturas foram incubadas durante 16 hrs a 37°C com agitação a 200 rpm. Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrifuga Costar de 1,7 ml (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmidico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid (BD Biosciences/Clontech/ Macherey-Nagel, Paio Alto, CA). Três yg do plasmideo isolado foram digeridos com 10 unidades de Spel (New England Biolabs, Beverly, MA) e incubados durante 1 hr a 37°C. O DNA cortado com enzimas de restrição foi sujeito a electrof orese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etidio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os clones plasmidicos esperados foram diagnosticados pela presença de fragmentos de DNA de 2,325 kpb e ~4,9 kpb (vector pDAB7452) ou 2,325 Kpb e ~5, 0 kpb (vector pDAB7 4 51) .
Os plasmideos resultantes foram designados pDAB7422 (posição 1 dador autónomo) (Fig. 73) e pDAB7452 (posição 2 dador autónomo) (Fig. 74), respectivamente. F. Construção da cassete não autónoma de expressão do gene de tolerância a herbicidas
Construiu-se uma cassete de expressão não autónoma do gene da tolerância a herbicidas compreendendo uma unidade de transcrição com promotor (PTU) (Fig. 75) .
Nesta realização, usou-se uma estratégia que explora a funcionalidade de uma sequência 2A (Mattion, N.M., Harnish, E.C., Crowley, J.C. & Reilly, P.A. (1996) J. Virol. 70, 8124- 8127) derivada do vírus de Thesoa assigna, um gene de tolerância a herbicida e sequências de poli-adenilação (poliA) e terminação, mas sem o promotor. Nesta realização, a sequência do sinal de terminação da tradução foi manipulada para estar na mesma grelha de tradução do gene de tolerância a herbicidas. Ainda, a sequência codificadora de 2A/ herbicida foi manipulada para coincidir com a grelha de tradução do gene IPP2K alvo. O gene de tolerância a herbicidas compreende o gene PAT (fosfinotricina acetil-transferase), o qual confere resistência ao herbicida bialaphos (uma versão modificada da região codificadora de PAT originalmente derivada de Streptomyces viridochromo-genes (GenBank N° de Acesso M22827; Wohlleben et al. Gene 70, 25-37; 1988) . As modificações da sequência original da grelha de leitura aberta mais longa de M22827 são substanciais e incluem a alteração do padrão de utilização de codões para optimizar a expressão em plantas. Exceptuando a substituição de metionina por valina como o primeiro aminoácido codificado e a adição de alanina como o segundo aminoácido codificado, a proteína codificada a partir da grelha de leitura aberta PAT de pDAB3014 é idêntica à codificada pela grelha de leitura aberta mais longa do N° de acesso M22827. A versão reconstruída de PAT é encontrada com o N° de Acesso 143995. As sequências terminadoras derivam da lipase L de Z. mays [clone de cDNA da lipase de milho com o N° de Acesso GenBank L35913, excepto um C na posição 1093 de L35913 estar substituído com um G na posição 2468 em pDAB3014] . Esta sequência de milho compreende a região não traduzida 3 '/região termina-dora da transcrição para o gene PAT.
As sequências iniciadoras oligonucleotídicas que se seguem foram sintetizadas por Integrated DNA
Technologies, Inc. (Coralville, IA) nas condições padrão de desalinação e diluídas com água para uma concentração de 0,125 gg/μΐ: 5'- ACTAGTGGCGGCGGAGAGGGCAGAGGAAGTCTTCTAACATGC GGTGACGTGGAGGAGAATCCCGGCCCTAGGATGGCTTCTCCGGAGAGGAGAC CAGTTGA-3' (SEQ ID NO: 153) 5'-ACTAGTATGCATGTGAATTCAGCACTTAAAGATCT-3' (SEQ ID NO: 154).
As reacções de amplificação por PCR foram realizadas usando reagentes fornecidos por TaKaRa Biotechnology Inc., Seta 3-4-1, Otsu, Shiga, 520-2193, Japan e consistiram no seguinte: 5 μΐ de tampão 10X LA PCR™ Buffer II (Mg2 + ) , 20 ng de matriz de cadeia dupla (DNA do plasmídeo pDAB3014), 10 pmol da sequência oligonucleotídica directa, 10 pmol da sequência oligonucleotídica reversa, 8 μΐ da mistura de dNTPs (2,5 mM cada), 33,5 μΐ PRO, 0,5 μΐ (2,5 unidades) DNA-polimerase TaKaRa LA Taq™, 1 gota de óleo mineral. As reacções de PCR foram realizadas usando um termociclador Perkin-Elmer Cetus, DNA Thermal Cycler (Norwalk, CT) de 48 amostras, nas seguintes condições: 94°C, 4 min/1 ciclo; 98°C 20 sec, 55°C 1 min, 68°C 2 min/30 ciclos; 72°C, 5 min/1 ciclo; 4°C/restante. Quinze μΐ de cada reacção de PCR foram sujeitos a electroforese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etidio. Os fragmentos amplificados foram visualizados com luz UV e os tamanhos dos fragmentos estimados por comparação com uma escada de DNA de 1 kpb. Os produtos de amplificação esperados foram diagnosticados pela presença de um fragmento de DNA de ~1 kpb. Este fragmento foi removido do gel e purificado de acordo com as instruções do fabricante usando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc. , Valencia, CA) . Os fragmentos purificados foram então clonados no plasmideo pCR2.1 usando o kit de clonagem TOPO TA Cloning® Kit (com o vector pCR®2.1) e células E. coli quimicamente competentes One Shot® TOPIO (Invitrogen Life Technologies, Carlsbad, CA) de acordo com o protocolo do fabricante.
Colónias individuais foram inoculadas num tubo Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de canamicina e incubadas 16 hrs a 37°C com agitação a 200 rpm. Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrifuga de 1,7 ml Costar (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmidico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid Kit (BD Biosciences/Clontech/Macherey-Nagel, Paio Alto, CA) . Três pg do plasmideo isolado foram digeridos com 10 unidades de Spel. Todas as digestos de plasmideos foram incubadas durante 1 hr a 37°C. O DNA cortado com enzimas de restrição foi sujeito a electroforese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etidio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os clones plasmidicos esperados foram diagnosticados pela presença de um fragmento de DNA inserido de ~1,0 kpb e 3,9 kpb (vector pCR®2.1). As reacções de sequenciação de cadeia dupla dos clones plasmidicos foram realizadas como descrito pelo fabricante usando o kit CEQ™ DTCS-Quick Start Kit (Beckman-Coulter, Paio Alto, CA) . As reacções foram purificadas usando Performa DTR Gel Filtration Cartridges (Edge BioSystems, Gaithersburg, MD) como descrito pelos protocolos do fabricante. As reacções de sequenciação foram analisadas num sistema de análise de DNA Beckman-Coulter CEQ™ 2000 XL e a caracterização nucleotidica realizada usando Sequencher™ versão 4.1.4 (Gene Codes Corporation, Ann Arbor, MI). G. Inserção da cassete não autónoma do gene de tolerância a herbicidas no esqueleto plasmidico - Dador não autónomo
De forma a criar um plasmideo dador, a cassete autónoma do gene de tolerância a herbicida descrita no Exemplo 18F foi inserida nas construções de esqueleto plasmidico descritas nos Exemplos 18B e 18C. O fragmento cortado com enzimas de restrição derivado de um clone que possuia a sequência correcta de 1 kpb foi removido do gel e purificado de acordo com as instruções do fabricante usando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA).
Este fragmento foi então combinado numa reacção de ligação com pDAB7471 purificado (esqueleto plasmidico para a posição 1, Fig. 70) ou pDAB 7451 (esqueleto plasmidico para a posição 2, Fig. 71) que tinham sido digeridos com a enzima de restrição Spel e subsequentemente desfosforilados. A ligação foi realizada nas seguintes condições: proporção vector:inserto 1:5 e 500 unidades de DNA-ligase de T4 (Invitrogen Life Technologies, Carlsbad, CA) num volume de reacção de 20 μΐ nas condições de incubação de 16 horas num banho-maria a 16°C. Cinco μΐ da reacção de ligação foi usado para transformar subsequentemente 50 μΐ de células quimicamente competentes MAX Efficiency® DH5a™ (Invitrogen Life Technologies, Carlsbad, CA) e semeadas nas condições de selecção descritas pelo fabricante.
Colónias individuais foram inoculadas num tubo Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de cloranfenicol. As culturas foram incubadas durante 16 hrs, a 37°C, com agitação a 200 rpm. Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrifuga Costar de 1,7 ml (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmidico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid (BD Biosciences/ Clontech/ Macherey-Nagel, Paio Alto, CA). Três yg do plasmideo isolado foram digeridos com 10 unidades de Spel (New England Biolabs, Beverly, MA) e incubados durante 1 hr a 37°C. O DNA cortado com enzimas de restrição foi sujeito a electrof orese a 100 V durante 1 hr num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etidio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os clones plasmidicos esperados foram diagnosticados pela presença de fragmentos de DNA de 1,0 kpb e 4,96 kpb (vector pDB7471) ou ~4,9 kpb (vector pDAB7452) ou 1,0 Kpb e ~5,0 kpb (vector pDAB7451). Os plasmideos resultantes foram designados pDAB7423 (posição 1 dador não autónomo) (Fig. 76) e pDAB7454 (posição 2 dador não autónomo) (Fig. 77), respectivamente. H. Posição 1 ZFN + sequências dadoras HR: Plasmideo de combinação
Como estratégia alternativa para a entrega de dois plasmideos separados numa célula vegetal (e.g. um plasmideo contendo elementos ZFN e um segundo contendo as sequências dadoras de tolerância a herbicidas), plasmideos isolados foram manipulados geneticamente de forma a conterem todos os elementos necessários ilustrados nesta patente. Os plasmidos de combinação descritos neste exemplo possuem ambos os ZFNs destinados a alvejar e gerar quebras da cadeia dupla no locus IPP2K especificado assim como PAT PTU autónomo e/ou 2A/PAT PTU e sequências flanqueantes dadoras desenhadas para a integração naqueles locais de quebra.
Usou-se tecnologia Gateway®, que usa recombinação especifica de local baseada no fago lambda (Landy, A. (1989) Ann. Rev. Biochem. 55:913) para converter os vectores pDAB7422 e pDAB7423 (descritos nos exemplos 6E e 6G) em vectores de destino Gateway®. Uma vez convertidos, os plasmideos contendo cassetes de expressão de ZFN (inseridas em vectores Gateway® Entry) podem ser mobilizados facilmente para o vector de destino criando um plasmideo de combinação ZFN/dador. Um pg de cada um desses plasmideos foi digerido com 10 unidades de Notl (New England Biolabs, Beverly, MA) durante 1 hr a 37°C. A endonuclease de restrição Notl foi inactivada pelo calor a 65°C durante 15 min e os extremos do fragmento subsequentemente desfosforilados a 37°C durante 1 hr usando 3 unidades de fosfatase alcalina de camarão (SAP) (Roche Diagnostics GmbH, Mannheim, Germany). O DNA cortado com enzimas de restrição foi sujeito a electroforese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etidio. Os fragmentos de vector (pDB7422 = 7,317 Kbp, pDAB7423 = 5,971 Kbp) foram visualizados com luz UV, o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb, removidos do gel e subsequentemente purificado de acordo com as instruções do fabricante usando o kit QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA).
Este fragmento vector foi então combinado com um fragmento Notl de 2,274 kpb contendo os elementos Gateway® Technology attRl, ccdB, CmR e attR2 numa reacção de ligação realizada nas seguintes condições: proporção de 1:5 vector:inserto e 500 unidades de DNA-ligase de T4 (Invitrogen Life Technologies, Carlsbad, CA) num volume de reacção de 20 μΐ em condições de 16 hr de incubação num banho-maria a 16°C. Cinco μΐ da reacção de ligação foram subsequentemente usados para transformar células E. coli quimicamente competentes One Shot® ccdB Survival™ (Invitrogen Life Technologies, Carlsbad, CA) e semeadas nas condições de selecção descritas pelo fabricante.
Colónias individuais foram inoculadas num tubo Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de canamicina e incubadas 16 hrs, a 37°C, com agitação a 200 rpm. Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrifuga de 1,7 ml Costar (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmidico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid Kit (BD Biosciences/Clontech/Macherey-Nagel, Paio Alto, CA) . Três yg de DNA plasmidico foram digeridos com 10 unidades de EcoRI (New England Biolabs, Beverly, MA) e incubados durante 1 hr a 37°C. O DNA cortado com enzimas de restrição foi sujeito a electroforese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etidio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb. Os clones plasmidicos esperados foram diagnosticados pela presença de fragmentos de DNA inseridos de 1,448 Kbp, 1,946 Kbp e 6,197 Kbp PAT PTU autónoma posição 1 HR dador e 5,807 Kbp e 2,438 Kbp para PAT não autónoma posição 1 HR dador. Os plasmideos resultantes foram designados pDAB7424 (dador autónomo posição 1 adaptado de Gateway®) (FIG. 78) e pDAB7425 (dador não autónomo posição 1 adaptado de Gateway®) (FIG. 79), respectivamente.
Como resultado destas manipulações de clonagem, os plasmideos pDAB7424 e pDAB7425 foram designados como vectores de destino Gateway®. pDAB7412 possui funcionalidade como um vector de entrada Gateway® contendo os seguintes elementos: ZMJbilv.2/ZFN12/Zm Per5 3' UTR. Para transferir uma cassete de expressão de ZFN (vector de entrada Gateway®), realizou-se uma reacção com LR Clonase™ II (Invitrogen Life Technologies, Carlsbad, CA) como descrito pelo fabricante numa proporção de 50 ng (vector de entrada):150 ng/μΐ (vector de destino). Os plasmideos resultantes positivos para a combinação foram designados pDAB7426 (dador HR autónomo posição -1/ZFN12) (FIG. 80) & pDAB7427 (dador HR não autónomo/ZFN12) (FIG. 81).
Exemplo 19: Entrega de ZFN e DNA dador em células vegetais
De modo a permitir a integração mediada por ZFN de DNA dador no genoma vegetal via integração dirigida, entende-se gue é necessária a entrega do DNA codificador de ZFN seguida da expressão da proteína ZFN funcional na célula vegetal. É igualmente necessária a entrega concomitante de DNA dador na referida célula vegetal, de forma gue a proteína ZFN possa induzir guebras na cadeia dupla no DNA alvo, as guais são então reparadas através de integração conduzida por homologia do DNA dador no locus alvo. Os familiarizados com a área podem conceber gue a expressão da proteína ZFN funcional possa ser conseguida através de vários métodos, incluindo, mas não lhes estando limitados, transgénese da construção codificadora de ZFN ou expressão transitória da construção codificadora de ZFN. Em ambos os casos, a expressãoda proteína ZFN funcional e a entrega de DNA dador na célula vegetal é simultaneamente conseguida de forma a conduzir a integração dirigida.
Nos exemplos agui citados, demonstrámos métodos para a entrega concomitante de DNA codificador de ZFN e de DNA dador em células vegetais. Os familiarizados com a técnica poderão usar qualquer um de uma variedade de métodos de entrega de DNA adequados para células vegetais, incluindo, mas não lhes estando limitados, transformação mediada por Agrobacterium, entrega de DNA baseada em biolística ou entrega de DNA mediada por Whiskers™. Numa realização aqui descrita, as experiências de entrega de DNA mediada por Whiskers™ foram realizadas usando várias combinações de DNA dador com construções de DNA codificador de ZFN. Estas combinações incluem 1) um único plasmídeo contendo sequência codificadora de ZFN e DNA dador e 2) dois plasmídeos distintos, um contendo sequência codificadora de ZFN e o outro contendo DNA dador. Numa outra realização, a entrega de DNA baseada em biolística foi realizada usando várias combinações de DNA dador com construções de DNA codificador de ZFN. Os familiarizados com a técnica podem deduzir que estas combinações podem incluir 1) um único plasmídeo contendo a sequência codificadora de ZFN e o DNA dador e 2) dois plasmídeos distintos, um contendo a sequência codificadora de ZFN e o outro contendo DNA dador. A. Entrega de DNA mediada por Whiskers™
Como aqui descrito anteriormente, foram produzidas culturas celulares embrionárias Hi-II de milho e foram usadas como fonte de células vegetais vivas em que é demonstrada a integração dirigida. Os familiarizados com a técnica podem considerar a utilização de culturas celulares derivadas de uma variedade de espécies vegetais ou tecidos vegetais diferenciados, derivados de uma variedade de espécies vegetais, como fonte de células vegetais vivas em que é demonstrada a integração dirigida.
Neste exemplo, 12 ml PCV de uma linha celular anteriormente criopreservada mais 28 ml de meio condicionado foram subcultivados em 80 ml de meio líquido GN6 (Chu CC, et al.1975), 2,0 mg/1 2,4-D, 30 g/1 sacarose, pH 5,8) num balão Erlenmeyer de 500 ml e colocados num agitador a 125 rpm a 28°C. Este passo foi repetido 2 vezes usando a mesma linha celular, de forma que um total de 36 ml PCV foi distribuído por 3 frascos. Após 24 horas, o meio líquido GN6 foi removido e substituído por 72 ml de meio osmótico GN6 S/M (N6 Medium, 2,0 mg/1 2,4-D, 30 g/1 sacarose, 45,5 g/1 sorbitol, 45,5 g/L manitol, 100 mg/1 mio-inositol, pH 6,0). O frasco foi incubado no escuro durante 30-35 minutos, a 28°C, com agitação moderada (125 rpm). Durante o período de incubação, preparou-se uma suspensão a 50 mg/ml de palhetas de carbeto de silício (Advanced Composite Materials, LLC, Greer, SC) através da adição de 8,1 ml de meio líquido GN6/SM a 405 mg de palhetas de carbeto de silício estéreis.
Após incubação em meio osmótico GN6 S/M, os conteúdos de cada frasco foram reunidos num frasco de centrífuga de 250 ml. Após todas as células no frasco terem sedimentado no fundo, o volume do conteúdo em excesso de aproximadamente 14 ml de líquido GN6 S/M foi removido e colhido num frasco estéril de 1 litro para uso posterior. A suspensão pré-molhada de palhetas foi misturada à velocidade máxima num vortex durante 60 segundo e depois adicionada ao frasco de centrífuga.
Num exemplo, em que um único plasmídeo contendo a sequência codificadora de ZFN mais o DNA dador é entregue nas células vegetais, 170 yg de DNA de plasmideo circular purificado foram adicionados ao frasco. Num exemplo alternativo, em que dois plasmideos distintos foram co-entregues, um contendo uma sequência codificadora de ZFN e o outro contendo DNA dador, foram avaliadas múltiplas estratégias para as quantidades de DNA. Uma estratégia utilizou 85 yg de DNA dador e 85 yg de DNA codificador de dedos de zinco. Outras modificações utilizaram proporções molares de 10, 5 ou 1 vez DNA dador para 1 vez DNA dedo de zinco, baseado no tamanho (em quilopares de bases) dos plasmideos individuais, de modo que um total de 170 yg de DNA foi adicionado por frasco. Em todos os casos de co-entrega, o DNA foi reunido num tubo antes de ser adicionado ao frasco de centrífuga. Uma vez adicionado o DNA, o frasco foi imediatamente colocado num misturador de tinta comercial Red Devil 5400 modificado (Red Devil Equipment Co., Plymouth, MN) e agitado durante 10 segundos. Após agitação, a mistura de células, meio, palhetas e DNA foi adicionada ao conteúdo de um frasco de 1 litro juntamente com 125 ml de meio liquido GN6 fresco para reduzir o regulador da pressão osmótica. As células ficaram a recuperar num agitador a 125 rpm durante 2 hrs. Seis ml da suspensão dispersa foram filtrados em papel de filtro Whatman #4 (5,5 cm) usando uma unidade colectora de vidro ligada a uma linha de vácuo, de modo a obter 60 filtros por frasco. Os filtros foram colocados em placas de 60 x 20 mm de meio GN6 sólido (o mesmo de meio GN6 liquido excepto com 2,5 g/1 de agente gelificante Gelrite) e incubados a 28°C no escuro durante 1 semana. B. Entrega de DNA mediada por biolística
Nos exemplos referidos atrás, as suspensões embrionárias de milho foram subcultivadas em meio líquido GN6 aproximadamente 24 horas antes da experimentação como descrito anteriormente. 0 meio líquido em excesso foi removido e aproximadamente 0,4 PCV de células foram finamente espalhadas num círculo de 2,5 cm de diâmetro no centro de uma placa de petri de 100x15 mm contendo meio GN6 S/M solidificado com 2,5 g/1 de gelrite. As células foram cultivadas no escuro durante 4 hrs. Para revestir as partículas de biolística com DNA, 3 mg de partículas de ouro de 1,0 micron de diâmetro foram lavadas uma vez com 100% de etanol, duas vezes com água destilada estéril e ressuspensas em 50 μΐ de água num tubo Eppendorf siliconado. Um total de 5 pg de DNA plasmídico, 20 μΐ de espermidina (0,1 M) e 50 μΐ de cloreto de cálcio (2,5 M) foram adicionados separadamente à suspensão de ouro e misturados num vortex. A mistura foi incubada à temperatura ambiente durante 10 min, sedimentada a 10000 rpm numa microcentrífuga de bancada durante 10 segundos, ressuspensa em 60 μΐ de etanol a 100% frio e 8-9 μΐ foram distribuídos por cada macroveículo. O bombardeamento foi efectuado com o sistema Biolistic PDS-1000/He™ system (Bio-Rad Laboratories, Hercules, CA) . As placas contendo as células foram colocadas na prateleira do meio em condições de 1100 psi e 27 polegadas de Hg de vácuo e foram bombardeadas seguindo o manual de funcionamento. Dezasseis horas após bombardeamento, o tecido foi transferido em pequenos aglomerados para meio GN6 (1H) e cultivado durante 2-3 semanas a 28°C no escuro. As transferências continuaram cada 2-4 semanas até surgirem isolados transgénicos putativos resultantes da integração do DNA dador. A identificação, isolamento e regeneração de putativos eventos de integração de DNA dador gerados através da entrega de DNA mediada por biolistica são idênticos ao processo utilizado para putativos eventos de integração de DNA dador através da entrega de DNA mediada por Whiskers™ e descritos abaixo. C. Identificação e isolamento de putativos eventos transgénicos de integração dirigida
Uma semana após entrega de DNA, os papéis de filtro foram transferidos para placas de 60x20 mm de meio de selecção GN6(1H) (Meio N6, 2,0 mg/1 2,4-D, 30 g/1 sacarose, 100 mg/1 mioinositol, 1,0 mg/1 de bialaphos da Herbiace (Meiji Seika, Japan), 2,5 g/1 de Gelrite, pH 5,8). Estas placas de selecção foram incubadas a 28°C durante uma semana no escuro.
Após 1 semana de selecção no escuro, o tecido foi embebido em meio fresco raspando metade das células de cada placa para um tubo contendo 3,0 ml de meio GN6 com agarose mantido a 37-38°C (meio N6, 2,0 mg/1 de 2,4-D, 30 g/1 sacarose, 100 mg/1 mioinositol, 7 g/1 de agarose SeaPlaque®, pH 5,8, autoclavado durante apenas 10 minutos a 121°C) e 1 mg/1 de bialaphos da Herbiace. A mistura de agarose/tecido foi partida com uma espátula e, subsequentemente, 3 ml da mistura de agarose/tecido foi vertida sobre a superficie de uma placa de petri de 100 x 15 mm contendo meio GN6 (1H) . Este processo foi repetido para as duas metades de cada placa. Uma vez embebido todo o tecido, as placas foram fechadas individualmente com Nescofilm® ou Parafilm M®, e cultivadas a 28° C no escuro até 10 semanas. Isolados putativamente transformados que cresceram nestas condições de selecção foram removidos das placas embebidas e transferidos para meio de selecção fresco em placas de 60 x 20 mm. No caso de ser evidente o crescimento sustentado após aproximadamente 2 semanas um evento foi considerado como sendo resistente ao herbicida aplicado (bialophos) e uma aliquota das células foi subsequentemente colhida para tubos Eppendorf de 2 ml para análise de genótipos.
Os familiarizados com a técnica poderão utilizar um gene codificador de qualquer marca seleccionável adequada no DNA dador e aplicar às células vivas condições de selecção comparáveis. Por exemplo, um gene de marca seleccionável alternativo como seja AAD-1, como descrito em WO 2005/107437 A2, poderá ser implementado como dador para a selecção e recuperação de eventos integrados em células de milho como aqui descrito.
Exemplo 20: Rastreio de eventos de integração dirigida através da genotipagem por PCR
Neste exemplo, a genotipagem por PCR inclui, mas não lhes está limitado, amplificação por reacção em cadeia da polimerase (PCR) de DNA genómico derivado de tecido de calo de milho isolado, previsto como contendo DNA dador inserido no genoma, seguido de clonagem convencional e análise de sequências dos produtos de amplificação por PCR. Os métodos de genotipagem por PCR têm sido bem descritos (por exemplo, Rios, G. et al. (2002) Plant J. 32:243-253) e podem ser aplicados a DNA genómico derivado de qualquer espécie ou tipo de tecido vegetal, incluindo culturas celulares.
Os familiarizados com a técnica podem considerar estratégias para a genotipagem por PCR que incluam (mas não lhes estão limitadas) amplificação de sequências específicas no genoma vegetal, amplificação de múltiplas sequências específicas no genoma vegetal, amplificação de sequências não específicas no genoma vegetal ou suas combinações. As amplificações podem ser seguidas de clonagem e sequenciação, como descrito neste exemplo, ou através de análise directa de sequências dos produtos de amplificação. Os familiarizados com a técnica podem considerar métodos alternativos de análise dos produtos de amplificação aqui gerados.
Numa realização aqui descrita, nas amplificações por PCR são empregues sequências oligonucleotídicas específicas para o gene alvo. Numa outra realização aqui descrita, são empregues sequências oligonucleotídicas específicas para sequências do DNA dador nas amplificações por PCR. Uma outra realização inclui uma combinação de sequências oligonucleotídicas que se ligam à sequência do gene alvo e à sequência do DNA dador. Os familiarizados com a técnica podem considerar outras combinações de sequências iniciadoras e reacções de amplificação para testar o genoma. A. Extracção de DNA genómico 0 DNA genómico (gDNA) foi extraído a partir de células de milho isoladas tolerantes a herbicida descritas no Exemplo 19 e utilizado como matriz nas experiências de genotipagem por PCR. 0 gDNA foi extraído a partir de aproximadamente 100-300 μΐ de volume de células sedimentadas (PCV) de calo Hill tolerantes a herbicida, isoladas como descrito atrás de acordo com protocolos do fabricante detalhado no kit DNeasy® 96 Plant Kit (QIAGEN Inc., Valencia, CA). O DNA genómico foi eluído em 100 μΐ do tampão de eluição fornecido com o kit, dando concentrações finais de 20-200 ng/μΐ e subsequentemente analisado através de métodos de genotipagem baseados em PCR descritos abaixo.
B. Desenho de sequências iniciadoras para a genotipagem por PCR
Os familiarizados com a técnica podem usar uma variedade de estratégias para o desenho e implementação de genotipagem baseada em PCR. São exequíveis sequências iniciadoras oligonucleotidicas projectadas para emparelharem com o gene alvo, com as sequências de DNA dador e/ou combinações das duas. De modo a desenhar sequências oligonucleotidicas que possam emparelhar com o gene alvo IPP2K nas regiões não abrangidas pelas sequências flanque-antes de homologia inseridas nas moléculas de DNA dador, clones plasmídicos contendo outras sequências de genes alvo foram caracterizadas através da sequenciação de DNA. As reacções de sequenciação em cadeia dupla dos clones palsmidicos foram realizadas como descrito pelo fabricante usando o kit CEQ™ DTCS-Quick Start Kit (Beckman-Coulter, Paio Alto, CA). As reacções foram purificadas usando cassetes Performa DTR Gel Filtration Cartridges (Edge BioSystems, Gaithersburg, MD) como descrito pelos protocolos do fabricante. As reacções de sequenciação foram analisadas num sistema de análise de DNA Beckman-Coulter CEQ™ 2000 XL e a caracterização nucleotidica realizada usando Sequencher™ versão 4.1.4 (Gene Codes Corporation, Ann Arbor, MI) . Estas sequências correspondem a regiões do gene IPP2K a montante (5'-) e a jusante (3'-) das regiões alvo de ZFN e estão descritas na Fig. 91 (SEQ ID NO: 141) e Fig. 92 (SEQ ID NO:142).
Nos exemplos aqui apresentados, todas as sequências oligonucleotidicas foram sintetizadas por Integrated DNA Technologies, Inc. (Coralville, IA) em condições padrão de desalinação e diluidas com água para uma concentração de 100 μΜ. A série de sequências iniciadoras oligonucleo-tidicas directa e reversa que se seguem foi desenhada para emparelhar com sequências de gDNA especificas do gene alvo IPP2K situadas fora das fronteiras das sequências de DNA dador. Estes oligonucleótidos são os seguintes: 5'-TGGACGGAGCGAGAGCCAGAATTCGACGCT G-3' (SEQ ID NO: 153) 5'-GTGCAAGAATGTATTGGGAATCAACCTGAT G-3' (SEQ ID NO: 154)
Uma segunda série de sequências iniciadoras oligonucleotidicas directa e reversa foi também desenhada para emparelhar com a sequência de gDNA especifica do gene alvo IPP2K fora das fronteiras das sequências de DNA dador, ainda que dentro dos limites do primeiro par: 5'-CTGTGGTACCAGTACTAGTACCAGCATC-S' (SEQ ID NO:155) 5'-TCT TGGATCAAGGCATCAAGC ATTCCAATCT-3' (SEQ ID NO: 156)
Desenharam-se ainda sequências iniciadoras oligonucleotidicas directa e reversa para emparelharem especificamente com DNA dador correspondendo à região codificadora do gene de tolerância a herbicida: 5'-TGGGTAACTGGCCTAACTGG-3' (SEQ ID NO:157) 5'-TGGAAGGCTAGGAACGCTTA-3' (SEQ ID NO:158) 5'-CCAGTTAGGCCAGTTACCCA-3' (SEQ ID NO:159) 5'-TAAGCGTTCCTAGCCTTCCA-3' (SEQ ID NO:160) C. Amplificação por PCR específica do DNA dador
As primeiras reacções de amplificação por PCR foram realizadas usando reagentes fornecidos por TaKaRa Biotechnology Inc., Seta 3-4-1, Otsu, Shiga, 520-2193, Japan e consistiram no seguinte: 2,5 μΐ de tampão 10X Ex Taq PCR™ Buffer, 40-200 ng de DNA genómico matriz de cadeia dupla, 10 μΜ da sequência oligonucleotidica directa, 10 μΜ da sequência oligonucleotidica reversa, 2 μΐ da mistura de dNTPs (2,5 mM cada), 16 μΐ PRO, 0,5 μΐ (2,5 unidades) DNA-polimerase Ex Taq™. As reacções de PCR foram realizadas usando um termociclador Bio-Rad, DNA Engine Tetrad2, Peltier Thermal Cycler (Hercules, CA) de 96 amostras, nas seguintes condições: 94°C, 3 min/1 ciclo; 94°C 30 seg, 64°C 30 seg, 72°C 5 min/35 ciclos; 72°C, 10 min/1 ciclo; 4 °C/restante.
Os produtos de amplificação da primeira reacção de PCR foram subsequentemente reamplifiçados numa segunda reacção de PCR constituída por: 2,5 μΐ de tampão 10X Ex Taq PCR™ Buffer, 2 μΐ de matriz (diluição 1:100 da Ia reacção de PCR em H2O) , 10 μΜ da sequência oligonucleotidica directa, 10 μΜ da sequência oligonucleotidica reversa, 2 μΐ da mistura de dNTPs (2,5 mM cada), 16 μΐ H2O, 0,5 μΐ (2,5 unidades) DNA-polimerase Ex Taq™. As reacções de PCR foram realizadas usando um termociclador Bio-Rad, DNA Engine Tetrad2, Peltier Thermal Cycler (Hercules, CA) de 96 amostras, nas seguintes condições: 94°C, 3 min/1 ciclo; 94°C 15 seg, 61°C 30 seg, 72°C 30 seg/30 ciclos; 72°C, 10 min/1 ciclo; 4°C/restante tempo. Dez μΐ de cada produto amplificado foram sujeitos a electroforese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE agarose suplementado com 0,5% de brometo de etídio. Os fragmentos amplificados foram visualizados com luz UV e os tamanhos dos fragmentos estimados por comparação com uma escada de DNA de 1 kpb. Os produtos de PCR contendo o fragmento esperado foram diagnosticados pela presença de um fragmento de DNA de 0,317 kpb, como se mostra na Fig. 82.
Exemplo 21: Detecção de eventos de integração dirigida
De entre os eventos de tolerância a herbicida contendo uma molécula de DNA dador integrada, codificadora de uma cassete do gene de tolerância a herbicida, espera-se que alguma proporção dos referidos eventos seja o produto da integração dirigida de DNA dador no local da quebra da cadeia dupla induzida por ZFN. De forma a diferenciar estes eventos de integração dos derivados da integração aleatória da cassete do gene de tolerância a herbicida, utilizou-se uma estratégia de genotipagem baseada em PCR usando uma combinação de sequências iniciadoras de PCR específicas de genoma e subsequentemente específicas de genoma e específicas de dador. A. Amplificação específica de genoma e amplificação subsequente específica de genoma/dador
Nesta realização, as primeiras reacções de PCR utilizaram oligonucleótidos iniciadores específicos das regiões do gene alvo IPP2K a montante e a jusante da região de integração dadora (e.g., Figs. 92 e 93) . As primeiras reacções de amplificação por PCR foram realizadas usando reagentes fornecidos por TaKaRa Biotechnology Inc., Seta 3- 4-1, Otsu, Shiga, 520-2193, Japan e consistiram nos seguintes: 2,5 μΐ de tampão 10X Ex Taq PCR™ Buffer, 40-200 ng de DNA genómico matriz de cadeia dupla, 10 μΜ da sequência oligonucleotidica directa, 10 μΜ da sequência oligonucleotidica reversa, 2 μΐ da mistura de dNTPs (2,5 mM cada), 16 μΐ PRO, 0,5 μΐ (2,5 unidades) DNA-polimerase Ex Taq™. As reacções de PCR foram realizadas usando um termociclador Bio-Rad, DNA Engine Tetrad2, Peltier Thermal Cycler (Hercules, CA) de 96 amostras, nas seguintes condições: 94°C, 3 min/1 ciclo; 94°C 30 seg, 64°C 30 seg, 72°C 5 min/35 ciclos; 72°C, 10 min/1 ciclo; 4°C/restante. O produto da primeira reacção de PCR foi subsequentemente diluido a 1:100 em H2O e usado como DNA matriz em duas segundas reacções de PCR distintas. Nesta realização, as segundas reacções usam sequências iniciadoras que se ligam à região genómica de IPP2K e à molécula dadora, dando origem a um amplicão que abrange a fronteira de integração entre o genoma e o dador. A primeira reacção focou-se na fronteira 5' entre o dador e genoma. Ambas as reacções consistiram no seguinte: 2,5 μΐ de tampão 10X Ex Taq PCR™ Buffer, 2 μΐ de matriz (diluição 1:100 da Ia reacção de PCR em H2O) , 10 μΜ da sequência oligonucleotidica directa, 10 μΜ da sequência oligonucleotidica reversa, 2 μΐ da mistura de dNTPs (2,5 mM cada), 16 μΐ H2O, 0,5 μΐ (2,5 unidades) DNA-polimerase Ex Taq™. As reacções de PCR foram realizadas usando um termociclador Bio-Rad, DNA Engine Tetrad2, Peltier Thermal Cycler (Hercules, CA) de 96 amostras, nas seguintes condições: 94°C, 3 min/1 ciclo; 94°C 15 seg, 60°C 30 seg, 72°C 2 min/35 ciclos; 72°C, 10 min/1 ciclo; 4°C/restante tempo. Vinte μΐ de cada 2a reacção de PCR foram sujeitos a electroforese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE agarose suplementado com 0,5% de brometo de etidio.
Os fragmentos amplificados foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb (Invitrogen Life Technologies, Carlsbad, CA) . Os produtos de PCR derivados da integração dirigida do dador no gene IPP2K foram diagnosticados pela presença de fragmentos de DNA de 1,65 kpb (fronteira 5') (Fig. 83) ou 1,99 kpb (fronteira 3') (Fig. 84). Estes fragmentos foram removidos do gel e purificados de acordo com as instruções do fabricante uando o kit de extracção QIAguick Gel Extraction Kit (QIAGEN Inc. , Valencia, CA) . Os fragmentos purificados foram então clonados no plasmideo pCR2.1 usando o kit de clonagem TOPO TA Cloning® Kit (com o vector pCR®2.1) e células E. coli quimicamente competentes One Shot® TOP10 (Invitrogen Life Technologies, Carlsbad, CA) de acordo com o protocolo do fabricante.
Colónias individuais foram inoculadas num tubo
Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de canamicina e incubadas 16 hrs a 37°C com agitação a 200 rpm. Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrífuga de 1,7 ml Costar (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmídico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid Kit (BD Biosciences/Clontech/Macherey-Nagel, Paio Alto, CA) . Três yg do plasmídeo isolado a partir de plasmídeos dos clones com sequências de homologia 5' foram digeridos com 10 unidades de EcoRI (New England Biolabs, Beverly, MA) . Todas as digestos de plasmídeos foram incubadas durante 1 hr a 37°C. O DNA cortado com enzimas de restrição foi sujeito a electroforese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etídio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb (Invitrogen Life Technologies, Carlsbad, CA).
Os clones plasmídicos esperados foram diagnosticados pela presença de fragmentos de DNA inseridos do tamanho adequado para além do vector pCR®2.1 de 3,9 kpb. As reacções de sequenciação de cadeia dupla dos clones plasmídicos foram realizadas como descrito pelo fabricante usando o kit CEQ™ DTCS-Quick Start Kit (Beckman-Coulter, Paio Alto, CA). As reacções foram purificadas usando
Performa DTR Gel Filtration Cartridges (Edge BioSystems, Gaithersburg, MD) como descrito nos protocolos do fabricante. As reacções de sequenciação foram analisadas num sistema de análise de DNA Beckman-Coulter CEQ™ 2000 XL e a caracterização nucleotídica realizada usando Sequen-cher™ versão 4.1.4 (Gene Codes Corporation, Ann Arbor, MI). Os alinhamentos de nucleótidos foram realizados usando Vector NTi versão 10.1 (Invitrogen Life Technologies, Carlsbad, CA). A análise de dados de sequências derivados de um evento de integração dirigida (evento #073) foi conduzida como se segue. Os primeiros produtos de PCR abrangendo a totalidade do local de integração do genoma foram sujeitos a uma segunda amplificação focada na fronteira 5' ou 3' entre o genoma e o dador. O alinhamento dos fragmentos clonados correspondendo a estes produtos de amplificação da segunda reacção com a sequência genómica IPP2K selvagem, assim como a sequência esperada de um evento de integração dirigida, indicou claramente que ocorreu integração precisa do DNA dador no local alvo. A sequência nucleotídica do locus genómico IPP2K, a fronteira genoma/dador, a sequência nucleotídica das regiões dadoras correspondendo às sequências flanqueantes de homologia de IPP2K e a sequência nucleotídica da cassete de tolerância a herbicida estavam todos preservados nos múltiplos produtos de PCR clonados derivados deste evento.
Assim, este evento representou um genoma em que ocorreu a reparação conduzida por homologia de uma quebra na cadeia dupla, mediada por ZFN, e a integração dirigida de um DNA dador num gene alvo especifico. Foram obtidos outros eventos transformados representando ocorrências de integração dirigida únicas, demonstrando que os métodos aqui descritos são reprodutíveis em calos de milho. Os familiarizados com a técnica poderão aplicar estes métodos a qualquer gene alvo em qualquer espécie de planta para a qual se pretenda integração dirigida. B. Amplificação específica de genoma/dador em duas reacções sucessivas
Nesta realização, a primeira reacção de PCR e a segunda reacção subsequente utilizaram sequências iniciadoras oligonucleotídicas específicas das regiões do gene IPP2K a montante ou a jusante da região de integração do dador (apêndices V e VI) em combinação com sequências iniciadoras oligonucleotídicas específicas para a sequência dadora. Neste exemplo, as primeiras reacções de amplificação por PCR foram realizadas usando reagentes fornecidos por TaKaRa Biotechnology Inc., Seta 3-4-1, Otsu, Shiga, 520-2193, Japan e consistiram nos seguintes: 2,5 μΐ de tampão 10X Ex Taq PCR™ Buffer, 40-200 ng de DNA genómico matriz de cadeia dupla, 10 μΜ da sequência oligonucleo-tídica directa, 10 μΜ da sequência oligonucleotídica reversa, 2 μΐ da mistura de dNTPs (2,5 mM cada), 16 μΐ PRO, 0,5 μΐ (2,5 unidades) DNA-polimerase Ex Taq™. As reacções de PCR foram realizadas usando um termociclador Bio-Rad, DNA Engine Tetrad2, Peltier Thermal Cycler (Hercules, CA) de 96 amostras, nas seguintes condições: 94°C, 3 min/1 ciclo; 94°C 30 seg, 52°C ou 64°C 30 seg, 72°C 2 min/35 ciclos; 72°C, 10 min/1 ciclo; 4°C/restante. O produto da primeira reacção de PCR foi subsequentemente diluido a 1:100 em H2O e usado como DNA matriz numa segunda reacção de PCR. Nesta realização, as segundas reacções usam sequências iniciadoras que se ligam à região genómica de IPP2K e à molécula dadora, dando origem a um amplicão que abrange a fronteira de integração entre o genoma e o dador. As sequências iniciadoras especificas usadas determinam se a amplificação é focada na fronteira 5' ou 3' entre o genoma e o dador. Os reagentes para estas reacções consistiram no seguinte: 2,5 μΐ de tampão 10X Ex Taq PCR™ Buffer, 2 μΐ de matriz (diluição 1:100 da Ia reacção de PCR em H2O) , 10 μΜ da sequência oligonucleotidica directa, 10 μΜ da sequência oligonucleo-tidica reversa, 2 μΐ da mistura de dNTPs (2,5 mM cada), 16 μΐ H2O, 0,5 μΐ (2,5 unidades) DNA-polimerase Ex Taq™. As reacções de PCR foram realizadas usando um termociclador Bio-Rad, DNA Engine Tetrad2, Peltier Thermal Cycler (Hercules, CA) de 96 amostras, nas seguintes condições: 94°C, 3 min/1 ciclo; 94°C 30 seg, 54°C ou 60°C 30 seg, 72°C 2 min/35 ciclos; 72°C, 10 min/1 ciclo; 4°C/restante tempo.
Vinte μΐ de cada 2a reacção de PCR foram sujeitos a electrof orese a 100 V, durante 1 hr, num gel de 1,0% de agarose em TAE agarose suplementado com 0,5% de brometo de etidio.
Os fragmentos amplificados foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb (Invitrogen Life Technologies, Carlsbad, CA) . Os produtos de PCR derivados da integração dirigida de dador no gene IPP2K foram diagnosticados pela presença de fragmentos de DNA de 1,35 kpb (fronteira 5') (Fig. 85) ou 1,66 kpb (fronteira 3') (Fig. 86). Estes fragmentos foram removidos do gel e purificados de acordo com as instruções do fabricante usando o kit de extracção QIAquick Gel Extraction Kit (QIAGEN Inc., Valencia, CA). Os fragmentos purificados foram então clonados no plasmideo pCR2.1 usando o kit de clonagem TOPO TA Cloning® Kit (com o vector pCR®2.1) e células E. coli quimicamente competentes One Shot® TOPIO (Invitrogen Life Technologies, Carlsbad, CA) de acordo com o protocolo do fabricante. C. Análise das sequências nucleotídicas dos produtos de PCR para genotipagem
Colónias individuais descritas no Exemplo 21B foram inoculadas num tubo Falcon de 14 ml (Becton-Dickinson, Franklin Lakes, NJ) contendo 2 ml de TB suplementado com 50 μΐ/ml de canamicina e incubadas 16 hrs a 37°C com agitação a 200 rpm. Após incubação, 1,5 ml de células foram transferidas para um tubo de microcentrífuga de 1,7 ml Costar (Fisher Scientific, Pittsburgh, PA) e sedimentadas a 16000 xg durante 1 min. O sobrenadante foi removido e o DNA plasmídico foi isolado como descrito atrás usando o kit NucleoSpin® Plasmid Kit (BD Biosciences/ Clontech/Macherey-Nagel, Paio Alto, CA) . Três pg do plasmídeo isolado a partir de plasmídeos dos clones com sequências de homologia 5' foram digeridos com 10 unidades de EcoRI (New England Biolabs, Beverly, MA). Todas as digestos de plasmídeos foram incubadas durante 1 hr a 37°C. 0 DNA cortado com enzimas de restrição foi sujeito a electrof orese a 100 V durante 1 hr num gel de 1,0% de agarose em TAE suplementado com 0,5% de brometo de etídio. Os fragmentos foram visualizados com luz UV e o tamanho dos fragmentos estimado por comparação com uma escada de DNA de 1 kpb (Invitrogen Life Technologies, Carlsbad, CA).
Os clones plasmídicos foram diagnosticados pela presença de fragmentos de DNA inseridos para além do vector pCR®2.1 de 3,9 kpb. As reacções de sequenciação de cadeia dupla dos clones plasmídicos foram realizadas como descrito pelo fabricante usando o kit CEQ™ DTCS-Quick Start Kit (Beckman-Coulter, Paio Alto, CA) . As reacções foram purificadas usando Performa DTR Gel Filtration Cartridges (Edge BioSystems, Gaithersburg, MD) como descrito pelos protocolos do fabricante. As reacções de sequenciação foram analisadas num sistema de análise de DNA Beckman-Coulter CEQ™ 2000 XL e a caracterização nucleotídica realizada usando Sequencher™ versão 4.1.4 (Gene Codes Corporation,
Ann Arbor, MI). Os alinhamentos de nucleótidos foram realizados usando Vector NTi versão 10.1 (Invitrogen Life Technologies, Carlsbad, CA).
Os dados de sequências abrangendo a fronteira entre a sequêncoa genómica IPP2K 5' a montante e o DNA dador derivado de múltiplos eventos de integração dirigida foram igualmente obtidos, incluindo os dados de sequências abrangendo a fronteira entre DNA dador e a sequência genómica IPP2K 3' derivada de múltiplos eventos de integração dirigida, assim como dados de sequências de fronteira a montante (5') derivadas de um único calo transformado (#114) . O evento de intergação dirigida transformado (#114) foi resultado da integração de um dador autónomo no gene alvo IPP2K.
Nestas análises, tanto a primeira como a segunda reacção de amplificação por PCR focaram-se na fronteira 5' ou 3' entre o genoma e o dador. O alinhamento dos fragmentos clonados correspondendo a estes produtos de amplificação secundários com a sequência genómica selvagem de IPP2K, assim como a sequência esperada de um evento de integração revelaram que ocorreu a integração de um DNA dador no local alvo. A sequência nucleotidica do locus genómico IPP2K, a fronteira genoma/dador, a sequência nucleotidica das regiões dadoras correspondendo às sequências flanqueantes de homologia de IPP2K e a sequência nucleotidica da cassete de tolerância a herbicida estavam todas preservadas nos múltiplos produtos de PCR clonados derivados deste evento.
Assim, este evento representa um genoma em que ocorreu reparação conduzida por homologia de uma quebra de DNA de cadeia dupla mediada por ZFN, num gene alvo específico. Obtiveram-se outros eventos transformados representando ocorrências únicas de integração dirigida, demonstrando que os métodos aqui descritos são reprodutíveis em calo de milho. Os familiarizados com a técnica poderão aplicar estes métodos a qualquer gene alvo em qualquer espécie de planta para a qual se pretenda integração dirigida.
Exemplo 22: Regeneração de plantas completas férteis a partir de tecido de calo de milho
Calos isolados de células de milho tolerantes a herbicida, derivados de cultura de células Hill, podem ser regenrados dando origem a plantas de milho completas férteis. Os familiarizados com a técnica poderão regenerar plantas de milho completas férteis a partir de uma variedade de culturas embrionárias de células de milho.
Neste exemplo, a regeneração de calos Hill isolados resistentes a bialophos foi iniciada por transferência de tecido de calo isolado para um meio de indução baseado em citocinina, 28 (1H), contendo sais MS e vitaminas, 30,0 g/1 sacarose, 5 mg/1 benzilaminopurina, 0,25 mg/1 de 2,4-D, 1 mg/1 bialaphos e 2,5 g/1 de Gelrite; pH 5,7. As células cresceram com pouca luz (13 pEm-2s-l) durante uma semana, seguido de transferência para condições maior intensidade de luz (40 pEm-2s-l) durante uma semana. As células foram então transferidas para meio de regeneração, 36 (1H), o qual é idêntico ao meio de indução excepto não possuir reguladores de crescimento vegetais. Pequenas plântulas (3-5 cm) foram retiradas com ferramentas manuais e colocadas em tubos de cultura de vidro de 150x25 mm contendo meio SHGA (Schenk and Hildebrandt basal salts and vitamins, 1972, Can. J. Bot 50:199-204; 1 g/1 mioinositol, 10 g/1 sacarose, 2,0 g/1 Gelrite, pH 5,8).
Uma vez as plântulas desenvolvidas até um sistema radicular e de rebentos suficientemente grande e diferenciado, foram transplantadas para potes de 4 polegadas contendo meio de crescimento Metro-Mix 360 (Sun Gro Horticulture Canada Ltd.) e colocados numa estufa. As plântulas foram total ou parcialmente cobertas com copos de plástico durante 2-7 dias, depois transplantadas para vasos de 5 galões contendo uma mistura consistindo em 95% de meio Metro-Mix 360 e 5% de solo argiloso/limoso e crescidas até à maturidade. As plantas podem ser auto-polinizadas ou sofrerem polinização cruzada com uma linha singeneica de forma a produzir sementes TI ou Fl, respectivamente. Os familiarizados com a técnica poderão auto-polinizar plantas regeneradas ou fazer polinização cruzada de plantas regeneradas com uma variedade de germoplasmas de modo a permitir a reprodução de milho.
Informação adicional relacionada com a clivagem dirigida, recombinação dirigida e integração dirigida pode ser encontrada nas publicações de pedido de patente dos Estados Unidos US-2003-0232410; US-2005-0026157; US-2005- 0064474; US-2005- 0208489; US-2006-0188987; e o pedido de patente dos Estados Unidos N° de Série 11/493423, entregue em 26 de Julho, 2006.
LISTAGEM DE SEQUÊNCIAS
<110> Cai, Qihua C
Miller, Jeffrey Urnov, Fyodor Shukla, Vipula K Petolino, Joseph F Baker, Lisa W Garrison, Robbi J Blue, Ryan C Mitechell, Jon C Arnold, Nicole L Worden, Sarah E <120> Proteínas com dedos de zinco não canónicas optimizadas <130> 8325-4002.40 <140> PCT/US2007/025455 <141> 2007-12-13 <150> 60/874,911 <151> 2006-12-14 <150> 60/932,497 <151> 2007-05-30 <160> 199 <170> Patentln versão 3.5 <210> 1 <211> 25 <212> PRT <213> Artificial <220> <223> motivo dedo de zinco <220> <221> MISC_FEATURE <222> (2)..(3) <223> Xaa = qualquer aminoácido <220> <221> MISC_FEATURE <222> (4)..(5) <223> Xaa = qualquer aminoácido Xaa pode estar presente ou ausente <220> <221> MISC_FEATURE <222> (7)..(18) <223> Xaa = qualquer aminoácido <220>
<221> MISC_FEATURE <222> (20)..(22) <223> Xaa = qualquer aminoácido <220> <221> MISC_FEATURE <222> (23)..(24) <223> Xaa = qualquer aminoácido
Xaa pode estar presente ou ausente <400> 1
Cys Xaâ, Xaa. xaà :%àà-'%àè Xaa Xaa Xaa x&amp;&amp; :lv 5 1-0 15
Xaa Xas. íí± y Xaa Xaa Xsa Xs-s. .Xaa His 20 2 5 <210> 2 <211> 6 <212> PRT <213> Artificial <220> <223> motivo dedo de zinco <220>
<221> MISC_FEATURE <222> (2)..(2) <223> Xaa = qualquer aminoácido (A, K ou T são preferidos) <220>
<221> MISC_FEATURE <222> (3)..(3) <223> Xaa = qualquer aminoácido (Q, E ou R são preferidos) <220>
<221> MISC_FEATURE <222> (6)..(6) <223> Xaa = qualquer aminoácido (G é preferido) <400> 2
His Kit (ilaâ: .âirg X 5 <210> 3 <211> 35 <212> PRT <213> Artificial <220> <223> motivo dedo de zinco <220> <221> MISC_FEATURE <222> (2)..(3) <223> Xaa = qualquer aminoácido <220> <221> MISC_FEATURE <222> (4)..(5) <223> Xaa = qualquer aminoácido Xaa pode estar presente ou ausente <220> <221> MISC_FEATURE <222> (7)..(18) <223> Xaa = qualquer aminoácido <220>
<221> MISC_FEATURE <222> (20)..(22) <223> Xaa = qualquer aminoácido <220> <221> MISC_FEATURE <222> (23)..(24) <223> Xaa = qualquer aminoácido Xaa pode estar presente ou ausente <220> <221> MISC_FEATURE <222> (26)..(26) <223> Xaa = qualquer aminoácido <220> <221> MISC_FEATURE <222> (27)..(35) <223> Xaa = qualquer aminoácido
Xaa pode estar presente ou ausente <400> 3
Cys líâ·®: &amp;&amp;&amp; Cys X&amp;S .35¾¾ JSãâ Xaa Xss. X&amp;&amp;- .Ksa Xaa Xa-ô
1 5 10 IS
Xa.® Xaa Hís Xaa Xaã'Ç$àà; Xam ,:Xáa Cys 'XáauXaá Xa® Xaa .Xaa Xa&amp;cMa 2Õ g| 30 -
Xaa 5sa<a Xaa •Tf *\ <210> 4 <211> 5 <212> PRT <213> Artificial <220> <223> elemento de ligação ZC <400> 4 01 y Lêti tegtSly Ser i 5 <210> 5 <211> 6 <212> PRT <213> Artificial <220> <223> elemento de ligação ZC <400> 5
Gly Giv Xeu Aro Gly Ser 1 $ <210> 6 <211> 1199 <212> DNA <213> Zea mays <400> 6 atggagatíjg .atcgey-ftct gcaagccgcg gatgccaagg accgggctr.a caagggggaa 6 0 ggcgé-gcgt atctcatcc- cago ta caco ggo teqtc-gç ecoccatout ®agog;::tga<j 120............ " " taggttctt® cca^gcgtac acqcatcgat caettgactt caqqgactca ata Lqtgatt xao cacgggtgcc gcggc-gccar, tcgagcr.ccs gatceagt.se egotsqagea agtqataaaa 240 cafcggagcag gg&amp;cg&amp;tcac gcggtcacfct gaaaattacq tigaqqtccog gaegacc&amp;tg ' 10«................................................. ««csâs-fecac» cas&amp;acaa&amp;ae· egetfesqtgt tgqictfcfcgfc 360 tocaagcgse: tgtgtgagtg tfctgagagtt cgcoagcgcg -aeategcccg acctgacaaa 420 ttasgctcte gttgetcct" catgattgtg cattttgtga gcafcgesctg aataatafcca 4S0 tggatstgtt tgcasggaaao attattccaa tctqatqata &amp;gqqccu:t,at t.caractLa:: --5:40 - - - - tttcaqcttg gcaaggfcáçt geggçfcegàg sagaateLaa aaaat-aagtc gc&amp;gcgggca ooo eegagttgta ctgcsttetc: aagtgafcgag ea&amp;eLcetgt: qgggcãatac cccagr&amp;asfcq 660 qttgagtcgq ccaaaeaacsa ttgcttagct caa-geecatq Laetiqcatqr tafcqaace&amp;a 220 cacctgggtg ccaatcatg»'. egatqgtggg qtatracttea q$ t&amp;ca«ttc a a atatecce 780
tgtt&amp;tcgtq àttttg&amp;ftg gtaacata.it '.g&amp;ca&amp;eetcg aeaettgcig®. tgàQáfcfecág 34 Q ttcacttafcq gaaqaaattg gàgp&amp;ttgtt at&amp;afctt&amp;te tàtaatcacc cetacfcá&amp;àa 200 feaga&amp;ataac aiggeatcaa tgfcgeaagct attgaatata q&amp;cacqaata cgetttaite 960 tatcatatgt fcggtaattcc· áqcagooa§q sgqoactacs: cttugqatce acsteaetr.g X020 aaaaagaaat ca caeca cat tcceacaaty oaggtcegtg tacgtqcttc tagoqatttt 1080 etggsgcatgf togaaaagáa i:.gt:?:ctCage sgcegccctg ecgggagagt 1.140 ' - " ' t caa 11g a ta a e ac t gc tg* tgeegsÇC tfc:: eeaafcagoiâg -lysea etc tfefc. att t e»S tgg <210> 7 <211> 50 <212> DNA <213> Zea mays <400> 7 çaaei.ectgt ggggc.ca.tau. ccc&amp;gaactg gttqaqtcgg tca&amp;acsaga 50 <210> 8 <211> 12 <212> DNA <213> Zea mays <400> 8 etgtgggqcc at 12 <210> 9 <211> 18 <212> DNA <213> Zea mays <400> 9 vetaefe&amp;ac tcagocag . 'll ν' <210> 10 <211> 59 <212> DNA <213> Zea mays <400> 10 aagucaugag caactcctgu gggydcatat eecagaaetg gttgaqucqg teaaaeaag M. <210> 11 <211> 53 <212> DNA <213> Zea mays <220> <223> Sequência do gene IPP2k de milho com mutação mediada por ZFN <400> 11 .aa-gtc^ti^gv <210> 12 <211> 12 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 12
Hie Thr Lys 21# Eis- I*eu .&amp;rg:: Gty V3#r Gin Lsu 'VnG "&amp; 5 10 <210> 13 <211> 12 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 13 111.íS· Thr Lys I.ls Cys Leu Arg Oiy Sèr Gin Leu Vai i LiA ' <210> 14 <211> 12 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 14
His T.hr Lys Gly Cys Leu Arg Oly Ser Gin h®u Vai 1: 5 10 <210> 15 <211> 12 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 15 Kís Thr Lys Ala Cys Leu Arg Gly Ser Gin Leu Vai 1 S 10 <210> 16 <211> 12 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 16 -Leu Arg Gly Ser Gin BmiVâl 1 5 10 <210> 17 <211> 12 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 17
Mis Thr Lys Leu Cys Leu Arg Gly Ser Gin 'Leu Vai 1 5 ' 10 <210> 18 <211> 12 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 18
HimèhT·· Lys Ser Cys Leu Arg Gly Ser Gin Leu Vãl 1 S 10 <210> 19 <211> 12 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 19 ·.:>'Arg :Gly Ser Gin Leu· Vai 1 5 10 <210> 20 <211> 12 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 20
His: Ifir: Ly§ Ly® Cys Leu Arg GlylSer Gin Léu Val 1 S «0 <210> 21 <211> 12 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 21 íáis Thr Lys Arg Cys-iBeu Arg Gly Sér Gin Leu Vai 1 ~ S ' 10 <210> 22 <211> 14 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 22 í'i-5. S TL.r Lys I .i $3 G1.y GlY Cys Leu Az'Cf Gly Ser Gxn. Leu. \< § 1 k, 'B ' ' " ia <210> 23 <211> 13 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 23
Hie Thr Lys Ile Cys Gly Leu Arg Gly Ser Gin Leu Vai 1 ' ¥ 10 <210> 24 <211> 14 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 24
His Thr Lys lis Cys Gly Gly Leu Arg Gly Ser Gin Leu Vai """"" Wv" : 1C; ' ' <210> 25 <211> 14 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 25
Hié Thr Lys Ile Gly Cys Gly Leu Arq Gly Ser Gin Leu Vai '-L 5 " " 10 <210> 26 <211> 15 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 26 H2.í5 XXtr Ays Xi e "2iy 0;ys <21 v 22r y Leu Ary Gly 222222 Olri Leu \Lsi 1 5 ~ ' ' 10' * 1¾ <210> 27 <211> 13 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 27
Bifo Le« 2¾¾. Gly £$* Gly Ser Gin Léu 'Vai
T ' ' 5 ' "' 1Q <210> 28 <211> 13 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 28
Hig Leu :Lys Gly ÂsniGyls Sró; Ãlâ Gly Ser Gin Leu Vai 1 5 10 <210> 29 <211> 13 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 29
His Ser Glu Gly Gly Cys Leu Arg Gly Ser Qln Léu 'Vai X R X 0 <210> 30 <211> 13 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 30
Kis Ser Glu Gly Gly Cys Pro Gly Gly Ser Gin Leu Vai 1 &amp; .10 <210> 31 <211> 13 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 31
Ria Ser Ser Sm: hsn Gym: :€:er Qliíilièfâ V&amp;l X. '...... "" 5 ' ......' " 10 <210> 32 <211> 13 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 32
His Ser Ser Ser Asn Cys Thr lie Gly Ser Gin leu \?al 1 ............5 " ' ' 10 <210> 33 <211> 15 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 33
sis Thr Lys lie Cys Gly âiy Gly ueu Atsj Gi y Ser Giji: teu Vai; 1: S XO <210> 34 <211> 16 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 34
His fhrttysGiy si;y Gly LeU: Gly Gin Leu Vai 1 5 10 15 <210> 35 <211> 14 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 35
Hi a T&amp;r Lys 11« Gly G-ly cys' Leu hrg Gly Ser Gin Leu tel 1 5 10 <210> 36 <211> 15 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 36
His Thr Lys Ile Gly Gly Cys Gly Leu Ara Cly Ser Gin Leu Vs1 1 5 10 15 <210> 37 <211> 16 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 37
Bis "’hr Lys Tie Gly Gly Cye Gly Gly Leu Arg Gly Ser Gin Leu VsL S .1.0 ~ " 15 <210> 38 <211> 13 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 38
His That LyS Arg Cys Gly Léu Arg Gly Ssr Glh LéutVsi 1. « ·· o
:+:: V ·ν V <210> 39 <211> 14 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 36
Sis Thr Lys Arg Cys Gly Gly Leu A?rg Gly Ser Glsi Leu Vai 1 5 2 0 <210> 40 <211> 15 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 40
Hie Thr Lys Arg Cy@ Qly <31y Giy Arg Qly Ser Gin L-au val 1 H 10 15 <210> 41 <211> 13 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 41
Hie Thr Lys Aro Giy Cys Lau Arg Giy Ser Gin Leu Vai 1-: 5 10 <210> 42 <211> 14 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 42 :1ÍA cisar:èys Gly Lèxi S^ihiíiy 'Has? Gin teu Vai; 1 ' Ç 10 <210> 43 <211> 14 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 43
His Thr leys Arq illy Cys Gly Giy Lets Ar-y Giy Ser Gin Leu Vai X S 10 15 <210> 44 <211> 16 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 44
His T.hr Lys Arg Sly Cys Gly Sly G1 y Leu Arg Sly Ger Sin Leu V&amp;I 1 ' $ ' " \ Q " ' X $. <210> 45 <211> 14 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 45
His Thr L-ya Arç Gly Gly Cys Lsu Arg Gly Ser Gin Leu VAX I G €&amp; <210> 46 <211> 15 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 46
His Thr Lys Ara <5ly Gly Cys Gly Leu Ara Gly Ser Gin Leu Vai 1 5 10 15 <210> 47 <211> 16 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 47
His Thr Lys Arg Gly Gly Cys Gly Gly Leu Arg Gly Ser Gin Leo Vai 1 5 10 15 <210> 48 <211> 14 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 48
Kia .Leu Lys Gly Asn Cys Gly Leu .Arg Gly Ser Gin Leu Vai 1 " S " 10 <210> 49 <211> 15 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 49
Mis Mu Lys Cly Asn Cy» Gl#;Leu Arg Gly -Màr Gin Leu vai :t........5........ " ' 10............ is <210> 50 <211> 16 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 50
His Leu Lys Gly Asxs Çy$ Gly Gly Qly Leu Arg Qly Ser: Gin Leu Vai 1 $ 1.Q: is <210> 51 <211> 13 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 51
Hlí» Lys Glu Arg Cys Gly Leu Arg Gly Sei' Gin Leu Vai. 1 5 " 10 <210> 52 <211> 13 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 52 L!&amp; Thr Arg Arg Cys Gly leu Arg Gly Ser Oln Leu Vai. 1 :S m <210> 53 <211> 13 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 53 Hís Ala Gin Arg Cys Gly Leu Arq Gly Ser Gin Leu Vai 1: S 10 <210> 54 <211> 14 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 54
Hts Lys; I.ye Tyr Cys Sly Leu Arg Gly Ser Gin Leu Vai % 5 " ίο" <210> 55 <211> 14 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 55
His Lys Lye Bis Tyt Cys Giy Leu Arg Cly Ser Sirs Leu vai 1 5 iO <210> 56 <211> 14 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 56
His Lys Lys Tyr Tir Cys Sly Lei; Arg Gly Ser; Gin Leu vaX 1 C. ~ i o <210> 57 <211> 14 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 57
His Lys Tyr Cys Gly Leu Arg 61y Ser Gin Leu V&amp;X. % s io <210> 58 <211> 14 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 58
His Lys Gin Tyr Tyr Cys Gly Leu Arg Gly S&amp;r QXn Leu Vai: 1 ' '' S ' r" 10 <210> 59 <211> 14 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 59
Eia Lôu Leu Lys Lye Cys Gly Leu Arg Gly $&amp;£ Gin .Leu "i;................S............. 10........... <210> 60 <211> 14 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 60
His GIE: Lyá :Êp’: ÊÍf LeaiArg G.iy Ser Gia:i»é:à Vai 1 S 10 <210> 61 <211> 14 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 61
His GlíX Lys Lys Leu Gys Gly Leu &amp;rg Gly Ser QX® Leu x.v" " s ' 10’’ " <210> 62 <211> 14 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 62
His Gin lie Arg Gly Cys Gly Leu &amp;rg Gly Ser Gin Lsu Vsl 1 S 10 <210> 63 <211> 15 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 63
Mis Ile Lys &amp;rg Qln Ser Çys Gly Leu Acg Giy Ser Gin Leu Vai 1 &amp; 10 15 <210> 64 <211> 15 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 64
His Ile Arg Arg Tyr Cys Gly Leu Axg Sly Ègr Gla Leu vai 1 S 10 .1.5 <210> 65 <211> 15 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 65
His lie Ser Ser Lys Lys €ya Gly Leu Arg Gly Ser GLn Ley Vel '1.: 5' " ΊΌ '45·: <210> 66 <211> 15 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 66
His Lys lie Gin Lys Ale Cys Gly Leu Arg Gly Ser Gin Leu Vai 1 5. 10 ' 45^ <210> 67 <211> 15 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 67
His Lys Arg Ile Tyr Thr Cys Gly Leu Arg Gly Ser Gin Lsxs Vai 4. ' ~ "" 5 ' ' %®y "" ” """ 1-5 <210> 68 <211> 15 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 68
His tón Lys C1 y Gin ftsn Cys Gly Lny Arg Ol γ Ser Gin seu Vai
£ 5 Ϊ0 IS <210> 69 <211> 15 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 69
His Leu Lys Lys Asp Gly Cys Giy Leu Arg Gly Ser Gin Leu Vai £ &amp; XO 15 <210> 70 <211> 15 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 70
Li. S:: teu Lyx? Ty 'fltr Lr o Cys Gliy Lee Art| Gly Ser G1 π La u. Va i. 4··"" " " " ' 5 1C·’ <210> 71 <211> 12 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 71
Kis Ths: Lys Arg Cyô Giy Ârg Giy Ser Gin Leu Vai 1 5 10 <210> 72 <211> 14 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 72
Hi B ‘íitr Lys.:. lie ÇíyS Qiy' .j&amp;iTÇf ¢3^1^ :Sé:3? 1 s ~ 10" <210> 73 <211> 13 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 73
His Lets Ly® Gly Asn Cys Gly A rd Gly Ser Gin Leu Vai. i"' 3;;":' ' '' 10 <210> 74 <211> 13 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 74
Hi® Lets Lys Gly âsn Cys Gly Gly Gly ser Gin Vai ;1: '5' 'IO;' <210> 75 <211> 11 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 75
His IIs €ys:.:-rhr: Gly Ser Gin Lys Bm
1 S LO <210> 76 <211> 12 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 76
His lis Irg Thr Cys Gly Tkr Gly Ser Gin Lym Ètá, l 5 M <210> 77 <211> 12 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 77
Kis Xíg: Arp W&amp;r Gly Ser GX.n Lye -:¾'...... 5 ............ 10 <210> 78 <211> 13 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 78
His lie Arg Thr Gly Cys Gly Thr Gly S&amp;r Gin Lys 1 5 10 ' <210> 79 <211> 11 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 79
His lie Arg Arg Cys 'Thr Gly Sor Gin Lya l*r©. I 5 10 <210> 80 <211> 12 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 80
Hi a lis Arg Arg Gly Cys Thr Gly Ser Gin Ays Pro %.................10 <210> 81 <211> 11 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 81
His Thr Lys lie His Thr Gly Ser Gin Lys Fro 1 5 ' 1©: <210> 82 <211> 11 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 82
His Thr Lys íia Mis Thr Gly Ser Gis Lye Pro i 5 : ίο <210> 83 <211> 11 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 83
Eis Thr Lys Arg Cys Thr Gly Ser Gin Lys Pro 1 * 5 10 <210> 84 <211> 11 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 84 HÇgv Ala Gly Ser Gin Lye/Pro 1 5 10 <210> 85 <211> 12 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 85 W$>È. i-i&amp;ac '.XXé Cys flr: Oly Sr Glái:Íjys,,:feo.:
1 f> 1C <210> 86 <211> 12 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 86 Kís. thr 1¾ Gly Ser Gin Lys· Pro 1 d 10 <210> 87 <211> 12 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 87
HiS· :à.lãs: Gla . Urg Cys Gly Thr Gly Ser Gin Lys Pro :i 10 ' <210> 88 <211> 12 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 88
Hisí Thr Lys lie Hiss Leu Arg Gly Ser Gin Leu Vai 1' 5 10 <210> 89 <211> 7 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 89 Hís Ala Gin At« Cys Gly Gly
1. S <210> 90 <211> 8 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 90
His Ala Gin Arg CVS Gly Gly Gly 1 ~ 5 ’ · ' ' <210> 91 <211> 8 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 91 Μ.B Tte Lys lie Cys íllyvSly fíly -£" : s: <210> 92 <211> 8 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 92
His Lyj» Ãxg Cys <3iy íliy 3Íy 1 &amp;' <210> 93 <211> 6 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 93
Ris Ala Gin. Arg Cys <31y 1 S <210> 94 <211> 7 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 94
Cys Cys Has: Chr Lys Xis Kis 1 ft <210> 95 <211> 7 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 95
Cys Cys His Thr Lys He His·
:.1 S <210> 96 <211> 7 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 96
Cvs Cys ;Mis Thr Lys He Çya :l ::S: <210> 97 <211> 10 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 97
Cys Cys Ms :teg Cys Gly Gly <3ly 1. S 10 <210> 98 <211> 8 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 98
Cys Cys His Ala CIb Amg Cys Sly :I: 5 <210> 99 <211> 8 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 99
Arg TSár; 01 y Cyd 1 s <210> 100 <211> 7 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 100
Cys Cy® His Thr Lys Ile Ris i 5 <210> 101 <211> 8 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 101
Cys Cys .His Ile Arg Thr Gly Cys 'i- " ~ <210> 102 <211> 7 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 102
Cys Cys Mis Thr Lys Tíe His 1 ' Si <210> 103 <211> 9 <212> PRT <213> Artificial <220> <223> Motivo dedo de zinco <400> 103
Cys Cys His Ala Gin. Arg Cys Giv Gly 1 ' 5 <210> 104 <211> 29 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 104 §tggâgâcgg atq ggg fc tct qcaagccgc 2 9 <210> 105 <211> 7 <212> PRT <213> Artificial <220> <223> Domínio de ligação a dedo de zinco <400> 105
Asp ftpg Sex Ala Leu Ser Arg $ <210> 106 <211> 7 <212> PRT <213> Artificial <220> <223> Domínio de ligação a dedo de zinco <400> 106
Ax q Aan Asp Asp Axg Lys Lys 1. ' ' " 75 - <210> 107 <211> 7 <212> PRT <213> Artificial <220> <223> Domínio de ligação a dedo de zinco <400> 107
Axgj Ssr Asp Asm Lea Ssr Thr 1 s <210> 108 <211> 7 <212> PRT <213> Artificial <220> <223> Domínio de ligação a dedo de zinco <400> 108 III a: Sér Má SM: Arg xlé Lys- 1.............. -s;........ <210> 109 <211> 7 <212> PRT <213> Artificial <220> <223> Domínio de ligação a dedo de zinco <400> 109
Arg :S«' âsp Vai Leu €1¾ £ g. <210> 110 <211> 7 <212> PRT <213> Artificial <220> <223> Domínio de ligação a dedo de zinco <400> 110
Gin Ser <3ly àsn Ler Ala Arg X 5 <210> 111 <211> 7 <212> PRT <213> Artificial <220> <223> Domínio de ligação a dedo de zinco <400> 111
Arg; S@r Asp Asb. : fen : Ala Arg.· 1: S' <210> 112 <211> 7 <212> PRT <213> Artificial <220> <223> Domínio de ligação a dedo de zinco <400> 112
Thr Ser Giy c-ler Leu Thr Arg
1 S <210> 113 <211> 7 <212> PRT <213> Artificial <220> <223> Domínio de ligação a dedo de zinco <400> 113
Thr Ser Gl.y Asm Thr Arg 1 <210> 114 <211> 7 <212> PRT <213> Artificial <220> <223> Domínio de ligação a dedo de zinco <400> 114 tog·; Glu .1. s <210> 115 <211> 7 <212> PRT <213> Artificial <220> <223> Domínio de ligação a dedo de zinco <400> 115
Thr~ I 5 <210> 116 <211> 7 <212> PRT <213> Artificial <220> <223> Domínio de ligação a dedo de zinco <400> 116
Glu Arg <3Iy Thr Lsu Kla Arg ϊ tv: <210> 117 <211> 7 <212> PRT <213> Artificial <220> <223> Domínio de ligação a dedo de zinco <400> 117
Arg S«r Asp Ala L«?u Thr Girt 1 " S' <210> 118 <211> 7 <212> PRT <213> Artificial <220> <223> Domínio de ligação a dedo de zinco <400> 118
Arg Ser Aap Ser Lev Ser à:!ía X 5 <210> 119 <211> 7 <212> PRT <213> Artificial <220> <223> Domínio de ligação a dedo de zinco <400> 119
Ara Sèr Alá A.la Leu Ala Arg 4: ~............... 1 <210> 120 <211> 7 <212> PRT <213> Artificial <220> <223> Domínio de ligação a dedo de zinco <400> 120
Arg Asp Asn Leu Ser Slu X 5 <210> 121 <211> 7 <212> PRT <213> Artificial <220> <223> Domínio de ligação a dedo de zinco <400> 121 Âls S#r:;Arg Thr Asn H r "
wL <210> 122 <211> 7 <212> PRT <213> Artificial <220> <223> Domínio de ligação a dedo de zinco <400> 122
Asp Arg Ser Mis Leu Ala Arg 1 ' 5 <210> 123 <211> 7 <212> PRT <213> Artificial <220> <223> Domínio de ligação a dedo de zinco <400> 123 in Ser Asp His Leu Ser Thr 1 K. <210> 124 <211> 7 <212> PRT <213> Artificial <220> <223> Domínio de ligação a dedo de zinco <400> 124
Cin Ser OUy Ser Leu Thr Arq 1. s <210> 125 <211> 7 <212> PRT <213> Artificial <220> <223> Domínio de ligação a dedo de zinco <400> 125 Q'lxi h&amp;n His His Are lie Asn " ' 5 " ' <210> 126 <211> 7 <212> PRT <213> Artificial <220> <223> Domínio de ligação a dedo de zinco <400> 126
Thr Gly Ser Leu Thr Krg 1 5 <210> 127 <211> 7 <212> PRT <213> Artificial <220> <223> Domínio de ligação a dedo de zinco <400> 127 te p. teg Ser
È·''' ~ I <210> 128 <211> 18 <212> DNA <213> Artificial <220> <223> Sequência alvo do dedo de zinco IPPK2 <400> 128 g«u*ceggttg «gtcggtc
IS <210> 129 <211> 18 <212> DNA <213> Artificial <220> <223> Sequência alvo do dedo de zinco IPPK2 <400> 129 gaactggttg agtcggtc 18 <210> 130 <211> 12 <212> DNA <213> Artificial <220> <223> Sequência alvo do dedo de zinco IPPK2 <400> 130 atggcceeac ag <r>: ^ . <210> 131 <211> 15 <212> DNA <213> Artificial <220> <223> Sequência alvo do dedo de zinco IPPK2 <400> 131 ggeacccagg tgttg 1$
<210> 132 <211> 18 <212> DNA <213> Artificial <220> <223> Sequência alvo do dedo de zinco IPPK2 <400> 132 gecgstgyfcg gggc&amp;tgg ............ <210> 133 <211> 18 <212> PRT <213> Artificial <220> <223> NLS derivada de op-2 do milho <400> 133
Arg Lyê Arg Lys Glti Sçr Assn Arg Glu SAx~ Ala. Arg Are? Ser Ar Tyr 1 5. 10 · &amp;
Arg Ay s <210> 134 <211> 18 <212> PRT <213> Artificial <220> <223> Sequência 2A do vírus de Thosea asigna <400> 134
Sla Sly .Arg Ser -Leu beu fhr Cye Gly Asp G&amp;l Glu Glu àsa iço I " "M ' "" u ly Pr. o <210> 135 <211> 30 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 135 ggeagcatta. t Lee a a L Ltg atg s.tAAt gg 3{) <210> 136 <211> 29 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 136 cecaagtgtc gaggttgtca atatgfctac òo' <210> 137 <211> 26 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 137 ÉSSC&amp;atààg ttgtaí: t:gOc ttctca 2 6 <210> 138 <211> 26 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 138 ss&amp;ataggct tgagccaagc aatcat 26 <210> 139 <211> 855 <212> DNA <213> Artificial <220> <223> posição -1 sequência flanqueante com homologia 3' <400> 139 gatagcagat gcagattgct tgiitgfcçitg gttfegátit^ ^ stttcegttfc ggttegtgtg cctcagtgtc tgacagcagc agatcetcga tggagacgga 120 tggggttctg caagtcgcgg atgccaagga etgggçttae aagggagaag gcgccgcgaa í S3 fectcatítctc «gctacâccg gdatgttfta: 'dtcdafcggfca âgdggtgagfe: aggfctcttss· 2 40 tgagtgtgca scttgao tti.: aggggctcaa I íYÓ ·.> W" cca.Kfcég&amp;âEC.: tccagatcea .¾¾¾teg /sgesaetgat saaae®tgga gs&amp;gggacga MO: tcacgtcgtc acfctga&amp;aat- fcatgfcgaggt ccgcggcgac gatotacygo qçgcçyasct 420 cfccga&amp;eact oacaeageca aa&amp;eegetfcc gtyttogtct tt.gttceaag cyaeogt.Qtg 480 gfcgtgtttgfc. sgcsgtfccge cggcgccgc® gafccgfccgss ccogstctga csaafe&amp;aãgc 540 tttegttgefc fcttecaegst tâtoyeattti ctgagc&amp;fcgc ac&amp;gastset atqatggata δ 00 tgtttggagg aagcataatt ccasi.«;gat gat&amp;aaggtg ttattt&amp;cac ttgtttt.cag 660 cttggeaagg tact?gcggc:fe esagaagafet. etaaaaaaca: agfefegeagag gycaccaaqt '720 tgtattgcct tètfôaagtga fgagosacte èÈgtfgqgcc atáfcgeeaga: âctsgtigsg .....?80...... tcgyrcaaac aaga?: tec at; gqctca&amp;gee tátgísàgtge a cgr. t.a tgag ccascacctg Λ λ λ ggt-gccaat;s. .c t<sgt 855 <210> 140 <211> 845 <212> DNA <213> Artificial <220> <223> posição -2 sequência flanqueante com homologia 3' <400> 140 act&amp;gt-catg tcgatggtgg ggtatggttc agsih.cagtt catttatgtc ctgfct.ath.C5t 60 gàfctttsatt tgsca&amp;cctc gayggfefeggg ateagsttoa q~te&amp;efct&amp;ii 12 0
ggasgaastc ggagaattgt crataattr.at. cuakaafcxac ccctaccgaa. atsgaáâtMa ISO
Ciitgacarara ahgtycaaye fcattggattt tgacaogaat atqctataat ctatcaaat.g >\ Λ .»> '
£ 4: U cagc&amp;ggcsg eaggc&amp;et&amp;e tettCggatc sacgfcgacfct gag&amp;a&amp;ga&amp;a
3 GO te&amp;tgcc-a t c tctce&amp;cas?t gcaggtccgc gtacgtg 111 c caggga 1t1 cc fcggagc1t 360 * ..... :':? ''" gcegaaaaga atgthcttag cageegccefc getggg&amp;g&amp;g tsaatgcaag ftcaattgac 420 sacactgctg tvcgccgctct tctaatagca gaccactctt tatfcttetgg tacgtaeccc 480 aiccctcttc ttaeeafcaac. cfcqaatcktq ttaaggttts; -aaatatacga fc u?«£i,asgt 540 s&amp;aatcoaqa *otct&amp;£be.a .'fcatctcacqc actgsfcgtfet: fc-^ratqaaacg cttgcagcaa sod
gacggfctgco CgCtat;fe&amp;is&amp; aOtÊgeéfct&amp; gÉC&amp;áàèttgt csecr-fcfcçjcfc tatss&amp;cjqtc :S|Q 1 ttgaac tCi-'f cagttcctat ;»gçsfcfcfca&amp;gfc ttgdaacfegt tàe t: s-acaae ssçja:saã!:.ífg gtage&amp;tcaa gattgtcttt ttcagtgatt cataacttaa ccctfcggtta aaecgccaga. " 780 :®câ&amp;S8S>tgg tgtg&amp;iaas.a tgcaaotggfc: gatgaggccg taaactgsaa:"tcadtgt^eg 04 0 tcgac 045 <210> 141 <211> 484 <212> DNA <213> Artificial <220>
<223> sequência genómica de IPP2K 5' a montante das regiões alvo de ZFN <400> 141
Cggacggagç gagagccag®. atdcgacgct ggcggcggcg- cgtcgccaat ãcgcagegeg: $0 gatgtggíigc câ?aatgcaas cgsigtgtccg t:ccgcgr,ggc gcccactctc cctccôcqtt 120 dcg-gcgtcct eggcgeatfce ctqggaaatc tòcàgctaet gsecaetgae: seitfeceatrtõ 180 agtccctttc occgggctgt ggtaccagta .çtagtaeq&amp;g: :cafcc tetter* ggctcc«cea-: "' 240 ' ' ” ~ ' ' acegeagacs ccgcagc&amp;gt ggcaqcagca cgatecagtq accceccgec qcgfcccagcc 100 toctcctec-g gegstcgocg g&amp;cnggcqg.g gteggaacca gcgsagcgc* gcccgectcc 360- ..fcfeccg-etggt atagagfcgscg cccgceccefc cctcecttcg cfecgettcct teetettecg 420 eateaggc-gt ^ee^gtefcea ccgcggcti-g ggg&amp;ttfcgat geggaget&amp;g taaaecagea 480 gage 484 <210> 142 <211> 729 <212> DNA <213> Artificial <220> <223> sequência genómica de IPP2K 3' a jusante das regiões alvo de ZFN <400> 142 attgt.tfc.ttfc tcaqcgatte ataaeftsac tofcteqttaâ accgctâqaa cadgeftugt: 60........ gccttjs.aaat gcaaotggt.ç etgsggecgfc aaccsgsaat cat.tgtacft ttetcícatt. '"tiao - ..... t c cttaga ta tt tc caasac teta cate tag a fegafc fcfca t o t11 g d 11 &amp;c f. t a g t o tt í e t 180 taatctcaqg caatcctaag getagcaget gcataeetgt ag&amp;gat&amp;s&amp;g eeactttqca 240 agcttcctct tttattetts ttteteattt ettatetate. cttotcctca axeatt tgsa
VlOíT :ttGt:tttgag- câ:tgctc&amp;ac etteé&amp;qgcG- aaatgtgagfc ttctgesate ateagaat&amp;t 360
Ha ta t ca g« ag- a 6 tsa-gaaa c.t a g caacg&amp;gaS ·> afeaaga t gea t. c a gc áç 'èt e.. 4 2 Ό aaattttatc agggfcg&amp;gtft çftgtagattcí g&amp;atíjcttqa tgacttgaic caac&amp;tajte ""'"'mp" ttccactct-α ttfcfcgcgcac ttaaaa-aaca tccaacgatg atacaascbt gatcaaaata 540
ccttaaggcfc tgfct&amp;tttsc ggaactgt-:.g gaatatbata ccgtcfcteg etttttgac-a SCO teasggttg^t fcsccaataca stcttgcscs cat ttca>7«t «tepi^agaeft ^g5;gagtacs 6§0 atcetcrtga tetatttccfc gggte&amp;aasg agagaataag catggceatc a&amp;gtcccgat 720
fc.C5CS-:?Ct.C 729 <210> 143 <211> 42 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 143 goggcg:g-cg a dtoacegogg C t t.ggggA 1t ggatacggsg· ct 42 <210> 144 <211> 38 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 144 actaglgata t^gecteata gg&amp;gftgcac «tg&amp;caty
3 H <210> 145 <211> 40 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 145 isctsgbccasr s.&amp;ctggttga gtcggiasaa a sag aat gat: ,<i Λ y <210> 146 <211> 32 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 146 act&amp;gcccag aaetggttga gteggtca&amp;a caagattgcn. ' "48 " ':~r: <210> 147 <211> 32 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 147 crcqqceqeta q&amp;taqe&amp;qat qcaqattgct 3 0 <210> 148 <211> 29 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 148 actacrtattcf ocacccagot attqgctca: <210> 149 <211> 38 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 149 aatagcccitg tcg<Uqç7çg ggtatqgtte agattcaçf ....." 38.......... <210> 150 <211> 37 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 150 gtcgacqtac aaigatttéa: ggfc-tàcggcc acaggáé 37 <210> 151 <211> 41 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 151 aotagttaac '.t§sccfccact egág-gteatt eatatgcttg a 41 <210> 152 <211> 29 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 152 aet.agtgtga attcacicact taaagatct 22: <210> 153 <211> 101 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 153
actagtqqcq gccqaqAqqa cagacfqaagt etfct-aacat gcggtgacgt g<?acfiaaoaas·. SO geeggg&amp;e ga §g&amp;^ggq tgçsggggágg agãgsagt tg qa: 101 <210> 154 <211> 35 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 154
sct&amp;gtatge atgtgaattc agggetfcaaa g&amp;feefe 3S <210> 155 <211> 28 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 155 ctgtggiacc agtactagta ccagcafcc 28 <210> 156 <211> 31 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 156 ccttggatc© aggssfccaag cattoeaafec t 31 <210> 157 <211> 20 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 157 ggggt&amp;actg ;:gce:fea&amp;o t gg <210> 158 <211> 20 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 158 tggg taactg gcct&amp;aotqq '20 <210> 159 <211> 20 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 159 ccagtfcagerc c ag 11accça 2 0“ " <210> 160 <211> 20 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 160 t&amp;sgogfctce t&amp;qccftcea 20 <210> 161 <211> 31 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 161 cfctggca&amp;g'g iact'.gcgqct eaagaagatt c 31 <210> 162 <211> 26 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 162 atgaagaaag scsggga&amp;qg asggac '4 ¢5 <210> 163 <211> 32 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 163 aqg&amp;agaa&amp;gr sssgggaaeg :aaqg««qgee. as 32 <210> 164 <211> 28 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 164 eaírggsggge g^dgagcdga tgtagctg 28 ' <210> 165 <211> 27 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 165 &amp;tcgâcatgs ttggc&amp;eeea ggtgttg <210> 166 <211> 31 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 166 fefefecgaeaàp fececfeagaaa c 31 <210> 167 <211> 28 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 167 2:¾ <210> 168 <211> 32 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 168 ttiagacaagc: acctagaaa.c ac 7 o <210> 169 <211> 29 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 169 tgctaagaac ®.t fcefett teg acaagete© 2<l <210> 170 <211> 32 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 170 gaacattctt fctcgaeaage tccagaaaat cc 32: <210> 171 <211> 30 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 171 fcggacggagc gagageeaga a t tcgacget 30 <210> 172 <211> 31 <212> DNA <213> Artificial <220> <223> Sequência iniciadora <400> 172 gtgcaagaat- gtattggg&amp;a tcaaectgat g 31:·: <210> 173 <211> 59 <212> DNA <213> Zea mays <400> 173 f gagteatgag;'gggccstat cccagaactg gt&amp;gê&amp;feèè# tèàéM^àq-5§
<210> 174 <211> 53 <212> DNA
<213> Sequência do gene IPP2K de milho com mutação mediada por ZFN <400> 174 a&amp;gtc&amp;cgsg c&amp;actecfcgt ggggccaaga act.ggttgag tcagtcs&amp;sc aag 53
<210> 175 <211> 55 <212> DNA <213> Sequência do gene IPP2K de milho com mutação mediada por ZFN <400> 175 s&amp;gtcatga# ca&amp;etcelgt ggggccafcaa gaèiCtggdfeg iagitgggteaa 55
<210> 176 <211> 54 <212> DNA <213> Sequência do gene IPP2K de milho com mutação mediada por ZFN <400> 176 a&amp;gtcaag&amp;g caaetoctgt ggggccatag s&amp;ctqgttga gtcgqtc&amp;aa ca&amp;g ' '' .............~ .....:V"""
<210> 177 <211> 56 <212> DNA <213> Sequência do gene IPP2K de milho com mutação mediada por ZFN <400> 177 sagLeatgag eaacicctgt gqggccatac agaactgaet gagtcggtca aacaaa M ' '
<210> 178 <211> 57 <212> DNA <213> Sequência do gene IPP2K de milho com mutação mediada por ZFN <400> 178 a&amp;gtcatqaq caactcctqt gqqqcc&amp;tae eagaacfcgat fcgagtcggfcc aaaeaag 67 ..... "
<210> 179 <211> 52 <212> DNA <213> Sequência do gene IPP2K de milho com mutação mediada por ZFN <400> 179 efcggfefcgsgfe eggfcéaaaeá ag 52
<210> 180 <211> 57 <212> DNA
<213> Sequência do gene IPP2K de milho com mutação mediada por ZFN <400> 180 aagt cat-gag gàigtoqfcgt ggggceatat eaga:actgqt: tgagfcqggSe >s.aaeaag 5'7
<210> 181 <211> 54 <212> DNA <213> Sequência do gene IPP2K de milho com mutação mediada por ZFN <400> 181 aagtcaigag caactcetgt ggggecat&amp;g aacc.cgt taa d3£cggfccaa« caag 54
<210> 182 <211> 54 <212> DNA <213> Sequência do gene IPP2K de milho com mutação mediada por ZFN <400> 182 aagteatgag saacfccefcg-t âggaèísáfc-ág aagtggfefcgs: gtcggtcaaa caag 54
<210> 183 <211> 57 <212> DNA <213> Sequência do gene IPP2K de milho com mutação mediada por ZFN <400> 183 aagtcatgag ea&amp;ctcetgg tgggggsata èagààctggt tgagtcggto aaa-caag .....S7 ...... v"' ' : "
<210> 184 <211> 54 <212> DNA <213> Sequência do gene IPP2K de milho com mutação mediada por ZFN <400> 184 aagtc&amp;cg&amp;g ea&amp;ctectgt ^gcjgccat&amp;g asctgqttqa gtcqqtc&amp;aa cs&amp;g SI.'
<210> 185 <211> 53 <212> DNA <213> Sequência do gene IPP2K de milho com mutação mediada por ZFN <400> 185 aagoatgage aae tcctqtq qqgccatacra actggttgsg tcggtcaaac sag S:S:
<210> 186 <211> 56 <212> DNA <213> Sequência do gene IPP2K de milho com mutação mediada por ZFN <400> 186 a&amp;gte*d'.gag daactcctgt ggggccaUac agaactçgtt gagtí:qgic:&amp; aacaaç S 6
<210> 187 <211> 57 <212> DNA <213> Sequência do gene IPP2K de milho com mutação mediada por ZFN <400> 187 &amp;agt’.catgag chsctcctgt ggçjgcca&amp;at e&amp;gaadtgijt CAjAgttgqtç aaacaag S’! : "'Λ: -
<210> 188 <211> 54 <212> DNA <213> Sequência do gene IPP2K de milho com mutação mediada por ZFN <400> 188 gsg ..'Aaçtvççig;: ggagcvoitag aac tggt tga. qtcggtottà çgqg M·’. .......................' ~.....".........."
<210> 189 <211> 54 <212> DNA <213> Sequência do gene IPP2K de milho com mutação mediada por ZFN <400> 189 .a&amp;gteatgag caaetrcetgc gggggõacsg a&amp;efcggttga gteggtc&amp;aa câ.ag *!·*··
<210> 190 <211> 54 <212> DNA <213> Sequência do gene IPP2K de milho com mutação mediada por ZFN <400> 190 aagtcatgag e&amp;actcctgt ggggcc&amp;cag s&amp;ctggttga gtcggteasa. caag
<210> 191 <211> 57 <212> DNA <213> Sequência do gene IPP2K de milho com mutação mediada por ZFN <400> 191 áaqtcãtqag caaeteetgfc ggqgãcatac caga&amp;etcrgt fc$&amp;c?fc.cQ«tc 57 ............'
<210> 192 <211> 54 <212> DNA <213> Sequência do gene IPP2K de milho com mutação mediada por ZFN <400> 192 aagtcatasg caactecfcgt ggggecatsg sactggctga gtcgatcaaa caag: «>4
<210> 193 <211> 55 <212> DNA <213> Sequência do gene IPP2K de milho com mutação mediada por ZFN <400> 193 sagteatgag eaaotcetgt ggggccataa gaacfcggLtg agtcggtcaa aca&amp;g ‘55
<210> 194 <211> 56 <212> DNA <213> Sequência do gene IPP2K de milho com mutação mediada por ZFN <400> 194 aagtcatgag caactcccgt ggggccatae agaáéfcggtfc gaqecggtea aacaag $ 6
<210> 195 <211> 56 <212> DNA <213> Sequência do gene IPP2K de milho com mutação mediada por ZFN <400> 195 aagtcefcgag caactcctgc ggggceat.at agaaetggtt gag t egg tea aasaag-· 56
<210> 196 <211> 56 <212> DNA <213> Sequência do gene IPP2K de milho com mutação mediada por ZFN <400> 196 aagteatgag caactcetgt ggggccatae sgaactggtt gagtaggtoa aacaag ί-
<210> 197 <211> 57 <212> DNA <213> Sequência do gene IPP2K de milho com mutação mediada por ZFN <400> 197 aacteatgsg caactcctgt gqggcc&amp;cse segaacfcggt taatrtcgatc 57 <210> 198 <211> 821 <212> DNA <213> Artificial <220> <223> posição -1 sequência flanqueante com homologia 5' <400> 198 gcçjgccgcgt ctcaccgcgg cttggggatt ggatâcgggg ctaottaacc agcaggggts gatagcagac gcagatcgct tgcttctctg gtttgsthtt tggsytcacc attfctgfctt 120 ggttegtçtg cctcagtgfcc 't^as5&amp;i^5S«#s:\^Ãtccfccsa tggaggtggg pggggltctg 180 caagcegcgg atiçsâsgga 'tsfetéfcs^tsi' 240 agct&amp;tactg gcaggtçgco etseafcggt&amp; agsgstgagfe. :^g§tetettac tgsgtgfcgeâ 300 ' ' ogçqfccgatc aettgacttt Mjg^gctcaa fcatgtgafctc aegggtgggg eeattcgagc 35.0 cccagatcca gtatcgctcg àgeaagtgat a&amp;saest#g;&amp; ge&amp;ggqacqa tcacqtggte 420 .éteaa&amp;q«gt 480 ' ' ' caq&amp;c&amp;gqqa asaccgottc qlgtlcqtct ttgtlccaac? ca-setqtatQ <3cgt.gttt.gt 540 agc.àgttogc: cggçgccrgça catcgtcgcc co-agat ctga caaatta&amp;qe 'tfctcgttoct 600 tttccacgat igtgcatstt ctgagcatgc sota a a tact: stg&amp;tqgsta tgtttggagg 060 qagcatt&amp;tt teastttgat qataatggtq t:tat ttao&amp;c ttgttttcaq cttgtcaagg 720: ' " -T' 'r-·' taccacagct caagasgatt ctq&amp;&amp;ís&amp;&amp;ca açttgcagcg qqçaccaísqí: hgtattaççt 780 tctcaagtca fegageaastt efcgtggggec atatcactag t 82.1 ........ <210> 199 <211> 821 <212> DNA <213> Artificial <220> <223> posição -1 sequência flanqueante com homologia 3' <400> 199 actpqtçtag a&amp;ctggttga qtecrgfccaas c&amp;as&amp;htqct hagctcaacic ctatqe&amp;qtg ' 60................'.........'.....···..-.. eatgttatqa crct&amp;acacet gggtgeeaat catgfccgatg gfcggggtstg gfctcagattc " 120 agthcattts tgfcectgtta ttgtgatttt gattggta&amp;c atattgacaa gctctjaeacfc 180 f-..gqgat;caa&amp; fctcagttsae fcfeatggaaga aattggagaa: ttgtgataat. ttíífccc&amp;taa 240 tcacccctac tqgaataqas at.aacat.gac ãfceaafcftge atgcfcattgg attttgacac 300 ” .....' ........... gaat.at.qctt tatt.ctaf.câ fsí-gUggra attccagcag gesgeagqca ccaetctttg 160 gatccacgtg aettgacaaa gaaafccatga catctt.tcca caatgcaggt ccgtgtacgt 42θ' gSittgfeaggg getOgtegaa aagaatgtfce; itfcagcagccg tcçfeggfcggg: 480 : âgagtaaa t.g caag11eaat t:g®Maeátt gctgatgccg :'tetgtt è£ á:gOagafígag: 540 tct-ttatctt gtggtacgta ctctatccct cttcttacca taatctoaat ctt.gttaaqa soo ' " .......... ' tttaaaat.at atgattgaf,l aagtaaaatc eagagc.ccta ttestatetc :·aegsactaat 660
vffifcfcgOgafcga:- aafigettgca g«âsg«gqgfc tgcctgttat :fct.çtatttgc: &amp;t.r.agacaaa 73Q cagtcacctt tgtttataaa ggtctttgáa tttgcagtcc ttâtággttt: aagtOOggaa 780 "" ' "" "...... ·--· --- c!:a oaacagccca atgggt aggà teaaggtega e 821.

Claims (13)

  1. REIVINDICAÇÕES
    1. Uma proteína com dedos de zinco compreendendo um domínio dedo de zinco não canónico (não C2H2) em que o dedo de zinco não canónico possui uma porção helicoidal envolvida na ligação a DNA e em que pelo menos um dedo de zinco compreende a sequência Cys-(Xa) 2-4-Cys-(XB)i2-His-( Xc) 3-5-Cys-(XD) 1-10 (SEQ ID NO: 3), onde Xa, Xb, Xc e XD podem ser qualquer aminoácido e His-(Xc) 3-5-Cys (XD) 1-10 compreende uma das sequências mostradas em qualquer uma de SEQ ID NOs: 14-80, 83-87 e 89-92 e ainda em que a proteína com dedos de zinco é manipulada geneticamente para se ligar a uma sequência alvo.
  2. 2. Uma proteína com dedos de zinco compreendendo uma pluralidade de dedos de zinco, em que pelo menos um dos dedos de zinco compreende um dedo de zinco CCHC de acordo com a reivindicação 1.
  3. 3. Uma proteína com dedos de zinco de qualquer uma das reivindicações 1 a 2, em que a proteína com dedos de zinco compreende qualquer uma das sequências mostradas na Tabela 8 e é geneticamente manipulada para se ligar a uma sequência alvo num gene IPP2-K.
  4. 4. Uma proteína de fusão compreendendo uma proteína com dedos de zinco de qualquer uma das reivindicações 1 a 3 e um ou mais domínios funcionais.
  5. 5. A proteína de fusão da reivindicação 4, em qu o domínio funcional compreende um semi-domínio de clivagem.
  6. 6. A proteína de fusão da reivindicação 5, compreendendo ainda um elemento de ligação ZC entre o semi-domínio de clivagem e a proteína com dedos de zinco.
  7. 7. Um polinucleótido codificador de pelo menos uma proteína com dedos de zinco ou proteína de fusão de acordo com qualquer uma das reivindicações 1 a 6.
  8. 8. Uma célula vegetal compreendendo pelo menos uma proteína com dedos de zinco, pelo menos uma proteína de fusão ou pelo menos um polinucleótido de acordo com qualquer uma das reivindicações 1 a 7.
  9. 9. A célula vegetal da reivindicação 8, em que a célula é uma semente.
  10. 10. A célula vegetal da reivindicação 8 a 9, em que IPP2-K é parcialmente eou totalmente inactivada e os níveis de ácido fítico na semente são reduzidos.
  11. 11. Um método para a clivagem dirigida de croma-tina celular numa célula vegetal, o método compreendendo a expressão, na célula, de um par de proteínas de fusão de acordo com a reivindicação 5 ou pelo menos um poli- nucleótidos codificador do par de proteinas de fusão; em que: (a) as sequências alvo das proteinas de fusão situam-se a dez nucleótidos uma da outra; e (b) as proteinas de fusão dimerizam e cortam o DNA entre as sequências alvo ou
  12. 12. Um método de recombinação genética dirigida numa célula vegetal, o método compreendendo: (a) expressão, na célula hospedeira, de um par de proteinas de fusão de acordo com a reivindicação 5 ou pelo menos um polinucleótido codificador do par de proteina de fusão, em que as sequências alvo das proteinas de fusão estão presentes num locus alvo seleccionado do hospedeiro, e (b) identificação de uma célula hospedeira recombinante que apresenta uma alteração da sequência no locus alvo do hospedeiro e c) facultativamente, introdução de um polinucleótido exógeno na célula hospedeira, em que, quando presente, o polinucleótido exógeno é integrado no genoma da célula vegetal hospedeira. 13. 0 método da reivindicação 12, em que a alteração da sequência é uma mutação seleccionada do grupo consistindo numa deleção de material genético, uma inserção de material genético, uma substituição de material genético e qualquer combinação destas.
  13. 14. Um método para redução do nível de ácido fítico numa semente vegetal ou para a tornar o fósforo mais metabolicamente disponível numa semente vegetal, o método compreendendo a inactivação ou alteração de um gene IPP2-K de acordo com a reivindicação 12.
PT111849345T 2006-12-14 2007-12-13 Proteínas com dedos de zinco não canónicas optimizadas PT2415872T (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US87491106P 2006-12-14 2006-12-14
US93249707P 2007-05-30 2007-05-30

Publications (1)

Publication Number Publication Date
PT2415872T true PT2415872T (pt) 2016-07-07

Family

ID=39472493

Family Applications (4)

Application Number Title Priority Date Filing Date
PT11184938T PT2415873E (pt) 2006-12-14 2007-12-13 Proteínas com dedos de zinco não canónicas optimizadas
PT111849410T PT2412812E (pt) 2006-12-14 2007-12-13 Proteínas com dedos de zinco não canónicas optimizadas
PT78533569T PT2092068E (pt) 2006-12-14 2007-12-13 Proteínas com dedos de zinco não canónicas optimizadas
PT111849345T PT2415872T (pt) 2006-12-14 2007-12-13 Proteínas com dedos de zinco não canónicas optimizadas

Family Applications Before (3)

Application Number Title Priority Date Filing Date
PT11184938T PT2415873E (pt) 2006-12-14 2007-12-13 Proteínas com dedos de zinco não canónicas optimizadas
PT111849410T PT2412812E (pt) 2006-12-14 2007-12-13 Proteínas com dedos de zinco não canónicas optimizadas
PT78533569T PT2092068E (pt) 2006-12-14 2007-12-13 Proteínas com dedos de zinco não canónicas optimizadas

Country Status (21)

Country Link
US (3) US9187758B2 (pt)
EP (5) EP3070169B1 (pt)
JP (1) JP5632610B2 (pt)
KR (4) KR101520507B1 (pt)
CN (1) CN103613646B (pt)
AR (1) AR069896A1 (pt)
AU (1) AU2007334468B2 (pt)
BR (1) BRPI0720048A8 (pt)
CA (2) CA2669746C (pt)
CO (1) CO6220864A2 (pt)
CR (1) CR10775A (pt)
DK (3) DK2092068T3 (pt)
EG (1) EG26980A (pt)
ES (1) ES2586210T3 (pt)
HU (1) HUE029238T2 (pt)
MX (1) MX2009006303A (pt)
NZ (2) NZ597995A (pt)
PT (4) PT2415873E (pt)
SI (2) SI2092068T1 (pt)
TW (1) TWI470079B (pt)
WO (1) WO2008076290A2 (pt)

Families Citing this family (134)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY150088A (en) 2003-05-19 2013-11-29 Irm Llc Immunosuppressant compounds and compositions
EP3070169B1 (en) * 2006-12-14 2018-05-09 Dow AgroSciences LLC Optimized non-canonical zinc finger proteins
CN101878307B (zh) * 2007-09-27 2017-07-28 陶氏益农公司 以5‑烯醇式丙酮酰莽草酸‑3‑磷酸合酶基因为靶的改造锌指蛋白
WO2009120396A2 (en) * 2008-01-08 2009-10-01 The University Of California Compositions and methods for regulating erythropoientin expression and ameliorating anemia and stimulating erythropoiesis
US8597912B2 (en) 2008-06-10 2013-12-03 Sangamo Biosciences, Inc. Methods and compositions for generation of Bax-and Bak-deficient cell lines
US8329986B2 (en) * 2008-12-17 2012-12-11 Dow Agrosciences, Llc Targeted integration into the Zp15 locus
KR20100080068A (ko) * 2008-12-31 2010-07-08 주식회사 툴젠 신규한 징크 핑거 뉴클레아제 및 이의 용도
US8586526B2 (en) 2010-05-17 2013-11-19 Sangamo Biosciences, Inc. DNA-binding proteins and uses thereof
AU2010282958B2 (en) 2009-08-11 2015-05-21 Sangamo Therapeutics, Inc. Organisms homozygous for targeted modification
US10172669B2 (en) 2009-10-09 2019-01-08 Ethicon Llc Surgical instrument comprising an energy trigger lockout
WO2011048600A1 (en) * 2009-10-21 2011-04-28 Danziger Innovations Ltd. Generating genotypic variations in plant genomes by gamete infection
WO2011049627A1 (en) * 2009-10-22 2011-04-28 Dow Agrosciences Llc Engineered zinc finger proteins targeting plant genes involved in fatty acid biosynthesis
US20130074220A1 (en) * 2009-10-26 2013-03-21 National Institute Of Agrobiological Sciences Method for producing genetically modified plant cell
KR101906605B1 (ko) 2009-11-24 2018-10-10 다우 아그로사이언시즈 엘엘씨 Aad-12 이벤트 416, 관련된 트랜스제닉 대두 계통, 및 이의 이벤트-특이적 확인
CN105384827A (zh) 2009-11-27 2016-03-09 巴斯夫植物科学有限公司 嵌合内切核酸酶及其用途
CA2782014C (en) 2009-11-27 2021-08-31 Basf Plant Science Company Gmbh Optimized endonucleases and uses thereof
DE112010004584T5 (de) 2009-11-27 2012-11-29 Basf Plant Science Company Gmbh Chimäre Endonukleasen und Anwendungen davon
US20110203012A1 (en) * 2010-01-21 2011-08-18 Dotson Stanton B Methods and compositions for use of directed recombination in plant breeding
AU2011207769B2 (en) * 2010-01-22 2015-05-28 Corteva Agriscience Llc Targeted genomic alteration
GB2480498A (en) 2010-05-21 2011-11-23 Ethicon Endo Surgery Inc Medical device comprising RF circuitry
WO2012017329A2 (en) * 2010-08-02 2012-02-09 Cellectis S.A. Method for targeted genomic events in algae
WO2012074868A2 (en) 2010-12-03 2012-06-07 Ms Technologies, Llc Optimized expression of glyphosate resistance encoding nucleic acid molecules in plant cells
CA2819684C (en) 2010-12-03 2024-05-07 Dow Agrosciences Llc Stacked herbicide tolerance event 8264.44.06.1, related transgenic soybean lines, and detection thereof
BRPI1107329A2 (pt) 2010-12-30 2019-11-19 Dow Agrosciences Llc moléculas de ácido nucléico que direcionadas à subunidade h de atpase vacuolar que conferem resistência a pragas de coleópteros, vetor de transformação de planta, célula transformada, bem como métodos para controlar uma população de praga de coleóptero, controlar uma infestação pela dita praga, melhorar o rendimento de uma safra e para produzir uma célula transgênica
MX342845B (es) 2010-12-30 2016-10-14 Dow Agrosciences Llc Moleculas de acido nucleico dirigidas a la subunidad de atpasa c vacuolar y que confieren resistencia a las plagas de coleopteros.
JP6223187B2 (ja) 2010-12-30 2017-11-01 ダウ アグロサイエンシィズ エルエルシー 鞘翅目有害生物に対する抵抗性を付与する核酸分子
UY34014A (es) 2011-04-15 2012-11-30 Dow Agrosciences Llc Genes sintéticos para expresar proteínas en células de maíz, construcciones, plantas transgénicas, métodos para controlar pestes y composiciones
BR102012019434B1 (pt) 2011-07-26 2021-11-09 Dow Agrosciences Llc Métodos de controle de pestes, de insetos, molécula e sequência de dna diagnóstica para o evento de soja 9582.814.19.1
CN103981149A (zh) * 2011-08-22 2014-08-13 拜尔作物科学公司 修饰植物基因组的方法和手段
US9333025B2 (en) 2011-10-24 2016-05-10 Ethicon Endo-Surgery, Llc Battery initialization clip
WO2013074999A1 (en) 2011-11-16 2013-05-23 Sangamo Biosciences, Inc. Modified dna-binding proteins and uses thereof
EP2612918A1 (en) 2012-01-06 2013-07-10 BASF Plant Science Company GmbH In planta recombination
BR102013001773A2 (pt) 2012-01-23 2015-09-08 Dow Agrosciences Llc evento de algodão pdab4468.19.10.3 tolerante a herbicidas
MX344968B (es) 2012-02-01 2017-01-12 Dow Agrosciences Llc Peptido de transito al cloroplasto.
CA3151103C (en) 2012-02-02 2024-02-13 Corteva Agriscience Llc Plant transactivation interaction motifs and uses thereof
CA2865011C (en) 2012-02-29 2021-06-15 Sangamo Biosciences, Inc. Methods and compositions for treating huntington's disease
US11518997B2 (en) 2012-04-23 2022-12-06 BASF Agricultural Solutions Seed US LLC Targeted genome engineering in plants
CN104428414B (zh) 2012-05-02 2022-01-21 陶氏益农公司 苹果酸脱氢酶的靶向修饰
KR102116153B1 (ko) * 2012-05-07 2020-05-27 상가모 테라퓨틱스, 인코포레이티드 도입유전자의 뉴클레아제-매개 표적화된 통합을 위한 방법 및 조성물
JP6514105B2 (ja) * 2012-08-13 2019-05-15 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア 生物学的成分を検出するための方法およびシステム
CA2884162C (en) 2012-09-07 2020-12-29 Dow Agrosciences Llc Fad3 performance loci and corresponding target site specific binding proteins capable of inducing targeted breaks
UA119135C2 (uk) * 2012-09-07 2019-05-10 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб отримання трансгенної рослини
US20140075593A1 (en) 2012-09-07 2014-03-13 Dow Agrosciences Llc Fluorescence activated cell sorting (facs) enrichment to generate plants
UA118090C2 (uk) 2012-09-07 2018-11-26 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб інтегрування послідовності нуклеїнової кислоти, що представляє інтерес, у ген fad2 у клітині сої та специфічний для локусу fad2 білок, що зв'язується, здатний індукувати спрямований розрив
EP2931901A1 (en) 2012-12-13 2015-10-21 Dow AgroSciences LLC Precision gene targeting to a particular locus in maize
WO2014093736A1 (en) 2012-12-13 2014-06-19 Dow Agrosciences Llc Dna detection methods for site specific nuclease activity
ES2904803T3 (es) 2013-02-20 2022-04-06 Regeneron Pharma Modificación genética de ratas
RU2723130C2 (ru) 2013-04-05 2020-06-08 ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи Способы и композиции для встраивания экзогенной последовательности в геном растений
ES2699578T3 (es) 2013-04-16 2019-02-11 Regeneron Pharma Modificación direccionada del genoma de rata
EP3988654A1 (en) 2013-08-28 2022-04-27 Sangamo Therapeutics, Inc. Compositions for linking dna-binding domains and cleavage domains
EP4279496A3 (en) 2013-09-04 2024-03-13 Corteva Agriscience LLC Rapid targeting analysis in crops for determining donor insertion
EP3066110B1 (en) 2013-11-04 2021-12-29 Corteva Agriscience LLC Optimal maize loci
UA121459C2 (uk) 2013-11-04 2020-06-10 Дау Агросаєнсиз Елелсі Рекомбінантна молекула нуклеїнової кислоти для трансформації рослини сої
BR102014027436B1 (pt) * 2013-11-04 2022-06-28 Dow Agrosciences Llc Molécula de ácido nucleico recombinante, e método para a produção de uma célula vegetal transgênica
JP6633532B2 (ja) 2013-11-04 2020-01-22 ダウ アグロサイエンシィズ エルエルシー 最適なトウモロコシ遺伝子座
PT3492593T (pt) * 2013-11-13 2021-10-18 Childrens Medical Center Regulação da expressão de genes mediada por nucleases
PT3080279T (pt) 2013-12-11 2018-12-17 Regeneron Pharma Métodos e composições para a modificação direcionada de um genoma
KR102170502B1 (ko) 2013-12-11 2020-10-28 리제너론 파마슈티칼스 인코포레이티드 게놈의 표적화된 변형을 위한 방법 및 조성물
US10683513B2 (en) 2013-12-31 2020-06-16 Dow Agrosciences Llc Tissue-specific expression and hybrid plant production
US10774338B2 (en) 2014-01-16 2020-09-15 The Regents Of The University Of California Generation of heritable chimeric plant traits
LT3152312T (lt) 2014-06-06 2020-04-27 Regeneron Pharmaceuticals, Inc. Tikslinio lokuso modifikavimo būdai ir kompozicijos
JP6336140B2 (ja) 2014-06-23 2018-06-06 リジェネロン・ファーマシューティカルズ・インコーポレイテッドRegeneron Pharmaceuticals, Inc. ヌクレアーゼ媒介dnaアセンブリ
PL3161128T3 (pl) 2014-06-26 2019-02-28 Regeneron Pharmaceuticals, Inc. Sposoby i kompozycje do celowanych modyfikacji genetycznych i sposoby zastosowania
CA2954201A1 (en) 2014-07-08 2016-01-14 Vib Vzw Means and methods to increase plant yield
MX2017000555A (es) 2014-07-14 2017-08-10 Univ Washington State Desactivacion de nanos que produce ablacion de celulas de linea germinal.
KR20170045344A (ko) 2014-09-07 2017-04-26 셀렉타 바이오사이언시즈, 인크. 항-바이러스 전달 벡터 면역 반응을 약화시키기 위한 방법 및 조성물
AU2015332451A1 (en) 2014-10-15 2017-04-20 Regeneron Pharmaceuticals, Inc. Methods and compositions for generating or maintaining pluripotent cells
EP3224363B1 (en) 2014-11-27 2021-11-03 Yissum Research Development Company of the Hebrew University of Jerusalem Ltd. Nucleic acid constructs for genome editing
MX2017008190A (es) 2014-12-19 2018-03-23 Regeneron Pharma Metodos y composiciones para la modificacion genetica dirigida a traves de direccionamiento multiple de una sola etapa.
US10159524B2 (en) 2014-12-22 2018-12-25 Ethicon Llc High power battery powered RF amplifier topology
CN107530654A (zh) 2015-02-04 2018-01-02 加利福尼亚大学董事会 通过在离散实体中条形码化对核酸进行测序
US20160281055A1 (en) 2015-03-20 2016-09-29 Dow Agrosciences Llc Incorporation of phosphatidylcholine in a media composition
EP3277805A1 (en) 2015-03-31 2018-02-07 Exeligen Scientific, Inc. Cas 9 retroviral integrase and cas 9 recombinase systems for targeted incorporation of a dna sequence into a genome of a cell or organism
US10314638B2 (en) 2015-04-07 2019-06-11 Ethicon Llc Articulating radio frequency (RF) tissue seal with articulating state sensing
FI3331355T3 (fi) 2015-08-06 2024-06-17 Univ Missouri Sikojen lisääntymishäiriö- ja keuhkotulehdusoireyhtymävirukselle (PRRSV) resistentti sika ja soluja, joilla on muokattuja CD163-geenejä
US11606940B2 (en) 2015-08-07 2023-03-21 Commonwealth Scientific And Industrial Research Organisation Method for producing an animal comprising a germline genetic modification
US10959771B2 (en) 2015-10-16 2021-03-30 Ethicon Llc Suction and irrigation sealing grasper
US10907133B2 (en) 2015-11-24 2021-02-02 Commonwealth Scientific And Industrial Research Organisation Production of viruses in avian eggs
US11174466B2 (en) 2015-11-24 2021-11-16 Commonwealth Scientific And Industrial Research Organisation Production of viruses in cell culture
US10959806B2 (en) 2015-12-30 2021-03-30 Ethicon Llc Energized medical device with reusable handle
US10856934B2 (en) 2016-04-29 2020-12-08 Ethicon Llc Electrosurgical instrument with electrically conductive gap setting and tissue engaging members
US10987156B2 (en) 2016-04-29 2021-04-27 Ethicon Llc Electrosurgical instrument with electrically conductive gap setting member and electrically insulative tissue engaging members
JP2019523009A (ja) 2016-07-29 2019-08-22 リジェネロン・ファーマシューティカルズ・インコーポレイテッドRegeneron Pharmaceuticals, Inc. C末端切断型フィブリリン−1の発現をもたらす変異を有するマウス
US10751117B2 (en) 2016-09-23 2020-08-25 Ethicon Llc Electrosurgical instrument with fluid diverter
BR112019014841A2 (pt) 2017-01-23 2020-04-28 Regeneron Pharma rna guia, uso do rna guia, rna antissentido, sirna ou shrna, uso do rna antissentido, do sirna ou do shrna, ácido nucleico isolado, vetor, composição, célula, e, métodos para modificar um gene hsd17b13 em uma célula, para diminuir a expressão de um gene hsd17b13 em uma célula, para modificar uma célula e para tratar um indivíduo que não é portador da variante de hsd17b13
US11033325B2 (en) 2017-02-16 2021-06-15 Cilag Gmbh International Electrosurgical instrument with telescoping suction port and debris cleaner
US10799284B2 (en) 2017-03-15 2020-10-13 Ethicon Llc Electrosurgical instrument with textured jaws
US11497546B2 (en) 2017-03-31 2022-11-15 Cilag Gmbh International Area ratios of patterned coatings on RF electrodes to reduce sticking
US11913015B2 (en) 2017-04-17 2024-02-27 University Of Maryland, College Park Embryonic cell cultures and methods of using the same
US10603117B2 (en) 2017-06-28 2020-03-31 Ethicon Llc Articulation state detection mechanisms
AU2018325363A1 (en) 2017-08-29 2020-04-09 Global Crop Innovations Pty. Ltd. Improved BLue Aleurone and other segregation systems
US11033323B2 (en) 2017-09-29 2021-06-15 Cilag Gmbh International Systems and methods for managing fluid and suction in electrosurgical systems
US11484358B2 (en) 2017-09-29 2022-11-01 Cilag Gmbh International Flexible electrosurgical instrument
US11490951B2 (en) 2017-09-29 2022-11-08 Cilag Gmbh International Saline contact with electrodes
US20190098879A1 (en) 2017-09-29 2019-04-04 Regeneron Pharmaceuticals, Inc. Non-Human Animals Comprising A Humanized TTR Locus And Methods Of Use
GB201716254D0 (en) * 2017-10-05 2017-11-22 Univ Leuven Kath Live-attenuated flaviruses with heterologous antigens
KR20200086670A (ko) 2017-10-13 2020-07-17 셀렉타 바이오사이언시즈, 인크. 항바이러스 전달 벡터 IgM 반응을 약화시키기 위한 방법 및 조성물
WO2019165436A1 (en) 2018-02-26 2019-08-29 Antolrx Tolerogenic liposomes and methods of use thereof
JP7338893B2 (ja) 2018-03-20 2023-09-05 チンホワ ユニバーシティ アルツハイマー病動物モデルおよびその使用
WO2019204226A1 (en) 2018-04-16 2019-10-24 University Of Massachusetts Compositions and methods for improved gene editing
WO2020036653A2 (en) * 2018-04-25 2020-02-20 The Regents Of The University Of California Improved method for homology directed repair in cells
GB201809273D0 (en) 2018-06-06 2018-07-25 Vib Vzw Novel mutant plant cinnamoyl-coa reductase proteins
GB201820109D0 (en) 2018-12-11 2019-01-23 Vib Vzw Plants with a lignin trait and udp-glycosyltransferase mutation
JP7449291B2 (ja) 2018-12-20 2024-03-13 リジェネロン・ファーマシューティカルズ・インコーポレイテッド ヌクレアーゼ媒介リピート伸長
JP2022527809A (ja) 2019-04-03 2022-06-06 リジェネロン・ファーマシューティカルズ・インコーポレイテッド 抗体コード配列をセーフハーバー遺伝子座に挿入するための方法および組成物
US11737435B2 (en) 2019-04-04 2023-08-29 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized coagulation factor 12 locus
AU2020253531C1 (en) 2019-04-04 2022-06-16 Regeneron Pharmaceuticals, Inc. Methods for scarless introduction of targeted modifications into targeting vectors
MX2021014566A (es) 2019-05-28 2022-03-22 Selecta Biosciences Inc Métodos y composiciones para la respuesta inmune atenuada anti-vector de transferencia viral.
JP2022534867A (ja) 2019-06-04 2022-08-04 リジェネロン・ファーマシューティカルズ・インコーポレイテッド ベータスリップ変異を有するヒト化ttr遺伝子座を含む非ヒト動物と使用方法
WO2020244759A1 (en) 2019-06-05 2020-12-10 Klemm & Sohn Gmbh & Co. Kg New plants having a white foliage phenotype
AU2020289581A1 (en) 2019-06-07 2021-11-18 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized albumin locus
AU2020290509A1 (en) 2019-06-14 2021-11-11 Regeneron Pharmaceuticals, Inc. Models of tauopathy
EP3987024A4 (en) 2019-06-20 2023-11-01 University Of Massachusetts COMPOSITIONS AND METHODS FOR IMPROVED GENE EDITING
WO2021028359A1 (en) 2019-08-09 2021-02-18 Sangamo Therapeutics France Controlled expression of chimeric antigen receptors in t cells
MX2022005572A (es) 2019-11-08 2022-06-09 Regeneron Pharma Estrategias crispr y aav para la terapia de retinosquisis juvenil ligada al cromosoma x.
WO2021108363A1 (en) 2019-11-25 2021-06-03 Regeneron Pharmaceuticals, Inc. Crispr/cas-mediated upregulation of humanized ttr allele
AU2021232598A1 (en) 2020-03-04 2022-09-08 Regeneron Pharmaceuticals, Inc. Methods and compositions for sensitization of tumor cells to immune therapy
CN117042600A (zh) 2020-11-16 2023-11-10 猪改良英国有限公司 具有经编辑的anp32基因的抗甲型流感动物
EP4304633A1 (en) 2021-03-12 2024-01-17 Mendus B.V. Methods of vaccination and use of cd47 blockade
WO2023064367A1 (en) 2021-10-12 2023-04-20 Selecta Biosciences, Inc. Methods and compositions for attenuating anti-viral transfer vector igm responses
US11957342B2 (en) 2021-11-01 2024-04-16 Cilag Gmbh International Devices, systems, and methods for detecting tissue and foreign objects during a surgical operation
WO2023086847A1 (en) 2021-11-10 2023-05-19 Encodia, Inc. Methods for barcoding macromolecules in individual cells
WO2023105244A1 (en) 2021-12-10 2023-06-15 Pig Improvement Company Uk Limited Editing tmprss2/4 for disease resistance in livestock
AU2022424002A1 (en) 2021-12-29 2024-06-13 Bristol-Myers Squibb Company Generation of landing pad cell lines
WO2023131616A1 (en) 2022-01-05 2023-07-13 Vib Vzw Means and methods to increase abiotic stress tolerance in plants
WO2023131637A1 (en) 2022-01-06 2023-07-13 Vib Vzw Improved silage grasses
WO2023144199A1 (en) 2022-01-26 2023-08-03 Vib Vzw Plants having reduced levels of bitter taste metabolites
US20230357437A1 (en) 2022-03-09 2023-11-09 Selecta Biosciences, Inc. Immunosuppressants in combination with anti-igm agents and related dosing
WO2023220603A1 (en) 2022-05-09 2023-11-16 Regeneron Pharmaceuticals, Inc. Vectors and methods for in vivo antibody production
WO2024013514A2 (en) 2022-07-15 2024-01-18 Pig Improvement Company Uk Limited Gene edited livestock animals having coronavirus resistance
WO2024026474A1 (en) 2022-07-29 2024-02-01 Regeneron Pharmaceuticals, Inc. Compositions and methods for transferrin receptor (tfr)-mediated delivery to the brain and muscle
WO2024031053A1 (en) 2022-08-05 2024-02-08 Regeneron Pharmaceuticals, Inc. Aggregation-resistant variants of tdp-43
WO2024107765A2 (en) 2022-11-14 2024-05-23 Regeneron Pharmaceuticals, Inc. Compositions and methods for fibroblast growth factor receptor 3-mediated delivery to astrocytes
CN116491599A (zh) * 2023-06-26 2023-07-28 云南大台农台标农业科技有限公司 一种复合菌剂及其在猪饲料中的应用

Family Cites Families (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8300698A (nl) 1983-02-24 1984-09-17 Univ Leiden Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; agrobacterium tumefaciens bacterien en werkwijze voor het produceren daarvan; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten.
EP0222493A1 (en) 1985-10-04 1987-05-20 Lubrizol Genetics Inc. TR-based sub-TI plasmids
US5422251A (en) 1986-11-26 1995-06-06 Princeton University Triple-stranded nucleic acids
US5176996A (en) 1988-12-20 1993-01-05 Baylor College Of Medicine Method for making synthetic oligonucleotides which bind specifically to target sites on duplex DNA molecules, by forming a colinear triplex, the synthetic oligonucleotides and methods of use
US5550318A (en) * 1990-04-17 1996-08-27 Dekalb Genetics Corporation Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof
US5356802A (en) 1992-04-03 1994-10-18 The Johns Hopkins University Functional domains in flavobacterium okeanokoites (FokI) restriction endonuclease
US5487994A (en) 1992-04-03 1996-01-30 The Johns Hopkins University Insertion and deletion mutants of FokI restriction endonuclease
US5436150A (en) 1992-04-03 1995-07-25 The Johns Hopkins University Functional domains in flavobacterium okeanokoities (foki) restriction endonuclease
EP0604662B1 (en) 1992-07-07 2008-06-18 Japan Tobacco Inc. Method of transforming monocotyledon
US6242568B1 (en) 1994-01-18 2001-06-05 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
US6140466A (en) 1994-01-18 2000-10-31 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
CA2681922C (en) 1994-01-18 2012-05-15 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
US5585245A (en) 1994-04-22 1996-12-17 California Institute Of Technology Ubiquitin-based split protein sensor
GB9824544D0 (en) 1998-11-09 1999-01-06 Medical Res Council Screening system
ATE407205T1 (de) 1994-08-20 2008-09-15 Gendaq Ltd Verbesserung in bezug auf bindungsproteine bei der erkennung von dna
US5789538A (en) 1995-02-03 1998-08-04 Massachusetts Institute Of Technology Zinc finger proteins with high affinity new DNA binding specificities
US5773695A (en) 1996-01-26 1998-06-30 North Carolina State University Plant nuclear scaffold attachment region and method for increasing gene expression in transgenic cells
US5925523A (en) 1996-08-23 1999-07-20 President & Fellows Of Harvard College Intraction trap assay, reagents and uses thereof
GB9703369D0 (en) 1997-02-18 1997-04-09 Lindqvist Bjorn H Process
GB2338237B (en) 1997-02-18 2001-02-28 Actinova Ltd In vitro peptide or protein expression library
US6342345B1 (en) 1997-04-02 2002-01-29 The Board Of Trustees Of The Leland Stanford Junior University Detection of molecular interactions by reporter subunit complementation
GB9710809D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
GB9710807D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
US6506559B1 (en) 1997-12-23 2003-01-14 Carnegie Institute Of Washington Genetic inhibition by double-stranded RNA
AR014491A1 (es) 1998-01-29 2001-02-28 Dow Agrosciences Llc Metodo para obtener plantas transgenicas fertiles de gossypium hirsutum.
US6410248B1 (en) 1998-01-30 2002-06-25 Massachusetts Institute Of Technology General strategy for selecting high-affinity zinc finger proteins for diverse DNA target sites
WO1999045132A1 (en) * 1998-03-02 1999-09-10 Massachusetts Institute Of Technology Poly zinc finger proteins with improved linkers
US6140081A (en) 1998-10-16 2000-10-31 The Scripps Research Institute Zinc finger binding domains for GNN
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US6453242B1 (en) 1999-01-12 2002-09-17 Sangamo Biosciences, Inc. Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
US7013219B2 (en) 1999-01-12 2006-03-14 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US20030104526A1 (en) * 1999-03-24 2003-06-05 Qiang Liu Position dependent recognition of GNN nucleotide triplets by zinc fingers
US6794136B1 (en) 2000-11-20 2004-09-21 Sangamo Biosciences, Inc. Iterative optimization in the design of binding proteins
US7030215B2 (en) 1999-03-24 2006-04-18 Sangamo Biosciences, Inc. Position dependent recognition of GNN nucleotide triplets by zinc fingers
CA2396898A1 (en) 2000-01-21 2001-07-26 The Scripps Research Institute Methods and compositions to modulate expression in plants
AU2001226935B2 (en) 2000-01-24 2006-06-22 Gendaq Limited Nucleic acid binding polypeptides characterized by flexible linkers connected nucleic acid binding modules
US20020061512A1 (en) 2000-02-18 2002-05-23 Kim Jin-Soo Zinc finger domains and methods of identifying same
DE60126483T2 (de) 2000-04-28 2007-12-06 Sangamo BioSciences, Inc., Richmond Gezielte Modifikation der Chromatinstruktur
WO2001088197A2 (en) 2000-05-16 2001-11-22 Massachusetts Institute Of Technology Methods and compositions for interaction trap assays
JP2002060786A (ja) 2000-08-23 2002-02-26 Kao Corp 硬質表面用殺菌防汚剤
AU2002213431A1 (en) 2000-09-29 2002-04-08 Sangamo Biosciences, Inc. Modulation of gene expression using localization domains
US7273923B2 (en) * 2001-01-22 2007-09-25 Sangamo Biosciences, Inc. Zinc finger proteins for DNA binding and gene regulation in plants
GB0108491D0 (en) 2001-04-04 2001-05-23 Gendaq Ltd Engineering zinc fingers
EP1421177A4 (en) 2001-08-20 2006-06-07 Scripps Research Inst ZINC FINGER FASTENING DOMAINS FOR CNN
ATE347593T1 (de) 2002-01-23 2006-12-15 Univ Utah Res Found Zielgerichtete chromosomale mutagenese mit zinkfingernukleasen
WO2003080809A2 (en) 2002-03-21 2003-10-02 Sangamo Biosciences, Inc. Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
EP1581610A4 (en) 2002-09-05 2009-05-27 California Inst Of Techn USE OF CHIMERIC NUCLEASES TO STIMULATE GENE TARGETING
WO2005014794A2 (en) * 2003-08-07 2005-02-17 Duke University Generation of low phytate plants by molecular disruption of inositol polyphosphate kinases
AU2004263865B2 (en) * 2003-08-08 2007-05-17 Sangamo Therapeutics, Inc. Methods and compositions for targeted cleavage and recombination
US8409861B2 (en) 2003-08-08 2013-04-02 Sangamo Biosciences, Inc. Targeted deletion of cellular DNA sequences
US7888121B2 (en) 2003-08-08 2011-02-15 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
WO2005028630A2 (en) * 2003-09-19 2005-03-31 Sangamo Biosciences, Inc. Engineered zinc finger proteins for regulation of gene expression
WO2005078079A1 (en) * 2004-02-09 2005-08-25 Pioneer Hi-Bred International, Inc. Phytate polynucleotides and methods of use
AU2005232665B2 (en) 2004-04-08 2010-05-13 Sangamo Therapeutics, Inc. Methods and compositions for treating neuropathic and neurodegenerative conditions
PL1740039T3 (pl) 2004-04-30 2013-03-29 Dow Agrosciences Llc Nowe geny odporności na herbicydy
AR050866A1 (es) * 2004-09-09 2006-11-29 Dow Agrosciences Llc Genes de inositol polifosfato 2-quinasa y usos de los mismos
CN101273141B (zh) 2005-07-26 2013-03-27 桑格摩生物科学股份有限公司 外源核酸序列的靶向整合和表达
CA2660485C (en) * 2006-08-11 2016-04-12 Sangamo Biosciences, Inc. Zinc finger nuclease-mediated homologous recombination
EP3070169B1 (en) * 2006-12-14 2018-05-09 Dow AgroSciences LLC Optimized non-canonical zinc finger proteins

Also Published As

Publication number Publication date
JP5632610B2 (ja) 2014-11-26
ES2586210T3 (es) 2016-10-13
PT2415873E (pt) 2015-03-31
CA2669746A1 (en) 2008-06-26
SI2415872T1 (sl) 2016-09-30
EP2415872B1 (en) 2016-05-11
NZ597995A (en) 2013-05-31
CN103613646A (zh) 2014-03-05
US20160130314A1 (en) 2016-05-12
AR069896A1 (es) 2010-03-03
US8921112B2 (en) 2014-12-30
KR101520507B1 (ko) 2015-05-29
US10662434B2 (en) 2020-05-26
EG26980A (en) 2015-03-01
EP2412812A1 (en) 2012-02-01
EP2415873B1 (en) 2015-01-21
US20090111188A1 (en) 2009-04-30
CR10775A (es) 2009-08-12
CO6220864A2 (es) 2010-11-19
BRPI0720048A2 (pt) 2013-12-31
US20080182332A1 (en) 2008-07-31
EP2415872A1 (en) 2012-02-08
DK2415872T3 (en) 2016-08-22
TW200844233A (en) 2008-11-16
PT2092068E (pt) 2015-01-14
TWI470079B (zh) 2015-01-21
JP2010512745A (ja) 2010-04-30
EP3070169A1 (en) 2016-09-21
KR20150016364A (ko) 2015-02-11
KR20160044066A (ko) 2016-04-22
CA2669746C (en) 2017-05-16
AU2007334468A1 (en) 2008-06-26
DK2412812T3 (en) 2015-05-26
EP2092068A2 (en) 2009-08-26
HUE029238T2 (en) 2017-02-28
DK2092068T3 (en) 2015-01-12
AU2007334468B2 (en) 2013-02-07
CN103613646B (zh) 2020-12-01
KR20090088904A (ko) 2009-08-20
WO2008076290A2 (en) 2008-06-26
EP2092068B1 (en) 2014-10-08
KR101574529B1 (ko) 2015-12-08
MX2009006303A (es) 2009-10-21
BRPI0720048A8 (pt) 2023-02-07
NZ576800A (en) 2013-02-22
EP3070169B1 (en) 2018-05-09
US9187758B2 (en) 2015-11-17
SI2092068T1 (sl) 2015-06-30
KR101723350B1 (ko) 2017-04-05
CA2962856A1 (en) 2008-06-26
PT2412812E (pt) 2015-04-30
EP2412812B1 (en) 2015-02-11
EP2415873A1 (en) 2012-02-08
WO2008076290A3 (en) 2008-11-20
KR101613624B1 (ko) 2016-04-29
KR20150139631A (ko) 2015-12-11

Similar Documents

Publication Publication Date Title
PT2415872T (pt) Proteínas com dedos de zinco não canónicas optimizadas
DK2049663T3 (en) ZINC FINGER NUCLEASE-MEDIATED HOMOLOGOUS RECOMBINATION
DK2370575T3 (en) TARGETED INTEGRATION IN THE ZP15 LOCUS
BRPI0817560B1 (pt) Proteínas de dedo de zinco (zfp) engenheiradas que têm como alvo genes de 5-enolpiruvil shiquimato-3-fosfato sintase, nuclease de dedo de zinco (zfn), vetor, bem como métodos para introdução de um transgene no genoma de uma célula de planta, para expressar o produto de um transgene em uma célula de planta, para deleção de uma sequência de gene de epsps a partir de um locus de gene epsps no genoma de uma célula de planta, e para modular expressão de um gene de epsps
DK2415873T3 (en) Optimized non-canonical zinc finger proteins