BR112013025567A2 - métodos para modificação genômica - Google Patents
métodos para modificação genômica Download PDFInfo
- Publication number
- BR112013025567A2 BR112013025567A2 BR112013025567-6A BR112013025567A BR112013025567A2 BR 112013025567 A2 BR112013025567 A2 BR 112013025567A2 BR 112013025567 A BR112013025567 A BR 112013025567A BR 112013025567 A2 BR112013025567 A2 BR 112013025567A2
- Authority
- BR
- Brazil
- Prior art keywords
- fact
- host cell
- endonuclease
- nucleic acid
- sequence
- Prior art date
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/905—Stable introduction of foreign DNA into chromosome using homologous recombination in yeast
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1082—Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1093—General methods of preparing gene libraries, not provided for in other subgroups
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Zoology (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Mycology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Virology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
MÉTODOS PARA MODIFICAÇÃO GENÔMICA
Trata-se de métodos de integração de um ou mais ácidos nucleicos exógenos no interior de um ou mais sítios alvos selecionados de um genoma de célula hospedeira. Em determinadas modalidades, os métodos compreende colocar o genoma de célula hospedeira em contato com um ou mais polinucleotídeos de integração que compreendem um ácido nucleico exógeno a ser integrado no interior de um sítio alvo genômico e uma nuclease que tem a capacidade de causar uma quebra de filamento duplo próxima ou dentro do sítio alvo genômico.
Description
1. REFERÊNCIA CRUZADA A PEDIDOS RELACIONADOS Este pedido reivindica c) beríefící-o de prioridade do Pedido Provisório N° U.S. 61/479.821, depositado em 27 5 de abril de 2011; Pedido Provisório N° U.S. 61/500.741, depositado em 24 de junho de 2011; e Pedido ProvisÓrio N° U.S. 61/539.389, depositado em 26 de setembro de 2011, cujo conteúdo é incorporado ao presente docurríento a título de referência integralmente.
2. CAMPO DA INVENÇÃO Os métodos e composí-ções fornecidos no presente documento geralrnente referem-se aos campos de biologia molecular e engenharia genéti-ca.
3. ANTECEDENTES Técnicas de engenharia genética para introduzir e integrar ácidos nucleico3 exógenos em um genoma de célula hospedeira são necessárias em uma variedade de campos. Por exemplo, no campo de biologia genética, a fabricação de uma cepa geneticamente modificada exige a inserção de sequênci-as de DNA personalizadas em urn cromossomo da célula hospedeira, e comumente, a produção em escala industrial exige a introdução de dezenas de genes no organismo hospedeiro. projetos aperfeíçoados para a cepa industrial são alcançados empiricamente, o que exige a construção e te3te in vivo de muitas montagens de DNA, sozinho e/ou em conjunto com cutros componentes de via biossintética.
A engenharia genética é altamente dependente de direcionamento de gene, que utiliza um fragmento extracromossomal de DNA de gabarito de doador e invoca um maquinário de recombinação homóloga (HR} de célula a trocar uma sequência cromossornal com uma sequência de doador exógeno. Consulte, por exemplo, Capecchi, Science 244:1288 a 1292 {1989). Direcionamento de gene é limitado em sua eficácia; em células vegetais e de mamíferos, apenas -1 em 5 106 células fornecidas com sequências de gabari-to em excesso são subrnetidas à modificação de gene desejada. a levedura demonstra uma capacidade maior para recombinação homóloga. Entretanto, a incorporação com sucesso de DNA exógeno em genomas de levedura é ainda um evento comparatívamente raro {-1 ern 105), e exige o üsc) de um marcador selecionável para triar por células recombinantes que normalmente ccunpreendem apenas uma única modifícação genômica. Além disso, como apenas um agrupamento limitado de marcadores selecionáveis são disponíveis para uso em levedura, marcadorjes) selecionável(is) deve ser removido de uma cepa recombinante para permitir modificações genômicas adicíonais com o uso dos mesmos marcadores, e em alguns casos, antes de liberar a célula hospedeira errt um ambiente de fabricação ou natural. Assim, independentemente da eficáci-a na qual a integração pode ser alcançada em qualquer local único, a natureza serial um-por-vez da engenharia genômica exige que a realização de mudanças em múltiplos locais extge tantos ciclns de engenharía qnantos locais a serem modificados.
A eficácia de direcionamento de gene pode ser aprimorada quando combinada com uma quebra de filamento duplo genômica direcionada {DSB) i-ntroduzida próximo ao sítio destinado de integração. Consulte por exemplo, Jasin, M., Trencis Genet 12(61:224 a 228 (1996); e Urnov et al., Nature 435{70421:646 a 651 {2005). As3 assim denominadas
"nucleases sintéti-cas" são enzimas que podem ser realizadas sob rnedida para ligar a uma sequência "alvo" específi-ca de DNA in vivo e introduzir urna quebra de filarnento duplo na rnesma. Tais quebras de f:i-lamento duplo direcionadas podem 5 ser executadas, por exemplo, ao transformar uma célula hospedeira corrt um plasmídeo que contém um gene que codifica a nuclease sintét:i-ca. A célula hospedeira conserta essas quebras de filamento duplo através d conserto de DNA de homologia direcionada ou união de extremidade não homóloga.
Durante esse conserto, qualquer rnecanismo pode ser utilizado para incorporar um DNA de doador exógeno ncj sítio alvo. Se a nuclease for introduzida na célula ao mesmo tempo errt que q DNA de doador é introduzido, a célula pode integrar o DNA de doador nos locais alvo.
O advento de nucleases sintéticas permitiu a introdução de transgenes em locais alvo particulares em safras {Wright et al., Plant j 44:693 a 705 (2005)}, para aprimorar linhagens de cultura celular de mamífero que expressam anticorpos terapêuticos {Malphettes et al., Biotechnol Bioeng 106(5}:774 a 783 (2010}), e mesmo para editar o genoma humano para evocar resistência ao HIV (Urnov et al., Nat Rev Genet 11(9):636 a 646 (2010}).
Embora impactante, HR medi-ado por DSB ainda não foi explorado para reduzir os múltiplos ciclos de engenharia necessários para integrar múltiplas montagens de DNA, por exemplo, em direção à construção de vias rrletabÓlica3 funcionais em micróbios industriais.
Assim, existe a necessidade de métodos e cornposições que permítem a integração simultânea de urna pluralidade de ácidos nucleicos exógenos em regiões especificas de um genoma de célula hospedeira.
4. SUMÁRIO São fornecidos no presente documento métoclos e compo3ições para integrar um ou mais ácidos nucleicos 5 exógenos em locai3 genômicos específicos de uma célula hospedei-ra. Em algumas modalidades, uma pluralidade de ácidos nucleicos exÓgenos é simultaneamente integrada a uma reação de transformação única. Em algumas modalidades, os métodos compreendem a introdução de uma ou mais nuclea3es e urna ou mais montagens de DNA de doador na célula para facilitar a integração do DNA de doador ern locais e3pecífLcos no genoma. Os métodos e composições utilizarn o maquinário de recombinação homóloga nativo da célula hospedeíra, cuja recombinação é adicionalmente acentuada ao induzir quebras de filamento duplo direcionadas no genoma da célula hospedeira nos sítios destinados de integração.
Assim, em um aspecto, é fornecido no presente documento um rnétodo para integrar uma plurãlidade de ácidos nucleicos exógenos em um genorrta de célula hospedeira, em que método compreende: {a) colocar uma célula hospedeí-ra em contato com: (i) uma pluralidade de ácidos nucleicos exógenos, sendo que cada ácido nucleico exógeno {ESÁ compreende uma primeira regiáo de homologia (HRIL, e urrta segunda região de homología (HR2)k, sendo que (HRIÚ e (HR2), sÊio capazes de iniciar recoinbinação homóloga mediada por célula hospedeira de (ESÁ em um sítio alvo {TS), do dito genoma de célula hospedeira; e (ii) para cada dito sítio alvo (TSL, uma nuclease {N),, capaz de clivagem em (TS}x, ao que a dita clivagem resulta em recombinação horríóloga de (ESL, em (TS),g e {b) recuperar uma célula hospedeira, sendo que cada ácido nucleico exógeno selecionado (ESÉ foi integrado 5 em cada sequência alvo 3elecionada (TSÁ, sendo que z é qualquer número LnteLro de 1 a n, 3endo que n é pelo menos 2.
Em algurrtas modalídades, (HRI), é homÓlogo a uma região 5' de (TS)x, e (HR21,,, é homólogo a uma região 3' de (TSÁ.
Em algumas modalidades, (N)x é capaz de clivagem em uma região posicionada entre as ditas regiões 5' e 3' de (TS)x.
Em algumas modalidades, uma úní-ca nuclease é capaz de clivagem, cada, (TSÁ.
Em algumas modalidades, n= 3, 4, 5, 6, 7, 8, 9 ou
10. Em algumas modalidades, n>l0.
Em algumas modalidades, a dita recuperação não exige inteçração de um marcador selecionável. Em algumas modalidades, a dita recuperação ocorre em uma frequência mai-or em comparação a nào colocar a célula hospedeira em contato com uma nuclease capaz de clivagem no dito sitio alvo. Em algurnas modalidades, a dita recuperação ocorre em urria frequência de cerca de um a cada 10, 9, 8, 7, 6, 5, 4, 3, ou 2 células hospedeiras colocadas em contato, ou populações clonais das mesmas, triadas. Em algumas modalidades, a dita recuperação cornpreende identificar as ditas integrações em pelo rrtenos um método selecionado a parttr do grupo que consiste errt PCR, Southern blot, mapearnento de restrição, e sequenciamento de DNA.
Em algurrias inodalidades, (N),, é capaz de clivagem de urna sequência genômica hospedeira endógena, por exemplo, locais nativos em seu interior (TS)x. Em algumas modalidades, {Nlx é capaz de clivagem de uma sequência 5 exógena, por exemplo, locais introduzidos em seu interior {TSÚ.
Ern algumas modali-dades, {ES)x compreende ainda um ácido nucleico de interesse Idá posicionado errt 3' de (HR1)x e 5' de (HR2)x. Em algumas modalidàdes, (D)x é selecionado a partir do grupo que consiste em um promotor, uraa sequência de ácido nucleico que codifica uma etiqueta de epítopo, urn gene de interesse, um gene repórter, e uma sequência de ácido nucleico que codifica um códon de terminação.
Em algumas modalidades, {ES)x é linear. Em alguinas moclalidades, (NÁ é fornecido como um vetor de expressão que coinpreende a 3equência de ácido nucleico que codifica (NL,. Em algumas modalidades, {N),, é transformado na célula hospedeira como uma proteina purificada. Ern algurnas modali-dades, (NÁ é transformado na célula hospedeira como RNA purificado.
Em algumas modalidades, a célula hospedeira compreende uma ou mais sequências de nucleotídeo heterólogas que codifícam uma ou mais enzj-mas de uma via biossintética. Em algumas modalidades, a uma ou mais sequências de nucleotídeo heterólogas que codifi-cam urria ou mais enzi-mas de uma via bio3sintética são genomicamente integradas. Em alguma3 modalidades, cada ácido nucleico exógeno (ESL, corrtpreende um ácido nucleico de interesse {D},, po3icionado errt 3' de {HRI), e 5' de {HR2}x, que codifica uma enzima de uma via biossintética. Em algurrias modalidades, (D)x é um rneínbro de uma biblioteca (JJ)x que compreende urrta pluralidade de moléculas de ácido nucleico que codificam variante3 de uma enzima de uma via 5 biossintética.
Em algumas modalídades, a célula hospedeira cornpreende uma ou mais sequências de nucleotídeo heterólogas que codificam uma ou mais enzimas de uma via de (MEV) mevalonato para produzir pirofosfato de isopentenila.
Errt algumas modalidades, a uma ou mais enzimas da via de mevalonato são selecionadas a partir de acetil-CoA tiolase, HMG-COA sintase, HMG-COA redutase, tnevalonato quinase, fosfomevalonato quinase e pí-rofosfato de mevalonato descarboxilase. Ern alqumas modalidades, a célula hospedeira compreende uma pluralidade de ácidos nucleicos heterólogos que codificam todas as enzirnas de uma via de MEV. Em outras palavras, a pluralidade de ácidos nucleicos heterólogos, tomados em conjunto, codifica pelo menos uma enzirna de cada classe de enzimas da via de MEV listada acirna. Em algurnas modalidades, cada ácido nuclei-co exógeno ksR compreende um ácido nucleico de interesse (DÁ posicionado ern 3' de {HR1)x e 5' de {HR2Á, que codifica uma terpeno sintase. Em algurnas ruodalidades, a terpenü sintase é selecionada a partir do grupo que consiste em uma monoterpeno sintase, uma diterpeno sintase, uma sesquiterpeno sinta3e, uma sesterterpeno sintase, uma triterpeno sintase, uma tetraterpeno Umtase, e uma poliperteno sintase.
Em algumas modalídades, (N),, é selecionado a partir do grupo que consiste ern uma endonuclease, por exeraplo, uma meganuclease, uma nuclease de dedo de zinco,
uma Proteína de fusão de dominio de nuclease que liga DNA ao efetor TAL (TALEN), uma tran3posase, e uma recombinase sítio-especifica, sendo que x é 1 ou qualquer número inteiro de 1 a n.
Em algumas modalidades, a nuclease de
5 dedo de zinco é uma proteína cíe fusão que compreende o dcünínio de clivagem de uma endonuclease de restrição de
TypellS fundida a um domínio de ligação de dedo de zinco projetado.
Erri algumas modalidades, a endonuclease de restri-ção de TypellS é selecionada a partir do grupo que consiste em endonuclease HO e endonuclease Fok I.
Ern algunla3 modalidades, o domínio de ligação de dedo de zinco compreende 3, 5 ou 6 dedos de zinco.
Errt algumas modalidades, a endonuclease é uma endonuclease de homing selecionada a partir do grupo que consiste em: uma endonuclease de homing LAGLIDADG, uma endonuclea:se de homi-ng HNH, uma box endonuclease de homing His-Cis, urna endonuclease de homing GIY-YIG, e urna endonuclease de homing de cianobactéria.
Em algumas rnodalidades, a endonuclease é selecionada a partir do grupo que consiste em: H-Orel, I-Scel, I-Scell, I-Scelll, I-ScelV, I-SceV, I-
SceVl, I-SceVll, I-Ceul, I-CeuAIIP, I-Crel, I-CrepsblP, I-
CrepsbllP, I-CrepsbIIIP, I-CrepsblVP, I-T11I, I-Ppoi, Pi-
pspl, pScel, F-Scell, F-Suvl, wCphl, Fljevl, F-Tev-LT, T
Amal, 1-Anil, I-Chul, I-Crrtoel, I-Cpal, I-Cpall, I-Csml, 1-
Cvul, I-CvuAIP, I-DCAI, 1-Ddill, I-Oirl, I-Omol, 1-Hmul, I-
Hmull, I-HSNIP, 1-Llal, I-MsoI, 1-Naal, 1-Nanl, I-NCIIP, I-
NgrlP, 1-Nitl, 1-Njal, I-Nsp236IP, I-Pakl, I-PbolP, I-
PculP, I-PcuAI, I-PcuVl, I-PgrlP, í-PoblP, I-Porl, I-
PorllP, I-Pbplp, I-Sp8etalP, I-Scal, I-SexlP, I-SnelP, 1-
Spoml, I-SpornCP, I-SpomlP, I-SpomllP, I-SqulP, I-Ssp68031,
I-SthPhijP, I-SthPhiST3P, I-SthPhiSTe3bP, 1-TdelP, I-TCVI, 1-Tevll, I-TevIII, i-UarAP, i-ljarHGPAIP, I-UarHGPA13P, I- VinlP, I-ZbilP, P1-Mgaí, P1-Mtul, PI-MtuHIP PI-MtuHIIP, PI- Pful, PI-Pfull, PI-Pkol, PI-PKOII, P1-Rma43812lP, PI- 5 SpBetalP, PI-Scel, P1-Tful, P1-Tfull, P1-Thyl, P1-Tlil, ou PI-T11II. Ein modalidades particulares, a endonuclease é Fcph-l.
Em algurrtas modalidades, a endonuclease é modificada para ligar especificamente uma sequêncí-a genômica de célula hospedeira endógena, 3endo que a endonuclease modificada não mais liga a sua sequência de reconhecimento de endonuclease de tipo selvagem. Em algumas modalidades, a endonuclea3e modificada é derívadà de urrta endonuclease de homíng selecionada a partir do grupo que consiste em: uma endonuclease de homing LAGLIDADG, uma endonuclease de homing HNH, uma box endonuclease de homí-ng His-Cis, urría endonuclease de homing GIY-YIG, e urna endonuclease de homing de cianobactéri-a. Ern algumas modalidades, a endonuclease modificada é derivada de uma endonuclease selecionada a partir do grupo que consiste errt: H-Orel, I-Scel, I-Scell, I-SceIII, I-Scelv, I-Scev, I- SceVl, I-SceVll, I-Ceul, I-CeuAIIP, I-Crel, I-CrepsblP, I- CrepsbllP, I-CrepsblllP, I-CrepsblVp, 1-Tlil, I-PpoI, pi PspI, F-Scel, F-Scell, F-Suvl, F-Cphl, F-Tevl, F-Tevll, 1- Amal, 1-Anil, I-Chul, I-Cmoel, I-Cpal, I Cpall, I-Csml, I- Cvul, I-CvuAIP, I-Odil, I-DdiII, I-Oirl, I-Omol, 1-Hmul, I- Hmull, I-HSNIP, 1-Llal, I-MSoI, 1-Naal, 1-Nanl, I-NCIIP, I- NgrlP, 1-Nitl, 1-Njal, I-Nsp236IP, I-Pakl, I-PbolP, I- Pculp, I-PcuAI, I-PcuVl, I-PgrlP, I-PoblP, I-Porl, I- PorllP, I-PbplP, I-Sp8etalP, I-Scal, I-SexlP, I-SnelP, I
Spoml, I-SpomCP, I-SpomlP, I-SpornllP, I-SqulP, I-Ssp68031, I-Sthphi-jP, I-SthPhiST3P, I-SthPhíSTe3bp, 1-Tdelp, 1-Tevl, 1-Tevll, I-TevIII, i-UarAP, i-UarHGPAIP, I-UarHGPA13P, I- VinlP, I-ZbilP, P1-Mgal, P1-Mtul, PI-MtuHIP PI-MtuHIIP, PI- 5 P:Eul, PI-Pfull, PI-Pkol, PI-Pkoll, P1-Rma43812lP, PI- SpBetalP, pI-Scel, P1-Tful, P1-Tfull, P1-Thyl, P1-Tlil, ou PI-T11II.
Em algumas modalidades, a céluia hospedei-ra é uma célula fúngi-ca, uma célula bacteriana, uma célula vegetal, urrta célula animal, ou uma célula humana. Em modalidades particulares, a célula hospedeira é uma célula de levedura.
Em algurrías modalidades, a célula de levedura é uma célula de levedura haploide. Em algumas modalidades, a célula de levedura é uma célula de Saccharomyces cerevisiae. Errt algumas modalidades, a célula de Saccharomyces cerevisiae é da levedura de Baker, Mauri, Santa Fe, cepa IZ-1904, TA, BG-l, CR-l, SA-l, M-26, Y-904, PE-2, PE-5, VR-l, BR-I, BR- 2, ME-2, VR-2, MA-3, MA-4, CAT-I, CB-I, NR-I, BT-I ou AL-I.
Em outro aspecto, é fornecido no presente documento um método para inteçração sem marcação de um ácido nucleico exógeno em urrt sítio alvo de uma célula de levedura genoma, em que o método compreende: (a) colocar uma célula de levedura hospedeira em contato com: (i) um ácido nucleico exógeno (ES) que compreende uma primeira região de homologia (HRI) e uma segunda região de hornologia {HR2}, sendo que (HRI) e {HR2) sÊio capazes de iniciar recombinação homóloga mediada por célula hospedeira no dito ci:ítio alvo {Tsl: e (ii) uma nuclease (N) capaz de clivagem em (TS),
ll àc) que a dita clivagem resulta em recombinação homóloga de (ES) em (TS}; e (b) recuperar uma célula hospedeira que tem (ES) integrada em (TS), sendo que a dita recuperação não exige 5 integração de um marcador 3elecionável.
Era outro aspecto, é fornecida no presente documento uma célula hospedeira modificada gerada por qualquer urn dos métodos de integrar genorrticamente um ou mais ácidos nucleicos exógenos descritos no presente documento. Em algurrtas rnodalidades, a célula hospedeira modificada compreende: (a) uma pluralidade de ácidos nucleicos exógenos, sendo que cada ácído nucleico exógeno KSL compreende uma primeira região de homologia {HRIÁ e uma segunda região de homologia (HR2Á, sendo que {HRIÁ e {HR2}x são capazes de iniciar recombinação homóloga mediada pot célula hospedeira de (ESÁ em um sítio alvo (TSÁ do dito genoma de célula hospedeira; e (b) para cada d:i-to sítio alvo (TS},,, uma nuclease (N)x capaz de clivagem em (TS)x, ao que a dita clivagem resulta em recombinação homóloga de (ESÁ em (TSÁ: sendo que x é qualquer número inteiro de 1 a n, sendo qne n é pelo menos 2.
Em algumas modalidades, a célula hospedeira modtficada é uma célula de levedura e compreende: (a) um ácido nucleico exógeno (ES) que compreende uma prímeira região de homologia (HRI) e uma segunda região de homologia (HR2), sendo que (HRI) e {HR2} são capazes de íniciar recombinação homóloga mediada por célula hospedeira em um sítio alvo (TS) do genoma de célula hospedeira; e
(b) uma nuclease (N) capaz de clivagem em (TS), ao que a dita cli-vagem resulta em recombinação horaóloga de {ES) erri (TS); sendo que (ES} não compreende um marcador 5 selecionável.
Em outro aspecto, é fornecida no ptesente documento uma composição que compreende: (a) uma célula de levedura; {b) uma pluralidade de ácidos nucleicos exógenos, sendo que cada ácido nucleico exógeno (ESN cornpreende: (i) uma primeira região de homologia (HRl)x e uma segunda região de horrtologia {HR2Á, sendo que {HRIÁ e (HR2Á são capazes de iniciar recombinação homõloga mediada por célula hospedeira de (ES)x errt um sítio alvo selecionado (TSN de um genoma de célula de levedura; e (ii) um ácido nucleico de interesse (Dlx posícionado em 3' de (HRI), e 5' de (HR2)x; {C) uma pluralidade de nucleases, s:endo que cada nuclease (N}x é capaz de clivagem ern (TSÁ, ao que a dita clivagem resulta em recornbinação homóloga de {ES)x em (TS)U sendo que x é qualquer número inteiro de 1 a n, 3endo que n é pelo menos 2.
Em outro aspecto, é fornecido no presente documento um kit útil para desempenhar os métodos para integrar genomicamente uní ou mais áci-dos nuclei-cos exógenos descritos no presente documento. Em algumas modalidades, c) kit compreende: (a) uma pluralidade de ácidos nucleicos exógenos, sendo que cada ácido nucleico exógeno {ESÁ compreende:
{i) uma primeira região de homologia (HRIÁ e uma segunda região de homologia (HR2)x, sendo que {HRIR e (HR2}x são capazes de iniciar recombinação homóloga mediada por célula hospedeira de (ESÁ em um sitio alvo selecionado 5 (TSÁ de um genoma de célula de levedura; e (ii) um ácido nucletco de interesse (D}x posicionado em 3' de (HRI),, e 5' de (HR2)x; {b) uma pluralidade de nucleases, sendo que cada nuclease (NÁ é capaz de clivagem em (TS)x, ao que a dita clivagem resulta em recombinação homóloga de (ESÁ em (TSN: sendo que x é qualquer número í-ntetro de 1 a n, sendo que n é pelo menos 2.
Em algumas modalidades, (DÀ é selecionado a partir do grupo que consiste em um marcador selecionável, urri prorriotor, urna sequêncí-a de ácido nucleico que codifica uma etiqueta de epítopo, um gene de interesse, um gene repórter, e uma sequência de ácido nucleico que codifica um códon de terminação. Em algumas modalidades, o kit compreende ainda uma plurali-dade de pares de iniciadores (P)x, sendo que cada par de iniciadores é capaz de identificar a integração de (ESÁ em (TS}, por PCR. Em algumas modalí-dades, (Eslx é linear. Em algumas rrtodalidades, (ES),, é circular.
Em uma modalidade particular, o kit permite i-ntegração sítio-específica de um ácido nucleico exógeno em um sitio alvo exclu3ivo dentro de qualquer um de aproximadamente 6.000 locais genéticos do genoma de Ievedura. Nessas modalidades, n 26.000, sendo que cada {TSÁ é exclusivo a um local específico do genoma de célula de levedura.
5. BREVE DESCRIÇÃO DAS FIGURAS A Figura 1 fornece uma modalidade exemplificativa de integração genômica sem marcação de um ácido nucleico 5 exógeno com c) uso de uma nuclease sitio-especifica.
A Figura 2 fornece uma modalidade exemplificativa de íntegração genôrrtica simultânea de uma pluralidade de ácidos nucleicos exógenos com o uso de uma pluralidade de nuclease sítio-específicas. HRI - região de homologia a montante; HR2 - região de horrtologia a jusante; TS - sítio alvo; N - nuclease sítto-específica; D - ácido nucleico de interesse.
A Figura 3 fornece uma representação esquemática da via de MEV para produção de isoprenoide.
A Figura 4 fornece uma modalidade exemplificativa dos métodos de geração de bibliotecas de integração combinatória fornecidos no presente documento. As rnarcas de tncubação repLesentam membros de ácido nucleico exógeno individuaís de cada bí-blioteca {L),,.
A Figura 5 fornece resultados de PCR de colônia de 96 colônias de células de levedura transformadas com DNA de vetor vazio e DNA de "doador" linear que codifica EmGFP funcional. As células de levedura compreenderarri cópías de ácido nucleico "alvo" que codifí-ca um EmgFP não funci-onal truncado genoínicarrtente integrado em cada um dos locais de HO, YGR250C, e NDT80. Reações de PCR separadas foram desernpenhadas para sonclar os locais de HO, YGR250C, e NDT80 com inicíadores específicos a ácido nucleico que codifica EmGFP funcional. Nenhum produto de PCR foi- observado, indicando que nenhuma substituição do ácido nucleico alvo que codifica EínGFP não funcional com ácido nucleico doador que codifica EAGFP funcional ocorreu.
A Figura 6 fornece resultados de PCR de colônia de 96 colônias de células de levedura transformadas corn DNA 5 de pZFN.gfp e DNA de "doador" linear que codifica EmGFP funcional. As células de levedura compreenderam cópias de ácído nucleico "alvo" que codifica um EmGFP não funcional truncado genomicamente í-ntegrado em cada um dos locais cle HO, YGR250C, e NDT80. pZFN.gfp codifica uma nuclease de dedo de zinco que reconhece e cliva uma sequência de ácido nucleico específica à sequência de codificação de EmGFP não funcional. Reações de PCR separadas foram desempenhadas para sondar os locais de HO, YGR250c, e NDT80 com iniciadclre3 específicos a ácido nucleico que codifica EmGFP funcional. Numerosos produtos de PCR foram observados, indicando substitui-ção com sucesso das íntegrações de EmGFP não funcional com DNA que expressa EmGFP funcional. 23 colônias ti-veram todos os 3 locais substituídos.
A Figura 7 fornece as titragens de sequiterpeno de Cepa B, uma cepa de levedura que produz farneseno parental que compreende enzimas da via de mevalonato e um plasmídeo que codifica farneseno sintase (FS); Cepa D, uma cepa derivada de Cepa B na qnaj 4 aÓpias de amorfadieno sintase {ADSI foram genomi-camente integradas; e Cepa E, uma cepa derivada de Cepa D na qual c) plasmídeo que codifica FS foi perdido. Quase 100% da capacidade de sesquiterpeno de Cepa B parental é mantida nas Cepas D e E com apenas a adição de múltiplas cópias de ADS.
A Fi-gura 8, fornece resultados para células cotransformadas com DNAs de doador lineares para os locais
SFCl (DNA de doador GFP) e YJR030c (DNA de doador ADE2j, o plasmídeo de endonuclease YjR030C (pCUTO06) e plasmideo de endonuclease SFCl (pCUT058}. 80% das colônias selecionadas eín Placas de Kan ágar + evasão de URA foram GFP positive.
5 Dessas colônias, 91% foram po3i't1vas para integração de ADE2. No total, 72,8% cÍà3 colônias foram integradas com sucesso com o DNA de doador sern marcação em ambos os locais.
6. DESCRIÇÃO DETALHADA DAS MODALIDADES LO 6.1 Defíníções Conforme usado no presente documento, os termcg "clivar", "cli-vagem" e/ou "em clivagem" em relaçào a uma nuclease, por exemplo, uma endonuclease de homzng, nuclease de dedo de zinco ou nuclease de efetor TAL, referem-se àc) ato de criar uma quebra de filamento duplô (DSB) em um ácido nucleico particular. A DSB pode deixar uma extremidade cega ou extremidade coesiva {isto é, saliência 5' ou 3'), conforme entendido por aqueles versados na técnica.
Conforme usado no presente documento, o termo "célula hospedeira projetada" cefere-se a uma célula hospedeira que é gerada âc) modificar geneticamente uma célula parente com c) uso de técnicas de engenharia genética {isto é, tecnologia recombinante). A célula hospedeira projetada pode compreender adições, exclusões, e/ou niodificações de sequências de nucleotídeo ao genoma da célula parente.
Conforme usado no presente documento, o termo "heterólogo" refere-se ao que não é normalmente encont:radc ría natureza. O termo "sequência de nucleotídeo heteróloga"
refere-se a uma sequência de nucleotídeo não normalrrtente encontrada em uma dada célula na natureza. Como tal, uma sequência de nucleotídeo heteróloga pode ser: (a) estranha à sua célula hospedei-ra (isto é, é "exógena" à céluía}; (b) 5 naturalmente encontrada na célula hospedeira (isto é, "endógena"), mas presente em uma quantidade não natural na célula (isto é, maior ou menor quantidade do que naturalmente ericontrado na célula hospedeira); ou (C) ser naturalmente encontrada ría célula ho3pedeira, mas posicionada fora de seu local natcral.
Conforme usado no presente docurnento, o termo "homologia" Fefere-3e à identidade entre duas ou mais sequências de ácido nucleico, ou duas ou rrtais sequências de aminoácido. A identidade de sequência pode ser medida errt termos de identidade percentual (ou similari-dade OLl homologia); quanto maior for a porcentagem, rnais próximas de serem idênticas as sequências são entre si. HornÓlogos ou ortÓlogos de ácido nucleico ou sequências de aminoácido têrn um grau relativamente alto de identidade de sequência quando alinhados com o uso de inétodos padrào. Métodos de alinhamento de sequências para comparação SãCi bem conhecidos na técnica. Vários programas e algoritmos de alinhainento são descritos ern: Smith & Waterman, Adv. Appl- Math. 2:482, 1981; Needleman & Wunsch, j. Èfol. Biol.
48:443, 1970; Pearmm & Lipman, Proc. Natl. Ècad. Sci. USA 85:2444, 1988; Hi-ggins & Sharp, Gene, 73:237 a 44, 1988; Higgins & Sharp, CABIOS 5:151 a 3, 1989; Corpet et al., Nuc. Acicis Res. 16:10881 a 90, 1988; Huang et al. Computer Appls. Biosc. 8, 155 a 65, 1992; e Pearson et al., ¥eth.
Fiol. Bio. 24:307 a 31, 1994. Altschul et al., j. Mol. Biol.
215:403 a 10, 1990, apte3enta uma consideração detalhada de métodos de alinhamento de sequência e cálculos de homologia. A Ferramenta de Pesquisa de Alinhamento Local Básico {BLAST) de NCBI {Altschul et al., j. /4o1. Biol.
5 215:403 a lO, 1990] é disponível a partir de diversas fontes, incluindo o Centro Nacional para Informações Biológicas {(National Center for Biological Information) NCBI, Bibl:i-oteca Nacional de Medic:ina - National Library of Medicine, Prédio 38A, Sala 8N8C)5, Bethesda, Md. 20894) e na Internet, para uso em conexão corn os prograrrtas de análise de sequêncí-a blastp, blastn, blastx, tblastn e tblastx.
Informações adicionais podem ser encontradas no site da web de NCBI.
Conforme usado no presente documento, o termo "sem marcaçào" refere-se a integração de um DNA de doador erri um sitio alvo dentto de um genoma de célula hospedeira sem acompanhar a integração de um marcador selecionável. Em algumas rnodalidades, c) terrrio também se refere à recuperação de tal célula hospedeira sem utilizar urn esquema de seleção que depende da integração de marcador selecionável no genoma de célula hospedeira. Por exemplo, ein certas modalidades, um marcador de seíeçào que é epissomal ou extracrDmos3ôInico pode ser utilizado para selecionar células que compreendem um plasmídeo que codifica uma nuclease capaz de clivagem de um sitio alvo genômtco. Tal üsc) seria considerado "serrt marcaçào" desde que o marcador selecionável não seja integradcÈ no genoma de célula hospedeira.
Conforme usado no presente documento, o termo 3Cí "polinucleotídeo" refere-se a urrt polímero composto por unidades de nucleotídeo, conforme seria entendido por uma pessoa versada na técnica. Cnidades de nucleotídeo preferenciais incluem, mas não são limitadas àquela3 que compreendem adeni-na (A), guanina (G), citosina (C), timina 5 (T), e uracila ([j). Unidades de nucleotídeo modificadas úteis incluem, mas nào são lirnitadas àquelas que cornpreendeín 4-acetilcitidina, 5- (carboxihidroxilmetil}uridina, 2-0 metilcitidina, 5- carboximetilaminometil-2-tiouridina, 5-carboximetilamino- lO IrtetilurLdina, diidrouridina, 2 O-metilpseudouridina, 2-O- metilguanosina, í-nosina, N6-ispentiladenosina, l- metiladeno3ina, l-metilpseudouridina, I-rnetilguanosina, l- metilinosina, 2,2-dimetilguanosina, 2-metiladenosina, 2- metilguanosina, 3-metilcitidina, S-metilcitidina, N6- metiladenosina, 7-metilguanosina, S-metilaminornetiluridina, 5-metoxiaminometil-2-tiouridina, 5-metoxiuridina, 5- metoxicarbonilmetil-2-tiouridina, 5- metoxicarbonilmetiluridina, 2-metiltio-N6- ispentiladenosina, uridina-5-ácido oxi-acético-metiléster, uridina-5-ácido oxiacético, wibutoxosina, wibutosina, pseudourídina, queuosina, Z-tiocitidí-na, 5-metil-2- tiouridina, 2-tiouridina, 4tiouridina, S-metiluridína, 2- 0-metil-5-metiluridina, 2-Q-metiluridina e simílares.
Polinucleotídeos incluem ácidos nucleicos de ocorrência natural, tal como ácidci desoxi-rribonucleico ("DNA") e ácido ribonucleico ("RNA"), assim como análogos de áciclo nucleico. Análogos de ácido nucleico incluem aqueles que incluem bases de ocorrência não natural, nucleotídeos que se engatam em ligações com outros nucleotideos além da ligação de fosfodiéster de ocorrência natural ou que incluem ba3e3 Eixadas através de ligações além da ligação de fosfodiéster. Assim, análogos de nucleotídeo incluem, por exemplo, e sem limitação, fosforotioatos, fosforoditioatos, fosforotriésteres, fosforamidatos, 5 boranofosfatos, metilfo3fonatos, quiral-metil fosfonatos, 2-Q-metil ribonucleotideos, peptídeo-ácidos nucleicos (PNAS) e simílares.
A notação convencional é usada no presente documento para descrever sequências de polinucleotídeo: a extremidade esquerda de uma sequência de polinucleotídeo de filamento único é a extremidade 5'; a direção esquerda de uma sequência de poli-nucleotídeo de filamento duplo é referida como a direção 5'.
Conforme usado no presente documento, o termo "simultâneo", quarido usado em relação à integração múltipla, abrange um período de tempo que começa no ponto no qual uma célula hospedeira é cotransformada coitl uma nuclea3e, por exemplo, um pla3mídeo que codifíca uma nuclease, e mais do que um DNA de doador a ser integrado no genoma de célula hospedeira, e que termina no ponto no qual a célula hospedeira transformada, ou populações clonais da mesrrta, é triada para integração com sucês3o do:s DNAS de doador em seus respectivos iccais alvo. Em algnmas modalidades, o periodo de tempo abrangido por "simultâneo" é pelo menos a quantidade de tempo exigida para a nuclease ligar e clí-var sua sequência alvo dentro do(s) cromossomo(s) da célula hospedeira. Em algumas modalidades, o período de tempo abrangido por "simultâneo" é pelo menos 6, 12, 24, 36, 48, 60, 72, 96 ou mais do que 96 horas, começando no ponto no qual urrta célula hospedeira é cotransformada com uma nuclease, por exemplo, um plasmideo que codifi-ca uma nuclease, e mais do que um DNA de doador.
6.2. Métodos de Integração de Ácídos Nucleicos Exógenos 5 São fornecidos no presente documento métodos de integração de um ou ínai-s ácidos nucleicos exógenos em um ou mais sitios alvo selecionados de um genoma de célula hospedeira. Em determinadas modalidades, os métodos compreendem contactar a célula hospedeira com um c)ü mais polinucleotídeos de integração, izto é, DNAS de doador, que compreendem urn ácido nucleico exógeno a ser integrado no sitio alvo de genoma, e uma ou mais nucleases com capaci-clade de causar uma quebra d2 duplo filamento próxima ao sítio alvo de genoma ou dentro do mesmo. A clivagem próxima ao sítio alvo de genoma OCl dentro do mesmo aumenta amplamente a frequênci-a de reconibinação homóloga no sítio de clivagem ou próximo ao rrtesrrto.
Ern uin aspecto particular, é forneci-do no presente documento um método para integração sem marcação de um ácido nucleico exógeno em urn sítio alvo de urrt genoma de célula hospedeLra, sendo que o método compreende: (a) contactar uma célula hospedeita com: (i) um ácido nucleico exÓgeno (ES} que compreende uma primeira regiào de homologia (HRI) e uma segunda regtão de homalogia (HR2), em que (HRI) e (HR2) têm capacidade de i-niciar recombinação homóloga mediada por célula hospedeira no dito sítío atvo (TS); e (ii) uma nuclease (N) cc:un capacidade de clivagem em {TS), imediatamente após a dita cíivagem remltar em recombinação homóloga de (ES) em (TS}; e
(b) recuperar uma célula hospedeira que tem (ES) integrado em (TS), em que a dit-a recuperação não exige integração de um marcador selecionável.
A Figura 1 fornece uma rr.odalidade exemplificativa 5 de integração genôrnica sem marcação de um ácido nucleico exógeno que usa uma nuclease especifica de sítio. Um polinucleotídeo doador é introduzicio em urna célula hospedeira, errt que o polinucleotídeo compreende uin ácido nucleico de interesse (D) flanqueado por uma primeira região de homologí-a (HRI) e uma segunda região de homologia (HR2). HRI e HR2 compartilham homologia com regiões 5' e 3', respectivamente, de um sítio alvo de genoma (TS). Uma nuclease especifica de sítio (N) também é introduzida à célula hospedeira, em que a nuc:lease tem capacidade de reconhecer e clívàr urna única sequência dentro do sitio alvo. Mediante introdução de uma quebra de duplo filamento dentro do sítí-o alvo pela nuclease especifica de sítio, a maquinaria de recombinação homóloga endógena integra c) ácido nuclei-co de i-nteresse no sítio alvo clivado errt urna frequência maior conforíne comparado a um sítio alvo que não compreende urna quebra de duplo fi-lamento. Essa frequência elevada de integração obvia a necessidade de cointegrar um marcador selecionável de modo a 3e]eciDnar transforraantes que se submeteram a um evento de recombinação. Eliminando a necessidade de marcadores selecionáveis, por exemplo, durante a construção de um micrõbio modelado, o tempo necessá:rio para construj-r ama cepa que compreende uma Vl-à biosintética cornpleta e funcional é amplamente reduzi-do.
Adicionalmente, as estratégias de modelagem não são mais limí-tadas pela necessí-dade de reciclar marcadores selecionáveis devído ao fato de que há um agrupamento limitado de rrtarcadores ciisponiveis para um dado organi3mo hospedeiro.
Em algumas modalidades, a recuperação sem 5 marcação de uma célula transforrrtada que compreende um ácído nucleico exógeno integrado de fcwma bem sucedida Dcorre dentro de uma frequência de cerca de um em cada 1.000, 900, 800, 700, 600, 500, 400, 30C, 200 ou 100 células hospedeiras contactadas ou populações clonais das mesmas, triadas. Em modalidades parti-culares, recuperação sem marcação de uma célula transformada que compreende um ácido nucleico exógeno integrado de forma bem smcedida ocorre dentro de urna frequência de cerca de urrta em cada 90, 80, 70, 60, 50, 40, 30, 20 ou 10 células hospedeiras contactadas ou populações clonais das mesmas, triadas. Em modalidades mais particulares, a recuperação sern marcação de uma célula transformada que compreende um ácido nucleico exógeno integrado de forrrta berrt sucedi-da ocorre dentro de urrta frequência de cerca de uma em cada 9, 8, "7, 6, 5, 4, 3 ou 2 células hospedeiras contactadas ou populações clonais das rrLe3mas, tri-adas. Em modalidades mais particulare3, a célula hospedeira é uma célula de levedura, e a frequência elevada de integração deriva de capacidade elevada de levedura para recombtnação hornóloga em relação a outros tipos de célula hospedeira.
Uma variedade de métodos está disponível para identificar aquelas células que tem um genoma alterado no sítio alvo ou prÓximo ao mesmo sem o uso de urri marcador 3elecionável. Em algumas modalí-dades, tais métodos visam detectar qualquer mudança no sítio alvo, e incluem, porém,
sem limitação, aos rnétodos de PCR, métodos de sequenciamento, digestão de nuclease, por exemplo, mapearnento de restrição, métodc de Southern blots, e qualquer combinação dos mesmos.
5 Ein outro aspecto, é forneci-do no presente documento um método para integrar uina pluralidade de ácidos nucleicos exógenos em um genoma de célula hospedeLra, sendo que o método compreende: (a) contactar uma célula hospedeira com: (i) uma pluralidade de áctdos nucleicos exógenos, em que cada ácido nucleico exógeno (ES)x cornpreende uma primeira região de homologia (HR1)x e uma segunda regi-ão de homologia (HR2),, em que (HR1)x e (HR2)x têm capacidade de iniciar recombinação homóloga mediada por célula hospedeira de (ES)x em um sítio alvo (TS)x do dito genoma de célula hospedeira; e {ii) para cada dito sítio alvo {TS},,, uma nuclease (N},., com capacidade de clivagem em (TSÁ, iruediatawente após a dita cli-vagem resulta errt reccmbinação homÓloga de (ES)x em {Tsj,.; e (b) recuperar uma célula hospedeira em que cada ácido nucleico exógeno (ES)x selecionada integrou em cada sequência alvo selecionada {TS),, em que x é qualquer núrrtero inteiro de i a n em que n é pelo menos 2.
A Figura 2 fornece uma ruodalidade exemplificativa de integração genÔmica simultânea de uma pluralidade de ácidos nucleicos exógenos coín o uso de uma pluralidade de nucleases específicas de sítio. Nesse exemplo, três polinucleotideos são introduzidos em uma célula hospedeira,
ern que cada polinucleotídeo compreende um ácido nucleico exógeno {ESÚ que compreende um ácido nucleico de interesse (DÁ, em que x-l, 2 ou 3. Cada (Wx é flanqueado por uma primeira região de homologia (HRIL, e uma segunda região de 5 homologia {HR2)y.. {HRIÁ e (HR2},, compartilham homologia com regiões 5' e 3', respectivamente, de um sítio alvo selecionado {TS)x selecionado, de três sítios alvo úni-cos totais no genoma. Uma pluralidade de nucleases específicas de sítio (NÁ tarríbém é introduzida na célula hospedeira, em que cada (NÁ tem capacidade de reconhecer e clivar uma única sequência dentro de seu sítio alvo, ITSÁ correspondente. Mediante clivagem de um sitio alvo (TS)x por sua nuclease específica de sítio (N),, correspondente, a maquinaria de recombinação homóloga endógena facilita a i-ntegração do ácido nucleico de interesse (DL, correspondente em (TS),.
Em modalidades particulares, cada ácido nucleico exógeno (ES),c, que corapreende opcionalmente um ácido nucleico de i-nteresse (D),, é integrado a seu respectivo sítio alvo de genoma (TS)x sirrtultaneamente, í-sto é, com urua transformação única da célula hospedeira com a pluralidade de polinucleotídeos de i-ntegração e a pluralidade de nucleases. Em alqurnas modalidades, ds métndos são úteis para integrar simultaneamente cjualquer pluralidade de ácidos nucleicos exógenos (ESÁ ou seja, em que x é qualquer número inteiro de 1 a n em que n é pelo menos 2, erri concordãncia com as variáveis citadas para o método descrito acima. Em algumas modalidades, o rrtétodo de integração simultãnea fornecido no presente documento é útil para integrar si-multaneamente até 10 ácidos nucleicos exógenos (ESÁ em 10 sítios alvo selecionados {TS},, ou seja, em que x é qualquer núrrtero inteiro de 1 a n errí que n- 2, 3, 4, 5, 6, 7, 8, 9 ou lO. Em algumas modalidades, o método de integração simultânea fornecido no presente 5 documento é útil para integrar simultaneamente até 20 ácidos nucleicos exógenos {ES),, em 20 sítios alvo selecionados (TS)., ou seja, em que x é qualquer número í-nteiro de 1 a n em que n- 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 ou 20. Em algumas modalidades, n =2. Em algumas modali-dades, n = 3. Em algumas rnodalidades, n = 4. Em algumas modalidades, n - 5.
Em algumas modalidades, n - 6. Em algumas modalidades, n =
7. Eín algumas modalidades, n - 8. Em algumas modalidades, n - 9. Erri algumas rnodalí-dades, n - 10. Ern algumas modalidades, n - ll. Em algurnas rnodalidades, n - 12. Em algumas modalidades, n - 13. Em algumas modalídades, n -
14. Em algumas modalidades, n - 15. Em algumas modalidades, n - 16. Errt algurrtas modalidades, n = 17. Em algumas rnodalidades, n - 18. Em algumas modalidades, n - 19. Em algumas modalidades, n = 20. Ern algumas modali-dades, o método de i-ntegração m-multânea fornecido no presente docurnento é útil para integrar simultaneamente mais do que 20 ácidos nüc;èicms exógenos.
Assirrt corn a integração de urn único ácido nucleico exógeno em um único sítio alvo, a integração múltipla simultânea de uma pluralidade de ácidos nucleicos ezógenos ocorre em uma frequência substancialmente mai-or conforme comparado para não contactar c)s sítios alvc com uma nuclease com capacidade de induzir uma quebra de duplo filamento. Erri algumas modalidades, durante a integração simultânea de uma pluralidade de ácidos nucleí-cos exógenos em múltiplos locais, isto é, na presença de múltiplas nucleases, a frequência de integração em quaisquer únicos locais é sub3tancialmente maior e:n comparação à frequência 5 de integração no mesmo local durante um único evento de integração, isto é, rja presença de uma única nuclease. Tal vantagem é demonstrada no Exemplo 6 (Seção 7.5.2) abaixo.
Sem ser limitado por teoria, acredita-se que a presença e atividade de múltipias nucleases, que cria quebras de duplo filamento (DSBs) em uma pluralidade de sítios alvo, enri-quece 03 transformantes que reparam de forma bem sucedida as DSBs integrando o(S) os DNA{s) de doador no sítio de corte, e/ou seleci-ona os transformantes sem capacidade de reparar as DSBS. Vi.sto que DSBs sào tóxícos às células, acredita-se que um núrnero elevado de nucleases induz a mais DSBS, e de forma correspondente, um enriquecimento para células com capacidade de reparar as DSBS através de integração medi-ada por HR de DNA(s) de doâdor.
Em algumas modalidades, essa frequência elevada de integração obvia a exigência de cointegração de um ou mais marcadores seleci-onáveis para a identificação da pluralidade de eventos de recombinação. Em algumas modalidades, a recuperação sem marcação de urrta célula transformada que compreende urna pluralidade de ácído nucleico exógeno integrado de forma bem sucedtda ocorre dentro de uma frequência de cerca de um em cada 1.000, 900, 800, 700, 600, 500, 400, 300, 200 ou 100 células hospedeiras contactadas ou populações clonais dasi mesmas, triadas. Em modalidades particulares, a recuperação sem rnarcação Qcorre dentro de uma frecjuência de cerca de uma erri cada 90, 80, 7C), 60, 50, 40, 30, 20 ou 10 células hospedeiras contactadas ou populações clonaís das rrtesmas, triadas. Em modalidades mais particulares, a recuperação 5 sem marcação ocorre dentro de uma frequência de cerca de uma em cada 9, 8, 7, 6, 5, 4, 3 ou 2 células ho3pedeiras contactadas ou populações clonais das rnesmas, triadas. Em modaltdades mais particulares, a célula hospedeira é uma célula de levedura, e a frequência elevada de íntegração deriva da capacidade elevada de levedura para recombi-nação homóloga em relação a outros tipos de célula hospedeira.
6.2.1. Métodos para Modelagem de Via Metabóliea Os métodos e composições descritas no presente documento fornecem vantagens particulares para construir organismos recombinantes que corrtpreendem vias biosintéticas otimizadas, por exemplo, voltadas à conversão de bi-omassa em biocornbustíveis, produtos farmacêuticos ou biomateriais.
As vias biológicas nào nativas funcionais foram construídas de forma bem sucedida em hospedeiros rnicrobianos para a produção de precursores ao fármaco antimalarial arternisinina (consulte, por exerríplo, Martin et al., Nat Biotechnol 21:796 a 802 (2003); o ácido graxo deriva combustívets e prodntos químicos (por exernpío, ésteres graxos, álcoois graxos e ceras; consulte, por exemplo, Steen et al., Nature 463:559-562 {2010); corabustíveis derivados de haleto de metila e produtos químicos (consulte, por exernplo, Bayer et al., j Am Chem Soc 131:6508 a 6515 (2009); policetideo sintases que criam colesterol diminuindo fármacos (consulte, por exemplo, Ma et al., Science 326:589 a 592 (2009}; e policetídeos
(consulte, por exemplo, Kodumal, Proc Natl Acad Sci USA 101:15573 a 15578 (2004).
Tradicionalmente, a mocelagem metabólica e, em particular, a construção de vias biosintéticas, procedeu de 5 modo errt séri-e de um para um no qual os componentes de via foram introduzidos, isto é, i-ntegrados no genoma de célula hospedeira ern um único local em urri tempo. Os métodos de integraçào fornecido no presente documento pode ser utilizado para reduzir o tenipo tipicamente exigido para lO modelar uma célula hospedeira, por exemplo, uma célula m:i-crobiana, para compreender uma ou mais sequências de nucleotídeo heterólogo que codifica enzimas de uma nova via metàbólica, isto é, uma via metabólica que produz um metabolito que não é produzído de forma endógena pela célula hospedeira. Erri outras modalidades particulares os métodos de integração fornecidos no presente documento podem ser usados para modelar de forrrta eficiente uma célula hospedei-ra para compreender urrta ou mais sequências de nucleotídeo heterólogo que codifica enzimas de uma via metabólica que é endógena à célula hospedeira, isto é, uma via metabólica que produz um metabolito que é produzido de forma endógena pela célula hospedeira. Em um exemplo, uma estratéqia de projeto pode visar substituir três genes nativos de uma célula hospedeira com uma via exógena complementar. A modLfI-cação desses três locais endógenos com o uso do estado atual da técnica exige três transformações separadas. Em contrapartida, os métodos de íntegração múltipla simultânea fornecidos no presente documento permitem que todas as três integraçõe3 a serem realizadas em uma transformação única, reduzindo desse modo os ciclos de modelagern necessárias em três vezes. Além do mais, os métodos permiterrt a portagem de conjuntos de DNA, que cornpreendetn componentes otimizados de via integrada em rnúltiplos sítios em uma chassi de célula hospedeira, a 5 sitios análogos em um segundo cha33i de célula hospedeira.
reduzindo c) número de ciclos necessários para modelar um genótipo desejado, o ritmo de construção de vias metabólicas é substancialmente aumentado.
6.2.1.1. Modelagem de Via Isoprenoíde ICl Em algumas modali-dades, os métodos fornecidos no presente documento podem ser utiA-zados para introduzir ou substituir simultaneamente um ou mais componentes de uma via bio3intética para modificar o perfil de produto de uma célula hospedeira modelada. Em algurnas rnodalidades, a via biosintética é a via isoprenoide.
Os terpenos são uma grande classe de hidrocarbonetos que são produzidos em muítos organismos.
Quando terpenos são quimicamente modificados (por exemplo, por meio de oxidação ou redLsposição do esqueieto de carbono) os compostos resultantes são geralmente referidos como terpenoides, que são também conhecidos como isoprenoides. Os isoprenoides desempenharn muitos papéis biologicamente importantes, por exemplo, as quinonas em cadeias de transporte de elétron, como componentes de merribtanas, em di-recionamento e regulação subcelulat por meio de prem-lação de proteina, como pigmentos fotossíntéticos que incluem carotenoides, clorofila, como horrnônios e cofatores, e como compostos de defesa de planta com vários morioterpenos, sesquiterpenos, e diterpenos. Os rrtesmos são industrialmente úteis como antibiÓtico3,
hormõnios, fármacos anticancerígenos, inseticidas, e produtos químicos.
0$ terpenos são derivados ligando-se unidades de isopreno (c5H8j, e são classiíjcados pelo número de 5 unidades de isopreno presentes. Os hemiterpenos consistem errt uma única unidade de isopreno. O próprio isopreno é considerado o único hemiterpeno. Cs monoterpenos são feitos de duas unidades de isopreno, e têrrt a fórrnula molecular Cl0H16. Os exemplos de monoterpenos sãcj geraniol, limoneno, e terpineol. Os sesquiterpenos são cornpostos de três unidades de isopreno, e têm a fÓrmula molecular C15Hz4. Os exemplos de sesquiterpenos são farnesenos e farnesol. Os diterpenos são feitos de quatro unidades de isopreno, e têm a fórmula molecular C20H32. Os exemplos de díterpenos são cafestol, caveol, cembreno, e taxadieno. 05 sesterterperios são feitos de cinco unidades de isopreno, e têm a fórmula molecular C2EHá0. Um exemplo de um sesterterpeno é gerani-lfarnesol. Os triterpenos consisterrt em séj-s unidades de isopreno, e têrrt a fÓrmula molecular C3gH48. Os tetraterpenos contêm oito unidade3 de i-sopreno, e têm a fórmula molecular C4CHFà. Os tetraterpenos biologicamente importantes irícluern o licopeno acícli-co, o caroteno monocíclico, e o alfa e beta-carotenos bicíclicos. Os politerpenos consistein em longas cadeias de mui-tas unidades de isopreno. A botracha natural consi-ste em polisopreno no qual as ligações duplas sãcj cis.
Os terpenos são biosintetizados através de condensações de pirofosfato de isopentenila {difosfato de isopentenila ou IPP) e seu j-sõmero pirofosfato de dimetilalila (difo3fato de dimetilalila ou DMAPP). Dua3 vias são conhecidas para gerar IPP e dmapp, ou seja, a via dependente de mevalonatojMEV) DE eucariontes (A Figura 3), e a ví.a de deoxixilulose-5-fosfato (DXP) ou independente de rnevalonato de procariontes. As plantas são tanto via MEV 5 quanto via DX?. O IPP e DMAPP por sua vez, são condensados para ciifosfatos de poliprenila (por exemplo, disfosfato de geranila ou GPP, difosfato de farnesila cju FPP, e difosfato de geranilgeranila (jü GGPE') através da ação de disfosfato de prení-la sintase3 (por exernplo, GPP sintase, FPP sintase, e GGPP sintase, respectivamente). Os intermediários de difosfato de políprenila são convertidos para estruturas isoprenoides rnais complexas por terpeno sintases.
As terpeno sintases sÊio organizadas em grandes farnílias de gene que formam ínúltiplos produtos. Os exemplos de terpeno sintases incluem monoterpeno sintases, que convertem GPP em rnonoterpenos; diterpeno sintases, que convertem GGPP em ditetpenos; e sesqui-terpeno sintases, que convertem FE'P em sesqui-terpenom Um exemplo de uma sesquiterpeno sintase é a farneseno sintase, que converte FPP em farneseno. As terpeno sintases são impoLtantes na regulação de fluxo de vi-a a um is.oprenoide devido ao fato de que os mesmos operam em pontos de ramificação metabólica e ditam c) tipo de isoprenoide produzido pela célula. A-lérn do mais, as terpeno sintases têm a chave para a produção de alto rendimento de tais terpenos. Como tal, urna estratégia para aprimorar o fluxo de via em hospedeiro3 modelados para produção de isoprenoide heterólogo é introduzir múltiplas cópías de ácidos nucleicos que coclificam terpeno sintases.
Por exemplo, em micróbios modelados que compreendern a via MEV em que a produção de sesquLterpenos tais como farneseno é desefada, uma sesqui-terpeno sintase, por exernplo, uma farnesene sintase é utilizada à medida que a enzima terrríinal da via, e múltiplas cópias de genes de farneseno sintase genes poclem ser introduzi-das na célula hospedeira 5 para a geração de uma cepa otimizada para produção de farneseno.
Devido ao fato de que a biossíntese de qualquer isoprenoide consiste nos mesmos componentes de via a montante da disfosfato de prenila sintas:e e terpeno sintase, esses componentes de via, uma vez que modelados em uma cepa de "plataforma" hospedei-ra, pode ser utilizado para a produção de qualquer sesquiterpeno, e a identidade do sesquiterpeno pode ser ditada pela sesquiterpeno sintase particular introduzida na célula hospedeira. Além do rnais, onde a produção de terpenos que têm diferentes unidades de isopteno for desejada, por exemplo um monoterpeno em vez de um sesiquiterpeno, tanto a difosfato de prenila sintase quanto a terpeno sintase pode ser substituída para produzir c) diferente terpeno enquanto aínda utiliza os componentes a montante da via.
Consequentemente, qs métocíos e compo3ições fornecí-dos no presente documento podem ser utilizados para modificar de forma eficiente uma célula hospedeira que compreende um isoprencn-de que prc)duz via, por exemplo, a via MEV para produzir um LsoprenoLde desejado. Em algumas modalidades, a célula hospedeira compreende a via MEV, e os métodos de integração múltipla simultânea fornecidos no presente docurriento podem ser utilizado para introduzir simultaneamente múltiplas cópias de uma difosfato de prenila sintase e lou uma terpeno siritase para definir o perfil de terpeno de produto da célula hospedeira. Em algumas modalidades, a difosfato de prenila sintase é a GPP sintase e a terpeno sintase é uma rnonoterpeno sintase. Em algumas rnodalidades, a difosfato de prenila sintase é a FPP 5 sintase e a terpeno sinta3e é uma sesqutterpeno sintase. Em algurnas modalidades, a difosfato de preni-la sintase é a GGPP sintase e c) terpeno sintase é uma diterpeno sintase.
Em outras rnodalidades, a célula hcspedeira compreende a via MEV e uma difosfato de prenila sintase e/ou uma terpeno sintase para a produção de um primeiro tipo de terpeno, por exemplo, farneseno, e os rrlétc)dc}s de i-ntegração rnúltipla sirnultânea fornecidos no presente documento podem se:r utilizados para substituir sí-multaneamente um ou mai-s cópias da difosfato de prenila sintase e/ou uma terpeno i5 sintase para produzir um segundo tipo de terpeno, por exemplo, amoríadieno. Ês3à3 modalidades são exemplificadas nos Exempíos 3 e 4 abaixo. Os métodos fornecidos no presente documento podem ser uti.Lizados de forrría similar para a construção e/ou modi-ficação de qualquer via biosintética que utili-za múltiplas cópia3 de componentes de via, e são parti-cularmente úteis para modelar células hospedeiras cujo perfil de produto pode ser prontarnente rnodtficado com a adição 011 troca de múlmplas nópias de um único componente de vía.
6.2.1.2. Métodos de Geração de Biblíoteeas de Integração Combinatóría Uma vez que as vias biosintéticas são construídas, os níveis de expressão de todos os componentes necessários para serem orquestrados para otimizar o fluxo metabólico e alcançar altas titragens de produto.
Abordagens comuns para otimizar fluxos incluem variar a icientidade do gene de componente de via, a otirnização de códon do gene, o uso de etiquetas de solubilidade, q ü3o de truncamentos ou mutações conhecidas, e o contexto de 5 expressão do gene (LSto é, escolha de promotor e terminador). Para mostrar essa variabilídade no curso cie construção de uma cepa corn o uso de inétodos tradicionais exige gerar e alcançar um número impraticavelmente grande de cepas. Por exemplo, se um engenheiro de cepas planeja integrar construtos em três locais, e dividiu lC) variantes para cada local, 1.000 cepas prec:isariam ser geradas para amostrar completamente a diversidade combinatória. Visto que os genes de via trabalham em concerto, e nem todos os intermediários de metabolito podem ser tríados, é frequentemente impossível avaliar a contribuição individual dos genes de via depois de cada cíclo de integração. Desse modo, engenheíros de cepa fazem escolhas de forma rotineira que limitam severamente o espaço de projeto que os rrLe3mos mostram ao construir uma via metabólica inovadora.
Pa:ra í-dentificar melhor o prc'jeto de via ideal, os métodos de modificação genômica fornecidos no presente documento podem ser utilizados para gerar cepas que compreendem bibliotecas cnmbinatórias de àonstrutos de íntegração racionalmente projetaclos. Os métodos consistem na introduçãc de uma ou mais nucleases e urri ou mais conjuntos de dna de doaciores na célula para fací-litar múltipla integração simultânea de DNA de doador em localizações especificadas no genorna. No entanto, para gerar uma diversidade de cepas modeladas, 03 métodos compreendem cotransformar uma biblioteca de DNAS de doadores, isto é, uma mistura de integração construtos para cada local di-recionado, de modc que as bibliotecas de integração combinatória de cepas hospedeiras possam ser geradas (Figura 4) . A alta frequêncía de meios alcançados 5 por múltiplas i-ntegrações de que as cepas resultantes podem ser razoavelmente triadas diretamente para produção sem controle de qualidade genômica extensiva, e a identidade de cepas de topo pode ser determi-nada após a triagem, por exemplo, por inej-o de sequenciamento. Esse método rernove o agravante de geração de cepa individual, controle de qualidade e arquivamento, e permi-te que o engenheiro gere diversas combinaçães de integração em um único tubo, e ordenar as cepas de melhor desempenho por meio de tri-agem, por exemplo, para o produto terminal da via.
Desse modo, em algumas modalidades, os métodos para integrat uma pluralidade de ácidos nucleicos exógenos em um genoma de célula hospedeira fornecidos no presente documento cornpreendem: (d) contactar urna célula hospedeira com: {i) uma pluralidade de biblic)teca3, em que cada biblioteca (L)x compreende urna plurali-dade de ácidos nucleicos exógenos, em que um ácido nucleico exógeno selecionado compreende, em nma orientação de 5 para 3, nma primeira regtão de homologia (HRI),, qualquer ácido nucleico de interesse selecionado do grupo (DÁ, e uma segunda região de homologia {HR2),,, em que (HR1)x e {HR2), têm capacidade de iniciar a recombinação homóloga mediada por célula hospedeira do dito ácido nucleico exógeno seleci-onado em um sítio alvo (TSN do dito genoma de célula ho3pedeira; e para cada dito sitio alvo (Tslx, uma nuclease (N),, com capacidade de clivagem em (TS),, imediatamente após dita clivagem resulta em reccmbinação homõloga do dito ácido nucleico exógeno selecionado em (TSÁ: e 5 5. recuperar uma célula hospedeira em que um ácido nucleico exógeno de cada biblioteca (L),, integrou eni cada sequência alvo selecionada (TSL,, em que :x é qualquer núrnero inteiro de 1 a n errí que n é pelo menos 2.
Uma representação esquemática desse método é fornecida na Figura 4.
Também é fornecido no presente documento uma célula hospedeira que compreende: (a) urrta pluralidade de biblíotecas, em que cada biblioteca (L}x compreende uma pluralidade de ácidos nucleicos exógenos, em que um ácidci nucleico exógeno selecionado compreende, em um orientação de 5 a 3, uma primeira região de homologia {HRIÁ, qualquer ácido nucleico de i-nteresse selecionado do grupo (DÁ, e uma segunda região de homologia (HR21,, em que (HRIÁ e {HR2),, têm capacidade de iniciar recombinação homóloga mediada por célula hospedeita do dito ácido nucleico exógeno selecionado em um sítio alvo (TSÁ do dito genoma de célula hospedei-ra: e (b) para cada dito sítio alvo (Tslx, uma nuclease {N),, com capacidade de clivagem em {TSÁ, imediatamente após dita clivagem resmlta em recombinação homóloga do dito ácido nucleico exógeno selecionado em (TSÁ,
em que x é qualquer número inteiro de 1 a n em que n é pelo menos 2.
Em algumas modalidades, cada biblioteca (L),, compreende ácidos nucleicos exógenos que codificam enzimas 5 de uma via biosintética cornurn. Em algumas modalidades, o grupo(D)x cornpreende pelo menos j(ji, j()Z, 10Í 10', jç)S, 106 ou mais do que 10f únicos ácidos nucleicos de interesse. Em algumas modalidades, cada bibli-oteca (L)x compreende uma pluralidade de ácidos nucleicos exógenos que codificam variantes de uma enzima de uma via biosintética. Conforme usado no presente documeríto, o termo "variante" se refere a um enzima de uina via biosintética que, em comparação a uma enzima selecionada tem um diferente sequência de nucleotídeo amino ácido. Por exerrtplo, em algumas modalidades, uma biblioteca (L}x compreende variantes de sesquiterpeno sintase, e em comparaçâo à ver3ão de tipo selvagem da sesquiterpeno sintase seleci-onada, a variante de sesquiterpeno sintase pode cornpreender adições de nucleotídeo, exclusões, e/ou substituições que podem ou não resultar em mudança à sequência de aminoácido correspondente. Em outras modaliclades, a enzima variante compreende adições de amino ácido, exclusões e/ou substituições retacionadas a nma enzima de referência, por exemplo, a versão de tipo selvagem.
Em alguírtas modalidades, a célula hospedeira compreende uma ou mais sequências de nucleotideo heterólogo que codifica uma ou mais enzimas de uma via biosintética antes de estar no dito contato. Ern algumas modalidades, as urrta ou màÚ3 sequências de nucleotideo heterÓlogo que codtfícam uma ou mais enzimas de uma via biosintética integradas de Eorma genômica.
6.3. PoIínucleotideos de Integração De forma vantajosa, um polinucleotídeo de 5 integração, isto é, DNA de doador, facilita a integração de um ou mais construtos de ácido nucleico exógeno em urrt sítio alvo selecionado de um genoma de célula hospedeira. Em rrtodalidades preferenciais, um polinucleotídeo de integração compreende um ácido nucleico exÓgeno {ESÁ que compreende uma primeira região de homologia {HRI),, e uma segunda região de homologia lHR2)x, e opcionalmente um ácido nucleico de interesse posicionados entre {HRI),, e (HR2Á.
Em algumas rnodaltdades, c) polinucleotideo de integração é uma molécula de DNA línear. Em outras modalidades, c) polinucleotídeo de integração é uma molécula de DNA circular.
O polinucleotideo de integração pode ser gerado por qualquer conjunto de procedimentos evidentes a alguém versado na técnica. Em determinadas modalidades, o polinucleotídeo de integração é gerado com o uso de reação de cadeia de polimerase (PCR) e conjuntos de procedimentos de clonagem molecular conhecidos na técnica. Consulte, por exemplo, PCR Technology: Principles e Applications for DNA Amplification, ed. HA Erlich, Stockton Press, New York, N.Y. {1989); Sambrook et al., 2001, Molecular Cloning - A Laboratory Manual, 3'd edition, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY; PCR Technology: Principles e Applications for DNA Ampiification, ed. HA Erlich, Stockton Press, New York, N.Y. {1989); Docuinento de Patente n° U.S. 8.110.360.
6.3.1. Sequêneías de Integração GenÔmica Em modalidades preferenciais, um polinucleotídeo de integração cornpreende um ácido nucleico exógeno {ESÜ que compreende uma primeita região de homologia (HRIÁ e 5 uma segunda regí-ão de homologia (HR2)x, em que (HRIR e (HR2)x têrn capacidade de iniciar recombinação homóloga mediada por célula ho3pedeira em urrí sítj-o alvo selecionado (TS)x dentro do genorrta de célula hospedetra. Para integrar um ácido nucleico exógeno no genoma por recombinação homóloga, o polinucleotideo de integração compreende preferencialmente {HRIÁ em um término e (HR2)x no outro término. Errt algumas modalidades, {HRIÉ é homólogo a uma região 5 do sitío alvo selecionado de genoma {TS),,, e (HR2)x, é honíólogo a uma região 3 do sítici alvo selecionado (TSÁ. Em algumas modalidades, (EIRIÁ é cerca de 70°s, 75°s, 80%, 85%, 90%, 95% ou 100% homólogo a uma região 5 do sítio alvo seleci-onado de genoma (TSL,. Em algumas modalidades, (HR2lx, é cerca de 70%, 75%, 80%, 85%, 90%, 95% ou 100% homologo a uma região 3 dcí sítici alvo selecionado (TS)x.
Em determinadas modalidades, (HRl)x é posicionado 5' a urn ácido nucleico de interesse (DÁ- Em algumas modalidades, (HRI), é posicí-onado -Lmediatamente adjacente à extremidade 5 de (D},,. Em algumas modalidades, (HR1)x é posicionado a montante ao 5' de P)x. Em deterrnínadas modalidades, (HR21, é po3icionado 3' a um ác-Ldo nucleico de interesse {D),,. Em algumas modalidades, (HR2},, é posicionado irnediatamente adjacente à extremidade 3 de {D)x. Em algumas modalidades, {HR2}x é posicionado a jusante ao 3' de (D),.,-
As propriedades que podem afetar a integração de um polinucieotídeo de integração em urn local genômico particular incluem, porém, sem lí-mitaçào, os comprimentos das sequências de integração genômica, o corrtprimento geral 5 do construto de ácido nucleico rerrtovível, e a sequência de nucleotídeo ou localização do local de integração genômica.
Por exemplo, a formaçãcj eficaz de heteroduplex entre um filamento de uma sequência de integração genômica e um filamento de urri local particular era um genoma de célula lC) hospedeira pode depender do comprimentô da sequência de integração genôrnica. Uma faixa efjcaz para o comprimento de urrta sequência de integração genôrrtica é cie 50 a 5.000 nucleotídeos. Para uma discussão de comprimentos eficazes de homologia entre as sequências de integração genômica e locais genômicos. Corísulte Hasty et al., l4ol Cell Biol 11:5586-91 (1991).
Eni algumas modalidades, {HRIÁ e {ER2L pode compreender qualqner sequência de nucleotídeo de comprimento suficiente e identídade de sequência que perrnite integração genômica do ácído nucleico exógeno (ES)x em qualquer local genômico de levedura. Em determinadas modalidades, cada um dentre (HRIÁ e (HR2Á consiste tndependentemente ern cerca de 50 a 5.000 nucleotídeos. Em determinadas uiodalidades, cada um dentre (HR1}x e (HR2Á consiste independentemente em cerca de 100 a 2.500 nucleotídeos. Em determinada3 raodalidades, cada um dentre (HRIÁ, e (HR2Á consiste independentemente em cerca de 100 a 1.000 nucleotídeos. Em determinadas modalidades, cada um dentre (HRIÁ e {HR2Á consiste independentemente em cerca de 250 a 750 nucleotídeos. Em ieterminadas modalidades,
cada um dentre (HRI),, e (HR2Á consiste independentemente em cerca de iOO, 200, 300, 400, 500, 600, 700, 800, 900,
1.000, 1.100, 1.200, 1.300, 1.400, 1.500, 1.600, 1.700,
1.800, 1.900, 2.000, 2.100, 2.200, 2.300, 2.400, 2.500, 5 2.600, 2.700, 2.800, 2.900, 3.OC)O, 3.100, 3.200, 3.300,
3.400, 3.500, 3.600, 3.700, 3.800, 3.900, 4.000, 4.100,
4.200, 4.300, 4.400, 4.500, 4.600, 4.700, 4.800, 4.900 ou
5.000 nucleotideos. Em algumas modalidades, cada um dentre (HRIÁ e {HR2N consiste independentemente em cerca de 500 nucleotídeos.
6.3.2. Ácidos Nucleieos de Interesse Em algumas modalidades, o polinucleotídeo de integração compreende adicionalmente um ácido nuclei-co de interesse (DÁ. O ácido nucLeLcc) de tnteresse pode ser qualquer segmento de DNA considerado útil por alguém versado na técnica. Por exernplo, o segmento de DNA pode cornpreender uní gene de interesse que pode ser "montado" a urn genoina hospedeiro. Em outras modalidades, o segmento de DNA funciona como um construto de "desmontamento" que tem capacidade especificamente de romper um gene alvo mediante integração do con3truto no sítio alvo do genoma de célula hospedeira, tornando assira c) gene rompido não funcional.
Exemplos úteis de tjrn ácido nncleico de interesse (|))x incluem, porém, sem limítação, uma sequência de codificação de proteína, gene repórter, sequência de codificação de marcador fluorescente, prorn.otor, intensificador, terminador, ativador transcricional, repressor transcricional, sítio de Ligação de ativador transcricional, sítto de ligação de repressor transcricional, íntron, exão, cauda poI1-A, sítio de múltipla clonagem, sinal de localização nuclear, sinal de estabilizaçÊio de rnRNA, locais de integração, sequência de codificação de etiqueta de epítop:i, sinal de degradação ou qualquer outrà molécula de DNA 3intético ou naturalrnente 5 ocorrente. Erri algurnas modalí-dades, (D)x pode ser de origem natural. de forma alternativa, {D),, pode ser completamente de origem sintética, produzida in vitro. Ademais, (DÁ. pode compreender qualquer combinação de moléculas de DNA naturalmente ocorrente isoladas CpÜ qualquer combinação de uma molécula de DNA naturalmente ocorrente isolada e um molécula de DNA sintética. E'or exemplo, (DÁ pode compreender um prorrtotor heterólogo operativamente ligado a uma sequência de codificação de proteína, uma sequência de codificação de proteína ligada a uma cauda poI1-A, uma sequência de codificação de proteína ligada em quadro a uma sequência de codificação de etiqueta de epítopo, e 3irrlLlares. O ácido nucleico de interesse (DÁ pode ser obtido por procedimentos padrão conhecidos na técnica a partir do DNA clonado {por exemplo, uma "biblioteca" de DNA), por síntese química, por clonagem de cDNA ou pela clonagem de DNA genômico ou fragmentos do memo, purificados a partir da célula desejada ou pctr arnplificação de PCR e clonagern. Consulte, por exemplo, Sambrook et al., Molecular Cloning, È Laboratory Manual, 3d. ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York (2001); Glover, D.M. {ed.), DNA Cloning: A Practical Approach, 2d. ed., MRL Press, Ltd., Oxford, U.K. (1995).
1. Em modalidades em particular, o ácido nucleico de interes3e (O).y não compreende ácido nucleico que codifica um marcador selectonável. Nessa:s modalidades,
a alta eficiência de integração fornecida pelos métodos descritos no presente documento permite a triagem e identificação de eventos de integração sem a exigência de pro1tferação de células transforrnadas em meio de seleção.
5 Entretanto, em Qutra3 modalidades eru que proliferação em ineio seletivo é mesmo assim desejado, o ácido nucleico de interesse (DÁ pode compreender um marcador selecionável que pode ser usado para selecionar para a jLntegraçao do ácido nucleico exógeno em um genoma ho3pedeiro.
lC) 2. Uma ampla variedade de marcadores selecionávei-s são conhecidos na técnica (ver, por exemplo, Kaufinan, Heth. Enzymol., 185:48"7 {1990); Kaufman, ¥eth.
Enzyinol., 185:537 (19901: Srivastava e Schlessinger, Gene, 103:53 (1991); Romanos et al., em DNA Cloning 2: Expression Systems, 2" Edição, páginas 123 a 167 {IRL Press 1995); Markie, Methods Èíol. Biol., 54:359 (1996); Pfeifer et al., Gene, 188:183 {1997); Tucker e Burke, Gene, 199:25 (1997); Hashida-Okado et al., FEBS Letters, 425:117 {1998)). Em algumas modalidades, o marcador selecionável é um marcador resistente a fárrnaco. Uin rnarcador resistente a fármaco permite que células desintoxiquem urn fármaco exógeno que de outro modo mataria a célnla. Exemplos ilustrativos de rnarcador resistente a fárrrlaco3 incluem, porém sem limitação, aqueles que conferem resistência a antibióticos tais como ampicili-na, tetraciclina, canamicina, bleomicina, estreptomicina, higromi-cina, necmicina, ZeocinTM, e 3emelhantes. Em outras modalidades, o marcador selecionável é um inarcador auxotrófico. Um marcador auxotrófico permite que células sinteti-zem um component:e essencial (normalmente um aininoácido) enquanto prolifera em meio sem aquele componente essencial. Sequências de gene auxotrófico selecionáveis incluem, por exemplo, hisO, que permite proliferação em mej-o livre de histidina na presença de hi-stidinol. Outros marcadores selecionáveis incluern um gene 5 com resistência a bleomicina, um çene de metalotioneína, um gene de higromicina B-fosfotransferase, o gene AURI, um gene adenosina deaminase, um gene de aminoglicosídeo fosfotransferase, um gene de dihidrofolato reduta3e, urn gene de timidina quinase, um gene de xantina-guanina fosforibosiltransferase, e semelhantes. Em outras modalidades, o marcador selec-i-onável é um marcador cliferente de um que resgata uma mutação auxotófica. Por exemplo, a cepa de célula hospedeira pode ccmpreende rrtutações diferentes de mutações auxotróficas, por exemplo, rnutações que não são letais para o hospedeiro e que também não causam efeitos adversos no uso destinado da cepa, por exemplo, fermentação industrial, contato que as mutações possam ser identifí-cadas por um método de seleção conhecido.
3. Transformantes de célula hospedeira que conipreendem um polinucleotídeo cromossomicamente integrado também podem ser identificados selecionando-se transformantes de célula hospedeira que exibem traços diferentes codificados por segmentos de DNA indLviduais ou por combinações de segmentos de DNA, por exemplo, expressão de peptídeos que emitem luz, ou por análise molecular de coiônj-as de célula hospedeira individuais, por exemplo, por mapeamento de enzima de restrição, arnplificação de PCR, ou análise de sequência de polinuclec)tídeos montados isolados ou sítios de integração cromossômica.
6.4 Nucleases
4. Em algumas modalidades dos métodos descritos no presente documento, um genomâ de célula hospedeira é colocado em contato com uma ou mais nucleases capazes de 5 clivagem, isto é, que causam um quebra de filamento duplo em uma regiãc> designada dentro de urrí sítio direcionado selecionado. Em alguma3 modalidades, um agente indutor de quebra de filamento duplo é qualquer agente que reconhece e/ou se liga a uma sequência de reconhecimento de poii-nucleotídeo específica para produzir ujna quebra em ou próximo à sequência de teconhecimento. Exemplos de agentes indutores de quebra de filarnento duplo incluem, porérn 3em linitação, endonucleases, recombinases específicas de sítio, transposases, topoisornerases, e nucleases de dedo de zinco, e incluem fragmentos, variações, e derivados modificados dos mesmos.
5. Em algumas modalidades, cada uma das urn ou mais nucleases é capaz de causar uma quebra de filamento duplo em uma região designada dentro de um sitio direcionado selecionado (TS)x. Em algurrla3 modalidades, a nuclease é capaz de causar urria quebra de filamento duplo em uma região po3LcLonada entre as regiões 5' e 3' de (TS}x com que (HR1)x e (HR2Á rompartilham homologia, respectivaraente. Em outras modaliclades, a nuclease é capaz de causar uma quebra de filamer.to duplo em uma região posLcLonada a montante ou a jusant-e das regiões 5' e 3' de (TS) X.
6. Urna sequência de reconhecimento é qualquer sequência de polinucleotídeo que é especificamente reconhecida e/ou ligada por um agente indutor de quebra de filamento duplo. O comprimento da sequência de sítio de reconhecimento pode variar, e imclui, por exemplo, sequências que são pelo menos 10, 12, 14, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 5 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70 ou mais nucleotídeos em comprimento.
"7. Em algumas modali.dades, a sequência de reconhecimento é palindrômí-ca, isso é, a sequência em um filamento é Lida como a mesma na direção oposta no mesmo filamento complementar. Em algurrtas ínodalidades, o sítio de entalhe/clivagem está dentro da sequência de reconhecimento. Em outras modalidades, o sítío de entalhe/clivagem está fora da sequência de reconhecimento.
Em algumas moclalidades, clivagem produz terminais de extrernidade cega. Em outras rnodalidades, clivagerrí produz saliêncías de fi-lamento único, isto é, "extremidades aderentes", que podem ser ou saliências 5', ou saiiências 3'.
8. Em algumas rnodalidades, a sequência de reconhecimento dentro do sítio direcionado selecionado pode ser endógena ou exógena ao genoma de célula hospedeira.
Quando o sitio de reconhecimento é uma sequência endógena, a mesma pode ser uma sequência de reconhecimento reconhecida por um agente indutor de quebra de filarnento duplo nati-vo ou de ocorrência natural. Alternativamente, um sítio de reconhecimento endógeno poderia ser reconhecido e/ou ligado por um agente indutot de quebra de filamento duplo rnodificado ou modelado projetado ou selecionado para reconhecer especifi-camente a seqt:ência de reconhecimento endógena para produzir uma quebra de filainento duplo. Em algumas rrtocialidades, o agente indutor de quebra de filarriento duplo modificado é derivado de um agente indutor de quebra de filamento duplo de ocorrência natural, nativo.
5 Em outras modalidades, o agente indutor de quebra de filamento duplo modificado é artificialmente criado ou sintetizado. Método3 para selecionar tais agente3 indutores de quebra de filamento duplo modificados ou modelados 3Êto conhecidos na técnica. Por exemplo, variações de sequência de aminoácido da{s) proteína(s) podem ser preparadas por mutações no DNA. Métodos para mutagênese e alteraçães de sequência de nucleotídeo incluen, por exemplo, Kunkel, {1985) Proc Natl Acad Sci USA 82:488 a 92; Kunkel, et al., (1987} Neth Enzymol 154:367 a 82; Pat.n°. U.S. 4.873.192; Walker e Gaastta, eds. {1983) Techniques in Nolecular Biology (MacMillan Publishing Company, Nova York} e as referências citada3 nos mesmos. Orientação em relação a substituições de aminoácido não provável de afetar atividade biológica da proteína é verificada, por exemplo, no modelo de Dayhoff, et al., (1978) Atlas of Protein Sequence e Structure (Natl Bioined Res Found, Washington, D.C.). Substttuições conservadores, tais como trocar um aminoácido com outro que tem propriedades similares, podem ser preíeríveis. Exclusões conservadoras, inserções, e substituições de arrtinoácido não são esperadas para produzir mudanças radXais nas características da proteína, e o efeito de qualquer substituição, exclusão, inserção, ou combinação dos mesmos pode ser avaliado por ensaios de triagem de rotina. Ensaios para quebra de filamento duplo que induz atividade são conhecidos e getalmente medem a atividade e especificidade em geral do agente em sub3trato5 de DNA que contêm sítios de reconhecimento.
9. Em algumas modalidades dos métodos fornecidos no presente documento, urna ou rrtais das nucleases 5 é uma endonuclease. Endonucleases são enzimas que clivam a ligação de fosfodié3ter dentro de uma cadeia de polinucleotídeo, e incluem endonucleases de restrição que clivam DNA como sítios específico3 sem danificar â3 ba3es.
Endonuclea3es de restrição incluem endonucleases de Tipo i, Tipo II, Ti-po III, e Tipo IV, que incluem, adicionalmente, subtipos. Endonucleases de rest:riçào são descritos e classificados adicionalmente, por exemplo, no banco de dados REBASE (página da web em rebase.neb.com; Roberts, et al., (2003) Nucleic Acids Res 31:418 a 20), Roberts, et al., (2003) Nucleic Acids Res 31:1805 a 12, e Belfort, et al., (2002) errt Mohile DNA II, pp. 761 a 783, Eds. Craigie, et al., ASM Press, Washington, D.C.
10. Como usado no presente documento, endonucleases também incluem endonucleases de homing, que semelhante a endonucleases de restrição, se ligam e cortam em uma sequência de reconhecimento e3pecífica. Entretanto, os sitios de reconheci-mento para endonucleases de homing são tipicamente mais longos, por exemp7o, cerca de 18 bp ou mais. Endonucleases de homing, também conhecidas como meganucleases, foram classificadas nas famílias a seguir com base em motivos de sequência ccnservada: uma endonuclease de homing de LAGLIDADG (SEQ ID NO: 50}, uma endonuclease de horning de HNH, uma endonuclease de homing de quadro de His-Cis, uma endonuclease de hoining de GIY-YIG (SEQ ID NO: 51), e uma endonuclease de homing cianobacteriana. Ver, por exemFlo, Stoddard, Quarterly Review of Biophysics 38(11: 49 a 95 (2006). Essas famílias se diferem grandemente ern 3êús motivos de núcleo de sítio ativo de nuclease conservada e mecanismos catalíticos, 5 distribuições biológicas e genômicas, e relação rrtais ampla a sistemas de nuclease de não homing. Ver, por exemplo, Guhan e Muniyappa 12003) Crit Rev Biochem ¥ol Biol 38:199 a 248; Lucas, et al., (20011 Nucleic Acids Res 29:9€0 a 9; jurica e Stoddard, (1999! Cell Mol Life Sci 55:1304 a 26; Stoddard, (2006) Q Rev Biophys 38:49 a 95; e Moure, et al., (2002) Nat Struct Biol 9:764. Exemplos de endonucleases de homing específicas úteis a partir dessas famílias incluem, porém sem limitação: I-Crel (ver, Rochaix et al., Nucieic Acids Res. 13: 975 a 984 (1985), I-MSOI (ver, Lucas et al., Nucieic Acicis Res. 29: 960 a 969 {2001), I-Scel (ver, Foury et al., FEBS Lett. 440: 325 a 331 (1998), I-ScelV (ver, Moran et al., Nucleic Acids Res. 20: 4069 a 4076 (1992), H- Drel {ver, Chevalier et al., l'q()l. Cell 10: 895 a 905 (2002), 1-Hmul {ver, Goodrich-8lair et al., cell 63: 417 a 2Cl 424 (19901: Goodrich-8lair et al., Cell 84: 211 a 221 (1996), I-PpoI (ver, Muscarella et al., Mol. Cell. Biol.
10: 3386 a 3396 (1990), I-Oirl (ver, Johansen et al., Cell 76: 725 a 734 (1994); johansen, Nucleic Acids Res. 21: 4405 (1993}, 1-Njal (ver, Elde et al., Eur. j. Biochem. 259: 281 a 288 (1999); De jonckheere et al., J. Eukaryot. Microbiol.
41: 45"7 a 463 {1994), 1-Nanl (ver, Elde et al., S. Eur. j.
Biochem. 259: 281 a 288 {1999); De jonckheere et al., j.
Eukaryot. Microbiol. 41: 457 a 463 (19941), 1-Nitl (ver, De jonckheere et al., j. Eukaryot. l'licrobiol. 41: 457 a 463 {1994); Elde et al., Eur. J. Biochem. 259: 281 a 288
(1999), 1-Tevl (ver, Chu et al., Cell 45: 157 a 166 (1986}, 1-Tevll (ver, Tomaschewski- et al., Nucleic Acids Res. 15: 3632 a 3633 (1987), I-TevIII {ver, Eddy et al., Genes Dev.
5: 1032 a 1041 {1991), F-Tevl {ver, Fujisawa et al., 5 Nucleic Acids Res. 13: 7473 a 7481 (1985), F-Tevll (ver, Kadyrov et al., Dokl. Biochem. 339: 145 a 147 (1994); Kaliman, Nucleic Acids Res. 18: 4277 (1990), F-Cphl (see, Zeng et al., Curr. Biol. 19: 218 a 222 (2009}, P1-Mgal {ver, Saves et al., Nucleic Aci-ds Res. 29:4310 a 4318 {2001), I-Cs:ml {ver, Colleaux et al., Mol. Gen. Genet.
223:288 a 296 {1990}, I-Ceul {ver, Turmel et al., j.Xol.
Biol. 218: 293 a 311 (1991) e PI-Scel (ver, Hirata et al.,.j. Biol. Chem. 265: 6726 a 6733 (1990).
11. Em algumas rnodaiidades dos métodos descritos no presente documento, uma variação que Qcorre naturalrriente, e/ou derivada modelada de um endonuclease de homtng é usada. Métodos para modificar as cinéticas, interações de cofator, expressào, condições Ótimas, e/ou especificidade de síticj de reconhecimento, e triagem para atividade são conhecidos. Ver, por exemplo, Epinat, et al., {2003) Nucleic Acids Res 31:2952 a 62; Chevalier, et al., (2002) Ebl Cell 10:895 a 905; Gimble, et al., (2003) !4O1 Biol 334:993 a 7008; Sel-Lgman, et al., (2002) Nucleic Acids Res 30:3870 a 9; Sussman, et al., (2004) J Mol Biol 342:31 a 41; Rosen, et al., {2006) Nucleic Acids Res 34:4791 a 800; Chames, et al., {2005) Nucleic Acids Res 33:el78; Smith, et al., (2006) Nucleic Acids Res 34:e149; Gruen, et al., {2002) Nucleic Acids Res 30:e29; Chen e Zhao, (2005) Nucleic Êcids Res 33:el54; WO2005105989; WO2003078619; WO2006097854; WO2006097853; WO2006Ü97784; e WO2004031346.
Endonucleases de homing úteis também incluerri aquelas descritas em WO04/067736; WO04/Cl67753; WO06/097784; WO06/097853; WO06/097854; WO07/034262; WO07/049095; WO07/049156; WO07/057781; WO07/060495; WO08/152524; 5 WO09/001159; WO09/095742; WO09/095793; WO1O/001189; WO1Q/015899; e WO10/046786.
12. Qualquer endonuclease de homing pode ser usada ccjmo um agente indutor de cfüêbra de filatnento duplo que inclui, porém sem limitação: H-Orel, I-Scel, I-Scell, lO I-Scelll, I-ScelV, I-Scev, I-Scevl, I-SceVll, I-Ceul, I- Ceui!\llP, I-Crel, I-CrepsblP, I-CrepsbllP, I-CrepsbIIIP, I- CrepsblVP, 1-Tlil, I-PpoI, Pi-Pspl, F-Scel, F-Scell, F- Suvl, F-Cphl, F-Tevl, F-Tevll, 1-Amal, I-Zinil, I-Chul, I- Cmoel, I-Cpal, I-Cpalí, I-Csml, I-Cvul, I-CvuAIP, I-Odil, I-DcI1II, I-Oirl, I-Omol, 1-Hmul, 1-HmuII, I-HSNIP, 1-Llal, I-MSOI, 1-Naal, 1-Nanl, I-NCIIP, 1-NgrlP, 1-Nitl, 1-Njal, I-Nsp236IP, I-Pakl, I-PbolP, I-PculP, I-PcuAI, I-PcuVí, I- PgrlP, I-PoblP, I-Porl, I-PorllP, I-PbplP, I-Sp8etalP, I- Scal, I-SexlP, I-SnelP, I-Spoml, I-SpomCP, I-SporrtlP, 1- SpomllP, I-SqulP, I-Ssp68031, I-Sthphijp, I-SthPhiST3P, I- SthPhiSTe3bP, 1-TdelP, 1-Tevl, 1-Tevll, I-TevIII, I-ljarAP, I-UarHGPAIP, I-ljarHGPA13E', I-VtnlP, I-Zbilp, P1-Mgal, PI- Mtul, PI-MtuHTP Pl-MtuHTTP, Pl-Pful, PIPfull, PI-PKoL, PJ- Pkoll, P1-Rma43812lP, P1-SpBetalP, PI-Scel, P1-Tful, PI- Tfull, P1-Thyl, PI-TlLI, ou PI-TI1.II, ou qualquer variação c)ü derivado dos mesrrios.
13. Em algumas modalidades, a endonuclease liga uma sequência de reconhecimento endógena ou nativa. Em outras modalidades, a endonuclease é uma endonuclease modificada que liga uma sequência de reconhecirriento não nativa ou exógena e não liga uma sequência de reconhecimento endógena ou nativa.
14. Em algumas modalidades dos rnétodos fornecídos no presente documento, uma ou mais das nucleases 5 é uma proteína de fusão de nuclease de domínio que liga DNA de efetor tipo TAL (TALEN). Efetores tipo TAL de bactérias patogênicas de planta no gênero Xanthcnonas desempenho um papel importante em doenças, ou acionam defesa, ligando-se DNA hospedeiro e ativando-se gene3 hospedeiros específicos de efetor. Ver, por exemplo, Gu et al. (2005) Nature 435:1122 a 5; Yang et al., {2006} Proc. Natl. Acad. Sci.
USA 103:10503 a 8; Kay et al., (2007) Science 318:648 a 51; Sugio et al., (20071 Proc. Natl. Acad. Sci. USA 104:10720 a 5; Romer et al., {2007) Science 318:645 a 8; Boch et al., (2009} Science 326{5959):1509 a 12; e Moscou e Bogdanove, (2009) 326(5959):1501. Um efetor tipo TAL cornpreende um dorrtínio de ligação de DNA que i-nterage com DNA em uma maneira específica de sequência através de um ou mais domínios de repetiçào em liriha. A sequência repetida tipicamente compreende 34 aminoácidos, e as repetições são tipicamente 91 a 100% homólogas entre si. Polimorfismo das repetições é normalmente localízado nas posições 12 e 13, e parece ter iima correspondência de um a um entre a identidade de resíduo duplo variável por repetições errí posições 12 e 13 com a identidade dos nucleotídeos contíguos na 3equência alvo de efetor tipo TAL.
15. O dornínio de ligação de DNA de efetor tipo TAL pode ser modelado para se ligar a urria sequência alvo desejada, e funciido em um domíni-o de nuclease, por exemplo, a partir de uma endonuclease de restrição tipo II,
tipicamente urn dominio de clivagem não específi-co a partir de urna endonuclease de restrição tipo II tal como Fokl {ver, por exemplo, Kim et al. {1996) Proc. Natl. Rcad. Sci.
USA 93:1156 a 1160). Outras endonucleases úteis podem 5 incluir, por exemplo, Hhal, Hincilll, Nod, BbvCl, ECORI, Bgll, e Alwl. Assim, ern modalidades preferidas, a TALEN compreende um domínio de efetor tipo TAL que compreende uma piuralidade de sequências de repetição de efetor tipo TAL que, em combinação, se ligam a uma sequência de nucleotídeo especifica na sequência de DNA alvo, de tal modo que o TALEN clive o DNA alvo dentro de ou adjacente à sequência de nucleotideo específica. TALENS úteis para os métodos fornecidos no presente documento -Lncluem aqueles descritos em WQ1O/079430 e Publ:i-cação de E'edido de Patente n°. U.S.
2011/0145940.
16. Em algurrtas raodalidades, o domínio de efetor tipo TAL que se l:i-ga a um sequência de nucleotídeo específica dentro do DNA alvo pode compreender 10 ou mais repetíções de ligação de DNA, e preferi-velmente 15 ou maís repetições de ligação de DNA. Em algumas modalidades, cada repetição de ligação de DNA compreende um resíduo duplo variável por repetição (RVD) que determi-na reconheci-mento de um par base na sequência de DNA allvo, ern qne cada repetição de ligação de DNA é respomável por reconhecer um par base na sequência de DNA alvo, e em que c) RVD compreende um ou mais de: HD para reconhecer C; NG para reconhecer T; NI para reconhecer IjM; NN para reconhecer G ou UM; NS para reconhecer UM ou C ou G ou T; N* para reconhecer C ou T, em que * representa uma lacuna na segunda posi-ção do RVD; HG para reconhecer T; H" para reconhecer T, errt que * represent:a urria lacuna na segunda posição do RVD; IG para reconhecer T; NK para reconhecer g; HA para reconhecer C; ND para reconhecer C; HI para reconhecer C; HN para reconhecer g; NA para reconhecer g; 5 SN para reconhecer G ou UM; e YG para reconhecer T.
17. Em algumas modalidades dos métodos fornecidos no presente documento, uma ou mais das nucleases é uma recoinbinase específica de sítio. Uma recombinase especifica de CUtiO, também referi-da como uma recombinase, lO é urri polipeptídeo que catalisa recombinação específica de sítio conservador entre seus sitios de recombinação corrípatíveis, e inclui polipeptídeos nativos assim corrto derivados, varíações e/ou fragmentos que retêm atividade, e polinucleotídeos nativos, derivados, variações, e/ou fragmentos que codificam uma recombi-nase que retém atividade. Para revisões de recombínases específicas de sitio e seus sítios de reconhecirnento, ver, Sauer {1994) Curr Op Biotechnol 5:521 a 7; e Sadowski, (1993) FASEB 7:760 a 7. Em algumas modalidades, a reccmbinase é uma serina recanbinase ou uma tirosina recombinase. Em algumas modalidades, a recombinase é das famílias Integrase ou Resolvase. Eru algurrtas modalidades, a recombinase é uma í-nteqrase scLecionada a parti r do qrnpo que consiste em FLP, Cre, lambda integrase, e R. Para outros membros da farnília Integrase, ver, por exemplo, Esposito, et al., (1997) Nucleic Acids Res 25:3605 a 14 e Abremski, et al., (1992) Protein Eng 5:87 a 91. Métodos para modificar as cinétj-cas, exigências e interação de cofator, expressão, condições ótimas, e/ou especificidade de sítio de reconhecímento, e triagem para ativí-dade de recornbinases e variações são conheci-dos, ver, pol exemplo, Miller, et al., (1980) Cell 20:721 a 9; Lange-Gustafson e Nash, (1984) J Biol Chem 259:12724 a 32; Christ, et al., (1998) j ¥ol Biol 288:825 a 36; Lorbach, et al., (2000} j L4O1 Biol 296:1175 a 5 81; Vergunst, et al., (2000) Science 290:979 a 82; Dorgai, et al., (1995) J Mól Biol 252:178 a 88; Dorgai, et al., (1998) j Mol Biol 277:1059 a 70; Yagu, et al., {1995) j Mol Biol 252:163 a 7; Sclimente, et al., {2001) Nucleic Acids Res 29:5044 a 51; Santoro e Schultze, (2002) Proc Natl Acad Sci USA 99:4185 a 90; Buchholz e Stewart, {2001} Nat Biotechnol 19:1047 a 52; Voziyanov, et al., (2002) Nucleic Acids Res 30:1656 a 63; Voziyanov, et al., (2003) j Mol Biol 326:65 a 76; Klippel, et al., (1988) E/4BO j 7:3983 a 9; Arnold, et al., (1999) EIVBO j 18:1407 a 14; WO03/08045; WO99/25840; e WO99/25841. Os sítios de reconhecimento vari-arn de cerca de 30 sítios rüínimos de nucleotídeo para poucas centeaas de nucleotideos. Qualquer sítio de reconhecimento para uma recorríbinase pode ser usado, que inclui que ocorrem naturalrnente sítios, e variações. Sítios de reconhecimento de variação são conheci-dos, ver, por exemplo, Hoess, et al., (1986) Nucleic Acids Res 14:2287 a 300; Albert, et al., {1995) Plant j 7:649 a 59; Thornson, et al., (20Cl3) Genesis 36:762 a 7; Huang, et al., (1991) Nucleic Acids Res 19:443 a 8; Siebler e Bode, (1997) Biochemistry 36:1740 a 7; Schlake e Bode, (1994) Biochemistry 33:12746 a 51; Thygarajan, et al., (2001) lVbl Cell Biol 21:3926 a 34; Umlauf e Cox, {1988) EYBC) j 7:1845 a 52; Lee e Saito, (1998) Gene 216:55 a 65; WOO1/23545; WO99/25821; WO99/25851; WOC)1/11058; WOO1/07572 e Pat. n°.
U.S. 5.888.732.
18. Em algumas modalídades dos métodos fornecidos no presente documento, um ou mais das nuclea3es em um transposase. Transposases são polipeptídeos que rnediam transportação de um trar.sposon a partir de uma 5 localização no genoma para outro. Transpo3ases tipicamente induzem quebras de fi-lamento duplo para excisar o transposon, reconhecem repetições de subterminal, e juntam as extremidades do transposon excí-sado, em alguns sistemas, outras proteínas também são em-gidas para juntar as lC) extremidades durante transposição. Exemplos de transposons e transposases incluem, porérrt serrt limitação, os elementos de AC/DS, Dt/rdt, Mu-Ml/Mn, e Spm{En)/dSpm de maís, os elementos de Tain de boca-cle-lobo, o transposon Plu de bacteriófago, transposons bacterianos (Tn) e sequências de inserção (IS), elementos de Ty de levedura (retrotransposon), elementos de Tal de Arabidopsis {retrotransposon), o transposon de elemento P de Drosophila (Gloor, et al., {1991} Science 253:1110 a 1117), a Copia, elementos Maríner e Minos de Drosophila, os elementos Hermes da mosca doméstica, os elementos Piggy8ack de Trichplusia ni, elementos Tcl de C. elegans, e elementos IAP de camundongos {retrotransposon).
19. Em algumas modalidades dos métodos fornecidos no presente documento, um ou mais3 das nucleases é uma nuclease de dedo de zinco (ZFN}. ZFN3 são agentes indutores de quebra de fi-lamento duplo rnodelados que compreendem um domínio de ligação de DNA de dedo de zinco e urrí domínio de agente indutor de quebra de filamento duplo.
ZFNs modelados consistem em duas matrizes de dedo de zinco (ZFAS), cada uina das quais é fundida em uma subunidade única de uma endonuclease não específica, tal como o domínio de nuclease da enzima Fokl, que se torna ativo rnediante a dimerização. Tipicamente, um ZFA único consiste em 3 ou 4 dominios de dedo de zinco, cada um dos quais é 5 projetado para reconhecer um trj-o de nucleotídeo específico (GGC, GAT, etc.). Assim, ZFNS compostos de doi3 ZFAS "de 3 dedos" sÊio capazes de reconhecer um sítio alvo de 18 pares bases; uma sequência de reconhecimento cie 18 pares bases é geralwente úni-ca, mesmo dentro de genomas grandes tais como aqueles de humanos e pLantas. Pelo di-recionamento da colocalização e dimerização de dois monômeros de Fokl nuclease, ZFNS geram uina endonuclease específica de sítio funcional que cria uma quebra de filamento duplo {DSB) em DNA no local directonado.
20. Nucleases de dedo de zinco úteis incluem aqueles que são conhecidos e aqueles que são proíetadDs para ter especificidade para um ou rrtais sítíos alvos (TS) descritos no presente documento. Dorninios de dedo de zinco sÊio responsávei-s por projetar polipeptídeos que li-gam especifícarnente uma sequêncía de reconhecimento de polinucleotídeo selecionada, por exemplo, dentro do sítio alvo do genoma de célula hospedeira. ZFNs consistem em um domínLo de dedo de zinco de ligação de DNA modelado ligado a um domínio de endonuclease não específico, por exeniplo, domínio de nuclease a partir de uma endonuclease Tipo IIs tal como HO ou Fokl. Alternativarnente, domínios de ligação de DNA de dedo de zinco ínodelados podem ser fundidos a outros agentes indutores de quebra de filamento duplo ou derivados dos mesmos que retêm atividade de entalhe/clivagem de DNA. Por exemplo, esse tipo de fusão pode ser usaclo para direcionar o agente indutor de quebra de fiíamento duplo a um sítio alvo diferente, para alterar a localização do sitio de entalhe ou clivagerri, para direcLc)nar d agente indutor a um sitio alvo mais curto, ou 5 para direcionar o agente indutor a um sítio alvo mais longo. Em alguns exerrtplos, um dom.ínio de ligação de DNA de dedo de zinco é fundido em uma recombinase especifica de sítio, tran5posa3e, ou um derivado dos mêsIÍlo3 que retêm atividade de entalhe e/ou clivagem de DNA. Funcionalidades IO adicionais podem ser fundidas no domínio de ligação de dedo de zinco, que inclui domínios ativadores transcricionais, domíni-os repressores de transcrição, e metilases. Ein algumas modalidades, dimerização de domínio de nuclease é exigida para ativi-dade de clivagem.
21. Cada dedo de zinco reconhece três pares bases consecutivos no DNA alvo. Por exemplo, uín domínio de 3 dedos reconheceu urria sequência de 9 nucleotideos contíguos, com uma exigência de dimerização da nuclease, dois conjuntos de trios de dedo de zj-nco são usados para ligar uma sequência de reconhecirríento de 18 nucleotídeos.
Módulos de dedo de zinco modeladores úteis incluem aqueles que reconhecem vários trios de GNN e ANN (Dreier, et al., (2001) J Biol Chérn 276:29466 a 78; Dreier, et al., (2000) j Yol Biol 303:489 a 5C)2; Liu, et al., (2002) J Biol Chem 277:3850 a 6), assim como aqueles que reconhecem vários trios de CNN ou TNN {Drei-er, et ãl., (2005} j Biol Chem 280:35588 a 97; jamieson, et al., (2003) Nature Rev Drug Discov 2:361 a 8). Ver tarrtbém, Durai, et al., (2005) Nucleic Acids Res 33:5978 a 90; Segal, (2002) Methods 26:76 a 83; Porteus e Carroll, {2005) Nat Biotechnol 23:967 a 73;
Pabo, et al., (2001) Ann Rev Biochem 70:313 a 40; Wolfe, et al., (2000) Ènn Rev Biophys Bioinol Struct 29:183 a 212; Segal e Barbas, (2001} Curr Opin Biotechnol 12:632 a 7; Segal, et al., (2003) Biochemistry 42:2137 a 48; Beerli e 5 Barbas, (2002) Nat Biotechnol 20:135 a 41; Carroll, et al., (2006) Nature Protocols 1:1329; C'rdiz, et al., {2002) Proc Natl Acad Sci USA 99:13290 a 5; Guan, et al., (2002) Proc Natl Acad Sci USA 99:13296 a 301; WO2002099084; WOO0/42219; WO02/42459; WO2003062455; US20030C)59767; Publi-cação de PedLdo de Patente número US 2003/0108880; Pat. n"'. U.S.
6.140.466, 6.511.808 e 6.453.242. Nucleases de dedo de zinco úteis também incluem aquelas descritas em WO03/080809; WO05/014791; WO05/084190; WO08/021207; WQ09/042186; WO09/054985; e WO10/065123.
6.5 Sítíos AIvos GenÔmícos
22. Nos métodos fornecidos no presente documento, uraa nuclease é introduzida na célula hospedeira, que é capaz de causar uma quebra de filamento duplo prÓxima ou dentro de um sítio alvo genômico, que aurrienta 2C) grandemente a frequência de recombinação hornÓloga em ou próximo do sítio de clivagem. Em modali-dades preferidas, a sequência de reconhecimento para a nuclease está presente no genoma de célnla hospedeira somente no sítio ãivcj, que minimiza, desse modo, qualquer clivagem e ligação genômica fora de alvo pela nuclease.
23. Em algumas modalidades, o sítio alvo genôrnico é endógeno à célula hospedeira, tal como um local nativo. Em algumas modalidades, o sítio alvo genômico nativo é selecí-onado de acordo corrt o tipo de nuclease a ser utilizado nos métodos de integração fornecidos no presente documento. Se a nuclease a ser utilizada é urna nuclease de dedo de zínco, sitios âivcg ótimos podem ser selecionados com o uso de um número de rec'iírsos online disponíveis publicamente. Ver, por exemplo, Reyon et al., BYC Genomics 5 12:83 {2011), que é incorporado pelo presente documento por referêncía em sua totalidade. Por exemplo, Modelagerrt de Acúmulo Oligorrterizado {Oligomerized Pool Engineering) (OPEN) é um protocolo disponivel publicamente e altamente robusto para modelar matrize3 de dedo de zinco com especificidade alta e funcionalidade ín vívo, e foi usado com sucesso para gerar ZFNS que funcionam eficientemente em planta:si, peixe zebra, e células-tronco pluripotentes e sornáticas humanas. OPEN é um rríétodo com base em seleção em que urrt aglomerado em aleatório pré-construído de ZFAS candidatos é submetido a triagem parà identificar aqueles com alta afinidade e especificidade para urría sequência alvo desejada. ZFNGenorne é uma ferrarrtenta com base em GBrowse para identificar e visualizar sítios alvos em potencial para ZFNs gerados por OPEN. ZFNGenome fornece um corrtpêndio de sítios alvos de ZFN em potencial errt genomas sequenciados e anotados de organismos modelos. ZFNGenome atualmente inclui um total de mais que 11,6 milhões de sítios alvos de ZFN em potencuíl, mapeados dentro dos genomas inteiramente sequenciados de sete organismos modelos; S. cerevisiae, C.
reinhardtii, A. thaliana, D. melanogaster, D. rerio, C.
elegans, e H. sapiens. Organismos modelos adicionais, que incluem três espécies de planta; GIycíne max {feijão-soja), Ozyza satíva {arroz), Zea mays (inaís), e três especíes de animal; Tribolixun castaneum (besouro castanho), Mús muscuíus (camundongo), Rattus nor"vegicus (rato-marrom)
serão adicionados no futuro prÓximo. ZFNGenome fornece inforrrtações sobre cada sítio alvo de ZFN em potencial, que inclui sua localização cromossômica e posição em relação a :sítio(s:) de iniciação de tramcrição. Usuários podem 5 questionar ZFNGenome com o usc: de diversos critérios diferentes (por exerrtplo, ID de gene, ID de transcrição, sítio alvo sequência).
24. Se a nuclease a ser utilizada é uma nuclease de efetor tipo TAL, em alguma3 modali-dades, sítios alvos lO ótimos podem ser selecionados de acordo com os métodos descritos por Sanjana et al., Nature Protocols, 7:171 a 192 {2012), que é incorporado pelo presente documento por referêncía em sua totalidade. Errt suma, TALENS funcionam como dimeros, e um par de TALENS, referido coruo os TALEN3 de esquerda e direita, sequências alvo em filamentos opostos de DNA. TALENS sãci modeZados como uma fusão do Domínio de ligação de DNA de TALE e um domínio catalítico de Fokl monomérico. Para facilitar dimerização de Fokl, os sítios alvos de TALEN de esquerda e direita são escolhidos com um distanciação de aproximadamente 14 a 20 bases.
E'ortanto, para um par de TALENs, sendo que cada se direciona a sequências de 20-bp, um sítio alvo Ótimo precisa ter a forma 5"TNlyNµl70NlgA-3', em qne ç} TALEN de esquerda se direciona a 5'-TN'9-3' e o TALEN de direita se direciona a filamento de antissenso de 5'-Nl9A-3' {N - UM, G, T ou C).
25. Em outras modalidades dos métodos fornecidos no presente documento, o sítio alvo genômico é exógeno à célula hospedeira. Por exemplo, um ou mais síti-os alvos genômicos podem ser modelados no genorna de célula hospedeira com o üsc) de métodos trad:i-cionais, por exemplo,
dírecionamento de gene, antes de realizar os métodos de integração descritos no presente documento.
Em algumas modalidades, múltiplas cópias da mesma sequência alvo são
5 modeladas no genoma de célula hospedeira em locais diferentes, que facilita, desse modo, eventos de integração múltiplos siinultâneos com o uso de somente uma única nuclease que reconhece especificamente a sequêncí-a alvo.
Ern outras modalidades, uma pluralidade de diferentes lO sequências alvo é modelada no genoma de célula hospedeira ern locais diferentes.
Em algumas modalídades, o sítio alvo modelado compreende urna sequência alvo que não é representada de outro raodo no genoma nativo da célula hospedeira.
Por exemplo, endonucleases de homing direcionam grandes sítios de reconhecimento {12 a 40 bp) que são normalmente incorporados em íntrons ou inteínas, e como tal, seus SLtios de reconhecimento são extremamente raros,
com nenhum ou somente poucos desses sítios presentes em um genorna de tamanho de mamífero.
Assim, em algumas modalidades, o sítio alvo genôrrtico exógeno é uma sequência de reconhecimento para uma endonuclease de homing.
Em algumas rrtodalidades, a nuclease de hom-ng é selecionada a partir do grupo qne consiste errt: H-Orel, I-Scel, ISceIT,
I-Scel1l, I-ScelV, I-SceV, I-SceVl, I-SceVll, I-Ceul, I-
CeuAIIE?, I-Crel, I-CrepsblP, I-CrepsbllP, I-CrepsbIIIP, I-
CrepsblVP, 1-Tlil, I-PpoI, Pi_-Pspl, F-Scel, F-Scell, F-
Suvl, F-Cphl, F-Tevl, F-TevII, 1-Amal, 1-Anil, I-Chul, I-
Cmoel, I-Cpal, I-Cpall, I-Csml, I-Cvul, I-CvuAIP, I-Odil,
1-Ddill, I-Oirl, I-Omol, 1-Hmul, 1-Hmull, I-HsNIP, 1-Llal,
I-MsOI, 1-Naal, 1-Nanl, I-NCIIP, 1-NgrlP, 1-Nitl, 1-Njal,
I-Nsp236IP, I-Pakl, I-PbolP, I-PculP, I-PcuZll, I-PcuVl, I- E'grlP, I-PoblP, I-Porl, I-PorllP, I-PbplP, I-Sp8etalP, I- Scal, I-SexlP, I-SnelP, I-Sponil, I-SpornCP, I-SpomlP, I- SpomllP, I-SqulP, I-Ssp68031, l-SthphtjP, I-SthPhiST3P, I- 5 SthPhiSTe3bP, 1-TdelP, 1-Tevl, I-TCVII, I-TevIII, I-UarAP, I-UarHGPAIP, I-UarHGPA13P, I-VinlP, I-ZbilP, P1-Mgal, PI- Mtul, PI-MtuHIP PI-MtuHIIP, PI-Pful, PI-Pfull, Pí-Pkol, PI- PKOII, P1-Rma43812lP, PI-Sp8etalP, PI-Scel, P1-Tful, PI- Tfull, P1-Thyl, p1-Tlil, ou PI-TI:LII, c)ü qualquer variação IO ou derivado dos mesmos. Em modalidades em particular, c) 3itio alvo genômico exógeno é a sequênci-a de reconhecimento para I-Scel, VDE (PI-Scel), F-Cphl, P1-Mgal ou P1-Mtull, cada um dos quais são fcrnecidos abaixo.
26. Tábela I: Sítíos de cIivagem e reconheeimento para selecionar endonueleases de homíng.
Nuelease Sequêncía de reconheeimento Li Scel tagggataacagggtaat {seq id no:52) jvDE (pi_ tatgtcgggtgcggagaaagaggtaatg= (seq id no:53) ) Scel) I F-Cphl gatgcacgagcgcaacgctcacaa (seq id no:54) ! P1-Mgal GCGTAGCTGCCCAGTATGAGTCAG (SEQ ID NO:55) acgtgcactacgtagagggtcgcaccgcaccgatctacaa (seq id PI MtnTT l no:56)
6.6 Entrega
27. Em algumas modalidades, as urrta ou mais nucleases úteís para os métodos descrítos no presente documento são fornecidas, por exemplo, entregues para a célula hospedeira como uma proteína purificada. Em outras modalidades, as uma ou mais nucleases são fornecidas por meio de polinucleotídeo(s} que compreendem um ácido nucleico que codifica a nuclease. Em outras modalidades, as um ou mais nucleases são introduzidas na célula hospedeira como RNA purificado que pode ser diretamente transladado no núcleo de célula hospedeira.
28. Em certas modalidades, um polinucleotídeo de integração, um polinucleotídeo que codifica uma nuclease, 5 ou uma proteína de nuclea3e purificada, conforme descrito acima, ou qualquer cornbinação dos me3mo3, pode ser introduzído ern uma célula hospedeLra com o uso de qualquer técnica convencional para introduzír proteína exógena e/ou ácidos nucleicos errí urría célula conhecida na técnica. Tais métodos incluem, porém sem limitação, captação direta da molécula por uma célula de solução, ou captação facilitada através de lipofeccção com c) uso de, por exemplo, lipossomas ou i-munolipossomas; transfecção mediada por partícula; etc. Ver, por exeínplo, Patente n". U.S.
5.272.065; Goeddel et al., eds, 1990, Methods in Enzymology, vol. 185, Academic Press, Inc., CA; Krieger, 1990, Gene Transfer e Expression - A Laboratory ¥anual, Stockton Press, NY; Sarrtbrook et al., 1989, Molecular Cloning -- A Laboratory Hanual, Cold Spring Harbor Laboratory, NY; e Ausubel et al., eds., Edição Atual, Current Protocols in Molecular Biology, Greene Publishing Associates e Wiley Interscience, NY. Método3 particulares para transformar células são bem conhecidos na técnica. Ver Hinnen et al.,Proc. Natl. Acad. Sci. IJSA 75:1292 a 3 {1978); Cregg et al.,Mol. Cell. Biol. 5:33"76 a 3385 {1985).
Técnicas exemplificativas incluem, porérri sem Iirnitaçãc', formação de esferoplasto (spheroplasting), eletroporação, transformação mediada por PEG 1000, e transforrrtaçáo mediada por cloreto de lítio ou acetato de lítio.
29. Em algumas modaltciades, biobalísticas são utilizados para introduzir 'jrrt polinucleotídeo de integração, um polinucleotídeo que codifica um nuclease, uma proteína de nuclease purificada, ou qualquer combínação 5 dos me3mos na célula hospedeira, em particular, células hospedeiras que são, de outro rrtodo, difíceís de transformar/transfectar com d uso de técnicas convencionais, tal como plantas. Biobalísticas funcionam lígando-se a reação de transforma;ão em partículas de ouro microscópicas, e, então, irrlpul3ionar as particulas com o uso de gás ccmprimido nas células alvo.
30. Ern algumas modalidades, o polinucleotideo que compreende ácido nucleico que codifica a nuclea3e é um vetor de expressão que permite a expressão de uma nuclease dentro de uma célula hospedeira. Vetores de expressão adequados inciuem, porém sem limitação, aqueles conhecidos por uso em expressar genes em Escherichia coli, levedura, ou células de mamífeto. Exemplos cíe vetores de expressão de Escherichia coli incluem, porérrt sem Limitação, pSCM525, pDIC73, pSCM351, e pSCM353. Exemplos de vetores de expressão de levedura incluem, porém sem limitação, pPEX7 e pPEX408. Outros exemplos de vetores de expressào adequados incluem a série pRS de levedura-Escherichia coli de vetores de transporte que cornpreendern sequências de CEN.ARS e marcadores selecionáveis de levedura; e 2µ de plasmidios.
Em algumas modalidades, um polinucleotídeo que codifica uma nuclease pode ser modificado para substi-tuir códons que têm uma frequência maior de uso na célula hospedeira, como comparado à sequência de polinucleotídeo que ocorre naturalmente. Por exemplo, o polinucleotídeo que codifica a nuclease pode ser modificado para substituir códons que têm uma frequênc a maior de uso em S. cerevisiae, coiüo comparado Èl sequência de poltnucleotídeo que ocorre naturalmente.
5 31. Em algumas modalidades em que a nuclease funciona como uin heterodímero que exi-ge a expressão separada de cada monômero, como é o caso para nucleases de dedo de zinco e nucleases cle efetor tipo TAL, cada rrtonômero do heterodimero pode ser expresso a partir do mesmo plasmídeo de expressão, ou de plasmídeos diferentes. Ern rnodalidades em que rrtúltiplas nucleases 3Êio introduzídas à célula para efetuar quebras de filamento duplo em sítios alvos diferentes, as nucleases podem ser codificadas em um único plasmídeo ou em plasmídeos separados.
Em certas rnodalidades, a nuclease vetor de expressáo compreende adicionalmente urrt rnarcador selecionável que permite seleção de células hospedeiras que compreendem o vetor de expressão. Tal seleção pode ser útil para reter o vetor na célula hospedeira por um período de tempo nece3sário para expressão de quantidades suficientes de nuclea3e ocorrer, por exemplo, para um período de 12, 24, 36, 48, 60, 72, 84, 96, ou mais que 96 horas, apÓs o qual as células hospedeiras podem ser proliter-adas sob condições sob as quais c) vetor de expressão não é mais retido. Em certas modalidades, o rnarcador selecionável é selecionado a partir do grupo que consiste em: URA3, higromicina B fosfotransferase, arninoglicosídeo fosfotransferase, resistência a zeocina, e fosfinotricina N-acetiltransferase. Em algumas modalidades, q vetor de vetor de expressão de nuclease pode compreender urrí marcador contrasselecionável que permite seleção de células hospedei-ras que não contêrrt o vetor de expressão subsequente a integração das uma ou mais rnoléculas de ácido nucleico doadoras. O vetor de expresMio de nuclease usado tambérn 5 pode ser urrt vetor transitório que não tem marcador de seleção, ou é um que não é selecionado para. Em modalidades em particular, a progênie de uma célula hospedeira que compreende um vetor de expressão de nuclease transitória perde o vetor ao longo do tempo.
Ern determinadas modalidades, o vetor de expressão compreende adicionalmente uma sequência de terminaçào de transcrição e um proinotor ligado de ruodo operacional à sequência de nucleotídeos que codifica a nuclease. Em algumas modalidades, o prornotor é um promotor constitutivo.
Em algurrias modalidades, o promotor é um promotor induzível.
Exemplos ilustrativos de promotores adequados para uso em células de levedura incluem, rrtas serrt 3ê limitar, o promotor do gene TEFI de K. lactis, o promotor do gene PGKl de Saccharomyces cerevisiae, o promotor do gene TDH3 de Saccharomyces cerevisiae, promotores reprinííveis, por exernplo, o promotor do gene CTR3 de Saccharomyces cerevisiae, e promotores induzíveis, por exemplo, promotoru induzívets de galactose de Saccharomyces cerevisiae (por exemplo, promotores do genes GALI, GAL7 e GALIO).
Em algumas modalidades, uma sequência de nucleotídeos adici-onal que compreende uma sequência de localização nuclear Inls) é ligada à 5' da sequência de nucleotídeos que codifí-ca a nuclease. A NLS pode facilitar a localização nuclear de nucleases maiores (>25 ko). Ern algumas rnodalidades, a sequência de localização nuclear é uma sequência de localização nuc-lear de SV40. Em algurnas modalidades, a sequência de localização nuclear é uma sequência de localização nuclear de levedura.
5 Um vetor de expressão de nuclease pode ser criado através de qualquer conjunto de procedimentos evidente a um indivíduo versado na técnica. Em determinadas modalidades, o vetor é crí-ado com o uso de uma reação em cadeia da polimerase {PCR) e conjuntos de procedimentos de clonagem lO molecular bern conhecidos na técnica. Consulte, por exemplo, PCR Technology: Principles and Applications for DNA Amplification, editora HA Erlich, Stockton E'ress, Nova Iorque, N.Y. {1989): Sambrook et al., 2001, Molecular Cloning - A Laboratory Manual, 3' edição, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY.
6.7 Células Hospedeiras Em outro aspecto, é fornecida no presente documento uma célula hospedeira modificada gerada através de qualquer urn dos métodos de integração genôrnica de um ou mais ácidos nucleicos exógenos descritos no presente documento. Células hospedei-ras aciequadas incluem qualquer célula na qual a integraçào de um ácído nucleico ou "DNA de doador" de interesse em um local epíssômico ou cromossômico é desejada. Em algumas modalidades, a célula é uma célula de urn organisrno que tem a habilidade cle realizar recombinação homÓloga. Embora várias das modalidades ilustrativas sejam demonstradas em levedura (S- cerevisiae), acredi-ta-se que os métodos de modificação genômica fornecidos no presente docurrtento podem ser praticados em todos qs organismos biológicos que têm urn sistema de recombinação funcional, até mesrno em que o sistema de recombinação não é tão proficiente como na levedura. Outras células ou tipos de célula que têm sistemas de recombinação homóloga funcional incluem 5 bactérias tais como Bacillus subtilis e E. coli (que é uma recombinação de RecE RecT proficiente; Muyrers et al., EMBO rep. 1: 239 a 243, 2000); protozoário (por exemplo, Plasmodium, Toxoplasma}; outra levedura (por exemplo, Schizosaccharomyces pombe); fungos fi-lamentosos (por exerrtplo, Ashbya gossypii); plantas, poe exemplo c) rnusgo Physcomitrella patens {Schaefer and Zryd, Piant j. 11:
1.195 a 1.206, 1997); e células anirnais, tais como células de rnaníífero e céluias DT40 de fra.ngo (Dieken et al., Nat.
Genet. 12:174 a 182, 1996).
Em algumas modalidades, a célula hospedeira é urria célula procariótica. Em algumas modalidades, a célula hospedeira é uma célula eucariótica. Em algumas modalidades, a célula é uma célula fúngica (por exemplo, uma célula de levedural, uma célula de bactérias, uma célula vegetal ou uma célula animal (por ezemplo, uma célula de frango). Errt algumas modalidades, a célula hospedeira é uma célula de mamífero. Em algurrias modaiidades, a célula hospedei r-a é uiua célula de ovário de hamster chinês (CHO), urria célula COS-7, um célula de fibroblasto de camundongo, uma célula de carcinoma embrionária de camundongo, ou uma célula tronco embrionária de camundongo. Em algumas modalidades, a célula hospedeira é uma célula de inseto. Em algurnas modalidades, a célula hospedeira é uma célula S2, uma célula Schneider, uma célula Sl2, uma célula 5B1-4, uma célula Tn5 ou urna célula
Sf9. Em algumas modalidades, a célula hospedeira é uma célula eucariótica de organismo unicelular.
Em rnodalidades parti-culares, a célula hospedeira é urna célula de levedura. Células hospedeiras de levedura 5 úteis incluem células de levedura que forarrt depositadas com depósitos de microrganismo (por exemplo IFO, ATCC, etc.} e pertencem acs gêneros Aciculoconidium, Ambrosiozyma, Arthroascus, Arxiozyma, Ashbya, Babjevia, Bensingtonia, Botryoascus, Botryozyma, Brettanomyces, Bullera, Bulleromyces, Candida, Citeromyces, Clavispora, Cryptococcus, Cystofilobasidium, Debaryomyces, Dekkara, Dipodascopsis, Dipodascus, Eeniella, Endomycopsella, Eremascus, Eremothecium, Erythrobasidium, Fellomyces, Filobasidium, Galactomyces, Geotrichum, Guilliermondella, Hanseniaspora, Hansenula, Hasegawaea, Holtermannia, Hormoascus, Hyphopichia, Issatchenkia, Kloeckera, Kloeckeraspora, Kluyveromyces, Kondoa, Kuraishia, Kurtzmanomyces, Leucosporidium, Lipoinyces, Lodderomyces, Malassezia, Èletschnikowia, Mrak:ia, Wyxozyma, Nadsonia, Nakazawaea, Nematospora, Ogataea, Oosporidium, Pachysolen, Phachytichospora, Phaffia, Pichia, Rhodosporidium, Rhodotorula, Saccharomyces, Saccharoinycodes, Saccharomycopsis, Saitoejla, Sakaquchia, Saturnospora, Schizohlastosporion, Schizosaccharomyces, Schwanniomyces, Sporidiabolus, Sporobolomyces, Sporopachydermia, Stephanoascus, Sterigmatomyces, Sterigmatosporidium, Symbiotaphrina, Syinpodiomyces, Sympodiomycopsis, Torulaspora, Trichosporiella, Trichosporon, Trigonopsis, Tsuchiyaea, Udeniomyces, Waltomyces, Wickerhamia, Wickerhamiella, Williopsis, Yaínadazyma, Yarrowia,
Zygoascus, Zygosaccharomyces, Zygomilliopsis e Zygozyma, dentre outros.
Em algumas modalidades, a célula hospedeira de levedura é uma célula de Saccharomyces cerevisiae, uma 5 célula de Pichia pastoris, urna célula de Schizosaccharomyces pombe, uma célula de Dekkera bruxellensis, uma célula de Kluyveromyces lactis, uma célula de Arxula acieninivorans, ou uma célula de Hansenula polymorpha (agora conhecida como Pichia angusta}. Em uma modalidade particular, a célula hospedeira de levedura é uma célula de Saccharomyces cerevisiae. Em algumas rnodalidades, a célula hospedeira de levedura é uma célula de Saccharomyces fragilis ou uma célula de Kluyveromyces lactis (anteriormente chamada de .Saccharomyces lactis). Ern algurnas modalidades, a célula hospedeira de levedura é uma célula que perteríce ao gênero Candida, tal como Candida lipolytica, Candida guilliermondii, Candida krusei, Candida pseudotropicaíis ou Candicia utilis. Em outra rnodalidade partícular, a célula hospedeira de levedura é uma célula de Kluveromyces marxianus.
Em modalidades particulares, a célula hospedeira de levedura é uma célula ."accharomyces cerevisiae selecionada a partir do grupo que consiste em uma célula de levedura de padeiro, uma célula CBS 7959, uma célula CBS 7960, uma célula CBS 7961, uma célula CBS 7962, uma célula CBS 7963, uma célula CBS 7964, uma célula IZ-1904, urrta célula TA, urrta célula BG-l, uma célula CR-l, uma célula SA- l, uma célula M-26, uma célula Y-904, uma célula PE-2, uma célula E'E-5, uma célula VR-l, uma célula BR-I, urrta célula BR-2, urna célula ME-2, uma célula VR-2, urna célula MA-3,
urría célula MA-4, uma célula CAT-I, uma célula CB-l, uírta célula NR-I, uma célula BT-I e urna célula AL-1. Erri algumas modalidades, a célula hospedeira é uma célula de Saccharomyces cerevisiae selecíonada a partir do grupo que 5 consiste em uma célula PE-2, umâ célula CAT-I, urna célula VR-l, umà célula BG-l, uma célula CR-l e uma célula SA-l.
Em uma modalidade particular, a célula hospedeira de Saccharomyces cerevisiae é uma célula PE-2. Em outra modalidade particular, a célula hospedeira de Saccharomyces cerevisiâe é uina célula CAT-I. Em outra modalidade particular, a célula hospedeira de Sâccharomyces cerevisiae é uma célula BG-l.
Em algumas modalidades, a célula hospedeira de levedura é uma célula que é adequada para fermentação industrial, por exernplo, fermentação de bioetanol. Em modalidades particulares, a célcla é condicionada para subsistir sob alta concentração de solvente, alta ternperatura, utilização de substrato expandida, limitação de nutriente, obrigação de estresse osmótico, acidez, contaminação bacteriana e por sulfito, ou combinações dos rnesmos, as quais são condições de estresse reconhecidas do ambiente de fermentação industrial.
6-8 Kíts Em outro aspecto, é fornecido no presente documento um kit úti-l para desempenhar os métodos de integração genômica de um ou mais ácidos nucleicos exógenos descritos no presente documento. Em algurnas modalidades, o kit compreende: (a) uma pluralidade de ácidos nucleicos exógenos, sendo que cada ácido nucleico exógeno (ES)x compreende:
(i} uma primeira região de homologia (HR1)x e uma segunda regzào de homologia (HR2Ú, sendo que (HRIÁ e (HR2Á são capazes de iniciar uma recombinação homóloga mediada por céluía hospedeira de (ES},, em um 3ítío alvo 5 selecionado (TS), de urn genoma de célula hospedei-ra; e {ii) um ácido nucleico de interesse {D),, posicionado em 3' de (HRII., e 5' de (HR2Á: (b} uma pluralidade de nucleases, sendo que cada nuclease (NÁ é capaz de clivagem em (TSÁ,, em que a dita clivagem resulta na recombinação homóloga de (ES)x em {TSÁ: sendo que x é quaíquer número inteiro de 1 a n sendo que n é pelo menos 2.
Em algumas modalLdade3, (DÁ é selecionado a partir do grupo que consiste em um raarcador selecionável, um prornotor, um sequência de ácido nucleico que codifica um etiqueta de epítopo, um gene de interesse, um gene repórter e uma sequência de ácido nucleico que codifica um códon de terminação. Em algumas modalidades, d kit compreende adicionalmente uma pluralidade cie pares de iniciadores (PL, sendo que cada par de iniciadores é capaz de identificar a integraçào de (ES),, em {TS)x através de PCR.
Em algumas modalidades, (ESÁ é linear. Em algumas rrtodalidades, (ESÁ é circular.
Em uma modalidade particular, c) kit permite a integração 3itio-específica de um ácido nucleico exógeno em um sitio alvo exclusivo dentro de qualquer urn dentre aproximadamente 6.000 locais genéticos do genoma de levedura. Nessas modaíidades, n= Z6000, sendo que cada
(Tslx é exclusivo a um local único do genoma de célula de levedura.
Em algumas modalidades, o kit compreende adicionalmente instruções para uso que descrevem os métodos 5 para integrar um ou mais ácidos nucleicos exógenos em qualquer local genético de urrta célula de levedura hospedeira.
7. EXEMPLOS
7.1 Exemplo 1: InteAra£ão múlti21a simultânea de uma ÁEluralídade de ácidos nucleícos exóAenos Os métodos e composi-ções descritos no presente documento são implantados para criar uina célula de levedura modificada que compreende dois ácidos nucleicos exógenos integrados em do:i-s locais do genoma de célula de levedura em urna única etapa de transformação, sendo que a recuperação da célula de levedura modificada não exige o ú3o de marcadorles} selecionável/selecionáveis.
É fornecida urna cepa hospedeira que compreende: (a) um sítici de reconhecimento anteriormente i-ntroduzido para a endonuclease de F-Cphl postcionada dentro do local NDT80; e (b): um síti-o de reconhecimento anteriormente introduzido para a endonuclease de I-Scel posicionada dentro do local HO. A célula hospedeira é simultaneamente transformada com: (1) ljlll plasmídeo de expressão que codifica F-Cphl; {2) um plasmídeo de expressão que codifica I-Scel; (3) um DNA linear que compreende um cassete de expressão que cociifica proteína fluorescente verde (GFP), flanqueado por dois trechos de sequênci-a de >500 bp que correspondem às regiões 5' e região 3' local de NDT80; e
(4) um DNA linear que compreende um cassete de expressão que codifica lacZ, flanqueado por dois trechos de sequência de >500 bp que cortespondern às regiões 5' e 3' do local ElO.
Como uma alternativa à inclusão dos plasmídeos de expressão 5 que codificam F-Cphí e I-Scel, respectivamente, proteína3 de I-Scel e F-Cphl puri-ftcadas são incluídas na reação de transforrriação. Um controle de quebra de filamento não duplo é desempenhado transformando-se cÉ!lula3 hospedeira3 com os construtos de integraçáo linear (3) e (4) apenàs, na ausência de proteína purificada ou plasmídeo de expressão de F-Cphl e I-Scel.
C)3 transformantes de controle e experimentais são plaqueados em meios livres de seleção, e as colônias de cada placa são visuali-zadas para a expressão de GFP e lacZ, respectivamente. A PCR de colônia é desempenhada de modo independente com um par de i-niciadores que é recozido a montante e a jusante da junção entre os construtos de integração integrados (3) OLl {4), respectivamente, e as sequências alvos respectivas dos mesmos, para confirmar a fidelidade e a frequência de integração.
7.2 Exemplo 2: Inteqra£ão mú1tiE1a símultânea de uma =1ura1ídade de ácídos nue1eícos exÓgenos Esse Exemplo fornece resultados que demonstram a integração simultânea de três ácicíos nucleicos exógenos em três locais diferentes de uma hospedeira de S. cerevisiae após a indução de quebras de filamento duplo direcionada no genoína de célula hospedeira. Em surna, uma sequência de ácido nucleico "alvo" exógena que codifica uma cópia não 3C) funcional truncada de Proteína Flu3rescente Verde Esrneralda
(emgfpls) foi integrada nos locais HO, YGR250C e NDT80, respectivamente, de células de levedura hospedeiras. As células recombinantes foram transformadas com DNA de "doador" linear que codifica uma cópia funcional intacta de 5 Proteína Fluorescente Verde Esmeralda (EAGFPI e: (1} urrí vetor vazio; ou {2) urrt vetor de expressão, pZFN.gfp, que codifica urrta nuclease de dedo de zinco (ZFN.gfp) que reconhece especificamente e cliva uma sequência dentro da 3equência de codificação de emgfpâ. As colônías transformadas foram triadas através de PCR de colônia {CE'CR) para a substituição de uma, duas ou três cópias genomicarnente integrada3 da sequência de codíficação de emgfpâ alvo com a sequência de codí-ficação de EWGFP de doador.
7.2.1. Construção e Integração de DNA Alvo Para gerar sítios alvos genômicos exógenm para quebras de filamento duplo raedtadas por nuclease, DNAS alvos que codificain emgfpâ foram construídos COTll o üsc) de uma montagem mediada por RYSE, conforrne descrito na Patente n° U.S. 8.110.360, cujos conteúdos estão integralrnente incorporados no presente a tít.ulo de referência. Os nucleotídeos 450 a 462 da sequência de codificaçào de EmGFP do tipo selvagem (SEQ ID NO:l) forarrt substituídos com a segui-nte sequência: 5'-CGTCTAAATCATG-3' (SEQ ID NO:2), resultando na introdução de: (1) um códon de terminação prematuro na posição 152 de EmGFP (emgfpâ); e {2) a sequência de teconhecimento/clivagem para ZFN.gfp.
Para a integração direcionada da sequência de codificação de emgfpâ em cada um dos locais HO, YGR250c e NDT80, a sequência de codificação de erngfpâ foi ladeada com
-200 a 500 bp de sequências h:mólogas a jusante e a rrtontante para cada local (SEQ ID NOS:3 a 8}- Um marcador selecionável exclusivo também fot incorporado em cada construto, posicionado em 5' para a sequência de codificação de erngfpâ, para a seleção de colônias que têm eventos de integração bem sucedidos. O construto de integração de HO incluiu KanR, çi construto de integração de YGR250c inclui-u URA3 e c) construto de integração de NDT80 incluiu NatR. Cada construto de integração foi transformado sequencialmente em uma cepa de levedura haploide de CEN.PK2 pura (cepa A), e confirmou-se que a cepa tem três cópias integradas da sequêncía de codtficação de errígfpâ.
7.2.2. Construção de Plasrrtídeo de Expressão de Levedura de ZFN As nuclea3es de dedo de zinccj consistem em dois domínios funcionais: um domínio de ligação de DNA constituido de uma cadeia de proteínas de dedo de zinco e urri domínio de clivagem de DNA cc)nstituído do domínio de nuclease de Fokl. O domínio de endonuclease de Fokl funciona como à3 um heterodímero obrigatÓrio a fiín de clivar o DNA e, assim, um par de ZFNs é requerido para ligar e corta a sequênci-a alvo do rnesmo. A sequência alvo de ZFN.gfp (Nuclease de dedo de zinc:o CompoZr®, Sigma Aldrich, St. Louis, MO} é : 5'- ACAACTACAACAGCCACAACgtctatATCATGGCCGACAAGCA-3' {SEQ ID NO: 9), corrt a 3equência de reconhecimento indicada errt caixa alta e a 3equêrlcia de cli-vagem indi-cada em caixa baixa.
Um plasmídeo de expressã3 de levedura de ZFN.gfp de cópia alta, pZFN.gfp, foi construido como segue. 03 genes ZFN.gfp.l e ZFN.gfp.2, cada um codi-ficando um membro do heterodímero obrigatório de ZFN.gfp, foram amplificados por PCR a partir de urn plasmideo de expressão de mamífero e fundidos a urn promotor de Pgall1ô divergente aos terminadores ADHI e CYCl, respectivamente. Os produtos de 5 PCR individuais de pgAL10>zFN.gfp.1-TADH1 e pgAL!>zFN.gfp.2- Tcyc1f juntamente com uma cadeia principal de vetor linearizado que corripreende um marcador selecionável de LEU2, foram cotransforrnados em um cepa de levedura pura para rnontagem in vivo através de uma recombinação homóloga de extremidades sobrepostas. Os produtos de PCR recombinados na sequência de prornotor de pGAL1,1O e montados na cadeia principal de vetor através de sequências homólogas adicionadas pelos ini-ciadores terminais. Os transformantes foram selecionadas em meios mínimos carentes de leucina, isolados e proliferados em meios líquidos. Os plasmídeos de múltiplos clones foram extraidos a partir de levedura com o uso do kit de Miniprep de Plasmídeo de Levedura I Zymoprep {Zymo Research). O eluente do protocolo de extração foi então tran3formado errt células quirnicarrtente competentes azuis XL-l de E. coli. Os plasmídeos foram propagados de urrt dia para o outro em E. coli e submetidos a miniprep (Qi-agen, Valencia, CA). Os clones corretos foram identificados através de mapeamento de restríção-
7.2.3. Transformação com DNA de Doador e Indução de Quebras de Filamento Duplo Um protocolo de acetato de lítio/SSDNA/PEG padrão {Gietz e Wcods, Methods Enzymol. 350:87 a 96 (2002)) foi usado para cotransformar a cepa A com o DNA de "doador" ij.neâr que codifica EmGFP e: (1) um vetor vazio; ou (2) o vetor de expressão de pZFN.gfp. A sequência de codificação de EmGFP difere da sequência de codificação de emgfpâ nas posições dentro do sítio de reconhecimento/clivagem para ZFN.gfp, nomeadamente as posições 450 (C3G), 456 (A3T}, 461 {TDC) e 462 (G3C). Assim, espera-se que o ZFN.gfp 5 seja reconheci-do e clivado dentro da sequência de emgfpà, mas não dentro da sequência de EmGFP.
Um micrograma do DNA de plasmideo apropriado foi cotransformado com 70 ul de DNA de EmGFP linear (-300 ng/ul). Todas as transformações foram recuperaclas cle um dia lO para o outro eni YP + 2°0 de galactose para induzir expressão de ZFN. Várias diluições foram plajueadas ern placas de ágar de rneios mínimos carentes de leucina ara selecionar colônias transformadas com DNA de plasrriídeo. As placas foram incubadas por 3 dias a 30 °C.
7.2.4. Confirmação de Integração Simultânea Múltipla A PCR de colÔnia foi realizada para deterrninar a frequência de substituição da sequência de codificação de emgfplj com a sequência de codifLcaçãD de EmGFP em cacla local alvo. O DNA foi preparado a partir de 96 colônias de cada transformação e investigado GDúl pares de iniciadores específicos para EmGFP e HO, EmGFP e NDT80, e EmGFP e YGR250c, respectivamente, de modo que um integração bem sucedida da sequência de codificação de EmGFP em cada local fosse esperada a produzir um ampli-con de um tamanho previsto, enquanto uma não integração foi esperada a não produzir qualquer amplicon.
Tabela 2. Sequências iníciadoras para verífíeação de CPCR de íntegração mú1tip1a da sequêneia de codífieação de EmGFP
Nome do Descrição | Sequêneía SEQ ID NO Inícíador KMH749- Iniciador CAACTACAACAGCCACAAGGTCT SEQ ID NO: Fixed direto ATATCACC 10 GFP-fwd específico para Em.GFP CR813 Iniciador CTCTAACGCTGTTGGTAGATTG SEQ ID NO: reverso 11 para local
HO KMH773- Iniciador ACCATGTGATAATACACTACTAA SEQ ID NO: NDT80-Ar reverso TGTGACTACTAGTTGA 12 para local NDT80 KMH679- Iniciador TCAGACGCGTTCGGAGGAGAGTG SEQ ID NO: YGR250C reverso CATTCAC 13 3' rev para local YGR250C Conforme indicado na Figura 5, das 96 colônias transformadas corrt DNA de doador de EmGFP linear (SEQ ID NO:l) e controle de vetor vazio, não foi produzido qualquer amplicon durante a PCR, indicando que não ouve qualquer 5 evento de integração bem sucedido, isto é, as substituições em qualquer um dos três locais que compreende a sequência alvo de codificação de emgfpâ na ausência de uma quebra de filamento duplo. Por outro lado, das 96 colônias transformada com DNA de EmGFP linear e pZFN.gfp, 2 colônias tiveram ujn local substituído, 4 colôrlia3 tíveram dois locais substituidos e 23 colônias tiveram todos os três locais substituídos corn a sequência de codificação de EmGFP (Figura 6). Os re3ultados da PCR de colônia foram corroborados visualizando-se a fluorescência das colônias transforrnadas nas placas {dados não mostrados}. Nenhurna das colônias transformada com EmGFP DNA e vetor vazio apareceu verde, indicando que nenhuma das sequências alvos de codificação de emgfpâ foram substituídas corrt sequências de codificação de EmGFP funcionais. Por outro lado, -20% das colônías transformadas corrt EmGFP DNA e pZFN.gfp apareceram verde, se correlacionando aproximadamente com a frequência de eventos de i-ntegração observada através da CPCR.
5 Esses resultados demonstram que a indução de múltiplas quebras de filarrtento duplo direcionadas no genoma de uma célula hospedeira podem facilítar a integração direcionada múltipla simultânea de ácidos nucleicos de doadores exógenos.
7.3 Exemplo 3: Integração múltípla símultânea de genes de terpeno sintase para facílítar a conversão de uma cepa de produção de farneseno para uma cepa de produção de amorfadíeno Esse Exemplo fornece resultados que demonstram que a integração simultânea de três genes de sesquiterpeno sintase em três locais modificados diferentes de uma hospedeira de S. cerevisiae modificado para um alto fluxo de via de mevalonato. Como resultados, uma cepa parental que produz farneseno e que compreende uma cópia baseada em plasmídeo clo gene de farneseno sintase foi convertida em uma cepa que produz arnorfadieno que coinpreende múltiplas cópias genomicamente integrada de amorfadieno sintase. Em surna, cassetes de marcador de URA3, NatR e KanR flanqueados por sítio3 de F-Cphl foram integrado3 no local Gal80, HXT3 e Mata, respectivamente, da cepa hospedeira. A hospedeira foi então cotransformada com um plasmídeo que codifi-ca a endonuclease de F-Cphl bem como t:cês construtos de DNA de "doador" linear que contêm otimtzações de códon distintas do gene de amorfadieno sintase (ADS} expresso a partir do promotor de Gall e terrninado pelo terminador de CYCl (cassete de ADS), cada um flaríqueado por regiões de homologia para c) local alvo respectivo dos mesmos. As colônias transformadas foram triadas através de PCR de 5 colônia (CPCR) para a sutgtituição de um, dois ou três locais de marcador alvo genomicamente íntegrados com os cassetes de ADS. Uma cepa triplamente integrada foi identificada e mod±ícada adiciclnalmente integrandos um quarto cassete de ADS, e a cepa resultante foi cultivada sob condições que permitem a perda do plasmideo que codifica farneseno sintase, de modo que c) perfil de produto da mesma foí completamente convertido de farneseno para amorfadieno.
7.3.1. Construção de u:na Cepa de Produção de Farneseno Parental Uma cepa de levedura de produção de farneseno, Y3639, útil para a integração simultânea múltipla de DNAS de doador exógenos que codificam amorfadieno sintase, foi preparada como segue.
2Cl As cepas Y93 (MAT A} e Y94 {MAT alfa) foram geradas para substituir o promotor do gene ERG9 de cepas de levedura YC)02 e YO03 (MAT A ou MAT alfa de segundo plano de CEN-PK2, respectivamente; nra352; trpl 289: len23,712; his3Al; MAL2-8C; SUC2; van Dtjken et al. (2000} Enzyme Microb. Technol. 26:706 a 714}, respectivamente, com o promotor do gene MET3 de Saccharomyces cerevisiae. Para esse fim, as células YO02 e YO03 que crescem exponencialmente foram transformadas com o construto de integração i8 (SEQ ID NO: 14), o que compreendeu o marcador de resistência de canarni-cina (KanMX) flanqueado pelo promotor e terminador do gene Tefl de Kluyveromyces lactis, a sequência de codificaçào de ERG9, um segmento truncado do promotor de ERG9 (E'ERG9 trunc.), e o promotor de MET3 (PMET3), flanqueado pelas sequências a rnontante e a jusante 5 de ERG9. Os tLansforrrLantes de célula hospedeira foram selecionados em um meío que compreende 0,5 g/ml de Geneticin {Invitrogen Corp., Carlsbad, CA), e clones selecionadcs foram confirmados através da E'CR diagnóstica, rendendo as cepas Y93 e Y94.
As cepas Y176 (MAT A) e Y177 (MAT alfa) foram geradas para substituir a sequênci.a de codificação do gene ADEI nas cepas Y93 e Y94, respecti-vamente, corrt a sequência de codificação do gene LEU2 de Candida glabrata (CgLEU2).
Para esse fim, o local genôrnico de CgLEU2 de 3,5 kb foi amplificado por PCR a partir do DNA genômico de Candidâ glabrata (ATCC, Manassas, VA) com o uso dos iniciadores 61- 67-CPK066-G (SEQ ID NO: 15) e 61-67-CPKCl67-G (SEQ ID NO: 16), e transformando-se o produto de PCR nas células Y93 e Y94 que crês3cêrü exponencialmente. Os transformantes de célula hospedeira foram selecionados em CSM-L, e clones selecionados foram confirmados através de PCR diagnóstica, rendendo as cepas Y176 e Y177.
A oepa Yl88 foi gerada introduzindose na cepa Y176 uma cópia adicional das sequê.ncias de codificação dos genes ERG13, ERGIO e ERG12 de Saccharomyces cerevisiae, e uma sequêncí-a de codificação truncada do gene HMGI de Saccharomyces cerevisiae, cada urrta sob controle regulatório de um promotor induzível de galactose do genes GALI ou GALIO de Saccharomyces cerevisiae. E'ara esse fi-m, células Y176 que crescem exponencialmente forarri transformadas com 2 µg de plasmídeos de expressão pAM491 e pAM495 digeridos com endonuclease de restrição de Pmel (New England Btoíabs, Beverly, MA). Os transformantes de célula hospedeira foram selecionados em histidina e uracila carentes de CSM {CSM-U- 5 H), e os clones selecíoriados foram confirmados através de PCR di-agnóstica, rendendo a cepa Y188.
A cepa Yl89 foi gerada introduzindo-se na cepa Y177 uma cópia adicional das sequências de codificação dos genes ERG20, ERG8 e ERG19 de Saccharomyces cerevisiae, e uma sequência de codificação truncada do gene HMGI de Saccharomyces cerevisiae, cada uma sob controle regulatório de um promotor induzível de galactose do gene GALI ou GALIO de Sacchâromyces cerevisiae. E'ara esse fim, as células Y188 que crescem exponencialinente foram transformadas corn 2 g de plasrnideos de expressão pAM489 e pAM497 digeridos corrt endonuclease de restrição de Pmel. Os transformantes de célula hospedeira foram selecionados em histidina e tríptofano carentes de CSM (CSM-T-H), e os clones selecionados foram confirmados através de PCR diagnóstica, rendendo a cepa Y189.
A cepa Y238 foi gerada para as cepas Y188 e Y189 compatíveis, e introduzindo-se uma cópia adicional da sequência de coditicação do gene lúll de Saccharomyces cerevisiae e uma sequência de codificação truncada do gene FIMGI de Saccharomyces cerevisiae, cada uma sob controle regulatório de urrt promotor induzível de galactose do gene GALI ou GALIO de Saccharomyces cerevisiae. Para esse fim, aproxiwadainente 1 x 10' de células de cepas Yi88 e Y189 foram misturadas em urria placa de meio de YPD por 6 horas em temperatura ambiente, células diploides foram selecionadas em CSM-H-U-T, e díploides que crescem exponencialmente forarri transformadas com 2 g de plasmídeo de expressão pAM493 digerido corri endonuclease de restrição de Pmel. Os transformantes de célula hospedeira foram selecionadas em 5 adenina carente de CSM (CSM-A), e os clones selecionados foram confirmados attavés de PCR díagnóstica, rendendo a cepa Y238.
As cepas Y210 (MAT A) e Y21l {MAT alfa) foram geradas pela cepa Y238 de esporulação. As células diploides foram e3poruladas em 2% de acetato de potássio e 0,02% de meio líquido de rafinose, e aproxirnadamente 200 tétrades genéticos foram isolados ccm o uso de um micromanipulador da série MSM300 da Singer Instruments (Singer Instrument Co, LTD. Somerset, UK). Os esporos foram 3elecionadas em CSM-A-H-U-T, e os clones selecionados foram confirmados através de PCR diagnóstica, rendendo as cepas Y210 (MAT A} e Y211 (MAT alfa).
A cepa Y221 foí- gerada transformando-se células Y211 que crescem exponencialmente com c) vetor pAM178. Os transforrnantes de célula hospedeira foram selecionadas em CSM-L.
A cepa Y290 foi gerada deletando-se a sequêncta de codificação do gene GAL80 da cepa Y221. Para esse fim, as células Y221 que crescem exponencialmente foram transformadas com o construto de integração i32 (SEQ ID NO: 17), o que compreendeu o marcador de resistência de higrornicina B (hph) flanqueado pelo proinotor e terminador do gene Tefl de Kluyveromyces lactis flanqueado pelas sequências a montante e a jusante de GAL80. Os transformantes de célula hospedeira foram selecionadas em urrt meio que compreende hi-gromicina B, e c)s clones selecionados foram confirmados através de PCR diagnóstica, rendendo a cepa Y290.
A cepa Y318 fcji gerada removendo-se o vetor 5 pAM178 da cepa Y290 através da propagação em série em meios ricos em leucina, e testando-se as colônias individuais para a habilidade das rrtesmas de proliferar em CSM-L, rendendo a cepa Y318.
A cepa Y409 foi- gerada introduzindo-se uma sequência de nucleotideos heteró oga que codifica uma B- farneseno sintase na cepa Y3l8. Para esse fim, células Y318 que crescem exponencialmente foram transformadas com o plasmídeo de expressão pAb4404. Os transformantes de célula hospedeira foram selecionadas erri CSM-L, rendendo a cepa Y409.
A cepa Y419 foi gerada tornando-se os promotores de GAL da cepa Y409 constitutivamente ativos. Para esse fim, as células Y409 que crescem exponencialmente fbrartí transformadas com Ci construto de integração i33 (SEQ ID NO: 18), o que compreendeu o marcador de resistência de nourseotricina de Streptoínyces noursei (NatR) flanqueado pelo promotor e pelo terminador do gene Tefl de Kluyveromyces lactis, e a sequência de codificação do gene GAL4 de Saccharomyces cerevisiae sob controle regulatório de urrta versão "constitutiva operativa" do promotor nativo do rnesma (PGAL4oc; Grigg3 & Johnston (1991} PNAS 88{19):8.597 a 8.601] e o terminadoi: de GAL4 (TGÀL4i, flanqueado pelas sequências a montante e a jusante das sequências de codificação e promotor de ERG9 modificado. Os tran3forrrLantes de célula hospedeira foram selecionados em um meio que compreende nour3eotricina, e os clones selecionados foram confirrnados através de PCR diagnóstica, rendendo a cepa Y419.
A cepa Y677 foi gerada através da introdução no 5 local GAL80 modificado da cepa Y419 de uma cópia ad1cl-onal da região de codificação dci gene ERG12 de Saccharomyces cerevisiae sob controle regulatório do promotor do gene GALI de Saccharoinyces cerevisiae. Em suma, as células Y677 que crescern exponencialmente forarrt transformadas com construto de integração i37 (SEQ ID NO: 19), que compreendeu o marcador de resi-stência de canamicina de Streptomyces noursei (KanR) flanqueado pelo promotor e pelo terminador do gene Tefl de Kluyveromyces lactis e as sequências de terminador e codificação do gene ERG12 de Saccharomyces cerevisiae flanqueado pelo prorrtotor GALI (PGALI) e pelo terminador ERG12 {TERG12). Os transformantes de célula hospedeira forarn se ecionados errt meio que compreende canamicina e os clones selecionados foram confirmados por PCR de diagnóstico, produzíndo a cepa Y677.
A cepa Y1551 foj- gerada a partir da cepa Y677 por mutagênese química. As cepas que sofreram mutação foram triadas em relação à produçào aumentada de j3-farneseno, produzindo a cepa Y1551.
A cepa Y1778 foi gerada a partir da cepa Yl551 por mutagênese química. As cepas que sofreram mutação foram triadas em relação à produção aurnentada de j3-farneseno, produzindo a cepa Yl778.
A cepa Yl816 foi gerada através da substituição da sequência de codificação HXT3 da cepa Y1778 com duas cÓpias de uma sequência de codificação de acetoacetil-CoZi tiolase, urn sendo derivada de Saccharomyces cerevisiae e a outra de C. butylicum e umâ cópia da sequência de codificação do gene HMGS de B. juncea. Em suma, as célula3 Y1778 que crescern exponencialmente foram transformadas com 5 construto de integtação í301 {SEQ ID NO: 20}, que compreendeu c marcador de resi-stência de higrorrticina B {hyg) flanqueado pelo promotor e pelo terminador do gene Tefl de Kluyveromyces lactis, a sequência de codificação do gene ERGIO de Sacchàromyces cerevisiae flanqueada por um promotor TDH3 truncado (tPTDH3) e termi-nador AHPI (TAHPI), a sequência de codificação do gene de acetoacetil-CoA tiolase de C. butylicum (tiolase) flanqueada pelo prornotor YPDI {PYPDI) e terminador CCW12 (TCCW12} e a sequência de codificação do gene HMGS de B. juncea {HMGS) precedido pelo promotor TUB2 {PTUB2), flanqueada por sequências a montante e a jusante do gene HXT3 de Saccharomyces cerevisiae. Os transformantes de célula hospedeira foram selecionados no rneio que compreende higromicina B e os clones selecionados foram confirrnados por PCR de diagn5stico, produzindo a cepa Y1816.
A cepa Y2055 foi gerada a partir da cepa Y1778 por mutagênese quimica. As cepas mutantes foram triadas em relação à produção auínentada de B-farneseno, produzindo a cepa Y2055.
A cepa Y2295 foi gerada a partir da cepa Y2055 por mutagênese quími-ca. As cepas mutantes foram triadas em relação à produção aumentada de j3-farneseno, produzindo a cepa Y2295.
A cepa Y31I1 foi gerada através da comutação do tipo correspondente de cepa Y2295 de MAT A a MAT alfa. Em suma, as Y2295 células que crescern exponencialmente foram transformadas com o construto de integração i476 (SEQ ID NO: 21), que compreendeu local correspondente de MAT alfa e o rnarcador de resistência de hi-gromicina B (hygA). Os 5 transformantes de célula hospedeira foram selecionados ern meio que compreende higromicina B e os clones selecionados foram confirmados por PCR de diagnóstico, produzindo a cepa Y3111.
A cepa Y2168 foi gerada a partir da cepa Y1816 por mutagênese química. As cepas mutantes foram triadas em relação à produção aumentada de j3-farneseno, produzindo a cepa Y2168.
A cepa Y2446 foi gerada a partir da cepa Y2168 por ínutagênese química. As cepas ínutantes foram triadas em relação à produção aumentada de j3-farneseno, produzindo a cepa Y2446.
A cepa Y3118 foi gerada através da inserção no local URA3 nativo da cepa Y2446 da sequência de codificação, promotor e terminador do gene GAL80 de Saccharomyces cerevisiae. Em suma, as células Y2446 que crescem exponencialmente foram transformada3 com o construto de integração i477 (SEQ ID NO: 22), que compreendeu o promotor, c) terminador e a sequêncía de codLfl-cação do gene GAL80 de Saccharomyces cerevisiae (GAL80) flanqueado através da sotreposição das sequências URA3 (que perniitem a excisão do laço do gene GAL8C) por recombinação homóloga e restauração da sequência URA3 original). Os transformântes de célula hospedeira foram selecionados em meio que corrípreende 5-FOA, produzindo a cepa Y3118.
A cepa Y3215 foí- gerada por cepas correspondentes Y3111 e Y3118. Aproximadamente 1 x iO' células de cepas Y3111 e Y3118 foram misturadas em um placa de meio YPD por 6 horas à teniperatura ambiente para permitir a 5 correspondência, segui-ndo pelo plaqueamento ení placa de ágar YPD para isolar as colônias siinples. Os diploides foram identí-ficados através da triageíu por PCR de colônia em relação à presença tanto cio lccal MAT alfa marcado com hphA quanto do local MAT A do tipo selvagem.
A cepa Y3000 foi gerada através da esporulação cia cepa Y3215 e do laço da sequência de codificação GAL80. As células díploídes foram esporuladas em acetato de potássio a 2% e meio Líquido de rafinose a 0,02%. Os esporo3 aleatÓrios foram isolados, plaqueados eiu ágar YPD, crescidos por 3 di-as e, então, plaqueados por réplica para CSM-U a fim de permitir o crescimento apenas de células que carecem de GAL80 {isto é, que têm urrt gene URA3 funcional) .
Os esporos foram, então, testados em relação à produção de l3-farne3eno, o melhor produtor foi identificado e a presença de con3ttuto de integração i301 foi confirmada por E'CR de diagnóstico, produzindo a cepa Y3000.
A cepa Y3284 foi gerada através da remoção do marcador URA3 da cepa Y3000. Em suma, as célnlas Y3000 qne crescem exponencialmente foram transformadas com construto de integração i94 (SEQ ID NO: 23), que compreendeu a sequência de codificação hi3G de Salmonella e a sequência de codificação do gene ERGI3 e uma sequência de codificação truncada do gene HMGI de Saccharomyces cerevisiae sob controle de um promotor de galactose induzível do çene GALI ou GAL1CI de Saccharomyces cerevisiae, flanqueado por sequências a inontante e a jusante do gene URA3 de Saccharomyces cerevisiae. Os transformantes de célula hospedeíra foram selecionados em íneio que cornpreende 5-FOA e os clones selecionados forarrt confirmados por PCR de 5 diagnóstico, produztndo a cepa Y3284.
A cepa Y3385 Eoi gerada através da substituiçáo da sequência de codificação NDT8J da cepa Y3284 com uina cópia adicional da sequência de codificação de um gene de acetil-CoA sintetase de Saccharomyces cerevisiae e a sequência de codificação do gene PDC de Z. mobilis. Em suma, as células Y3385 que crescem exponencialmente foram transformadas com o construto de integração í-467 (SEQ ID NO: 24}, que compreendeu o marcador URA3, a sequência de codificação do gene ACS2 de Saccharomyces cerevisiae (ACS2) flanqueada pelo promotor HXT3 (PHXT3) e pelo terminador PGKl {TPGkll e a sequência de codificação do gene PDC de Z.
mobilis (zmPOC) flanqueada pelo promotor GAL7 (PGAL7) e pelo terminador TDH3 {TTDH3), flanqueada por sequências NDT80 a montante e a jusante. Os transformantes de célula hospedeira foram selecionados em CSM-U e os cLones selecionados foram confitmados por PCR de diagnóstico, produzindo a cepa Y3385.
A cepa Y3547 foi gerada a partir da cepa Y3385 por rnutagênese quimica. As cepas que sofre:ram mutação foram triadas em relação à produção aumentada de B-farnesenD, produzindo a cepa Y3547.
A cepa Y3639 foi gerada a partir da cepa Y3547 por mutagênese quimica. As cepas que sofreram mutação forarn triadas em relação à produção aumentada de S-farneseno, produzindo a cepa Y3639.
7.3.2. Construção e Integraçào de DNA-AIvo Sítios-alvo genômicos €xógenos para quebras de fi-lamento duplo Fcphl mediadas por endonuclease foram integrados em três diferentes locais de cepa Y3639. Três 5 sítio alvo cassete3 foram construídos através do uso do conjunto de PCR de fragment.os de sobreposição, cada uín cowpreende a sequencia de reconhecimento para o endonuclease Fcphl e para a sequência de codificação para: {1) URA3 (flanqueada por regiões de horrtologia para o local de Gal80 modificado) {SEQ ID NO: 25); (2) NatR (flanqueada por regiôes de homologia para o local de HXT3 modificado) (SEQ ID NO: 26j; e (3) KanR (flanqueada por regiões de homologia para o local de Mata modificado) (SEQ ID NO: 27}, respecttvamente. Cada cassete de sítio-alvo foi transformado, em série, em Y3639 e a cepa foj- confirmada pela coIônia PCR para ter três cópias integradas dos cassetes marcadores flanqueados por F-Cphl nos locais corretos ("cepa B").
7.3.3. Construção de Plasmídeo de Expressão de Levedura de F-Cphl O Plasmídeo de Expressão de Levedura de F-Cphl pAM1799, compreende um marcador selecionável HygR, que foi anteri-ormente descrito na Patente n° US 7.9119.605, que é tncorporada por meío deste a titulo de referência na completude da rrtesma.
7.3.4. Transforrrtação de DNA de doador e Indução de Quebras de filamento duplo O protocolo padrão de acetato de lítio/PEG/SSDNA/ (Gietz e Woods, ¥ethods Enzymol. 2002;350:87-96) foi modificado para incluir uma incubação de 30 graus e 30 minutos das células anteriores ao choque de caior de 42 graus. Esse método foi usado para cotransformar a cepa B corri pAM1799, codificar endonuclease Fcphl e três "doadores" lineares de DNA, cada um compreende um sequência de 5 codíficação otimizada de códon para sintase de amorfadieno {ADS) de Artemisia annua, flanqueadà por regiões de homologia aos Gal80 (SEQ ID NO: 28), HXT3 (SEQ ID NO: 29) e locats de PIata (SEQ ID NO: 30) modificados, respectivamente, da cepa B.
Um micrograma de pAM1799 foi cotransformado com -100 ng de cada urrt dos ADS de DNAS de doador. Todas as transforrnações foram recuperadas durante a noite em YP + 2% galactose para induzir expressão de F-Cphl. Diversas diluições foram colocadas em placas de ágar de YPD que contêm higromicina para selectonar para colônias transformadas com DNA plasmídico. As placas foram incubadas por 3 dias a 30°C.
7.3.5. Confírmação de Múltiplas IntegraçCjes simultâneas A colôm-a PCR {CPCR) foi efetuada para determinar frequência de substituição das sequênci-as de codificação de cassete marcador flanqueado por F-Cphl com a ADS sequência de codificação de cassete. C) DNA foi pr-eparado das 20 colônias sondadas com pares iniciais específicos para, respetivamente, os ADS e pai:a o local de Gal80, para ADS e para c)s locats de HXT3 e ADS e para o local de Matcx, de modo que tenha sido esperado que a integração bem sucedida da sequência de codifícação de cassete de ADS em cada local para produzisse urrt fragrnento de um tamanho previsto, ernbora tenha sido esperado que a não integração não produzisse fragrnento. As reações de PCR para produzirem fragmentos das extremidades 5' e 3' de cada local foram tentadas em rrtultiplex. Em alguns casos, apenas o fragmento 5' ou 3' foi detectado de forma bern sucedida, porém 5 integração aproprí-ada do cassete de ADS confirmada nesses locais através de sequenciamento de fragmento3 de PCR maiores .
Tabela 3. Sequências inicíadoras para verifieação de CPCR de integração múltípla da sequência de codífícação de cassete de ADS ) Nome do ) Deseríção i Sequência SEQ I Inícíador ) ! ID
NO ) CUT24 : Local de ) GTTTCTTTTGGATTGCGCTTGCC SEQ I Gal80 US I ID ! FOR l NO: 31 !]Ànjíí"uiij= códon i TACTGACAACCACATGTTAC SEQ | V2 i ID ) 5' REV ) NO: 32 ) ART45 ) ADS ORF 5' ) TACTGCTTCGGTAGTAGTTTCACCCTTCA SEQ ) REV ! ID NO: 33 i ART210 l Local de)AAGTCCAATTCAATAGT SEQ ! Gal80 DS ) ID l REV i NO: i 34 l HJ207 i Local de ) CATCTTCTCGAGATAACACCTGGAG ) SEQ | HXT3 US ) i ID i '°" ) jjj' I KB349 I CYCIT FOR i ACGCGTGTACGCATGTAAC l SEQ
I ID ) NO: i 36 HJ607 T,OC:d1 de CAAT'L'GGGG'L TC'I'GGCAGTC SEQ HXT3 DS ID REV NO: 37
CUT76 Local de GAAGCCTGCTTTCAAAATTAAGAACAAAGC' SEQ Matu US ) ID FOR )NO: l 38 HJ632 Local de GAATTTACCTGTTCTTAGCTTGTACCAGAG| SEQ Matcx DS ) ID REV I NO: 9 Das 20 colônias triadas mediante CPCR, 14 têrn ADS integrados no local de Gal80, 17 têm ADS integrados nos locais de HXT3 e quanto têm ADS integrados nos3 local de Matcx. A baixa taxa de integração no local de Matcx pode ser 5 explicada rnediante autofechamento nesse local rrtediado através de uma sequência de repet]-çào direta que flanqueia os sítíos de F-Cphl. Nc) total, 6 clones têm ADS integrados ern um único sítio, 10 clones têra ADS integrados em dois sites e três clones têm ADS integrados errí todos os três lO locais ("cepas C"). A3 cepas irlt€gradas triplamente foram confirrnadas, adicionalmente, rrtediante sequenciamento rriais longo de Produtos de PCR que abrangem ambos c)s flancos.
1.1.5. Término da cepa de ADS integrada e avaliação de sesquiterpeno As cepas de ADS i-ntegradas triplamente foram modeladas, adi-cionalmente, através da integração de uma cÓpia tirmí de ADS [[ldrc:ddo c:orrt uru cds3ete de URA {SEQ -LD NO: 40) no local His3 com c) uso de um ptotocolo padrão e uma cepa resultante foi confirmada para essa quarta cópia {"cepa D"). Pcjr fim, células: de cepa D foram passadas em uma rrtídia não seletiva para soltar o plasmídeo de sintase de farne3eno de cópia alta marcada ern Leu+ (pAM404) ("cepa E").
Dí-versos isolados de cepa E foram avaliados CIll relação à produção de sesquiterpeno junto da cepa d e da cepa B parente original. Em sunía, isolados: das cepas B, D e forma incubados ern cavidades separadas de ujna placa de 96 cavidades que contém 360 µ1 de Meí-o De Semente De Pássaro (BSM) com de 2% de sacarose por cavidade (pré-cultura).
5 Após 3 dias de incubação a 33,5'C com agitação erri 999 rpm, 14,4 o µ1 de cada cavidade fo.i inoculado em uma cavidade de uma nova piaca de 96 cavidades que contém 360 µ1 de BSM fresco coín 4% de sacarose (culzura de produção). Após outras 2 dias de incubação à 33,5°C com àgitação em 999 rpm, amostras foram tomadas e analisadas para produção de sesquiterpeno medi-ante análise de cromatografi-a de gás (GC). Amostras foram extraídas com heptano de metanol (1:1 v/V) e as rnisturas foram centrifugadas para remover materíal celular. Uma alíquota do extrato de heptano de metanol foi diluída em heptano e, então, injetada em uma fase estacionária de silicone de metila através do úsc) de uma injeção de divisãci pulsada. Farneseno e amorfadieno foram separados por um ponto de ebulição como o uso de GC com detecção de ionização de chama (FID). Cariofilina TrarlsB foi usada corrto urn marcador de tempo de retenção para monitorar injeção berrt sucedida e extração durante c) perfil de forno Cg especificado.
Conforrne rnostr-ado na Figura 7, total produção de sesquiterpeno permaneceu quase idêntica (3-3.5 g/l) para todas as cepas, porém d perfil de produto foi convertida, de forma bem sucedida, do Farneseno (cepa B) para o produto misturado (cepa D) para amorfadieno (cepa E).
Esses resultados demonstram que a indução de múltiplas quebras de fi-lamento duplo em alvo no genoma de uma célula hospedeira pode facilit-ar múltiplas integrações siinultâneas de um cassete de gene funcional, nesse caso, a conversão de uma cepa produtora de farneseno em uma cepa produtora de amorfadieno através de uma única transformação é faci-litada.
5 7.4 Exemplo 4: Substituição simultânea de múltíplas eópías integradas de sintase de farneseno com sintase de amorfadieno Esse exemplo fornece resultados que demonstram as substituições stmultâneas de quatro genes de sintase terpênica, genomicamente integrados, facilitadas por quebras de filamento duplo de nuclease induzida projetistas dentro das regiões de codificação de sintase. Em suma, uma cepa de produção de farneseno existente entregue da cepa Y3639 (descrita no Exemplo 31, mas que cornpreende quatro integradas em vez das cópias extracromossômicas do gene de si-ntase de (FS}, foi cotransforrriada com urna cochfícação plasmídica, uma nuclease de efetor TAL projetista {TALEN) e quatro DNAs de doador lineares que codificam novos genes de sintase terpênica. O TALEN projetista é capaz de vincular à e clivar uma única sequência ao gene de sintase de farneseno integrado. Colônias trarisformadas foram triadas mediante coTônia PCR (CPCR} e cepas com um, dois OLl três ou quatro locais marcadores de alvo genomicamente integrados forma identificadas.
7.4.1. Con3trução e Integração de DNA Alvci Quatro cassetes de doador, cada um compreende sequência de codificação flanqueada por regiões de homologia de sintase de terpeno (-500 bp) aos respectivos locais de alvo da niesma, foram armados rrtediante a sobreposição de PCR. Três dos DNA3 de doador compreenderarn sequências de codificação de ADS e nenhum marcador selecionável (SEQ ID NOs: 41-43), enquanto DNA de doador final foi um cassete que compreende uma otimização nova de 5 códon da sintase de farneseno (FS} fundida com um cassete marcador de URA3 {SEQ ID NO: 44). Nenhum dos DNAS de doador conteve o sítio alvo reconhecido pelo TALEN específico de FS (5'- TAGTGGAGGAATTAAAAGAGGAAGTTAAGAAGGAATTGATAACTATCAA- y (SEQ ID NO:45)).
lO Para a substituição dos quatro cassetes de FS integrados na cepa {Cepa F), o TALEN marcador de plasmídeo de hyg+ foi cotransformado na cepa hospedeira junto de -500 ng e cada DNA de doador linear com o uso do protocola descrito do Exemplo 3. Várias diluições foram caladas nas placas de CSM-URA + Hyg e incubadas à 30 graus por três dias.
7.4.2. Confirmação de Múltiplas Integrações Simultâneas Após a seleção para o Plasmídeo de TALEN e integração do cas3ete de códon de FS rrtarcado ern URA3 errt CSM-URA placas de Hyg+, colônia PCR foi efetuada para determinar a frequência de substituição do câ33éte de FS integrado com os Cassetes de ADS desmarcados em três locai-s. O DNA fcii preparado de 20 coIônias e sondado com pares iniciadores específicos para integraçào do cassete de ADS nos locais de NDT80, de DITI e ERGIO, de modo que tenha sido esperado que a integração beni sucedida da sequência de codificação de cassete de ADS errt cada local tenha produzido um fragmento de um tamanho previsto, enquanto era esperado que a não integração não produzisse fragmento.
Tabela 4. Sequêneias inicíadoras para veríficaçâo de CPCR de substítuíção de múltiplos cassetes de Earneseno de sintases com cassetes de síntase de amorfadieno.
Número do Deserição Sequêncía SEQ ID iniciador NO HJ272 NDT80 5' ATAACAATATTATAAAAAGCGCTTAA SEQ ID FOR NO: 46 ART4 5 ADS ORF TACTGCTTCGGTAGTAGTTTCACCCT SEQ ID 5' REV TCA NO: 47 HJ643 DITI 5' AAAATCCTTATATTATTGGCCC SEQ ID FOR NO: 48 HJ799 ERGIO 5' GTAGCCTAAAACAAGCGCC SEQ ID FOR NO: 49 5 Três dentre 48 clones exarninados integraram um único cassete de ADS, em adição ao FS marcado em URA3, um clone integrou 2 cassetes de ADS e um clone integrou todos qs três cassetes de ADS. Resultados de integração múltipla foraín confirmados, adicionalmente, mediante sequenciamento de produtos de PCR mais longos que abrangem ambos os flancos.
Esses resultados demonstrarrt que a expressão de urna nuclease projetista de sítio específico em uma célula hospedeira, que compreende uma via Biosintética, pode facilitar a substituição simultânea de múltiplas cópias integradas de um gene de via com novos genes de via em uma única etapa de transformação.
7.5 Exemplo 5 Integração múltípla simultânea de construtos de DNA sem marcação em doís Iocaís eortados por nucleases projetístas dístíntas Esse exemplo fornece resultados que demonstram as integrações simultâneas de dois construtos cle DNA sem marcação em dois sítio alvos nat.ivos, cada sitio que é cortado pro uma nuclease projetista distinta. EM suma, uma Cepa hospedeira de ADE coin cotransformada com: (1} um fragmento de DNA ltnear que compreende um cassete de GFP (flanqueado por regiões homólogas a montante e a jusante ao 5 local de SFCl); 12) um fragmento de DNA linear que compreende um cassete ADE2 (flanqueado por regiões homÓlogas a montante e a jusante ao local de YjR030C); e {3} plasmídeos (s} que codificam nucleasses projetistas que alvejam sequências ncs quadros riativos SFCl e YJR030c legíveis abertos, respectivamente. Após a seleção para 0(3} pLasrnideo(s), colônias transformadas forrna triada3, de forma visual, para fluorescência de GFP e para cor branca, indicar complementação do fenótipo de ADE . Colônia de PCR (cPCR) também foi efetuada para c:onfirmar substituição de ambos os locai-s. De forma interessante, um melhoramento significante na taxa de integração em ambos os locais de alvo foi observada quando as endonucleases projetistas foram usadas em combinação comparadas à taxa de i-ntegração quando apenas uma única nuclease projeti-sta foi usada.
7.5.1. Construção de DNA de doador cassetes Dois DNAS de doador foram gerados com o uso de conjunto de PCR de fragmentos de sobreposição: {1) um fragmento de DNA linear qne compreende nm cassete de GFP flanqueado mediante -500 bp de regiões homólogas a montante e a jusante ao local de SFCl (SEQ ID NO: 58}; e (2) um fragmento de DNA linear que compreende um cassete ADE2 flanqueado por -500 bp de regiões homólogas a montante e a jusante ao local YjR030C (SEQ ID NO: 591.
7.5.2. Construção de plasmídeos de Expressão ZFN heterodimérico
Um plasmídeo que codifica a nucleasse de dedo de zinco de YjR030C (ZFN) foi construídas de duas maneiras. Na primeira versão, os dois ORF3 de um ZFN heterodiinérico sob expre3sãD de um promotor de Gal1-"lO divergente e terminado 5 pelos terminadores Adhl e CYCl foram clonado erri um vetor CEN-ARS marcado por Kan por um reparo de lacuna de três fases na levedura {pCUTO06). Uma segunda versão tambérn foi construída em que ambos os ORFS do ZFN heterodemérico foram expressos do promotor de GallO c:om um único ORF com os monômeros separados por urna sequencia de DNA que codifica um ligante de peptídeo possível de clivagem. É3sê segundo plasmideo foi construído pot urrt ligação de três partes que usa ligantes produzidos por uma digestão de enzima de restrição IIS de fragmentos de E'CR em um vetor CEN-ARS marcado por Kan osso das costas (pCUTO16). O plasmídeo que codifica o ZFN específico de SFCl também foi construido corrío um único ORF que usa a mesma estratégia de ligante, marcador e osso das cotas (pCUTO151. O marcador foi, então, rrtudado para URA por rrteio de uma reação de reparo de lacuna em levedura (pCUT058}. Para construir uma único plasmídeo para expressão de ambos 03 YJR030c e nucleasses específicas de SFCl, os únicos QRFS do pCUT16 e do pCUT15 foram subclonados em um novo osso das costas de vetor CEN-ARS Kan+ e expresso do promotor divergente de Gall-lO com terminadores Cycl e Adhl (pCUT032}.
7.5.1. Transformação com DNA de doador e Indução de Quebras de Filamento Duplo Um micrograma de cada nuclease projetista de DNA plasmídico, ou o plasma que contem ambas endonucleases projetistas em urrt púnico plasmídeo, foi cotransformada em urri único -1 micrograma de cada um dos DNAS de doador. Todos as transformações foram recuperadas durante a noite em YP + 2% de galactose para induzir expressão de nuclease. Vári-as diluições foram colocadas em placas de ágar de evasão de 5 URA + Kan (para duplos plasmídeos) ou YPD + Kan para selecionar para colônias transformadas com DNA plasmidico.
Placas foram incubadas por 3 a 4 dias à 30°C.
7.5.2. Confirmação de Múltipla Integração Simultânea Integração sem marcação no local de SFCl foi pontuada pela observação de fluotescência de GFP sob luz Ultravioleta que usa filtros apropriados. Integração sem marcação de ADE2 foi pontuada pela observação de cor de colônia branca que indica complementação do fenÓtipo de supressão de ADE2 (colônias rosasl na cepa hospedeira. Em um experimento típico, 50 a 150 colônias forarri avaliadas. A estratégia de pontuação visual foi confirmada em um subsi-stema de colônias mediante colônia PCR corrt uso de iniciadores 5' do construto de integração e urri iniciador reverso interno. Integração em cada local era esp4erado produzir um fragmento de um tamanho prevtsto, enquanto era esperado que a não integração não produzisse fragmento. Os resultados de CPCR confirmaram a precísão do método de pontuação visual.
Tabela 4. Sequêncías inieiadoras para verífíeação de CPCR bem sucedída de íntegração múltípla da Sequência de eodifieação de cassete de ADS
Nome de Descríção ! Sequêncía SEQ TD Inícíador NO CUT351 SFCl 5' GCGAATGAGCCATGAATTATTAACCG SEQ ID cPCR C NO: 63 CUT350 YJR030c AGATGAAACGAATTACTAGCATTTTA SEQ ID 5' cPCR TCCGTTC NO: 64 CUT371 Cassete TAACTACCATTACTCAGTGTACTTGA SEQ ID de ADE2 TTGTTTTGTCCGATTTTCTTG NO: 65
REV HJ788 Cassete GCCGGGTGACAGAGAAATATTG SEQ ID de GFP NO: 66
REV Conforme indicado na Figura 8, em célula3 cotransforrnadas com DNAS de doador limeares para os locais de SFCl e de YJR030c e para o plasmídeo de endonuclease de 5 YjR030C (pCUTO06] e plasmídeo de endonuclease SFCl (pCUT058}, 80% das colônias selecionadas em evasão de URA + placas de ágar Kan eram GFP positivas. Dessas colônias, 91% foram positivas para integração cle ADE2. No total, 72,8% das colônias integraram o DNA de doador em ambos os locais.
Errt células cotransformadas com DNA de doâdcír linear par ac. Iocal de SFCl e c) plasrrtídeo de nucleasse projeti-sta que direciona o SFCl (pCUTO15}, 50% das células eram posítivas para GFP. Quando as células foram cotransformadas com o DNA de doador linear para d local de YJR030c e o plasmídeo de nuclease projetista que alveja c) local de YJR030c {pCUTO16), apenas 5% das células erarri positivas para integração de ADE2. Quando as células hospedeiras fcmam cotransformadas corn DNAS lineares para o locais de SFCl e de YjR030C e o plasmídeo de nuclease projetista de SFC1/YjR030C {pCUT032), 76% das células foram GFP positivas e 63% foram ADE2 positivas. Esse reímltado é notável pelo fato de que derronstra um melhoramento significante inesperado em eficáci-a de integração quando múltiplos sítios são alvejados atravês de endonucleases projetistas.
Esses resultados demonstram que a indução de 5 múltiplas quebras de filamento duplo em alvo, em locais nativos no genoma de uma célula hospedeira, pode facilitar integrações se marcações, múltiplas e sj-muitâneas cÍO3 cassetes de genes funcionais.
Todas as publicações, patentes e pedidos de patentes citados neste relatcSrio descritivo sÊio incorporados ao presente documentc a título de referência, como se cada publicação individual c)ü pedido de patente fosse, especifica e indivi-dualmente, indicado para ser i-ncorporado a título de referência. Embora a invençãc' supracitada tenha sido descrita ccm algum detalhe a título de ilustração e exemplo para o propÓsito de esclarecimento de entendimento, será prontamente aparente àqueles de habilidade comum na técnica sob a luz dos ensinamentos dessa invenção que determinadas mudanças e rnodificações podem ser feitas na me3ma sem se afastar do espírito e escopo das reí-vindicações anexas.
107345_104_sequence_Ljsting
SEQUENCE LISTING <110> AMYRIS, INC. SERBER, zach HORWITZ, Andrew <120> METHODS FOR GENOMIC MODIFICATION <130> AM-4800-US <150> US 61/479,821 <151> 2011-04-27 <150> US 61/500,741 <151> 2011-06-24 <150> US 61/539,389 <151> 2011-09-26 <160> 66 <170> patentIn version 3.5 <210> 1 <211> 741 <212> DNA <213> Artif'icial sequence <220> <223> synthetic: wild-type Em.gFp coding sequence <400> 1 atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60 ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120 ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180 ctcgtgacca ccttgaccta cggcgtgcag tgcttcgccc gctaccccga ccacatgaag 240 cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300 ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360 gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420 aagctggagt acaactacaa cagccacaag gtctatatca ccgccgacaa gcagaagaac 480 ggcatcaagg tgaacttcaa gacccgccac aacatcgagg acggcagcgt gcagctcgcc 540 gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600 tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660 ctgctggagt tcçjtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720 ctcgagaagc ttgatccggc t 741 <210> 2 <211> 13 <212> DNA <213> Artificja1 sequence pági na 1
107345_104_sequence_Ljstjng
<220> <223> Synthetic: EmgFp linker encoding premature stop codon
<400> 2 cgtctaaatc atg 13
<210> 3 <211> 500 <212> DNA <213> Artificia} sequence
<220> <223> synthetic: HO upstream integration sequence
<400> 3 cgcaagtcct gtttctatgc ctttctctta gtaattcacg aaataaacct atggtttacg 60 aaatgatcca cgaaaatcat gttattattt acatcaacat atcgcgaaaa ttcatgtcat 120 gtccacatta acatcattgc agagcaacaa ttcattttca tagagaaatt tgctactatc 180 acccactagt actaccattg gtacctacta ctttgaattg tactaccgct gggcgttatt 240 aggtgtgaaa ccacgaaaag ttcaccataa cttcgaataa agtcgcggaa aaaagtaaac 300 agctattgct actcaaatga ggtttgcaga agcttgttga agcatgatga agcgttctaa 360 acgcactatt catcattaaa tatttaaagc tcataaaatt gtattcaatt cctattctaa 420 atggctttta tttctattac aactattagc tctaaatcca tatcctcata agcagcaatc 480 aattctatct atactttaaa 500
<210> 4 <211> 200 <212> DNA <213> Artificia1 sequence
<220> <223> synthetic: ho downstream integration secjuence
<400> 4 aatgtgtata ttagtttaaa aagttgtatg taataaaagt aaaatttaat attttggatg 60 aaaaaaacca tttttagact ttttcttaac tagaatgctg gagtagaaat acgccatctc 120 aagatacaaa aagcgttacc ggcactgatt tgtrtcaacc agratataga ttattattgg 180 gtcttgatca actttcctca 200
<210> 5 <211> 490 <212> DNA <213> Artificia1 Sequence
<220> <223> Synthetic: YGR25ÓC upstream integration sequence
<400> 5 página 2
107345_104_sequence_Ljsting gtacgatgtt tctcccgctg atccgattac tagccgaaga cgtaaaattg gcgcttgatt 60 caatttatgc cctrcccggg aatagttgac caaagggcaa aaaaattcag tcggagattc 120 cctattgggc ggaatttagt agatctcttt ccgtgcataa cgcctgcccg ttagtcgtta 180 tttcacgtta acattttctt ggccactgcg ctatataaat aaatacatat atatatgtca 240 agcacaataa agaaacttcc cttaaatatt gaataagtaa ataatagttg aaaagtgcct 300 tttgttcgaa ggattagagt gttcttaatt ttagttcgtt caacggtctc aaaaaaagtg 360 tgaacaagta aagcatagca cacatcccaa attacaaggc accctgatta aaaatccaaa 420 aataaaccat aagttttatt ttactaaaaa cattatacgt gaaagacaaa ccgcatcaga 480 agtttcgagg 490
<210> 6 <211> 185 <212> DNA <213> Artificia1 Sequence <220> <223> synthetic: YGR250c downstream integration sequence <400> 6 attgcatcag gtccataaaa tgtttttgtc tgcttttttt tcttcatgta ttagttggtt 60 tttattttta tattttcatt tatcttattc atacttttta ctcctttttt cttcattctt 120 tacgatcttg gacattcaac tagcctatgg taacttttct tattactttg cccctccttg 180 aggtg 185
<210> 7 <211> S04 <212> DNA <213> Artificia1 Sequence <220> <223> synthetic: NDT80 upstream integration sequence <400> 7 catcaagcgc tccaagctga cataaatcgc actttgtatc tacttttttt tattcgaaaa 60 caaggcacaa caatgaatct atcgccctgt gagattttca atctcaagtt tgtgtaatag 120 atagcgttat attatagaac tataaaggtc cttgaatata catagtgttt cattcctatt 180 actgtatatg tgactttaca ttgttacttc cgcggctatt tgacgttttc tgcttcaggt 240 gcggctrgga gggcaaagtg tcagaaaatc ggccaggccg tatgacacaa aagagtagaa 300 aacgagatct caaatatctc gaggcctgtc ctctatacaa ccgcccagct ctctgacaaa 360 gctccagaac ggttgtcttt tgtttcgaaa agccaaggtc ccttataatt gccctccatt 420 ttgtgtcacc tatttaagca aaaaattgaa agtttactaa cctttcatta aagagaaata 480 acaatattat aaaaagcgct taaa 504 pági na 3
107345_104_sequence_Listing
<210> 8 <211> 202 <212> DNA <213> Artificia1 Sequence
<220> <223> Synthetic: NDT80 downstream integration sequence
<400> 8 ataaactaat gattttaaat cgttaaaaaa atatgcgaat tctgtggatc gaacacagga 60 cctccagata acttgaccga agttttttct tcagtctggc gctctcccaa ctgagctaaa 120 tccgcttact atttgttatc agttcccttc atatctacat agaataggtt aagtatttta 180 ttagttgcca gaagaactac tg 202
<210> 9 <211> 43 <212> DNA <213> Artifjcia1 Sequence
<220> <223> Synthetic: Recognition sequence for zFN.gfp <400> 9 acaactacaa cagccacaac gtctatatca tggccgacaa gca 43
<210> 10 <211> 31 <212> DNA <213> Artjfjcia1 Sequence <220> <223> synthetic: Forward primer specific to Em.GFp
<400> 10 caactacaac agccacaagg tctatatcac c 31
<210> 11 <211> 22 <212> DNA <213> Artificia1 sequence
<220> <223> Synthetic: Reverse primer for ho locus
<400> 11 ctctaacgct gttggtagat tg 22
<210> 12 <211> 39 <212> DNA <213> Artificia1 sequence
<220> <223> synthetic: Rêverse primer for NDT80 locus página 4 l07345_104_sequencê_Listing <400> 12 accatgtgat aatacactac taatgtgact actagttga 39
<210> 13 <211> 30 <212> DNA <213> Artificia1 sequence <220> <223> Synthetic: Rêverse primer for ygr250c locus
<400> 13 tcagacgcgt tcggaggaga gtgcattcac 30
<210> 14 <211> 5251 <212> DNA <213> Artificia1 sequence
<220> <223> Synthetic: Integration construct i8
<400> 14 ttgcctatgc tttgtttgct ttgaacactt gtttccgctc tccttttact tattggctac 60 taaaactacg tgtaaaagat cgcccagcgc aaaaaggtcc ggcggtttca aataatctcg 120 aactattcct ataatatgca aaatagtagg taggaacaag tcgactctag gcagataagg 180 aagatgtccg gtaaatggag actagtgctg accgggatag gcaatccaga gcctcagtac 240 gctggtaccc gtcacaatgt agggctatat atgctggagc tgctacgaaa gcggcttggt 300 ctgcagggga gaacttattc ccctgtgcct aatacgggcg gcaaagtgca ttatatagaa 360 gacgaacatt gtacgatact aagatcggat ggccagtaca tgaatctaag tggagaacag 420 gtgtgcaagg tctgggcccg gtacgccaag taccaagccc gacacgtagt tattcatgac 480 gagttaagtg tggcgtgtgg aaaagtgcag ctcagagccc ccagcaccag tattagaggt 540 cataatgggc tgcgaagcct gctaaaatgc agtggaggcc gtgtaccctt tgccaaattg 600 gctattggaa tcggcagaga acctgggtcc cgttctagag accctgcgag cgtgtcccgg 660 tgggttctgg gagctctaac tccgcaggaa ctacaaacct tçcttacaca gagtgaacct 720 gctgcctggc gtgctctgac tcagtacatt tcatagtgga tggcggcgtt agtatcgaat 780 cgacagcagt atagcgacca gcattcacat acgattgacg catgatatta ctttctgcgc 840 acttaacttc gcatctgggc agatgatgtc gaggcgaaaa aaaatataaa tcacgctaac 900 atttgattaa aatagaacaa ctacaatata aaaaaactat acaaatgaca agttcttgaa 960 aacaagaatc tttttattgt cagtactgat tagaaaaact catcgagcat caaatgaaac 1020 tgcaatttat tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat 1080 gaaggagaaa actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg 1140 página 5
107345_104_sequence_Listing attccgactc gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta 1200 tcaagtgaga aatcaccatg agtgacgact gaatccggtg agaatggcaa aagcttatgc 1260 atttctttcc agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca 1320 tcaaccaaac cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg 1380 ttaaaaggac aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca 1440 tcaacaatat tttcacctga atcaggatat tcttctaata cctggaatgc tgttttgccg 1500 gggatcgcag tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc 1560 ggaagaggca taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg 1620 gcaacgctac ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat 1680 cgatagattg tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa 1740 tcagcatcca tgttggaatt taatcgcggc ctcgaaacgt gagtcttttc cttacccatg 1800 gttgtttatg ttcggatgtg atgtgagaac tgtatcctag caagatttta aaaggaagta 1860 tatgaaagaa gaacctcagt ggcaaatcct aaccttttat atttctctac aggggcgcgg 1920 cgtggggaca attcaacgcg tctgtgaggg gagcgtttcc ctgctcgcag gtctgcagcg 1980 aggagccgta atttttgctt cgcgccgtgc ggccatcaaa atgtatggat gcaaatgatt 2040 atacatgggg atgtatgggc taaatgtacg ggcgacagtc acatcatgcc cctgagctgc 2100 gcacgtcaag actgtcaagg agggtattct gggcctccat gtcgctggcc gggtgacccg 2160 gcggggacga ggcaagctaa acagatctga tcttgaaact gagtaagatg ctcagaatac 2220 ccgtcaagat aagagtataa tgtagagtaa tataccaagt attcagcata ttctcctctt 2280 cttttgtata aatcacggaa gggatgattt ataagaaaaa tgaatactat tacacttcat 2340 ttaccaccct ctgatctaga ttttccaacg atatgtacgt agtggtataa ggtgaggggg 2400 tccacagata taacatcgtt taatttagta ctaacagaga cttttgtcac aactacatar 2460 aagtgtacaa atatagtaca gatatgacac acttgtagcg ccaacgcgca tcctacggat 2520 tgctgacaga aaaaaaggtc acgtgaccag aaaagtcacg tgtaattttg taactcaccg 2580 cattctagcg gtccctgtcg tgcacactgc actcaacacc ataaacctta gcaacctcca 2640 aaggaaatca ccgtataaca aagccacagt tttacaactt agtctcttat gaagttactt 2700 accaatgaga aatagaggct ctttctcgag aaatatgaat atggatatat atatatatat 2760 atatatatat atatatatat gtaaacttgg ttctttttta gcttgtgatc tctagcttgg 2820 gtctctctct gtcgtaacag ttgtgatatc ggaagaagag aaaagacgaa gagcagaagc 2880 ggaaaacgta tacacgtcac atatcacaca cacacaatgg gaaagctatt acaattggca 2940 ttgcarccgg tcgagatgaa ggcagctttg aagctgaagt tttgcagaac accgctattc 3000 página 6
107345_104_sequence_Listing tccatctatg atcagtccac gtctccatat ctcttgcact gtttcgaact gttgaacttg 3060 acctccagat cgtttgctgc tgtgatcaga gagctgcatc cagaattgag aaacrgtgtt 3120 actctctttt atttgatttt aagggctttg gataccatcg aagacgatat gtccatcgaa 3180 cacgatttga aaattgactt gttgcgtcac ttccacgaga aattgttgtt aactaaatgg 3240 agtttcgacg gaaatgcccc cgatgtgaag gacagagccg ttttgacaga tttcgaatcg 3300 attcttattg aattccacaa attgaaacca gaatatcaag aagtcatcaa ggagatcacc 3360 gagaaaatgg gtaatggtat ggccgactac atcttagatg aaaattacaa cttgaatggg 3420 ttgcaaaccg tccacgacta cgacgtgtac tgtcactacg tagctggttt ggtcggtgat 3480 ggtttgaccc gtttgattgt cattgccaag tttgccaacg aatctttgta ttctaatgag 3540 caattgtatg aaagcatggg tcttttccta caaaaaacca acatcatcag agattacaat 3600 gaagatttgg tcgatggtag atccttctgg cccaaggaaa tctggtcaca atacgctcct 3660 cagttgaagg acttcatgaa acctgaaaac gaacaactgg ggttggactg tataaaccac 3720 ctcgtcttaa acgcattgag tcatgttatc gatgtgttga cttatttggc cggtatccac 3780 gagcaatcca ctttccaatt ttgtgccatt ccccaagtta tggccattgc aaccttggct 3840 ttggtattca acaaccgtga agtgctacat ggcaatgtaa agattcgtaa gggtactacc 3900 tgctatttaa ttttgaaatc aaggactttg cgtggctgtg tcgagatttt tgactattac 3960 ttacgtgata tcaaatctaa attggctgtg caagatccaa atttcttaaa attgaacatt 4020 caaatctcca agatcgaaca gtttatggaa gaaatgtacc aggataaatt acctcctaac 4080 gtgaagccaa atgaaactcc aattttcttg aaagttaaag aaagatccag atacgatgat 4140 gaattggttc caacccaaca agaagaagag tacaagttca atatggtttt atctatcatc 4200 ttgtccgttc ttcttgggtt ttattatata tacactttac acagagcgtg aagtctgcgc 4260 caaataacat aaacaaacaa ctccgaacaa raactaagta cttacataat aggtagaggc 4320 ctatccttaa agataacctt atatttcatt acatcaacta attcgacctt attatctttc 4380 gaattgaaat gcattatacc catcggtacg tctagctttg tcaccttccc cagtaaacgc 4440 tgtttcttgc cgacaaacaa tgtggccctc tctccgtcaa tctgtaacga cccaaatcgt 4500 attaaagttt cgccgtcctg ttcactgaac cttccctcat ttggagaatc tctcctcgcc 4560 agcgacgcaa agtccttagg caactctagt tcaccttgaa tctccagcat catcatccca 4620 agcggtgtta tcaccgtggt ctgcttttct cttgactgtg tcaacttctg ccattgacta 4680 gcatctatat ctacactagg cattcttttc agctgtttat tgggctgaat gatagtgata 4740 attctttttt ctatcactcc tttggctata ttagtggtta gcttactaaa aaagattaaa 4800 ggaaaaatga aattcaagat gctaacgttg acatgtatat tttaagaaaa caaaaatcat 4860 acaaagagga gatcggatat aaaagaataa cataaatatg tttagtgcat taggtaaatg 4920 págjna 7
107345_104_sequence_Listing ggtccgaggc tctcgcaatg ataaggactt tgtgacgaag tataccgcag atttatcaca 4980 aataacttca cagatccatc aattagatgt cgcgttaaag aaaagccaat ccatcttgag 5040 tcaatggcaa tcaaatctga ccttttatgg tattgcgtta acggtattgg ccctgagcta 5100 cacatattgg gagtaccatg gttatcgacc ataccttgtg gtgactgcgc tactatgcat 5160 aggctcgcta atcttgttca aatgggcatt aaccaaactc tatgcatttt ataacaacaa 5220 taggttacgc aagttggcaa aactccgtgc a 5251
<210> 15 <211> 70 <212> DNA <213> Artificia1 sequence
<220> <223> Synthetic: primer 61-67-CPK066-G
<400> 15 ggtaagacgg ttgggtttta tcttttgcag ttggtactat taagaacaat cacaggaaac 60 agctatgacc 70
<210> 16 <211> 70 <212> DNA <213> Artificja1 sequence
<220> <223> synthetic: primer 61-67-CPK067-G
<400> 16 ttgcgttttg tactttggtt cgctcaattt tgcaggtaga taatcgaaaa gttgtaaaac 60 gacggccagt 70
<210> 17 <211> 4162 <212> DNA <213> Artifjcia1 sequence
<220> <223> synthetic: Integration construct i32
<400> 17 gcctgtctac aggataaaga cgggtcggat acctgcacaa gcaatttggc acctgcatac 60 cccatttccc cagtagataa cttcaacaca cacatcaatg tccctcacca gtttatttcc 120 aaaagagacg ctttttacta cctgactaga ttttcatttt gtttcttttg gattgcgctt 180 gcctttgtag gtgtgtcgtt tatcctttac gttttgactt ggtgctcgaa gatgctttca 240 gagatggtgc ttatcctcat gtcttttggg tttgtcttca atacggcagc cgttgtcttg 300 caaacggccg cctctgccat ggcaaagaat gctttccarg acgatcatcg tagtgcccaa 360 página 8
107345_104_sequence_Ljsting ttgggtgcct ctatgatggg tatggcttgg gcaagtgtct ttttatgtat cgtggaattt 420 atcctgctgg tcttctggtc tgttagggca aggttggcct ctacttactc catcgacaat 480 tcaagataca gaacctcctc cagatggaat cccttccata gagagaagga gcaagcaact 540 gacccaatat tgactgccac tggacctgaa gacatgcaac aaagtgcaag catagtgggg 600 ccttcttcca atgctaatcc ggtcactgcc actgctgcta cggaaaacca acctaaaggt 660 attaacttct tcactataag aaaatcacac gagcgcccgg acgatgtctc tgtttaaatg 720 gcgcaagttt tccgctttgt aatatatatt tatacccctt tcttctctcc cctgcaatat 780 aatagtttaa ttctaatatt aataatatcc tatattttct tcatttaccg gcgcactctc 840 gcccgaacga cctcaaaatg tctgctacat tcataataac caaaagctca taactttttt 900 ttttgaacct gaatatatat acatcacata tcactgctgg tccttgccga ccagcgtata 960 caatctcgat agttggtttc ccgttctttc cactcccgtc cacaggaaac agctatgacc 1020 atgattacgc caagctattt aggtgacact atagaatact caagctatgc atcaagcttg 1080 gtaccgagct cggatccact agtaacggcc gccagtgtgc tggaattcgc cctgtcgaca 1140 ctagtaatac acatcatcgt cctacaagtt catcaaagtg ttggacagac aactatacca 1200 gcatggatct cttgtatcgg ttcttttctc ccgctctctc gcaataacaa tgaacactgg 1260 gtcaatcata gcctacacag gtgaacagag tagcgtttat acagggttta tacggtgatt 1320 cctacggcaa aaatttttca tttctaaaaa aaaaaagaaa aatttttctt tccaacgcta 1380 gaaggaaaag aaaaatctaa ttaaattgat ttggtgattt tctgagagtt ccctttttca 1440 tatatcgaat tttgaatata aaaggagatc gaaaaaattt ttctattcaa tctgttrtct 1500 ggttttattt gatagttttt ttgtgtatta ttattatgga ttagtactgg tttatatggg 1560 tttttctgta taacttcttt ttattttagt ttgtttaatc ttattttgag ttacattata 1620 gttccctaac tgcaagagaa gtaacattaa aaatgaaaaa gcctgaactc accgcgacgt 1680 ctgtcgagaa gtttctgatc gaaaagttcg acagcgtctc cgacctgatg cagctctcgg 1740 agggcgaaga atctcgtgct ttcagcttcg atgtaggagg gcgtggatat gtcctgcggg 1800 taaatagctg cgccgatggt ttctacaaag atcgttatgt ttatcggcac tttgcatcgg 1860 ccgcgctccc gattccggaa gtgcttgaca ttggggaatt cagcgagagc ctgacctatt 1920 gcatctcccg ccgtgcacag ggtgtcacgt tgcaagacct gcctgaaacc gaactgcccg 1980 ctgttctgca gccggtcgcg gaggccatgg atgcgatcgc tgcggccgat cttagccaça 2040 cgagcgggtt cggcccattc ggaccgcaag gaatcggtca atacactaca tggcgtgatt 2100 tcatatgcgc gattgctgat ccccatgtgt atcactggca aactgtgatg gacgacaccg 2160 tcagtgcgtc cgtcgcgcag gctctcgatg agctgatgct ttgggccgag gactgccccg 2220 aagtccggca cctcgtgcac gcggatttcg gctccaacaa tgtcctgacg gacaatggcc 2280 página 9
107345_104_sequence_Ljsting gcataacagc ggtcattgac tggagcgagg cgatgttcgg ggattcccaa tacgaggtcg 2340 ccaacatctt cttctggagg ccgtggttgg cttgtatgga gcagcagacg cgctacttcg 2400 agcggaggca tccggagctt gcaggatcgc cgcggctccg ggcgtatatg ctccgcattg 2460 gtcttgacca actctatcag agcttggttg acggcaattt cgatgatgca gcttgggcgc 2520 agggtcgatg cgacgcaatc gtccgatccg gagccgggac tgtcgggcgt acacaaatcg 2580 cccgcagaag cgcggccgtc tggaccgatg gctgtgtaga agtactcgcc gatagtggaa 2640 accgacgccc cagcactcgt ccgagggcaa aggaataggt ttaacttgat actactagat 2700 tttttctctt catttataaa atttttggtt ataattgaag ctttagaagt atgaaaaaat 2760 cctttttttt cattctttgc aaccaaaata agaagcttct tttattcatt gaaatgatga 2820 arataaacct aacaaaagaa aaagactcga atatcaaaca ttaaaaaaaa ataaaagagg 2880 ttatctgttt tcccatttag ttggagtttg cattttctaa tagatagaac tctcaattaa 2940 tgtggattta gtttctctgt tcgttttttt ttgttttgtt ctcactgtat ttacatttct 3000 atttagtatt tagttattca tataatctta acttctcgag gagctctaag ggcgaattct 3060 gcagatatcc atcacactgg cggccgctcg agcatgcatc tagagggccc aattcgccct 3120 atagtgagtc gtattacaat tcactggccg tcgttttaca acaagcatct tgccctgtgc 3180 ttggccccca gtgcagcgaa cgttataaaa acgaatactg agtatatatc tatgtaaaac 3240 aaccatatca tttcttgttc tgaactttgt ttacctaact agttttaaat ttcccttttt 3300 cgtgcatgcg ggtgttctta tttattagca tactacattt gaaatatcaa atttccttag 3360 tagaaaagtg agagaaggtg cactgacaca aaaaataaaa tgctacgtat aactgtcaaa 3420 actttgcagc agcgggcatc cttccatcat agcttcaaac atattagcgt tcctgatctt 3480 catacccgtg ctcaaaatga tcaaacaaac tgttattgcc aagaaataaa cgcaaggctg 3540 ccttcaaaaa ctgatccatt agatcctcat atcaagcttc ctcatagaac gcccaattac 3600 aataagcatg ttttgctgtt atcaccgggt gataggtttg ctcaaccatg gaaggtagca 3660 tggaatcata atttggatac taatacaaat cggccatata atgccattag taaattgcgc 3720 tcccatttag gtggttctcc aggaatacta ataaatgcgg tgcatttgca aaatgaattt 3780 attccaaggc caaaacaaca cgatgaatgg ctttattttt ttgttattcc tgacatgaag 3840 ctttatgtaa ttaaggaaac ggacatcgag gaatttgcat cttttttaga tgaaggagct 3900 attcaagcac caaagctatc cttccaggat tatttaagcg gtaaggccaa ggcttcccaa 3960 caggttcatg aagtgcatca tagaaagctt acaaggtttc agggtgaaac ttttctaaga 4020 gattggaact tagtctgtgg gcattataag agagatgcta agtgtggaga aatgggaccc 4080 gacataattg cagcatttca agatgaaaag ctttttcctg agaataatct agccttaatt 4140 página 10
107345_104_sequence_Ljsting tctcatattg ggggtcatat tt 4162
<210> 18 <211> 7879 <212> DNA <213> Artificial sequence
<220> <223> Synthetic: Integration construct i33
<220> <221> misc feature <222> (270)..(270) <223> n is a, C, g, or t
<400> 18 atgaattggc cagttttttc caattatgga acgcctgttc ctgatccacg gcctgcactt 60 gcgaccacaa ttccacacct gaggcgcctg cctcttttcc agcatgtggc aactgtcccc 120 acgacagggc atcccagaat cctctggtaa atcttaaatg aaactgacgc gtggcagtag 180 attccaacaa tggtgggatg gcccgtggga aagtcgtgta gtgctcatac gcatcatatg 240 acatggatga tacggccggg tcaaacggtn cgattgcagt tggaatgcaa atgagagtag 300 cagatcattg ttgggcagcg gcttcaacac cagtgcttcg tcgtacggat accataaact 360 gtcatttata ccaatctgcg acaccgtgtc ttctgcgaac acacccagca gtagagtgcc 420 cagcatgaaa taggccagtg tgaggatcat cgtcgtcttg cctatgcttt gtttgctttg 480 aacacttgtt tccgctctcc ttttacttat tggctactaa aactacgtgt aaaagatcgc 540 ccagcgcaaa aaggtccggc ggtttcaaat aatctcgaac tat.tcctata atatgcaaaa 600 tagtaggtag gaacaagtca actctaggca gataacgaag atgtccggta aatggagact 660 agtgctgact gggataggca atccagagcc tcagtacgct ggcacccgtc acaatgtagg 720 gctatatatg ctggagctgc tacgaaagcg gcttggtctg caggggagaa cttattcccc 780 tgtgcctaat acgggcggca aagtgcatta tatagaagac gaacattgta cgatactaag 840 atcggatggc cagtacatga atctaagtgg agaacaggtg tgcaaggtct gggcccggta 900 cgccaagtac caagcccgac acgttgttat tcatgacgag ttaagtgtgg cgtgtggaaa 960 agtgcagctc agagccccca gcaccagtat tagaggtcat aatgggctgc gaagcctgct 1020 aaaatgcagt ggaggccgtg taccctttgc caaattggct attggaatcg gcagagaacc 1080 tgggtcccgt tctagagacc ctgcgagcgt gtcccggtgg gttctgggag ctctaactcc 1140 gcaggaacta caaaccttgc ttacacagag tgaacctgct gcctggcgtg ctctgactca 1200 gtacatttca taggacagca ttcgcccagt atttttttta ttctacaaac cttctataat 1260 ttcaaagtat ttacataatt ctgtatcagt ttaatcacca taatatcgtt ttctttgttt 1320 agtgcaatta atttttccta ttgttacttc gggccttttt ctgttttatg agctattttt 1380 págjna ll
107345_104_sequence_Listjng tccgtcatcc ttccggatcc agattttcag cttcatctcc agattgtgtc tacgtaatgc 1440 acgccatcat tttaagagag gacagagaag caagcctcct gaaagatgaa gctactgtct 1500 tctatcgaac aagcatgcga tatttgccga cttaaaaagc tcaagtgctc caaagaaaaa 1560 ccgaagtgcg ccaagtgtct gaagaacaac tgggagtgtc gctactctcc caaaaccaaa 1620 aggtctccgc tgactagggc acatctgaca gaagtggaat caaggctaga aagactggaa 1680 cagctatttc tactgatttt tcctcgagaa gaccttgaca tgattttgaa aatggattct 1740 ttacaggata taaaagcatt gttaacagga ttatttgtac aagataatgt gaataaagat 1800 gccgtcacag atagattggc ttcagtggag actgatatgc ctctaacatt gagacagcat 1860 agaataagtg cgacatcatc atcggaagag agtagtaaca aaggtcaaag acagttgact 1920 gtatcgattg actcggcagc tcatcatgat aactccacaa ttccgttgga ttttatgccc 1980 agggatgctc ttcatggatt tgattggtct gaagaggatg acatgtcgga tggcttgccc 2040 ttcctgaaaa cggaccccaa caataatggg ttctttggcg acggttctct cttatgtatt 2100 cttcgatcta ttggctttaa accggaaaat tacacgaact ctaacgttaa caggctcccg 2160 accatgatta cggatagata cacgttggct tctagatcca caacatcccg tttacttcaa 2220 agttatctca ataattttca cccctactgc cctatcgtgc actcaccgac gctaatgatg 2280 ttgtataata accagattga aatcgcgtcg aaggatcaat ggcaaatcct ttttaactgc 2340 atattagcca ttggagcctg gtgtatagag ggggaatcta ctgatataga tgttttttac 2400 tatcaaaatg ctaaatctca tttgacgagc aaggtcttcg agtcaggttc cataattttg 2460 gtgacagccc tacatcttct gtcgcgatat acacagtgga ggcagaaaac aaatactagc 2520 tataattttc acagcttttc cataagaatg gccatatcat tgggcttgaa tagggacctc 2580 ccctcgtcct tcagtgatag cagcattctg gaacaaagac gccgaatttg gtggtctgtc 2640 tactcttggg agatccaatt gtccctgctt tatggtcgat ccatccagct ttctcagaat 2700 acaatctcct tcccttcttc tgtcgacgat gtgcagcgta ccacaacagg tcccaccata 2760 tatcatggca tcattgaaac agcaaggctc ttacaagttt tcacaaaaat ctatgaacta 2820 gacaaaacag taactgcaga aaaaagtcct atatgtgcaa aaaaatgctt gatgatttgt 2880 aatgagattg aggaggtttc gagacaggca ccaaagtttt tacaaatgga tatttccacc 2940 accgctctaa ccaatttgtt gaaggaacac ccttggctat cctttacaag attcgaactg 3000 aagtggaaac agttgtctct tatcatttat gtattaagag attttttcac taattttacc 3060 cagaaaaagt cacaactaga acaggatcaa aatgatcatc aaagttatga agttaaacga 3120 tgctccatca tgttaagcga tgcagcacaa agaactgtta tgtctgtaag tagctatatg 3180 gacaatcata atgtcacccc atattttgcc tggaattgtt cttattactt gttcaatgca 3240 págjna 12
107345_104_sequencê_Listing gtcctagtac ccataaagac tctactctca aactcaaaat cgaatgctga gaataacgag 3300 accgcacaat tattacaaca aattaacact gttctgatgc tattaaaaaa actggccact 3360 tttaaaatcc agacttgtga aaaatacatt caagtactgg aagaggtatg tgcgccgttt 3420 ctgttatcac agtgtgcaat cccattaccg catatcagtt ataacaatag taatggtagc 3480 gccattaaaa atattgtcgg ttctgcaact atcgcccaat accctactct tccggaggaa 3540 aatgtcaaca atatcagtgt taaatatgtt tctcctggct cagtagggcc ttcacctgtg 3600 ccattgaaat caggagcaag tttcagtgat ctagtcaagc tgttatctaa ccgtccaccc 3660 tctcgtaact ctccagtgac aataccaaga agcacacctt cgcatcgctc agtcacgcct 3720 tttctagggc aacagcaaca gctgcaatca ttagtgccac tgaccccgtc tgctttgttt 3780 ggtggcgcca attttaatca aagtgggaat attgctgata gctcattgtc cttcactttc 3840 actaacagta gcaacggtcc gaacctcata acaactcaaa caaattctca agcgctttca 3900 caaccaattg cctcctctaa cgttcatgat aacttcatga ataatgaaat cacggctagt 3960 aaaattgatg atggtaataa ttcaaaacca ctgtcacctg gttggacgga ccaaactgcg 4020 tataacgcgt ttggaatcac tacagggatg tttaatacca ctacaatgga tgatgtatat 4080 aactatctat tcgatgatga agatacccca ccaaacccaa aaaaagagta aaatgaatcg 4140 tagatactga aaaaccccgc aagttcactt caactgtgca tcgtgcacca tctcaatttc 4200 tttcatttat acatcgtttt gccttctttt atgtaactat actcctctaa gtttcaatct 4260 tggccatgta acctctgatc tatagaattt tttaaatgac tagaattaat gcccatcttt 4320 tttttggacc taaattcttc atgaaaatat attacgaggg cttattcaga agcttcgctc 4380 agtcgacact açtaatacac atcatcgtcc tacaagttca tcaaagtgtt ggacagacaa 4440 ctataccagc atgçjatctct tgtatcggtt cttttctccc gctctctcgc aataacaatg 4500 aacactgggt caatcatagc ctacacaggt gaacagagta gcgrttatac agggtttata 4560 cggtgattcc tacggcaaaa atttttcatt tctaaaaaaa aaaagaaaaa tttttctttc 4620 caacgctaga aggaaaagaa aaatctaatt aaattgattt ggtgattttc tgagagttcc 4680 ctttttcata tatcgaattt tgaatataaa aggagatcga aaaaattttt ctattcaatc 4740 tgttttctgg ttttatttga tagttttttt gtgtattatt attatggatt agtactggtt 4800 tatatgggtt tttctgtata acttcttttt attttagttt gtttaatctt attttgagtt 4860 acattatagt tccctaactg caagagaagt aacattaaaa atgaccactc ttgacgacac 4920 ggcttaccgg taccgcacca gtgtcccggg ggacgccgag gccatcgagg cactggatgg 4980 gtccttcacc accgacaccg tcttccgcgt caccgccacc ggggacggct tcaccctgcg 5040 ggaggtgccg gtggacccgc ccctgaccaa ggtgttcccc gacgacgaat cggacgacga 5100 atcggacgcc ggggaggacg gcgacccgga ctcccggacg ttcgtcgcgt acggggacga 5160 página 13
107345_104_sequence_Ljsting cggcgacctg gcgggcttcg tggtcgtctc gtactccggc tggaaccgcc ggctgaccgt 5220 cgaggacatc gaggtcgccc cggagcaccg ggggcacggg gtcgggcgcg cgttgatggg 5280 gctcgcgacg gagttcgccc gcgagcgggg cgccgggcac ctctggctgg aggtcaccaa 5340 cgtcaacgca ccggcgatcc acgcgtaccg gcggatgggg ttcaccctct gcggcctgga 5400 caccgccctg tacgacggca ccgcctcgga cggcgagcag gcgctctaca tgagcatgcc 5460 ctgcccctga gtttaacttg atactactag attttttctc ttcatttata aaatttttgg 5520 ttataattga agctttagaa gtatgaaaaa atcctttttt ttcattcttt gcaaccaaaa 5580 taagaagctt cttttattca ttgaaatgat gaatataaac ctaacaaaag aaaaagactc 5640 gaatatcaaa cattaaaaaa aaataaaaga ggttatctgt tttcccattt agttggagtt 5700 tgcattttct aatagataga actctcaatt aatgtggatt tagtttctct gttcgttttt 5760 ttttgttttg ttctcactgt atttacattt ctatttagta tttagttatt catataatct 5820 taacttctcg aggagctcga tcttgaaact gagtaagatg ctcagaatac ccgtcaagat 5880 aagagtataa tgtagagtaa tataccaagt attcagcata ttctcctctt cttttgtata 5940 aatcacggaa gggatgattt ataagaaaaa tgaatactat tacacttcat ttaccaccct 6000 ctgatctaga ttttccaacg atatgtacgt agtggtataa ggtgaggggg tccacagata 6060 taacatcgtt taatttagta ctaacagaga cttttgtcac aactacatat aagtgtacaa 6120 atatagtaca gatatgacac acttgtagcg ccaacgcgca tcctacggat tgctgacaga 6180 aaaaaaggtc acgtgaccag aaaagtcacg tgtaattttg taactcaccg cattctagcg 6240 gtccctgtcg tgcacactgc actcaacacc ataaacctta gcaacctcca aaggaaatca 6300 ccgtataaca aagccacagt tttacaactt agtctcttat gaagtgtctc tctctgtcgt 6360 aacagttgtg atatcggaag aagagaaaag acgaagagca gaagcggaaa acgtatacac 6420 gtcacatatc acacacacac aatgggaaag ctattacaat tggcattgca tccggtcgag 6480 atgaaggcag ctttgaagct gaagttttgc agaacaccgc tattctccat ctatgatcag 6S40 tccacgtctc catatctctt gcactgtttc gaactgttga acttgacctc cagatcgttt 6600 gctgctgtga tcagagagct gcatccagaa ttgagaaact gtgttactct cttttatttg 6660 attttaaggg ctttggatac catcgaagac gatatgtcca tcgaacacga tttgaaaatt 6720 gacttgttgc gtcacttcca cgagaaattg ttgttaacta aatggagttt cgacggaaat 6780 gcccccgatg tgaaggacag agccgttttg acagatttcg aatcgattct tattgaattc 6840 cacaaattga aaccagaata tcaagaagtc atcaaggaga tcaccgagaa aatgggtaat 6900 ggtatggccg actacatctt ggatgaaaat tacaacttga atgggttgca aaccgtccac 6960 gactacgacg tgtactgtca ctacgtagct ggtttggtcg gtgatggttt gacccgtttg 7020 págjna 14
107345_104_Sequence_Listing attgtcattg ccaagtttgc caacgaatct ttgtattcta atgagcaatt gtatgaaagc 7080 atgggtcttt tcctacaaaa aaccaacatc atcagagact acaatgaaga tttggtcgat 7140 ggtagatcct tctggcccaa ggaaatctgg tcacaatacg ctcctcagtt gaaggacttc 7200 atgaaacctg aaaacgaaca actggggttg gactgtataa accacctcgt cttaaacgca 7260 ttgagtcatg ttatcgatgt gttgacttat ttggccagta tccacgagca atccactttc 7320 caattttgtg ccattcccca agttatggcc attgcaacct tggctttggt attcaacaac 7380 cgtgaagtgc tacatggcaa tgtaaagatt cgtaagggta ctacctgcta tttaattttg 7440 aaatcaagga ctttgcgtgg ctgtgtcgag atttttgact attacttacg tgatatcaaa 7500 tctaaattgg ctgtgcaaga tccaaatttc ttaaaattga acattcaaat ctccaagatc 7560 gaacaattca tggaagaaat gtaccaggat aaattacctc ctaacgtgaa gccaaatgaa 7620 actccaattt tcttgaaagt taaagaaaga tccagatacg atgatgaatt ggtcccaacc 7680 caacaagaag aagagtacaa gttcaatatg gttttatcta tcatcttgtc cgttcttctt 7740 gggttttatt atatatacac tttacacaga gcgtgaagtc tgcgccaaat aacataaaca 7800 aacaactccg aacaataact aagtacttac ataataggta gaggcctatc cttaaagata 7860 accttatatt tcattacat 7879
<210> 19 <211> 5714 <212> DNA <213> Artifjcja1 Sequence
<220> <223> Synthetic: Integration construct i37
<400> 19 gcctgtctac aggataaaga cgggtcggat acctgcacaa gcaatttggc acctgcatac 60 cccatttccc cagtagataa cttcaacaca cacatcaatg tccctcacca gtttatttcc 120 aaaagagacg ctttttacta cctgactaga ttttcatttt gtttcttttg gattgcgctt 180 gcctttgtag gtgtgtcgtt tatcctttac gttttgactt ggtgctcgaa gatgctttca 240 gagatggtgc ttatcctcat gtcttttggg tttgtcttca atacggcagc cgttgtcttg 300 caaacggccg cctctgccat ggcaaagaat gctttccatg acgatcatcg tagtgcccaa 360 ttgggtgcct ctatgatggg tttaaacgta tggcttgggc aagtgtcttt ttatgtatcg 420 rggaatttat cctgctggtc ttctggtctg ttagggcaag gttggcctct acttactcca 480 tcgacaattc aagatacaga acctcctcca gatggaatcc cttccataga gagaaggagc 540 aagcaactga cccaatattg actgccactg gacctgaaga catgcaacaa agtgcaagca 600 tagtggggcc ttcttccaat gctaatccgg tcactgccac tgctgctacg gaaaaccaac 660 ctaaaggtat taacttcttc actataagaa aatcacacga gcgcccggac gatgtctctg 720 págjna 15
107345_104_Sequence_Listinç tttaaatggc gcaagttttc cgctttgtaa tatatattta tacccctttc ttctctcccc 780 tgcaatataa tagtttaatt ctaatattaa taatatccta tattttcttc atttaccggc 840 gcactctcgc ccgaacgacc tcaaaatgtc tgctacattc ataataacca aaagctcata 900 actttttttt ttgaacctga atatatatac atcacatatc actgctggtc ctgagaagtt 960 aagattatat gaataactaa atactaaata gaaatgtaaa tacagtgaga acaaaacaaa 1020 aaaaaacgaa cagagaaact aaatccacat taattgagag ttctatctat tagaaaatgc 1080 aaactccaac taaatgggaa aacagataac ctcttttatt tttttttaat gtttgatatt 1140 cgagtctttt tcttttgtta ggtttatatt catcatttca atgaataaaa gaagcttctt 1200 attttggttg caaagaatga aaaaaaagga ttttttcata cttctaaagc ttcaattata 1260 accaaaaatt ttataaatga agagaaaaaa tctagtagta tcaagttaaa cttagaaaaa 1320 ctcatcgagc atcaaatgaa actgcaattt attcatatca ggattatcaa taccatattt 1380 ttgaaaaagc cgtttctgta atgaaggaga aaactcaccg aggcagttcc ataggatggc 1440 aagatcctgg tatcggtctg cgattccgac tcgtccaaca tcaatacaac ctattaattt 1500 cccctcgtca aaaataaggt tatcaagtga gaaatcacca tgagtgacga ctgaatccgg 1560 tgagaatggc aaaagcttat gcatttcttt ccagacttgt tcaacaggcc agccattacg 1620 ctcgtcatca aaatcactcg catcaaccaa accgttattc attcgtgatt gcgcctgagc 1680 gagacgaaat acgcgatcgc tgttaaaagg acaattacaa acaggaatcg aatgcaaccg 1740 gcgcaggaac actgccagcg catcaacaat attttcacct gaatcaggat attcttctaa 1800 tacctggaat gctgttttgc cggggatcgc agtggtgagt aaccatgcat catcaggagt 1860 acggataaaa tgcttgatgg tcggaagagg cataaattcc gtcagccagt ttagtctgac 1920 catctcatct gtaacatcat tggcaacgct acctttgcca tgtttcagaa acaactctgg 1980 cgcatcgggc ttcccataca atcgatagar tgtcgcacct gattgcccga cattatcgcg 2040 agcccattta tacccatata aatcagcatc catgttggaa tttaatcgcg gcctcgaaac 2100 gtgagtcttt tccttaccca tttttaatgt tacttctctt gcagttaggg aactataatg 2160 taactcaaaa taagattaaa caaactaaaa taaaaagaag ttatacagaa aaacccatat 2220 aaaccagtac taatccataa taataataca caaaaaaact atcaaataaa accagaaaac 2280 agattgaata gaaaaatttt ttcgatctcc ttttatattc aaaattcgat atatgaaaaa 2340 gggaactctc agaaaatcac caaatcaatt taattagatt tttcttttcc ttctagcgtt 2400 ggaaagaaaa atttttcttt ttttttttag aaatgaaaaa tttttgccgt aggaatcacc 2460 gtataaaccc tgtataaacg ctactctgtt cacctgtgta ggctatgatt gacccagtgt 2520 tcattgttat tgcgagagag cgggagaaaa gaaccgatac aagagatcca tgctggtata 2580 página 16
107345_104_Sequence_Listing gttgtctgtc caacactttg atgaacttgt aggacgatga tgtgtattac tagtgtcgac 2640 accatataca tatccatatc taatcttact tatatgttgt ggaaatgtaa agagccccat 2700 tatcttagcc taaaaaaacc ttctctttgg aactttcagt aatacgctta actgctcatt 2760 gctatattga agtacggatt agaagccgcc gagcgggcga cagccctccg acggaagact 2820 ctcctccgtg cgtcctggtc ttcaccggtc gcgttcctga aacgcagatg tgcctcgcgc 2880 cgcactgctc cgaacaataa agattctaca atactagctt ttatggttat gaagaggaaa 2940 aattggcagt aacctggccc cacaaacctt caaatcaacg aatcaaatta acaaccatag 3000 gataataatg cgattagttt tttagcctta tttctggggt aattaatcag cgaagcgatg 3060 atttttgatc tattaacaga tatataaatg caaaagctgc ataaccactt taactaatac 3120 tttcaacatt ttcggtttgt attacttctt attcaaatgt cataaaagta tcaacaaaaa 3180 attgttaata tacctctata ctttaacgtc aaggagaaaa aactataatg tcattaccgt 3240 tcttaacttc tgcaccggga aaggttatta tttttggtga acactctgct gtgtacaaca 3300 agcctgccgt cgctgctagt gtgtctgcgt tgagaaccta cctgctaata agcgagtcat 3360 ctgcaccaga tactattgaa ttggacttcc cggacattag ctttaatcat aagtggtcca 3420 tcaatgattt caatgccatc accgaggatc aagtaaactc ccaaaaattg gccaaggctc 3480 aacaagccac cgatggcttg tctcaggaac tcgttagtct tttggatccg ttgttagctc 3540 aactatccga atccttccac taccatgcag cgttttgttt cctgtatatg tttgtttgcc 3600 tatgccccca tgccaagaat attaagtttt ctttaaagtc tactttaccc atcggtgctg 3660 ggttgggctc aagcgcctct atttctgtat cactggcctt agctatggcc tacttggggg 3720 ggttaatagg atctaatgac ttggaaaagc tgtcagaaaa cgataagcat atagtgaatc 3780 aatgggcctt cataggtgaa aagtgtattc acggtacccc ttcaggaata gataacgctg 3840 tggccactta tggtaatgcc ctgctatttg aaaaagactc acataatgga acaataaaca 3900 caaacaattt taagttctta gatgatttcc caçjccattcc aatgatccta acctatacta 3960 gaattccaag gtctacaaaa gatcttgttg ctcgcgttcg tgtgttggtc accgagaaat 4020 ttcctgaagt tatgaagcca attctagatg ccatgggtga atgtgcccta caaggcttag 4080 agatcatgac taagttaagt aaatgtaaag gcaccgatga cgaggctgta gaaactaata 4140 atgaactgta tgaacaacta ttggaattga taagaataaa tcatggactg cttgtctcaa 4200 tcggtgtttc tcatcctgga ttagaactta ttaaaaatct gagcgatgat ttgagaattg 4260 gctccacaaa acttaccggt gctggtggcg gcggttgctc tttgactttg ttacgaagag 4320 acattactca agagcaaatt gacagtttca aaaagaaatt gcaagatgat tttagttacg 4380 agacatttga aacagacttg ggtgggactg gctgctgttt gttaagcgca aaaaatttga 4440 ataaagatct taaaatcaaa tccctagtat tccaattatt tgaaaataaa actaccacaa 4500 página 17
107345_104_Sequence_Listing agcaacaaat tgacgatcta ttattgccag gaaacacgaa tttaccatgg acttcataag 4560 ctaatttgcg ataggcatta tttattagtt gtttttaatc ttaactgtgt atgaagtttt 4620 atgtaataaa gatagaaaga gaaacaaaaa aaaatttttc gtagtatcaa ttcagctttc 4680 gaagacagaa tgaaatttaa gcagaccatc atcttgccct gtgcttggcc cccagtgcag 4740 cgaacgttat aaaaacgaat actgagtata tatctatgta aaacaaccat atcatttctt 4800 gttctgaact ttgtttacct aactagtttt aaatttccct ttttcgtgca tgcgggtgtt 4860 cttatttatt agcatactac atttgaaata tcaaatttcc ttagtagaaa agtgagagaa 4920 ggtgcactga cacaaaaaat aaaatgctac gtataactgt caaaactttg cagcagcggg 4980 catccttcca tcatagcttc aaacatatta gcgttcctga tcttcatacc cgtgctcaaa 5040 atgatcaaac aaactgttat tgccaagaaa taaacgcaag gctgccttca aaaactgatc 5100 cattagatcc tcatatcaag cttcctcata gaacgcccaa ttacaataag catgttttgc 5160 tgttatcacc gggtgatagg tttgctcaac catggaaggt agcatggaat cataatttgg 5220 atactaatac aaatcggcca tataatgcca ttagtaaatt gcgctcccat ttaggtggtt 5280 ctccaggcaa atttgaatac taataaatgc ggtgcatttg caaaatgaat ttattccaag 5340 gccaaaacaa cacgatgaat ggctttattt ttttgttatt cctgacatga agctttatgt 5400 aattaaggaa acggacatcg aggaatttgc atctttttta gatgaaggag ctattcaagc 5460 accaaagcta tccttccagg attatttaag cggtaaggcc aaggcttccc aacaggttca 5520 tgaagtgcat catagaaagc ttacaaggtt tcagggtgaa acttttctaa gagattggaa 5580 cttagtctgt gggcattata agagagatgc taagtgtgga gaaatgggac ccgacataat 5640 tgcagcattt caagatgaaa agctttttcc tgagaataat ctagccttaa tttctcatat 5700 tgggggtcat attt 5714
<210> 20 <211> 7688 <212> DNA <213> Artificia1 Sequence
<220> <223> Synthetic: Integratjon construct i301 <400> 20 gacggcacgg ccacgcgttt aaaccgccga gctattcgcg gaacattcta gctcgtttgc 60 atcttcttgc atttggtagg ttttcaatag ttcggtaata ttaacggata cctactatta 120 tcccctagta ggctcttttc acggagaaat tcgggagtgt tttttttccg tgcgcatttt 180 cttagctata ttcttccagc ttcgcctgct gcccggtcat cgttcctgtc acgtagtttt 240 tccggattcg tccggctcat ataataccgc aataaacacg gaatatctcg ttccgcggat 300 página 18
107345_l04_sequence_Ljstjng tcggttaaac tcrcggtcgc ggattatcac agagaaagct tcgtggagaa tttttccaga 360 ttttccgctt tccccgatgt tggtatttcc ggaggtcatt atactgaccg ccattataat 420 gactgtacaa cgaccttctg gagaaagaaa caactcaata acgatgtggg acattggggg 480 cccactcaaa aaatctgggg actatatccc cagagaattt ctccagaaga gaagaaaagt 540 caaagttttt tttcgcttgg gggttgcata taaagctcac acgcggccag ggggagccat 600 gaaaaagcct gaactcaccg cgacgtctgt cgagaagttr ctgatcgaaa agttcgacag 660 cgtctccgac ctgatgcagc tctcggaggg cgaagaatct cgt:gctttca gcttcgatgt 720 aggagggcgt ggatatgtcc tgcgggtaaa tagctgcgcc gatggtttct acaaagatcg 780 ttatgtttat cggcactttg catcggccgc gctcccgatt ccggaagtgc ttgacattgg 840 ggaattcagc gagagcctga cctattgcat ctcccgccgt gcacagggtg tcacgttgca 900 agacctgcct gaaaccgaac tgcccgctgt tctgcagccg gtc.gcggagg ccatggatgc 960 gatcgctgcg gccgatctta gccagacgag cgggttcggc ccattcggac cgcaaggaat 1020 cggtcaatac actacatggc gtgatttcat atgcgcgatt gctgatcccc atgtgtatca 1080 ctggcaaact gtgatggacg acaccgtcag tgcgtccgtc gcgcaggctc tcgatgagct 1140 gatgctttgg gccgaggact gccccgaagt ccggcacctc gtgcacgcgg atttcggctc 1200 caacaatgtc ctgacggaca atggccgcat aacagcggtc attgactgga gcgaggcgat 1260 gttcggggat tcccaatacg aggtcgccaa catcttcttc tggaggccgt ggttggcttg 1320 tatggagcag cagacgcgct acttcgagcg gaggcatccg gagcttgcag gatcgccgcg 1380 gctccgggcg tatatgctcc gcattggtct tgaccaactc tatcagagct tggttgacgg 1440 caatttcgat gatgcagctt gggcgcaggg tcgatgcgac gcaatcgtcc gatccggagc 1500 cgggactgtc gggcgtacac aaatcgcccg cagaagcgcg gccgtctgga ccgatggctg 1560 tgtagaagta ctcgccgata gtggaaaccg acgccccagc actcgtccga gggcaaagga 1620 atagcgctcg tccaacgccg gcggacctcg ctcgtccaac gccggcggac ctcttttaat 1680 tctgctgtaa cccgtacatg cccaaaatag ggggcgggtt acacagaata tataacatcg 1740 taggtgtctg ggtgaacagt ttattcctgg catccactaa atataatgga gcccgctttt 1800 taagctggca tccagaaaaa aaaagaatcc cagcaccaaa atattgtttt cttcaccaac 1860 catcagttca taggtccatt ctcttagcgc aactacagag aacaggggca caaacaggca 1920 aaaaacgggc acaacctcaa tggagtgatg caacctgcct ggagtaaatg atgacacaag 1980 gcaattgacc cacgcatgta tctatctcat tttcttacac cttctattac cttctgctct 2040 ctctgatttg gaaaaagctg aaaaaaaagg ttgaaaccag ttccctgaaa ttattcccct 2100 acttgactaa taagtatata aagacggtag gtattgattg taattctgta aatctatttc 2160 ttaaacttct taaattctac ttttatagtt agtctttttt ttagttttaa aacaccaaga 2220 página 19
107345_104_Sequence_Listing acttagtttc gatccccgcg tgcttggccg gccgtatccc cgcgtgcttg gccggccgta 2280 tgtctcagaa cgtttacatt gtatcgactg ccagaacccc aattggttca ttccagggtt 2340 ctctatcctc caagacagca gtggaattgg gtgctgttgc tttaaaaggc gccttggcta 2400 aggttccaga attggatgca tccaaggatt ttgacgaaat tatttttggt aacgttcttt 2460 ctgccaattt gggccaagct ccggccagac aagttgcttt ggctgccggt ttgagtaatc 2520 atatcgttgc aagcacagtt aacaaggtct gtgcatccgc tatgaaggca atcattttgg 2580 gtgctcaatc catcaaatgt ggtaatgctg atgttgtcgt agctggtggt tgtgaatcta 2640 tgactaacgc accatactac atgccagcag cccgtgcggg tgccaaattt ggccaaactg 2700 ttcttgttga tggtgtcgaa agagatgggt tgaacgatgc gtacgatggt ctagccatgg 2760 gtgtacacgc agaaaagtgt gcccgtgatt gggatattac tagagaacaa caagacaatt 2820 ttgccatcga atcctaccaa aaatctcaaa aatctcaaaa ggaaggtaaa ttcgacaatg 2880 aaattgtacc tgttaccatt aagggattta gaggtaagcc tgatactcaa gtcacgaagg 2940 acgaggaacc tgctagatta cacgttgaaa aattgagatc tgcaaggact gttttccaaa 3000 aagaaaacgg tactgttact gccgctaacg cttctccaat caacgatggt gctgcagccg 3060 tcatcttggt ttccgaaaaa gttttgaagg aaaagaattt gaagcctttg gctattatca 3120 aaggttgggg tgaggccgct catcaaccag ctgattttac atgggctcca tctcttgcag 3180 ttccaaaggc tttgaaacat gctggcatcg aagacatcaa ttctgttgat tactttgaat 3240 tcaatgaagc cttttcggtt gtcggtttgg tgaacactaa gattttgaag ctagacccat 3300 ctaaggttaa tgtatatggt ggtgctgttg ctctaggtca cccattgggt tgttctggtg 3360 ctagagtggt tgttacactg ctatccatct tacagcaaga aggaggtaag atcggtgttg 3420 ccgccatttg taatggtggt ggtggtgctt cctctattgt cattgaaaag atatgattac 3480 gttctgcgat tttctcatga tctttttcat aaaatacata aatatataaa tggctttatg 3540 tataacaggc ataatttaaa gttttatttg cgattcatcg tttttcaggt actcaaacgc 3600 tgaggtgtgc cttttgactt acttttccgc cttggcaagc tggccgggtg atacttgcac 3660 aagttccact aattactgac atttgtggta ttaactcgtt tgactgctct acaattgtag 3720 gatgttaatc aatgtcttgg ctgcctaacc tgcaggccgc gagcgccgat atgctatgta 3780 atagacaata aaaccatgtt tatataaaaa aaattcaaaa tagaaaacga ttctgtacaa 3840 ggagtatttt ttttttgttc tagtgtgttt atattatcct tggctaagag gcactgcgta 3900 tacttcaagg tacccctgtg ttttgaaaaa aaacaacagt aaaataggaa ctccgcgagg 3960 ttcaggaacc tgaaacaaaa tcaataaaaa cattatatgc gtttcgaaca aaattaaaga 4020 aaaagaataa atatagatta aaaaaaaaaa gaagaaatta aaagaatttc tactaaatcc 4080 págjna 20
107345_104_sequence_Ljsting caattgttat atatttgtta aatgccaaaa aagtttataa aaaatttaga atgtataaat 4140 aataataaac taagtaacgc gatcgccgac gccgccgata tctccctcgc cagcggccgc 4200 cttatggcta agaatgttgg aattttggcc atggacatct acttcccacc aacttgtgtt 4260 cagcaggagg ctttagaagc acatgacgga gcctcaaagg gtaagtacac aatcggatta 4320 ggacaggatt gcttagcatt ctgcactgaa ttggaggacg tcatctcaat gtctttcaac 4380 gccgtcacct cattgttaga gaagtacaaa atcgacccaa accagatcgg aaggttggaa 4440 gtcggttctg aaaccgtcat cgacaagtct aaatcaatca agactttcgt tatgcagttg 4500 ttcgaaaagt gcggtaatac tgacgtcgag ggtgtagact ctactaacgc ttgttatggt 4560 ggtaccgcag ctttattgaa ctgcgtaaac tgggttgagt caaactcatg ggatggtagg 4620 tacggattag tcatttgcac cgattctgcc gtctacgccg agggtccagc aaggccaacc 4680 ggtggagctg cagctattgc tatgttaatc ggaccagatg cccctatagt cttcgagtct 4740 aagttgaggg gttcacacat ccctaacgtc tacgacttct acaagccaaa cttggcctca 4800 gagtatccag ttgtcgacgg aaagttatct cagacatgct acttgatggc cttagattca 4860 tgttacaagc acttatgcaa caagttcgaa aagttggagg gaaaggagtt ctcaattaac 4920 gacgccgact acttcgtttt tcactctcca tacaacaaat tggtccagaa gtcattcgcc 4980 aggttattgt acaacgattt tttgagaaac gcatcatcta tcgatgaggc cgccaaggag 5040 aaattcaccc catattcttc tttgtcattg gacgagtctt accagtctag ggacttggag 5100 aaggtatcac agcaattggc taaaaccttc tatgacgcca aagttcagcc aaccaccttg 5160 gtccctaaac aggtcggaaa tatgtatact gcatctttgt atgccgcctt tgcctctttg 5220 atccacaaca agcacaacga tttagtcgga aaaagggttg tcatgttttc ttacggtgcc 5280 ggatctactg ccactatgtt ctcattgagg ttatgcgaaa accagtcacc attttcattg 5340 tctaacatcg cctcagtcat ggacgtaggt gtctcacctg agaagttcgt agaaaccatg 5400 aagttgatgg agcacagata cggtgccaaa gaattcgtca cttcaaaaga gggaatcttg 5460 gatttgttgg ccccaggaac ctactatttg aaggaggtcg actctttgta cagaaggttc 5520 tatggaaaga agggagacga cggatctgtc gcaaacggtc agtaaatcgg cggcgtcggc 5580 gatcgcgtta aggcggccgc tggcgaggga gatatttcaa cctgggccta acagtaaaga 5640 ratcctcctc aaaacrggtg cacttaatcg ctgaatttgt tctggcttct cttctttttc 5700 tttattcccc ccatgggcca aaaaaaatag tactatcagg aatttggcgc cgggtcacga 5760 tatacgtgta cagtgaccta ggcgacgcca caaggaaaaa ggaaaaaaac agaaaaaaca 5820 acaaaaacta aaacaaacac gaaaacttta atagatctaa gtgaagtagt ggtgaggcaa 5880 ttggagtgac atagcagcta ctacaactac aaaaaaggcg cgccacggtc gtgcggatat 5940 gaaagaggtc gttatagctt ctgccgtcag gaccgccatc ggatcttacg gtaagtcatt 6000 página 21
107345_104_sequencê_Listing aaaggacgtc cctgccgttg atttaggagc caccgcaatt aaagaggccg ttaaaaaggc 6060 aggtataaag ccagaggacg tcaacgaggt catcttggga aatgtcttac aagccggatt 6120 aggtcaaaac ccagcaagac aagcatcatt caaagccggt ttacctgtcg agatacctgc 6180 aatgaccatc aacaaggttt gcggttcagg attaaggacc gtttctttag cagcacagat 6240 cattaaggct ggagatgcag acgttatcat tgctggtggt atggaaaaca tgtcaagagc 6300 cccatacttg gctaataacg ccaggtgggg atataggatg ggaaacgcca agtttgtcga 6360 cgaaatgatt actgacggat tgtgggacgc cttcaatgac tatcacatgg gtataaccgc 6420 agaaaacatt gccgagaggt ggaatatctc aagagaagaa caggatgagt ttgcattggc 6480 ctcacagaaa aaagcagagg aggcaataaa gtcaggtcag tttaaggatg aaatcgtccc 6540 agtcgtcatc aagggaagaa agggtgagac agttgtcgac accgacgaac accctagatt 6600 tggttcaacc atcgagggat tagcaaagtt gaagccagcc ttcaagaaag acggaaccgt 6660 aaccgccggt aatgcatctg gattgaacga ttgcgcagca gttttggtca taatgtcagc 6720 cgagaaagct aaggagttgg gtgtcaagcc attggcaaaa attgtttcat acggatcagc 6780 cggtgtcgac cctgccatca tgggttacgg acctttttac gccaccaagg ctgcaatcga 6840 aaaggccggt tggaccgtag atgaattgga tttgatcgag tcaaacgagg cctttgccgc 6900 ccaatcattg gctgtcgcca aggacttgaa gttcgacatg aacaaggtca acgtcaacgg 6960 tggtgccatc gcattgggtc accctatcgg agcctctggt gccaggatct tggttacctt 7020 ggtccacgcc atgcagaaga gggacgcaaa gaagggtttg gccaccttgt gcatcggtgg 7080 aggtcaggga acagctatct tgttagagaa atgcagcccc tcagcccccc tagcgtcgaa 7140 taaaagacat tggtacatga tatcaaacag aattttaaca tttcttgatc cagtttgtaa 7200 acaaaacaaa caatttttct accatttaac ttcataccat cggcgagagc cgaacaggaa 7260 aaaaaagaag tctccggtta tcgtaagcag tatcaaataa taagaatgta tgtgtgtgca 7320 atttgttata cccacgaaga agtgcgcagt agagttagaa aaccaactga gtaatcttta 7380 ctcccgacaa tcgtccaata atcctcttgt tgctaggaac gtgatgatgg atttcgtttg 7440 aaatccggac ggaaaactca aaagaagtcc aaccaccaac cattttcgag cctcaagaat 7500 ctctaagcag gtttctttac taaggggatg gcctttctgt cctggacatt ttttccttcc 7560 ttttttcatt tccttgaaag gaacagattt tttttgactt ttgccacaca gctgcactat 7620 ctcaacccct tttacatttt aagttttcgg gttgaatggc cggtgtttaa accccagcgc 7680 ctggcggg 7688
<210> 21 <211> 5025 <212> DNA página 22
107345_104_sequence_Ljsting <213> Artificia1 sequence <220> <223> Synthetic: Integration construct i476 <400> 21 caggatccga cggcacggcc acgcgtttaa accgcctggg ataggatagt agcaactctt 60 ggaggagagc attgtcagtt gtccagtctc tgaagttaag tagtaagttt gcggagtcaa 120 agggggatgg cttttgccat ttgtgagagt tgtgcggcag catcttattc aaatagagct 180 gtattctgaa gacctcttgt agaacatcat ccatactaaa aagtaaatcg tcctgtccca 240 ttacgagctg tattagtgct gtgaccctct gtatatttac gttgccatga agaaggtaat 300 gggcgatatt ttgatacaat tcctgagttg catgttggat tgagtttacg aagggtcgcc 360 agacggccag aaacctccag gcggagttaa caactagtaa tacggcatcc atgtttgcat 420 cagcgccgag cctataccag tcactgagta gacgttttct tgctcttttt atgtcctgac 480 ttcttttgac gagggggcat tctctagaga cacaggcagt tgcttccagc aactgccgta 540 cggccgttct catgctgtcg aggatttttt ttgggacgat attgtcatta tagggcagtg 600 tgtgacttat gaattgttgt agaaggacgt ctgtgatgtt ggagatatgt attttgttaa 660 ctcttcttga gacgatttgg ccctggatag cgaagcgtgc ggttacaaat aggtcgtctt 720 gttcaagaag gtaggcgagg acattatcta tcagtacaaa catcttagta gtgtctgagg 780 agagggttga ttgtttatgt atttttgcga aatatatata tatatattct acacagatat 840 atacatattt gtttttcggg ctcattcttt cttctttgcc agaggctcac cgctcaagag 900 gtccgctaat tctggagcga ttgttattgt tttttctttt cttcttctat tcgaaaccca 960 gtttttgatt tgaatgcgag ataaactggt attcttcatt agattctcta ggcccttggt 1020 atctagatat gggttctcga tgttctttgc aaaccaactt tctagtattc ggacattttc 1080 ttttgtaaac cggtgtcctc tgtaaggttt agtacttttg tttatcatat cttgagttac 1140 cacattaaat accaacccat ccgccgattt atttttctgt gtaagttgat aattacttct 1200 atcgttttct atgctgcgca tttctttgag taatacagta atggtagtag tgagttgaga 1260 tgttgtttgc aacaacttct tctcctcatc actaatctta cggtttttgt tggccctaga 1320 taagaatcct aatatatccc ttaattcaac ttcttcttct gttgttacac tctctggtaa 1380 cttaggtaaa ttacagcaaa tagaaaagag ctttttattt atgtctagta tgctggattt 1440 aaactcatct gtgatttgtg gatttaaaag gtctttaatg ggtattttat tcattttttc 1500 ttgcttatct tccttttttt cttgcccact tctaagctga tttcaatctc tcctttatat 1560 atatttttaa gttccaacat tttatgtttc aaaacattaa tgatgtctgg gttttgtttg 1620 ggatgcaatt tattgcttcc caatgtagaa aagtacatca tatgaaacaa cttaaactct 1680 taactacttc ttttaacctt cactttttat gaaatgtatc aaccatatat aataacttaa 1740 página 23
107345_104_Sequence_Listing tagacgacat tcacaatatg tttacttcga agcctgcttt caaaattaag aacaaagcat 1800 ccaaatcata cagaaacaca gcggtttcaa aaaagctgaa agaaaaacgt ctagctgagc 1860 atgtgaggcc aagctgcttc aatattattc gaccactcaa gaaagatatc cagattcctg 1920 ttccttcctc tcgattttta aataaaatcc aaattcacag gatagcgtct ggaagtcaaa 1980 atactcagtt tcgacagttc aataagacat ctataaaatc ttcaaagaaa tatttaaact 2040 catttatggc ttttagagca tattactcac agtttggctc cggtgtaaaa caaaatgtct 2100 tgtcttctct gctcgctgaa gaatggcacg cggacaaaat gcagcacgga atatgggact 2160 acttcgcgca acagtataat tttataaacc ctggttttgg ttttgtagag tggttgacga 2220 ataattatgc tgaagtacgt ggtgacggat attgggaaga tgtgtttgta catttggcct 2280 tatagagtgt ggtcgtggcg gaggttgttt atctttcgag tactgaatgt tgtcagtata 2340 gctatcctat ttgaaactcc ccatcgtctt gctcttgttc ccaatgtttg tttatacact 2400 catatggcta tacccttatc tacttgcctc ttttgtttat gtctatgtat ttgtataaaa 2460 tatgatatta ctcagactca agcaaacaat caatgctcac acgcggccag ggggagcctc 2520 gacactagta atacacatca tcgtcctaca agttcatcaa agtgttggac agacaactat 2580 accagcatgg atctcttgta tcggttcttt tctcccgctc tctcgcaata acaatgaaca 2640 ctgggtcaat catagcctac acaggtgaac agagtagcgt ttatacaggg tttatacggt 2700 gattcctacg gcaaaaattt ttcatttcta aaaaaaaaaa gaaaaatttt tctttccaac 2760 gctagaagga aaagaaaaat ctaattaaat tgatttggtg attttctgag agttcccttt 2820 ttcatatatc gaattttgaa tataaaagga gatcgaaaaa atttttctat tcaatctgtt 2880 ttctggtttt atttgatagt ttttttgtgt attattatta tggattagta ctggtttata 2940 tgggtttttc tgtataactt ctttttattt tagtttgttt aatcttattt tgagttacat 3000 tatagttccc taactgcaag agaagtaaca ttaaaaatga aaaagcctga actcaccgcg 3060 acgtctgtcg agaagtttct gatcgaaaag ttcgacagcg tctccgacct gatgcagctc 3120 tcggagggcg aagaatctcg tgctttcagc ttcgatgtag gagggcgtgg atatgtcctg 3180 cgggtaaata gctgcgccga tggtttctac aaagatcgtt atgtttatcg gcactttgca 3240 tcggccgcgc tcccgattcc ggaagtgctt gacattgggg aattcagcga gagcctgacc 3300 tattçcatct cccgccgtgc acagggtgtc acgttgcaag acctgcctga aaccgaactg 3360 cccgctgttc tgcagccggt cgcggaggcc atggatgcga tcgctgcggc cgatcttagc 3420 cagacgagcg ggttcggccc attcggaccg caaggaatcg gtcaatacac tacatggcgt 3480 gatttcatat gcgcgattgc tgatccccat gtgtatcact ggcaaactgt gatggacgac 3540 accgtcagtg cgtccgtcgc gcaggctctc gatgagctga tgctttgggc cgaggactgc 3600 página 24
107345_104_sequence_Listing cccgaagtcc ggcacctcgt gcacgcggat ttcggctcca acaatgtcct gacggacaat 3660 ggccgcataa cagcggtcat tgactggagc gaggcgatgt tcggggattc ccaatacgag 3720 gtcgccaaca tcttcttctg gaggccgtgg ttggcttgta tggagcagca gacgcgctac 3780 ttcgagcgga ggcatccgga gcttgcagga tcgccgcggc tccgggcgta tatgctccgc 3840 attggtcttg accaactcta tcagagcttg gttgacggca atttcgatga tgcagcttgg 3900 gcgcagggtc gatgcgacgc aatcgtccga tccggagccg ggactgtcgg çcgtacacaa 3960 atcgcccgca gaagcgcggc cgtctggacc gatggctgtg tagaagtact cgccgatagt 4020 ggaaaccgac gccccagcac tcgtccgagg gcaaaggaat aggtttaact tgatactact 4080 agattttttc tcttcattta taaaattttt ggttataatt gaagctttag aagtatgaaa 4140 aaatcctttt ttttcattct ttgcaaccaa aataagaagc ttcttttatt cattgaaatg 4200 atgaatataa acctaacaaa agaaaaagac tcgaatatca aacattaaaa aaaaataaaa 4260 gaggttatct gttttcccat ttagttggag tttgcatttt ctaatagata gaactctcaa 4320 ttaatgtgga tttagtttct ctgttcgttt ttttttgttt tgttctcact gtatttacat 4380 ttctatttag tatttagtta ttcatataat cttaacttct cgaggagctc cgctcgtcca 4440 acgccggcgg acctcggagg ttgtttatct ttcgagtact gaatgttgtc agtatagcta 4500 tcctatttga aactccccat cgtcttgctc ttgttcccaa tgtttgttta tacactcata 4560 tggctatacc cttatctact tgcctctttt gtttatgtct atgtatttgt ataaaatatg 4620 atattactca gactcaagca aacaatcaat tcttagcatc attctttgtt cttatcttaa 4680 ccataaacga tcttgatgtg acttttgtaa tttgaacgaa ttggctatac gggacggatg 4740 acaaatgcac cattactcta ggttgttgtt ggatcttaac aaaccgtaaa ggtaaactgc 4800 ccatgcggtt cacatgactt ttgactttcc tttgtttgct agttaccttc ggcttcacaa 4860 tttgtttttc cacttttcta acaggtttat cacctttcaa acttatcttt atcttattcg 4920 ccttcttggg tgcctccaca gtagaggtta cttccttttt aatatgtact tttaggatac 4980 tttcacgctt tataacacgg tgtttaaacc ccagcgcctg gcggg 5025
<210> 22 <211> 3665 <212> DNA <213> Artificia] sequence <220> <223> Synthetic: Integration construct i477 <400> 22 agctcgagga cggcacggcc acgcgtttaa accgccaagc ttttcaattc atcttttttt 60 tttttgttct tttttttgat tccggtttct ttgaaatttt tttgattcgg taatctccga 120 gcagaaggaa gaacgaagga aggagcacag acttagattg gtatatatac gcatatgtgg 180 página 25
107345_104_sequence_Listing tgttgaagaa acatgaaatt gcccagtatt cttaacccaa ctgcacagaa caaaaacctg 240 caggaaacga agataaatca tgtcgaaagc tacatataag gaacgtgctg ctactcatcc 300 tagtcctgtt gctgccaagc tatttaatat catgcacgaa aagcaaacaa acttgtgtgc 360 ttcattggat gttcgtacca ccaaggaatt actggagtta gttgaagcat taggtcccaa 420 aatttgttta ctaaaaacac atgtggatat cttgactgat ttttccatgg agggcacagt 480 taagccgcta aaggcattat ccgccaagta caatttttta ctcttcgaag acagaaaatt 540 tgctgacatt ggtaatacag tcaaattgca gtactctgcg ggtgtataca gaatagcaga 600 atgggcagac attacgaatg cacacggtgt ggtgggccca ggtattgtta gcggtttgaa 660 gcaggcggca gaagaagtaa caaaggaacc tagaggcctt ttgatgttag cagaattgtc 720 atgcaagggc tccctatcta ctggagaata tactaagggt actgttgaca ttgcgaagag 780 tgacaaagat tttgttatcg gctttattgc tcaaagagac atgggtggaa gagatgaagg 840 ttacgattgg ttgattatga cacccggtgt gggtttagat gacaagggag acgcattggg 900 tcaacagtat agaaccgtgg atgatgtggt ctctacagga tctgacatta ttattgttgg 960 aagcgctcgt ccaacgccgg cggacctatg gcgcaagttt tccgctttgt aatatatatt 1020 tatacccctt tcttctctcc cctgcaatat aatagtttaa ttctaatatt aataatatcc 1080 tatattttct tcatttaccg gcgcactctc gcccgaacga cctcaaaatg tctgctacat 1140 tcataataac caaaagctca taactttttt ttttgaacct gaatatatat acatcacata 1200 tcactgctgg tccttgccga ccagcgtata caatctcgat agttggtttc ccgttctttc 1260 cactcccgtc atggactaca acaagagatc ttcggtctca accgtgccta atgcagctcc 1320 cataagagtc ggattcgtcg gtctcaacgc agccaaagga tgggcaatca agacacatta 1380 ccccgccata ctgcaactat cgtcacaatt tcaaatcact gccttataca gtccaaaaat 1440 tgagacttct attgccacca tccagcgtct aaaattgagt aatgccactg cttttcccac 1500 tttagagtca tttgcatcat cttccactat agatatgata gtgatagcta tccaagtggc 1560 cagtcattat gacgttgtta tgcctctctt ggaattctcc aaaaataatc cgaacctcaa 1620 gtatcttttc gtagaatggg cccttgcatg ttcactagat caagccgaat ccatttataa 1680 ggctgctgct gaacgtgggg ttcaaaccat catctcttta caaggtcgta aatcaccata 1740 tattttgaga gcaaaagaat taatatctca aggctatatc ggcgacatta attctatcga 1800 gattgctgga aatggcggtt ggtacggcta cgaaaggcct gttaaatcac caaaatacat 1860 ctatgaaatc gggaacggtg tagatctggt aaccacaaca tttggtcaca caatcgatat 1920 tttacaatac atgacaagtt cgtacttttc caggataaat gcaatggttt tcaataatat 1980 tccagagcaa gagctgatag atgagcgtgg taaccgattg ggccagcgag tcccaaagac 2040 págjna 26
107345_104_sequence_Ljstjng agtaccggat catcttttat tccaaggcac attgttaaat ggcaatgttc cagtgtcatg 2100 cagtttcaaa ggtggcaaac ctaccaaaaa atttaccaaa aatttggtca ttgatattca 2160 cggtaccaag ggagatttga aacttgaagg cgatgccgga ttcgcagaaa tttcaaatct 2220 ggtcctttac tacagtggaa ctagagcaaa cgacttcccg ctagctaatg gacaacaagc 2280 tcctttagac ccggggtatg atgcaggtaa agaaatcatg gaagtatatc atttacgaaa 2340 ttataatgcc attgtcggta atattcatcg actgtatcaa tctatctctg acttccactt 2400 caatacaaag aaaattcctg aattaccctc acaatttgta atgcaaggtt tcgatttcga 2460 aggctttccc accttgatgg atgctctgat attacacagg ttaatcgaga gcgtttataa 2520 aagtaacatg atgggctcca cattaaacgt tagcaatatc tcgcattata gtttataaaa 2580 gcatcttgcc ctgtgcttgg cccccagtgc agcgaacgtt ataaaaacga atactgagta 2640 tatatctatg taaaacaacc atatcatttc ttgttctgaa ctttgtttac ctaactagtt 2700 ttaaatttcc ctttttcgtg catgcgggtg ttcttattta ttagcatact acatttgaaa 2760 tatcaaattt ccttagtaga aaagtgagag aaggtgcact gacacaaaaa ataaaatccc 2820 cgcgtgcttg gccggccgtc ttcattggat gttcgtacca ccaaggaatt actggagtta 2880 gttgaagcat taggtcccaa aatttgttta ctaaaaacac atgtggatat cttgactgat 2940 ttttccatgg agggcacagt taagccgcta aaggcattat ccgccaagta caatttttta 3000 ctcttcgaag acagaaaatt tgctgacatt ggtaatacag tcaaattgca gtactctgcg 3060 ggtgtataca gaatagcaga atgggcagac attacgaatg cacacggtgt ggtgggccca 3120 ggtattgtta gcggtttgaa gcaggcggca gaagaagtaa caaaggaacc tagaggcctt 3180 ttgatgttag cagaattgtc atgcaagggc tccctatcta ctggagaata tactaagggt 3240 actgttgaca ttgcgaagag tgacaaagat tttgttatcg gctttattgc tcaaagagac 3300 atgggtggaa gagatgaagg ttacgattgg ttgattatga cacccggtgt gggtttagat 3360 gacaagggag acgcattggg tcaacagtat agaaccgtgg atgatgtggt ctctacagga 3420 rctgacatta ttattgttgg aagaggacta tttgcaaagg gaagggatgc taaggtagag 3480 ggtgaacgtt acagaaaagc aggctgggaa gcatatttga gaagatgcgg ccagcaaaac 3540 taaaaaactg tattataagt aaatgcatgt atactaaact cacaaattag agcttcaatt 3600 taattatatc agttattacc cgggaatctc ggtgtttaaa ccccagcgcc tggcgggtct 3660 agatc 3665
<210> 23 <211> 10623 <212> DNA <213> Artificia7 Sequence <220> página 27
107345_l04_sequence_Ljsting <223> Synthetic: Integration construct i94 <400> 23 atgagtgata gggaattcgt cacggtagat cccgtcacta tcataatcaa agaatgcatt 60 aatttatcga cagcgatgcg gaaatactct aaatttacct ctcaatctgg agtggccgct 120 ttgctggggg gaggaagtga aatatttagc aatcaagatg actacttggc tcacacattc 180 aacaatttga ataccaacaa gcacaatgat ccatttttat ctggattcat tcagttaaga 240 cttatgttga ataaactgaa aaatctagat aatatagatt cactaaccat attgcagcca 300 tttttattaa ttgtgagtac aagttccatt tctggttaca. tcacttccct ggccctggac 360 tctttgcaga aattctttac cttgaatatc atcaatgaat catcgcaaaa ctatattggt 420 gcacacaggg cgacggtaaa tgctctaaca cattgtaggt ttgaaggatc tcaacaactt 480 tctgatgatt cagttctttt gaaagtcgtg tttttactgc gttcaatcgt cgactcacct 540 tacggagatt tattatcaaa ctctatcata tatgacgtat tgcaaacgat tctttcattg 600 gcttgtaata acagaaggag cgaagtcctt aggaatgctg cacaatcaac aatgatagcc 660 gttaccgtaa agattttctc aaaactaaag actattgagc ctgttaatgt gaatcaaata 720 tacatcaatg atgaaagtta cacaaatgat gtattgaagg ccgatacaat tggcacaaat 780 gtagaatcca aagaagaagg aagtcaagaa gatcccatcg gcatgaaagt gaataatgag 840 gaagctatta gcgaggacga tggcattgaa gaagagcata ttcattcaga gaagagcaca 900 aatggcgccg aacaactaga tattgtgcaa aaaacaacaa gatcaaattc caggatccaa 960 gcgtatgctg atgataacta tggattgccc gtggttaggc aatatttaaa cttattacta 1020 tcattgattg cgccagaaaa tgaattaaaa cattcatact ccactagaat atttggccta 1080 gagttaattc aaacggcatt agaaatttca ggtgatcgat tgcagctata cccacggctt 1140 tttacacrga ratcagatcc tattttcaaa agcattttgt ttatcataca gaacactaca 1200 aaattatcac tacttcaagc tacattgcag ctatttacta ctctagttgt tatattgggc 1260 aacaacttac aattacagat cgagctcact ctaacaagaa tattttctat tcttttagat 1320 gatggtaccg caaataactc gagttctgaa aataagaaca agccatcaat aataaaggaa 1380 cttctaattg agcaaatatc catcttatgg actaggtcgc catctttttt tacttctact 1440 tttatcaatt tcgattgtaa tctcgatagg gcagacgttt ccataaactt tttgaaggct 1500 ttgactaaat tggccttacc agaatccgcc ttaactacca cagaaagtgt accacccatt 1560 tgccttgagg gattçjgtctc cctagtcgat gatatgttcg atcacatgaa ggacattgac 1620 agagaagaat ttggcaggca aaagaatgaa atggaaatct taaaaaagag ggaccgtaaa 1680 acagagttta ttgaatgtac caatgcattc aatgaaaagc ccaaaaaggg tattccgatg 1740 ttaatagaaa aaggtttcat tgcttccgac tccgataaag atattgcgga gtttcttttc 1800 página 28
107345_104_sequence_Ljsting aataataaca accgtatgaa taaaaaaaca atcggtttgc tactttgcca tccggacaaa 1860 gtaagcttgt tgaatgaata tattcgtttg tttgattttt cagggttaag ggtcgatgaa 1920 gctattagaa ttttgttgac gaaatttagg ttgcctggtg aatcgcaaca aattgaaaga 1980 atcatcgaag ccttctcgtc tgcgtattgt gaaaatcaag attacgatcc atccaaaatc 2040 agtgacaacg cggaggatga catttctact gttcaaccag acgctgattc tgttttcatt 2100 ttaagttatt caattattat gttgaacact gacctacata accctcaagt gaaggaacac 2160 atgtcatttg aagattactc tggtaactta aagggatgct gtaatcacaa agacttccca 2220 ttctggtatt tggatagaat ttactgttca atcagagata aagaaattgt tatgcctgaa 2280 gagcaccacg gcaacgaaaa gtggtttgaa gatgcttgga ataacttgat atcttcaact 2340 actgttataa ctgaaataaa aaaagacaca caatctgtca tggataaatt aacacccttg 2400 gagcttttga actttgatag agcaattttt aaacaagttg gcccaagtat tgtcagtact 2460 ttattcaaca tttacgtagt tgcatctgat gaccatatat ctaccagaat gataacaagt 2520 ttggacaaat gttcctatat ttccgcattt tttgacttca aagatctctt taatgatata 2580 ctaaactcca ttgctaaggg cactactttg attaattcaa gccatgacga tgaactttca 2640 actttagctt ttgaatatgg cccaatgcca ctggtgcaaa ttaaattcga agacactaac 2700 actgagatcc cggttagtac agatgctgtt agatttggta gatcatttaa gggtcaacta 2760 aatacagttg tttttttccg gattattcgc aggaacaaag atcctaaaat tttctccaag 2820 gaattatggt taaacattgt taatattata ctaacattgt acgaagactt gattttgtct 2880 cctgatattt tccctgattt acaaaaaaga ctgaaattaa gcaacttçcc taagccatct 2940 cctgaaattt ctattaacaa gagcaaagaa agcaaaggtc tcttatcaac atttgcttct 3000 tatttaaaag gtgatgaaga acccacagaa gaggaaatca aatcctcaaa aaaagcgatg 3060 gagtgcataa agtcgagtaa tattgccgcc tctgtctttg gaaatgaatc aaatataaca 3120 gcggatttaa taaaaacttt actagactcc gccaaaactg agaaaaacgc agataattcc 3180 aggtattttg aagcagaact tttatttatc atcgaattga ctattgcatt atttctattt 3240 tgcaaagagg agaaagaatt aggaaagttc atacttcaaa aagttttcca actttctcac 3300 acgaaaggcc tcacgaaaag gactgttcgt agaatgctaa catacaaaat tttgttaatt 3360 tcgttatgtg cggatcagac ggagtacttg tccaaattaa taaacgatga gctgttaaaa 3420 aagggggata tttttaccca aaaatttttt gcaactaatc aaggtaagga atttttgaag 3480 agactatttt cattgaccga atcagagttt tatagaggat ttttactagg aaatgagaat 3540 ttttggaaat ttttaagaaa agttacagca atgaaagagc agagcgagag catttttgaa 3600 tatttaaatg aatcgatcaa gacagacagc aatattttga caaatgagaa cttcatgtgg 3660 gtcctaggac tattagatga aatttcatca atgggtgccg ttggaaatca ctgggaaata 3720 página 29
107345_104_Sequence_Listing gaatacaaga aattgacaga aagtggtcat aaaattgata aggagaatcc atacaagaaa 3780 tcgatcgaat tatcattgaa atccattcaa ctaacatcac acttgctgga agataataac 3840 gatctgcgta aaaacgagat attcgctatt attcaagctt tggcacatca atgcatcaat 3900 ccgtgtaagc agataagtga atttgcagtg gtaacgctag agcagacgct catcaataaa 3960 atcgaaattc caactaatga gatggaatcg gtagaagaat taattgaggg cggattacta 4020 ccgttgctaa attcgagtga aacacaggaa gaccagaaaa tcctcatttc atccatatta 4080 acaataattt caaatgttta tttgcattat ttgaaactag ggaagacaag caacgaaacg 4140 tttttgaaaa ttttgagtat tttcaataaa tttgtagagg actcagatat tgaaaaaaag 4200 ctacagcaat taatacttga taagaagagt attgagaagg gcaacggttc atcatctcat 4260 ggatctgcac atgaacaaac accagagtca aacgacgttg aaattgaggc tactgcgcca 4320 attgatgaca atacagacga tgataacaaa ccgaagttat ctgatgtaga aaaggattaa 4380 agatgctaag agatagtgat gatatttcat aaataatgta attctatata tgttaattac 4440 cttttttgcg aggcatattt atggtgaagg ataagttttg accatcaaag aaggttaatg 4500 tggctgtggt ttcagggtcc atacccggga gttatgacaa ttacaacaac agaattcttt 4560 ctatatatgc acgaacttgt aatatggaag aaattatgac gtacaaacta taaagtaaat 4620 attttacgta acacatggtg ctgttgtgct tctttttcaa gagaatacca atgacgtatg 4680 actaagttta ggatttaatg caggtgacgg acccatcttt caaacgattt atatcagtgg 4740 cgtccaaatt gttaggtttt gttggttcag caggtttcct gttgtgggtc atatgacttt 4800 gaaccaaatg gccggctgct agggcagcac ataaggataa ttcacctgcc aagacggcac 4860 aggcaactat tcttgctaat tgacgtgcgt tggtaccagg agcggtagca tgtgggcctc 4920 ttacacctaa taagtccaac atggcacctt gtggttctag aacagtacca ccaccgatgg 4980 tacctacttc gatggatggc atggatacgg aaattctcaa atcaccgtcc acttctttca 5040 tcaatgttat acagttggaa ctttcgacat tttgtgcagg atcttgtcct aatgccaaga 5100 aaacagctgt cactaaatta gctgcatgtg cgttaaatcc accaacagac ccagccattg 5160 cagatccaac caaattctta gcaatgttca actcaaccaa tgcggaaaca tcacttttta 5220 acacttttct gacaacatca ccaggaatag tagcttctgc gacgacactc ttaccacgac 5280 cttcgatcca gttgatggca gctggttttt tgtcggtaca gtagttacca gaaacggaga 5340 caacctccat atcttcccag ccatactctt ctaccatttg ctttaatgag tattcgacac 5400 ccttagaaat catattcata cccattgcgt caccagtagt tgttctaaat ctcatgaaga 5460 gtaaatctcc tgctagacaa gtttgaatat gttgcagacg tgcaaatctt gatgtagagt 5520 taaaagcttt tttaattgcg ttttgtccct cttctgagtc taaccatatc ttacaggcac 5580 página 30
107345_104_Sequence_Listing cagatctttt caaagttggg aaacggacta ctgggcctct tgtcatacca tccttagtta 5640 aaacagttgt tgcaccaccg ccagcattga ttgccttaca gccacgcatg gcagaagcta 5700 ccaaacaacc ctctgtagtt gccattggta tatgataaga tgtaccatcg ataaccaagg 5760 ggcctataac accaacgggc aaaggcatgt aacctataac attttcacaa caagcgccaa 5820 atacgcggtc gtagtcataa tttttatatg gtaaacgatc agatgctaat acaggagctt 5880 ctgccaaaat tgaaagagcc ttcctacgta ccgcaaccgc tctcgtagta tcacctaatt 5940 ttttctccaa agcgtacaaa ggtaacttac cgtgaataac caaggcagcg acctctttgt 6000 tcttcaattg ttttgtattt ccactactta ataatgcttc taattcttct aaaggacgta 6060 ttttcttatc caagctttca atatcgcggg aatcatcttc ctcactagat gatgaaggtc 6120 ctgatgagct cgattgcgca gatgataaac ttttgacttt cgatccagaa atgactgttt 6180 tattggttaa aactggtgta gaagcctttt gtacaggagc agtaaaagac ttcttggtga 6240 cttcagtctt caccaattgg tctgcagcca ttatagtttt ttctccttga cgttaaagta 6300 tagaggtata ttaacaattt tttgttgata cttttatgac atttgaataa gaagtaatac 6360 aaaccgaaaa tgttgaaagt attagttaaa gtggttatgc agcttttgca tttatatatc 6420 tgttaataga tcaaaaatca tcgcttcgct gattaattac cccagaaata aggctaaaaa 6480 actaatcgca ttattatcct atggttgtta atttgattcg ttgatttgaa ggtttgtggg 6540 gccaggttac tgccaatttt tcctcttcat aaccataaaa gctagtattg tagaatcttt 6600 attgttcgga gcagtgcggc gcgaggcaca tctgcgtttc aggaacgcga ccggtgaaga 6660 ccaggacgca cggaggagag tcttccgtcg gagggctgtc gcccgctcgg cggcttctaa 6720 tccgtacttc aatatagcaa tgagcagtta agcgtattac tgaaagttcc aaagagaagg 6780 tttttttagg ctaagataat ggggctcttt acatttccac aacatataag taagattaga 6840 tatggatatg tatatggrgg tattgccatg taatatgatt attaaacttc tttgcgtcca 6900 tccaaaaaaa aagtaagaat ttttgaaaat tcaatataaa tgaaactctc aactaaactr 6960 tgttggtgtg gtattaaagg aagacttagg ccgcaaaagc aacaacaatt acacaataca 7020 aacttgcaaa tgactgaact aaaaaaacaa aagaccgctg aacaaaaaac cagacctcaa 7080 aatgtcggta ttaaaggtat ccaaatttac atcccaactc aatgtgtcaa ccaatctgag 7140 ctagagaaat ttgatggcgt ttctcaaggt aaatacacaa ttggtctggg ccaaaccaac 7200 atgtcttttg tcaatgacag agaagatatc tactcgatgt ccctaactgt tttgtctaag 7260 ttgatcaaga gttacaacat cgacaccaac aaaattggta gattagaagt cggtactgaa 7320 actctgattg acaagtccaa gtctgtcaag tctgtcttga tgcaattgtt tggtgaaaac 7380 actgacgtcg aaggtattga cacgcttaat gcctgttacg gtggtaccaa cgcgttgttc 7440 aactctttga actggattga atctaacgca tgggatggta gagacgccat tgtagtttgc 7500 página 31
107345_104_sequence_Ljstjng ggtgatattg ccatctacga taagggtgcc gcaagaccaa ccggtggtgc cggtactgtt 7560 gctatgtgga tcggtcctga tgctccaatt gtatttgact ctgtaagagc ttcttacatg 7620 gaacacgcct acgattttta caagccagat ttcaccagcg aatatcctta cgtcgatggt 7680 catttttcat taacttgtta cgtcaaggct cttgatcaag tttacaagag ttattccaag 7740 aaggctattt ctaaagggtt ggttagcgat cccgctggtt cggatgcttt gaacgttttg 7800 aaatatttcg actacaacgt tttccatgtt ccaacctgta aattggtcac aaaatcatac 7860 ggtagattac tatataacga tttcagagcc aatcctcaat tgttcccaga agttgacgcc 7920 gaattagcta ctcgcgatta tgacgaatct ttaaccgata agaacattga aaaaactttt 7980 gttaatgttg ctaagccatt ccacaaagag agagttgccc aatctttgat tgttccaaca 8040 aacacaggta acatgtacac cgcatctgtt tatgccgcct ttgcatctct attaaactat 8100 gttggatctg acgacttaca aggcaagcgt gttggtttat tttcttacgg ttccggttta 8160 gctgcatctc tatattcttg caaaattgtt ggtgacgtcc aacatattat caaggaatta 8220 gatattacta acaaattagc caagagaatc accgaaactc caaaggatta cgaagctgcc 8280 atcgaattga gagaaaatgc ccatttgaag aagaacttca aacctcaagg ttccattgag 8340 catttgcaaa gtggtgttta ctacttgacc aacatcgatg acaaatttag aagatcttac 8400 gatgttaaaa aataatcttc ccccatcgat tgcatcttgc tgaaccccct tcataaatgc 8460 tttatttttt tggcagcctg ctttttttag ctctcattta atagagtagt tttttaatct 8520 atatactagg aaaactcttt atttaataac aatgatatat atatattcca gtggtgcatg 8580 aacgcatgag aaagcccccg gaagatcatc ttccgggggc tttttttttg gcgcgcgata 8640 cagaccggtt cagacaggat aaagaggaac gcagaatgtt agacaacacc cgcttacgca 8700 tagctattca gaaatcaggc cgtttaagcg atgattcacg agaattgctg gcccgctgcg 8760 gcataaaaat taatttacac actcagcgcc tgattgcgat ggcggaaaac atgccgattg 8820 atatcctgcg cgtgcgtgat gatgacattc cgggtctggt aatggatggc gtggtcgatc 8880 tcggtattat cggcgaaaac gtgctggaag aagagctact caaccgccgc gcacagggcg 8940 aagatccacg ctatttaacc ctgcgccgtc ttgacttcgg cggctgccgt ttatcgctgg 9000 caacaccggt tgacgaagcc tgggacggcc cggccgcgct ggacggtaaa cgtatcgcta 9060 cctcatatcc gcacctcctc aaacgctacc tcgaccagaa aggcgtctct tttaaatcgt 9120 gtctgttaaa tggttctgtc gaagtcgcgc cgcgcgcggg gctggccgac gctatctgcg 9180 atttggtctc taccggcgcg acgcttgaag ctaacggcct gcgtgaagtc gaagttatct 9240 accgctctaa agcctgtctg attcagcgcg acggtgagat ggcacagagc aagcaagagc 9300 tgatcgataa attgctgacc cgtattcagg gcgtgattca ggcgcgcgaa tcgaaataca 9360 Página 32
107345_104_Sequence_Listing tcatgatgca cgcgccaagt gaacgcctgg aagaggttat cgccctgctg ccaggcgccg 9420 aaaggccgac aattctgccg ctggcaggcg agcaacagcg cgtggcgatg cacatggtca 9480 gcagcgaaac gttgttctgg gaaaccatgg agaaactgaa agcgcttggc gccagctcga 9540 ttctggtact gccgatcgag aagatgatgg agtgatctga cgcctgatgg cgctgcgctt 9600 atcaggccta cgtaatgcgt tgaaaaactg tattataagt aaatgcatgt atactaaact 9660 cacaaattag agcttcaatt taattatatc agttattacc cgggaatctc ggtcgtaatg 9720 atttctataa tgacgaaaaa aaaaaaattg gaaagaaaaa gcttcatggc ctttataaaa 9780 aggaactatc caatacctcg ccagaaccaa gtaacagtat tttacggggc acaaatcaag 9840 aacaataaga caggactgta aagatggacg cattgaactc caaagaacaa caagagttcc 9900 aaaaagtagt ggaacaaaag caaatgaagg atttcatgcg tttgtactct aatctggtag 9960 aaagatgttt cacagactgt gtcaatgact tcacaacatc aaagctaacc aataaggaac 10020 aaacatgcat catgaagtgc tcagaaaagt tcttgaagca tagcgaacgt gtagggcagc 10080 gtttccaaga acaaaacgct gccttgggac aaggcttggg ccgataaggt gtactggcgt 10140 atatatatct aattatgtat ctctggtgta gcccattttt agcatgtaaa tataaagaga 10200 aaccatatct aatctaacca aatccaaaca aaattcaata gttactatcg cttttttctt 10260 tctgtatcgc aaataagtga aaattaaaaa agaaagatta aattggaagt tggatatggg 10320 ctggaacagc agcagtaatc ggtatcgggt tcgccactaa tgacgtccta cgattgcact 10380 caacagacct tgacgctcac gccgtagcgg gcgacaagtc aaacggaaca accgttgccg 10440 ttcccatcgg agtccgacct aggccgaact ccgtgaartt ctgataacaa cggtcggtaa 10500 agactggttc cccagtatat ttcttctctc aggagcaggg gccaatgcca aaagcgacat 10560 taacccggag gacaaggctc cactgtgttc caccgaattt cccacctgat aatatctgat 10620 aac 10623
<210> 24 <211> 8479 <212> DNA <213> Artificja1 sequence
<220> <223> synthetic: Integration construct i467 <400> 24 gacggcacgg ccacgcgttt aaaccgccct ccaagctgac ataaatcgca ctttgtatct 60 actttttttt attcgaaaac aaggcacaac aatgaatcta tcgccctgtg agattttcaa 120 tctcaagttt gtgtaataga tagcgttata ttatagaact ataaaggtcc ttgaatatac 180 atagtgtttc attcctatta ctgtatatgt gactttacat tgttacttcc gcggctattt 240 gacgttttct gcttcaggtg cggcttggag ggcaaagtgt cagaaaatcg gccaggccgt 300 página 33
107345_104_Sequence_Listing atgacacaaa agagtagaaa acgagatctc aaatatctcg aggcctgtcc tctatacaac 360 cgcccagctc tctgacaaag ctccagaacg gttgtctttt gtttcgaaaa gccaaggtcc 420 cttataattg ccctccattt tgtgtcacct atttaagcaa aaaattgaaa gtttactaac 480 ctttcattaa agagaaataa caatattata aaaagcgctt aaagctcaca cgcggccagg 540 gggagccgtt catcatctca tggatctgca catgaacaaa caccagagtc aaacgacgtt 600 gaaattgagg ctactgcgcc aattgatgac aatacagacg atgataacaa accgaagtta 660 tctgatgtag aaaaggatta aagatgctaa gagatagtga tgatatttca taaataatgt 720 aattctatat atgttaatta ccttttttgc gaggcatatt tatggtgaag gataagtttt 780 gaccatcaaa gaaggttaat gtggctgtgg tttcagggtc cataaagctt ttcaattcat 840 cttttttttt tttgttcttt tttttgattc cggtttcttt gaaatttttt tgattcggta 900 atctccgagc agaaggaaga acgaaggaag gagcacagac ttagattggt atatatacgc 960 atatgtggtg ttgaagaaac atgaaattgc ccagtattct taacccaact gcacagaaca 1020 aaaacctgca ggaaacgaag ataaatcatg tcgaaagcta catataagga acgtgctgct 1080 actcatccta gtcctgttgc tgccaagcta tttaatatca tgcacgaaaa gcaaacaaac 1140 ttgtgtgctt cattggatgt tcgtaccacc aaggaattac tggagttagt tgaagcatta 1200 ggtcccaaaa tttgtttact aaaaacacat gtggatatct tgactgattt ttccatggag 1260 ggcacagtta agccgctaaa ggcattatcc gccaagtaca attttttact cttcgaagac 1320 agaaaatttg ctgacattgg taatacagtc aaattgcagt actctgcggg tgtatacaga 1380 atagcagaat gggcagacat tacgaatgca cacggtgtgg tgggcccagg tattgttagc 1440 ggtttgaagc aggcggcaga agaagtaaca aaggaaccta gaggcctttt gatgttagca 1500 gaattgtcat gcaagggctc cctatctact ggagaatata ctaagggtac tgttgacatt 1560 gcgaagagtg acaaagattt tgttatcggc tttattgctc aaagagacat gggtggaaga 1620 gatgaaggtt acgattggtt gattatgaca cccggtgtgg gtttagatga caagggagac 1680 gcattgggtc aacagtatag aaccgtggat gatgtggtct ctacaggatc tgacattatt 1740 attgttggaa gaggactatt tgcaaaggga agggatgcta aggtagaggg tgaacgttac 1800 agaaaagcag gctgggaagc atatttgaga agatgcggcc agcaaaacta aaaaactgta 1860 ttataagtaa atgcatgtat actaaactca caaattagag cttcaattta attatatcag 1920 ttattacccg ggaatctcgg tcgtaatgat ttctataatg acgaaaaaaa aaaaattgga 1980 aagaaaaagc ttcatggcct ttataaaaag gaactatcca atacctcgcc agaaccaagt 2040 aacagtattt tacggggcac aaatcaagaa caataagaca ggactgtaaa gatggacgca 2100 rcgctcgtcc aacgccggcg gacctgtttt caatagttcg gtaatattaa cggataccta 2160 página 34
107345_104_sequence_Ljsting ctattatccc ctagtaggct cttttcacgg agaaattcgg gagtgttttt tttccgtgcg 2220 cattttctta gctatattct tccagcttcg cctgctgccc ggtcatcgtt cctgtcacgt 2280 agtttttccg gattcgtccg gctcatataa taccgcaata aacacggaat atctcgttcc 2340 gcggattcgg ttaaactctc ggtcgcggat tatcacagag aaagcttcgt ggagaatttt 2400 tccagatttt ccgctttccc cgatgttggt atttccggag gtcattatac tgaccgccat 2460 tataatgact gtacaacgac cttctggaga aagaaacaac tcaataacga tgtgggacat 2520 tgggggccca ctcaaaaaat ctggggacta tatccccaga gaatttctcc agaagagaag 2580 aaaagtcaaa gttttttttc gcttgggggt tgcatataaa tacaggcgct gttttatctt 2640 cagcatgaat attccataat tttacttaat agcttttcat aaataataga atcacaaaca 2700 aaatttacat ctgagttaaa caatcatgac aatcaaggaa cataaagtag tttatgaagc 2760 tcacaacgta aaggctctta aggctcctca acatttttac aacagccaac ccggcaaggg 2820 ttacgttact gatatgcaac attatcaaga aatgtatcaa caatctatca atgagccaga 2880 aaaattcttt gataagatgg ctaaggaata cttgcattgg gatgctccat acaccaaagt 2940 tcaatctggt tcattgaaca atggtgatgt tgcatggttt ttgaacggta aattgaatgc 3000 atcatacaat tgtgttgaca gacatgcctt tgctaatccc gacaagccag ctttgatcta 3060 tgaagctgat gacgaatccg acaacaaaat catcacattt ggtgaattac tcagaaaagt 3120 ttcccaaatc gctggtgtct taaaaagctg gggcgttaag aaaggtgaca cagtggctat 3180 ctatttgcca atgattccag aagcggtcat tgctatgttg gctgtggctc gtattggtgc 3240 tattcactct gttgtctttg ctgggttctc cgctggttcg ttgaaagatc gtgtcgttga 3300 cgctaattct aaagtggtca tcacttgtga tgaaggtaaa agaggtggta agaccatcaa 3360 cactaaaaaa attgttgacg aaggtttgaa cggagtcgat ttggtttccc gtatcttggt 3420 tttccaaaga actggtactg aaggtattcc aatgaaggcc ggtagagatt actggtggca 3480 tgaggaggcc gctaagcaga gaacttacct acctcctgtt tcatgtgacg ctgaagatcc 3540 tctattttta ttatacactt ccggttccac tggttctcca aagggtgtcg ttcacactac 3600 aggtggttat ttattaggtg ccgctttaac aactagatac gtttttgata ttcacccaga 3660 agatgttctc ttcactgccg gtgacgtcgg ctggatcacg ggtcacacct atgctctata 3720 tggtccatta accttgggta ccgcctcaat aattttcgaa tccactcctg cctacccaga 3780 ttatggtaga tattggagaa ttatccaacg tcacaaggct acccatttct atgtggctcc 3840 aactgcttta agattaatca aacgtgtagg tgaagccgaa attgccaaat atgacacttc 3900 ctcattacgt gtcttgggtt ccgtcggtga accaatctct ccagacttat gggaatggta 3960 tcatgaaaaa gtgggtaaca aaaactgtgt catttgtgac actatgtggc aaacagagtc 4020 tggttctcat ttaattgctc ctttggcagg tgctgtccca acaaaacctg gttctgctac 4080 página 35
107345_104_sequencê_Listing cgtgccattc tttggtatta acgcttgtat cattgaccct gttacaggtg tggaattaga 4140 aggtaatgat gtcgaaggtg tccttgccgt taaatcacca tggccatcaa tggctagatc 4200 tgtttggaac caccacgacc gttacatgga tacttacttg aaaccttatc ctggtcacta 4260 tttcacaggt gatggtgctg gtagagatca tgatggttac tactggatca ggggtagagt 4320 tgacgacgtt gtaaatgttt ccggtcatag attatccaca tcagaaattg aagcatctat 4380 ctcaaatcac gaaaacgtct cggaagctgc tgttgtcggt attccagatg aattgaccgg 4440 tcaaaccgtc gttgcatatg tttccctaaa agatggttat ctacaaaaca acgctactga 4500 aggtgatgca gaacacatca caccagataa tttacgtaga gaattgatct tacaagttag 4560 gggtgagatt ggtcctttcg cctcaccaaa aaccattatt ctagttagag atctaccaag 4620 aacaaggtca ggaaagatta tgagaagagt tctaagaaag gttgcttcta acgaagccga 4680 acagctaggt gacctaacta ctttggccaa cccagaagtt gtacctgcca tcatttctgc 4740 tgtagagaac caatttttct ctcaaaaaaa gaaataaatt gaattgaatt gaaatcgata 4800 gatcaatttt tttcttttct ctttccccat cctttacgct aaaataatag tttattttat 4860 tttttgaata ttttttattt atatacgtat atatagacta ttatttatct tttaatgatt 4920 attaagattt ttattaaaaa aaaattcgct cctcttttaa tgcctttatg cagttttttt 4980 ttcccattcg atatttctat gttcgggttc agcgtatttt aagtttaata actcgaaaat 5040 tctgcgttcg ttaaagcttt cgagaaggat attatttcga aataaaccgt gttgtgtaag 5100 cttgaagcct ttttgcgctg ccaatattct tatccatcta ttgtactctt tagatccagt 5160 atagtgtatt cttcctgctc caagctcatc ccatccccgc gtgcttggcc ggccgttttg 5220 ccaçcttact atccttcttg aaaatatgca ctctatatct tttagttctt aattgcaaca 5280 catagatttg ctgtataacg aattttatgc tattttttaa atttggagtt cagtgataaa 5340 agtgtcacag cgaatttcct cacatgtagg gaccgaattg tttacaagtt ctctgtacca 5400 ccatggagac atcaaaaatt gaaaatctat ggaaagatat ggacggtagc aacaagaata 5460 tagcacgagc cgcggagttc atttcgttac ttttgatatc actcacaact attgcgaagc 5520 gcttcagtga aaaaatcata aggaaaagtt gtaaatatta ttggtagtat tcgtttggta 5580 aagtagaggg ggtaattttt cccctttatt ttgttcatac attcttaaat tgctttgcct 5640 ctccttttgg aaagctatac ttcggagcac tgttgagcga aggctcatta gatatatttt 5700 ctgtcatttt ccttaaccca aaaataaggg aaagggtcca aaaagcgctc ggacaactgt 5760 tgaccgtgat ccgaaggact ggctatacag tgttcacaaa atagccaagc tgaaaataat 5820 gtgtagctat gttcagttag tttggctagc aaagatataa aagcaggtcg gaaatattta 5880 tgggcattat tatgcagagc atcaacatga taaaaaaaaa cagttgaata ttccctcaaa 5940 página 36
107345_104_sequence_Ljsting aatgtcttac accgtcggaa cctacttggc cgagaggttg gtccagatcg gattgaagca 6000 ccacttcgcc gtcgccggtg actacaactt ggtcttgttg gacaacttgt tgttgaacaa 6060 gaacatggag caggtctatt gctgcaacga gttgaactgc ggtttctcag cagaaggtta 6120 tgcaagagcc aagggagcag ccgctgccgt cgtcacctac tcagtcggtg cattatcagc 6180 attcgatgca attggaggtg cttacgctga gaacttgcca gtcatcttga tctctggagc 6240 acctaacaac aacgaccatg ctgctggtca cgtattgcac cacgccttgg gtaaaacaga 6300 ctaccactac cagttggaaa tggcaaaaaa tattaccgca gccgcagagg ccatctacac 6360 cccagaggaa gcacctgcca aaattgacca cgtcataaag accgctttga gagagaagaa 6420 gcctgtttac ttggagatcg cctgcaacat cgcttctatg ccatgcgccg cacctggtcc 6480 agcctctgct ttgttcaacg acgaggcctc tgacgaagct tcattgaacg ccgcagtcga 6540 agagacatta aagttcatcg ccaacaggga caaagttgcc gtcttagtcg gttcaaagtt 6600 gagggccgct ggtgccgaag aggcagctgt caagttcgct gacgccttgg gaggagccgt 6660 cgccaccatg gccgcagcaa aatctttctt tcctgaggag aacccacatt acatcggaac 6720 ctcatggggt gaagtatcat atcctggagt agaaaaaacc atgaaagagg ccgatçccgt 6780 aatagcattg gctcctgtct tcaacgacta ctcaaccaca ggatggactg atataccaga 6840 tccaaagaaa ttagtcttgg ctgagcctag gtctgtcgtc gtaaacggta tcaggttccc 6900 ttctgttcat ttgaaggact acttaacaag attggcccaa aaggtatcta aaaagactgg 6960 tgccttggac ttcttcaagt cattaaacgc aggagaattg aaaaaagcag caccagccga 7020 tccatcagcc ccattagtta acgctgaaat cgctagacaa gtagaggctt tgttgactcc 7080 aaacactacc gtcatagctg agacaggtga ctcttggttc aacgcacaga gaatgaaatt 7140 gccaaatggt gccagggtcg agtatgaaat gcagtgggga catataggtt ggtcagtccc 7200 agccgccttt ggatacgcag taggtgcccc tgagaggagg aacatattga tggttggtga 7260 tggttcattc caattaacag cccaggaggt agcccaaatg gtcaggttga agttgcctgt 7320 catcatcttc ttgatcaaca attacggata caccatcgag gtcatgatcc acgacggacc 7380 ttacaacaac atcaaaaact gggactacgc cggtttgatg gaggttttca acggtaacgg 7440 tggttatgac tcaggagccg gtaagggatt aaaçgctaag accggtggtg aattggctga 7500 agcaattaag gtcgcattgg ccaacaccga tggacctaca ttgattgaat gcttcatcgg 7560 aagggaggac tgcaccgagg aattggttaa atggggtaaa agggtagccg ctgctaattc 7620 aagaaaacca gttaataaat tattataata agtgaattta ctttaaatct tgcatttaaa 7680 taaattttct ttttatagct ttatgactta gtttcaattt atatactatt ttaatgacat 7740 tttcgattca ttgattgaaa gctttgtgtt ttttcttgat gcgctattgc attgttcttg 7800 tctttttcgc cacatgtaat atctgtagta gatacctgat acattgtgga tgctgagtga 7860 página 37
107345_104_Sequence_Listing aattttagtt aataatggag gcgctcttaa taattttggg gatattggct taacctgcag 7920 gccgcgagcg ccgatataaa ctaatgattt taaatcgtta aaaaaatatg cgaattctgt 7980 ggatcgaaca caggacctcc agataacttg accgaagttt tttcttcagt ctggcgctct 8040 cccaactgag ctaaatccgc ttactatttg ttatcagttc ccttcatatc tacatagaat 8100 aggttaagta ttttattagt tgccagaaga actactgata gttgggaata tttggtgaat 8160 aatgaagatt gggtgaataa tttgataatt ttgagattca attgttaatc aatgttacaa 8220 tattatgtat acagagtata ctagaagttc tcttcggaga tcttgaagtt cacaaaaggg 8280 aatcgatatt tctacataat attatcatta cttcttcccc atcttatatt tgtcattcat 8340 tattgattat gatcaatgca ataatgattg gtagttgcca aacatttaat acgatcctct 8400 gtaatatttc tatgaataat tatcacagca acgttcaatt atcttcaatt ccggtgttta 8460 aaccccagcg cctggcggg 8479
<210> 25 <211> 5628 <212> DNA <213> Artificia1 Sequence <220> <223> Synthetic: URA3 Fcphl target site cassette <400> 25 gcctgtctac aggataaaga cgggtcggat acctgcacaa gcaatttggc acctgcatac 60 cccatttccc cagtagataa cttcaacaca cacatcaatg tccctcacca gtttatttcc 120 aaaagagacg ctttttacta cctgactaga ttttcatttt gtttcttttg gattgcgctt 180 gcctttgtag gtgtgtcgtt tatcctttac gttttgactt ggtgctcgaa gatgctttca 240 gagatggtgc ttatcctcat gtcttttggg tttgtcttca atacggcagc cgttgtcttg 300 caaacggccg cctctgccat ggcaaagaat gctttccatg acgatcatcg tagtgcccaa 360 trgggtgcct ctatgatggg tttaaacgta tggcttgggc aagtgtcttt ttatgtatcg 420 tggaatttat cctgctggtc ttctggtctg ttagggcaag gttggcctct acttactcca 480 tcgacaattc aagatacaga acctcctcca gatggaatcc cttccataga gagaaggagc 540 aagcaactga cccaatattg actgccactg gacctgaaga catgcaacaa agtgcaagca 600 tagtggggcc ttcttccaat gctaatccgg tcactgccac tgctgctacg gaaaaccaac 660 ctaaaggtat taacttcttc actataagaa aatcacacga gcgcccggac gatgtctctg 720 tttaaatggc gcaagttttc cgctttgtaa tatatattta tacccctttc ttctctcccc 780 tgcaatataa tagtttaatt ctaatattaa taatatccta tattttcttc atttaccggc 840 gcactctcgc ccgaacgacc tcaaaatgtc tgctacattc ataataacca aaagctcata 900 página 38
107345_104_sequence_Ljsting actttttttt ttgaacctga atatatatac atcacatatc actgctggtc ctttgtgagc 960 gttgcgctcg tgcatcatgc gtccatcttt acagtcctgt cttattgttc ttgatttgtg 1020 ccccgtaaaa tactgttact tggttctggc gaggtattgg atagttcctt tttataaagg 1080 ccatgaagct ttttctttcc aatttttttt ttttcgtcat tatagaaatc attacgaccg 1140 agattcccgg gtaataactg atataattaa attgaagctc taatttgtga gtttagtata 1200 catgcattta cttataatac agttttttag ttttgctggc cgcatcttct caaatatgct 1260 tcccagcctg cttttctgta acgttcaccc tctaccttag catcccttcc ctttgcaaat 1320 agtcctcttc caacaataat aatgtcagat cctgtagaga ccacatcatc cacggttcta 1380 tactgttgac ccaatgcgtc tcccttgtca tctaaaccca caccgggtgt cataatcaac 1440 caatcgtaac cttcatctct tccacccatg tctctttgag caataaagcc gataacaaaa 1500 tctttgtcac tcttcgcaat gtcaacagta cccttagtat attctccagt agatagggag 1560 cccttgcatg acaattctgc taacatcaaa aggcctctag gttcctttgt tacttcttct 1620 gccgcctgct tcaaaccgct aacaatacct gggcccacca caccgtgtgc attcgtaatg 1680 tctgcccatt ctgctattct gtatacaccc gcagagtact gcaatttgac tgtattacca 1740 atgtcagcaa attttctgtc ttcgaagagt aaaaaattgt acttggcgga taatgccttt 1800 agcggcttaa ctgtgccctc catggaaaaa tcagtcaaga tatccacatg tgtttttagt 1860 aaacaaattt tgggacctaa tgcttcaact aactccagta attccttggt ggtacgaaca 1920 tccaatgaag cacacaagtt tgtttgcttt tcgtgcatga tattaaatag cttggcagca 1980 acaggactag gatgagtagc agcacgttcc ttatatgtag ctttcgacat gatttatctt 2040 cgtttcctgc aggtttttgt tctgtgcagt tgggttaaga atactgggca atttcatgtt 2100 tcttcaacac cacatatgcg tatatatacc aatctaagtc tgtgctcctt ccttcgttct 2160 tccttctgct cggagattac cgaatcaaaa aaatttcaaa gaaaccggaa tcaaaaaaaa 2220 gaacaaaaaa aaaaaagatg aattgaaaag ctttatggac cctgaaacca cagccacatt 2280 aaccttcttt gatggtcaaa acttatcctt caccataaat atgcctcgca aaaaaggtaa 2340 ttaacatata tagaattaca ttatttatga aatatcatca ctatctctta gcatctttaa 2400 tccttttcta catcagataa cttcggtttg ttatcatcgt ctgtattgtc atcaattggc 2460 gcagtagcct caatttcaac gtcgtttgac tctggtgttt gttcatgtgc agatccatga 2520 gatgatgaac ttgtgagcgt tgcgctcgtg catcaccata tacatatcca tatctaatct 2580 tacttatatg ttgtggaaat gtaaagagcc ccattatctt agcctaaaaa aaccttctct 2640 ttggaacttt cagtaatacg cttaactgct cattgctata ttgaagtacg gattagaagc 2700 cgccgagcgg gcgacagccc tccgacggaa gactctcctc cgtgcgtcct ggtcttcacc 2760 ggtcgcgttc ctgaaacgca gatgtgcctc gcgccgcact gctccgaaca ataaagattc 2820 página 39
107345_104_sequence_Ljstjng tacaatacta gcttttatgg ttatgaagag gaaaaattgg cagtaacctg gccccacaaa 2880 ccttcaaatc aacgaatcaa attaacaacc ataggataat aatgcgatta gttttttagc 2940 cttatttctg gggtaattaa tcagcgaagc gatgattttt gatctattaa cagatatata 3000 aatgcaaaag ctgcataacc actttaacta atactttcaa cattttcggt ttgtattact 3060 tcttattcaa atgtcataaa agtatcaaca aaaaattgtt aatatacctc tatactttaa 3120 cgtcaaggag aaaaaactat aatgtcatta ccgttcttaa cttctgcacc gçgaaaggtt 3180 attatttttg gtgaacactc tgctgtgtac aacaagcctg ccgtcgctgc tagtgtgtct 3240 gcgttgagaa cctacctgct aataagcgag tcatctgcac cagatactat tgaattggac 3300 ttcccggaca ttagctttaa tcataagtgg tccatcaatg atttcaatgc catcaccgag 3360 gatcaagtaa actcccaaaa attggccaag gctcaacaag ccaccgatgg cttgtctcag 3420 gaactcgtta gtcttttgga tccgttgtta gctcaactat ccgaatcctt ccactaccat 3480 gcagcgtttt gtttcctgta tatgtttgtt tgcctatgcc cccatgccaa gaatattaag 3540 ttttctttaa agtctacttt acccatcggt gctgggttgg gctcaagcgc ctctatttct 3600 gtatcactgg ccttagctat ggcctacttg ggggggttaa taggatctaa tgacttggaa 3660 aagctgtcag aaaacgataa gcatatagtg aatcaatggg ccttcatagg tgaaaagtgt 3720 attcacggta ccccttcagg aatagataac gctgtggcca cttatggtaa tgccctgcta 3780 tttgaaaaag actcacataa tggaacaata aacacaaaca attttaagtt cttagatgat 3840 ttcccagcca ttccaatgat cctaacctat actagaartc caaggtctac aaaagatctt 3900 gttgctcgcg ttcgtgtgtt ggtcaccgag aaatttcctg aagttatgaa gccaattcta 3960 gatgccatgg gtgaatgtgc cctacaaggc ttagagatca tgactaagtt aagtaaatgt 4020 aaaggcaccg atgacgaggc tgtagaaact aataatgaac tgtatgaaca actattggaa 4080 ttgataagaa taaatcatgg actgcttgtc tcaatcggtg tttctcatcc tggattagaa 4140 cttattaaaa atctgagcga tgatttgaga attggctcca caaaacttac cggtgctggt 4200 ggcggcggtt gctctttgac tttgttacga agagacatta ctcaagagca aattgacagt 4260 ttcaaaaaga aattgcaaga tgattttagt tacgagacat ttgaaacaga cttgggtggg 4320 actggctgct gtttgttaag cgcaaaaaat ttgaataaag atcttaaaat caaatcccta 4380 gtattccaat tatttgaaaa taaaactacc acaaagcaac aaattgacga tctattattg 4440 ccaggaaaca cgaatttacc atggacttca taagctaatt tgcgataggc attatttatt 4500 agttgttttt aatcttaact gtgtatgaag ttttatgtaa taaagataga aagagaaaca 4560 aaaaaaaatt tttcgtagta tcaattcagc tttcgaagac agaatgaaat ttaagcagac 4620 catcatcttg ccctgtgctt ggcccccagt gcagcgaacg rtataaaaac gaatactgag 4680 página 40
107345_104_sequence_Listing tatatatcta tgtaaaacaa ccatatcatt tcttgttctg aactttgttt acctaactag 4740 ttttaaattt ccctttttcg tgcatgcggg tgttcttatt tattagcata ctacatttga 4800 aatatcaaat ttccttagta gaaaagtgag agaaggtgca ctgacacaaa aaataaaatg 4860 ctacgtataa ctgtcaaaac tttgcagcag cgggcatcct tccatcatag cttcaaacat 4920 attagcgttc ctgatcttca tacccgtgct caaaatgatc aaacaaactg ttattgccaa 4980 gaaataaacg caaggctgcc ttcaaaaact gatccattag atcctcatat caagcttcct 5040 catagaacgc ccaattacaa taagcatgtt ttgctgttat caccgggtga taggtttgct 5100 caaccatgga aggtagcatg gaatcataat ttggatacta atacaaatcg gccatataat 5160 gccattagta aattgcgctc ccatttaggt ggttctccag gcaaatttga atactaataa 5220 atgcggtgca tttgcaaaat gaatttattc caaggccaaa acaacacgat gaatggcttt 5280 atttttttgt tattcctgac atgaagcttt atgtaattaa ggaaacggac atcgaggaat 5340 ttgcatcttt tttagatgaa ggagctattc aagcaccaaa gctatcctrc caggattatt 5400 taagcggtaa ggccaaggct tcccaacagg ttcatgaagt gcatcataga aagcttacaa 5460 ggtttcaggg tgaaactttt ctaagagatt ggaacttagt ctgtgggcat tataagagag 5520 atgctaagtg tggagaaatg ggacccgaca taattgcagc atttcaagat gaaaagcttt 5580 ttcctgagaa taatctagcc ttaatttctc atattggggg tcatattt 5628
<210> 26 <211> 10019 <212> DNA <213> Artificja] sequence <220> <223> Synthetic: HXT3 FcphI target site cassette <400> 26 accggtatat caaatggcgg tgtagtttga aaagtacact gtatgtccat taataaaatt 60 acgccgaaga acactgacta gctataaatt ctcttccggc gtccaatttc aacctaaggc 120 aagtattgtt aatcaataat gcgtgttggt aaatatgaag cccgatgttg attaagaaga 180 attattcgta taagaattaa gcaagcaaaa ttaaggaaaa ttttttcttt cctattcgtc 240 atcgcagaca gccttcatct tctcgagata acacctggag gaggagcaat gaaatgaaag 300 gaaaaaaaaa tactttcttt ttcttgaaaa aagaaaaaaa ttgtaagatg agctattcgc 360 ggaacattct agctcgtttg catcttcttg catttggtag gttttcaata gttcggtaat 420 attaacggat acctactatt atcccctagt aggctctttt cacggagaaa ttcgggagtg 480 ttttttttcc gtgcgcattt tcttagctat attcttccag cttcgcctgc tgcccggtca 540 rcgttcctgt cacgtagttt ttccggattc gtccggctca tataataccg caataaacac 600 ggaatatctc gttccgcgga ttcggttaaa ctctcggtcg cggattatca cagagaaagc 660 página 41
107345_104_sequence_Listjng ttcgtggaga atttttccag attttccgct ttccccgatg ttggtatttc cggaggtcat 720 tatactgacc gccattataa tgactgtaca acgaccttct ggagaaagaa acaactcaat 780 aacgatgtgg gacattgggg gcccactcaa aaaatctggg gactatatcc ccagagaatt 840 tctccagaag agaagaaaag tcaaagtttt ttttcgcttg ggggttgcat ataaattgtg 900 agcgttgcgc tcgtgcatcg tcgacactag taatacacat catcgtccta caagttcatc 960 aaagtgttgg acagacaact ataccagcat ggatctcttg tatcggttct tttctcccgc 1020 tctctcgcaa taacaatgaa cactgggtca atcatagcct acacaggtga acagagtagc 1080 gtttatacag ggtttatacg gtgattccta cggcaaaaat ttttcatttc taaaaaaaaa 1140 aagaaaaatt tttctttcca acgctagaag gaaaagaaaa atctaattaa attgatrtgg 1200 tgattttctg agagttccct ttttcatata tcgaattttg aatataaaag gagatcgaaa 1260 aaatttttct attcaatctg ttttctggtt ttatttgata gtttttttgt gtattattat 1320 tatggattag tactggttta tatgggtttt tctgtataac ttctttttat tttagtttgt 1380 ttaatcttat tttgagttac attatagttc cctaactgca agagaagtaa cattaaaaat 1440 gaccactctt gacgacacgg cttaccggta ccgcaccagt gtcccggggg acgccgaggc 1500 catcgaggca ctggatgggt ccttcaccac cgacaccgtc ttccgcgtca ccgccaccgg 1560 ggacggcttc accctgcggg aggtgccggt ggacccgccc ctgaccaagg tgttccccga 1620 cgacgaatcg gacgacgaat cggacgccgg ggaggacggc gacccggact cccggacgtt 1680 cgtcgcgtac ggggacgacg gcgacctggc gggcttcgtg gtcgtctcgt actccggctg 1740 gaaccgccgg ctgaccgtcg aggacatcga ggtcgccccg gagcaccggg ggcacggggt 1800 cgggcgcgcg ttgatggggc tcgcgacgga gttcgcccgc gagcggggcg ccgggcacct 1860 ctggctggag gtcaccaacg tcaacgcacc ggcgatccac gcgtaccggc ggatggggtt 1920 caccctctgc ggcctggaca ccgccctgta cgacggcacc gcctcggacg gcgagcaggc 1980 gctctacatg agcatgccct gcccctgagt ttaacttgat actactagat tttttctctt 2040 catttataaa atttttggtt ataattgaag ctttagaagt atgaaaaaat cctttttttt 2100 cattctttgc aaccaaaata agaagcttct tttattcatt gaaatgatga atataaacct 2160 aacaaaagaa aaagactcga atatcaaaca ttaaaaaaaa ataaaagagg ttatctgttt 2220 tcccatttag ttggagtttg cattttctaa tagatagaac tctcaattaa tgtggattta 2280 gtttctctgt tcgttttttt ttgttttgtt ctcactgtat ttacatttct atttagtatt 2340 tagttattca tataatctta acttctcgag gagctcgatg cgtccatctt tacagtcctg 2400 tcttattgtt cttgatttgt gccccgtaaa atactgttac ttggttctgg cgaggtattg 2460 gatagttcct ttttataaag gccatgaagc tttttctttc caattttttt tttttcgtca 2520 página 42
107345_104_sequence_Ljsting ttatagaaat cattacgacc gagattcccg ggtaataact gatataatta aattgaagct 2580 ctaattrgtg agtttagtat acacgcattt acttataata cagtttttta gttttgctgg 2640 ccgcatcttc tcaaatatgc ttcccagcct gcttttctgt aacgttcacc ctctacctta 2700 gcatcccttc cctttgcaaa tagtcctctt ccaacaataa taatgtcaga tcctgtagag 2760 accacatcat ccacggttct atactgttga cccaatgcgt ctcccttgtc atctaaaccc 2820 acaccgggtg tcataatcaa ccaatcgtaa ccttcatctc ttccacccat gtctctttga 2880 gcaataaagc cgataacaaa atctttgtca ctcttcgcaa tgtcaacagt acccttagta 2940 tattctccag tagataggga gcccttgcat gacaattctg ctaacatcaa aaggcctcta 3000 ggttcctttg ttacttcttc tgccgcctgc ttcaaaccgc raacaatacc tgggcccacc 3060 acaccgtgtg cattcgtaat gtctgcccat tctgctattc tgtatacacc cgcagagtac 3120 tgcaatttga ctgtattacc aatgtcagca aattttctgt cttcgaagag taaaaaattg 3180 tacttggcgg ataatgcctt tagcggctta actgtgccct ccatggaaaa atcagtcaag 3240 atatccacat gtgtttttag taaacaaatt ttgggaccta atgcttcaac taactccagt 3300 aattccttgg tggtacgaac atccaatgaa gcacacaagt ttgtttgctt ttcgtgcatg 3360 atattaaata gcttggcagc aacaggacta ggatgagtag cagcacgttc cttatatgta 3420 gctttcgaca tgatttatct tcgtttcctg caggtttttg ttctgtgcag ttgggttaag 3480 aatactgggc aatttcatgt ttcttcaaca ccacatatgc gtatatatac caatctaagt 3540 ctgtgctcct tccttcgttc ttccttctgc tcggagatta ccgaatcaaa aaaatttcaa 3600 agaaaccgga atcaaaaaaa agaacaaaaa aaaaaaagat gaattgaaaa gctttatgga 3660 ccctgaaacc acagccacat taaccttctt tgatggtcaa aacttatcct tcaccataaa 3720 tatgcctcgc aaaaaaggta attaacatat atagaattac attatttatg aaatatcatc 3780 actatctctt agcatcttta atccttttct acatcagata acttcggttt gttatcatcg 3840 tctgtattgt catcaattgg cgcagtagcc tcaatttcaa cgtcgtttga ctctggtgtt 3900 tgttcatgtg cagatccatg agatgatgaa cttgtgagcg ttgcgctcgt gcatccgctc 3960 gtccaacgcc ggcggacctc gctcgtccaa cgccggcgga cctcttttaa ttctgctgta 4020 acccgtacat gcccaaaata gggggcgggt tacacagaat atataacatc gtaggtgtct 4080 gggtgaacag tttattcctg gcatccacta aatataatgg agcccgcttt ttaagctggc 4140 atccagaaaa aaaaagaatc ccagcaccaa aatattgttt tcttcaccaa ccatcagttc 4200 ataggtccat tctcttagcg caactacaga gaacaggggc acaaacaggc aaaaaacggg 4260 cacaaccrca atggagtgat gcaacctgcc tggagtaaat gatgacacaa ggcaattgac 4320 ccacgcatgt atctatctca ttttcttaca ccttctatta ccttctgctc tctctgattt 4380 ggaaaaagct gaaaaaaaag gttgaaacca gttccctgaa attattcccc tacttgacta 4440 página 43
107345_104_Sequencé_Listing ataagtatat aaagacggta ggtattgatt gtaattctgt aaatctattt cttaaacttc 4500 ttaaattcta cttttatagt tagtcttttt tttagtttta aaacaccaag aacttagttt 4560 cgatccccgc gtgcttggcc ggccgtatcc ccgcgtgctt ggccggccgt atgtctcaga 4620 acgtttacat tgtatcgact gccagaaccc caattggttc attccagggt tctctatcct 4680 ccaagacagc agtggaattg ggtgctgttg ctttaaaagg cgccttggct aaggttccag 4740 aattggatgc atccaaggat tttgacgaaa ttatttttgg taacgttctt tctgccaatt 4800 tgggccaagc tccggccaga caagttgctt tggctgccgg tttgagtaat catatcgttg 4860 caagcacagt taacaaggtc tgtgcatccg ctatgaaggc aatcattttg ggtgctcaat 4920 ccatcaaatg tggtaatgct gatgttgtcg tagctggtgg ttgtgaatct atgactaacg 4980 caccatacta catgccagca gcccgtgcgg gtgccaaatt tggccaaact gttcttgttg 5040 atggtgtcga aagagatggg ttgaacgatg cgtacgatgg tctagccatg ggtgtacacg 5100 cagaaaagtg tgcccgtgat tgggatatta ctagagaaca acaagacaat tttgccatcg 5160 aatcctacca aaaatctcaa aaatctcaaa aggaaggtaa attcgacaat gaaattgtac 5220 ctgttaccat taagggattt agaggtaagc ctgatactca agtcacgaag gacgaggaac 5280 ctgctagatt acacgttgaa aaattgagat ctgcaaggac tgttttccaa aaagaaaacg 5340 gtactgttac tgccgctaac gcttctccaa tcaacgatgg tgctgcagcc gtcatcttgg 5400 tttccgaaaa agttttgaag gaaaagaatt tgaagccttt ggctattatc aaaggttggg 5460 gtgaggccgc tcatcaacca gctgatttta catgggctcc atctcttgca gttccaaagg 5520 ctttgaaaca tgctggcatc gaagacatca attctgttga ttactttgaa ttcaatgaag 5580 ccttttcggt tgtcggtttg gtgaacacta agattttgaa gctagaccca tctaaggtta 5640 atgtatatgg tggtgctgtt gctctaggtc acccattggg ttgttctggt gctagagtgg 5700 ttgttacact gctatccatc rtacagcaag aaggaggtaa gatcggtgtr gccgccattt 5760 gtaatggtgg tggtggtgct tcctctattg tcattgaaaa gatatgatta cgttctgcga 5820 ttttctcatg atctttttca taaaatacat aaatatataa atggctttat gtataacagg 5880 cataatttaa agttttattt gcgattcatc gtttttcagg tactcaaacg ctgaggtgtg 5940 ccttttgact tacttttccg ccttggcaag ctggccgggt gatacttgca caagttccac 6000 taattactga catttgtggt attaactcgt ttgactgctc tacaattgta ggatgttaat 6060 caatgtcttg gctgcctaac ctgcaggccg cgagcgccga tatgctatgt aatagacaat 6120 aaaaccatgt ttatataaaa aaaattcaaa atagaaaacg attctgtaca aggagtattt 6180 tttttttgtt ctagtgtgtt tatattatcc ttggctaaga ggcactgcgt atacttcaag 6240 gtacccctgt gttttgaaaa aaaacaacag taaaatagga actccgcgag gttcaggaac 6300 página 44
107345_104_Sequence_Listing ctgaaacaaa atcaataaaa acattatatg cgtttcgaac aaaattaaag aaaaagaata 6360 aatatagatt aaaaaaaaaa agaagaaatt aaaagaattt ctactaaatc ccaattgtta 6420 tatatttgtt aaatgccaaa aaagtttata aaaaatttag aatgtataaa taataataaa 6480 ctaagtaacg cgatcgccga cgccgccgat atctccctcg ccagcggccg ccttatggct 6540 aagaatgttg gaattttggc catggacatc tacttcccac caacttgtgt tcagcaggag 6600 gctttagaag cacatgacgg agcctcaaag ggtaagtaca caatcggatt aggacaggat 6660 tgcttagcat tctgcactga attggaggac gtcatctcaa tgtctttcaa cgccgtcacc 6720 tcattgttag agaagtacaa aatcgaccca aaccagatcg gaaggttgga agtcggttct 6780 gaaaccgtca tcgacaagtc taaatcaatc aagactttcg ttatgcagtt gttcgaaaag 6840 tgcggtaata ctgacgtcga gggtgtagac tctactaacg cttgttatgg tggtaccgca 6900 gctttattga actgcgtaaa ctgggttgag tcaaactcat gggatggtag gtacggatta 6960 gtcatttgca ccgattctgc cgtctacgcc gagggtccag caaggccaac cggtggagct 7020 gcagctattg ctatgttaat cggaccagat gcccctatag tcttcgagtc taagttgagg 7080 ggttcacaca tccctaacgt ctacgacttc tacaagccaa acttggcctc agagtatcca 7140 gttgtcgacg gaaagttatc tcagacatgc tacttgatgg ccttagattc atgttacaag 7200 cacttatgca acaagttcga aaagttggag ggaaaggagt tctcaattaa cgacgccgac 7260 tacttcgttt ttcactctcc atacaacaaa ttggtccaga agtcattcgc caggttattg 7320 tacaacgatt ttttgagaaa cgcatcatct atcgatgagg ccgccaagga gaaattcacc 7380 ccatattctt ctttgtcatt ggacgagtct taccagtcta gggacttgga gaaggtatca 7440 cagcaattgg ctaaaacctt ctatgacgcc aaagttcagc caaccacctt ggtccctaaa 7500 caggtcggaa atatgtatac tgcatctttg tatgccgcct ttgcctcttt gatccacaac 7560 aagcacaacg atttagtcgg aaaaagggtt gtcatgtttt cttacggtgc cggatctact 7620 gccactatgt tctcattgag gttatgcgaa aaccagtcac cattttcatt gtctaacatc 7680 gcctcagtca tggacgtagg tgtctcacct gagaagttcg tagaaaccat gaagttgatg 7740 gagcacagat acggtgccaa agaattcgtc acttcaaaag agggaatctt ggatttgttg 7800 gccccaggaa cctactattt gaaggaggtc gactctttgt acagaaggtt ctatggaaag 7860 aagggagacg acggatctgt cgcaaacggt cagtaaatcg gcggcgtcgg cgatcgcgtt 7920 aaggcggccg ctggcgaggg agatatttca acctgggcct aacagtaaag atatcctcct 7980 caaaactggt gcacttaatc gctgaatttg ttctggcttc tcttcttttt ctttattccc 8040 cccatgggcc aaaaaaaata gtactatcag gaatttggcg ccgggtcacg atatacgtgt 8100 acagtgacct aggcgacgcc acaaggaaaa aggaaaaaaa cagaaaaaac aacaaaaact 8160 aaaacaaaca cgaaaacttt aatagatcta agtgaagtag tggtgaggca attggagtga 8220 página 45
107345_104_sequence_Ljsting catagcagct actacaacta caaaaaaggc gcgccacggt cgtgcggata tgaaagaggt 8280 cgttatagct tctgccgtca ggaccgccat cggatcttac ggtaagtcat taaaggacgt 8340 ccctgccgtt gatttaggag ccaccgcaat taaagaggcc gttaaaaagg caggtataaa 8400 gccagaggac gtcaacgagg tcatcttggg aaatgtctta caagccggat taggtcaaaa 8460 cccagcaaga caagcatcat tcaaagccgg tttacctgtc gagatacctg caatgaccat 8520 caacaaggtt tgcggttcag gattaaggac cgtttcttta gcagcacaga tcattaaggc 8580 tggagatgca gacgttatca ttgctggtgg tatggaaaac atgtcaagag ccccatactt 8640 ggctaataac gccaggtggg gatataggat gggaaacgcc aagtttgtcg acgaaatgat 8700 tactgacgga ttgtgggacg ccttcaatga ctatcacatg ggtataaccg cagaaaacat 8760 tgccgagagg tggaatatct caagagaaga acaggatgag tttgcattgg cctcacagaa 8820 aaaagcagag gaggcaataa agtcaggtca gtttaaggat gaaatcgtcc cagtcgtcat 8880 caagggaaga aagggtgaga cagttgtcga caccgacgaa caccctagat ttggttcaac 8940 catcgaggga ttagcaaagt tgaagccagc cttcaagaaa gacggaaccg taaccgccgg 9000 taatgcatct ggattgaacg attgcgcagc agttttggtc ataatgtcag ccgagaaagc 9060 taaggagttg ggtgtcaagc cattggcaaa aattgtttca tacggatcag ccggtgtcga 9120 ccctgccatc atgggttacg gaccttttta cgccaccaag gctgcaatcg aaaaggccgg 9180 ttggaccgta gatgaattgg atttgatcga gtcaaacgag gcctttgccg cccaatcatt 9240 ggctgtcgcc aaggacttga agttcgacat gaacaaggtc aacgtcaacg gtggtgccat 9300 cgcattgggt caccctatcg gagcctctgg tgccaggatc ttggttacct tggtccacgc 9360 catgcagaag agggacgcaa agaagggttt ggccaccttg tgcatcggtg gaggtcaggg 9420 aacagctatc ttgttagaga aatgcagccc ctcagccccc ctagcgtcga ataaaagaca 9480 trggtacatg atatcaaaca gaattttaac atttcttgat ccagtttgta aacaaaacaa 9540 acaatttttc taccatttaa cttcatacca tcggcgagag ccgaacagga aaaaaaagaa 9600 gtctccggtt atcgtaagca gtatcaaata ataagaatgt atgtgtgtgc aatttgttat 9660 acccacgaag aagtgcgcag tagagttaga aaaccaactg agtaatcttt actcccgaca 9720 atcgtccaat aatcctcttg ttgctaggaa cgtgatgatg gatttcgttt gaaatccgga 9780 cggaaaactc aaaagaagtc caaccaccaa ccattttcga gcctcaagaa tctctaagca 9840 ggtttcttta ctaaggggat ggcctttctg tcctggacat tttttccttc cttttttcat 9900 ttccttgaaa ggaacagatt ttttttgact tttgccacac agctgcacta tctcaacccc 9960 ttttacattt taagttttcg ggttgaatgg ccggtgttta aaccccagcg cctggcggg 10019
<210> 27 página 46
107345_104_Sequence_Listing <211> 5027 <212> DNA <213> Artificial Sequence
<220> <223> Synthetic: Màt alpha Fcph:r target site cassette
<400> 27 tgatgtctgg gttttgtttg ggatgcaatt tattgcttcc caatgtagaa aagtacatca 60 tatgaaacaa cttaaactct taactacttc ttttaacctt cactttttat gaaatgtatc 120 aaccatatat aataacttaa tagacgacat tcacaatatg tttacttcga agcctgcttt 180 caaaattaag aacaaagcat ccaaatcata cagaaacaca gcggtttcaa aaaagctgaa 240 agaaaaacgt ctagctgagc atgtgaggcc aagctgcttc aatattattc gaccactcaa 300 gaaagatatc cagattcctg ttccttcctc tcgattttta aataaaatcc aaattcacag 360 gatagcgtct ggaagtcaaa atactcagtt tcgacagttc aataagacat ctataaaatc 420 ttcaaagaaa tatttaaact catttatggc ttttagagca tattactcac agtttggctc 480 cggtgtaaaa caaaatgtct tgtcttctct gctcgctgaa gaatggcacg cggacaaaat 540 gcagcacgga atatgggact acttcgcgca acagtataat tttataaacc ctggttttgg 600 ttttgtagag tggttgacga ataattatgc tgaagtacgt ggrgacggat attgggaaga 660 tgtgtttgta catttggcct tatagagtgt ggtcgtggcg gaggttgttt atctttcgag 720 tactgaatgt tgtcagtata gctatcctat ttgaaactcc ccatcgtctt gctcttgttc 780 ccaatgtttg tttatacact catatggcta tacccttatc tacttgcctc ttttgtttat 840 gtctatgtat ttgtataaaa tatgatatta ctcagactca agcaaacaat caatttgtga 900 gcgttgcgct cgtgcatcga gaagttaaga ttatatgaat aactaaatac taaatagaaa 960 tgtaaataca gtgagaacaa aacaaaaaaa aacgaacaga gaaactaaar ccacattaat 1020 tgagagttct atctattaga aaatgcaaac tccaactaaa tgggaaaaca gataacctct 1080 tttatttttt tttaatgttt gatattcgag tctttttctt ttgttaggtt tatattcatc 1140 atttcaatga ataaaagaag cttcttattt tggttgcaaa gaatgaaaaa aaaggatttt 1200 ttcatacttc taaagcttca attataacca aaaattttat aaatgaagag aaaaaatcta 1260 gtagtatcaa gttaaactta çjaaaaactca tcgagcatca aatgaaactg caatttattc 1320 atatcaggat tatcaatacc atatttttga aaaagccgtt tctgtaatga aggagaaaac 1380 tcaccgaggc agttccatag gatggcaaga tcctggtatc ggtctgcgat tccgactcgt 1440 ccaacatcaa tacaacctat taatttcccc tcgtcaaaaa taaggttatc aagtgagaaa 1500 tcaccatgag tgacgactga atccggtgag aatggcaaaa gcttatgcat ttctttccag 1560 acttgttcaa caggccagcc attacgctcg tcatcaaaat cactcgcatc aaccaaaccg 1620 ttattcattc gtgattgcgc ctgagcgaga cgaaatacgc gatcgctgtt aaaaggacaa 1680 págjna 47
107345_104_Sequence_Listing ttacaaacag gaatcgaatg caaccggcgc aggaacactg ccagcgcatc aacaatattt 1740 tcacctgaat caggatattc ttctàatacc tggaatgctg ttttgccggg gatcgcagtg 1800 gtgagtaacc atgcatcatc aggagtacgg ataaaatgct tgatggtcgg aagaggcata 1860 aattccgtca gccagtttag tctgaccatc tcatctgtaa catcattggc aacgctacct 1920 ttgccatgtt tcagaaacaa ctctggcgca tcgggcttcc catacaatcg atagattgtc 1980 gcacctgatt gcccgacatt atcgcgagcc catttatacc catataaatc agcatccatg 2040 ttggaattta atcgcggcct cgaaacgtga gtcttttcct tacccatttt taatgttact 2100 tctcttgcag ttagggaact ataatgtaac tcaaaataag attaaacaaa ctaaaataaa 2160 aagaagttat acagaaaaac ccatataaac cagtactaat ccataataat aatacacaaa 2220 aaaactatca aataaaacca gaaaacagat tgaatagaaa aattttttcg atctcctttt 2280 atattcaaaa ttcgatatat gaaaaaggga actctcagaa aatcaccaaa tcaatttaat 2340 tagatttttc ttttccttct agcgttggaa agaaaaattt ttcttttttt ttttagaaat 2400 gaaaaatttt tgccgtagga atcaccgtat aaaccctgta taaacgctac tctgttcacc 2460 tgtgtaggct atgattgacc cagtgttcat tgttattgcg agagagcggg agaaaagaac 2520 cgatacaaga gatccàtgct ggtatagttg tctgtccaac actttgatga acttgtagga 2580 cgatgatgtg tattactagt gtcgacatgc gtccatcttt acagtcctgt cttattgttc 2640 ttgatttgtg ccccgtaaaa tactgttact tggttctggc gaggtattgg atagttcctt 2700 tttataaagg ccatgaagct ttttctttcc aatttttttt ttttcgtcat tatagaaatc 2760 attacgaccg agattcccgg gtaataactg atataattaa attgaagctc taatttgtga 2820 gtttagtata catgcattta cttataatac agttttttag ttttgctggc cgcatcttct 2880 caaatatgct tcccagcctg cttttctgta acgttcaccc tctaccttag catcccttcc 2940 ctttgcaaat agtcctcttc caacaataat aatgtcagat cctgtagaga ccacatcatc 3000 cacggttcta tactgttgac ccaatgcgtc tcccttgtca tctaaaccca caccgggtgt 3060 cataatcaac caatcgtaac cttcatctct tccacccatg tctctttgag caataaagcc 3120 gataacaaaa tctttgtcac tcttcgcaat gtcaacagta cccttagtat attctccagt 3180 agatagggag cccttgcatg acaattctgc taacatcaaa aggcctctag gttcctttgt 3240 tacttcttct gccgcctgct tcaaaccgct aacaatacct gggcccacca caccgtgtgc 3300 attcgtaatg tctgcccatt ctgctattct gtatacaccc gcagagtact gcaatttgac 3360 tgtattacca atgtcagcaa attttctgtc ttcgaagagt aaaaaattgt acttggcgga 3420 taatgccttt agcggcttaa ctgtgccctc catggaaaaa tcagtcaaga tatccacatg 3480 tgtttttagt aaacaaattt tgggacctaa tgcttcaact aactccagta attccttggt 3540 página 48
107345_104_sequence_Ljstjng ggtacgaaca tccaatgaag cacacaagtt tgtttgcttt tcgtgcatga tattaaatag 3600 cttggcagca acaggactag gatgagtagc agcacgttcc ttatatgtag ctttcgacat 3660 gatttatctt cgtttcctgc aggtttttgt tctgtgcagt tgggttaaga atactgggca 3720 atttcatgtt tcttcaacac cacatatgcg tatatatacc aatctaagtc tgtgctcctt 3780 ccttcgttct tccttctgct cggagattac cgaatcaaaa aaatttcaaa gaaaccggaa 3840 rcaaaaaaaa gaacaaaaaa aaaaaagatg aattgaaaag ctttatggac cctgaaacca 3900 cagccacatt aaccttcttt gatggtcaaa acttatcctt caccataaat atgcctcgca 3960 aaaaaggtaa ttaacatata tagaattaca ttatttatga aatatcatca ctatctctta 4020 gcatctttaa tccttttcta catcagataa cttcggtttg ttatcatcgt ctgtattgtc 4080 atcaattggc gcagtagcct caatttcaac gtcgtttgac tctggtgttt gttcatgtgc 4140 agatccatga gatgatgaac ttgtgagcgt tgcgctcgtg catccggagg ttgtttatct 4200 ttcgagtact gaatgttgtc agtatagcta tcctatttga aactccccat cgtcttgctc 4260 ttgttcccaa tgtttgttta tacactcata tggctatacc cttatctact tgcctctttt 4320 gtttatgtct atgtatttgt ataaaatatg atattactca gactcaagca aacaatcaat 4380 tcttagcatc attctttgtt cttatcttaa ccataaacga tcttgatgtg acttttgtaa 4440 tttgaacgaa ttggctatac gggacggatg acaaatgcac cattactcta ggttgttgtt 4500 ggatcttaac aaaccgtaaa ggtaaactgc ccatgcggtt cacatgactt ttgactttcc 4560 tttgtttgct agttaccttc ggcttcacaa tttgtttttc cacttttcta acaggtttat 4620 cacctttcaa acttatcttt atcttattcg ccttcttggg tgcctccaca gtagaggtta 4680 cttccttttt aatatgtact tttaggatac tttcacgctt tataacaata tcaagtttac 4740 cttcttcatt actattcatc ttcgccacaa gtcttctctc ccttggtgtt tccaatctaa 4800 ctacaaaact gttgartagg gtgtacatca ccctaacaag atcatgtatt tgcttcctct 4860 ggtacaagct aagaacaggt aaattcaaaa catcccagag taatatcttc aaagggctat 4920 accctttaaa catatctcgg catatttgta ttaacccact aatattttga cggccaatct 4980 tttctatttt tattttcata tcatcgacgt aatgaccact taaaaac 5027
<210> 28 <211> 6126 <212> DNA <213> Artificja1 sequence <220> <223> synthetic: ADS_GAL80 donor cassette
<400> 28 gcctgtctac aggataaaga cgggtcggat acctgcacaa gcaatttggc acctgcatac 60 cccatttccc cagtagataa cttcaacaca cacatcaatg tccctcacca gtttatttcc 120 págjna 49
107345_l04_Sequencê_Listing aaaagagacg ctttttacta cctgactaga ttttcatttt gtttcttttg gattgcgctt 180 gcctttgtag gtgtgtcgtt tatcctttac gttttgactt ggtgctcgaa gatgctttca 240 gagatggtgc ttatcctcat gtcttttggg tttgtcttca atacggcagc cgttgtcttg 300 caaacggccg cctctgccat ggcaaagaat gctttccatg acgatcatcg tagtgcccaa 360 ttgggtgcct ctatgatggg tttaaacgta tggcttgggc aagtgtcttt ttatgtatcg 420 tggaatttat cctgctggtc ttctggtctg ttagggcaag gttggcctct acttactcca 480 tcgacaattc aagatacaga acctcctcca gatggaatcc cttccataga gagaaggagc 540 aagcaactga cccaatattg actgccactg gacctgaaga catgcaacaa agtgcaagca 600 tagtggggcc ttcttccaat gctaatccgg tcactgccac tgctgctacg gaaaaccaac 660 ctaaaggtat taacttcttc actataagaa aatcacacga gcgcccggac gatgtctctg 720 tttaaatggc gcaagttttc cgctttgtaa tatatattta tacccctttc ttctctcccc 780 tgcaatataa tagtttaatt ctaatattaa taatatccta tattttcttc atttaccggc 840 gcactctcgc ccgaacgacc tcaaaatgtc tgctacattc ataataacca aaagctcata 900 actttttttt ttgaacctga atatatatac atcacatatc actgctggtc ctcttcgagc 960 gtcccaaaac cttctcaagc aaggttttca gtataatgtt acatgcgtac acgcgtctgt 1020 acagaaaaaa aagaaaaatt tgaaatataa ataacgttct taatactaac ataactataa 1080 aaaaataaat agggacctag acttcaggtt gtctaactcc ttccttttcg gttagagcgg 1140 atcttagcta gcttaaatag acatgggata aactaataaa gacttaatta aatgcttgta 1200 ctcatctccc atacgagtga agttatcttt acccgcgtac tgcacttcca ggaattgaca 1260 aagatagata actgccatca gtaatggtct gggtatgttt ttagtggtca agtattctct 1320 gtttatgtcc ttccaaacgt cttcgacttc cttgtatatg agggtttgtg cgtattcctc 1380 atrtacarta tattccttca tataagattc tagagaagat gatgagtgct ttctctcctg 1440 ttctgccttg tgcgtcatca agtcgtttag acgacgaccc aaaataccag aataccggaa 1500 tagtggtggc gctgacacgg cccattcaac tgattcttta gtgaaaatat ctgacatccc 1560 caggtaacat gtggttgtca gtaggttcgc tccaccagtt ataataacaa ctggatcgtg 1620 ttcttcagtg gtcggtatgt gcccttcgtt tgcccacttt gcttcgacca tgagattccg 1680 tacaaattcc ttaacaaact cttttccgca attaaataaa tctgttctcc cttcttttgc 1740 aagaaattcc tccatttctg tatacgtatc catgaataat ttatagatag gcttcatgta 1800 ttctggcagc gtatcaaggc aggtaatcga ccaacgttct acagcttcag tgaaaatttt 1860 taattcttca tatgttccat aagcatcgta agtatcatca atcagggtta taacggctac 1920 cactttggtg aagaaaactc gtgctcttga atattgtggt tcataaccag aacctaaacc 1980 página 50
107345_104_sequence_Listjng ccagaaataa cactctacaa tgcggtcgcg caaacaaggt gcgttctttt ttatatcaaa 2040 tgctttccac catttacaga cgtggctaag ctcctccttg tgcaaagatt gcagcaggtt 2100 gaattctaat tttgctaatt ttaaaagcgt cttattatga gagtcttgtt gttggtagaa 2160 aggaatatac tgagcagctt ctatgcgggg aagacgcttc cataaaggtt gttttaatgc 2220 tctttgtatt tcggtaaaca aagccggatt agtggagaat gcatccttag tcattataga 2280 taatcgactt ctagtaaacc caagcgcgtc ttccaaaata atttcgcctg gaacccgcat 2340 ggaagtcgcc tcatataact ctaataaccc ttccacatca ttagccaatg attgtttaaa 2400 agcaccgttt ttatctttgt aattattgaa aacatcacag gtcacgtagt agccttgctt 2460 cctcatcaag cgaaaccata gtgaactgcg atctccattc cagttgtctc cgtatgtctc 2520 gtaaatacat tgaagagcat ggtcaatttc cctttcaaaa tggtatggaa ttcctagtct 2580 ctgtatttca tctattaatt ttaacaaatt agcatgcttc ataggaatgt ctaaggcttc 2640 cttcaggagc tgtcttactt ctttcttcag atcgtttaca atttgttcga ccccttgttc 2700 tacttgtttc tcataaatga gaaactgatc accccaaàta gagggaggga aattggctat 2760 aggtctaatc ggtttctcct cggttagtgc catggatcct tcagttacag taaatgtttt 2820 agttgcatcg tcataggtcc attcaccatc aacaccatta tcattagcat attgcttaaa 2880 gaccttttcg gctgttgctg catctactgc ttcggtagta gtttcaccct tcaaagtttt 2940 accattcaaa attaatttat attgacccat ttatattgaa ttttcaaaaa ttcttacttt 3000 ttttttggat ggacgcaaag aagtttaata atcatattac atggcattac caccatatac 3060 atatccatac ctaatcttac ttatatgttg tggaaatgta aagagcccca ttatcttagc 3120 ctaaaaaaac cttctctttg gaactttcag taatacgctt aactgctcat tgctatattg 3180 aagtacggat tagaagccgc cgagcgggcg acagccctcc gacggaagac tctcctccgt 3240 gcgtcctcgt cttcaccggt cgcgttcctg aaacgcagat gtgcctcgcg ccgcactgct 3300 ccgaacaata aagattctac aatactagct tttatggtta tgaagaggaa aaattggcag 3360 taacctggcc ccacaaacct tcaaattaac gaatcaaatt aacaaccata ggatgataat 3420 gcgattagtt ttttagcctt atttctgggg taattaatca gcgaagcgat gatttttgat 3480 ctattaacag atatataaat ggaaaagctg cataaccact ttaactaata ctttcaacat 3540 tttcagtttg tattacttct tattcaaatg tcataaaagt atcaacaaaa aattgttaat 3600 atacctctat actttaacgt caaggagaaa aaactataat gtcattaccg ttcttaactt 3660 ctgcaccggg aaaggttatt atttttggtg aacactctgc tgtgtacaac aagcctgccg 3720 tcgctgctag tgtgtctgcg ttgagaacct acctgctaat aagcgagtca tctgcaccag 3780 atactattga attggacttc ccggacatta gctttaatca taagtggtcc atcaatgatt 3840 tcaatgccat caccgaggat caagtaaact cccaaaaatt ggccaaggct caacaagcca 3900 página 51
107345_104_sequence_Listing ccgatggctt gtctcaggaa ctcgttagtc ttttggatcc gttgttagct caactatccg 3960 aatccttcca ctaccatgca gcgttttgtt tcctgtatat gtttgtttgc ctatgccccc 4020 atgccaagaa tattaagrtt tctttaaagt ctactttacc catcggtgct gggttgggct 4080 caagcgcctc tatttctgta tcactggcct tagctatggc ctacttgggg gggttaatag 4140 gatctaatga cttggaaaag ctgtcagaaa acgataagca tatagtgaat caatgggcct 4200 tcataggtga aaagtgtatt cacggtaccc cttcaggaat agataacgct gtggccactt 4260 atggtaatgc cctgctattt gaaaaagact cacataatgg aacaataaac acaaacaatt 4320 ttaagttctt agatgatttc ccagccattc caatgatcct aacctatact agaattccaa 4380 ggtctacaaa agatcttgtt gctcgcgttc gtgtgttggt caccgagaaa tttcctgaag 4440 ttatgaagcc aattctagat gccatgggtg aatgtgccct acaaggctta gagatcatga 4500 ctaagttaag taaatgtaaa ggcaccgatg acgaggctgt agaaactaat aatgaactgt 4560 atgaacaact attggaattg ataagaataa atcatggact gcttgtctca atcggtgttt 4620 ctcatcctgg attagaactt attaaaaatc tgagcgatga tttgagaatt ggctccacaa 4680 aacttaccgg tgctggtggc ggcggttgct ctttgacttt gttacgaaga gacattactc 4740 aagagcaaat tgacagtttc aaaaagaaat tgcaagatga ttttagttac gagacatttg 4800 aaacagactt gggtgggact ggctgctgtt tgttaagcgc aaaaaatttg aataaagatc 4860 ttaaaatcaa atccctagta ttccaattat ttgaaaataa aactaccaca aagcaacaaa 4920 ttgacgatct attattgcca ggaaacacga atttaccatg gacttcataa gctaatttgc 4980 gataggcatt atttattagt tgtttttaat cttaactgtg tatgaagttt ratgtaataa 5040 agatagaaag agaaacaaaa aaaaattttt cgtagtatca attcagcttt cgaagacaga 5100 atgaaattta agcagaccat tcatcttgcc ctgtgcttgg cccccagtgc agcgaacgtt 5160 ataaaaacga atactgagta tatatctatg taaaacaacc atatcatttc ttgttctgaa 5220 ctttgtttac ctaactagtt ttaaatttcc ctttttcgtg catgcgggtg ttcttattta S280 ttagcatact acatttgaaa tatcaaattt ccttagtaga aaagtgagag aaggtgcact 5340 gacacaaaaa ataaaatgct acgtataact gtcaaaactt tgcagcagcg ggcatccttc 5400 catcatagct tcaaacatat tagcgttcct gatcttcata cccgtgctca aaatgatcaa 5460 acaaactgtt attgccaaga aataaacgca aggctgcctt caaaaactga tccattagat 5520 cctcatatca agcttcctca tagaacgccc aattacaata agcatgtttt gctgttatca 5580 ccgggtgata ggtttgctca accatggaag gtagcatgga atcataattt ggatactaat 5640 acaaatcggc catataatgc cattagtaaa ttgcgctccc atttaggtgg ttctccaggc 5700 aaatttgaat actaataaat gcggtgcatt tgcaaaatga atttattcca aggccaaaac 5760 página 52 l07345_104_sequence_Listing aacacgatga atggctttat ttttttgtta ttcctgacat gaagctttat gtaattaagg 5820 aaacggacat cgaggaattt gcatcttttt tagatgaagg agctattcaa gcaccaaagc 5880 tatccttcca ggattattta agcggtaagg ccaaggcttc ccaacaggtt catgaagtgc 5940 atcatagaaa gcttacaagg tttcagggtg aaacttttct aagagattgg aacttagtct 6000 gtgggcatta taagagagat gctaagtgtg gagaaatggg acccgacata attgcagcat 6060 ttcaagatga aaagcttttt cctgagaata atctagcctt aatttctcat attgggggtc 6120 atattt 6126
<210> 29 <211> 9550 <212> DNA <213> Artjficia] sequence
<220> <223> synthetic: ADS_HXT3 donor cassette
<400> 29 accggtatat caaatggcgg tgtagtttga aaagtacact gtatgtccat taataaaatt 60 acgccgaaga acactgacta gctataaatt ctcttccggc gtccaatttc aacctaaggc 120 aagtattgtt aatcaataat gcgtgttggt aaatatgaag cccgatgttg attaagaaga 180 attattcgta taagaattaa gcaagcaaaa ttaaggaaaa ttttttcttt cctattcgtc 240 atcgcagaca gccttcatct tctcgagata acacctggag gaggagcaat gaaatgaaag 300 gaaaaaaaaa tactttcttt ttcttgaaaa aagaaaaaaa ttgtaagatg agctattcgc 360 ggaacattct agctcgtttg catcttcttg catttggtag gttttcaata gttcggtaat 420 attaacggat acctactatt atcccctagt aggctctttt cacggagaaa ttcgggagtg 480 ttttttttcc gtgcgcattt tcttagctat attcttccag cttcgcctgc tgcccggtca 540 tcgttcctgt cacgtagttt ttccggattc gtccggctca tataataccg caataaacac 600 ggaatatctc gttccgcgga ttcggttaaa ctctcggtcg cggattatca cagagaaagc 660 ttcgtggaga atttttccag attttccgct ttccccgatg ttggtatttc cggaggtcat 720 tatactgacc gccattataa tgactgtaca acgaccttct ggagaaagaa acaactcaat 780 aacgatgtgg gacattgggg gcccactcaa aaaatctggg gactatatcc ccagagaatt 840 tctccagaag agaagaaaag tcaaagtttt ttttcgcttg ggggttgcat ataaacttcg 900 agcgtcccaa aaccttctca agcaaggttt tcagtataat gttacatgcg tacacgcgtc 960 tgtacagaaa aaaaagaaaa atttgaaata taaataacgt tcttaatact aacataacta 1020 taaaaaaata aatagggacc tagacttcag gttgtctaac tccttccttt tcggttagag 1080 cggatcttag atagacatag ggtagaccaa caaagactta attaagtgct tatattcgtc 1140 acccattctg gtgaaattgt ctttaccagc gtattgaact tctaagaatt gacataaata 1200 página 53 l07345_104_sequence_Ljsting gataacagcc attaacaatg gacgtggaat atttttggtg gtcaagtatt ctctgttaat 1260 atctttccaa acgtcttcaa cttccttgta aatcaaagtt tgagcgtatt cttcgttaac 1320 gttgtattcc ttcatgtaaç attctaagga agaggaggag tgctttcttt cttgctcagc 1380 cttgtgagtc atcaaatcgt ttaatcttct acccaaaata ccagagtatc tgaacaaagg 1440 tggagcggaa acggcccatt caacagartc cttggtgaaa atatcagaca tacctaagta 1500 acaagtagta gtcaacaagt tagcaccacc agtaatgata acgactggat cgtgttcttc 1560 agtagttgga atatgacctt cgttagccca tttagcttca accatcaagt tacgaacgaa 1620 ttccttaacg aattccttac cacaattgaa caagtcggta cgaccttcct tagccaagaa 1680 ttcttccatt tcggtgtaag tgtccatgaa caacttataa attggcttca tgtattctgg 1740 taaagtatct aaacaggtaa tggaccatct ttcgacagct tcagtgaaaa tcttcaattc 1800 ttcgtaggta ccgtaagcgt cgtaagtgtc gtcaatcaag gtaataacag caaccacctt 1860 agtaaagaaa actctagctc tagagtattg tggttcgtaa ccggaaccca aaccccagaa 1920 gtaacattcg acaattctat ctctcaaaca tggagcgttc ttcttaatat cgaaggcttt 1980 ccaccactta caaacgtgag acaattcttc cttgtgcaag gattgcaaca agttaaattc 2040 caatttagcc aatttcaaca aggttttgtt gtgagagtct tgttgttggt agaatgggat 2100 gtattgagca gcttcgattc ttggcaaacg cttccacaat ggttgtttca aagctctttg 2160 gatttcagtg aacaaagctg ggttagtaga gaaggcatct ttagtcatga tggacaatct 2220 agatctagta aaacccaaag cgtcttccaa gatgatttca ccaggaactc tcatggaggt 2280 ggcttcatac aattctaaca aaccttcaac atcgttggcc aaagattgct taaaagcacc 2340 attcttatct ttgtagttgt tgaaaacgtc acaagtaacg tagtaacctt gctttctcat 2400 taatctgaac cataaggaag atctgtcacc gttccagtta tcaccgtaag tttcgtaaat 2460 acattgcaaa gcgtgatcaa tttctctttc gaaatggtat ggaataccta atctttggat 2520 ttcgtcgatt aatttcaata agttagcgtg cttcattggg atgtccaaag cttccttcaa 2580 caattgtcta acttccttct tcaaatcgtt aacgatttgt tcaacacctt gctcaacttg 2640 cttttcgtag atcaagaatt ggtcacccca gatagaaggt ggaaaattag caattggtct 2700 gattggtttt tcttcagtca aagccatgga tccttcagtt acagtaaatg ttttagttgc 2760 atcgtcatag gtccattcac catcaacacc attatcatta gcatattgct taaagacctt 2820 ttcggctgtt gctgcatcta ctgcttcggt agtagtttca cccttcaaag ttttaccatt 2880 caaaattaat ttatattgac ccatttatat tgaattttca aaaattctta cttttttttt 2940 ggatggacgc aaagaagttt aataatcata ttacatggca ttaccaccat atacatatcc 3000 atatctaatc ttacttatat gttgtggaaa tgtaaagagc cccattatct tagcctaaaa 3060 página 54
107345_104_Sequencê_Listing aaaccttctc tttggaactt tcagtaatac gcttaactgc tcattgctat attgaagtac 3120 ggartagaag ccgccgagcg ggcgacagcc ctccgacgga agactctcct ccgtgcgtcc 3180 tcgtcttcac cggtcgcgtt cctgaaacgc agatgtgcct cgcgccgcac tgctccgaac 3240 aataaagatt ctacaatact agcttttatg gttatgaaga ggaaaaattg gcagtaacct 3300 ggccccacaa accttcaaat taacgaatca aattaacaac cataggatga taatgcgatt 3360 agttttttag ccttatttct ggggtaatta atcagcgaag cgatgatttt tgatctatta 3420 acagatatat aaatggaaaa gctgcataac cactttaact aatactttca acattttcag 3480 tttgtattac ttcttartca aatgtcataa aagtatcaac aaaaaattgt taatatttta 3540 attctgctgt aacccgtaca tgcccaaaat agggggcggg ttacacagaa tatataacat 3600 cgtaggtgtc tgggtgaaca gtttattcct ggcatccact aaatataatg gagcccgctt 3660 tttaagctgg catccagaaa aaaaaagaat cccagcacca aaatattgtt ttcttcacca 3720 accatcagtt cataggtcca ttctcttagc gcaactacag agaacagggg cacaaacagg 3780 caaaaaacgg gcacaacctc aatggagtga tgcaacctgc ctggagtaaa tgatgacaca 3840 aggcaattga cccacgcatg tatctatctc attttcttac accttctatt accttctgct 3900 ctctctgatt tggaaaaagc tgaaaaaaaa ggttgaaacc agttccctga aattattccc 3960 ctacttgact aataagtata taaagacggt aggtattgat tgtaattctg taaatctatt 4020 tcttaaactt cttaaattct acttttatag ttagtctttt ttttagtttt aaaacaccaa 4080 gaacttagtt tcgatccccg cgtgcttggc cggccgtatc cccgcgtgct tggccggccg 4140 tatgtctcag aacgtttaca ttgtatcgac tgccagaacc ccaattggtt cattccaggg 4200 ttctctatcc tccaagacag cagtggaatt gggtgctgtt gctttaaaag gcgccttggc 4260 taaggttcca gaattggatg catccaagga ttttgacgaa attatttttg gtaacgttct 4320 ttctgccaat ttgggccaag ctccggccag acaagttgct ttggctgccg gtttgagtaa 4380 tcatatcgtt gcaagcacag ttaacaaggt ctgtgcatcc gctatgaagg caatcatttt 4440 gggtgctcaa tccatcaaat gtggtaatgc tgatgttgtc gtagctggtg gttgtgaatc 4500 tatgactaac gcaccatact acatgccagc agcccgtgcg ggtgccaaat ttggccaaac 4560 tgttcttgtt gatggtgtcg aaagagatgg gttgaacgat gcgtacgatg gtctagccat 4620 gggtgtacac gcagaaaagt gtgcccgtga ttgggatatt actagagaac aacaagacaa 4680 ttttgccatc gaatcctacc aaaaatctca aaaatctcaa aaggaaggta aattcgacaa 4740 tgaaattgta cctgttacca ttaagggatt tagaggtaag cctgatactc aagtcacgaa 4800 ggacgaggaa cctgctagat tacacgttga aaaattgaga tctgcaagga ctgttttcca 4860 aaaagaaaac ggtactgtta ctgccgctaa cgcttctcca atcaacgatg gtgctgcagc 4920 cgtcatcttg gtttccgaaa aagttttgaa ggaaaagaat ttgaagcctt tggctattat 4980 págjna 55
107345_104_Sequence_Listing caaaggttgg ggtgaggccg ctcatcaacc agctgatttt acatgggctc catctcttgc 5040 agttccaaag gctttgaaac atgctggcat cgaagacatc aattctgttg attactttga 5100 attcaatgaa gccttttcgg ttgtcggttt ggtgaacact aagattttga agctagaccc 5160 atctaaggtt aatgtatatg gtggtgctgt tgctctaggt cacccattgg gttgttctgg 5220 tgctagagtg gttgttacac tgctatccat cttacagcaa gaaggaggta agatcggtgt 5280 tgccgccatt tgtaatggtg gtggtggtgc ttcctctatt gtcattgaaa agatatgatt 5340 acgttctgcg attttctcat gatctttttc ataaaataca taaatatata aatggcttta 5400 tgtataacag gcataattta aagttttatt tgcgattcat cgtttttcag gtactcaaac 5460 gctgaggtgt gccttttgac ttacttttcc gccttggcaa gctggccggg tgatacttgc 5520 acaagttcca ctaattactg acatttgtgg tattaactcg tttgactgct ctacaattgt 5580 aggatgttaa tcaatgtctt ggctgcctaa cctgcaggcc gcgagcgccg atatgctatg 5640 taatagacaa taaaaccatg tttatataaa aaaaattcaa aatagaaaac gattctgtac 5700 aaggagtatt ttttttttgt tctagtgtgt ttatattatc cttggctaag aggcactgcg 5760 tatacttcaa ggtacccctg tgttttgaaa aaaaacaaca gtaaaatagg aactccgcga 5820 ggttcaggaa cctgaaacaa aatcaataaa aacattatat gcgtttcgaa caaaattaaa 5880 gaaaaagaat aaatatagat taaaaaaaaa aagaagaaat taaaagaatt tctactaaat 5940 cccaattgtt atatatttgt taaatgccaa aaaagtttat aaaaaattta gaatgtataa 6000 ataataataa actaagtaac gcgatcgccg acgccgccga tatctccctc gccagcggcc 6060 gccttatggc taagaatgtt ggaattttgg ccatggacat ctacttccca ccaacttgtg 6120 ttcagcagga ggctttagaa gcacatgacg gagcctcaaa gggtaagtac acaatcggat 6180 taggacagga ttgcttagca ttctgcactg aattggagga cgtcatctca atgtctttca 6240 acgccgtcac ctcattgtta gagaagtaca aaatcgaccc aaaccagatc ggaaggttgg 6300 aagtcggttc tgaaaccgtc atcgacaagt ctaaatcaat caagactttc gttatgcagt 6360 tgttcgaaaa gtgcggtaat actgacgtcg agggtgtaga ctctactaac gcttgttatg 6420 gtggtaccgc agctttattg aactgcgtaa actgggttga gtcaaactca tgggatggta 6480 ggtacggatt agtcatttgc accgattctg ccgtctacgc cgagggtcca gcaaggccaa 6540 ccggtggagc tgcagctatt gctatgttaa tcggaccaga tgcccctata gtcttcgagt 6600 ctaagttgag gggttcacac atccctaacg tctacgactt ctacaagcca aacttggcct 6660 cagagtatcc agttgtcgac ggaaagttat ctcagacatg ctacttgatg gccttagatt 6720 catgttacaa gcacttatgc aacaagttcg aaaagttgga gggaaaggag ttctcaatta 6780 acgacgccga ctacttcgtt tttcactctc catacaacaa attggtccag aagtcattcg 6840
Página 56
107345_104_sequence_Listing ccaggttatt gtacaacgat tttttgagaa acgcatcatc tatcgatgag gccgccaagg 6900 agaaattcac cccatattct tctttgtcat tggacgagtc ttaccagtct agggacttgg 6960 agaaggtatc acagcaattg gctaaaacct tctatgacgc caaagttcag ccaaccacct 7020 tggtccctaa acaggtcgga aatatgtata ctgcatcttt gtatgccgcc tttgcctctt 7080 tgatccacaa caagcacaac gatttagtcg gaaaaagggt tgtcatgttt tcttacggtg 7140 ccggatctac tgccactatg ttctcattga ggttatgcga aaaccagtca ccattttcat 7200 tgtctaacat cgcctcagtc atggacgtag gtgtctcacc tgagaagttc gtagaaacca 7260 tgaagttgat ggagcacaga tacggtgcca aagaattcgt cacttcaaaa gagggaatct 7320 tggatttgtt ggccccagga acctactatt tgaaggaggt cgactctttg tacagaaggt 7380 tctatggaaa gaagggagac gacggatctg tcgcaaacgg tcagtaaatc ggcggcgtcg 7440 gcgatcgcgt taaggcggcc gctggcgagg gagatatttc aacctgggcc taacagtaaa 7500 gatàtcctcc tcaaaactgg tgcacttaat cgctgaattt gttctggctt ctcttctttt 7560 tctttattcc ccccatgggc caaaaaaaat agtactatca ggaatttggc gccgggtcac 7620 gatatacgtg tacagtgacc taggcgacgc cacaaggaaa aaggaaaaaa acagaaaaaa 7680 caacaaaaac taaaacaaac acgaaaactt taatagatct aagtgaagta gtggtgaggc 7740 aattggagtg acatagcagc tactacaact acaaaaaagg cgcgccacgg tcgtgcggat 7800 atgaaagagg tcgttatagc ttctgccgtc aggaccgcca tcggatctta cggtaagtca 7860 ttaaaggacg tccctgccgt tgatttagga gccaccgcaa ttaaagaggc cgttaaaaag 7920 gcaggtataa agccagagga cgtcaacgag gtcatcttgg gaaatgtctt acaagccgga 7980 ttaggtcaaa acccagcaag acaagcatca ttcaaagccg gtttacctgt cgagatacct 8040 gcaatgacca tcaacaaggt ttgcggttca ggattaagga ccgtttcrtt agcagcacag 8100 atcattaagg ctggagatgc agacgttatc attgctggtg gtatggaaaa catgtcaaga 8160 gccccatact tggctaataa cgccaggtgg ggatatagga tgggaaacgc caagtttgtc 8220 gacgaaatga ttactgacgg attgtgggac gccttcaatg actatcacat gggtataacc 8280 gcagaaaaca ttgccgagag gtggaatatc tcaagagaag aacaggatga gtttgcattg 8340 gcctcacaga aaaaagcaga ggaggcaata aagtcaggtc agtttaagga tgaaatcgtc 8400 ccagtcgtca tcaagggaag aaagggtgag acagttgtcg acaccgacga acaccctaga 8460 tttggttcaa ccatcgaggg attagcaaag ttgaagccag ccttcaagaa agacggaacc 8520 gtaaccgccg gtaatgcatc tggattgaac gattgcgcag cagttttggt cataatgtca 8580 gccgagaaag ctaaggagtt gggtgtcaag ccattggcaa aaattgtttc atacggatca 8640 gccggtgtcg accctgccat catgggttac ggaccttttr acgccaccaa ggctgcaatc 8700 gaaaaggccg gttggaccgt agatgaattg gatttgatcg agtcaaacga ggcctttgcc 8760 págjna 57
107345_104_sequencê_Listing gcccaatcat tggctgtcgc caaggacttg aagttcgaca tgaacaaggt caacgtcaac 8820 ggtggtgcca tcgcattggg tcaccctatc ggagcctctg gtgccaggat cttggttacc 8880 ttggtccacg ccatgcagaa gagggacgca aagaagggtt tggccacctt gtgcatcggt 8940 ggaggtcagg gaacagctat cttgttagag aaatgcagcc cctcagcccc cctagcgtcg 9000 aataaaagac attggtacat gatatcaaac agaattttaa catttcttga tccagtttgt 9060 aaacaaaaca aacaattttt ctaccattta acttcatacc atcggcgaga gccgaacagg 9120 aaaaaaaaga agtctccggt tatcgtaagc agtatcaaat aataagaatg tatgtgtgtg 9180 caatttgtta tacccacgaa gaagtgcgca gtagagttag aaaaccaact gagtaatctt 9240 tactcccgac aatcgtccaa taatcctctt gttgctagga acgtgatgat ggatttcgtt 9300 tgaaatccgg acggaaaact caaaagaagt ccaaccacca accattttcg agcctcaaga 9360 atctctaagc aggtttcttt actaagggga tggcctttct gtcctggaca ttttttcctt 9420 ccttttttca tttccttgaa aggaacagat tttttttgac ttttgccaca cagctgcact 9480 atctcaaccc cttttacatt ttaagttttc gggttgaatg gccggtgttt aaaccccagc 9540 gcctggcggg 9550
<210> 30 <211> 4429 <212> DNA <213> Artificia] sequence <220> <223> synthetic: ADS_Màt alpha donor cassette <400> 30 tgatgtctgg gttttgtttg ggatgcaatt tattgctrcc caatgtagaa aagtacatca 60 tatgaaacaa cttaaactct taactacttc ttttaacctt cactttttat gaaatgtatc 120 aaccatatat aataacttaa tagacgacat tcacaatatg tttacttcga agcctgcttt 180 caaaattaag aacaaagcat ccaaatcata cagaaacaca gcggtttcaa aaaagctgaa 240 agaaaaacgt ctagctgagc atgtgaggcc aagctgcttc aatattattc gaccactcaa 300 gaaagatatc cagattcctg ttccttcctc tcgattttta aataaaatcc aaattcacag 360 gatagcgtct ggaagtcaaa atactcagtt tcgacagttc aataagacat ctataaaatc 420 ttcaaagaaa tatttaaact catttatggc ttttagagca tattactcac agtttggctc 480 cggtgtaaaa caaaatgtct tgtcttctct gctcgctgaa gaatggcacg cggacaaaat 540 gcagcacgga atatgggact acttcgcgca acagtataat tttataaacc ctggttttgg 600 ttttgtagag tggttgacga ataattatgc tgaagtacgt ggtgacggat attgggaaga 660 tgtgtttgta catttggcct tatagagtgt ggtcgtggcg gaggttgrtt atctttcgag 720 página 58
107345_104_sequence_Listing tactgaatgt tgtcagtata gctatcctat ttgaaactcc ccatcgtctt gctcttgttc 780 ccaatgtttg tttatacact catatggcta tacccttatc tacttgcctc ttttgtttat 840 gtctatgtat ttgtataaaa tatgatatta ctcagactca agcaaacaat caattttcaa 900 aaattcttac tttttttttg gatggacgca aagaagttta ataatcatat tacatggcat 960 taccaccata tacatatcca tatacatatc catatctaat cttacttata tgttgtggaa 1020 atgtaaagag ccccattatc ttagcctaaa aaaaccttct ctttggaact ttcagtaata 1080 cgcttaactg ctcattgcta tattgaagta cggattagaa gccgccgagc gggtgacagc 1140 cctccgaagg aagactctcc tccgtgcgtc ctcgtcttca ccggtcgcgt tcctgaaacg 1200 cagatgtgcc tcgcgccgca ctgctccgaa caataaagat tctacaatac tagcttttat 1260 ggttatgaag aggaaaaatt ggcagtaacc tggccccaca aaccttcaaa tgaacgaatc 1320 aaattaacaa ccataggatg ataatgcgat tagtttttta gccttatttc tggggtaatt 1380 aatcagcgaa gcgatgattt ttgatctatt aacagatata taaatgcaaa aactgcataa 1440 ccactttaac taatactttc aacattttcg gtttgtatta cttcttattc aaatgtaata 1500 aaagtatcaa caaaaaattg ttaatatacc tctatacttt aacgtcaagg agaaaaaacc 1560 ccggatccat gggtcaatat aaattaattt tgaatggtaa aactttgaag ggtgaaacta 1620 ctaccgaagc agtagatgca gcaacagccg aaaaggtctt taagcaatat gctaatgata 1680 atggtgttga tggtgaatgg acctatgacg atgcaactaa aacatttact gtaactgaag 1740 gatccatggc cttaacagaa gagaagccaa tcagacccat agccaacttc cctccatcaa 1800 tatggggtga tcaatttctt atatacgaaa agcaagttga acaaggtgtc gaacaaatcg 1860 tcaacgatct aaagaaggag gtcaggcagt tattaaaaga agctctggac ataccgatga 1920 aacatgctaa tctactaaaa ttaattgatg agattcaaag attgggcatc ccttatcact 1980 tcgagagaga gattgatcat gcattgcaat gtatatacga gacgtacggt gataactgga 2040 acggagatag gagtagtcta tggttcaggt tgatgagaaa gcaaggctac tatgtgacat 2100 gcgatgtctt taataactat aaggacaaaa atggtgcatt taagcaatct ctagccaacg 2160 atgttgaagg tttattagaa ttatatgaag ccacaagcat gagagtccca ggagagatca 2220 tattggaaga tgctctaggg ttcacacgtt ctagattgtc aataatgacc aaggacgcat 2280 tcagtactaa ccctgcgtta ttcactgaaa tccaaagggc actaaagcaa cctctttgga 2340 aaagattgcc tcgtattgaa gcagcacaat atataccctt ctatcagcag caggactctc 2400 acaacaaaac tctacttaaa ttagcaaagt tagaattcaa tttgttgcaa agtttacata 2460 aggaagaatt atctcacgta tgcaaatggt ggaaagcttt cgatattaag aagaacgccc 2520 catgcctgag agacagaata gttgagtgtt atttctgggg tctgggttcc ggttatgaac 2580 cacaatattc tagggccaga gtctttttta ccaaagttgt cgcggtcata actttaatcg 2640 página 59
107345_104_sequence_Listing acgatactta tgatgcttat ggtacctacg aggagttaaa gatattcacc gaagctgtgg 2700 aaaggtggtc tataacttgc ttggacaccc taccagaata tatgaaacca atttacaaat 2760 tgtttatgga tacttatact gaaatggagg aattcctggc aaaagaaggt agaactgatt 2820 tgtttaattg cggtaaggaa tttgtgaagg aattcgtaag aaacttaatg gtcgaggcaa 2880 aatgggccaa cgaaggacac attccaacaa ccgaagagca tgatcctgtc gtgataatca 2940 ccggtggcgc taacctacta accactacct gctacctagg tatgtctgat atcttcacaa 3000 aagagagtgt tgaatgggca gttagtgctc cgcctttgtt càggtatagc ggtatacttg 3060 gcaggcgttt aaatgatctt atgacccata aagccgaaca agaaagaaaa cactcaagct 3120 cctctcttga atcctatatg aaggaataca atgttaacga ggaatatgcg caaactttaa 3180 tatacaagga ggtggaagat gtgtggaaag atatcaacag agaaratctt actacaaaga 3240 acataccccg tccacttttg atggcagtga tttacttgtg tcagttctta gaggtacaat 3300 acgctggtaa ggataacttt acaagaatgg gcgacgaata caaacatttg atcaagtcat 3360 tattagttta tcccatgtcc atctaagcta gctaagatcc gctctaaccg aaaaggaagg 3420 agttagacaa cctgaagtct aggtccctat ttattttttt atagttatgt tagtattaag 3480 aacgttattt atatttcaaa tttttctttt ttttctgtac agacgcgtgt acgcatgtaa 3540 cattatactg aaaaccttgc ttgagaaggt tttgggacgc tcgaagcgga ggttgtttat 3600 ctttcgagta ctgaatgttg tcagtatagc tatcctattt gaaacrcccc atcgtcttgc 3660 tcttgttccc aatgtttgtt tatacactca tatggctata cccttatcta cttgcctctt 3720 ttgtttatgt ctatgtattt gtataaaata tgatattact cagactcaag caaacaatca 3780 attcttagca tcattctttg ttcttatctt aaccataaac gatcttgatg tgacttttgt 3840 aatttgaacg aattggctat acgggacgga tgacaaatgc accattactc taggttgttg 3900 ttggatctta acaaaccgta aaggtaaact gcccargcgg ttcacatgac tttrgacttt 3960 cctttgtttg ctagttacct tcggcttcac aatttgtttt tccacttttc taacaggttt 4020 atcacctttc aaacttatct ttatcttatt cgccttcttg ggtgcctcca cagtagaggt 4080 tacttccttt ttaatatgta cttttaggat actttcacgc tttataacaa tatcaagttt 4140 accttcttca ttactattca tcttcgccac aagtcttctc tcccttggtg tttccaatct 4200 aactacaaaa ctgttgatta gggtgtacat caccctaaca agatcatgta tttgcttcct 4260 ctggtacaag ctaagaacag gtaaattcaa aacatcccag agtaatatct tcaaagggct 4320 atacccttta aacatatctc ggcatatttg tattaaccca ctaatatttt gacggccaat 4380 cttttctatt tttattttca tatcatcgac gtaatgacca cttaaaaac 4429
<210> 31 página 60
107345_lC)4_sequence_Listing <211> 23 <212> DNA <213> Artificia1 Sequence <220> <223> Synthetic: primer CUT24 <400> 31 gtttcttttg gattgcgctt gcc 23
<210> 32 <211> 20 <212> DNA <213> Ar"tificia1 sequence
<220> <223> Synthetic: primer ART12
<400> 32 tactgacaac cacatgttac 20
<210> 33 <211> 29 <212> DNA <213> Artificia1 sequence
<220> <223> synthetic: primer ART45
<400> 33 tactgcttcg gtagtagttt cacccttca 29
<210> 34 <211> 20 <212> DNA <213> Artificia1 sequence
<220> <223> Synthetic: primer ART210
<400> 34 gggaagtcca attcaatagt 20
<210> 35 <211> 25 <212> DNA <213> Artificial Sequence
<220> <223> Synthetic: primer Hj207
<400> 35 catcttctcg agataacacc tggag 25
<210> 36 <211> 19 <212> DNA <213> Art'ificial Sequence págj na 61
107345_104_sequence_Listjng <220> <223> Synthetic: primer KB349
<400> 36 acgcgtgtac gcatgtaac 19
<210> 37 <211> 20 <212> DNA <213> Artificja1 sequence
<220> <223> Synthetic: primer Hj602
<400> 37 caattggggt tctggcagtc 20
<210> 38 <211> 30 <212> DNA <213> Artificia1 sequence
<220> <223> Synthetic: primer CUT76 <400> 38 gaagcctgct ttcaaaatta agaacaaagc 30
<210> 39 <211> 30 <212> DNA <213> Artificia1 sequence
<220> <223> Synthetic: primer Hj362
<400> 39 gaatttacct gttcttagct tgtaccagag 30
<210> 40 <211> 6523 <212> DNA <213> Artjfjcia1 Sequence
<220> <223> Synthetic: ADS_HIS3 donor cassette
<400> 40 attgtgaggg tcagttattt catccagata taacccgaga ggaaacttct tagcgtctgt 60 tttcgtacca taaggcagtt catgaggtat attttcgtta ttgaagccca gctcgtgaat 120 gcttaatgct gctgaactgg tgtccatgtc gcctaggtac gcaatctcca caggctgcaa 180 aggttttgtc tcaagagcaa tgttattgtg caccccgtaa ttggtcaaca agtttaatct 240 gtgcttgtcc accagctctg tcgtaacctt cagttcatcg actatctgaa gaaatttact 300 página 62
107345_104_Sequence_Listing aggaatagtg ccatggtaca gcaaccgaga atggcaattt ctactcgggt tcagcaacgc 360 tgcataaacg ctgttggtgc cgtagacata ttcgaagata ggattatcat tcataagttt 420 cagagcaatg tccttattct ggaacttgga tttatggctc ttttggttta atttcgcctg 480 attcttgatc tcctttagct tctcgacgtg ggcctttttc ttgccatatg gatccgctgc 540 acggtcctgt tccctagcat gtacgtgagc gtatttcctt ttaaaccacg acgctttgtc 600 ttcattcaac gtttcccatt gtttttttct actattgctt tgctgtggga aaaacttatc 660 gaaagatgac gactttttct taattctcgt tttaagagct tggtgagcgc taggagtcac 720 tgccaggtat cgtttgaaca cggcattagt cagggaagtc ataacacagt cctttcccgc 780 aattttcttt ttctattact cttggcctcc tctagtacac tctatatttt tttatgcctc 840 ggtaatgatt ttcatttttt ttttttccac ctagcggatg actctttttt tttcttagcg 900 attggcatta tcacataatg aattatacat tatataaagt aatgtgattt cttcgaagaa 960 tatactaaaa aaatcgttat tgtcttgaag gtgaaatttc tactcttatt aatggtgaac 1020 gttaagctga tgctatgatg gaagctgatt ggtcttaact tgcttgtcat cttgctaatg 1080 gtcattggct cgtgttatta cttaagttat ttgtactcgt tttgaacgra atgctaatga 1140 tcatcttatg gaataatagt gagtggtttc agggtccata aagcttttca attcatcttt 1200 tttttttttg ttcttttttt tgattccggt ttctttgaaa tttttttgat tcggtaatct 1260 ccgagcagaa ggaagaacga aggaaggagc acagacttag attggtatat atacgcatat 1320 gtggtgttga agaaacatga aattgcccag tattcttaac ccaactgcac agaacaaaaa 1380 cctgcaggaa acgaagataa atcatgtcga aagctacata taaggaacgt gctgctactc 1440 atcctagtcc tgttgctgcc aagctattta atatcatgca cgaaaagcaa acaaacttgt 1500 gtgcttcatt ggatgttcgt accaccaagg aattactgga gttagttgaa gcattaggtc 1560 ccaaaatttg tttactaaaa acacatgtgg atatcttgac tgatttttcc atggagggca 1620 cagttaagcc gctaaaggca ttatccgcca agtacaattt tttactcttc gaagacagaa 1680 aatttgctga cattggtaat acagtcaaat tgcagtactc tgcgggtgta tacagaatag 1740 cagaatgggc agacattacg aatgcacacg gtgtggtggg cccaggtatt gttagcggtt 1800 tgaagcaggc ggcggaagaa gtaacaaagg aacctagagg ccttttgatg ttagcagaat 1860 rgtcatgcaa gggctcccta gctactggag aatatactaa gggtactgtt gacattgcga 1920 agagtgacaa agattttgtt atcggcttta ttgctcaaag agacatgggt ggaagagatg 1980 aaggttacga ttggttgatt atgacacccg gtgtgggttt agatgacaag ggagacgcat 2040 tgggtcaaca gtatagaacc gtggatgatg tggtctctac aggatctgac attattattg 2100 ttggaagagg actatttgca aagggaaggg atgctaaggt agagggtgaa cgttacagaa 2160 aagcaggctg ggaagcatat ttgagaagat gcggccagca aaactaaaaa actgtattat 2220 Página 63
107345_104_sequence_Ljsting aagtaaatgc atgtatacta aactcacaaa ttagagcttc aatttaatta tatcagttat 2280 taccacgaaa atcgttattg tcttgaaggt gaaatttcta ctcttattaa tggtgaacgt 2340 taagctgatg ctatgatgga agctgattgg tcttaacttg cttgtcatct tgctaatggt 2400 catatggctc gtgttattac ttaagttatt tgtactcgtt ttgaacgtaa tgctaatgat 2460 catcttatgc ttcgagcgtc ccaaaacctt ctcaagcaag çttttcagta taatgttaca 2520 tgcgtacacg cgtctgtaca gaaaaaaaag aaaaatttga aatataaata acgttcttaa 2580 tactaacata actataaaaa aataaatagg gacctagact tcaggttgtc taactccttc 2640 cttttcggtt agagcggatc ttagctagct tagctagctt agatagacat agggtagacc 2700 aacaaagact taattaagtg cttatattcg tcacccattc tggtgaaatt gtctttacca 2760 gcgtattgaa cttctaagaa ttgacataaa tagataacag ccattaacaa tggacgtgga 2820 atatttttgg tggtcaagta ttctctgtta atatctttcc aaacgtcttc aacttccttg 2880 taaatcaaag tttgagcgta ttcttcgtta acgttgtatt ccttcatgta agattctaag 2940 gaagaggagg agtgctttct ttcttgctca gccttgtgag tcatcaaatc gtttaatctt 3000 ctacccaaaa taccagagta tctgaacaaa ggtggagcgg aaacggccca ttcaacagat 3060 tccttggtga aaatatcaga catacctaag taacaagtag tagtcaacaa gttagcacca 3120 ccagtaatga taacgactgg atcgtgttct tcagtagttg gaatatgacc ttcgttagcc 3180 catttagctt caaccatcaa gttacgaacg aattccttaa cgaattcctt accacaattg 3240 aacaagtcgg tacgaccttc cttagccaag aattcttcca tttcggtgta agtgtccatg 3300 aacaacttat aaattggctt catgtattct ggtaaagtat ctaaacaggt aatggaccat 3360 ctttcgacag cttcagtgaa aatcttcaat tcttcgtagg taccgtaagc gtcgtaagtg 3420 tcgtcaatca aggtaataac agcaacagcc ttagtaaaga aaactctagc tctagagtat 3480 tgtggttcgt aaccggaacc caaaccccag aagtaacatt cgacaattct atctctcaaa 3540 catggagcgt tcttcttaat atcgaaggct ttccaccact tacaaacgtg agacaattct 3600 tccttgtgca aggattgcaa caagttaaat tccaatttag ccaatttcaa caaggttttg 3660 ttgtgagagt cttgttgttg gtagaatggg atgtattgag cagcttcgat tcttggcaaa 3720 cgcttccaca atggttgttt caaagctctt tggatttcag tgaacaaagc tgggttagta 3780 gagaaggcat ctttagtcat gatggacaat ctagatctag taaaacccaa agcgtcttcc 3840 aagatgattt caccaggaac tctcatggag gtggcttcat acaattctaa caaaccttca 3900 acatcgttgg ccaaagattg cttaaaagca ccattcttat ctttgtagtt gttgaaaacg 3960 tcacaagtaa cgtagtaacc ttgctttctc attaatctga accataagga agatctgtca 4020 ccgttccagt tatcaccgta agtttcgtaa atacattgca aagcgtgatc aatttctctt 4080 página 64
107345_104_sequence_Listjng tcgaaatggt atggaatacc taatctttgg atttcgtcga ttaatttcaa taagttagcg 4140 tgcttcattg ggatgtccaa agcttccttc aacaattgtc taacttcctt cttcaaatcg 4200 ttaacgattt gttcaacacc ttgctcaact tgcttttcgt agatcaagaa ttggtcaccc 4260 cagatagaag gtggaaaatt agcaattggt ctgattggtt tttcttcagt caaagccatg 4320 gatccttcag ttacagtaaa tgttttagtt gcatcgtcat aggtccattc accatcaaca 4380 ccattatcat tagcatattg cttaaagacc ttttcggctg ttgctgcatc tactgcttcg 4440 gtagtagttt cacccttcaa agttttacca ttcaaaatta atttatattg acccattata 4500 gttttttctc cttgacgtta aagtatagag gtatattaac aattttttgt tgatactttt 4560 attacatttg aataagaagt aatacaaacc gaaaatgttg aaagtattag ttaaagtggt 4620 tatgcagttt ttgcatttat atatctgtta atagatcaaa aatcatcgct tcgctgatta 4680 attaccccag aaataaggct aaaaaactaa tcgcattatc atcctatggt tgttaatttg 4740 attcgttcat ttgaaggttt gtggggccag gttactgcca atttttcctc ttcataacca 4800 taaaagctag tattgtagaa tctttattgt tcggagcagt gcggcgcgag gcacatctgc 4860 gtttcaggaa cgcgaccggt gaagacgagg acgcacggag gagagtcttc cttcggaggg 4920 ctgtcacccg ctcggcggct tctaatccgt acttcaatat agcaatgagc agttaagcgt 4980 attactgaaa gttccaaaga gaaggttttt ttaggctaag ataatggggc tctttacatt 5040 tccacaacat ataagtaaga ttagatatgg atatgtatat ggatatgtat atggtggtaa 5100 tgccatgtaa tatgattatt aaacttcttt gcgtccatcc aaaaaaaaag taagaatttt 5160 tgaaaattca atataaatgt ctcagaacgt ttacattgta tcgactgcca gaaccccaat 5220 tggttcattc cagggttctc tatcctccaa gacagcagtg gaattgggtg ctgttgcttt 5280 aaaaggcgcc ttggctaagg ttccagaatt ggatgcatcc aaggattttg acgaaattat 5340 trttggtaac gttctttctg ccaatttggg ccaagctccg gccagacaag ttgctttggc 5400 tgccggtttg agtaatcata tcgttgcaag cacagttaac aaggtctgtg catccgctat 5460 gaaggcaatc attttgggtg ctcaatccat caaatgtggt aatgctgatg ttgtcgtagc 5520 tggtggttgt gaatctatga ctaacgcacc atactacatg ccagcagccc gtgcgggtgc 5580 caaatttggc caaactgttc ttgttgatgg tgtcgaaaga gatgggttga acgatgcgta 5640 cgatggtcta gccatgggtg tacacgcaga aaagtgtgcc cgtgattggg atattactag 5700 agaacaacaa gacaattttg ccatcgaatc ctaccaaaaa tctcaaaaat ctcaaaagga 5760 aggtaaattc gacaatgaaa ttgtacctgt taccattaag ggatttagag gtaagcctga 5820 tactcaagtc acgaaggacg aggaacctgc tagattacac gttgaaaaat tgagatctgc 5880 aaggactgtt ttccaaaaag aaaacggtac tgttactgcc gctaacgctt ctccaatcaa 5940 cgatggtgct gcagccgtca tcttggtttc cgaaaaagtt ttgaaggaaa agaatttgaa 6000 página 65
107345_104_sequence_Listjng gcctttggct attatcaaag gttggggtga ggccgctcat caaccagctg attttacatg 6060 ggctccatct cttgcagttc caaaggcttt gaaacatgct ggcatcgaag acatcaattc 6120 tgttgattac tttgaattca atgaagcctt ttcggttgtc ggtttggtga acactaagat 6180 tttgaagcta gacccatcta aggttaatgt atatggtggt gctgttgctc taggtcaccc 6240 attgggttgt tctggtgcta gagtggttgt tacactgcta tccatcttac agcaagaagg 6300 aggtaagatc ggtgttgccg ccatttgtaa tggtggtggt ggtgcttcct ctattgtcat 6360 tgaaaagata tgattacgtt ctgcgatttt ctcatgatct ttttcataaa atacataaat 6420 atataaatgg ctttatgtat aacaggcata atttaaagtt ttatttgcga ttcatcgttt 6480 ttcaggtact caaacgctga ggtgtgcctt ttgacttact ttt 6523
<210> 41 <211> 10379 <212> DNA <213> Artificia1 sequence
<220> <223> synthetic: ADS_FS.1 donor cassette
<400> 41 atattgtttt ttccctagct gttttcggtt tggttatgaa cgcattgtct gcgaaaagaa 60 acgtggataa gtattataga aacagcactt cttcggccaa caatatcacg caaattgagc 120 aagatagtgc tataaaaggt cttttgccct tttttgccta ttatgcaagc attgctttac 180 tagtgtggat gcaaccaagc tttattacac tctctttcat cctttccgtt ggtttcacgg 240 gagcatttac cgtcggaaga ataatcgttt gccatttaac taagcagagc tttcccatgt 300 tcaatgcacc catgttaatt cctttgtgcc agatagtatt gtacaaaata tgtctatccc 360 tttggggaat tgagtctaat aaaatcgtct ttgccctatc ttggcttggg ttcggtctct 420 cactaggtgt tcacattatg tttatgaatg acattatcca tgaatttact gagtacctgg 480 acgtttatgc tttatccatc aagcgctcca agctgacata aatcgcactt tgtatctact 540 tttttttatt cgaaaacaag gcacaacaat gaatctatcg ccctgtgaga ttttcaatct 600 caagtttgtg taatagatag cgttatatta tagaactata aaggtccttg aatatacata 660 gtgtttcatt cctattactg tatatgtgac tttacattgt tacttccgcg gctatttgac 720 gttttctgct tcaggtgcgg cttggagggc aaagtgtcag aaaatcggcc aggccgtatg 780 acacaaaaga gtagaaaacg agatctcaaa tatctcgagg cctgtcctct atacaaccgc 840 ccagctctct gacaaagctc cagaacggtt gtcttttgtt tcgaaaagcc aaggtccctt 900 araattgccc tccattttgt gtcacctatt taagcaaaaa attgaaagtt tactaacctt 960 tcattaaaga gaaataacaa tattataaaa agcgcttaaa tatacctgag aaagcaacct 1020 página 66
107345_104_sequence_Listing gacctacagg aaagagttac tcaagaataa gaatrttcgt tttaaaacct aagagtcact 1080 ttaaaatttg tatacactta ttttttttat aacttattta ataataaaaa tcataaatca 1140 taagaaattc gcttatttag aagtgtcaac aacgtatcta ccaacgattt gacccttttc 1200 catcttttcg taaatttctg gcaaggtaga caagccgaca accttgattg gagacttgac 1260 caaacctctg gcgaagaatt gttaattaag agctcagatc ttatcgtcgt catccttgta 1320 atccatcgat actagtgcgg ccgcccttta gtgagggttg aattcgaatt ttcaaaaatt 1380 cttacttttt ttttggatgg acgcaaagaa gtttaataat catattacat ggcattacca 1440 ccatatacat atccatatac atatccatat ctaatcttac ttatatgttg tggaaatgta 1500 aagagcccca ttatcttagc ctaaaaaaac cttctctttg gaactttcag taatacgctt 1560 aactgctcat tgcgccgccg agcgggtgac agccctccga aggaagactc tcctccgtgc 1620 gtcctcgtct tcaccggtcg cgttcctgaa acgcagatgt gcctcgcgcc gcactgctcc 1680 gaacaataaa gattctacaa tactagcttt tatggttatg aagaggaaaa attggcagta 1740 acctggcccc acaaaccttc aaatgaacga atcaaattaa caaccatagg atgataatgc 1800 gattagtttt ttagccttat ttctggggta attaatcagc gaagcgatga tttttgatct 1860 attaacagat atataaatgc aaaaactgca taaccacttt aactaatact ttcaacattt 1920 tcggtttgta ttacttctta ttcaaatgta ataaaagtat caacaaaaaa ttgttaatat 1980 acctctatac tttaacgtca aggagaaaaa actataatgg gtcaatataa attaattttg 2040 aatggtaaaa ctttgaaggg tgaaactact accgaagcag tagatgcagc aacagccgaa 2100 aaggtcttta agcaatatgc taatgataat ggtgtrgatg gtgaatggac ctatgacgat 2160 gcaactaaaa catttactgt aactgaagga tccatggctt tgactgaaga aaaaccaatc 2220 agaccaattg ctaattttcc accttctatc tggggtgacc aattcttgat ctacgaaaag 2280 caagttgagc aaggtgttga acaaatcgtt aacgatttga agaaggaagt tagacaattg 2340 ttgaaggaag ctttggacat cccaatgaag cacgctaact tattgaaatt aatcgacgaa 2400 atccaaagat taggtattcc ataccatttc gaaagagaaa ttgatcacgc tttgcaatgt 2460 atttacgaaa cttacggtga taactggaac ggtgacagat cttccttatg gttcagatta 2520 atgagaaagc aaggttacta cgttacttgt gacgrtttca acaactacaa agataagaat 2580 ggtgctttta agcaatcttt ggccaacgat gttgaaggtt tgttagaatt gtatgaagcc 2640 acctccatga gagttcctgg tgaaatcatc ttggaagacg ctttgggttt tactagatct 2700 agattgtcca tcatgactaa agatgccttc tctactaacc cagctttgtt cactgaaatc 2760 caaagagctt tgaaacaacc attgtggaag cgtttgccaa gaatcgaagc tgctcaatac 2820 atcccattct accaacaaca agactctcac aacaaaacct tgttgaaatt ggctaaattg 2880 gaatttaact tgttgcaatc cttgcacaag gaagaattgt ctcacgtttg taagtggtgg 2940 página 67
107345_104_sequence_Listinç aaagccttcg atattaagaa gaacgctcca tgtttgagag atagaattgt cgaatgttac 3000 ttctggggtt tgggttccgg ttacgaacca caatactcta gagctagagt tttctttact 3060 aaggtggttg ctgttattac cttgattgac gacacttacg acgcttacgg tacctacgaa 3120 gaattgaaga ttttcactga agctgtcgaa agatggtcca ttacctgttt agatacttta 3180 ccagaataca tgaagccaat ttataagttg ttcatggaca cttacaccga aatggaagaa 3240 ttcttggcta aggaaggtcg taccgacttg ttcaattgtg gtaaggaatt cgttaaggaa 3300 ttcgttcgta acttgatggt tgaagctaaa tgggctaacg aaggtcatat tccaactact 3360 gaagaacacg atccagtcgt tatcattact ggtggtgcta acttgttgac tactacttgt 3420 tacttaggta tgtctgatat tttcaccaag gaatctgttg aatgggccgt ttccgctcca 3480 cctttgttca gatactctgg tattttgggt agaagattaa acgatttgat gactcacaag 3540 gctgagcaag aaagaaagca ctcctcctct tccttagaat cttacatgaa ggaatacaac 3600 gttaacgaag aatacgctca aactttgatt tacaaggaag ttgaagacgt ttggaaagat 3660 attaacagag aatacttgac caccaaaaat attccacgtc cattgttaat ggctgttatc 3720 tatttatgtc aattcttaga agttcaatac gctggtaaag acaatttcac cagaatgggt 3780 gacgaatata agcacttaat taagtctttg ttggtctacc ctatgtctat ctaagatccg 3840 ctctaaccga aaaggaagga gttagacaac ctgaagtcta ggtccctatt tattttttta 3900 tagttatgtt agtattaaga acgttattta tatttcaaat ttttcttttt tttctgtaca 3960 gacgcgtgta cgcatgtaac attatactga aaaccttgct tgagaaggtt ttgggacgct 4020 cgaaggtttt caatagttcg gtaatattaa cggataccta ctattatccc ctagtaggct 4080 cttttcacgg agaaattcgg gagtgttttt tttccgtgcg cattttctta gctatattct 4140 tccagcttcg cctgctgccc ggtcatcgtt cctgtcacgt agtttttccg gattcgtccg 4200 gctcatataa taccgcaata aacacggaat atctcgttcc gcggattcgg ttaaactctc 4260 ggtcgcggat tatcacagag aaagcttcgt ggagaatttt tccagatttt ccgctttccc 4320 cgatgttggt atttccggag gtcattatac tgaccgccat tataatgact gtacaacgac 4380 cttctggaga aagaaacaac tcaataacga tgtgggacat tgggggccca ctcaaaaaat 4440 ctggggacta tatccccaga gaatttctcc agaagagaag aaaagtcaaa gttttttttc 4500 gcttgggggt tgcatataaa tacaggcgct gttttatctt cagcatgaat attccataat 4560 tttacttaat agcttttcat aaataataga atcacaaaca aaatttacat ctgagttaaa 4620 caatcatgac aatcaaggaa cataaagtag tttatgaagc tcacaacgta aaggctctta 4680 aggctcctca acatttttac aacagccaac ccggcaaggg ttacgttact gatatgcaac 4740 attatcaaga aatgtatcaa caatctatca atgagccaga aaaattcttt gataagatgg 4800 página 68
107345_104_sequence_Listjng ctaaggaata cttgcattgg gatgctccat acaccaaagt tcaatctggt tcattgaaca 4860 atggtgatgt tgcatggttt ttgaacggta aattgaatgc atcatacaat tgtgttgaca 4920 gacatgcctt tgctaatccc gacaagccag ctttgatcta tgaagctgat gacgaatccg 4980 acaacaaaat catcacattt ggtgaattac tcagaaaagt ttcccaaatc gctggtgtct 5040 taaaaagctg gggcgttaag aaaggtgaca cagtggctat ctatttgcca atgattccag 5100 aagcggtcat tgctatgttg gctgtggctc gtattggtgc tattcactct gttgtctttg 5160 ctgggttctc cgctggttcg ttgaaagatc gtgtcgttga cgctaattct aaagtggtca 5220 tcacttgtga tgaaggtaaa agaggtggta agaccatcaa cactaaaaaa attgttgacg 5280 aaggtttgaa cggagtcgat ttggtttccc gtatcttggt tttccaaaga actggtactg 5340 aaggtattcc aatgaaggcc ggtagagatt actggtggca tgaggaggcc gctaagcaga 5400 gaacttacct acctcctgtt tcatgtgacg ctgaagatcc tctattttta ttatacactt 5460 ccggttccac tggttctcca aagggtgtcg ttcacactac aggtggttat ttattaggtg 5520 ccgctttaac aactagatac gtttttgata ttcacccaga agatgttctc ttcactgccg 5580 gtgacgtcgg ctggatcacg ggtcacacct atgctctata tggtccatta accttgggta 5640 ccgcctcaat aattttcgaa tccactcctg cctacccaga ttatggtaga tattggagaa 5700 ttatccaacg tcacaaggct acccatttct atgtggctcc aactgcttta agattaatca 5760 aacgtgtagg tgaagccgaa attgccaaat atgacacttc ctcattacgt gtcttgggtt 5820 ccgtcggtga accaatctct ccagacttat gggaatggta tcatgaaaaa gtgggtaaca 5880 aaaactgtçjt catttgtgac actatgtggc aaacagagtc tggttctcat ttaattgctc 5940 ctttggcagg tgctgtccca acaaaacctg gttctgctac cgtgccattc tttggtatta 6000 acgcttgtat cattgaccct gttacaggtg tggaattaga aggtaatgat gtcgaaggtg 6060 tccttgccgt taaatcacca tggccatcaa tggctagatc tgtttggaac caccacgacc 6120 gttacatgga tacttacttg aaaccttatc ctggtcacta tttcacaggt gatggtgctg 6180 gtagagatca tgatggttac tactggatca ggggtagagt tgacgacgtt gtaaatgttt 6240 ccggtcatag attatccaca tcagaaattg aagcatctat ctcaaatcac gaaaacgtct 6300 cggaagctgc tgttgtcggt attccagatg aattgaccgg tcaaaccgtc gttgcatatg 6360 tttccctaaa agatggttat ctacaaaaca acgctactga aggtgatgca gaacacatca 6420 caccagataa tttacgtaga gaattgatct tacaagttag gggtgagatt ggtcctttcg 6480 cctcaccaaa aaccattatt ctagttagag atctaccaag aacaaggtca ggaaagatta 6540 tgagaagagt tctaagaaag gttgcttcta acgaagccga acagctaggt gacctaacta 6600 ctttggccaa cccagaagtt gtacctgcca tcatttctgc tgtagagaac caatttttct 6660 ctcaaaaaaa gaaataaatt gaattgaatt gaaatcgata gatcaatttt tttcttttct 6720 página 69
107345_i04_Sequence_Listing ctttccccat cctttacgct aaaataatag tttattttat tttttgaata ttttttattt 6780 atatacgtat atatagacta ttatttatct tttaatgatt attaagattt ttattaaaaa 6840 aaaattcgct cctcttttaa tgcctttatg cagttttttt ttcccattcg atatttctat 6900 gttcgggttc agcgtatttt aagtttaata actcgaaaat tctgcgttcg ttaaagcttt 6960 cgagaaggat attatttcga aataaaccgt gttgtgtaag cttgaagcct ttttgcgctg 7020 ccaatattct tatccatcta ttgtactctt tagatccagt atagtgtatt cttcctgctc 7080 caagctcatc ccatccccgc gtgcttggcc ggccgttttg ccagcttact atccttcttg 7140 aaaatatgca ctctatatct tttagttctr aattgcaaca catagatttg ctgtataacg 7200 aattttatgc tattttttaa atttggagtt cagtgataaa agtgtcacag cgaatttcct 7260 cacatgtagg gaccgaattg tttacaagtt ctctgtacca ccatggagac atcaaaaatt 7320 gaaaatctat ggaaagatat ggacggtagc aacaagaata tagcacgagc cgcggagttc 7380 atttcgttac ttttgatatc actcacaact attgcgaagc gcttcagtga aaaaatcata 7440 aggaaaagtt gtaaatatta ttggtagtat tcgtttggta aagtagaggg ggtaattttt 7500 cccctttatt ttgttcatac attcttaaat tgctttgcct ctccttttgg aaagctatac 7560 ttcggagcac tgttgagcga aggctcatta gatatatttt ctgtcatttt ccttaaccca 7620 aaaataaggg aaagggtcca aaaagcgctc ggacaactgt tgaccgtgat ccgaaggact 7680 ggctatacag tgttcacaaa atagccaagc tgaaaataat gtgtagctat gttcagttag 7740 tttggctagc aaagatataa aagcaggtcg gaaatattta tgggcattat tatgcagagc 7800 atcaacatga taaaaaaaaa cagttgaata ttccctcaaa aatgtcttac accgtcggaa 7860 cctacttggc cgagaggttg gtccagatcg gattgaagca ccacttcgcc gtcgccggtg 7920 actacaactt ggtcttgttg gacaacttgt tgttgaacaa gaacatggag caggtctatt 7980 gctgcaacga gtcgaactgc ggtttctcag cagaaggtta tgcaagagcc aagggagcag 8040 ccgctgccgt cgtcacctac tcagtcggtg cattatcagc attcgatgca attggaggtg 8100 cttacgctga gaacttgcca gtcatcttga tctctggagc acctaacaac aacgaccatg 8160 ctgctggtca cgtattgcac cacgccttgg gtaaaacaga ctaccactac cagttggaaa 8220 tggcaaaaaa tattaccgca gccgcagagg ccatctacac cccagaggaa gcacctgcca 8280 aaattgacca cgtcataaag accgctttga gagagaagaa gcctgtttac ttggagatcg 8340 cctgcaacat cgcttctatg ccatgcgccg cacctggtcc agcctctgct ttgttcaacg 8400 acgaggcctc tgacgaagct tcattgaacg ccgcagtcga agagacatta aagttcatcg 8460 ccaacaggga caaagttgcc gtcttagtcg gttcaaagtt gagggccgct ggtgccgaag 8520 aggcagctgt caagttcgct gacgccttgg gaggagccgt cgccaccatg gccgcagcaa 8580 página 70
107345_104_sequence_Listing aatctttctt tcctgaggag aacccacatt acatcggaac ctcatggggt gaagtatcat 8640 atcctggagt agaaaaaacc atgaaagagg ccgatgccgt aatagcattg gctcctgtct 8700 tcaacgacta ctcaaccaca ggatggactg atataccaga tccaaagaaa ttagtcttgg 8760 ctgagcctag gtctgtcgtc gtaaacggta tcaggttccc ttctgttcat ttgaaggact 8820 acttaacaag attggcccaa aaggtatcta aaaagactgg tgccttggac ttcttcaagt 8880 cattaaacgc aggagaattg aaaaaagcag caccagccga tccatcagcc ccattagtta 8940 acgctgaaat cgctagacaa gtagaggctt tgttgactcc aaacactacc gtcatagctg 9000 agacaggtga ctcttggttc aacgcacaga gaatgaaatt gccaaatggt gccagggtcg 9060 agtatgaaat gcagtgggga catataggtt ggtcagtccc agccgccttt ggatacgcag 9120 taggtgcccc tgagaggagg aacatattga tggttggtga tggttcattc caattaacag 9180 cccaggaggt agcccaaatg gtcaggttga agttgcctgt catcatcttc ttgatcaaca 9240 attacggata caccatcgag gtcatgatcc acgacggacc ttacaacaac atcaaaaact 9300 gggactacgc cggtttgatg gaggttttca acggtaacgg tggttatgac tcaggagccg 9360 gtaagggatt aaaggctaag accggtggtg aattggctga agcaattaag gtcgcattgg 9420 ccaacaccga tggacctaca ttgattgaat gcttcatcgg aagggaggac tgcaccgagg 9480 aattggttaa atggggtaaa agggtagccg ctgctaattc aagaaaacca gttaataaat 9540 tattataata agtgaattta ctttaaatct tgcatttaaa taaattttct ttttatagct 9600 ttatgactta gtttcaattt atatactatt ttaatgacat tttcgattca ttgattgaaa 9660 gctttgtgtt ttttcttgat gcgctattgc attgttcttg tctttttcgc cacatgtaat 9720 atctgtagta gatacctgat acattgtgga tgctgagtga aattttagtt aataatggag 9780 gcgctcttaa taattttggg gatattggct taacctgcag gccgcgagcg ccgatataaa 9840 ctaatgattt taaatcgtta aaaaaatatg cgaattctgt ggatcgaaca caggacctcc 9900 agataacttg accgaagttt tttcttcagt ctggcgctct cccaactgag ctaaatccgc 9960 ttactatttg ttatcagttc ccttcatatc tacatagaat aggttaagta ttttattagt 10020 tgccagaaga actactgata gttgggaata tttggtgaat aatgaagatt gggtgaataa 10080 tttgataatt ttgagattca attgttaatc aatgttacaa tattatgtat acagagtata 10140 ctagaagttc tcttcggaga tcttgaagtt cacaaaaggg aatcgatatt tctacataat 10200 attatcatta cttcttcccc atcttatatt tgtcattcat tattgattat gatcaatgca 10260 ataatgattg gtagttgcca aacatttaat acgatcctct gtaatatttc tatgaataat 10320 tatcacagca acgttcaatt atcttcaatt ccggtgttta aaccccagcg cctggcggg 10379
<210> 42 <211> 4140 página 71
107345_104_sequence_Listing <212> DNA <213> Artjficia] sequence
<220> <223> Synthetic: ADS_FS.2 donor cassette
<400> 42 tcctcttgtg gtccgtggct tgtaattttc gggaaagata gaaatcactg cattcatcga 60 aagaagtgaa aataaattgt atcggggaag taatgagggg tggaatacgt aattgcttct 120 caatttgata atacaagtta cagtcttttt attgagagtc cctggaagga aaattattga 180 tgtttacctt tttttgcgac gcgcgtctgg ccataaataa aagggttctc ttgccaagaa 240 aaaataaaaa ggcgccttaa gggaccttct atgacaaata tggtgaggta tgcaacctca 300 atgaagagca atgagaaaat ttaaggggta agtaagcatc ggaatttgtt gtttcctaac 360 aatttgtcta atttactcaa taatatcagg agaattgatc gaaaaaagca aaccaggaac 420 ccctcacaaa taagggaaca taaagtaatt gctcgtcttt acatacatgg cactcaatcc 480 cagacgtcgc gtgctaaaaa tccttatatt attggcccct caggagttta tttgaatttt 540 gattgcattg ctttcagtgg acagtatatc ataaaatttg caagggcata gtgcctgccc 600 tacgatgttg taaaacaatt tctgaaaata ggttcagaat caaaaatgat gtataaatat 660 tgaaataaat tttcacataa attgtgctcc tccgcaaagt cttgactaaa taaacaattt 720 gttaatatcc tttcaaaaat tcttactttt tttttggatg gacgcaaaga agtttaataa 780 tcatattaca tggcattacc accatataca tatccatata catatccata tctaatctta 840 cttatatgtt gtggaaatgt aaagagcccc attatcttag cctaaaaaaa ccttctcttt 900 ggaactttca gtaatacgct taactgctca ttgctatatt gaagtacgga ttagaagccg 960 ccgagcgggt gacagccctc cgaaggaaga ctctcctccg tgcgtcctcg tcttcaccgg 1020 tcgcgttcct gaaacgcaga rgtgcctcgc gccgcactgc tccgaacaar aaagattcta 1080 caatactagc ttttatggtr atgaagagga aaaattggca gtaacctggc cccacaaacc 1140 ttcaaatgaa cgaatcaaat taacaaccat aggatgataa tgcgattagt tttttagcct 1200 tatttctggg gtaattaatc agcgaagcga tgatttttga tctattaaca gatatataaa 1260 tgcaaaaact gcataaccac tttaactaat actttcaaca ttttcggttt gtattacttc 1320 ttattcaaat gtaataaaag tatcaacaaa aaattgttaa tatacctcta tactttaacg 1380 tcaaggagaa aaaaccccgg atccatgggt caatataaat taattttgaa tggtaaaact 1440 ttgaagggtg aaactactac cgaagcagta gatgcagcaa cagccgaaaa ggtctttaag 1500 caatatgcta atgataatgg tgttgatggt gaatggacct atgacgatgc aactaaaaca 1560 tttactgtaa ctgaaggatc catggctttg actgaagaaa aaccaatcag accaattgct 1620 aattttccac cttctatctg gggtgaccaa ttcttgatct acgaaaagca agttgagcaa 1680 págjna 72
107345_104_Sequence_Listing ggtgttgaac aaatcgttaa cgatttgaag aaggaagtta gacaattgtt gaaggaagct 1740 ttggacatcc caatgaagca cgctaactta ttgaaattaa tcgacgaaat ccaaagatta 1800 ggtattccat accatttcga aagagaaatt gatcacgctt tgcaatgtat ttacgaaact 1860 tacggtgata actggaacgg tgacagatct tccttatggt tcagattaat gagaaagcaa 1920 ggttactacg ttacttgtga cgttttcaac aactacaaag ataagaatgg tgcttttaag 1980 caatctttgg ccaacgatgt tgaaggtttg ttagaattgt atgaagccac ctccatgaga 2040 gttcctggtg aaatcatctt ggaagacgct ttgggtttta ctagatctag attgtccatc 2100 atgactaaag atgccttctc tactaaccca gctttgttca ctgaaatcca aagagctttg 2160 aaacaaccat tgtggaagcg tttgccaaga atcgaagctg ctcaatacat cccattctac 2220 caacaacaag actctcacaa caaaaccttg ttgaaattgg ctaaattgga atttaacttg 2280 ttgcaatcct tgcacaagga agaattgtct cacgtttgta agtggtggaa agccttcgat 2340 attaagaaga acgctccatg tttgagagat agaattgtcg aatgttactt ctgggçjtttg 2400 ggttccggtt acgaaccaca atactctaga gctagagttt tctttactaa ggtggttgct 2460 gttattacct tgattgacga cacttacgac gcttacggta cctacgaaga attgaagatt 2520 ttcactgaag ctgtcgaaag atggtccatt acctgtttag atactttacc agaatacatg 2580 aagccaattt ataagttgtt catggacact tacaccgaaa tggaagaatt cttggctaag 2640 gaaggtcgta ccgacttgtt caattgtggt aaggaattcg ttaaggaatt cgttcgtaac 2700 ttgatggttg aagctaaatg ggctaacgaa ggtcatattc caactactga agaacacgat 2760 ccagtcgtta tcattactgg tggtgctaac ttgttgacta ctacttgtta cttaggtatg 2820 tctgatattt tcaccaagga atctgttgaa tgggccgttt ccgctccacc tttgttcaga 2880 tactctggta ttttgggtag aagattaaac gatttgatga ctcacaaggc tgagcaagaa 2940 agaaagcact cctcctcttc cttagaatct tacatgaagg aatacaacgt taacgaagaa 3000 tacgctcaaa ctttgattta caaggaagtt gaagacgttt ggaaagatat taacagagaa 3060 tacttgacca ccaaaaatat tccacgtcca ttgttaatgg ctgttatcta tttatgtcaa 3120 ttcttagaag ttcaatacgc tggtaaagac aatttcacca gaatgggtga cgaatataag 3180 cacttaatta agtctttgtt ggtctaccct atgtctatct aagatccgct ctaaccgaaa 3240 aggaaggagt cagacaacct gaagtctagg tccctattta tttttttata gttatgttag 3300 tattaagaac gttatttata tttcaaattt ttcttttttt tctgtacaga cgcgtgtacg 3360 catgtaacat tatactgaaa accttgcttg agaaggtttt gggacgctcg aagctacctt 3420 tttgttcttt tacttaaaca ttagttagtt cgttttcttt ttctcatttt tttatgtttc 3480 ccccccaaag ttctgatttt ataatatttt atttcacaca attccattta acagaggggg 3540 aatagattct ttagcttaga aaattagtga tcaatatata tttgcctttc ttttcatctt 3600 página 73
107345_104_Sequence_Listing ttcagtgata ttaatggttt cgagacactg caatggccct agttgtctaa gaggatagat 3660 gttactgtca aagatgatat tttgaatttc aattgacgta attaatgata ctattaataa 3720 tacagagcgt atatgaagta ttgcaaataa catgcacagt tcttttggga tgagaatgat 3780 aatgaaaggc gaaggcgggc gttcagaaaa gcgttgcgga gtaacaagtg attaaatagc 3840 acccaaataa tcttctttga tactaccgat tgcgtgaata gaactcactt gactgataca 3900 accttcaatt ttaactctaa ttctactttt tatggtgatg acatcctcgg aactttggta 3960 tgatggtggg tttgaacccg cattaaaggt taaatcttga ggcatcagat gctttgtcac 4020 aaatactttc attggaccta cttgcacttc gaacccgtgc tgagaacatg aaacgactgt 4080 gccgtccact acttcccctt taaatggttt gaaaactaca gctctatatt tcacgttgaa 4140
<210> 43 <211> 4475 <212> DNA <213> Artificia1 Sequence <220> <223> synthetic: ADS_FS.3 donor cassette <400> 43 attgaagcac ctgtggagta tttaaaaact gcggttacat ggcctacaga tgaaatatgt 60 gctcaactaa tgacacaatt cccaccagga acgccgacca gtgtcctgct gcagactatt 120 tcagatgagc tagagaaaag ttctgacaac ctgttcacgt tatctgattt aaagagcaaa 180 ctgaaagtta ttggcttatt cgagcacatg gaagatatcc catttttcga caagctgaaa 240 ctaagcaatg cgcccgtgaa ggacatgcct atggtcacaa aggcgttcac caaattttgc 300 gaaacaatag caaaaaggca tacaagaggc cractgtcat accgattacc ttttaaccta 360 ctggactaca attgcatacc gaatgagagt tattcattag aggtttatga gtcattgtac 420 aacatcatta ctctatactt ctggctcagc aacaggtacc caaactactt cattgacatg 480 gaatctgcta aagatttgaa gtatttctgt gagatgatta ttttcgagaa acttgatcga 540 ttaaagaaga atccttacgc acataagccc tttggttcta caagaggtca cctctcatct 600 tcgagaagaa gattgcgtac ataatctacg atatatcctg taaatagaaa cagctacact 660 gcttgaaagc cttaacatga tacatttctg gtatgatgcc attgttgtgc cctgccgggt 720 ttatcgtttc ctaacaggca cgtcacttat aacgaggtgc ctgtcgttta ccgcccaagc 780 cggttttttc gctggagagt acggtactac tagcccacca cacgttcgtg gccaggttga 840 taggccaccg ttgagcaaag ggcagtaaaa tatataaaag aggaacaagc gcttccatta 900 agagcactgc taagcctact cgttttctag ttctctgaaa aaaggtagcc taaaacaagc 960 gccatatcat atatatttat acagattaga cgtactcaaa attcttactt ttrttttgga 1020 página 74
107345_l04_sequence_Lj5tjng tggacgcaaa gaagtttaat aatcatatta catggcatta ccaccatata catatccata 1080 tacatatcca tatctaatct tacttatatg ttgtggaaat gtaaagagcc ccattatctt 1140 agcctaaaaa aaccttctct ttggaacttt cagtaatacg cttaactgct cattgcgccg 1200 ccgagcgggt gacagccctc cgaaggaaga ctctcctccg tgcgtcctcg tcttcaccgg 1260 tcgcgttcct gaaacgcaga tgtgcctcgc gccgcactgc tccgaacaat aaagattcta 1320 caatactagc ttttatggtt atgaagagga aaaattggca gtaacctggc cccacaaacc 1380 ttcaaatgaa cgaatcaaat taacaaccat aggatgataa tgcgattagt tttttagcct 1440 tatttctggg gtaattaatc agcgaagcga tgatttttga tctattaaca gatatataaa 1500 tgcaaaaact gcataaccac tttaactaat actttcaaca ttttcggttt gtattacttc 1560 ttattcaaat gtaataaaag tatcaacaaa aaattgttaa tatacctcta tactttaacg 1620 tcaaggagaa aaaactataa tgggtcaata taaattaatt ttgaatggta aaactttgaa 1680 gggtgaaact actaccgaag cagtagatgc agcaacagcc gaaaaggtct ttaagcaata 1740 tgctaatgat aatggtgttg atggtgaatg gacctatgac gatgcaacta aaacatttac 1800 tgtaactgaa ggatccatgg ctttgactga agaaaaacca atcagaccaa ttgctaattt 1860 tccaccttct atctggggtg accaattctt gatctacgaa aagcaagttg agcaaggtgt 1920 tgaacaaatc gttaacgatt tgaagaagga agttagacaa ttgttgaagg aagctttgga 1980 catcccaatg aagcacgcta acttattgaa attaatcgac gaaatccaaa gattaggtat 2040 tccataccat ttcgaaagag aaattgatca cgctttgcaa tgtatttacg aaacttacgg 2100 tgataactgg aacggtgaca gatcttcctt atggttcaga ttaatgagaa agcaaggtta 2160 ctacgttact tgtgacgttt tcaacaacta caaagataag aatggtgctt ttaagcaatc 2220 tttggccaac gatgttgaag gtttgttaga attgtatgaa gccacctcca tgagagttcc 2280 tggtgaaatc atcttggaag acgctttggg ttttactaga tctagattgt ccatcatgac 2340 taaagatgcc ttctctacta acccagcttt gttcactgaa atccaaagag ctttgaaaca 2400 accattgtgg aagcgtttgc caagaatcga agctgctcaa tacatcccat tctaccaaca 2460 acaagactct cacaacaaaa ccttgttgaa attggctaaa ttggaattta acttgttgca 2520 atccttgcac aaggaagaat tgtctcacgt ttgtaagtgg tggaaagcct tcgatattaa 2580 gaagaacgct ccatgtttga gagatagaat tgtcgaatgt tacttctggg gtttgggttc 2640 cggttacgaa ccacaatact ctagagctag agttttcttt actaaggtgg ttgctgttat 2700 taccttgatt gacgacactt acgacgctta cggtacctac gaagaattga agattttcac 2760 tgaaçjctgtc gaaagatggt ccattacctg tttagatact ttaccagaat acatgaagcc 2820 aatttataag ttgttcatgg acacttacac cgaaatggaa gaattcttgg ctaaggaagg 2880 tcgtaccgac ttgttcaart gtggtaagga attcgttaag gaattcgttc gtaacttgat 2940 págjna 75 l07345_104_sequence_Ljstjng ggttgaagct aaatgggcta acgaaggtca tattccaact actgaagaac acgatccagt 3000 cgttatcatt actggtggtg ctaacttgtt gactactact tgttacttag gtatgtctga 3060 tattttcacc aaggaatctg ttgaatgggc cgtttccgct ccacctttgt tcagatactc 3120 tggtattttg ggtagaagat taaacgattt gatgactcac aaggctgagc aagaaagaaa 3180 gcactcctcc tcttccttag aatcttacat gaaggaatac aacgttaacg aagaatacgc 3240 tcaaactttg atttacaagg aagttgaaga cgtttggaaa gatattaaca gagaatactt 3300 gaccaccaaa aatattccac gtccattgtt aatggctgtt atctatttat gtcaattctt 3360 agaagttcaa tacgctggta aagacaattt caccagaatg ggtgacgaat ataagcactt 3420 aattaagtct ttgttggtct accctatgtc tatctaagat ccgctctaac cgaaaaggaa 3480 ggagttagac aacctgaagt ctaggtccct atttattttt ttatagttat gttagtatta 3540 agaacgttat ttatatttca aatttttctt ttttttctgt acagacgcgt gtacgcatgt 3600 aacattatac tgaaaacctt gcttgagaag gttttgggac gctcgaagga tacttgcaca 3660 agttccacta attactgaca tttgtggtat taactcgttt gactgctcta caattgtagg 3720 atgttaatca atgtcttggc tgccttcatt ctcttcaggc tctattaatt ttaaccgtta 3780 taagttcctt ttctcccttg gaagcaaaca tcaactgcct taaaatctgg tggcgaggaa 3840 agaggaaatg gcatgtacta atgatggtcc taataaatat cccgaaattg tgagtgttaa 3900 gcacctgttc caacattcgg gatccaagca tgaatttagt gctggtaaac gattttcaaa 3960 atccattggt aaaatattca aacgaaactc tgctttgaaa acttctagaa ctgaaacggc 4020 aaatcataaa atggaattga aaaaaagaga gggtgttacc ttattgccac ctgtcccaga 4080 atcattatta cataaactca attcttggtt ggaaactttt tcttccacca agaacatgaa 4140 aatcgaagaa aacaaaattg ttattaatga aaaagagatt cgggattcag tctcttacta 4200 ccctgataag aatggaggaa gtgcrgtatt ttgttacttg cccgaccttg tgctatatta 4260 taagccgcct ataaaagtca caggcaagca atgtccaata aagagaagtc cttgggaatc 4320 gatggaaatc caatatcaaa agtttatgta ccccttagaa aggttggaaa gacagtttga 4380 ggaagttcca tttaggccct ggtattttgc aatgcgatta aaggaacttt acagatgctg 4440 tgaaaggtct tttactaacg cggcaaatag aggaa 4475
<210> 44 <211> 8247 <212> DNA <213> Artificia1 sequence
<220> <223> synthetic: 9XFS_URA3_FS.4 donor cassette
<400> 44 página 76
107345_104_sequence_Listing attgctattg agtaagttcg atccgtttgg cgtcttttgg ggtgtaacgc caaacttatt 60 acrtttccta tttgaggttg gtattgattg ttgtcaaaga atgaaaatat acacaaacgc 120 cacaatatac gtaccaggtt cacgaaaact gatcgtatgg ttcataccct gacttggcaa 180 acctaatgtg accgtcgctg attagcggat cacgaaaagt gatctcgata caattagagg 240 atccacgaaa atgatgtgaa tgaatacatg aaagattcat gagatctgac aacatggtag 300 acgtgtgtgt ctcatggaaa ttgatgcagt tgaagacatg tgcgtcacga aaaaagaaat 360 caatcctaca cagggcttaa gggcaaatgt attcatgtgt gtcacgaaaa gtgatgtaac 420 taaatacacg attaccatgg aaattaacgt accttttttg tgcgtgtatt gaaatattat 480 gacatattac agaaagggtt cgcaagtcct gtttctatgc ctttctctta gtaattcacg 540 aaataaacct atggtttacg aaatgatcca cgaaaatcat gttattattt acatcaacat 600 atcgcgaaaa ttcatgtcat gtccacatta acatcattgc agagcaacaa ttcattttca 660 tagagaaatt tgctactatc acccactagt actaccattg gtacctacta ctttgaattg 720 tactaccgct gggcgttatt aggtgtgaaa ccacgaaaag ttcaccataa cttcgaataa 780 agtcgcggaa aaaagtaaac agctattgct actcaaatga ggtttgcaga agcttgttga 840 agcatgatga agcgttctaa acgcactatt catcattaaa tatttaaagc tcataaaatt 900 gtattcaatt cctattctaa atggctttta tttctattac aactattagc tctaaatcca 960 tatcctcata agcagcaatc aattctatct atactttaaa agtaaaattc ttgagggaac 1020 tttcaccatt atgggaaatg gttcaagaag gtattgactt aaactccatc aaatggtcag 1080 gtcattgagt gttttttatt tgttgtattt tttttttttt agagaaaatc ctccaatatc 1140 aaattaggaa tcgtagtttc atgattttct gttacaccta actttttgtg tggtgccctc 1200 ctccttgtca atattaatgt taaagtgcaa ttctttttcc ttatcacgtt gagccattag 1260 tatcaatttg cttacctgta ttcctttact atcctccttt ttctccttct tgataaatgt 1320 atgtagattg cgtatatagt ttcgtctacc ctatgaacat attccatttt gtaatttcgt 1380 gtcgtttcta tratgaattr catttaraaa gtttargtac aaatatcata aaaaaagaga 1440 arctttttaa gcaaggattt tcttaacttc ttcggcgaca gcatcaccga cttcggtggt 1500 actgttggaa ccacctaaat caccagttct gatacctgca tccaaaacct ttttaactgc 1560 atcttcaatg gccttacctt cttcaggcaa gttcaatgac aatttcaaca tcattgcagc 1620 agacaagata gtggcgatag ggtcaacctt attctttggc aaatctggag cagaaccgrg 1680 gcatggttcg tacaaaccaa atgcggtgtt cttgtctggc aaagaggcca aggacgcaga 1740 tggcaacaaa cccaaggaac ctgggataac ggaggcttca tcggagatga tatcaccaaa 1800 catgttgctg gtgattataa taccatttag gtgggttggg ttcttaacta ggatcatggc 1860 ggcagaatca atcaattgat gttgaacctt caatgtaggg aattcgttct tgatggtttc 1920 Página 77
107345_104_sequence_Ljstjng ctccacagtt tttctccata atcttgaaga ggccaaaaca ttagctttat ccaaggacca 1980 aataggcaat ggtggctcat gttgtagggc catgaaagcg gccattcttg tgattctttg 2040 cacttctgga acggtgtatt gttcactatc ccaagcgaca ccatcaccat cgtcttcctt 2100 tctcttacca aagtaaatac ctcccactaa ttctctgaca acaacgaagt cagtaccttt 2160 agcaaattgt ggcttgattg gagataagtc taaaagagag tcggatgcaa agttacatgg 2220 tcttaagttg gcgtacaatt gaagttcttt acggattttt agtaaacctt gttcaggtct 2280 aacactaccg gtaccccatt taggaccacc cacagcacct aacaaaacgg catcaacctt 2340 cttggaggct tccagcgcct catctggaag tgggacacct gtagcatcga tagcagcacc 2400 accaattaaa tgattttcga aatcgaactt gacattggaa cgaacatcag aaatagcttt 2460 aagaacctta atçgcttcgg ctgtgatttc ttgaccaacg tggtcacctg gcaaaacgac 2520 gatcttctta ggggcagaca taggggcaga cattagaatg gtatatcctt gaaatatata 2580 tatatattgc tgaaatgtaa aaggtaagaa aagttagaaa gtaagacgat tgctaaccac 2640 ctattggaaa aaacaatagg tccttaaata atattgtcaa cttcaagtat tgtgatgcaa 2700 gcatttagtc atgaacgctt ctctattcta tatgaaaagc cggttccggc ctctcacctt 2760 tcctttttct cccaattttt cagttgaaaa aggtatatgc gtcaggcgac ctctgaaatt 2820 aacaaaaaat ttccagtcat cgaatttgat tctgtgcgat agcgcccctg tgtgttctcg 2880 ttatgttgag gaaaaaaata atggttgcta agagattcga actcttgcat cttacgatac 2940 ctgagtattc ccacagttaa ctgcggtcaa gatatttctt gaatcaggcg ccttagaccg 3000 ctcggccaaa caaccaatta cttgttgaga aatagagtat aattatccta taaatataac 3060 gtttttgaac acacatgaac aaggaagtac aggacaattg attttgaaga gaatgtggat 3120 tttgatgtaa ttgttgggat tccattttta ataaggcaat aatattaggt atgtggatat 3180 actagaagtt ctcctcgacc graataatca tattacatgg cattaccacc atatacatat 3240 ccatatacat atccatatct aatcttactt atatgttgtg gaaatgtaaa gagccccatt 3300 atcttagcct aaaaaaacct tctctttgga actttcagta atacgcttaa ctgctcattg 3360 cgccgccgag cgggtgacag ccctccgaag gaagactctc ctccgtgcgt cctcgtcttc 3420 accggtcgcg ttcctgaaac gcagatgtgc ctcgcgccgc actgctccga acaataaaga 3480 ttctacaata ctagctttta tggttatgaa gaggaaaaat tggcagtaac ctggccccac 3540 aaaccttcaa atgaacgaat caaattaaca accataggat gataatgcga ttagtttttt 3600 agccttattt ctggggtaat taatcagcga agcgatgatt tttgatctat taacagatat 3660 ataaatgcaa aaactgcata accactttaa ctaatacttt caacattttc ggtttgtatt 3720 acttcttatt caaatgtaat aaaagtatca acaaaaaatt gttaatatac ctctatactt 3780 págjna 78
107345_104_sequencê_Listing taacgtcaag gagaaaaaac tataatgtcc actttgccta tttcctctgt ttcttcctct 3840 ccatctactt ccccaattgt tgtcgatgat aaggattcta ccaagccaga cgttattaga 3900 cataccgcta acttcaacgc ttccatttgg ggtgatcaat ttttgactta cgatgaacca 3960 gaggacttgg ttatgaagaa gcaattagtc gaagagttaa aggaggaagt taagaaggaa 4020 ttgattacta ttaagggttc taacgaacct atgcaacatg ttaagttgat cgaattaatc 4080 aatgctgttc aacgtttagg tattgcttac cattttgaag aagaaatcga agaagcttta 4140 caacatatcc atgtcactta cggtgaacaa tgggtcgata aggaaaattt acaatctatc 4200 tccttgtggt ttcgtttgtt gcgtcaacaa ggtttcaatg tctcctctgg tgttttcaag 4260 gactttatgg acgaaaaagg taaatttaag gaatctttgt gtaacgacgc tcaaggtatc 4320 ttggccttgt acgaagctgc tttcatgaga gtcgaagatg aaaccatctt ggacaacgct 4380 ttggaattct ctaaggttca cttggacatt attgccaagg atccatcttg tgactcttcc 4440 ttaagaaccc aaatccacca agccttgaag caaccattga gaagaagatt ggccagaatc 4500 gaagctttac actatatgcc aatttaccaa caagaaactt ctcacgacga ggttttgttg 4560 aagttggcta agttagattt ctctgttttg caatccatgc ataagaaaga attgtctcac 4620 atctgcaagt ggtggaaaga tttagacttg caaaacaaat tgccattcgt tcgtgataga 4680 gttgtcgaag gttacttctg gattttgtct atttactatg aaccacaaca tgccagaacc 4740 agaatgttct tgatgaagtc ttgtatgtgg ttggtcgttt tggatgatac cttcgacaac 4800 tacggtacct acgaagaatt ggaaattttc actcaagccg ttgagaagtg gtccatttct 4860 tgtttggaca tgttgccaga atacatgaag ttgatctacc aagaattggt taacttgcac 4920 gttgaaatgg aagaatcttt agaaaaggaa ggtaaggctt atcaaatcca ctacgttaag 4980 gaaatggcta aggaattggt cagaaactac ttggttgaag ccagatggtt gaaagaaggt 5040 tacatgccta ctttggaaga gtacatgtct gtttccatgg ttaccggtac ctacggtttg 5100 atcactgcta gatcttacgt tggtagaggt gacattgtta acgaggacac ttttaaatgg 5160 gtttcttcct acccacctat tgttgaagct tcttgtgtta rcattagatt gatggatgat 5220 attgtctctc ataaagaaga acaagaaaga ggtcatgttg cctcctccat cgaatgttat 5280 tctaaggaat ccggtgcttc tgaagaagaa gcctgtgaat acatctctag aaaagtcgaa 5340 gacgcctgga aggttattaa cagagaatct ttgagaccaa ccgccgttcc attccctttg 5400 ttaatgccag ctatcaactt ggctagaatg tgtgaagttt tatactctgt taacgatggt 5460 ttcactcacg ccgaaggtga catgaaatct tacatgaagt ccttctttgt ccatccaatg 5520 gtcgtttgag cgaatttctt atgatttatg atttttatta ttaaataagt tataaaaaaa 5580 ataagtgtat acaaatttta aagtgactct taggttttaa aacgaaaatt cttattcttg 5640 agtaactctt tcctgtaggt caggttgctt tctcaggtat agcatgaggt cgctcatgcg 5700 página 79
107345_104_sequencê_Listing tccatcttta cagtcctgtc ttattgttct tgatttgtgc cccgtaaaat actgttactt 5760 ggttctggcg aggtattgga tagttccttt ttataaaggc catgaagctt tttctttcca 5820 attttttttt tttcgtcatt atagaaatca ttacgaccga gattcccggg taataactga 5880 tataattaaa ttgaagctct aatttgtgag tttagtatac atgcatttac ttataataca 5940 gttttttagt tttgctggcc gcatcttctc aaatatgctt cccagcctgc ttttctgtaa 6000 cgttcaccct ctaccttagc atcccttccc tttgcaaata gtcctcttcc aacaataata 6060 atgtcagatc ctgtagagac cacatcatcc acggttctat actgttgacc caatgcgtct 6120 cccttgtcat ctaaacccac accgggtgtc ataarcaacc aatcgtaacc ttcatctctt 6180 ccacccatgt ctctttgagc aataaagccg ataacaaaat ctttgtcact cttcgcaatg 6240 tcaacagtac ccttagtata ttctccagta gatagggagc ccttgcatga caattctgct 6300 aacatcaaaa ggcctctagg ttcctttgtt acttcttctg ccgcctgctt caaaccgcta 6360 acaatacctg ggcccaccac accgtgtgca ttcgtaatgt ctgcccattc tgctattctg 6420 tatacacccg cagagtactg caatttgact gtattaccaa tgtcagcaaa ttttctgtct 6480 tcgaagagta aaaaattgta cttggcggat aatgccttta gcggcttaac tgtgccctcc 6540 atggaaaaat cagtcaagat atccacatgt gtttttagta aacaaatttt gggacctaat 6600 gcttcaacta actccagtaa ttccttggtg gtacgaacat ccaatgaagc acacaagttt 6660 gtttgctttt cgtgcatgat attaaatagc ttggcagcaa caggactagg atgagtagca 6720 gcacgttcct tatatgtagc tttcgacatg atttatcttc gtttcctgca ggtttttgtt 6780 ctgtgcagtt gggttaagaa tactgggcaa tttcatgttt cttcaacacc acatatgcgt 6840 atatatacca atctaagtct gtgctccttc cttcgttctt ccttctgctc ggagattacc 6900 gaatcaaaaa aatttcaaag aaaccggaat caaaaaaaag aacaaaaaaa aaaaagatga 6960 attgaaaagc tttarggacc ctgaaaccac agccacarta acctrcrttg arggtcaaaa 7020 cttatccttc accataaata tgcctcgcaa aaaaggtaat taacatatat agaattacat 7080 tatttatgaa atatcatcac tatctcttag catctttaat ccttttctac atcagataac 7140 ttcggtttgt tatcatcgtc tgtattgtca tcaattggcg cagtagcctc aatttcaacg 7200 tcgtttgact ctggtgtttg ttcatgtgca gatccatgag atgatgaaat gtgtatatta 7260 grrtaaaaag ttgtatgtaa taaaagtaaa atttaatatt ttggatgaaa aaaaccattt 7320 ttagactttt tcttaactag aatgctggag tagaaatacg ccatctcaag atacaaaaag 7380 cgttaccggc actgatttgt ttcaaccagt atatagatta ttattgggtc ttgatcaact 7440 ttcctcagac atatcagtaa cagttatcaa gctaaatatt tacgcgaaag aaaaacaaat 7500 attttaattg rgatacttgt gaattttatr ttattaagga tacaaagtta agagaaaaca 7560 página 80
107345_104_sequence_Ljstjng aaatttatat acaatataag taatattcat atatatgtga tgaatgcagt cttaacgaga 7620 agacatggcc ttggtgacaa ctctcttcaa accaacttca gcctttctca attcatcagc 7680 agatgggtct tcgatttgca aagcagccaa agcatcggac aaagcagctt caatcttgga 7740 cttggaacct ctcttcaatt tagaagacaa gactgggtca gtgacagttt gttcgatgga 7800 ggcaacgtag gattccaatc tttgtctagc ttcgtgcttc ttggcaaaag cttcatcggc 7860 agccttgaac tcttcagctt ggttaaccat cttttcaatt tcttcagaag acaatctacc 7920 aacagcgtta gagatagtga tgttagaaga cttaccggta gacttttcga cggcagtaac 7980 cttcaagata ccgttagcat caacttcgaa gatagcttcc aagactggtt caccagctgg 8040 catcattggg atgttcttca agtcgaattc acccaacaaa gtgttttctt tacagttaac 8100 acgttcacct tggtagactg ggaattgaac ggtggtttgg ttgtcagcac atgtagtaaa 8160 ggttcttctc ttgatggttg gaacagtagt gtttcttgga acaacgatac cgaacatgtc 8220 accttgcata ccaacaccta gagataa 8247
<210> 45 <211> 49 <212> DNA <213> Artificia1 sequence
<220> <223> Synthetic: Rêcognition sequence for Fs-specific talen
<400> 45 tagtggagga attaaaagag gaagttaaga aggaattgat aactatcaa 49
<210> 46 <211> 26 <212> DNA <213> Artificja] sequence
<220> <223> Synthetic: prÍmer Hj272
<400> 46 ataacaatat tataaaaagc gcttaa 26
<210> 47 <211> 29 <212> DNA <213> Artjficia1 Sequence
<220> <223> Synthetic: primer ART45
<400> 47 tactgcttcg gtagtagttt cacccttca 29
<210> 48 <211> 22 pági na 81
107345_104_Sequencé_Listing <212> DNA <213> Artificia1 sequence <220> <223> synthetic: primer Hj643 <400> 48 aaaatcctta tattattggc cc 22
<210> 49 <211> 19 <212> DNA <213> Artifjcja1 Sequence
<220> <223> Synthetic: primer Hj799
<400> 49 gtagcctaaa acaagcgcc 19
<210> 50 <211> 9 <212> prt <213> Artjficia1 Sequence
<220> <223> synthetic: Homing endonuclease family conserved motif
<400> 50
Lêú Ajà gly Lêú I1e asp Aià asp Gly 1 5
<210> 51 <211> 6 <212> PRT <213> Artifjcia1 sequence
<220> <223> synthetic: Homjng endonuclease family conserved motif
<400> 51
Gly I1e Tyr Tyr I1e Gly 1 5
<210> 52 <211> 18 <212> DNA <213> Artjficia1 Sequence
<220> <223> synthetic: Rêcognition sequence for I-scel
<400> 52 tagggataac agggtaat 18
<210> 53 página 82
107345_104_Sequencê_Listing <211> 31 <212> DNA <213> Artif'icial sequence <220> <223> synthetic: Recognition sequence for vde (pr-scel) <400> 53 tatgtcgggt gcggagaaag aggtaatgaa a 31
<210> 54 <211> 24 <212> DNA <213> Artjficia1 sequence
<220> <223> Synthetic: Recognjtjon sequence for F-cphI
<400> 54 gatgcacgag cgcaacgctc acaa 24
<210> 55 <211> 24 <212> DNA <213> Artjfjcia1 sequence
<220> <223> Synthetic: Rêcognition sequence for p1-Mgal
<400> 55 gcgtagctgc ccagtatgag tcag 24
<210> 56 <211> 40 <212> DNA <213> Artificia1 Sequence
<220> <223> Synthetic: Rêcognition sequence for PI-MtúII <400> 56 acgtgcacta cgtagagggt cgcaccgcac cgatctacaa 40
<210> 57 <211> 4300 <212> DNA <213> Artificiaj sequence
<220> <223> Synthetic: ADE2_SFCi donor cassette
<400> 57 ccggtggtgc ttatactgtt tctactgcag ctgccgctac tgttagatct accatcagaa 60 gattaagaga aatggttgaa gcttaaactt ctttcattca ttttctcttg gctttcacta 120 ggtatatcta ttccataacg actatgtttt gtatttgtta atttacataa aaccatatca 180 gtacatcaac gaactgtaaa aaagaaactt tagcataatt attgcggata tttaaactca 240 págjna 83
107345_104_Sequence_Listing cttgcaggta agagcaaaag gcgattgatt tccagtccgc ctcttgtcac gtgatttagt 300 aagaaatttt gacagcaccc tcggtttaat ggaaaagagg ggcgtttttc gatgaacccg 360 aggggagact agagaatcat ctcggttgaa tggagcatta tttttttagt agcgcccgcc 420 cggagaaatg gacgttggcg aatgagccat gaattattaa ccgcccatgt ctaccagata 480 gacggcacgg ccacgcgttt aaaccgcccc acatcgtatg acagtaccag cctagtcccg 540 gtaaaccgca aacggacctt aattgtgacg aagggcccaa atttgatggg tcggtgttaa 600 tgattagtcc tcattgtcat aataaagtgt gatgatggag gcaatgatga tatacggtag 660 tactactgct cgaggtgcta tcttttaacc aatcctttga gattcttgtc gccacggagt 720 tactaccttt tacaaaccgt aatgtcacat tttgcatata tcttatgtat aaatatatag 780 ttcacttact acttgttctc gttttgttaa ctttcttgtt gtagttcttc ttgttcttgg 840 cgtttccccc tttgttttct atctgcttca taagtaaagt gcaaagcatt ttggaagata 900 ttatcaattg agtcattgaa agaaacttgg catcttccct attactaaaa ctaagaatac 960 ttgattcaag aaagaagttt atattagttt tagccgtaag ataacataac aaagaagaag 1020 aaagaaaatt cttgaataat acataacttt tcttaaaaga atcaaagaca gataaaattt 1080 aagagatatt aaatattagt gagaagccga gaattttgta acaccaacat aacactgaca 1140 tctttaacaa cttttaatta tgatacattt cttacgtcat gattgattat tacagctatg 1200 ctgacaaatg actcttgttg catggctacg aaccgggtaa tactaagtga ttgactcttg 1260 ctgacctttt attaagaact aaatggacaa tattatggag catttcatgt ataaattggt 1320 gcgtaaaatc gttggatctc tcttctaagt acatcctact ataacaatca agaaaaacaa 1380 gaaaatcgga caaaacaatc aagtatggat tctagaacag ttggtatatt aggaggggga 1440 caattgggac gtatgattgt tgaggcagca aacaggctca acattaagac ggtaatacta 1500 gatgctgaaa attctcctgc caaacaaata agcaactcca atgaccacgt raatggctcc 1560 ttrtccaatc ctcttgatat cçjaaaaacta gctgaaaaat gtgatgtgcr aacgattgag 1620 attgagcatg ttgatgttcc tacactaaag aatcttcaag taaaacatcc caaattaaaa 1680 atttaccctt ctccagaaac aatcagattg atacaagaca aatatattca aaaagagcat 1740 ttaatcaaaa atggtatagc agttacccaa agtgttcctg tggaacaagc cagtgagacg 1800 tccctattga atgttggaag agatttgggt tttccattcg tcttgaagtc gaggactttg 1860 gcatacgatg gaagaggtaa cttcgttgta aagaataagg aaargattcc ggaagctttg 1920 gaagtactga aggatcgtcc tttgtacgcc gaaaaatggg caccatttac taaagaatta 1980 gcagtcatga ttgtgaggtc tgttaacggt ttagtgtttt cttacccaat tgtagagact 2040 atccacaagg acaatatttg tgacttatgt tatgcgcctg ctagagttcc ggactccgtt 2100 Página 84
107345_104_Sequence_Listing caacttaagg cgaagttgtt ggcagaaaat gcaatcaaat cttttcccgg ttgtggtata 2160 trtggtgtgg aaatgttcta tttagaaaca ggggaattgc ttattaacga aattgcccca 2220 aggcctcaca actctggaca ttataccatt gatgcttgcg tcacttctca atttgaagct 2280 catttgagat caatattgga tttgccaatg ccaaagaatt tcacatcttt ctccaccatt 2340 acaacgaacg ccattatgct aaatgttctt ggagacaaac atacaaaaga taaagagcta 2400 gaaacttgcg aaagagcatt ggcgactcca ggttcctcag tgtacttata tggaaaagag 2460 tctagaccta acagaaaagt aggtcacata aatattattg cctccagtat ggcggaatgt 2520 gaacaaaggc tgaactacat tacaggtaga actgatattc caatcaaaat ctctgtcgct 2580 caaaagttgg acttggaagc aatggtcaaa ccattggttg gaatcatcat gggatcagac 2640 tctgacttgc cggtaatgtc tgccgcatgt gcggttttaa aagattttgg cgttccattt 2700 gaagtgacaa tagtctctgc tcatagaact ccacatagga tgtcagcata tgctatttcc 2760 gcaagcaagc gtggaattaa aacaattatc gctggagctg gtggggctgc tcacttgcca 2820 ggtatggtgg ctgcaatgac accacttcct gtcatcggtg tgcccgtaaa aggttcttgt 2880 ctagatggag tagattcttt acattcaatt gtgcaaatgc ctagaggtgt tccagtagct 2940 accgtcgcta ttaataatag tacgaacgct gcgctgttgg ctgtcagact gcttggcgct 3000 tatgattcaa gttatacaac gaaaatggaa cagtttttat taaagcaaga agaagaagtt 3060 cttgtcaaag cacaaaagtt agaaactgtc ggttacgaag cttatctaga aaacaagtaa 3120 tatataagtt tattgatata cttgtacagc aaataattat aaaatgatat acctattttt 3180 taggctttgt tatgattaca tcaaatgtgg acttcataca tagaaatcaa cgcttacagg 3240 tgtccttttt taagaatttc atacataaga tcatgatgaa caatgggact acaaaatgaa 3300 ataaagaaaa aatagaaata gaatagaaga tcaattatta atcgccctat tcttccttat 3360 tacctacaca aaataaagca gcaacataag aaacaaaaac aaaatgaaaa caaaccaaat 3420 aaatctatgt aagcatactc atttcaattt gatattcatt acttgacttt tttgtcctta 3480 tttgaggctc cataagcgcg ccattttccc ctactccctt ttttcgtaaa tagtaataat 3540 gtgctgaaaa gaacaatgaa gtagttatca tacatattcc gtcgtgtcga tatgagggga 3600 ggtgtctctt tctttcatcc cttgtcgcaa cctccaatat ataagagcat aagcaactga 3660 tcttacttta gtaattaact tagcatacct ggcccgaagg aagaaaaaaa attcacctca 3720 acaacatggt tcctaagttt tacaaacttt caaacggctt caaaatccca agcattgctt 3780 tgggaaccta ccggtgttta aaccccagcg cctggcgggg atattccaag atcgcaaaca 3840 gccgaaattg tgtatgaagg tgtcaagtgc ggctaccgtc atttcgatac tgctgttctt 3900 tatggtaatg agaaggaagt tggcgatggt atcattaaat ggttgaacga agatccaggg 3960 aaccataaac gtgaggaaat cttctacact actaaattat ggaattcgca aaacggatat 4020 págjna 85
107345_l04_sequence_Listing aaaagagcta aagctgccat tcagcaatgt ttgaatgaag tctcgggctt gcaatacatc 4080 gatcttcttt tgattcattc gccactggaa ggttctaaat taaggttgga aacttggcgc 4140 gccatgcaag aagcggttga tgaaggattg gttaagtcta taggggtttc caactatggg 4200 aaaaagcaca ttgatgaact tttgaactgg ccagaactga agcacaagcc agtggtcaac 4260 caaatcgaga tatcaccttg gattatgaga caagaattag 4300
<210> 58 <211> 3586 <212> DNA <213> Ar"tificia1 Sequence
<220> <223> synthetic: GFP_SFC1 donor cassette <400> 58 ccggtggtgc ttatactgtt tctactgcag ctgccgctac tgttagatct accatcagaa 60 gattaagaga aatggttgaa gcttaaactt ctttcattca ttttctcttg gctttcacta 120 ggtatatcta ttccataacg actatgtttt gtatttgtta atttacataa aaccatatca 180 gtacatcaac gaactgtaaa aaagaaactt tagcataatt attgcggata tttaaactca 240 cttgcaggta agagcaaaag gcgattgatt tccagtccgc ctcttgtcac gtgatttagt 300 aagaaatttt gacagcaccc tcggtttaat ggaaaagagg ggcgtttttc gatgaacccg 360 aggggagact agagaatcat ctcggttgaa tggagcatta tttttttagt agcgcccgcc 420 cggagaaatg gacgttggcg aatgagccat gaattattaa ccgcccatgt ctaccagata 480 gacggcacgg ccacgcgttt aaaccgcccc acatcgtatg acagtaccag cctagtcccg 540 gtaaaccgca aacggacctt aattgtgacg aagggcccaa arttgatggg rcggtgttaa 600 tgattagtcc tcattgtcat aataaagtgt gatgatggag gcaatgatga tatacggtag 660 tactactgct cgaggtgcta tcttttaacc aatcctttga gattcttgtc gccacggagt 720 tactaccttt tacaaaccgt aatgtcacat tttgcatata tcttatgtat aaatatatag 780 ttcacttact acttgttctc gttttgttaa ctttcttgtt gtagttcttc ttgttcttgg 840 cgtttccccc tttgttttct atctgcttca taagtaaagt gcaaagcatt ttggaagata 900 ttatcaattg agtcattgaa agaaacttgg catcttccct attactaaaa ctaagaatac 960 ttgattcaag aaagaagttt atattagttt tagccgtaag ataacataac aaagaagaag 1020 aaagaaaaac acaattacag taacaataac aagaggacag atactaccaa aatgtgtggg 1080 gaagcgggta agctgccaca gcaattaatg cacaacattt aacctacatt cttccttatc 1140 ggatcctcaa aacccttaaa aacatatgcc tcaccctaac atattttcca attaaccctc 1200 aatatttctc tgtcacccgg cctctatttt ccattttctt ctttacccgc cacgcgtttt 1260 página 86
107345_104_sequence_Listjng tttctttcaa atttttttct tctttcttct ttttcttcca cgtcctcttg cataaataaa 1320 taaaccgttt tgaaaccaaa ctcgcctctc tctctccttt ttgaaatatt tttgggtttg 1380 tttgatcctt tccttcccaa tctctcttgt ttaatatata ttcatttata tcacgctctc 1440 tttttatctt cctttttttc ctctctcttg tattcttcct tcccctttct actcaaacca 1500 agaagaaaaa gaaaaggtca atctttgtta aagaatagga tcttctacta catcagcttt 1560 tagatttttc acgcttactg cttttttctt cccaagatcg aaaatttact gaattaacaa 1620 tggtgagcaa gggcgaggag ctgttcaccg gggtggtgcc catcctggtc gagctggacg 1680 gcgacgtaaa cggccacaag ttcagcgtgt ccggcgaggg cgagggcgat gccacctacg 1740 gcaagctgac cctgaagttc atctgcacca ccggcaagct gcccgtgccc tggcccaccc 1800 tcgtgaccac cttgacctac ggcgtgcagt gcttcgcccg ctaccccgac cacatgaagc 1860 agcacgactt cttcaagtcc gccatgcccg aaggctacgt ccaggagcgc accatcttct 1920 tcaaggacga cggcaactac aagacccgcg ccgaggtgaa gttcgagggc gacaccctgg 1980 tgaaccgcat cgagctgaag ggcatcgact tcaaggagga cggcaacatc ctggggcaca 2040 agctggagta caactacaac agccacaagg tctatatcac cgccgacaag cagaagaacg 2100 gcatcaaggt gaacttcaag acccgccaca acatcgagga cggcagcgtg cagctcgccg 2160 accactacca gcagaacacc cccarcggcg acggccccgt gctgctgccc gacaaccact 2220 acctgagcac ccagtccgcc ctgagcaaag accccaacga gaagcgcgat cacatggtcc 2280 tgctggagtt cgtgaccgcc gccgggatca ctctcggcat ggacgagctg tacaagtaac 2340 tcgagaagct tgatccggct gcgaatttct tatgatttat gatttttatt attaaataag 2400 ttataaaaaa aataagtgta tacaaatttt aaagtgactc ttaggtttta aaacgaaaat 2460 tcttattctt gagtaactct ttcctgtagg tcaggttgct ttctcaggta tagcatgagg 2520 tcgctcttat tgaccacacc tctaccggca tgccgagcat gatgaacaat gggactacaa 2580 aatgaaataa agaaaaaata gaaatagaat agaagatcaa ttattaatcç ccctattctt 2640 ccttattacc tacacaaaat aaagcagcaa cataagaaac aaaaacaaaa tgaaaacaaa 2700 ccaaataaat ctatgtaagc atactcattt caatttgata ttcattactt gacttttttg 2760 tccttatttg aggctccata agcgcgccat tttcccctac tccctttttt cgtaaatagt 2820 aataatgtgc tgaaaagaac aatgaagtag ttatcataca tattccgtcg tgtcgatatg 2880 aggggaggtg tctctttctt tcatcccttg tcgcaacctc caatatataa gagcataagc 2940 aactgatctt actttagtaa ttaacttagc atacctggcc cgaaggaaga aaaaaaattc 3000 acctcaacaa catggttcct aagttttaca aactttcaaa cggcttcaaa atcccaagca 3060 ttgctttggg aacctaccgg tgtttaaacc ccagcgcctg gcggggatat tccaagatcg 3120 caaacagccg aaattgtgta tgaaggtgtc aagtgcggct accgtcattt cgatactgct 3180 página 87
107345_104_sequencê_Listing gttctttatg gtaatgagaa ggaagttggc gatggtatca ttaaatggtt gaacgaagat 3240 ccagggaacc ataaacgtga ggaaatcttc tacactacta aattatggaa ttcgcaaaac 3300 ggatataaaa gagctaaagc tgccattcag caatgtttga atgaagtctc gggcttgcaa 3360 tacatcgatc ttcttttgat tcattcgcca ctggaaggtt ctaaattaag gttggaaact 3420 tggcgcgcca tgcaagaagc ggttgatgaa ggattggtta agtctatagg ggtttccaac 3480 tatgggaaaa agcacattga tgaacttttg aactggccag aactgaagca caagccagtg 3540 gtcaaccaaa tcgagatatc accttggatt atgagacaag aattag 3586
<210> 59 <211> 4300 <212> DNA <213> Artif'iciaj Sequence
<220> <223> synthetic: ADE2_YjR030C donor cassette
<400> 59 ggaactttat gaacatatta agtctgcttg atgaaatgtc atgtgcaggt gccgttggca 60 caaaatggga acaaaattat gaaaattcag tcgaggatgg gtgtgaagca cctgaatcca 120 atccataccg ttctattatt gatctttcta gtcgttccat taatataact gcagacctac 180 tttcgactgt tgggaggagt aattcagcac tcaacaagaa tgagattata gctgctattc 240 aaggtctcgc ccatcaatgc ctcaatccct gtgacgaact aggtatgcaa gcattgcaag 300 cattagagaa cattctgtta tctcgagcaa gtcaactacg tacggaaaaa gttgcggtgg 360 ataacctact agagacagga ttattaccga tttttgagtt ggatgaaatc caagatgtca 420 agatgaaacg aattactagc attttatccg ttctttctaa aatgacggca cggccacgcg 480 tttaaaccgc ccttcttggg tcaacttgtg gaaggcgtaa caagtaacga aacttttttg 540 agagtgctta acgtatttaa caagtatgta gatgatccta cggtggaaag gcagttgcaa 600 gagttgatta tttctaagag ggaaatcgag aaggagtaga ccaacgataa tgtaactata 660 ccaagaaact tagtatgatg gaattttttc aaggagtcgt aaattagatt ttcgcaggta 720 ataatgcgat atataagcaa tctcatttaa atatcgacgg tggcatttat accatcattt 780 actgttatat ttatctaacg cgtcgcgacg cgttagataa aatacaacaa gatttttttt 840 tcgtgtcacc aatggcatga aagcttcgag aataatttga aggaaatttc acttaatggg 900 aaaaataaaa atgtaccctt atcgagatta ctcttttacc ctcagttcaa ttaaaattca 960 tcatgaacca agtaaaagtt cctctaatta cgaacgagca agcaaattag tattgtgtgg 1020 gagacgggtt cttgaataat acataacttt tcttaaaaga atcaaagaca gataaaattt 1080 aagagatatt aaatattagt gagaagccga gaattttgta acaccaacat aacactgaca 1140 página 88
107345_104_Sequence_Listing tctttaacaa cttttaatta tgatacattt cttacgtcat gattgattat tacagctatg 1200 ctgacaaatg actcttgttg catggctacg aaccgggtaa tactaagtga ttgactcttg 1260 ctgacctttt attaagaact aaatggacaa tattatggag catttcatgt ataaattggt 1320 gcgtaaaatc gttggatctc tcttctaagt acatcctact ataacaatca agaaaaacaa 1380 gaaaatcgga caaaacaatc aagtatggat tctagaacag ttggtatatt aggaggggga 1440 caattgggac gtatgattgt tgaggcagca aacaggctca acattaagac ggtaatacta 1500 gatgctgaaa attctcctgc caaacaaata agcaactcca atgaccacgt taatggctcc 1560 ttttccaatc ctcttgatat cgaaaaacta gctgaaaaat gtgatgtgct aacgattgag 1620 attgagcatg ttgatgttcc tacactaaag aatcttcaag taaaacatcc caaattaaaa 1680 atttaccctt ctccagaaac aatcagattg atacaagaca aatatattca aaaagagcat 1740 ttaatcaaaa atggtatagc agttacccaa agtgttcctg tggaacaagc cagtgagacg 1800 tccctattga atgttggaag agatttgggt tttccattcg tcttgaagtc gaggactttg 1860 gcatacgatg gaagaggtaa cttcgttgta aagaataagg aaatgattcc ggaagctttg 1920 gaagtactga aggatcgtcc tttgtacgcc gaaaaatggg caccatttac taaagaatta 1980 gcagtcatga ttgtgaggtc tgttaacggt ttagtgtttt cttacccaat tgtagagact 2040 atccacaagg acaatatttg tgacttatgt tatgcgcctg ctagagttcc ggactccgtt 2100 caacttaagg cgaagttgtt ggcagaaaat gcaatcaaat cttttcccgg ttgtggtata 2160 tttggtgtgg aaatgttcta tttagaaaca ggggaattgc ttattaacga aattgcccca 2220 aggcctcaca actctggaca ttataccatt gatgcttgcg tcacttctca atttgaagct 2280 catttgagat caatattgga tttgccaatg ccaaagaatt tcacatcttt ctccaccatt 2340 acaacgaacg ccattatgct aaatgttctt ggagacaaac atacaaaaga taaagagcta 2400 gaaacttgcg aaagagcatt ggcgactcca ggttcctcag tgtacttata tggaaaagag 2460 tctagaccta acagaaaagt aggtcacata aatattattg cctccagtat ggcggaatgt 7520 gaacaaaggc tgaactacat tacaggtaga actgatattc caatcaaaat ctctgtcgct 2580 caaaagttgg acttggaagc aatggtcaaa ccattggttg gaatcatcat gggatcagac 2640 tctgacttgc cggtaatgtc tgccgcatgt gcggttttaa aagattttgg cgttccattt 2700 gaagtgacaa tagtctctgc tcatagaact ccacatagga tgtcagcata tgctatttcc 2760 gcaagcaagc gtggaattaa aacaattatc gctggagctg gtggggctgc tcacttgcca 2820 ggtatggtgg ctgcaatgac accacttcct gtcatcggtg tgcccgtaaa aggttcttgt 2880 ctagatggag tagattcttt acattcaatt gtgcaaatgc ctagaggtgt tccagtagct 2940 accgtcgcta ttaataatag tacgaacgct gcgctgttgg ctgtcagact gcttggcgct 3000 tatgattcaa gttatacaac gaaaatggaa cagtttttat taaagcaaga agaagaagtt 3060 Página 89
107345_104_sequence_Ljsting cttgtcaaag cacaaaagtt agaaactgtc ggttacgaag cttatctaga aaacaagtaa 3120 tatataagtt tattgatata cttgtacagc aaataattat aaaatgatat acctattttt 3180 taggctttgt tatgattaca tcaaatgtgg acttcataca tagaaatcaa cgcttacagg 3240 tgtccttttt taagaatttc atacataaga tcatgttgag ataattgttg ggattccatt 3300 gttgataaag gctataatat taggtataca gaatatacta gaagttctcc tcgaggatat 3360 aggaatcctc aaaatggaat ctatatttct acatactaat attacgatta ttcctcattc 3420 cgttttatat gtttatattc attgatccta ttacattatc aatccttgcg tttcagcttc 3480 ctctaacttc gatgacagct tctcataact tatgtcatca tcttaacacc gtatatgata 3540 atatattgat aatataacta ttagttgata gacgatagtg gatttttatt ccaacatacc 3600 acccataatg taatagatct aatgaatcca tttgtttgtt aatagtttga atgtttttat 3660 cggaagaggt ttggtcatta cgtctgcaat attctttttg gtttcgatat agcatacgtg 3720 cagatgattt cctgatactt catctctcaa tctcattgct ttagtaccaa aaaatctgtt 3780 cctaaatttc cggtgtttaa accccagcgc ctggcgggtc ttcattattg gatataatta 3840 tactgattgt agatttactg tcggttagta atcctttggt aattggtttc ttgtcaagtt 3900 cttgtatcag gtaacttaga ttatttaata atgggacaga ttcacttatc gcgtgtattt 3960 ctgcttccgt agttgaagta catgttaatg aagccttggt ggactttcct ccaattacct 4020 ttccattaag taaatatatg ttgccaattt gtgatttata atacggttgg ttgccatacg 4080 aggcatcgct tataacaact aatttatttg ttggcttaac aggtttgctt ttgtgccata 4140 ttaattgctt atctctcgta ttccatatga actgtatcaa ttcatatgtc atatctaaca 4200 cttgcttgga cggaaatagt atatgttgtg caagtgtgtt gatgtagtat aataggtcaa 4260 atctaaattt atatccaaca tatgatgcta gacctatcag 4300
<210> 60 <211> 3586 <212> DNA <213> Artificiaj Sequence <220> <223> Synthetic: GFP_YjR030C donor cassette <400> 60 ggaactttat gaacatatta agtctgcttg atgaaatgtc atgtgcaggt gccgttggca 60 caaaatggga acaaaattat gaaaattcag tcgaggatgg gtgtgaagca cctgaatcca 120 atccataccg ttctattatt gatctttcta gtcgttccat taatataact gcagacctac 180 tttcgactgt tgggaggagt aattcagcac tcaacaagaa tgagattata gctgctattc 240 aaggtctcgc ccatcaatgc ctcaatccct gtgacgaact aggtatgcaa gcattgcaag 300 página 90
107345_l04_sequence_Listing cattagagaa cattctgtta tctcgagcaa gtcaactacg tacggaaaaa gttgcggtgg 360 ataacctact agagacagga ttattaccga tttttgagtt ggatgaaatc caagatgtca 420 agatgaaacg aattactagc attttatccg ttctttctaa aatgacggca cggccacgcg 480 tttaaaccgc ccttcttggg tcaacttgtg gaaggcgtaa caagtaacga aacttttttg 540 agagtgctta acgtatttaa caagtatgta gatgatccta cggtggaaag gcagttgcaa 600 gagttgatta tttctaagag ggaaatcgag aaggagtaga ccaacgataa tgtaactata 660 ccaagaaact tagtatgatg gaattttttc aaggagtcgt aaattagatt ttcgcaggta 720 ataatgcgat atataagcaa tctcatttaa atatcgacgg tggcatttat accatcattt 780 actgttatat ttatctaacg cgtcgcgacg cgttagataa aatacaacaa gatttttttt 840 tcgtgtcacc aatggcatga aagcttcgag aataatttga aggaaatttc acttaatggg 900 aaaaataaaa atgtaccctt atcgagatta ctcttttacc ctcagttcaa ttaaaattca 960 tcatgaacca agtaaaagtt cctctaatta cgaacgagca agcaaattag tattgtgtgg 1020 gagacgggac acaattacag taacaataac aagaggacag atactaccaa aatgtgtggg 1080 gaagcgggta agctgccaca gcaattaatg cacaacattt aacctacatt cttccttatc 1140 ggatcctcaa aacccttaaa aacatatgcc tcaccctaac atattttcca attaaccctc 1200 aatatttctc tgtcacccgg cctctatttt ccattttctt ctttacccgc cacgcgtttt 1260 tttctttcaa atttttttct tctttcttct ttttcttcca cgtcctcttg cataaataaa 1320 taaaccgttt tgaaaccaaa ctcgcctctc tctctccttt ttgaaatatt tttgggtttg 1380 tttgatcctt tccttcccaa tctctcttgt ttaatatata ttcatttata tcacgctctc 1440 tttttatctt cctttttttc ctctctcttg tattcttcct tcccctttct actcaaacca 1500 agaagaaaaa gaaaaggtca atctttgtta aagaatagga tcttctacta catcagcttt 1560 tagatttttc acgcttactg cttttttctt cccaagatcg aaaatttact gaattaacaa 1620 tggtgagcaa gggcgaggag ctgttcaccg gggtggtgcc catcctggtc gagctggacg 1680 gcgacgtaaa cggccacaag ttcagcgtgt ccggcgaggg cgagggcgat gccacctacg 1740 gcaagctgac cctgaagttc atctgcacca ccggcaagct gcccgtgccc tggcccaccc 1800 tcgtgaccac cttgacctac ggcgtgcagt gcttcgcccg ctaccccgac cacatgaagc 1860 agcacgactt cttcaagtcc gccatgcccg aaggctacgt ccaggagcgc accatcttct 1920 tcaaggacga cggcaactac aagacccgcg ccgaggtgaa gttcgagggc gacaccctgg 1980 tgaaccgcat cgagctgaag ggcatcgact tcaaggagga cggcaacatc ctggggcaca 2040 agctggagta caactacaac agccacaagg tctatatcac cgccgacaag cagaagaacg 2100 gcatcaaggt gaacttcaag acccgccaca acatcgagga cggcagcgtg cagctcgccg 2160 accactacca gcagaacacc cccatcggcg acggccccgt gctgctgccc gacaaccact 2220 página 91
Claims (1)
- REIVINDICAÇÕES1. Método para integrar urrta pluralidade de ácidos nucleicos exógenos em um genoma de célula hospedeira caracterízado pelo fato de que o método compreende: 5 (a) colocar uma célula hospedeira em contato com: (i] uma pluralidade de ácidos nucleicos exÓgenos, em que cada ácido nuclei-co exógeno (ES)x compreende uma primeira região de homologia (HR1)x e uma segunda regiào de homologia (HR2)x, em que (HR1)x e (HR2)x têm a capacidade lO de iniciar uma recombinação honióloga inediada por célula hospedeira de (Esjx em um sítio alvo (TS}x do di-to genoma de célula hospedeira; e (i-i) para cada dito sítio alvo (TS)x, uma nuclease {N)x tem a capacidade de clivagem em (TS)x, portanto, a dita clivagem resulta em recombinação homóloga de (ES)x em (Tsjx; e (b) recuperar uma célula hospedeira em que cada ácido nucleico exógeno selecionado (ES)x foi integrado em cada sequência alvo seleci-onada (Tslx, em que x é qualquer núrrtero de 1 a n ern que n é pelo menos 2.2. Método, de acordo com a reivindicação 1, earacterizado pelo fato de que (HR1)x é homóloga a uma região 5' de (TS)X, e (HR2)x é hontóloga a uma região 3' de (TS)X.3. Método, de acordo com a reivindicação 1, earacterízado pelo fato de que {N)x tem a capacidade de clivagem em uma região posicíonada entre as ditas regiões 5' e 3' de (TS)x.4. Método, de acordo com a reivindicação I, caracterízado pelo fato de que uma única nuclease tem a capacidade de clivar cada (Tslx.5. Método, de acordo com a reivindicação 1, 5 earaeterizado pelo fato de que n 3, 4, 5, 6, 7, 8, 9 ou lO.6. Método, de acordo com a reivindicação 1, earacterízado pelo fato de que a dita recuperação não requer a integração de um marcadôr selecionável.7. Método, de acordo com a reivindicação 1, earaeterizado pelo fato de que a dita recuperação ocorre em uma frequência superior em comparaçào a não colocar a célula hospedeira ern contato com urna nuclease que tern a capacidade de clivagem no dito sítio alvo.8. Método, de acordo com a reivindicação 1, earacterizado pelo fato de que a dita recuperação ocorre em uma frequência de cerca de urna vez a cada 10, 9, 8, 7, 6, 5, 4, 3 ou 2 células hospedeiras colocadas em contato, ou populações clonais das mesraas, triadas.9. Método, de acordo com a reivtndicação 1, earaQterizado pelo fato de que a dita recuperação compreende identtR-car as ditas integrações por pelo menos um método selecionado a parttr do grupo que consiste em PCR, Southern blot, mapeamento de restrição e sequenciamento de DNA.10. Método, de acordo com a reivindicação 1, caracterízado pelo fato de que (N)x tem a capacidade de clivar uma sequência genômica endógena dentro de (TS)x.11. Método, de acordo com a reivi-ndicação 1, caracterizado pelo fato de que {N)x tem a capaciAade de clivar uma sequênci-a exógena dentro de {TS)x.12. Métodci, de acordo com a reivindicação 11, 5 caraeterízado pelo fato de que a sequência exógena é urrta sequência de reconhecimento para uma endonuclease homing.13. Método, de acordo coin a reivindicação 12, caracterizado pelo fato de que a endonuclease homíng é F- cphl.14. Método, de acordo com a reivindicação 1, caracterízado pelo fato de que (ES)x compreende adicionalmente um ácido nucleico de interesse (D)x posicionado em 3' de (HR1)x e 5' de (HR2)x.15. Método, de acordo com a reivindicação 14, caraeterizado pelo fato de que (D)x é selecionado a partir do grupo que consiste em urrt marcador selecionável, um promotor, uma sequênci-a de ácidos nucleicos que codifica uma etiqueta de epítopo, um gene de interesse, um gene repórter e uma sequência de ácidos nucleicos que codifica um códon de terminação.16. Método, de acordo com a reivindicação I, earaeterizado pelo fato de que (ES)x é linear.17. Método, de acordo com a reivindicaçào 1, earaeterizado pelo fato de que a célula hospedeira compreende uma ou mais sequências de nucleotídeos heterólogos que codificarn uma ou ruais enzimas de uma via biossi-ntética.18. Método, de acordo cojn a reivtndicação 17, caraeterizado pelo fato de que as uma ou mais sequências de nucleotídeos heterÓlogos que codificam uma ou mais enzimas de uma via biossintética são integradas genomicamente.19. Método, de acordo com a reivindicação I, caracterízado pelo fato de que cada dito ácido nucleico 5 exógeno {ES)x compreende um ácido nucleico de interesse {D):x posicionado em 3' de (HR1)x e 5' de (HR2}x, que codifica uma enzima de uma via biossintética.20. Método, de acordo com a reivindicação 19, caracterizado pelo fato de que (Djx é um membro de uma lO bíblioteca (L)x que compreende uma pluralídade de moléculas de ácido nucleico que codifica variantes de uma enzima de urrta via biossintética.21. Método, de acordo com a reivindicação 1, earacterizado pelo fato de que a célula hospedeira compreende uma ou raai3 sequências de nucleotídeos heterólogos que codificam urrta ou mais enzimas de uma via de mevalonato (MEV) para produzir pirofosfato de isopentenila.22. Método, de acordo com a reivindicação 21, caracterízado pelo fato de que as uma ou mais enzimas da via de rnevalonato são selecionadas a partir de acetil-CoPi tiolase, HMG-CoA sintase, HMG-COA redutase, rnevalonato quinase, fosfomevalonato quinase e mevalonato pirofosfato decarboxilase.23. Método, de acordo com a reivindicação 21, caracterízado pelo fato de que a célula hospedeira compreende uina pluralidade de ácido nucletcos heterólogos que codificam cada uma das enzimas de uma via de MEV.24. Método, de acordo com a reivindicação 21, caracterízado pelo fato de que cada dito ácido nucleico exógeno (ES)x compreende um ácido nucleico de interesse{D)x posicionado em 3' de (HR1)x e 5' de (HR2)x, que codifica uma terpeno sintase.25. Método, de acordo com a reivindicação 24, earaeterizado pelo fato de que a terpeno sinta3e é 5 selecionada a partir do grupo que consiste em uma monoterpeno sintase, uma diterpeno sintase, uma sesquiterpeno sintase, uma sesterterpeno sintase, uma tri-terpeno sintase, uma tetrat-erpeno sintase e uma politerpeno sintase.26. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que (Nlx é fornecida como um vetor de expressão que compreende uma sequência de ácidQ3 nucleicos que codífica {N)x.27. Método, de acordo com a reivindicação 1, earacterizado pelo fato de que (N)x é transformada na célula hospedeira como uma proteína purificada.28. Método, de acordo com a reivindicação 1, caraeterízado pelo fato de que (N)x é 3elecionada a partir do çrupo que consiste em ujna endonuclease, uma nuclease de dedo de zinco, uma proteína de fusão de nuclease de domínio de ligação de DNA efetuador de TAL (TALEN), urría transposase e uma recombinase especifica por sitio.29. Método, de acordo com a reivindicação 28, earacterízado pelo fato de que a nuclease de dedo de zinco é uma proteína de fusão que compreende o domínio de clivagem de uma endonuclease de restrição TypellS fundida a um dorrtínio de ligação de dedo de zinco rnodificado.30. Método, de acordo corri a reivindicação 29, caracterízado pelo fato de que a endonuclease de restriçàoTypellS é selecionada a partir do grupo que consiste em endonuclease HO e endonuclease Fok I.31. Método, de acordo com a reivindicação 29, earacterízado pelo fato de que o domínio de Iigação de dedo 5 de zinco compreende 3, 5 ou 6 dedos de zinco.32. Método, de acordo com a reivindicação 30, earaeterízado pelo fato de que a endonuclease é uma endonuclease homing selecionada a partír do grupo que consiste em: uma endonuclease homing LAGLIDADG, uma 10 endonuclease homing HNH, uma endonuclease homíng His-Cys box, uma endonuclease homing GIY-YIG, e uma endonuclease homing cianobacteriana.33. Método, de acordo com a reivindícação 30, earacterízado pelo fato de que a endonuclease é _s_e_l_e-c-í-o.n-a-d-a 15 a partir do grupo que consiste em: H-Drel, I-Scel, I-Scell, I-Scelll, I-ScelV, I-SceV, I-SceVl, I-SceVll, I-Ceul, I- "« CeuAIIP, I-Crel, I-CrepsblP, I-CrepsbllP, I-CrepsblllP, I- .- CrepsblVP, I-T11I, I-PpoI, Pi-Pspl, F-Scel, F-Scell, F- Suvl, F-Cphl, F-Tevl, F-TevII, 1-Amal, 1-Anil, I-Chul, 1- 20 Cmoel, I-Cpal, I-Cpall, I Csml, I Cvul, I CvuAIP, I Ddíl, 1-Ddill, 1-Dirl, 1-Dmol, 1-Hmul, 1-HmuII, I-HSNIP, 1-Llal, I-MSOI, 1-Naal, 1-Nanl, I-NCIIP, 1-NgrlP, 1-Nitl, 1-Njal, I-Nsp236IP, I-Pakl, I-PbolP, I-PculP, I-PcuAI, I-PcuVl, I- PgrlP, I-PoblP, I-Porl, I-Porllp, I-PbplP, 1-SpBetalP, 1- 25 Scal, I-SexlP, I-SnelP, I-Spoml, I-SpomCP, I-SpomlP, I- SpomllP, I-SqulP, I-Ssp68031, I-SthPhíjp, I-SthphiST3P, i- SthPhíSTe3bp, 1-TdelP, 1-Tevl, 1-Tevll, I-TevIII, i-UarAP, i-UarHGPAIP, I-UarHGPA13P, I-VinlP, I-ZbilP, P1-Mgal, PI- Mtul, PI-MtuHIP PI-MtuHIIP, PI-Pful, PI-Pfull, PI-Pkol, PI-PKOII, P1-Rma43812lp, P1-SpBetalp, PI-Scel, P1-Tful, PI- Tfull, P1-Thyl, P1-Tlil, ou PI-T11II.34. Método, de acordo com a reivindícaçào 28, earaeterízado pelo fato de que a endonuclease é modificada 5 para Iigar especificamente uma sequência genômica endógena, em que a endonuclease modificada não se liga mais à sua sequência de reconhecimento de endonuclease do tipo selvagem.35. Método, de acordo com a reivindicação 34, 10 caracterízado pelo fato de que a endonuclease modificada é derivada de uma endonuclease homing selecionada a partir do grupo que consiste em: uma endonuclease homing LAGLIDADG, uma endonuclease homing HNH, uma endonuclease homing His- Cys box, uma endonucíease homing GIY-YIG e uma endonuclease 15 homing cianobacteriana." 0.36. Método, de acordo com a reivindicação 34, . earaeterízado pelo fato de que a endonuclease modifícada é % derivada a partir de uma endonuclease selecionada a partir do grupo que consiste em: H-Drel, I-Scel, I-Scell, 1- 20 Scelll, I-ScelV, I-SceV, I-SceVl, I-SceVll, I-Ceul, I- CeuZ\l1P, I-Crel, I-CrepsblP, I-CrepsbllP, I-CrepsblllP, I- CrepsblVP, 1-Tlil, I-PpoI, Pi-Pspl, F-Scel, F-Scell, F- Suvl, F-Cphl, F-Tevl, F-TevII, 1-Amal, 1-Anil, I-Chul, I- Cmoel, I-Cpal, I-Cpall, I-Csml, I-Cvul, I-CvuAIP, 1-Ddil, 25 1-Ddill, 1-Dirl, 1-Dmol, 1-Hmul, 1-Hmull, I-HSNIP, 1-Llal, I-MSOI, 1-Naal, 1-Nanl, I-NcIIP, 1-NgrlP, 1-Nitl, 1-Njal, I-Nsp236IP, I-Pakl, I-PbolP, I-PculP, I-PcuAI, I-PcuVl, I- PgrlP, I-PoblP, I-Porl, I-PorllP, I-PbplP, 1-SpBetalp, I- Scal, I-SexlP, I-SnelP, I-Spoml, I-SpomCP, I-SpomlP, 1- 30 SpomllP, I-SqulP, I-Ssp68031, I-SthPhijp, I-SthPhíST3P, I-SthPhiSTe3bP, 1-TdelP, I-TCVI, 1-Tevll, I-TevIII, i-UarAP, i-UarHGPAIP, I-UarHGPA13P, I-VinlP, I-ZbilP, P1-Mgal, PI- Mtul, PI-MtuHIP PI-MtuHIIP, PI-Pful, PI-Pfull, PI-Pkol, PI- PKoII, P1-Rma43812lP, P1-SpBetalP, PI-Scel, P1-Tful, PI- 5 Tfull, P1-Thyl, P1-Tlil, ou PI-Tli-II.37. Método, de acordo cora a reivindicação 1, earaeterizado pelo fato de que a célula hospedeira é selecionada a partir do grupo que consiste em uma célula fúngica, uma célula bacteriana, uma célula vegetal e uma célula animal.38. Método, de acordo com a reivindicação 1, earaeterizado pelo fato de que a célula hospedeira é uma célula de levedura.39. Método, de acordo com a reivindicação 38, earaeterízado pelo fato de que a célula de levedura é uma célula de Saccharomyces cerevisiae.40. Método, de acordo com a reivindicação 39, caraeterizado pelo fato de que a célula de Saccharomyces cerevisiae é cepa de levedura da Baker, Mauri, Santa Fe, IZ 1904, TA, BG-l, CR-l, SA-l, M-26, Y-904, PE-2, PE-5, VR- l, BR-I, BR-2, ME-2, VR-2, MA-3, MA-4, CAT-I, CB-l, NR-I, BT-I ou AL-I.41. Célula hospedeira caracterízada pelo fato de que é gerada pelo rnétodo, conforme definido na reivindicação 1.42. Célula hospedeira caracterizada pelo fato de que compreende: (a) '.ima pluralidade de ácidos nucleicos exógenos, em que cada áci-do nucleico exógeno (ES)x compreende urrta primeira região de homologia {HR1)x e uma segunda região de hcünologia (HR2jx, em que {HR1)x e (HR2)X têm a capacidade de iniciar uma recombinaçáo homÓloga mediada por célula hospedeira de {Eslx em um SLtio alvo (Tsjx do dito genoma de célula hospedetra; e 5 (bl para cada dito sítio alvo (TS)X, uma nuclease (N)x que tem a capacidade de clivagem em (TS)X, portanto, a dita clivagern resulta na recombinação homóloga de (Esjx errt (Tslx: em que x é qualquer número inteiro de 1 a n caracterizado pelo fato de que n é pelo menos 2.43. Célula hospedeira, de acordo coin a reivindicação 42, caraeterizada pelo fato de que (HR1}x é homóloga a uma região 5' de {TS)x, e {HR2)x é homólogo a urrta região 3' de (TS)x.44. Célula hospedeira, de acordo com a reívindicação 33, caracterizada pelo fato de que (N)x tem a capacídade de clivagern em uma região posicionada entre as ditas regiões 5' e 3' de (TS)x.45. Célula ho3pedeira, de acordo com a reivindicação 42, caracterízada pelo fato de que a única nuclease tem a capacidade de clivar cada (TS)x-46. Célula hospedeira, de acordo com a reívindicação 42, caracterízada pelo fato de que n— 3, Ei, 5, 6, 7, 8, 9 ou 10.47. Célula hospedeira, de acordo com a reivindicação 42, earacterízada pelo fato de que (N}x tem a capacidade de clivar uma sequêncta genômica endógena dentro de (TS)X.48. Célula hospedeira, de acordo com a reivindicação 42, caraeterízada pelo fato de que (N}x tem a capacidade de clivar uma sequência exógena dentro de (TS)x, em que x é 1 ou qualquer número inteiro de 1 a n.49. Célula hospedeira, de acordo corn a reivindicação 42, earacterizada pelo fato de que a 5 sequência exógena é uma sequência de reconhecimento para uma endonucleàse homing.50. Célula hospedeira, de acordo com a reivindicação 42, earacterizada pelo fato de que a endonuclease F.omi-ng é F-cphl.51. Célula hospedeira, de acordo com a reivindicação 42, caracterizada pelo fato de que (ES)X compi:eende adicionalmente um ácido nucleico de interesse (D)x posicionado em 3' de {HR1)X e 5' de (HR2)x.52. Célula hospedeira, de acordo com a reivindicação 51, caraeterizada pelo fato de que (D)x é selecionado a partir do grupo que consiste em um marcador selecionável, urrt promotot, uma sequência de ácidos nucieiccg que codifica uma etiqueta de epítopo, um gene de interesse, um gene repórter e uma sequência de ácidos nucleicos que codifica um códon de terrüinação.53. Célula hospedeira, de acordo coru a reivindicação 42, caracterizada pelo fato de que (ES)X é Iínear.54. Célula hospedeira, de acordo corn a reivindicação 42, caracterízada pelo fato de que a célula hospedeira compreende uma ou mais sequências de nucleotideos heterólogos que codificam uma ou rriais enzimas de uma via biossintética.55. Célula hospedeira, de acordo corn a reivindicação 54, caracterizada p€lD fato de que a uma ou mais sequências de nucleotídeos heterólogos que codificam urría ou mais enzimas de uma via biossintética sÊio integrados genomicamente.56. Célula hospedeira, de acordo com a 5 reivindicação 42, earaeterizada pelo fato de que cada dito ácido nuclei-co exógeno (Eslx compreende um ácido nucleico de interesse (D)x posi-cíonado eni 3' de (HR1)X e 5' de (HR2)x, que codifica uma enziina de uma via biossintética.57. Célula ho3pedeira, de acordo corn a reivindicação 56, earaeterizada pelo fato de que (Dlx é um membro de uma biblioteca {L)x que compreende uma pluralidade de moléculas de ácidci nucleico que codifica variantes de uina enzima de uma via biossintética.58. Célula hospedeira, de acordo com a i5 reivindicaçào 42, caracterizada pelo fato de que a célula hospedeira compreende uma ou mats sequências de nucleotídeos heterólogos que codificam uma ou mais enzimas de uru via de mevalonato {MEV) para produzir pirofosfato de isopenteni-la.59. Célula hospedeira, de acordo com a reivindicação 58, Qaracterízada pelo fato de que â3 uma ou mais enzimas da via de mevalonato são selecionadas a partir de acetiúL-CoA tiolase, HMG-CoA sintase, HMG-COA redutà3c, mevalonato quinase, fosfomevalonato quinase e mevalonato pirofosfato decarboxilase.60. Célula hospedeira, de acordo com a reivindicação 58, earaeterizada pelo fato de que a célula hospedeira coinpreende uma pluralidade de ácidos nucleicos heterÓlogos que codiftcam cada uma das enzimas de uma via de MEV.61. Célula hospedeira, de acordo com a reivindicação 58, caracterízada pelo fato de que cada dito ácido nucleico exógeno {Eslx cornpreende um ácj-cío nucleico de interesse (D)x posicionado en 3' de (HR1}x e 5' de 5 (HR2)x, que codifica uma terpeno sintase.62. Célula hospedeira, de acordo com a reivindicação 61, earaeterizada pelo fato de que a terpeno sintase é selecionada a partir do grupo que consiste em uma rnonoterpeno sintase, uma diterpeno s:i-ntase, uma sesquiterpeno sintase, uma sesterterpeno sintase, uma triterpeno si-ntase, uma tetraterpeno si-ntase e uma politerpeno sintase.63. Célula hospedeira, de acordo com a reivíndicação 42, earacterizada pelo fato de que (N)x é fornecida como um vetor de expressão que compreende uma sequência de ácidos nucleicos gue codifi-ca (Nlx.64. Célula hospedeira, de acordo com a reivindicação 42, caracterízada pelo fato de que (N)x é transformada na célula hospedeira corno uma proteína purificada.65. Célula hospedeira, de acordo com a reivindicação 42, earacterizada pelo fato de que (N)x é transformada na céluía hccspedeíca gouíc) ljill RNA puzíficado.66. Célula hospedeira, de acordo com a LeivLndicação 42, caracterízada pelo fato de que (N)x é selecionada a parti-r do grupo que consiste em uma endonuclease, uma nuclease de dedo de zinco, uma proteína de fus:ão de domínio de ligaçào de DNA efetuador de TAL (TALEN), urna tran3posa5e e uma recombinase específica por sítio.67. Célula hospedeira, de acordo com a reivindicação 66, caraeterizada pelo fato de que a nuclease de dedo de zinco é uma proteína cle fusão que compreende o domínio de clivagem de uina endonuclease de restrição 5 TypellS fundida a um domínio de ligação de dedo de zinco modificado.68. Célula hospedeira, de acordo com a reivindícação 67, earaeterizada pelo fato de que a endonuclease cie restrição TypellS é selecionada a partir do grupo que consi-ste em endonuclease HO e endonuclease Fok I.69. Célula hospedeira, de acordo com a reivindicaçáo 67, caracterizada pelo fato de que o domínio de ligaçào de dedo de zinco compreende 3, 5 cjü 6 dedos de zinco.70. Célula hospedeira, de acordo corrt a reivi-ndicação 66, earaeterizada pelo fato de que a endonuclease é uma endonuclease hoining selecionada a partir do grupo que consiste ein: uma endonuclease homing LAGLIDADG, uma endonuclease homing HNH, uma endonuclease homing His-Cys box, uma endonuclease homi-ng GIY-YIG e uma endonuclease homing cianobacteriana.71. Célula hospedeira, de acordo com a reivindicação 66, caracterízada pelo fato de que a endonuclease é selecionada a partir do grupo que consiste em: H-Orel, I-Scel, I-Scell, I-SceIII, I-Scelv, I-SceV, I- SceVl, I-SceVll, I-Ceul, I-CeuAIIP, I-Crel, I-CrepsblP, I- Crep3bIIP, I-CrepsblllP, I-CrepsblVP, l-Tli-I, I-PpoI, Pi- PspI, F-Scel, F-Scell, F-Suvl, F-Cphl, F-Tevl, F-Tevll, I- Amal, 1-Anil, I-Chul, I-Cmoel, I-Cpal, I-Cpall, I-Csrnl, I- Cvul, I-CvuAIP, I-Odil, I-OdiII, I-Dí-rl, I-Omol, 1-Hmul, I-Hmull, I-HSNIP, I-ljlal, I-MSOI, 1-Naal, 1-Nanl, I-NCIIP, I- NgrlP, 1-Nitl, 1-Njal, I-Nsp236IP, I-Pakl, I-PbolP, I- PculP, I-PcuAI, I-PcuVl, I-PgrlP, I-Poblp, I-Porl, I- PorllP, I-PbplP, I-Sp8etalP, I-Scal, I-SexlP, I-SnelP, I- 5 Sporrtl, I-SporrtCP, I-SpomlP, I-SpomílP, I-SqulP, I-SSp68031, I-SthphijP, I-SthphiST3P, I-SthPhiSTe3bp, 1-TdelP, 1-Tevl, 1-Tevll, I-TevIII, i-UarAP, i-CjatHGPAIP, I-UarHGPA13P, I- VinlP, I-ZbilP, P1-Mgal, P1-Mtul, PI-MtuHIP PI-MtuHITP, PI- E'ful, PI-Pfull, PI-Pkol, PI-PKoII, P1-Rma43812lP, PI- lO SpBetalP, PI-Scel, P1-Tful, P1-Tfull, P1-Thyl, P1-Tlil, ou P1-Tlill.72. Célula hospedeira, de acordo com a reivindicação 66, earacterízada pelo fato de que a endonuclease é modificada para ligar especificamente uma sequência genômica de célula hospedeira endógena, errt que a endonuclease rríodificada não se liga rnais à sua sequência de reconhecimento de endonuclease do tipo selvagem.73. Célula hospedeira, de acordo com a reivindicação 72, caracterizada pelo fato de que a endonuclease modificada é derivada de uma endonuclease homing selecionada a part:i-r do grupo que consiste em: uma endonuclease homing LAGLIDADG, uina endonuclease homing HNH, uma endonuclease homing His Cy3 box, uma endonuclease homing GIY-YIG e uma endonuclease hcming cianobacteriana.74. Célula hospedeira, de acordo com a reivindicação 72, earacterízada pelo fato de que a endonuclease modl-fLcada é derivada de uma endonucíease selecionada a partir do grupo que consiste em: H-Orel, I- Scel, I-Scell, I-Scelll, I-ScelV, I-SceV, I-SceVl, 1- SceVll, I-Ceul, I-CeuAIIP, I-Crel, I-CrepsblP, I-Crep3bIIP,I-CrepsblllP, I-CrepsblVP, 1-Tlil, I-PpoI, Pi-Pspl, F-Scel, F-Scell, F-Suvl, F-Cphl, F-Tevl, F-'l'evll, 1-Amal, 1-Anil, I-Chul, I-Cmoel, I-Cpal, I-Cpall, I-Csml, I-Cvul, I-Cvu/ilp, 1-Ddil, 1-Ddill, I-Oirl, I-Omol, 1-Hmul, 1-Hmull, I-HSNIP, 5 1-Llal, I-MsoI, 1-Naal, 1-Nanl, T-NcIIP, 1-NgrlP, 1-Nitl, 1-Njal, I-Nsp236IP, I-Pakl, I-PbolP, I-PculP, I-PcuAI, I- Pcuvl, I-PgrlP, I-PoblP, I-Porl, I-PorllP, I-PbplP, I- SpBetalP, I-Scal, I-SexlP, I-SnelP, I-Spoml, I-SpomCP, I- SpomlP, I-SpomllP, I-SqulP, í-Ssp6803i, I-Sthphijp, I- lO SthphisT3P, I-SthPhiSTe3bP, 1-TdelP, 1-Tevl, 1-Tevll, I- Tevlll, i-ljarAP, i-UarHGPAIP, 1-UarHGPA13P, I-VinlP, I- ZbilP, P1-Mgaí, P1-Mtul, PI-MtuHIP PI-MtuHIIP, E'l-Pful, PI- Pfull, PI-Pkol, E'I-PKOII, P1-Rna43812lP, PI-Sp8etalP, PI- Scel, P1-Tful, P1-Tfull, P1-Thyl, P1-Tlil, ou PI-TI1II.75. Célula hospedeira, de acordo com a reivindicação 42, earacterizada pelo fato de que a célula hospedeira é selecionada a partir do grupo que consiste errí urrta célula fúngica, a célula bacteriana, a célula vegetal e uma célula animal.76. Célula hospedei-ra, de acordo com a reivindLcação 42, caracterízada pelo fato de que a célula hospedeira é uma célula de levedura.77- Célula de Ievedura, conforrne definida na reivimdicação 76, caraeterízada pelo fato de que a célula de Ievedura é uma célula de Saccharomyces cerevisiae.78. Célula de levedura, de acordo com a reivindicação 77, caracterizada pelo fato de que a célula de Saccharomyces cerevisí-ae é da cepa de levedura da Baker, Mauri, Santa Fe, IZ 1904, TA, BG-l, CR-l, SA-l, M-26, Y-904, PE-2, PE-5, VR-l, BR-I, BR-2, ME-2, VR-2, MA-3, MA-4, CAT-I, CB-l, NR-I, BT-I ou AL-I.79. Kit earaeterizado pelo fato de que compreende: 5 {a) uma pluralidade de ácidos nucleicos exógenos, em que cada ácido nucleico exógeno (Eslx corrtpreende: (b) uma primeira região de hornologia {HR1)X e uma segunda região de homologia (HR2)x, em que (HR1)X e (HR2)X têrn a capacidade de iniciar uma recornbinação homóloga rnediada por célula hospedeira de {ES)x em um síticj alvo selecionado (Tsjx de uma célula de levedura genoma; e lit} um ácído nucleico de interesse (Dlx posicionado em 3' de (HR1)x e 5' de (HR2)x; (b) uma pluralidade de nucleases, em que cada nuclease (N)x tem a capacidade de clivagern em (TS}x, portanto, resulta na recombinação homóloga de (ES)x ern {TS)X; em que x é qualquer número inteiro de 1 a n caracterizado pelo fatci de que n é pelo menos 2.80. Kit, de acordo com a reivindicação 79, caracterízado pelo fato de que compreende adicionalmente urria pluralidade de pares de iniciador {P)x, em que cada par de iniciador tem a capacidade de identificar a integração de (ES)x em {Tslx por PCR.81. Kit, de acordo com a reivíndícação 79, caracterízado pelo fato de que (HR1}x é homóloga a uma região 5' de (Tslx, e (HR2}x é homólogo a uma regi-ão 3' de (TS)x.82. Ki-t, de acordo com a reivindicação 79, caracterízado pelo fato de que {N)x tem a capacidade de cLivagem em uma região posicionada entre as ditas regiões 5' e 3' de (TS)x.83. Kit, de acordo com a reivindicação 79, caracterízado pelo fato de que n= 26000, em que cada (TS)x 5 é uma região cio genorua de célula de levedura.84. Kit, de acordo corrt a reivindicação 79, caraeterízado pelo fato de que (Nlx tem a capacidade de clivar uma sequência genômica de levedura endógena dentro de (TS)x.85. Ki-t, de acordo com a reívindicação 79, earacterizado pelo fato de que (N)x tem a capacidade de clivar uma sequência exógena dentro de ITSIx.86. Kit, de acordo com a reivindicação 79, caraeterizado pelo fato de que (Eslx compreende adicionalmente um ácido nucleico de interesse (D)x posicionado em 3' de (HR1)x e 5' de {HR2)x.87. Kit, de acordo com a reivindicação 86, caracterízado pelo fato de que (D)x é selecionado a partir do grupo que consiste em um marcador selecionável, um promotor, uma sequência de áctdos nucleicos que codifica uma etiqueta de epitopo, um gene de interesse, um gene repórter e uma sequência de ácidos nucleicos que codifica um códon de terminação.88. Kit, de acordo com a reivindicação 79, caracterízado pelo fato de que (ÉSíx é linear.89. Kit, de acordo coin a reivindicação 79, caracterízado pelo fato de que (ES)x é circular.90. Kit, de acorcio coin a rei-vindicação 79, earacterizado pelo fato de que (N)x é fornecida como um vetor de expressão que compreende a sequênci-a de ácidos nucleicos que codifica (N)x.91. Kít, de acordo com a reivindicação 79, caracterízado pelo fato de que In)x é fornecida como 5 proteina purificada.92. Kit, de acordo com a reivindicação 79, caracterízado pelo fato de que (N)x é selecionada a partir do grupo que consiste em uma endonuclea3e, uma nuclease de dedo de zinco, uma proteína de fusão de domínio de ligação de DNA efetuador de TAL (TALEN), uma transposase e urria recombinase específica por sítio.93. Kit, de acordo com a reivindicação 92, caracterizado pelo fato de que a nuclease de dedo de zinco é urria proteína de fusão que compreende o dorríínio de clivagem de urr,a endonucieàse de restrição TypellS fundida a um domínío de ligação de dedo de zinco modificado.94. Kit, de acordo com a reivindicação 93, caracterizado pelo fato de que a endonuclease de restrição TypellS é selecionada a partir do grupo que consiste em endonuclease HO e endonuclease Fok I.95. Kit, de acordo com a reivindicaçào 93, caracterizado pelo fato de que o domínio de ligação de dedo de )nco compreende 3, 5 Oll 6 dedo.s de zinco.96. Kit, de acordo com a reivindicação 92, earacterízado pelo Eato de que a endonuclease é uma endonuclease homing selecionada a partir do grupo que consiste em: uma endonuclease homing LAGLIDADG, uma endonuclease homing HNH, uma endonuclease homing His-Cys bcix, uma endonuciease homing GIY-YIG e uma endonuclease homing cianobacteriana.97. Kit, de acordo com a reivindicação 92, caracterízado pelo fato de que a endonuclease é selecionada a partir do grupo que consiste em: H-Orel, I-Scel, I-Scell, I-Scelll, I-Scelv, I-Scev, I-Scevl, I-SceVll, I-Ceul, I- 5 CeuAIIP, I-Crel, I-CrepsblP, I-CrepsbllP, I-CrepsbIIIP, I- CrepsblVP, 1-Tlil, I-PpoI, Pi-Pspl, F-Scel, F-Scell, F- Suvl, F-Cphl, F-Tevl, F-TevII, 1-Amal, 1-Anil, I-Chul, I- Cmoel, I-Cpal, I-Cpall, I-Csml, I-Cvul, I-CvuAIP, I-Odil, I-DdiII, I-Oirl, I-Omol, 1-Hmul, [-Hrnull, I-HSNIP, 1-Llal, iO I-MSOI, 1-Naal, 1-Nanl, I-NcIIP, 1-NgrlP, 1-Nitl, 1-Njal, I-Nsp236IP, I-Pakl, I-PbolP, I-PculP, I-PCüAI, I-PcuVl, I- PgrlP, I-PoblP, I-Porl, I-PorllP, I-PbplP, I-Sp8etalP, I- Scal, I-sexlp, I-Snelp, I-Spoml, I-SpomCP, I-SpornlP, I- SpomllP, I-SqulP, I-Ssp68031, I-SthPhijP, I-SthPhiST3P, I- SthPhiSTe3bP, 1-TdeíP, 1-Tevl, 1-Tevll, I-TevIII, i-UarAP, i--UarHGPAIP, I-UarHGPA13P, I-VinlP, I-ZbilP, P1-Mgal, PI- Mtuí, PI-MtuHIE' PI-MtuHIIP, PI-Pful, PI-Pfull, PI-Pkol, PI- PKOII, P1-Rma43812lP, P1-SpBetalP, PI-Scel, P1-Tful, PI- Tfull, P1-Thyl, P1-Tlil, ou PI-TI1II.98. Kit, de acordo com a reivindicação 92, caraeterízado pelo fato de que a endonuclea3e é inodificada para ligar especificamente uma sequência genômica de levedura endógena, em que a endonuclease modificada não se liga mais à sua sequência de reconhecimento de endonuclease do tipo selvagem.99. Kit, de acordo com a reivindicação 98, earaeterizado pelo fato de que a endonuclease modificada é derivada de uma endonuclease homing selecionada a partir do grupo que consiste ein: uma endonuclease homing LAGLIDADG, uma endonuclease homing HNH, uma endonuclease homing His-Cys box, uma endonuclease homing GIY-YIG e uma endonuclease horning cianobacteriana.lCiO. Kit, de acordo com a reivindicação 99, caraeterizado pelo fato de que a endonuclease modificada é 5 derivada a partir de uraa endonuclease selecionada a partir do grupo que consíste erri: H-Orel, I-Scel, I-Scell, I- Scelll, I-ScelV, I-SceV, I-SceVl, I-Scevll, I-Ceuí, I- CeuAIIP, I-Crel, I-CrepsblP, I-CrepsbllP, I-CrepsblílP, I- CrepsblVP, 1-Tlil, I-E'poI, Pi-Pspl, F-Scel, F-Scell, F- lO Suvl, F-Cphl, F-Tevl, F-Tevll, 1-Amal, 1-Anil, I-Chul, I- Cmoel, I-Cpal, I-Cpall, I-Csml, I-Cvul, I-CvuAIP, 1-Ddil, 1-Ddill, I-Oirl, I-Orrtol, 1-Hmul, 1-HmuII, I-HSNIP, 1-Llal, I-MSOI, 1-Naaí, 1-Nanl, I-NcIIP, 1-NgrlP, 1-Nitl, 1-Njal, I-Nsp236IP, I-Pakl, I-PbolP, I-PculP, I-PcuAI, I-PcuVí, 1- PgrlP, I-PoblP, I-Porl, I-PorllP, I-PbplP, I-Sp8etalP, I- Scal, I-SexlP, I-SnelP, I-Spoml, I-SpomCP, I-SpomlP, I- SpomllP, I-SqulP, I-Ssp68031, I-SthPhijP, I-SthPhiST3E', I- SthPhiSTe3bP, 1-TdelP, 1-Tevl, 1-Tevll, I-TevIII, I-UarAP, I-UarHGPAIP, I-UarHGPA13P, I-VinlP, I-Zbilp, P1-Mgal, PI- Mtul, PI-MtuHIP PI-MtuHIIP, PI-Pfuí, PI-Pfull, PI-Pkol, PI- PKOII, P1-Rma43812lP, PI-Sp8etalP, PI-Scel, P1-Tful, PI- Tfull, P1-Thyl, P1-Tlil, ou PI-TI1II.101. Método para integração sem marcação de um ácido nuclei-co exógeno em um sítio alvo de um genoma de célula de levedura caraeterízado pelo fato de que o método cornpreende: {a) colocar uma célula de levedura em contato com : (i) um ácido nucleico exógeno (ES)1 que compreende uma prirneira região de homologia {HR1)1 e uma segunda região de homologi-a (HR2)1, em que (HR1)1 e (HR2)1 têm a capacidade de iniciar uma recombinação homóloga mediada por célula hospedeira no dito sítio alvo (TS)l; e (ii) uma nuclease {N)1 tem a capacidade de 5 clívagem ern (TS)1, portanto, a dita clivagern resulta na recombinação hcunóloga de (ES)1 em {TS)1; e (b) recuperar uma célula de levedura que tem (ES)1 integrado em (TS)l, em que a dita recuperação não requer a integração de um marcador selecionável.102. Célula de levedura caraeterízada pelo fato de que compreende: {a) um ácido nucleico exógeno {ES)1 que compreende uma primeira região de homologia (HR1)1 e uma segunda região de homologia {HR2)1, em que (HR1)1 e (HR2)1 têm a capacidade de iniciar urria recombinação homóloga mediada por célula hospedeira em urri sítio alvo (TS)l do genorrta de célula de levedura; e {b] urna nuclease {Njl tem a capacidade de clivagem em (TS)1, portanto, a dita cli-vagem resulta na recombinação homóloga de (ES)1 em (Tsjl; em que (ES)1 não compreende um marcador selecíonável.103. Método para integrar uma pluralidade de ácidos nucleicos exógenos no interior de um genoma de céluía hospedeira caracterizado pelo fato de que o método corrtpreende: (a) colocar urna célula hospedeira em contato com: {i) urna pluralidade de bibliotecas, errt que cada biblioteca (Llx compreende uma pluralídade de ácidos nucleicos exógenos, em que um ácido nucleico exógeno selecionado compreende, em uma orientação de 5' a 3', uma primeira região de homologia (HR1)x, qualquer ácido nucleico de interesse selecionado a partir do grupo (D)x, e uma segunda região de homologi-a (HR2)x, em que (HR1}X e 5 {HR2)X têrn a capacidade de iniciar uma recombinaçÊio homóloga mediada por célula hospedeira do dito ácido nucleico exógeno selecionado errt um sítio alvo {Tslx do dito genoma de célula hospedeira; e (ii) para cada dito sítí-o alvo (TS)X, uma nuclease (Nlx tem a capacidade de clívageui em (T3)x, portanto, a dita clivagern resulta na recombínação horrtóloga do dito áci-do nucleico exógeno seleci-onado em (TS)x; e (b) recuperar uma célula hospedeira errí que urn ácido nuclei-co exógeno de cada biblioteca (L)x foi integrado errí cada sequência alvo 3elecLonada (Tsjx, em que x é qualquer número inteiro cle 1 a n em que n é pelo menos 2.104. Célula hospedeira caracterizada pelo fato de que compreende: (a) uma pluralidade de bibliotecas, em que cada bibli-oteca (Llx compreende uma pluralidade de ácidos nucleicos exógenos, em que um ácido nucleico exógeno selecionado cornpreende, em uma orientação de 5' a 3', uma primeira região de homologia {HR1)x, qualquer ácido nucleico de interesse selecionado a partir do grupo (Dlx, e uma segunda :região cle hoinologia IHR2)x, em que (HR1)x e (HR2)x têm a capacidade de iniciar uma recombinação homóloga mediada por célula hospedeira do dito ácido nucleíco exógeno selecionado em um sítio alvo (TS)x do dito çenoma de célula hospedeira; e lb) para cada dito sitio alvo (TS)x, uma nuclease (N}x terri a capacidade de clivagem em (TS)x, portanto, a dita clivagem resulta na recomb:i-nação horrtóloga do dito ácido nucleico exógeno selecicnado em (TS)x, 5 em que x é qualquer número inteiro de i a n caracterizado pelo fato de que n é pelo menos 2.105. Composição caracterízada pelo fato de que compreende: (a) urna célula de levedura; (b) urna pluralidade de ácidos nucleicos exógenos, em que cada ácido nucleico exógeno (Eslx cornpreende: {jj uma primeira região de horrtologia (HR1}x e uma segunda região de homologia {HR2)x, erri que (HR1)X e (HR2)x têm a capacidade de iniciar uma recombinação homóloga mediada por célula hospedeira de (ES)X em um sítio aivo selecionado(TSlx de um genoma de célula de levedura; e (ii) um ácido nucleico de intere3se (Dlx posicionado errt 3' de (HR1)x e 5' de {HR2Ix: uma (C) pluralidade de nucleases, em que cada nuclease (Nlx tem a capacidade de cli-vagem em (TS)x, portanto, a dita clivagem resulta na recombinação homóloga de {ES}x em (TS)x; ern que x é qualquer número inteiro de 1 a n em que n é pelo menos 2.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161479821P | 2011-04-27 | 2011-04-27 | |
US201161500741P | 2011-06-24 | 2011-06-24 | |
US201161539389P | 2011-09-26 | 2011-09-26 | |
PCT/US2012/035657 WO2012149470A1 (en) | 2011-04-27 | 2012-04-27 | Methods for genomic modification |
Publications (2)
Publication Number | Publication Date |
---|---|
BR112013025567A2 true BR112013025567A2 (pt) | 2020-11-17 |
BR112013025567B1 BR112013025567B1 (pt) | 2021-09-21 |
Family
ID=46051948
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR112013025567-6A BR112013025567B1 (pt) | 2011-04-27 | 2012-04-27 | Métodos para modificação genômica |
Country Status (13)
Country | Link |
---|---|
US (3) | US8685737B2 (pt) |
EP (1) | EP2702160B1 (pt) |
JP (2) | JP6158170B2 (pt) |
KR (1) | KR102068107B1 (pt) |
CN (1) | CN103492578B (pt) |
AU (2) | AU2012249390B2 (pt) |
BR (1) | BR112013025567B1 (pt) |
CA (1) | CA2834375C (pt) |
MX (1) | MX351043B (pt) |
PT (1) | PT2702160T (pt) |
SG (1) | SG194089A1 (pt) |
WO (1) | WO2012149470A1 (pt) |
ZA (1) | ZA201307225B (pt) |
Families Citing this family (107)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112013025567B1 (pt) * | 2011-04-27 | 2021-09-21 | Amyris, Inc | Métodos para modificação genômica |
WO2013066438A2 (en) | 2011-07-22 | 2013-05-10 | President And Fellows Of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
US10314594B2 (en) | 2012-12-14 | 2019-06-11 | Corquest Medical, Inc. | Assembly and method for left atrial appendage occlusion |
US10813630B2 (en) | 2011-08-09 | 2020-10-27 | Corquest Medical, Inc. | Closure system for atrial wall |
US10307167B2 (en) | 2012-12-14 | 2019-06-04 | Corquest Medical, Inc. | Assembly and method for left atrial appendage occlusion |
WO2013074916A1 (en) * | 2011-11-18 | 2013-05-23 | Board Of Regents, The University Of Texas System | Car+ t cells genetically modified to eliminate expression of t- cell receptor and/or hla |
GB201122458D0 (en) | 2011-12-30 | 2012-02-08 | Univ Wageningen | Modified cascade ribonucleoproteins and uses thereof |
US9213947B1 (en) | 2012-11-08 | 2015-12-15 | 23Andme, Inc. | Scalable pipeline for local ancestry inference |
US9977708B1 (en) | 2012-11-08 | 2018-05-22 | 23Andme, Inc. | Error correction in ancestry classification |
US20140142689A1 (en) | 2012-11-21 | 2014-05-22 | Didier De Canniere | Device and method of treating heart valve malfunction |
EP2931892B1 (en) | 2012-12-12 | 2018-09-12 | The Broad Institute, Inc. | Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof |
MX2015007549A (es) * | 2012-12-12 | 2017-01-20 | Broad Inst Inc | Modificaciones de sistemas, métodos y composiciones guía optimizadas para la manipulación de secuencias. |
EP2825654B1 (en) * | 2012-12-12 | 2017-04-26 | The Broad Institute, Inc. | Crispr-cas component systems, methods and compositions for sequence manipulation |
BR112015013784A2 (pt) | 2012-12-12 | 2017-07-11 | Massachusetts Inst Technology | aplicação, manipulação e otimização de sistemas, métodos e composições para manipulação de sequência e aplicações terapêuticas |
KR20140109183A (ko) * | 2013-03-05 | 2014-09-15 | 삼성전자주식회사 | 다중 유전자 삽입 기술을 이용한 유전자 재조합 균주 제작 방법 |
NZ712727A (en) | 2013-03-14 | 2017-05-26 | Caribou Biosciences Inc | Compositions and methods of nucleic acid-targeting nucleic acids |
LT2966984T (lt) * | 2013-03-15 | 2022-05-25 | Cibus Us Llc | Tikslinė genų modifikacija, naudojant oligonukleotidų sukeltą genų taisymą |
CN105008536A (zh) * | 2013-04-16 | 2015-10-28 | 深圳华大基因科技服务有限公司 | 分离的寡核苷酸及其用途 |
KR20160034901A (ko) | 2013-06-17 | 2016-03-30 | 더 브로드 인스티튜트, 인코퍼레이티드 | 서열 조작에 최적화된 crispr-cas 이중 닉카아제 시스템, 방법 및 조성물 |
EP3011029B1 (en) | 2013-06-17 | 2019-12-11 | The Broad Institute, Inc. | Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation |
WO2014204727A1 (en) | 2013-06-17 | 2014-12-24 | The Broad Institute Inc. | Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof |
CN107995927B (zh) | 2013-06-17 | 2021-07-30 | 布罗德研究所有限公司 | 用于肝靶向和治疗的crispr-cas系统、载体和组合物的递送与用途 |
CN105793425B (zh) | 2013-06-17 | 2021-10-26 | 布罗德研究所有限公司 | 使用病毒组分靶向障碍和疾病的crispr-cas系统和组合物的递送、用途和治疗应用 |
US20150044192A1 (en) | 2013-08-09 | 2015-02-12 | President And Fellows Of Harvard College | Methods for identifying a target site of a cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9322037B2 (en) | 2013-09-06 | 2016-04-26 | President And Fellows Of Harvard College | Cas9-FokI fusion proteins and uses thereof |
US9340799B2 (en) | 2013-09-06 | 2016-05-17 | President And Fellows Of Harvard College | MRNA-sensing switchable gRNAs |
US9526784B2 (en) | 2013-09-06 | 2016-12-27 | President And Fellows Of Harvard College | Delivery system for functional nucleases |
KR101735697B1 (ko) | 2013-10-07 | 2017-05-24 | 서울대학교산학협력단 | 이종 시스템에서 (-)-α-비사보롤을 생산하는 방법 |
WO2015053510A1 (ko) * | 2013-10-07 | 2015-04-16 | 서울대학교산학협력단 | 이종 시스템에서 (-)-α-비사보롤을 생산하는 방법 |
US9566443B2 (en) | 2013-11-26 | 2017-02-14 | Corquest Medical, Inc. | System for treating heart valve malfunction including mitral regurgitation |
WO2015089486A2 (en) | 2013-12-12 | 2015-06-18 | The Broad Institute Inc. | Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems |
KR20160089527A (ko) | 2013-12-12 | 2016-07-27 | 더 브로드 인스티튜트, 인코퍼레이티드 | 게놈 편집을 위한 crispr-cas 시스템 및 조성물의 전달, 용도 및 치료적 응용 |
WO2015089364A1 (en) | 2013-12-12 | 2015-06-18 | The Broad Institute Inc. | Crystal structure of a crispr-cas system, and uses thereof |
US9068179B1 (en) | 2013-12-12 | 2015-06-30 | President And Fellows Of Harvard College | Methods for correcting presenilin point mutations |
CA2932472A1 (en) | 2013-12-12 | 2015-06-18 | Massachusetts Institute Of Technology | Compositions and methods of use of crispr-cas systems in nucleotide repeat disorders |
CN106029886B (zh) | 2013-12-19 | 2021-02-05 | 阿迈瑞斯公司 | 基因组整合的方法 |
EP4063503A1 (en) * | 2014-02-11 | 2022-09-28 | The Regents of the University of Colorado, a body corporate | Crispr enabled multiplexed genome engineering |
US9522936B2 (en) | 2014-04-24 | 2016-12-20 | Sangamo Biosciences, Inc. | Engineered transcription activator like effector (TALE) proteins |
CN111647627A (zh) | 2014-04-28 | 2020-09-11 | 重组股份有限公司 | 多重基因编辑 |
GB201407852D0 (en) | 2014-05-02 | 2014-06-18 | Iontas Ltd | Preparation of libraries od protein variants expressed in eukaryotic cells and use for selecting binding molecules |
CN105331604A (zh) * | 2014-05-29 | 2016-02-17 | 中国科学院上海生命科学研究院 | 一种dna构建物以及dna体外拼接方法 |
WO2016022363A2 (en) | 2014-07-30 | 2016-02-11 | President And Fellows Of Harvard College | Cas9 proteins including ligand-dependent inteins |
AU2015346422A1 (en) * | 2014-11-12 | 2017-05-25 | Recombinetics, Inc. | Heterozygous modifications of tumor suppressor genes and swine model of neurofibromatosis type 1 |
US11352666B2 (en) | 2014-11-14 | 2022-06-07 | Institute For Basic Science | Method for detecting off-target sites of programmable nucleases in a genome |
CN107109486B (zh) * | 2014-11-14 | 2021-08-13 | 基础科学研究院 | 用于检测基因组中遗传剪刀的脱靶位点的方法 |
CN105713885B (zh) * | 2014-12-04 | 2019-06-11 | 清华大学 | 特异识别并修复β地中海贫血症beta-globin基因的嵌合核酸酶 |
US10842626B2 (en) | 2014-12-09 | 2020-11-24 | Didier De Canniere | Intracardiac device to correct mitral regurgitation |
EP3985115A1 (en) | 2014-12-12 | 2022-04-20 | The Broad Institute, Inc. | Protected guide rnas (pgrnas) |
CA2978457A1 (en) | 2015-03-03 | 2016-09-09 | Regents Of The University Of Minnesota | Etv2 and uses thereof |
WO2016205759A1 (en) | 2015-06-18 | 2016-12-22 | The Broad Institute Inc. | Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation |
MX2017016289A (es) | 2015-06-18 | 2018-08-15 | Broad Inst Inc | Mutaciones de la enzima crispr que reducen los efectos fuera del blanco. |
WO2016210350A1 (en) | 2015-06-25 | 2016-12-29 | Amyris, Inc. | Maltose dependent degrons, maltose-responsive promoters, stabilization constructs, and their use in production of non-catabolic compounds |
BR112017028608A2 (pt) | 2015-06-30 | 2018-09-04 | Univ Minnesota | músculo cardíaco humanizado |
JP2018522553A (ja) | 2015-06-30 | 2018-08-16 | リージェンツ オブ ザ ユニバーシティ オブ ミネソタ | ヒト化骨格筋 |
US20170000743A1 (en) * | 2015-07-02 | 2017-01-05 | Vindico NanoBio Technology Inc. | Compositions and Methods for Delivery of Gene Editing Tools Using Polymeric Vesicles |
IL294014B2 (en) | 2015-10-23 | 2024-07-01 | Harvard College | Nucleobase editors and their uses |
EP3368673B1 (en) | 2015-10-29 | 2020-07-29 | Amyris, Inc. | Compositions and methods for production of myrcene |
US11208649B2 (en) | 2015-12-07 | 2021-12-28 | Zymergen Inc. | HTP genomic engineering platform |
KR20190090081A (ko) * | 2015-12-07 | 2019-07-31 | 지머젠 인코포레이티드 | Htp 게놈 공학 플랫폼에 의한 미생물 균주 개량 |
US9988624B2 (en) | 2015-12-07 | 2018-06-05 | Zymergen Inc. | Microbial strain improvement by a HTP genomic engineering platform |
WO2017100376A2 (en) | 2015-12-07 | 2017-06-15 | Zymergen, Inc. | Promoters from corynebacterium glutamicum |
EP4089166A1 (en) | 2016-01-27 | 2022-11-16 | Oncorus, Inc. | Oncolytic viral vectors and uses thereof |
WO2017143071A1 (en) | 2016-02-18 | 2017-08-24 | The Regents Of The University Of California | Methods and compositions for gene editing in stem cells |
JP2019515654A (ja) | 2016-03-16 | 2019-06-13 | ザ ジェイ. デヴィッド グラッドストーン インスティテューツ | 肥満及び/又は糖尿病を処置するための方法及び組成物、並びに候補処置薬剤を識別するための方法及び組成物 |
ES2865481T3 (es) | 2016-04-29 | 2021-10-15 | Poseida Therapeutics Inc | Micelas basadas en poli(histidina) para la complejación y el aporte de proteínas y ácidos nucleicos |
US11293033B2 (en) | 2016-05-18 | 2022-04-05 | Amyris, Inc. | Compositions and methods for genomic integration of nucleic acids into exogenous landing pads |
CN107513538A (zh) * | 2016-06-17 | 2017-12-26 | 北京大学 | 基因敲除方法 |
EP3478833A4 (en) | 2016-06-30 | 2019-10-02 | Zymergen, Inc. | METHODS OF GENERATING A BACTERIAL HEMOGLOBIN LIBRARY AND USES THEREOF |
US10544411B2 (en) | 2016-06-30 | 2020-01-28 | Zymergen Inc. | Methods for generating a glucose permease library and uses thereof |
US11078481B1 (en) | 2016-08-03 | 2021-08-03 | KSQ Therapeutics, Inc. | Methods for screening for cancer targets |
CA3032699A1 (en) | 2016-08-03 | 2018-02-08 | President And Fellows Of Harvard College | Adenosine nucleobase editors and uses thereof |
AU2017308889B2 (en) | 2016-08-09 | 2023-11-09 | President And Fellows Of Harvard College | Programmable Cas9-recombinase fusion proteins and uses thereof |
CA3033788A1 (en) | 2016-08-17 | 2018-02-22 | Factor Bioscience Inc. | Nucleic acid products and methods of administration thereof |
US11542509B2 (en) | 2016-08-24 | 2023-01-03 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
US11078483B1 (en) | 2016-09-02 | 2021-08-03 | KSQ Therapeutics, Inc. | Methods for measuring and improving CRISPR reagent function |
WO2018071868A1 (en) | 2016-10-14 | 2018-04-19 | President And Fellows Of Harvard College | Aav delivery of nucleobase editors |
US20180179553A1 (en) | 2016-12-14 | 2018-06-28 | Ligandal, Inc. | Compositions and methods for nucleic acid and/or protein payload delivery |
US10745677B2 (en) | 2016-12-23 | 2020-08-18 | President And Fellows Of Harvard College | Editing of CCR5 receptor gene to protect against HIV infection |
SG11201906540WA (en) | 2017-01-19 | 2019-08-27 | Open Monoclonal Tech Inc | Human antibodies from transgenic rodents with multiple heavy chain immunoglobulin loci |
EP3592853A1 (en) | 2017-03-09 | 2020-01-15 | President and Fellows of Harvard College | Suppression of pain by gene editing |
JP2020510439A (ja) | 2017-03-10 | 2020-04-09 | プレジデント アンド フェローズ オブ ハーバード カレッジ | シトシンからグアニンへの塩基編集因子 |
IL269458B2 (en) | 2017-03-23 | 2024-02-01 | Harvard College | Nucleic base editors that include nucleic acid programmable DNA binding proteins |
WO2018209320A1 (en) | 2017-05-12 | 2018-11-15 | President And Fellows Of Harvard College | Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation |
JP6990385B2 (ja) * | 2017-05-16 | 2022-02-03 | 国立大学法人 長崎大学 | 多重遺伝子導入手法 |
WO2018226880A1 (en) * | 2017-06-06 | 2018-12-13 | Zymergen Inc. | A htp genomic engineering platform for improving escherichia coli |
DK3645719T3 (da) | 2017-06-30 | 2022-05-16 | Inscripta Inc | Automatiserede cellebehandlingsfremgangsmåder, moduler, instrumenter og systemer |
BR112020001559A2 (pt) | 2017-07-26 | 2020-08-11 | Oncorus, Inc. | vetores virais oncolíticos e usos dos mesmos |
JP2020534795A (ja) | 2017-07-28 | 2020-12-03 | プレジデント アンド フェローズ オブ ハーバード カレッジ | ファージによって支援される連続的進化(pace)を用いて塩基編集因子を進化させるための方法および組成物 |
US11319532B2 (en) | 2017-08-30 | 2022-05-03 | President And Fellows Of Harvard College | High efficiency base editors comprising Gam |
WO2019190590A2 (en) | 2017-09-18 | 2019-10-03 | Amyris, Inc. | Methods for genomic integration for kluyveromyces host cells |
US11884928B2 (en) | 2017-09-18 | 2024-01-30 | Amyris, Inc. | Methods for genetic engineering Kluyveromyces host cells |
CN111372650A (zh) | 2017-09-30 | 2020-07-03 | 因思科瑞普特公司 | 流通式电穿孔仪器 |
US11795443B2 (en) | 2017-10-16 | 2023-10-24 | The Broad Institute, Inc. | Uses of adenosine base editors |
GB201720351D0 (en) | 2017-12-06 | 2018-01-17 | Iontas Ltd | Selecting for developability in drug discovery |
US20210189376A1 (en) * | 2018-08-29 | 2021-06-24 | Amyris, Inc. | Cells and methods for selection based assay |
CN113015801A (zh) * | 2018-09-20 | 2021-06-22 | 赛诺菲 | 基于内含子的通用克隆方法和组合物 |
US20220145330A1 (en) | 2019-02-10 | 2022-05-12 | The J. David Gladstone Institutes, a testamentary trust established under the Will of J. David Glads | Modified mitochondrion and methods of use thereof |
DE112020001342T5 (de) | 2019-03-19 | 2022-01-13 | President and Fellows of Harvard College | Verfahren und Zusammensetzungen zum Editing von Nukleotidsequenzen |
WO2021016114A1 (en) | 2019-07-19 | 2021-01-28 | 23Andme, Inc. | Phase-aware determination of identity-by-descent dna segments |
US10501404B1 (en) | 2019-07-30 | 2019-12-10 | Factor Bioscience Inc. | Cationic lipids and transfection methods |
JPWO2021100731A1 (pt) * | 2019-11-19 | 2021-05-27 | ||
CN111154704B (zh) * | 2020-03-30 | 2023-04-11 | 河南巨龙生物工程股份有限公司 | 一株粘质沙雷氏菌突变株以及发酵生产组氨酸的方法 |
DE112021002672T5 (de) | 2020-05-08 | 2023-04-13 | President And Fellows Of Harvard College | Vefahren und zusammensetzungen zum gleichzeitigen editieren beider stränge einer doppelsträngigen nukleotid-zielsequenz |
US11817176B2 (en) | 2020-08-13 | 2023-11-14 | 23Andme, Inc. | Ancestry composition determination |
CN118525099A (zh) | 2021-08-25 | 2024-08-20 | 艾恩塔斯有限公司 | 真核细胞中表达的蛋白质变体文库的制备 |
WO2023228969A1 (ja) * | 2022-05-25 | 2023-11-30 | キッコーマン株式会社 | 遺伝子導入のための糸状菌 |
Family Cites Families (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5272065A (en) | 1983-10-20 | 1993-12-21 | Research Foundation Of State University Of New York | Regulation of gene expression by employing translational inhibition of MRNA utilizing interfering complementary MRNA |
US4873192A (en) | 1987-02-17 | 1989-10-10 | The United States Of America As Represented By The Department Of Health And Human Services | Process for site specific mutagenesis without phenotypic selection |
US6140466A (en) | 1994-01-18 | 2000-10-31 | The Scripps Research Institute | Zinc finger protein derivatives and methods therefor |
PT937098E (pt) | 1995-06-07 | 2002-12-31 | Invitrogen Corp | Clonagem recombinatoria in vitro utilizando locais de recombinacao modificados |
JP4206154B2 (ja) | 1997-11-13 | 2009-01-07 | 大日本住友製薬株式会社 | 変異型loxP配列とその応用 |
CA2306184C (en) | 1997-11-18 | 2007-05-15 | Pioneer Hi-Bred International, Inc. | Compositions and methods for genetic modification of plants |
BR9814669A (pt) | 1997-11-18 | 2001-11-20 | Pioneer Hi Bred Int | Método para a integração de dna estranho emgenomas eucarióticos |
US5929301A (en) | 1997-11-18 | 1999-07-27 | Pioneer Hi-Bred International | Nucleic acid sequence encoding FLP recombinase |
US6453242B1 (en) | 1999-01-12 | 2002-09-17 | Sangamo Biosciences, Inc. | Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites |
US6794136B1 (en) | 2000-11-20 | 2004-09-21 | Sangamo Biosciences, Inc. | Iterative optimization in the design of binding proteins |
US7398262B1 (en) | 1999-06-18 | 2008-07-08 | Multex.Com, Inc. | Method and system for referencing, archiving and retrieving symbolically linked information |
WO2001007572A2 (en) | 1999-07-23 | 2001-02-01 | The Regents Of The University Of California | Dna recombination in eukaryotic cells by the bacteriophage phic31 recombination system |
WO2001011058A1 (en) | 1999-08-09 | 2001-02-15 | Monsanto Technology Llc | Novel cloning methods and vectors |
JP4787440B2 (ja) | 1999-09-30 | 2011-10-05 | 泉 斎藤 | 変異型frt配列を含有してなるdna |
AU785483B2 (en) * | 1999-12-10 | 2007-09-20 | Invitrogen Corporation | Use of multiple recombination sites with unique specificity in recombinational cloning |
WO2001083819A2 (en) | 2000-04-28 | 2001-11-08 | Sangamo Biosciences, Inc. | Methods for designing exogenous regulatory molecules |
US6503712B1 (en) | 2000-05-10 | 2003-01-07 | Amgen Inc. | Methods and compositions for preparing a genomic library for knockout targeting vectors |
US20030082561A1 (en) | 2000-07-21 | 2003-05-01 | Takashi Sera | Zinc finger domain recognition code and uses thereof |
DK1353941T3 (da) | 2001-01-22 | 2013-06-17 | Sangamo Biosciences Inc | Modificerede zinkfingerbindingsproteiner |
GB0108491D0 (en) | 2001-04-04 | 2001-05-23 | Gendaq Ltd | Engineering zinc fingers |
AT5356U1 (de) | 2001-07-16 | 2002-06-25 | Uv & P Umweltman Verfahrenstec | Verfahren zur immobilisierung von verbrennungsrückständen |
WO2003012036A2 (en) | 2001-07-27 | 2003-02-13 | The Government Of The United States Of America As Represented By The Secretary Of Health And Human Services | Systems for in vivo site-directed mutagenesis using oligonucleotides |
CA2479153C (en) | 2002-03-15 | 2015-06-02 | Cellectis | Hybrid and single chain meganucleases and use thereof |
WO2009095742A1 (en) | 2008-01-31 | 2009-08-06 | Cellectis | New i-crei derived single-chain meganuclease and uses thereof |
ATE531796T1 (de) | 2002-03-21 | 2011-11-15 | Sangamo Biosciences Inc | Verfahren und zusammensetzungen zur verwendung von zinkfinger-endonukleasen zur verbesserung der homologen rekombination |
WO2004031346A2 (en) | 2002-09-06 | 2004-04-15 | Fred Hutchinson Cancer Research Center | Methods and compositions concerning designed highly-specific nucleic acid binding proteins |
JP4966006B2 (ja) * | 2003-01-28 | 2012-07-04 | セレクティス | カスタムメイドメガヌクレアーゼおよびその使用 |
US7888121B2 (en) | 2003-08-08 | 2011-02-15 | Sangamo Biosciences, Inc. | Methods and compositions for targeted cleavage and recombination |
CA2534296C (en) | 2003-08-08 | 2013-03-26 | Sangamo Biosciences, Inc. | Methods and compositions for targeted cleavage and recombination |
EP1591521A1 (en) | 2004-04-30 | 2005-11-02 | Cellectis | I-Dmo I derivatives with enhanced activity at 37 degrees C and use thereof |
ATE466933T1 (de) | 2005-03-15 | 2010-05-15 | Cellectis | I-crei-meganuklease-varianten mit modifizierter spezifität sowie verfahren zu ihrer herstellung und verwendung |
WO2007034262A1 (en) | 2005-09-19 | 2007-03-29 | Cellectis | Heterodimeric meganucleases and use thereof |
WO2006097784A1 (en) | 2005-03-15 | 2006-09-21 | Cellectis | I-crei meganuclease variants with modified specificity, method of preparation and uses thereof |
WO2007049095A1 (en) | 2005-10-25 | 2007-05-03 | Cellectis | Laglidadg homing endonuclease variants having mutations in two functional subdomains and use thereof |
WO2007060495A1 (en) | 2005-10-25 | 2007-05-31 | Cellectis | I-crei homing endonuclease variants having novel cleavage specificity and use thereof |
DK2024504T4 (da) * | 2006-05-26 | 2023-02-27 | Amyris Inc | Fremstilling af isoprenoider |
US9428756B2 (en) | 2006-08-11 | 2016-08-30 | Dow Agrosciences Llc | Zinc finger nuclease-mediated homologous recombination |
WO2009001159A1 (en) | 2007-06-25 | 2008-12-31 | Cellectis | Method for enhancing the cleavage activity of i-crei derived meganucleases |
AU2008259939B2 (en) * | 2007-06-01 | 2014-03-13 | Open Monoclonal Technology, Inc. | Compositions and methods for inhibiting endogenous immunoglobulin genes and producing transgenic human idiotype antibodies |
WO2008152524A2 (en) | 2007-06-06 | 2008-12-18 | Cellectis | Method for enhancing the cleavage activity of i-crei derived meganucleases |
WO2010015899A2 (en) | 2008-08-04 | 2010-02-11 | Cellectis | Novel method to generate meganucleases with altered characteristics |
US20090203140A1 (en) | 2007-09-27 | 2009-08-13 | Sangamo Biosciences, Inc. | Genomic editing in zebrafish using zinc finger nucleases |
CA2937438C (en) * | 2007-09-27 | 2020-07-07 | Dow Agrosciences Llc | Engineered zinc finger proteins targeting 5-enolpyruvyl shikimate-3-phosphate synthase genes |
US8936936B2 (en) | 2007-10-25 | 2015-01-20 | Sangamo Biosciences, Inc. | Methods and compositions for targeted integration |
WO2010001189A1 (en) | 2008-07-03 | 2010-01-07 | Cellectis | The crystal structure of i-dmoi in complex with its dna target, improved chimeric meganucleases and uses thereof |
EP2180058A1 (en) | 2008-10-23 | 2010-04-28 | Cellectis | Meganuclease recombination system |
MX2011005195A (es) | 2008-11-19 | 2011-09-01 | Amyris Inc | Composiciones y metodos para el ensamblaje de polinucleotidos. |
EP3156494B8 (en) | 2008-12-04 | 2018-09-19 | Sangamo Therapeutics, Inc. | Genome editing in rats using zinc-finger nucleases |
KR20100080068A (ko) * | 2008-12-31 | 2010-07-08 | 주식회사 툴젠 | 신규한 징크 핑거 뉴클레아제 및 이의 용도 |
EP2206723A1 (en) | 2009-01-12 | 2010-07-14 | Bonas, Ulla | Modular DNA-binding domains |
PL2816112T3 (pl) * | 2009-12-10 | 2019-03-29 | Regents Of The University Of Minnesota | Modyfikacja DNA za pośrednictwem efektorów TAL |
US7919605B1 (en) | 2010-08-30 | 2011-04-05 | Amyris, Inc. | Nucleic acids, compositions and methods for the excision of target nucleic acids |
BR112013025567B1 (pt) * | 2011-04-27 | 2021-09-21 | Amyris, Inc | Métodos para modificação genômica |
-
2012
- 2012-04-27 BR BR112013025567-6A patent/BR112013025567B1/pt active IP Right Grant
- 2012-04-27 US US13/459,034 patent/US8685737B2/en active Active
- 2012-04-27 AU AU2012249390A patent/AU2012249390B2/en active Active
- 2012-04-27 CN CN201280020323.6A patent/CN103492578B/zh active Active
- 2012-04-27 EP EP12720058.2A patent/EP2702160B1/en active Active
- 2012-04-27 JP JP2014508155A patent/JP6158170B2/ja active Active
- 2012-04-27 SG SG2013074307A patent/SG194089A1/en unknown
- 2012-04-27 KR KR1020137031551A patent/KR102068107B1/ko active IP Right Grant
- 2012-04-27 CA CA2834375A patent/CA2834375C/en active Active
- 2012-04-27 PT PT127200582T patent/PT2702160T/pt unknown
- 2012-04-27 WO PCT/US2012/035657 patent/WO2012149470A1/en active Application Filing
- 2012-04-27 MX MX2013012479A patent/MX351043B/es active IP Right Grant
-
2013
- 2013-09-26 ZA ZA2013/07225A patent/ZA201307225B/en unknown
-
2014
- 2014-02-11 US US14/178,203 patent/US9701971B2/en active Active
-
2016
- 2016-12-05 JP JP2016235954A patent/JP6527126B2/ja active Active
-
2017
- 2017-02-03 US US15/424,709 patent/US20170240923A1/en not_active Abandoned
- 2017-06-29 AU AU2017204456A patent/AU2017204456B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US8685737B2 (en) | 2014-04-01 |
JP6527126B2 (ja) | 2019-06-05 |
SG194089A1 (en) | 2013-11-29 |
EP2702160A1 (en) | 2014-03-05 |
CN103492578A (zh) | 2014-01-01 |
ZA201307225B (en) | 2014-12-23 |
CN103492578B (zh) | 2016-10-19 |
AU2012249390A1 (en) | 2013-12-12 |
CA2834375A1 (en) | 2012-11-01 |
US20170240923A1 (en) | 2017-08-24 |
AU2017204456A1 (en) | 2017-07-20 |
JP2014513535A (ja) | 2014-06-05 |
CA2834375C (en) | 2020-07-14 |
BR112013025567B1 (pt) | 2021-09-21 |
AU2017204456B2 (en) | 2019-08-15 |
US9701971B2 (en) | 2017-07-11 |
KR102068107B1 (ko) | 2020-01-20 |
WO2012149470A1 (en) | 2012-11-01 |
JP2017042173A (ja) | 2017-03-02 |
US20120277120A1 (en) | 2012-11-01 |
JP6158170B2 (ja) | 2017-07-12 |
MX2013012479A (es) | 2014-01-31 |
US20140186942A1 (en) | 2014-07-03 |
EP2702160B1 (en) | 2020-05-27 |
PT2702160T (pt) | 2020-07-30 |
KR20140027354A (ko) | 2014-03-06 |
MX351043B (es) | 2017-09-29 |
AU2012249390B2 (en) | 2017-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BR112013025567A2 (pt) | métodos para modificação genômica | |
KR102021585B1 (ko) | 두 개의 벡터로부터 발현된 Cas9 단백질을 이용한 유전자 발현 조절 방법 | |
US20220325303A1 (en) | Methods for genomic integration | |
AU2020264325A1 (en) | Plant genome modification using guide rna/cas endonuclease systems and methods of use | |
AU2020223682B2 (en) | Plant regulatory elements and uses thereof | |
JP7093310B2 (ja) | 外因性ランディングパッドへの核酸のゲノム組込みのための組成物および方法 | |
KR20200124702A (ko) | 신규한 cas9 오르소로그 | |
IL263375A (en) | Methods and preparations for integrating exogenous sequence into the genome of plants | |
CN111263810A (zh) | 使用多核苷酸指导的核酸内切酶的细胞器基因组修饰 | |
KR20180002852A (ko) | 가이드 RNA/Cas 엔도뉴클레아제 시스템 | |
KR20230164771A (ko) | 지베렐린 대사의 조작을 통한 단간 식물의 수확가능한 수확량을 증가시키기 위한 방법 및 조성물 | |
CN106687594A (zh) | 用于产生对草甘膦除草剂具有抗性的植物的组合物和方法 | |
CN107223155A (zh) | 单倍体诱导系 | |
CN108882689A (zh) | 烟草植物体及其制备方法 | |
KR20230084505A (ko) | Dna 변형 효소 및 그의 활성 단편 및 변이체 및 사용 방법 | |
KR20210018219A (ko) | 발효 및 생산 중 곰팡이 형태를 제어하기 위한 신호 전달에 포함된 유전자의 조작 | |
CN111542610A (zh) | 精确基因组编辑的新策略 | |
TW202309291A (zh) | 用於室內空氣修復之組合物及方法 | |
CN106471008B (zh) | 棕榈Mantle表型检测 | |
KR20220137166A (ko) | 전이유전자성 마커 서열을 이용하지 않는 세포 단리 방법 | |
WO2011078351A1 (ja) | 分泌シグナル配列およびこれを利用したタンパク質発現系 | |
Hughes et al. | Molecular cloning and sequence analysis of cdc27+ required for the G 2-M transition in the fission yeast Schizosaccharomyces pombe | |
CN112010953B (zh) | 小麦白粉病抗性相关蛋白Pm24及其编码基因和应用 | |
CN115867565A (zh) | 用于改善对大豆锈病的抗性的方法 | |
Bhattarai | GENETIC CHARACTERIZATION OF LIGC AND LIGD IN MYCOBACTERIAL NHEJ A Dissertation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B15I | Others concerning applications: loss of priority |
Free format text: PERDA DAS PRIORIDADES 27/04/2011 US 61/479,821; 24/06/2011 US 61/500,741; 26/09/2011 US 61/539,389 POR NAO ENVIO DE DOCUMENTO COMPROBATORIO DE CESSAO DAS MESMAS CONFORME AS DISPOSICOES LEGAIS PREVISTAS NO ART. 16, 6O DA LEI 9.279 DE 4/05/1996 (LPI), ITEM 27 DO ATO NORMATIVO 128/1997, ART. 28 DA RESOLUCAO INPI-PR 77/2013 E ART. 3O DA IN 179/2017, UMA VEZ QUE O DEPOSITANTE CONSTANTE DA PETICAO DE REQUERIMENTO DO PEDIDO PCT E DISTINTO DAQUELE QUE DEPOSITOU AS PRIORIDADES. |
|
B06U | Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette] | ||
B06A | Patent application procedure suspended [chapter 6.1 patent gazette] | ||
B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 27/04/2012, OBSERVADAS AS CONDICOES LEGAIS. |