BR112020001815A2 - método de remoção de pelo menos duas porções de ácido nucleico de inserto, polinucleotídeos genômico de célula hospedeira e genômico procariótico ou um cromossomo eucariótico, célula hospedeira, e, processos para engenheirar por engenharia genética uma célula hospedeira e para fazer uma proteína glicosilada - Google Patents

método de remoção de pelo menos duas porções de ácido nucleico de inserto, polinucleotídeos genômico de célula hospedeira e genômico procariótico ou um cromossomo eucariótico, célula hospedeira, e, processos para engenheirar por engenharia genética uma célula hospedeira e para fazer uma proteína glicosilada Download PDF

Info

Publication number
BR112020001815A2
BR112020001815A2 BR112020001815-5A BR112020001815A BR112020001815A2 BR 112020001815 A2 BR112020001815 A2 BR 112020001815A2 BR 112020001815 A BR112020001815 A BR 112020001815A BR 112020001815 A2 BR112020001815 A2 BR 112020001815A2
Authority
BR
Brazil
Prior art keywords
recombination
nucleic acid
site
sequence
host cell
Prior art date
Application number
BR112020001815-5A
Other languages
English (en)
Inventor
Amirreza Faridmoayer
Michael Thomas KOWARIK
Gerd Martin LIPOWSKY
Fabio SERVENTI
Original Assignee
Glaxosmithkline Biologicals S.A.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glaxosmithkline Biologicals S.A. filed Critical Glaxosmithkline Biologicals S.A.
Publication of BR112020001815A2 publication Critical patent/BR112020001815A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/24Vectors characterised by the absence of particular element, e.g. selectable marker, viral origin of replication
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/30Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

A presente invenção descreve um processo para engenheirar uma célula hospedeira compreendendo as etapas de: a) integrar um primeiro cassete polinucleotídico incluindo um primeiro marcador de seleção flanqueado por um primeiro par de sítios de recombinação; b) remover o primeiro marcador de seleção pela ação de uma recombinase que reconhece o primeiro par de sítios de recombinação; c) integrar um segundo cassete polinucleotídico incluindo um segundo marcador de seleção flanqueado por um segundo par de sítios de recombinação; e d) remover o segundo marcador de seleção pela ação de uma recombinase que reconhece o segundo par de sítios de recombinação; em que o primeiro par de sítios de recombinação têm uma sequência de ácido nucleico idêntica e o segundo par de sítios de recombinação têm uma sequência de ácido nucleico idêntica e os primeiro e segundo pares de sítios de recombinação compartilham 90-98% de identidade de sequência de ácido nucleico. Também é divulgado um polinucleotídeo genômico de célula hospedeira compreendendo uma primeira região engenheirada por recombinação e uma segunda região engenheirada por recombinação, em que um primeiro sítio de recombinação único é adjacente à primeira região engenheirada por recombinação, e um segundo sítio de recombinação único é adjacente à segunda região engenheirada por recombinação, em que os primeiro e segundo sítios de recombinação têm sequências nucleotídicas que compartilham 90-98% de identidade uma com a outra e opcionalmente com a sequência de ácido nucleico de quaisquer sítios de recombinação adicionais presentes no polinucleotídeo genômico de célula hospedeira.

Description

1 / 78
MÉTODO DE REMOÇÃO DE DUAS PORÇÕES DE ÁCIDO NUCLEICO DE INSERTO, CÉLULA HOSPEDEIRA, POLINUCLEOTÍDEO GENÔMICO PROCARIÓTICO OU UM CROMOSSOMO EUCARIÓTICO, E, PROCESSO PARA FAZER UMA PROTEÍNA GLICOSILADA
[001] A presente invenção refere-se ao campo da manipulação recombinante de ácidos nucleicos e, especificamente, à remoção precisa de regiões específicas de ácido nucleico, enquanto assegurando que porções requeridas de ácido nucleico não sejam removidas. Especificamente, a presente invenção permite a remoção de elementos genéticos múltiplos indesejados que podem ter sido incorporados, por exemplo, como marcadores de seleção, durante manipulação recombinante de um polinucleotídeo genômico. O processo usa sítios curtos de recombinação, tais como sítios FRT, para flanquear um elemento genético que deve ser subsequentemente removido. O uso de sítios de recombinação não idênticos para flanquear diferentes elementos genéticos que devem ser removidos permite a remoção eficiente dos elementos genéticos pretendidos sem perda de outros elementos do polinucleotídeo genômico.
FUNDAMENTOS
[002] A manipulação genética de organismos procarióticos e eucarióticos frequentemente envolve a inserção estável de elementos genéticos no genoma, de modo que uma linhagem estável com o atributo requerido possa ser gerada. Alternativamente, manipulação genética pode ser usada para remover elementos indesejados de material genético, substituindo opcionalmente o material genético removido por outras insertos genéticos. Marcadores de seleção são geralmente introduzidos durante a manipulação genética, de modo que células contendo a manipulação genética correta possam ser selecionadas. No entanto, é útil remover subsequentemente os marcadores uma vez que uma célula hospedeira manipulada corretamente tenha sido estabelecida, especialmente se a célula hospedeira para usada para
2 / 78 a fabricação de produtos para uso médico ou veterinário.
[003] A remoção de marcadores genéticos únicos de um genoma é conhecida. A Flp recombinase foi verificada como tendo um papel na inversão de material genético de levedura (Broach e Hicks (1980) Cell 21; 501-506, Broach et al (1982) Cell 29; 227-234). O potencial da Flp recombinase foi investigado em E. coli (Cox (1983) P.N.A.S 80; 4223-4227, Vetter et al (1983) PNAS 80; 7204-7288, Andrews et al (1985) Cell 40; 795- 803) e papéis para Flp recombinase em excisão, inversão, translocação e inserção de elementos genéticos foram elucidados (Gronostajski e Sadowski (1985) J. Biol. Chem. 260; 12328-35). A Flp recombinase produz recombinação entre sítios alvo de Flp recombinase (FRT) que são elementos genéticos de cerca de 48 pb. Sítios FRT tem sido usados para flanquear um marcador de seleção, permitindo sua excisão subsequente a partir de um genoma de levedura usando Flp recombinase (Cregg e Madden (1989) Mol. Gen. Genet. 219; 320-323) e uma estratégia similar foi usada para excisar marcadores de resistência a antibióticos em E. coli (Cherepanov e Wackernagel (1995) Gene 158; 9-14).
[004] Manipulação genética mais complexa de organismos procarióticos e eucarióticos requer a integração estável e/ou remoção de múltiplos elementos genéticos no/a partir do genoma. Por exemplo, manipulação de E. coli para produzir proteínas ligadas a sacarídeos específicos foi descrita (WO 09/104074, WO 11/60615, WO 11/138361). Para realizar a produção de bioconjugados em E. coli, é necessário introduzir múltiplos elementos genéticos na célula hospedeira, incluindo uma ou mais cópias de vários genes codificando as glicotransferases que são necessárias para montar a cadeia de sacarídeo requerida, um gene codificando uma oligossacariltransferase como PglB, um gene codificando a proteína requerida contendo um sítio de glicosilação e potencialmente genes adicionais codificando outras enzimas, como polimerases, co-polimerases, flippases e/ou
3 / 78 enzimas para corretamente ‘decorar’ o sacarídeo. Também é benéfico remover elementos genéticos específicos, como lipopolissacarídeo O-antígeno ligase, glicosiltransferase nativa ou oligossacaril transferase, flippases, polimerases ou co-polimerases. Seria benéfico integrar vários desses genes no genoma da célula de produção e remover genes indesejados, a fim de facilitar a produção (WO 14/57109, WO 15/52344). No entanto, isso é difícil usando os métodos padrão (Datsenko e Wanner (2000) PNAS 97; 6640-5, Kuhlman e Cox (2010) 38; e92). Em particular, é difícil remover os marcadores de seleção múltipla associados a integrações múltiplas, porque interferência pode ocorrer entre os sítios de recombinação flanqueando os marcadores de seleção, resultando na excisão de parte do material genético requerido, bem como marcadores de seleção. Isso é particularmente problemático se os marcadores de seleção a serem excisados estiverem posicionados relativamente próximos uns dos outros no genoma. Este problema é demonstrado na Figura 4.
[005] A presente invenção provê uma solução para este problema ao usar pares de sítios de recombinação idênticos para flanquear cada segmento de ácido nucleico a ser removido do genoma; em que cada par idêntico de sítios de recombinação é diferente do par de sítios de recombinação flanqueando outros segmentos de ácido nucleico a serem removidos do genoma.
[006] Consequentemente, é provido um método de remover pelo menos duas porções de ácido nucleico de inserto de um polinucleotídeo genômico em uma célula hospedeira, dito método compreendendo as etapas de: a) preparar um polinucleotídeo genômico compreendendo um primeiro ácido nucleico de inserto que é flanqueado por um par de primeiros sítios de recombinação na mesma orientação que são idênticos um ao outro e têm uma primeira sequência de ácido nucleico;
4 / 78 b) expor o polinucleotídeo genômico de etapa a) a uma recombinase que reconhece os primeiros sítios de recombinação de modo que os sítios de recombinação idênticos recombinam resultando na excisão do primeiro ácido nucleico de inserto e um dos primeiros sítios de recombinação; c) inserir no polinucleotídeo genômico de etapa b) um segundo ácido nucleico de inserto flanqueado por um par de segundos sítios de recombinação na mesma orientação em que os segundos sítios de recombinação são idênticos um ao outro e têm uma segunda sequência de ácido nucleico que compartilha não mais do que 98% de identidade de sequência com a primeira sequência de ácido nucleico; e d) expor o polinucleotídeo genômico de etapa c) a uma recombinase que reconhece os segundos sítios de recombinação de modo que os sítios de recombinação idênticos recombinam resultando na excisão do segundo ácido nucleico de inserto e um dos segundos sítios de recombinação mas sem a remoção de sequência de polinucleotídeo genômico que não é flanqueada por sítios de recombinação idênticos.
[007] Consequentemente, também é provido um método para remover pelo menos duas porções de ácido nucleico de inserto de um polinucleotídeo genômico em uma célula hospedeira, dito método compreendendo as etapas de: a) preparar um polinucleotídeo genômico compreendendo pelo menos um primeiro e um segundo ácido nucleico de inserto, em que i) um primeiro ácido nucleico de inserto é flanqueado por primeiros sítios de recombinação na mesma orientação que são idênticos um ao outro e têm uma primeira sequência de ácido nucleico ii) o segundo ácido nucleico de inserto é flanqueado por segundos sítios de recombinação na mesma orientação que são idênticos um ao outro e têm uma segunda sequência de ácido nucleico que compartilha não mais do que 98% de identidade de sequência com a primeira sequência de ácido nucleico e iii) quaisquer sítios de recombinação adicionais
5 / 78 têm uma sequência de ácido nucleico que compartilha não mais do que 98% de identidade de sequência com a primeira ou segunda sequências de ácido nucleico; e b) expor o polinucleotídeo genômico a uma recombinase que reconhece os primeiro e segundo sítios de recombinação de modo que os sítios de recombinação idênticos recombinam resultando na excisão do ácido nucleico de inserto flanqueado por sítios de recombinação idênticos, mas sem a remoção de polinucleotídeo genômico que não é flanqueado por sítios de recombinação idênticos.
[008] Sem desejar ser limitado por teoria, o uso de pares não idênticos de sítios de recombinação favorece recombinação entre os pares idênticos de sítios de recombinação de modo que os segmentos de ácido nucleico esperados são preferivelmente removidos.
[009] Em um segundo aspecto da invenção, é provida uma célula hospedeira compreendendo um polinucleotídeo genômico preparado pelo método da invenção.
[0010] Em um terceiro aspecto da invenção, é provida um polinucleotídeo genômico de célula hospedeira compreendendo uma primeira região engenheirada por recombinação e uma segunda região engenheirada por recombinação, em que um primeiro sítio de recombinação único é adjacente à primeira região engenheirada por recombinação, e um segundo sítio de recombinação único é adjacente à segunda região engenheirada por recombinação, em que os primeiro e segundo sítios de recombinação têm sequências nucleotídicas que compartilham 90-98% de identidade uma com a outra e com a sequência de ácido nucleico de quaisquer sítios de recombinação adicionais presentes no polinucleotídeo genômico de célula hospedeira.
[0011] Em um quarto aspecto da invenção, é provida uma célula hospedeira compreendendo um polinucleotídeo genômico de célula
6 / 78 hospedeira contendo uma primeira região engenheirada por recombinação e uma segunda região engenheirada por recombinação, em que um primeiro cicatriz de sítio de recombinação é adjacente à primeira região engenheirada por recombinação e uma cicatriz do segundo sítio de recombinação é adjacente à segunda região engenheirada por recombinação; em que as cicatrizes do primeiro e do segundo sítio de recombinação têm diferentes sequências polinucleotídicas que são menos que 98% idênticas uma a outra e menos que 98% idênticas à sequência polinucleotídica de qualquer cicatriz de sítio de recombinação adicional presente no polinucleotídeo genômico de célula hospedeira.
[0012] Em um quinto aspecto da invenção, é provido um processo para fazer uma proteína glicosilada compreendendo as etapas de; a) cultivar a célula hospedeira da invenção sob condições apropriadas para a produção de proteína glicosilada e b) isolar a proteína glicosilada da cultura.
[0013] Em um sexto aspecto da invenção, é provido um polinucleotídeo genômico procariótico ou um cromossomo eucariótico compreendendo pelo menos duas cicatrizes de sítios de recombinação adjacentes a pelo menos duas regiões de recombinação, em que cada cicatriz de sítio de recombinação tem uma diferente sequência polinucleotídica.
[0014] Em um sétimo aspecto da invenção, é provido um processo para engenheirar por engenharia genética uma célula hospedeira compreendendo as etapas de: a) integrar um primeiro cassete polinucleotídico incluindo um primeiro marcador de seleção flanqueado por um primeiro par de sítios de recombinação; b) remover o primeiro marcador de seleção pela ação de uma recombinase que reconhece o primeiro par de sítios de recombinação; c) integrar um segundo cassete polinucleotídico incluindo um
7 / 78 segundo marcador de seleção flanqueado por um segundo par de sítios de recombinação; e d) remover o segundo marcador de seleção pela ação de uma recombinase que reconhece o segundo par de sítios de recombinação; em que o primeiro par de sítios de recombinação têm uma sequência de ácido nucleico idêntica e o segundo par de sítios de recombinação têm uma sequência de ácido nucleico idêntica e os primeiro e segundo pares de sítios de recombinação compartilham 90-98% de identidade de sequência de ácido nucleico.
[0015] Em um oitavo aspecto da invenção, é provida uma célula hospedeira engenheirada obtenível pelo processo da invenção. Por exemplo, uma célula hospedeira engenheirada é opcionalmente modificada por inserção de cópias múltiplas de um gene particular ou agrupamento de genes. Um loci particular para integração pode ser selecionado para otimizar o nível de expressão de diferentes genes. Similarmente, a integração de 2, 3, 4, 5, 6 ou mais cópias de um gene ou agrupamento de genes em diferentes loci pode otimizar a expressão do gene ou agrupamento de genes. Breve Descrição das Figuras
[0016] Figura 1 - Western blot em SDS PAGE carregado com extratos periplásmicos. Painel esquerdo: detecção com antissoro His. Painel direito: detecção com antissoro anti 33F. Pista 1 contém marcadores de peso molecular, pista 2 contém cepa 8661, pista 3 contém cepa 10852 e pista 4 contém cepa 10853.
[0017] Figura 2 - Esquema de organização genômica dos agrupamentos wca e rfb substituídos nas cepas 10175 e 10180.
[0018] Figura 3 - PCR de colônia em clones selecionados derivados da remoção de cassete de resistência mediada por FLP das cepas 10175 a
10180. Pistas 1, 14 e 27 contêm 1kb de escada de DNA GeneRulerTM, pista 2 contém St10175 antes da remoção, pistas 3 e 4 contêm FRTwt, padrão B,
8 / 78 pistas 5 e 6 contêm FRTwt padrão E, pistas 7, 8 e 9 contêm FRT3, padrão E, pistas 10, 11 e 12 contêm FRT3, padrão D, pistas 13, 15 e 16 contêm FRT10, padrão R, pistas 17 e 18 contêm FRT10, padrão D, pistas 19 e 20 contêm FRT10, padrão C, pistas 21 e 22 contêm, FRT13, padrão E, pista 23 contém FRT13, padrão A, pistas 24 e 25 contêm FRT13, padrão D, pistas 26 e 28 contêm FRT13, padrão C, pista 29 contém FRT13, padrão B, pistas 30, 31, 32 e 33 contêm FRT14, pista 34 contém FRT14, padrão D, pistas 35 e 36 contêm FRT15, padrão E e pistas 37, 38 e 39 contêm FRT15, padrão C.
[0019] Figura 4 - PCR preparativa em cepas de DNA genômico derivadas da remoção de cassete de resistência mediada por FLP.
[0020] Figura 5 - Esquema conceitual demonstrando a vantagem do uso de sítios FRT alternativos. Descrição Detalhada
[0021] A invenção provê um método de remover pelo menos duas porções de ácido nucleico de inserto de um polinucleotídeo genômico em uma célula hospedeira, dito método compreendendo as etapas de: a) preparar um polinucleotídeo genômico compreendendo um primeiro ácido nucleico de inserto que é flanqueado por um par de primeiros sítios de recombinação na mesma orientação que são idênticos um ao outro e têm uma primeira sequência de ácido nucleico; b) expor o polinucleotídeo genômico de etapa a) a uma recombinase que reconhece os primeiros sítios de recombinação de modo que os sítios de recombinação idênticos recombinam resultando na excisão do primeiro ácido nucleico de inserto e um dos primeiros sítios de recombinação; c) inserir no polinucleotídeo genômico de etapa b) um segundo ácido nucleico de inserto flanqueado por um par de segundos sítios de recombinação na mesma orientação em que os segundos sítios de recombinação são idênticos um ao outro e têm uma segunda sequência de ácido nucleico que compartilha não mais do que 98% de identidade de
9 / 78 sequência com a primeira sequência de ácido nucleico; e d) expor o polinucleotídeo genômico de etapa c) a uma recombinase que reconhece os segundos sítios de recombinação de modo que os sítios de recombinação idênticos recombinam resultando na excisão do segundo ácido nucleico de inserto e um dos segundos sítios de recombinação mas sem a remoção de sequência de polinucleotídeo genômico que não é flanqueado por sítios de recombinação idênticos.
[0022] A invenção também provê um método para remover pelo menos duas porções de ácido nucleico de inserto de um polinucleotídeo genômico em uma célula hospedeira, dito método compreendendo as etapas de: a) preparar um polinucleotídeo genômico compreendendo pelo menos um primeiro e um segundo ácido nucleico de inserto, em que i) um primeiro ácido nucleico de inserto é flanqueado por um par de primeiros sítios de recombinação na mesma orientação que são idênticos um ao outro e têm uma primeira sequência de ácido nucleico ii) o segundo ácido nucleico de inserto é flanqueado por um segundo par de segundos sítios de recombinação na mesma orientação que são idênticos um ao outro e têm uma segunda sequência de ácido nucleico que compartilha não mais do que 98% de identidade de sequência com a primeira sequência de ácido nucleico e iii) quaisquer sítios de recombinação adicionais têm uma sequência de ácido nucleico que compartilha não mais do que 98% de identidade de sequência com a primeira ou segunda sequências de ácido nucleico; e b) expor o polinucleotídeo genômico a uma recombinase que reconhece os primeiro e segundo sítios de recombinação de modo que os sítios de recombinação idênticos recombinam resultando na excisão do ácido nucleico de inserto flanqueado por sítios de recombinação idênticos, mas sem a remoção de polinucleotídeo genômico que não é flanqueado por sítios de recombinação idênticos.
10 / 78
[0023] Embora não desejando ser limitado por teoria, o uso de pares não idênticos de sítios de recombinação favorece a recombinação entre os pares idênticos de sítios de recombinação de modo que as seções esperadas de ácido nucleico são preferivelmente removidas.
[0024] O termo “ácido nucleico de inserto” significa um segmento de ácido nucleico que se torna integrado em um polinucleotídeo genômico como um resultado de uma manipulação genética do polinucleotídeo genômico. O ácido nucleico de inserto é tipicamente um segmento de ácido nucleico que se torna integrado no polinucleotídeo genômico como uma consequência indesejada do processo de recombinação genética em vez de um segmento de ácido nucleico, por exemplo, um gene a ser expressado, que é o objetivo da recombinação genética a introduzir. Assim, o ácido nucleico de inserto é opcionalmente um marcador genético tal como um marcador de resistência a antibiótico. Alternativamente, o ácido nucleico de inserto é uma sequência inserida no polinucleotídeo genômico para auxiliar a recombinação homóloga, por exemplo, uma “pista de pouso”. A finalidade da presente invenção é prover um modo eficiente de remover ácido nucleico de inserto do polinucleotídeo genômico de modo eficaz, uma vez que as manipulações genéticas múltiplas tenham sido completadas.
[0025] O termo “sítios de recombinação” significa sequências em ambos os lados do ácido nucleico de inserto que permitem sua subsequente remoção do polinucleotídeo genômico por recombinação genética mediada por uma recombinase. Estas são tipicamente sequências nucleotídicas reconhecidas por uma recombinase, permitindo a deleção da sequência interveniente após a recombinação homóloga.
[0026] O termo “região engenheirada por recombinação” significa uma parte do polinucleotídeo genômico que foi engenheirada por engenharia genética. Isto pode envolver a adição da sequência de ácido nucleico, a deleção da sequência de ácido nucleico ou a substituição da sequência de
11 / 78 ácido nucleico. O termo “polinucleotídeo genômico” significa um grande pedaço de material genético, por exemplo, um cromossomo eucariótico ou material genético procariótico.
[0027] O termo “célula hospedeira” significa uma célula procariótica ou eucariótica. Tipicamente, a célula hospedeira foi geneticamente manipulada para conter novo material genético e/ou para remover material genético. Em uma modalidade, manipulações genéticas múltiplas serão realizadas na célula hospedeira, resultando em pelo menos 2, 3, 4, 5, 6 7, 8, 9 ou 10 ácidos nucleicos de inserto que podem ser eficazmente excisados usando o método da invenção.
[0028] O método da invenção pode ser usado para remover ácido nucleico de inserto após qualquer forma de manipulação genética anterior. Por exemplo, o ácido nucleico de inserto pode estar presente no polinucleotídeo genômico como o resultado de adição de material genético, remoção de material genético ou substituição de material genético deletado com adicional material genético. O método da invenção é apropriado para uso com polinucleotídeos genômicos procarióticos, com plasmídeos ou com cromossomos eucarióticos.
[0029] Em uma modalidade, o primeiro e segundo ácidos nucleicos de inserto são marcadores de seleção, por exemplo, marcadores de seleção usados para identificar células hospedeiras em cuja célula hospedeira a adição, remoção ou substituição de material genético tinha ocorrido com sucesso. Em uma modalidade, os marcadores de seleção são marcadores de resistência a antibióticos. Em uma modalidade, os marcadores de seleção codificam proteínas que conferem resistência a antibióticos, por exemplo ampicilina, canamicina, cloranfenicol, espectinomicina ou gentamicina.
[0030] Em uma modalidade, o par de sítios de recombinação flanqueando o ácido nucleico de inserto são idênticos um ao outro. Em uma modalidade, os pares de sítios de recombinação flanqueando um ácido
12 / 78 nucleico de inserto estão na mesma orientação. Isto permite uma recombinação eficiente a ocorrer na presença de uma recombinase que reconhece o sítio de recombinação, resultando na deleção do ácido nucleico de inserto e um dos sítios de recombinação. Tal recombinação resulta em um sítio de recombinação único restante; isto é, como uma “cicatriz de sítio de recombinação” no polinucleotídeo genômico.
[0031] Em uma modalidade, o primeiro e segundo pares de sítios de recombinação têm sequências de ácido nucleico que compartilham não mais do que 98%, 96%, 94%, 92%, 90%, 85%, 80%, 75% ou 70% de identidade. Em uma modalidade, o primeiro e segundo pares de sítios de recombinação têm sequências de ácido nucleico que compartilham 70-98%, 75-98%, 80- 98%, 85-98%, 90-98%, 92-98%, 94-98% ou 96-98% de identidade. Em uma modalidade apropriada, os primeiro e segundo pares de sítios de recombinação compartilham 90-98% de identidade entre a sequência do primeiro sítio de recombinação e a sequência do segundo sítio de recombinação.
[0032] Em uma modalidade, o primeiro e segundo sítios de reconhecimento compartilham não mais do que 98%, 96%, 94%, 92%, 90%, 85%, 80%, 75% ou 70% de identidade com qualquer outro sítio de recombinação no polinucleotídeo genômico. Em uma modalidade, o primeiro e segundo sítios de recombinação têm sequências de ácido nucleico que compartilham 70-98%, 75-98%, 80-98%, 85-98%, 90-98%, 92-98%, 94-98% ou 96-98% de identidade com qualquer outro sítio de recombinação presente no polinucleotídeo genômico. Em uma modalidade apropriada, os primeiro e segundo pares de sítios de recombinação compartilham 90-98% de identidade entre a sequência do primeiro sítio de recombinação e a sequência do segundo sítio de recombinação e qualquer outro sítio de recombinação presente no polinucleotídeo genômico.
[0033] Em uma modalidade, etapa a) prepara um polinucleotídeo
13 / 78 genômico compreendendo um terceiro ácido nucleico de inserto que é flanqueado por um conjunto de terceiros sítios de recombinação idênticos tendo uma terceira sequência de ácido nucleico que compartilha não mais do que 98% 96%, 94%, 92% ou 90% ou 50%-98%, 60%-98%, 70%-98%, 80%- 98%, 85%-98% 90-98%, 92-98%, 94%-98%, ou 96%-98% de identidade de sequência com a sequência de ácido nucleico do primeiro ou segundo sítio de recombinação ou quaisquer sítios de recombinação adicionais. Em uma modalidade apropriada, o terceiro sítio de recombinação compartilha 90-98% de identidade com o primeiro ou segundo sítio de recombinação ou quaisquer sítios de recombinação adicionais.
[0034] Em uma modalidade, etapa a) prepara um polinucleotídeo genômico compreendendo um quarto ácido nucleico de inserto que é flanqueado por um conjunto de idênticos quartos sítios de recombinação tendo uma quarta sequência de ácido nucleico que compartilha não mais do que 98%, 96%, 94%, 92% ou 90% ou 50%-98%, 60%-98%, 70%-98%, 80%- 98%, 85%-98% 90-98%, 92-98%, 94%-98%, ou 96%-98% de identidade de sequência com a primeira sequência de ácido nucleico, segunda sequência de ácido nucleico, terceira sequência de ácido nucleico ou a sequência de ácido nucleico de quaisquer sítios de recombinação adicionais. Em uma modalidade apropriada, o quarto sítio de recombinação compartilha 90-98% de identidade com o primeiro ou segundo sítio de recombinação ou quaisquer sítios de recombinação adicionais.
[0035] Em uma modalidade, etapa a) prepara um polinucleotídeo genômico compreendendo um quinto ácido nucleico de inserto que é flanqueado por um conjunto de quintos sítios de recombinação idênticos tendo uma quinta sequência de ácido nucleico que compartilha não mais do que 98% 96%, 94%, 92% ou 90% ou 50%-98%, 60%-98%, 70%-98%, 80%- 98%, 85%-98% 90-98%, 92-98%, 94%-98%, ou 96%-98% de identidade de sequência com a primeira sequência de ácido nucleico, segunda sequência de
14 / 78 ácido nucleico, terceira sequência de ácido nucleico, quarto ácido nucleico ou a sequência de ácido nucleico de quaisquer sítios de recombinação adicionais. Em uma modalidade apropriada, o quinto sítio de recombinação compartilha 90-98% de identidade com o primeiro ou segundo sítio de recombinação ou quaisquer sítios de recombinação adicionais
[0036] Em uma modalidade, etapa a) prepara um polinucleotídeo genômico compreendendo um sexto ácido nucleico de inserto que é flanqueado por um conjunto de sextos sítios de recombinação idênticos tendo uma sexta sequência de ácido nucleico que compartilha não mais do que 98% 96%, 94%, 92% ou 90% ou 50%-98%, 60%-98%, 70%-98%, 80%-98%, 85%-98% 90-98%, 92-98%, 94%-98%, ou 96%-98% de identidade de sequência com a primeira sequência de ácido nucleico, segunda sequência de ácido nucleico, terceira sequência de ácido nucleico, quarto ácido nucleico, quinto ácido nucleico ou a sequência de ácido nucleico de quaisquer sítios de recombinação adicionais. Em uma modalidade apropriada, o sexto sítio de recombinação compartilha 90-98% de identidade com o primeiro ou segundo sítio de recombinação ou quaisquer sítios de recombinação adicionais.
[0037] Os princípios para o projeto de sítios FRT é descrito em Turan S, Kuehle J, Schambach A, Baum C e Bode J (2010) J. Mol. Biol. 402; 52-69. Por exemplo, um sítio FRT típico consiste de 48 pares de base consistindo de duas repetições de 13-bp invertidas (a’ e a) em torno de um espaçador de 8-bp e uma quarta repetição (b), separadas por uma lacuna de 1-bp na orientação direta para a repetição adjacente b-----Æ a’ ----Æ espaçador Å--a
[0038] Variação é tipicamente introduzida na sequência de espaçador. Preferivelmente, o teor de AT do espaçador está acima de 75%. Preferivelmente alterações são feitas para o bp em pelo menos uma das posições 2, 3, 4, 5, 6 ou 7 do espaçador. Preferivelmente posições 1 e 8 do espaçador são inalteradas. Preferivelmente, não são feitas interrupções
15 / 78 principais nos tratos de 5’ – polipirimidina.
[0039] Em uma modalidade, o polinucleotídeo genômico preparado em etapa a) compreende 2, 3, 4, 5, 6, 7, 8, 9, ou 10 ácidos nucleicos de inserto cada flanqueado com pares idênticos de sítios de recombinação em que cada par de sítios de recombinação são diferentes de outros pares de sítios de recombinação por exemplo, um pares particular de sítios de recombinação compartilha 90%-98% de identidade de sequência com qualquer outro par de sítios de recombinação no polinucleotídeo genômico.
[0040] Em uma modalidade, os sítios de recombinação são 30-50, ou 40-50 pares de base em comprimento, preferivelmente 48 pares de base em comprimento. Em uma modalidade, os sítios de recombinação são reconhecidos por uma recombinase. Em uma modalidade, a recombinase é preferivelmente uma FLP-recombinase. Por exemplo, os primeiro e segundo sítios de recombinação (como pares ou pós-recombinação, como cicatrizes) são diferentes de cada um dos outros sítios alvo de reconhecimento de flippase (FRT) ou sítios FRT variantes.
[0041] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência 5’- gaagttcctattccgaagttcctattctctagaaagtataggaacttc-3’ (SEQ ID NO:1) e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:2.
[0042] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência 5’- gaagttcctattccgaagttcctattctctagaaagtataggaacttc-3’ (SEQ ID NO:1) e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:3.
[0043] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência 5’- gaagttcctattccgaagttcctattctctagaaagtataggaacttc-3’ (SEQ ID NO:1) e o
16 / 78 segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:4.
[0044] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência 5’- gaagttcctattccgaagttcctattctctagaaagtataggaacttc-3’ (SEQ ID NO:1) e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:5.
[0045] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência 5’- gaagttcctattccgaagttcctattctctagaaagtataggaacttc-3’ (SEQ ID NO:1) e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:6.
[0046] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência 5’- gaagttcctattccgaagttcctattctctagaaagtataggaacttc-3’ (SEQ ID NO:1) e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:7.
[0047] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência 5’- gaagttcctattccgaagttcctattctctagaaagtataggaacttc-3’ (SEQ ID NO:1) e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:8.
[0048] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência 5’- gaagttcctattccgaagttcctattctctagaaagtataggaacttc-3’ (SEQ ID NO:1) e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:9.
[0049] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência 5’-
17 / 78 gaagttcctattccgaagttcctattctctagaaagtataggaacttc-3’ (SEQ ID NO:1) e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:10.
[0050] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:2 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:3.
[0051] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:2 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:4.
[0052] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:2 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:5.
[0053] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:2 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:6.
[0054] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:2 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:7.
[0055] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:2 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:8.
[0056] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:2 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:9.
[0057] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:2 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:10.
[0058] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:2 e o segundo sítio de
18 / 78 recombinação é um sítio FRT tendo a sequência de SEQ ID NO:1.
[0059] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:3 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:4.
[0060] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:3 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:5.
[0061] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:3 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:6.
[0062] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:3 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:7.
[0063] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:3 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:8.
[0064] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:3 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:9.
[0065] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:3 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:10.
[0066] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:3 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:1.
[0067] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:3 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:2.
[0068] Em uma modalidade, o primeiro sítio de recombinação é um
19 / 78 sítio FRT tendo a sequência de SEQ ID NO:4 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:5.
[0069] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:4 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:6.
[0070] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:4 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:7.
[0071] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:4 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:8.
[0072] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:4 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:9.
[0073] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:4 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:10.
[0074] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:4 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:1.
[0075] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:4 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:2.
[0076] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:4 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:3.
[0077] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:5 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:6.
20 / 78
[0078] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:5 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:7.
[0079] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:5 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:8.
[0080] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:5 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:9.
[0081] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:5 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:10.
[0082] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:5 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:1.
[0083] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:5 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:2.
[0084] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:5 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:3.
[0085] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:5 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:4.
[0086] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:6 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:7.
[0087] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:6 e o segundo sítio de
21 / 78 recombinação é um sítio FRT tendo a sequência de SEQ ID NO:8.
[0088] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:6 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:9.
[0089] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:6 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:10.
[0090] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:7 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:8.
[0091] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:7 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:9.
[0092] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:7 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:10.
[0093] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:6 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:1.
[0094] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:6 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:2.
[0095] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:6 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:3.
[0096] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:6 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:4.
[0097] Em uma modalidade, o primeiro sítio de recombinação é um
22 / 78 sítio FRT tendo a sequência de SEQ ID NO:6 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:5.
[0098] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:8 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:9.
[0099] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:8 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:10.
[00100] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:8 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:1.
[00101] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:8 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:2.
[00102] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:8 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:3.
[00103] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:8 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:4.
[00104] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:8 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:5.
[00105] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:8 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:6.
[00106] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:8 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:7.
23 / 78
[00107] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:9 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:1.
[00108] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:9 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:2.
[00109] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:9 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:3.
[00110] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:9 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:4.
[00111] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:9 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:5.
[00112] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:9 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:6.
[00113] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:9 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:7.
[00114] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:9 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:8.
[00115] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:9 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:10.
[00116] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:10 e o segundo sítio de
24 / 78 recombinação é um sítio FRT tendo a sequência de SEQ ID NO:1.
[00117] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:10 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:2.
[00118] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:10 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:3.
[00119] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:10 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:4.
[00120] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:10 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:5.
[00121] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:10 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:6.
[00122] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:10 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:7.
[00123] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:10 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:8.
[00124] Em uma modalidade, o primeiro sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:10 e o segundo sítio de recombinação é um sítio FRT tendo a sequência de SEQ ID NO:9.
[00125] Em uma modalidade, o primeiro e segundo ácidos nucleicos de inserto estão situados no polinucleotídeo genômico em que a distância entre o primeiro e segundo ácidos nucleicos de inserto é menos do que 500kb, 400kB, 300kb, 200kb, 150kb, 100kb, 75kb, 50kb ou 25kb.
25 / 78
[00126] Em uma modalidade, em etapa b) o polinucleotídeo genômico é exposto à recombinase por introdução de um gene codificando FLP- recombinase na célula hospedeira. O gene codificando FLP-recombinase é opcionalmente introduzido na célula hospedeira em um plasmídeo sob o controle de um promotor indutível ou um promotor constitutivo. Onde um promotor indutível é usado, o plasmídeo pCP20, tendo a sequência de ácido nucleico de SEQ ID NO:13 pode ser usado de modo apropriado.
[00127] Em uma modalidade, o gene codificando FLP-recombinase tem uma sequência de ácido nucleico tendo pelo menos 80%, 85%, 90%, 95%, 98% ou 99% de identidade para a sequência de SEQ ID NO:12. Em uma modalidade, a FLP-recombinase tem uma sequência de aminoácido pelo menos 80%, 85%, 90%, 95%, 98% ou 99% idêntica à sequência de SEQ ID NO:11.
[00128] Em uma modalidade, o ácido nucleico de inserto codifica pelo menos um marcador de seleção. No entanto, o método da invenção é particularmente utilizável quando pelo menos 2, 3, 4, 5 ou 6 ácidos nucleicos de inserto cada codificam um marcador de seleção. Nestes casos, múltiplos marcadores de seleção podem ser removidos de um polinucleotídeo genômico em uma etapa única sem a remoção de regiões de DNA entre os marcadores de seleção por um evento de recombinação indesejado. Este benefício é particularmente forte onde os marcadores de seleção estão localizados dentro de 100, 75, 50, 25, 10, 5 ou 2kb um do outro no polinucleotídeo genômico.
[00129] Em uma modalidade, o polinucleotídeo genômico é de uma espécie Escherichia, Neisseria, Shigella, Klebsiella, Xhantomonas, Salmonella, Yersinia, Lactococcus, Lactobacillus, Pseudomonas, Corynebacterium, Streptomyces, Streptococcus, Staphylococcus, Bacillus ou Cperdidoridium. No entanto, é evidente que o método da invenção pode ser usado para remover múltiplos ácidos nucleicos de inserto de um polinucleotídeo genômico a partir de qualquer organismo incluindo
26 / 78 organismos eucariótico e procariótico, plantas, insetos, levedura e organismos mamíferos incluindo camundongos, ratos, coelhos. O método da invenção é apropriado onde o polinucleotídeo genômico é de E. coli.
[00130] Um aspecto adicional da invenção é um polinucleotídeo genômico preparado pelo método da invenção.
[00131] Seguindo a realização do processo da invenção, pelo menos uma primeira e uma segunda região do polinucleotídeo genômico são recombinantemente manipuladas e duas deleções de ácido nucleico ocorrem entre os pares de sítios de recombinação idênticos. Isto resulta na perda de um sítio de recombinação por par e o ácido nucleico interveniente. O resultado é um polinucleotídeo genômico de célula hospedeira compreendendo um primeiro sítio engenheirado por recombinação e um segundo sítio engenheirado por recombinação, em que um primeiro sítio de recombinação único é adjacente à primeira região engenheirada por recombinação, e um segundo sítio de recombinação único é adjacente à segunda região engenheirada por recombinação, em que os primeiro e segundo sítios de recombinação têm sequências nucleotídicas que compartilham 90-98% de identidade uma com a outra e com a sequência de ácido nucleico de quaisquer sítios de recombinação adicionais presentes no polinucleotídeo genômico de célula hospedeira.
[00132] Em uma modalidade, as primeira e segunda regiões engenheiradas por recombinação são regiões em que parte do genoma da célula hospedeira foi removida. Em uma modalidade, as primeira e segunda regiões engenheiradas por recombinação são sítios em que um segmento de ácido nucleico adicional de acima de 20, 50, 100, 250 ou 500 pares de base em comprimento foi inserido. Em uma modalidade, os primeiro e segundo sítios de recombinação são sítios de recombinação para uma recombinase, por exemplo, uma recombinase de FLP, por exemplo, uma recombinase de FLP que tem a sequência de aminoácido de SEQ ID NO:11.
27 / 78
[00133] Em uma modalidade, os primeiro e segundo sítios de recombinação são de 30-50 ou 40-50 pares de base em comprimento, preferivelmente 48 pares de base em comprimento. Em uma modalidade, o primeiro sítio de recombinação tem uma sequência de ácido nucleico de SEQ ID NO:1-10. Como descrito acima, é visado que qualquer um dos sítios de recombinação de SEQ ID NO:1-10 pode ser usado com qualquer outro sítio de recombinação de SEQ ID NO:1-10 de modo que recombinação ocorre entre os pares homólogos de sítios de recombinação, mas não entre pares heterólogos de sítios de recombinação. As combinações preferidas têm um primeiro sítio de recombinação tendo uma sequência selecionada dentre o grupo de SEQ ID NO:1-6 usado em combinação com um segundo sítio de recombinação tendo uma sequência selecionada do grupo de SEQ ID NO:1-6 (em que o segundo sítio de recombinação é diferente do primeiro sítio de recombinação).
[00134] Em uma modalidade, o método da invenção resulta em uma célula hospedeira compreendendo um polinucleotídeo genômico de célula hospedeira contendo uma primeira região engenheirada por recombinação e uma segunda região engenheirada por recombinação, em que uma primeira cicatriz de sítio de recombinação é adjacente à primeira região engenheirada por recombinação e uma cicatriz do segundo sítio de recombinação é adjacente à segunda região engenheirada por recombinação; em que as cicatrizes do primeiro e do segundo sítio de recombinação têm diferentes sequências polinucleotídicas que são menos que 98% idênticas uma a outra e menos que 98% idênticas à sequência polinucleotídica de qualquer cicatriz de sítio de recombinação adicional presente no polinucleotídeo genômico de célula hospedeira.
[00135] Em uma modalidade, as primeira e segunda regiões engenheiradas por recombinação são regiões em que parte do genoma da célula hospedeira foi removida. Em uma modalidade, as primeira e segunda
28 / 78 regiões engenheiradas por recombinação são regiões em que um segmento de ácido nucleico adicional de acima de 20, 50, 100, 250 ou 500 pares de base em comprimento foi inserido.
[00136] Em uma modalidade, os primeiro e segundo sítios de recombinação são sítios de recombinação para uma recombinase, por exemplo, uma recombinase de FLP, por exemplo, uma recombinase de FLP tendo a sequência de aminoácido de SEQ ID NO:11.
[00137] Em uma modalidade, os primeiro e segundo sítios de recombinação são de 30-50 ou 40-50 pares de base em comprimento, preferivelmente 48 pares de base em comprimento. Em uma modalidade, o primeiro sítio de recombinação tem uma sequência de ácido nucleico de SEQ ID NO:1-10. Um segundo sítio de recombinação terá uma sequência de ácido nucleico diferente que é opcionalmente selecionada de SEQ ID NO:1-10. Combinações de primeiro e segundo sítios de recombinação ambos com SEQ ID NO:1-6 são preferidas.
[00138] Em uma modalidade, os primeiro e segundo sítios de recombinação são separados por menos do que 500kbases, 400kbases, 300kbases, 200kbases, 150kbases,100kbases, 75kbases, 50kbases, 25kbases, 10kbases, 5kBases, 4kbases, 3kbases, 2kbases, 1kbase. A possibilidade de ácido nucleico interveniente ser deletado não intencionalmente, se o método da invenção não para seguido, é maior quando os primeiro e segundo sítios de recombinação estão próximos. Assim, o método da invenção é mais vantajoso onde os primeiro e segundo sítios de recombinação estão próximos.
[00139] Em uma modalidade, as manipulações genéticas são em um genoma de E. coli, por exemplo, E. coli cepa W3110. A manipulação genética opcionalmente envolve a remoção de um agrupamento de ácido colônico wca e opcionalmente substituindo o mesmo com DNA de inserto, por exemplo, um agrupamento de glicano heterólogo. A manipulação genética opcionalmente envolve a deleção de um gene waaL e, opcionalmente,
29 / 78 substituindo o mesmo com um gene pglB. A manipulação genética opcionalmente envolve a deleção de pelo menos parte de um agrupamento rfb, por exemplo, pelo menos parte de um agrupamento rfb O16. Em uma modalidade, pelo menos 1, 2 ou todos os 3 de um gene waaL, pelo menos parte de um agrupamento rfb e pelo menos parte de um agrupamento de ácido colânico wca são deletados. Em uma modalidade, pelo menos 1, 2 ou todos os 3 ou um gene waaL, pelo menos parte de um agrupamento rfb e pelo menos parte de um agrupamento de ácido colânico wca são substituídos por genes heterólogos, opcionalmente como descrito acima.
[00140] A invenção também divulga um processo para fazer uma proteína glicosilada compreendendo as etapas de; a) cultivar a célula hospedeira da invenção sob condições apropriadas para a produção de proteína glicosilada e b) isolar a proteína glicosilada da cultura.
[00141] A produção de proteínas glicosiladas engenheiradas em células hospedeiras bacterianas pode requerer manipulações múltiplas do polinucleotídeo genômico de célula hospedeira a fim de deletar alguns genes de célula hospedeira e incorporar genes heterólogos codificando as proteínas requeridas para produzir uma proteína glicosilada planejada, por exemplo, um bioconjugado. As manipulações recombinantes múltiplas do genoma da célula hospedeira podem introduzir marcador genéticos múltiplos, que seriam vantajosos remover. Assim, os processos da invenção são particularmente aplicáveis à construção de uma célula hospedeira que é subsequentemente usada para a produção de proteínas glicosiladas, por exemplo, bioconjugados.
[00142] Um aspecto adicional da invenção é um polinucleotídeo genômico procariótico ou um cromossomo eucariótico compreendendo pelo menos duas (por exemplo 3, 4, 5, 6, 7, 8, 9 ou 10) cicatrizes de sítios de recombinação adjacentes a pelo menos duas (por exemplo 3, 4, 5, 6, 7, 8, 9 ou 10) regiões de recombinação, em que cada cicatriz de sítio de recombinação
30 / 78 tem uma diferente sequência polinucleotídica. Tipicamente, o número de cicatrizes de sítios de recombinação é igual ao número de regiões de recombinação.
[00143] Um aspecto adicional da invenção é um processo para engenheirar por engenharia genética uma célula hospedeira compreendendo as etapas de; a) integrar um primeiro cassete polinucleotídico incluindo um primeiro marcador de seleção flanqueado por um primeiro par de sítios de recombinação; b) remover o primeiro marcador de seleção pela ação de uma recombinase que reconhece o primeiro par de sítios de recombinação; c) integrar um segundo cassete polinucleotídico incluindo um segundo marcador de seleção flanqueado por um segundo par de sítios de recombinação; e d) remover o segundo marcador de seleção pela ação de uma recombinase que reconhece o segundo par de sítios de recombinação; em que o primeiro par de sítios de recombinação têm uma sequência de ácido nucleico idêntica e o segundo par de sítios de recombinação têm uma sequência de ácido nucleico idêntica e os primeiro e segundo pares de sítios de recombinação compartilham 90-98% de identidade de sequência de ácido nucleico.
[00144] Em uma modalidade, a recombinase de etapa b) e etapa d) é uma recombinase de FLP, por exemplo, uma recombinase de FLP que tem uma sequência de aminoácido pelo menos 80%, 85%, 90%, 95%, 98%, 99% ou 100% idêntica a SEQ ID NO:7.
[00145] Um aspecto adicional da invenção é uma célula hospedeira engenheirada obtenível pelo processo da invenção.
[00146] Todas as referências ou pedidos de patentes listados neste relatório de patente são incorporadas por referência aqui.
31 / 78
[00147] A invenção é descrita adicionalmente nos seguintes parágrafos:
1. Um método de remover pelo menos duas porções de ácido nucleico de inserto de um polinucleotídeo genômico em uma célula hospedeira, dito método compreendendo as etapas de: a) preparar o polinucleotídeo genômico compreendendo um primeiro ácido nucleico de inserto que é flanqueado por um par de primeiros sítios de recombinação na mesma orientação que são idênticos um ao outro e têm uma primeira sequência de ácido nucleico; b) expor o polinucleotídeo genômico de etapa a) a uma recombinase que reconhece os primeiros sítios de recombinação de modo que os sítios de recombinação idênticos recombinam resultando na excisão do primeiro ácido nucleico de inserto e um dos primeiros sítios de recombinação; c) inserir no polinucleotídeo genômico de etapa b) um segundo ácido nucleico de inserto flanqueado por um par de segundos sítios de recombinação na mesma orientação em que os segundos sítios de recombinação são idênticos um ao outro e têm uma segunda sequência de ácido nucleico que compartilha não mais do que 98% de identidade de sequência com a primeira sequência de ácido nucleico; e d) expor o polinucleotídeo genômico de etapa c) a uma recombinase que reconhece os segundos sítios de recombinação de modo que os sítios de recombinação idênticos recombinam resultando na excisão do segundo ácido nucleico de inserto e um dos segundos sítios de recombinação mas sem a remoção de sequência de polinucleotídeo genômico que não é flanqueado por sítios de recombinação idênticos.
[00148] 2. Um método para remover pelo menos duas porções de ácido nucleico de inserto de um polinucleotídeo genômico em uma célula hospedeira, dito método compreendendo as etapas de: a) preparar o polinucleotídeo genômico compreendendo pelo
32 / 78 menos um primeiro e um segundo ácido nucleico de inserto, em que i) um primeiro ácido nucleico de inserto é flanqueado por primeiros sítios de recombinação na mesma orientação que são idênticos um ao outro e têm uma primeira sequência de ácido nucleico ii) o segundo ácido nucleico de inserto é flanqueado por segundos sítios de recombinação na mesma orientação que são idênticos um ao outro e têm uma segunda sequência de ácido nucleico que compartilha não mais do que 98% de identidade de sequência com a primeira sequência de ácido nucleico e iii) quaisquer sítios de recombinação adicionais têm uma sequência de ácido nucleico que compartilha não mais do que 98% de identidade de sequência com a primeira ou segunda sequências de ácido nucleico; e b) expor o polinucleotídeo genômico a uma recombinase que reconhece os primeiro e segundo sítios de recombinação de modo que os sítios de recombinação idênticos recombinam resultando na excisão do ácido nucleico de inserto flanqueado por sítios de recombinação idênticos, mas sem a remoção de sequência de polinucleotídeo genômico que não é flanqueado por sítios de recombinação idênticos.
[00149] 3. O método de parágrafo 1 ou 2, em que o polinucleotídeo genômico é um polinucleotídeo genômico procariótico ou um plasmídeo.
[00150] 4. O método de parágrafo 1 ou 2 ou 3 em que o polinucleotídeo genômico é um cromossomo eucariótico.
[00151] 5. O método de qualquer um dos parágrafos 1-4 em que o primeiro e segundo ácidos nucleicos de inserto são marcadores de seleção.
[00152] 6. O método de parágrafo 5 em que o primeiro e segundo ácidos nucleicos de inserto são marcadores de seleção codificando proteínas que conferem resistência a ampicilina, canamicina, cloranfenicol, espectinomicina ou gentamicina.
[00153] 7. O método de qualquer um dos parágrafos 2-6 em que etapa a) prepara um polinucleotídeo genômico compreendendo um terceiro ácido
33 / 78 nucleico de inserto que é flanqueado por um conjunto de idênticos terceiros sítios de recombinação tendo uma terceira sequência de ácido nucleico que compartilha não mais do que 98% de identidade de sequência com a primeira sequência de ácido nucleico, segunda sequência de ácido nucleico ou a sequência de ácido nucleico de quaisquer sítios de recombinação adicionais.
[00154] 8. O método de parágrafo 7 em que etapa a) prepara um polinucleotídeo genômico compreendendo um quarto ácido nucleico de inserto que é flanqueado por um conjunto de idênticos quarto sítios de recombinação tendo um quarto sequência de ácido nucleico que compartilha não mais do que 98% de identidade de sequência com a primeira sequência de ácido nucleico, segunda sequência de ácido nucleico, terceiro sequência de ácido nucleico ou a sequência de ácido nucleico de quaisquer sítios de recombinação adicionais.
[00155] 9. O método de parágrafo 8 em que etapa a) prepara um polinucleotídeo genômico compreendendo um quinto ácido nucleico de inserto que é flanqueado por um conjunto de idênticos quinto sítios de recombinação tendo um quinto sequência de ácido nucleico que compartilha não mais do que 98% de identidade de sequência com a primeira sequência de ácido nucleico, segunda sequência de ácido nucleico, terceiro sequência de ácido nucleico, quarto ácido nucleico ou a sequência de ácido nucleico de quaisquer sítios de recombinação adicionais.
[00156] 10. O método de parágrafo 9 em que etapa a) prepara um polinucleotídeo genômico compreendendo um sexto ácido nucleico de inserto que é flanqueado por um conjunto de sextos sítios de recombinação idênticos tendo um sexto sequência de ácido nucleico que compartilha não mais do que 98% de identidade de sequência com a primeira sequência de ácido nucleico, segunda sequência de ácido nucleico, terceiro sequência de ácido nucleico, quarto ácido nucleico, quinto ácido nucleico ou a sequência de ácido nucleico de quaisquer sítios de recombinação adicionais.
34 / 78
[00157] 11. O método de qualquer um dos parágrafos 2-5, em que o polinucleotídeo genômico preparado em etapa a) compreende 3, 4, 5, 6, 7, 8, 9, ou 10 ácidos nucleicos de inserto cada flanqueado com pares idênticos de sítios de recombinação em que cada par de sítios de recombinação compartilha 90%-98% de identidade de sequência com qualquer outro par de sítios de recombinação
[00158] 12. O método de qualquer um dos parágrafos 1-11 em que os sítios de recombinação são de 30-50 pares de base em comprimento, preferivelmente 48 pares de base em comprimento.
[00159] 13. O método de qualquer um dos parágrafos 1-12 em que os sítios de recombinação são reconhecido por uma recombinase, preferivelmente uma FLP-recombinase.
[00160] 14. O método de qualquer um dos parágrafos 1-13 em que o primeiro e segundo ácidos nucleicos de inserto estão situados no polinucleotídeo genômico em que a distância entre o primeiro e segundo ácidos nucleicos de inserto é menor do que 100kb.
[00161] 15. O método de qualquer um dos parágrafos 1-14 em que os primeiro e segundo sítios de recombinação são sítios alvo de reconhecimento de flippase (FRT) ou sítios FRT variantes.
[00162] 16. O método de parágrafo 15 em que o primeiro sítio de recombinação é um sítio FRT tendo a sequência 5’- gaagttcctattccgaagttcctattctctagaaagtataggaacttc-3’ (SEQ ID NO:1).
[00163] 17. O método de qualquer um dos parágrafos 15-16 em que o segundo sítio de recombinação é um sítio FRT variante tendo a sequência de qualquer uma de SEQ ID NO:2, 3, 4, 5 ou 6.
[00164] 18. O método de qualquer um dos parágrafos 1-17 em que em etapa b) o polinucleotídeo genômico é exposto à recombinase por introdução de um gene codificando FLP-recombinase na célula hospedeira.
[00165] 19. O método de parágrafo 18 em que o gene codificando
35 / 78 FLP-recombinase tem uma sequência de ácido nucleico pelo menos 80% idêntica à sequência de SEQ ID NO:12.
[00166] 20. O método de parágrafo 18 em que a FLP-recombinase tem uma sequência de aminoácido pelo menos 80% idêntica à sequência de SEQ D NO:11.
[00167] 21. O método de qualquer um dos parágrafos 18-20, em que o gene codificando FLP-recombinase é introduzido na célula hospedeira em um plasmídeo sob o controle de um promotor indutível ou um promotor constitutivo.
[00168] 22. O método de parágrafo 21 em que o plasmídeo contém um gene de FLP-recombinase sob o controle de um promotor indutível.
[00169] 23. O método de parágrafo 21 em que o plasmídeo é pCP20, tendo a sequência de ácido nucleico de SEQ ID NO:12.
[00170] 24. O método de qualquer um dos parágrafos 1-23 em que o ácido nucleico inerte codifica pelo menos um marcador de seleção.
[00171] 25. O método de parágrafo 24 em que pelo menos 2, 3, 4, 5 ou 6 ácidos nucleicos de inserto codificam, cada, um marcador de seleção.
[00172] 26. O método de qualquer um dos parágrafos 1-25 em que o polinucleotídeo genômico é de uma espécie Escherichia, Neisseria, Shigella, Klebsiella, Xhantomonas, Salmonella, Yersinia, Lactococcus, Lactobacillus, Pseudomonas, Corynebacterium, Streptomyces, Streptococcus, Staphylococcus, Bacillus ou Cperdidoridium.
[00173] 27. O método de parágrafo 26 em que o polinucleotídeo genômico é de E. coli.
[00174] 28. A célula hospedeira compreendendo um polinucleotídeo genômico preparado pelo método de qualquer um dos parágrafos 1-27.
[00175] 29. Um polinucleotídeo genômico de célula hospedeira compreendendo uma primeira região engenheirada por recombinação e uma segunda região engenheirada por recombinação, em que um primeiro sítio de
36 / 78 recombinação único é adjacente à primeira região engenheirada por recombinação, e um segundo sítio de recombinação único é adjacente à segunda região engenheirada por recombinação, em que os primeiro e segundo sítios de recombinação têm sequências nucleotídicas que compartilham 90-98% de identidade uma com a outra e opcionalmente com a sequência de ácido nucleico de quaisquer sítios de recombinação adicionais presentes no polinucleotídeo genômico de célula hospedeira.
[00176] 30. O polinucleotídeo genômico de célula hospedeira de parágrafo 29 em que as primeira e segunda regiões engenheiradas por recombinação são regiões em que parte do genoma da célula hospedeira foi removida.
[00177] 31. O polinucleotídeo genômico de célula hospedeira de parágrafo 29 ou 30 em que as primeira e segunda regiões engenheiradas por recombinação são regiões em que um segmento de ácido nucleico adicional de acima de 20, 50, 100, 200, 300, 400 ou 500 pares de base em comprimento foi inserido.
[00178] 32. O polinucleotídeo genômico de célula hospedeira de qualquer uma de parágrafos 29-31 em que os primeiro e segundo sítios de recombinação e sítios de recombinação para uma recombinase.
[00179] 33. O polinucleotídeo genômico de célula hospedeira de parágrafo 32 em que a recombinase é uma recombinase de FLP.
[00180] 34. O polinucleotídeo genômico de célula hospedeira de parágrafo 33 em que a recombinase de FLP tem a sequência de aminoácido de SEQ ID NO:11.
[00181] 35. O polinucleotídeo genômico de célula hospedeira de qualquer uma de parágrafos 29-34 em que os primeiro e segundo sítios de recombinação são de 30-50 pares de base em comprimento, preferivelmente 48 pares de base em comprimento.
[00182] 36. O polinucleotídeo genômico de célula hospedeira de
37 / 78 parágrafo 35 em que o primeiro sítio de recombinação tem uma sequência de ácido nucleico de qualquer uma de SEQ ID NO:1-10.
[00183] 37. Uma célula hospedeira compreendendo um polinucleotídeo genômico de célula hospedeira contendo uma primeira região engenheirada por recombinação e uma segunda região engenheirada por recombinação, em que uma cicatriz do primeiro sítio de recombinação é adjacente à primeira região engenheirada por recombinação e uma cicatriz do segundo sítio de recombinação é adjacente à segunda região engenheirada por recombinação; em que as cicatrizes do primeiro e do segundo sítio de recombinação têm diferentes sequências polinucleotídicas que são menos que 98% idênticas uma a outra e opcionalmente menos que 98% idênticas à sequência polinucleotídica de qualquer cicatriz de sítio de recombinação recombinação adicional presente no polinucleotídeo genômico de célula hospedeira.
[00184] 38. A célula hospedeira de parágrafo 37 em que as primeira e segunda regiões engenheiradas por recombinação são regiões em que parte do genoma da célula hospedeira foi removida.
[00185] 39. A célula hospedeira de parágrafo 37 ou 38 em que as primeira e segunda regiões engenheiradas por recombinação são regiões em que um segmento de ácido nucleico adicional de acima de 20, 50, 100, 200, 300, 400 ou 500 pares de base em comprimento foi inserido.
[00186] 40. A célula hospedeira de qualquer uma de parágrafos 37-39 em que os primeiro e segundo sítios de recombinação são sítios de recombinação para uma recombinase.
[00187] 41. A célula hospedeira de parágrafo 40 em que a recombinase é uma recombinase de FLP.
[00188] 42. A célula hospedeira de parágrafo 41 em que a recombinase de FLP tem a sequência de aminoácido de SEQ ID NO:11.
[00189] 43. A célula hospedeira de qualquer uma de parágrafos 37-42 em que os primeiro e segundo sítios de recombinação são de 30-50 pares de
38 / 78 base em comprimento, preferivelmente 48 pares de base em comprimento.
[00190] 44. A célula hospedeira de parágrafo 43 em que o primeiro sítio de recombinação tem uma sequência de ácido nucleico de qualquer uma de SEQ ID NO:1-10.
[00191] 45. A célula hospedeira de qualquer uma de parágrafos 37-44 em que os primeiro e segundo sítios de recombinação são separados por menos do que 100kbases, 75kbases, 50kbases, 25kbases, 10kbases, 5kbases, 4kbases, 3kbases, 2kbases ou 1 kbase.
[00192] 46. A célula hospedeira de parágrafo 45 em que os primeiro e segundo sítios de recombinação são separados por menos do que 5kbases.
[00193] 47. Um polinucleotídeo genômico procariótico ou um cromossomo eucariótico compreendendo pelo menos duas cicatrizes de sítio de recombinação recombinação adjacentes a pelo menos duas regiões engenheiradas por recombinação, em que cada cicatriz de sítio de recombinação tem uma diferente sequência polinucleotídica.
[00194] 48. Um processo para engenheirar por engenharia genética uma célula hospedeira compreendendo as etapas de; a) integrar um primeiro cassete polinucleotídico incluindo um primeiro marcador de seleção flanqueado por um primeiro par de sítios de recombinação; b) remover o primeiro marcador de seleção pela ação de uma recombinase que reconhece o primeiro par de sítios de recombinação; c) integrar um segundo cassete polinucleotídico incluindo um segundo marcador de seleção flanqueado por um segundo par de sítios de recombinação; e d) remover o segundo marcador de seleção pela ação de uma recombinase que reconhece o segundo par de sítios de recombinação; em que o primeiro par de sítios de recombinação têm uma sequência de ácido nucleico idêntica e o segundo par de sítios de
39 / 78 recombinação têm uma sequência de ácido nucleico idêntica e os primeiro e segundo pares de sítios de recombinação compartilham 90-98% de identidade de sequência de ácido nucleico.
[00195] 49. O processo de parágrafo 48 em que a recombinase de etapa b) e d) é uma recombinase de FLP
[00196] 50. O processo de parágrafo 49 em que a recombinase de FLP tem uma sequência de aminoácido pelo menos 80% idêntica a SEQ ID NO:11.
[00197] 51. Uma célula hospedeira engenheirada obtenível pelo processo de qualquer uma de parágrafos 48 - 50.
[00198] 52. Uma célula hospedeira engenheirada compreendendo cópias únicas de pelo menos 2, 3, 4, 5, 6, 7, 8, 9 ou 10 sítios de recombinação no polinucleotídeo genômico de célula hospedeira, em que cada sítio de recombinação tem uma sequência nucleotídica que é menos do que 98% idêntica aos outros sítios de recombinação.
[00199] 53. A célula hospedeira engenheirada de parágrafo 52 em que os pelo menos 2 sítios de recombinação são sítios FRT.
[00200] 54. A célula hospedeira engenheirada de parágrafo 52 ou reivindicação 53 em que os pelo menos 2 sítios de recombinação são separados por menos do que 100kb, 75kb, 50kb, 25kb, 10kb, 5kb, 3kb ou 1kb no polinucleotídeo genômico de célula hospedeira.
[00201] 55. Uma célula hospedeira engenheirada Gram negativa em que pelo menos parte de um agrupamento rfb nativo e pelo menos parte de um agrupamento de ácido colânico wca foram deletadas enquanto mantendo intacto um promotor do agrupamento rfb.
[00202] 56. A célula hospedeira engenheirada Gram negativa de parágrafo 53 em que um gene waaL é também deletado.
[00203] 57. A célula hospedeira engenheirada Gram negativa de parágrafo 53 ou 54 em que a célula hospedeira gram negativa é E. coli.
40 / 78
[00204] 58. A célula hospedeira engenheirada Gram negativa de qualquer uma de parágrafos 53-55 em que pelo menos parte do agrupamento rfb nativo é substituída com um agrupamento de glicano heterólogo.
[00205] 59. A célula hospedeira engenheirada Gram negativa de qualquer uma de parágrafos 53-56 em que o gene waaL é substituído com um pglB gene.
[00206] 60. A célula hospedeira de qualquer uma de parágrafos 28 ou 37-46 ou 51-59 em que a célula hospedeira é engenheirada para expressar a) uma oligossacariltransferase, por exemplo, PglB ou PglL; b) um agrupamento de glicano heterólogo, por exemplo, um agrupamento rfb ou um agrupamento de genes codificando glicosiltransferases requeridas para sintetizar um polissacarídeo capsular; e uma proteína contendo um sítio de glicosilação reconhecido pela oligossacariltransferase, por exemplo, uma sequência de consenso otimizada divulgada em WO 06/119987 (reivindicação 1)
[00207] 61. Um processo para fazer uma proteína glicosilada compreendendo as etapas de: i) cultivar a célula hospedeira de parágrafo 60 sob condições apropriadas para a produção de proteína glicosilada e ii) isolar a proteína glicosilada da cultura.
[00208] Para que esta invenção possa ser melhor compreendida, os seguintes exemplos são apresentados. Esses exemplos são apenas para fins ilustrativos, e não devem ser interpretados como limitativos do escopo da invenção de nenhum modo.
EXEMPLOS Exemplo 1: Uso de dois pares de FRT alternativos em ocasião de construção de cepa para produção de conjugado capsular de polissacarídeo de S. pneumoniae sorotipo 33F
[00209] Cepa stGVXN8661 é um derivado de Escherichia coli W3110 que contém várias engenheirações genômicas envolvendo o uso de FRTwt de
41 / 78 modo que FRTwt único estava presente em três posições no DNA genômico, adjacente à sítios de eventos recombinantes.
[00210] Manipulação genômica adicional foi usada para deletar genes adicionais de stGVXN8661 enquanto mantendo o resto do genoma intacto. O marcador de seleção precisa ser removido a fim de permitir outra engenheiração da cepa.
[00211] Primeiras etapas com relação à construção de plasmídeos pDOC para uso para a deleção. p3910 e p3911 foram preparados como a seguir. Um inserto foi gerado resultando a partir de uma PCR de montagem usando dois produtos PCR e pares de oligonucleotídeos para clonagem de HR2 e do cassete clmR no plasmídeo pDOC-C doador. Um produto PCR foi gerado a partir de pKD3 (GenBank: AY048742.1) usando oligonucleotídeos codificando um cassete clmR e sítios FRTwt e outro foi a região de homologia 3’ derivada de PCR de DNA genômico W3110 com oligonucleotídeos. O DNA montado foi cortado usando BamHI/EcoRI e clonado nos mesmos sítios em pDOC-C, resultando em p482. Um produto PCR da região 5’ de homologia foi, então, gerado usando DNA cromossômico W3110 e oligonucleotídeos, cortados com BamHI e SpeI e clonados nos sítios SpeI/BamHI de p482, resultando em p562. A sequência nucleotídica de um sítio de clonagem múltipla obtido por anelamento de oligonucleotídeos 5’- fosforilados foi clonado via NheI e BamHI em p562, resultando em p1043. Cassete de resistência a canamicina (kanR) flanqueado por dois sítios FRT3 foi sintetizado e clonado em pUC57 (GenBank: Y14837.1) por Genewiz LCC, resultando em p3268. O fragmento NdeI/BstBI de p3268 contendo FRT3-kanR-FRT3 foi clonado em p1043, substituindo FRTwt-clmR-FRTwt, resultando em p3602. A região 5’ de homologia de p1043 e p3602 foi substituída por clonagem via SpeI/NheI, uma nova região 5’ de homologia de 1276-bp, resultando em p3910 e p3911, respectivamente.
[00212] p3910 e p3911 codificam as regiões de homologia 5’ e 3’ com
42 / 78 um MCS e um cassete de resistência clmR invertido flanqueado por dois sítios FRTwt, e um cassete de resistência a kanR flanqueado por dois sítios FRT3, respectivamente entre os mesmos. Os plasmídeos resultantes foram o plasmídeo doador para a deleção da sequência genômica selecionada e sua substituição com FRTwt-clmR-FRTwt ou com FRT3-kanR-FRT3.
[00213] Para a deleção um plasmídeo auxiliar é necessário. Uma variante de pTKRED (GenBank: GU327533.1) p2824 foi usada.
[00214] Deleções e seleção. Procedimentos de duas deleções paralelas foram realizados em cepa stGVXN8661. Os dois procedimentos diferem para o uso de p3910 ou p3911 como plasmídeos doadores, e para a resistência aplicada para a seleção: cloranfenicol quando p3910 foi usado e canamicina quando p3911 foi usado. Cepa stGVXN8661 foi co-transformada com p2824 e o plasmídeo doador via eletroporação. Devido ao fenótipo de replicação sensível a temperatura de p2824, células resultantes foram cultivadas a 30°C o tempo todo em LB suplementado com espectinomicina para seleção de p2824 e com cloranfenicol ou canamicina para seleção de p3910 e p3911, respectivamente. Os plasmídeos foram inseridos nas células aceitadoras para permitir a expressão das enzimas codificadas no plasmídeo auxiliar na presença do DNA plasmídeo doador dentro da mesma célula.
[00215] A seguir, o procedimento de inserção foi realizado. As cepas recentemente transformadas foram cultivadas em meio TSB na presença de ampicilina e espectinomicina a 30°C em escala de 5 ml durante a noite a 180 rpm. 50 ȝl da cultura densa foram transferidos para um novo tubo contendo 1 ml TSB suplementado com espectinomicina e cloranfenicol ou canamicina. A nova cultura foi, então, cultivada a 180 rpm durante 2 h a 30°C, as células foram centrifugadas a 4000 rpm durante 15 minutos a 4°C, e o sobrenadante foi substituído por meio TSB suplementado com spec, 0,2% arabinose (p/v), e 1 mM IPTG. A composição de meio sustenta seleção de plasmídeo auxiliar, e expressão de recombinase e SceI endonuclease para permitir inserção. As
43 / 78 células recolocadas em suspensão e ainda incubadas a 30°C durante 3 h a 180 rpm. 50 ȝl desta cultura foram usados para inocular 1 ml TSB suplementado com 0,2% arabinose (p/v), e 1 mM IPTG, que foi cultivado durante a noite a 30°C a 180 rpm. A ausência de resistência nesta etapa intensificou a perda do plasmídeo auxiliar.
[00216] 0,5 ml da cultura foi colocado em placas TSB suplementadas com clm ou kan, dependendo do plasmídeo doador usado (para seleção do inserto de DNA) e 10 % (p/v) sacarose (para contra-seleção contra o plasmídeo doador) e incubado a 37°C durante a noite (para selecionar a perda do plasmídeo auxiliar sensível a temperatura).
[00217] Um ‘tapete’ de células apareceu para ambos os procedimentos. Listras foram feitas em placas TSB suplementadas com clm ou kan, dependendo do plasmídeo doador usado e novamente incubadas a 37°C durante a noite.
[00218] Para triar as colônias resultantes para o fenótipo de inserção correto, colônias únicas das listras riscadas foram colocadas em placas em réplica sobre placas LB suplementadas, com spec, amp, ou clm quando p3910 foi usado ou sobre placas LB suplementadas, com spec, amp, ou kan, quando p3911 foi usado. Colônias resistentes a clm ou kan (para presença do inserto), mas sensíveis para amp e spec (para ausência dos plasmídeos doador e auxiliar) foram analisadas adicionalmente para a inserção.
[00219] Para confirmar que a cepa perdeu o DNA substituído se originando de W3110, e continha o inserto de DNA, PCR de colônia foi realizada. Colônias candidatas com o fenótipo correto foram pegas e sofreram um teste de PCR de colônia. Três PCR foram executadas. i) Uma PCR amplifica a região no 5’ do DNA inserido apenas se a recombinação ocorreu corretamente. Os oligonucleotídeos usados são 4897/3233 para integração com p3910 e 4897/4363 para integração com p3911. ii) Um PCR amplifica a região no 3’ do DNA inserido apenas se a recombinação ocorreu
44 / 78 corretamente. Oligonucleotídeos usados são 3315/3208 para integração com p3910 e 4364/3208 para integração com p3911. iii) Um PCR amplifica a região genômica que foi substituída, significando que a cepa corretamente engenheirada não deveria dar qualquer produto enquanto a cepa não engenheirada deveria. Oligonucleotídeos usados são 3213/3208. Vários clones de ambas as integrações mostraram o padrão de PCR correto (PCR i e ii positivo, PCR iii negativo). As cepas resultantes foram designadas st8661 ǻ::FRTwt-clmR-FRTwt (st10851) quando p3910 foi usado como um plasmídeo doador e st8661 ǻ::FRT3-kanR-FRT3 (st10852) quando p3911 foi usado como um plasmídeo doador.
[00220] A seguinte etapa é a remoção da resistência a antibiótico das cepas integradas para obter uma deleção ‘sem marcador’ de wbbIL. As duas cepas obtidas foram transformadas com o plasmídeo pCP20 sensível à temperatura expressando a recombinase de FLP [1] e colocado em placas LB suplementadas, com ampicilina para selecionar pCP20. Placas foram incubadas durante a noite a 30°C a fim de permitir a replicação do plasmídeo. 5 ml de culturas LB foram inoculados com listras das placas e cultivados durante a noite a 42°C para assegurar perda de pCP20. Diluições em série das culturas noturnas foram colocadas em placas LB. Colônias únicas foram replicadas em placas LB suplementadas, com ampicilina, cloranfenicol, ou sem antibióticos quando derivadas de st8661 ǻ::FRTwt-clmR-FRTwt ou em placas LB suplementadas, com ampicilina, canamicina, ou sem antibióticos quando derivadas de st8661 ǻ::FRT3-kanR-FRT3. Em ambos os casos, 100% das colônias cresceram somente em placas desprovidas de antibióticos, indicando que, em ambas as situações, o cassete de resistência foi removido pela recombinase de FLP codificada por pCP20.
[00221] A fim de entender se o DNA removido de FLP foi limitado a cassete de resistência inserido flanqueado por FRT, uma PCR de colônia foi realizada. Os oligonucleotídeos 4897/2174 usados resultam em um produto de
45 / 78 2781-bp se a resistência for removida e as regiões de borda estão presentes. Não são esperadas bandas se a região entre o FRT recentemente inserido e o FRTwt presentes no a montante wca locus é perdido. Foi observada a banda corrente somente quando a resistência foi removida de ǻ::FRT3-kanR-FRT3, indicando que a reatividade cruzada de FRT não ocorre entre o sítio FRTwt site do locus wca e o FRT3 recentemente introduzido. Inversamente, quando FRTwt é introduzido, reatividade cruzada com os outros sítios FRTwt presentes no locus wca provoca a perda de material genômico entre os dois sítios. A cepa resultante de cassete de resistência a canamicina de st8661 ǻ::FRT3-kanR-FRT3 (st10852) é chamada st10853.
[00222] Para verificar se a produção de glicoconjugado Sp33F por cepa st10852 e st10853 é comparável ao observado em st8661, o seguinte experimento foi realizado. Cepas st8661, st10852, e st10853 foram transformadas via eletroporação com plasmídeos 3914, codificando a proteína carreadora, rcsA de E. coli K30, regulador de comprimento de cadeia, wzy, todos sob promotor indutível IPTG, e com plasmídeo 3750, codificando genes constitutivamente expressados wchA, e genes de wciB para wzy do agrupamento 33F. As células de produção foram inoculadas em 5 ml de meio TB-dev suplementado com 10 mM MgCl2, espectinomicina, e tetraciclina e cultivadas durante a noite a 37°C em fase estacionária. Células foram então diluídas a um OD600 de 0,05 em 50 ml TBdev contendo 10 mM MgCl2, espectinomicina, tetraciclina, e 0,01 mM IPTG. Após 6 horas, 0,09 IPTG foi adicionado às culturas, que foram então cultivadas durante a noite a 37°C. IPTG dirige a expressão dos elementos codificados em p3814 (incluindo a proteína carreadora e rcsA, que dirige a expressão do agrupamento de polissacarídeo capsular 33F no locus wca), e o pglB integrado no genoma. Células foram então colhidas por centrifugação e extratos de células periplásmicos foram preparados usando o método Lysozyme [2]. Os extratos periplásmicos (normalizados a OD600) foram separados por SDS PAGE e
46 / 78 analisados por immunoblotting após eletrotransferência (Figura 1). Detecção com o antissoro anti His (painel esquerdo) e antissoro anti 33F (painel direito) mostram, ambos, um padrão claro semelhante a escada entre 70 a 170 kDa para todas as amostras, fortemente indicativo de glicoproteínas consistindo da proteína carreadora e polissacarídeo 33F. A quantidade e a qualidade do glicoconjugado obtido de st10852 e de st10853 é comparável às observadas em st8661. Isto indica que os genes a montante da região deletada ainda estão presentes e ativos.
[00223] Cepa st10853 foi usada para produção em escala de biorreator de bioconjugado 33F. Além disso, o genoma da cepa foi adicionalmente engenheirado via um procedimento análogo, e uma cepa livre de resistência final foi obtida. Exemplo 2: Estudo sistemático sobre o uso de sítios FRT alternativos para excisão contemporânea de cassetes de resistência vizinhos
[00224] Uma série de derivados de E. coli W3110 foi construída, diferindo apenas da presença de sequências alternativas de FRT. Em primeiro lugar, o agrupamento O16 rfb foi substituído por um cassete de resistência a gentamicina gntR, na mesma orientação do agrupamento substituído, seguido por um cassete de resistência a cloranfenicol clmR na orientação oposta e encerrado entre dois sítios FRTwt. Em segundo lugar, seis recombinações homólogas paralelas foram realizadas a fim de substituir o agrupamento wca de ácido colânico com um cassete de resistência a canamicina kanR na orientação oposta do agrupamento substituído, encerrado entre dois sítios FRTwt, FRT3, FRT10, FRT13, FRT14, e FRT15, resultando em cepa 10175, 10176, 10177, 10178, 10179, e 10180, respectivamente.
[00225] As seis cepas são capazes de crescer em meio contendo canamicina, gentamicina, e cloranfenicol. Figura 2 descreve a organização genética dos loci wca e rfb nas seis cepas.
[00226] A fim de avaliar o grau de reatividade cruzada do sítio FRTwt
47 / 78 com os sítios alternativos de FRT, um protocolo de remoção do cassete de resistência foi aplicado nas seis cepas. as cepas foram transformadas com o plasmídeo pCP20 sensível à temperatura expressando a recombinase de FLP
[1] e colocadas em placas LB suplementadas, com ampicilina para selecionar pCP20. Placas foram incubadas durante a noite a 30°C a fim de permitir a replicação do plasmídeo. 5 ml de culturas LB foram inoculados com listras das placas e cultivados durante o fim de semana a 37°C para assegurar perda de pCP20. Diluições em série das culturas densas foram colocadas em placas LB. Sessenta colônias isoladas por recombinação foram replicadas em placas LB suplementadas, com ampicilina, canamicina, cloranfenicol, gentamicina, ou sem antibióticos e cultivadas durante a noite a 37°C.
[00227] No caso de reação cruzada entre os sítios FRT flanqueando o cassete de cloranfenicol e os flanqueando o cassete de resistência a canamicina, a perda de resistência contra canamicina, gentamicina, e cloranfenicol é esperada. No caso de falta de reatividade cruzada, resistência a gentamicina deveria ser retida, enquanto resistência a canamicina e cloranfenicol deveria ser perdida. A persistência da resistência de canamicina pode ser explicada com eficácia sub-ótima dos sítios FRT flanqueando o cassete correspondente. Persistência da resistência a cloranfenicol pode ser explicada ou por uma eficácia sub-ótima do par de FRTwt, ou pela retenção de pCP20, que é tanto resistente a ampicilina como a cloranfenicol. No último cenário, persistência concomitante da resistência a ampicilina é esperada.
[00228] O padrão de resistência dos clones replicados foi observado e é resumido na tabela 1. Em geral, cinco diferentes padrões fenotípicos foram observados, ignorando a situação de resistência a ampicilina: padrão A: o clone é resistente a canamicina, gentamicina, e cloranfenicol, indicando falta completa de atividade de recombinase de FLP em ambos pares de FRT; padrão B: sem deixar resistência, indicando reação cruzada não específica entre os dois pares de FRT; padrão C: resistência a canamicina e gentamicina,
48 / 78 indicando atividade defeituosa de recombinase de FLP no par de FRT flanqueando kanR; padrão D: resistência a cloranfenicol e gentamicina, indicando ou atividade defeituosa da recombinase de FLP sobre o par de FRTwt flanqueando clmR ou remoção específica correta de kanR e clmR sem reação cruzada entre os pares de FRT flanqueando clmR e kanR, mas persistência de plasmídeo pCP20; padrão E: resistência a gentamicina apenas, indicando remoção específica correta de kanR e clmR sem reação cruzada os pares de FRT flanqueando clmR e kanR. Tabela 1. Padrões de resistência observados após remoção da resistência mediada por FLP em seis diferentes cepas. N. de colônias por placa de antibióticos. Tot: 60 N. de colônias pertencendo a colônias por FRT padrão de resistência. Tot: 60 colônias por FRT kanR- %a FRT‘sfla AmpR KanR ClmR GntR A B C D E nqueand o kanR- FRTwt 0 0 0 4 0 56 0 0 4 7 FRT3 28 0 26 60 0 0 0 27 33 55 a 98 FRT10 7 4 4 60 0 0 4 4 52 87 a 93 FRT13 20 10 19 59 1 1 9 18 31 52 a 82 FRT14 5 0 1 60 0 0 0 1 59 98 a 100 FRT15 0 14 0 60 0 0 14 0 46 77 a) Porcentagem de colônias com apenas cassete de gentamicina deixado.
[00229] Padrão A (nenhuma resistência removida) foi observado apenas para um clone quando cepa 10178, onde kanR é flanqueado por sítios FRT13, foi usada. Padrão B (todas as resistências removidas) foi quase exclusivamente observado para cepa 10175, onde kanR é flanqueado por FRTwt, representando 93% de clones para a remoção de resistência desta cepa. A única exceção é um clone derivado de cepa 10178, onde FRT13 flanqueia kanR. Padrão E (somente resistência a gentamicina deixada) foi sempre observado em mais do que 50% de casos para todas as cepas para sítios alternativos FRT flanquearem kanR, enquanto somente 7% dos clones derivados de cepa 10175 (FRTwt flanqueando ambos clmR e kanR) mostram
49 / 78 este padrão. Padrão C (resistência a canamicina e gentamicina deixada) foi observado em poucos casos quando FRT10, FRT13, e FRT15 flanqueiam kanR. Isto pode indicar uma eficiência levemente inferior da recombinase de FLP atuando sobre estes sítios específicos FRT. Padrão D (resistência a gentamicina e cloranfenicol deixada), foi observado em vários casos quando FRT3, FRT10, FRT13 e FRT14 flanqueiam kanR. Com a exceção de um clone derivado de st10176 (FRT3) todos os clones apresentando padrão D são também resistentes a ampicilina, sugerindo uma elevada probabilidade de que o fenótipo resistente a cloranfenicol é devido à persistência de pCP20 em vez de uma remoção defeituosa de clmR.
[00230] Estes resultados mostram que a perda de DNA entre os pares FRTwt vizinhos é altamente provável (93% dos casos), enquanto a probabilidade diminui significativamente se um dos dois pares FRTwt for substituído por um par de locais FRT alternativos. A excisão da resistência à gentamicina foi observada apenas em um caso em 300 quando qualquer um dos locais alternativos de FRT estava flanqueando kanR, sublinhando a especificidade da reação catalisada por FLP. A porcentagem de padrão genético correto (apenas o cassete de gentamicina restante) quando locais alternativos de FRT foram usados pode ser inferida a partir do fenótipo. O padrão fenotípico E só pode ser explicado com o cenário genético no qual ocorreu uma remoção específica correta das duas cassetes, enquanto o padrão fenotípico D pode ser explicado pelo mesmo (somente quando a resistência à ampicilina também está presente) ou pela falta de excisão de clmR. Assim, os clones pertencentes ao padrão fenotípico E representam o número mínimo possível de clones nos quais a remoção específica correta de ambos clmR e kanR sem perda de gntR, enquanto os clones pertencentes ao padrão E + D representam o número máximo possível de clones nos quais essa organização genética existe. A Tabela 1 resume a porcentagem de clones com o padrão genético correto, levando em consideração essas considerações.
50 / 78
[00231] Para confirmar a organização genética dos agrupamentos após a remoção da resistência mediada por FLP, foi realizada uma PCR de colônia em clones selecionados pertencentes a diferentes padrões fenotípicos para cada cepa testada. O uso de oligonucleotídeos 3206/3208 resulta em um produto de 7922 pb se nenhuma resistência tiver sido removida, em um produto de 3388 pb se toda a região genômica entre os dois sítios FRT tiver sido removida, em um produto de 6990 pb se apenas clmR for excisado, em um produto de 6550 pb, se apenas kanR for excisado, e em um produto de 5618 pb, se for atingido o padrão desejado no qual resta apenas gntR. Todos os clones testados pertencentes ao padrão D mostram a banda correspondente à excisão de ambos clmR e kanR, e não apenas à excisão de kanR. Os comprimentos de produto observados para clones que mostram padrões de resistência inequívocos (A, B, C ou E) correspondem ao único padrão genético inferido possível, com as seguintes exceções. Dois dentre os quatro clones mostrando padrão E derivado das cepas em que FRTwt flanqueia ambos clmR e kanR foram testados, mas nenhum produto de PCR foi observado. Quatro clones pertencentes ao padrão E da cepa 10179 (FRT14) foram testados e um deles não mostrou nenhum produto de PCR. A única colônia pertencente ao padrão A, quando sítios FRT alternativos foram usados, deriva da cepa contendo FRT13 e mostra um produto de ajuste de comprimento com a remoção apenas de clmR (6990 pb), em vez da banda esperada de 7922 pb, observada no controle, quando nenhuma resistência é removida. Um clone derivado da cepa com FRT13 mostrou padrão fenotípico C, mas a PCR mostra uma banda de comprimento correspondendo à remoção de ambos clmR e kanR ao contrário (Figura 3).
[00232] Um clone derivado da cepa portando apenas FRTwt com padrão B, um clone derivado da cepa portando FRT3 com padrão E, um clone derivado da cepa FRT10 cepa portando com padrão E, um clone derivado da cepa portando FRT10 com padrão C, um clone derivado da cepa portando
51 / 78 FRT13 com padrão E, um clone derivado da cepa portando FRT13 com padrão B, um clone derivado da cepa portando FRT14 com padrão E, e um clone derivado da cepa portando FRT15 com padrão E foram armazenados e chamados 10247, 10248, 10249, 10250, 10251, 10252, 10253, 10254, respectivamente. Para estas 8 cepas, genoma foi isolado e uma PCR usando oligonucleotídeos 3206/3208 foi realizado. Os produtos de PCR foram purificados e sequenciados. Os comprimentos obtidos do produto (Figura 4) e os resultados do sequenciamento obtidos confirmam, adicionalmente, a organização genômica esperada. Na única cepa em que uma remoção completa do material genômico entre os dois pares de FRT é observada, quando usando um sítio FRT alternativo (FRT13, cepa 10525), o único sítio FRT deixado é FRTwt.
[00233] Este experimento prova que usar sítios FRT alternativos é uma abordagem válida e eficaz para a excisão dos cassetes de resistência a partir das regiões genômicas vizinhas e próximas de um sítio FRTwt já existente sem perda do DNA encerrado. Exemplo 3: Uso de sítios FRT alternativos durante o desenvolvimento da cepa para uma produção adicional de conjugado de polissacarídeo capsular sorotipo S. pneumoniae s
[00234] Cepa stGVXN9876 é um derivado de Escherichia coli W3110 que contém várias engenheirações genômicas envolvendo o uso de FRTwt de modo que cópias únicas de FRTwt estavam presente em três posições no DNA genômico, adjacente aos sítios de eventos recombinantes.
[00235] O objetivo da manipulação genômica foi adicionar cópias de glicosil transferases a partir de um agrupamento de glicano S. pneumoniae e de de gne epimerase de C. jejuni.
[00236] As primeiras etapas com relação à construção de plasmídeos pDOC para uso para a substituição. p3408 foi preparado como a seguir. Um produto PCR da região de homologia 5’ (contendo 1,2 kb a montante do
52 / 78 primeira gene do agrupamento wca, wza) foi obtido a partir de E. coli W3110 genoma usando oligonucleotídeos, e clonado em sítios EcoRI/XhoI de pDOC- C, resultando em p693. Um produto PCR da região de homologia 3’ (contendo 1,2 kb a jusante do último gene do agrupamento wca, wcaM) foi obtido a partir do genoma de E. coli W3110 usando os oligonucleotídeos e clonado nos sítios BcuI/NheI de p693, resultando em p699. Um sítio de clonagem múltipla foi clonado em sítios AscI/BamHI de p699, resultando em p3259. Plasmídeo 3914 foi obtido de Genewiz LCC como um serviço de síntese de genes. O produto PCR de p3914 com oligonucleotídeos 4110/4111, contendo um cassete de resistência a canamicina kanR, flanqueado por dois sítios FRT13, foi clonado no sítio HindIII de p3259, resultando em p3306. Plasmídeo 3256 codifica genes codificando glicosiltransferases de S. pneumoniae se originando de PCR no agrupamento glicano de S. pneumoniae sob controle do promotor sintético J23114 e seguido pelo terminador transcricional rrnb T2. Este cassete de expressão foi amplificado e clonado em sítios PacI/XmaI de p3375, na direção oposta relativa a kanR. Plasmídeo 207, codificando gne previamente amplificado de genoma de Campylobacter jejuni, foi usado como um gabarito para uma PCR. O amplicon resultante contém o promotor sintético J23100, adicionado com um oligonucleotídeo, gne a montante, e foi clonado no sítio SbfI/XmaI de p3375, resultando em p3408.
[00237] p3408 codifica as regiões de homologia 5’ e 3’ para inserção em agrupamento wca e entre os mesmos, na orientação oposta, os seguinte elementos: promotor J23114, genes glicosiltransferase de S. pneumoniae, terminador T2 de rrnb, promotor J23100, gne.
[00238] Para a substituição, cepa 9876 foi co-transformada com pTKRED (GenBank: GU327533.1) e o plasmídeo doador p3408 via eletroporação. Devido ao fenótipo de replicação sensível à temperatura de pTKRED, células resultantes foram cultivadas a 30°C o tempo todo em LB
53 / 78 suplementado com espectinomicina para seleção de pTKRED e com canamicina para seleção de p3408. Os plasmídeos foram inseridos nas células aceitadoras para permitir a expressão das enzimas codificadas no plasmídeo auxiliar na presença do DNA plasmídeo doador dentro da mesma célula.
[00239] A seguir, o procedimento de inserção foi realizado. A cepa recentemente transformada foi cultivada em Meio TSB na presença de canamicina e espectinomicina a 30°C em escala de 5 ml durante a noite a 180 rpm. 50 ȝl da cultura densa foram transferidos para um novo tubo contendo 1 ml TSB suplementado com espectinomicina e canamicina. A nova cultura foi, então, cultivada a 180 rpm durante 2 h a 30°C, as células foram centrifugadas a 4000 rpm durante 15 minutos a 4°C, e o sobrenadante foi substituído por meio TSB suplementado com spec, 0,2% arabinose (p/v), e 1 mM IPTG. A composição de meio sustenta seleção de plasmídeo auxiliar, e expressão de recombinase e SceI endonuclease para permitir inserção. As células foram recolocadas em suspensão e ainda incubadas a 30°C durante 3 h a 180 rpm. 0,5 ml da cultura foi colocado em placas TSB suplementadas com kan (para seleção do inserto de DNA) e 10 % (p/v) sacarose (para contra-seleção contra o plasmídeo doador) e incubadas a 37°C durante a noite (para selecionar a perda do plasmídeo auxiliar sensível a temperatura). Um ‘tapete’ de células apareceu. Listras foram feitas em placas TSB suplementadas com kan e incubadas a 37°C durante a noite.
[00240] Para triar as colônias resultantes para o fenótipo de inserção correto, colônias únicas das listras riscadas foram colocadas em placas em réplica sobre placas LB suplementadas com spec, amp, ou kan. Colônias resistentes a kan (para presença do inserto), mas sensíveis para amp e spec (para ausência dos plasmídeos doador e auxiliar) foram analisadas adicionalmente para a inserção.
[00241] Para confirmar que a cepa perdeu o DNA substituído se originando de W3110, e continha o inserto de DNA, PCR de colônia foi
54 / 78 realizada. Colônias candidatas com o fenótipo correto foram pegas e sofreram um teste de PCR de colônia. Dois PCR foram executadas. i) Um PCR usa oligonucleotídeos 3206/4195 e amplifica a região no 5’ do DNA inserido apenas se a recombinação ocorreu corretamente. ii) Um PCR usa oligonucleotídeos 3081/3957 e amplifica a região no 3’ do DNA inserido apenas se a recombinação ocorreu corretamente. Vários clones da integração mostraram o padrão de PCR correto (PCR i e ii positivo). A cepa resultante foi designada st10084.
[00242] A seguinte etapa é a remoção da resistência a antibiótico da cepa integrada. Cepa 10084 foi transformada com o plasmídeo pCP20 sensível à temperatura expressando uma recombinase de FLP [1] e colocado em placas LB suplementadas com ampicilina, para selecionar pCP20. Placas foram incubadas durante a noite a 30°C a fim de permitir a replicação do plasmídeo. 5 ml de culturas LB foram inoculados com listras das placas e cultivados durante a noite a 42°C para assegurar perda de pCP20. Diluições em série das culturas noturnas foram colocadas em placas LB. 60 colônias únicas foram replicadas em placas LB suplementadas com ampicilina, canamicina, ou sem antibióticos. Todas as colônias cresceram em placas sem antibiótico, 5 colônias cresceram em placas de canamicina (cassete de resistência não foi excisado), 14 colônias cresceram em placas de ampicilina (pCP20 foi retido).
[00243] A fim de confirmar que a perda de resistência a canamicina é devido à excisão do cassete, e que nenhum material genômico exceto o cassete de resistência a canamicina foi perdido, uma PCR de colônia foi realizada. Usar oligonucleotídeos 3081 e 3957 é esperado: i. Uma banda 1513-bp se o cassete de canamicina é removido e o DNA bordejando os sítios FRT não é removido; ii. Uma banda de 2879-bp se o cassete de canamicina não foi removido; iii. nenhum produto PCR se a região de DNA entre o sítio FRT13 e o sítio FRTwt presentes no locus rfb O16 foi excluída do circuito.
55 / 78
[00244] 12 colônias com o padrão de resistência correto (sem resistência a ampicilina e canamicina) foram testadas por PCR de colônia, e todos dos mesmos mostraram a banda de 1513-bp esperada se o cassete de resistência a canamicina é excisado e o DNA entre os sítios FRT13 e FRTwt está intacto. Como um controle, a cepa antes da remoção da resistência mostrou a banda esperada de 2879-bp.
[00245] O uso de dois pares de sítios FRT alternativos (FRT13 para a substituição do locus wca, FRTwt para a substituição do locus rfb) permitiu obter uma integração sem marcador dupla sem perda de DNA nestes dois loci adjacentes. A cepa resultante foi chamada 10085. Exemplo 4: Uso de sítios FRT alternativos para introduzir mudanças recombinantes adicionais em uma cepa já contendo cópias únicas de FRTwt
[00246] Cepa stLMTB11280 é um derivado de Eschericha coli W3110 que contém várias engenheirações genômicas envolvendo o uso de FRTwt de modo que cópias de FRTwt estão presentes em múltiplas posições no DNA genômico, adjacentes aos sítios de eventos recombinantes. Duas cópias únicas de FRTwt estavam presente assim como um par de sequências FRTwt flanqueando um cassete de resistência a.cloranfenicol
[00247] Manipulações genômicas adicionais foram realizadas para adicionar uma cópia de agrupamento engenheirado por engenharia genética no genoma.
[00248] O plasmídeo pDOC doador pLMTB4184 codifica as regiões 5’ e 3’ de homologia para a substituição de genes de rfbD para wbbL do agrupamento de antígeno O16. Entre os mesmos, na mesma orientação, uma unidade de transcrição codificando sete genes de interesse seguido por um cassete de resistência a canamicina na orientação oposta flanqueado por dois sítios FRT3.
[00249] Para a substituição, cepa 11280 foi co-transformada com
56 / 78 pTKRED (GenBank: GU327533.1) e o plasmídeo doador p4184 via eletroporação. Devido ao fenótipo de replicação sensível à temperatura de pTKRED, células resultantes foram cultivadas a 30°C o tempo todo em TSB suplementado com 10 mM MgCl2, espectinomicina para seleção de pTKRED e com canamicina para seleção de p4184. Os plasmídeos foram inseridos nas células aceitadoras para permitir a expressão das enzimas codificadas no plasmídeo auxiliar na presença do DNA plasmídeo doador dentro da mesma célula.
[00250] A seguir, o procedimento de inserção foi realizado. A cepa recentemente transformada foi cultivada em meio TSB 10 mM MgCl2 na presença de canamicina e espectinomicina a 30°C em escala de 5 ml durante a noite a 180 rpm. 50 ȝl da cultura densa foram transferidos para um novo tubo contendo 1 ml TSB suplementado com espectinomicina e canamicina. A nova cultura foi, então, cultivada a 180 rpm durante 2 h a 30°C, as células foram centrifugadas a 4000 rpm durante 15 minutos a 4°C, e o sobrenadante foi substituído por meio TSB suplementado com kan, 10 mM MgCl2, 0,2% arabinose (p/v), e 1 mM IPTG. A composição de meio sustenta seleção de plasmídeo auxiliar, e expressão de recombinase e SceI endonuclease para permitir inserção. As células foram recolocadas em suspensão e ainda incubadas a 30°C durante 4 h a 180 rpm. As células foram centrifugadas a 4000 rpm durante 15 minutos a 4°C e recentemente recolocadas em suspensão em 1 mL TSB MgCl2 0,2% ara, 1 mM IPTG, e ainda incubadas a 30°C para 1 h. A cultura densa foi, então, colocada em placas TSB suplementadas com kan (para seleção do inserto de DNA) e 10 % (p/v) sacarose (para contra- seleção contra o plasmídeo doador) e incubadas a 37°C durante a noite (para selecionar a perda do plasmídeo auxiliar sensível a temperatura). Um ‘tapete’ de células apareceu. Listras foram feitas em placas TSB suplementadas com kan e 10% (p/v) sacarose e incubadas a 37°C durante a noite.
[00251] Para triar as colônias resultantes para o fenótipo de inserção
57 / 78 correto, colônias únicas das listras riscadas foram colocadas em placas em réplica sobre placas LB suplementadas com spec, amp, ou kan. Colônias resistentes a kan (para presença do inserto), mas sensíveis para amp e spec (para ausência dos plasmídeos doador e auxiliar) foram analisadas adicionalmente para a inserção.
[00252] Para confirmar que a cepa perdeu o DNA substituído se originando de W3110, e continha o inserto de DNA, PCR de colônia foi realizada. Colônias candidatas com o fenótipo correto foram pegas e sofreram um teste de PCR de colônia. Três PCR foram executadas. i) Uma PCR usa oligonucleotídeos 2449/5210 e amplifica a região no 5’ do DNA inserido apenas se a recombinação ocorreu corretamente. ii) Uma PCR usa oligonucleotídeos 546/1237 e amplifica a região no 3’ do DNA inserido apenas se a recombinação ocorreu corretamente. iii) Uma PCR usa oligonucleotídeos 3454/3455 que dão um produto apenas se um locus alvo não tiver sido engenheirado, significando recombinação sem sucesso. Vários clones da integração mostram o padrão de PCR correto (PCR i e ii positivo, PCR iii negativo). A cepa resultante foi designada stLMTB11339.
[00253] A seguinte etapa é a remoção da resistência a antibióticos para cloranfenicol (agrupamento ECA) e canamicina a partir da cepa integrada. Cepa 11339 foi transformada com o plasmídeo pCP20 sensível à temperatura expressando a recombinase de FLP [1] e colocado em placas LB suplementadas com ampicilina para selecionar pCP20. Placas foram incubadas durante a noite a 30°C a fim de permitir a replicação do plasmídeo. 5 ml de culturas LB foram inoculados com listras das placas e cultivados durante a noite a 42°C para assegurar perda de pCP20. Diluições em série das culturas noturnas foram colocadas em placas LB. 60 colônias únicas foram replicadas em placas LB suplementadas com ampicilina, canamicina, cloranfenicol, ou sem antibióticos. 9 colônias não cresceu em placas sem antibiótico, nenhum colônia cresceu em placas com canamicina, 15 colônias
58 / 78 cresceram em cloranfenicol (cassete de resistência em ECA não foi excisado), 19 colônias cresceram em placas com ampicilina (pCP20 foi retido). Um total de 41 colônias mostrou o padrão correto de resistência (crescimento somente em placas de LB sem antibiótico).
[00254] A fim de confirmar que a perda de resistências é devido à excisão do cassete, e que nenhum material genômico exceto o cassete de resistências foi perdido, duas PCR de colônia foram realizadas. 1) Remoção de cassete de canamicina. Usar oligonucleotídeos 3376 e 1265 é esperado: i. Uma banda de 900-bp se o cassete de canamicina é removido e o DNA bordejando os sítios FRT não é removido; ii. Uma banda de 1945-bp se o cassete de canamicina não tiver sido removido; iii. nenhum produto PCR se a região de DNA entre o sítio FRT3 e o sítio FRTwt presentes no locus wca foi excluída do circuito. 2) Remoção do cassete de cloranfenicol. Usar oligonucleotídeos 3376 e 3495 é esperado: i. Uma banda de 2023-bp se o cassete de cloranfenicol é removido e o DNA bordejando os sítios FRT não é removido; ii. Uma banda de 2991-bp se o cassete de cloranfenicol não tiver sido removido.
[00255] 8 colônias com o padrão de resistência corrente (sem resistências a ampicilina, cloranfenicol e canamicina) foram testadas por PCR de colônia, e todos mostraram a banda de 900-bp esperada se o cassete de resistência a canamicina é excisado e o DNA entre os sítios FRT13 e FRTwt está intacto. Somente 4 das 8 colônias mostraram a banda de 2023-bp esperada a partir da remoção do cassete de cloranfenicol, enquanto as outras 4 não deram sinal na PCR. Como um controle, a cepa antes da remoção da resistência mostrou as bandas esperadas de 2991 e 1945-bp para os cassetes de cloranfenicol e canamicina, respectivamente.
[00256] O uso de dois pares de sítios FRT alternativos (FRT13 para a substituição de locus wca, FRTwt para a substituição de locus rfb) permitiu obter uma integração sem marcador dupla, sem perda de DNA nestes dois loci
59 / 78 adjacentes. Além disso, usar dois diferentes marcadores de seleção permitiu a excisão simultânea do cassete de resistência a cloranfenicol a partir do agrupamento ECA de wec e do cassete de resistência a canamicina a partir do agrupamento rfb O16. A cepa resultante foi chamada 11340. Exemplo 5: Preparação de um cepa desprovida de elementos genéticos indesejados por uso de sítios FRT alternativos.
[00257] Cepa stLMTB10502 é um derivado de Eschericha coli W3110 em que os seguintes genes foram deletados: i. waaL, substituído por um sitio FRTwt; ii. agrupamento rfb O16 de rfbD a wbbL, substituído por um sítio FRT3.
[00258] O objetivo de manipulação genômica foi para deletar o agrupamento de ácido colânico wca enquanto mantendo intacta a região genômica curta (2525 bp) entre o agrupamento acima mencionado e o gene rfbD (o segundo gene do agrupamento rfb O16), de modo que uma cepa desprovida de agrupamento de açúcar indesejado pode ser usada como um ponto de partida para outras recombinações homólogas. A manutenção de uma região genômica entre o ácido colânico e os agrupamentos de antígeno O16 é fundamental porque i. contém o promotor do agrupamento de antígeno O16 que é explorado para a expressão dos elementos inseridos e ii. a cepa pode ser ainda engenheirada usando pDOCs doadores para a substituição do agrupamento de antígeno O16 como as regiões homólogas são mantidas.
[00259] O plasmídeo doador pDOC pLMTB3385 codifica as regiões 5’ e 3’ de homologia para a substituição de genes de wza a wcaM do agrupamento de ácido colânico. Entre os mesmos, na orientação oposta, estava um cassete de resistência a canamicina flanqueado por sítios FRT15.
[00260] Para a substituição, cepa 11502 foi co-transformada com pTKRED (GenBank: GU327533.1) e o plasmídeo doador p3385 via eletroporação. Devido ao fenótipo de replicação sensível à temperatura de pTKRED, células resultantes foram cultivadas a 30°C o tempo todo em TSB
60 / 78 suplementado com espectinomicina para seleção de pTKRED e com canamicina para seleção de p3385. Os plasmídeos foram inseridos nas células aceitadoras para permitir a expressão das enzimas codificadas no plasmídeo auxiliar na presença do DNA plasmídeo doador dentro da mesma célula.
[00261] A seguir, o procedimento de inserção foi realizado. A cepa recentemente transformada foi cultivada em meio TSB na presença de canamicina e espectinomicina a 30°C em escala de 5 ml durante a noite a 180 rpm. 50 ȝl da cultura densa foram transferidos para um novo tubo contendo 1 ml TSB suplementado com espectinomicina e canamicina. A nova cultura foi, então, cultivada a 180 rpm durante 2 h a 30°C, as células foram centrifugadas a 4000 rpm durante 15 minutos a 4°C, e o sobrenadante foi substituído por meio TSB suplementado com kan, 10 mM MgCl2, 0,2% arabinose (p/v), e 1 mM IPTG. A composição de meio sustenta a seleção de plasmídeo auxiliar e a expressão de recombinase e SceI endonuclease para permitir inserção. As células foram recolocadas em suspensão e ainda incubadas a 30°C durante 4 h a 180 rpm. As células foram centrifugadas a 4000 rpm durante 15 minutos a 4°C e recentemente recolocadas em suspensão em 1 mL TSB MgCl2 0,2% ara, 1 mM IPTG, e ainda incubadas a 30°C durante 1 h. A cultura densa foi, então, colocada em placas TSB suplementadas com kan (para seleção do inserto de DNA) e 10 % (p/v) sacarose (para contra-seleção contra o plasmídeo doador) e incubadas a 37°C durante a noite (para selecionar a perda do plasmídeo auxiliar sensível a temperatura). Um ‘tapete’ de células apareceu. Listras foram feitas em placas TSB suplementadas com kan e 10% (p/v) sacarose e incubadas a 37°C durante a noite.
[00262] Para triar as colônias resultantes para o fenótipo de inserção correto, colônias únicas das listras riscadas foram colocadas em placas em réplica sobre placas LB suplementadas com spec, amp, ou kan. Colônias resistentes a kan (para presença do inserto), mas sensíveis para amp e spec (para ausência dos plasmídeos doador e auxiliar) foram analisadas
61 / 78 adicionalmente para a inserção. 11 dentre 60 clones testados tinham o padrão correto, enquanto os restantes mostraram persistência de resistência a ampicilina.
[00263] Para confirmar que a cepa perdeu o DNA substituído se originando de W3110, e continha o inserto de DNA, PCR de colônia foi realizada. Colônias candidatas com o fenótipo correto foram pegas e sofreram um teste de PCR de colônia. Três PCR foram executadas. i) Uma PCR usa oligonucleotídeos 3206/4363 e amplifica a região no 5’ do DNA inserido apenas se a recombinação ocorreu corretamente. ii) Uma PCR usa oligonucleotídeos 4364/3975 e amplifica a região no 3’ do DNA inserido apenas se a recombinação ocorreu corretamente. iii) Uma PCR usa oligonucleotídeos 3872/3957 que deram um produto apenas se um locus alvo não foi engenheirado, significando recombinação sem sucesso. Todos os clones da integração mostraram o padrão de PCR correto (PCR i e ii positivo, PCR iii negativo). A cepa resultante foi designada stLMTB10605.
[00264] A seguinte etapa é a remoção do cassete de resistência a canamicina a partir da cepa integrada. Cepa 10605 foi transformada com o plasmídeo pCP20 sensível à temperatura expressando uma recombinase de FLP [1] e colocada em placas LB suplementadas com ampicilina para selecionar pCP20. Placas foram incubadas durante a noite a 30°C a fim de permitir a replicação do plasmídeo. 5 ml de culturas LB foram inoculados com listras das placas e cultivados durante a noite a 42°C para assegurar perda de pCP20. Diluições em série das culturas noturnas foram colocadas em placas LB. 10 colônias únicas foram replicadas em placas LB suplementadas, com ampicilina, canamicina, ou sem antibióticos. 2 colônias mostraram o padrão resistência correto (crescimento somente em placas LB sem antibiótico) e foram testadas em PCR de colônia.
[00265] A fim de confirmar que a perda de resistências é devido à excisão do cassete, e que nenhum material genômico, exceto os cassetes de
62 / 78 resistência, foi perdido, uma PCR de colônia foi realizada usando oligonucleotídeos 3206 e 3957, anelando fora dos sítios FRT15 flanqueando a resistência a canamicina. Uma banda de 423-bp é esperada se o cassete de canamicina for removido e o DNA bordejando os sítios FRT não for removido; uma banda de 2862-bp é esperada se o cassete de canamicina não tiver sido removido; nenhum produto de PCR é esperado se a região de DNA entre o sítio FRT15 e o sítio FRT3 presentes no locus rfb for excluída do circuito. Ambas as colônias testadas mostraram o padrão esperado a partir da remoção do cassete correto.
[00266] O uso de dois pares de sítios alternativos de FRT (FRT15 para a substituição do locus wca, FRT3 para a substituição do locus rfb) permitiu obter uma deleção sem marcador dupla, sem perda de DNA nestes dois loci adjacentes. Esta é a primeira evidência de falta de reatividade cruzada entre os sítios FRT3 e FRT15. A cepa resultante foi chamada 10651.
[00267] O agrupamento ECA wca completo ou parcial (wzzE a wecG) foi depois removido da cepa 10651 originando as cepas 10739 e 10740 respectivamente, que podem ser usadas como cepas de partida gerais para o desenvolvimento de derivados de produção de bioconjugados específicos de sacarídeos. Exemplo 6: Uso de sítios FRT alternativos durante o desenvolvimento da cepa para permitir integração de agrupamentos homólogos de genes
[00268] Cepa stLMTB10739 foi usada como cepa de partida para a integração de dois agrupamentos de genes altamente homólogos.
[00269] Na primeira manipulação genética, o agrupamento de ácido colânico wca foi substituído por um agrupamento de glicano heterólogo. O plasmídeo doador pDOC pLMTB2941 codifica as regiões 5’ e 3’ de homologia para a substituição do agrupamento wca. Entre os mesmos, na mesma orientação, um agrupamento heterólogo de genes foi seguido por um cassete de resistência a cloranfenicol na orientação oposta flanqueado por dois
63 / 78 sítios FRTwt.
[00270] Para a substituição, cepa 10739 foi co-transformada com pTKRED (GenBank: GU327533.1) e o plasmídeo doador p2941 via eletroporação. Devido ao fenótipo de replicação sensível à temperatura de pTKRED, células resultantes foram cultivadas a 30°C o tempo todo em TBdev suplementado com espectinomicina para seleção de pTKRED e com ampicilina para seleção de p2941. Os plasmídeos foram inseridos nas células aceitadoras para permitir a expressão das enzimas codificadas no plasmídeo auxiliar na presença do DNA plasmídeo doador dentro da mesma célula.
[00271] A seguir, o procedimento de inserção foi realizado. A cepa recentemente transformada foi cultivada em meio TBdev na presença de cloranfenicol e espectinomicina a 30°C em escala de 5 ml durante a noite a 180 rpm. 50 ȝl da cultura densa foram transferidos para um novo tubo contendo 2 ml TBdev suplementado com espectinomicina e cloranfenicol. A nova cultura foi, então, cultivada a 180 rpm durante 3 h a 30°C, as células foram centrifugadas a 4000 rpm para 5 minutos a 4°C, e o sobrenadante foi substituído por 2 mL de meio TBdev suplementado com spec, 0,2% arabinose (p/v), e 1 mM IPTG. A composição de meio sustenta seleção de plasmídeo auxiliar, e expressão de recombinase e SceI endonuclease para permitir inserção. As células recolocadas em suspensão e ainda incubadas a 30°C por 4 horas a 180 rpm. As células foram centrifugadas a 4000 rpm durante 5 minutos a 4°C e recentemente recolocadas em suspensão em 2 mL de TBdev e ainda incubadas a 37°C durante 1 h. a cultura densa foi, então, colocada em placas TBdev suplementadas com clm (para seleção do inserto de DNA) e 10 % (p/v) sacarose (para contra-seleção contra o plasmídeo doador) e incubadas a 37°C durante a noite (para selecionar a perda do plasmídeo auxiliar sensível a temperatura). Um ‘tapete’ de células apareceu. Listras riscadas foram feitas em placas TSB suplementadas com kan e 10% (p/v) sacarose e incubadas a 37°C durante a noite.
64 / 78
[00272] Para triar as colônias resultantes para o fenótipo de inserção correto, 120 colônias únicas das listras riscadas foram colocadas em placas em réplica sobre placas LB suplementadas com spec, amp, ou clm. Colônias resistentes a clm (para presença do inserto), mas sensíveis para amp e spec (para ausência dos plasmídeos doador e auxiliar) foram analisadas adicionalmente para a inserção. 119 dentre 120 colônias eram resistentes a clm e sensíveis para amp e spec.
[00273] Para confirmar que a cepa perdeu o DNA substituído se originando de W3110, e continha o inserto de DNA, PCR de colônia foi realizada. Colônias candidatas com o fenótipo correto foram pegas e sofreram um teste de PCR de colônia. Três PCR foram executadas. i) Uma PCR usa oligonucleotídeos 1822/3050 e amplifica a região no 5’ do DNA inserido apenas se a recombinação ocorreu corretamente. ii) Uma PCR usa oligonucleotídeos 1366/746 e amplifica a região no 3’ do DNA inserido apenas se a recombinação ocorreu corretamente. iii) Uma PCR usa oligonucleotídeos 3967/3969 que amplificam parte do genoma inserido. 21 dentre os 21 clones testados a partir da integração mostraram o padrão de PCR correto (PCR i, ii, e iii são positivos).
[00274] 10 clones foram testados para funcionalidade. Todos os clones testados adquiriram a capacidade de expressar os genes heterólogos. Um clone de desempenho foi selecionado e chamado stLMTB10867.
[00275] Como uma etapa adicional, um segundo agrupamento de genes com alta homologia para o primeiro agrupamento heterólogo de genes foi inserido no locus rfb do antígeno O16, que é constitutivamente expressado. Caso se tenha um trecho longo de homologia entre o agrupamento wca- integrado e o segundo agrupamento de genes glicano, é essencial manter a pressão de resistência a cloranfenicol durante este segundo procedimento de recombinação homóloga. Deste modo, foi possível selecionar o evento desejado de recombinação porque, se o trecho de homologia seria usado como
65 / 78 a região 5’ de recombinação, o cassete de resistência a cloranfenicol seria excisado. Neste caso, o plasmídeo doador é pDOC p3952, codificando as regiões 5’ e 3’ de homologia para a substituição do agrupamento rfb. Entre os mesmos, na mesma orientação, está o segundo agrupamento de genes, seguido por um cassete de resistência a canamicina na orientação oposta flanqueado por dois sítios FRT3.
[00276] Para a substituição, cepa 10867 foi co-transformada com pTKRED (GenBank: GU327533.1) e o plasmídeo doador p3952 via eletroporação. Devido ao fenótipo de replicação sensível à temperatura de pTKRED, células resultantes foram cultivadas a 30°C o tempo todo em LB suplementado com espectinomicina para seleção de pTKRED e com canamicina para seleção de p3952. Os plasmídeos foram inseridos na células aceitadoras para permitir a expressão das enzimas codificadas no plasmídeo auxiliar na presença do DNA plasmídeo doador dentro da mesma célula.
[00277] A seguir, o procedimento de inserção foi realizado. A cepa recentemente transformada foi cultivada em meio TBdev na presença de canamicina e espectinomicina a 28°C em escala de 5 ml durante a noite a 180 rpm. 50 ȝl da cultura densa foram transferidos para um novo tubo contendo 2 ml de TBdev suplementado com espectinomicina e cloranfenicol. A nova cultura foi, então, cultivada a 180 rpm durante 3 h a 30°C, as células foram centrifugadas a 4000 rpm durante 5 minutos a 4°C, e o sobrenadante foi substituído por 2 mL Meio TBdev foi suplementado com spec, 0,2% arabinose (p/v), e 1 mM IPTG. A composição de meio sustenta seleção de plasmídeo auxiliar, e expressão de recombinase e SceI endonuclease para permitir inserção. As células recolocadas em suspensão e ainda incubadas a 30°C durante 4 h a 180 rpm. 50 uL da cultura foram usados para inocular 2 mL TBdev com 0,2% arabinose (p/v) e 1 mM IPTG, que foram cultivados durante a noite a 30°C. No dia seguinte, a cultura foi colocada 1 hora a 37°C e então colocada em placas TBdev suplementadas com kan (para seleção do
66 / 78 inserto de DNA), clm (para seleção do evento desejado de recombinação), e 10 % (p/v) sacarose (para contra-seleção contra o plasmídeo doador) e incubada a 37°C durante a noite (para selecionar a perda do plasmídeo auxiliar sensível a temperatura). Um ‘tapete’ de células apareceu. Listras riscadas foram feitas em placas de TBdev suplementadas com clm, kan, e 10% (p/v) sacarose e incubadas a 37°C durante a noite.
[00278] Para triar as colônias resultantes para o fenótipo de inserção correto, 60 colônias únicas das listras riscadas foram colocadas em placas em réplica sobre placas LB suplementadas com spec, amp, ou clm+kan. Colônias resistentes a clm e kan (para presença do inserto e com padrão correto de recombinação), mas sensíveis para amp e spec (para ausência dos plasmídeos doador e auxiliar) foram analisadas adicionalmente para a inserção. 55 dentre as 60 colônias mostraram o padrão de resistência desejado.
[00279] Colônias candidatas com o fenótipo correto foram pegas e sofreram um teste de PCR de colônia. Duas PCR foram executadas. i) Uma PCR usa oligonucleotídeos 3204/3940 e amplifica a região no 5’ do DNA inserido apenas se a recombinação ocorreu corretamente, e o material genético entre os loci wca e rfb não ficou perdido. ii) Uma PCR usa oligonucleotídeos 548/1237 e amplifica a região no 3’ do DNA inserido apenas se a recombinação ocorreu corretamente. iii) Uma PCR usa oligonucleotídeos 3967/3969 que amplificam parte do genoma inserido. 30 colônias foram triadas primeiro para PCR i. 3 colônias positivas foram encontradas. PCRs ii e iii. foram realizadas somente nestas colônias e resultaram como positivas para todas entre as mesmas.
[00280] Os três clones foram testados para funcionalidade (expressão de enzima). Todos os clones testados adquiriam a capacidade de expressar as enzimas esperadas, especificamente do agrupamento rfb (ver abaixo para explicação). Um clone de desempenho foi selecionado e chamado stLMTB10883.
67 / 78
[00281] A seguinte etapa é a remoção da resistência a antibióticos para cloranfenicol (agrupamento wca de ácido colânico) e canamicina (integração acima mencionada em agrupamento O16) da cepa integrada. Cepa 10883 foi transformada com o plasmídeo pCP20 sensível à temperatura expressando a recombinase de FLP [1] e colocada em placas LB suplementadas, com ampicilina para selecionar pCP20. Placas foram incubadas durante a noite a 30°C a fim de permitir a replicação do plasmídeo. 5 ml de culturas LB foram inoculados com listras das placas e cultivados durante a noite a 42°C para assegurar perda de pCP20. Diluições em série das culturas noturnas foram colocadas em placas LB. 20 colônias únicas foram replicadas em placas LB suplementadas com ampicilina, canamicina, cloranfenicol, ou sem antibióticos. Todas as colônias mostraram o padrão correto de resistência (crescimento somente em placas LB sem antibiótico).
[00282] A fim de confirmar que a perda de resistências é devido à excisão do cassete, e que nenhum material genômico exceto o cassete de resistências foi perdido, duas PCRs de colônia foram realizadas. i. Remoção de cassete de canamicina usando oligonucleotídeos 3966 e 1237 que se ligam fora dos sítios FRT3; ii. remoção de cassete de cloranfenicol usando oligonucleotídeos 3929 e 1231 que se ligam fora dos sítios FRTwt. As três colônias triadas tinham o padrão esperado a partir da remoção correta do cassete de canamicina. 2 das mesmas foram testadas para a PCR de cloranfenicol e também resultaram no padrão esperado. Um dos dois clones confirmados resultantes desta remoção de canamicina / cloranfenicol foi chamado stLMTB10900.
[00283] O uso de dois pares de sítios FRT alternativos (FRT13 para a substituição de locus rfb, FRTwt para a substituição de locus wca) permitiu obter uma integração sem marcador dupla, sem perda de DNA nestes dois loci adjacentes. Neste caso particular, a remoção simultânea foi essencial como a persistência do cassete de cloranfenicol durante a inserção da segunda cópia
68 / 78 do agrupamento e do cassete de resistência a canamicina foi estritamente necessária para a seleção para do evento correto de recombinação.
[00284] Cepas 27_0048 10739, 10867, 10883, e 10900 foram testadas e comparadas para funcionalidade por obtenção de células competentes e a transformação das mesmas com diferentes conjuntos de plasmídeos. 5 mL de TBdev 10 mM MgCl2 suplementado com antibióticos apropriados foram inoculados com 10 uL da suspensão de recuperação e cultivados durante a noite a 37°C. 50 mL de TBdev 10 mM MgCl2 e culturas principais de antibióticos foram inoculados em OD600 0,1 e agitados a 37°C. Indução foi realizada a OD600 0,8 a 1 com 1mM IPTG e 0,1% arabinose, quando necessário. Culturas foram cultivadas durante a noite a 37°C. O volume correspondendo a 2 OD foi coletado, recolocado em suspensão em 100 uL de tampão Lämmli, aquecido 10 minutos a 95°C. Proteinase K foi adicionada e incubada a 55°C durante uma hora, seguido por 10 minutos a 70°C para inativação. Amostras foram completamente submetidas a vórtice e centrifugadas. O volume correspondendo a 0,4 OD foi carregado em um gel SDS-page. Após o ciclo, foi transferido sobre uma membrana e após Western Blot foi feita medição das enzimas expressadas. O agrupamento wca- codificado se baseia na expressão de rcsA para sua própria expressão, enquanto o agrupamento rfb-codificado é ativo, mas a biossíntese requer wchA. As combinações de plasmídeos usadas foram selecionadas a fim de entender se ambos os agrupamentos são ativos. Foi possível observar que ambos os agrupamentos integrados são funcionais: presença de wchA em cepa 10883 e 10900 resulta na produção de espécies reativas a antissoro, enquanto adição de rcsA ativa o agrupamento wca-integrado resultando em espécies reativas a antissoro. Exemplo 7 Sequências utilizáveis para realizar a deleção de DNA de inserto SEQ ID NO:1 FRTwt
69 / 78 5’-
GAAGTTCCTATTCCGAAGTTCCTATTCTCTAGAAAGTATAGGAACT TC-3’ SEQ ID NO:2 FRT3 5’-
GAAGTTCCTATTCCGAAGTTCCTATTCTTCAAATAGTATAGGAACT TC-3’ SEQ ID NO:3 FRT10 5’-
GAAGTTCCTATTCCGAAGTTCCTATTCACTAGAATGTATAGGAACT TC-3’ SEQ ID NO:4 FRT13 5’- GAAGTTCCTATTCCGAAGTTCCTATTCTCATATAAGTATAGGAACTTC-3’ SEQ ID NO:5 FRT14 5’-
GAAGTTCCTATTCCGAAGTTCCTATTCTATCAGAAGTATAGGAACT TC-3’ SEQ ID NO:6 FRT15 5’-
GAAGTTCCTATTCCGAAGTTCCTATTCTTATAGGAGTATAGGAACT TC-3’ SEQ ID NO:7 FRT5 5’ –
GAAGTTCCTATTCCGAAGTTCCTATTCACTAGAATGTATAGGAACT TC – 3’ SEQ ID NO:8 FRT11 5’ –
GAAGTTCCTATTCCGAAGTTCCTATTCTGAACTAAGTATAGGAACT
70 / 78 TC – 3’ SEQ ID NO:9 FRT12 5’ –
GAAGTTCCTATTCCGAAGTTCCTATTCTTTCTGAAGTATAGGAACT TC – 3’ SEQ ID NO:10 FRT16 5’ –
GAAGTTCCTATTCCGAAGTTCCTATTCTCCGGGCAGTATAGGAAC TTC – 3’ SEQ ID NO:11 recombinase de FLP
MPQFDILCKTPPKVLVRQFVERFERPSGEKIALCAAELTYLCWMITHN GTAIKRATFMSYNTIISNSLSFDIVNKSLQFKYKTQKATILEASLKKLIP AWEFTIIPYYGQKHQSDITDIVSSLQLQFESSEEADKGNSHSKKMLKA LLSEGESIWEITEKILNSFEYTSRFTKTKTLYQFLFLATFINCGRFSDIKN VDPKSFKLVQNKYLGVIIQCLVTETKTSVSRHIYFFSARGRIDPLVYLD EFLRNSEPVLKRVNRTGNSSSNKQEYQLLKDNLVRSYNKALKKNAPY SIFAIKNGPKSHIGRHLMTSFLSMKGLTELTNVVGNWSDKRASAVAR TTYTHQITAIPDHYFALVSRYYAYDPISKEMIALKDETNPIEEWQHIEQ
LKGSAEGSIRYPAWNGIISQEVLDYLSSYINRRI SEQ ID NO:12 recombinase de FLP
ATGCCACAATTTGATATATTATGTAAAACACCACCTAAGGTGCTTG TTCGTCAGTTTGTGGAAAGGTTTGAAAGACCTTCAGGTGAGAAAAT AGCATTATGTGCTGCTGAACTAACCTATTTATGTTGGATGATTACA CATAACGGAACAGCAATCAAGAGAGCCACATTCATGAGCTATAAT ACTATCATAAGCAATTCGCTGAGTTTCGATATTGTCAATAAATCAC TCCAGTTTAAATACAAGACGCAAAAAGCAACAATTCTGGAAGCCT CATTAAAGAAATTGATTCCTGCTTGGGAATTTACAATTATTCCTTA CTATGGACAAAAACATCAATCTGATATCACTGATATTGTAAGTAGT TTGCAATTACAGTTCGAATCATCGGAAGAAGCAGATAAGGGAAAT
71 / 78
AGCCACAGTAAAAAAATGCTTAAAGCACTTCTAAGTGAGGGTGAA AGCATCTGGGAGATCACTGAGAAAATACTAAATTCGTTTGAGTAT ACTTCGAGATTTACAAAAACAAAAACTTTATACCAATTCCTCTTCC TAGCTACTTTCATCAATTGTGGAAGATTCAGCGATATTAAGAACGT TGATCCGAAATCATTTAAATTAGTCCAAAATAAGTATCTGGGAGTA ATAATCCAGTGTTTAGTGACAGAGACAAAGACAAGCGTTAGTAGG CACATATACTTCTTTAGCGCAAGGGGTAGGATCGATCCACTTGTAT ATTTGGATGAATTTTTGAGGAATTCTGAACCAGTCCTAAAACGAGT AAATAGGACCGGCAATTCTTCAAGCAATAAACAGGAATACCAATT ATTAAAAGATAACTTAGTCAGATCGTACAATAAAGCTTTGAAGAA AAATGCGCCTTATTCAATCTTTGCTATAAAAAATGGCCCAAAATCT CACATTGGAAGACATTTGATGACCTCATTTCTTTCAATGAAGGGCC TAACGGAGTTGACTAATGTTGTGGGAAATTGGAGCGATAAGCGTG CTTCTGCCGTGGCCAGGACAACGTATACTCATCAGATAACAGCAA TACCTGATCACTACTTCGCACTAGTTTCTCGGTACTATGCATATGA TCCAATATCAAAGGAAATGATAGCATTGAAGGATGAGACTAATCC AATTGAGGAGTGGCAGCATATAGAACAGCTAAAGGGTAGTGCTGA AGGAAGCATACGATACCCCGCATGGAATGGGATAATATCACAGGA
GGTACTAGACTACCTTTCATCCTACATAAATAGACGCATA SEQ ID NO:13 pCP20 contendo gene FLP
GAGACACAACGTGGCTTTGTTGAATAAATCGAACTTTTGCTGAGTT GAAGGATCAGATCACGCATCTTCCCGACAACGCAGACCGTTCCGT GGCAAAGCAAAAGTTCAAAATCACCAACTGGTCCACCTACAACAA AGCTCTCATCAACCGTGGCTCCCTCACTTTCTGGCTGGATGATGGG GCGATTCAGGCCTGGTATGAGTCAGCAACACCTTCTTCACGAGGC AGACCTCAGCGCCACAGGTGCGGTTGCTGGCGCTAACCGTTTTTAT CAGGCTCTGGGAGGCAGAATAAATGATCATATCGTCAATTATTAC CTCCACGGGGAGAGCCTGAGCAAACTGGCCTCAGGCATTTGAGAA GCACACGGTCACACTGCTTCCGGTAGTCAATAAACCGGTAAACCA
72 / 78
GCAATAGACATAAGCGGCTATTTAACGACCCTGCCCTGAACCGAC GACCGGGTCGAATTTGCTTTCGAATTTCTGCCATTCATCCGCTTATT ATCACTTATTCAGGCGTAGCAACCAGGCGTTTAAGGGCACCAATA ACTGCCTTAAAAAAATTACGCCCCGCCCTGCCACTCATCGCAGTAC TGTTGTAATTCATTAAGCATTCTGCCGACATGGAAGCCATCACAAA CGGCATGATGAACCTGAATCGCCAGCGGCATCAGCACCTTGTCGC CTTGCGTATAATATTTGCCCATGGTGAAAACGGGGGCGAAGAAGT TGTCCATATTGGCCACGTTTAAATCAAAACTGGTGAAACTCACCCA GGGATTGGCTGAGACGAAAAACATATTCTCAATAAACCCTTTAGG GAAATAGGCCAGGTTTTCACCGTAACACGCCACATCTTGCGAATAT ATGTGTAGAAACTGCCGGAAATCGTCGTGGTATTCACTCCAGAGC GATGAAAACGTTTCAGTTTGCTCATGGAAAACGGTGTAACAAGGG TGAACACTATCCCATATCACCAGCTCACCGTCTTTCATTGCCATAC GGAATTCCGGATGAGCATTCATCAGGCGGGCAAGAATGTGAATAA AGGCCGGATAAAACTTGTGCTTATTTTTCTTTACGGTCTTTAAAAA GGCCGTAATATCCAGCTGAACGGTCTGGTTATAGGTACATTGAGC AACTGACTGAAATGCCTCAAAATGTTCTTTACGATGCCATTGGGAT ATATCAACGGTGGTATATCCAGTGATTTTTTTCTCCATTTTAGCTTC CTTAGCTCCTGAAAATCTCGATAACTCAAAAAATACGCCCGGTAGT GATCTTATTTCATTATGGTGAAAGTTGGAACCTCTTACGTGCCGAT CAACGTCTCATTTTCGCCAAAAGTTGGCCCAGGGCTTCCCGGTATC AACAGGGACACCAGGATTTATTTATTCTGCGAAGTGATCTTCCGTC ACAGGTATTTATTCGGCGCAAAGTGCGTCGGGTGATGCTGCCAACT TACTGATTTAGTGTATGATGGTGTTTTTGAGGTGCTCCAGTGGCTTC TGTTTCTATCAGCTGTCCCTCCTGTTCAGCTACTGACGGGGTGGTG CGTAACGGCAAAAGCACCGCCGGACATCAGCGCTTGTTTCGGCGT GGGTATGGTGGCAGGCCCCGTGGCCGGGGGACTGTTGGGCGCCTG TAGTGCCATTTACCCCCATTCACTGCCAGAGCCGTGAGCGCAGCGA ACTGAATGTCACGAAAAAGACAGCGACTCAGGTGCCTGATGGTCG
73 / 78
GAGACAAAAGGAATATTCAGCGATTTGCCCGAGCTTGCGAGGGTG CTACTTAAGCCTTTAGGGTTTTAAGGTCTGTTTTGTAGAGGAGCAA ACAGCGTTTGCGACATCCTTTTGTAATACTGCGGAACTGACTAAAG TAGTGAGTTATACACAGGGCTGGGATCTATTCTTTTTATCTTTTTTT ATTCTTTCTTTATTCTATAAATTATAACCACTTGAATATAAACAAA AAAAACACACAAAGGTCTAGCGGAATTTACAGAGGGTCTAGCAGA ATTTACAAGTTTTCCAGCAAAGGTCTAGCAGAATTTACAGATACCC ACAACTCAAAGGAAAAGGACTAGTAATTATCATTGACTAGCCCAT CTCAATTGGTATAGTGATTAAAATCACCTAGACCAATTGAGATGTA TGTCTGAATTAGTTGTTTTCAAAGCAAATGAACTAGCGATTAGTCG CTATGACTTAACGGAGCATGAAACCAAGCTAATTTTATGCTGTGTG GCACTACTCAACCCCACGATTGAAAACCCTACAAGGAAAGAACGG ACGGTATCGTTCACTTATAACCAATACGTTCAGATGATGAACATCA GTAGGGAAAATGCTTATGGTGTATTAGCTAAAGCAACCAGAGAGC TGATGACGAGAACTGTGGAAATCAGGAATCCTTTGGTTAAAGGCT TTGAGATTTTCCAGTGGACAAACTATGCCAAGTTCTCAAGCGAAA AATTAGAATTAGTTTTTAGTGAAGAGATATTGCCTTATCTTTTCCA GTTAAAAAAATTCATAAAATATAATCTGGAACATGTTAAGTCTTTT GAAAACAAATACTCTATGAGGATTTATGAGTGGTTATTAAAAGAA CTAACACAAAAGAAAACTCACAAGGCAAATATAGAGATTAGCCTT GATGAATTTAAGTTCATGTTAATGCTTGAAAATAACTACCATGAGT TTAAAAGGCTTAACCAATGGGTTTTGAAACCAATAAGTAAAGATTT AAACACTTACAGCAATATGAAATTGGTGGTTGATAAGCGAGGCCG CCCGACTGATACGTTGATTTTCCAAGTTGAACTAGATAGACAAATG GATCTCGTAACCGAACTTGAGAACAACCAGATAAAAATGAATGGT GACAAAATACCAACAACCATTACATCAGATTCCTACCTACATAAC GGACTAAGAAAAACACTACACGATGCTTTAACTGCAAAAATTCAG CTCACCAGTTTTGAGGCAAAATTTTTGAGTGACATGCAAAGTAAGT ATGATCTCAATGGTTCGTTCTCATGGCTCACGCAAAAACAACGAAC
74 / 78
CACACTAGAGAACATACTGGCTAAATACGGAAGGATCTGAGGTTC TTATGGCTCTTGTATCTATCAGTGAAGCATCAAGACTAACAAACAA AAGTAGAACAACTGTTCACCGTTACATATCAAAGGGAAAACTGTC CATATGCACAGATGAAAACGGTGTAAAAAAGATAGATACATCAGA GCTTTTACGAGTTTTTGGTGCATTTAAAGCTGTTCACCATGAACAG ATCGACAATGTAACAGATGAACAGCATGTAACACCTAATAGAACA GGTGAAACCAGTAAAACAAAGCAACTAGAACATGAAATTGAACA CCTGAGACAACTTGTTACAGCTCAACAGTCACACATAGACAGCCT GAAACAGGCGATGCTGCTTATCGAATCAAAGCTGCCGACAACACG GGAGCCAGTGACGCCTCCCGTGGGGAAAAAATCATGGCAATTCTG GAAGAAATAGCGCCTGTTTCGTTTCAGGCAGGTTATCAGGGAGTG TCAGCGTCCTGCGGTTCTCCGGGGCGTTCGGGTCATGCAGCCCGTA ATGGTGATTTACCAGCGTCTGCCAGGCATCAATTCTAGGCCTGTCT GCGCGGTCGTAGTACGGCTGGAGGCGTTTTCCGGTCTGTAGCTCCA TGTTCGGAATGACAAAATTCAGCTCAAGCCGTCCCTTGTCCTGGTG CTCCACCCACAGGATGCTGTACTGATTTTTTTCGAGACCGGGCATC AGTACACGCTCAAAGCTCGCCATCACTTTTTCACGTCCTCCCGGCG GCAGCTCCTTCTCCGCGAACGACAGAACACCGGACGTGTATTTCTT CGCAAATGGCGTGGCATCGATGAGTTCCCGGACTTCTTCCGGATTA CCCTGAAGCACCGTTGCGCCTTCGCGGTTACGCTCCCTCCCCAGCA GGTAATCAACCGGACCACTGCCACCACCTTTTCCCCTGGCATGAAA TTTAACTATCATCCCGCGCCCCCTGTTCCCTGACAGCCAGACGCAG CCGGCGCAGCTCATCCCCGATGGCCATCAGTGCGGCCACCACCTG AACCCGGTCACCGGAAGACCACTGCCCGCTGTTCACCTTACGGGCT GTCTGATTCAGGTTATTTCCGATGGCGGCCAGCTGACGCAGTAACG GCGGTGCCAGTGTCGGCAGTTTTCCGGAACGGGCAACCGGCTCCC CCAGGCAGACCCGCCGCATCCATACCGCCAGTTGTTTACCCTCACA GCGTTCAAGTAACCGGGCATGTTCATCATCAGTAACCCGTATTGTG AGCATCCTCTCGCGTTTCATCGGTATCATTACCCCATGAACAGAAA
75 / 78
TCCCCCTTACACGGAGGCATCAGTGACTAAACGGGGTCTGACGCT CAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTA TCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTT TTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTA CCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTT CGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGA TACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGC GAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGC CAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCG CCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAG TTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTGCAGGC ATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCG GTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAA AAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAG TTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATT CTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGA GTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAG TTGCTCTTGCCCGGCGTCAACACGGGATAATACCGCGCCACATAGC AGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGA AAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAAC CCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAG CGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAA AGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCC TTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGC GGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTT CCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACC ATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGC CCTTTCGTCTTCAAGAATTTTATAAACCGTGGAGCGGGCAATACTG AGCTGATGAGCAATTTCCGTTGCACCAGTGCCCTTCTGATGAAGCG
76 / 78
TCAGCACGACGTTCCTGTCCACGGTACGCCTGCGGCCAAATTTGAT TCCTTTCAGCTTTGCTTCCTGTCGGCCCTCATTCGTGCGCTCTAGGA TCCTCTACGCCGGACGCATCGTGGCCGGCATCACCGGCGCTGAGG TCTGCCTCGTGAAGAAGGTGTTGCTGACTCATACCAGGCCTGAATC GCCCCATCATCCAGCCAGAAAGTGAGGGAGCCACGGTTGATGAGA GCTTTGTTGTAGGTGGACCAGTTGGTGATTTTGAACTTTTGCTTTGC CACGGAACGGTCTGCGTTGTCGGGAAGATGCGTGATCTGATCCTTC AACTCAGCAAAAGTTCGATTTATTCAACAAAGCCGCCGTCCCGTCA AGTCAGCGTAATGCTCTGCCAGTGTTACAACCAATTAACCAATTCT GATTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTC ATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTA ATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGAT CCTGGTATCGGTCTGCGATTCCGACTCGTCCAACATCAATACAACC TATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCA CCATGAGTGACGACTGAATCCGGTGAGAATGGCAGAATAGGAACT TCGGAATAGGAACTTCAAAGCGTTTCCGAAAACGAGCGCTTCCGA AAATGCAACGCGAGCTGCGCACATACAGCTCACTGTTCACGTCGC ACCTATATCTGCGTGTTGCCTGTATATATATATACATGAGAAGAAC GGCATAGTGCGTGTTTATGCTTAAATGCGTACTTATATGCGTCTAT TTATGTAGGATGAAAGGTAGTCTAGTACCTCCTGTGATATTATCCC ATTCCATGCGGGGTATCGTATGCTTCCTTCAGCACTACCCTTTAGC TGTTCTATATGCTGCCACTCCTCAATTGGATTAGTCTCATCCTTCAA TGCTATCATTTCCTTTGATATTGGATCATATGCATAGTACCGAGAA ACTAGTGCGAAGTAGTGATCAGGTATTGCTGTTATCTGATGAGTAT ACGTTGTCCTGGCCACGGCAGAAGCACGCTTATCGCTCCAATTTCC CACAACATTAGTCAACTCCGTTAGGCCCTTCATTGAAAGAAATGA GGTCATCAAATGTCTTCCAATGTGAGATTTTGGGCCATTTTTTATA GCAAAGATTGAATAAGGCGCATTTTTCTTCAAAGCTTTATTGTACG ATCTGACTAAGTTATCTTTTAATAATTGGTATTCCTGTTTATTGCTT
77 / 78
GAAGAATTGCCGGTCCTATTTACTCGTTTTAGGACTGGTTCAGAAT TCCTCAAAAATTCATCCAAATATACAAGTGGATCGATCCTACCCCT TGCGCTAAAGAAGTATATGTGCCTACTAACGCTTGTCTTTGTCTCT GTCACTAAACACTGGATTATTACTCCCAGATACTTATTTTGGACTA ATTTAAATGATTTCGGATCAACGTTCTTAATATCGCTGAATCTTCC ACAATTGATGAAAGTAGCTAGGAAGAGGAATTGGTATAAAGTTTT TGTTTTTGTAAATCTCGAAGTATACTCAAACGAATTTAGTATTTTCT CAGTGATCTCCCAGATGCTTTCACCCTCACTTAGAAGTGCTTTAAG CATTTTTTTACTGTGGCTATTTCCCTTATCTGCTTCTTCCGATGATTC GAACTGTAATTGCAAACTACTTACAATATCAGTGATATCAGATTGA TGTTTTTGTCCATAGTAAGGAATAATTGTAAATTCCCAAGCAGGAA TCAATTTCTTTAATGAGGCTTCCAGAATTGTTGCTTTTTGCGTCTTG TATTTAAACTGGAGTGATTTATTGACAATATCGAAACTCAGCGAAT TGCTTATGATAGTATTATAGCTCATGAATGTGGCTCTCTTGATTGCT GTTCCGTTATGTGTAATCATCCAACATAAATAGGTTAGTTCAGCAG CACATAATGCTATTTTCTCACCTGAAGGTCTTTCAAACCTTTCCAC AAACTGACGAACAAGCACCTTAGGTGGTGTTTTACATAATATATCA AATTGTGGCATACAACCTCCTTAGTACATGCAACCATTATCACCGC CAGAGGTAAAATAGTCAACACGCACGGTGTTAGATATTTATCCCTT GCGGTGATAGATTTAACGTATGAGCACAAAAAAGAAACCATTAAC ACAAGAGCAGCTTGAGGACGCACGTCGCCTTAAAGCAATTTATGA AAAAAAGAAAAATGAACTTGGCTTATCCCAGGAATCTGTCGCAGA CAAGATGGGGATGGGGCAGTCAGGCGTTGGTGCTTTATTTAATGG CATCAATGCATTAAATGCTTATAACGCCGCATTGCTTACAAAAATT CTCAAAGTTAGCGTTGAAGAATTTAGCCCTTCAATCGCCAGAGAA ATCTACGAGATGTATGAAGCGGTTAGTATGCAGCCGTCACTTAGA AGTGAGTATGAGTACCCTGTTTTTTCTCATGTTCAGGCAGGGATGT TCTCACCTAAGCTTAGAACCTTTACCAAAGGTGATGCGGAGAGAT GGGTAAGCACAACCAAAAAAGCCAGTGATTCTGCATTCTGGCTTG
78 / 78
AGGTTGAAGGTAATTCCATGACCGCACCAACAGGCTCCAAGCCAA GCTTTCCTGACGGAATGTTAATTCTCGTTGACCCTGAGCAGGCTGT TGAGCCAGGTGATTTCTGCATAGCCAGACTTGGGGGTGATGAGTTT ACCTTCAAGAAACTGATCAGGGATAGCGGTCAGGTGTTTTTACAA CCACTAAACCCACAGTACCCAATGATCCCATGCAATGAGAGTTGTT CCGTTGTGGGGAAAGTTATCGCTAGTCAGTGGCCTGAAGAGACGT TTGGCTGATCGGCAAGGTGTTCTGGTCGGCGCATAGCTGATAACA ATTGAGCAAGAATCTGCATTTCTTTCCAGACTTGTTCAACAGGCCA GCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTA TTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGCTGT TAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGG AACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATT CTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAG TAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGG AAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCT GTAACATCATTGGCAACGCTACCTTTGCCATGTTTCAGAAACAACT CTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGA TTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCA TCCATGTTGGAATTTAATCGCGGCCTCGAGCAAGACGTTTCCCGTT GAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGA CAGTTTTATTGTTCATGATGATATATTTTTATCTTGTGCAATGTAAC ATCAGAGATTTT

Claims (15)

REIVINDICAÇÕES
1. Método de remoção de pelo menos duas porções de ácido nucleico de inserto de um polinucleotídeo genômico em uma célula hospedeira, o dito método caracterizado pelo fato de que compreende as etapas de: a) preparar o polinucleotídeo genômico compreendendo um primeiro ácido nucleico de inserto que é flanqueado por um par de primeiros sítios de recombinação na mesma orientação que são idênticos um ao outro e têm uma primeira sequência de ácido nucleico; b) expor o polinucleotídeo genômico de etapa a) a uma recombinase que reconhece os primeiros sítios de recombinação de modo que os sítios de recombinação idênticos recombinam resultando na excisão do primeiro ácido nucleico de inserto e um dos primeiros sítios de recombinação; c) inserir no polinucleotídeo genômico de etapa b) um segundo ácido nucleico de inserto flanqueado por um par de segundos sítios de recombinação na mesma orientação em que os segundos sítios de recombinação são idênticos um ao outro e têm uma segunda sequência de ácido nucleico que compartilha não 70 - 98% de identidade de sequência com a primeira sequência de ácido nucleico; e d) expor o polinucleotídeo genômico de etapa c) a uma recombinase que reconhece os segundos sítios de recombinação de modo que os sítios de recombinação idênticos recombinam resultando na excisão do segundo ácido nucleico de inserto e um dos segundos sítios de recombinação mas sem a remoção de sequência de polinucleotídeo genômico que não é flanqueado por sítios de recombinação idênticos.
2. Método para remover pelo menos duas porções de ácido nucleico de inserto de um polinucleotídeo genômico em uma célula hospedeira, o dito método caracterizado pelo fato de que compreende as etapas de:
a) preparar o polinucleotídeo genômico compreendendo pelo menos um primeiro e um segundo ácido nucleico de inserto, em que i) o primeiro ácido nucleico de inserto é flanqueado por primeiros sítios de recombinação na mesma orientação que são idênticos um ao outro e têm uma primeira sequência de ácido nucleico ii) o segundo ácido nucleico de inserto é flanqueado por segundos sítios de recombinação na mesma orientação que são idênticos um ao outro e têm uma segunda sequência de ácido nucleico que compartilha não mais do que 98% de identidade de sequência com a primeira sequência de ácido nucleico e iii) quaisquer sítios de recombinação adicionais têm uma sequência de ácido nucleico que compartilha não mais do que 98% de identidade de sequência com as primeira ou segunda sequências de ácido nucleico; e b) expor o polinucleotídeo genômico a uma recombinase que reconhece os primeiro e segundo sítios de recombinação de modo que os sítios de recombinação idênticos recombinam resultando na excisão do ácido nucleico de inserto flanqueado por sítios de recombinação idênticos, mas sem a remoção de sequência de polinucleotídeo genômico que não é flanqueado por sítios de recombinação idênticos.
3. Método de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que o polinucleotídeo genômico é um polinucleotídeo genômico procariótico ou um plasmídeo.
4. Método de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que o polinucleotídeo genômico é um cromossomo eucariótico.
5. Método de acordo com qualquer uma das reivindicações 1 a 4, caracterizado pelo fato de que os primeiro e segundo ácidos nucleicos de inserto são marcadores de seleção.
6. Célula hospedeira, caracterizada pelo fato de que compreende um polinucleotídeo genômico de célula hospedeira contendo uma primeira região engenheirada por recombinação e uma segunda região engenheirada por recombinação, em que uma cicatriz do primeiro sítio de recombinação é adjacente à primeira região engenheirada por recombinação e uma cicatriz do segundo sítio de recombinação é adjacente à segunda região engenheirada por recombinação; em que as cicatrizes do primeiro e do segundo sítio de recombinação têm diferentes sequências polinucleotídicas que são menos que 98% idênticas uma a outra e opcionalmente menos que 98% idênticas à sequência polinucleotídica de qualquer cicatriz de sítio de recombinação recombinação adicional presente no polinucleotídeo genômico de célula hospedeira.
7. Célula hospedeira de acordo com a reivindicação 6, caracterizada pelo fato de que os primeiro e segundo sítios de recombinação são sítios de recombinação para uma recombinase, por exemplo, uma recombinase de FLP.
8. Célula hospedeira de acordo com a reivindicação 7, caracterizada pelo fato de que o primeiro sítio de recombinação tem uma sequência de ácido nucleico de qualquer uma de SEQ ID NO:1-10.
9. Célula hospedeira de acordo com qualquer uma das reivindicações 6 a 8, caracterizada pelo fato de que os primeiro e segundo sítios de recombinação são separados por menos do que 100, 75, 50, 25, 10 ou 5kbases.
10. Polinucleotídeo genômico procariótico ou um cromossomo eucariótico, caracterizado pelo fato de que compreende pelo menos duas cicatrizes de sítio de recombinação recombinação adjacentes a pelo menos duas regiões engenheiradas por recombinação, em que cada cicatriz de sítio de recombinação tem uma diferente sequência polinucleotídica.
11. Célula hospedeira engenheirada, caracterizada pelo fato de que compreende cópias únicas de pelo menos 2, 3, 4, 5, 6, 7, 8, 9 ou 10 sítios de recombinação no polinucleotídeo genômico de célula hospedeira, em que cada sítio de recombinação tem uma sequência nucleotídica que é menos do que 98% idêntica aos outros sítios de recombinação.
12. Célula hospedeira engenheirada como definida na reivindicação 11, caracterizada pelo fato de que os pelo menos 2 sítios de recombinação são sítios FRT.
13. Célula hospedeira engenheirada de acordo com a reivindicação 11 ou 12, caracterizada pelo fato de que os pelo menos 2 sítios de recombinação são separados por menos do que 100kb, 75kb, 50kb, 25kb, 10kb, 5kb, 3kb ou 1kb no polinucleotídeo genômico de célula hospedeira.
14. Célula hospedeira de acordo com qualquer uma das reivindicações 6 a 9 ou 11 a 13, caracterizada pelo fato de que a célula hospedeira é engenheirada para expressar a) uma oligossacariltransferase, por exemplo, PglB ou PglL; b) um agrupamento de glicano heterólogo, por exemplo, um agrupamento rfb ou um agrupamento de genes codificando glicosiltransferases requeridas para sintetizar um polissacarídeo capsular; e uma proteína contendo um sítio de glicosilação reconhecido pela oligossacariltransferase.
15. Processo para fazer uma proteína glicosilada, caracterizado pelo fato de que compreende as etapas de: i) cultivar a célula hospedeira como definida na reivindicação 14, sob condições apropriadas para a produção de proteína glicosilada e ii) isolar a proteína glicosilada da cultura.
BR112020001815-5A 2017-08-07 2018-08-07 método de remoção de pelo menos duas porções de ácido nucleico de inserto, polinucleotídeos genômico de célula hospedeira e genômico procariótico ou um cromossomo eucariótico, célula hospedeira, e, processos para engenheirar por engenharia genética uma célula hospedeira e para fazer uma proteína glicosilada BR112020001815A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1712678.0 2017-08-07
GBGB1712678.0A GB201712678D0 (en) 2017-08-07 2017-08-07 Process for the manipulation of nucleic acids
PCT/EP2018/071415 WO2019030234A1 (en) 2017-08-07 2018-08-07 PROCESS FOR PRODUCING NUCLEIC ACIDS

Publications (1)

Publication Number Publication Date
BR112020001815A2 true BR112020001815A2 (pt) 2020-07-21

Family

ID=59894846

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020001815-5A BR112020001815A2 (pt) 2017-08-07 2018-08-07 método de remoção de pelo menos duas porções de ácido nucleico de inserto, polinucleotídeos genômico de célula hospedeira e genômico procariótico ou um cromossomo eucariótico, célula hospedeira, e, processos para engenheirar por engenharia genética uma célula hospedeira e para fazer uma proteína glicosilada

Country Status (8)

Country Link
US (1) US11959092B2 (pt)
EP (1) EP3665284A1 (pt)
JP (2) JP2020530996A (pt)
CN (1) CN110914432A (pt)
BR (1) BR112020001815A2 (pt)
CA (1) CA3071761A1 (pt)
GB (1) GB201712678D0 (pt)
WO (1) WO2019030234A1 (pt)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112022023234A2 (pt) 2020-06-25 2023-01-03 Glaxosmithkline Biologicals Sa Proteínas de exotoxina a modificada
WO2023118033A1 (en) 2021-12-22 2023-06-29 Glaxosmithkline Biologicals Sa Vaccine

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000011155A1 (en) * 1998-08-19 2000-03-02 The Board Of Trustees Of The Leland Stanford Junior University Methods and compositions for genomic modification
AU7447000A (en) 1999-09-30 2001-04-30 Izumu Saito Dna containing variant frt sequences
EP2853600B1 (en) 2005-05-11 2018-09-19 ETH Zürich Recombinant N-glycosylated proteins from procaryotic cells
WO2007011733A2 (en) * 2005-07-18 2007-01-25 Pioneer Hi-Bred International, Inc. Modified frt recombination sites and methods of use
WO2009104074A2 (en) 2008-02-20 2009-08-27 Glycovaxyn Ag Bioconjugates made from recombinant n-glycosylated proteins from procaryotic cells
WO2010143606A1 (ja) * 2009-06-08 2010-12-16 財団法人かずさディー・エヌ・エー研究所 新規な部位特異的組換え酵素とその認識配列を用いた部位特異的組換え方法
US8539727B2 (en) 2009-11-19 2013-09-24 Sun Wah Lui Mechanically-held tile
DK2566507T3 (da) 2010-05-06 2018-01-29 Glaxosmithkline Biologicals Sa Biokonjugatvacciner med kapselformige grampositive bakterier
CA2832095A1 (en) * 2011-04-05 2012-10-11 The Scripps Research Institute Chromosomal landing pads and related uses
EA201590488A1 (ru) 2012-10-12 2015-09-30 Гликоваксин Аг Способы модификации клеток-хозяев
ES2713166T3 (es) 2012-11-07 2019-05-20 Glaxosmithkline Biologicals Sa Producción de vacuna recombinante en E. coli mediante conjugación enzimática
EP3055416B1 (en) 2013-10-11 2020-01-22 GlaxoSmithKline Biologicals S.A. Methods of host cell modification
ES2793023T3 (es) 2014-08-08 2020-11-12 Glaxosmithkline Biologicals Sa Células huésped modificadas y oligosacáridos híbridos para su uso en producción de bioconjugados
US10392674B2 (en) 2015-07-22 2019-08-27 President And Fellows Of Harvard College Evolution of site-specific recombinases

Also Published As

Publication number Publication date
EP3665284A1 (en) 2020-06-17
US11959092B2 (en) 2024-04-16
US20220090143A1 (en) 2022-03-24
CA3071761A1 (en) 2019-02-14
JP2020530996A (ja) 2020-11-05
WO2019030234A1 (en) 2019-02-14
JP2024069212A (ja) 2024-05-21
CN110914432A (zh) 2020-03-24
GB201712678D0 (en) 2017-09-20

Similar Documents

Publication Publication Date Title
Sun et al. A CRISPR‐Cpf1‐assisted non‐homologous end joining genome editing system of Mycobacterium smegmatis
TWI608100B (zh) Cas9表達質體、大腸桿菌基因剪輯系統及其方法
JP6621465B2 (ja) 標的化変異
JP5732496B2 (ja) Dna分子及び方法
JP6473510B2 (ja) ビブリオで汎用される遺伝子ノックアウト用の自殺ベクターおよびその利用
US20230287439A1 (en) Pathway integration and expression in host cells
EP2588615B1 (en) Self-deleting plasmid
US20240197792A1 (en) Efficient traceless gene editing system for salmonella and use thereof
BR112020001815A2 (pt) método de remoção de pelo menos duas porções de ácido nucleico de inserto, polinucleotídeos genômico de célula hospedeira e genômico procariótico ou um cromossomo eucariótico, célula hospedeira, e, processos para engenheirar por engenharia genética uma célula hospedeira e para fazer uma proteína glicosilada
CN110591994B (zh) 一种基于氢氧化钠刺激的哈维弧菌同源重组基因敲除的方法
WO2020186262A1 (en) Compositions and methods for gene targeting using crispr-cas and transposons
CA2572003C (en) Process for the removal of selectable marker gene sequences
EA011823B1 (ru) Бактериальная система селекции и ее применение
CN109628361B (zh) 整合双拷贝功能性f4菌毛操纵子基因猪源益生菌ep1克隆株、构建方法及应用
CN114480467B (zh) 一种在棒状杆菌中辅助sacB基因编辑系统的CRISPR-cpf1筛选工具
JP6757008B2 (ja) ビフィドバクテリウム属細菌の形質転換方法
JP2009514506A (ja) E.コリ株dsm6601のプラスミド不含のクローン
Santos CRISPR/Cas9-Based Genome Editing Of Lactic Acid Bacteria For The Improvement Of Biopharmaceutical-Grade Plasmid And Recombinant Protein Production
Cangelosi et al. Engineering large functional plasmids for biosafety
EP3794119A1 (en) Bacterial vectors for genetic manipulation of bacteria

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]