BR112020022288A2 - método para otimizar a expressão de anticorpos - Google Patents

método para otimizar a expressão de anticorpos Download PDF

Info

Publication number
BR112020022288A2
BR112020022288A2 BR112020022288-7A BR112020022288A BR112020022288A2 BR 112020022288 A2 BR112020022288 A2 BR 112020022288A2 BR 112020022288 A BR112020022288 A BR 112020022288A BR 112020022288 A2 BR112020022288 A2 BR 112020022288A2
Authority
BR
Brazil
Prior art keywords
protein
fact
cell
phenylalanine
amino acid
Prior art date
Application number
BR112020022288-7A
Other languages
English (en)
Inventor
Md Harunur Rashid
Mark Shimazu
Feng Tian
Original Assignee
Ambrx, Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ambrx, Inc. filed Critical Ambrx, Inc.
Publication of BR112020022288A2 publication Critical patent/BR112020022288A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K14/245Escherichia (G)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/2803Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily
    • C07K16/2809Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily against the T-cell receptor (TcR)-CD3 complex
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/52Constant or Fc region; Isotype
    • C07K2317/522CH1 domain
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/55Fab or Fab'
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/90Immunoglobulins specific features characterized by (pharmaco)kinetic aspects or by stability of the immunoglobulin
    • C07K2317/92Affinity (KD), association rate (Ka), dissociation rate (Kd) or EC50 value
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y502/00Cis-trans-isomerases (5.2)
    • C12Y502/01Cis-trans-Isomerases (5.2.1)
    • C12Y502/01008Peptidylprolyl isomerase (5.2.1.8), i.e. cyclophilin

Abstract

Métodos, composições e componentes para otimizar ou aumentar a expressão de uma proteína, polipeptídeo ou fragmento do mesmo são divulgados neste relatório.

Description

“MÉTODO PARA OTIMIZAR A EXPRESSÃO DE ANTICORPOS” REFERÊNCIA AOS PEDIDOS RELACIONADOS
[001] O presente pedido reivindica o benefício do Pedido Provisório U.S. No 62/665.093, intitulado “A Method for Optimizing Antibody Expression” depositado em 1 de Maio de 2018, os conteúdos do qual são integralmente incorporados neste relatório à título de referência.
LISTAGEM DE SEQUÊNCIAS
[002] O presente pedido contém uma Listagem de Sequências que foi enviada em formato ASCII via EFS-Web e é por meio deste relatório integralmente incorporada à título de referência. A cópia ASCII, criada em 30 de Abril de 2019 é denominada_AMBX_0226_00PCT_ST25.txt e tem 15.184 bytes.
CAMPO DA INVENÇÃO
[003] A presente divulgação pertence ao campo da biologia molecular. A presente divulgação da invenção refere-se ao projeto e construção de vetores e plasmídeos. A invenção também refere-se às novas cepas de produção ou células que incorporam aminoácidos não naturalmente codificados e aos métodos para produzir proteínas recombinantes a partir das mesmas.
FUNDAMENTOS DA INVENÇÃO
[004] O acúmulo de fragmentos de anticorpos intactos, apropriadamente montados, ativos no periplasma de Escherichia coli (E. coli) exige múltiplas etapas para ocorrer corretamente, incluindo: transcrição, tradução, supressão de um códon de parada para incorporação de aminoácidos não naturais, translocação através da membrana interna, clivagem de peptídeo de sinal, dobra apropriada, isomerização cis ou trans correta de resíduos de prolina, montagem de cadeia leve com cadeia pesada, formação correta de ligações intra- e inter-dissulfeto e retenção no periplasma (sem vazamento através da membrana externa no meio). Vias alternativas para polipeptídeos no citoplasma ou periplasma incluem truncamento,
dobra incorreta, agregação e proteólise (Miot M. & Betton J.M., Microbial Cell Factories, 3, 4, 2004; Yoon, S. H. et al., Recent Patents in Biotech, 4, 23, 2010).
[005] Muitas classes de proteínas e/ou fatores auxiliares em E. coli funcionam para auxiliar na geração de proteínas em seu estado apropriadamente dobrado e ativo. Estas proteínas incluem chaperonas, foldases, isomerases etc., mas não são limitadas às tais. Chaperonas se ligam a proteínas dobradas erroneamente ou não dobradas e facilitam a dobra apropriada. Outras proteínas e/ou fatores auxiliares incluem proteínas que se envolvem na redução/oxidação ou isomerização da ligação dissulfeto, peptidil-prolil isomerases que interconvertem a ligação peptidil-prolil cis/trans e proteases que degradam proteínas dobradas erroneamente ou agregadas. A superexpressão de muitas destas proteínas foi usada para aumentar o título de proteínas heterólogas, incluindo fragmentos de anticorpos, em E. coli (Thomas et al., Applied Biochemistry and Biotechnology, 66, 197, 1997; Kolaj et al., Microbial Cell Factories, 8, 2009; Merdanovic et al., Annu.
Rev. Microbiol. 65, 149, 2011).
[006] Na indústria, a expressão procariótica de um anticorpo ou fragmento de anticorpo que apresenta um aminoácido não natural incorporado em um sítio selecionado ou específico é difícil de obter. Isto é particularmente observado para fragmentos de anticorpos em E. coli. Até o momento, apenas algumas empresas de biotecnologia e farmacêuticas podem expressar com êxito fragmentos de anticorpos do tipo selvagem em Escherichia coli em um título alto.
[007] Para superar os desafios enfrentados com a expressão de proteínas difíceis de expressar (DTE), a presente invenção utiliza proteínas e/ou fatores auxiliares, incluindo chaperonas, no projeto e engenharia de vetores e plasmídeos a partir dos mesmos para obter otimização do título de um fragmento de anticorpo em que um aminoácido não naturalmente codificado é incorporado.
SUMÁRIO DA INVENÇÃO
[008] A presente invenção fornece novos vetores, plasmídeos e cepas de produção construídos. Em algumas formas de realização, a invenção fornece novos plasmídeos de expressão e a cepa de produção correspondente para a otimização da expressão da proteína e rendimento do título. Na forma de realização da invenção, os vetores e cepas construídos compreendem uma sequência de ácidos nucleicos que codifica uma proteína de interesse tendo um sítio de aminoácido não natural especificamente incorporado e uma sequência de ácidos nucleicos que codifica um ou mais componentes, em que o componente é uma proteína ou fator auxiliar ou um elemento genético. Em outras formas de realização, a divulgação da invenção fornece métodos e plasmídeos de expressão e cepas de produção para otimizar a expressão da proteína em um sistema procarionte, tal como, mas não limitado a E. coli.
[009] Em algumas formas de realização, um ou mais componentes são um componente eucariótico ou procariótico. Em algumas formas de realização, um ou mais componentes são uma proteína ou fator auxiliar ou um elemento genético. O elemento genético pode ser um gene ou polinucleotídeo que codifica uma proteína ou elemento regulatório.
[010] Em uma forma de realização, a presente invenção fornece um vetor para otimizar a expressão da proteína compreendendo uma sequência de ácidos nucleicos que codifica uma proteína de interesse tendo um sítio de aminoácido não naturalmente codificado especificamente incorporado e uma sequência de ácidos nucleicos que codifica um ou mais componentes, em que um ou mais componentes são selecionados a partir da SEQ. ID. NOs.: 12, 15 ou 17.
[011] Em outras formas de realização, um ou mais componentes podem estar envolvidos em dobra de proteína, chaperonas periplasmáticas, elementos genéticos, incluindo sequência de codificação de DNA, extensão do terminal carbóxi da cadeia pesada (HC) de Fab e o loco de partição do plasmídeo, parB. Em algumas formas de realização, um destes componentes pode ser incluído em um plasmídeo de expressão juntamente com a proteína de interesse. Em outras formas de realização, dois ou três ou mais destes componentes podem ser incluídos em um plasmídeo juntamente com a proteína de interesse. Em algumas formas de realização, todos os componentes podem ser incluídos em um plasmídeo de expressão único tendo um promotor nativo ou em um sistema de dois plasmídeos tendo um promotor induzível.
[012] Em outras formas de realização, um ou mais componentes são uma proteína ou fator auxiliar ou um elemento genético. Em outras formas de realização, a proteína ou fator auxiliar é uma chaperona. A chaperona é Skp ou FkpA ou Skp e FkpA. Em outra forma de realização, o elemento genético é o loco de partição B (parB).
[013] Em uma forma de realização, o vetor da presente invenção compreende adicionalmente variante de extensão C-terminal de cadeia pesada. Em outra forma de realização, a variante de extensão C-terminal de cadeia pesada é uma variante de extensão C-terminal de cadeia pesada de anticorpo. Em outras formas de realização, a variante de extensão C-terminal de cadeia pesada compreende um ou mais aminoácidos.
[014] Em outras formas de realização, o parB está posicionado em uma orientação de transcrição direta entre os sítios Afe1 e Not1 da sequência de ácidos nucleicos que codifica a proteína de interesse. Em outra forma de realização, o parB está posicionado em uma orientação de transcrição direta nos sítios Afe1 ou Zra1 da sequência de ácidos nucleicos que codifica a proteína de interesse. Em outra forma de realização, o parB está posicionado em uma orientação de transcrição reversa nos sítios Afe1 ou Zra1 da sequência de ácidos nucleicos que codifica a proteína de interesse. Em outra forma de realização, o vetor compreende adicionalmente o loco de partição B (parB).
[015] Em uma forma de realização, uma ou mais proteínas capazes de facilitar a dobra de proteína são FkpA, Skp, SurA, PPiA e PPiD. Em outras formas de realização, uma ou mais proteínas capazes de facilitar a secreção ou translocação da proteína são SecY, SecE, SecG, SecYEG, SecA, SecB, FtsY e Lep. Em outra forma de realização, uma ou mais proteínas capazes de facilitar a formação de ligação dissulfeto são DsbA, DsbB, DsbD, DsbG. Em algumas formas de realização, a chaperona pode incluir Skp ou FpkA. Em outras formas de realização, o parB pode ser clonado na direção direta entre os sítios Afe1 e Not1, no sítio Zra1 ou no sítio Afe1. Em outras formas de realização, o plasmídeo contém uma deleção de sequência de 271 pares de base. Em outra forma de realização, o plasmídeo contém o parB na orientação direta e as chaperonas Skp ou FpkA clonadas no sítio Zra1.
Em outras formas de realização, o plasmídeo contém o parB ou FkpA em uma posição a montante ou a jusante e parB na orientação direta. Em uma forma de realização adicional, o plasmídeo contém FkpA em uma posição a montante ou a jusante e na orientação direta ou reversa. Em outra forma de realização, o plasmídeo contém o parB em uma posição a montante e FkpA em uma posição a jusante. Em outra forma de realização, o plasmídeo contém o parB em uma posição a jusante e FkpA em uma posição a montante. Em algumas formas de realização, a extensão de cadeia pesada do terminal carbóxi pode compreender ou consistir de 1, 2, 3, 4, 5 ou mais aminoácidos. Em algumas formas de realização, a extensão de cadeia pesada do terminal carbóxi pode compreender ou consistir de 5 ou mais aminoácidos com pelo menos uma mutação nos mesmos.
[016] Em outras formas de realização, a proteína de interesse é selecionado a partir de uma molécula bioterapêutica, biologicamente ativa, imunógeno, anticorpo, fragmento de anticorpo ou variantes dos mesmos. Em outras formas de realização, o produto bioterapêutico é uma vacina. Em outra forma de realização, a proteína de interesse é uma citocina, quimiocina, fator de crescimento, receptor do fator de crescimento, interferon, interleucina, molécula inflamatória, produto de oncogene, hormônio peptídico, molécula de transdução de sinal ou receptor do hormônio esteroide. Em outras formas de realização, a proteína de interesse é HER2, CD-70, PSMA, 5T4, EGFR, TROP2, CD3, IL-2, IL-3, IL-10, IL-12, IL-15, IL-21, GPC3, DLL3, ROR1, leptina, grelina, FGF-1, FGF-19, FGF-21, FGF-23, HGH, FcR, insulina, IGF1, TNFR1, TRAIL, EPO e análogos, biespecíficos ou fragmentos dos mesmos.
[017] Em uma forma de realização, o anticorpo é um anticorpo de comprimento total ou um fragmento de anticorpo. Em outras formas de realização, o anticorpo é um anticorpo IgG1, IgG2, IgG3 ou IgG4. Em outras formas de realização, o fragmento de anticorpo é fragmento Fab, Fab’, F(ab’)2, Fv, fragmentos de anticorpos de cadeia única (scFv), scFv estabilizado por dissulfeto (dsFv)), diacorpo (Db), BiTE (Ligador de células T biespecífico), DART (Redirecionamento de Dupla Afinidade) ou Diacorpo em Tandem (TandAb). Em algumas formas de realização, o fragmento de anticorpo é Fab.
[018] Na forma de realização da invenção, o plasmídeo e cepas construídos compreendem uma sequência de ácidos nucleicos que codifica anticorpos que alvejam proteínas ou polipeptídeos de interesse, incluindo, mas não limitados a HER2, CD-70, PSMA, 5T4, EGFR, TROP2, CD3, IL-2, IL-3, IL-10, IL-12, IL-15, IL-21, GPC3, DLL3, ROR1, leptina, grelina, FGF-1, FGF-19, FGF-21, FGF-23, HGH, FcR, insulina, IGF1, TNFR1, TRAIL, EPO e análogos, biespecíficos ou fragmentos dos mesmos tendo um sítio de aminoácido não natural especificamente incorporado e uma sequência de ácidos nucleicos que codifica um ou mais componentes, em que um ou mais componentes são uma proteína ou fator auxiliar ou um elemento genético. Em outras formas de realização da invenção, os plasmídeos construídos compreendem uma sequência de ácidos nucleicos que codifica um anticorpo específico para qualquer antígeno alvo, incluindo, mas não limitado a HER2, CD-70, PSMA, 5T4, EGFR, TROP2, CD3, IL-2, IL-3, IL-10, IL-12, IL-15, IL-21, GPC3, DLL3,
ROR1, leptina, grelina, FGF-1, FGF-19, FGF-21, FGF-23, HGH, FcR, insulina, IGF1, TNFR1, TRAIL, EPO e análogos, biespecíficos ou fragmentos dos mesmos, em que o fragmento é um fragmento Fab, Fab’, F(ab’)2, Fv, fragmentos de anticorpos de cadeia única (scFv), scFv estabilizado por dissulfeto (dsFv)), diacorpo (Db), BiTE (Ligador de células T biespecífico), DART (Redirecionamento de Dupla Afinidade) ou Diacorpo em Tandem (TandAb) e semelhantes, tendo um sítio de aminoácido não natural especificamente incorporado e uma sequência de ácidos nucleicos que codifica um ou mais componentes, em que um ou mais componentes são uma proteína ou fator auxiliar ou um elemento genético. Em outras formas de realização, a sequência de ácidos nucleicos codifica um HER2, CD-70, PSMA, 5T4, EGFR, TROP2, CD3, IL-2, IL-3, IL-10, IL-12, IL-15, IL-21, GPC3, DLL3, ROR1, leptina, grelina, FGF-1, FGF-19, FGF-21, FGF-23, HGH, FcR, insulina, IGF1, TNFR1, TRAIL, EPO e análogos, biespecíficos ou fragmentos de anticorpos, mas não é limitada a tal. Em outras formas de realização, o fragmento de anticorpo é um fragmento Fab, Fab’, F(ab’)2, Fv, fragmentos de anticorpos de cadeia única (scFv), scFv estabilizado por dissulfeto (dsFv)), diacorpo (Db), BiTE (Ligador de células T biespecífico), DART (Redirecionamento de Dupla Afinidade) ou Diacorpo em Tandem (TandAb), mas não é limitado a tal. Em outras formas de realização, o anticorpo ou fragmento do mesmo é uma molécula de Fab pegilada. Em outras formas de realização, o fragmento de anticorpo é Fab anti-CD3.
[019] Em uma forma de realização, a cepa de produção ou célula construída é 2797, 2835, 2884, 2885, 2886, 2887, 2909, 2910, 2914, 2915, 2916, 2917, 2918, 2839, 2840, 2841, 3004, 3005 ou 3006, como ilustrado nas figuras, tabelas e Exemplos neste relatório. Em outra forma de realização, o plasmídeo de expressão é o plasmídeo p56, p96, p117, p118, p119, p120, p134, p135, p141, p142, p143, p144, p145, p94, p199, p200 ou p201, como ilustrado nas figuras, tabelas e Exemplos neste relatório.
[020] Em uma forma de realização, a invenção fornece uma célula recombinante compreendendo uma sequência de ácidos nucleicos que codifica uma proteína de interesse tendo um sítio de aminoácido não naturalmente codificado especificamente incorporado e uma sequência de ácidos nucleicos que codifica um ou mais componentes, em que um ou mais componentes são selecionados a partir da SEQ. ID. NOs.: 12, 15 ou 17. Em uma forma de realização, a célula recombinante é a cepa 2797, 2835, 2884, 2885, 2886, 2887, 2909, 2910, 2914, 2915, 2916, 2917, 2918, 2839, 2840, 2841, 3004, 3005 ou 3006. Em outras formas de realização, a célula recombinante compreende a chaperona Skp e o loco de partição B (parB). A célula é selecionada a partir da cepa 2910 ou 2841. Em outras formas de realização, a célula recombinante compreende a chaperona FkpA e o loco de partição B (parB).
A célula é selecionada a partir de cepa 2909, 2840, 3004, 3005 ou 3006. Em outras formas de realização, a célula recombinante compreende uma variante de extensão C-terminal de cadeia pesada. A célula é selecionada a partir da cepa 2914, 2915, 2916, 2917 ou 2918.
[021] Em uma forma de realização, a invenção fornece um plasmídeo de expressão, de acordo com qualquer uma das reivindicações em que o plasmídeo é p56, p94, p96, p117, p118, p119, p120, p134, p135, p141, p142, p143, p144, p145, p199, p200 ou p201.
[022] Em outras formas de realização, otimizar ou aumentar o título de expressão de uma proteína, polipeptídeo ou fragmento de anticorpo de interesse em um sistema procarionte, tal como E. coli, pode incluir otimizar ou aumentar o rendimento de expressão em pelo menos 0,2 vez, pelo menos 0,5 vez, pelo menos 1 vez, pelo menos 2 vezes, pelo menos 3 vezes, pelo menos 4 vezes, pelo menos 5 vezes, pelo menos 6 vezes, pelo menos 7 vezes, pelo menos 8 vezes, pelo menos 9 vezes, pelo menos 10 vezes, pelo menos 20 vezes, pelo menos 30 vezes, pelo menos 40 vezes, pelo menos 50 vezes, pelo menos 60 vezes, pelo menos 70 vezes,
pelo menos 80 vezes, pelo menos 90 ou mais vezes sobre a cepa de partida. Em outras formas de realização, otimizar ou aumentar o título de expressão de uma proteína, polipeptídeo, fragmento de anticorpo de interesse em um sistema procarionte, tal como E. coli, pode incluir otimizar ou aumentar o rendimento de expressão em cerca de ou aproximadamente 0,25 g/L, 0,5 g/L, 1,0 g/L, 1,5 g/L, 2,0 g/L, 2,5 g/L, 3,0 g/L, 3,5 g/L, 4,0 g/L, 4,5 g/L, 5,0 g/L ou mais, 10 g/L ou mais, 20 g/L ou mais.
[023] Em uma forma de realização, a invenção fornece um método para produzir um proteína recombinante de interesse que incorpora um aminoácido não naturalmente codificado, o método compreendendo expressar a proteína em uma célula bacteriana e introduzir uma sequência de ácidos nucleicos que codifica um ou mais componentes, em que um ou mais componentes são selecionados a partir da SEQ. ID. NOs.: 12, 15 ou 17. Em outra forma de realização, é fornecido um método para aperfeiçoar o rendimento de uma proteína tendo um sítio de aminoácido não natural especificamente incorporado. Em algumas formas de realização, a invenção fornece um método para otimizar ou aumentar a expressão da proteína recombinante de uma proteína difícil de expressar de interesse, em que a proteína incorpora um aminoácido não naturalmente codificado. Em outras formas de realização, a posição do gene da chaperona e a orientação em relação ao gene de interesse pode otimizar o rendimento da proteína recombinante.
[024] Em outras formas de realização, a proteína, polipeptídeo, anticorpo ou gene de interesse é uma citocina, um fator de crescimento, um receptor do fator de crescimento, um interferon, uma interleucina, uma molécula inflamatória, um produto de oncogene, um hormônio peptídico, uma molécula de transdução de sinal, um receptor do hormônio esteroide, um ativador transcricional, um supressor transcricional, eritropoietina (EPO), insulina, hormônio do crescimento humano, Peptídeo de Ativação de Neutrófilos epiteliais-78, GROα/MGSA, GROβ, GRO, MIP-
1α, MIP-1β, MCP-1, fator de crescimento de hepatócitos, fator de crescimento semelhante à insulina, fator inibitório de leucemia, oncostatina M, PD-ECSF, PDGF,
pleiotropina, SCF, ligante c-kit, VEGF, G-CSF, IL-1, IL-2, IL-8, IGF-I, IGF-II, FGF
(fator de crescimento de fibroblastos), TNF, TGF-α, TGF-β, EGF (fator de crescimento epidérmico), KGF (fator de crescimento de queratinócitos), SCF/c-Kit,
CD40L/CD40, VLA-4/VCAM-1, ICAM-1/LFA-1, hialurina/CD44, Mos, Ras, Raf, Met,
p53, Tat, Fos, Myc, Jun, Myb, Rel, receptor de estrogênio, receptor de progesterona,
receptor de testosterona, receptor de aldosterona, receptor de LDL e corticosterona,
uma antitripsina Alfa-1, um Angiostatina, um fator anti-hemolítico, uma
Apolipoproteína, uma Apoproteína, um fator natriurético atrial, um polipeptídeo natriurético atrial, um peptídeo atrial, uma quimiocina C-X-C, T39765, NAP-2, ENA-
78, um Gro-a ou Gro-c, um IP-10, um GCP-2, um NAP-4, um SDF-1, um PF4, um
MIG, uma Calcitonina, um ligante c-kit, uma citocina, uma quimiocina CC, uma proteína quimioatraente de monócitos-1, uma proteína quimioatraente de monócitos-
2, uma proteína quimioatraente de monócitos-3, uma proteína inflamatória de monócitos-1 alfa, uma proteína inflamatória de monócitos-1 beta, RANTES, I309, R83915, R91733, HCC1, T58847, D31065, T64262, um Ligante C-kit, um colágeno,
um fator estimulante de colônia (CSF), um fator do complemento 5a, um inibidor do complemento, um receptor do complemento 1, uma citocina, um Peptídeo de
Ativação de Neutrófilos epiteliais-78, um Fator de Crescimento Epidérmico (EGF),
um Peptídeo de Ativação de Neutrófilos epiteliais, uma Eritropoietina (EPO), uma
Toxina esfoliativa, um Fator IX, um Fator VII, um Fator VIII, um Fator X, um Fator de
Crescimento de Fibroblastos (FGF), um Fibrinogênio, uma Fibronectina, um G-CSF,
um GM-CSF, uma Glucocerebrosidase, uma Gonadotropina, um fator de crescimento, um receptor do fator de crescimento, uma proteína Hedgehog, uma
Hemoglobina, um Fator de crescimento de hepatócitos (HGF), uma Hirudina, uma albumina sérica humana, um ICAM-1, um receptor de ICAM-1, um LFA-1, um receptor de LFA-1, uma Insulina, um Fator de Crescimento Semelhante à Insulina (IGF), um IGF-I, um IGF-II, um interferon, um IFN-α, um IFN-beta, um IFN-γ, uma interleucina, uma IL-1, uma IL-2, uma IL-3, uma IL-4, uma IL-5, uma IL-6, uma IL-7, uma IL-8, uma IL-9, uma IL-10, uma IL-11, uma IL-12, um Fator de Crescimento de Queratinócitos (KGF), uma Lactoferrina, um fator inibitório de leucemia, uma Luciferase, um Neurturina, um fator inibitório de neutrófilos (NIF), uma oncostatina M, uma proteína osteogênica, um produto de oncogene, um hormônio da paratireoide, um PD-ECSF, um PDGF, um hormônio peptídico, um Hormônio do crescimento humano, uma Pleiotropina, uma proteína A, uma proteína G, uma exotoxina pirogênica A, B ou C, uma Relaxina, um Renina, um SCF, um receptor do complemento solúvel I, um I-CAM 1 Solúvel, um receptor de interleucina solúvel, um receptor de TNF solúvel, uma Somatomedina, uma Somatostatina, uma Somatotropina, uma estreptocinase, um Superantígeno, uma enterotoxina estafilocócica, um SEA, um SEB, um SEC1, um SEC2, um SEC3, um SED, um VEJA, um receptor do hormônio esteroide, uma Superóxido dismutase, uma toxina da síndrome do choque tóxico, uma timosina alfa 1, um ativador de plasminogênio tecidual, um fator de crescimento tumoral (TGF), um TGF-α, um TGF-β, um Fator de Necrose Tumoral, um Fator de Necrose Tumoral alfa, um fator de necrose tumoral beta, um Receptor do fator de necrose tumoral (TNFR), uma proteína VLA-4, uma proteína VCAM-1, um Fator de crescimento endotelial vascular (VEGF), uma urocinase, um Mos, um Ras, um Raf, um Met; um p53, um Tat, um Fos, um Myc, um Jun, um Myb, um Rel, um receptor de estrogênio, um receptor de progesterona, um receptor de testosterona, um receptor de aldosterona, um receptor de LDL e uma corticosterona e semelhantes.
[025] Em outras formas de realização, o aminoácido não natural é selecionado a partir do grupo que consiste de: uma O-metil-L-tirosina, uma L-3-(2- naftil)alanina, uma 3-metil-fenilalanina, uma O-4-alil-L-tirosina, uma 4-propil-L-
tirosina, uma tri-O-acetil-GlcNAcβ-serina, uma L-Dopa, uma fenilalanina fluorada,
uma isopropil-L-fenilalanina, uma p-azido-L-fenilalanina, uma p-acil-L-fenilalanina,
uma p-benzoil-L-fenilalanina, uma L-fosfosserina, uma fosfonosserina, uma fosfonotirosina, uma p-iodo-fenilalanina, uma p-bromofenilalanina, uma p-amino-L-
fenilalanina, uma isopropil-L-fenilalanina, um análogo não natural de um aminoácido tirosina; um análogo não natural de um aminoácido glutamina; um análogo não natural de um aminoácido fenilalanina; um análogo não natural de um aminoácido serina; um análogo não natural de um aminoácido treonina; um aminoácido substituído por alquila, arila, acila, azido, ciano, halo, hidrazina, hidrazida, hidroxila,
alquenila, alquinila, éter, tiol, sulfonila, seleno, éster, tioácido, borato, boronato, fosfo,
fosfono, fosfina, heterocíclico, enona, imina, aldeído, hidroxilamina, ceto ou amino ou qualquer combinação dos mesmos; um aminoácido com um reticulador fotoativável;
um aminoácido marcado com spin; um aminoácido fluorescente; um aminoácido com um novo grupo funcional; um aminoácido que interage covalente ou não covalentemente com outra molécula; um aminoácido de ligação ao metal; um aminoácido contendo metal; um aminoácido radioativo; um aminoácido fotoengaiolado e/ou fotoisomerizável; uma biotina ou análogo de biotina contendo aminoácido; um aminoácido glicosilado ou modificado com carboidrato; um aminoácido contendo ceto; aminoácidos compreendendo polietilenoglicol ou poliéter;
um aminoácido substituído por átomo pesado; um aminoácido quimicamente clivável ou fotoclivável; um aminoácido com uma cadeia lateral alongada; um aminoácido contendo um grupo tóxico; um aminoácido substituído por açúcar, por exemplo, uma serina substituída por açúcar ou semelhantes; um aminoácido contendo açúcar ligado ao carbono; um aminoácido redox ativo; um ácido contendo α-hidróxi; um aminoácido contendo aminotioácido; um aminoácido α,α di-substituído; um β-
aminoácido; e um aminoácido cíclico, exceto prolina.
[026] Em outras formas de realização, a invenção fornece uma célula ou linhagem celular isolada. Em algumas formas de realização, a célula ou linhagem celular isolada é para a produção de uma proteína ou polipeptídeo contendo aminoácido não natural. Em outra forma de realização, a invenção fornece uma célula ou linhagem celular isolada, em que o rendimento da proteína contendo aminoácido não natural é de pelo menos 0,25 vez ou maior na presença de uma ou mais chaperonas e loco parB. Em outras formas de realização, o rendimento da proteína contendo aminoácido não natural é de pelo menos 0,25 vez ou maior na presença de uma ou mais chaperonas e o loco parB está posicionado em uma orientação de transcrição reversa no sítio Afe1 da sequência de ácidos nucleicos que codifica a proteína de interesse. Em outras formas de realização, a célula ou linhagem celular isolada otimiza a retenção de plasmídeo em uma célula ou linhagem celular de produção.
BREVE DESCRIÇÃO DOS DESENHOS
[027] As novas características da invenção são apresentadas com particularidade nas reivindicações anexas. Uma melhor compreensão das características e vantagens da presente divulgação da invenção será obtida por referência à seguinte descrição detalhada que apresenta formas de realização ilustrativas, em que os princípios da invenção são utilizados e os desenhos anexos fornecidos.
[028] Figura 1. Esquema do cassete de expressão de Fab anti-CD3- HK129pAcF com o sítio de incorporação de aminoácido não natural pAcF mostrado na região de domínio constante de cadeia pesada (CH1).
[029] Figura 2. Esquema geral para a construção de plasmídeos de expressão e suas cepas de produção correspondentes.
[030] Figura 3. Mapa circular do plasmídeo p56 que ilustra nomes, localizações e direções transcricionais de vários elementos de expressão.
[031] Figura 4. Títulos de fermentação da cepa de produção 2835 que abriga o plasmídeo p96 juntamente com a cepa precursora 2797 que abriga o plasmídeo precursor p56. No plasmídeo p96, o loco parB foi clonado na orientação direta entre os sítios de enzima de restrição AfeI e NotI, desse modo, deletando uma sequência de nucleotídeos de 271-bp a partir da estrutura do plasmídeo. Os títulos de pelotas celulares das cepas de produção 2797 e 2835 são mostrados.
[032] Figuras 5A a B. Títulos de fermentação de 4 novas cepas de produção contendo parB sem qualquer deleção da sequência da estrutura do plasmídeo. Nas cepas 2884 (p117) e 2885 (p118), o loco parB foi clonado em a orientação Dir ou Rev, respectivamente, no sítio de enzima de restrição AfeI. Nas cepas 2886 (p119) e 2887 (p120), o loco parB foi clonado na orientação Dir ou Rev, respectivamente, no sítio de enzima de restrição ZraI. Os títulos da pelota celular (Figura 5A) e do meio (Figura 5B) são mostrados.
[033] Figura 6. Mapa do plasmídeo p119 contido na cepa 2886 mostrada com a localização e orientação ideais do loco parB.
[034] Figuras 7A a B. Esquema de um sistema de expressão compatível de dois plasmídeos (Figura 7A) versus plasmídeo único (Figura 7B) para o teste dos efeitos da expressão de chaperona periplasmática. O vetor Fab contém o marcador AmpR e o vetor chaperona contém o marcador KanR no sistema de dois plasmídeos. Para o sistema de plasmídeo único, o gene da chaperona é clonado no vetor Fab padrão com o marcador KanR.
[035] Figura 8. Títulos de fermentação de duas cepas que expressam chaperona periplasmática, cepas 2840 e 2841, juntamente com uma cepa controle 2839 sem qualquer gene da chaperona em um sistema de dois plasmídeos de expressão compatível.
[036] Figuras 9A a B. Títulos de fermentação de duas cepas que expressam chaperona periplasmática, a cepa 2909 (p134) e a cepa 2910 (p135), juntamente com a cepa precursora 2886 (p119) em um sistema de expressão de plasmídeo único. Os títulos da pelota celular (Figura 9A) e do meio (Figura 9B) são mostrados.
[037] Figura 10. Mapa de plasmídeo p134 contido na cepa 2909 mostrada com a localização e orientação da chaperona FkpA e do loco parB.
[038] Figura 11. Títulos de pelotas celulares de várias cepas que expressam os fatores auxiliares loco parB e chaperona FkpA variando em sua posição e orientação no plasmídeo.
[039] Figuras 12A a B. Esquema de vários fragmentos traducionalmente truncados (seta pontilhada) e proteoliticamente clipados (seta cheia) da cadeia pesada (Figura 12A) e cadeia leve (Figura 12B) de Fab a partir da cepa 2886, capturada em uma fração de eluição de coluna Capto S. Nesta cepa, recuperação de Fab intacto típica foi entre 20 a 25 % de proteínas capturadas totais.
[040] Figuras 13A a B. títulos recuperáveis (Figura 13A) e análise de pureza (Figura 13B) de diversas variantes de extensão carbóxi-terminal (C-term) de cadeia pesada (HC). Novas cepas 2914 a 2918 (que abrigam o plasmídeo p141 a p145, respectivamente) são comparadas com a cepa controle 2909 (que abriga o plasmídeo p134) sem qualquer extensão C-terminal HC. A Figura 13A mostra o título recuperável pela coluna Capto S das variantes de cadeia pesada (HC). A Figura 13B mostra a análise de pureza do agrupamento da coluna Capto S das variantes de extensão de cadeia pesada (HC).
DESCRIÇÃO DETALHADA DA INVENÇÃO
[041] Antes de descrever a presente invenção em detalhes, deve ser entendido que esta invenção não é limitada às metodologias particulares ou composições ou sistemas biológicos, que podem, certamente, variar. Também deve ser entendido que a terminologia usada neste relatório é para o propósito de descrever apenas formas de realização particulares e não é se destina a ser limitante. Como usadas nesta especificação e nas reivindicações anexas, as formas singulares “um”, “uma” e “o/a” incluem referentes plurais, a menos que o conteúdo indique outro modo. Assim, por exemplo, a referência a “uma célula” inclui uma combinação de duas ou mais células e semelhantes.
[042] Embora as formas de realização preferidas da invenção tenham sido mostradas e descritas neste relatório, será óbvio para os técnicos no assunto que tais formas de realização são fornecidas apenas através de exemplo. As diversas variações, alterações e substituições, ocorrerão aos técnicos no assunto sem se afastar da invenção. Deve ser entendido que várias alternativas às formas de realização da invenção descritas neste relatório podem ser utilizadas na prática da invenção. Pretende-se que as seguintes reivindicações definam o escopo da invenção e que os métodos e estruturas dentro do escopo dessas reivindicações e seus equivalentes sejam cobertos pelas mesmas.
[043] A menos que de outro modo definido neste relatório ou abaixo no restante da especificação, todos os termos técnicos e científicos usados neste relatório têm o mesmo significado como comumente entendido pelos técnicos no assunto à qual a invenção pertence.
DEFINIÇÕES
[044] O termo “aminoácido” refere-se a aminoácidos de ocorrência natural ou não natural, bem como análogos de aminoácidos e miméticos de aminoácidos que funcionam de uma maneira similar aos aminoácidos de ocorrência natural. Os aminoácidos codificados naturalmente são os 20 aminoácidos comuns (alanina, arginina, asparagina, ácido aspártico, cisteína, glutamina, ácido glutâmico, glicina, histidina, isoleucina, leucina, lisina, metionina, fenilalanina, prolina, serina, treonina, triptofano, tirosina e valina) e pirolisina e selenocisteína. Os análogos de aminoácido referem-se aos compostos que têm a mesma estrutura química básica como um aminoácido de ocorrência natural, a título do exemplo apenas, um carbono α que está ligado a um hidrogênio, um grupo carboxila, um grupo amino e um grupo R funcional. Tais análogos podem ter grupos R modificados (a título do exemplo, norleucina) ou podem ter esqueletos peptídicos modificados enquanto ainda retêm a mesma estrutura química básica como um aminoácido de ocorrência natural. Os exemplos não limitantes de análogos de aminoácido incluem homosserina, norleucina, sulfóxido de metionina, metil metionina sulfônio. Os aminoácidos podem ser referidos neste relatório por seus nomes, seus símbolos de três letras comumente conhecidos ou pelos símbolos de uma letra recomendados pela Comissão de Nomenclatura Bioquímica IUPAC-IUB. Adicionalmente, nucleotídeos, podem ser referidos por seus códigos de uma letra comumente aceitos.
[045] O termo “anticorpo” neste relatório refere-se a uma proteína que consiste de um ou mais polipeptídeos substancialmente codificados por todo ou parte dos genes de anticorpo. Os genes de imunoglobulina incluem, mas não são limitados aos genes de região constante capa, lambda, alfa, gama (IgG1, IgG2, IgG3 e IgG4), delta, épsilon e um, bem como a miríade de genes de região variável de imunoglobulina. O anticorpo neste relatório também significado incluir anticorpos de comprimento total e fragmentos de anticorpos, e incluir anticorpos que existem naturalmente em qualquer organismo, variantes de anticorpos, anticorpos projetados e fragmentos de anticorpos. O anticorpo neste relatório também significa incluir o anticorpo intacto, anticorpos monoclonais ou policlonais. O anticorpo neste relatório também abrange anticorpos multiespecíficos e/ou anticorpos biespecíficos. Os anticorpos da presente invenção incluem anticorpos humanos. Os anticorpos humanos são usualmente feitos de duas cadeias leves e duas cadeias pesadas, cada uma compreendendo regiões variáveis e regiões constantes. A região variável da cadeia leve compreende 3 CDRs, identificados neste relatório como CDRL1, CDRL2 e CDRL3 flanqueados por regiões de estrutura. A região variável da cadeia pesada compreende 3 CDRs, identificados neste relatório como CDRH1, CDRH2 e CDRH3 flanqueados por regiões de estrutura.
[046] O termo “fragmento de anticorpo” neste relatório refere-se a qualquer forma de um anticorpo exceto a forma de comprimento total.
Os fragmentos de anticorpos neste relatório incluem anticorpos que são componentes menores que existem dentro de anticorpos de comprimento total, e anticorpos que foram projetados, tais como variantes de anticorpos.
Os fragmentos de anticorpos incluem,
mas não são limitados a Fv, Fc, Fab e (Fab’)2, Fv de cadeia única (scFv), diacorpos, triacorpos, tetracorpos, anticorpos híbridos bifuncionais, CDR1, CDR2, CDR3,
combinações de CDRs, regiões variáveis, regiões de estrutura, regiões constantes,
cadeias pesadas, cadeias leves e regiões variáveis e moléculas de não anticorpo de arcabouço alternativo, anticorpos biespecíficos e semelhantes (Maynard & Georgiou,
Annu.
Rev.
Biomed.
Eng. 2:339 a 76, 2000; Hudson, Curr.
Opin.
Biotechnol. 9:395 a
402, 1998). Outra subestrutura funcional é um Fv de cadeia única (scFv), composta pelas regiões variáveis da cadeia leve e pesada da imunoglobulina, covalentemente conectada por um ligante peptídico (Hu et al., Cancer Research, 56, 3055 a 3061,
1996). Estas proteínas pequenas (Mr 25.000) geralmente retêm especificidade e afinidade para o antígeno em um único polipeptídeo e podem fornecer um bloco de construção conveniente para moléculas maiores específicas do antígeno.
A menos que especificamente observado de outro modo, as declarações e reivindicações que usam o termo “anticorpo” ou “anticorpos” especificamente incluem “fragmento de anticorpo” e “fragmentos de anticorpos”. Como usado neste relatório, o termo
“fragmento de anticorpo”, quando usado no contexto de anticorpo, refere-se a uma porção do anticorpo que tem cerca de 10 % a cerca de 99 % do comprimento do anticorpo completo.
Por exemplo, um fragmento de um anticorpo pode ter pelo menos cerca de 10 %, 11 %, 12 %, 13 %, 14 %, 15 %, 16 %, 17 %, 18 %, 19 %, 20
%, 21 %, 22 %, 23 %, 24 % ou 25 % do comprimento do anticorpo completo.
Um fragmento de um anticorpo também pode ter pelo menos cerca de 25 %, 26 %, 27
%, 28 %, 29 %, 30 %, 31 %, 32 %, 33 %, 34 %, 35 %, 36 %, 37 %, 38 %, 39 %, 40
%, 41 %, 42 %, 43 %, 44 %, 45 %, 46 %, 47 %, 48 %, 49 %, 50 %, 51 %, 52 %, 53 %, 54 %, 55 %, 56 %, 57 %, 58 %, 59 %, 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % do comprimento do anticorpo completo. Em algumas formas de realização, o fragmento de anticorpo é um diacorpo (Db), BiTE (Ligador de células T biespecífico), DART (Redirecionamento de Dupla Afinidade) ou Diacorpo em Tandem (TandAb).
[047] Em algumas formas de realização, a divulgação se refere a aminoácidos que foram incorporadas biossinteticamente no anticorpo. O termo “biossinteticamente”, como usado neste relatório, refere-se a qualquer método que utiliza um sistema de tradução (celular ou não celular), incluindo o uso de pelo menos um dos seguintes componentes: um polinucleotídeo, um códon, um tRNA, e um ribossomo. A título do exemplo, os aminoácidos não naturais podem ser “biossinteticamente incorporados” em polipeptídeos de aminoácidos não naturais usando os métodos e técnicas descritos neste relatório e como é bem conhecido na técnica. Veja, por exemplo, WO 2010/011735 e WO 2005/074650.
[048] O termo “molécula biologicamente ativa”, “porção biologicamente ativa” ou “agente biologicamente ativo” quando usado neste relatório, significa qualquer substância que possa afetar quaisquer propriedades físicas ou bioquímicas de um sistema biológico, trajetória, molécula ou interação relacionado a um organismo, incluindo, mas não limitado a vírus, bactéria, bacteriófago, transposon, príon, insetos, fungos, plantas, animais e seres humanos. Em particular, como usado neste relatório, as moléculas biologicamente ativas incluem, mas não são limitadas a, qualquer substância destinada a diagnóstico, cura, mitigação, tratamento ou prevenção de doença em humanos ou outros animais, ou para, de outro modo, realçar o bem-estar físico ou mental de humanos ou animais. Exemplos de moléculas biologicamente ativas incluem, mas não são limitados a, peptídeos, proteínas, enzimas, drogas de moléculas pequenas, vacinas, imunógenos, drogas pesadas, drogas leves, carboidratos, átomos ou moléculas inorgânicas, corantes, lipídeos, nucleosídeos, radionuclídeos, oligonucleotídeos, toxoides, moléculas biologicamente ativas, células eucarióticas e procarióticas, vírus, polissacarídeos, ácidos nucleicos e porções dos mesmos, obtidas ou derivadas de vírus, bactéria, insetos, animais ou qualquer outras células ou tipo de célula, lipossomos, micropartículas e micelas. As classes de agentes biologicamente ativos que são adequadas para o uso com a invenção incluem, mas não são limitados a, drogas, pró-drogas, radionuclídeos, agentes de imagem, polímeros, antibióticos, fungicidas, resinas de ácido biliar, niacina e/ou estatinas, agentes anti-inflamatórios, agentes antitumorais, agentes cardiovasculares, agentes ansiolíticos, hormônios, fatores de crescimento, agentes esteroidais, inibidores de proteínas de verificação, inibidores de trajetória de sinalização, moléculas biologicamente ativas derivadas de micróbios e semelhantes. Os agentes biologicamente ativos também incluem compostos de amida, tais como aqueles descritos na Publicação de Pedido de Patente U.S. Número 20080221112.
[049] “Agente redutor”, como usado neste relatório em relação à redobra de proteína, é definido como qualquer composto ou material que mantém grupos de sulfidrilo no estado reduzido e reduz ligações intra ou intermoleculares. Os agentes redutores adequados incluem, mas não são limitados a, ditiotreitol (DTT), 2- mercaptoetanol, ditioeritritol, cisteína, cisteamina (2-aminoetanotiol) e glutationa reduzida. É prontamente aparente para os técnicos no assunto que uma grande variedade de agente redutores é adequada para o uso nos métodos e composições da presente invenção.
[050] “Agente oxidante”, como usado neste relatório em relação à redobra de proteína, é definido como qualquer composto ou material que é capaz de remover um elétron de um composto a ser oxidado. Os agentes oxidantes adequados incluem, mas não são limitados a, glutationa oxidada, cistina, cistamina, ditiotreitol oxidado, eritreitol oxidado e oxigênio. É facilmente evidente para os técnicos no assunto que uma grande variedade de agentes oxidantes é adequada para o uso nos métodos da presente invenção.
[051] “Agente desnaturante” ou “desnaturante”, como usado neste relatório, é definido como qualquer composto ou material que poderá causar um reversível desdobramento de uma proteína. A força de um agente desnaturante ou desnaturante será determinada tanto pelas propriedades quanto pela concentração do agente desnaturante ou desnaturante particular. Os agentes desnaturante ou desnaturantes podem ser caotrópicos, detergentes, solventes orgânicos, solventes miscíveis em água, fosfolipídeos ou uma combinação de dois ou mais desses agentes. Os caótropos adequados incluem, mas não são limitados a, ureia, guanidina e tiocianato de sódio. Os detergentes úteis podem incluir, mas não são limitados a, detergentes fortes, tais como dodecilssulfato de sódio ou éteres de polioxietileno (por exemplo, detergentes Tween ou Triton), Sarkosil, detergentes não iônicos suaves (por exemplo, digitonina), detergentes catiônicos suaves, tais como N-›2,3-(dioleióxi)-propil-N,N,N-trimetilamônio, detergentes iônicos suaves (por exemplo, colato de sódio ou desoxicolato de sódio) ou detergentes zwitteriônicos incluindo, mas não limitados a, sulfobetaínas (Zwittergent), sulfato de 3-(3- clolamidopropil)dimetilamônio-1-propano (CHAPS) e sulfonato de 3-(3- clolamidopropil)dimetilamônio-2-hidróxi-1-propano (CHAPSO). Os solventes orgânicos, miscíveis em água, tais como acetonitrila, alcanóis inferiores (especialmente alcanóis C2-C4, tais como etanol ou isopropanol) ou alcanóis inferiores (especialmente alcanóis C2-C4, tais como etileno-glicol) podem ser usados como desnaturantes. OS fosfolipídeos úteis na presente invenção podem ser fosfolipídeos de ocorrência natural, tais como fosfatidiletanolamina, fosfatidilcolina,
fosfatidilserina e fosfatidilinositol ou fosfolipídeos sintéticos derivados ou variantes, tais como dihexanoilfosfatidilcolina ou diheptanoilfosfatidilcolina.
[052] “Redobra”, como usado neste relatório, descreve qualquer processo, reação ou método que transforma a ligação dissulfeto contendo polipeptídeos de um estado dobrado ou desdobrado de modo inadequado para uma conformação nativa ou corretamente dobrado em relação às ligações dissulfeto.
[053] “Redobra”, como usado neste relatório, refere-se especificamente a processos de redobra, reações ou métodos que utilizam, pelo menos, dois polipeptídeos que interagem entre si e o resultado na transformação de polipeptídeos ou impropriamente dobradas de polipeptídeos nativos, adequadamente desdobradas.
[054] “Variantes modificadas de forma conservativa” se aplicam tanto a aminoácido quanto a sequências de ácidos nucleicos. Em relação às sequências de ácidos nucleicos particulares, “variantes modificadas de forma conservativa” refere- se aos ácidos nucleicos que codificam sequência de aminoácidos idênticas ou essencialmente idênticas, ou onde o ácido não codifica uma sequência de aminoácidos, para sequências essencialmente idênticas. O termo “variantes modificadas de forma conservativa” se aplica tanto a aminoácidos naturais natural e não naturais quanto a sequências de ácidos nucleicos naturais e não naturais, e combinações dos mesmos. Em relação às sequências de ácidos nucleicos particulares, “variantes modificadas de forma conservativa” refere-se aos ácidos nucleicos naturais e não naturais que codificam sequências de aminoácidos naturais e não naturais idênticas ou essencialmente idênticas, ou onde o ácido nucleico natural e não natural não codifica uma sequência de aminoácidos natural e não natural, para sequências essencialmente idênticas. A título do exemplo, por causa da degeneração do código genético, um grande número de ácidos nucleicos funcionalmente idênticos codifica qualquer proteína. Por exemplo, os códons GCA,
GCC, GCG e GCU codificam o aminoácido alanina. Assim, em cada posição onde uma alanina é especificada por um códon, o códon pode ser alterado para qualquer um dos códons correspondentes descritos sem alterar o polipeptídeo codificado.
Tais variações de ácido nucleico são “variações silenciosas”, que são uma espécie de variações modificadas de forma conservativa. Assim, a título do exemplo, cada sequência de ácidos nucleicos natural ou não natural neste relatório, que codifica um polipeptídeo natural ou não natural também descreve todas as possíveis variações silenciosas do ácido nucleico natural ou não natural. Um técnico reconhecerá que cada códon em um ácido nucleico natural ou não natural (exceto AUG, que comumente é o único códon para metionina, e UGG, que comumente é apenas o códon para triptofano) pode ser modificado para fornecer uma molécula funcionalmente idêntica. Consequentemente, cada variação silenciosa de um ácido nucleico natural e não natural que codifica um polipeptídeo natural e não natural está implícita em cada sequência descrita. Quanto às sequências de aminoácidos, substituições, deleções ou adições individuais a um ácido nucleico, peptídeo, polipeptídeo ou sequência de proteínas que altera, adiciona ou exclui um único aminoácido natural e não natural ou uma pequena porcentagem de aminoácidos naturais e não naturais na sequência codificada é uma “variante modificada conservativamente” onde a alteração resulta na deleção de um aminoácido, adição de um aminoácido ou substituição de um aminoácido natural e não natural com um aminoácido quimicamente similar. As tabelas substituições conservativas fornecendo aminoácidos naturais funcionalmente similares são bem conhecidas na técnica. As tabelas de substituições conservativas fornecendo aminoácidos funcionalmente similares são conhecidas pelos técnicos no assunto. Os oito grupos seguintes, cada um, contêm aminoácidos que são substituições conservativas para outra: 1) Alanina (A), Glicina (G); 2) Ácido aspártico (D), Ácido glutâmico (E); 3) Asparagina (N), Glutamina (Q); 4) Arginina (R), Lisina (K); 5) Isoleucina (I), Leucina (L), Metionina
(M), Valina (V); 6) Fenilalanina (F), Tirosina (Y), Triptofano (W); 7) Serina (S), Treonina (T); e 8) Cisteína (C), Metionina (M) (ver, por exemplo, Creighton, Proteins: Structures and Molecular Properties, W H Freeman & Co. 2a edição,1993). Tais variantes modificadas de forma conservativa são adicionais e não excluem variantes polimórficas, homólogos interespécies e alelos das composições descritas neste relatório.
[055] O termo “idêntico”, como usado neste relatório, refere-se a duas ou mais sequências, (ácidos nucleicos ou polipeptídeo) ou subsequências que são as mesmas. Além disso, o termo “substancialmente idênticas”, como usado neste relatório, refere-se a duas ou mais sequências que têm uma porcentagem de unidades sequenciais que são as mesmas quando comparadas e alinhadas para a correspondência máxima ao longo de uma janela de comparação ou região designada como medida usando algoritmos de comparação ou por alinhamento manual e inspeção visual. Apenas a título do exemplo, duas ou mais sequências podem ser “substancialmente idênticas” se as unidades sequenciais forem cerca de 60 % idênticas, cerca de 65 % idênticas, cerca de 70 % idênticas, cerca de 75 % idênticas, cerca de 80 % idênticas, cerca de 85 % idênticas, cerca de 90 % idênticas ou cerca de 95 % idênticas em uma região especificada. Tais porcentagens descrevem a “porcentagem de identidade” de duas ou mais sequências. A identidade de uma sequência pode existir sobre uma região que tem pelo menos cerca de 75 a 100 unidades sequenciais de comprimento, em uma região que tem cerca de 50 unidades sequenciais de comprimento ou, quando não especificado, em toda a sequência. Esta definição também refere-se ao complemento de uma sequência de teste. Apenas a título do exemplo, duas ou mais sequências de polipeptídeos são idênticas quando os resíduos de aminoácido são os mesmos, enquanto duas ou mais sequências de polipeptídeos são “substancialmente idênticas” se os resíduos de aminoácido forem cerca de 60 % idênticas, cerca de 65
% idênticas, cerca de 70 % idênticas, cerca de 75 % idênticas, cerca de 80 % idênticas, cerca de 85 % idênticas, cerca de 90 % idênticas ou cerca de 95 % idênticas em uma região especificada. A identidade pode existir em uma região que tem pelo menos cerca de 75 a cerca de 100 aminoácidos de comprimento, em uma região que tem cerca de 50 aminoácidos de comprimento ou, quando não especificado, em toda a sequência de uma sequência de polipeptídeos. Além disso, apenas a título do exemplo, duas ou mais sequências de polinucleotídeos são idênticas quando os resíduos de ácido nucleico são os mesmos, enquanto duas ou mais sequências de polinucleotídeos são “substancialmente idênticas” se os resíduos de ácido nucleico forem cerca de 60 % idênticas, cerca de 65 % idênticas, cerca de 70 % idênticas, cerca de 75 % idênticas, cerca de 80 % idênticas, cerca de 85 % idênticas, cerca de 90 % idênticas ou cerca de 95 % idênticas em uma região especificada. A identidade pode existir em uma região que tem pelo menos cerca de 75 a cerca de 100 ácidos nucleicos de comprimento, em uma região que tem cerca de 50 ácidos nucleicos de comprimento ou, quando não especificado, em toda a sequência de uma sequência de polinucleotídeos.
[056] O termo “isolado”, como usado neste relatório, refere-se a separar e remover um componente de interesse a partir de componentes que não são de interesse. O termo “isolado”, quando aplicado a um ácido nucleico ou proteína, denota que o ácido nucleico ou proteína está livre de pelo menos alguns dos componentes celulares com os quais estão sendo associados no estado natural ou que o ácido nucleico ou proteína foi concentrado a um nível maior do que a concentração de sua produção in vivo ou in vitro. As substâncias isoladas podem ser estar em um estado seco ou semisseco ou na solução, incluindo, mas não limitado a uma solução aquosa. O componente isolado pode ser estar em um estado homogêneo ou o componente isolado pode ser uma parte de uma composição farmacêutica que compreende portadores e/ou excipientes farmaceuticamente aceitáveis adicionais. A pureza e homogeneidade podem ser determinadas usando técnicas químicas analíticas incluindo, mas não limitadas a, eletroforese em gel de poliacrilamida ou cromatografia líquida de alto desempenho. Além disso, quando um componente de interesse é isolado e é a espécie predominante presente em uma preparação, o componente é descrito neste relatório como substancialmente purificado. O termo “purificado”, como usado neste relatório, pode referir-se a um componente de interesse que é pelo menos 85 % puro, pelo menos 90 % puro, pelo menos 95 % puro, pelo menos 99 % ou mais puro. Apenas a título do exemplo, os ácidos nucleicos ou proteínas são “isolados” quando tais ácidos nucleicos ou proteínas são livres de pelo menos alguns dos componentes celulares com os quais estão associados no estado natural ou que o ácido nucleico ou proteína foi concentrado a um nível maior do que a concentração de sua produção in vivo ou in vitro. Além disso, a título do exemplo, um gene é isolado quando separado dos quadros de leitura abertos que flanqueiam o gene e codificam uma proteína exceto o gene de interesse.
[057] O termo “modificado”, como usado neste relatório refere-se a quaisquer alterações feitas em um determinado polipeptídeo, tais como alterações no comprimento do polipeptídeo, na sequência de aminoácidos, estrutura química, modificação cotraducional ou modificação pós-traducional de um polipeptídeo. Em alguns casos, os polipeptídeos são opcionalmente modificados, isto é, os polipeptídeos podem ser modificados ou não modificados.
[058] Um “aminoácido não natural” refere-se a um aminoácido que não é um dos 20 aminoácidos comuns ou pirolisina ou selenocisteína. Outros termos que podem ser usados como sinônimos com o termo “aminoácido não natural” são “aminoácido codificado não natural”, “aminoácido não natural”, “aminoácido de ocorrência não natural”, e várias versões hifenizadas e não hifenizadas dos mesmos. O termo “aminoácido não natural” inclui, mas não é limitado a, aminoácidos que ocorrem naturalmente por modificação de um aminoácido codificado naturalmente (incluindo, mas não limitado a, 20 aminoácidos comuns ou pirrolisina e selenocisteína), mas não são eles próprios incorporados em uma cadeia de polipeptídeos crescente pelo complexo de tradução. Exemplos de aminoácidos de ocorrência natural que não são codificados naturalmente incluem, mas não são limitados a, N-acetilglucosaminil-L-serina, N-acetilglucosaminil-L-treonina e O- fosfotirosina. Adicionalmente, o termo “aminoácido não natural” inclui, mas não é limitado a, aminoácidos que não ocorrem naturalmente e podem ser obtidos sinteticamente ou podem ser obtido por modificação de aminoácidos não naturais.
[059] O termo “ácido nucleico”, como usado neste relatório, refere-se a desoxirribonucleotídeos, desoxirribonucleosídeos, ribonucleosídeos ou ribonucleotídeos e seus polímeros na forma de fita simples ou dupla. Apenas a título do exemplo, tais ácidos nucleicos e polímeros de ácido nucleico incluem, mas não são limitados a, (i) análogos de nucleotídeos naturais que têm propriedades de ligação similares como um ácido nucleico de referência e são metabolizados de uma maneira similar aos nucleotídeos de ocorrência natural; (ii) análogos de oligonucleotídeo incluindo, mas não são limitados a, PNA (ácido peptidonucleico), análogos de DNA usados em tecnologia antissentido (fosforotioatos, fosforoamidatos e semelhantes); (iii) suas variantes modificadas de forma conservativa (incluindo, mas não limitadas a, substituições de códons degenerados) e sequências complementares e sequência explicitamente indicada. A título do exemplo, substituições de códons degenerados podem ser obtidas gerando sequências em que a terceira posição de um ou mais códons selecionados (ou todos) é substituída com base mista e/ou resíduos dedoxiinosina (Batzer et al., Nucleic Acid Res.
19:5081, 1991; Ohtsuka et al., J. Biol. Chem. 260:2605 a 2608, 1985; e Rossolini et al., Mol. Cell. Probes 8:91 a 98, 1994).
[060] Os termos “polipeptídeo”, “peptídeo” e “proteína” são usados permutavelmente neste relatório para se referir a um polímero de resíduos de aminoácido.
Isto é, uma descrição dirigida a um polipeptídeo se aplica igualmente a uma descrição de um peptídeo e uma descrição de uma proteína e vice-versa.
Os termos aplicam-se aos polímeros de aminoácido de ocorrência natural bem como polímeros de aminoácido em que um ou mais resíduos de aminoácido são um aminoácido não natural.
Adicionalmente, tais “polipeptídeos”, “peptídeos” e
“proteínas” incluem cadeias de aminoácido de qualquer comprimento, incluindo proteínas de comprimento total, em que os resíduos de aminoácido são ligados por ligações peptídicas covalentes.
Em formas de realização da presente invenção, a proteína de interesse é uma citocina, um fator de crescimento, um receptor de fator de crescimento, um interferon, uma interleucina, uma molécula inflamatória, um produto oncogene, um hormônio peptídico, uma molécula de transdução de sinal,
um receptor de hormônio esteroide, um ativador de transcrição, um supressor da transcrição, eritropoietina (EPO), insulina, hormônio de crescimento humano,
peptídeo de ativação de neutrófilos epitelial 78, GROα/MGSA, GROβ, GRO, MIP-1α, MIP-1β, MCP-1, fator de crescimento de hepatócito, fator de crescimento similar à insulina, fator inibidor de leucemia, oncostatina M, PD-ECSF, PDGF, pleiotropina,
SCF, ligante c-kit, VEGF, G-CSF, IL-1, IL-2, IL-8, IGF-I, IGF-II, FGF (fator de crescimento de fibroblastos), TNF, TGF-α, TGF-β, EGF (fator de crescimento epidérmico), KGF (fator de crescimento de queratinócitos), SCF/c-Kit, CD40L/CD40,
VLA-4/VCAM-1, ICAM-1/LFA-1, hialurina/CD44, Mos, Ras, Raf, Met, p53, Tat, Fos,
Myc, Jun, Myb, Rel, receptor de estrogênio, receptor de progesterona, receptor de testosterona, receptor de aldosterona, receptor de LDL e corticosterona, uma antitripsina alfa-1, uma angiostatina, um fator anti-hemolítico, uma apolipoproteína,
uma apoproteína, um fator natriurético atrial, um polipeptídeo natriurético atrial, um peptídeo atrial, um quimiocina C-X-C, T39765, NAP-2, ENA-78, um Gro-a ou Gro-c,
um IP-10, um GCP-2, um NAP-4, um SDF-1, um PF4, um MIG, uma Calcitonina, um ligante c-kit, uma citocina, uma quimiocina CC, uma proteína quimioatraente de monócitos 1, uma proteína quimioatraente de monócitos 2, uma proteína quimioatraente de monócitos 3, uma proteína alfa inflamatória de monócitos 1, uma proteína beta inflamatória de monócitos 1, RANTES, I309, R83915, R91733, HCC1,
T58847, D31065, T64262, um ligante C-kit, um colágeno, um fator de estimulação de colônia (CSF), um fator de complemento 5a, um inibidor de complemento, um receptor de complemento 1, uma citocina, um peptídeo ativador de neutrófilos epitelial 78, um fator de crescimento epidérmico (EGF), um peptídeo ativador de neutrófilos epitelial, uma eritropoietina (EPO), uma toxina esfoliativa, um fator IX, um fator VII, um fator VIII, um fator X, um fato de crescimento de fibroblastos (FGF), um fibrinogênio, uma fibronectina, um G-CSF, um GM-CSF, uma glucocerebrosidase,
uma gonadotropina, um fator de crescimento, um receptor de fator de crescimento,
uma proteína Hedgehog, uma hemoglobina, um fator de crescimento de hepatócito
(HGF), uma hirudina, uma albumina de soro humano, um ICAM-1, um receptor
ICAM-1, um LFA-1, um receptor LFA-1, um Insulina, um fator de crescimento similar à insulina (IGF), um IGF-I, um IGF-II, um interferon, um IFN-α, um IFN-beta, um IFN- , uma interleucina, uma IL-1, uma IL-2, uma IL-3, uma IL-4, uma IL-5, uma IL-6,
uma IL-7, uma IL-8, uma IL-9, uma IL-10, uma IL-11, uma IL-12, um fator de crescimento de queratinócitos (KGF), uma lactoferrina, um fator inibidor de leucemia,
uma luciferase, uma neurturina, um fator inibidor de neutrófilos (NIF), uma oncostatina M, uma proteína osteogênica, um produto oncogene, um hormônio paratireoide, um PD-ECSF, um PDGF, um hormônio peptídico, um hormônio de crescimento humano, uma pleiotropina, uma proteína A, uma proteína G, uma exotoxina pirogênica A, B ou C, uma relaxina, uma renina, um SCF, um receptor de complemento solúvel I, um I-CAM solúvel 1, um receptor de interleucina solúvel, um receptor TNF solúvel, uma somatomedina, uma somatostatina, uma somatotropina,
uma estreptoquinase, um superantígeno, uma enterotoxina estafilocócicas, um SEA, um SEB, um SEC1, um SEC2, um SEC3, um SED, um SEE, um receptor de hormônio esteroide, uma superóxido dismutase, uma toxina da síndrome do choque tóxico, uma timosina alfa 1, um ativador de plasminogênio de tecido, um fator de crescimento de tumor (TGF), um TGF-α, um TGF-β, um fator de necrose tumoral, um fator de necrose tumoral alfa, um fator de necrose tumoral beta, um receptor do fator de necrose tumoral (TNFR), uma proteína VLA-4, uma proteína VCAM-1, um fator de crescimento endotelial vascular (VEGF), uma uroquinase, um Mos, um Ras, um Raf, um Met; um p53, um Tat, um Fos, um Myc, um Jun, um Myb, um Rel, um receptor de estrogênio, um receptor de progesterona, um receptor de testosterona, um receptor de aldosterona, um receptor de LDL e uma corticosterona e semelhantes.
[061] O termo “modificado pós-traducionalmente” refere-se a qualquer modificação de um aminoácido natural ou não natural que ocorre depois de tal aminoácido ter sido incorporado traducionalmente em uma cadeia polipeptídica. Tais modificações incluem, mas não são limitados a, modificações cotraducionais in vivo, modificações cotraducionais in vitro (tais como em um sistema de tradução livre de células), modificações pós-traducionais in vivo e modificações pós-traducionais in vitro.
[062] O termo “célula hospedeira recombinante”, também referido como “célula hospedeira”, refere-se a uma célula que inclui um polinucleotídeo exógeno, em que os métodos usados para inserir o polinucleotídeo exógeno em uma célula incluem, mas não são limitados a, absorção direta, transdução, f-mating ou outros métodos conhecidos na técnica para criar células hospedeiras recombinante.
Apenas a título do exemplo, tal polinucleotídeo exógeno pode ser um vetor não integrado, incluindo, mas não limitado a um plasmídeo ou pode ser integrado no genoma do hospedeiro.
[063] Como usado neste relatório, o termo “meio” ou “ambiente” inclui qualquer meio de cultura, solução, sólido, semissólido ou rígido que pode suportar ou conter qualquer célula hospedeira, incluindo células hospedeiras bacterianas, células hospedeiras de levedura, células hospedeiras de inseto, células hospedeiras de plantas, células hospedeiras eucarióticas, células hospedeiras de mamíferos, células CHO, células hospedeiras procarióticas, E. coli ou células hospedeiras pseudomonas e conteúdo celular. Assim, o termo pode abranger um meio em que a célula hospedeira foi cultivada, por exemplo, um meio em que a proteína de interesse foi secretada, incluindo o meio antes ou depois de uma etapa de proliferação. O termo também pode abranger tampões ou reagentes que contêm lisados de célula hospedeira, tais como no caso onde a proteína de interesse é produzida intracelularmente e as células hospedeiras são lisadas ou rompidas para liberá-las.
[064] O termo “substancialmente purificado”, como usado neste relatório, refere-se a um componente de interesse que pode ser substancialmente ou essencialmente livre de outros componentes que normalmente acompanham ou interagem com o componente de interesse antes da purificação. Apenas a título do exemplo, um componente de interesse pode ser “substancialmente purificado” quando a preparação do componente de interesse contém menos do que cerca de 30 %, menos do que cerca de 25 %, menos do que cerca de 20 %, menos do que cerca de 15 %, menos do que cerca de 10 %, menos do que cerca de 5 %, menos do que cerca de 4 %, menos do que cerca de 3 %, menos do que cerca de 2 % ou menos do que cerca de 1 % (em peso seco) de componentes contaminantes. Assim, um componente de interesse “substancialmente purificado” pode ter um nível de pureza de cerca de 70 %, cerca de 75 %, cerca de 80 %, cerca de 85 %, cerca de 90 %, cerca de 95 %, cerca de 96 %, cerca de 97 %, cerca de 98 %, cerca de 99 % ou mais. Apenas a título do exemplo, um polipeptídeo de aminoácido natural ou um polipeptídeo de aminoácido não natural pode ser purificado a partir de uma célula nativa ou célula hospedeira no caso de polipeptídeo de aminoácido naturais ou polipeptídeo de aminoácido não naturais recombinantemente produzidos.
A título do exemplo, uma preparação de um polipeptídeo de aminoácido natural ou um polipeptídeo de aminoácido não natural pode ser “substancialmente purificada”
quando a preparação contém menos do que cerca de 30 %, menos do que cerca de
25 %, menos do que cerca de 20 %, menos do que cerca de 15 %, menos do que cerca de 10 %, menos do que cerca de 5 %, menos do que cerca de 4 %, menos do que cerca de 3 %, menos do que cerca de 2 % ou menos do que cerca de 1 % (em peso seco) de material contaminante.
A título do exemplo, quando um polipeptídeo de aminoácido natural ou um polipeptídeo de aminoácido não natural é recombinantemente produzido por células hospedeiras, o polipeptídeo de aminoácido natural ou polipeptídeo de aminoácido não natural pode estar presente em cerca de 30 %, cerca de 25 %, cerca de 20 %, cerca de 15 %, cerca de 10 %,
cerca de 5 %, cerca de 4 %, cerca de 3 %, cerca de 2 % ou cerca de 1 % ou menos do que o peso seco das células.
A título do exemplo, quando um polipeptídeo de aminoácido natural ou um polipeptídeo de aminoácido não natural é recombinantemente produzido por células hospedeiras, o polipeptídeo de aminoácido natural ou polipeptídeo de aminoácido não natural pode estar presente no meio de cultura em cerca de 5 g/L, cerca de 4 g/L, cerca de 3 g/L, cerca de 2 g/L,
cerca de 1 g/L, cerca de 750 mg/L, cerca de 500 mg/L, cerca de 250 mg/L, cerca de
100 mg/L, cerca de 50 mg/L, cerca de 10 mg/L ou cerca de 1 mg/L ou menos do que o peso seco das células.
A título do exemplo, polipeptídeos de aminoácidos naturais ou polipeptídeos de aminoácidos não naturais “substancialmente purificados” podem ter um nível de pureza de cerca de 30 %, cerca de 35 %, cerca de 40 %, cerca de 45
%, cerca de 50 %, cerca de 55 %, cerca de 60 %, cerca de 65 %, cerca de 70 %,
cerca de 75 %, cerca de 80 %, cerca de 85 %, cerca de 90 %, cerca de 95 %, cerca de 99 % ou mais, como determinado pelos métodos apropriados, incluindo, mas não limitados a, análise SDS/PAGE, RP-HPLC, SEC e eletroforese capilar.
[065] Na presente invenção, a proteína, peptídeo, polipeptídeo de interesse a ser expressado pode ser qualquer proteína, peptídeo, polipeptídeo que é expressado em uma forma não estabilizada e/ou forma insolubilizada ou uma forma solubilizada em E. coli. Em algumas formas de realização, uma proteína insolúvel pode ser qualquer proteína, peptídeo, polipeptídeo em E. coli localizados no citoplasma. Em outros aspectos da invenção, uma proteína solúvel pode ser qualquer proteína, peptídeo, polipeptídeo em E. coli localizados no periplasma ou citoplasma ou meio extracelular. Em algumas formas de realização, tal proteína, peptídeo, polipeptídeo incluem uma proteína, peptídeo, polipeptídeo terapêutico, profilático ou diagnóstico. Em outras formas de realização, tal proteína, peptídeo, polipeptídeo incluem interferons, interleucinas, receptores de interleucina, antagonista do receptor de interleucina, fatores estimuladores de colônias de granulócitos, fatores estimuladores de colônias de granulócitos macrófagos, fatores estimuladores de colônias de macrófagos, eritropoietina, trombopoietina, inibidores de leucemia, fatores de crescimento de célula tronco, fatores de necrose tumoral, hormônios de crescimento, pró-insulina, fatores de crescimento similares à insulina, fatores de crescimento de fibroblastos, fatores de crescimento derivados de plaqueta, fatores do crescimento de transformação, fatores de crescimento de hepatócitos, fatores morfogenéticos ósseos, fatores de crescimento de nervos, fatores neutrotróficos ciliares, fatores neutrotróficos derivados do cérebro, fatores neutrotróficos derivados da linha celular da glia, neutrotrofina, prouroquinase, ativadores do plasminogênio de tecido, fatores de coagulação do sangue, proteína C, glucocerebrosidase, superóxido dismutase, renina, lisozima, P450, procimosina, inibidores de tripsina, inibidores de elastase, lipocortina, reptina, imunoglobulinas, anticorpos de cadeia única, componentes de complemento, albumina sérica,
alérgenos do pólen de cedro, proteínas do estresse induzido por hipóxia, proteínas quinases, produtos proto-oncogene, fatores de transcrição e proteínas constituintes do vírus, mas não são limitadas a tais.
[066] O termo “derivado de” refere-se a um componente que é isolado de um organismo ou isolado e modificado ou gerado, por exemplo, sintetizado quimicamente, usando informações do componente do organismo.
[067] O termo “sistema de tradução” refere-se aos componentes necessários para incorporar um aminoácido de ocorrência natural em uma cadeia polipeptídica em crescimento (proteína). Por exemplo, os componentes podem incluir ribossomos, tRNAs, sintetases, mRNA e semelhantes. Os componentes da presente invenção podem ser adicionados a um sistema de tradução, in vivo ou in vitro.
[068] O termo “procariota” refere-se aos organismos não eucarióticos pertencentes ao domínio filogenético Eubacteria (incluindo, mas não limitado a, Escherichia coli, Thermus thermophilus, Bacillus stearothermophilus, Pseudomonas fluorescens, Pseudomonas aeruginosa, Pseudomonas putida, etc.) ou ao domínio filogenético Archaea (incluindo, mas não limitado a, Methanococcus jannaschii, Methanobacterium thermoautotrophicum, Halobacterium, tal como Haloferax volcanii e Halobacterium espécie NRC-1, Archaeoglobus fulgidus, Pyrococcus furiosus, Pyrococcus horikoshii, Aeuropyrum pernix, etc.).
[069] A presente invenção fornece um “operon” que codifica Fab. O termo “operon” usado na presente invenção é definido como um grupo de genes, cada um dos quais codifica as cadeias leves e pesadas de Fab descritas acima, formando uma unidade de transcrição sob o controle de um único promotor, que inclui um operon natural ou artificial. Em algumas formas de realização da presente invenção, o operon é um operon bicistrônico conduzido pelo promotor da fosfatase alcalina E.
coli (phoA).
[070] Como usado neste relatório, o termo “promotor” refere-se a uma sequência de ácidos nucleicos que regula a expressão de um ácido nucleico, de maneira operável ligado ao mesmo.
Tais promotores são conhecido por serem elementos de sequência de ação cis necessários para a transcrição, uma vez que servem para ligar a polimerase de RNA dependente de DNA, que transcreve as sequências presentes a jusante desta.
Para a regulação do nível de expressão da proteína (ou gene) de interesse da presente invenção, é preferível que o promotor que controla a transcrição seja um promotor induzível.
Exemplos do promotor induzível incluem, por exemplo, lac, tac, trc, trp, araB, Pzt-1, lambda PL e semelhantes.
Os promotores lac, tac e trc podem ser induzidos por meio do uso de isopropil-1-tio-beta-D-galactopiranosida (IPTG); os promotores trp, araB e Pzt-1 podem ser induzidos por meio do uso de ácido 3-indoleacrílico (IAA), L-arabinose e tetraciclina, respectivamente; e o promotor épsilon PL pode ser induzido a uma temperatura elevada (42 oC). Também pode ser usado é um promotor T7, que é específica e fortemente transcrito por uma polimerase de RNA T7. Na transcrição da polimerase de RNA T7, a indução da polimerase de RNA T7 acima por meio do uso de IPTG é feita possivelmente usando uma cepa de E. coli abrigando um fago lambda lisogenizado transportando o gene de polimerase de RNA T7 localizado a jusante do promotor lac.
Em algumas formas de realização, o promotor induzível é o promotor de tetraciclina induzível (pTc). Em algumas formas de realização, da presente invenção, o promotor induzível usado para a expressão de elementos genéticos, tais como chaperonas, pode ser o mesmo ou diferente do promotor usado para expressar a proteína de interesse.
Em algumas formas de realização, pode ser vantajoso para controlar independentemente a expressão dos elementos genéticos,
tais como chaperonas, e que da proteína desejada na otimização do nível e tempo de expressão das chaperonas sem baixar o nível de expressão da proteína desejada.
[071] Em outras formas de realização, o termo “promotor” refere-se a uma região de DNA que geralmente está localizada a montante (em direção à região 5’ de um gene) que é necessária para a transcrição. Os promotores permitem a ativação ou repressão apropriada do gene que controlam. Um promotor contém sequências específicas que são reconhecidas por fatores de transcrição. Esses fatores se ligam às sequências de DNA do promotor e resultam no recrutamento da RNA polimerase, a enzima que sintetiza o RNA a partir da região codificadora do gene. Em procariotos, o promotor é reconhecido pela RNA polimerase e um fator sigma associado, que por sua vez são trazidos para o DNA do promotor por uma proteína ativadora que se liga à sua sequência de DNA mais próxima. Em eucariotos, o processo é mais complicado. Por exemplo, pelo menos sete fatores diferentes são necessários para a transcrição de um promotor de RNA polimerase II.
Os promotores representam elementos que podem trabalhar em conjunto com outras regiões regulatórias (potenciadores, silenciadores, elementos de limite/isoladores) para direcionar o nível de transcrição de um determinado gene. Os promotores que são úteis na realização dos métodos descritos neste relatório incluem promotores de RNA polimerase III (também chamados de Pol III), que transcrevem DNA para sintetizar rRNA 5S ribossômico, tRNA, e outros pequenos RNAs. Pol III é incomum (em comparação ao Pol II) pelo fato de que não requer sequências de controle a montante do gene. Em vez disso, ele pode contar com sequências de controle internas. Os promotores de RNA polimerase III são mais variados em estrutura do que os promotores uniformes de RNA polimerase I, e ainda não tão diversos como os promotores de RNA polimerase II. Eles foram divididos em três tipos principais (tipos 1 a 3), dois dos quais são internos do gene e geralmente sem TATA, e um dos quais é externo do gene e contém uma caixa TATA.
[072] Como usado neste relatório, o termo “codificação” é um termo aberto de tal modo que um ácido nucleico que codifica uma sequência de aminoácidos particular pode consistir de códons especificando um polipeptídeo, ou podem também compreender sequências adicionais que são traduzíveis, ou cuja presença é útil para o controle da transcrição, tradução ou replicação, ou para facilitar a manipulação de alguma construção de ácido nucleico do hospedeiro. Como usado neste relatório, o termo é interpretado de forma ampla e pode ter uma variedade de aplicações. Em alguns casos, o termo “codificar” descreve o processo de replicação de DNA semiconservativa, onde um filamento de uma molécula de DNA de fita dupla é usado como um modelo para codificar um filamento irmão complementar recentemente sintetizada por um DNA polimerase dependente de DNA. Quando usado para descrever o processo de tradução, o termo “codificar” também se estende ao códon tripleto que codifica um aminoácido. Em alguns casos, uma molécula de RNA pode codificar uma molécula de DNA, por exemplo, pelo processo de transcrição reversa incorporando uma DNA polimerase dependente de RNA. Em outro aspecto, uma molécula de DNA pode codificar um peptídeo, onde é entendido que “codificar” como usado nesse caso, incorpora tanto os processos de transcrição quanto de tradução. Em outro aspecto, o termo “codificar” refere-se a qualquer processo pelo qual as informações em uma molécula são usadas para direcionar a produção de uma segunda molécula que tem uma natureza química diferente da primeira molécula.
[073] Como usado neste relatório, o termo “expressão de gene” refere-se ao processo pelo qual as informações codificadas de uma unidade de transcrição de ácido nucleico (incluindo, por exemplo, DNA genômico ou cDNA) são convertidas em uma parte operacional, não operacional ou estrutural de uma célula, frequentemente incluindo a síntese de uma proteína. A expressão de gene pode ser influenciada por sinais externos; por exemplo, a exposição de uma célula, tecido ou sujeito a um agente que aumenta ou diminui a expressão de gene. A expressão de um gene também pode ser regulada em qualquer lugar na trajetória do DNA ao RNA para a proteína. A regulação de expressão de gene ocorre, por exemplo, por meio de controles que atuam na transcrição, tradução, transporte e processamento de RNA, degradação de moléculas intermediárias, tais como mRNA ou por meio do uso de ativação, inativação, compartimentalização ou degradação de moléculas de proteínas específicas depois de terem sido feitas, ou por combinações dos mesmos. A expressão de gene pode ser medida no nível de RNA ou no nível da proteína e por qualquer método conhecido na técnica, incluindo, sem limitação, Northern blot, RT-PCR, Western blot ou ensaio(s) de atividade de proteína in vitro, in situ ou in vivo.
[074] Como usado neste relatório, o termo “isolado” refere-se a um componente biológico (tal como uma molécula de ácido nucleico, peptídeo ou célula) que foi purificado de outros componentes biológicos em uma amostra mista (tal como um extrato celular). Por exemplo, um peptídeo ou molécula de ácido nucleico “isolada” é um peptídeo ou molécula de ácido nucleico que foi separada de outros componentes de uma célula na qual o peptídeo ou molécula de ácido nucleico estava presente (tal como uma célula hospedeira de expressão para um peptídeo recombinante ou molécula de ácido nucleico).
[075] Como usado neste relatório, o termo “ácido nucleico”, “molécula de ácido nucleico”, polinucleotídeo” refere-se a uma forma polimérica de nucleotídeos, que pode incluir tanto fitas com sentido quanto anti-sentido de RNA, cDNA, DNA genômico, e formas sintéticas e polímeros mistos dos mencionados acima. Um nucleotídeo refere-se a um ribonucleotídeo, desoxinucleotídeo ou uma forma modificada de qualquer tipo de nucleotídeo. Uma “molécula de ácido nucleico” como usado neste relatório, é sinônimo de “ácido nucleico” e “polinucleotídeo”. A molécula de ácido nucleico tem usualmente pelo menos 10 bases em comprimento, a menos que de outro modo especificado. O termo inclui formas de DNA de fita simples e dupla. Uma molécula de ácido nucleico pode incluir um ou ambos os nucleotídeos de ocorrência natural e modificados ligados entre si por ligações de nucleotídeos de ocorrência natural e/ou ligações de nucleotídeos de ocorrência não natural. As moléculas de ácido nucleico podem ser modificadas química ou bioquimicamente ou podem conter bases de nucleotídeos não naturais ou derivadas, como serão prontamente avaliadas pelos técnicos no assunto. Tais modificações incluem, por exemplo, marcações, metilação, substituição de um ou mais dos nucleotídeos de ocorrência natural com um análogo, modificações internucleotídicas, tais como ligações não carregadas (por exemplo, fosfonatos de metila, fosfotriésteres, fosforamidatos, carbamatos, etc.), ligações carregadas (por exemplo, fosforotioatos, fosforoditioatos, etc.), porções pendentes (por exemplo, peptídeos), intercaladores (por exemplo, acridina, psoraleno, etc.), quelantes, alquiladores e ligações modificadas (por exemplo, ácidos nucleicos alfa anoméricos, etc.). O termo “molécula de ácido nucleico” também inclui qualquer conformação topológica, incluindo conformações de fita simples, fita dupla, parcialmente duplex, triplex, em grampo, circular e com cadeado.
[076] Como usado neste relatório, o termo “procariota” ou “procariótico” refere-se a um organismo pertencente ao Reino Monera (também denominado Procarya). Os organismos procarióticos são geralmente distinguíveis dos eucariotos por sua organização unicelular, reprodução assexuada por brotamento ou fissão, a falta de um núcleo ligado à membrana ou outras organelas ligadas à membrana, um cromossomo circular, a presença de operons, a ausência de íntrons, capeamento de mensagem e poli-A mRNA, e outras características bioquímicas, tais como uma estrutura ribossomal distinta. Os Prokarya incluem sub-reinos Eubacteria e Archaea (às vezes denominados “Archaebacteria”). As cianobactérias (as algas verdes azuladas) e micro plasmas às vezes recebem classificações separadas no Reino Monera.
[077] Como usado neste relatório, o termo “transdução” refere-se ao processo pelo qual o material genético, por exemplo, DNA ou outra molécula de ácido nucleico, é inserido em uma célula. As técnicas de transdução incluem o uso de vetores virais (incluindo bacteriófagos), eletroporação e reagentes químicos que aumentam a permeabilidade celular. A transfecção e transformação são outros termos para transdução, embora algumas vezes também impliquem a expressão do material genético.
[078] Os termos “transformação”, “transformado” ou “introdução de um ácido nucleico em uma célula hospedeira” denotam qualquer processo em que um ácido nucleico extracelular (DNA exógeno ou heterólogo) como um vetor, com ou sem material acompanhante, entra em uma célula (por exemplo, célula hospedeira). O DNA em transformação pode ou não ser integrado (covalentemente ligado) no genoma da célula. Nas células procariotas, por exemplo, o DNA em transformação pode ser mantido em um elemento epissomal, tal como um vetor ou plasmídeo. O termo “célula transformada” ou “célula em transformação” significa a célula ou sua progênie em que o ácido nucleico extracelular foi introduzido e, assim, abriga o ácido nucleico extracelular. O ácido nucleico pode ser introduzido na célula de modo que o ácido nucleico seja replicável como um integrante cromossômico ou como um elemento cromossômico extra. A transformação de células hospedeiras apropriadas com, por exemplo, um vetor de expressão, pode ser realizada por métodos bem conhecidos, tais como micro injeção, eletroporação, partícula de bombardeamento ou por métodos químicos, tais como transformação mediada por fosfato de cálcio, descritos, por exemplo, em Maniatis et al., Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory, 1982 ou em Ausubel et al., Current protocol in molecular biology, John Wiley e Sons, 1994.
[079] “Tecnologia de DNA recombinante” refere-se às técnicas para unir duas moléculas de DNAs heterólogas, usualmente como um resultado da ligação in vitro de DNAs de organismos diferentes. As moléculas de DNA recombinante são comumente produzidas por experimentos em engenharia genética. Termos sinônimos incluem “splicing de gene”, “clonagem molecular” e “engenharia genética”.
O produto dessas manipulações resulta em um “recombinante” ou “molécula recombinante”. O termo “proteína recombinante” ou “polipeptídeo recombinante” como usado neste relatório refere-se a uma molécula de proteína que é expressada a partir de uma molécula de DNA recombinante.
[080] O termo vetor ou construção como usado neste relatório, refere-se a uma molécula de ácido nucleico capaz de transportar uma sequência de ácidos nucleicos não vetorial que foi introduzida no vetor. Um tipo de vetor é um “plasmídeo”, que refere-se a um DNA circular de fita dupla em que podem ser ligados segmentos de DNA não plasmídicos. Outros vetores incluem cosmídeos, cromossomos artificiais cromossomos (BAC) e cromossomos artificiais de levedura (YAC). Outro tipo de vetor é um vetor viral, em que segmentos de DNA adicionais podem ser ligados em todo ou parte do genoma viral. Certos vetores são capazes de replicação autônoma em uma célula hospedeira em que são introduzidos (por exemplo, vetores tendo uma origem bacteriana de replicação replicam-se em bactérias hospedeiras). Outros vetores podem ser integrados no genoma de uma célula hospedeira após a introdução na célula hospedeira e são replicados junto ao genoma hospedeiro. Alguns vetores contêm sequências de controle de expressão (tais como promotores) e são capazes de dirigir a transcrição de uma sequência de ácidos nucleicos expressáveis que foi introduzida no vetor, tais vetores são referidos como “vetores de expressão”. O vetor também pode incluir um ou mais genes marcadores selecionáveis e/ou elementos genéticos conhecidos na técnica.
[081] O termo “plasmídeo” como usado neste relatório refere-se a uma molécula de DNA separada do DNA cromossômico e capaz de replicação autônoma.
É tipicamente circular e de fita dupla, e pode ocorrer naturalmente em bactérias e, às vezes, em organismos eucarióticos (por exemplo, o anel de 2micrômetro em Saccharomyces cerevisiae). O tamanho dos plasmídeos pode variar de cerca de 1 a mais de 400 pares de quilobases. Os plasmídeos frequentemente contêm genes ou cassetes genes que conferem uma vantagem seletiva à bactéria (ou outra célula) que os hospeda, tal como a capacidade de tornar a bactéria (ou outra célula) resistente a antibióticos. Os plasmídeos contêm pelo menos uma sequência de DNA que serve como uma origem de replicação, que permite que o DNA do plasmídeo seja duplicado independentemente do DNA cromossômico. Os cromossomos da maioria das bactérias são circulares, mas os plasmídeos lineares também são conhecidos. Os plasmídeos usados em engenharia genética são referidos como vetores. Eles podem ser usados para transferir genes de um organismo para outro e, tipicamente, contêm um marcador genético que confere um fenótipo que pode ser selecionado a favor ou contra. A maioria também contém um poli ligante ou sítio de clonagem múltipla, que é uma região curta contendo vários sítios de restrição comumente usados, permitindo a fácil inserção de fragmentos de DNA nesta localização. O plasmídeo da presente invenção, pode conter adicionalmente um gene marcador de seleção de modo a facilitar a seleção após a transformação.
Exemplos de tais genes marcadores de seleção incluem genes de resistência à ampicilina, genes de resistência à canamicina e genes de resistência à cloranfenicol.
É desejado que o gene marcador de seleção de plasmídeo usado seja diferente do gene marcador de seleção, se houver, contido no cromossomo da cepa. Um plasmídeo como definido acima, pode ser introduzido em um hospedeiro através de técnicas padrão. Com relação à transformação de células hospedeiras procarióticas, ver, por exemplo, Cohen et al., Proc. Natl. Acad. Sci. USA 69, 2110, 1972 e Sambrook et al., Molecular Cloning, A Laboratory Manual, 3.sup.rd Ed. Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y., 2001.
[082] Como usado neste relatório, o termo “cassete de expressão” refere-se a uma sequência de polinucleotídeos que codifica um polipeptídeo, de maneira operável ligada a um promotor e outros elementos de controle de transcrição e tradução, incluindo, mas não limitado a intensificadores, códons de terminação, sítios de entrada de ribossomo interno ou sítios de poliadenilação. O cassete também pode incluir sequências que facilitam movê-lo de uma molécula hospedeira para outra.
[083] O termo “construção de expressão” como usado neste relatório, refere- se a um módulo de expressão ou cassete de expressão constituído por uma molécula de DNA recombinante ou sintética, contendo uma sequência de codificação desejada e sequências de ácidos nucleicos apropriadas necessárias para a expressão da sequência de codificação ligada de maneira operável a um organismo hospedeiro particular. As sequências de ácidos nucleicos necessárias para a expressão em procariotos usualmente incluem um promotor e um sítio de ligação ao ribossomo, frequentemente junto com outras sequências. Tipicamente, um vetor de expressão inclui uma unidade de transcrição compreendendo uma sequência de ácidos nucleicos particular a ser transcrita ligada de maneira operável a um promotor. Um vetor em um hospedeiro pode ser, por exemplo, um plasmídeo autônomo ou auto replicante, um cosmídeo, um fago, um vírus ou um retrovírus.
[084] Os termos “hospedeiro”, “célula hospedeira” e “célula hospedeira recombinante” são usados permutavelmente neste relatório para indicar uma célula procariótica em que um ou mais vetores ou sequências de ácidos nucleicos isoladas e purificadas da invenção foram introduzidos. É entendido que tais termos não se referem apenas à célula particular em questão, mas também à progênie ou progênie potencial de tal uma célula. Pelo fato de que certas modificações podem ocorrer nas gerações seguintes devido às mutações ou influências, tal progênie pode não ser,
de fato, idêntica à célula precursora, mas ainda está incluída dentro do escopo do termo como usado neste relatório.
[085] Elementos ou componentes genéticos
[086] Como usado neste relatório, “elementos genéticos” ou “elemento genético” pode incluir quaisquer moléculas que podem facilitar, realçar, potencializar ou sinergizar com uma proteína auxiliar ou fator para promover proteína expressão.
Elementos genéticos podem facilitar a transcrição de um ou mais genes associados ou envolvidos na expressão da proteína. Esses elementos podem ser de uma fonte não eucariótica ou eucariótica.
[087] A presente invenção utiliza um ou mais elementos genéticos envolvidos na expressão de proteínas, incluindo proteínas difíceis de expressar (DTE), o dobramento de proteínas, e a retenção de plasmídeo e estabilização em um sistema procariótico. Tais elementos genéticos incluem, mas não são limitados a, sequência de codificação de DNA, e proteínas auxiliares e/ou fatores incluindo chaperonas, foldases e isomerases. Em algumas formas de realização da invenção, tais elementos genéticos incluem chaperonas periplasmáticos, extensão do terminal carbóxi da cadeia pesada (HC) e a presença de plasmídeo de lócus de partição, parB. Muitas classes de proteínas auxiliares e/ou fatores em E. coli auxiliam na geração de proteína(s) ativas devidamente dobradas. As chaperonas, por exemplo, ligam-se a proteínas mal dobradas ou não dobradas e facilitam o dobramento apropriado. Outras proteínas auxiliares desempenham um papel na redução/oxidação ou isomerização da ligação dissulfeto. Peptidil-prolil isomerases estão envolvidas na interconversão da ligação cis/trans peptidil-prolil, e as proteases funcionam para degradar proteínas mal dobradas ou agregadas.
[088] Foi demonstrado na técnica que a superexpressão de chaperonas moleculares de várias classes aumenta o título de proteínas heterólogas, incluindo fragmentos de anticorpos, em E. coli (Thomas et al., Applied Biochemistry and
Biotechnology 66, 197, 1997; Kolaj et al., Microbial Cell Factories, 2009; Merdanovic et. al., Annu. Rev. Microbiol. 65, 149, 2011). Também é conhecido pelos técnicos no assunto que o polipeptídeo de cadeia pesada do anticorpo (HC) é difícil de dobrar e a isomerização de peptidil prolil foi proposta como uma etapa de limitação de taxa para dobramento de HC (Feige et al., Mol. Cell 34, 569, 2009). Além disso, a expressão procariótica de um anticorpo ou fragmento de anticorpo tendo um aminoácido não natural incorporado em um sítio selecionado é difícil de alcançar.
[089] A presente invenção utiliza proteínas auxiliares e/ou fatores ou elementos genéticos na concepção e de engenharia de vetores e plasmídeos da mesma para obter o aumento do título de proteínas que incorporam o aminoácido não natural.
[090] É bem conhecido na técnica que a localização periplasmática de várias proteínas auxiliares e/ou fatores incluindo fatores de dobra de proteína e chaperonas, catalisar a montagem apropriada e dobramento de fragmentos de anticorpos funcionais. Por exemplo, as chaperonas promovem a isomerização apropriada e o direcionamento celular ao interagir transitoriamente com intermediários de dobramento; e foldases aceleram as etapas de limitação de taxa ao longo da trajetória de dobramento. Também é bem conhecido na técnica que Escherichia coli é um dos hospedeiros mais amplamente usados para a produção de proteínas recombinantes. E. coli serve idealmente como um hospedeiro para a produção de proteínas heterólogas a baixo custo e alto rendimento, pelo fato de que pode ser facilmente cultivado em altas densidade e os estudos sobre os sistemas hospedeiro-vetor foram os mais avançados e muitos vetores de alta expressão foram desenvolvidos. Os sistemas de vetor-hospedeiro E. coli são, portanto, mais amplamente utilizados como sistemas de expressão para genes heterológos.
[091] O periplasma de E. coli fornece um ambiente mais oxidante do que o citosol, que promove a formação de ligação dissulfeto, e o espaço periplasmático também contém menos proteínas de hospedeiro, como em comparação ao citoplasma, facilitando assim os processos de purificação subsequentes. Entretanto, frequentemente existem problemas na recuperação de rendimentos substanciais de proteínas corretamente dobradas. Por exemplo, a alta expressão de proteínas, tal como fragmentos de anticorpos, aumenta a demanda por dobramento de proteínas, promovendo uma carga metabólica não caracterizada nas células, levando ao dobramento incorreto e agregação da proteína. A localização periplasmática de vários fatores de dobra de proteínas e chaperonas catalisam a montagem e o dobramento apropriados de proteínas funcionais, tais como fragmentos de anticorpos. Um método para resolver o problema do baixo rendimento proteico é ter proteínas recombinantes secretadas no espaço periplasmático ou meio de cultura.
Portanto, para aumentar, melhorar e/ou otimizar o rendimento de proteínas dos fatores de dobra da proteína em E. coli. pode ser utilizado.
[092] Outro método para melhorar o baixo rendimento de proteína é utilizar proteínas auxiliares e/ou fatores incluindo fatores de dobra de proteína, tais como chaperonas, envolvidos na restauração da solubilidade e funcionalidade de produtos de proteína recombinante, e afetando o metabolismo celular durante a expressão do fragmento de anticorpo periplasmático. As chaperonas da presente invenção podem ser qualquer proteína envolvida no dobramento de proteínas incluindo, mas não limitado a chaperonas derivadas de E. coli. Exemplos de tais chaperonas incluem, por exemplo, DnaK, DnaJ, GrpE, GroEL, GroES, HscA/Hsc66, ClpA, ClpB, ClpS, ClpX, HtpG, HdeA, HdeB, HtpG, HslO, HscC osmY, SecB, Spy, Tig e semelhantes.
Outras chaperonas incluem as chaperonas periplasmáticas Skp, FkpA, SurA, PPiA, PPiD mas não são limitados a tal. Em algumas formas de realização da invenção, uma ou mais chaperonas podem ser usadas na combinação. A coexpressão de uma ou mais proteínas auxiliares e/ou fatores, tais como chaperonas, com a proteína de destino pode aumentar os níveis de proteína solúvel. Em uma forma de realização,
uma ou mais proteínas capazes de facilitar o dobramento de proteínas são FkpA, Skp, SurA, PPiA e PPiD. Em outras formas de realização, uma ou mais proteínas capazes de facilitar a secreção ou translocação da proteína são SecY, SecE, SecG, SecYEG, SecA, SecB, FtsY e Lep. Em uma outra forma de realização, uma ou mais proteínas capazes de facilitar a formação da ligação dissulfeto são DsbA, DsbB, DsbD, DsbG. Em algumas formas de realização, a ligação dissulfeto oxidante e a isomerização de componentes podem ser das fontes eucarióticas, tais como dissulfeto de proteína isomerase (PDI) de levedura ou humano.
[093] Chaperonas periplasmáticas, incluindo, mas não limitadas a Skp e FkpA, foram mostradas para melhorar a produção periplasmática de fragmentos de anticorpos (Hayhurst et al., Protein Expr. Purif., 15, 336 a 343, 1999; Hayhurst et al., J. Immunol. Meth., 276, 185 a 196, 2003; Padiolleau-Lefèvre et al., Immunol. Lett., 103, 39 a 44, 2006; Zhang, et al., Biotechniques, 35, 1032 a 1038, 2003; Bothmann et al., J. Biol. Chem., 275, 17100 a 17105, 2000; Ow et al., Microb. Cell Fact., 9, 22, 2010). Em E. coli, FkpA e Skp são duas chaperonas periplasmáticas bifuncionais bem conhecidas tendo atividades de peptidil prolil isomerase. Skp e FkpA são chaperonas moleculares com capacidade geral para redobrar proteínas mal dobradas e evitar sua agregação em corpos de inclusão insolúveis no periplasma.
Skp uma proteína homotrimérica 17-kDa que facilita o dobramento apropriado de proteínas da membrana externa recentemente sintetizadas e ajuda a manter sua solubilidade, e FkpA uma proteína homodimérica 26-kDa que exibe atividade de chaperona e atividade de peptidil-prolil isomerase (PPlase).
[094] Em algumas formas de realização, proteínas capazes de facilitar a formação de ligação dissulfeto formação, ligação dissulfeto oxidante e isomerização de chaperonas e enzimas, podem ser utilizadas. A proteína dissulfeto isomerase é uma enzima que catalisa a formação e ruptura de ligações dissulfeto entre resíduos de cisteína dentro de proteínas como se dobram. Em E. coli, tais dissulfetos isomerases (proteínas auxiliares) incluem DsbA, DsbB, DsbC, DsbD ou DsbG. A coexpressão de proteínas que catalisam a formação de ligações dissulfeto para melhorar a expressão da proteína em uma célula hospedeira é bem conhecida pelos técnicos no assunto. Por exemplo, o WO 1998/56930 divulga um método para produzir ligações dissulfeto heterólogas contendo polipeptídeos em células bacterianas em que uma dissulfeto isomerase procariótica, tal como DsbC ou DsbG é coexpressado com um polipeptídeo eucariótico; a Patente U.S. No 6673569 divulga um operon artificial compreendendo polinucleotídeos que codificam cada um de DsbA, DsbB, DsbC e DsbD para o uso na produção de uma proteína estranha; a Patente EP No 0786009 divulga um processo para produzir um polipeptídeo heterólogo em bactérias em que a expressão do ácido nucleico que codifica DsbA ou DsbC é induzida antes da indução da expressão do ácido nucleico que codifica o polipeptídeo heterólogo. Além disso, algumas proteínas isomerases, por exemplo DsbC, são bifuncionais e críticas na expressão de proteínas, como observado na técnica para FkpA.
[095] É conhecido na técnica que em alguns sistemas de segregação de plasmídeos bacterianos, genes específicos conhecidos como lócus de partição de plasmídeo (par) estão envolvidos na morte de células filhas que tinham perdido o plasmídeo durante a divisão celular (Ebersbach G. e Gerdes K., Annu. Rev. Genet.
2005 39, 453). Adicionalmente, outras descobertas na literatura demonstram que um lócus de partição mínima B de 580 bp (parB), originalmente do plasmídeo R1 de E.
coli, medeia a manutenção e estabilidade em muitas bactérias, incluindo E. coli (Gerdes K., Nature Biotech. 1988 6, 1402 a 1405; Gerdes K. et. al., Mol. Microbiol.
1990 4, 1807; Gerdes K. e Neilsen Al, J. Mol. Biol. 1992 226, 637). O lócus parB (partição B) de plasmídeo R1 controla a estabilidade do plasmídeo e codifica os genes hok e sok. Aquelas células que na divisão celular perdem um plasmídeo transportando parB são rapidamente mortas (assim chamado morte pós-
segregacional; Gerdes et al., 1986a). O gene hok, responsável pela morte da célula hospedeira, está localizado na parte esquerda da região parB. Este gene é regulado pelo repressor codificado pelo gene sok, um pequeno RNA antissentido complementar ao mRNA hok, no nível traducional. O gene sok (supressão da morte) que codifica um antagonista de ação trans, da atividade do gene hok está localizado a montante de toda estrutura de codificação do gene (Gerdes et al., 1986a). O mRNA hok é altamente estável, enquanto o RNA sok se deteriora rapidamente. Este mecanismo de ação, morte pós-segregacional, ocorre quando a molécula de RNA sok desaparece rapidamente em células que perderam um plasmídeo transportando parB. Isso, por sua vez, leva à tradução do mRNA hok estável. Subsequentemente, a proteína Hok é sintetizada e promove a morte de células livres de plasmídeo.
Assim, para melhorar a retenção de plasmídeo nas cepas de produção da divulgação da invenção, o gene do lócus parB foi utilizado no projeto e engenharia dos plasmídeos de expressão sintéticos. Como observado nos exemplos neste relatório, o lócus parB foi significante no aumento do rendimento da expressão de proteína recombinante. Em algumas formas de realização da invenção, a posição e a orientação do lócus parB em relação ao gene de interesse também influenciaram o aumento da expressão de proteína recombinante.
[096] As proteases desempenham um papel importante na transformação sobre proteínas velhas e mal dobradas no periplasma e citoplasma de E. coli. As proteases bacterianas agem para degradar a proteína recombinante de interesse, portanto, frequentemente reduzindo significantemente o rendimento da proteína ativa. Tais proteases incluem, mas não são limitadas a Protease III (ptr), DegP, OmpT, Tsp, prlC, ptrA, ptrB, pepA-T, tsh, espc, eatA, clpP e Íon. A serina endo- protease periplasmática Prc (para o processamento do terminal C), também conhecida como protease específica de cauda (Tsp) acredita-se ser responsável pela clivagem Fab (Chen C. et al. Biotechnology and Bioengineering 2004 85, 463).
Acredita-se que Prc reconhece e se liga ao terminal C de uma proteína e, em seguida, cliva em regiões solta ou não dobradas dentro da sequência da proteína (Keiler et al. Protein Science 1995 4, 1507). O sítio de clivagem é determinado pela estrutura secundária ou terciária da proteína e não pela sequência primária. Prc tem uma ampla especificidade de sequência em relação ao sítio de proteólise. É conhecido na técnica que a sequência do terminal C de uma proteína pode afetar sua clivagem por Prc, e que a modificação da sequência do terminal C pode alterar a quantidade de clivagem dessa proteína por Prc (Keiler KC e Sauer RT, The Journal of Biological Chemistry 1996 271, 2589). Assim, em algumas formas de realização, a presente invenção examina o envolvimento da protease na modulação ou regulação do rendimento da proteína.
TECNOLOGIA DE tRNA ORTOGONAL
[097] Na otimização da expressão da proteína em um sistema procariótico, por exemplo, E. coli, a presente invenção utiliza a proteína, incluindo fragmentos de anticorpos difíceis de expressar (DTE), em que um aminoácido codificado não natural é incorporado. O uso da tecnologia de incorporação de aminoácidos não naturais em Escherichia coli, é bem conhecido na técnica. Esta tecnologia usa pares ortogonais de tRNA/aminoacil-tRNA sintetase que funcionam em espécies procarióticas para incorporar especificamente aminoácidos não naturais em resposta aos códons seletores. Ver, por exemplo, WO 2002/085923, WO 2002/086075, WO 2004/09459, WO 2005/019415, WO 2005/007870 e WO 2005/007624, cujo conteúdo é incorporado a título de referência. Ver também, Wang e Schultz, “Expanding the Genetic Code”, Angewandte Chemie Int. Ed., 44(1):34 a 66, 2005, cujo conteúdo é incorporado a título de referência. A incorporação do aminoácido não natural em proteínas pode ser programada para ocorrer em qualquer posição desejada pela engenharia do polinucleotídeo que codifica a proteína (ou gene) de interesse para conter um códon seletor que sinaliza a incorporação do aminoácido não natural. Os códons da presente invenção incluem, por exemplo, três códons com base única, um códon sem sentido, tal como um códon de parada.
[098] Para adicionar aminoácidos não naturais reativos adicionais ao código genético, novos pares ortogonais compreendendo um aminoacil-tRNA sintetase e um tRNA adequado são necessários que podem funcionar de forma eficiente na máquina de tradução do hospedeiro, mas que são “ortogonais” ao sistema de tradução em questão, o que significa que funciona independentemente das sintetases e tRNAs endógenos ao sistema de tradução. As características desejadas do par ortólogo incluem tRNA que decodifica ou reconhece apenas um códon específico, por exemplo, um códon seletor, que não é decodificado por qualquer tRNA endógeno, e aminoacil-tRNA sintetases que preferencialmente aminoacilam (ou “carregam”) seu tRNA cognato com apenas um aminoácido não natural específico. O O-tRNA também não é tipicamente aminoacilado por sintetases endógenas. Por exemplo, em E. coli, um par ortogonal incluirá um aminoacil-tRNA sintetase que não apresenta reação cruzada com qualquer um dos tRNA endógenos, por exemplo, que existem 40 em E. coli, e um tRNA ortogonal que não é aminoacilado por qualquer uma das sintetases endógenas, por exemplo, das quais existem 21 em E. coli.
[099] Uma ampla variedade de tRNAs ortogonais e aminoacil tRNA sintetases foram descritos na técnica para inserir aminoácidos sintéticos particulares em polipeptídeos e são, geralmente, adequados para o uso na presente invenção.
Por exemplo, O-tRNA/aminoacil-tRNA sintetases ceto-específicas são descritas em Wang et al., Proc. Natl. Acad. Sci. USA 100:56 a 61 (2003) e Zhang et al., Biochem.
42(22):6735 a 6746 (2003). O-RS exemplar ou porções do mesmo, são codificados por sequências de polinucleotídeos e incluem sequências de aminoácidos divulgadas nas Patentes U.S. Nos 7.045.337 e 7.083.970, cada uma incorporada neste relatório a título de referência. As moléculas de O-tRNA correspondentes para o uso com o O-RSs também são descritas nas Patentes U.S. Nos 7.045.337 e
7.083.970 que são incorporadas a título de referência neste relatório. Exemplos adicionais de pares de O-tRNA/aminoacil-tRNA sintetase são descritos em WO 2005/007870, WO 2005/007624; e WO 2005/019415.
[0100] Vários outros pares ortogonais foram relatados. Sistemas de glutaminil (ver, por exemplo, Liu et al., (1999) PNAS 96:4780 a 4785), aspartil (ver, por exemplo, Pastrnak et al., (2000) Helv. Chim. Acta 83:2277 a 2286), e tirosil (ver, por exemplo, Ohno et al., (1998) J. Biochem. (Tóquio, Japão) 124:1065 a 1068; e, Kowal et al., (2001) PNAS 98:2268 a 2273) derivados de tRNA’s e sintetases de S.
cerevisiae foram descritos para a potencial incorporação de aminoácidos não naturais em E. coli. Os sistemas derivados de glutaminil (ver, por exemplo, Kowal et al., (2001) PNAS 98:2268 a 2273) e tirosil (ver, por exemplo, Edwards et al., (1990) Mol. Cell. Biol. 10:1633 a 1641) sintetases de E. coli foram descritos para o uso em S. cerevisiae. O sistema tirosil de E. coli foi usado para a incorporação de 3-iodo-L- tirosina in vivo, em células de mamíferos. Ver, Sakamoto et al., (2002) Nucleic Acid Res. 30:4692 a 4699.
[0101] Em geral, quando um par ortogonal reconhece um códon seletor e carrega um aminoácido em resposta ao códon seletor, diz-se que o par ortogonal é “suprime” o códon seletor. Isto é, um códon seletor que não é reconhecido pelo pela maquinaria endógena do sistema de tradução (por exemplo, a célula) não é comumente traduzida, o que pode resultar no bloqueio da produção de um polipeptídeo que, de outro modo, seria traduzido a partir do ácido nucleico. Um O- tRNA da invenção reconhece um códon seletor e inclui pelo menos cerca de 45 %, 50 %, 60 %, 75 %, 80 % ou 90 % ou mais eficiência de supressão na presença de uma sintetase cognata em resposta a um códon seletor como em comparação à eficiência de supressão de um O-tRNA compreendendo ou codificado por uma sequência de polinucleotídeos. O O-RS aminoacila o O-tRNA com um aminoácido não natural de interesse. A célula usa o par O-tRNA/O-RS para incorporar o aminoácido não natural em uma cadeia polipeptídica em crescimento, por exemplo, através de um ácido nucleico que compreende um polinucleotídeo que codifica um polipeptídeo de interesse, onde o polinucleotídeo compreende um códon seletor que é reconhecido pelo O-tRNA. Em certos aspectos desejáveis, a célula pode incluir um par O-tRNA/O-RS adicional, onde o O-tRNA adicional é carregado pelo O-RS adicional com um aminoácido não natural diferente. Por exemplo, um dos O-tRNAs pode reconhecer um códon de quatro bases e o outro pode reconhecer um códon de parada. Alternativamente, múltiplos códons de parada diferentes ou múltiplos códons de quatro bases diferentes podem reconhecer especificamente diferentes códons seletores.
[0102] Os códons seletores da invenção expandem a estrutura de códons genéticos da maquinaria biossintética de proteínas. Por exemplo, um códon seletor inclui, mas não é limitado a, um códon único de três bases, um códon sem sentido, tal como um códon de parada, incluindo, mas não limitado a, um códon âmbar (UAG), um códon ocre ou um códon opala (UGA), um códon não natural, um ou mais códons de quatro bases, um códon raro ou semelhantes. É prontamente aparente para os técnicos no assunto que existe uma grande variedade no número de códons seletores que podem ser introduzidos em um gene ou polinucleotídeo desejado, incluindo, mas não limitado a, um ou mais, dois ou mais, três ou mais, em um único polinucleotídeo que codifica a proteína de interesse.
[0103] Em uma forma de realização, os métodos envolvem o uso de um códon seletor que é um códon de parada para a incorporação de um ou mais aminoácidos não naturais in vivo. Por exemplo, é produzido um O-tRNA que reconhece o códon de parada, incluindo, mas não limitado a, UAG, e é aminoacilado por um O-RS com um aminoácido não natural desejado. Este O-tRNA não é reconhecido pelos aminoacil-tRNA sintetases do hospedeiro de ocorrem naturalmente. A mutagênese dirigida ao sítio pode ser usada para introduzir o códon de parada, incluindo, mas não limitado a, TAG, no sítio de interesse em um polipeptídeo de interesse. Ver, por exemplo, Sayers, J.R., et al. (1988), 5’-3’ Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis.
Nucleic Acids Res, 16:791 a 802. Quando o O-RS, O-tRNA e o ácido nucleico que codifica o polipeptídeo de interesse são combinados in vivo, o aminoácido não natural é incorporado em resposta ao códon UAG para fornecer um polipeptídeo contendo o aminoácido não natural na posição especificada.
[0104] A incorporação de aminoácidos não naturais in vivo pode ser feita sem perturbação significante da célula hospedeira eucariótica. Por exemplo, pelo fato de que a eficiência de supressão para o códon UAG depende da competição entre o O-tRNA, incluindo, mas não limitado ao, tRNA supressor âmbar, e um fator de liberação eucariótico (incluindo, mas não limitado a, eRF) (que se liga a um códon de parada e inicia a liberação do peptídeo em crescimento do ribossomo), a eficiência de supressão pode ser modulada, incluindo, mas não limitada ao, aumento do nível de expressão de O-tRNA e/ou do tRNA supressor.
[0105] Os aminoácidos não naturais também podem ser codificados com códons raros. Por exemplo, quando a concentração de arginina em uma reação de síntese de proteínas in vitro é reduzida, o códon de arginina raro, AGG, provou ser eficiente para a inserção de Ala por um tRNA sintético acilado com alanina. Ver, por exemplo, Ma et al., Biochemistry, 32:7939 (1993). Neste caso, o tRNA sintético compete com o tRNAArg de ocorrência natural, que existe como uma espécie secundária em Escherichia coli. Alguns organismos não usam todos os códons tripletos. Um códon AGA não atribuído em Micrococcus luteus foi utilizado para a inserção de aminoácidos em um extrato de transcrição/tradução in vitro. Ver, por exemplo, Kowal e Oliver, Nucl. Acid. Res., 25:4685 (1997). Os componentes da presente invenção podem ser gerados para usar esses códons raros in vivo.
[0106] Os códons seletores também compreendem códons estendidos, incluindo, mas não limitados aos, códons de quatro ou mais bases, tais como, códons de quatro, cinco, seis ou mais bases. Exemplos de códons de quatro bases incluem, mas não são limitados a, AGGA, CUAG, UAGA, CCCU e semelhantes.
Exemplos de códons de cinco bases incluem, mas não são limitados a, AGGAC, CCCCU, CCCUC, CUAGA, CUACU, UAGGC e semelhantes. Uma característica da invenção inclui o uso de códons estendidos com base na mudança de fase de supressão de leitura. Códons de quatro ou mais bases podem inserir, incluindo, mas não limitados a, um ou múltiplos aminoácidos não naturais na mesma proteína. Por exemplo, na presença de O-tRNAs mutados, incluindo, mas não limitados a, uma mudança especial de tRNAs supressores de fase de leitura, com loops anticódons, por exemplo, com loops de anticódon de pelo menos 8 a 10 nt, os códons de quatro ou mais bases são lidos como aminoácido único. Em outras formas de realização, os loops de anticódon podem decodificar, incluindo, mas não limitados a, pelo menos um códon de quatro bases, pelo menos um códon de cinco bases ou pelo menos um códon de seis bases ou mais. Uma vez que existem 256 códons de quatro bases possível, múltiplos aminoácidos não naturais podem ser codificados na mesma célula usando um códon de quatro ou mais bases. Ver, Anderson et al., Exploring the Limits of Codon and Anticodon Size, Chemistry and Biology, 9:237 a 244. 2002; Magliery, Expanding the Genetic Code: Selection of Efficient Suppressors of Four- base Codons and Identification of “Shifty” Four-base Codons with a Library Approach in Escherichia coli, J. Mol. Biol. 307: 755 a 769, 2001.
[0107] Por exemplo, códons de quatro bases foram usados para incorporar aminoácidos não naturais em proteínas usando métodos biossintéticos in vitro. Ver, por exemplo, Ma et al., Biochemistry, 32:7939, 1993; e Hohsaka et al., J. Am. Chem.
Soc., 121(51), pp. 12194 a 12195, 1999. CGGG e AGGU foram usados para incorporar simultaneamente 2-naftilalanina e um NBD derivado de lisina em estreptavidina in vitro com dois tRNAs supressores de mudança de fase de leitura quimicamente acilados. (Ver, por exemplo, Hohsaka et al., supra). Em um estudo in vivo, Moore et al. examinaram a capacidade de derivados de tRNALeu com anticódons NCUA para suprimir códons UAGN (N pode ser U, A, G ou C), e descobriram que o UAGA quádruplo pode ser decodificado por um tRNALeu com um anticódon UCUA com uma eficiência de 13 a 26 % com pouca decodificação no quadro 0 ou -1. Ver, Moore et al., J. Mol. Biol., 298:195, 2000. Em uma forma de realização, códons estendidos com base em códons raros ou códons sem sentido, podem ser usados na presente invenção, o que pode reduzir a leitura sem sentido e a supressão da mudança de fase de leitura em outros sítios indesejados.
[0108] Para um determinado sistema, um códon seletor também pode incluir um dos códons naturais de três bases, onde o sistema endógeno não usa (ou raramente usa) o códon de base natural. Por exemplo, isso inclui um sistema que não tem um tRNA que reconhece o códon natural de três bases, e/ou um sistema onde o códon de três bases é um códon raro.
[0109] Os códons seletores incluem opcionalmente pares de base não naturais. Esses pares de base não naturais expandem adicionalmente o alfabeto genético existente. Um par de bases extra aumenta o número de códons tripletos de 64 para 125. As propriedades dos pares de três bases incluem emparelhamento de bases estáveis e seletivas, incorporação enzimática eficiente no DNA com alta fidelidade por uma polimerase e a extensão do iniciador continuada eficiente após a síntese do par de bases não naturais nascente. As descrições de pares de bases não naturais que podem ser adaptadas para métodos e composições incluem, por exemplo, Hirao, et al. Um par de bases não naturais para incorporar análogos de aminoácidos em proteína, Nature Biotechnology, 20:177 a 182, 2002. Ver, também, Wu, Y., et al., J. Am. Chem. Soc. 124:14626 a 14630, 2002. Outras publicações relevantes são listadas abaixo.
[0110] Em certas formas de realização da invenção, uma célula tal como uma célula de E. coli que inclui um tRNA ortogonal (O-tRNA), um aminoacil-tRNA sintetase ortogonal (O-RS), um aminoácido não natural e um ácido nucleico que compreende um polinucleotídeo que codifica um polipeptídeo de interesse, onde o polinucleotídeo compreende o códon seletor que é reconhecido pelo O-tRNA. O sistema de tradução também pode ser um sistema livre de células, por exemplo, qualquer um de uma variedade de sistemas de transcrição/tradução “in vitro” comercialmente disponíveis. Exemplos de pares incluem um par mutRNATyr, tal como um par mutRNATyr-SS 12TyrRS, um par mutRNALeu-mutLeuRS, um par mutRNAThr-mutThrRS, um par mutRNAGlu-mutGluRS ou semelhantes.
AMINOÁCIDOS NÃO NATURAIS
[0111] A presente divulgação inclui fragmentos de anticorpos que apresentam um sítio de aminoácido codificado não natural ou não naturalmente incorporado especificamente nos mesmos. Os métodos para a introdução específica do sítio de aminoácidos não naturais em um anticorpo ou fragmento de anticorpo são descritos na técnica, ver, por exemplo, WO 2010/011735 e WO 2005/074650. Tipicamente, os aminoácidos não naturais da invenção são selecionados ou projetados para fornecer características adicionais indisponíveis nos vinte aminoácidos naturais. Por exemplo, aminoácidos não naturais são projetados ou selecionados opcionalmente para modificar as propriedades biológicas de uma proteína em que eles são incorporados. Por exemplo, as seguintes propriedades são modificadas opcionalmente pela inclusão de um aminoácido não natural em uma proteína: toxicidade, biodistribuição, solubilidade, estabilidade (por exemplo, térmica, hidrolítica, oxidativa, resistência à degradação enzimática e semelhantes), facilidade de purificação e processamento, propriedades estruturais, propriedades espectroscópicas, propriedades químicas e/ou fotoquímicas, atividade catalítico,
potencial redox, meia-vida, capacidade de reagir com outras moléculas (covalente ou não covalentemente) ou semelhantes.
[0112] Como usado neste relatório, o termo “aminoácido não natural ou não natural” refere-se a qualquer aminoácido, aminoácido modificado, e/ou análogo de aminoácido, que não é um dos 20 aminoácidos de ocorrência natural comuns ou selenocisteína ou pirrolisina. Aminoácidos não naturais da invenção podem ser compostos de ocorrência natural exceto os vinte alfa-aminoácidos conhecidos na técnica. Os aminoácidos não naturais podem incluir mas não são limitados a p- etiltiocarbonil-L-fenilalanina, p-(3-oxobutanoil)-L-fenilalanina, aminoácido 1,5-dansil- alanina, 7-amino-cumarina, aminoácido 7-hidróxi-cumarina, nitrobenzil-serina, O-(2- nitrobenzil)-L-tirosina, p-carboximetil-L-fenilalanina, p-ciano-L-fenilalanina, m-ciano- L-fenilalanina, bifenilalanina, 3-amino-L-tirosina, bipiridil alanina, p-(2-amino-1- hidroxietil)-L-fenilalanina, p-isopropiltiocarbonil-L-fenilalanina, 3-nitro-L-tirosina e p- nitro-L-fenilalanina e podem incluir enantiômeros L e D dos mesmos. Aminoácidos não naturais da invenção podem compreender um alquil, aril, acil, hidrazina, ciano, halo, hidrazida, alquenil, éter, borato, boronato, fosfo, fosfono, fosfina, enona, imina, éster, hidroxilamina, amina e semelhantes, ou qualquer combinação dos mesmos.
Outro aminoácido não natural de interesse inclui, mas não é limitado aos, aminoácidos compreendendo um reticulante fotoativável, aminoácidos rotulados por spin, aminoácidos fluorescentes, aminoácidos de ligação metálica, aminoácidos contendo metal, aminoácidos radioativos, aminoácidos com novos grupos funcionais, aminoácidos que interagem covalente ou não covalentemente com outras moléculas, aminoácidos fotoengaiolados e/ou fotoisomerizáveis, aminoácidos contendo biotina ou análogo de biotina, aminoácidos contendo ceto, aminoácidos glicosilados, uma porção de sacarídeo ligada à cadeia lateral do aminoácido, aminoácidos compreendendo polietilenoglicol ou poliéter, aminoácidos substituídos por átomo pesado, aminoácidos quimicamente cliváveis ou fotocliváveis,
aminoácidos com uma cadeia lateral alongada como em comparação aos aminoácidos naturais (por exemplo, poliéteres ou hidrocarbonetos de cadeia longa, maiores do que cerca de 5, mais do que cerca de 10 carbonos, etc.), aminoácidos contendo açúcar ligados ao carbono, aminoácidos contendo aminotioácido e aminoácidos contendo uma ou mais porções tóxicas.
[0113] Aminoácidos não naturais com base em aminoácidos naturais, tais como tirosina, glutamina, fenilalanina, e semelhantes são incluídos na presente invenção. Os análogos de tirosina incluem tirosinas para-substituídas, tirosinas orto- substituídas, e tirosina meta-substituídas, em que a tirosina substituída compreende um grupo acetil, um grupo benzoil, um grupo amino, uma hidrazina, uma hidroxiamina, um grupo tiol, um grupo carbóxi, um grupo isopropil, um grupo metila, uma cadeia reta ou ramificada de hidrocarbonetos C6-C20, um hidrocarboneto saturado ou insaturado, um grupo O-metila, um grupo poliéter, um grupo nitro ou semelhantes. Além disso, anéis de arila multiplamente substituídos também são considerados. Análogos de glutamina da invenção incluem, mas não são limitados ao, derivados alfa-hidróxi, derivados beta-substituídos, derivados cíclicos e derivados de glutamina substituídos por amida. Análogos de fenilalanina do exemplo incluem, mas não são limitados a, fenilalaninas meta-substituídas, em que o substituinte compreende um grupo hidróxi, um grupo metóxi, um grupo metila, um grupo alil, um grupo acetil ou semelhantes. Exemplos específicos de aminoácidos não naturais incluem, mas não são limitados a, O-metila-L-tirosina, uma L-3-(2- naftil)alanina, uma 3-metila-fenilalanina, uma O-4-alil-L-tirosina, uma 4-propil-L- tirosina, um tri-O-acetil-GlcNAc beta-serina, uma L-Dopa, uma fenilalanina fluorada, uma isopropil-L-fenilalanina, uma p-azido-L-fenilalanina, uma p-acil-L-fenilalanina, uma p-benzoil-L-fenilalanina, uma L-fosfoserina, uma fosfonoserina, uma fosfonotirosina, uma p-iodo-fenilalanina, uma p-bromofenilalanina, uma p-amino-L- fenilalanina, uma isopropil-L-fenilalanina e semelhantes.
[0114] Muitos dos aminoácidos não naturais fornecidos acima estão comercialmente disponíveis, por exemplo, a partir de Sigma (USA) ou Aldrich (Milwaukee, Wis., USA). Aqueles que não estão comercialmente disponíveis, são opcionalmente sintetizados como fornecido em várias publicações ou usando métodos padrão conhecidos pelos técnicos no assunto. Para as técnicas de síntese orgânica, ver, por exemplo, Fessenden, R & Fessenden, J, Organic Chemistry, Segunda Edição, Willard Grant Press, Boston Mass., 1982; Março, J., Advanced Organic Chemistry, Terceira Edição, Wiley e Sons, Nova Iorque, 1985; e Carey, F. & Sundberg, R., Advanced Organic Chemistry, Terceira Edição, Partes A e B, Plenum Press, Nova Iorque, 1990). Publicações adicionais que descrevem a síntese de aminoácidos não naturais incluem, por exemplo, WO 2002/085923 intitulado “In vivo incorporation of Unnatural Amino Acids”; Matsoukas et al., J. Med. Chem., 38, 4660 a 4669, 1995; King, F. E. & Kidd, D. A. A., A New Synthesis of Glutamine and of gama-Dipeptides of Glutamic Acid from Phthylated Intermediates, J. Chem. Soc., 3315 a 3319, 1949; Friedman, O. M. & Chatterrji, R., Synthesis of Derivatives of Glutamine as Model Substrates for Anti-Tumor Agents, J. Am. Chem. Soc. 81, 3750 a 3752, 1959; Craig, J. C. et al., Absolute Configuration of the Enantiomers of 7- Chloro-4[[4-(diethylamino)-1-methylbutyl]amino]quinoline (Chloroquine), J. Org.
Chem. 53, 1167 a 1170, 1988; Azoulay, M., Vilmont, M. & Frappier, F., Glutamine analogues as Potential Antimalarials, Eur. J. Med. Chem. 26, 201 a 5, 1991; Koskinen, A. M. P. & Rapoport, H. Synthesis of 4-Substituted Prolines as Conformationally Constrained Amino Acid Analogues, J. Org. Chem., 54, 1859 a 1866, 1989; Christie, B. D. & Rapoport, H., Synthesis of Optically Pure Pipecolates from L-Asparagine. Application to the Total Synthesis of (+)-Apovincamine through Amino Acid Decarbonylation ion and Iminium Cyclization, J. Org. Chem. 1989:1859 a 1866, 1985; Barton et al., Synthesis of Novel a-Amino-Acids and Derivatives Using Radical Chemistry: Synthesis of L-and Da-Amino-Adipic Acids, La-aminopimelic Acid and Appropriate Unsaturated Derivatives, Tetrahedron Lett, 43:4297 a 4308, 1987; e, Subasinghe et al., Quisqualic acid analogues: synchronize of beta-heterocyclic 2- aminopropanoic acid derivatives and their activity at a novel quisqualate-sensitized site, J. Med. Chem. 35:4602 a 7, 1992. Ver também, a Publicação Internacional WO 2004/058946, intitulada “Protein Arrays”, depositada em 22 de dezembro de 2003.
[0115] A incorporação de um aminoácido não natural pode ser feita para uma variedade de propósitos, incluindo, mas não limitada a, modular a interação de uma proteína com seu receptor ou uma ou mais subunidades de seu receptor, adaptando mudanças na estrutura e/ou função da proteína, mudança de tamanho, acidez, nucleofilicidade, ligação de hidrogênio, hidrofobicidade, acessibilidade de sítios de destino de protease, direcionamento de uma porção (incluindo, mas não limitado a, para uma matriz de proteínas), adição de uma molécula biologicamente ativa, anexo de um polímero, anexo de um radionuclídeo, modular a meia-vida do soro, modular a penetração do tecido (por exemplo, tumores), modular o transporte ativo, modular a especificidade ou distribuição de tecido ou órgão, modular a imunogenicidade, modular a resistência à protease, etc. Proteínas que incluem um aminoácido não natural podem ter se aprimorado ou mesmo propriedades catalíticas ou biofísicas inteiramente novas. Por exemplo, as seguintes propriedades são opcionalmente modificadas pela inclusão de um aminoácido não natural em uma proteína: ligação ao receptor, toxicidade, biodistribuição, propriedades estruturais, propriedades espectroscópicas, propriedades químicas e/ou fotoquímicas, capacidade catalítica, meia-vida (incluindo, mas não limitada a meia-vida do soro), capacidade de reagir com outras moléculas, incluindo, mas não limitadas a, covalência ou não covalência e semelhantes. As composições incluindo proteínas que incluem pelo menos um aminoácido não natural, são úteis para, incluindo, mas não limitadas a, novas terapêuticas, diagnósticos, enzimas catalíticas, enzimas industriais, proteínas de ligação (incluindo, mas não limitadas a, anticorpos), e incluindo, mas não limitados a, o estudo da estrutura e função da proteína. Ver, por exemplo, Dougherty, (2000) Unnatural Amino Acids as Protein Structure and Function, Current Opinion in Chemical Biology, 4:645 a 652.
[0116] Em um aspecto da invenção, uma composição inclui pelo menos uma proteína com pelo menos um, incluindo, mas não limitado a, pelo menos dois, pelo menos três, pelo menos quatro, pelo menos cinco, pelo menos seis, pelo menos sete, pelo menos oito, pelo menos nove ou pelo menos dez ou mais aminoácidos não naturais. Os aminoácidos não naturais podem ser os mesmos ou diferentes, incluindo, mas não limitados a, pode haver 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 ou mais sítios diferentes na proteína que compreende 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 ou mais aminoácidos não naturais diferentes. Em outro aspecto, uma composição inclui uma proteína com pelo menos um, mas menos do que todos, de um aminoácido particular presente na proteína que é substituído pelo aminoácido não natural. Para uma determinada proteína com mais do que um aminoácido não natural, os aminoácidos não naturais podem ser idênticos ou diferentes (incluindo, mas não limitados a, proteína pode incluir dois ou mais diferentes tipos de aminoácidos não naturais ou pode incluir dois do mesmo aminoácido não natural). Para uma determinada proteína com mais do que dois aminoácidos não naturais, o aminoácido não natural pode ser o mesmo, diferente ou uma combinação de um aminoácido não natural múltiplo do mesmo tipo com pelo menos um aminoácido não natural diferente.
[0117] Proteínas ou polipeptídeos de interesse com pelo menos um aminoácido não natural são uma característica da invenção. A invenção também inclui polipeptídeos ou proteínas com pelo menos um aminoácido não natural produzido usando as composições e métodos da invenção. Um excipiente (incluindo, mas não limitado a, um excipiente farmaceuticamente aceitável) também pode estar presente com a proteína. Ao produzir proteínas ou polipeptídeos de interesse com pelo menos um aminoácido não natural em células eucarióticas, proteínas ou polipeptídeos incluirão tipicamente modificação eucariótico pós-tradução. Em certas formas de realização, uma proteína inclui pelo menos um aminoácido não natural e pelo menos uma modificação pós-tradução que é feita in vivo por uma célula eucariótica, onde a modificação pós-tradução não é feita por uma célula procariótica.
Por exemplo, a modificação pós-tradução inclui, incluindo, mas não limitada a, acetilação, acilação, modificação de lipídeo, palmitoilação, adição de palmitato, fosforilação, modificação de ligação de glicolipídeo, glicosilação e semelhantes.
[0118] Uma vantagem de um aminoácido não natural é que apresenta porções químicas adicionais que podem ser usadas para adicionar moléculas adicionais. Estas modificações podem ser feitas in vivo em uma célula eucariótica ou não eucariótica ou in vitro. Assim, em certas formas de realização, a modificação pós-tradução é através do aminoácido não natural. Por exemplo, a modificação pós- tradução pode ser através de uma reação nucleofílica-eletrofílica. A maioria das reações atualmente usadas para a modificação seletiva de proteínas envolve a formação de ligações covalentes entre parceiros de reação nucleofílica e eletrofílica, incluindo, mas não limitada à reação de α-halocetonas com cadeias laterais de histidina ou cisteína. A seletividade nestes casos, é determinada pelo número e acessibilidade dos resíduos nucleofílicos na proteína. Em proteínas da invenção, outras reações mais seletivas podem ser usadas, tais como a reação de um cetoaminoácido não natural com hidrazidas ou compostos amino-óxi, in vitro e in vivo. Ver, por exemplo, Cornish et al., (1996) J. Am. Chem. Soc., 118:8150 a 8151; Mahal et al., (1997) Science, 276:1125 - 1128; Wang et al., (2001) Science 292:498 a 500; Chin et al., (2002) J. Am. Chem. Soc. 124:9026 - 9027; Chin et al., (2002) Proc. Natl. Acad. Sci., 99:11020 a 11024; Wang et al., (2003) Proc. Natl. Acad. Sci., 100:56 a 61; Zhang et al., (2003) Biochemistry, 42:6735 a 6746; e Chin et al., (2003) Science, 301:964 a 7, que são integralmente incorporados a título de referência neste relatório. Isso permite a marcação seletiva de virtualmente qualquer proteína com uma série de reagentes incluindo fluoróforos, agentes de reticulação, derivados de sacarídeos e moléculas citotóxicas. Ver a Patente U.S. No 6.927.042 intitulada “Glycoprotein synthesis”, que é integralmente incorporada a título de referência neste relatório. As modificações de pós-tradução, incluindo, mas não limitadas a, através de um aminoácido azido, também podem ser feitas através da ligação de Staudinger (incluindo, mas não limitada aos, com reagentes de triarilfosfina). Ver, por exemplo, Kiick et al., Incorporation of azides into recombinant protein for the quimioselective Modification by the Staudinger ligation, PNAS 99:19 a 24, 2002.
SISTEMAS DE EXPRESSÃO
[0119] Para obter a expressão de alto nível de um polinucleotídeo clonado, um polinucleotídeo de subclones que codifica tipicamente uma proteína ou polipeptídeo de interesse em um vetor de expressão que contém um promotor forte para a transcrição direta, um terminador de transcrição/tradução, e se para uma ácido nucleico que codifica uma proteína, um sítio de ligação do ribossomo para a iniciação da tradução. Promotores bacterianos adequados são conhecidos pelos técnicos no assunto e descritos, por exemplo, em Sambrook et al. e Ausubel et al.
[0120] Os sistemas de expressão bacteriana para expressar a proteína de interesse da invenção estão disponíveis em, incluindo, mas não limitados a, E. coli, Bacillus sp., Pseudomonas fluorescens, Pseudomonas aeruginosa, Pseudomonas putida e Salmonella (Palva et al., Gene 22:229 a 235, 1983; Mosbach et al., Nature 302:543 a 545, 1983). Kits para tais sistemas de expressão estão disponíveis comercialmente.
[0121] Uma célula hospedeira recombinante da presente invenção fornece a capacidade de sintetizar proteínas que compreendem aminoácidos não naturais em grandes quantidades úteis. Em um aspecto, a composição inclui opcionalmente, incluindo, mas não limitada a, pelo menos 2 microgramas, pelo menos 5 microgramas, pelo menos 10 microgramas, pelo menos 50 microgramas, pelo menos 75 microgramas, pelo menos 100 microgramas, pelo menos 200 microgramas, pelo menos 250 microgramas, pelo menos 500 microgramas, pelo menos 1 miligrama, pelo menos 10 miligramas, pelo menos 100 miligramas, pelo menos um grama ou mais da proteína que compreende um aminoácido não natural ou uma quantidade que pode ser obtida com métodos de produção de proteína in vivo (detalhes sobre a produção e purificação de proteína recombinante são fornecidos neste relatório). Em outro aspecto, a proteína está opcionalmente presente na composição em uma concentração de, incluindo, mas não limitada a, pelo menos 2 microgramas de proteína por litro, 5 microgramas de proteína por litro, 10 microgramas de proteína por litro, pelo menos 50 microgramas de proteína por litro, pelo menos 75 microgramas de proteína por litro, pelo menos 100 microgramas de proteína por litro, pelo menos 200 microgramas de proteína por litro, pelo menos 250 microgramas de proteína por litro, pelo menos 500 microgramas de proteína por litro, pelo menos 1 miligrama de proteína por litro ou pelo menos 10 miligramas de proteína por litro ou mais, incluindo, mas não limitada a, um lisato celular, um tampão, um tampão farmacêutico ou outra suspensão líquida (incluindo, mas não limitada a, um volume de, incluindo, mas não limitado a, qualquer lugar de cerca de 1 nL a cerca de 100 L ou mais).
[0122] A sequência de nucleotídeos que codifica uma proteína de interesse pode ou não pode incluir também a sequência que codifica um peptídeo de sinal. O peptídeo de sinal está presente quando o polipeptídeo é secretado das células em que é expressado. Tal peptídeo de sinal pode ser qualquer sequência. O peptídeo de sinal pode ser procariótico ou eucariótico. (Coloma, J. Imm. Methods, 152, 89 a 104, 1992) descreve um peptídeo de sinal para o uso em células de mamíferos (capa de Ig murina de peptídeo de sinal de cadeia leve). Outros peptídeos de sinal incluem mas não são limitados ao, peptídeo de sinal do fator α de S. cerevisiae
(Patente U.S. No 4.870.008 que é integralmente incorporada a título de referência neste relatório), o peptídeo de sinal de amilase salivar de camundongo (Hagenbuchle et al., Nature 289, 643 a 646, 1981), um peptídeo de sinal de carboxipeptidase modificado (Valls et al., Cell 48, 887 a 897, 1987), o peptídeo de sinal BAR1 de levedura (WO 87/02670, que é integralmente incorporado a título de referência neste relatório), e o peptídeo de sinal de protease aspártica de levedura 3 (YAP3) (conforme Egel-Mitani et al., Yeast 6, 127 a 137, 1990).
[0123] As técnicas de expressão bacteriana são conhecidas pelos técnicos no assunto. Uma grande variedade de vetores está disponível para o uso em hospedeiros bacterianos. Os vetores podem ser de cópia única ou vetores de baixa ou alta cópia. Os vetores podem servir para clonagem e/ou expressão. Em vista da ampla literatura sobre vetores, a disponibilidade comercial de muitos vetores e até mesmo manuais que descrevem vetores e seus mapas de restrição e características, nenhuma discussão extensa é necessária neste relatório. Como é bem conhecido, os vetores normalmente envolvem marcadores que permitem a seleção, os quais podem fornecer marcadores para a resistência, prototrofia ou imunidade ao agente citotóxico. Frequentemente, uma pluralidade de marcadores está presente, os quais fornecem características diferentes.
[0124] Um promotor bacteriano é qualquer sequência de DNA capaz de se ligar ao RNA polimerase bacteriana e iniciar a transcrição a jusante (3’) de uma sequência de codificação (por exemplo, gene estrutural) em mRNA. Um promotor terá uma região de iniciação de transcrição que é usualmente colocada próxima da extremidade 5’ da sequência de codificação. Esta região de iniciação de transcrição inclui tipicamente um sítio de ligação do RNA polimerase e um sítio de iniciação de transcrição. Um promotor bacteriano também pode ter um segundo domínio denominado operador que pode se sobrepor a um sítio de ligação do RNA polimerase adjacente no qual a síntese de RNA começa. O operador permite a transcrição regulada negativamente (induzível), pois uma proteína repressora de gene pode se ligar ao operador e, desse modo, inibir a transcrição de um gene específico. A expressão constitutiva pode ocorrer na ausência de elementos reguladores negativos, tais como o operador. Além disso, a regulação positiva pode ser obtida por uma sequência de ligação de proteína ativadora de gene, que, se presente, é usualmente próxima (5’) à sequência de ligação de RNA polimerase. Um exemplo de uma proteína ativadora de gene é a proteína ativadora catabólita (CAP), que ajuda a iniciar a transcrição do operon lac em Escherichia coli (E. coli) (Raibaud et al., Annu.Rev.Genet, 18:173, 1984). A expressão regulada pode, portanto, ser positiva ou negativa, desse modo, aumentando ou reduzindo a transcrição.
[0125] O termo “hospedeiro bacteriano” ou “célula hospedeira bacteriana” refere-se a uma bactéria que pode ser ou foi, usada como um receptor para vetores recombinantes ou outra transferência de DNA. O termo inclui a progênie da célula hospedeira bacteriana original que foi transfectada. É entendido que a progênie de uma única célula parental pode não ser necessariamente completamente idêntica em morfologia ou em complemento de DNA genômico ou total ao precursor original, devido a mutação acidental ou deliberada. A progênie da célula parental que é suficientemente similar ao precursor para ser caracterizada pela propriedade relevante, tal como a presença de uma sequência de nucleotídeos que codifica uma proteína de interesse da invenção, está incluída na progênie intencionada por esta definição.
[0126] A seleção de bactérias hospedeiras adequadas para proteínas de expressão da invenção é conhecida pelos técnicos no assunto. Na seleção de hospedeiros bacterianos para expressão, os hospedeiros adequados podem incluir aqueles que demonstraram ter, entre outros, boa capacidade de formação de corpos de inclusão, baixa atividade proteolítica e robustez global. Os hospedeiros bacterianos estão geralmente disponíveis a partir de uma variedade de fontes incluindo, mas não limitada a, Bacterial Genetic Stock Center, Department of Biophysics and Medical Physics, University of California (Berkeley, CA); e American Type Culture Collection (“ATCC”) (Manassas, VA). A fermentação industrial/farmacêutica geralmente usa bactérias derivadas de cepas K (por exemplo, W3110) ou de bactérias derivadas de cepas B (por exemplo, BL21). Essas cepas são particularmente úteis pelo fato de que seus parâmetros de crescimento são extremamente bem conhecidos e robustos. Além disso, essas cepas são não patogênicas, o que é comercialmente importante por razões de segurança e ambientais. Outros exemplos de hospedeiros de E. coli adequados incluem, mas não são limitados a, cepas de BL21, DH10B ou seus derivados. Em outra forma de realização dos métodos da presente invenção, o hospedeiro de E. coli é uma cepa sem protease incluindo, mas não limitado a, OMP- e LON-. A cepa de célula hospedeira pode ser uma espécie de Pseudomonas, incluindo, mas não limitada a, Pseudomonas fluorescens, Pseudomonas aeruginosa e Pseudomonas putida.
Pseudomonas fluorescens biovar 1, designada cepa MB101, é conhecido por ser útil para a produção recombinante e está disponível para processos de produção de proteínas terapêuticas. Exemplos de um sistema de expressão de Pseudomonas incluem o sistema disponível em The Dow Chemical Company como uma cepa hospedeira (Midland, MI disponível na worldwideweb em dow.com).
[0127] Uma vez que uma cepa de célula hospedeira recombinante foi estabelecida (isto é, a construção de expressão foi introduzida na célula hospedeira e as células hospedeiras com a construção de expressão apropriada são isoladas), a cepa da célula hospedeira recombinante é cultivada sob condições apropriadas para a produção da proteína ou polipeptídeo de interesse. Como será evidente para os técnicos no assunto, o método de cultura da cepa da célula hospedeira recombinante será dependente da natureza da construção de expressão utilizada e da identidade da célula hospedeira. As cepas hospedeiras recombinantes são normalmente cultivadas usando métodos que são conhecidos pelos técnicos no assunto. As células hospedeiras recombinantes são tipicamente cultivadas em meio líquido contendo fontes assimiláveis de carbono, nitrogênio e sais inorgânicos e, opcionalmente, contendo vitaminas, aminoácidos, fatores de crescimento, e outros suplementos de cultura proteica conhecidos pelos técnicos no assunto. Os meios líquidos para a cultura de células hospedeiras podem conter opcionalmente antibióticos ou antifúngicos para prevenir o crescimento de micro-organismos e/ou compostos indesejáveis incluindo, mas não limitados aos, antibióticos para selecionar células hospedeiras contendo o vetor de expressão.
[0128] As células hospedeiras recombinantes podem ser cultivadas em lote ou formatos contínuos, com colheita de células ou colheita de sobrenadante de cultura em lote ou formatos contínuos. Para a produção em células hospedeiras procarióticas, a cultura em lote e a colheita de células são preferidas.
[0129] As proteínas de interesse da presente invenção podem ser purificadas depois da expressão em sistemas recombinantes. As proteínas de interesse podem ser purificadas a partir de células hospedeiras ou meio de cultura por uma variedade de métodos conhecidos na técnica. As proteínas de interesse da invenção produzidas em células hospedeiras bacterianas podem ser fracamente solúveis ou insolúveis (na forma de corpos de inclusão). Em uma forma de realização da presente invenção, as substituições de aminoácidos podem ser prontamente feitas na proteína ou polipeptídeo que são selecionados para o propósito de aumentar a solubilidade da proteína produzida recombinantemente utilizando os métodos divulgados neste relatório bem como aqueles conhecidos na técnica. No caso da proteína insolúvel, a proteína pode ser coletada dos lisatos da célula hospedeira por centrifugação e pode ainda ser seguida pela homogeneização das células. No caso de proteína fracamente solúvel, compostos incluindo, mas não limitado ao, polietileno imina (PEI), podem ser adicionados para induzir a precipitação de proteína parcialmente solúvel. A proteína precipitada pode então ser convenientemente coletada por centrifugação. As células hospedeiras recombinantes podem ser rompidas ou homogeneizadas para liberar os corpos de inclusão de dentro das células usando uma variedade de métodos conhecidos pelos técnicos no assunto. A interrupção ou homogeneização da célula hospedeira pode ser realizada usando técnicas bem conhecidas incluindo, mas não limitadas a, interrupção da célula enzimática, sonicação, homogeneização de dounce ou interrupção da liberação de alta pressão.
[0130] Proteínas ou polipeptídeos insolúveis ou precipitados podem então ser solubilizados usando qualquer um dos vários agentes de solubilização adequados conhecidos na técnica. As proteínas ou polipeptídeos podem ser solubilizados com ureia ou cloridreto de guanidina. O volume das proteínas ou polipeptídeos solubilizados deve ser minimizado de modo que grandes lotes podem ser produzidos usando tamanhos de lote convenientemente gerenciáveis. Este fator pode ser significante em um ambiente comercial de grande escala, onde o hospedeiro recombinante pode ser cultivado em lotes de milhares de litros em volume. Além disso, ao fabricar proteínas ou polipeptídeo em um ambiente comercial em grande escala, em particular, para usos farmacêuticos humanos, deve- se evitar, se possível, produtos químicos agressivos que podem danificar o maquinário e o recipiente ou o próprio produto proteico.
[0131] Em alguns casos, a proteína solúvel pode ser secretada para o espaço periplasmático ou para o meio de cultura. Além disso, a proteína solúvel pode estar presente no citoplasma das células hospedeiras. Pode ser desejado concentrar a proteína solúvel antes de realizar as etapas de purificação. As técnicas convencionais conhecidas pelos técnicos no assunto podem ser usadas para concentrar a proteína solúvel, por exemplo, lisados celulares ou meio de cultura.
Além disso, as técnicas convencionais conhecidas pelos técnicos no assunto,
podem ser usadas para destruir células hospedeiras e liberar a proteína solúvel do citoplasma ou espaço periplasmático das células hospedeiras.
METODOLOGIA E TÉCNICAS
[0132] A presente divulgação abrange metodologias e técnicas de rotina bem conhecidas na técnica. Estas incluem métodos convencionais de biologia molecular, técnicas de DNA recombinante, bioquímica e biologia celular, todos dentro da técnica. Tais técnicas são explicadas completamente na literatura, tal como Molecular Cloning: A Laboratory Manual, Terceira Edição (Sambrook et al., Eds., Cold Spring Harbor Press, Cold Spring Harbor, NY, 2001); Oligonucleotide Synthesis: Methods And Applications (Methods in Molecular Biology), (Herdewijn, P., Ed., Humana Press, Totowa, NJ); Oligonucleotide Synthesis (Gait, M. J., Ed., 1984); Methods In Molecular Biology, (Humana Press, Totowa, NJ); Cell Biology: A Laboratory Notebook (Cellis, J. E., Ed., Academic Press, Nova Iorque, NY, 1998); Animal Cell Culture (Freshney, R. I., Ed., 1987); Introduction to Cell And Tissue Culture (Mather, J. P. e Roberts, P. E., Eds., Plenum Press, Nova Iorque, NY, 1998); Cell And Tissue Culture: Laboratory Procedures (Doyle, A. et al., Eds., John Wiley e Sons, Hoboken, NJ, 1993 a 8); Gene Transfer Vectors For Mammalian Cells (Miller, J. M. et al. Eds., Cold Spring Harbor Press, Cold Spring Harbor, NY, 1987); Current Protocols In Molecular Biology (Ausubel, F. M. et al., Eds., Greene Pub. Associates, Nova Iorque, NY, 1987); PCR: The Polymerase Chain Reaction, (Mullis, K. et al., Eds., Birkhauser, Boston, MA, 1994); Short Protocols In Molecular Biology (John Wiley e Sons, Hoboken, NJ, 1999); Immunobiology 7 (Janeway, C. A. et al., Garland Science, Londres, UK, 2007); Antibodies (P. Finch, Stride Publications, Devoran, UK, 1997); Antibodies: A Practical Approach (D. Catty., ed., Oxford University Press, USA, Nova Iorque, NY, 1989); Monoclonal Antibodies: A Practical Approach (Shepherd, P. et al. Eds., Oxford University Press, USA, Nova Iorque NY, 2000); Using Antibodies: A Laboratory Manual (Harlow, E. et al. Eds., Cold Spring Harbor
Laboratory Press, Cold Spring Harbor, NY, 1998); The Antibodies (Zanetti, M. et al.
Eds., Harwood Academic Publishers, Londres, UK, 1995).
[0133] A invenção também refere-se às células hospedeiras eucarióticas, células hospedeiras não eucarióticas e organismos para a incorporação in vivo de um aminoácido não natural através de pares tRNA/RS ortogonais. As células hospedeiras são geneticamente modificadas (incluindo, mas não limitadas a, transformadas, transduzidas ou transfectadas) com os polinucleotídeos da invenção ou construções que incluem um polinucleotídeo da invenção, incluindo, mas não limitado a, um vetor da invenção, que pode ser, por exemplo, um vetor de clonagem ou um vetor de expressão.
[0134] Vários métodos bem conhecidos de introdução de ácidos nucleicos de destino em células estão disponíveis, qualquer um dos quais pode ser usado na invenção. Estes incluem a fusão das células receptoras com protoplastos bacterianos contendo o DNA, eletroporação, bombardeio de projéteis e infecção com vetores virais, etc. As células bacterianas podem ser usadas para amplificar o número de plasmídeos contendo construções de DNA desta invenção. As bactérias são cultivadas até a fase log e os plasmídeos dentro da bactéria podem ser isolados por uma variedade de métodos conhecidos na técnica (ver, por exemplo, Sambrook). Além disso, os kits estão comercialmente disponíveis para a purificação de plasmídeos de bactérias, (ver, por exemplo, EasyPrep™, FlexiPrep™, ambos da Pharmacia Biotech; StrataClean™ de Stratagene; e, QIAprep™ de Qiagen). Os plasmídeos isolados e purificados são, em seguida, manipulados adicionalmente para produzir outros plasmídeos, usados para transfectar células ou incorporados em vetores relacionados para infectar organismos. Os vetores típicos contêm terminadores de transcrição e tradução, sequências de iniciação de transcrição e tradução, e promotores úteis para a regulação da expressão do ácido nucleico de destino particular. Os vetores opcionalmente compreendem cassetes de expressão genérica contendo pelo menos uma sequência terminadora independente, sequências que permitem a replicação do cassete em eucariotos ou procariotos ou ambos, (incluindo, mas não limitado aos, vetores de transporte) e marcadores de seleção para ambos os sistemas procarióticos e eucarióticos. Os vetores são adequados para a replicação e integração em procariotos, eucariotos ou ambos.
Ver, Gillam & Smith, Gene 8:81, 1979; Roberts, et al., Nature, 328:731, 1987; Schneider, E., et al., Protein Expr. Purif. 6(1):10 a 14, 1995; Ausubel, Sambrook, Berger (todos supra). Um catálogo de bactérias e bacteriófagos úteis para clonagem é fornecido, por exemplo, pelo ATCC, por exemplo, The ATCC Catalogue of Bacteria and Bacteriophage (1992) Gherna et al. (eds) publicado pelo ATCC. Os procedimentos básicos adicionais para sequenciamento, clonagem e outros aspectos de biologia molecular e considerações teóricas subjacentes, também são encontrados em Watson et al. (1992) Recombinant DNA Second Edition Scientific American Books, NY. Além disso, essencialmente qualquer ácido nucleico (e virtualmente qualquer ácido nucleico marcado, seja padrão ou não padrão) pode ser personalizado ou pedido padrão de qualquer uma de uma variedade de fontes comerciais, tais como Midland Certified Reagent Company (Midland, TX disponível na worldwideweb em mcrc.com), The Great American Gene Company (Ramona, CA disponível na worldwideweb em genco.com), ExpressGen Inc. (Chicago, IL disponível na worldwideweb em expressgen.com), Operon Technologies Inc.
(Alameda, CA) e muitos outros.
KITS
[0135] Qualquer uma das composições descritas neste relatório pode ser montada em um kit, em um meio de recipiente adequado. Mais particularmente, todos ou um subconjunto dos componentes para projetar e construir ou manipular um vetor e/ou plasmídeo da presente invenção podem ser empacotados juntos em um kit. Um ou mais componentes da presente invenção podem ser empacotados separadamente ou juntos. Em algumas formas de realização, é preferível empacotar o vetor e/ou plasmídeo junto com um ou mais componentes divulgados neste relatório. Em formas de realização da invenção, as proteínas, peptídeos, polipeptídeos (incluindo fragmentos de anticorpos) ou ácido nucleico que os codificam podem ser empacotados juntos, ou moléculas individuais ou como um conjunto de moléculas. Alternativamente, os componentes divulgados neste relatório podem ser empacotados e vendidos individualmente junto com as instruções, na forma impressa ou em mídia legível por máquina, descrevendo como eles podem ser usados em conjunto uns com os outros para projetar e construir um vetor e/ou plasmídeo, como divulgado neste relatório. Em uma forma de realização, o kit pode ter um único meio de recipiente, e/ou pode ter meios de recipiente distintos para compostos adicionais. Os componentes da presente invenção podem ser fornecidos na forma líquida ou na forma de pó seco. Em alguns casos, onde os componentes são fornecidos em uma ou mais soluções líquidas, a solução líquida é uma solução aquosa, com uma solução aquosa estéril sendo particularmente preferida. Em outros casos, os componentes do kit podem ser fornecidos como pó(s) seco. Quando os componentes (por exemplo, reagentes) são fornecidos como um pó seco, o pó pode ser reconstituído pela adição de um solvente adequado. Prevê-se que o solvente também pode ser fornecido em outros meios de recipiente. Os meios de recipiente considerados neste relatório, incluem de uma maneira não limitante, pelo menos um frasco, tubo de ensaio, balão de vidro, garrafa e/ou outros meios de recipiente.
EXEMPLOS
[0136] Deve ser entendido que os exemplos e formas de realização descritos neste relatório são apenas para propósitos ilustrativos e que várias modificações ou alterações à luz dos mesmos serão sugeridas aos técnicos no assunto e devem ser incluídas no espírito e âmbito deste pedido e escopo das reivindicações anexas.
Exemplo 1: Engenharia de Vetores de Expressão
[0137] Os plasmídeos de expressão de Fab anti-CD3 da presente invenção foram construídos por método de clonagem com base em recombinação usando o kit Gibson Assembly (New England Biolabs, MA) ou usando kit de mutagênese QuikChange (Agilent Technologies, CA) na cepa de clonagem NEB5α de E. coli (New England Biolabs, MA), conforme descrito abaixo. A Tabela 1 mostra três E. coli hospedeiros de clonagem e produção, usados neste estudo e seus genótipos detalhados.
Tabela 1. Cepas Hospedeiras de Clonagem e Produção de Escherichia coli e Genótipos Cepa Genótipos Fonte/Referência fhuA2 (argF-lacZ)U169 phoA glnV44 80 (lacZ)M15 NEB5α NEB#2987 gyrA96 recA1 relA1 endA1 thi-1 hsdR17 W3110 F- mcrA mcrB EM(rrnD-rrnE) lambda- rph-1 ATCC#27325 F- mcrA mcrB EM(rrnD-rrnE) lambda- rph-1 araB::g1-tetA W3110B60 Ambrx, Inc. fhuA::dhfr proS-W375R-cat
[0138] Montagem de Gibson: Os iniciadores para amplificar vários genes de interesse (GOIs) contendo fragmentos doadores apresentaram sequência de sobreposição de cerca de 18 a 24 pares de base (bp) em seus terminais 5’ com as sequências de vetor aceitante para recombinação homóloga e foram sintetizados na Integrated DNA Technologies ((IDT), San Diego, CA)). Os fragmentos de PCR foram amplificados usando mistura de DNA polimerase de alta fidelidade, Pfu Ultra II Hotstart PCR Master Mix (Agilent Technologies, CA). Os produtos da PCR foram digeridos com a enzima de restrição Dpn1 (NEB) durante 2 horas a 37 °C para remover o fundo de plasmídeo, seguido por purificação da coluna usando kit de purificação de coluna Qiagen PCR (Qiagen) e quantificados por Nanodrop (ThermoFisher). Os vetores aceitantes foram linearizados por digestão com enzimas de restrição únicas (NEB, MA) dentro do vetor durante 3 a 5 horas nas temperaturas recomendadas pelo fornecedor, a coluna de PCR purificada e quantificada. Os insertos doadores e vetores aceitantes apropriadamente preparados foram misturados em uma razão molar 3:1, incubado a 50 °C durante 15 min, usando o kit Gibson Assembly (NEB) e, depois, usados para transformação na cepa NEB5α de E.
coli (NEB).
[0139] Os recombinantes foram recuperados por plaqueamento da mistura Gibson Assembly em placas de ágar LB contendo antibióticos apropriados. No dia seguinte, 4 a 6 colônias únicas bem isoladas foram inoculadas em 5 mL de meio LB + 50 µg/mL de sulfato de canamicina (Sigma) ou carbenicilina 100 µg/mL (Teknova) e cultivadas durante a noite a 37 °C. Os plasmídeos recombinantes foram isolados usando kit mini-prep e DNA de plasmídeo Qiagen (Qiagen) e verificados por sequenciamento de DNA (Eton Biosciences, CA). A região de GOI completa mais as sequências de 100 bp a montante e 100 bp a jusante foram verificadas usando iniciadores se sequenciamento específico do gene.
[0140] Mutagênese QuikChange (QCM): Variantes âmbar contendo o códon de parada TAG foram criadas usando kit de mutagênese dirigida por sítio QuikChange Lightning (Agilent Technologies). Os oligonucleotídeos QCM foram prejetados usando o Portal da Web QuikChange (Agilent Technologies Inc.) e ordenados a partir de IDT (San Diego, CA). A mistura de PCR QCM continha 5 µl de tampão 10x, 2,5 µl de dNTP Mix, 1 µl (100 ng) de molde de plasmídeo, 1 µl de mistura oligo (conc. 10 uM cada), 1 µl de enzima QuikChange Lightning, 2,5 µl de solução Quick e 37 µl de água destilada (DW). O DNA foi amplificado usando o Programa de PCR recomendado pelo kit para 18 ciclos apenas.
[0141] Depois da conclusão da reação de PCR, a mistura foi digerida com enzima Dpn1 que veio com o kit (Agilent Technologies) durante 2 a 3 horas a 37 °C e correu em um gel para verificar a presença de produto de PCR amplificado. Em seguida, 2,5 a 5 µl de Produto de PCR foram transformados em cepa NEB5α de E.
coli. Os plasmídeos recombinantes a partir de 4 a 6 colônias depois foram isolados e a sequência verificada, como descrito para a Gibson Assembly acima.
Exemplo 2: Engenharia das Cepas de Expressão
[0142] Para preparar as cepas de produção da presente invenção, células hospedeiras W3110B60 de E. coli quimicamente competentes foram transformadas com DNA de plasmídeo verificado na sequência (50 ng), as células recombinantes foram selecionadas em 2xYT + 1 % de placas de glicose ágar contendo 50 µg/mL de sulfato de canamicina (Sigma) (ou carbenicilina 100 µg/mL, Teknova) e incubadas durante a noite a 37 °C. Uma colônia única a partir da placa de transformação fresca depois foi propagada três vezes em 2xYT + 1 % de placas de glicose ágar contendo 50 µg/mL de sulfato de canamicina ou carbenicilina 100 µg/mL por estriamento triplo sequencial e incubação durante a noite a 37 °C. Finalmente, uma colônia única a partir da placa triplamente estriada foi inoculada em 20 mL de Super Broth (Fisher- OptiglowTM) contendo 50 µg/mL de sulfato de canamicina (Sigma) (ou carbenicilina 100 µg/mL, Teknova) e incubada durante a noite a 37 °C e 250 rpm. A cultura cultivada durante a noite depois foi diluída com glicerol a uma concentração de glicerol final de 20 % (p/v). Esta suspensão celular depois foi dispensada em alíquotas de 1 mL em vários criofrascos e congeladas a -80 °C como frascos de cepa de produção.
[0143] Depois da geração de frascos de glicerol das cepas de produção, conforme descrito acima, as cepas de produção foram ainda validadas por sequenciamento de DNA e caracterização fenotípica de marcadores de resistência a antibióticos. Para confirmar que o frasco de cepa de produção apresentou o plasmídeo correto no hospedeiro de produção, o plasmídeo foi verificado na sequência. Vinte (20) mL de LB contendo 50 µg/mL de sulfato de canamicina (ou carbenicilina 100 µg/mL) foram inoculados com uma punção a partir de um frasco de glicerol do clone e cultivados a 37 °C, 250 rpm durante a noite. O DNA de plasmídeo foi isolado usando Kit Qiagen Miniprep e a presença de GOI ORF intacto no plasmídeo isolado foi confirmado por sequenciamento de DNA (Eton Biosciences, CA).
[0144] Para verificar adicionalmente o genótipo da cepa de cada cepa de produção, as células a partir do mesmo frasco foram estriadas sobre quatro placas separadas de LB:LB contendo 50 ug/mL de sulfato de canamicina, LB contendo 15 ug/mL de tetraciclina, LB contendo 34 ug/mL de cloranfenicol e LB contendo 75 ug/mL de trimetoprima. Todas as placas depois foram verificadas quanto ao crescimento positivo, conforme esperado com o genótipo da cepa do hospedeiro de produção W3110B60, divulgado na Tabela 1.
Exemplo 3: Processo de Fermentação
[0145] O processo de fermentação para a produção de Fab anti-CD3-pAcF consiste de dois estágios: (i) preparação do inóculo e (ii) produção do fermentador.
O inóculo é iniciado a partir de um frasco de glicerol único, descongelado, diluído 1:1000 (v/v) em 50 mL de meio de semente definido em um 250 mL frasco Erlenmeyer com defletor e incubado a 37 °C e 250 rpm. Antes do uso, o fermentador é limpo e autoclavado. Uma quantidade especificado de meio basal é adicionada ao fermentador e esterilizada a vapor. Quantidades especificadas de solução de sulfato de canamicina, meio de alimentação e antiespumante P2000 são adicionados ao meio basal antes da inoculação. Todas as soluções adicionadas ao fermentador depois da autoclavagem são filtradas por 0,2 µm ou autoclavadas antes da adição asséptica. O fermentador de produção é inoculado em uma OD600 alvo de 0,0004 por transferência asséptica dos conteúdos do inóculo. Depois da inoculação, a cultura é experimentada em intervalos apropriado para a determinação de OD600.
Temperatura, pH e oxigênio dissolvido são monitorados e controlados nos pontos de ajuste especificados de 37 °C, 7,0 e >30 %, respectivamente. O pH é controlado pela adição de solução de hidróxido de amônio ou ácido sulfúrico. oxigênio dissolvido é controlado variando a velocidade de agitação e aumentando a composição de oxigênio na mistura de ar/oxigênio pulverizada. O antiespumante é adicionado durante o processo de fermentação para controlar a formação de espuma.
[0146] Quando a densidade celular atinge uma OD600 de > 25, um bolo de meio de alimentação é adicionado. Quando a densidade celular atinge uma OD600 de > 50, um meio de alimentação é adicionado em uma taxa de fluxo constante de 0,094 mL/L de volume inicial/minuto durante 32 horas até que seja reduzido a 0,052 mL/L de volume inicial/minuto até o final da fermentação. Imediatamente depois do início da alimentação, uma quantidade especificada de solução de pAcF é adicionada assepticamente para permitir a incorporação de pAcF na sequência de aminoácidos da proteína. Simultaneamente, a temperatura é alterada a partir de 37 °C usado durante o crescimento até 27 °C para a produção. A produção é controlada pelo promotor phoA e inicia quando níveis de fosfato no meio são depletados. A colheita é iniciada aproximadamente 24 e 48 horas depois da indução para processos de fermentação curtos e longos, respectivamente.
Exemplo 4: Ensaio de Retenção de Plasmídeo
[0147] Para medir a retenção de plasmídeo das amostras de fermentação, glicerol (20 % v/v) foi adicionado a 1 mL de caldo de fermentação na colheita e armazenado a -80 °C para análise futura. A partir desta amostra, 100 µL foram retirados e diluídos em série em 900 µL de caldo LB através de 10-1, 10-2, 10-3, 10-4, 10-5, 10-6, 10-7 e 10-8 diluições. 100 μL das 10-4, 10-5, 10-6, 10-7 e 10-8 diluições foram plaqueados em 2xYT + 1 % de placas de glicose ágar. As placas foram incubadas a 30 °C durante a noite. No dia seguinte, 100 colônias foram escolhidas a partir das placas de diluição com colônias bem isoladas e a réplica plaqueada em placas de 2xYT + 1 % de glicose ágar e 2xYT + 1 % de glicose + canamicina (50 μg/mL). As placas foram incubadas a 30 °C durante a noite. Depois da incubação durante a noite, as colônias foram contadas e comparadas entre as placas de 2xYT + 1 % de glicose e 2xYT + 1 % de glicose + canamicina (50 µg/mL). A retenção de plasmídeo é relatada como uma porcentagem de colônias que cresceram em placas de 2xYT + 1 % de glicose em comparação às placas de 2xYT + 1 % de glicose + canamicina (50 μg/mL).
Exemplo 5: Quantificação do Título do Produto
[0148] Para quantificar o título do produto, 1 mL de caldo de fermentação foi centrifugado (18,000 x g, 5 minutos) em vários pontos no tempo em todo o processo de fermentação. O sobrenadante foi transferido para um tubo de centrífuga separado de 1,5 mL e a pelota e o sobrenadante foram retidos e armazenados a -80 °C para análise futura. As pelotas celulares foram lisadas e o título foi determinado usando ensaios ELISA ou CEX, conforme descrito abaixo.
[0149] Preparação da Amostra: 1,0 mL de pelotas celulares de E. coli, conforme descrito acima, a partir das amostras de fermentação (pasta celular), foi seco e pesado para determinar a massa para a amostra. Lysonase Bioprocessing Reagent (Novagen) e Benzonase Nuclease Reagent (Novagen) foram usados para lisar quimicamente a pasta celular e foram diluídos 1:500 em BugBuster Protein Extraction Reagent (Novagen). 1,0 mL da mistura de Bugbuster/Lysonase/Benzonase foi adicionado a 1,0 mL de pasta celular seca e a mistura resultante foi vigorosamente agitada e depois colocada em um agitador Thermos a 22 °C durante 20 minutos com agitação em 1000 revoluções por minuto (rpm). Depois que a incubação foi concluído, o lisato celular foi centrifugado em 18,000 x g durante 3 minutos para peletizar os resíduos celulares.
[0150] Ensaio ELISA: O ensaio imunossorvente ligado por enzimas, ELISA, analisa as amostras por ensaio imunoenzimático para medir quantitativamente a presença de Fab anti-CD3. As amostras mencionadas acima depois foram diluídas em Tampão Caseína (ThermoFisher) antes da análise ELISA. Uma placa MSD (MSD) foi revestida com IgG Fd anti-humana de cabra (Southern Biotech) específica para a porção de cadeia pesada de Fab anti-CD3. As placas de ELISA revestidas depois foram lavadas com Tampão KPL (KPL) 1x e bloqueadas com tampão de Bloqueio Caseína. As amostras contendo Fab anti-CD3 e padrões purificados depois são incubados na placa durante 2 horas na temperatura ambiente com agitação. A placa foi lavada com tampão KPL 1x e uma etapa de ligação adicional ao anticorpo biotinilado capa anti-humano de cabra (Southern Biotech) específico para a porção de cadeia leve de Fab anti-CD3 foi realizada para garantir apenas que o Fab intacto fosse detectado. Estrepavidina Sulfo-etiquetada (MSD) foi usada para a identificação e quantificação das proteínas de Fab anti-CD3 capturadas. Tampão de leitura MSD (MSD) 4x foi diluído 1x e adicionado a cada poço. A quantidade de Fab anti-CD3 na amostra é determinada por extrapolação contra uma curva padrão.
[0151] Ensaio CEX: Uma alíquota de 200 µL do sobrenadante de lisato celular, como descrito acima, depois foi filtrada através de um filtro centrífugo de PVDF de 0,22 µm (Millipore) em 18.000 x g durante 3 minutos. O produto filtrado depois foi analisado por cromatografia de troca catiônica (CEX) para determinar a quantidade de Fab anti-CD3 presente nas amostras de fermentação. O ProPac WCX-10, coluna CEX 4 x 100mm (ThermoFisher) foi usado para separar o Fab anti- CD3 a partir dos contaminantes de proteína da célula hospedeira. A Fase Móvel A foi usada para capturar Fab anti-CD3 e consistiu de 20 mM de Fosfato de Sódio no pH 6,5, enquanto a Fase Móvel B, que foi usada para eluir Fab anti-CD3 e consistiu de 20 mM de Fosfato de Sódio, 200 mM de cloreto de sódio no pH 6,5. A quantidade de Fab anti-CD3 na amostra é determinada por interpolação da área do pico observada contra uma curva padrão.
Exemplo 6: Qualidade do Produto e Recuperação do Título
[0152] Fabs anti-CD3 da presente invenção foram produzidos em células de E. coli e recuperados a partir dos sobrenadantes de lisato celular total (WCL). A lise celular foi realizada a 4 °C. As células são lisadas em 100 mM de ácido acético, 100 mM de NaCl, 1 mM de EDTA pH 3,5, em um volume igual ao volume de fermentação original, resultando em um pH pós-lise de 4,1 a 4,2. Após a lise, o WCL é centrifugado em 15.900 x g durante 30 minutos a 4 °C e filtrado (0,8/0,2 mícron) para remover proteína precipitada e resíduos celulares. A cromatografia de troca catiônica Capto S foi usada para capturar Fab anti-CD3 a partir de sobrenadante de WCL de E. coli. A análise de RP-HPLC foi conduzida no agrupamento de Capto S para determinar a pureza de Fab intacto versus espécies de cadeia pesada e cadeia leve clipadas e truncadas adicionais que se copurificam na coluna Capto S juntamente com o Fab intacto. O título recuperável também foi estimado calculando a quantidade total da proteína recuperada a partir da coluna de captura Capto S e multiplicando pela porcentagem de Fab intacto no agrupamento de eluição de Capto S. A quantidade de Fab intacto foi dividida pelo volume de carga de Capto S inicial para estimar o título de fermentação, conforme as pelotas celulares colhidas foram recolocadas em suspensão novamente ao volume de colheita de fermentação para lise e purificação.
[0153] Espectrometria de Massas: 5 a 10 µg de amostra de Fab anti-CD3 foram carregados em uma coluna de HPLC analítica PLRP-S de fase reversa 2,1 mm x 150 mm, 8 µm, 4000 angstroms (A) (Agilent) para análise. As amostras purificadas e coletadas por fração foram injetadas sobre a coluna analítica pura. A fase móvel A consistiu de 0,05 % de TFA de grau LC/MS (FisherSci) em água de HPLC grau LC/MS (FisherSci), enquanto a fase móvel B consistiu de 0,05 % de TFA grau LC/MS em acetonitrila grau LC/MS (FisherSci). Um sistema de HPLC Agilent série1200 com uma bomba binária ligada a um sistema Agilent 6510 ESI Q-Toff- LC/MS foi usado para a análise do espectro de massas. O software de análise
Agilent Mass Hunter foi usado para identificar qualitativamente a massa dos picos cromatograficamente separados. O software de análise de proteína de espectro de massas GPMAW foi usado para determinar a massa teórica da sequência primária da proteína Fab anti-CD3. A massa teórica foi comparada à massa medida para determinar a identidade de cada pico.
Exemplo 7: Sistema de Expressão de Fab Anti-CD3 em E. coli
[0154] A Figura 1 mostra o esquema do cassete de expressão de Fab anti- CD3 com a localização do sítio de incorporação UAA dentro do domínio constante de cadeia pesada (CH1) indicado. Este operon bicistrônico é acionado pelo promotor de fosfatase alcalina (phoA) de E. coli que é induzido quando fosfato no meio é depletado. A sequência de aminoácidos do Fab anti-CD3 é composta das sequências codificantes de vH e vL (região variável das cadeias pesada e leve da imunoglobulina, respectivamente) mais as regiões constantes humanas gama1 (CH1) e capa (CL). Um peptídeo sinal de secreção, STII, anexado às cadeias pesada e leve, direciona a secreção de Fab no periplasma oxidante para a dobra apropriada e formação de ligação dissulfeto. Um códon de parada âmbar (TAG) foi construído no resíduo de lisina (K) 129 na posição 129 do domínio constante de cadeia pesada (CH1), (refere-se neste relatório, em seguida, como HK129amber ou HK129am), (mostrado em Figura 1) no Fab anti-CD3. Este códon de parada TAG codificou pAcF neste sítio com a maquinaria evoluída de pAcF tyrRS/tRNA de M.
jannaschii (veja, por exemplo, Wang L. et al., Science, 292, 498, 2001; Zhang Z. et al., Biochemistry, 42, 6735, 2003).
[0155] Esquema geral do vetor de expressão e construção de cepa de produção correspondente: A Figura 2 mostra o esquema geral do vetor de expressão e sua construção de cepa de produção correspondente. A Tabela 2 descreve todos os vetores de expressão e suas cepas correspondentes que foram usadas neste estudo. Brevemente, um vetor de expressão foi inicialmente construído pelo método Gibson Assembly ou por protocolo de mutagênese QuikChange na cepa de clonagem NEB5α de E. coli (New England Biolabs, MA), conforme descrito acima. O DNA do vetor de expressão verificado na sequência depois foi transformado em cepas W3110 ou W3110B60 do hospedeiro de produção da plataforma (Tabela 1) resultando em cepas de produção correspondentes (Tabela 2), conforme descrito neste relatório.
Tabela 2. Cepas de Produção e Plasmídeos de Expressão Correspondentes Cepa de Cepa Plasmídeo Parâmetros do plasmídeo produção hospedeira Plasmídeo precursor/cepa com o sítio 2797 W3110B60 p56 HK129-pAcF parB-F clonado entre os sítios AfeI & 2835 W3110B60 p96 NotI; deleta a sequência de plasmídeo Δ271 bp parB-F clonado no sítio AfeI; nenhuma 2884 W3110B60 p117 deleção de sequência de plasmídeo parB-R clonado no sítio AfeI; nenhuma 2885 W3110B60 p118 deleção de sequência de plasmídeo parB-F clonado no sítio ZraI; nenhuma 2886 W3110B60 p119 deleção de sequência de plasmídeo parB-R clonado no sítio ZraI; nenhuma 2887 W3110B60 p120 deleção de sequência de plasmídeo Tanto parB-F quanto chaperona FkpA-F 2909 W3110B60 p134 clonados no sítio ZraI; nenhuma deleção de sequência de plasmídeo Tanto parB-F quanto chaperona Skp-F 2910 W3110B60 p135 clonados no sítio ZraI; nenhuma deleção de sequência de plasmídeo 2914 W3110B60 p141 extensão CH1-D (1-aa) 2915 W3110B60 p142 extensão CH1-DK (2-aa) 2916 W3110B60 p143 extensão CH1-DKTH (4-aa) 2917 W3110B60 p144 extensão CH1-DKTHT (5-aa) extensão CH1-DKTHL (5-aa com 2918 W3110B60 p145 mutação T>L) Tanto parB-F quanto chaperona FkpA-R 3004 W3110B60 p199 clonados no sítio ZraI; nenhuma deleção de sequência de plasmídeo Tanto parB-F quanto chaperona FkpA-F 3005 W3110B60 P200 clonados no sítio ZraI; nenhuma deleção de sequência de plasmídeo Tanto parB-F quanto chaperona FkpA-R 3006 W3110B60 P201 clonados no sítio ZraI; nenhuma deleção de sequência de plasmídeo Exemplo 8: Cepa 2797 Construída com o Plasmídeo p56
[0156] A Figura 3 mostra o mapa do plasmídeo de expressão p56. No projeto e construção deste plasmídeo, um sistema ortogonal com E9 RS sintetase e agrupamento de tRNA contido dentro do plasmídeo foi utilizado (Veja, por exemplo, Publicação de Patente U.S. Nos.: 2003010885, 20050009049, 20050208536, 20060233744). Também utilizada no projeto e construção de plasmídeos da invenção foi a superexpressão de prolina sintetase de E. coli, ProS, proteína no plasmídeo proprietário para prevenir a incorporação errônea de prolina, assim como complementar uma mutação de proS sensível à temperatura dentro do cromossomo da cepa W3110B60 do hospedeiro de produção da plataforma proprietária para garantir a manutenção do plasmídeo (descrito, por exemplo, em Javahishvili, T. et al., ACS Chem. Biol., 9, 87, 2014).
[0157] Um gene sintético para a sequência de Fab anti-CD3 humanizado com códon de parada âmbar TAG na posição de aminoácido de cadeia pesada HK129 com flanqueamento dos sítios de enzima de restrição SnaBI e SpeI foi construído (Figura 1). O gene de Fab construído foi clonado em um vetor de expressão de E. coli proprietário usando kit Gibson Assembly (New England Biolabs, MA). Depois da verificação da sequência, o plasmídeo foi transformado na cepa W3110B60 do hospedeiro de produção de E. coli e uma colônia única isolada purificada para preparar os frascos de glicerol. Estes frascos de glicerol serviram como os clones de produção 2797 para a fermentação de E. coli da molécula de Fab. As sequências de DNA e aminoácidos das cadeias pesadas e leves deste Fab são mostradas como SEQ. ID. Nos.: 1 a 11 na Tabela 3 abaixo.
Tabela 3: Sequências de Aminoácidos e DNA do Cassete de Expressão Fab-HK129am Anti-CD3 SEQ. ID. Nome Tipo Sequência NO.
1 STII (23aa) Proteína MKKNIAFLLASMFVFSIATNAYA
QAVVTQEPSLTVSPGGTVTLTCRSSTGAVTTSNYA
NWVQQKPGQAPRGLIGGTNKRAPGTPARFSGSLL 2 vL (110aa) Proteína
GGKAALTLSGAQPEDEAEYYCALWYSNLWVFGG GTKLTVLG RTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPRE
AKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSS 3 CL (107aa) Proteína
TLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRG EC EVQLVESGGGLVQPGGSLRLSCAASGFTFNTYAM
NWVRQAPGKGLEWVARIRSKYNNYATYYADSVKD 4 vH (125aa) Proteína
RFTISRDDSKNILYLQMNSLKTEDTAVYYCVRHGN
FGNSYVSWFAYWGQGTLVTVSS CH1 (103aa)
ASTKGPSVFPLAPSSXSTSGGTAALGCLVKDYFPE X indica a 5 Proteína PVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVT inserção de
VPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSC pAcF
ATGAAAAAGAATATCGCATTTCTTCTTGCATCTAT 6 STII (69 bp) DNA
GTTCGTTTTTTCTATTGCTACAAACGCGTACGCT CAGGCTGTGGTGACTCAGGAGCCCTCACTGACT GTGTCCCCAGGAGGGACAGTCACTCTCACCTGT CGCTCCAGCACTGGAGCTGTCACCACTAGTAAT TATGCCAACTGGGTCCAGCAGAAGCCTGGCCAA
GCCCCCAGGGGACTGATTGGTGGGACAAACAAG 7 vL (330 bp) DNA
AGAGCTCCCGGGACACCTGCCCGGTTCTCAGGC TCCCTCCTTGGGGGCAAAGCTGCCCTGACCCTT TCGGGTGCGCAGCCTGAGGATGAGGCTGAGTAT TACTGCGCTCTCTGGTATAGTAATCTGTGGGTGT TCGGCGGAGGGACCAAGTTGACCGTCCTCGGA CGTACGGTGGCTGCACCATCTGTCTTCATCTTCC CGCCATCTGATGAGCAGTTGAAATCTGGAACTG CCTCTGTTGTGTGCCTGCTGAATAACTTCTATCC
CAGAGAGGCCAAAGTACAGTGGAAGGTGGATAA CL (321 bp) CGCCCTCCAATCGGGTAACTCCCAGGAGAGTGT 8 DNA
CACAGAGCAGGACAGCAAGGACAGCACCTACAG CCTCAGCAGCACCCTGACGCTGAGCAAAGCAGA CTACGAGAAACACAAAGTCTACGCCTGCGAAGT CACCCATCAGGGCCTGAGCTCGCCCGTCACAAA
GAGCTTCAACAGGGGAGAGTGT espaçador 9 DNA TCTGGGGATAAGAATTCGGTTGAGGTGATTTT (32 bp)
GAGGTGCAGCTGGTGGAGTCTGGGGGAGGCTT GGTCCAGCCTGGAGGGTCCCTGAGACTCTCCTG TGCAGCCTCTGGATTCACCTTCAATACCTACGCA ATGAACTGGGTCCGCCAGGCTCCAGGGAAGGG
GCTGGAGTGGGTTGCTCGTATTAGAAGCAAATAT 10 vH (375 bp) DNA AACAATTACGCCACATATTACGCCGATTCTGTGA
AAGACAGATTCACCATCTCAAGAGATGATTCAAA GAACATTCTGTATCTGCAAATGAACAGCCTGAAA ACCGAGGACACGGCCGTGTATTACTGTGTTAGA CATGGGAATTTCGGCAACTCTTATGTCAGTTGGT TTGCCTACTGGGGCCAAGGTACCCTGGTCACCG TCTCGAGT GCTAGCACCAAGGGCCCATCGGTCTTCCCCCTG GCACCCTCCTCCTAGAGCACCTCTGGGGGCACA
GCGGCCCTGGGCTGCCTGGTCAAGGACTACTTC CH1 (309 bp) CCCGAACCGGTGACGGTGTCGTGGAACTCAGG TAG indica CGCCCTGACCAGCGGCGTGCACACCTTCCCGG 11 DNA sítio âmbar CTGTCCTACAGTCCTCAGGACTCTACTCCCTCAG
CAGCGTGGTGACCGTGCCCTCCAGCAGCTTGG GCACCCAGACCTACATCTGCAACGTGAATCACA AGCCCAGCAACACCAAGGTGGACAAGAAAGTTG AGCCCAAATCTTGT
[0158] Os títulos de fermentação e retenção de plasmídeo da cepa 2797 são mostrados nas Figuras 4, 5A a B e Tabela 4 abaixo.
Tabela 4. Retenção de Plasmídeo da Cepa 2797 Retenção de Parâmetros do Cepa de Processo de Ponto no plasmídeo plasmídeo (estado produção fermentação tempo (h) (%) do parB) 2797 Longo 54 1 nenhum parB Otimizado 2797 48 0 - 44 nenhum parB longo Exemplo 9: Cepas Construídas com Posicionamento e Orientação Variados do Loco B de Partição (parB)
[0159] A linhagem celular do hospedeiro Produção W3110B60, usada para gerar a cepa 2797, contém uma mutação no gene de proS prolina sintetase genômico (W375R). Esta mutação torna a proteína ProS genômica inativa acima de 34 °C, assim, criando uma linhagem celular W3110B60 sensível à temperatura com crescimento inibido a 37 °C. Além do gene de interesse (GOI) de Fab anti-CD3, o plasmídeo p56 na cepa 2797 também contém o gene proS de E. coli para a expressão da proteína ProS de E. coli do tipo selvagem. Isto permite o crescimento e fornece uma pressão seletiva para manter o plasmídeo GOI a 37 °C. Entretanto, pode não ser uma vantagem para a manutenção do plasmídeo quando a temperatura de produção é menor do que 34 °C. O gene kanR para resistência à canamicina também está presente no plasmídeo p56 (Figura 3), fornecendo uma pressão seletiva para a manutenção do plasmídeo quando o antibiótico canamicina é adicionado ao meio. Mesmo com os dois componentes, retenção de plasmídeo deficiente foi observada nas células 2797 coletadas em vários pontos no tempo durante a fermentação (Tabela 4).
[0160] Para garantir a manutenção do plasmídeo robusta durante toda a fermentação, independentemente da temperatura de produção de Fab ou qualquer outras limitações de processo, várias estratégias foram investigadas. Uma estratégia foi garantir a segregação do plasmídeo apropriada durante a divisão celular bacteriana, tal que cada célula filha herdasse o mesmo plasmídeo. Foi mostrado na literatura que em alguns sistemas de segregação de plasmídeo bacterianos, genes específicos conhecidos como loco de partição do plasmídeo (par) garantem isto matando as células filhas que perderam o plasmídeo durante a divisão celular (Ebersbach G. & Gerdes K., Annu. Rev. Genet. 39, 453, 2005). Adicionalmente, outras descobertas na literatura demonstraram que a incorporação de um loco de partição B parB (hok/sok)de 580-bp mínimo (SEQ. ID. NO:12), originalmente a partir do plasmídeo R1 de E. coli, em plasmídeos, pode aperfeiçoar sua manutenção e estabilidade em muitas bactérias, incluindo E. coli (Gerdes K., Nature Biotech.
6,1402, 1988; Gerdes K. et al., Mol. Microbiol. 4, 1807, 1990; Gerdes K. e Neilsen Al, J. Mol. Biol. 226, 637, 1992).
[0161] Portanto, os inventores procuraram clonar um gene do loco parB sintético de 580-bp (DNA2,0, Menlo Park, CA) com direção transcricional direta (F) de seu gene de morte hospedeiro (hok) (SEQ. ID. NO:13) e aminoácido (SEQ. ID.
NO:14) com respeito à direção transcricional do gene de Fab a jusante entre os sítios de enzima de restrição AfeI e NotI no plasmídeo p56. Esta estratégia gerou um plasmídeo sintético construído, p96, tendo uma deleção de 271-bp na estrutura do plasmídeo logo a montante da região promotora phoA. Todas as outras regiões codificantes (CDSs) e suas direções transcricionais, incluindo o gene de Fab, genes kanR e proS, permanecer não alteradas. O plasmídeo p96 depois foi transformado em uma cepa W3110B60 de hospedeiro de produção padrão, conforme descrito nos Exemplos acima, para obter a cepa de produção 2835.
Tabela 5: Sequências de DNA e Proteína do loco parB, FkpA e Skp Chaperonas SEQ. ID. Nome Tipo Sequência No.
AACAAACTCCGGGAGGCAGCGTGATGCGGCAACAATCACACGG ATTTCCCGTGAACGGTCTGAATGAGCGGATTATTTTCAGGGAAA GTGAGTGTGGTCAGCGTGCAGGTATATGGGCTATGATGTGCCC GGCGCTTGAGGCTTTCTGCCTCATGACGTGAAGGTGGTTTGTTG CCGTGTTGTGTGGCAGAAAGAAGATAGCCCCGTAGTAAGTTAAT
TTTCATTAACCACCACGAGGCATCCCTATGTCTAGTCCACATCAG parB GATAGCCTCTTACCGCGCTTTGCGCAAGGAGAAGAAGGCCATG 12 DNA (580-bp) AAACTACCACGAAGTTCCCTTGTCTGGTGTGTGTTGATCGTGTG
TCTCACACTGTTGATATTCACTTATCTGACACGAAAATCGCTGTG CGAGATTCGTTACAGAGACGGACACAGGGAGGTGGCGGCTTTC ATGGCTTACGAATCCGGTAAGTAGCAACCTGGAGGCGGGCGCA GGCCCGCCTTTTCAGGACTGATGCTGGTCTGACTACTGAAGCG CCTTTATAAAGGGGCTGCTGGTTCGCCGGTAGCCCCTTTCTCCT TGCTGATGTTGT
ATGAAACTACCACGAAGTTCCCTTGTCTGGTGTGTGTTGATCGT hok (156-
GTGTCTCACACTGTTGATATTCACTTATCTGACACGAAAATCGCT 13 bp) DNA
GTGCGAGATTCGTTACAGAGACGGACACAGGGAGGTGGCGGCT
TTCATGGCTTACGAATCCGGTAAG Hok (52-
MKLPRSSLVWCVLIVCLTLLIFTYLTRKSLCEIRYRDGHREVAAFMA 14 aa) Proteína
YESGK GATTCACCTCTTTTGTCGAATGGTCGCCGCGGATTCTACTTAACT TTGCTGCCCGAGACAGCACTCATTTCGCGGTCATCGAAACTAAT TTAAACAAAAAGAGTCTGAAAATAGATGATAATAGGGCGTGTCTG TATGTAGATTTGTTCGACAACGCTTTATAGTACCCTTCTGATAAT AGTTAACCCTGGGGTGAGATGCCCCGATCCTGGAGATATGGAT GAAATCACTGTTTAAAGTAACGCTGCTGGCGACCACAATGGCCG TTGCCCTGCATGCACCAATCACTTTTGCTGCTGAAGCTGCAAAA CCTGCTACAGCTGCTGACAGCAAAGCAGCGTTCAAAAATGACGA TCAGAAATCAGCTTATGCACTGGGTGCCTCGCTGGGTCGTTACA
TGGAAAACTCTCTAAAAGAACAAGAAAAACTGGGCATCAAACTG fkpA
GATAAAGATCAGCTGATCGCTGGTGTTCAGGATGCATTTGCTGA (1199- 15 DNA TAAGAGCAAACTCTCCGACCAAGAGATCGAACAGACTCTACAAG bp)
CATTCGAAGCTCGCGTGAAGTCTTCTGCTCAGGCGAAGATGGAA AAAGACGCGGCTGATAACGAAGCAAAAGGTAAAGAGTACCGCG AGAAATTTGCCAAAGAGAAAGGTGTGAAAACCTCTTCAACTGGT CTGGTTTATCAGGTAGTAGAAGCCGGTAAAGGCGAAGCACCGA AAGACAGCGATACTGTTGTAGTGAACTACAAAGGTACGCTGATC GACGGTAAAGAGTTCGACAACTCTTACACCCGTGGTGAACCGCT TTCTTTCCGTCTGGACGGTGTTATCCCGGGTTGGACAGAAGGTC TGAAGAACATCAAGAAAGGCGGTAAGATCAAACTGGTTATTCCA CCAGAACTGGCTTACGGCAAAGCGGGTGTTCCGGGGATCCCAC CGAATTCTACCCTGGTGTTTGACGTAGAGCTGCTGGATGTGAAA CCAGCGCCGAAGGCTGATGCAAAGCCGGAAGCTGATGCGAAAG CCGCAGATTCTGCTAAAAAATAAGCATTAAGAACCGCCGCCTGA CCAGGCGGCGGTTTTTTTATTACAGGCCGGATATAATTAGTGCT GGAAAGCGGAACCTCCGCTGTATTAATTTAGTTACCCGCATCAT TAATGAGCCTGCCCTGAAAAGTTAACGACAGGCTCCTGAAAAGG AGTGTTTTTTTTC MKSLFKVTLLATTMAVALHAPITFAAEAAKPATAADSKAAFKNDDQK
SAYALGASLGRYMENSLKEQEKLGIKLDKDQLIAGVQDAFADKSKL FkpA SDQEIEQTLQAFEARVKSSAQAKMEKDAADNEAKGKEYREKFAKE 16 Proteína (270-aa) KGVKTSSTGLVYQVVEAGKGEAPKDSDTVVVNYKGTLIDGKEFDN
SYTRGEPLSFRLDGVIPGWTEGLKNIKKGGKIKLVIPPELAYGKAGV PGIPPNSTLVFDVELLDVKPAPKADAKPEADAKAADSAKK TTTAACATCGGTAAAACCTGGTAAGTGTTCTCCACAAAGGAATGT AGTGGTAGTGTAGCGATGACTTTAGGCGATCAATATAAGATCGC CGGGCCACGCAAAGAACTGCACCCTCCGGTGCAAATGGGATGG TAAGGAGTTTATTGTGAAAAAGTGGTTATTAGCTGCAGGTCTCG GTTTAGCACTGGCAACTTCTGCTCAGGCGGCTGACAAAATTGCA ATCGTCAACATGGGCAGCCTGTTCCAGCAGGTAGCGCAGAAAA
CCGGTGTTTCTAACACGCTGGAAAATGAGTTCAAAGGCCGTGCC skp 17 DNA AGCGAACTGCAGCGTATGGAAACCGATCTGCAGGCTAAAATGAA
AAAGCTGCAGTCCATGAAAGCGGGCAGCGATCGCACTAAGCTG GAAAAAGACGTGATGGCTCAGCGCCAGACTTTTGCTCAGAAAGC GCAGGCTTTTGAGCAGGATCGCGCACGTCGTTCCAACGAAGAA CGCGGCAAACTGGTTACTCGTATCCAGACTGCTGTGAAATCCGT TGCCAACAGCCAGGATATCGATCTGGTTGTTGATGCAAACGCCG TTGCTTACAACAGCAGCGATGTAAAAGACATCACTGCCGACGTA CTGAAACAGGTTAAATAAGTA
MKKWLLAAGLGLALATSAQAADKIAIVNMGSLFQQVAQKTGVSNTL Skp ENEFKGRASELQRMETDLQAKMKKLQSMKAGSDRTKLEKDVMAQ 18 Proteína (161-aa) RQTFAQKAQAFEQDRARRSNEERGKLVTRIQTAVKSVANSQDIDLV
VDANAVAYNSSDVKDITADVLKQVK
[0162] As cepas de produção, 2797 e 2835 depois foram comparadas em processos de fermentação de alta densidade celular, conforme descrito acima. A Figura 4 compara o título de produção das cepas 2797 e 2835 sob condições de fermentação curtas e longas. A Tabela 6 mostra os dados de retenção de plasmídeo para estas duas cepas sob dois processos de fermentação diferentes. A retenção de plasmídeo típica para a cepa 2797 variou entre 0 % e 44 % em 48 horas após otimização do processo de fermentação longo para conservar o plasmídeo, com apenas 1 % de retenção de plasmídeo medida em 54 horas. Como esperado e mostrado, a incorporação do loco parB na cepa 2835 melhorou significantemente a retenção de plasmídeo. As rodadas de fermentação com a cepa2835 mostraram 100 % de retenção de plasmídeo nos dois processos e nos dois pontos no tempo (22 horas e 54 horas; Tabela 6).
Tabela 6. Retenção de plasmídeo de cepas contendo parB e cepa precursora 2797 Retenção de Parâmetros do Cepa de Processo de Ponto no plasmídeo plasmídeo (estado do produção fermentação tempo (h) (%) parB) 2797 Longo 54 1 nenhum parB Otimizado 2797 48 0 - 44 nenhum parB longo parB-F no sítio AfeI+NotI; deleção de 2835 Curto 22 100 sequência de plasmídeo271-bp parB-F no sítio AfeI+NotI; deleção de 2835 Longo 52 100 sequência de plasmídeo 271-bp parB-F no sítio AfeI; 2884 Longo 48 100 nenhuma deleção de sequência de plasmídeo parB-R no sítio AfeI; 2885 Longo 48 100 nenhuma deleção de sequência de plasmídeo parB-F no sítio ZraI; 2886 Longo 48 100 nenhuma deleção de sequência de plasmídeo parB-R no sítio ZraI; 2887 Longo 48 100 nenhuma deleção de sequência de plasmídeo
[0163] Apesar da manutenção melhorada do plasmídeo, os títulos da pelota celular foram cerca de 40 % menores com a linhagem celular 2835 para processos de fermentação curtos e longos (Figura 4). Isto foi inesperado, visto que a retenção de plasmídeo melhorada teoricamente deve ter, pelo menos, mantido a mesmo produtividade, se não melhorada. As melhoras no título foram observadas mais tarde com a inserção do loco parB sem qualquer deleção de sequência da estrutura do plasmídeo que é descrita abaixo.
Exemplo 10: Construção de Vetores e Cepas contendo ParB sem Deleção de Sequência de Plasmídeo
[0164] Como descrito acima, a inserção do loco parB entre os sítios de enzima de restrição AfeI e NotI na orientação direta (F) resultou na retenção de plasmídeo melhorada (100 %), como esperado a partir da literatura. Entretanto, inesperadamente, também diminuiu títulos de Fab intacto em cerca de 40 % na pelota celular. Para recuperar esta perda de produção, 4 novos plasmídeos de expressão (p117, p118, p119 e a p120; Tabela 2) sem qualquer deleção da sequência da estrutura do plasmídeo foram construídos. Os sítios de enzima de restrição AfeI e ZraI únicos dentro da estrutura do plasmídeo foram utilizados. O mesmo loco parB foi clonado nas duas localizações na orientação direta (F) ou em reversa (R) com respeito a CDS de Fab. Esta estratégia resultou em 4 novas cepas de produção, 2884, 2885, 2886 e 2887 (Tabela 2), que depois foram comparadas em fermentação celular de alta densidade com a cepa 2797 original para a retenção de plasmídeo e título de produção (Figuras 5A a B e Tabela 6).
[0165] As novas linhagens celulares de produção foram 2884 (Fab anti-CD3, parB-AfeI-F), 2885 (Fab anti-CD3, parB-AfeI-R), 2886 (Fab anti-CD3, parB-ZraI-F) e 2887 (Fab anti-CD3, parB-ZraI-R) onde AfeI ou ZraI indica o sítio de enzima de restrição onde o loco parB foi clonado e F (direta) indica que a transcrição do gene hok está na mesma orientação de CDS de Fab, onde R (reversa) indica que a transcrição do gene hok está na orientação reversa em comparação a CDS de Fab.
Estas linhagens celulares de produção foram comparadas a 2797 (Fab anti-CD3) sem o loco parB.
[0166] Como esperado, todos as 4 novas linhagens celulares parB mostraram 100 % de retenção de plasmídeo 48 horas pós-indução (Tabela 6). Isto demonstra uma melhora significante em relação a 2797 sem o loco parB, onde a retenção de plasmídeo no final da fermentação variou de tão baixa quanto 0 % até a mais alta medida a 44 %, dependendo do processo de fermentação usado (veja a Tabela 6 e Exemplos acima). De forma surpreendente, a localização e a orientação do loco parB dentro do plasmídeo apresentou efeito significante sobre o título de Fab anti-CD3. Três cepas (cepa 2885, 2886 e 2887) das 4 novas cepas mostraram pelota celular significantemente melhorada (Figura 5A) e títulos do meio (Figura 5B) em relação à cepa controle 2797. Além da alteração na localização e orientação do loco parB a partir de 2835 descrita acima, nas cepas 2884 a 2887, o parB foi clonado evitando a deleção de qualquer porção da sequência de plasmídeo. Em um estudo separado, foi observado que as partes de deleção da sequência de plasmídeo a montante da região promotora phoA apresentaram um impacto negativo sobre os títulos de Fab (dados não mostrados). Realocar o parB para longe desta região e deixar esta sequência intacta, provavelmente, suporta os títulos de Fab aumentados observados com a maioria destes constructos.
[0167] Apenas a cepa 2884 apresentou títulos da pelota celular e do meio menores do que a cepa controle 2797 (Figuras 5A a 5B). A única diferença entre as cepas 2884 e 2835, descritas neste relatório, é a deleção da sequência de plasmídeo 271-bp entre os sítios de enzima de restrição AfeI e NotI com a mesma orientação do parB-F. Portanto, como a deleção de sequência de plasmídeo ou a falta dela, nesta localização, resultou no título de Fab menor (cepa 2835 comparada a 2884), foi concluído que a orientação de parB é mais importante do que a localização para aumentar o título dada a cepa 2885 com título melhorado na orientação de parB-R.
[0168] Outros estudos foram conduzidos usando as cepas 2886 e 2887, onde parB está localizado mais longe da região promotora phoA, em um esforço para determinar a melhor cepa para a otimização do processo de expressão. A cepa 2886 foi escolhida por apresentar o título mais alto, com 236 m g/L medidos 32 horas pós-indução (média de n = 3 fermentações; dados não mostrados). O mapa do plasmídeo p119 contido na cepa 2886 é mostrado na Figura 6 com a localização e orientação ideais do loco parB clonado.
Exemplo 11: Projeto e Efeitos de Chaperonas Periplasmáticas sobre um Sistema de Expressão de Dois Plasmídeos Compatível
[0169] Para determinar o envolvimento de chaperonas moleculares na otimização ou aumento do título da proteína em E. coli, duas chaperonas periplasmáticas bifuncionais bem conhecidas, FkpA e Skp, tendo atividades de peptidil prolil isomerase, foram analisadas.
[0170] Para este fim, dois plasmídeos compatíveis foram construídos com origem p15A de replicação (10 a 15 número de cópias/célula) por clonagem do gene FkpA ou Skp. Estes plasmídeos de resistência à canamicina (KanR) foram cotransformados com plasmídeo de expressão de Fab anti-CD3 tendo resistência à ampicilina (AmpR) com origem pBR322 de replicação (30 a 50 número de cópias/célula) para testar os efeitos da coexpressão de chaperona periplasmática (Figura 7A).
[0171] Para este estudo, cepa hospedeira de expressão W3110do tipo selvagem (Tabela 1) foi utilizada uma vez que o cepa do hospedeiro de produção padrão, W3110B60, tem um marcador KanR inserido no cromossomo. Todas as 3 linhagens celulares proprietárias neste estudo foram cotransformadas com dois plasmídeos, conforme ilustrado na Figura 7A. O plasmídeo 1 contém Fab anti-CD3 + ampR + parB (com parB clonado com deleção de 271-bp entre os sítios de enzima de restrição AfeI e NotI) em todas as 3 cepas de produção. Para as cepas de chaperona periplasmática 2840 e 2841, o plasmídeo 2 contém as chaperonas FkpA e Skp, respectivamente, por trás do promotor de tetraciclina induzível (pTetA) com marcador de resistência à canamicina (kanR) onde os genes fkpA e skp são induzidos pela adição de 50 partes por bilhão (ppb) de tetraciclina no meio (Figura 7A). Para a cepa controle 2939, o plasmídeo 2 contém marcador de resistência à canamicina (kanR), mas nenhuma chaperona. As sequências de DNA e proteína das chaperonas FkpA e Skp são incluídas como SEQ ID NOs: 15 a 18 na Tabela 5.
[0172] Todas as fermentações foram conduzidas usando o processo de fermentação curto, como mencionado nos Exemplos acima e mostrado na Figura 4.
Para todas as 3 cepas, 50 µg/mL de carbenicilina e 50 µg/mL de canamicina foram adicionados ao meio para manter os dois plasmídeos. Para as cepas 2840 e 2841 (Tabela 7), 2 mL de 50 µg/mL de tetraciclina (concentração final de 50 ng/mL) foram adicionados com pAcF na depleção de fosfato (PO4) para induzir a expressão de chaperonas. Os títulos de ELISA da pelota celular são mostrados na Figura 8.
Contrariamente às expectativas, não houve aumento no título da pelota observado para a coexpressão de chaperonas periplasmáticas FkpA e Skp. Não houve vazamento ao meio para qualquer uma destas cepas (dados não mostrados).
Tabela 7. Cepas de Produção e Plasmídeos de Expressão Correspondentes em um Sistema de Dois Plasmídeos Compatível Cepa de Cepa Plasmídeo AbR Plasmídeo AbR de Comentários produção hospedeira de Fab1 de de Chaperona Fab Chaperona 2839 W3110 p94 Amp Nenhuma Kan Cepa chaperona precursora para comparação 2840 W3110 p94 Amp FkpA Kan Cepa de chaperona FkpA 2841 W3110 p94 Amp Skp Kan Cepa de Skp chaperona
[0173] Deve ser observado que a falta de melhora da expressão de Fab observada pode ser atribuída à expressão de chaperonas periplasmáticas sendo não ligadas a partir de seu promotor de E. coli natural, visto que foram artificialmente acionadas pelo promotor de tetraciclina induzível (pTetA), como divulgado neste relatório. Em E. coli, a expressão dos genes FkpA e Skp é acionada por um fator sigma E alternativo (sigma E) que está envolvido em vários sensores de estresse periplasmático, incluindo estresse proteico mal dobrado/não dobrado (Merdanovic M.
et al., Annu. Rev. Microbiol. 2011, 65, 149). Isto permite que a expressão destas chaperonas seja induzida quando necessário, isto é, quando as células detectam estresse proteico mal dobrado/não dobrado. Com base neste raciocínio, os inventores procuraram determinar a influência do sistema de promotor natural divulgado abaixo.
Exemplo 12: Projeto e Efeitos de Chaperonas Periplasmáticas sobre um Sistema de Expressão de Plasmídeo Único
[0174] Dado que nenhuma melhora do título de Fab foi observada em um sistema de dois plasmídeos compatível, como divulgado acima, um sistema de plasmídeo único foi examinado. Neste sistema, os genes de chaperona, FkpA e Skp, foram clonados atrás de seus promotores nativos no mesmo plasmídeo que o Fab anti-CD3 com parB-ZraI-F como na cepa 2886 (veja a Figura 7B).
[0175] As linhagens celulares usadas neste estudo foram 2886 (Fab anti- CD3, parB-ZraI-F) como um controle, 2909 (Fab anti-CD3, parB-ZraI-F, fkpA) para a coexpressão de FkpA e 2910 (Fab anti-CD3, parB-ZraI-F, skp) para a coexpressão de Skp. Os plasmídeos p134 e p135 (Tabela 2) contêm as chaperonas FkpA e Skp, respectivamente, clonadas com suas sequências nativas de promotor na orientação direta (F) com respeito ao loco parB e orientação de Fab. Assim, esta estratégia vinculou a expressão à fisiologia celular (isto é, estresse proteico mal dobrado/não dobrado) ao invés da expressão induzível por tetraciclina não ligada como no sistema de dois plasmídeos (veja a Figura 10, mapa do plasmídeo p134).
[0176] A coexpressão das chaperonas periplasmáticas FkpA ou Skp, desta maneira, aumentou a produção de Fab total significantemente nos títulos de 2886 (Figuras 9A a 9B). A coexpressão de Skp, entretanto, resultou em vazamento de Fab significante no meio e títulos da pelota celular de 2910 em 48 horas pós-indução não foram maiores do que 2886. Com a coexpressão de FkpA, a maioria do Fab foi retida na pelota celular. 424 m g/L de título de ELISA foram medidos para 2909, versus 245 m g/L para títulos de ELISA de 2886 medidos no mesmo dia. Assim,
ficou claro que a maneira em que as chaperonas são coexpressadas para a produção de proteína recombinante é muito importante. A partir destes dados, 2909 com a chaperona FkpA foi escolhida para desenvolvimento posterior.
Exemplo 13: Otimização da Localização e Orientação da Chaperona FkpA com Respeito a Fab e o Loco ParB dentro do Plasmídeo
[0177] Como divulgado acima, na cepa 2909, chaperona FkpA foi clonada na orientação direta atrás do loco parB no sistema de expressão de plasmídeo único (Figura 10). O mesmo gene da chaperona FkpA, quando expressado a partir de um plasmídeo separado como no sistema de dois plasmídeos de expressão na cepa 2840 (veja as Figuras 7A a B e Figura 8), não melhorou o título de Fab, enfatizando a importância de alinhar a expressão de chaperona auxiliar com fisiologia celular.
[0178] Com base nos dados obtidos sobre os efeitos de localização e orientação do loco parB com respeito à orientação de Fab no plasmídeo de expressão, como descrito nos Exemplos acima, os inventores especularam que a localização e orientação dos genes da chaperona, incluindo FkpA, também podem causar impacto no título de Fab. Para examinar este aspecto da invenção, os plasmídeos foram projetados e construídos por clonagem do gene fkpA na frente ou atrás do loco parB nas orientações Dir e Rev. Esta estratégia permitiu a avaliação do efeito da coexpressão do gene da chaperona sobre a produção de proteína recombinante em três níveis diferentes: 1) efeito do promotor, 2) efeito da posição e 3) efeito da orientação.
[0179] Para este fim, três novos plasmídeos (p199, p200 e p201) foram projetados e construídos variando a posição e orientação da chaperona FkpA com respeito à posição de parB-F, como mostrado na Tabela 8. Três(3) novas cepas de produção (cepas 3004, 3005 e 3006) que abrigam estes novos plasmídeos foram testadas quanto aos seus efeitos sobre o título de expressão de Fab. Como mostrado na Figura 11, a posição e a orientação da chaperona FkpA com respeito à orientação de parB-F afetou significantemente o título de Fab. Nenhum vazamento de Fab ao meio foi observado (dados não mostrados).
Tabela 8. Efeitos da Posição e Orientação do Loco parB e Chaperona FkpA sobre o Título de Expressão de Fab. Plasmídeo Posição Orientação Cepa A montante A jusante FkpA parB 2909 p134 FkpA parB For For 3004 p199 FkpA parB Rev For 3005 p200 parB FkpA For For 3006 p201 parB FkpA Rev For Exemplo 14: Efeito da Cepa Hospedeira sobre o Título de Fab anti-CD3 e Qualidade do Produto
[0180] É conhecido na literatura que os Fabs de anticorpos quando produzidos em E. coli são clipados por proteases no periplasma sob condições de produção sem qualquer inserção de aminoácido não natural (Battersby, J. E. et al., Journal of Chromatography A, 927, 61, 2001). Para investigar como a qualidade do produto de Fab é afetada por um sistema de supressão âmbar ortogonal, uma coluna de captura de Fab foi desenvolvida, por troca catiônica usando resina Capto S, que captura o Fab intacto, assim como vários fragmentos adicionais. As proteínas a partir da cepa 2886 que abriga o plasmídeo p119 (Table2) com o loco parB foram utilizadas para este estudo.
[0181] A caracterização analítica do agrupamento de eluição Capto S por RP-HPLC mais espectroscopia de massas (MS) a partir da cepa 2886 revelou que dois fragmentos capturados eram fragmentos Fab de HC e LC proteoliticamente clipados compatíveis com o relatório da literatura (Battersby, J. E. et al., Journal of Chromatography A, 927, 61, 2001) e um fragmento de HC traducionalmente truncado adicional, visto que o códon de parada âmbar está localizado na HC (Figuras 12A a B). Foi descoberto que Fab intacto foi apenas ~20 % da proteína capturada por área percentual de absorvância A280 a partir de RP-HPLC no agrupamento Capto S. Os fragmentos Fab remanescentes capturados foram clipados da cadeia leve a partir do terminal N (aa 1 a 110) (~20 %), clipados da cadeia pesada a partir do terminal N (~20 %) (aa 1 a 217) e a cadeia pesada truncada no códon de parada âmbar na posição HK129 para a incorporação de pAcF (~40 %) (aa 1 a 141) (Figuras 12A a B). O único fragmento que não foi capturado nesta coluna Capto S foi o fragmento clipado na cadeia leve do terminal C (aa 111 a 217).
Exemplo 15: Projeto, Construção e Análise de Expressão de Vetores com Várias Extensões de Cadeia Pesada
[0182] A construção das cepas de extensão C-terminal de cadeia pesada (HC): Como divulgado nos Exemplos acima, RP-HPLC e massa intacta no agrupamento de eluição Capto S identificaram vários fragmentos Fab que estavam presentes em altas porcentagens da proteína Fab total. Uma provável protease responsável pala clivagem de Fab é a serina endo-protease Prc periplasmática (para o processamento do terminal C), também conhecida como protease específica da cauda (Tsp) (Chen C. et al., Biotechnology and Bioengineering, 85, 463, 2004).
Acredita-se que Prc reconheça e se ligue ao terminal C de uma proteína e, depois, clive em regiões soltas ou não dobradas dentro da sequência da proteína (Keiler et al., Protein Science, 4, 1507, 1995). O sítio de clivagem é determinado pela estrutura secundária ou terciária da proteína e não pela sequência primária e Prc, portanto, tem uma ampla especificidade de sequência com respeito ao sítio de proteólise. Foi mostrado, entretanto, que uma sequência C-terminal da proteína afeta sua clivagem por Prc e que a modificação de uma sequência C-terminal da proteína pode alterar a quantidade de clivagem de tal proteína por Prc (Keiler K.C. & Sauer R.T., The Journal of Biological Chemistry, 271, 2589, 1996).
[0183] Neste estudo, as sequências C-terminais de cadeia pesada de Fab foram modificadas com o objetivo de reduzir a ligação C-terminal de Prc e, desse modo, reduzindo a clivagem de Prc. Esta estratégia foi buscada para melhorar a pureza do material de partida da coluna de captura Capto S para purificação, assim como para aumentar o título de Fab intacto diminuindo a porcentagem de HC gerada como espécie clipada, desse modo, aumentando a quantidade de HC disponível para a montagem no Fab intacto. No projeto de Fab, a sequência de cadeia pesada terminou com KSC220 onde C220 está implicado apenas na formação de ligação dissulfeto inter-cadeia com a cadeia leve. Ao contrário da sequência de cadeia leve (LC) que termina em C214, a sequência de HC natural se estende além do domínio CH1 no fragmento Fab na região da dobradiça, domínio CH2 e, finalmente, termina no domínio CH3. Para determinar se o reconhecimento de Prc na sequência C- terminal de HC pode ser alterado estendendo-o para além do resíduo C220 com base nos critérios relatados na literatura (Keiler K.C. & Sauer R.T., The Journal of Biological Chemistry, 271, 2589, 1996), diversas variantes de sequência de cadeia pesada foram projetadas estendendo o terminal C a partir de 1 a 5 aminoácidos (veja a Tabela 2) com a sequência D221KTHT225, a sequência natural na região da dobradiça. As variantes com a substituição T225 para L225 (Tabela 2), relatadas para Lucentis Fab (Ranibizumabe) da Genentech, também foram projetadas (veja na worldwideweb drugbank.ca/drugs/DB01270). As linhagens celulares usadas neste estudo apresentaram o loco parB e a chaperona FkpA coexpressados fora do plasmídeo de Fab anti-CD3, como 2909 (Fab anti-CD3, parB-ZraI-F, fkpA).
[0184] O teste dos efeitos de extensões C-terminais de HC: Um conjunto de 50 mL de amostras foi purificado por coluna Capto S, com título recuperável estimado por recuperação de A280 Capto S vezes a pureza de RP-HPLC no agrupamento Capto S (Figura 13A). Os resultados da pureza de RP-HPLC sobre os agrupamentos de Capto S a partir de 50 mL de purificações são mostrados na Figura 13B.
[0185] Todas as 5 variantes de extensão C-terminal de cadeia pesada forneceram títulos recuperáveis maiores em comparação ao controle 2909, até 610 m g/L para 2918 (Figura 13A). Estas variantes de cadeia pesada também mostraram uma porcentagem maior de Fab intacto no agrupamento Capto S do que o controle 2909 (30 % a 42 % intacto para as variantes de cadeia pesada vs. 25 % intacto para o controle 2909, Figura 13B). De forma surpreendente, embota tenha havido uma pequena diminuição na porcentagem da espécie de cadeia pesada clipada (como esperado a partir de proteólise de Prc reduzida), uma redução maior foi observada na porcentagem da cadeia pesada truncada (31 % a 38 % truncada para variantes de cadeia pesada vs. 39 % truncada para o controle 2909). Isto sugere que nem toda a espécie de HC “truncada” ocorre necessariamente a partir dos resultados de baixa eficácia de supressão e incorporação de pAcF e que algumas destas espécies também podem ocorrer devido à proteólise. Alternativamente, a alteração na sequência C-terminal de cadeia pesada pode afetar independentemente a eficácia de supressão.
[0186] Embora as variantes de extensão C-terminal de cadeia pesada tenham mostrado títulos maiores e porcentagem maior de Fab intacto, sugerindo que a ligação e proteólise por Prc foi reduzido, não houve uma correlação direta entre a porcentagem de Fab intacto e títulos de Fab. Entre as variantes de extensão de cadeia pesada, 2918 apresentou o título recuperável mais alto (610 m g/L), mas a porcentagem mais baixa de Fab intacto (30 %). Existem muitas variáveis que afetam o título e a alteração da sequência de proteína pode, por exemplo, afetar a expressão, secreção ao periplasma, dobra, incluindo isomerização de prolina cis- trans e formação de ligação dissulfeto, além de afetar a proteólise por Prc.
[0187] Como pode ser observado na Figura 13B, 2917 com sequência C- terminal de cadeia pesada KSC220DKTHT225 apresentou as porcentagens mais baixas de fragmentos de LC clipados, de HC clipados e de HC truncados concomitantes com a porcentagem mais alta do título de Fab intacto. Ainda que o título de Fab da cepa 2917 tenha sido menor em comparação a outras variantes, esta cepa foi selecionada, devido à melhor qualidade global da proteína, para avançar para outro desenvolvimento de processo, geração de linhagem celular e estudos in vivo.
[0188] Deve ser entendido que os métodos e composições descritos neste relatório não são limitados à metodologia, protocolos, linhagens celulares, constructos e reagentes particulares descritos neste relatório e, como tal, podem variar. Também deve ser entendido que a terminologia usada neste relatório é para o propósito de descrever apenas as formas de realização particulares e não se destina a limitar o escopo dos métodos e composições descritos neste relatório, que será limitado apenas pelas reivindicações anexas.
[0189] Como usado neste relatório e nas reivindicações anexas, as formas no singular “um”, “uma” e “o”, “a” incluem a referência no plural, a menos que o contexto claramente indique de outro modo.
[0190] A menos que definido de outro modo, todos os termos técnicos e científicos usados neste relatório têm o mesmo significado, como comumente entendido pelos técnicos no assunto ao qual a invenção divulgada e descrita neste relatório pertence. Embora quaisquer métodos, dispositivos e materiais similares ou equivalentes àqueles descritos neste relatório possam ser usados na prática ou teste da invenção descrita neste relatório, os métodos, dispositivos e materiais preferidos são agora descritos.
[0191] Todas as publicações e patentes mencionadas neste relatório são integralmente incorporadas neste relatório à título de referência para o propósito de descrever e divulgar, por exemplo, os constructos e metodologias que são descritos nas publicações, que podem ser usados em relação à invenção presentemente descrita. As publicações debatidas neste relatório são fornecidas somente para sua divulgação antes da data do depósito do presente pedido. Nada neste relatório deve ser interpretado como uma admissão de que os inventores descritos neste relatório não têm o direito de antecipar tal divulgação em virtude da invenção anterior ou por qualquer outra razão.
[0192] Embora a invenção precedente tenha foi descrita em alguns detalhes para propósitos de esclarecimento e entendimento, será claro ao técnico no assunto a partir de uma leitura desta divulgação que várias alterações na forma e detalhes podem ser feitas sem divergir do verdadeiro escopo da invenção. Por exemplo, todas as técnicas e aparelho descritos neste relatório podem ser usados em várias combinações. Deve ser entendido que os exemplos e formas de realização descritos neste relatório são apenas para propósitos ilustrativos e que várias modificações ou alterações à luz do mesmo serão sugeridas aos técnicos no assunto e devem ser incluídas no espírito e âmbito deste pedido e escopo das reivindicações anexas.
INCORPORAÇÃO À TÍTULO DE REFERÊNCIA
[0193] Todas as publicações, patentes, pedidos de patente e/ou outros documentos citados neste pedido são integralmente incorporados à título de referência para todos os propósitos na mesma medida como se cada publicação, patente, pedido de patente e/ou outro documento individual fosse individualmente indicado para ser incorporado à título de referência para todos os propósitos.

Claims (39)

REIVINDICAÇÕES
1. Vetor para otimizar a expressão da proteína, CARACTERIZADO pelo fato de que compreende uma sequência de ácidos nucleicos que codifica uma proteína de interesse tendo um sítio de aminoácido não naturalmente codificado especificamente incorporado e uma sequência de ácidos nucleicos que codifica um ou mais componentes, em que um ou mais componentes são selecionados a partir da SEQ. ID. NOs.: 12, 15 ou 17.
2. Vetor, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que um ou mais componentes são uma proteína ou fator auxiliar ou um elemento genético.
3. Vetor, de acordo com a reivindicação 2, CARACTERIZADO pelo fato de que a proteína ou fator auxiliar é uma chaperona.
4. Vetor, de acordo com a reivindicação 2, CARACTERIZADO pelo fato de que o elemento genético é o loco de partição B (parB).
5. Vetor, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que compreende adicionalmente uma variante de extensão C-terminal de cadeia pesada de anticorpo.
6. Vetor, de acordo com a reivindicação 5, CARACTERIZADO pelo fato de que a variante de extensão C-terminal de cadeia pesada compreende um ou mais aminoácidos.
7. Vetor, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que o parB está posicionado em uma orientação de transcrição direta entre os sítios Afe1 e Not1 da sequência de ácidos nucleicos que codifica a proteína de interesse.
8. Vetor, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que o parB está posicionado em uma orientação de transcrição direta nos sítios Afe1 ou Zra1 da sequência de ácidos nucleicos que codifica a proteína de interesse.
9. Vetor, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que o parB está posicionado em uma orientação de transcrição reversa nos sítios Afe1 ou Zra1 da sequência de ácidos nucleicos que codifica a proteína de interesse.
10. Vetor, de acordo com a reivindicação 3, CARACTERIZADO pelo fato de que a chaperona é Skp ou FkpA.
11. Vetor, de acordo com a reivindicação 3, CARACTERIZADO pelo fato de que a chaperona é Skp e FkpA.
12. Vetor, de acordo com a reivindicação 10 ou 11, CARACTERIZADO pelo fato de que compreendendo adicionalmente o loco de partição B (parB).
13.Vetor, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que a proteína de interesse é selecionada a partir de um produto bioterapêutico, imunógeno, anticorpo, fragmento de anticorpo ou variantes dos mesmos.
14. Vetor, de acordo com a reivindicação 13, CARACTERIZADO pelo fato de que o produto bioterapêutico é uma vacina.
15. Vetor, de acordo com a reivindicação 13, CARACTERIZADO pelo fato de que a proteína de interesse é uma citocina, quimiocina, fator de crescimento, receptor do fator de crescimento, interferon, interleucina, molécula inflamatória, produto de oncogene, hormônio peptídico, molécula de transdução de sinal ou receptor do hormônio esteroide.
16. Vetor, de acordo com a reivindicação 13, CARACTERIZADO pelo fato de que a proteína de interesse é HER2, CD-70, PSMA, 5T4, EGFR, TROP2, CD3, IL-2, IL-3, IL-10, IL-12, IL-15, IL-21, GPC3, DLL3, ROR1, leptina, grelina, FGF-1, FGF-19, FGF-21, FGF-23, HGH, FcR, insulina, IGF1, TNFR1, TRAIL, EPO e análogos, biespecíficos ou fragmentos dos mesmos.
17. Vetor, de acordo com a reivindicação 13, CARACTERIZADO pelo fato de que o fragmento de anticorpo é fragmento Fab, Fab’, F(ab’)2, Fv, fragmentos de anticorpos de cadeia única (scFv), scFv estabilizado por dissulfeto (dsFv)), diacorpo
(Db), BiTE (Ligador de células T biespecífico), DART (Redirecionamento de Dupla Afinidade) ou Diacorpo em Tandem (TandAb).
18. Vetor, de acordo com a reivindicação 17, CARACTERIZADO pelo fato de que o fragmento de anticorpo é Fab.
19. Vetor, de acordo com a reivindicação 13, CARACTERIZADO pelo fato de que o fragmento de anticorpo é Fab anti-CD3.
20. Célula recombinante, CARACTERIZADA pelo fato de que compreende uma sequência de ácidos nucleicos que codifica uma proteína de interesse tendo um sítio de aminoácido não naturalmente codificado especificamente incorporado e uma sequência de ácidos nucleicos que codifica um ou mais componentes, em que um ou mais componentes são selecionados a partir da SEQ. ID. NOs.: 12, 15 ou 17.
21. Célula recombinante, de acordo com a reivindicação 20, CARACTERIZADA pelo fato de que a célula é a cepa 2797, 2835, 2884, 2885, 2886, 2887, 2909, 2910, 2914, 2915, 2916, 2917, 2918, 2839, 2840, 2841, 3004, 3005 ou 3006.
22. Célula recombinante, de acordo com a reivindicação 20, CARACTERIZADA pelo fato de que a célula compreende a chaperona Skp e o loco de partição B (parB).
23. Célula recombinante, de acordo com a reivindicação 22, CARACTERIZADA pelo fato de que a célula é selecionada a partir da cepa 2910 ou
2841.
24. Célula recombinante, de acordo com a reivindicação 20, CARACTERIZADA pelo fato de que a célula compreende a chaperona FkpA e o loco de partição B (parB).
25. Célula recombinante, de acordo com a reivindicação 24, CARACTERIZADA pelo fato de que a célula é selecionada a partir da cepa 2909, 2840, 3004, 3005 ou 3006.
26. Célula recombinante, de acordo com a reivindicação 20, CARACTERIZADA pelo fato de que a célula compreende uma variante de extensão C-terminal de cadeia pesada de anticorpo.
27. Célula recombinante, de acordo com a reivindicação 26, CARACTERIZADA pelo fato de que a célula é selecionada a partir da cepa 2914, 2915, 2916, 2917 ou 2918.
28. Plasmídeo de expressão, de acordo com qualquer uma das reivindicações precedentes, CARACTERIZADO pelo fato de que o plasmídeo é p56, p94, p96, p117, p118, p119, p120, p134, p135, p141, p142, p143, p144, p145, p199, p200 ou p201.
29. Método para produzir uma proteína recombinante de interesse que incorpora um aminoácido não naturalmente codificado, CARACTERIZADO pelo fato de que o método compreende expressar a proteína em uma célula bacteriana e introduzir uma sequência de ácidos nucleicos que codifica um ou mais componentes, em que um ou mais componentes são selecionados a partir da SEQ.
ID. NOs.: 12, 15 ou 17.
30. Método, de acordo com a reivindicação 29, CARACTERIZADO pelo fato de que é para aperfeiçoar o rendimento de uma proteína tendo um sítio de aminoácido não natural especificamente incorporado.
31. Método, de acordo com a reivindicação 30, CARACTERIZADO pelo fato de que o aminoácido não natural é O-metil-L-tirosina, L-3-(2-naftil)alanina, 3-metil- fenilalanina, O-4-alil-L-tirosina, 4-propil-L-tirosina, p-propargilóxi-L-fenilalanina, tri-O- acetil-GlcNAcβ-serina, L-Dopa, uma fenilalanina fluorada, isopropil-L-fenilalanina, p- azido-L-fenilalanina, p-acil-L-fenilalanina, p-benzoil-L-fenilalanina, L-fosfosserina, fosfonosserina, fosfonotirosina, p-iodo-fenilalanina, p-bromofenilalanina, p-amino-L- fenilalanina, isopropil-L-fenilalanina, para-acetil fenilalanina, p-nitrofenilalanina, p- sulfotirosina, p-carboxifenilalanina, o-nitrofenilalanina, m-nitrofenilalanina, p-boronil fenilalanina, o-boronilfenilalanina, m-boronilfenilalanina, p-aminofenilalanina, o- aminofenilalanina, m-aminofenilalanina, p-acilfenilalanina, o-acilfenilalanina, m- acilfenilalanina, p-OMe fenilalanina, o-OMe fenilalanina, m-OMe fenilalanina, p- sulfofenilalanina, o-sulfofenilalanina, m-sulfofenilalanina, 5-nitro His, 3-nitro Tyr, 2- nitro Tyr, Leu nitro substituído, His nitro substituído, De nitro substituído, Trp nitro substituído, 2-nitro Trp, 4-nitro Trp, 5-nitro Trp, 6-nitro Trp, 7-nitro Trp, 3- aminotirosina, 2-aminotirosina, O-sulfotirosina, 2-sulfo-óxifenilalanina, 3-sulfo- óxifenilalanina, o-carboxifenilalanina, m-carboxifenilalanina, p-acetil-L-fenilalanina, p- propargil-fenilalanina, O-metil-L-tirosina, L-3-(2-naftil)alanina, uma 3-metil- fenilalanina, O-4-alil-L-tirosina, 4-propil-L-tirosina, tri-O-acetil-GlcNAcβ-serina, L- Dopa, fenilalanina fluorada, isopropil-L-fenilalanina, p-azido-L-fenilalanina, p-acil-L- fenilalanina, p-benzoil-L-fenilalanina, L-fosfosserina, fosfonosserina, fosfonotirosina, p-iodo-fenilalanina, p-bromofenilalanina, p-amino-L-fenilalanina, isopropil-L- fenilalanina ou p-propargilóxi-fenilalanina.
32. Método, de acordo com a reivindicação 31, CARACTERIZADO pelo fato de que o aminoácido não natural é para-acetil fenilalanina.
33. Célula ou linhagem celular, CARACTERIZADA pelo fato de que é isolada, de acordo com reivindicação 29.
34. Célula ou linhagem celular isolada, de acordo com a reivindicação 33, CARACTERIZADA pelo fato de que é para produzir uma proteína ou polipeptídeo contendo aminoácido não natural.
35. Célula ou linhagem celular isolada, de acordo com a reivindicação 29, CARACTERIZADA pelo fato de que o rendimento da proteína contendo aminoácido não natural é de pelo menos 0,25 vez ou maior na presença de uma ou mais chaperonas e loco parB.
36. Célula ou linhagem celular isolada, de acordo com a reivindicação 35, CARACTERIZADA pelo fato de que o loco parB está posicionado em uma orientação de transcrição reversa no sítio Afe1 da sequência de ácidos nucleicos que codifica a proteína de interesse.
37. Célula ou linhagem celular isolada, de acordo com a reivindicação 35, CARACTERIZADA pelo fato de que é para otimizar a retenção de plasmídeo em uma célula ou linhagem celular de produção.
38. Vetor, de acordo com a reivindicação 17, CARACTERIZADO pelo fato de que o anticorpo é um anticorpo de comprimento total.
39. Vetor, de acordo com a reivindicação 38, CARACTERIZADO pelo fato de que o anticorpo de comprimento total é um anticorpo IgG 1, IgG2, IgG3 ou IgG4.
BR112020022288-7A 2018-05-01 2019-05-01 método para otimizar a expressão de anticorpos BR112020022288A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862665093P 2018-05-01 2018-05-01
US62/665,093 2018-05-01
PCT/US2019/030295 WO2019213331A1 (en) 2018-05-01 2019-05-01 A method for optimizing antibody expression

Publications (1)

Publication Number Publication Date
BR112020022288A2 true BR112020022288A2 (pt) 2021-02-23

Family

ID=66776873

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020022288-7A BR112020022288A2 (pt) 2018-05-01 2019-05-01 método para otimizar a expressão de anticorpos

Country Status (11)

Country Link
US (1) US20210108213A1 (pt)
EP (1) EP3788149A1 (pt)
JP (1) JP2021522785A (pt)
KR (1) KR20210005172A (pt)
CN (1) CN112313336A (pt)
AU (1) AU2019263303A1 (pt)
BR (1) BR112020022288A2 (pt)
CA (1) CA3098910A1 (pt)
MX (1) MX2020011529A (pt)
SG (1) SG11202010439VA (pt)
WO (1) WO2019213331A1 (pt)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020232247A1 (en) 2019-05-14 2020-11-19 Provention Bio, Inc. Methods and compositions for preventing type 1 diabetes
CN111304234A (zh) * 2020-02-27 2020-06-19 江南大学 一种适用于枯草芽孢杆菌的非天然氨基酸利用工具
JP2023544143A (ja) * 2020-09-29 2023-10-20 イノベント バイオロジクス(シンガポール)プライベート リミティド 抗クローディン18.2および抗cd3二重特異性抗体およびその使用
CN113699124B (zh) * 2021-09-08 2022-04-12 北京大学 一种含非天然氨基酸蛋白的制备方法
CN113862239B (zh) * 2021-09-09 2023-06-30 山西中医药大学 一种核酸酶活性提高的蒙古黄芪病程相关蛋白突变体及其应用

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK410783D0 (da) * 1982-09-16 1983-09-09 Benzon A Salfred Fremgangsmade til stabilisering af plasmider
US4870008A (en) 1983-08-12 1989-09-26 Chiron Corporation Secretory expression in eukaryotes
HU206897B (en) 1985-10-25 1993-01-28 Zymogenetics Inc Process for utilizing bar-1 gen for selecting strange proteins
EP0742832A1 (en) * 1994-02-03 1996-11-20 Center For Innovative Technology High expression nucleic acid vectors
US5639635A (en) 1994-11-03 1997-06-17 Genentech, Inc. Process for bacterial production of polypeptides
US6083715A (en) 1997-06-09 2000-07-04 Board Of Regents, The University Of Texas System Methods for producing heterologous disulfide bond-containing polypeptides in bacterial cells
JP2000083670A (ja) 1998-09-09 2000-03-28 Hsp Kenkyusho:Kk DsbA/DsbB/DsbC/DsbD発現プラスミド
MXPA03009563A (es) 2001-04-19 2004-12-06 Scripps Research Inst Incorporacion in vivo de aminoacidos no naturales.
US6536736B2 (en) 2001-07-16 2003-03-25 Agilent Technologies, Inc. Optomechanical mount for precisely steering/positioning a light beam
US7429593B2 (en) 2001-09-14 2008-09-30 Shionogi & Co., Ltd. Utilities of amide compounds
WO2004009459A1 (en) 2002-07-23 2004-01-29 Yong-Seok Jeong Beverage can
KR20050073559A (ko) 2002-10-16 2005-07-14 더 스크립스 리서치 인스티튜트 당단백질 합성
AU2003300389B2 (en) 2002-12-22 2009-10-08 The Scripps Research Institute Protein arrays
ATE542894T1 (de) 2003-04-17 2012-02-15 Scripps Research Inst Ausweitung des eukaryotischen genetischen codes
ATE386133T1 (de) 2003-07-07 2008-03-15 Scripps Research Inst Zusammensetzungen der orthogonalen lysyl-trna und aminoacyl-trna synthetase paaren und ihre verwendungen
US7527943B2 (en) 2003-07-07 2009-05-05 The Scripps Research Institute Compositions of orthogonal glutamyl-tRNA and aminoacyl-tRNA synthetase pairs and uses thereof
US20060160175A1 (en) 2003-07-07 2006-07-20 The Scripps Research Institute Compositions of orthogonal leucyl-trna and aminoacyl-trna synthetase pairs and uses thereof
BRPI0507169A (pt) 2004-02-02 2007-06-26 Ambrx Inc polipeptìdeos do hormÈnio de crescimento humano modificados e seu usos
JP2008503217A (ja) * 2004-06-18 2008-02-07 アンブレツクス・インコーポレイテツド 新規抗原結合ポリペプチド及びそれらの使用
CA2882445A1 (en) * 2005-12-14 2007-06-21 Ambrx, Inc. Compositions containing, methods involving, and uses of non-natural amino acids and polypeptides
BRPI0819092A2 (pt) * 2007-11-02 2014-10-14 Scripps Research Inst Evolução direcionada usando proteínas que compreendem aminoácidos não naturais.
EP3225248B1 (en) 2008-07-23 2023-06-07 Ambrx, Inc. Modified bovine g-csf polypeptides and their uses
CA2826142A1 (en) * 2011-02-03 2012-08-09 Xoma Technology Ltd. Methods and materials for enhancing functional protein expression in bacteria
GB201208367D0 (en) * 2012-05-14 2012-06-27 Ucb Pharma Sa Biological product
SG11201605093VA (en) * 2013-12-23 2016-07-28 Zymeworks Inc Antibodies comprising c-terminal light chain polypeptide extensions and conjugates and methods of use thereof
GB201419109D0 (en) * 2014-10-27 2014-12-10 Medical Res Council Incorporation of unnatural amino acids into proteins

Also Published As

Publication number Publication date
SG11202010439VA (en) 2020-11-27
US20210108213A1 (en) 2021-04-15
EP3788149A1 (en) 2021-03-10
AU2019263303A1 (en) 2020-12-24
CA3098910A1 (en) 2019-11-07
WO2019213331A1 (en) 2019-11-07
MX2020011529A (es) 2021-01-29
CN112313336A (zh) 2021-02-02
KR20210005172A (ko) 2021-01-13
JP2021522785A (ja) 2021-09-02

Similar Documents

Publication Publication Date Title
BR112020022288A2 (pt) método para otimizar a expressão de anticorpos
DK1490483T3 (en) In vivo incorporation of unnatural amino acids
JP5932117B2 (ja) 脊椎動物細胞内におけるサプレッサーtrnaの転写
JP2010502221A (ja) 脊椎動物細胞による非天然アミノ酸の部位特異的組み込み
CN101541955B (zh) 用于脊椎动物细胞的杂合抑制tRNA
AU2008200780B2 (en) In vivo incorporation of unnatural amino acids

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]