BR112021005634A2 - métodos de purificação de proteína - Google Patents

métodos de purificação de proteína Download PDF

Info

Publication number
BR112021005634A2
BR112021005634A2 BR112021005634-3A BR112021005634A BR112021005634A2 BR 112021005634 A2 BR112021005634 A2 BR 112021005634A2 BR 112021005634 A BR112021005634 A BR 112021005634A BR 112021005634 A2 BR112021005634 A2 BR 112021005634A2
Authority
BR
Brazil
Prior art keywords
gene product
gene
expression
host cell
seq
Prior art date
Application number
BR112021005634-3A
Other languages
English (en)
Inventor
Melissa Patterson
Sean McClain
Jia Liu
Original Assignee
Absci, Llc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Absci, Llc filed Critical Absci, Llc
Publication of BR112021005634A2 publication Critical patent/BR112021005634A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/14Extraction; Separation; Purification
    • C07K1/145Extraction; Separation; Purification by extraction or solubilisation
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/14Extraction; Separation; Purification
    • C07K1/16Extraction; Separation; Purification by chromatography
    • C07K1/22Affinity chromatography or related techniques based upon selective absorption processes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • C07K14/62Insulins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/485Exopeptidases (3.4.11-3.4.19)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/96Stabilising an enzyme by forming an adduct or a composition; Forming enzyme conjugates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/17Metallocarboxypeptidases (3.4.17)
    • C12Y304/17002Carboxypeptidase B (3.4.17.2)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Engineering & Computer Science (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Diabetes (AREA)
  • Endocrinology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

A presente invenção fornece métodos de purificação de proteínas, que são expressas na forma de complexos solubilizáveis que produzem proteínas apropriadamente dobradas e ativas quando solubilizadas. Outros aspectos da invenção referem-se aos polipeptídeos que podem ser utilizados na expressão e purificação de proteínas.

Description

Relatório Descritivo de Patente de Invenção para "MÉTODOS DE PURIFICAÇÃO DE PROTEÍNA".
REFERÊNCIA AOS PEDIDOS RELACIONADOS
[0001] Este pedido reivindica o benefício de prioridade do Pedido Provisório U.S. No. 62/735.861, depositado em 25 de setembro de 2018, cuja invenção integral é no presente documento incorporada por referência.
REFERÊNCIA À LISTAGEM DE SEQUÊNCIAS
[0002] Este pedido inclui uma listagem de sequência enviada eletronicamente, em um arquivo intitulado "AbSci-005PCT_ST25.txt", criado em 20 de setembro de 2019 e tendo um tamanho de 63 kilobytes (KB), que é no presente documento incorporada por referência.
CAMPO DE INVENÇÃO
[0003] A presente invenção está nos campos técnicos gerais de biologia molecular e fabricação biotecnológica. Mais particularmente, a presente invenção está no campo técnico da produção de proteínas recombinantes.
ANTECEDENTES DA INVENÇÃO
[0004] A expressão eficiente de proteínas recombinantes ou outros produtos gênicos requer o uso de um sistema, todos os vários aspectos do qual - construto(os) de expressão, cepa da célula hospedeira, condições de crescimento e métodos de purificação - trabalham juntos para produzir o produto desejado em quantidades suficientes, enquanto minimiza o gasto de materiais e tempo.
[0005] Muitos sistemas de expressão que são utilizados atualmente para a produção industrial de produtos recombinantes dependem de culturas de células de mamíferos caras ou utilizam a secreção de proteínas no periplasma de células bacterianas, que é mais limitada na quantidade de produto por célula e é mais demorada do que a expressão de produtos gênicos no citoplasma bacteriano. Em muitos sistemas de expressão desenvolvidos por outros, nos quais o citoplasma bacteriano é utilizado como o compartimento celular preferido para a expressão recombinante, é comum que as proteínas desejadas sejam produzidas como corpos de inclusão insolúveis (ver, por exemplo, Chung et al., "Recombinant production of biologically active giant grouper (Epinephelus lanceolatus) growth hormone from inclusion bodies of Escherichia coli by fed-batch culture", Protein Expr Purif 2015 Jun; 110: 79-88; doi: 10.1016/j.pep.2015.02.012; Epub 2015 Feb 19). Para recuperar algumas proteínas solúveis e corretamente dobradas de corpos de inclusão, foi necessário executar etapas adicionais de redobramento (Yamaguchi and Miyazaki, "Refolding techniques for recovering biologically active recombinant proteins from inclusion bodies", Biomolecules 2014 Feb 20; 4(1): 235-251; doi:
10.3390/biom4010235; Review). Para proteínas contendo ligações de dissulfeto, essas etapas de redobramento incluem tipicamente o uso de agentes redutores para converter em grupos tiol quaisquer ligações de dissulfeto formadas de forma inadequada, particularmente ligações de dissulfeto intermoleculares que podem estar contribuindo para a agregação da proteína em corpos de inclusão insolúveis.
[0006] Sistemas de expressão melhorados e métodos de seu uso para produzir produtos gênicos de maneira mais eficiente tais como proteínas recombinantes em uma forma apropriadamente dobrada e solúvel, e de uma maneira que seja capaz de atingir níveis de produção comerciais, são claramente necessários.
SUMARIO DA INVENÇÃO
[0007] A presente invenção fornece métodos de purificação de proteínas e outros produtos gênicos, expressos na forma de complexos solubilizáveis que produzem um produto gênico ativo e devidamente dobrado quando solubilizados, sem exigir o uso de um agente redutor. Uma vantagem da invenção é a capacidade de coletar os complexos solubilizáveis do produto gênico na forma de um pélete solubilizável, permitindo que os componentes indesejáveis do lisado da célula hospedeira sejam descartados no sobrenadante. Quando os complexos solubilizáveis de produto gênico estão presentes em um lisado de célula hospedeira, por exemplo, esta mistura pode ser considerada uma suspensão em que os complexos solubilizáveis podem ser sedimentados em um pélete por centrifugação ou outro meio, e separados de uma fração predominantemente líquida do lisado da célula hospedeira. Conforme utilizado nesta invenção, o termo "solução" abrange misturas que podem apresentar as propriedades de uma suspensão. Outros aspectos da invenção referem-se a pró- sequências de polipeptídeo que podem ser utilizadas na expressão e purificação de proteínas.
[0008] Um aspecto da invenção é um método para a produção de um ou mais produtos gênicos compreendendo: fornecer uma primeira solução que compreende pelo menos um produto gênico que foi expresso em uma célula hospedeira, em que pelo menos algum do referido pelo menos um produto gênico na primeira solução pode ser sedimentado por centrifugação (em condições de sal de NaCl 200 mM em pH 7,4 e 4 graus C) em uma força de: 900 x g, ou entre 900 x g e
7.000 x g, ou em 7.000 x g, para formar um pélete solubilizável; e colocar pelo menos algum do referido pelo menos um produto gênico em uma solução de solubilização. O método da invenção acima pode ser utilizado de acordo com qualquer aspecto do método da invenção, conforme expresso nos parágrafos a seguir, em qualquer combinação dos mesmos.
[0009] O método da invenção em que dito pelo menos um produto gênico é um polipeptídeo que forma pelo menos uma ligação de dissulfeto.
[0010] O método da invenção em que dito pelo menos um produto gênico é um polipeptídeo que carece de um peptídeo sinal.
[0011] O método da invenção em que o referido pelo menos um produto gênico compreende um polipeptídeo selecionado do grupo que consiste em (a) leptina, metreleptina, hormônio do crescimento, hormônio do crescimento humano, um polipeptídeo compreendendo a sequência de aminoácido de uma cadeia madura de insulina, e (b) um fragmento de qualquer um dos polipeptídeos de (a).
[0012] O método da invenção em que o referido pelo menos um produto gênico compreende um polipeptídeo compreendendo a sequência de aminoácido de uma cadeia de insulina madura e uma sequência de aminoácido selecionada do grupo que consiste em: (a) qualquer uma das SEQ ID NOs 12 a 14 e 37; e (b) uma sequência de aminoácido que compartilha pelo menos 70% (ou pelo menos 80%, ou pelo menos 90%) de identidade de sequência de aminoácido em pelo menos 50% (ou pelo menos 60%, ou pelo menos 70%, ou pelo menos 80%, ou pelo menos 90%) do comprimento de qualquer uma das sequências de aminoácido de (a).
[0013] O método da invenção em que dito pelo menos um produto gênico compreende um polipeptídeo compreendendo uma sequência de aminoácido selecionada do grupo que consiste em: (a) qualquer uma das SEQ ID NOs 27 a 36; e (b) uma sequência de aminoácido que compartilha pelo menos 70% (ou pelo menos 80%, ou pelo menos 90%) de identidade de sequência de aminoácido em pelo menos 50% (ou pelo menos 60%, ou pelo menos 70%, ou pelo menos 80%, ou pelo menos 90%) do comprimento de qualquer uma das sequências de aminoácido de (a).
[0014] O método da invenção em que pelo menos um produto gênico compreende um polipeptídeo compreendendo uma sequência de aminoácido Asp-Pro; e este método da invenção compreendendo ainda a clivagem do referido propeptídeo na sequência de aminoácido Asp-Pro.
[0015] O método da invenção em que a primeira solução é um lisado da referida célula hospedeira; e este método da invenção em que o lisado da referida célula hospedeira foi produzido através do contato da célula hospedeira com lisozima, ou em que o lisado da referida célula hospedeira foi produzido por lise mecânica.
[0016] O método da invenção em que a célula hospedeira é uma célula procariótica; e este método da invenção em que a célula hospedeira é uma célula de Escherichia coli.
[0017] O método da invenção em que a célula hospedeira foi modificada para ter um citoplasma mais oxidante; e este método da invenção em que a modificação em dita célula hospedeira resulta na expressão defeituosa de pelo menos um gene selecionado do grupo que consiste em trxB, gor, gshA e gshB; e este método da invenção em que a dita célula hospedeira ainda compreende uma mutação no gene ahpC.
[0018] O método da invenção em que a célula hospedeira compreende um ou mais construtos de expressão; e este método da invenção em que a referida pelo menos um construto de expressão compreende pelo menos um promotor induzível; e este método da invenção em que o dito pelo menos um promotor induzível é selecionado do grupo que consiste em um promotor induzível por arabinose, um promotor induzível por propionato, um promotor induzível por ramnose, um promotor induzível por xilose, um promotor induzível por lactose e um promotor induzível por depleção de fosfato, e/ou em que dita célula hospedeira possui um nível reduzido de função do gene de pelo menos um gene que codifica uma proteína que metaboliza o indutor de pelo menos um dos referidos pelo menos um promotor induzível; e este método da invenção em que o pelo menos um gene é selecionado do grupo que consiste em araA, araB, araD, prpB, prpD, rhaA, rhaB, rhaD, xylA e xylB.
[0019] O método da invenção que ainda compreende submeter a primeira solução à centrifugação; e este método da invenção em que a centrifugação está em uma força de: 900 x g, ou entre 900 x g e
25.000 x g, ou entre 900 x g e 7.000 x g, ou entre 2.000 x g e 20.000 x g, ou em 3.300 x g, ou entre 3.300 x g e 20.000 x g, ou em 7.000 x g, ou entre 7.000 x g e 20.000 x g; e este método da invenção em que a dita primeira solução é separada em uma fração solúvel e um pélete, em que o referido pélete compreende pelo menos algum do referido pelo menos um produto gênico; e este método da invenção ainda compreendendo a recuperação de pelo menos algum do referido pelo menos um produto gênico de dito pélete; e este método da invenção em que pelo menos algum do dito pelo menos um produto gênico presente no referido pélete é colocado em uma solução de solubilização.
[0020] O método da invenção em que dita solução de solubilização compreende pelo menos um agente caotrópico; e este método da invenção em que dito pelo menos um agente caotrópico é selecionado do grupo que consiste em n-butanol, etanol, cloreto de guanidínio, cloridrato de guanidina, perclorato de lítio, acetato de lítio, cloreto de magnésio, fenol, 2-propanol, dodecil sulfato de sódio, tiouréia e uréia; e este método da invenção em que o referido pelo menos um agente caotrópico é selecionado do grupo que consiste em uréia em uma concentração entre 2M e 10M e cloridrato de guanadina em uma concentração entre 2M e 8M, ou é uréia em uma concentração entre 7M e 8M.
[0021] O método da invenção que ainda compreende a redução da concentração do referido pelo menos um agente caotrópico na solução de solubilização; e este método da invenção em que a concentração do dito pelo menos um agente caotrópico na solução de solubilização é reduzida para 50% ou menos de sua concentração inicial na solução de solubilização e/ou em que a concentração inicial do dito pelo menos um agente caotrópico na solução de solubilização é a uréia em uma concentração entre 7M e 8M e a concentração de dito pelo menos um agente caotrópico é reduzida na uréia em uma concentração entre 3M e 4M; e este método da invenção em que a redução da concentração do referido pelo menos um agente caotrópico na solução de solubilização é executada por um método selecionado do grupo que consiste em diálise, diluição e diafiltração; e este método da invenção ainda compreendendo a incubação da solução de solubilização que compreende uma concentração reduzida do referido pelo menos um agente caotrópico durante um período de tempo selecionado do grupo que consiste em pelo menos uma hora, duas horas, cinco horas, 10 horas, 12 horas, 15 horas, entre 12 e 24 horas, 24 horas, entre 24 e 72 horas, 36 horas, 48 horas, 72 horas, entre 72 e 120 horas e 120 horas.
[0022] O método da invenção que ainda compreende a recuperação de pelo menos algum de dito pelo menos um produto gênico da referida solução de solubilização; e este método da invenção em que a quantidade do referido pelo menos um produto gênico recuperado da referida solução de solubilização é pelo menos 50%, ou pelo menos 60%, ou pelo menos 70%, ou pelo menos 80% da quantidade total de dito pelo menos um produto gênico presente na referida primeira solução e/ou em que pelo menos algum de dito pelo menos um produto gênico recuperado da referida solução de solubilização possui uma propriedade selecionada do grupo que consiste em ligações de dissulfeto apropriadamente formadas e atividade de produto gênico; e este método da invenção em que pelo menos 50%, ou pelo menos 60%, ou pelo menos 70%, ou pelo menos 80%, ou pelo menos 85%, ou pelo menos 90% do pelo menos um produto gênico recuperado de dita solução de solubilização possui ligações de dissulfeto apropriadamente formadas.
[0023] O método da invenção ainda compreendendo a purificação cromatográfica do referido pelo menos um produto gênico; e este método da invenção em que a purificação cromatográfica é a cromatografia de afinidade por íons metálicos imobilizados (IMAC); e este método da invenção em que a purificação cromatográfica utiliza uma coluna Ni-NTA.
[0024] O método da invenção em que dito pelo menos um produto gênico não é colocado em contato com um agente redutor.
[0025] Um outro aspecto da invenção é um polipeptídeo que compreende uma sequência de aminoácido selecionada do grupo que consiste em: (a) qualquer uma das SEQ ID NOs 12 a 14 e 27 a 36; e (b) uma sequência de aminoácido que compartilha pelo menos 70% (ou pelo menos 80%, ou pelo menos 90%) de identidade de sequência de aminoácido em pelo menos 50% (ou pelo menos 60%, ou pelo menos 70%, ou pelo menos 80%, ou pelo menos 90%) do comprimento de qualquer uma das sequências de aminoácido de (a).
BREVE DESCRIÇÃO DOS DESENHOS
[0026] A Figura 1 é um fluxograma que resume métodos para purificar complexos de produtos gênicos solubilizáveis produzidos pelos métodos da invenção.
[0027] A Figura 2 mostra que a pró-insulina CPBpro_lispro, expressa e solubilizada de acordo com os métodos da invenção, contém ligações de dissulfeto. A pró-insulina CPBpro_lispro solubilizada com uréia 8M foi analisada por eletroforese em gel de poliacrilamida em um gel de Bis-Tris a 12%. As células hospedeiras foram submetidas à lise em uma concentração cinco vezes ('5X') ou dez vezes ('10X') maior do que a da cultura de células hospedeiras. M: marcadores de peso molecular
Pista 1: Proteína total (5X) sem DTT (não reduzido) Pista 2: Proteína total (5X) + DTT (reduzido) Pista 3: pélete solubilizado (5X) sem DTT (não reduzido) Pista 4: pélete solubilizado (5X) + DTT (reduzido) Pista 5: pélete solubilizado (10X) sem DTT (não reduzido) Pista 6: pélete solubilizado (10X) + DTT (reduzido)
[0028] O tratamento da pró-insulina CPBpro_lispro solubilizada com o agente redutor DTT fez com que a pró-insulina CPBpro_lispro solubilizada migrasse em uma taxa ligeiramente mais lenta no gel, indicando que o tratamento com DTT reduziu as ligações de dissulfeto presentes na pró-insulina CPBpro_lispro solubilizada não reduzida. A Figura 2 também mostra que a peletização de complexos de pró- insulina CPBpro_lispro solubilizáveis permite que a maioria das proteínas potencialmente contaminantes presentes no lisado da célula hospedeira (Pistas 1 e 2) seja removida do pélete solubilizável, resultando em uma preparação significativamente purificada de pró- insulina CPBpro_lispro solubilizada (Pistas 3 a 6).
[0029] A Figura 3 é uma representação esquemática de um polipeptídeo de pró-insulina CPBpro_glargina. Os aminoácidos das cadeias A e B são mostrados como círculos cinza claro e cinza escuro, respectivamente. O propeptídeo CPBpro N-terminal é mostrado como uma linha tracejada; o peptídeo C (ou 'peptídeo de conexão') que conecta as cadeias A e B é mostrado como um arco cinza. As linhas sólidas cinza escuras entre os resíduos de cisteína nas cadeias A e B e conectando duas cisteínas na cadeia A representam as ligações de dissulfeto presentes na insulina glargina corretamente dobrada.
[0030] A Figura 4 é um diagrama esquemático que representa a digestão da pró-insulina CPBpro_glargina purificada com tripsina e com glutamil endopeptidase ('Glu-C') para gerar fragmentos de peptídeos reticulados para caracterização através da espectrometria de massa. As ligações de dissulfeto são representadas por linhas sólidas cinza escuras conectando resíduos de cisteína.
[0031] A Figura 5 é um conjunto de três cromatogramas de espectrometria de massa que mostra que 93% da pró-insulina CPBpro_glargina, purificada apenas através da solubilização de complexos solubilizáveis peletizados, possui a formação correta de ligações de dissulfeto e, portanto, está devidamente dobrada. Painel A: cromatograma de pico de base (não reduzido); Painel B: cromatograma de íon extraído (não reduzido, +/- 5 ppm) que mostra picos correspondentes ao fragmento de peptídeo com duas ligações de dissulfeto; Painel C: cromatograma de íon extraído (não reduzido, +/- 5 ppm) que mostra um pico correspondente ao fragmento de peptídeo com uma ligação dissulfeto. As setas indicam o pico correspondente ao fragmento de peptídeo indicado, conforme determinado através da comparação com o cromatograma produzido por um padrão de insulina glargina. A seta rotulada "forma trocada" indica um pico menor que corresponde à conformação em que as cisteínas nas posições A6 e A7 da insulina madura (ver a Figura 4) possuem parceiros de ligação dissulfeto "trocados". *: O asterisco marca um pico que não está no estado de carga correto para ser da pró-insulina CPBpro_glargina.
DESCRIÇÃO DETALHADA DA INVENÇÃO
[0032] O problema de produzir produtos gênicos tais como proteínas recombinantes em escala comercial e na forma ativa é abordado ao fornecer os métodos para expressão e purificação de proteínas no presente documento descritos. Nós descobrimos que produtos gênicos tais como polipeptídeos, quando expressos em células hospedeiras para densidade de produto gênico suficiente e de uma maneira que permite que o produto gênico seja devidamente dobrado quando expresso, e tenha quaisquer ligações de dissulfeto devidamente formadas, formarão complexos solubilizáveis que são facilmente purificados de outros componentes celulares e, em seguida, solubilizados para produzir um produto gênico apropriadamente dobrado e presumivelmente ativo. Estes métodos da invenção, direcionados à produção de produto gênico na forma de tais complexos solubilizáveis e à purificação subsequente do produto gênico adequadamente dobrado, possuem a vantagem de não exigir um procedimento envolvendo o contato do produto gênico com um agente redutor.
[0033] Como outro aspecto da invenção, métodos são fornecidos para a solubilização direta de polipeptídeos produzidos por células hospedeiras na forma de complexos solubilizáveis, sem uma etapa inicial de centrifugação para separar as frações insolúveis e solúveis após a lise celular e que leva em conta a purificação de polipeptídeos dobrados e/ou ativos que formam ligações de dissulfeto sem a necessidade de colocar em contato tais polipeptídeos com um agente redutor.
[0034] O dobramento apropriado de um produto gênico, tal como um produto gênico que compreende um ou mais polipeptídeos, é consistente com quaisquer ligações de dissulfeto nesse produto gênico sendo formadas no local apropriado dentro desse produto gênico. Portanto, determinar se um produto gênico está devidamente dobrado pode envolver a caracterização de quaisquer ligações de dissulfeto presentes no produto gênico, conforme descrito posteriormente nos Exemplos 2C e 8, para avaliar se essas ligações de dissulfeto são formadas corretamente. Uma ligação dissulfeto adequadamente formada é aquela que, quando testada, é uma ligação covalente que une dois átomos de enxofre e que, quando presente dentro de um polipeptídeo ou entre dois polipeptídeos, é uma ligação covalente que liga (ou conecta) os átomos de enxofre de dois resíduos de aminoácido contendo enxofre (tais como resíduos de cisteína ou Cys) que estão ligados por uma ligação de dissulfeto na forma desejada do produto gênico compreendendo os polipeptídeos. Por exemplo, para a pró-insulina glargina como mostrado na Figura 3, as três ligações de dissulfeto adequadamente formadas são aquelas que conectam os resíduos Cys nas posições 6 e 11 da SEQ ID NO: 6, na posição 7 da SEQ ID NO: 6 e posição 7 da SEQ ID NO: 7 e na posição 20 da SEQ ID NO: 6 e posição 19 da SEQ ID NO: 7.
[0035] Os produtos gênicos ativos incluem quaisquer produtos gênicos com atividade mensurável do tipo associado à forma desejada do produto gênico. Por exemplo, um produto gênico da insulina ativa pode ter atividade mensurável de ligação ao receptor de insulina, ou atividade de ligação do anticorpo anti-insulina mensurável, ou qualquer outro tipo de atividade associada com a forma desejada do produto gênico da insulina.
[0036] A recuperação de formas apropriadamente dobradas e/ou ativas de proteínas de corpos de inclusão tipicamente inclui o tratamento com pelo menos um agente redutor. O termo 'agente redutor', tal como no presente documento utilizado, inclui substâncias químicas (não proteínas) com potenciais de redução que são mais negativos do que -0,26 V no pH 7,0 e 25 graus C, tal como DTE (ditioeritritol), DTT (ditiotreitol) e TCEP (tris(2-carboxietil)-fosfina); o termo 'agente redutor', portanto, não inclui L-cisteína ('L-cys') ou glutationa. Ao contrário da recuperação do produto gênico de corpos de inclusão, os métodos de solubilização no presente documento divulgados - que não envolvem o uso de agentes redutores - resultam em uma recuperação substancialmente maior do produto gênico, por exemplo, recuperação de pelo menos 50%, 60%, 70% ou 80% do material do produto gênico total presente no lisado da célula hospedeira, conforme calculado pelos métodos descritos no Exemplo
7. Dados os altos rendimentos do produto gênico (5 a 20 g/L) alcançados no lisado celular, os métodos de solubilização no presente documento descritos (como nos Exemplos 1 a 3), podem resultar em rendimentos de 4 a 16 g/L de produto gênico.
[0037] Para que a célula hospedeira produza produtos gênicos na forma de complexos solubilizáveis, é mais vantajoso utilizar uma combinação adequada dos seguintes aspectos I a IV da expressão do produto gênico, conforme descrito no presente documento com detalhes:
[0038] I. Os produtos gênicos a serem produzidos, incluindo quaisquer veículos, cofatores, chaperonas e/ou marcadores ou propeptídeos a serem utilizados na expressão dos produtos gênicos desejados.
[0039] II. Os construtos de expressão a serem utilizados para a expressão dos produtos gênicos.
[0040] III. As células hospedeiras a serem utilizadas para expressar os construtos de expressão que codificam os produtos gênicos.
[0041] IV. As condições para o crescimento da célula hospedeira e a indução da expressão.
[0042] A seção V descreve os métodos de solubilização e purificação da invenção.
[0043] As seguintes publicações e pedidos de patente, todos expressamente incorporados por referência nesta invenção, fornecem exemplos adicionais de produtos gênicos, construtos de expressão, células hospedeiras e condições de crescimento e indução que podem ser empregadas na produção de complexos solubilizáveis adequados para os métodos de purificação da invenção: US9617335B2, "Inducible Coexpression System"; WO2016205570A1, "Vectors for Use in an Inducible Coexpression System"; e Pedido Internacional
PCT/US2016/067064, "Cytoplasmic Expression System". I. Produtos Produzidos pelos Métodos da Invenção
[0044] Existe uma grande versatilidade na utilização da expressão gênica e métodos de purificação de produtos gênicos da presente invenção em numerosas aplicações de expressão e nas propriedades dos produtos.
[0045] Os produtos gênicos produzidos pelos métodos da invenção podem compreender qualquer um, ou mais do que um, dos seguintes: 1-antitripsina; 2C4; activina; addressinas; fosfatase alcalina; anti- CD11a; anti-CD18; anti-CD20; fatores anticoagulantes tais como Proteína C; anticorpo anti-HER-2; anti-IgE; anti-IgG; anti-VEGF; anticorpos e fragmentos de anticorpos; anticorpos para domínios ErbB2 tais como 2C4 (WO 01/00245 hibridoma ATCC HB-12697), que se liga a uma região no domínio extracelular de ErbB2 (por exemplo, qualquer um ou mais resíduos na região de cerca do resíduo 22 a cerca do resíduo 584 de ErbB2, inclusivo); ligando Apo2 (Apo2L); fator natriurético atrial; BDNF; beta-lactamase; bombesina; proteína morfogenética óssea (BMP); toxina botulínica; IGF-I cerebral; calcitonina; cardiotrofinas (fator de hipertrofia cardíaca) tais como cardiotrofina-1 (CT-1); proteínas CD tais como CD-3, CD-4, CD-8 e CD-19; fatores de coagulação tais como fator VIIIC, fator IX, fator tecidual e fator de von Willebrands; fatores estimulantes de colônias (CSFs), por exemplo, M-CSF, GM-CSF e G-CSF; citocinas; fator de aceleração de decaimento; des(1-3)-IGF-I (IGF-I cerebral); DNase; encefalinase; fator de crescimento epidérmico (EGF); eritropoietina; fator de crescimento de fibroblastos tal como aFGF e bFGF; hormônio estimulante folicular; glucagon; gp120; grelina; hormônio do crescimento, incluindo hormônio do crescimento humano ou hormônio do crescimento bovino; fator de liberação do hormônio de crescimento; fator de crescimento hemopoiético; receptores homing; HSA; IGF-I;
IGF-II; imunotoxinas; inibina; cadeias de insulina (cadeia A da insulina, cadeia B da insulina) ou pró-insulina; proteínas de ligação ao fator de crescimento semelhante à insulina; fator de crescimento semelhante à insulina-I e -II (IGF-I e IGF-II); integrina; interferon tal como interferon- alfa, -beta e -gama; interleucinas (ILs), por exemplo, IL-1 a IL-10; leptina; lipoproteínas; tensoativo pulmonar; hormônio luteinizante; metreleptina; peptídeo associado à gonadotropina de camundongo; substância inibidora de mulleriano; fator de crescimento do nervo (NGF); fator neurotrófico tal como fator neurotrófico derivado do cérebro (BDNF), neurotrofina-3, -4, -5 ou -6 (NT-3, NT-4, NT-5 ou NT- 6); fatores osteoindutivos; hormônio da paratireóide; ativador do plasminogênio, tal como urocinase ou urina humana ou ativador do plasminogênio tipo tecidual (t-PA); fator de crescimento derivado de plaquetas (PDGF); prorelaxin; proteína A ou D; receptores para hormônios ou fatores de crescimento; proteínas reguladoras; cadeia A de relaxina; cadeia B de relaxina; renina; fatores reumatóides; albumina de soro, tal como albumina de soro humano (HSA) ou albumina de soro bovino (BSA); superóxido dismutase; proteínas da membrana superficial; receptores de células T; TGF-beta; trombina; trombopoietina; hormônio estimulador da tireóide; fator de transformação do crescimento (TGF) tal como TGF-alfa e TGF-beta, incluindo TGF-1, TGF-2, TGF-3, TGF-4 ou TGF-5; proteínas de transporte; fator de necrose tumoral alfa e beta; urocinase; fator de crescimento endotelial vascular (VEGF); antígenos virais tais como, por exemplo, uma parte do envoltório da AIDS; fragmentos de qualquer um dos acima; e qualquer um dos acima ou um fragmento dos mesmos covalentemente ligados a uma ou mais das proteínas acima ou fragmentos das mesmas ou domínios funcionais tais como: um domínio Fc de anticorpo, um fragmento variável de cadeia única de anticorpo (scFv), um domínio com atividade enzimática (tal como um domínio de glicosídeo hidrolase ou um domínio de cinase), um domínio EVH1 (homologia Ena/Vasp ou WH1), um domínio PAS (Per- Arnt-Sim), um domínio PDZ, um domínio POU (Pit-1, Oct, Unc-86), um domínio SPR (Spread, Sprouty), um domínio VWFC (fator de Von Willebrand, tipo C ou VWC) ou um domínio dedo de zinco (por exemplo, um domínio dedo RING).
[0046] Os produtos gênicos produzidos pelos métodos da invenção podem incluir qualquer um, ou mais de um, dos seguintes polipeptídeos de insulina. Um polipeptídeo de insulina produzido pelos métodos da invenção compreende em algumas modalidades a sequência de aminoácido de uma cadeia A madura ou de uma cadeia B madura da insulina, e em outras modalidades compreende uma cadeia A madura e uma cadeia B madura. Um polipeptídeo de pró- insulina compreende uma cadeia A de insulina madura e uma cadeia B de insulina madura. Cadeias polipeptídicas de insulina em certas modalidades compreendem uma ou mais de qualquer uma das sequências de aminoácido de ocorrência natural de insulinas, ou fragmentos das mesmas, e em outras modalidades compreendem uma ou mais sequências de aminoácido análogas de insulina, ou fragmentos das mesmas, e em outras modalidades compreendem combinações de sequências de aminoácido de insulina de ocorrência natural e/ou sequências de aminoácido análogas de insulina. Exemplos de sequências de aminoácido de insulina de ocorrência natural e sequências de aminoácido análogas de insulina são mostrados na Tabela 1. Tabela 1. Sequências de Aminoácido da Cadeia de Insulina A: cadeia A madura; B: cadeia B madura; Sublinhado: diferenças da insulina humana nativa; *: resíduo modificado Nome: Descrição Sequência: Insulina Insulina humana nativa A: GIVEQCCTSICSLYQLENYCN (SEQ ID NO: 1) (regular) B: FVNQHLCGSHLVEALYLVCGERGFFYTPKT (SEQ ID NO: 2)
Nome: Descrição Sequência: Insulina de Insuliina Neutral A: GIVEQCCTSICSLYQLENYCN (SEQ ID NO: 1) isofano protamine Hagedorn; B: FVNQHLCGSHLVEALYLVCGERGFFYTPKT (SEQ ID NO: 2) formulada para ser de atuação intermediária Insulina Análogo de insulina, A: GIVEQCCTSICSLYQLENYCN (SEQ ID NO: 1) lispro atuação rápida B: FVNQHLCGSHLVEALYLVCGERGFFYTKPT (SEQ ID NO: 3) Insulina Análogo de insulina, A: GIVEQCCTSICSLYQLENYCN (SEQ ID NO: 1) aspártica atuação duradoura B: FVNQHLCGSHLVEALYLVCGERGFFYTDKT (SEQ ID NO: 4) Insulina Análogo de insulina, A: GIVEQCCTSICSLYQLENYCN (SEQ ID NO: 1) glulisina atuação rápida B: FVKQHLCGSHLVEALYLVCGERGFFYTPET (SEQ ID NO: 5) Insulina Análogo de insulina, A: GIVEQCCTSICSLYQLENYCG (SEQ ID NO: 6) glargina liberação lenta, longa B: FVNQHLCGSHLVEALYLVCGERGFFYTPKTRR (SEQ ID NO: atuação 7) Insulina Análogo de insulina, A: GIVEQCCTSICSLYQLENYCN (SEQ ID NO: 1) degludeca longa atuação B: FVNQHLCGSHLVEALYLVCGERGFFYTPK* (SEQ ID NO: 8) Insulina Análogo de insulina, A: GIVEQCCTSICSLYQLENYCN (SEQ ID NO: 1) detemir longa atuação B: FVNQHLCGSHLVEALYLVCGERGFFYTPK* (SEQ ID NO: 9)
[0047] Os polipeptídeos de pré-pró-insulina podem compreender os seguintes componentes, de preferência na seguinte ordem N- terminal para C-terminal: um pré-peptídeo, que pode ser um peptídeo de sinal que é extraído por clivagem durante a expressão da proteína pela peptidase de sinal da célula hospedeira; um propeptídeo; a cadeia B; um peptídeo C (ou 'peptídeo de ligação'); e a cadeia A. Os polipeptídeos de pré-pró-insulina também podem compreender as cadeias A e B em uma ordem diferente do N-terminal para o C- terminal, por exemplo: um pré-peptídeo; um propeptídeo; a cadeia A; um peptídeo C; e a cadeia B. Para polipeptídeos de pró-insulina que devem ser expressos no citoplasma de células hospedeiras, um pré- peptídeo compreendendo uma sequência de sinal não está presente. Um diagrama de um polipeptídeo de pró-insulina glargina é mostrado na Figura 3. Exemplos de peptídeos C incluem o peptídeo C da insulina humana (aminoácidos 55 a 89 da Sequência de Referência
NCBI NP_001278826.1, SEQ ID NO: 10), e um peptídeo C artificial RRYPGDVKR (SEQ ID NO: 11) (Chang et al., "Human insulin production from a novel mini-proinsulin which has high receptor-binding activity", Biochem J 1998 Feb 1; 329 (Pt 3): 631-635). As sequências de aminoácido do peptídeo C adicionais que podem ser utilizadas em polipeptídeos de pró-insulina são variantes artificiais do peptídeo C humano (SEQ ID NOs 12 e 13) e um peptídeo C artificial RRDDNLER (SEQ ID NO: 14). As sequências de aminoácido do peptídeo C são geralmente apresentadas nesta invenção como incluindo os resíduos de arginina e lisina terminais que são tipicamente clivados quando o polipeptídeo de pró-insulina é convertido em insulina madura através de um processo de digestão tríptica. Uma exceção é o peptídeo C da pró-insulina glargina como mostrado na Figura 3: visto que a cadeia B madura da insulina glargina possui dois resíduos de arginina (R), esses resíduos de arginina são descritos na Figura 3 como sendo parte da cadeia B madura da insulina glargina em vez de como parte do peptídeo C.
[0048] Os produtos gênicos produzidos pelos métodos da invenção podem incluir polipeptídeos de leptina e/ou metreleptina. Um exemplo de um polipeptídeo de leptina, também denominado metreleptina, é mostrado na SEQ ID NO: 15 e corresponde à leptina humana madura com um resíduo de metionina em seu N-terminal. Outros exemplos de polipeptídeos de leptina compreendem uma sequência de aminoácido sem o resíduo de metionina N-terminal, tal como os aminoácidos 2 a 147 de SEQ ID NO: 15. Uma isoforma comum de leptina possui um resíduo de metionina na posição 74 da SEQ ID NO: 15 em vez de um resíduo de valina. Um polipeptídeo de leptina produzido pelos métodos da invenção compreende em algumas modalidades a sequência de aminoácido de um polipeptídeo de leptina com um resíduo de metionina em seu N-terminal (metreleptina) e em outras modalidades com um marcador, ligante ou outra sequência de aminoácido propeptídeo (conforme descrito mais abaixo) adicionada ao N-terminal do polipeptídeo de leptina, em algumas modalidades com, e em outras modalidades sem, a inclusão da metionina no N-terminal da sequência de aminoácido da metreleptina.
[0049] Peptídeos de Sinal. Os produtos gênicos de polipeptídeo produzidos pelos métodos da invenção podem ter ou não peptídeos de sinal. Em certas modalidades da invenção, os produtos gênicos de polipeptídeo carecem de peptídeos de sinal porque é vantajoso que tais produtos gênicos sejam retidos no citoplasma oxidante da célula hospedeira. Os peptídeos de sinal (também denominadas sequências de sinal, sequências líder ou peptídeos líderes) são caracterizados estruturalmente por um trecho de aminoácidos hidrofóbicos, com aproximadamente cinco a vinte aminoácidos de comprimento e muitas vezes em torno de dez a quinze aminoácidos de comprimento, que tem uma tendência a se formar uma única alfa-hélice. Este trecho hidrofóbico costuma ser imediatamente precedido por um trecho mais curto, enriquecido em aminoácidos carregados positivamente (particularmente lisina). Os peptídeos de sinal que devem ser clivados do polipeptídeo maduro tipicamente terminam em um trecho de aminoácidos que é reconhecido e clivado pela peptidase de sinal. Os peptídeos de sinal que direcionam a inserção do produto gênico de polipeptídeo nas membranas, às vezes referidos como sequências de âncora de sinal, podem não ter a sequência de aminoácido que é clivada pela peptidase de sinal e, nesse caso, são retidos no produto gênico de polipeptídeo. Os peptídeos de sinal podem frequentemente ser caracterizados funcionalmente pela capacidade de direcionar o transporte de um polipeptídeo, tanto cotranslacionalmente quanto pós- translacionalmente, para fora do citoplasma e, por exemplo, através da membrana plasmática de procariontes (ou a membrana interna de bactérias gram negativas como E. coli), ou no retículo endoplasmático de células eucarióticas. O grau em que um peptídeo sinal permite que um polipeptídeo seja transportado para o espaço periplasmático de uma célula hospedeira como E. coli, por exemplo, pode ser determinado pela separação de proteínas periplasmáticas de proteínas retidas no citoplasma, utilizando um método tal como aquele fornecido no Exemplo 9 abaixo. Marcadores e outras sequências de polipeptídeo que podem ser utilizadas com produtos gênicos.
[0050] Marcadores. Os produtos gênicos a serem expressos pelos métodos da invenção podem ser projetados para incluir partes moleculares que auxiliam na purificação e/ou detecção dos produtos gênicos. Muitas dessas partes são conhecidas na técnica; como um exemplo, um produto gênico de polipeptídeo pode ser projetado para incluir uma sequência de 'marcador' de poli-histidina - uma série de seis ou mais histidinas, de preferência seis a dez resíduos de histidina, e mais preferivelmente seis histidinas ('6xHis') - em seu N- ou C- terminal. A presença de uma sequência de poli-histidina na extremidade de um polipeptídeo permite que ele seja ligado por meio de afinidade à base de cobalto ou níquel e separado de outros polipeptídeos. A sequência do marcador de poli-histidina pode ser removida por exopeptidases.
[0051] Marcadores adicionais, expressos na extremidade N- terminal da sequência de aminoácido de um produto gênico de polipeptídeo produzido pelos métodos da invenção, compreendem em certas modalidades: (1) as partes N-terminais autocliváveis (Npro) de poliproteínas de pestivírus tais como vírus da cólera Hog (cepa Alfort) (SEQ ID NO: 16), também chamado de vírus da peste suína clássica (CSFV), e do vírus da doença de fronteira (BDV) e vírus da diarréia viral bovina (BVDV), e seus fragmentos; e/ou (2) pequeno modificador relacionado à ubiquitina (SUMO) (SEQ ID NO: 17, SwissProt P55853.1). Qualquer marcador N-terminal próprio pode ser marcado em seu N-terminal com um marcador de poli-histidina tal como 6xHis, levando em conta a purificação inicial do polipeptídeo marcado em uma coluna de níquel, seguido por autoclivagem de marcadores, tais como Npro, ou clivagem enzimática do marcador SUMO N-terminal pela SUMO protease, respectivamente, e eluição do polipeptídeo liberado da coluna. Em uma modalidade deste método, os polipeptídeos de SUMO protease também são proteínas de fusão compreendendo marcadores 6xHis, permitindo uma purificação em duas etapas: na primeira etapa, o polipeptídeo marcado 6xHis-SUMO expresso é purificado pela ligação a uma coluna de níquel, seguido por eluição da coluna. Na segunda etapa, os marcadores SUMO nos polipeptídeos purificados são clivadas pela SUMO protease marcada com 6xHis e a mistura de reação de SUMO protease - polipeptídeo é operada através de uma segunda coluna de níquel, que retém a SUMO protease, mas permite que o polipeptídeo agora não marcado flua do começo ao fim.
[0052] Como outro exemplo, as sequências de proteínas fluorescentes podem ser expressas como parte de um produto gênico de polipeptídeo, com a sequência de aminoácido para a proteína fluorescente de preferência adicionada na extremidade N ou C- terminal da sequência de aminoácido do produto gênico de polipeptídeo. A proteína de fusão resultante produz fluorescência quando exposta à luz de certos comprimentos de onda, permitindo que a presença da proteína de fusão seja detectada visualmente. Uma proteína fluorescente bem conhecida é a proteína fluorescente verde de Aequorea victoria, e muitas outras proteínas fluorescentes estão disponíveis comercialmente, junto com sequências de nucleotídeo que as codificam.
[0053] Ligantes. Ligantes são polipeptídeos que são utilizados para conectar dois outros polipeptídeos. Exemplos de polipeptídeos de ligante que formam alfa-hélices são fornecidos como SEQ ID NO: 18 e SEQ ID NO: 19 (Amet et al., "Insertion of the designed helical linker led to increased expression of Tf-based fusion proteins", Pharm Res 2009 Mar; 26(3): 523-528; doi: 10.1007/s11095-008-9767-0; Epub 2008 Nov 11).
[0054] Sequências de Clivagem. As sequências de clivagem são sequências de aminoácido discretas que podem ser atuadas por reagentes químicos ou enzimas para efetuar a clivagem do polipeptídeo contendo a sequência de clivagem. Uma ou mais destas sequências podem ser introduzidas entre um marcador ou sequência de propeptídeo e a sequência de aminoácido de um produto gênico de polipeptídeo, para permitir que o marcador ou propeptídeo seja extraído por clivagem durante o processo de purificação do produto gênico. Exemplos de sequências de clivagem incluem as sequências de aminoácido DP e GGDPGGG (SEQ ID NO: 20, que podem ser clivadas através do tratamento com ácido fórmico na ligação entre D (Asp) e P (Pro). Certas sequências cliváveis por ácido estão presentes dentro de propeptídeos particulares descritos abaixo (SEQ ID NOs 33 a 35). Exemplos adicionais são sequências de aminoácido cliváveis por proteases, tais como a protease de TEV (vírus etch do tabaco) (sequência de clivagem ENLYFQGG (SEQ ID NO: 21)), enterocinase (sequência de clivagem DDDDKG (SEQ ID NO: 22)), e trombina (sequência de clivagem LVPRGS (SEQ ID NO: 23)).
[0055] Propeptídeos. Os propeptídeos no presente documento descritos podem ser ligados a produtos gênicos de polipeptídeo, tanto N-terminal quanto C-terminal à sequência de aminoácido de um produto gênico de polipeptídeo, ou ambos, e ligados diretamente à sequência de aminoácido de um produto gênico de polipeptídeo, ou com outras sequências de polipeptídeo, tais como ligantes ou marcadores colocados entre o propeptídeo e o produto gênico de polipeptídeo. Exemplos de polipeptídeos que podem ser utilizados como propeptídeos incluem proteínas precursoras de carboxipeptidase B de mamífero (descritas mais abaixo) e proteína de ligação de maltose ou 'MBP' (UniProtKB/Swiss-Prot: P0AEX9.1, SEQ ID NO: 24), que possui uma sequência de sinal; os aminoácidos 2 a 26 da SEQ ID NO: 24 podem ser removidos para gerar um propeptídeo que permanecerá localizado no citoplasma da célula. Outro polipeptídeo que tem sido utilizado como um propeptídeo é o módulo de ligação a carboidratos da família 9 de Thermotoga maritima xilanase 10a ou 'CBM9' (SEQ ID NO: 25, aminoácidos 700 a 868 de UniProtKB/Swiss- Prot: Q60037, Notenboom et al., "Crystal structures of the family 9 carbohydrate-binding module from Thermotoga maritima xylanase 10A in native and ligand-bound forms", Biochemistry 2001 May 29; 40(21): 6248-6256).
[0056] Propeptídeo Carboxipeptidase B (CPBpro). A proteína precursora de carboxipeptidase B típica de mamífero possui um peptídeo de sinal em seu N-terminal, seguido por um propeptídeo de 95 aminoácidos tendo um resíduo de arginina em seu C-terminal; este propeptídeo, que também é denominado o domínio de ativação da carboxipeptidase B, é clivado do restante da enzima carboxipeptidase B (EC 3.4.17.2) por hidrólise tríptica, que ativa a enzima (Coll et al., "Three-dimensional structure of porcine procarboxypeptidase B: a structural basis of its inactivity", EMBO J 1991 Jan; 10(1): 1-9). A sequência de aminoácido da proteína precursora da carboxipeptidase B humana ou CPBpro é fornecida como SEQ ID NO: 26.
[0057] Os termos 'CPBpro' e 'propeptídeos CPBpro' são utilizados neste documento para se referir a propeptídeos carboxipeptidase B, incluindo as novas variantes no presente documento divulgadas. Os propeptídeos CPBpro podem ser utilizados na produção de polipeptídeos recombinantes, fundidos, por exemplo, no resíduo de arginina C-terminal do propeptídeo CPBpro ao resíduo N-terminal desejado do polipeptídeo de interesse: após a expressão do CPBpro_polipeptídeo, o propeptídeo CPBpro pode ser clivado a partir do polipeptídeo de interesse pela tripsina para gerar o N-terminal desejado. Exemplos de propeptídeos CPBpro variantes incluem SEQ ID NOs 27 a 36, e um outro propeptídeo é fornecido tendo a sequência de aminoácido da SEQ ID NO: 37.
[0058] Formação de Produtos Gênicos Solubilizáveis. Em certos casos, a expressão de produtos gênicos utilizando os métodos de expressão no presente documento descritos resulta na formação de complexos de produtos gênicos solubilizáveis sem a necessidade da adição de marcadores ou outros polipeptídeos ao produto gênico. Por exemplo, em experimentos de pequeno volume, a coexpressão de metreleptina (SEQ ID NO: 15) com a sulfidril oxidase Erv1p (SEQ ID NO: 38, descrita abaixo) de acordo com os métodos de expressão no presente documento descritos resultou na maioria (ao redor de 70%) da metreleptina expressa formando complexos solubilizáveis; coexpressão semelhante de Erv1p com um produto gênico (SEQ ID NO: 39) formado pela adição de um propeptídeo variante CPBpro (SEQ ID NO: 27) à metreleptina (SEQ ID NO: 15) resultou em uma porção maior do produto gênico (ao redor de 84%) formando complexos solubilizáveis. Para a otimização da expressão dos produtos gênicos em complexos solubilizáveis, os produtos gênicos podem em primeiro lugar ser expressos sem modificação, e a quantidade de complexos solubilizáveis produzidos pode ser determinada. O efeito da adição de várias sequências de polipeptídeo (marcadores, propeptídeos, opcionalmente em combinação e opcionalmente em combinação adicional com sequências de ligante e/ou clivagem) a produtos gênicos de polipeptídeo pode então ser avaliado, de preferência em experimentos de expressão de pequeno volume, para determinar se uma porção maior dos produtos gênicos desejados é então expressa como complexos solubilizáveis.
[0059] Ligações de Dissulfeto. Os produtos gênicos produzidos pelos métodos da invenção são, em alguns casos, polipeptídeos que formam ligações de dissulfeto. Os números e localizações das ligações de dissulfeto formadas por um polipeptídeo podem ser determinados por métodos tais como aqueles do Exemplo 8 abaixo. O número de ligações de dissulfeto para um produto gênico tal como um polipeptídeo, é o número total de ligações intramoleculares e intermoleculares formadas por esse produto gênico quando está presente em um produto funcional. Por exemplo, uma cadeia leve de um anticorpo de IgG humano normalmente possui três ligações de dissufeto (duas ligações intramoleculares e uma ligação intermolecular), e uma cadeia pesada de um anticorpo de IgG humano normalmente possui sete ligações de dissufeto (quatro ligações intramoleculares e três ligações intermoleculares). Em certas modalidades da invenção, um produto gênico produzido pelos métodos da invenção é um polipeptídeo que forma pelo menos uma e menos de vinte ligações de dissulfeto, ou pelo menos duas e menos de dezessete ligações de dissulfeto, ou pelo menos dezessete e menos de cinquenta ligações de dissulfeto, ou pelo menos três e menos do que dez ligações de dissulfeto, ou pelo menos três e menos do que oito ligações de dissulfeto, ou é um polipeptídeo que forma várias ligações de dissulfeto selecionadas do grupo que consiste em uma, duas, três, quatro, cinco, seis, sete, oito e nove ligações de dissulfeto.
[0060] Glicosilação. Os produtos gênicos produzidos pelos métodos da invenção podem ser glicosilados ou não glicosilados. Em uma modalidade da invenção, os produtos gênicos são polipeptídeos. Os polipeptídeos glicosilados são polipeptídeos que compreendem um grupo de glicosila covalentemente ligado e incluem polipeptídeos compreendendo todos os grupos de glicosila normalmente ligados a resíduos particulares desse polipeptídeo (polipeptídeos totalmente glicosilados), polipeptídeos parcialmente glicosilados, polipeptídeos com glicosilação em um ou mais resíduos onde a glicosilação normalmente não ocorre (glicosilação alterada), e polipeptídeos glicosilados com pelo menos um grupo de glicosila que difere em estrutura do grupo de glicosila normalmente ligado a um ou mais resíduos especificados (glicosilação modificada). Um exemplo de glicosilação modificada é a produção de polipeptídeos "desfucosilados" ou "deficientes em fucose", polipeptídeos que carecem de componentes de fucosila nos grupos de glicosila ligados a eles, através da expressão de polipeptídeos em células hospedeiras sem a capacidade de fucosilar polipeptídeos. Os polipeptídeos não glicosilados são polipeptídeos que não compreendem um grupo de glicosila covalentemente ligado. Um polipeptídeo não glicosilado pode ser o resultado da desglicosilação de um polipeptídeo ou da produção de um polipeptídeo não glicosilado. Os polipeptídeos desglicosilados podem ser obtidos pela deglicosilação enzimática de polipeptídeos glicosilados, enquanto que os polipeptídeos não glicosilados podem ser produzidos expressando polipeptídeos em células hospedeiras que não possuem a capacidade de glicosilar os polipeptídeos, tais como células procarióticas ou células enzimáticas em que a função de pelo menos uma glicosilação foi eliminada ou reduzida. Em uma modalidade particular, os polipeptídeos expressos são não glicosilados e, em uma modalidade mais específica, os polipeptídeos não glicosilados são expressos em células procarióticas tais como E. coli.
[0061] Outras modificações de produtos gênicos. Os produtos gênicos produzidos pelos métodos da invenção podem ser covalentemente ligados a outros tipos de moléculas. Exemplos de moléculas que podem ser covalentemente ligadas a produtos gênicos, sem limitar o escopo da invenção, incluem polipeptídeos (tais como aqueles presentes em receptores, ligantes, citocinas, fatores de crescimento, hormônios polipeptídicos, domínios de ligação de DNA, domínios de interação de proteínas tais como domínios PDZ, domínios de cinase, anticorpos e fragmentos de qualquer um de tais polipeptídeos); polímeros solúveis em água (tais como polietileno glicol (PEG), carboximetilcelulose, dextrano, álcool polivinílico, polióis polioxietilados (tais como glicerol), propionaldeído de polietileno glicol e compostos semelhantes, derivados ou suas misturas); e agentes citotóxicos (tais como agentes quimioterapêuticos, agentes inibidores do crescimento, toxinas (tais como toxinas enzimaticamente ativas de origem bacteriana, fúngica, vegetal ou animal, ou seus fragmentos) e isótopos radioativos).
[0062] Chaperonas. Em algumas modalidades, os produtos gênicos desejados são coexpressos com outros produtos gênicos, tais como chaperonas, que são benéficos para a produção do produto gênico desejado. Chaperonas são proteínas que auxiliam o dobramento ou desdobramento não covalente e/ou a montagem ou desmontagem de outros produtos gênicos, mas não ocorrem nas estruturas de produto gênico monoméricas ou multiméricas resultantes quando as estruturas estão desempenhando suas funções biológicas normais (tendo concluídos os processos de dobragem e/ou montagem). As chaperonas podem ser expressas a partir de um promotor induzível ou um promotor constitutivo dentro de um construto de expressão, ou podem ser expressas a partir do cromossomo da célula hospedeira; de preferência, a expressão das proteínas chaperona na célula hospedeira está em um nível suficientemente alto para produzir produtos gênicos coexpressos que são devidamente dobrados e/ou montados no produto desejado. Exemplos de chaperonas presentes em células hospedeiras de E. coli são os fatores de dobramento DnaK/DnaJ/GrpE, DsbC/DsbG, GroEL/GroES, IbpA/IbpB, Skp, Tig (fator de ativação) e FkpA, que foram utilizados para prevenir a proteína agregação de proteínas citoplasmáticas ou periplasmáticas. DnaK/DnaJ/GrpE, GroEL/GroES e ClpB podem funcionar sinergicamente auxiliando a dobragem de proteínas e, portanto, a expressão dessas chaperonas em combinações tem se mostrado benéfica para a expressão de proteínas (Makino et al., "Strain engineering for improved expression of recombinant proteins in bacteria", Microb Cell Fact 2011 May 14; 10: 32). Quando se expressa proteínas eucarióticas em células hospedeiras procarióticas, uma proteína chaperona eucariótica, tal como a proteína dissulfeto isomerase (PDI) da mesma ou de uma espécie eucariótica relacionada, é em certas modalidades da invenção coexpressa ou coexpressa de forma induzível com o produto gênico desejado.
[0063] Uma chaperona que pode ser expressa nas células hospedeiras é uma proteína dissulfeto isomerase de Humicola insolens, um hifomiceto do solo (fungo de podridão lisa). Uma sequência de aminoácido de Humicola insolens PDI é mostrada como SEQ ID NO: 40; carece do peptídeo de sinal da proteína nativa de modo que permanece no citoplasma da célula hospedeira. A sequência de nucleotídeo que codifica PDI foi otimizada para expressão em E. coli; o construto de expressão para PDI é mostrado como SEQ ID NO: 41. A SEQ ID NO: 41 contém um sítio de restrição GCTAGC NheI na sua extremidade 5', um sítio de ligação ao ribossomo AGGAGG nos nucleotídeos 7 a 12, a sequência de codificação PDI nos nucleotídeos 21 a 1478 e um sítio de restrição GTCGAC SalI em sua extremidade 3'. A sequência de nucleotídeo da SEQ ID NO: 41 foi projetada para ser inserida imediatamente a jusante de um promotor, tal como um promotor induzível. Os sítios de restrição
NheI e SalI na SEQ ID NO: 41 podem ser utilizados para inseri-la em um sítio de clonagem de múltiplos vetores, tal como o do vetor de expressão pSOL (SEQ ID NO: 42), descrito no pedido de patente US publicado US2015353940A1, que é no presente documento incorporado por referência na sua totalidade. Outros polipeptídeos de PDI também podem ser expressos em células hospedeiras, incluindo polipeptídeos de PDI de uma variedade de espécies (Saccharomyces cerevisiae (UniProtKB P17967), Homo sapiens (UniProtKB P07237), Mus musculus (UniProtKB P09103), Caenorhabditis elegans (UniProtKB Q17770 e Q17967), Arabdopsis thaliana (UniProtKB O48773, Q9XI01, Q9SRG3, Q9LJU2, Q9MAU6, Q94F09 e Q9T042), Aspergillus niger (UniProtKB Q12730) e também formas modificadas de tais polipeptídeos de PDI. Em certas modalidades da invenção, um polipeptídeo de PDI expresso em células hospedeiras compartilha pelo menos 70%, ou 80%, ou 90% ou 95% de identidade de sequência de aminoácido em pelo menos 50% (ou pelo menos 60%, ou pelo menos 70%, ou pelo menos 80%, ou pelo menos 90%) do comprimento da SEQ ID NO: 40, onde a identidade da sequência de aminoácido é determinada de acordo com o Exemplo 11.
[0064] Transporte celular de cofatores. Ao utilizar os sistemas de expressão da invenção para produzir produtos gênicos que requerem cofatores para funcionar, é útil utilizar uma célula hospedeira capaz de sintetizar o cofator a partir de precursores disponíveis ou retirá-lo do ambiente. Os cofatores comuns incluem ATP, coenzima A, dinucleotídeo flavina adenina (FAD), NAD+/NADH e heme. Os polinucleotídeos que codificam polipeptídeos de transporte de cofator e/ou polipeptídeos de síntese de cofator podem ser introduzidos em células hospedeiras, e tais polipeptídeos podem ser expressos constitutivamente ou coexpressos de forma induzível com os produtos gênicos a serem produzidos pelos métodos da invenção.
II. Construtos de Expressão.
[0065] Os construtos de expressão são polinucleotídeos projetados para a expressão de um ou mais produtos gênicos de interesse. Certos produtos gênicos de interesse são produtos gênicos "heterólogos", que são derivados de espécies que são diferentes daquelas da célula hospedeira na qual são expressos e/ou são produtos gênicos heterólogos que não são expressos nativamente a partir dos promotores utilizados no construto de expressão e/ou são produtos gênicos modificados que foram concebidos para incluir as diferenças de formas de ocorrência natural de tais produtos gênicos. Construtos de expressão compreendendo polinucleotídeos que codificam produtos gênicos heterólogos e/ou modificados, ou compreendendo uma combinação de polinucleotídeos que foram derivados de organismos de diferentes espécies, ou compreendendo polinucleotídeos que foram modificados para diferir de polinucleotídeos de ocorrência natural, não são moléculas de ocorrência natural. Os construtos de expressão podem ser integrados em um cromossomo da célula hospedeira ou mantidos dentro da célula hospedeira como moléculas de polinucleotídeo que se replicam independentemente do cromossomo da célula hospedeira, tais como plasmídeos ou cromossomos artificiais. Um exemplo de um construto de expressão é um polinucleotídeo resultante da inserção de uma ou mais sequências de polinucleotídeo em um cromossomo de célula hospedeira, onde as sequências de polinucleotídeo inseridas alteram a expressão das sequências de codificação cromossômicas. Um vetor de expressão é um construto de expressão de plasmídeo especificamente utilizado para a expressão de um ou mais produtos gênicos. Um ou mais construtos de expressão podem ser integrados em um cromossomo da célula hospedeira ou ser mantidos em um polinucleotídeo extracromossômico, tal como um plasmídeo ou cromossomo artificial.
Em certas modalidades da invenção, o construto de expressão é o vetor de expressão pSOL (SEQ ID NO: 42).
[0066] Os construtos de expressão podem compreender certos elementos polinucleotídicos, tais como origens de replicação, marcadores selecionáveis, promotores tais como promotores constitutivos ou induzíveis (descritos mais abaixo), sítios de ligação ao ribossoma e sítios de múltiplas clonagens. Exemplos desses elementos polinucleotídicos são bem conhecidos na técnica, e outras descrições deles podem ser encontradas nas seguintes publicações e pedidos de patente, todos expressamente incorporados nesta invenção por referência: US9617335B2 e WO2014025663A1, "Inducible Coexpression System"; WO2016205570A1, "Vectors for Use in an Inducible Coexpression System"; e Pedido Internacional PCT/US2016/067064, "Cytoplasmic Expression System".
[0067] Promotor induzível. Conforme descrito mais abaixo, existem vários promotores induzíveis diferentes que podem ser incluídos nos construtos de expressão como parte dos sistemas de expressão da invenção. Os promotores induzíveis preferidos compartilham pelo menos 80% de identidade de sequência de polinucleotídeo (mais preferivelmente, pelo menos 90% de identidade, e o mais preferível, pelo menos 95% de identidade) a pelo menos 30 (mais preferivelmente, pelo menos 40, e o mais preferível, pelo menos 50) bases contíguas de uma sequência de polinucleotídeo promotor conforme definido na Tabela 1 da WO2014025663A1, onde a porcentagem de identidade de sequência de polinucleotídeo é determinada utilizando os métodos do Exemplo 11. Sob condições de indução "padrão" (ver o Exemplo 10), os promotores induzíveis preferidos possuem pelo menos 75% (mais preferivelmente, pelo menos 100%, e o mais preferível, pelo menos 110%) da força do promotor induzível do 'tipo selvagem' correspondente de E. coli K-12 subcepa MG1655, conforme determinado utilizando o método de PCR quantitativo de De Mey et al. "Promoter knock-in: a novel rational method for the fine tuning of genes", BMC Biotechnol 2010 Mar 24; 10: 26 (ver a WO2014025663A1, Exemplo 8A). Dentro do construto de expressão, um promotor induzível é colocado 5' para (ou 'a montante de') a sequência de codificação para o produto gênico que deve ser induzivelmente expresso, de modo que a presença do promotor induzível irá direcionar a transcrição da sequência de codificação do produto gênico em uma direção 5' para 3' em relação à fita de codificação do polinucleotídeo que codifica o produto gênico. Os produtos gênicos expressos a partir dos promotores induzíveis nos construtos de expressão não são os produtos gênicos expressos nativamente a partir desses promotores induzíveis; em vez disso, eles são produtos gênicos heterólogos, com o resultado de que os construtos de expressão compreendendo produtos gênicos heterólogos expressos a partir de promotores induzíveis são necessariamente construtos artificiais não encontradas na natureza.
[0068] Promotores Induzíveis. O que se segue é uma descrição de promotores induzíveis que podem ser utilizados em construtos de expressão para a expressão de produtos gênicos, juntamente com algumas das modificações genéticas que podem ser feitas em células hospedeiras que contêm tais construtos de expressão. Exemplos desses promotores induzíveis e genes relacionados são, a menos que especificado de outra forma, aqueles derivados de Escherichia coli (E. coli) cepan MG1655 (American Type Culture Collection, deposito ATCC 700926), que é uma subcepa de E. coli K-12 (American Type Culture Collection, depósito ATCC 10798). A Tabela 1 do Pedido Internacional PCT/US13/53562 (publicado como WO2014025663A1) lista as localizações genômicas, em E. coli MG1655, das sequências de nucleotídeo para estes exemplos de promotores induzíveis e genes relacionados; a publicação WO2014025663A1 é no presente documento incorporada por referência na sua totalidade. Sequências de nucleotídeo e outras genéticas, referenciadas pela localização genômica como na Tabela 1 da WO2014025663A1, são expressamente incorporadas nesta invenção por referência. Informações adicionais sobre os promotores, genes e cepas de E. coli no presente documento descritos podem ser encontradas em muitas fontes públicas, incluindo o recurso EcoliWiki online, situado em ecoliwiki.net.
[0069] Promotor de arabinose. (Como no presente documento utilizado, 'arabinose' significa L-arabinose.) Vários óperons de E. coli envolvidos na utilização de arabinose são induzíveis por arabinose - araBAD, araC, araE e araFGH - mas os termos 'promotor de arabinose' e 'promotor de ara' são tipicamente utilizados para designar o promotor araBAD. Vários termos adicionais foram utilizados para indicar o promotor araBAD de E. coli, tais como Para, ParaB, P e PBAD. O uso nesta invenção de 'promotor ara' ou qualquer um dos termos alternativos dados acima, significa o promotor araBAD de E. coli. Como pode ser visto a partir do uso de outro termo, 'promotor araC- araBAD', o promotor araBAD é considerado parte de um promotor bidirecional, com o promotor araBAD controlando a expressão do óperon araBAD em uma direção, e o promotor araC, em estreita proximidade e na fita oposta do promotor araBAD, controlando a expressão da sequência de codificação de araC na outra direção. A proteína AraC é um regulador transcricional positivo e negativo do promotor araBAD. Na ausência de arabinose, a proteína AraC reprime a transcrição de PBAD, mas na presença de arabinose, a proteína AraC, que altera sua conformação ao se ligar à arabinose, torna-se um elemento regulador positivo que permite a transcrição de PBAD. O óperon araBAD codifica proteínas que metabolizam a L-arabinose através da sua conversão, por meio dos intermediários L-ribulose e L- ribulose-fosfato, em D-xilulose-5-fosfato.
Com o objetivo de maximizar a indução da expressão de um promotor induzível de arabinose, é útil eliminar ou reduzir a função de AraA, que catalisa a conversão de L- arabinose em L-ribulose e, opcionalmente para eliminar ou reduzir a função de pelo menos um de AraB e AraD, igualmente.
Eliminar ou reduzir a capacidade das células hospedeiras de diminuir a concentração eficaz de arabinose na célula, através da eliminação ou redução da capacidade da célula de converter arabinose em outros açúcares, permite que mais arabinose esteja disponível para indução do promotor induzível de arabinose.
Os genes que codificam os transportadores que movem a arabinose para a célula hospedeira são araE, que codifica o simportador de prótons de L-arabinose de baixa afinidade, e o óperon araFGH, que codifica as subunidades de um transportador de L-arabinose de alta afinidade da superfamília ABC.
Outras proteínas que podem transportar L-arabinose para a célula são certos mutantes da permease de lactose LacY: as proteínas LacY (A177C) e LacY (A177V), tendo um aminoácido cisteína ou valina em vez de alanina na posição 177, respectivamente (Morgan-Kiss et al., "Long-term and homogeneous regulation of the Escherichia coli araBAD promoter by use of a lactose transporter of relaxed specificity", Proc Natl Acad Sci U S A 2002 May 28; 99(11): 7373-7377). A fim de alcançar a indução homogênea de um promotor induzível por arabinose, é útil tornar o transporte de arabinose para a célula independente da regulação por arabinose.
Isso pode ser executado através da eliminação ou redução da atividade das proteínas transportadoras AraFGH e alteração da expressão de araE de modo que seja apenas transcrita a partir de um promotor constitutivo.
A expressão constitutiva de araE pode ser executada mediante a eliminação ou redução da função do gene araE nativo e introdução na célula de um construto de expressão que inclui uma sequência de codificação para a proteína AraE expressa a partir de um promotor constitutivo. Alternativamente, em uma célula sem função AraFGH, o promotor que controla a expressão do gene araE cromossômico da célula hospedeira pode ser alterado de um promotor induzível por arabinose para um promotor constitutivo. De maneira semelhante, como alternativas adicionais para a indução homogênea de um promotor induzível por arabinose, uma célula hospedeira que não possui a função AraE pode ter qualquer sequência de codificação AraFGH funcional presente na célula expressa a partir de um promotor constitutivo. Como outra alternativa, é possível expressar o gene araE e o óperon araFGH a partir de promotores constitutivos, através da substituição dos promotores araE e araFGH nativos por promotores constitutivos no cromossomo hospedeiro. Também é possível eliminar ou reduzir a atividade dos transportadores de arabinose tanto AraE quanto AraFGH e, nessa situação, utilizar uma mutação na lactose permease LacY que permite a esta proteína transportar arabinose. Visto que a expressão do gene lacY não é normalmente regulada por arabinose, o uso de um mutante LacY, como LacY (A177C) ou LacY (A177V), não levará ao fenômeno de indução 'tudo ou nada' quando o promotor induzível por arabinose for induzido pela presença de arabinose. Uma vez que a proteína LacY (A177C) parece ser mais eficaz no transporte de arabinose para a célula, o uso de polinucleotídeos que codificam a proteína LacY (A177C) é preferível ao uso de polinucleotídeos que codificam a proteína LacY (A177V).
[0070] Promotor de propionato. O 'promotor de propionato' ou 'promotor prp' é o promotor para o óperon prpBCDE de E. coli e também é denominado PprpB. Como o promotor ara, o promotor prp é parte de um promotor bidirecional, que controla a expressão do óperon prpBCDE em uma direção e com o promotor prpR que controla a expressão da sequência de codificação de prpR na outra direção.
A proteína PrpR é o regulador da transcrição do promotor prp e ativa a transcrição do promotor prp quando a proteína PrpR se liga ao 2- metilcitrato ('2-MC'). Propionato (também chamado de propanoato) é o íon, CH3CH2COO-, do ácido propiônico (ou 'ácido propanóico') e é o menor dos ácidos 'graxos' tendo a fórmula geral H(CH2)nCOOH que compartilha certas propriedades desta classe de moléculas: produzindo uma camada oleosa quando afundado em uma solução de água e tendo um sal de potássio com sabão.
O propionato comercialmente disponível é geralmente vendido como um sal de cátion monovalente de ácido propiônico, tal como o propionato de sódio (CH3CH2COONa), ou como um sal de cátion divalente, tal como o propionato de cálcio (Ca(CH3CH2COO)2). O propionato é permeável à membrana e é metabolizado em 2-MC através da conversão do propionato em propionil-CoA por PrpE (propionil-CoA sintetase) e, em seguida, conversão de propionil-CoA em 2-MC por PrpC (2-metilcitrato sintetase). As outras proteínas codificadas pelo óperon prpBCDE, PrpD (2-metilcitrato desidratase) e PrpB (2-metilisocitrato liase), estão envolvidas no catabolismo adicional de 2-MC em produtos menores tais como piruvato e succinato.
A fim de maximizar a indução de um promotor induzível por propionato pelo propionato adicionado ao meio de crescimento celular, é, portanto, desejável ter uma célula hospedeira com atividade de PrpC e PrpE, para converter o propionato em 2-MC, mas também tendo eliminado ou reduzido a atividade de PrpD e, opcionalmente, também eliminado ou reduzido a atividade de PrpB, para evitar que 2-MC seja metabolizado.
Outro óperon que codifica proteínas envolvidas na biossíntese de 2-MC é o óperon scpA- argK-scpBC, também chamado de óperon sbm-ygfDGH.
Esses genes codificam proteínas necessárias para a conversão de succinato em propionil-CoA, que pode então ser convertido em 2-MC por PrpC.
A eliminação ou redução da função dessas proteínas removeria uma via paralela para a produção do indutor 2-MC e, assim, pode reduzir os níveis de fundo de expressão de um promotor induzível por propionato e aumentar a sensibilidade do promotor induzível por propionato a exogenamente o propionato fornecido. Foi observado que uma deleção de sbm-ygfD-ygfG-ygfH-ygfI, introduzida em E. coli BL21 (DE3) para criar a cepa JSB (Lee and Keasling, "A propionate- inducible expression system for enteric bacteria", Appl Environ Microbiol 2005 Nov; 71(11): 6856-6862), foi útil na redução da expressão de fundo na ausência de indutor fornecido exogenamente, mas esta deleção também reduziu a expressão geral do promotor prp na cepa JSB. Deve-se notar, no entanto, que a deleção sbm-ygfD- ygfG-ygfH-ygfI também afeta aparentemente ygfI, que codifica um regulador transcricional da família LysR putativo de função desconhecida. Os genes sbm-ygfDGH são transcritos como um óperon, e ygfI é transcrito da fita oposta. As extremidades 3' das sequências de codificação ygfH e ygfI se sobrepõem por alguns pares de bases, portanto, uma deleção que remove todo o óperon sbm- ygfDGH aparentemente remove também a função de codificação de ygfI. Eliminar ou reduzir a função de um subconjunto dos produtos gênicos sbm-ygfDGH, como YgfG (também chamado de ScpB, metilmalonil-CoA descarboxilase), ou deletar a maior parte do óperon sbm-ygfDGH (ou scpA-argK-scpBC) enquanto deixa ficar o suficiente da extremidade 3' do gene ygfH (ou scpC) de modo que a expressão de ygfI não seja afetada, pode ser suficiente para reduzir a expressão de fundo de um promotor induzível por propionato sem reduzir o nível máximo de expressão induzida.
[0071] Promotor de Ramnose. (Como no presente documento utilizado, 'ramnose' significa L-ramnose.) O 'promotor de ramnose' ou 'promotor rha', ou PrhaSR, é o promotor para o óperon rhaSR de E. coli.
Como os promotores ara e prp, o promotor rha é parte de um promotor bidirecional, que controla a expressão do óperon rhaSR em uma direção e com o promotor rhaBAD que controla a expressão do óperon rhaBAD na outra direção.
O promotor rha, no entanto, possui dois reguladores transcricionais envolvidos na modulação da expressão: RhaR e RhaS.
A proteína RhaR ativa a expressão do óperon rhaSR na presença de ramnose, enquanto que a proteína RhaS ativa a expressão dos óperons catabólicos e de transporte de L-ramnose, rhaBAD e rhaT, respectivamente (Wickstrum et al., "The AraC/XylS family activator RhaS negatively autoregulates rhaSR expression by preventing cyclic AMP receptor protein activation", J Bacteriol 2010 Jan; 192(1): 225-232). Embora a proteína RhaS também possa ativar a expressão do óperon rhaSR, na verdade o RhaS autorregula negativamente essa expressão, interferindo na capacidade da proteína do receptor de AMP cíclico (CRP) de coativar a expressão com RhaR em um nível muito maior.
O óperon rhaBAD codifica as proteínas catabólicas da ramnose RhaA (L-ramnose isomerase), que converte a L-ramnose em L-ramnulose; RhaB (ramnulocinase), que fosforila a L- ramnulose para formar L-ramnulose-1-P; e RhaD (ramnulose-1-fosfato aldolase), que converte L-ramnulose-1-P em L-lactaldeído e DHAP (fosfato de di-hidroxiacetona). Para maximizar a quantidade de ramnose na célula disponível para indução da expressão de um promotor induzível por ramnose, é desejável reduzir a quantidade de ramnose que é quebrada por catálise, através da eliminação ou redução da função de RhaA, ou opcionalmente de RhaA e pelo menos um de RhaB e RhaD.
As células de E. coli também podem sintetizar L- ramnose a partir de alfa-D-glicose-1-P por meio das atividades das proteínas RmlA, RmlB, RmlC, e RmlD (também chamadas de RfbA, RfbB, RfbC e RfbD, respectivamente) codificadas por o óperon rmlBDACX (ou rfbBDACX). Para reduzir a expressão de fundo de um promotor induzível por ramnose e para aumentar a sensibilidade de indução do promotor induzível por ramnose pela ramnose exogenamente fornecida, pode ser útil eliminar ou reduzir a função de um ou mais das proteínas RmlA, RmlB, RmlC e RmlD. A L-ramnose é transportada para a célula por RhaT, a ramnose permease ou L- ramnose:simportador de prótons. Conforme observado acima, a expressão de RhaT é ativada pelo regulador transcricional RhaS. Para tornar a expressão de RhaT independente da indução por ramnose (que induz a expressão de RhaS), a célula hospedeira pode ser alterada de modo que todas as sequências codificadoras de RhaT funcionais na célula sejam expressas a partir de promotores constitutivos. Adicionalmente, as sequências de codificação para RhaS podem ser deletadas ou inativadas, de modo que nenhum RhaS funcional seja produzido. Ao eliminar ou reduzir a função de RhaS na célula, o nível de expressão do promotor rhaSR é aumentado devido à ausência de autorregulação negativa por RhaS, e o nível de expressão do óperon catalítico de ramnose rhaBAD é diminuído, aumentando ainda mais a capacidade de ramnose de induzir a expressão do promotor rha.
[0072] Promotor de xilose. (Como no presente documento utilizado, 'xilose' significa D-xilose) O promotor de xilose, ou 'promotor xyl', ou PxylA, significa o promotor para o óperon xylAB de E. coli. A região do promotor de xilose é semelhante em organização a outros promotores induzíveis em que o óperon xylAB e o óperon xylFGHR são ambos expressos a partir de promotores induzíveis por xilose adjacentes em direções opostas no cromossomo de E. coli (Song and Park, "Organization and regulation of the D-xylose operons in Escherichia coli K-12: XylR acts as a transcriptional activator", J Bacteriol. 1997 Nov; 179(22): 7025-7032). O regulador transcricional de ambos os promotores PxylA e PxylF é o XylR, que ativa a expressão desses promotores na presença de xilose.
O gene xylR é expresso como parte do óperon xylFGHR ou a partir de seu próprio promotor fraco, que não é induzível pela xilose, localizado entre as sequências de codificação das proteínas xylH e xylR.
D-xilose é catabolizada por XylA (D-xilose isomerase), que converte D-xilose em D-xilulose, que é então fosforilada por XylB (xilulocinase) para formar D-xilulose-5-P.
Para maximizar a quantidade de xilose na célula disponível para indução da expressão de um promotor induzível por xilose, é desejável reduzir a quantidade de xilose que é quebrada por catálise, através da eliminação ou redução da função de pelo menos XylA, ou opcionalmente tanto XylA quanto XylB.
O óperon xylFGHR codifica XylF, XylG e XylH, as subunidades de um transportador de D- xilose de alta afinidade da superfamília ABC.
O gene xylE, que codifica o simportador de xilose-próton de baixa afinidade de E. coli, representa um óperon separado, cuja expressão também é induzida pela xilose.
Para constituir a expressão de um transportador de xilose independente da indução por xilose, a célula hospedeira pode ser alterada de modo que todos os transportadores de xilose funcionais sejam expressos a partir de promotores constitutivos.
Por exemplo, o óperon xylFGHR pode ser alterado de modo que as sequências de codificação de xylFGH sejam deletadas, deixando XylR como a única proteína ativa expressa a partir do promotor PxylF induzível por xilose e com a sequência de codificação xylE expressa a partir de um promotor constitutivo em vez de seu promotor nativo.
Como outro exemplo, a sequência de codificação xylR é expressa a partir do promotor PxylA ou PxylF em um construto de expressão, enquanto que o óperon xylFGHR é excluído e o xylE é expresso constitutivamente ou, alternativamente, um óperon xylFGH (sem a sequência de codificação xylR, uma vez que está presente em um construto de expressão) é expresso a partir de um promotor constitutivo e a sequência de codificação xylE é deletada ou alterada de modo que não produza uma proteína ativa.
[0073] Promotor da lactose. O termo 'promotor da lactose' refere- se ao promotor induzível por lactose para o óperon lacZYA, um promotor que também é denominado lacZp1; este promotor da lactose está localizado em ca. 365603 - 365568 (fita negativa, com o sítio de ligação de RNA polimerase ('-35') em ca. 365603-365598, a caixa Pribnow ('10') em 365579-365573, e um sítio de iniciação da transcrição em 365567) na sequência genômica da subcepa MG1655 de E. coli K-12 (NCBI Reference Sequence NC_000913.2, 11-JAN- 2012). Em algumas modalidades, os sistemas de expressão da invenção podem compreender um promotor induzível por lactose tal como o promotor lacZYA. Em outras modalidades, os sistemas de expressão da invenção compreendem um ou mais promotores induzíveis que não são promotores induzíveis por lactose.
[0074] Promotor da fosfatase alcalina. Os termos 'promotor da fosfatase alcalina' e 'promotor phoA' referem-se ao promotor do óperon phoApsiF, um promotor que é induzido sob condições de privação de fosfato. A região do promotor phoA está localizada em ca. 401647 - 401746 (fita positiva, com a caixa Pribnow ('10') em 401695 - 401701 (Kikuchi et al., "The nucleotide sequence of the promoter and the amino-terminal region of alkaline phosphatase structural gene (phoA) of Escherichia coli", Nucleic Acids Res 1981 Nov 11; 9(21): 5671- 5678)) na sequência genômica de subcepa MG1655 de E. coli K-12 (NCBI Reference Sequence NC_000913.3, 16-DEZ-2014). O ativador transcricional para o promotor phoA é PhoB, um regulador transcricional que, junto com a proteína sensora PhoR, forma um sistema de transdução de sinal de dois componentes em E. coli. PhoB e PhoR são transcritos do óperon phoBR, localizado em ca. 417050- 419300 (fita positiva, com a sequência de codificação PhoB em
417.142-417.831 e a sequência de codificação PhoR em 417.889-
419.184) na sequência genômica da subcepa MG1655 de E. coli K-12 (NCBI Reference Sequence NC_000913.3, 16-DEZ-2014). O promotor phoA difere dos promotores induzíveis descritos acima pelo fato de que é induzido pela falta de uma substância - fosfato intracelular - em vez da adição de um indutor. Por esta razão, o promotor phoA é geralmente utilizado para direcionar a transcrição de produtos gênicos que devem ser produzidos em um estágio em que as células hospedeiras estão sem fosfato, tal como nos estágios posteriores de fermentação. Em algumas modalidades, os sistemas de expressão da invenção podem compreender um promotor phoA. Em outras modalidades, os sistemas de expressão da invenção compreendem um ou mais promotores induzíveis que não são promotores phoA. III. Células hospedeiras.
[0075] Os construtos de expressão que codificam produtos gênicos de interesse são expressas em células hospedeiras para produzir os produtos gênicos de interesse. As células hospedeiras podem ser qualquer célula capaz de compreender tais construtos de expressão e expressá-las. Células hospedeiras particularmente adequadas são capazes de desenvolver em alta densidade celular em cultura de fermentação e podem produzir produtos gênicos na oxidação do citoplasma da célula hospedeira através da expressão gênica induzível altamente controlada. As células hospedeiras com essas qualidades são produzidas pela combinação de algumas ou todas as características a seguir. (1) As células hospedeiras são geneticamente modificadas para terem um citoplasma oxidante, através do aumento da expressão ou função de polipeptídeos oxidantes no citoplasma e/ou pela diminuição da expressão ou função de polipeptídeos redutores no citoplasma. Exemplos específicos de tais alterações genéticas são no presente documento fornecidos. Opcionalmente, as células hospedeiras também podem ser geneticamente modificadas para expressar chaperonas e/ou cofatores que auxiliam na produção dos produtos gênicos desejados e/ou para glicosilar produtos gênicos de polipeptídeo. (2) As células hospedeiras compreendem um ou mais construtos de expressão projetados para a expressão de um ou mais produtos gênicos de interesse; em certas modalidades, pelo menos um construto de expressão compreende um promotor induzível e um polinucleotídeo que codifica um produto gênico a ser expresso a partir do promotor induzível. (3) As células hospedeiras contêm modificações genéticas adicionais destinadas a melhorar certos aspectos da expressão do produto gênico a partir dos construtos de expressão.
Nas modalidades particulares, as células hospedeiras (A) possuem uma alteração da função do gene de pelo menos um gene que codifica uma proteína transportadora para um indutor de pelo menos um promotor induzível e, como outro exemplo, em que o gene que codifica a proteína transportadora é selecionado a partir do grupo que consiste em araE, araF, araG, araH, rhaT, xylF, xylG e xylH, ou particularmente é araE, ou em que a alteração da função do gene, mais particularmente, é a expressão de araE a partir de um promotor constitutivo; e/ou (B) possuem um nível reduzido de função gênica de pelo menos um gene que codifica uma proteína que metaboliza um indutor de pelo menos um promotor induzível e, como exemplos adicionais, em que o gene que codifica uma proteína que metaboliza um indutor de pelo menos um referido promotor induzível é selecionado do grupo que consiste em araA, araB, araD, prpB, prpD, rhaA, rhaB, rhaD, xylA e xylB; e/ou (C) possuem um nível reduzido de função gênica de pelo menos um gene que codifica uma proteína envolvida na biossíntese de um indutor de pelo menos um promotor induzível, cujo gene em outras modalidades é selecionado do grupo que consiste em scpA/sbm, argK/ygfD, scpB/ygfG, scpC/ygfH, rmlA, rmlB, rmlC e rmlD.
[0076] Exemplos de células hospedeiras são fornecidos que lvam em conta a produção eficiente e econômica de produtos gênicos, incluindo produtos multiméricos. As células hospedeiras podem incluir, além de células isoladas em cultura, células que fazem parte de um organismo multicelular ou células cultivadas em um organismo ou sistema de organismos diferente. Em certas modalidades da invenção, as células hospedeiras são células microbianas tais como leveduras (Saccharomyces, Schizosaccharomyces, etc.) ou células bacterianas, ou são bactérias gram-positivas ou bactérias gram-negativas, ou são E. coli, ou são uma cepa B de E. coli, ou são células EB0001 de E. coli (cepa B) (também chamadas de células ASE(DGH) de E. coli), ou são células EB0002 de E. coli (cepa B). Em experimentos de desenvolvimento com células hospedeiras de E. coli tendo citoplasma oxidante, especificamente as cepas B de E. coli SHuffle® Express (Catálogo NEB No. C3028H) e SHuffle® T7 Express (Catálogo NEB No. C3029H) e a cepa K de E. coli SHuffle® T7 (Catálogo NEB No. C3026H), determinamos que essas cepas B de E. coli com citoplasma oxidante são capazes de crescer até densidades celulares muito mais elevadas do que a cepa K de E. coli mais próxima correspondente.
[0077] Células hospedeiras procarióticas. Em algumas modalidades da invenção, os construtos de expressão projetados para a expressão de produtos gênicos são fornecidos em células hospedeiras, tais como células hospedeiras procarióticas. As células hospedeiras procarióticas podem incluir archaea (tais como Haloferax volcanii, Sulfolobus solfataricus), bactérias Gram-positivas (tais como Bacillus subtilis, Bacillus licheniformis, Brevibacillus choshinensis, Lactobacillus brevis, Lactobacillus buchneri, Lactococcus lactis e Streptomyces lividans), ou bactérias Gram-negativas, incluindo Alphaproteobacteria (Agrobacterium tumefaciens, Caulobacter crescentus, Rhodobacter sphaeroides e Sinorhizobium meliloti),
Betaproteobacteria (Alcaligenes eutrophus) e Gammaproteobacteria (Acinetobacter calcoaceticus, Azotobacter vinelandii, Escherichia coli, Pseudomonas aeruginosa e Pseudomonas putida). As células hospedeiras preferidas incluem Gammaproteobacteria da família Enterobacteriaceae, tais como Enterobacter, Erwinia, Escherichia (incluindo E. coli), Klebsiella, Proteus, Salmonella (incluindo Salmonella typhimurium), Serratia (incluindo Serratia marcescans) e Shigella.
[0078] Células hospedeiras eucarióticas. Muitos tipos adicionais de células hospedeiras podem ser utilizados para os sistemas de expressão da invenção, incluindo células eucarióticas tais como levedura (Candida shehatae, Kluyveromyces lactis, Kluyveromyces fragilis, outra espécie Kluyveromyces, Pichia pastoris, Saccharomyces cerevisiae, Saccharomyces pastorianus também conhecida como Saccharomyces carlsbergensis, Schizosaccharomyces pombe, espécie Dekkera/Brettanomyces e Yarrowia lipolytica); outros fungos (Aspergillus nidulans, Aspergillus niger, Neurospora crassa, Penicillium, Tolypocladium, Trichoderma reesia); linhagens celulares de inseto (células de Drosophila melanogaster Schneider 2 e células de Spodoptera frugiperda Sf9) e linhagens celulares de mamífero, incluindo linhagens celulares imortalizadas (células de ovário de hamster chinês (CHO), células HeLa, células de rim de hamster bebê (BHK), células de rim de macaco (COS), células de rim embrionário humano (HEK, 293 ou HEK-293), e células de carcinoma hepatocelular humano (Hep G2)). As células hospedeiras acima estão disponíveis na American Type Culture Collection.
[0079] Alterações nas funções do gene da célula hospedeira. Certas alterações podem ser feitas nas funções do gene das células hospedeiras compreendendo construtos de expressão induzíveis, para promover a indução eficiente e homogênea da população de células hospedeiras por um indutor.
De preferência, a combinação de construtos de expressão, genótipo de célula hospedeira e condições de indução resulta em pelo menos 75% (mais preferivelmente pelo menos 85%, e o mais preferível, pelo menos 95%) das células na cultura que expressam o produto gênico de cada promotor, conforme medido pelo método de Khlebnikov et al. "Regulatable arabinose- inducible gene expression system with consistent control in all cells of a culture", J Bacteriol 2000 Dec; 182(24): 7029-7034, conforme descrito na WO2014025663A1, Exemplo 8B.
Para células hospedeiras diferentes de E. coli, essas alterações podem envolver a função de genes que são estruturalmente semelhantes a um gene de E. coli, ou genes que realizam uma função dentro da célula hospedeira semelhante àquela do gene de E. coli.
Alterações nas funções do gene da célula hospedeira incluem a eliminação ou redução da função do gene pela exclusão da sequência codificadora da proteína do gene em sua totalidade, ou exclusão de uma parte bastante grande do gene, inserção da sequência no gene ou de outra forma alterar a sequência do gene de modo que um nível de produto gênico funcional seja feito a partir desse gene.
As alterações nas funções do gene da célula hospedeira também incluem o aumento da função do gene, por exemplo, através da alteração do promotor nativo para criar um promotor mais forte que direciona um nível mais alto de transcrição do gene, ou introdução de uma mutação de sentido trocado na sequência de codificação da proteína que resulta em um produto gênico mais altamente ativo.
As alterações nas funções do gene da célula hospedeira incluem a alteração da função do gene de qualquer forma, incluindo, por exemplo, a alteração de um promotor induzível nativo para criar um promotor que é ativado constitutivamente.
Além das alterações nas funções gênicas para o transporte e metabolismo de indutores, conforme descrito nesta invenção em relação aos promotores induzíveis, e/ou uma expressão alterada de proteínas chaperonas, também é possível alterar o ambiente de redução- oxidação da célula hospedeira.
[0080] Ambiente de redução-oxidação da célula hospedeira. Em células bacterianas tais como E. coli, as proteínas que precisam de ligações de dissulfeto são tipicamente exportadas para o periplasma, onde a formação da ligação de dissulfeto e a isomerização são catalisadas pelo sistema Dsb, compreendendo DsbABCD e DsbG. A expressão aumentada da cisteína oxidase DsbA, a dissulfeto isomerase DsbC ou combinações das proteínas Dsb, que são todas normalmente transportadas para o periplasma, tem sido utilizada na expressão de proteínas heterólogas que requerem ligações de dissulfeto (Makino et al., "Strain engineering for improved expression of recombinant proteins in bacteria", Microb Cell Fact 2011 May 14; 10: 32). Também é possível expressar formas citoplasmáticas dessas proteínas Dsb, tal como uma versão citoplasmática de DsbA e/ou de DsbC ('cDsbA' ou 'cDsbC'), que não possui um peptídeo de sinal e, portanto, não é transportada para o periplasma. Proteínas Dsb citoplasmáticas tais como cDsbA e/ou cDsbC, são úteis para tornar o citoplasma da célula hospedeira mais oxidante e assim mais propício à formação de ligações de dissulfeto em proteínas heterólogas produzidas no citoplasma. O citoplasma da célula hospedeira também pode se tornar menos redutor e, portanto, mais oxidante através da alteração da tioredoxina e os sistemas de enzimas glutaredoxina/glutationa diretamente: cepas mutantes defeituosas em glutationa redutase (gor) ou glutationa sintetase (gshB), juntamente com tiorredoxina redutase (trxB), tornam o citoplasma oxidante. Essas cepas são incapazes de reduzir os ribonucleotídeos e, portanto, não podem desenvolver na ausência de redutor exógeno, tal como o ditiotreitol (DTT). Mutações de supressor (tal como ahpC* e ahpCΔ,
Lobstein et al., "SHuffle, a novel Escherichia coli protein expression strain capable of correctly folding disulfide bonded proteins in its cytoplasm", Microb Cell Fact 2012 May 8; 11: 56; doi: 10.1186/1475- 2859-11-56) no gene ahpC, que codifica a peroxirredoxina AhpC, se convertem em uma dissulfeto redutase que gera glutationa reduzida, permitindo a canalização de elétrons para a enzima ribonucleotídeo redutase e que permite as células defeituosas em gor e trxB, ou com defeito em gshB e trxB, para desenvolver na ausência de DTT.
Uma classe diferente de formas mutadas de AhpC pode permitir que as cepas, com defeito na atividade da gama-glutamilcisteína sintetase (gshA) e com defeito em trxB, cresçam na ausência de DTT; estes incluem AhpC V164G, AhpC S71F, AhpC E173/S71F, AhpC E171Ter e AhpC dup162-169 (Faulkner et al., "Functional plasticity of a peroxidase allows evolution of diverse disulfide-reducing pathways", Proc Natl Acad Sci U S A 2008 May 6; 105(18): 6735-6740, Epub 2008 May 2). Em tais cepas com citoplasma oxidante, as proteínas cisteínas expostas tornam-se prontamente oxidadas em um processo que é catalisado pelas tioredoxinas, em uma reversão de sua função fisiológica, resultando na formação de ligações de dissulfeto.
Outras proteínas que podem ser úteis para reduzir os efeitos do estresse oxidativo em células hospedeiras de um citoplasma oxidante são HPI (hidroperoxidase I) catalase-peroxidase codificada por E. coli katG e HPII (hidroperoxidase II) catalase-peroxidase codificada por E. coli katE, que desproporciona o peróxido em água e O2 (Farr and Kogoma, "Oxidative stress responses in Escherichia coli and Salmonella typhimurium", Microbiol Rev. 1991 Dec; 55(4): 561-585; Review). O aumento dos níveis de proteína KatG e/ou KatE em células hospedeiras por meio da coexpressão induzida ou através de níveis elevados de expressão constitutiva é um aspecto de algumas modalidades da invenção.
[0081] Outra alteração que pode ser feita nas células hospedeiras é expressar a sulfidril oxidase Erv1p do espaço da membrana interna da mitocôndria de levedura no citoplasma da célula hospedeira, que demonstrou aumentar a produção de uma variedade de proteínas complexas com ligações de dissulfeto de origem eucariótica no citoplasma de E. coli, mesmo na ausência de mutações em gor ou trxB (Nguyen et al., "Pre-expression of a sulfhydryl oxidase significantly increases the yields of eukaryotic disulfide bond containing proteins expressed in the cytoplasm of E. coli" Microb Cell Fact 2011 Jan 7; 10: 1).
[0082] As células hospedeiras compreendendo construtos de expressão preferivelmente também expressam cDsbA e/ou cDsbC e/ou Erv1p; são deficientes na função do gene trxB; também são deficientes na função do gene de gor, gshB e/ou gshA; opcionalmente possuem níveis aumentados de função do gene katG e/ou katE; e opcionalmente expressam uma forma mutante apropriada de AhpC de modo que as células hospedeiras possam ser cultivadas na ausência de DTT.
[0083] Glicosilação de produtos gênicos polipeptídicos. As células hospedeiras podem ter alterações em sua capacidade de glicosilar polipeptídeos. Por exemplo, as células hospedeiras eucarióticas podem ter eliminado ou reduzido a função do gene em genes de glicosiltransferase e/ou oligosaccariltransferase, prejudicando a glicosilação eucariótica normal de polipeptídeos para formar glicoproteínas. Células hospedeiras procarióticas tais como E. coli, que normalmente não glicosilam polipeptídeos, podem ser alteradas para expressar um conjunto de genes eucarióticos ou procarióticos que fornecem uma função de glicosilação (DeLisa et al., "Glycosylated protein expression in prokaryotes", WO2009089154A2, 2009 Jul 16).
[0084] Cepas de células hospedeiras disponíveis com funções gênicas alteradas. Para criar cepas preferidas de células hospedeiras a serem utilizadas nos sistemas de expressão e métodos da invenção, é útil começar com uma cepa que já compreende as alterações genéticas desejadas, exemplos das quais são fornecidos na Tabela 2. Tabela 2. Cepas de Células Hospedeiras Cepa: Genótipo: Fonte ou Referência E. coli ∆(ara-leu)7697 ∆lacX74 ∆phoA PvuII phoR araD139 ahpC galE Merck (EMD Millipore Origami™ 2 galK rpsL F′[lac+ lacIq pro] gor522::Tn10 trxB (StrR, TetR) Chemicals) Catalog No. 71344 E. coli fhuA2 [lon] ompT ahpC gal λatt::pNEB3-r1-cDsbC (Spec, lacI) New England Biolabs SHuffle® ∆trxB sulA11 R(mcr-73::miniTn10--TetS)2 [dcm] R(zgb- Catalog No. C3028H Express 210::Tn10 --TetS) endA1 ∆gor ∆(mcrC-mrr)114::IS10 EB0001 ∆araBAD fhuA2 [lon] ompT ahpC∆ gal λatt::pNEB3-r1-cDsbC WO2016205570A1 (Spec, lacI) ∆trxB sulA11 R(mcr-73::miniTn10--TetS)2 [dcm] R(zgb-210::Tn10--TetS) ∆araEp::J23104 ∆scpA-argK-scpBC endA1 rpsL-Arg43 ∆gor ∆(mcrC-mrr)114::IS10 EB0002 ∆araBAD fhuA2 prpD [lon] ompT ahpC∆ gal λatt::pNEB3-r1- WO2016205570A1 cDsbC (Spec, lacI) ∆trxB sulA11 R(mcr-73::miniTn10--TetS)2 [dcm] R(zgb-210::Tn10--TetS) ∆araEp::J23104 ∆scpA-argK- scpBC endA1 rpsL-Arg43 ∆gor ∆(mcrC-mrr)114::IS10
[0085] Métodos de alteração das funções do gene da célula hospedeira. Existem muitos métodos conhecidos na técnica para fazer alterações nos genes da célula hospedeira a fim de eliminar, reduzir ou alterar a função do gene. Métodos de efetuar interrupções direcionadas de genes em células hospedeiras, tais como E. coli e outros procariontes foram descritos (Muyrers et al., "Rapid modification of bacterial artificial chromosomes by ET-recombination", Nucleic Acids Res 1999 Mar 15; 27(6): 1555-1557; Datsenko and Wanner, "One-step inactivation of chromosomal genes in Escherichia coli K-12 using PCR products", Proc Natl Acad Sci U S A 2000 Jun 6; 97(12): 6640-6645), e kits para uso dos métodos de recombinação Red/ET semelhantes estão disponíveis comercialmente (por exemplo, o Quick & Easy E. coli Gene Deletion Kit da Gene Bridges GmbH, Heidelberg, Germany). Em uma modalidade da invenção, a função de um ou mais genes de células hospedeiras é eliminada ou reduzida por meio da identificação de uma sequência de nucleotídeo dentro da sequência de codificação do gene a ser interrompido, tal como uma das sequências de codificação da subcepa MG1655 de E. coli K-12 no presente documento incorporadas por referência para localização genômica da sequência, e mais especificamente através da seleção de dois trechos adjacentes de 50 nucleotídeos cada dentro dessa sequência de codificação. O Quick & Easy E. coli Gene Deletion Kit é então utilizado de acordo com as instruções do fabricante para inserir um construto polinucleotídico contendo um marcador selecionável entre os trechos adjacentes selecionados da sequência de codificação, eliminando ou reduzindo a função normal do gene. Os métodos de recombinação Red/ET também podem ser utilizados para substituir uma sequência de promotor por aquela de um promotor diferente, tal como um promotor constitutivo ou um promotor artificial que é previsto de promover um certo nível de transcrição (De Mey et al., "Promoter knock-in: a novel rational method for the fine tuning of genes", BMC Biotechnol 2010 Mar 24; 10: 26). A função dos genes da célula hospedeira também pode ser eliminada ou reduzida por métodos de silenciamento de RNA (Man et al., "Artificial trans-encoded small non- coding RNAs specifically silence the selected gene expression in bacteria", Nucleic Acids Res 2011 Apr; 39(8): e50, Epub 2011 Feb 3). Além disso, mutações conhecidas que alteram a função do gene da célula hospedeira podem ser introduzidas nas células hospedeiras através de métodos genéticos tradicionais. IV. Métodos para o Crescimento de Células Hospedeiras
[0086] Crescimento de Pequeno Volume. As células hospedeiras utilizadas para realizar os métodos da invenção podem ser cultivadas em pequenos volumes com a finalidade de testar o crescimento ou as condições de indução, ou para a produção de vários produtos gênicos diferentes, etc. A natureza dos experimentos a serem executados determinará o volume em que as células hospedeiras devem ser cultivadas, tal como um ml a um litro, ou entre 5 ml e 500 ml, ou qualquer volume conveniente. Em certas modalidades, o recipiente no qual as células hospedeiras são cultivadas é movido repetidamente a fim de agitar o meio de crescimento e, assim, fornecer oxigênio às células hospedeiras. As células hospedeiras são cultivadas em um meio contendo nutrientes adequados e quaisquer antibióticos necessários para selecionar a retenção pelas células hospedeiras de construtos de expressão que fornecem resistência a antibióticos. Exemplos do crescimento de pequeno volume de células hospedeiras são fornecidos no Exemplo 1. Para determinar a quantidade apropriada de indutor a ser utilizado para induzir a expressão de construtos de expressão induzível presentes nas células, experimentos como aqueles descritos no Exemplo 10 podem ser vantajosamente executados com células hospedeiras cultivadas em pequenos volumes, tais como em placas de múltiplas cavidades.
[0087] Fermentação. Os processos de fermentação envolvidos na produção de proteínas recombinantes irão utilizar um modo de operação que se enquadra em uma das seguintes categorias: (1) operação descontínua (processo em batelada), (2) operação contínua e (3) operação semicontínua (batelada alimentada). Um processo em batelada é caracterizado pela inoculação do meio de cultura estéril (meio em batelada) com microrganismos no início do processo, cultivado por um período específico de reação. Durante o cultivo, as concentrações de células, as concentrações de substrato (fonte de carbono, sais de nutrientes, vitaminas, etc.) e as concentrações do produto se alteram. Uma boa mistura garante que não haja diferenças locais significativas na composição ou temperatura da mistura de reação. A reação não é estacionária e as células são cultivadas até que o substrato limitador de crescimento (geralmente a fonte de carbono) tenha sido consumido.
[0088] A operação contínua é caracterizada pelo fato de que meio de cultura fresco (meio de alimentação) é adicionado continuamente ao fermentador e os meios gastos e as células são retirados continuamente do fermentador na mesma taxa. Em uma operação contínua, a taxa de crescimento é determinada pela taxa de adição do meio e o rendimento do crescimento é determinado pela concentração do substrato limitador de crescimento (isto é, fonte de carbono). Todas as variáveis de reação e os parâmetros de controle permanecem constantes no tempo e, portanto, um estado constante no tempo é estabelecido no fermentador, seguido pela produtividade e produção constantes.
[0089] A operação semicontínua pode ser considerada uma combinação de operação contínua e em batelada. A fermentação é iniciada como um processo descontínuo e quando o substrato limitador de crescimento foi consumido, um meio de alimentação contínuo contendo glicose e minerais é adicionado de uma maneira especificada (batelada alimentada). Em outras palavras, esta operação emprega um meio em batelada e um meio de alimentação para atingir o crescimento celular e a produção eficiente da proteína desejada. Nenhuma célula é adicionada ou retirada durante o período de cultivo e, portanto, o fermentador opera em bateladas no que diz respeito aos microrganismos. Embora a presente invenção possa ser utilizada em uma variedade de processos, incluindo aqueles mencionados acima, uma utilização particular é em conjunto com um processo em batelada alimentada.
[0090] Em cada um dos processos acima, o crescimento celular e o acúmulo de produto podem ser monitorados indiretamente, tirando vantagem de uma correlação entre a formação de metabólitos e alguma outra variável, tal como pH médio, densidade óptica, cor e acidez titulável. Por exemplo, a densidade óptica fornece uma indicação do acúmulo de partículas de células insolúveis e pode ser monitorada em produção utilizando uma unidade micro-OD acoplada a um dispositivo de exibição ou gravador, ou off-line por amostragem. As leituras de densidade óptica em 600 nanômetros (OD600) são utilizadas como um meio de determinar o peso seco da célula.
[0091] Fermentações de alta densidade celular são geralmente descritas como aqueles processos que resultam em um rendimento de >30 g de peso seco de células/litro (OD600 > 60) no mínimo, e em certas modalidades resultam em um rendimento de > 40 g de peso seco de células/litro (OD600 > 80). Todos os processos de fermentação de alta densidade celular empregam um meio nutriente concentrado que é gradualmente dosado no fermentador em um processo em "baetlada alimentada". Um meio de alimentação de nutrientes concentrado é necessário para processos de alta densidade celular, a fim de minimizar a diluição do conteúdo do fermentador durante a alimentação. Um processo em batelada alimentada é necessário porque permite ao operador controlar a alimentação da fonte de carbono, o que é importante porque se as células forem expostas a altas concentrações da fonte de carbono o suficiente para gerar altas densidades celulares, as células irão produzir muito do subproduto inibidor, acetato, em que o crescimento irá parar (Majewski and Domach, "Simple constrained-optimization view of acetate overflow in E. coli", Biotechnol Bioeng 1990 Mar 25; 35(7): 732-738).
[0092] O ácido acético e seu íon desprotonado, o acetato, juntos representam um dos principais subprodutos inibidores do crescimento bacteriano e da produção de proteínas recombinantes em biorreatores. No pH 7, o acetato é a forma mais prevalente de ácido acético. Qualquer excesso de fonte de energia de carbono pode ser convertido em ácido acético quando a quantidade da fonte de energia de carbono excede em muito a capacidade de processamento da bactéria.
A pesquisa mostrou que a saturação do ciclo do ácido tricarboxílico e/ou da cadeia de transporte de elétrons é a causa mais provável do acúmulo de ácido acético.
A escolha do meio de crescimento pode afetar o nível de inibição do ácido acético; as células cultivadas em meios definidos podem ser afetadas pelo ácido acético mais do que aquelas cultivadas em meios complexos.
A substituição de glicose por glicerol também pode diminuir grandemente a quantidade de ácido acético produzida.
Acredita-se que o glicerol produz menos ácido acético do que a glicose porque sua taxa de transporte para a célula é muito mais lenta do que a da glicose.
No entanto, o glicerol é mais caro do que a glicose e pode fazer com que as bactérias cresçam mais lentamente.
O uso de temperaturas de crescimento reduzidas também pode diminuir a velocidade de absorção da fonte de carbono e da taxa de crescimento, diminuindo assim a produção de ácido acético.
As bactérias produzem ácido acético não apenas na presença de uma fonte de energia de carbono em excesso ou durante o crescimento rápido, mas também sob condições anaeróbicas.
Quando as bactérias tais como a E. coli são deixadas crescer muito rápido, elas podem exceder a capacidade de liberação de oxigênio do sistema de biorreator, o que pode levar a condições de crescimento anaeróbico.
Para evitar que isso aconteça, uma taxa de crescimento constante mais lenta pode ser mantida por meio da limitação de nutrientes.
Outros métodos para reduzir o acúmulo de ácido acético incluem modificação genética para prevenir a produção de ácido acético, adição de genes de utilização de ácido acético e seleção de cepas com ácido acético reduzido.
A E. coli BL21(DE3) é uma das cepas que demonstrou produzir níveis mais baixos de ácido acético por causa de sua capacidade de utilizar ácido acético em sua via de derivação de glioxilato.
[0093] Vários fermentadores de em batelada alimentada em grande escala estão disponíveis para a produção de proteínas recombinantes. Fermentadores maiores possuem pelo menos 1000 litros de capacidade, de preferência cerca de 1000 a 100.000 litros de capacidade (isto é, volume de trabalho), deixando espaço adequado para o espaço livre. Esses fermentadores utilizam impulsores agitadores ou outros meios adequados para distribuir oxigênio e nutrientes, especialmente glicose (a fonte de carbono/energia preferida). A fermentação em pequena escala geralmente se refere à fermentação em um fermentador que não possui mais do que aproximadamente 100 litros de capacidade volumétrica e, em algumas modalidades específicas, não mais do que aproximadamente 10 litros.
[0094] As condições de reação padrão para os processos de fermentação utilizados para produzir proteínas recombinantes geralmente envolvem a manutenção do pH em cerca de 5,0 a 8,0 e temperaturas de cultivo variando de 20 a 50 graus C para células hospedeiras microbianas tais como E. coli. Em uma modalidade da presente invenção que utiliza E. coli como o sistema de hospedeiro, a fermentação é executada em um pH ideal de cerca de 7,0 e uma temperatura de cultivo ideal de cerca de 30 graus C.
[0095] Os componentes do meio nutriente padrão nesses processos de fermentação geralmente incluem uma fonte de energia, carbono, nitrogênio, fósforo, magnésio e traços de ferro e cálcio. Além disso, o meio pode conter fatores de crescimento (tais como vitaminas e aminoácidos), sais inorgânicos e quaisquer outros precursores essenciais para a formação do produto. O meio pode conter um organofosfato transportável tal como um glicerofosfato, por exemplo, um alfa-glicerofosfato e/ou um beta-glicerofosfato e, como um exemplo mais específico, glicerol-2-fosfato e/ou glicerol-3-fosfato. A composição elementar da célula hospedeira sendo cultivada pode ser utilizada para calcular a proporção de cada componente necessária para suportar o crescimento celular. As concentrações dos componentes irão variar dependendo se o processo é um processo de baixa densidade celular ou um processo de alta densidade celular. Por exemplo, as concentrações de glicose em processos de fermentação em batelada de baixa densidade celular variam de 1 a 5 g/L, enquanto que os processos em batelada de alta densidade celular utilizam concentrações de glicose que variam de 45 g/L a 75 g/L. Além disso, o meio de crescimento pode conter concentrações modestas (por exemplo, na faixa de 0,1 a 5 mM, ou 0,25 mM, 0,5 mM, 1 mM, 1,5 mM ou 2 mM) de osmólitos protetores tais como betaína, dimetilsulfoniopropionato e/ou colina.
[0096] Um ou mais indutores podem ser introduzidos no meio de crescimento para induzir a expressão dos produtos gênicos de interesse. A indução pode ser iniciada durante a fase de crescimento exponencial, por exemplo, tal como em direção ao final da fase de crescimento exponencial, mas antes que a cultura atinja a densidade celular máxima, ou em momentos anteriores ou posteriores durante a fermentação. Ao expressar os produtos gênicos de interesse de um ou mais promotores induzíveis pela depleção de nutrientes tais como fosfato, a indução ocorrerá quando esse nutriente tiver sido suficientemente esgotado do meio de crescimento, sem a adição de um indutor exógeno.
[0097] Durante o crescimento exponencial das células hospedeiras, a taxa metabólica é diretamente proporcional à disponibilidade de oxigênio e de uma fonte de carbono/energia; assim, reduzir os níveis de oxigênio ou fontes de carbono/energia disponíveis, ou ambos, reduzirá a taxa metabólica. A manipulação dos parâmetros operacionais do fermentador, tais como taxa de agitação ou contrapressão, ou redução da pressão de O2, modula os níveis de oxigênio disponíveis e pode reduzir a taxa metabólica da célula hospedeira. A redução da concentração ou taxa de liberação, ou ambas, das fontes de carbono/energia possui um efeito semelhante. Além disso, dependendo da natureza do sistema de expressão, a indução da expressão pode levar a uma diminuição na taxa metabólica da célula hospedeira. Finalmente, ao atingir a densidade celular máxima, a taxa de crescimento para ou diminui drasticamente. A redução na taxa metabólica da célula hospedeira pode resultar em uma expressão mais controlada dos produtos gênicos de interesse, incluindo os processos de dobramento e montagem de proteínas. A taxa metabólica da célula hospedeira pode ser avaliada através da medição das taxas de crescimento celular, taxas de crescimento específicas ou taxas de crescimento instantâneo (através da medição da densidade óptica (OD) tal como OD600 e/ou opcionalmente, através da conversão da OD em biomassa). A biomassa aproximada (peso seco da célula) em cada ponto testado é calculada: biomassa aproximada (g) = (OD600 ÷ 2) x volume (L). As taxas de crescimento desejáveis estão, em certas modalidades da invenção, na faixa de 0,01 a 0,7, ou estão na faixa de 0,05 a 0,3, ou estão na faixa de 0,1 a 0,2, ou são aproximadamente 0,15 (0,15 mais ou menos 10%), ou são 0,15.
[0098] Equipamento de Fermentação. A seguir estão os exemplos de equipamentos que podem ser utilizados para cultivar células hospedeiras; muitas outras configurações de sistemas de fermentação estão disponíveis comercialmente. As células hospedeiras podem ser cultivadas em um fermentador encamisado de água New Brunswick BioFlo/CelliGen 115 (Eppendorf North America, Hauppauge, New York), tamanho de recipiente de 1 L com um impulsor 2X Rushton e um controlador BioFlo/CelliGen 115 Fermentor/Bioreactor;
temperatura, pH e oxigênio dissolvido (DO) são monitorados. Também é possível cultivar células hospedeiras em um sistema DASGIP configurável quatro vezes (Eppendorf North America, Hauppauge, New York) compreendendo quatro recipientes de fermentação DASbox de 60 a 250 ml, cada um com um impulsor Rushton 2X, um condensador de exaustão DASbox, e um módulo de alimentação e monitoramento DASbox (que inclui um sensor de temperatura, um sensor de pH/oxirredução e um sensor de oxigênio dissolvido). O equipamento de fermentação adequado também inclui fermentadores de laboratório NLF 22 de 30 L (Bioengineering, Inc., Somerville, Massachusetts), com capacidade de 30 L e volume de trabalho máximo de 20 L em um recipiente de aço inoxidável; dois impulsores Rushton, alimentados apenas com ar; e um sistema de controle que executa o software BioSCADA que leva em conta o rastreamento e controle de todos os parâmetros relevantes, incluindo pH, DO, O2 de exaustão, CO2 de exaustão, temperatura e pressão. V. Métodos de Ssolubilização e Purificação.
[0099] Os produtos gênicos expressos pelos métodos descritos nesta invenção podem ser purificados utilizando qualquer um de uma variedade de métodos de purificação. Quando os produtos gênicos são expressos de modo a produzir complexos solubilizáveis, como no presente documento descrito e como nas modalidades particulares descritas nos Exemplos 1 e 2, um método de purificação altamente vantajoso pode ser utilizado para produzir com eficiência o produto gênico devidamente dobrado e ativo, sem a necessidade de etapas adicionais de redobramento. O Exemplo 3 descreve um outro método de 'solubilização direta' para purificar produtos gênicos expressos como complexos solubilizáveis, incluindo produtos gênicos que formam ligações de dissulfeto, sem a necessidade de centrifugação após a lise para separar as frações solúveis e insolúveis, e sem o uso de agentes redutores. Os métodos para purificar complexos de produto gênico solubilizável dessas maneiras são delineados esquematicamente na Figura 1 e são descritos com maiores detalhes abaixo.
[00100] Coleta de células hospedeiras por centrifugação. As células hospedeiras que compreendem construtos de expressão são cultivadas e a expressão do produto gênico de interesse é induzida como descrito mais adiante nesta invenção, resultando na produção de complexos solubilizáveis do produto gênico de interesse dentro da célula hospedeira. Após os períodos de crescimento e indução estarem completos, as células hospedeiras são coletadas por centrifugação em 4.000 x g a 4 graus C durante 10 minutos, por exemplo. As células hospedeiras podem ser congeladas neste ponto e armazenadas para purificação posterior.
[00101] Lise de células hospedeiras. O pélete resultante de células hospedeiras intactas é então submetido à lise utilizando um de vários métodos alternativos. O pélete de células hospedeiras é colocado novamente em suspensão em um tampão de lise não desnaturante, tal como solução salina tamponada com fosfato (PBS) ou solução salina tamponada com Tris (TBS) suplementada com NaCl de 0 mM a 300 mM ou com L-cisteína 2,5 mM, pH 9,5. Após a colocação novamente em suspensão em tampão de lise, as células hospedeiras podem ser submetidas à lise por métodos incluindo lise enzimática ou química, lise mecânica e/ou um método de congelamento-descongelamento. Para a lise enzimática, a lise pode ser executada através da adição de lisozima recombinante, benzonase e octil glucosídeo ao tampão de lise. Para a lise mecânica, as células hospedeiras colocadas novamente em suspensão são passadas uma ou mais vezes através de um microfluidizador, tal como um microfluidizador Microfluidics model LV1 para volumes de até 60 ml, ou um microfluidizador
Microfluidics model M-110Y para volumes maiores que 60 ml (Microfluidics International Corp., Westwood, Massachusetts), ou um homogeneizador de mesa PandaPLUS 2000 ou um GEA Niro (GEA North America, Columbia, Maryland). Para o método de congelamento e descongelamento, a suspensão de células é congelada a -80 graus C e depois descongelada em uma temperatura entre 25 e 37 graus C.
[00102] Após a lise, a mistura de células submetidas à lise é opcionalmente centrifugada para agregar os complexos de produtos gênicos solubilizáveis. A velocidade e o tempo dessa etapa de centrifugação podem variar de 3.300 a 20.000 x g e de 30 a 60 minutos. O uso de uma velocidade mais alta pode resultar em um pélete do complexo de produto gênico solubilizável que é mais difícil de colocar em suspensão. Quanto mais baixa a velocidade utilizada nesta etapa de centrifugação, tanto maior a duração da centrifugação que é necessária para completar a separação do complexo de produto gênico solubilizável do sobrenadante. É possível variar a concentração de sal e/ou o pH do lisado celular para alterar a centrifugação ou outras condições necessárias para separar os complexos de produtos gênicos solubilizáveis de outros componentes no lisado celular.
[00103] Uma vantagem significativa para coletar o produto gênico de interesse desta forma é que a maioria das proteínas da célula hospedeira potencialmente contaminante e outras moléculas permanecerão no sobrenadante e serão removidas do complexo de produto gênico solubilizável agregado, que é então uma preparação altamente enriquecida para o produto gênico de interesse. Alternativamente, se o sobrenadante remanescente após a agregação dos complexos solubilizáveis retiver produto gênico suficiente, o produto gênico neste sobrenadante pode ser solubilizado como descrito para o método de solubilização direta e/ou purificado mais adiante. Se a análise do material agregado indicar que um número significativo de células sobrevivem à lise e estão sendo centrifugadas com os complexos de produtos gênicos solubilizáveis, é possível utilizar uma solução densa e/ou viscosa, tal como solução de sacarose de alta concentração, como um "bloco" no procedimento de centrifugação para separar as células intactas dos complexos de produtos gênicos solubilizáveis. Quando a lise mecânica é utilizada, a mistura de células submetidas à lise pode ser passada através do microfluidizador várias vezes (por exemplo, quatro ou cinco vezes). Quando o procedimento de centifugação acima é omitido em um método de solubilização direta, o lisado celular é misturado com reagentes para criar as condições para solubilização dos complexos de produtos gênicos solubilizáveis, conforme descrito abaixo.
[00104] O produto gênico é liberado dos complexos solubilizáveis pela colocação em uma solução de solubilização, resultando no produto gênico solubilizado. O produto gênico, em um pélete resultante da centrifugação, ou no lisado celular, é solubilizado como se segue. As soluções de solubilização contêm de preferência um ou mais agentes caotrópicos, tais como n-butanol, etanol, cloreto de guanidínio, cloridrato de guanidina, perclorato de lítio, acetato de lítio, cloreto de magnésio, fenol, 2-propanol, dodecil sulfato de sódio, tiouréia ou uréia. Soluções de solubilização exemplares podem conter uréia 7 M a 8 M em PBS ou TRIS em pH 9,5, opcionalmente com L- cisteína 2,5 mM ou, alternativamente, cloridrato de guanidina 6 M em PBS em pH 7,5; experimentos de solubilização eficazes utilizaram tampões de solubilização em valores de pH variando de 6,5 a 11,0. Experiências para determinar composições alternativas de tampão a serem utilizadas para solubilização são descritas no Exemplo 5. O pélete pode ser opcionalmente lavado antes de colocar novamente em suspensão. Após a adição de tampão de solubilização ao pélete, é mais eficaz agitar mecanicamente o tubo contendo o pélete, por exemplo, pelo uso de um vórtice de placa durante pelo menos 10 minutos, do que colocar novamente em suspensão o pélete manualmente utilizando uma ponta de pipeta. A modificação química reversível do produto gênico, por exemplo, citraconilação dos resíduos de lisina livre e grupos amino primários, pode alterar a solubilidade do produto gênico.
[00105] Clarificação opcional do produto gênico solubilizado por centrifugação. Como mostrado na Figura 1, a solução do produto gênico solubilizado pode ser opcionalmente clarificada por centrifugação, tal como a 7.000 x g durante 1 hora a 16 graus C. O sobrenadante, que contém o produto gênico solubilizado, é retido após a centrifugação. Um procedimento de clarificação pode ser executado antes e/ou após colocar o produto gênico solubilizado em uma solução que é menos concentrada do que a solução de solubilização, conforme descrito abaixo.
[00106] Colocar o produto gênico solubilizado em uma solução que é menos concentrada do que a solução de solubilização. Para amostras de produtos gênicos de proteína que devem ser analisados por mapeamento de peptídeos, o produto gênico solubilizado é tipicamente colocado em uma solução tendo uma concentração de desnaturante de duas a dez vezes reduzida, utilizando métodos tais como diálise, diluição ou diafiltração, visto que a presença de uréia 7 M a 8 M ou cloridrato de guanidina 6 M inibe a eficiência de clivagem de várias proteases. Por exemplo, após a solubilização em uréia 7M a 8M em PBS ou TRIS, pH 6,5 a 9,5, opcionalmente com L-cisteína 2,5 mM, as amostras contendo o produto gênico podem ser colocadas em uréia 2M a 4M em PBS ou TRIS, pH 6,5 a 9,5, opcionalmente com L- cisteína 2,5 mM e incubado durante um período de 10 a 120 horas, por exemplo, a 16 graus C com agitação.
[00107] Formação opcional de solução com maior concentração de produto gênico. Para propósitos de armazenamento, purificação adicional ou caracterização, a solução do produto gênico solubilizado pode ser reconcentrada para resultar em uma solução com uma concentração mais elevada do produto gênico. Isto pode ser conseguido através da ativação da solução sobre uma coluna de cromatografia e eluição no tampão desejado, como descrito abaixo, ou por dessalinização por rotação ou diafiltração como descrito abaixo, ou por outros métodos conhecidos. Outra alternativa é o uso de um método de precipitação tal como a precipitação com sulfato de amônio para precipitar o produto gênico; o produto gênico pode ser opcionalmente lavado antes da colocação novamente em suspensão do pélete no tampão desejado na concentração desejada.
[00108] Os produtos gênicos com sequências de clivagem podem ser opcionalmente clivados através do tratamento químico ou enzimático. Os produtos gênicos que compreendem, por exemplo, sequências que são clivadas por enzimas tais como tripsina, e/ou sequências tais como a sequência de clivagem química 'DP' (Asp-Pro) descrita acima e no Exemplo 2, podem ser clivados pelo tratamento apropriado enzimático ou químico antes do uso ou purificação adicional.
[00109] O produto gênico solubilizado pode ser opcionalmente purificado a mais. Por exemplo, produtos gênicos que incluem uma marca 6xHis podem ser purificados através da cromatografia de afinidade por íons metálicos imobilizados (IMAC), tal como o uso de uma coluna de níquel - ácido nitrilotriacético (Ni-NTA) para reter especificamente o produto gênico marcado 6xHis de interesse enquanto outras moléculas fluem completamente. A IMAC explora as interações entre resíduos de histidina e íons metálicos divalentes, mais comumente Ni2+; outros íons de metal, incluindo Cu2+, Co2+, Fe2+ e Zn2+, também mostraram ter afinidade com relação aos resíduos His.
Os íons metálicos são tipicamente imobilizados na matriz por meio de vários sistemas quelantes de metal, incluindo ácido iminodiacético (IDA) e o ácido nitrilotriacético (NTA) mais comumente utilizado.
Uma grande variedade de matrizes está disponível comercialmente, tal como ácido níquel-nitrilotriacético (Ni-NTA), Sepharose de Ni e carboxilmetilaspartato de cobre (CO-CMA). A coluna pode ser equilibrada com um tampão tal como Tris 50 mM, uréia 3 M, NaCl 0,5 M, imidazol 25 mM, pH 8,0. Após a ligação do produto gênico marcado com 6xHIs, uma etapa de lavagem com um tampão contendo uma baixa concentração de imidazol (0 mM, ou 10 a 50 mM), ou um tampão com um pH superior ou inferior do que aquele do tampão de ligação, pode ser incluído para remover proteínas não específicas que estão fracamente ligadas à coluna durante a carga de amostra.
Por exemplo, um tampão de lavagem de Tris 50 mM, NaCl 100 mM, pH 10 pode ser utilizado.
O produto gênico marcado com 6xHis pode ser eluído da matriz utilizando um tampão contendo imidazol em uma concentração de pelo menos imidazol 100 mM, ou imidazol 250 a 500 mM, ou imidazol 500 mM.
Também é possível eluir os produtos gênicos de interesse através da diminuição do pH do tampão e/ou incluindo agentes quelantes tais como EDTA (em uma concentração de 50 a 200 mM ou 100 mM) no tampão de eluição.
Por exemplo, um tampão de eluição de Tris 50 mM, NaCl 100 mM, imidazol 100 mM, pH 10 pode ser utilizado.
Os métodos de purificação para produtos gênicos que incluem uma etiqueta de poli-histidina são ainda descritos em Bornhorst and Falke, "Purification of proteins using polyhistidine affinity tags", Methods Enzymol 2000; 326: 245-254, que é no presente documento incorporado por referência.
Na purificação por IMAC de proteínas de pró-insulina CPBpro marcadas com 6xHis de complexos solubilizáveis, utilizando Ni-NTA Superflow (QIAgen, Germantown, Maryland) ou colunas HisTrap HP Ni Sepharose (GE Healthcare,
Pittsburgh, Pensilvânia), este método levou em conta a purificação do produto gênico da pró-insulina com pureza superior a 90%.
[00110] Para amostras que carecem de um marcador 6xHis, ou para procedimentos em que o uso de tal marcador não é necessário, cromatografia de troca catiônica ou aniônica, tal como o uso de resinas DEAE e/ou fase reversa ou cromatografia em fase líquida de alto eficiência (RPLC ou HPLC), pode ser empregada para separar ainda mais o produto gênico de interesse de outros contaminantes ou dos produtos indesejados de tratamento químico ou enzimático.
[00111] Os procedimentos químicos ou enzimáticos podem ser executados opcionalmente em produtos gênicos que são retidos por um substrato sólido tal como uma coluna: por exemplo, clivagem de tripsina de produtos gênicos de pró-insulina para propósitos preparativos ou analíticos, também chamada de transversão de pró- insulina para insulina madura, conforme descrito abaixo no Exemplo 3C.
[00112] Os procedimentos de cromatografia tais como IMAC também podem ser utilizados para eluir os complexos solubilizados em tampões diferentes daqueles utilizados para solubilizar os complexos, por exemplo, em imidazol 250 mM até 500 mM em PBS pH 7,5, opcionalmente seguido pela dessalinização giratória para trocar o tampão de eluição por um tampão mais preferível, como descrito no Exemplo 2D. Métodos para remover componentes de tampão indesejáveis tais como sais, incluem diálise, diafiltração (utilizando, por exemplo, concentradores centrífugos ou filtração de fluxo tangencial) e filtração em gel utilizando, por exemplo, microesferas de poliacrilamida (Bio-Rad, Hercules, Califórnia), resina Sephadex (GE Healthcare, Pittsburgh, Pennsylvania) e/ou outras resinas de cromatografia tais como resinas de exclusão de tamanho (Zeba™ Spin Desalting Columns, ThermoFisher Scientific Inc., Waltham, Massachusetts).
[00113] O produto gênico solubilizado pode ser química e/ou estruturalmente caracterizado. Para produtos gênicos de proteína contendo ligações de dissulfeto, o enovelamento apropriado da proteína produzida pelos métodos da invenção pode ser inferido a partir da presença de ligações de dissulfeto formadas corretamente. A identificação e caracterização de ligações de dissulfeto podem ser alcançadas utilizando métodos de mapeamento de peptídeos nos quais o tratamento químico ou enzimático da proteína é utilizado para produzir fragmentos de peptídeos. A separação e a identificação desses fragmentos são executadas por análise de cromatografia em fase líquida acoplada à espectrometria de massas (LC-MS); mapeamento de peptídeos e métodos de LC-MS são descritos ainda no Exemplo 8 abaixo. O mapeamento de peptídeos e a análise de LC- MS também podem identificar diferenças na estrutura primária da proteína, tais como mutações pontuais e modificações pós-translação (PTMs).
[00114] O número e a presença de ligações de dissulfeto oxidadas podem ser verificados para amostras de proteínas intactas. Os produtos gênicos da proteína podem ser tratados com um agente redutor, tal como o ditiotreitol (DTT) e/ou um reagente reativo com sulfidrila, tal como a iodoacetamida (IAA). A análise de LC-MS de amostras reduzidas e/ou alquiladas resultará em um aumento de massa de 2 Da por redução da ligação de dissulfeto e um aumento de massa de 57 Da por alquilação de cada tiol livre. O produto gênico da proteína pode ser caracterizado não apenas na formação do número correto de dissulfetos, mas também no arranjo de ligação com ponte correto ou "estrutura de dissulfeto". Este procedimento consiste em clivagem proteolítica, separação dos peptídeos resultantes por cromatografia em fase líquida de alta eficiência (HPLC) e análise de espectrometria de massa (MS) dos peptídeos representados por picos de HPLC. Para gerar produtos de peptídeo proteolítico, o produto gênico da proteína pode ser fragmentado por meio de agentes químicos, tais como brometo de cianogênio e/ou agentes enzimáticos, tais como tripsina, pepsina, lisil endopeptidase (Lys-C), glutamil endopeptidase (Glu-C) e peptidil-Asp metalo-endopeptidase (Asp-N). Para o produto gênico da proteína pró-insulina, uma reação de clivagem proteolítica sequencial pode ser executada utilizando Glu-C e tripsina, onde a ordem de adição de protease pode ser trocada (isto é, Glu-C depois tripsina, ou tripsina depois Glu-C). A reação de digestão da protease pode ser realizada em uma faixa de temperatura de 25 a 37 graus C durante 4 a 16 horas, com uma relação substrato para enzima variando de 12 a 200 microgramas de pró-insulina por micrograma de protease. A eficiência e a especificidade da clivagem proteolítica podem ser melhoradas através da adição de tensoativos comercialmente disponíveis, tais como ProteaseMax™ (Promega, Madison, Wisconsin) e RapiGest SF (Waters, Milford, Massachusetts), e/ou baixas concentrações de solventes orgânicos, tais como 10 a 20% de acetonitrila.
[00115] Conforme ainda descrito no Exemplo 2C e como mostrado na Figura 5, a análise de LC-MS demonstrou que aproximadamente 93% do produto gênico da proteína solubilizada tinha ligações de dissulfeto adequadamente formadas, sem um novo redobramento ou etapa de purificação após a solubilização. Outros métodos que podem ser utilizados para a caracterização do produto gênico solubilizado incluem eletroforese em gel, ensaios de atividade e separação por cromatografia em fase líquida de alta eficiência (HPLC) por meio de fase reversa analítica ou cromatografia de exclusão por tamanho (SEC). EXEMPLO 1 Uso de propeptídeos variantes CPBpro na produção de pró-insulina lispro A. Preparação de construtos de expressão para pró-insulina CPBpro_lispro
[00116] Nestas experiências, certas variantes de CPBpro foram utilizadas como propeptídeos na expressão em pequena escala de polipeptídeos de pró-insulina lispro. Construtos de expressão compreendendo polinucleotídeos que codificam os polipeptídeos de pró-insulina CPBpro mostrados na Tabela 3 e otimizados para expressão em E. coli foram sintetizados por ATUM (Newark, Califórnia). A primeira coluna da Tabela 3 fornece o número da proteína (PN) e SEQ ID NO para cada sequência de aminoácido do polipeptídeo da pró-insulina CPBpro completa. Os polinucleotídeos que codificam cada um dos polipeptídeos da pró-insulina CPBpro, apresentados a partir da sequência RBS através do códon de terminação, possuem as SEQ ID NOs 44, 46, 48, 50, 52 e 54, respectivamente. A segunda até quinta colunas da Tabela 3 indicam as sequências de aminoácido de cada parte de cada polipeptídeo de pró-insulina CPBpro: a sequência de propeptídeo de CPBpro N- terminal, e depois seguindo a ordem N para C, a cadeia B de insulina lispro (como mostrado na Tabela 1), o peptídeo C e a cadeia A de insulina lispro (como mostrado na Tabela 1). Tabela 3. Polipeptídeos de pró-insulina CPBpro lispro PN, SEQ ID Resíduos da variante CPBpro Cadeia C-peptídeo Cadeia NO: B da A da insulina insulina PN2.5; SEQ MHHHHHHEVFVENDISLHELASTQIDFWPDIE SEQ ID RRYPGDVKR SEQ ID ID NO: 43 VDFRVKAEDEVR (SEQ ID NO: 27) NO: 3 (SEQ ID NO: 11) NO: 1 PN2.6; SEQ MHHSGEHEVFVENDISLHELASTQIDFWPDIE SEQ ID RRYPGDVKR SEQ ID ID NO: 45 VDFRVKAEDVEDFELDRVR (SEQ ID NO: 28) NO: 3 (SEQ ID NO: 11) NO: 1 PN2.7; SEQ MHHHHHHEVFVENDISLHELASTQIDFWPDIE SEQ ID RRYPGDVKR SEQ ID ID NO: 47 VDFRVKAEDVEDFELDRVR (SEQ ID NO: 29) NO: 3 (SEQ ID NO: 11) NO: 1 PN2.8; SEQ MHHSGEHEVFVENDISLHELASTQIDFWPDIE SEQ ID RRYPGDVKR SEQ ID
PN, SEQ ID Resíduos da variante CPBpro Cadeia C-peptídeo Cadeia NO: B da A da insulina insulina ID NO: 49 VDFRVKAEDVEDFELQDSRVR (SEQ ID NO: NO: 3 (SEQ ID NO: 11) NO: 1 30) PN2.9; SEQ MHHHHHHEVFVENDISLHELASTQIDFWPDIE SEQ ID RRYPGDVKR SEQ ID ID NO: 51 VDFRVKAEDVEDFELQDSRVR (SEQ ID NO: NO: 3 (SEQ ID NO: 11) NO: 1 31) PN2.10; MHHSGEHEKVFRVENDISLHELASTQIDFWKP SEQ ID RRYPGDVKR SEQ ID SEQ ID NO: DIHVDFRVKAEDLVEDFLEQELQRVR NO: 3 (SEQ ID NO: 11) NO: 1 53 (SEQ ID NO: 32)
[00117] Os polinucleotídeos que codificam cada um dos polipeptídeos da pró-insulina CPBpro foram localizados a jusante do promotor araBAD no vetor de expressão pSOL (SEQ ID NO: 42). Cada um desses construtos de expressão também continha a sequência de codificação para a proteína dissulfeto isomerase (PDI, SEQ ID NO: 41) a jusante do promotor prpBCDE dentro do vetor de expressão pSOL. B. Transformação de células hospedeiras e expressão de pró-insulina CPBpro_lispro
[00118] Os construtos de expressão pSOL:CPBpro-lispro/PDI foram transformados em células EB0001 como se segue; o genótipo de células EB0001 é mostrado na Tabela 2. Células EB0001 quimicamente competentes (tratadas com CaCl) foram descongeladas em gelo durante 10 minutos. DNA (1 microlitro de cada estoque de DNA do construto de expressão) foi adicionado a um tubo eppendorf estéril e frio. Células EB0001 (100 microlitros) foram adicionadas a cada tubo de DNA e a mistura foi incubada em gelo durante 30 minutos. Os tubos foram submetidos a choque térmico a 42 graus C durante 20 segundos e deixados em repouso no gelo durante 5 minutos. As células transformadas recuperaram-se em meio de crescimento SOC de 900 microlitros (número de catálogo New England Biolabs B9020S) a 37 graus C durante uma hora com agitação de 275 RPM. Após o período de recuperação, as células foram agregadas em 3,8 k x g durante 2 minutos e colocadas novamente em suspensão em um volume de meio de recuperação de cerca de 100 microlitros remanescente do sobrenadante, depois plaqueadas em placas de ágar contendo 50 microgramas/ml de canamicina. As células plaqueadas transformadas foram cultivadas durante 18 horas a 37 graus C. Para cada transformação, três colônias foram colhidas da placa e cultivadas em meio LB com 50 microgramas/ml de canamicina a 30 graus C, com agitação a 275 RPM durante a noite até alcançar a fase estacionária (OD600 > 2,0). Os estoques de glicerol foram formados através da adição de 750 microlitros da cultura durante a noite a 750 microlitros de glicerol a 40%. Os estoques de glicerol foram armazenados a -80 graus C.
[00119] Culturas de células hospedeiras para expressão de pró- insulina CPBpro_lispro foram iniciadas pelos estoques de glicerol penetrantes e inoculação de 0,1 L de meio LB contendo 50 microgramas/ml de canamicina em frascos de 0,5 L não compartimentados. As células foram cultivadas durante a noite a 30 graus C com agitação a 275 RPM até a OD600 atingir 2. As culturas de células hospedeiras foram diluídas para uma OD600 de 0,2 em meio LB contendo 50 microgramas/mL de canamicina, e cultivadas em um volume total de 0,1 L em frascos compartimentados de 0,5 L a 30 graus C com agitação em 275 RPM até a OD600 atingir 0,6 a 0,8. Neste momento, o volume apropriado foi agregado (3800 x g, 10 minutos) de modo que a colocação novamente em suspensão em meio mínimo M9 contendo 50 microgramas/ml de canamicina forneceu uma OD600 de 0,7 a 0,75. Mínimo Médio M9. Em um volume de 1,2 L, autoclave: 15,36 g de fosfato de sódio, dibásico, heptahidratado 3,6 g de fosfato de potássio, monobásico
0,6 g de cloreto de sódio 1,2 g de cloreto de amônio 2,4 g de casaminoácidos
[00120] Ajustar o pH para 7,2 com KOH, autoclave a 121 graus C durante 45 minutos e deixar esfriar para a temperatura ambiente; isso cria um meio mínimo M9 incompleto. Para completar o meio: para cada 10 mL de meio incompleto, adicionar os seguintes volumes de sais esterilizados por filtro: 20 microlitros de MgSO4 1M; 1 microlitro de CaCl2 1M; 1 microlitro de FeSO4 5 mg/ml.
[00121] As culturas foram transferidas para placas de cavidades profundas de 24 cavidades. Uma amostra de 3 ml de cultura de células hospedeiras foi adicionada a cada cavidade, para cada uma das seguintes condições de indução: 6 cavidades para cada construto de expressão com arabinose 15 micromolar e 6 cavidades para cada construto com arabinose 45 micromolar. As células hospedeiras foram induzidas em 27 ou 30 graus C durante 6 horas com agitação de 275 RPM. A densidade óptica das células hospedeiras foi medida após o período de indução; a OD600 foi entre 1,0 e 1,2 em todas as cavidades. Amostras replicadas (3 x 1 ml, 2 x 5 ml de péletes) para cada condição de indução para cada construto de expressão foram coletadas por centrifugação em 3800 x g durante 7 minutos na temperatura ambiente.
[00122] O sucesso da indução dos construtos de expressão PN2.5, PN2.7 e PN2.9 foi confirmado utilizando SDS-PAGE com coloração com azul coomassie. Um pélete de 5 ml para cada condição de indução para cada construto de expressão foi descongelado em gelo durante 10 minutos. As células hospedeiras foram submetidas à lise em uma concentração de 6 vezes sobre a concentração de cultura na colheita em tampão de lise GLB-OG, pH 7,4 (Tris 50 mM pH 7,4, NaCl 200 mM, com 1% de octilglucosídeo, inibidores de protease 1X, 2 U benzonase (EMD# 70746) por ml de cultura, e 2,25 kU de rLisozima (EMD# 71110) por ml de cultura). A lise prosseguiu através da incubação em gelo durante 10 minutos.
Após a lise, as amostras foram divididas em dois conjuntos, um dos quais recebeu preparação de lisado total, o outro recebeu preparação de lisado solúvel.
Para a preparação de lisado total, após a lise de uréia 8 M em Tris 50 mM pH 7,4, NaCl 200 mM foi adicionado a cada amostra em uma relação de 1:1 e incubado na temperatura ambiente durante 20 minutos antes da preparação para operar as amostras em um gel.
Para a preparação do lisado solúvel, as amostras foram centrifugadas a 20k x g durante 30 minutos a 4 graus C, o sobrenadante (fração solúvel) foi removido e adicionado a uréia 8M em Tris 50 mM pH 7,4, NaCl 200 mM em uma relação de 1:1 e incubado na temperatura ambiente durante 20 minutos antes da preparação para operar as amostras em um gel.
A eletroforese em gel de poliacrilamida (PAGE) foi executada nas amostras em um gel de redução de Bis-Tris 12% em tampão SDS- MES, e o gel foi corado com uma coloração de azul coomassie.
Nas pistas com a preparação de lisado total, faixas substanciais do tamanho esperado foram vistas para as amostras PN2.5 (SEQ ID NO: 43), PN2.7 (SEQ ID NO: 47) e PN2.9 (SEQ ID NO: 51) somente: os polipeptídeos CPBpro nessas amostras possuem todos uma sequência 6xHis imediatamente após o resíduo de metionina N- terminal.
No entanto, nenhuma faixa para PN2.5, PN2.7 e PN2.9 foi observada na preparação de lisado solúvel, indicando que as quantidades substanciais de proteína produzida a partir dos construtos de expressão correspondentes foram produzidas em uma forma insolúvel (e solubilizável). Nenhuma expressão foi observada em qualquer preparação para os construtos de expressão PN2.6, PN2.8 e PN2.10, nem foi detectada expressão a partir do construto de expressão PN2.6 em experimentos de acompanhamento.
Embora a causa da ausência de expressão dos construtos de expressão que codificam PN2.6, PN2.8 e PN2.10 não tenha sido determinada, esses construtos de expressão compartilham uma sequência de nucleotídeo comum em torno do sítio de iniciação da translação que difere daquela nos construtos de expressão que codificam PN2.5, PN2.7 e PN2.9, e é possível que a mensagem transcrita dos construtos de expressão PN2.6, PN2.8 e PN2.10 não seja trasladada de forma eficiente. C. Solubilização e caracterização da pró-insulina CPBpro_lispro
[00123] Solubilização por uréia 2M - 6M. Para determinar as condições de solubilização da pró-insulina CPBpro_lispro PN2.5 (SEQ ID NO: 43), um pélete de 5 ml das células hospedeiras contendo pró- insulina CPBpro_lispro PN2.5, produzido no Exemplo 1.B, foi descongelado em gelo durante 10 minutos. As células hospedeiras foram submetidas à lise, em uma concentração de 2 vezes sobre a concentração da cultura na colheita, em tampão de lise GLB-OG pH 7,4 em gelo durante 10 minutos. O lisado foi então dividido em 12 amostras e tratado como segue; todas as seguintes amostras, exceto a amostra total de lisado foram centrifugadas em 20k x g a 4 graus C durante 30 minutos: Lisado total: sem rotação, sem aditivos de solubilização Sem tratamento: sem aditivos de solubilização Uréia 6M: adição de uréia 8M em GLB Uréia 4M: adição de uréia 5,3M em GLB Uréia 2M: adição de uréia 2,66M em GLB Uréia 1M: adição de uréia 1,33M em GLB Uréia 0,5 M: adição de uréia 0,66 M em GLB Triton-X 100 4%: adição de Triton-X 100 5% em GLB Triton-X 100 2%: adição de Triton-X 100 2,5% em GLB Triton-X 100 1%: adição de Triton-X 100 1,25% em GLB Triton-X 100 0,5%: adição de Triton-X 100 0,625% em GLB
Triton-X 100 0,25%: adição de Triton-X 100 0,3125% em GLB
[00124] A quantidade de pró-insulina CPBpro_lispro PN2.5 presente em cada amostra foi determinada por eletroforese capilar automatizada "Western blot" utilizando o instrumento WES (ProteinSimple, San Jose, Califórnia), seguindo o protocolo do fabricante e como geralmente descrito no Exemplo 6. Em preparação para análise sob condições de redução, o lisado total, sem tratamento e as amostras solubilizadas mostradas acima foram diluídas 1:300 em tampão WES 0,1X (ProteinSimple) com DTT adicionado (48 mM), levando as amostras a uma concentração final de 0,0033X. A pró- insulina CPBpro_lispro PN2.5 foi detectada por eletroforese capilar no instrumento WES, utilizando um anticorpo primário antilispro de camundongo e um anticorpo secundário de cabra anticamundongo conjugado a HRP, com exposições em 5, 15, 30, 60, 120, 240 e 480 segundos (apenas a exposição de 5 segundos é utilizada para quantificação). Os tratamentos de solubilização apenas com Triton-X não foram geralmente bem-sucedidos neste experimento, solubilizando apenas cerca de 10% ou menos da pró-insulina CPBpro_lispro PN2.5 total presente nas amostras, conforme indicado pela quantidade de pró-insulina CPBpro_lispro PN2.5 detectada no lisado total. A solubilização com uréia em uma concentração de pelo menos 2M foi mais bem-sucedida: a quantidade de pró-insulina CPBpro_lispro PN2.5 solubilizada aumentou com o aumento da concentração de uréia, com uréia 6M solubilizando cerca de 70% da pró-insulina CPBpro_lispro PN2.5 presente na amostra.
[00125] Caracterização do tamanho dos complexos de pró-insulina CPBpro_lispro solubilizáveis. As células hospedeiras contendo complexos de pró-insulina CPBpro_lispro PN2.5 solubilizáveis foram lisadas como se segue. Para criar uma amostra de controle de "lise de guanidina" representando a quantidade total de proteína gerada pela lise da célula hospedeira, um pélete de 1 ml das células hospedeiras contendo pró-insulina CPBpro_lispro PN2.5, produzida no Exemplo
1.B, foi descongelado em gelo durante 10 minutos e colocado novamente em suspensão em 500 microlitros de tampão guanidina HCl 6M, pH 8 (guanidina HCl 6M, NaPO4 100 mM, Tris Base 10 mM, imidazol 10 mM, ajustado para pH 8 com NaOH 5M). As células hospedeiras foram submetidas à lise por congelamento a -80 graus C durante uma hora, e depois descongeladas na temperatura ambiente durante 30 minutos ou até o completo descongelamento. As células hospedeiras também foram submetidas à lise em tampão de lise GLB- OG como descrito acima e o lisado foi centrifugado em 900 x g a 4 graus C durante 15 minutos para criar uma fração de pélete ('P1') e uma fração de sobrenadante ('S1'). Uma parte da fração de sobrenadante S1 foi retida e o restante foi centrifugado em 7000 x g a 4 graus C durante 30 minutos para criar uma fração de pélete ('P2') e uma fração de sobrenadante ('S2'). Uma parte da fração de sobrenadante S2 foi retida e o restante foi centrifugado em 20K x g a 4 graus C durante 30 minutos para criar uma fração de pélete ('P3') e uma fração de sobrenadante ('S3'). O pélete P1 foi solubilizado em tampão de guanidina HCl 6M, pH 8. A lise de guanidina e as amostras solubilizadas de P1, S1, S2 e S3 foram analisadas por eletroforese capilar no instrumento WES, sob condições de redução conforme descrito acima. Após a rotação de 900 x g, a quantidade de pró- insulina CPBpro_lispro PN2.5 detectada na fração solúvel S1 foi de cerca de 42% da quantidade de "lise total" detectada na amostra de lise de guanidina. A quantidade de pró-insulina CPBpro_lispro PN2.5 detectada a partir do pélete P1 solubilizado foi ao redor de 35% da quantidade de "lise total" na amostra de lise de guanidina, em vez dos 58% esperados, sugerindo que ocorreu a perda de pró-insulina CPBpro_lispro PN2.5 potencialmente recuperável em alguma fase do procedimento de lise, centrifugação e solubilização de GLB-OG. Após as rotações mais elevadas de 7000 x g e 20K x g, apenas uma pequena quantidade (cerca de 7%) da pró-insulina CPBpro_lispro PN2.5 foi detectada nas frações solúveis S2 e S3, com a maior parte da proteína presumivelmente terminando em péletes P2 e P3. Estes resultados são consistentes com uma parte significativa da pró-insulina CPBpro_lispro PN2.5, talvez cerca de metade do que estava nas células hospedeiras, estando presente em complexos grandes o suficiente para serem girados a 900 x g, uma velocidade de centrifugação relativamente baixa na qual os detritos celulares de células submetidas à lise podem ser agregadas, mas não proteínas solúveis (ver Cube Biotech, "Screening detergents for optimal solubilization and purification of membrane proteins", 2013, recuperado da www.cube-biotech.com/files/protocols/Screening_Detergents.pdf em 29 de março de 2017). Da pró-insulina CPBpro_lispro PN2.5 presente nas células hospedeiras que permaneceram solúveis durante a rotação de 900 x g, a grande maioria foi agregada em uma velocidade de centrifugação intermediária de 7000 x g, consistente com a pró-insulina CPBpro_lispro remanescente também presente nas células hospedeiras na forma de grandes complexos solubilizáveis.
[00126] Solubilização em uréia 8 M e em uréia 3,5 M/Triton-X 5%. Para avaliar ainda mais as condições de solubilização para a preparação de pró-insulina CPBpro_lispro PN2.5 (SEQ ID NO: 43), células hospedeiras EB0001 compreendendo construtos de expressão PN2.5 pSOL:CPBpro-lispro/PDI foram cultivadas e induzidas com arabinose 15 micromolar, conforme descrito no Exemplo 1B. Após a indução, amostras de 1 ml da cultura de células hospedeiras foram colhidas por centrifugação em 3800 x g a 4 graus C durante 10 minutos. Para a lise, os péletes das células hospedeiras foram colocados novamente em suspensão em tampão de lise GLB-OG pH
7,4 e a lise prosseguiu em gelo durante 15 minutos. O lisado de células hospedeiras foi centrifugado em 20K x g a 4 graus C durante 15 minutos, e os péletes resultantes foram colocados novamente em suspensão em uréia 8 M em solução salina tamponada com Tris 1X (TBS) pH 8,0 ou uréia 3,5 M/triton-X 5% em 1X TBS pH 8,0. As amostras da proteína solubilizada foram preparadas para PAGE através da remoção de triton-X das amostras de uréia 3,5M/triton-X 5% utilizando um Pierce™ SDS PAGE Prep Kit (Thermo Fisher Scientific, Waltham, Massachusetts), e através da preparação de uma amostra tanto não reduzida (em tampão de amostra LDS, Thermo Fisher Scientific) quanto reduzida (em tampão de amostra LDS mais DTT 100 mM) a ser analisada por PAGE para cada condição de solubilização. A quantidade de pró-insulina CPBpro_lispro PN2.5 solubilizada em cada amostra foi avaliada por PAGE em um gel de Bis-Tris 12% em tampão SDS-MES, e os géis foram corados com uma coloração de azul coomassie. Faixas migrando conforme esperado para o peso molecular de pró-insulina CPBpro_lispro PN2.5 (12,25 kD) foram claramente vistas, com as amostras solubilizadas em uréia 8M produzindo faixas significativamente mais densas do que aquelas solubilizadas em uréia 3,5M/tampão triton-X 5%. Este resultado indica que, nestas condições, a uréia 8M é mais eficaz do que uréia 3,5M/triton-X 5% na solubilização dos complexos de pró-insulina.
[00127] A pró-insulina CPBpro_lispro de complexos solubilizáveis possui ligações de dissulfeto e é significativamente purificada. A fim de determinar se a pró-insulina CPBpro_lispro PN2.5 de complexos solubilizáveis possui ligações de dissulfeto ou resíduos de tiol livre, as amostras solubilizadas em uréia 8M e preparadas conforme descrito acima foram analisadas por PAGE em um gel de Bis-Tris a 12% em tampão SDS-MES, com os pares não reduzidos e reduzidos de amostras executadas em pistas adjacentes. O gel foi corado com azul coomassie e é mostrado na Figura 2. O tratamento com DTT fez com que as amostras reduzidas (Pistas 4 e 6) corressem um pouco mais lentamente do que as amostras não reduzidas correspondentes (Pistas 3 e 5), indicando a presença de ligações de dissulfeto na pró- insulina CPBpro_lispro PN2.5 não reduzida. A diferença nas taxas de migração entre a pró-insulina CPBpro_lispro reduzida e não reduzida foi confirmada por cromatografia analítica de fase reversa. A Figura 2 também mostra que a pró-insulina CPBpro_lispro PN2.5 solubilizada (Pistas 3 a 6) foi significativamente purificada como resultado da remoção das proteínas solúveis no lisado da célula hospedeira total (Pistas 1 e 2) do pélete de pró-insulina CPBpro_lispro solubilizável.
[00128] Os complexos de pró-insulina CPBpro_lispro solubilizáveis se formam ao longo da indução. Para caracterizar ainda mais a formação dos complexos de pró-insulina CPBpro_lispro solubilizáveis, um curso de tempo de indução foi executado com células hospedeiras EB0001 compreendendo o construto de expressão PN2.5 pSOL:CPBpro-lispro/PDI, que foram cultivadas e induzidas geralmente como descrito no Exemplo 1B. Neste experimento, a indução foi executada em culturas de células hospedeiras em três volumes de 200 ml cada em frascos compartimentados de 1 L, com arabinose micromolar 15 como indutor, e com amostras de 1 ml tomadas nos momentos 0, 2, 4 e 6 horas após o início da indução. As células hospedeiras foram colhidas, a lise executada, e os péletes solubilizáveis foram colocados novamente em suspensão em uréia 8M em solução salina tamponada com Tris 1X (TBS) pH 8,0 como descrito acima e analisados por PAGE. Os complexos de pró-insulina CPBpro_lispro solubilizáveis estavam presentes nas células hospedeiras em cada um dos momentos de 2, 4 e 6 horas, conforme indicado por uma faixa em cada pista na posição esperada. Este resultado indica que os complexos solubilizáveis estão sendo formados nas células hospedeiras ao longo do período de indução, com pró-insulina CPBpro_lispro suficiente presente dentro das células hospedeiras para formar complexos solubilizáveis após apenas duas horas de indução. EXEMPLO 2 Uso de propeptídeos variantes CPBpro na produção de pró-insulina glargina A. Células hospedeiras para expressão de pró-insulina CPBpro_glargina
[00129] Nestas experiências, o propeptídeo CPBpro tendo a sequência de aminoácido da SEQ ID NO: 27 ('His-CPB1') foi utilizado na expressão em escala de fermentação de polipeptídeos de pró- insulina glargina. Um polinucleotídeo que codifica o propeptídeo His- CPB1 e otimizado para expressão em E. coli foi previamente sintetizado (ver o Exemplo 1A). A sequência que codifica o propeptídeo His-CPB1 foi clonada em um construto de expressão existente compreendendo uma sequência de polinucleotídeo que codifica a pró-insulina glargina, similarmente otimizada para expressão em E. coli, que também foi sintetizada por ATUM (Newark, California). O polipeptídeo da pró-insulina CPBpro_glargina PN3.13 (SEQ ID NO: 55) possui o propeptídeo His-CPB1 (SEQ ID NO: 27) em seu N- terminal, seguido pela cadeia B da insulina glargina (SEQ ID NO: 7); um peptídeo C correspondente a RRYPGDVKR (SEQ ID NO: 11), exceto que as argininas iniciais (RR) do peptídeo C são indicadas neste caso como estando no final da sequência da cadeia B da SEQ ID NO: 7; e da cadeia A da insulina glargina (SEQ ID NO: 6). A estrutura do polipeptídeo da pró-insulina CPBpro_glargina PN3.13 é mostrada esquematicamente na Figura 3, incluindo as ligações de dissulfeto encontradas na insulina glargina. O polinucleotídeo que codifica o polipeptídeo da pró-insulina CPBpro_glargina PN3.13 (SEQ
ID NO: 56) foi inserido a jusante do promotor araBAD no vetor de expressão pSOL (SEQ ID NO: 42). Este construto de expressão também continha a sequência de codificação para Erv1p (SEQ ID NO: 38), otimizada para expressão em E. coli (SEQ ID NO: 57), a jusante do promotor prpBCDE dentro do vetor de expressão pSOL. O construto de expressão pSOL:PN3.13-CPBpro-glargina/Erv1p foi transformado em células de E. coli EB0001, e estoques de glicerol das células hospedeiras transformadas foram preparados e armazenados a -80 graus C, utilizando os métodos descritos no Exemplo 1B. B. Crescimento da célula hospedeira e indução da expressão da pró- insulina CPBpro_glargina
[00130] As células hospedeiras EB0001 (pSOL:PN3.13-CPBpro- glargina/Erv1p) foram cultivadas em um sistema de fermentação DASGIP (Eppendorf North America, Hauppauge, New York) em um recipiente de fermentação DASbox de 250 ml, biorreator 1 ('BR1') (ver 'Equipamento de fermentação', acima). O biorreator foi calibrado como se segue: desvio de pH para pH 0,80; declive do pH 104,15%; desvio de DO 0,01 nA; declive de DO 66,72 nA.
[00131] Meios de fermentação. O volume total de 100 ml do meio de fermentação e os alimentos de crescimento e indução foram preparados como se segue.
[00132] Meio de fermentação; componentes de pré-esterilização, concentração em g/L por volume de 90 ml adicionado a cada biorreator: • Fosfato de potássio (monobásico) 14,8 • Citrato de potássio tribásico (monoidrato) 3,3 • Sulfato de amônio 4,4 • Cloreto de sódio 2,2 • Extrato de levedura 11,1
[00133] Traços de metais Korz modificados (estoque 100x);
combinar os componentes abaixo, onde a concentração final é mostrada em g/L, e esterilizar o filtro: ● CoCl2•6H2O 0,25 ● MnCl2•4H2O 1,5 ● CuSO4•5H2O 0,22 ● H3BO3 0,3 ● Na2MoO4•2H2O 0,25 ● ZnSO4•7H2O 1,7
[00134] Meio de fermentação; componentes pós-esterilização (concentração de estoque estéril), quantidade em ml adicionada para atingir o volume total de ca. 100 ml no biorreator: • Glicose (700 g / L) 1,4 • EDTA (estoque 100x, 0,84 g/L) 1,0 • traços de metais Korz modificados (estoque 100x) 1,0 • Sulfato de amônio ferroso (40 g/L) 0,8 • sulfato de magnésio diluído 1:5 heptaidratado (500 g/L) 1,3 • Antiespumante estéril 204, 10% dissolvido em etanol 70%/H2O 30% (Sigma-Aldrich, St. Louis, Missouri) 0,3 • Canamicina diluída 1:10 (50 g/L) 1,0 • Cloreto de cálcio (200 g/L) 1,0
[00135] Alimentação de crescimento; componentes (concentração de estoque estéril), quantidade em ml que pode ser preparada para um biorreator: • Glicose (700 g/L) 80 • EDTA (estoque 100x, 0,84 g/L) 1,36 • Traços de metais Korz modificados (estoque 100x) 1,44 • Sulfato de amônio ferroso (40 g/L) 1,40 • Sulfato de magnésio heptaidratado (500 g/L) 4,0 • Canamicina (50 g/L) 0,08 • Extrato de levedura (250 g/L) 2,8
[00136] Alimentação de indução; componentes (concentração de estoque estéril), quantidade em ml que pode ser preparada para um biorreator: • Glicerol (700 g/L) 80 • EDTA (estoque 100x, 0,84 g/L) 1,36 • Traços de metais Korz modificados (estoque 100x) 1,44 • Sulfato de amônio ferroso (40 g/L) 1,40 • Sulfato de magnésio heptaidratado (500 g/L) 4,0 • Canamicina (50 g/L) 0,08 • Arabinose (500 g/L) 0,97 10x Caldo Extraordinário ('10x TB'): Adicionar o que se segue a 90 ml de H2O destilada: 12 g de soytone, 24 g de extrato de levedura. Ajustar para 100 ml com H2O destilada. Esterilizar em autoclave. Deixar esfriar até a temperatura ambiente. Procedimento de Fermentação
[00137] Uma cultura de alimentação de células hospedeiras EB0001 (pSOL:PN3.13-CPBpro-glargina/Erv1p) foi cultivada geralmente de acordo com os métodos descritos no Exemplo 1B, mas com crescimento durante a noite até a OD600 atingir ca. 3, e com um inóculo de segundo dia maior em meio LB com glicose 1%, a fim de alcançar uma densidade celular final de DO600 2,40 após 5,5 horas de crescimento. Esta cultura alimentadora foi utilizada para inocular o meio de fermentação no biorreator: uma alíquota de 4,2 ml foi adicionada a ca. 100 ml de meio para que a leitura de densidade óptica inicial (OD600) fosse ca. 0,1.
[00138] As células foram cultivadas sob as condições do estágio de crescimento (30,0 graus C, DO 30%, pH 7,0, alimentação de crescimento contendo glicose 70% em uma taxa de alimentação inicial de 0,6 ml/h, para uma taxa de crescimento definida de 0,15/h com uma taxa de alimentação máxima de 3,2 ml por hora) durante 29 horas.
Imediatamente antes do início da indução, 5 ml de Caldo Extraordinário 10x foram adicionados ao biorreator. A indução foi iniciada; as condições de fermentação foram definidas para as condições do estágio de indução: 30,0 graus C, DO 30%, pH 7,0 e alimentação de indução contendo glicerol 70% em um coeficiente de alimentação de indução de 2,1 ml por hora. A alimentação de indução também continha o indutor L-arabinose, em uma concentração calculada da seguinte forma a partir do volume total de componentes adicionados para criar a alimentação de indução: [L-arabinose] na alimentação de indução: (0,97 ml x 500 g/l) / 89,25 ml = 5,4 g/l
[00139] As células hospedeiras no biorreator foram experimentadas em vários pontos de tempo durante a fermentação e indução; as densidades ópticas da cultura de crescimento nestes pontos de tempo, expressas em termos de tempo de fermentação decorrido (EFT (horas)) e tempo de indução decorrido (EIT (horas)) são mostradas abaixo. EFT (hrs) EIT (hrs) Densidade Óptica (OD600) 0 -29 0,1 28 -1 133,2 29 0 130,8 38 9 147,2 41 12 148,0 44 15 154,4 47 18 150,4 50 21 150,8 53 24 148,4
[00140] As células hospedeiras nas amostras de 2 ml tomadas para medições de densidade óptica em 9 horas ou mais após a indução, e 125 microlitros de células hospedeiras diluídas 1:20 em tampão PBS, foram colhidas por centrifugação em 4300 RPM a 4 graus C durante sete minutos e armazenadas como péletes congelados secos a -80 graus C. C. Solubilização e caracterização da pró-insulina CPBpro_glargina
[00141] Para investigar se as ligações de dissulfeto presentes nos complexos de pró-insulina CPBpro_glargina solubilizáveis são formadas entre os resíduos corretos, os complexos de pró-insulina CPBpro_glargina solubilizados foram analisados por cromatografia em fase líquida acoplada à espectrometria de massas (LC-MS). Péletes de células hospedeiras que foram cultivadas, induzidas e colhidas de 1 ml de cultura conforme descrito no Exemplo 2B, foram colocados novamente em suspensão em 15 ml de tampão de lise GLB-OG pH 7,4 e a lise prosseguiu em gelo durante 15 minutos. O lisado da célula hospedeira foi centrifugado em 20 K x g a 4 graus C durante 30 minutos, e os péletes resultantes foram colocados novamente em suspensão em 5 ml de uréia 8 M em solução salina tamponada com fosfato (PBS) 1X pH 7,5.
[00142] Os seguintes procedimentos foram executados na digestão enzimática e no mapeamento de dissulfeto não reduzido da pró- insulina CPBpro_glargina e são mostrados esquematicamente na Figura 4. As amostras iniciais continham pró-insulina CPBpro_glargina solubilizada em uréia 8M, PBS, pH 7,5 em uma concentração de 0,63 mg/ml. Para preparar as amostras para digestão enzimática, 25 microlitros de Tris 1M pH 7,5, 165 microlitros de água deionizada e 60 microlitros da amostra de pró-insulina CPBpro_glargina foram adicionados a um tubo Eppendorf de 1,5 ml para cada amostra, gerando uma concentração final da amostra de pró-insulina CPBpro_glargina em 0,15 mg/ml (e um total de 37,5 microgramas de pró-insulina CPBpro_glargina) e redução da concentração de uréia para ca. 1,9M. A tripsina de grau de sequenciamento (Promega Corp., Madison, Wisconsin) foi reconstituída em 0,1 mg/ml em ácido acético
50 mM. Um volume de 10 microlitros (ou 1 micrograma) de tripsina foi adicionado a cada tubo de amostra e incubado a 37 graus C durante quatro horas com agitação em 275 RPM. Glutamil endopeptidase Pierce™ ('Glu-C'), MS Grade (Thermo Fisher Scientific, Waltham, Massachusetts) foi reconstituído em água deionizada em 0,04 mg/ml e 5 microlitros (ou 0,2 microgramas) de Glu-C foram adicionados a cada tubo de amostra. As amostras foram incubadas a 37 graus C durante 16 horas com agitação em 275 RPM. Um volume de 5 microlitros de ácido acético a 10% foi adicionado a cada tubo para inativar as proteases. Neste ponto, as amostras podem ser opcionalmente congeladas a -80 oC antes da análise. As amostras também podem ser opcionalmente analisadas por SDS-PAGE ou LC de fase reversa para determinar se a digestão ocorreu. Após a digestão enzimática, as amostras foram centrifugadas em 14K x g a 4 graus C durante 5 minutos e 20 microlitros do sobrenadante foram transferidos para o frasco de amostrador automático apropriado para uso na seguinte análise MS.
[00143] A análise Nano-LC MS/MS foi conduzida em um espectrômetro de massa Orbitrap Fusion™ Tribrid™ recentemente calibrado e no Dionex UltiMate™ 3000 RSLCnano System (Thermo Fisher Scientific) com um método de 60 minutos. Uma coluna analítica Acclaim™ Pepmap™ 100 C18 75 micrômetro x 25 cm x 2 micrômetro foi utilizada com uma coluna de captura Acclaim™ Pepmap™ 100 C18 100 micrômetro x 2 cm x 5 micrômetro (Thermo Fisher Scientific). O tampão A consistia em ácido fórmico 0,1% em água grau LC-MS e o tampão B consistia em ácido fórmico 0,1% em acetonitrila grau LC- MS. Uma quantidade de 200 ng de amostra foi injetada na armadilha. Um gradiente foi operado como se segue: 0 a 5 minutos tampão B 2%; 5 a 5,1 minutos 2 - tampão B 7,5%; 5,1 a 35 minutos 7,5 - tampão B 30%; 36 a 41 minutos 30 - tampão B 98%; e 42 a 60 minutos tampão B
2%. As amostras foram analisadas em 2.400 V no modo de íon positivo com uma temperatura de tubo de transferência de íons de 275 graus C utilizando a fonte EASY-Spray™ (Thermo Fisher Scientific). Varreduras MS1 foram obtidas de 400 a 1600 m/z em 120K de resolução com um AGC (controle automático de ganho) de 400.000 e um tempo máximo de injeção de 50 ms. MS/MS direcionado foi conduzido em 742,8330 m/z (z = 4) representando as seguintes sequências: QCCTSICSLYQLE (SEQ ID NO: 58) e FVNQHLGSHLVE (SEQ ID NO: 59) com uma ligação intercadeia e uma ligação de dissulfeto intracadeia. As massas foram calculadas até quatro casas decimais para os cálculos (por exemplo, H+ = 1,0073). As configurações de MS/MS direcionadas incluíram um isolamento quadrupolo de 3 m/z, ativação de HCD em 30% e detecção no analisador de massa Orbitrap com resolução de 15K de 100 a 2000 m/z com um tempo máximo de injeção de 250 ms e um alvo AGC de
50.000. Os eventos MS/MS dependentes de dados ou direcionados adicionais podem ser programados opcionalmente conforme desejado, contanto que uma varredura de avaliação MS1 ocorra pelo menos a cada 2 segundos. Os resultados desta análise de cromatografia em fase líquida acoplada à espectrometria de massas (LC-MS) são mostrados na Figura 5. D. Purificação adicional e solubilidade da pró-insulina CPBpro_glargina
[00144] As pró-insulinas CPBpro_glargina variantes adicionais foram preparadas (PN3.15, PN3.16 e PN3.17), cada uma tendo uma porção de propeptídeo correspondente a SEQ ID NOs 33, 34 e 35, respectivamente, com uma ou mais sequências de DP cliváveis com ácido (Asp-Pro) inseridas antes da arginina presente na extremidade C-terminal do propeptídeo. As modificações foram feitas no construto de expressão (SEQ ID NO: 56) que codifica a pró-insulina CPBpro_glargina PN3.13 (SEQ ID NO: 55) para produzir construtos de expressão (SEQ ID NOs 63, 65 e 67, respectivamente, mostrados a partir do sítio de ligação ao ribossomo (RBS) para o códon de terminação, acrescido de 18 pb da sequência de nucleotídeo a jusante) que codifica a pró-insulina CPBpro_glargina PN3.15 (SEQ ID NO: 62), a pró-insulina CPBpro_glargina PN3.16 (SEQ ID NO: 64) e a pró-insulina CPBpro_glargina PN3.17 (SEQ ID NO: 66), com cada construto de expressão tendo o polinucleotídeo que codifica a pró- insulina CPBpro_glargina localizada a jusante do promotor araBAD no vetor de expressão pSOL e um polinucleotídeo (SEQ ID NO: 57) que codifica Erv1p (SEQ ID NO: 38) a jusante de o promotor prpBCDE, conforme descrito no Exemplo 2A. Estes construtos de expressão pSOL:PN3.15-CPBpro-glargina/Erv1p, pSOL:PN3.16-CPBpro- glargina/Erv1p e pSOL:PN3.17-CPBpro-glargina/Erv1p foram transformados em células de E. coli EB0001. As pró-insulinas PN3.15, PN3.16 e PN3.17 CPBpro_glargina foram produzidas por fermentação essencialmente como descrito no Exemplo 2B, com lise de células hospedeiras seguida por centrifugação em 20 K x g a 4 graus C durante 30 minutos. Os péletes resultantes, compreendendo complexos solubilizáveis de pró-insulina CPBpro_glargina, foram solubilizados em uréia 8M em solução salina tamponada com fosfato 1X (PBS) pH 7,5.
[00145] Uma porção da pró-insulina CPBpro_glargina PN3.15 (SEQ ID NO: 62) preparada a partir de complexos solubilizáveis foi carregada em uma coluna Ni-NTA de 5 ml, lavada com uréia 8M e imidazol 10 mM em 1X PBS pH 7,5, depois eluída em 500 imidazol mM em 1X PBS pH 7,5. A pró-insulina CPBpro_glargina PN3.15 era estável e solúvel nas condições de não desnaturação da purificação da coluna Ni-NTA e eluição em imidazol 500 mM em PBS 1X em pH neutro 7,5. Após a eluição da coluna Ni-NTA, amostras de pró-insulina CPBpro_glargina PN3.15, PN3.16 e PN3.17 em 500 mM de imidazol em 1X PBS pH 7,5 foram ajustadas em pH 6 com ácido fórmico para precipitar a pró-insulina CPBpro_glargina purificada 16K x g a 4 graus C durante 10 minutos, e os péletes foram colocados novamente em suspensão em ácido acético 0,1 M em pH 2 e incubados a 65 graus C durante 12 horas para clivar cada propeptídeo na sequência DP (Asp- Pro) presente em cada um dos propeptídeos PN3.15, PN3.16 e PN3.17. Após a incubação, as amostras foram neutralizadas com NH4HCO3 2M (bicarbonato de amônio) até um pH final entre 7,0 e 8,0. A clivagem dos propeptídeos foi observada por eletroforese em gel de poliacrilamida.
[00146] A separação da porção N-terminal clivada do propeptídeo PN3.17 do restante da pró-insulina CPBpro_glargina PN3.17 (SEQ ID NO: 66) foi alcançada por cromatografia de troca catiônica ('CEX') utilizando um meio Capto S (GE Healthcare, Pittsburgh, Pennsylvania). Uma reação de clivagem, na qual a pró-insulina CPBpro_glargina PN3.17 foi tratada com ácido acético 0,1 M em pH 2 e incubada a 60 graus C durante 24 horas com agitação em 275 RPM, foi ajustada para pH 4 com ácido clorídrico 1 M e carregada na coluna de troca catiônica, depois equilibrada com uréia 8M em NaOAc 20 mM pH 6,5, e eluída com concentrações crescentes de sal, de NaCl 0M a 0,35M, em uréia 8M NaOAc 20 mM pH 6,5. A análise LC-MS do fragmento de pró-insulina glargina purificado por CEX determinou que a massa do fragmento era como esperada para uma pró-insulina glargina com todas as suas ligações duplas intactas. A digestão de tripsina da pró- insulina glargina purificada por CEX produziu uma molécula de insulina glargina madura com ligações de dissulfeto intactas, conforme indicado pela análise LC-MS.
[00147] Para investigar ainda mais a precipitação de pró-insulina CPBpro_glargina PN3.15 (SEQ ID NO: 62) por condições acídicas, amostras de pró-insulina CPBpro_glargina PN3.15 preparadas por solubilização de complexos solubilizáveis e eluição de uma coluna Ni- NTA com imidazol 500 mM em 1X PBS pH 7,8, como descrito acima, foram ajustadas para os seguintes valores de pH utilizando ácido fórmico 10%: pH 7,5, 7,2, 7,0, 6,7, 6,5, 6,0, 5,5 e 5,0. As amostras foram então centrifugadas em 14K x g a 4 graus C durante 15 minutos, e os sobrenadantes foram removidos e secos através da evaporação centrífuga. Os péletes e os sobrenadantes secos foram então colocados novamente em suspensão em uréia 8M com 1X PBS pH 7,5 e analisados por eletroforese em gel de poliacrilamida sob condições desnaturantes. Em valores de pH entre 7,8 e 7,2, a maior parte da pró- insulina CPBpro_glargina PN3.15 permaneceu solúvel. Em pH 7,0, quantidades aproximadamente iguais de pró-insulina CPBpro_glargina PN3.15 foram observadas no sobrenadante e no pélete. À medida que o pH diminuía, porções crescentes da pró-insulina CPBpro_glargina PN3.15 estavam presentes no pélete, até quase todo ter sido precipitado em pH 5,0. A capacidade de precipitar proteínas através da alteração do pH da solução de proteína é útil, por exemplo, para a colocação novamente em suspensão da proteína em um volume menor e mais concentrado e/ou em um tampão diferente. Este efeito do pH na solubilidade também foi observado para pró-insulina CPBpro_glargina PN3.17 e é considerado provavelmente uma característica de outros produtos gênicos de polipeptídeo que formam complexos solubilizáveis.
[00148] Para obter a pró-insulina CPBpro_glargina PN3.17 purificada (SEQ ID NO: 66) para análise posterior, a pró-insulina CPBpro_glargina PN3.17 foi produzida por fermentação essencialmente conforme descrito no Exemplo 2B, com lise de células hospedeiras seguida pela centrifugação em 20K x g a 4 graus C durante 30 minutos. O material agregado foi solubilizado em uréia 8M em solução salina tamponada com fosfato (PBS) 1X pH 7,5, em 10 ml de tampão de ressuspensão por 1 g de peso celular úmido de células hospedeiras colhidas, com vórtice e incubação em temperatura ambiente durante 20 a 30 minutos, seguido por uma rotação de clarificação em 4000 x g a 4 graus C durante 5 minutos.
A pró-insulina CPBpro_glargina PN3.17 solubilizada foi operada em uma coluna de 5 ml de Ni-NTA.
Cinco volumes de coluna (CV) de uréia 8M em PBS pH 7,5 foram utilizados para equilibrar a coluna, a amostra foi carregada, seguida pela lavagem 1 (uréia 5CV 8M e imidazol 20 mM em PBS pH 7,5), lavagem 2 (imidazol 1,25CV 20 mM em PBS pH 7,5), eluição (5CV imidazol 500 mM em PBS pH 7,5) e limpeza (1,25 CV 0,2N NaOH, 6 CV 20% EtOH). Para investigar a solubilidade da pró-insulina CPBpro_glargina PN3.17 em vários tampões, as amostras da pró- insulina CPBpro_glargina PN3.17 purificada por Ni-NTA correspondente a 0,5 g de peso celular úmido de células hospedeiras coletadas foram operadas em colunas de dessalinização giratória Zeba™ de 5 ml com um corte de peso molecular de 7K (MWCO) (Thermo Fisher Scientific Inc., Waltham, Massachusetts). Os tampões em que as amostras foram centrifugadas foram: imidazol 500 mM em PBS pH 7,5, imidazol 200 mM em PBS pH 7,5, PBS pH 7,5, EDTA 50 mM em PBS pH 7,5 e L-arginina 25 mM em fosfato K 10 mM pH 7,5. Um ensaio de proteína Bradford foi utilizado para medir a concentração de proteína da solução de pró-insulina CPBpro_glargina PN3.17 como eluída em imidazol 500 mM em PBS pH 7,5, e a concentração de proteína das soluções de pró-insulina CPBpro_glargina PN3.17 após dessalinização giratória em vários tampões.
O rendimento de pró-insulina CPBpro_glargina PN3.17 no experimento em que o tampão de partida, imidazol 500 mM em PBS pH 7,5, foi substituído pelo mesmo tampão, representa a eficiência do procedimento de dessalinização por rotação e foi de aproximadamente 80%. O rendimento das outras amostras, cada uma transferida por dessalinização por rotação em um tampão diferente, variou de 77% a 91%, e não foram significativamente diferentes dos rendimentos esperados do próprio procedimento de dessalinização por rotação, sugerindo que não houve perda adicional de pró-insulina CPBpro_glargina PN3.17 da precipitação quando transferida para um tampão diferente. As amostras dessalinizadas da pró-insulina CPBpro_glargina PN3.17 também foram analisadas por eletroforese em gel de poliacrilamida sob condições redutoras e não redutoras, e a mudança na mobilidade eletroforética das faixas da pró-insulina CPBpro_glargina PN3.17 quando expostas a condições de redução indica que a pró-insulina CPBpro_glargina PN3.17 como eluída da coluna Ni-NTA e dessalinizada, continha ligações de dissulfeto. EXEMPLO 3 Uso de propeptídeos variantes e peptídeos C na produção de pró- insulina glargina A. Preparação de pró-insulina glargina
[00149] As proinsulinas glargina adicionais foram preparadas (PN3.62, PN3.116, PN3.165, PN3.172 e PN3.185), cada uma tendo uma porção de propeptídeo variante correspondente a SEQ ID NO: 36 ou SEQ ID NO: 37, e um peptídeo C variante correspondente a uma das SEQ ID NOs 12, 13 e 14 (ver a Tabela 4). Tabela 4. Polipeptídeos de pró-insulina glargina PN, SEQ Propeptídeo Cadeia B C-peptídeo Cadeia A ID NO: de insulina de insulina PN3.62; MHHHHHHEVFVENDISLR SEQ ID Variante humana de C- SEQ ID SEQ ID (SEQ ID NO: 36) NO: 7 peptídeo (aminoácidos 3 a 35 NO: 6 NO: 68 da SEQ ID NO: 12) PN3.116; MHHHHHHEVFVENDISLR SEQ ID DDNLER C-peptídeo SEQ ID SEQ ID (SEQ ID NO: 36) NO: 7 (aminoácidos 3 a 8 da SEQ ID NO: 6 NO: 69 NO: 14) PN3.165; MHHHHHHR SEQ ID Variante humana de C- SEQ ID SEQ ID (SEQ ID NO: 37) NO: 7 peptídeo (aminoácidos 3 a 35 NO: 6
PN, SEQ Propeptídeo Cadeia B C-peptídeo Cadeia A ID NO: de insulina de insulina NO: 70 da SEQ ID NO: 12) PN3.172; MHHHHHHEVFVENDISLR SEQ ID Variante humana de C- SEQ ID SEQ ID (SEQ ID NO: 36) NO: 7 peptídeo (aminoácidos 3 a 25 NO: 6 NO: 71 da SEQ ID NO: 13) PN3.185; MHHHHHHR SEQ ID Variante humana de C- SEQ ID SEQ ID (SEQ ID NO: 37) NO: 7 peptídeo (aminoácidos 3 a 25 NO: 6 NO: 72 da SEQ ID NO: 13)
[00150] Os polinucleotídeos que codificam cada um dos polipeptídeos da pró-insulina glargina foram inseridos a jusante do promotor araBAD no vetor de expressão pSOL (SEQ ID NO: 42). Cada um desses construtos de expressão também continha a sequência de codificação para a proteína dissulfeto isomerase (PDI, SEQ ID NO: 41) a jusante do promotor prpBCDE dentro do vetor de expressão pSOL.
[00151] Cada um dos vetores de expressão que codificam os polipeptídeos de glargina pró-insulina foi utilizado para transformar células hospedeiras de E. coli EB0001, para formar o seguinte: EB0001(pSOL:PN3.62proglargina/PDI), EB0001(pSOL:PN3.116proglargina/PDI), EB0001(pSOL:PN3.165proglargina/PDI), EB0001(pSOL:PN3.172proglargina/PDI), e EB0001(pSOL:PN3.185proglargina/PDI).
[00152] Cada um dos cinco tipos de células hospedeiras acima foi cultivado em cultura de fermentação e induzido para a expressão de proteína, em seguida, colhido, geralmente como descrito no Exemplo 2B. Dois fatores que variaram entre as amostras durante o processo de fermentação foram se a fermentação foi realizada em um DASbox ou um aparelho NLF, e se MnCl2 foi ou não adicionado à fermentação como um componente dos traços de metal Korz (ver Exemplo 2B). Estes fatores são indicados para cada uma das amostras de pró-
insulina glargina que foram purificadas e analisadas, conforme descrito no Exemplo 3B. B. Purificação da pró-insulina glargina através da solubilização direta
[00153] A fim de preparar amostras altamente purificadas de pró- insulina glargina devidamente dobrada com ligações de dissulfeto corretamente colocadas, para o propósito de transversão da insulina glargina madura como descrito no Exemplo 3C, as células hospedeiras colhidas acima foram submetidas a um tratamento de solubilização direta após a lise que não utiliza uma etapa inicial de centrifugação para separar a fração solúvel da insolúvel, a fim de coletar a pró- insulina glargina na forma de complexos solubilizáveis.
[00154] As amostras de células hospedeiras colhidas que foram purificadas são referidas como mostrado na lista a seguir, observando o aparelho de fermentação e se MnCl2 foi adicionado (+) ou estava ausente (-) durante a fermentação. PN3.62 A DASbox MnCl2 adicionado (+) PN3.62 B NLF MnCl2 ausente (-) PN3.62 C NLF MnCl2 ausente (-) PN3.116 DASbox MnCl2 ausente (-) PN3.165 A DASbox MnCl2 ausente (-) PN3.165 B NLF MnCl2 adicionado (+) PN3.165 C NLF MnCl2 adicionado (+) PN3.172 DASbox MnCl2 ausente (-) PN3.185 A DASbox MnCl2 adicionado (+) PN3.185 B NLF MnCl2 adicionado (+) PN3.185 C NLF MnCl2 adicionado (+)
[00155] Para a lise, o 'grupo de amostra principal' incluiu PN3.62 A, B e C; PN3.116; PN3.165 A; PN3.172; e PN3.185 A. Para o grupo de amostra principal, as células hospedeiras colhidas foram colocadas em suspensão em uréia 7M, Tris 50 mM pH 8 em uma diluição de 10 vezes em relação ao volume da cultura de fermentação. As amostras adicionais (PN3.165 B e C, e PN3.185 B e C) foram colocadas em suspensão em ureia 7M, L-Cys 2,5 mM, Tris 50 mM pH 9,5 em uma diluição de 2 vezes em relação ao volume da cultura de fermentação. Todas as amostras foram homogeneizadas em 8.000 psi para um total de cinco passagens, lisando as células. Os lisados foram diluídos 3,5 vezes em Tris 50 mM pH 8 (grupo de amostra principal), ou L-Cys 2,5 mM, Tris 50 mM pH 9,5 (PN3,165 B e C, e PN3,185 B e C), de modo que todas as amostras estavam em soluções de uréia 2M. Todas as amostras, exceto PN3.165 C e PN3.185 C, foram incubadas a 16 graus C com agitação em 120 RPM durante 48 a 72 horas, ou para PN3.165 C e PN3.185 C, durante 24 horas.
[00156] Após a incubação, para purificação utilizando cromatografia de afinidade por íons metálicos imobilizados (IMAC), as amostras de lisado foram todas clarificadas por centrifugação em 3300 x g, e os lisados solúveis foram filtrados através de membranas de polietersulfona (PES) de 0,45 micrômetro e coletados, com imidazol adicionado aos lisados para uma concentração final de 10 mM. A etapa de centrifugação na clarificação também pode ser realizada de
7.000 a 20.000 x g durante 30 a 60 minutos, e os lisados solúveis também podem ser filtrados através da filtração de fibra de vidro (retenção de partículas de 0,7 micrômetro no líquido). Os aditivos para o lisado clarificado, para prevenir a ligação não específica durante a IMAC, podem incluir imidazol 10 a 20 mM e/ou NaCl 0 a 300 mM.
[00157] As colunas de IMAC foram equilibradas com 2 a 4 volumes de coluna (CVs) de uréia 7 M, NaCl 0,3 M, imidazol 10 mM, Tris 25 mM pH 8, depois lavadas com 2 a 4 CVs de NaCl 0,1 M, Tris 40 mM pH 10. Para um grupo de amostra (PN3.62 A e B, PN3.165 A, PN3.172 e PN3.185 A), cada amostra foi carregada em uma coluna Ni Sepharose Fast Flow (GE Healthcare Life Sciences, Pittsburgh, Pennsylvania).
Para um segundo grupo de amostra (PN3.62 C, PN3.116, PN3.165 B e C e PN3.185 B e C), cada amostra foi carregada em uma coluna Ni HisTrap High Performance (GE Healthcare Life Sciences, Pittsburgh, Pennsylvania). As amostras foram carregadas com o equivalente a 0,5 a 1 ml de volume de cultura de fermentação por ml de resina. Todas as amostras foram eluídas utilizando 2 a 4 CVs de imidazol 0,5 M, Tris 40 mM, NaCl 0,1 M, pH 10. As colunas foram limpas no local com 2 CVs de NaOH 0,5 M e removidas com uréia 7 M, NaCl 0,3 M, imidazol 0,5 M e Tris 25 mM pH 8.
[00158] Seguindo a IMAC, as amostras foram concentradas e dessalinizadas. Para um grupo de amostra (PN3.62 A, PN3.165 A, PN3.172 e PN3.185 A), cada amostra foi concentrada utilizando um concentrador centrífugo Amicon® de corte de peso molecular 3 kDa (MWCO) (Sigma- Aldrich, St. Louis, Missouri), adicionando água destilada para retornar cada amostra ao seu volume inicial para 2 a 3 trocas utilizando o mesmo concentrador centrífugo. Para o outro grupo de amostra (PN3.62 B e C, PN3.116, PN3.165 B e C, e PN3.185 B e C), cada amostra foi concentrada por meio de filtração de fluxo tangencial e diafiltração descontínua em um concentrador tangencial MWCO Vivaflow 50 de 3 kDa (Sartorius, Goettingen, Germany), com o volume no reservatório de alimentação concentrado em cerca de um décimo do volume inicial, depois adicionando água destilada para retornar cada amostra ao seu volume inicial e repetindo esse processo 2 a 3 vezes. C. Transversão da pró-insulina glargina em insulina glargina madura
[00159] Os experimentos foram executados para identificar as condições ideais para a transversão, através da digestão com tripsina, de várias formas de pró-insulina glargina em insulina glargina madura ('B32 glargina'). Seguindo os protocolos de tratamento, os resultados foram analisados por espectrometria de massa de extração em fase sólida (SPE-MS).
[00160] Os parâmetros de SPE-MS foram como se segue: MS: LTQ Coluna: Otimizar C4 SPE Vinject: 20 microlitros Tampão A: MeCN 2,5% em água com ácido fórmico 0,1% Tampão B (apenas para MS): MeCN 75% / água 25% com ácido fórmico 0,1% Método: 0,6 minutos Gradiente: 100% A, 100% B, 100% A
[00161] A condição para cada pró-insulina glargina que produziu glargina B32 ideal, de acordo com os resultados de SPE-MS, foi selecionada e a amostra correspondente foi executada por espectrometria de massa de cromatografia em fase líquida de quadrupolo por tempo de vôo (QTOF) (LCMS). Um padrão autêntico de glargina USP foi utilizado para uma curva padrão externa para quantificar a porcentagem de material que sofreu transversão. A porcentagem de transversão (% de Transversão) é igual à concentração de B32 glargina, conforme determinado por meio da integração A280 LC versus o padrão USP glargina, dividido pela concentração inicial de pró-insulina glargina, conforme determinado por meio da integração A280 LC versus um analisado de aminoácido padrão, multiplicado por 100%. As integrações em A214 e por meio de cromatogramas de íons extraídos, em comparação com a mesma curva padrão externa de glargina, estavam de acordo com as integrações em A280.
[00162] Os parâmetros de QTOF-LCMS foram como se segue: MS: 5600+ Coluna: CSH_C18 1,7 mícron 2 x 150 mm
Vinject: 1 microlitro Tampão A: ácido fórmico 0,1% em água Tampão B: ácido fórmico 0,1% em acetonitrila com a seguinte tabela de gradiente: Tempo: Taxa de Vazão: %A: %B: Curva: Inicial 0,350 80,0 20,0 Inicial 13,00 0,350 72,0 28,0 6 13,10 0,350 5,0 95,0 6 14,00 0,350 5,0 95,0 1 16,00 0,350 80,0 20,0 1
[00163] No Experimento 1, 5 microlitros de cada amostra de pró- insulina glargina foram misturados com 5 microlitros de solução de NiCl2 de concentração variável e 5 microlitros de uma solução de tripsina (4,5 g/L de tripsina em Tris 120 mM NaCl 300 mM pH 9, CaCl2 15 mM). Os volumes combinados foram girados em 500 x g por 1 minuto, em seguida, incubados na temperatura ambiente com agitação em 100 RPM durante períodos variáveis de tempo, depois a reação foi interrompida pela adição de ureia 8M com ácido fórmico 1% (pH 3 a 3,5).
[00164] No Experimento 2, concentrações variáveis de NiCl2, FeCl2, NaCl e CaCl2 foram adicionadas à mistura de reação de tripsina e a reação foi realizada durante vários períodos de tempo, mas de outra forma geralmente como descrito acima.
[00165] No Experimento 3, várias concentrações de NaCl ou de tampão Tris foram adicionadas à mistura de reação de tripsina, que tinha quantidades constantes de 1,5 g/L de tripsina, CaCl2 50 mM e 7 micromolar de NiCl2, e a reação foi realizada durante vário períodos de tempo, mas de outra forma geralmente conforme descrito para o Experimento 1.
[00166] No Experimento 4, concentrações variáveis de NiCl2 e tempos de reação foram testados, em uma mistura de reação de tripsina que continha 1,5 g/L de tripsina, CaCl2 5 mM, Tris 120 mM, NaCl 300 mM.
[00167] No Experimento 5, duas condições de reação de tripsina foram testadas, contendo 1,5 g/L de tripsina, para vários comprimentos de tempo de reação. Cada condição produziu um resultado máximo comparável, conforme indicado na tabela abaixo.
[00168] No experimento 6, concentrações variáveis de NaCl e pH foram testadas durante períodos variáveis de tempo, em uma mistura de reação de tripsina que continha 1,5 g/L de tripsina e 7 micromolar de NiCl2.
[00169] Para cada experimento, as melhores condições de reação para cada uma das pró-insulinas glargina de interesse que foram testadas são indicadas abaixo, junto com a transversão percentual. Pró-insulina Glargina Experimento Condições Ideais de Reação Transversão % de A280 PN3.62, amostra A 1 7 micromolar de NiCl2; 120 minutos 7,2 PN3.62, amostras 2 0 micromolar de NiCl2; 31,2 reunidas B e C 7 micromolar de FeCl2; NaCl 0,15M; CaCl2 2,5 mM; 120 minutos PN3.165, amostra A 1 35 micromolar de NiCl2; 240 minutos 30,2 PN3.165, amostra A 3 Tris 50 mM; 180 minutos 16,2 PN3.165, amostra A 3 Tris 250 mM; 120 minutos 16,2 PN3.165, amostras 5 NaCl 100 mM, CaCl2 5 mM, 41,9 reunidas B e C Tris 40 mM pH 8.8; 90 minutos PN3.165, amostras 5 NaCl 150 mM, CaCl2 2,5 mM, 41,1 reunidas B e C 7 micromolar de NiCl2 pH 8.8; 90 minutos PN3.172 1 7 micromolar de NiCl2; 180 minutos 24,8 PN3.172 3 Tris 100 mM; 240 minutos 45,0 PN3.185, amostra 4 0 micromolar de NiCl2; 60 minutos 54,6 PN3.185, amostra A 6 NaCl 0 mM, CaCl2 5 mM, Tris 33 mM pH 9; 65,2 75 minutos
[00170] Estes resultados demonstram que altas frequências de transversão podem ser obtidas para os polipeptídeos de pró-insulina glargina variantes da invenção, utilizando os métodos no presente documento divulgados. EXEMPLO 4 Determinação da solubilidade de produtos de expressão; métodos de detecção de corpos de inclusão
[00171] Quando os métodos da invenção são utilizados para expressar produtos gênicos no citoplasma de células hospedeiras, os seguintes procedimentos podem ser utilizados para determinar o grau em que os produtos gênicos são produzidos na célula na forma solúvel.
[00172] A abordagem mais direta é submeter a lise as células utilizando qualquer método eficaz, tal como a lise enzimática com lisozima, conforme descrito com maiores detalhes no Exemplo 1, ou por ruptura celular com um microfluidizador. Uma amostra do lisado celular pode ser retida como uma medida do produto gênico total, solúvel e insolúvel, produzido pelas células hospedeiras. As células submetidas à lise são então centrifugadas em 20.000 x g durante 15 minutos na temperatura ambiente para separar a fração insolúvel como um pélete; a fração solúvel (o sobrenadante) é coletada. A quantidade de produto gênico total presente no lisado celular, menos a quantidade de produto gênico solúvel recuperado no sobrenadante, representa a quantidade total de produto gênico insolúvel presente no pélete. Os métodos para solubilização no presente documento descritos podem ser utilizados para determinar qual porção da fração insolúvel no pélete é solubilizável. Qualquer método, tal como ELISA ou Western blots de eletroforese capilar, que pode ser utilizado para detectar o produto gênico, e de preferência para detectar especificamente e de modo quantificado o produto gênico em cada fração, é empregado e as quantidades presentes nas frações solúveis e insolúveis são comparadas. Para testar a eficácia desta abordagem, proteínas endógenas da célula hospedeira, conhecidas por serem solúveis e presentes apenas no citoplasma da célula hospedeira, são detectadas nas frações solúveis e insolúveis para determinar se os métodos de lise e fracionamento estão capturando quantidades detectáveis de produtos do citoplasma solúveis na fração insolúvel.
[00173] Também é possível avaliar diretamente se as células contêm corpos de inclusão. Os corpos de inclusão podem ser colhidos por centrifugação das células hospedeiras submetidas à lise, coradas com corantes tais como o vermelho Congo, e visualizados utilizando microscopia de luz polarizada cruzada ou de campo claro com ampliação modesta (10X) (Wang et al., "Bacterial inclusion bodies contain amyloid-like structure", PLoS Biol 2008 Aug 5; 6(8): e195; doi:
10.1371/journal.pbio.0060195). Esses corpos de inclusão também podem ser solubilizados novamente (Singh and Panda, "Solubilization and refolding of bacterial inclusion body proteins", J Biosci Bioeng 2005 Apr; 99(4): 303-310; Review) e testados, utilizando ensaios de ligação específicos ou outros métodos de identificação de proteínas, por exemplo, para determinar se eles incluem produtos gênicos específicos. Os corpos de inclusão podem ser distinguidos dos complexos solubilizáveis no presente documento descritos, em que a maior parte do produto gênico recuperado dos corpos de inclusão através da solubilização não estará em uma forma ativa ou devidamente dobrada e exigirá pelo menos uma etapa de redobramento adicional para obter uma maioria do produto gênico que está ativo e/ou devidamente dobrado. EXEMPLO 5 Determinação de métodos adicionais para a solubilização de complexos de produto gênico solubilizável
[00174] Os tampões utilizados para solubilização de complexos de produtos gênicos produzidos pelos métodos da invenção podem incluir vários tipos diferentes de componentes, como descrito abaixo. Para otimizar a solubilização de qualquer produto gênico de interesse, os experimentos podem ser empreendidos para identificar as combinações mais eficazes de componentes do tampão de solubilização. Experimentos iniciais são executados para identificar quais combinações de componentes de tampão podem ser prontamente preparadas em laboratório, utilizando compostos comercialmente disponíveis. Uma vez que um tampão de teste foi preparado, ele pode ser utilizado em experimentos de solubilização com os complexos de produto gênico de interesse e, opcionalmente, com complexos de produto gênico de controle que são conhecidos por serem solubilizáveis em diferentes extensões em tampões de solubilização de referência. Exemplos de protocolos de solubilização para uso com complexos de produtos gênicos são fornecidos nesta invenção, tais como aqueles descritos nos Exemplos 1 e 2. Componentes dos tampões de solubilização:
[00175] A seguinte descrição dos componentes do tampão, resumida na Tabela 5, destina-se a fornecer exemplos dos diferentes tipos de componentes que podem ser utilizados em combinação com tampões de solubilização, sem limitação nos possíveis componentes tampão ou suas combinações. Por exemplo, os agentes caotrópicos incluem n-butanol, etanol, cloreto de guanidínio, cloridrato de guanidina, perclorato de lítio, acetato de lítio, cloreto de magnésio, fenol, 2-propanol, dodecil sulfato de sódio, tiouréia e/ou uréia. Um ou mais compostos de cada tipo de componente tampão podem ser utilizados em combinação com um ou mais compostos de qualquer um ou todos os outros tipos de componentes, na preparação de tampões de solubilização a serem testados quanto à eficácia na solubilização de complexos de produtos gênicos. As concentrações dos componentes tampão mostradas na Tabela 5 incluem faixas de concentrações e também exemplos particulares de concentrações que podem ser testadas quanto à eficácia.
[00176] Para a preparação de um produto gênico de interesse de uma forma que retém uma conformação de produto gênico apropriadamente dobrada, retém ligações de dissulfeto adequadamente formadas e/ou retém a atividade da proteína, os agentes redutores não seriam incluídos no tampão de solubilização. No entanto, certos ensaios analíticos, tais como Western blots de eletroforese capilar (ver Exemplo 6), são preferivelmente executados com as amostras de produto gênico solubilizado em um estado reduzido. Com o propósito de preparar amostras para tais ensaios, agentes redutores (por exemplo, DTE (ditioeritritol), DTT (ditiotreitol) e/ou TCEP (tris(2-carboxietil)fosfina)) podem ser incluídos no tampão em uma concentração de 10 mM, por exemplo, ou até 100 mM. Componentes que podem ser utilizados em combinação com tampões de solubilização Tipo de Exemplos: Concentrações Finais no Componente: Tampão de Solubilização: Solvente acetonitrila, dimetilformamida (DMF), % de solvente orgânico orgânico sulfóxido de dimetila (DMSO), metanol, (orgânica: água, trifluoroetanol volume:volume): 0 a 60% 15 a 40%, 20% Agente Tris, fosfato, citrato, acetato 0 a 200 mM, 50 mM tamponante Agente Uréia, guanidina Uréia: 0 a 10M, 2 a 10M, caotrópico 7M a 8M, 7M, 8M; guanidina: 0 a 8M, 2 a 8M, 5M a 6M, 6M Detergente CHAPS (3-[(3-colamidopropil)dimetilamônio]- 0 a 10%, 1% a 2%, 1% 1-propanossulfonato), CHAPSO (3-[(3- colamidopropil)dimetilamônio]-2-hidróxi-1- propanosulfonato); deoxicolato,
Tipo de Exemplos: Concentrações Finais no Componente: Tampão de Solubilização: N-lauroilsarcosina, octil glucosídeo, SDS, lauroil sarcosinato de sódio ('sarcosila') Sal Acetato de lítio, NaCl 0 a 10M, 1M Supressor de L-arginina 0 a 2M, 1M agregação pH O pH pode ser ajustado com: ácido pH 2,0 a 11,0, pH 6,5 a cítrico/citrato de sódio, HCl, PO4 mono- di- 8,0, pH 7,2 a 7,8, pH ou tribásico, NaOH, Tris-HCl/Tris base 7,5, pH 7,5 a 11,0, pH 8,0 a 10,0, pH 9,5 EXEMPLO 6 Caracterização por Western blot de eletroforese capilar
[00177] Os produtos gênicos podem ser detectados e quantificados conforme descrito abaixo, utilizando como exemplo produtos gênicos de proteínas solúveis ou solubilizadas, por um Western blot de eletroforese capilar operado em um sistema WES (ProteinSimple, San Jose, Califórnia) de acordo com as instruções do fabricante. Extratos de proteínas solúveis são carregados no conjunto capilar e as proteínas são separadas eletroforeticamente por tamanho. A proteína de interesse nas amostras é detectada com um anticorpo primário que é específico para essa proteína e a incubação com um anticorpo secundário conjugado com HRP, tal como um anticorpo secundário de cabra anti-humano ou anti-camundongo, que reconhece as cadeias pesadas e/ou leves do anticorpo primário. A detecção da presença do anticorpo secundário conjugado com HRP é executada pela adição do substrato quimioluminescente ao capilar e pela captura direta da luz emitida durante a reação catalisada por enzima. As estimativas de peso molecular são calculadas utilizando uma curva padrão gerada que utiliza seis proteínas biotiniladas variando de 12 k a 230 kDa para cada execução. Os padrões fluorescentes são incluídos no tampão de carga da amostra, dando a cada amostra um padrão interno que é utilizado para alinhar a amostra com o padrão de peso molecular.
[00178] Para determinar a quantidade de proteína presente em um determinado peso molecular, quantidades conhecidas de uma preparação padrão da proteína de interesse são executadas em alguns dos capilares e detectadas utilizando os mesmos anticorpos primários e secundários das amostras experimentais. Diluições em série são preparadas do padrão para a proteína de interesse tendo uma concentração conhecida, tal como um padrão de proteína comercialmente disponível, começando, por exemplo, em 10 microgramas/ml e diluído até 1,0 nanogramas/ml. Aproximadamente cinco capilares do sistema WES são utilizados para operar a diluição em série. Para cada faixa de proteína nos capilares de diluição experimental e em série, uma curva é gerada pelo software do sistema WES que representa a intensidade de quimioluminescência da faixa de proteína, e a área sob cada curva é avaliada, com uma curva padrão dessas áreas traçada para as faixas de proteína nos capilares de diluição em série. Para determinar a concentração das amostras experimentais, a área sob cada curva que representa a intensidade de quimioluminescência de uma amostra experimental pode ser comparada com a curva padrão gerada para as amostras de concentração conhecida. EXEMPLO 7 Determinar o rendimento e a recuperação de produtos gênicos produzidos utilizando os métodos de solubilização e purificação da invenção
[00179] O seguinte método pode ser utilizado para calcular a quantidade de produto gênico recuperado em diferentes estágios do processo de solubilização e purificação, em comparação com a quantidade total presente no lisado celular.
[00180] Uma amostra padrão para o produto gênico é requerida. Esta poderia ser uma amostra comercialmente disponível do produto gênico que possui uma concentração conhecida, ou uma amostra completamente purificada do produto gênico analisado por aminoácido (AAA).
[00181] O lisado celular de uma cultura de células hospedeiras, tal como uma cultura de fermentação, é preparado em um nível conhecido de diluição da cultura de células hospedeiras. Um gel SDS- PAGE, tal como um gel de 4 a 12%, é preparado e um conjunto de diluição em série de amostras tanto do lisado celular quanto da amostra padrão do produto gênico é operado no gel SDS-PAGE sob condições redutoras, seguido de coloração com SimplyBlue SafeStain (Thermo Fisher Scientific Inc., Waltham, Massachusetts). O uso de condições redutoras é necessário para permitir que a quantidade total de produto gênico no lisado celular seja medida. Uma medição de densitometria da faixa do produto gênico no gel SDS-PAGE é executada para cada uma das amostras, e as curvas com base nos dados de densitometria são traçadas com se segue.
[00182] Para as amostras padrão do produto gênico, a densidade de faixa da faixa do produto gênico de cada amostra padrão operada no gel é traçada no eixo y, e o volume da amostra (em microlitros) é traçado no eixo x. Para o volume de amostra, o volume da solução de amostra padrão presente na amostra menos diluída (por exemplo, 6 microlitros) é traçado. Para cada amostra padrão diluída em série, seu volume é representado graficamente como o volume do padrão na amostra menos diluída (por exemplo, 6 microlitros) dividido por cada fator de diluição (por exemplo, 2). Para esses valores, os volumes de amostra (em microlitros) seriam 6, 3, 1,5, 0,75, etc. Uma curva padrão linear de melhor ajuste é criada com base nos dados traçados, que podem ser expressos utilizando a fórmula y = m (padrão) x + k, onde m é a inclinação da curva padrão e k é a interceptação y.
[00183] Para determinar o rendimento (ou título, em g/L) do produto gênico presente no lisado celular, a densidade da faixa do produto gênico para cada amostra de lisado celular é traçada no eixo y contra os volumes de amostra no eixo x, da mesma maneira como para as amostras padrão, descritas acima. Uma curva linear de melhor ajuste para as amostras de lisado celular também é criada, na forma y = m (experimental) x + k. Para calcular o rendimento do produto gênico no lisado celular, o declive para as amostras de lisado celular é dividido pelo declive para as amostras padrão e, em seguida, multiplicado pela concentração da solução de amostra padrão e multiplicado pelo grau em que a célula as amostras de lisado foram diluídas em relação à cultura de células hospedeiras (por exemplo, 100 para uma diluição de 100 vezes).
[00184] Para ilustrar o uso deste método, o exemplo a seguir é a determinação do rendimento total do produto gênico de proglargina PN3.172 de um processo de fermentação. Uma amostra padrão altamente purificada e analisada com aminoácidos (AAA) de PN3.172 Foi preparada, a qual tinha uma concentração de 0,266 microgramas/microlitro, que é equivalente a 0,266 g/L. O polipeptídeo de proglargina PN3.172 foi expresso na cultura de fermentação de células hospedeiras e submetido à lise geralmente de acordo com os métodos descritos nos Exemplos 2B e 3A acima. O lisado celular que foi analisado foi diluído 80 vezes em relação à cultura de fermentação da célula hospedeira, de modo que o fator de diluição é 80. Amostras tanto do padrão AAA PN3.172 quanto do lisado celular PN3.172 foram preparadas como conjuntos de amostras diluídas em série por um fator de 1,25, tendo volumes de 6,0, 4,8, 3,8, 3,1 e 2,5 microlitros, e essas amostras foram operadas em um gel SDS-PAGE de 4 a 12% sob condições redutoras, seguido pela coloração com SimplyBlue
SafeStain (Thermo Fisher Scientific Inc., Waltham, Massachusetts). A densitometria de faixa foi executada para cada uma das amostras de padrão AAA PN3.172 e de lisado celular PN3.172, e as curvas lineares de melhor ajuste foram traçadas. Para o padrão AAA PN3.172, a curva foi y = 93.899x - 129.917, com a inclinação ou m (padrão) igual a
93.899. Para o lisado celular PN3.172, a curva foi y = 72.614x -
228.763, com a inclinação ou m (experimental) igual a 72.614. O cálculo do rendimento de PN3.172 no lisado celular foi: (m (experimental) / m (padrão)) x fator de diluição x concentração do padrão = (72.614 / 93.899) x 80 x 0,266 g/L = 16,5 g/L. Em experimentos adicionais, os rendimentos do produto gênico de pró- insulina no lisado celular variaram de 5 a 20 g/L.
[00185] Quando a densidade óptica (por exemplo, OD600) da cultura de crescimento da célula hospedeira é medida no momento da lise, também é possível calcular o rendimento de um produto gênico como g/L/OD, através da divisão do rendimento em g/L conforme calculado acima pela densidade óptica.
[00186] Este método para calcular o rendimento também pode ser utilizado em etapas posteriores no processo de solubilização e purificação. Por exemplo, um gel SDS-PAGE pode ser executado com amostras padrão e com amostras experimentais solubilizadas por um dos métodos no presente documento descritos, e o rendimento pós- solubilização das amostras experimentais pode ser determinado. Da mesma forma, este método de cálculo de rendimento pode ser utilizado para determinar o rendimento do produto gênico após a purificação por cromatografia em coluna, tal como purificação de Ni- IMAC, de preferência utilizando uma análise RP-UPLC de picos de amostra padrão e picos de amostra experimental. Quando a análise RP-UPLC é utilizada, a área calculada sob os picos do cromatograma nos tempos de retenção esperados para o produto gênico desejado é utilizada da mesma maneira que a densidade de faixa no método de cálculo de rendimento descrito acima. Uma diluição em série da amostra padrão é feita e as amostras de quantidade de produto gênico conhecidas são executadas na coluna de cromatografia, uma de cada vez, as áreas sob os picos do produto gênico são calculadas e uma curva padrão é traçada. Para a amostra experimental, a área calculada sob os picos do cromatograma nos tempos de retenção esperados de qualquer operação isolada através da coluna RP-UPLC pode ser comparada com a curva padrão calculada a partir da diluição em série da amostra padrão, para obter a quantidade de produto gênico na amostra experimental.
[00187] A porcentagem do produto gênico que é recuperada entre as etapas sucessivas do processo pode ser determinada mediante a divisão do rendimento na etapa posterior do processo pelo rendimento na etapa anterior do processo, e multiplicação por 100%. Os processos de purificação foram executados em proglargina PN3.172, em que o rendimento no estágio de lisado celular foi determinado utilizando o método acima, e a proglargina PN3.172 foi solubilizada por centrifugação de complexos solubilizáveis para formar um pélete, e depois solubilizando a proglargina PN3.172 a partir do pélete (como nos Exemplos 1 e 2), ou pelo método de solubilização direta (como no Exemplo 3). Os rendimentos de proglargina PN3.172 solúvel foram determinados utilizando o método acima, e a porcentagem de recuperação de proglargina PN3.172 solúvel foi calculada para cada método de solubilização. O método de 'agregação e solubilização' dos Exemplos 1 e 2 produziu proglargina PN3.172 com 84,7% de recuperação, com o material recuperado sendo 75,3% de proteína de proglargina PN3.172 pura conforme determinado pela análise RP- UPLC, utilizando uma coluna de proteína BEH 300A 1,7 μm 2,1 x 150 mm C4 (número do produto 186006549, Waters, Milford,
Massachusetts). O método de 'solubilização direta' do Exemplo 3 produziu proglargina PN3.172 com uma recuperação comparável de 81,4%, no entanto, o material recuperado era proteína de proglargina PN3.172 pura 30,4% conforme determinado pela análise RP-UPLC. A purificação subsequente da proglargina PN3.172 preparada por cada método de solubilização, utilizando uma coluna Ni-IMAC e uma etapa de troca de tampão, resultou em uma recuperação total de 70,8% com relação à 'agregação e solubilização' da proglargina PN3.172, com pureza de 98,2%, e uma recuperação total de 71,0% com relação à 'solubilização direta' de proglargina PN3.172, com pureza de 94,7%. Este experimento demonstrou que o método de 'agregação e solubilização' dos Exemplos 1 e 2 recupera tanto produto gênico quanto o método de solubilização direta do Exemplo 3 e resulta em uma pureza mais elevada do material tanto antes quanto após a etapa de cromatografia subsequente. EXEMPLO 8 Caracterização das ligações de dissulfeto presentes nos produtos de expressão
[00188] O número e a localização das ligações de dissulfeto em produtos de expressão de proteínas podem ser determinados pela digestão da proteína com uma protease, tal como tripsina, sob condições não redutoras e submetendo os fragmentos de peptídeo resultantes à espectrometria de massa (MS) que combina dissociação de transferência de elétrons sequencial (ETD) e dissociação induzida por colisão (CID) etapas de MS (MS2, MS3) (Nili et al., "Defining the disulfide bonds of insulin-like growth factor-binding protein-5 by tandem mass spectrometry with electron transfer dissociation and collision- induced dissociation", J Biol Chem 2012 Jan 6; 287(2): 1510-1519; Epub 2011 Nov 22).
[00189] Digestão da proteína expressa. Para evitar rearranjos de ligações de dissulfeto, quaisquer resíduos de cisteína livres são em primeiro lugar bloqueados por alquilação: a proteína expressa é incubada protegida da luz com o agente alquilante iodoacetamida (5 mM) com agitação durante 30 minutos a 20 oC em tampão com uréia 4M.
Alternativa e preferivelmente, NEM é utilizado como o reagente alquilante, com proteólise de tripsina em combinação com redução/alquilação conduzida sob condições desnaturantes (GuaHCl 6M). Após a alquilação, a proteína expressa é separada por SDS- PAGE não redutor utilizando géis pré-moldados.
Alternativamente, a proteína expressa é incubada no gel após eletroforese com iodoacetamida ou NEM, ou sem como um controle.
As faixas de proteína são coradas, descoradas com água duplamente deionizada, cortadas e incubadas duas vezes em 500 microlitros de bicarbonato de amônio 50 mM, acetonitrila 50% (v/v) enquanto agita durante 30 minutos a 20 oC.
As amostras de proteínas são desidratadas em acetonitrila 100% durante 2 minutos, secas por centrifugação a vácuo e reidratadas com 10 mg/ml de tripsina ou quimiotripsina em tampão contendo bicarbonato de amônio 50 mM e cloreto de cálcio 5 mM durante 15 minutos em gelo.
O excesso de tampão é removido e substituído por 50 microlitros do mesmo tampão sem enzima, seguido de incubação durante 16 horas a 37 oC ou 20 oC, para tripsina e quimiotripsina, respectivamente, com agitação.
A digestão é interrompida pela adição de 3 microlitros de ácido fórmico 88% e, após breve agitação no vórtice, o sobrenadante é removido e armazenado a o -20 C até a análise.
Métodos alternativos de fragmentação de proteínas (LysC, Glu-C ou CNBr) são utilizados se a tripsinólise fornecer cobertura de sequência insuficiente (< 75%). O uso do agente redutor TCEP (tris(2-carboxietil)fosfina) sob condições acídicas na presença de NEM fornece acesso a fragmentos com ligações de dissulfeto parcialmente intactas.
O mapa de digestão intacto de dissulfeto é comparado com o mapa de digestão reduzido (DTT ou TCEP).
[00190] Localização de ligações de dissulfeto por espectrometria de massa. Os peptídeos são injetados em uma coluna coletora de 1 mm x 8 mm (Michrom BioResources, Inc., Auburn, CA) em 20 microlitros/minuto em uma fase móvel contendo ácido fórmico 0,1%. O cartucho coletor é então colocado em linha com uma coluna de 0,5 mm x 250 mm contendo 5 mm de fase estacionária Zorbax SB-C18 (Agilent Technologies, Santa Clara, CA) e peptídeos separados por um gradiente de acetonitrila de 2 a 30% ao longo 90 minutos em 10 microlitros/minuto com HPLC capilar série 1100 (Agilent Technologies); alternativamente, uma coluna C18 adequada para UPLC é utilizada. Os peptídeos são analisados utilizando uma armadilha iônica linear LTQ Velos com uma fonte ETD (Thermo Fisher Scientific Inc., Waltham, Massachusetts). A ionização por electrospray é executada utilizando uma fonte Captive Spray (Michrom Bioresources, Inc.), ou de preferência, um emissor de sílica fundida não revestido de atração (New Objective Inc., Woburn, Massachuetts) em 3,0 kV. Alternativamente, a análise de fragmentos proteolíticos de tamanho médio é executada utilizando um instrumento Thermo LTQ- FT MS (7 Tesla), ou um espectrômetro de massa Synapt G2-Si quadrupolo de mobilidade iônica por onda de deslocamento de tempo de vôo (ToF) (Waters Corp., Milford, Massachusetts). De preferência, os peptídeos são analisados utilizando um espectrômetro de massa Orbitrap Fusion™ Tribrid™ (Thermo Fisher Scientific). Os peptídeos ligados por dissulfeto possuem estados de carga de +4 ou maior após a tripsinização devido à presença de dois N-terminais e dois resíduos básicos (arginina ou lisina) nos terminais carbóxi. Estes peptídeos ligados por dissulfeto são preferivelmente isolados pelo instrumento Orbitrap Fusion™ de modo que as ligações de dissulfeto podem ser quebradas utilizando fragmentação ETD. As varreduras MS de pesquisa são seguidas por sete varreduras dependentes de dados consistindo em varreduras CID e ETD MS2 no íon mais intenso na varredura de pesquisa, seguidas por cinco varreduras MS3 CID no primeiro ao quinto íons mais intensos na varredura ETD MS2. As varreduras CID utilizam energia de colisão normalizada de 35, e as varreduras ETD utilizam um tempo de ativação de 100 ms com ativação suplementar habilitada. Os sinais mínimos para iniciar as varreduras MS2 CID e ETD são 10.000, os sinais mínimos para o início das varreduras MS3 CID são 1000 e as larguras de isolamento para todas as varreduras MS2 e MS3 são 3,0 m/z. O recurso de exclusão dinâmica do software é habilitado com uma contagem de repetição de 1, tamanho da lista de exclusão de 100 e duração de exclusão de 30 segundos. Listas de inclusão para direcionar espécies reticuladas específicas para coleta de varreduras ETD MS2 são utilizadas. Arquivos de dados separados para varreduras MS2 e MS3 são criados pelo Bioworks 3.3 (Thermo Fisher Scientific) utilizando a análise do estado de carga ZSA. A correspondência de varreduras de MS2 e MS3 com sequências de peptídeos é executada por Sequest (V27, Rev 12, Thermo Fisher Scientific). A análise é executada sem especificidade enzimática, uma tolerância de massa iônica de origem de 2,5, tolerância de massa de fragmento de 1,0 e uma massa variável de +16 para resíduos de metionina oxidada. Os resultados são então analisados utilizando o programa Scaffold (V3_00_08, Proteome Software, Portland, OR) com probabilidades mínimas de peptídeo e proteína de 95 e 99% sendo utilizadas. As ferramentas de software para interpretação de dados também incluem Proteome Discoverer™
2.0 com o Disulfinator node (Thermo Fisher Scientific). Os peptídeos dos resultados de MS3 são classificados por número de varredura e os peptídeos contendo cisteína são identificados a partir de grupos de varreduras MS3 produzidos a partir dos cinco íons mais intensos observados em varreduras ETD MS2. As identidades dos peptídeos de cisteína que participam de espécies ligadas por dissulfeto são ainda confirmadas por exame manual das massas iônicas de origem observadas na varredura de pesquisa e na varredura ETD MS2. EXEMPLO 9 Solubilização e purificação de produtos de expressão do periplasma de células bacterianas, de esferoplastos e de células inteiras
[00191] Os métodos de solubilização e purificação da invenção podem ser utilizados na produção de produtos gênicos que se acumulam em diferentes compartimentos da célula, tais como o citoplasma ou periplasma. As células hospedeiras tais como E. coli ou S. cerevisiae, possuem uma membrana celular externa ou parede celular e podem formar esferoplastos quando a membrana externa ou parede é removida. As proteínas expressas constituídas em tais hospedeiros podem ser purificadas especificamente a partir do periplasma, ou a partir dos esferoplastos, ou de células inteiras, utilizando o seguinte método (Schoenfeld, "Convenient, rapid enrichment of periplasmic and spheroplasmic protein fractions using the new PeriPreps™ Periplasting Kit", Epicentre Forum 1998 5(1): 5; disponível na epibio.com/docs/default-source/forum-archive/forum-05- 1---convenient-rapid-enrichment-of-periplasmic-and-spheroplasmic- protein-fractions-using-the-new-peripreps-periplasting-kit.pdf). Este método é projetado para E. coli e outras bactérias gram-negativas, mas a abordagem geral pode ser modificada para outras células hospedeiras tais como S. cerevisiae.
[00192] 1. A cultura de células hospedeiras bacterianas é cultivada apenas para a fase log tardia, pois as culturas de células mais antigas em fase estacionária comumente demonstram alguma resistência ao tratamento com lisozima. Se a expressão da proteína recombinante for excessiva, as células podem sofrer lise prematuramente; portanto, as culturas celulares não são cultivadas em meio rico ou em temperaturas de crescimento mais elevadas que podem induzir a síntese excessiva de proteínas. A expressão da proteína é então induzida; as células devem estar na fase logarítmica ou na fase estacionária inicial.
[00193] 2. A cultura de células é agregada por centrifugação em um mínimo de 1.000 x g durante 10 minutos na temperatura ambiente. Nota: as células devem ser frescas, não congeladas. O peso úmido do pélete celular é determinado para calcular a quantidade de reagentes necessários para este protocolo.
[00194] 3. As células são completamente colocadas novamente em suspensão em um mínimo de 2 ml de PeriPreps Periplasting Buffer (Tris-HCl 200 mM pH 7,5, sacarose 20%, EDTA 1 mM e 30 U/microlitro de Ready-Lyse Lysozyme) para cada grama de células, por mistura de vórtice ou por pipetagem até que a suspensão de células esteja homogênea. Nota: a agitação excessiva pode provocar lise prematura dos esferoplastos, resultando na contaminação da fração periplasmática com proteínas citoplasmáticas.
[00195] 4. Incubar durante cinco minutos em temperatura ambiente. A Ready-Lyse Lysozyme é idealmente ativa na temperatura ambiente. A lise em temperaturas mais baixas (0 oC a 4 oC) requer tempo de incubação adicional; em tais temperaturas, os tempos de incubação são estendidos de 2 a 4 vezes.
[00196] 5. Adicionar 3 ml de água purificada a 4 oC para cada grama de peso do pélete celular original (Etapa 2) e misturar por inversão.
[00197] 6. Incubar durante 10 minutos no gelo.
[00198] 7. As células submetidas à lise são agregadas por centrifugação em um mínimo de 4.000 x g durante 15 minutos na temperatura ambiente.
[00199] 8. O sobrenadante contendo a fração periplasmática é transferido para um tubo limpo.
[00200] 9. Para degradar os ácidos nucléicos contaminantes, OmniCleave Endonuclease é opcionalmente adicionado ao PeriPreps Lysis Buffer. A inclusão de uma nuclease irá melhorar de uma forma geral o rendimento da proteína e a facilidade de manipulação dos lisados, mas a adição de uma nuclease é indesejável em alguns casos: por exemplo, o uso de uma nuclease deve ser evitado se a atividade de nuclease residual ou exposição transitória ao cofator de magnésio irá interferir com os ensaios ou usos subsequentes da proteína purificada. A adição de EDTA ao lisado para inativar a OmniCleave Endonuclease, da mesma forma, pode interferir no ensaio subsequente ou no uso da proteína purificada. Se a nuclease for adicionada, 2 microlitros de OmniCleave Endonuclease e 10 microlitros de MgCl2 1,0M são diluídos até 1 ml com PeriPreps Lysis Buffer (Tris-HCl 10 mM pH 7,5, KCl 50 mM, EDTA 1 mM e desoxicolato 0,1%) para cada mililitro de tampão de lise necessário na Etapa 10.
[00201] 10. O pélete é colocado novamente em suspensão em 5 ml de PeriPreps Lysis Buffer para cada grama de peso do pélete celular original.
[00202] 11. O pélete é incubado na temperatura ambiente durante 10 minutos (se incluído, a atividade de OmniCleave Endonuclease provocará uma diminuição significativa na viscosidade; a incubação continua até que a suspensão celular tenha a consistência de água).
[00203] 12. Os resíduos celulares são agregados por centrifugação em um mínimo de 4.000 x g durante 15 minutos a 4 oC.
[00204] 13. O sobrenadante contendo a fração do esferoplasto é transferido para um tubo limpo.
[00205] 14. Se OmniCleave Endonuclease foi adicionado ao
PeriPreps Lysis Buffer, 20 microlitros de EDTA 500 mM são adicionados para cada mililitro da fração esferoplástica resultante, para quelar o magnésio (a concentração final de EDTA no lisado é de 10 mM). Após a hidrólise de ácidos nucleicos com OmniCleave Endonuclease, os lisados podem conter quantidades substanciais de mono- ou oligonucleotídeos. A presença desses produtos de degradação pode afetar o processamento posterior do lisado: por exemplo, os nucleotídeos podem diminuir a capacidade de ligação das resinas de troca aniônica ao interagir com a resina.
[00206] O protocolo acima pode ser utilizado para preparar a proteína celular total com as seguintes modificações. As células agregadas na Etapa 2 podem ser frescas ou congeladas; na Etapa 4, as células são incubadas durante 15 minutos; As etapas 5 a 8 são omitidas; na Etapa 10, 3 ml de PeriPreps Lysis Buffer são adicionados para cada grama de peso de pélete celular original.
[00207] Após a preparação de amostras de proteína periplasmática, esferoplásticas ou de células inteiras, as amostras podem ser analisadas por qualquer um de vários métodos de caracterização e/ou quantificação de proteínas. Em um exemplo, o fracionamento bem- sucedido de proteínas periplasmáticas e esferoplásticas é confirmado pela análise de uma alíquota de frações tanto periplasmáticas quanto esferoplásticas por SDS-PAGE (dois microlitros de cada fração são geralmente suficientes para visualização por coloração com Azul Brilhante Coomassie). A presença de proteínas únicas ou o enriquecimento de proteínas específicas em uma determinada fração indica um fracionamento bem-sucedido. Por exemplo, se a célula hospedeira contiver um plasmídeo de alto número de cópias com o marcador de resistência de ampicilina, então a presença de β- lactamase (31,5 kDa) principalmente na fração periplasmática indica fracionamento bem-sucedido. Outras proteínas de E. coli encontradas no espaço periplasmático incluem fosfatase alcalina (50 kDa) e fator de alongamento Tu (43 kDa). A quantidade de proteína encontrada em uma determinada fração pode ser quantificada utilizando qualquer um de vários métodos (tais como SDS-PAGE e análise de densitometria de faixas de proteínas coradas ou marcadas, contagem de cintilação de proteínas radiomarcadas, ensaio imunoenzimático (ELISA), ou ensaio de proximidade de cintilação, entre outros métodos). A comparação das quantidades de uma proteína encontrada na fração periplasmática em comparação com a fração esferoplástica indica o grau em que a proteína foi exportada do citoplasma para o periplasma. EXEMPLO 10 Titulação da expressão pela variação da concentração do indutor
[00208] Para otimizar a produção de um produto gênico utilizando os sistemas de expressão da invenção, é possível ajustar ou titular independentemente as concentrações dos indutores. Células hospedeiras contendo construtos de expressão compreendendo promotores induzíveis - tais como promotores induzíveis por L- arabinose, induzível por propionato, induzível por L-ramnose ou induzível por D-xilose - são cultivadas até a densidade desejada para titulações de pequeno volume (tal como uma OD600 de aproximadamente 0,5) em meio mínimo M9 contendo os antibióticos apropriados, depois as células são divididas em alíquotas em pequenos volumes de meio mínimo M9, opcionalmente preparado sem fonte de carbono, tal como glicerol, e com os antibióticos apropriados e concentrações variáveis de cada indutor. Titulações de pequeno volume podem ser executadas em frascos agitados de 200 a 500 ml. A concentração de L-arabinose, L-ramnose ou D-xilose necessária para induzir a expressão é tipicamente menor (e é muitas vezes substancialmente menor) do que 0,02% por unidade de OD das células. Em um experimento de titulação, as concentrações testadas de L-arabinose podem variar de 2% a 1,5%, 1%, 0,5%, 0,2%, 0,1%, 0,05%, 0,04%, 0,03%, 0,02%, 0,01%, 0,005%, 0,002%, 0,001%, 0,0005%, 0,0002%, 0,0001%, 0,00005%, 0,00002%, 0,00001%, 0,000005%, 0,000002%, 0,000001%, 0,0000005%, 0,0000002%, 0,0000001%, 0,00000005%, 0,00000002% e 0,00000001%, tudo por unidade de OD das células. Uma concentração de 66,61 micromolar de L-arabinose corresponde a 0,001% de L-arabinose. Um experimento de titulação alternativo para L-arabinose, L-ramnose ou D-xilose seria testar as seguintes concentrações, expressas em termos de molaridade: 250 mM, 100 mM, 50 mM, 25 mM, 10 mM, 5 mM, 2,5 mM, 1,0 mM, 500 micromolar, 250 micromolar, 100 micromolar, 75 micromolar, 50 micromolar, 25 micromolar, 10 micromolar, 5,0 micromolar, 2,5 micromolar, 1,0 micromolar, 500 nM, 250 nM, 100 nM, 50 nM, 25 nM, 10 nM, 5,0 nM, 2,5 nM, 1,0 nM, 500 pM, 250 pM, 100 pM, 50 pM, 25 pM, 10 pM, 5,0 pM, 2,5 pM e 1,0 pM, todos por unidade de OD das células. Para o propionato, as concentrações a serem testadas podem variar de 1 M a 750 mM, 500 mM, 250 mM, 100 mM, 75 mM, 50 mM, 25 mM, 10 mM, 5 mM, 1 mM, 750 micromolar, 500 micromolar, 250 micromolar, 100 micromolar, 50 micromolar, 25 micromolar, 10 micromolar, 5,0 micromolar, 2,5 micromolar, 1,0 micromolar, 500 nM, 250 nM, 100 nM, 50 nM, 25 nM, 10 nM, 5,0 nM, 2,5 nM e 1,0 nM tudo por unidade de OD das células.
[00209] Para cada concentração 'x' de L-arabinose (ou L-ramnose ou D-xilose) que é testada, a concentração de um indutor diferente, tal como propionato, adicionado a cada um dos tubos contendo a concentração 'x' do primeiro indutor, é variada em cada série de amostras. Alternativamente, os experimentos de titulação podem começar em uma combinação "padrão" de concentrações de indutor, que para células hospedeiras tendo um nível reduzido de função do gene de pelo menos um gene que codifica uma proteína que metaboliza o indutor é 0,0015% (100 micromolar) de qualquer um de L -arabinose, L-ramnose ou D-xilose por unidade de OD das células e/ou propionato 100 micromolar por unidade de OD das células. Para células hospedeiras nas quais as proteínas que metabolizam o indutor são funcionais, a combinação "padrão" de concentrações de indutor é 0,0033% (220 micromolar) de qualquer um de L-arabinose, L-ramnose ou D-xilose por unidade de OD das células, e/ou propionato 83 mM por unidade de OD das células. Combinações adicionais de concentrações de indutor que variam daquela da combinação 'padrão' são testadas; em uma série de experimentos de titulação, os resultados dos experimentos iniciais podem ser utilizados para 'ajustar' as concentrações do indutor utilizadas em experimentos posteriores. Experiências de titulação semelhantes podem ser executadas com qualquer combinação de indutores utilizados em um sistema de expressão da invenção, incluindo, mas não limitado a L-arabinose, propionato, L-ramnose e D-xilose. Após crescimento na presença de indutores durante 6 horas, as células são agregadas, o produto desejado é extraído das células e o rendimento do produto por valor de massa das células é determinado por um ensaio imunológico quantitativo, tal como ELISA, ou através da purificação do produto e quantificação por absorvância de UV em 280 nm.
[00210] Também é possível titular as concentrações do indutor utilizando um ensaio de alto rendimento, no qual as proteínas a serem expressas são projetadas para incluir um componente de proteína fluorescente, tal como aquela fornecida pela proteína fluorescente vermelha mKate2 (Evrogen, Moscow, Russia), ou as proteínas fluorescentes verdes intensificadas de Aequorea victoria e Bacillus cereus. Outra abordagem para determinar a quantidade e a atividade dos produtos gênicos produzidos por diferentes concentrações de indutores em um experimento de titulação de alto rendimento é utilizar um sensor capaz de medir as interações de ligação biomolecular, tal como um sensor que detecta ressonância plasmônica de superfície ou um sensor que emprega interferometria de bio-camada (BLI) (por exemplo, um sistema Octet® QK de forteBIO, Menlo Park, CA). Se um anticorpo estiver disponível que se liga com especificidade suficiente ao produto gênico que está sendo expresso, o produto gênico pode ser detectado e quantificado utilizando um Western blot de eletroforese capilar, tal como aquele operado em um sistema WES conforme descrito no Exemplo 6. EXEMPLO 11 Determinação de similaridade da sequência de polinucleotídeo ou aminoácido
[00211] A porcentagem de identidade de sequência de polinucleotídeo ou de sequência de aminoácido é definida como o número de símbolos alinhados, isto é, nucleotídeos ou aminoácidos, que são idênticos em ambas as sequências alinhadas, dividido pelo número total de símbolos no alinhamento das duas sequências, incluindo intervalos. O grau de similaridade (porcentagem de identidade) entre duas sequências pode ser determinado através do alinhamento das sequências utilizando o método de alinhamento global de Needleman and Wunsch (J. Mol. Biol. 48:443, 1970), conforme implementado pelo National Center for Biotechnology Information (NCBI) na Needleman-Wunsch Global Sequence Alignment Tool, disponível através do site blast.ncbi.nlm.nih.gov/Blast.cgi. Em uma modalidade, os parâmetros de alinhamento de Needleman and Wunsch são definidos para os valores padrão (Match/Mismatch Scores de 2 e 3, respectivamente, e Gap Costs for Existence and Extension de 5 e 2, respectivamente). Outros programas utilizados por aqueles versados na técnica de comparação de sequências também podem ser utilizados para alinhar as sequências, tais como, por exemplo, a ferramenta de pesquisa de alinhamento local básica ou o programa BLAST® (Altschul et al., "Basic local alignment search tool", J Mol Biol 1990 Oct 5; 215(3): 403- 410), conforme implementado pelo NCBI, utilizando as configurações de parâmetro padrão descritas no site blast.ncbi.nlm.nih.gov/Blast.cgi. O algoritmo BLAST possui vários parâmetros opcionais, incluindo dois que podem ser utilizados como se segue: (A) inclusão de um filtro para mascarar segmentos da sequência de pesquisa que possuem baixa complexidade de composição ou segmentos que consistem em repetições internas de periodicidade curta, que é de preferência não utilizado ou definido como 'desligado', e (B) um limite de significância estatística para relatar correspondências contra sequências de banco de dados, chamado 'Esperar' ou E-score (a probabilidade esperada de correspondências serem encontradas meramente por acaso; se a significância estatística atribuída a uma correspondência for maior do que este limite de E-score, a correspondência não será relatada). Se este valor 'Esperar' ou E-score for ajustado do valor padrão (10), os valores de limite preferidos são 0,5, ou em ordem de preferência crescente, 0,25, 0,1, 0,05, 0,01, 0,001, 0,0001, 0,00001 e 0,000001.
[00212] Na prática da presente invenção, muitas técnicas convencionais em biologia molecular, microbiologia e tecnologia de DNA recombinante são opcionalmente utilizadas. Essas técnicas convencionais referem-se a vetores, células hospedeiras e métodos recombinantes. Estas técnicas são bem conhecidas e são explicadas, por exemplo, em Berger and Kimmel, Guide to Molecular Cloning Techniques, Methods in Enzymology volume 152 Academic Press, Mc, San Diego, CA; Sambrook et al., Molecular Cloning - A Laboratory Manual (3rd Ed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 2000; e Current Protocols in Molecular Biology, F.M. Ausubel et al., eds., Current Protocols, a joint venture between
Greene Publishing Associates, Inc. and John Wiley & Sons, Inc., (complementado até 2006). Outras referências úteis, por exemplo, para isolamento e cultura de células e para subsequente isolamento de ácido nucleico ou proteína, incluem Freshney (1994) Culture of Animal Cells, a Manual of Basic Technique, third edition, Wiley-Liss, New York e as referências nele citadas; Payne et al. (1992) Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons, Inc. New York, NY; Gamborg and Phillips (Eds.) (1995) Plant Cell, Tissue and Organ Culture; Fundamental Methods Springer Lab Manual, Springer- Verlag (Berlin Heidelberg New York); e Atlas and Parks (Eds.) The Handbook of Microbiological Media (1993) CRC Press, Boca Raton, FL. Métodos de produção de ácidos nucleicos (por exemplo, por meio de amplificação in vitro, purificação de células ou síntese química), métodos para manipulação de ácidos nucleicos (por exemplo, por meio da mutagênese direcionada ao sítio, digestão com enzimas de restrição, ligação, etc.) e vários vetores, linhagens celulares e semelhantes úteis na manipulação e produção de ácidos nucleicos são descritos nas referências acima. Além disso, essencialmente qualquer polinucleotídeo (incluindo polinucleotídeos marcados ou biotinilados) pode ser personalizado ou padronizado de qualquer uma de uma variedade de fontes comerciais.
[00213] A presente invenção foi descrita em termos de modalidades particulares encontradas ou propostas para compreender certos modos para a prática da invenção. Será observado por aqueles de habilidade prática na técnica que, à luz da presente invenção, numerosas modificações e alterações podem ser feitas nas modalidades particulares exemplificadas sem se afastar do escopo pretendido da invenção.
[00214] Todas as referências citadas, incluindo publicações de patentes, são incorporadas nesta invenção por referência na sua totalidade. Sequências de nucleotídeo e outras genéticas, referidas pela localização genômica publicada ou outra descrição, também são expressamente incorporadas nesta invenção por referência.
SEQUÊNCIAS APRESENTADAS NA LISTAGEM DE SEQUÊNCIAS SEQ Comprimento: Tipo: Organismo: Descrição; 'Outras Informações' ID NO: 1 21 PRT Homo sapiens Insulina humana nativa, cadeia A 2 30 PRT Homo sapiens Insulina humana nativa, cadeia B 3 30 PRT Sequência Insulina lispro, cadeia B Artificial 4 30 PRT Sequência Insulina aspártica, cadeia B Artificial 5 30 PRT Sequência Insulina glulisina, cadeia B Artificial 6 21 PRT Sequência Insulina glargina, cadeia A Artificial 7 32 PRT Sequência Insulina glargina, cadeia B Artificial 8 29 PRT Sequência Insulina degludeca, cadeia B; Artificial modificação de lisina em B29 com uma molécula de ácido hexadecanodióico ligada a B29 através de um ligante L-gamma-Glu 9 29 PRT Sequência Insulina detemir, cadeia B; Artificial modificação de lisina em B29 com uma molécula de ácido mirístico 10 35 PRT Homo sapiens O C-peptídeo de insulina humana 11 9 PRT Sequência C-peptídeo artificial Artificial 12 34 PRT Sequência Variante artificial do C-peptídeo Artificial humano 13 25 PRT Sequência Variante artificial do C-peptídeo Artificial humano 14 8 PRT Sequência C-peptídeo artificial Artificial 15 147 PRT Sequência Metreleptina Artificial
SEQ Comprimento: Tipo: Organismo: Descrição; 'Outras Informações' ID NO: 16 168 PRT Vírus da cólera Vírus da cólera suína / vírus da febre suína (cepa suína clássica (CSFV) Npro Alfort) 17 91 PRT Caenorhabditis Modificador relacionado à ubiquitina elegans menor (SUMO) 18 26 PRT Sequência Polipeptídeo ligante Artificial 19 50 PRT Sequência Polipeptídeo ligante Artificial 20 7 PRT Sequência Sequência de aminoácido clivável por Artificial ácido 21 8 PRT Sequência Sítio de clivagem da protease do TEV Artificial (vírus etch do tabaco) 22 6 PRT Sequência Sítio de clivagem da enterocinase Artificial 23 6 PRT Sequência Sítio de clivagem de trombina Artificial 24 396 PRT Escherichia Proteína de ligação a maltose (MBP) coli 25 169 PRT Thermotoga Módulo de ligação de carboidrato da maritima família 9 de Thermotoga maritima xilanase 10a (CBM9) 26 95 PRT Homo sapiens Propeptídeo de carboxipeptidase B 27 44 PRT Sequência Variante do propeptídeo de Artificial carboxipeptidase B 28 51 PRT Sequência Variante do propeptídeo de Artificial carboxipeptidase B 29 51 PRT Sequência Variante do propeptídeo de Artificial carboxipeptidase B 30 53 PRT Sequência Variante do propeptídeo de Artificial carboxipeptidase B 31 53 PRT Sequência Variante do propeptídeo de Artificial carboxipeptidase B 32 58 PRT Sequência Variante do propeptídeo de Artificial carboxipeptidase B 33 48 PRT Sequência Variante do propeptídeo de Artificial carboxipeptidase B com sequência
SEQ Comprimento: Tipo: Organismo: Descrição; 'Outras Informações' ID NO: Asp-Pro clivável por ácido 34 48 PRT Sequência Variante do propeptídeo de Artificial carboxipeptidase B com sequência Asp-Pro clivável por ácido 35 51 PRT Sequência Variante do propeptídeo de Artificial carboxipeptidase B com sequência Asp-Pro clivável por ácido 36 18 PRT Sequência Variante do propeptídeo de Artificial carboxipeptidase B 37 8 PRT Sequência Propeptídeo artificial Artificial 38 189 PRT S. cerevisiae Saccharomyces cerevisiae (cepa S288c) Erv1p 39 191 PRT Sequência Variante CPBpro ligada ao N-terminal Artificial de metreleptina 40 486 PRT Sequência Proteína dissulfeto isomerase (PDI) de Artificial Humicola insolens, sem peptídeo de sinal 41 1487 DNA Sequência Polinucleotíde que codifica a PDI de Artificial Humicola insolens sem peptídeo de sinal 42 5304 DNA Sequência Vetor do promotor dual, pSOL Artificial 43 104 PRT Sequência Polipeptídeo da pró-insulina lispro Artificial variante CPBpro PN2.5 44 329 DNA Sequência Polinucleotídeo que codifica Artificial polipeptídeo de pró-insulina lispro variante CPBpro PN2.5 45 111 PRT Sequência Polipeptídeo de pró-insulina lispro Artificial variante CPBpro PN2.6 46 350 DNA Sequência Polinucleotídeo que codifica Artificial polipeptídeo de pró-insulina lispro variante CPBpro PN2.6 47 111 PRT Sequência Polipeptídeo de pró-insulina lispro Artificial variante CPBpro PN2.7 48 350 DNA Sequência Polinucleotídeo que codifica Artificial polipeptídeo de pró-insulina lispro
SEQ Comprimento: Tipo: Organismo: Descrição; 'Outras Informações' ID NO: variante CPBpro PN2.7 49 113 PRT Sequência Polipeptídeo de pró-insulina lispro Artificial variante CPBpro PN2.8 50 356 DNA Sequência Polinucleotídeo que codifica Artificial polipeptídeo de pró-insulina lispro variante CPBpro PN2.8 51 113 PRT Sequência Polipeptídeo de pró-insulina lispro Artificial variante CPBpro PN2.9 52 356 DNA Sequência Polinucleotídeo que codifica Artificial polipeptídeo de pró-insulina lispro variante CPBpro PN2.9 53 118 PRT Sequência Polipeptídeo de pró-insulina lispro Artificial variante CPBpro PN2.10 54 371 DNA Sequência Polinucleotídeo que codifica Artificial polipeptídeo de pró-insulina lispro variante CPBpro PN2.10 55 104 PRT Sequência Polipeptídeo de pró-insulina glargina Artificial variante CPBpro PN3.13 56 329 DNA Sequência Polinucleotídeo que codifica Artificial polipeptídeo de pró-insulina glargina variante CPBpro PN3.13 57 570 DNA Sequência Polinucleotídeo que codifica Artificial Saccharomyces cerevisiae (cepa S288c) Erv1p 58 13 PRT Homo sapiens Fragmento da cadeia A de insulina 59 12 PRT Homo sapiens Fragmento da cadeia B de insulina 60 4 PRT Homo sapiens Fragmento da cadeia A de insulina 61 8 PRT Homo sapiens Fragmento da cadeia B de insulina 62 108 PRT Sequência Polipeptídeo de pró-insulina glargina Artificial variante CPBpro PN3.15 63 359 DNA Sequência Polinucleotídeo que codifica Artificial polipeptídeo de pró-insulina glargina variante CPBpro PN3.15 64 108 PRT Sequência Polipeptídeo de pró-insulina glargina Artificial variante CPBpro PN3.16 65 359 DNA Sequência Polinucleotídeo que codifica Artificial polipeptídeo de pró-insulina glargina
SEQ Comprimento: Tipo: Organismo: Descrição; 'Outras Informações' ID NO: variante CPBpro PN3.16 66 111 PRT Sequência Polipeptídeo de pró-insulina glargina Artificial variante CPBpro PN3.17 67 368 DNA Sequência Polinucleotídeo que codifica Artificial polipeptídeo de pró-insulina glargina variante CPBpro PN3.17 68 103 PRT Sequência Polipeptídeo de pró-insulina glargina Artificial variante PN3.62 69 77 PRT Sequência Polipeptídeo de pró-insulina glargina Artificial variante PN3.116 70 93 PRT Sequência Polipeptídeo de pró-insulina glargina Artificial variante PN3.165 71 94 PRT Sequência Polipeptídeo de pró-insulina glargina Artificial variante PN3.172 72 84 PRT Sequência Polipeptídeo de pró-insulina glargina Artificial variante PN3.185

Claims (29)

REIVINDICAÇÕES
1. Método para a produção de um ou mais produtos gênicos, caracterizado pelo fato de que compreende: fornecer uma primeira solução compreendendo pelo menos um produto gênico que foi expresso em uma célula hospedeira, em que ao menos algum do pelo menos um dito produto gênico na referida primeira solução pode ser sedimentado através de centifugação em 7000 x g para formar um pélete solubilizável; e colocar ao menos algum do pelo menos um dito produto gênico em uma solução de solubilização; e recuperar pelo menos algum do dito pelo menos um produto gênico da referida solução de solubilização, em que a quantidade do dito pelo menos um produto gênico recuperado da referida solução de solubilização é ao menos 50% da quantidade total do dito pelo menos um produto gênico presente na referida primeira solução; em que o dito pelo menos um produto gênico não é colocado em contato com um agente redutor.
2. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que ainda compreende: submeter a referida primeira solução à centrifugação, em que a referida primeira solução é separada em uma fração solúvel e um pélete; e recuperar ao menos algum do dito pelo menos um produto gênico do referido pélete, que é colocado na referida solução de solubilização.
3. Método para produzir um ou mais produtos gênicos, caracterizado pelo fato de que compreende: fornecer uma primeira solução compreendendo pelo menos um produto gênico que foi expresso em uma célula hospedeira; e submeter a referida primeira solução à centrifugação, em que a referida primeira solução é separada em uma fração solúvel e um pélete; e recuperar pelo menos algum do dito pelo menos um produto gênico do referido pélete; e colocar ao menos algum do dito pelo menos um produto gênico recuperado do referido pélete em uma solução de solubilização; e recuperar pelo menos algum do dito pelo menos um produto gênico da referida solução de solubilização, em que a quantidade do dito pelo menos um produto gênico recuperado da referida solução de solubilização é pelo menos 50% da quantidade total do dito pelo menos um produto gênico presente na referida primeira solução; em que o dito pelo menos um produto gênico não é colocado em contato com um agente redutor.
4. Método, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que dito pelo menos um produto gênico é um polipeptídeo que forma pelo menos uma ligação de dissulfeto.
5. Método, de acordo com qualquer uma das reivindicações 1 a 4, caracterizado pelo fato de que dito pelo menos um produto gênico é um polipeptídeo que carece de um peptídeo de sinal.
6. Método, de acordo com qualquer uma das reivindicações 1 a 5, caracterizado pelo fato de que dito pelo menos um dito produto gênico compreende um polipeptídeo selecionado do grupo que consiste em (a) leptina, metreleptina, hormônio do crescimento, hormônio do crescimento humano, um polipeptídeo compreendendo a sequência de aminoácido de uma cadeia madura de insulina, e (b) um fragmento de qualquer um dos polipeptídeos de (a).
7. Método, de acordo com qualquer uma das reivindicações 1 a 6, caracterizado pelo fato de que a primeira solução é um lisado da referida célula hospedeira.
8. Método, de acordo com a reivindicação 7, caracterizado pelo fato de que o lisado da referida célula hospedeira foi produzido pelo contato da célula hospedeira com a lisozima.
9. Método, de acordo com a reivindicação 7, caracterizado pelo fato de que o lisado da referida célula hospedeira foi produzido por lise mecânica.
10. Método, de acordo com qualquer uma das reivindicações 1 a 9, caracterizado pelo fato de que a célula hospedeira é uma célula procariótica.
11. Método, de acordo com a reivindicação 10, caracterizado pelo fato de que a célula hospedeira é uma célula de Escherichia coli.
12. Método, de acordo com qualquer uma das reivindicações 1 a 11, caracterizado pelo fato de que a referida célula hospedeira foi modificada para ter um citoplasma mais oxidante.
13. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que a modificação na referida célula hospedeira resulta na expressão defeituosa de pelo menos um gene selecionado do grupo que consiste em trxB, gor, gshA e gshB.
14. Método, de acordo com a reivindicação 13, caracterizado pelo fato de que a referida célula hospedeira compreende ainda uma mutação no gene ahpC.
15. Método, de acordo com qualquer uma das reivindicações 1 a 14, caracterizado pelo fato de que a célula hospedeira compreende um ou mais construtos de expressão.
16. Método, de acordo com a reivindicação 15, caracterizado pelo fato de que pelo menos um dito construto de expressão compreende pelo menos um promotor induzível.
17. Método, de acordo com a reivindicação 16, caracterizado pelo fato de que a referida célula hospedeira possui um nível reduzido de função de um gene de pelo menos um gene que codifica uma proteína que metaboliza o indutor de pelo menos um dos ditos pelo menos um promotor induzível.
18. Método, de acordo com qualquer uma das reivindicações 2 a 17, caracterizado pelo fato de que a centrifugação está a uma força entre 900 x g e 25.000 x g.
19. Método, de acordo com qualquer uma das reivindicações 1 a 18, caracterizado pelo fato de que a referida solução de solubilização compreende pelo menos um agente caotrópico.
20. Método, de acordo com qualquer uma das reivindicações 1 a 19, caracterizado pelo fato de que dito pelo menos um agente caotrópico é selecionado do grupo que consiste em n- butanol, etanol, cloreto de guanidínio, cloridrato de guanidina, perclorato de lítio, acetato de lítio, cloreto de magnésio, fenol, 2- propanol, dodecil sulfato de sódio, tioureia e ureia.
21. Método, de acordo com a reivindicação 20, caracterizado pelo fato de que dito pelo menos um agente caotrópico é selecionado do grupo que consiste em ureia em uma concentração entre 2M e 10M e cloridrato de guanadina em uma concentração entre 2M e 8M.
22. Método, de acordo com qualquer uma das reivindicações 1 a 21, caracterizado pelo fato de que ainda compreende reduzir a concentração de dito pelo menos um agente caotrópico na solução de solubilização.
23. Método, de acordo com a reivindicação 22, caracterizado pelo fato de que a diluição da referida solução de solubilização reduz a concentração de dito pelo menos um agente caotrópico para 50% ou menos de sua concentração inicial na referida solução de solubilização.
24. Método, de acordo com a reivindicação 22 ou 23, caracterizado pelo fato de que ainda compreende a incubação da referida solução de solubilização compreendendo uma concentração reduzida de dito pelo menos um agente caotrópico durante pelo menos uma hora.
25. Método, de acordo com qualquer uma das reivindicações 1 a 24, caracterizado pelo fato de que pelo menos algum do dito pelo menos um produto gênico recuperado da referida solução de solubilização possui uma propriedade selecionada do grupo que consiste em ligações de dissulfeto apropriadamente formadas e uma atividade de produto gênico.
26. Método, de acordo com a reivindicação 25, caracterizado pelo fato de que pelo menos 50% do dito pelo menos um produto gênico recuperado da referida solução de solubilização possui ligações de dissulfeto apropriadamente formadas.
27. Método, de acordo com qualquer uma das reivindicações 1 a 26, caracterizado pelo fato de que ainda compreende a purificação cromatográfica do dito pelo menos um produto gênico.
28. Método, de acordo com a reivindicação 27, caracterizado pelo fato de que a purificação cromatográfica é cromatografia de afinidade com metal imobilizado (IMAC).
29. Método, de acordo com a reivindicação 28, caracterizado pelo fato de que a purificação cromatográfica utiliza uma coluna Ni-NTA.
BR112021005634-3A 2018-09-25 2019-09-25 métodos de purificação de proteína BR112021005634A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862735861P 2018-09-25 2018-09-25
US62/735,861 2018-09-25
PCT/US2019/052998 WO2020069011A1 (en) 2018-09-25 2019-09-25 Protein purification methods

Publications (1)

Publication Number Publication Date
BR112021005634A2 true BR112021005634A2 (pt) 2021-06-29

Family

ID=68296636

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112021005634-3A BR112021005634A2 (pt) 2018-09-25 2019-09-25 métodos de purificação de proteína

Country Status (11)

Country Link
US (2) US11584785B2 (pt)
EP (1) EP3856760A1 (pt)
JP (1) JP2022502039A (pt)
KR (1) KR20210064325A (pt)
CN (1) CN113286810A (pt)
AU (1) AU2019349934A1 (pt)
BR (1) BR112021005634A2 (pt)
CA (1) CA3114395A1 (pt)
IL (1) IL281804A (pt)
MX (1) MX2021003475A (pt)
WO (1) WO2020069011A1 (pt)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SI3551209T1 (sl) 2016-12-09 2021-10-29 Akston Biosciences Corp Inzulin-FC fuzije in postopki uporabe
US11267862B2 (en) 2018-06-29 2022-03-08 Akston Biosciences Corporation Ultra-long acting insulin-Fc fusion proteins and methods of use
HUE058005T2 (hu) 2018-06-29 2022-06-28 Akston Biosciences Corp Ultra hosszan ható inzulin Fc fehérjék, és alkalmazási eljárások
MX2021003475A (es) * 2018-09-25 2021-09-10 Absci Corp Metodos de purificacion de proteinas.
DK4073098T5 (da) 2019-12-19 2024-07-22 Akston Biosciences Corp Ultralangtidsvirkende insulin-Fc-fusionsproteiner og fremgangsmåder til anvendelse
US11186623B2 (en) 2019-12-24 2021-11-30 Akston Bioscience Corporation Ultra-long acting insulin-Fc fusion proteins and methods of use
CN116096733A (zh) 2020-04-10 2023-05-09 阿卡斯通生物科学公司 Covid-19融合蛋白的抗原特异性免疫疗法和使用方法
US11192930B2 (en) 2020-04-10 2021-12-07 Askton Bioscences Corporation Ultra-long acting insulin-Fc fusion protein and methods of use
US11198719B2 (en) 2020-04-29 2021-12-14 Akston Biosciences Corporation Ultra-long acting insulin-Fc fusion protein and methods of use
US11667689B2 (en) 2021-07-23 2023-06-06 Akston Biosciences Corporation Insulin-Fc fusion proteins and methods of use to treat cancer
CN114903827B (zh) * 2022-05-07 2023-11-28 广东蒂姆森大健康科技有限公司 一种高稳定性的皂角水提物的制备方法
CN116046947B (zh) * 2023-01-28 2023-06-02 北京惠之衡生物科技有限公司 一种德谷胰岛素中残留赖氨酰内切酶的检测方法
CN117603323A (zh) * 2023-05-16 2024-02-27 张文康 一种肉毒毒素的制备方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1305285C (en) * 1987-04-21 1992-07-14 Malcolm Roy Brandon Production of proteins in active forms
ATE437655T1 (de) 1999-06-25 2009-08-15 Genentech Inc Humanisierte anti-erbb2 antikörper und behandlung mit anti-erbb2 antikörper
EP1856255A4 (en) * 2005-02-11 2010-01-27 Univ Southern California METHODS OF EXPRESSING PROTEINS WITH DISULFIDE BRIDGES
WO2009089154A2 (en) 2008-01-03 2009-07-16 Cornell Research Foundation, Inc. Glycosylated protein expression in prokaryotes
WO2012115638A1 (en) * 2011-02-23 2012-08-30 Elona Biotechnologies Glargine proinsulin compositions and methods of producing glargine insulin analogs therefrom
WO2013168178A1 (en) * 2012-03-30 2013-11-14 Krishnan Archana Rajesh Process for renaturation of polypeptides
US20150353940A1 (en) 2013-08-05 2015-12-10 Absci, Llc Vectors for use in an inducible coexpression system
WO2017106583A1 (en) * 2015-12-15 2017-06-22 Absci, Llc Cytoplasmic expression system
EP4273257A3 (en) 2012-08-05 2024-02-28 ABSCI Corporation Inducible coexpression system
MX2021003475A (es) * 2018-09-25 2021-09-10 Absci Corp Metodos de purificacion de proteinas.

Also Published As

Publication number Publication date
US20200299343A1 (en) 2020-09-24
WO2020069011A1 (en) 2020-04-02
KR20210064325A (ko) 2021-06-02
AU2019349934A1 (en) 2021-05-13
US11584785B2 (en) 2023-02-21
US20230072673A1 (en) 2023-03-09
CA3114395A1 (en) 2020-04-02
JP2022502039A (ja) 2022-01-11
MX2021003475A (es) 2021-09-10
CN113286810A (zh) 2021-08-20
EP3856760A1 (en) 2021-08-04
IL281804A (en) 2021-05-31

Similar Documents

Publication Publication Date Title
US11584785B2 (en) C-peptides and proinsulin polypeptides comprising the same
Hayat et al. Recombinant protein expression in Escherichia coli (E. coli): what we need to know
ES2906725T3 (es) Vectores para el uso en un sistema de coexpresión inducible
US8148494B2 (en) Signal peptide for the production of recombinant proteins
WO2017106583A1 (en) Cytoplasmic expression system
US20200270338A1 (en) Expression constructs, host cells, and methods for producing insulin
Nag et al. Strategies to improve the expression and solubility of recombinant proteins in E. coli
JP3691722B2 (ja) 自然に折りたたまれかつ分泌されるタンパク質を生産するための方法
Malik et al. Periplasmic production of native human proinsulin as a fusion to E. coli ecotin
Lee et al. Enhanced production of antibody fragment via SRP pathway engineering in Escherichia coli
Zhang et al. Preparation of selenocysteine-containing forms of human SELENOK and SELENOS
Chilakapati et al. Characterization and Expression Profiling of Recombinant Parathyroid Hormone (rhPTH) Analog 1–34 in Escherichia coli, Precise with Enhanced Biological Activity
JP2006174833A (ja) 細胞の成長を促進する方法及びターゲット遺伝子の発現による遺伝子産物の生産量を増加する方法
US20230159598A1 (en) Polypeptide cleavage methods
CN111197041B (zh) 制备青鳉鱼肠激酶活性亚基的方法、其产物和用途
US20220364104A1 (en) Vectors for use in an inducible coexpression system
CA2705077C (en) Inducible/regulated gene expression system in e. coli
Nataraj et al. Evaluating various Promoters for increased expression of Proinsulin
JP2005046068A (ja) 蛋白質生産用の新規なバクテリア及び蛋白質の製造方法
US20100279344A1 (en) Integrated cytokine production system
CN116217699A (zh) 一种高效表达羊生长激素的方法
Tomson Production of labelled recombinant proteins in fed-batch systems in Escherichia coli
BR122024008472A2 (pt) Construto de expressão, kit, célula hospedeira e método de produção de produto genético

Legal Events

Date Code Title Description
B25A Requested transfer of rights approved

Owner name: ABSCI CORPORATION (US)