BRPI0915414A2 - Métodos para identificar uma região propensa à agregação e uma região de ligação de macromolécula em uma proteína, bem como métodos para produzir uma variante de proteína e uma composição farmacêutica. - Google Patents

Métodos para identificar uma região propensa à agregação e uma região de ligação de macromolécula em uma proteína, bem como métodos para produzir uma variante de proteína e uma composição farmacêutica. Download PDF

Info

Publication number
BRPI0915414A2
BRPI0915414A2 BRPI0915414-0A BRPI0915414A BRPI0915414A2 BR PI0915414 A2 BRPI0915414 A2 BR PI0915414A2 BR PI0915414 A BRPI0915414 A BR PI0915414A BR PI0915414 A2 BRPI0915414 A2 BR PI0915414A2
Authority
BR
Brazil
Prior art keywords
protein
atoms
sap
aggregation
region
Prior art date
Application number
BRPI0915414-0A
Other languages
English (en)
Inventor
Naresh Chennamsetty
Bernhard Helk
Bernhardt Trout
Veysel Kayser
Vladimir Voynov
Original Assignee
Novartis Ag
Massachusetts Institute Of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novartis Ag, Massachusetts Institute Of Technology filed Critical Novartis Ag
Publication of BRPI0915414A2 publication Critical patent/BRPI0915414A2/pt

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/20Protein or domain folding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/395Antibodies; Immunoglobulins; Immune serum, e.g. antilymphocytic serum
    • A61K39/39591Stabilisation, fragmentation
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/71Receptors; Cell surface antigens; Cell surface determinants for growth factors; for growth regulators
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/08Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses
    • C07K16/10Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses from RNA viruses
    • C07K16/1036Retroviridae, e.g. leukemia viruses
    • C07K16/1045Lentiviridae, e.g. HIV, FIV, SIV
    • C07K16/1063Lentiviridae, e.g. HIV, FIV, SIV env, e.g. gp41, gp110/120, gp160, V3, PND, CD4 binding site
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B99/00Subject matter not provided for in other groups of this subclass
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C10/00Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/90Immunoglobulins specific features characterized by (pharmaco)kinetic aspects or by stability of the immunoglobulin
    • C07K2317/94Stability, e.g. half-life, pH, temperature or enzyme-resistance
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C99/00Subject matter not provided for in other groups of this subclass

Abstract

método para identificar uma região propensa à agregação e uma região de ligação de macromolécula em uma proteína, bem como métodos para produzir uma variante de proteína e uma composição farmacêutica. a presente invenção refere-se a métodos e ferramentas computacionais com base, pelo menos em parte, nas estimulações com computador que identificam regiões de ligação de macromolécula e região propensa a agregações de uma proteína. substituições podem então ser feitas nessas regiões propensas à agregação para projetar proteínas com estabilidade aumentada e/ou uma tendência reduzida para agregação. similarmente, substituições podem então ser produzidas nessas regiões de ligação de macromolécula para projetar proteínas com afinidade de ligação alterada para uma macromolécula.

Description

: Relatório Descritivo da Patente de Invenção para "MÉTODOS
PARA IDENTIFICAR UMA REGIÃO PROPENSA À AGREGAÇÃO E UMA | REGIÃO DE LIGAÇÃO DE MACROMOLÉCULA EM UMA PROTEÍNA, BEM COMO MÉTODOS PARA PRODUZIR UMA VARIANTE DE PROTEÍ- NAEUMA COMPOSIÇÃO FARMACÊUTICA".
ANTECEDENTES DA INVENÇÃO A presente invenção refere-se a ao entendimento e controle de estabilidade de proteína cujo esforço foi desejado por biólogos, químicos e engenheiros. A primeira ligação entre substituição de aminoácido e doença (Ingram. Nature. 1957, 180(4581):326-8.) ofereceu uma nova e essencial perspectiva na estabilidade de proteína na saúde e na doença. O aumento tremendo recente de produtos farmacêuticos à base de proteína criou um novo desafio. Proteínas terapêuticas são armazenadas no líquido por vários meses em concentrações muito alta. A percentagem da espécie não monomé- rica aumenta com o tempo. Uma vez que agregados se formam, não apenas a eficácia do produto diminui, mas os efeitos colaterais tal como resposta imuno- lógica após a administração pode ocorrer. Assegurando estabilidade dos produ- tos farmacêuticos de proteína para a vida útil do produto é imperativo. Por causa de seu potencial na cura de várias doenças, anticorpos atualmente constituem a classe em desenvolvimento mais rápida de tera- pêutica humana (Carter. Nature Reviews Immunology. 2006, 6(5), 343). Desde 2001, seu mercado estava se desenvolvendo em uma taxa de cres- cimento anualmente média de 35%, a taxa mais alta entre todas as categori- as de fármacos biotec (S. Aggarwal, Nature. BioTech. 2007, 25 (10) 1097). Anticorpos terapêuticos são preparados e são armazenados em soluções aquosas em altas concentrações, quando exigido para o tratamen- to de doença. No entanto, esses anticorpos são termodinamicamente instá- veis sob essas condições e grau devido a agregação. A agregação por sua vez leva a uma diminuição na atividade de anticorpo tornando o fármaco ine- ficaz e pode ainda gerar uma resposta imunológica. Como tal, há uma ne- cessidade urgente em desenvolver um entendimento mecanicista de como esses anticorpos, e de fato proteínas em geral, agregam, a descobrir quais regiões da proteína estão envolvidas na agregação, e a desenvolver estraté- gias para impedir agregação.
Esses efeitos são particularmente importantes para terapêutica de anticorpo. Uma abordagem para estabilização de anticorpo é enxertar os laços de CDR que conferem especificidade de ligação de antígeno sobre uma estrutura mais estável (Ewert, Honegger, and Pluckthun, Biochemistry. 2003, 42(6): 1517-28.). Essa abordagem apenas trabalhará se a sequência de aminoácidos nos laços de CDR não for a força de agregação motriz, e se enxerto dos laços de CDR sobre uma estrutura mais estável não mudar a especificidade de ligação de antígeno.
A tecnologia relacionada com regiões propensas à agregação de proteína previstas pode ser dividida em duas categorias, 1) modelos feno- menológicos e 2) técnicas de simulação moleculares. Os modelos fenome- nológicos são principalmente com base na previsão da agregação 'wpontos , 15 quentes' das sequências primárias da proteína usando-se propriedades tais BR como hidrofobicidade, tendência a B-folha etc., enquanto que as técnicas de simulação moleculares usam as três estruturas dimensionais e dinâmicas de proteínas para localizar as regiões propensas à agregação. A maioria das técnicas foi dirigidas na direção do entendimento de formação e agregação defibrilaamiloide de outras proteínas pequenas onde a formação de B-folha é predominante.
Modelos fenomenológicos foram desenvolvidos com base nas propriedades fisicoquímicas tais como hidrofobicidade, tendência a B-folha etc., para prover as regiões propensas à agregação de sequência primária de proteina (Caflisch, Current Opinion in Chemical Biology. 2006, 10, 437- 444; Chiti and Dobson. Annu. Rev. Biochem.2006, 75: 333-366). Um dos modelos fenomenológicos iniciais eram com base nos estudos mutacionais da cinética de agregação de uma proteína globular pequena 'Acilofosfato de músculo humano (AcP) juntamente com outros peptídeos não estruturados e proteína ativamente não dobradas (Chiti, e outros Nature. 2003, 424 p. 805- 808; a patente U.S. No. 7379824]. Esse estudo revelou correlações simples entre as propriedades fisicoquímicas e agregação tais como tendência a B-
| 3179 folha, hidrofobicidade e carga.
Esses estudos foram feitos sob condições em que as proteínas são principalmente não estruturadas.
Assim um modelo empírico de três parâmetros foi desenvolvido que liga sequência à tendência de tendência à agregação (Chiti, e outros Nature. 2003, 424, 805-808). Esse — modelofoitambém usado para sugerir variantes do hormônio de peptídeo de 32 resíduos calcitonina para reduzir sua tendência à agregação (Fowler, e outros Proc Natl Acad Sci USA. 2005, 102, 10105-10110.). DuBay e cotraba- lIhadores prolongaram a equação de três parâmetros (Chiti, e outros Nature. 2003, 424, 805-808) em uma fórmula de sete parâmetros que inclui proprie- dades intrínsicas da cadeia de polipeptídeo e fatores extrínsicos relaciona- dos com o ambiente tais como concentração de peptídeo, valor de pH e concentração iônica da solução) (Dubay, e outros J Mol Biol. 2004, 341, 1317-1326). Usando-se esse modelo eles são capazes de reproduzir as ta- xas de agregação in vitro de uma ampla faixa de proteínas e peptídeos não ' 15 estruturados.
No entanto, a principal limitação do modelo de sete parâmetros ' é que todos os resíduos na sequência eram dados a mesma importância relativa.
Isso é inconsistente com a observação experimental e simulação que mostram que certas regiões são mais importantes que outras, depen- dendo das tendências estruturais secundárias.
Recentemente, essa análise foi ulterormente prolongada a incluir fatores de proteção para descrever a agregação das cadeias de polipeptídeo estruturadas (Tartaglia, G.
G., Pa- war, A.
P., Campioni, S, Dobson, C.
M., Chiti, F., and Vendruscolo, M.
J Mol Biol (2008) in press). Alguns dos sítios previstos estavam de acordo com os sítios propensos a agregação conhecidos para proteínas tais como Lisozima, —Mioglobina, etc.
Um modelo fenomenológico sem parâmetros livres foi de- senvolvido (Tartaglia, e outros Proteína Sci. 2004, 13,1939-1941; Tartaglia e outros Proteína Sci. 2005, 14, 2723-2734) para prever mudanças na taxa de alongamento da fibrila agregada na mutação e identificar segmentos pro- pensos a agregação.
As propriedades fisicoquímicas usadas são a mudança natendênciaafB na mutação, a mudança em número de resíduos aromáti- cos, e a mudança na carga total.
Além do mais, a razão de área de superfi- cie acessível é levada em conta se as cadeias laterais de tipo selvagem e mutantes forem ambas polar ou ambas apolar, enquanto que o momento dipolar da cadeia lateral polar é usado no caso de mutação apolar em polar (ou polar em apolar). Esse modelo reproduziu a tendência relativa a agrega- ção de um conjunto de 26 sequências de heptapeptídeos, que eram previs- tasafavorecer uma disposição de B-folha em paralela no registro.
O modelo de DuBay e cotrabalhadores (Dubay e outros J Mol Biol. 2004, 341, 1317-1326) foi modificado com a inclusão de padronização hidrofóbica e tendência a alfa helicoidal, e comparação da classificação de tendência à agregação de uma dada sequência de aminoácidos com uma tendência média calculada para um conjunto de sequências de comprimento similar (Pawar, e outros, J Mol Biol. 2005, 350, 379-392). Esse modelo foi validado nos segmentos propensos a agregação de três cadeias de polipep- tídeo nativamente não dobradas: AB42, asinucleína e a proteína tau. Um outro algoritmo chamado TANGO (Fernandez-Escamilla, e Á 15 outros, Nat Biotechnol. 2004, 22, 1302-1306) foi desenvolvido, que equilibra 5 os mesmos parâmetros fisicoquímicos, suplementados pela suposição que um aminoácido é totalmente encoberto no estado agregado. Isso é com ba- se na tendência a estrutura secundária e estimativa de pênalti de dessolva- ção para prever regiões de agregação de B da sequência de proteínas bem como efeitos mutacionais. Em contraste com os modelos discutidos anteri- ormente, TANGO leva em conta a estabilidade de estado nativo por uso do campo de força de FOLD-X. Embora, não seja possível calcular taxas abso- lutas de agregação com TANGO, ele provê uma comparação qualitativa en- tre peptídeos ou proteínas que diferem significativamente na sequência. Ser- rano e cotrabalhadores (Linding, e outros, J Mol Biol. 2004, 342, 345-353) usavam TANGO para analisar a tendência à agregação de B de um conjunto de proteínas globulares não redundantes com um limite superior de 40% de identidade de sequência.
Um outro algoritmo, Previsão De Agregação De Estrutura Ami- loide (PASTA), foi recentemente introduzido por edição de uma função de energia aos pares para resíduos voltando uns dos outros dentro de uma fo- lha B (Trovato, e outros, Proteína Engineering, Design & Selection. 2007,
i 5/79 20(10), 521 - 523; Trovato, e outros, PLOS Comput. Biol. 2006, 2, 1608 -1618 ; Trovato e outros, J. Phys.: Condens. Matter. 2007 19, 285221).Yoon and Welsh (Yoon and Welsh, Proteína Sci. 2004, 13 : 2149-2160) desenvolveram uma abordagem com base na estrutura para a detecção de tendência de agregação Bde um segmento de proteína condicionado no número de con- tatos terciários. Usando-se um deslizamento de janela sete-resíduos, seg- mentos com uma fonte tendência a folha B em um ambiente firmemente compactado (isto é, com um alto número de contatos terciários) foram suge- ridos serem o mediador local da formação de fibrila.
Enquanto os modelos fenomenológicos descritos acima mostra- ram realizar bem para peptídeos pequenos e proteínas desnaturadas, ten- dências à agregação poderiam diferir para proteínas globulares tais como anticorpos onde a estrutura terciária e a estabilidade do estado nativo são muito importantes.
' 15 Técnicas de simulação moleculares para a previsão de regiões BR propensas à agregação e estudo do mecanismo de agregação têm modelos de simulação mais simples principalmente empregados (Ma and Nussinov.
Curr. Opin. Chem. Biol. 2006, 10, 445-452; Cellmer, e outros, TRENDS in - Biotechnology 2007, 25(6), 254). A menor parcela detalhada dos modelos de simulação empregados era o modelo de rede, em que cada resíduo é apre- sentado como uma conta que ocupa um único sítio em uma rede tridimensi- onal. Modelos mais detalhados, tal como o modelo de resolução intermediá- ria seguidos mas sofriam da mesma incapacidade de exatamente represen- tar proteína de estruturas secundária e terciária.
A não ser que modelos mais simples, modelos atomísticos inclu- em todos os detalhes atomísticos tais como ligação de hidrogênio e são as- sim mais exatos do que a rede ou os modelos de resolução intermediária. Tais modelos atomísticos foram usados ou com um solvente explícito, ou com um solvente implícito onde o solvente é tratado como uma série contí- nua O modelo explícito é mais exato mas também uma demanda mais computacional. Posteriormente um protocolo de simulação da dinâmica mo- lecular foi desenvolvido para se obter informação estrutural na agregação B i E) de polipeptídeos amiloidogênico (Cecchini e outros, J Mol Biol. 2006, 357, 1306-1321.). No entanto, uma vez que tal procedimento é uma exigência muito computacional, especialmente para proteínas grandes tais como anti- corpos lá não parecem ser simulação atomística de anticorpo total na litera- tura No entanto, têm havido simulações atomísticas de partes pequenas do anticorpo, principalmente para o fragmento de Fab (Noon, e outros, PNAS. 2002, 99, 6466; Sinha and Smith-Gill, Cell Biochemistry and Biophysics. 2005, 43, 253). Numerosas abordagens existentes para a prevenção de agrega- ção de anticorpo empregam o uso de aditivos nas formulações de proteína.
Isso é diferente da abordagem direta descrita aqui onde o próprio anticorpo é modificado com base nas regiões propensas à agregação previstas a partir das simulações moleculares.
Aditivos comumente usados na estabilização de anticorpo são sais de bases contendo nitrogênio, tal como arginina, gua- . 15 nidina, ou imidazol (EPO025275). Outros aditivos adequados para a estabili- : zação são poliéteres (EPAO0018609), glicerina, albumina e sulfato de dextra- no (a patente U.S.
No. 4808705), detergentes e tensoativos tais como ten- soativos à base de polissorbato (Publicação DA 2652636, e Publicação GB 2175906 (Pedido de patente do RU No.
GB 8514349)), chaperonas tal como GroEl (Mendoza, Biotechnol.
Tech. 1991, (10) 535-540), tampão de citrato (WO 9322335) ou agentes de quelação (WO 9115509). Embora esses aditi- vos permitam que proteínas sejam estabilizados em algum grau na solução, eles sofrem de certas desvantagens tal como a necessidade de etapas de processamento adicional para remoção de aditivo.
Assim, novos métodos são exigidos como entendendo os mecanismos envolvidos na agregação de proteína e identificam as regiões de proteína que mediam esse fenômeno.
Tais métodos seriam úteis em uma variedade de áreas terapêuticas e diag- nósticos, e permitiriam que composições de proteína, tal como terapêutica de anticorpo, a serem diretamente estabilizadas sem o uso de aditivos. — Sumárioda Invenção A presente invenção provê métodos e ferramentas computacio- nais com base, pelo menos em parte, nas simulações de computador que i 7179 identificam regiões propensas à agregação de uma proteína. Substituições podem então ser produzidas nessas regiões propensas à agregação para projetar proteínas com estabilidade aumentada e/ou uma tendência reduzida para agregação.
Além do mais, a presente invenção provê métodos e ferramen- tas computacionais com base, pelo menos em parte, nas simulações de computador que identificam regiões de ligação de macromolécula de uma proteína. Substituições e deleções podem então ser produzidas nessas regi- ões de ligação de macromolécula para projetar proteínas com afinidade de ligação alterada para uma macromolécula.
Em um aspecto a invenção provê um método para o cálculo da Tendência à Agregação Espacial (SAP) para um átomo particular em uma proteína, compreendendo (a) identificação de um ou mais átomos em um modelo estrutural que representa a proteína, em que o(s) um ou mais áto- ' 15 mos estão dentro de uma região especial definida centrada no ou próximo : do átomo particular; (b) cálculo, para o(s) um ou mais átomos na região es- pacial definida, uma razão de área acessível a solvente (SAA) dos átomos para a SAA de átomos em um resíduo idêntico que é totalmente exposto; (c) . multiplicação de cada razão pela hidrofobicidade do átomo do(s) um ou mais átomos, e (d)soma dos produtos da etapa (c); pelo que a soma é a SAP pa- ra o átomo particular.
Tendência à agregaçãoÉ entendido que em concretizações par- tículares a região espacial definida é qualquer volume ou região tridimensio- nal. Em concretizações específicas a região espacial definida é selecionada do grupo que compreende uma esfera, um cubo, um cilindro, uma pirâmide, e uma esferoide elíptica. Em algumas concretizações a região espacial defi- nida é uma região tendo um volume equivalente a uma esfera com um raio de entre 1 a 30Ã, ou mais. Em algumas concretizações o raio pode ter 50Á ou mais. Em algumas concretizações preferidas o raio da região espacial definida é 5ÁÃ, ou 10Ã.
Em uma concretização preferida, a região espacial definida é uma esfera tendo um raio de entre 1 a 30Ã. Em algumas concretizações a esfera é centrada no átomo particular, enquanto que, em outras concretiza- ções a região espacial definida ou esfera é centrada em uma ligação quími- ca ou é centrada em um ponto no espaço próximo do átomo em que a SAP será calculada.
Em algumas concretizações a região espacial definida é centra- da em um ponto no espaço dentro de 30ÀÃ a partir do átomo particular ou em algumas concretizações preferidas a região espacial definida é centrada em um ponto no espaço dentro de 20Ã, dentro de 10 À, dentro de 5ÀÃ, dentro de 2À, dentro de 1À a partir do átomo particular.
Em algumas concretizações o(s) um ou mais átomos dentro da região espacial definida são átomos em uma cadeia lateral do(s) um ou mais aminoácidos.
Em outras concretizações um ou mais átomos dentro do raio es- colhido em um modelo estrutural podem ser, ou são exigidos a estarem em í 15 uma cadeia lateral de um ou mais aminoácidos. Alternativamente, o(s) um ou : mais átomos dentro do raio escolhido em um modelo estrutural pode ter, ou são exigidos serem átomos de cadeia principal de um ou mais aminoácidos.
A área acessível a solvente (SAA) que é parte do cálculo de SAP - pode, em algumas concretizações ser calculada apenas nos átomos nas cadeias laterais de aminoácido, ou, em algumas concretizações apenas nos átomos de cadeia principal. Os átomos de cadeia principal podem ou não podem incluir os átomos de hidrogênio ligados.
Em algumas concretizações particularmente preferidas o modelo estrutural de proteína é processado antes do cálculo da SAP, por exemplo, porrealização de uma estimulação dinâmica molecular que opcionalmente inclui um solvente. O solvente pode ser água, um outro solvente conhecido na técnica, ou, o solvente pode estar ausente. Em algumas concretizações particularmente preferidas o modelo estrutural de proteína é processado an- tes do cálculo da SAP, por exemplo, por realização de uma simulação de Monte Carlo.
Em um outro aspecto do cálculo da SAP pode compreender ou- tra realização de simulações dinâmicas moleculares e cálculo médio dos l 9/79 valores de SAP calculados sobre múltiplas etapas de tempo no estímulo da dinâmico molecular. Por exemplo, a SAP para o átomo particular pode ser calculada por condução de uma estimulação dinâmica molecular antes da etapa (a) acima e etapas de repetição (a) a (d), cada vez conduzindo uma outra estimulação dinâmica molecular em uma pluralidade de etapas de tempo, desse modo produzindo múltiplas somas como na etapa (d), e cálcu- lo da média das somas; pelo que a média calculada é a SAP para o átomo particular. Em outros exemplos, uma simulação de Monte Carlo pode ser usado no lugar ou, ou em combinação com uma simulação da dinâmica mo- lecular.
Em outras concretizações as Classificações de SAP podem ser somadas sobre múltiplos aminoácidos, por exemplo, a soma de sobre entre 1 e 50 aminoácidos em uma região propensa à agregação ou trajetória de superfície no modelo estrutural de proteína. Em uma concretização particu- larmente preferida, a SAP é somada sobre 1 a 20 aminoácidos, 1 a 15 ami- À noácidos, 1 a 10 aminoácidos, 1 a 5 aminoácidos, 1 a 3 aminoácidos, ou a SAP pode ser somada através de 2 aminoácidos adjacentes. Em algumas concretizações, a soma pode ser tirada sobre aminoácidos adjacentes que pode ser adjacente sequencialmente ao longo da sequência de proteínas ou espacialmente na estrutura de proteína.
Em que os métodos necessitam de a simulação da dinâmica mo- lecular, a simulação pode ser realizada usando-se um pacote de estimulação escolhida do grupo que compreende ou que consiste em ABINIT, AMBER, Ascalaph, CASTEP, CPMD, CHARMM, DL POLY, FIREBALL, GROMACS, GROMOS, LAMMPS, MDynaMix, MOLDY, MOSCITO, NAMD, Newton-X, ProtoMol, PWscf, SIESTA, VASP, TINKER, YASARA, ORAC, e XMD. Em concretizações particularmente preferidas, o pacote de estimulação é o pa- cote de estimulação de CHARMM . Em outras concretizações preferidas o pacote de estimulação é o pacote de estimulação de NAMD.
Em que os métodos necessitam de realização de cálculos para um ou mais átomos dentro de uma cadeia principal, resíduo ou proteína, (por exemplo, cálculo de SAA para um ou mais átomos) será apreciado pelo ver-
i 10/79 sado na técnica que cálculos podem ser para átomos, pares de átomos, combinações ou grupos de átomos, porções de átomos, ou para cada um ou a totalidade de átomos em uma região espacial, cadeia lateral, resíduo, pro- teina, etc. Quando da realização de cálculos caracterizados nas metodologi- asda invenção, o versado na técnica também apreciará que cálculos (por exemplo, cálculos de SAA) podem também ser produzidos para resíduos de aminoácido, cadeias laterais, e similares, compreendendo átomos, grupos de átomos, etc. Em outras concretizações preferidas o modelo estrutural é um modelo de estrutura de cristal de raios X da proteína, ou sua porção; ou o modelo estrutural pode ser um modelo da estrutura de proteína teórica da proteína, ou sua porção. Em concretizações relacionadas o modelo estrutu- ral teórico é um modelo de homologia da proteína ou sua porção. Em outras concretizações o modelo estrutural teórico é uma modelo estrutural de prote- ínaabinitio da proteína, ou sua porção.
' Em um outro aspecto a presente invenção provê métodos para identificar regiões propensas à agregação na proteína. Em uma concretiza- ção a um método para identificar uma região propensa à agregação na pro- - teina, compreende (a) mapeamento, sobre o modelo estrutural a SAP como calculado de acordo com qualquer método descrito aqui para átomos na pro- teína; e (b) identificação de uma região dentro na proteína tendo uma plura- lidade de átomos tendo uma SAP > O; em que a região propensa à agrega- ção compreende os aminoácidos compreendendo a dita pluralidade de áto- mos. Em algumas concretizações o método pode compreender identificação deumoumais aminoácidos contendo um ou mais átomos tendo uma SAP maior do que um limiar escolhido; em que a SAP é calculada de acordo com qualquer método descrito aqui e em que a região propensa à agregação compreende os aminoácidos identificados Em uma outra concretização o método para identificar uma regi- ão propensa à agregação na proteína, compreende representação gráfica dos valores de SAP como calculado de acordo com qualquer método descri- to aqui, outro cálculo para picos no diagrama da área sob a curva (AUC) e identificação de uma ou mais regiões de proteína com uma AUC positiva, em que a região propensa à agregação compreende as regiões de proteína i- dentificadas.
Em um outro aspecto a invenção provê métodos de produção de uma variante de proteínas que exibem uma tendência reduzida para agrega- ção. Em uma concretização preferida um método de produção de uma vari- ante de proteína que exibe uma tendência reduzida para agregação, com- preende substituição ou deleção de pelo menos um resíduo de aminoácido dentro de uma região propensa à agregação na proteína, em que a região propensa à agregação é identificada usando-se Classificações de SAP cal- culadas de acordo com qualquer método descrito aqui; e em que, se o resi- duo de aminoácido for substituído, ele é substituído com um resíduo de ami- noácido que é mais hidrofílico, tal que a tendência à agregação da variante é reduzida. Em algumas concretizações particulares pelo menos um resíduo é i 15 substituído e pelo menos um resíduo é deletado.
; Em uma outra concretização um método de produção de uma variante de proteína que exibe uma tendência reduzida para agregação, compreende (a) geração de uma pluralidade das variantes de proteína por substituição, em cada variante pelo menos um resíduo dentro de uma região —propensa à agregação na proteína, em que a região propensa à agregação é identificada usando-se Classificações de SAP calculadas de acordo com qualquer método descrito aqui, em que um ou mais resíduos diferentes, ou diferentes combinações de resíduos são substituídos em cada variante; em que o pelo menos um resíduo é substituído com um resíduo que é mais hi- drofílico; e (b) seleção de uma variante de proteína preparada como na (a) que exibe uma tendência reduzida para agregação.
Em algumas concretizações o aminoácido que é selecionado pa- ra substituição é o aminoácido mais hidrofóbico (como determinado por uma escala de hidrofobicidade reconhecida na técnica) em uma região propensa à agregação. Em concretizações específicas o aminoácido selecionado para substituição é Fe, Leu, lle, Tyr, Trp, Val, Met, Pro, Cys, Ala, ou Gly. Em tais concretizações específicas o aminoácido mais hidrofílico que é substituído
| 12/79 na proteína pode ser selecionado do grupo que consiste em Thr, Ser, Lys, Gin, Asn, His, Glu, Asp, e Arg. Frequentemente, a escala de hidrofobicidade preferida para a determinação que resíduos são mais ou menos hidrofílicos ou hidrofóbicos do que outros é a escala de hidrofobicidade de Black e Mould.
Em algumas concretizações pelo menos dois resíduos de ami- noácidos dentro da região propensa à agregação são substituídos. Em con- cretizações relacionadas pelo menos três resíduos de aminoácidos dentro da região propensa à agregação são substituídos. Também, em concretiza- ções similares pelo menos um resíduo é substituído dentro de mais do que uma das regiões propensas à agregação dentro da proteína.
Em concretizações preferidas os métodos descritos aqui são a- plicados à proteína que é selecionada do grupo que consiste em um anticor- po, um fragmento de Fab, um fragmento de Fab', um fragmento de Fd, um ' 15 fragmento de Fv, um fragmento de F(ab'),, e um fragmento de Fc.
. Em outras concretizações preferidas os métodos descritos aqui são aplicados à proteína que é selecionada do grupo que consiste em uma : citocina, uma quimiocina, uma lipocina, uma miocina, um neurotransmissor, uma neurotrofina, uma interleucina, ou um interferon. Em algumas concreti- zações específicas a proteína pode ser um hormônio ou um fator de cresci- mento um receptor ou domínio de receptor, ou um neurotransmissor ou neu- rotrofina. Em algumas concretizações a proteina é uma mimética de peptí- deo, uma proteína modificada, uma proteína compreendendo aminoácidos não naturais, ou uma proteina compreendendo aminoácidos incomuns.
Em um outro aspecto a invenção também provê métodos para calcular a SAA eficaz para um resíduo de aminoácido em uma proteína. Um método preferido para o cálculo da SAA eficaz para um resíduo de aminoá- cido em uma proteína, compreende (a) cálculo para um aminoácido de uma razão de área acessível a solvente (SAA) de átomos no aminoácido para a —SAA de átomos em um resíduo idêntico que é totalmente exposto; (b) multi- plicação da razão pela hidrofobicidade do aminoácido como determinado por uma escala de hidrofobicidade de aminoácido; pelo que o produto é a SAA eficaz para o aminoácido. Além disso, a SAA eficaz para um resíduo de ami- noácido em uma proteína pode ser calculada por um método que ulterior- mente compreende a soma da SAA eficaz sobre 3 aminoácidos, ou em al- gumas concretizações 2, 4, 5, ou 6 aminoácidos, que são adjacentes na se- quênciade proteínas.
Em um outro aspecto a invenção também inclui métodos para identificar uma região de ligação de macromolécula na proteína, compreen- dendo (a) mapeamento, sobre um modelo estrutural da proteina da SAP como calculada de acordo com qualquer um dos aspectos precedentes para átomos na proteína; e (b) identificação de uma região dentro de uma proteí- na tendo uma pluralidade de átomos tendo uma SAP > 0; em que a região de ligação de macromolécula compreende os aminoácidos compreendendo a dita pluralidade de átomos.
Em um outro aspecto a invenção inclui métodos para identificar Í 15 umaregião de ligação de macromolécula na proteína, compreendendo iden- Ú tificação de um ou mais aminoácidos contendo um ou mais átomos tendo uma SAP maior do que um limiar escolhido; em que a SAP é calculada de ' acordo com o método de qualquer um dos aspectos anteriores e em que a - região de ligação de macromolécula compreende os aminoácidos identifica- dos Em um outro aspecto a invenção inclui métodos para identificar uma região de ligação de macromolécula na proteína, compreendendo re- presentação gráfica dos valores de SAP como calculados em qualquer um dos aspectos precedentes, cálculo, para picos no diagrama, da área sob a curva (AUC) e identificação de um ou mais regiões de proteina com uma AUC positiva, em que a região de ligação de macromolécula compreende as regiões de proteína identificadas.
Em um outro aspecto a invenção inclui métodos de produção de uma variante de proteína que exibe uma afinidade de ligação reduzida para uma macromolécula, compreendendo substituição ou deleção de pelo me- nos um resíduo de aminoácido dentro de uma região de ligação de macro- molécula para uma macromolécula na proteína, em que a região de ligação de macromolécula é identificada usando-se Classificações de SAP calcula- das de acordo com qualquer um dos aspectos anteriores; e em que, se o resíduo de aminoácido for substituído, ele é substituído com um resíduo de aminoácido que é mais hidrofílico, tal que a afinidade de ligação para uma — macromolécula da variante é reduzida.
Em certas concretizações pelo me- nos um resíduo é substituído e pelo menos um resíduo é deletado.
Em um outro aspecto a invenção também inclui métodos de produção de uma vari- ante de proteína que exibe uma afinidade de ligação alterada para uma ma- cromolécula, compreendendo (a) geração de uma pluralidade das variantes de proteina por substituição em cada variante de pelo menos um resíduo dentro de uma região de ligação de macromolécula para uma macromolécu- la na proteina, em que a região de ligação de macromolécula é identificada usando-se Classificações de SAP calculadas de acordo com qualquer um dos aspectos precedentes, em que um ou diferentes resíduos, ou diferentes ' 15 combinações de resíduos são substituídos em cada variante; e (b) seleção y de uma variante de proteína preparada como na (a) que exibe uma afinidade de ligação alterada para uma macromolécula.
Em certas concretizações o ] pelo menos um resíduo de aminoácido dentro da região de ligação de ma- cromolécula é o resíduo mais hidrofóbico em uma região de ligação de ma- cromolécula.
Em certas concretizações o pelo menos um resíduo de amino- ácido dentro de uma região propensa à agregação é Fe, Leu, lle, Tyr, Trp, Val, Met, Pro, Cys, Ala, ou Gly.
Em certas concretizações o resíduo de ami- noácido que é mais hidrofílico é selecionado do grupo que consiste em Thr, Ser, Lys, Gln, Asn, His, Glu, Asp, e Arg.
Em certas concretizações o resíduo de aminoácido que é mais hidrofílico é um aminoácido incomum, não natural ou modificado.
Em certas concretizações o resíduo de aminoácido que é mais hidrofílico é determinado de acordo com escala de hidrofobicidade de Black e Mould.
Em certas concretizações pelo menos dois resíduos de ami- noácidos dentro da região de ligação de macromolécula são substituídos.
Em certas concretizações pelo menos três resíduos de aminoácidos dentro da região de ligação de macromolécula são substituídos.
Em certas concre- tizações pelo menos um resíduo é substituído dentro de mais do que uma das regiões propensas à agregação dentro da proteína.
Em certas concreti- zações a região propensa à agregação é identificada de acordo com o mé- todo de qualquer um dos aspectos precedentes para a identificação de uma região propensa à agregação na proteína.
Em certas concretizações que podem ser combinadas com as concretizações precedentes, uma macromo- lécula é uma outra proteína, um polinucleotídeo ou um polissacarídeo.
Em certas concretizações que podem ser combinadas com as concretizações precedentes, a proteína é selecionada do grupo que consiste em um anti- corpo, um fragmento de Fab, um fragmento de Fab', um fragmento de Fd, um fragmento de Fv, um fragmento de F(ab'),, e um fragmento de Fc.
Em certas concretizações que podem ser combinadas com as concretizações precedentes, uma proteína é uma citocina, uma quimiocina, uma lipocina, uma miocina, um neurotransmissor, uma neurotrofina, uma interleucina, ou um interferon.
Em certas concretizações que podem ser combinadas com as i 15 concretizações precedentes, uma proteína é um hormônio ou um fator de ; crescimento.
Em certas concretizações a macromolécula é um receptor de hormônio ou receptor de fator de crescimento.
Em certas concretizações a ' proteína é um receptor ou um domínio de receptor.
Em certas concretiza- - ções uma macromolécula é um agonista de receptor ou um antagonista de receptor do receptor ou domínio de receptor.
Em certas concretizações que podem ser combinadas com as concretizações precedentes, uma proteína é um neurotransmissor ou neurotrofina.
Em certas concretizações a macromo- lécula é um receptor de neurotransmissor ou receptor de neurotrofina.
Em um outro aspecto, a invenção também inclui um método para tornar uma composição farmacêutica compreendendo uma variante de pro- teina que exibe uma tendência alterada para a interação com um par de li- gação, compreendendo a formulação de uma variante de proteína obtida de acordo com um processo de qualquer um dos aspectos precedentes junta- mente com um transportador, auxiliar e/ou excipiente farmaceuticamente aceitável.
Descrição Detalhada da Invenção A presente invenção leva em conta a necessidade inadequada de mais profundamente entender o mecanismo de agregação de proteína, e para identificar as regiões de proteína envolvidas na agregação. A invenção provê, pelo menos em parte, uma tecnologia de simulação que pode ser u- sada, concorrentemente com os métodos experimentais descritos aqui, para aperfeiçoar a estabilidade de potencialmente a totalidade de proteínas tera- pêuticas contra agregação. Essa tecnologia exibe enorme potencial científico e comercial considerando-se que terapias à base de anticorpo estão se de- senvolvendo no passo mais alto entre todas as classes da terapêutica hu- mana. Agregação é um problema comum encontrado na maior parte dos estágios do desenvolvimento de fármaco de anticorpo impedindo rápida co- mercialização de candidatos de fármaco de anticorpo potencial. Assim a pre- venção de agregação usando-se os métodos descritos aqui poderiam ter um impacto significativo no desenvolvimento de fármaco de proteína.
Além disso, a presente invenção leva em conta a necessidade h 15 inadequada de exatamente identificar as regiões de proteína envolvidas na p ligação com outras macromoléculas ligação essa que é frequentemente me- diada, pelo menos em parte, através de grandes trajetórias hidrofóbicas que ' podem ser prontamente identificadas usando-se os métodos revelados aqui. - A invenção provê, pelo menos em parte, uma tecnologia de simulação que pode ser usada, concorrentemente com os métodos experimentais descritos aqui, para alterar a afinidade de ligação de potencialmente a totalidade de interações moleculares de proteína que são mediadas, pelo menos em par- te, através de grandes trajetórias hidrofóbicas. Essa tecnologia exibe enorme potencial científico e comercial considerando-se que terapias à base de pro- teina estão se desenvolvendo no passo mais alto entre todas as classes da terapêutica humana. A capacidade de alterar uma afinidade de ligação tera- pêutica de proteína para uma ou mais macromoléculas podem ser usadas para aperfeiçoar eficazmente e reduzir ou eliminar atividades mediadas atra- vês de uma região de ligação de macromolécula secundária indesejada. A presente invenção provê, inter alia, métodos para reduzir ou prevenir agregação de uma proteína ou alterar a afinidade de ligação para uma macromolécula. Em particular, métodos são providos para identificar regiões hidrofóbicas em uma estrutura de proteína que pode participar nas interações de proteína, interações de macromolécula de proteína ou agrega- ção de proteína.
Os métodos providos são com base na nova técnica descri- ta aqui como a "Tendência à agregação espacial" ou "SAP." A ferramenta de SAP também corretamente identifica as regiões do anticorpo propensas a ligação com outras proteínas.
Além de anticorpos, essa ferramenta poderia ser amplamente aplicada a todas as proteínas para a identificação das regi- ões propensas à agregação ou as regiões que ligam outras proteínas ou li- gantes.
Os métodos da presente invenção podem ser aplicados a qualquer proteína para a qual uma estrutura tridimensional está disponível ou para a qual uma estrutura tridimensional pode ser criada usando-se modelação por homologia, modelação molecular, ou determinação de estrutura ab initio.
Em geral, a "SAP" pode ser calculada de múltiplos modos, usando-se as equa- ções e metodologias descritas aqui, por exemplo, a SAP pode ser calculada À 15 na modelo estrutural de proteína ou pode ser calculada como uma média ; sobre múltiplas etapas de tempo da simulação da dinâmica molecular de um modelo estrutural.
Embora o método específico de cálculo, e os resultados Í obtidos, podem variar como descritos aqui, o princípio subjacente é com ba- - se no fato de que SAP é uma medida que não apenas leva em conta a hidro- fobicidade de resíduos em uma proteina, mas também uma estrutura tridi- mensional da proteína, e a proximidade de resíduos de aminoácido na estru-
tura de proteína dobrada.
Por "proteína" quer se dizer qualquer sequência de dois ou mais aminoácidos, (também chamados aqui de "resíduos de aminoácido" ou "re- — síduos"”) unidos entre si por ligações de peptídeo entre grupos carboxila e amino de aminoácidos adjacentes, independentemente de comprimento, modificação pós-tradução, modificação química, ou função. "Polipeptídeo," "peptídeo," e, "proteina" são usados intercambeavelmente aqui.
Em concre- tizações preferidas, os métodos da presente invenção são aplicados à prote- ínaque é de comprimento suficiente para dobrar em uma estrutura tridimen- sional.
Em algumas concretizações, a proteína é uma proteína de ocorrência natural.
Em algumas concretizações, a proteína é quimicamente sintetizada.
Em algumas concretizações a proteina é uma proteína recombinante, por exemplo, uma proteína híbrida ou quimérica.
Em algumas concretizações a proteína é uma proteína complexada (por exemplo, proteínas de interação complexadas). Proteínas podem ser isoladas (por exemplo, de uma fonte natural ou meio químico). Em algumas concretizações a proteína pode ser uma proteína modificada ou uma mimética de peptídeo.
Em algumas concre- tizações a proteína pode ser uma proteína derivatizada, por exemplo, uma proteína quimicamente conjugada (incluindo mas não limitado a proteínas conjugadas com polímero (por exemplo, proteínas pegiladas). Como usada aqui, o termo "proteína" também destina-se a incluir fragmentos de proteína.
Proteínas exemplares incluem anticorpos (incluindo mas não limitado a fragmentos, variantes, e derivados dos mesmos). De fato, é previsto que os métodos da presente invenção podem ser aplicados a qualquer molécula à base de aminoácido para a qual um modelo estrutural está disponível ou pode ser gerado.
Por exemplo, os mé- j todos descritos aqui podem ser aplicados a proteínas modificadas, ou prote- Ínas que incorporam aminoácidos incomuns ou não naturais como descritos ' aqui.
Em algumas concretizações, as estruturas de aminoácidos incomuns, E: não naturais ou modificados podem ser computacionalmente substituídos ou inseridos para dentro de um modelo estrutural para a aplicação dos métodos descritos aqui.
Métodos de análogos, derivados e miméticas de peptídeo de projeção experimental são conhecidos na técnica.
Por exemplo, vide Farmer, P.S. in Drug Design (E.J.
Ariens, ed.) Academic Press, New York, 1980, vol. 10, pp. 119-143; Ball.
J.B. and Alewood, P.F. (1990) J.
Mol.
Recognition 3:55; Morgan, B.A. and Gainor, J.A. (1989) Ann.
Rep.
Med.
Chem. 24:243; e Frei- dinger, R.M. (1989) Trends Pharmacol.
Sci. 10:270. Vide também Sawyer, T.K. (1995) " Peptidomimetic Design and Chemical Abordagemes to Peptideo Metabolism" em Taylor, M.D. e Amidon, G.L. (eds.) Peptide-Based Drug De- sign: Controlling Transport and Metabolism, Capítulo 17; Smith, A.B. 3rd, e outros(1995)J.
Am.
Chem.
Soc. 117:11113-11123; Smith, A.B. 3rd, e outros (1994) J.
Am.
Chem.
Soc. 116:9947-9962; and Hirschman, R., e outros
(1993) J.
Am.
Chem.
Soc. 115:12550-12568.
Um grande número e variedade de agentes terapêuticos de pep- tídeo, polipeptídeo, e proteína são conhecidos na técnica, e são esperados como beneficiando a partir dos métodos da presente invenção.
Esses agen- tes terapêuticos compreendem várias classes muito amplas, incluindo hor- mônios, proteínas, antígenos, imunoglobulinas, repressores/ativadores, en- zimas, citocinas, quimiocinas, miocinas, lipocinas, fatores de crescimento, receptores, domínios de receptor, neurotransmissores, neurotrofinas, inter- leucinas, e interferons entre outros.
Hormônios adequados que podem ser empregados dentro do escopo da presente invenção incluem hormônios de proteína, tais como in- sulina e glucagem que regulam açúcar no sangue.
Como será apreciado por aquele versado na técnica, os hormônios observados são tipicamente em- pregados para o tratamento de condições e doenças diversos, incluindo câncer, doenças metabólicas, doença cardiovascular, condições da pituitária emenopausa. : Inicialmente, era imaginado que apenas algumas proteínas for- mavam fibrilas ou agregados.
Evidência mais recente que muito mais proteí- ' nas do que esperadas têm regiões propensas à agregação (Fandrich, M., : Fletcher, M.
A., and Dobson, C.
M. (2001) Nature 410, 165-166). De fato, é documentado que peptídeos tão curtos quanto 4 resíduos podem formar fi- brilas (J.
Biol.
Chem., Vol. 277, Issue 45, 43243-43246, Nov. 8, 2002). Terapêutica de proteina representa uma parte de desenvolvi- mento do mercado terapêutico.
Por exemplo, insulina e glucagons são im- portante terapêutica de proteína que regula açúcar no sangue, são muito benéficos a partir dos métodos descritos aqui.
Polipeptídeo amiloide de ilho- ta (IAPP) é um outro hormônio secretado pelo pâncreas que é usado no tra- tamento de diabetes.
Uma outra proteina de interesse é um fator de estimu- lação de colônia de granulócito, ou G-CSF, que é um fator de crescimento sanguíneo que pode ser usado para aumentar a produção de células san- —guíneas.
Ativador de plasminogênio de tecido é uma degradação de coágulo usado no tratamento de acidente vascular cerebral ou ataque cardíaco.
Além disso, eritropoietina é um hormônio produzido pelo rim que pode ser usada no tratamento de AIDS, anemia, falha de rim, e outras condições. Finalmen- te, calcitonina é um peptídeo que demonstrou ser eficaz no tratamento de hipercalcemia, doença de Paget, e certos tipos de osteoporose.
Outros exemplos de proteínas que são esperados beneficiar a partir dos métodos descritos aqui incluem, sem limitação, ACTH, amiílina, angiotensina, angiogenina, peptídeos anti-inflamatórios, BNP, endorfinas, endotelina, GLIP, Fator de liberação de hormônio de crescimento (GRF), hirudina, insulinotropina, neuropeptíideo Y, PTH, VIP, hormônio de liberação de hormônio de crescimento (GHRH), octreotídeo, hormônio pituitários (por exemplo, hGH), ANF, fatores de crescimento, bMSH, somatostatina, fator de liberação de fator de crescimento derivado de plaqueta, gonadotropina cori- ônica humana, hirulog, interferon alfa, interferon beta, interferon gama, inter- leucinas, fator de estimulação de colônia de macrófago de granulócito (GM- CSF), fator de estimulação de colônia de granulócito (G-CSF), menotropinas (urofoltropina (FSH) e LH)), estreptoquinase, uroquinase, inibidores de depu- ração de ANF, ANP, ANP, agonistas de hormônio antidiurético, peptídeo re- lacionado com gene de calcitonina (CGRP), IGF-1, pentigetídeo, proteína C, ] proteína S, timosina alfa-1, análogos de antagonistas de vasopressina, TNF- a negativo dominante, alfa-MSH, VEGF, PYY, e polipeptídeos, fragmentos, polipeptídeo análogos e derivados do exposto acima.
Em concretizações particularmente preferidas, a proteína é um anticorpo ou uma imunoglobulina. O termo "anticorpo" é usado no sentido mais amplo e especificamente cobre anticorpos monoclonais (incluindo anti- corpos monoclonais de comprimento total), anticorpos policlonais, anticorpos —multiespecíficos (por exemplo, anticorpos biespecíficos), anticorpos de ca- deia simples, anticorpos quiméricos, anticorpos recombinantes, e fragmentos de anticorpo. Um anticorpo de comprimento total é uma glicoproteína com- preendendo pelo menos duas cadeias pesadas (H) e duas cadeias leves (L) interligadas por ligações de dissulfeto. O resíduo de Asn-297 no Cu é N- —glicosilado. Cada cadeia pesada é constituída de uma região variável de ca- deia pesada (abreviada aqui como Vx) e uma região constante de cadeia pesada. A região constante de cadeia pesada é constituída de três domínios,
Cn, CH2 e Cuz.
Receptores de Fc ligam na região principal inferior de Cha e mediam funções efetoras tal como citotoxicidade mediada por célula depen- dente de anticorpo (ADCC). Proteína A liga na junção de Ch2-Ch3 de Fc e é amplamente usada na purificação de anticorpos totais.
Cada cadeia leve é constituída de uma região variável de cadeia leve (abreviada aqui como V,) e uma região constante de cadeia leve.
A região constante de cadeia leve é constituída de um domínio, C,. As regiões de Vy e V, podem ser ulteriormen- te subdivididas em regiões de hipervariabilidade, chamadas de regiões de determinação de complementaridade (CDR), intercaladas com regiões que sãomais conservadas, chamadas de regiões estruturais (FR). Cada Vh e V. é constituído por três CDRs e quatro FRs, disposto de amino-terminal até carbóxi-terminal na seguinte ordem: FR1, CDR1, FR2, CDR2, FR3, CDR3, FRA.
As regiões variáveis das cadeias pesada e leve contêm um domínio de ligação que interage com um antígeno.
Assim, o termo "anticorpo" incluiria os vários isótipos de anticorpo ou subclasses, por exemplo, IgA, 1gD, IgE, ! IgG e IgM, ou IgG1, I1gG2, I1gG3, e Ig9G4. Ulteriomente incluídos são um fragmento de Fab, um fragmento monovalente que consiste nos domínios de ' Vi, Vu, CL e Ch1; um fragmento de F(ab'), um fragmento bivalente compre- : endendo dois fragmentos de Fab, ligados por uma ponte de dissulfeto na região principal; um fragmento de Fab', que é essencialmente um Fab com parte da região principal (vide, FUNDAMENTAL IMMUNOLOGY (Paul ed., 3rd ed. 1993); um fragmento de Fd que consiste nos domínios 1 de V4 e Cu; um fragmento de Fv que consiste nos domínios de V, e Vy de uma subdivi- são simples de um anticorpo, um fragmento de dAb (Ward e outros, (1989) Nature 341:544-546), que consiste em um domínio de V4; uma região de determinação de complementaridade isolada (CDR); e um nanocorpo, uma região variável de cadeia pesada contendo um domínio variável simples e dois domínios constantes.
Como usado aqui um "modelo estrutural" de proteína é uma re- presentação de estrutura secundária, terciária e/ou quaternária tridimensio- nal da proteina.
Um modelo estrutural inclui estruturas de cristal de raios X, estruturas de RMN, estruturas de proteína teóricas, estruturas criadas de
, ”
22/79 modelação por homologia, modelos de tomografia de proteína, e modelos atomísticos formados a partir de estudos microscópicos de elétron.
Tipica- mente, um "modelo estrutural" meramente não incluirá a sequência de ami- noácidos primária de uma proteína, mas proverá coordenadas para os áto- mosem uma proteína no espaço tridimensional, assim mostrando as posi- ções de resíduo de aminoácido e dobramentos de proteína.
Em concretiza- ções preferidas, o modelo estrutural analisado é uma estrutura de cristal de raios X, por exemplo, uma estrutura obtida a partir de um Banco de Dados de proteína (PDB, rcesb.org/pdb/home/home.do) ou um modelo de homologia formado em uma estrutura conhecida de uma proteína similar.
Em concreti- zações preferidas, o modelo estrutural será pré-processado antes da aplica- ção dos métodos da presente invenção.
Por exemplo, o modelo estrutural pode ser posto através de uma simulação da dinâmica molecular para permi- tir que as cadeias laterais de proteína alcancem uma conformação mais na- í 15 tural, ou o modelo estrutural pode ser deixado que interaja com solvente, por : exemplo, água, em uma simulação da dinâmica molecular.
O pré- processamento não é limitado a simulação da dinâmica molecular e pode ser Ê realizado usando-se quaisquer meios reconhecidos na técnica para determi- er nar um movimento de uma proteina em solução.
Uma técnica de simulação alternativa exemplar é uma simulação de Monte Carlo.
Simulações podem ser realizadas usando-se pacotes de estimulação ou quaisquer outros meios de computação aceitáveis.
Em certas concretizações, simulações para pro- curar sonda ou amostra de espaço conformacional de proteina podem ser realizadas em um modelo estrutural para determinar movimento da proteína.
Uma "estrutura de proteína teórica" é um modelo estrutural de proteína tridimensional que é criada usando-se métodos computacionais fre- quentemente sem quaisquer medições experimentais diretas da estrutura nativa de proteína.
A "estrutura de proteína teórica" inclui modelos estruturais criados por métodos ab initio e modelação por homologia.
Um "modelo de —homologia" é um modelo estrutural de proteína tridimensional que é criado por modelação por homologia, que tipicamente envolve comparação de uma sequência primária da proteína com a estrutura tridimensional conhecida de uma proteína similar. Modelação por homologia é bem-conhecida na técnica e é descrita em Kolinski e outros Proteínas. 1999;:37(4):592-610; Rost e ou- tros, B, Potein Sci. 1996;5(8): 1704-1718, e as patentes U.S. Nos. 7212924; 6256647; e 6125331 que são incorporadas aqui por referência. Em particu- lar, Xiang(Curr Proteína Pept Sci. junho de 2006;7(3):217-27, incorporado aqui por referência) provê uma excelente descrição e revisão de técnicas de modelação por homologia que podem ser usadas para gerar estruturas úteis para os métodos da presente invenção. De fato, qualquer software de mode- lação por homologia conhecido na técnica pode ser usado de acordo com os presentes métodos, por exemplo, MODELLER (Eswar, e outros, Comparati- ve Estrutura de proteína Modeling With MODELLER. Current Protocols in Bioinformatics, John Wiley & Sons, Inc., Supplement 15, 5.6.1-5.6.30, 200.), SEGMOD/ENCAD (Levitt M. JMolBiol 1992;226:507-533), SWISS-MODEL (Schwede T, Kopp J, Guex N, Peitsch MC. Nucleic Acids Research “15 2003;31:3381-3385.)) 3D-JIGSAW (Bates e outros, Proteínas: Structure, | Function and Genetics, Suppl 2001;5:39-46), NEST (Xiang. Curr Proteína Pept Sci. 2006 June ; 7(3): 217-227), e BUILDER (Koehl and Delarue. Curr Opin Struct Biol 1996;6(2):222-226.). Para anticorpos em particular, a estru- tura de regiões variáveis de anticorpo pode ser obtida exatamente usando- seométodo de estruturas canônicas (Chothia C and Lesk AM, J. Mol.Biol.
1987, 196, 901; Chothia C e outros, Nature 1989, 342, 877).
Em concretizações particulares, modelação por homologia pode ser usada para montar proteínas totais oriundas de fragmentos de estrutura conhecidos, tal como quando um fragmento de Fab de anticorpo é modelado sobre um fragmento de Fc, ou quando um fragmento de Fab é criado como uma estrutura de proteína teórica e é modelado sobre uma estrutura de cris- tal de um fragmento de Fc. Um versado na técnica entenderá que várias possibilidades existem. Em uma concretização particular um fragmento de Fab pode ser modelado sobre várias estruturas de Fc de anticorpo de dife- rentes classes ou isótipos.
Modelos Ab initio podem também ser empregados nos métodos da presente invenção. Um "modelo estrutural de proteína ab initio" é um mo-
delo estrutural de proteína que é criado diretamente da sequência primária de proteína por simulação do processo de dobramento de proteína usando- se as equações conhecidas na fisicoquímica (Bonneau e Baker.
Annual Re- view of Biophysics and Biomolecular Structure. 2001, Vol. 30, Pages 173- 189; Lesk Proteins 1997;1:151-166. Suppl; Zemla, e outros.
Proteínas 1997;1:140-150.Suppl; Ingwall, e outros Biopolymers 1968;6:331-368; e nas Pats.
U.S.
Nos. 6832162; 5878373; 5436850; 6512981; 7158891; 6377893; e nos Pedidos de Pat.
U.S.
Nos. 9/788.006; 11/890.863; e 10/113.219, que são todos incorporados aqui por referência). Tipicamente, estruturas experi- mentalmente determinadas (por exemplo, estruturas de cristal de raios X) e modelos de homologia são de preferência para modelos ab initio, uma vez que a dificuldade na simulação de dobramento de proteína de novo pode,
em alguns casos, levar a modelos estruturais de proteína imprecisos.
É entendido que qualquer método conhecido na técnica como ' 15 gerando uma estrutura de proteína teórica pode ser útil de acordo com a presente invenção.
Além dos métodos descritos acima, métodos tais como i aqueles descritos na reunião, Critical Assessment of Techniques for Protein ' Structure Prediction (CASP) podem ser usados na presente metodologia. . Vários exemplos são descritos nos procedimentos para CASP, por exemplo, nas publicações relacionadas ao the 7th Community Wide Experiment on the Critical Assessment of Techniques for Protein Structure Prediction Asilomar Conference Center, Pacific Grove, CA de 26 a 30 de novembro de 2006 e também nos procedimentos de CASPG6. Proteins: Structure, Function, and Bioinformatics.2005. 61(S7):1-236; procedimentos de CASP5. Proteins: S- tructure, Function, and Genetics. 2003, 53(S6):333-595; procedimentos de CASPA4. Proteins: Structure, Function, and Genetics. 2001, 45(S5):1-199; procedimentos de CASP3. Proteins: Structure, Function, and Genetics, 1999,
37(83):1-237 (1999)
A presente invenção também provê um método de produção de uma variante de proteína que exibe uma tendência reduzida para agregação.
Como usado aqui, uma "tendência para agregação" é a tendência de uma proteína para formar agrupamentos ou massas.
Tais agrupamentos ou mas-
| . ' ' À 25/79 sas podem conter duas, ou mais frequentemente 3, ou mais proteínas, tipi- camente do mesmo tipo. Correspondentemente, uma proteína que exibe uma "tendência para agregação reduzida" é uma que, quando modificada ou tratada, forma menos agregados ou agregados menores quando compara- doscomamesma proteína que é não modificada ou não tratada.
O termo "inibir" quer se dizer para levar uma redução mensurá- vel em um fenômeno, frequentemente usado aqui em referência a agrega- ção ou interações ou de ligação de proteína.
Resíduos de aminoácido, agrupamentos de resíduos, regiões de proteína, peptídeos, ou remendos na superfície de proteína podem frequen- temente ser descritos aqui como hidrofílico ou hidrofóbico. De acordo com os métodos da invenção a tendência à agregação espacial descreve hidrofobi- cidade e é calculada, em parte, usando-se uma escala de hidrofobicidade de aminoácido conhecida na técnica. Em uma concretização preferida, a escala de hidrofobicidade de aminoácido é o conjunto de escala indicado em Black e Mould, Anal. Biochem. 19971, 193, 72-82 (incorporado aqui por referência). Em geral, de acordo com o Black e Mould, hidrofobicidade de aminoácido prossegue como se segue (se iniciando com a maioria dos resíduos hidrofó- bicos): Fe > Leu = Ile > Tyr = Trp > Val > Met > Pro> Cys > Ala > Gly > Thr > Ser>Lys>Glh>Asn>His> Glu > Asp > Arg. Valores escalonados para hidrofobicidade, como relatado por Black e Mould são mostrados na tabela 1 abaixo.
Tabela 1 Feris ag re gg |
. N : , V 26/79 e zag Dr a ag | re a | Correspondentemente, quando um aminoácido é selecionado para substituição pelos métodos da invenção (por exemplo, por tendo uma alta classificação de SAP ou sendo identificada com resíduo em uma região i propensa à agregação), ele será substituído por um outro aminoácido que é mais baixoem uma escala de hidrofobicidade. Por exemplo, se a metionina de aminoácido é selecionada para substituição, ela pode ser substituída com qualquer aminoácido que seja menos hidrofóbico, por exemplo, Pro, Cys, Ala, Gly, etc. Em concretizações particularmente preferidas, um aminoácido hidrofóbico é substituído com Lys. Em outras concretizações preferidas, um aminoácido hidrofóbico é substituído com Glu, GIn, Asp, Thr, ou Ser. Portan- to, quando um resíduo é descrito como "mais hidrofóbico," "mais hidrofílico," "o mais hidrofóbico," ou "o mais hidrofílico," a determinação de hidrofobici- dade/hidrofilicidade é produzida de acordo com qualquer escala de hidrofo- bicidade conhecida na técnica, por exemplo, a escala preferida de Black e Mould.
Na prática, qualquer escala reconhecida na técnica de hidrofobi- cidade de aminoácido pode ser empregada pelos métodos da presente in- venção. Assim, embora a escala descrita na tabela 1 possa ser usada duran- te o cálculo da tendência à agregação espacial, outras escalas conhecidas
. > 27/79 na técnica podem ser substituídas. A revisão recente por Biswas e outros (J. Chromatogr. A 1000 (2003) 637-655; incorporada aqui por referência) des- creve uma variedade de escalas de hidrofobicidade que podem ser usadas de acordo com a presente invenção.
Além de hidrofobicidade de aminoácido, os métodos descritos aqui podem distribuir uma hidrofobicidade em um átomo dentro de uma pro- teina ou modelo estrutural de proteína. Em uma concretização a "hidrofobi- cidade de átomo" é uma razão da hidrofobicidade do aminoácido que com- preende o átomo e o número de átomos no aminoácido, ou mais de prefe- rência, o número de átomos no aminoácido cadeia lateral. Em uma concreti- zação similar a "hidrofobicidade de átomo" pode ser uma fração da hidrofo- bicidade de resíduo que é proporcional ao tamanho, área de superfície, ou volume do átomo em questão. Por exemplo, se um átomo de oxigênio com- puser 5% do volume de um resíduo de aminoácido, a hidrofobicidade de á- tomo do átomo de oxigênio será 5% da hidrofobicidade do resíduo de ami- noácido. Em uma outra concretização a hidrofobicidade de átomo pode ser | uma fração da hidrofobicidade de resíduo equivalente para ou proporcional à : fração da área de superfície a fim de que o átomo contribui para o resíduo de aminoácido. Em concretizações relacionadas, o peso de hidrofobicidade (istoé,afração de hidrofobicidade de resíduo) distribuído em um átomo po- de refletir a fração de volume, o átomo colocado no resíduo, o peso de mas- sa do átomo no resíduo, a contribuição do átomo para hidrofobicidade, etc. Como descrito acima, a hidrofobicidade de aminoácido é determinada de acordo com a escala de hidrofobicidade conhecida na técnica.
O termo "região propensa à agregação" como discutido aqui, é uma região em uma estrutura de proteína que tem uma tendência para a ligação a outras proteínas, assim aumento da probabilidade para a formação de agregado. Regiões propensas à agregação exibem caráter hidrofóbico como identificado pelas classificações de SAP descritas aqui. Em uma outra concretização, uma região propensa à agregação é uma região que é mais hidrofóbica do que as regiões envolventes. Em uma concretização específi- ca, a região propensa à agregação pode ser uma região tridimensional, defi-
. , 28/79 nida região espacial, por exemplo, uma esfera de raio R (ou, alternativamen- te, todos os resíduos de aminoácido com pelo menos um átomo dentro do raio R), que envolvem um átomo em que o caráter hidrofóbico é uma classi- ficação de SAP.
Em outras concretizações, a "região propensa à agregação" inclui qualquer agrupamento ou agrupamento dos resíduos ou átomos que exibem um caráter hidrofóbico como calculado por uma classificação de SAP.
Alternativamente, uma "região propensa à agregação" pode compreen- der próximos átomos ou resíduos que têm uma classificação de SAP mais alta do que algum limiar, por exemplo, >-0,5, >0, >0,5, etc, ou, em uma con- cretização similar, pode compreender aqueles átomos ou resíduos tendo uma área calculada sob a curva (em um diagrama de classificações de SAP como descrito abaixo) acima de algum limiar, por exemplo, >-0,5, >O, >0,5,
>1,>1,5, >2, >2,5, etc.
Em um aspecto os métodos da invenção empregam tecnologia de simulação molecular para pré-processar modelos estruturais de proteína : e/ou para identificar regiões propensas à agregação nas proteínas.
Por e- xemplo, uma simulação da dinâmica molecular pode ser empregada para í antes do cálculo SAP ou SAA.
Na prática, qualquer técnica de simula- ção/embalagem que amostras do espaço conformacional podem ser usadas de acordo com os métodos descritos aqui.
O modo preferido da simulação molecular é uma simulação da dinâmica molecular (MDS). Um MDS é uma simulação matemática em que os átomos em uma estrutura molecular são deixados que se movam e interagem de acordo com as leis da física, por exemplo, as ligações químicas dentro de proteínas podem ser deixadas do- brar, girar, dobrar, ou vibrar quando permitidas pelas leis da química e física.
Interações tais como forças eletroestáticas, forças hidrofóbicas, interações de van der Waals, interações com solvente e outras podem também ser mo- deladas nas simulações de MDS.
Tais simulações permitem ao versado na técnica observar uma estrutura de proteína como ela deve aparecer quando —solvatada, ou tomar medições mais exatas em uma estrutura de proteína por tirar a média de múltiplas medições em vários pontos durante a simulação.
Em uma concretização preferida, a simulação molecular é conduzida usan-
. > | 29/79 do-se o pacote de estimulação de CHARMM (Brooks e outros J. Comput. Chem., 1983,4, 187). Em uma outra concretização preferida a simulação molecular é conduzida usando-se o pacote de NAMD (Phillips e outros Jour- nal of Computational Chemistry. 2005, 26, 1781). Aquele versado na técnica entenderá que múltiplos pacotes podem ser usados, por exemplo, o pacote de CHARMM pode ser empregado para o ajuste ou pré-processamento de um modelo estrutural de proteína, solvatação da estrutura, etc, e o pacote de NAMD pode ser empregado para as simulações que fazem parte dos cálcu- los de tendência à agregação espacial. Qualquer uma das numerosas meto- dologias conhecida na técnica para conduzir simulações de MDS pode ser usada de acordo com a presente invenção. As seguintes publicações, que são incorporadas aqui por referência, descrevem múltiplas metodologias que podem ser empregadas: Guvench and MackKerell. Methods Mol Biol. 2008;443:63-88, Norberg and Nilsson Q Rev Biophys. agosto de 2003;36(3):257-306; as patentes U.S. Nos. 5424963; 7096167, e os pedidos de patente U.S. Nos. 11/520.588; e 10/723.594. Em particular, as seguintes plataformas de software podem ser empregadas para as simulações dinâmi- ' cas moleculares: ABINIT (Gonze e outros Comput. Mat. Science. 2002, 25, 478; Gonze e outros Kristallogr. 2005, 220, 558; abinit.org/); AMBER (Duan e outros Journal of Computational Chemistry. 2003, 24(16):1999-2012; am- ber.scripps.edu); Ascalaph (agilemolecule.com/Products.html, em 19 de ju- nho de 2008); CASTEP (Segall, e outros J. Phys.: Cond. Matt. 2002, 14(11):2717-2743; Clark e outros Zeitschrift fur Kristallographie. 2005, 220(5- 6) pp.567-570; castep.org); CPMD (manual de CMPD para CMPD versão
3.11.0, em 29 de março de 2006; cpmd.org/manual.pdf ); CHARMM (Brooks e outros J Comp Chem. 1983, 4:187-217; charmm.org); DL POLY (Todorov & Smith, THE DL POLY 3 USER MANUAL. STFC Daresbury Laboratory. ver- são 3.093, fevereio de 2008; cse.scitech.ac.uk/ccg/software/DL- POLY/MANUALS/USRMAN3.09.pdf); FIREBALL (fire- ball.phys.wvu.edu/LewisGroup/firebaliHome.html); GROMACS (Van Der Spoel, e outros, J Comput Chem. 2005, 26(16): 1701-18. Hess, e outros, J Chem Theory Comput. 2008, 4(2): 435; gromacs.org); GROMOS (Schuler,
« » 30/79 Daura, van Gunsteren. Journal of Computational Chemistry. 2001, 22(11):1205-1218; igc.ethz.ch/GROMOS/index); LAMMPS (Plimpton, J Comp Phys. 1995, 117, 1-19 ; lammps.sandia.gov); MDynaMix (Lyubartsev and Laaksonen. Computer Physics Communications. 2000, 128, 565-589; fos.suse/-sasha/mdynamix/); MOLDY (Moldy: a portable molecular dyna- mics simulation program for serial and parallel computers., Computer Phy- sics Communications. 2000, 126(3):309-328; ear- th.ox.ac.uk/-keithr/moldy.html); MOSCITO (Dietmar Paschek and Alfons Geiger. User's Guide and Manual, MOSCITO 4, Performing Molecular Dyna- mics Simulations, em 7 de abril de 2003, ganterchemie.uni- dortmund.de/MOSCITO/manual4.pdf); NAMD (Kumar, e outros IBM Journal of Research and Development. 2007, Volume 52, No. 1/2; Phillips e outros, Proceedings of SC 2002; charm.cs.uiuc.edu/research/moldyn/); Newton-X (M. Barbatti, G. Granucci, M. Ruckenbauer, M. Persico, H. Lischka, Newton- X a package for Newtonian dynamics close to the crossing seam, versão
0.15b, 2007; univie.ac.at/newtonx; Barbatti, e outros, J. Photochem. Photobi- o. A 190, 228 (2007)); ProtoMol (Matthey, e outros ACM Trans. Math. Softw., Í 2004, 30(3):237-265; protomol.sourceforge.net/); PWscf (User's Guide for . Quantum-ESPRESSO version 3.2, pwscf.org/guide/3.2.3/users-guide-
3.2.3.pdf); SIESTA (Soler, e outros Journal of Physics: Condensed Matter. 2002, 14: 2745-2779; uam.es/departamentos/ciencias/fismateriac/siesta/); VASP (Georg Kresse and Júrgen Furthmúller, VASP the GUIDE, Institut fúr Materialphysik, Universitãt Wien,Sensengasse 8, A-1130 Austria, Vienna, em 1 de março de 2007 ; cms.mpi.univie.ac.at/vasp/); TINKER (Ren and Ponder. J Phys. Chem. B.2003, 107, 5933-5947; dasher.wustl.edu/tinker/); YASARA (Krieger E, Koraimann G, Vriend G.Proteínas. 2002 47(3):393-402.); ORAC (Procacci, e outros, Phys. Chem. 1996, 100 10464-10469; chim.unifi.it/orac/); XMD (XMD online manual, XMD - Molecular Dynamics Program Jon Rifkin, v2.5.30 20 Jan 2002) Como usado aqui, os termos "aminoácido" e "resíduo de amino- ácido" e "resíduo" podem, em algumas concretizações, ser usados sinoni- mamente para referir-se a um aminoácido como ele existe em um estado c "+ 31/79 isolado, por exemplo, em solução têm grupos amino não ligados e carbóxi terminais, ou como ele existe em uma proteína, por exemplo, um resíduo de aminoácido covalentemente ligado a pelo menos um outro aminoácido via uma ligação de peptídeo. Aquele versado na técnica entenderá a química de proteína pretendida.
Como usado aqui, um "aminoácido não natural" é um aminoáci- do que não é conhecido como ocorrendo na natureza. O termo "aminoácido não natural" inclui análogos de aminoácido. Pode ulteriormente incluir um derivado de um aminoácido natural compreendendo uma substituição ou adição selecionada do grupo que compreende um grupo alquila, um grupo arila, um grupo acila, um grupo azido, um grupo ciano, um grupo halo, um grupo hidrazina, um grupo hidrazida, um grupo hidroxila, um grupo alquenila, um grupo alquinila, um grupo éter, um grupo tiol, um grupo sulfonila, um gru- po seleno, um grupo éster, um grupo ticoácido, um grupo borato, um grupo boronato, um grupo fosfo, um grupo fosfono, um grupo fosfina, um grupo heterocíclico, um grupo enona, um grupo imina, um grupo aldeído, um grupo hidroxilamino, um grupo ceto, um grupo de açúcar, um grupo .alfa.-hidróxi, ' um grupo ciclopropila, um grupo ciclobutila, um grupo ciclopentila, um grupo 2-nitrobenzila, um grupo 3,5-dimetóxi-2-nitrobenzila, um grupo 3,5-dimetóxi- 2-nitroveratrol carbamato, um grupo nitrobenzila, um grupo 3,5-dimetóxi-2- nitrobenzila, e um grupo amino.
Por exemplo, aminoácido não natural pode ser, sem limitação, qualquer um dos seguintes aminoácidos: hidróxi metionina, norvalina, O- metilserina, crotilglicina, hidróxi leucina, alo-isoleucina, norleucina, ácido a- —aminobutírico, t-butilalanina, hidróxi glicina, hidróxi serina, F-alanina, hidróxi tirosina, homotirosina, 2-F-tirosina, 3-F-tirosina, 4-metil-fenilalanina, 4- metóxi-fenilalanina, 3-hidróxi-fenilalanina, 4-NH>-fenilalanina, — 3-metóxi- fenilalanina, —2-F-fenilalanina, — 3-F-fenilalanina, — 4-F-fenilalanina, — 2-Br- fenilalanina, 3-Br-fenilalanina, 4-Br-fenilalanina, 2-Cl-fenilalanina, 3-CI- fenilalanina, 4-Cl-fenilalanina, 4-CN-fenilalanina, 2,3-F>-fenilalanina, 2,4-F2- fenilalanina, 2,5-F2z-fenilalanina, 2,6-F2-fenilalanina, 3,4-F2-fenilalanina, 3,5- F2-fenilalanina, 2,3-Br7-fenilalanina, 2,4-Br>-fenilalanina, 2,5-Br>-fenilalanina,
r > l 32/79 2,6-Br7-fenilalanina, — 3,4-Br7-fenilalanina, — 3,5-Br7-fenilalanina, — 2,3-Clz- fenilalanina, 2,4-Cl.sub.2-fenilalanina, 2,5-Cl;-fenilalanina, 2,6-Cl;- fenilalanina, — 3,4-Cl.sub.2-fenilalanina, — 2,3,4-F3-fenilalanina, — 2,3,5-F3- fenilalanina, 2,3,6-F3-fenilalanina, 2,4,6-F;3-fenilalanina, 3,4,5-F3-fenilalanina, 2,34-Br.sub.;fenilalanina, 2,3,5-Br;3-fenilalanina, 2,3,6-Br3-fenilalanina, 2,4,6-Br.sub.;-fenilalanina, — 3,4,5-Br3-fenilalanina, — 2,3,4-Cl;-fenilalanina, 2,3,5-Cl;-fenilalanina, 2,3,6-Cl;-fenilalanina, 2,4,6-Cl3-fenilalanina, 3,4,5-Cl3- fenilalanina, 2,3,4,5-F,4-fenilalanina, 2,3,4,5-Br.sub.,-fenilalanina, 2,3,4,5-Cl4- ” fenilalanina, 2,3,4,5,6-F5-fenilalanina, 2,3,4,5,6-Brs-fenilalanina, 2,3,4,5,6-Cl5- fenilalanina, ciclo-hexilalanina, hexa-hidrotirosina, ciclo-hexanol-alanina, hi- Í droxila alanina, hidróxi fenilalanina, hidróxi valina, hidróxi isoleucina, hidroxila y glutamina, tienilalanina, pirrol alanina, Nr-metil-histidina, ácido 2-amino-5- oxoexanoico, norvalina, norleucina, 3,5-F2-fenialanina, ciclo-hexialanina, 4- Cl-fenialanina, p-azido-fenilalanina, o-azido-fenilalanina, O-4-alil-L-tirosina, : 15 ácido 2-amino-4-pentanoico, e ácido 2-amino-5-oxoexanoico. É esperado que, pelo menos para os aminoácidos não naturais listados acima e para aqueles empregados pela tecnologia de Ambrx ReCODE? (am- Í brx.com/wt/page/technology), os aminoácidos não naturais seguirão escalas de hidrofobicidade similar àqueles dos 20 aminoácidos comuns, por exem- plo, como descrito em Black e Mould. Alternativamente, a hidrofobicidade de qualquer aminoácido não natural ou incomum pode ser determinado por vá- rias técnicas que são bem-conhecidas na técnica, tais como aqueles revisa- dos e referenciados em Biswas e outros (J. Chromatogr. A 1000 (2003) 637- 655).
O termo "análogo de aminoácido" refere-se a um aminoácido em que o grupo carbóxi C-terminal, o grupo amino N-terminal ou o grupo funcio- nal de cadeia lateral era quimicamente modificado em um outro grupo fun- cional. Por exemplo, (éster de beta-metila) de ácido aspártico é um análogo de aminoácido de ácido aspártico; N-etilglicina é um análogo de aminoácido deglicina;ou alanina carboxamida é um análogo de aminoácido de alanina.
O termo "aminoácido incomum" refere-se àqueles aminoácidos naturais que são raros ou de outra maneira entre os aminoácidos mais co-
r > 33/79 muns em que o aminoácidos comuns são selenocisteína, alanina, arginina, asparagina, ácido aspártico, cisteína, glutamina, ácido glutâmico, glicina, histidina, isoleucina, leucina, lisina, metionina, fenilalanina, prolina, serina, treonina, triptofano, tirosina, e valina.
Outros exemplos não limitantes dos aminoácidos modificados, incomuns (isto é, rara), não naturais, ou análogos que podem ser substituí- dos em uma proteína de acordo com os métodos da invenção são: O-metil- L-tirosina, L-3-(2-naftil)-alanina, 3-metil-L-fenilalanina, fenilalanina fluorada, 7 p-benzoil-L-fenilalanina, p-iodo-L-fenilalanina, p-bromo-L-fenilalanina, p- amino-L-fenilalanina, 3,4-di-hidróxi-L-fenilalanina, isopropil-L-fenilalanina, p- É azido-L-fenilalanina, p-acetil-L-fenilalanina, m-acetil-L-fenilalanina, 4-(2-0x0- . propóxi)-L-fenilalanina, e os aminoácidos (e métodos de incorporação da mesma) que são descritos nas patentes US Nos. 7.083.970; 7.045.337; nos ' pedidos de patente US Nos. 10/126.931; 11/002.387; 11/254.170; f 15 11/009.635; 11/670.354; 11/284.259; 10/563.686; 11/326.970; 10/563.656; Ê 10/563.655; 11/715.672; 11/671.036; 11/255.601; 11/580.223; 11/137.850; 11/233.508; 10/575.991; 11/232.425; Wipo Publicações WO/2007/094916; ' WO/2007/130453; e as publicações Liao J. Biotechnol Prog. 2007 Jan-Feb; 23(1):28-31; Rajesh, and Igbal. Curr Pharm Biotechnol. agosto de 2006; 7(4):247-59. Cardillo e outros Mini Rev Med Chem. março de 2006; 6(3):293- 304; Wang e outros Annu Rev Biophys Biomol Struct. 2006; 35:225-49; Cha- kraborty e outros, Glicoconj J. março de 2005; 22(3):83-93 que são todos incorporados aqui por referência. Outros exemplos de aminoácidos não na- turais podem ser encontrados, por exemplo, nas seguintes publicações de patente U.S., cujo conteúdo são incorporados aqui por referência: 2003- 0082575, 2005-0250183, 2003-0108885, 2005-0208536, e 2005-0009049. |. Tendência à agregação espacial A invenção aqui refere-se a métodos para a identificação de re- giões propensas à agregação na superfície de proteína, para a prevenção ou redução de agregação de uma proteína, e para a identificação de uma regi- ão de ligação de macromolécula na proteína. Os métodos aqui representam uma vantagem na capacidade de métodos computacionais para identificar
" 2 Ê 34/79 regiões de proteína que podem ser modificadas para reduzir a tendência de uma proteína de agregar ou para reduzir a afinidade de ligação de uma pro- teina para uma macromolécula. Em particular, os métodos são com base, pelo menos em parte, no cálculo da SAA (Área acessível a solvente), que é conhecido na técnica para a caracterização da superfície de uma proteína. SAA dá a área de superfície de cada estrutura de aminoácido ou de proteína que é posta em contato com o solvente. SAA pode ser tipicamente calculada por computação do local do centro de uma esfera da sonda quando ela gira . sobre a superfície de proteína, isto é, a superfície do modelo estrutural de proteína. A esfera da sonda tem o mesmo raio que aquela de uma molécula Ú de água, R=1,4 À. Métodos alternativos de cálculo SAA, descritos abaixo, ' são conhecidos na técnica e são compatíveis com os métodos descritos a- qui. Embora SAA seja totalmente útil caracterizar a superfície de proteína, ' demonstrou ser adequado caracterizar as placas hidrofóbicas na superfície de proteina que são potencialmente propensas à agregação por causa das seguintes falhas,
1. SAA não distingui entre regiões hidrofóbicas e hidrofílicas f 2. SAA não é diretamente proporcional a uma hidrofobicidade do resíduo | (por exemplo, MET tem área mais superficial do que LEU mas é menos hi- drofóbico)
3. SAA não indica se vários resíduos hidrofóbicos estão pertos e assim po- deriam melhorar a hidrofobicidade de uma certa região. Esses resíduos po- deriam estar perto ou na sequência primária ou na estrutura terciária embora eles estejam afastados na sequência primária. Qualquer modo, eles poderi- am melhorar a hidrofobicidade de uma certa placa na superfície de anticor- po.
Uma medida que é descrito aqui, a SAA eficaz, é gerada por cálculo da hidrofobicidade da fração do aminoácido que é exposta de acordo com a fórmula abaixo: SAA eficaz = AA X hidrofobicidade de resíduo SAA Totalmente exposto Uma outra concretização da SAA eficaz ulteriormente compre- ende a soma da SAA eficaz sobre pelo menos a, pelo menos três, pelo me-
nos quatro, pelo menos cinco ou pelo menos seis, (por exemplo, dois, três, quatro, cinco, seis, etc.) resíduos de aminoácido que são adjacentes na se- quência de proteínas primária.
Embora a SAA eficaz represente um aperfei- çoamento sobre a SAA básica, ela, no entanto, carece da capacidade de representar totalmente a estrutura da proteína dobrada e para o fato de que os aminoácidos que não são adjacentes na sequência de proteínas podem estar na proximidade uns dos outros na estrutura secundária, terciária ou quaternária dobrada de uma proteína.
Tais dobramentos de proteína podem é formar regiões propensas à agregação que não aparecem na estrutura pri- : 10 —mária sozinha, ou que podem apenas ser detectadas por análise mais robus- ta da estrutura de proteína dobrada. . A presente invenção provê uma nova, mais avançada medida, chamada a tendência à agregação espacial, que iluminará a hidrofobicidade : eficaz de uma certa placa ou região na superfície de proteína.
A tendência à ' 15 agregação espacial é calculada para regiões espaciais definidas nos ou per- : to do átomos do modelo estrutural de proteína.
Nesse contexto, uma "região espacial definida" é um volume ou í espaço tridimensional escolhido para capturar uma estrutura física local e/ou ambiente químico na ou próximo da estrutura de proteína.
Em uma concreti- zação particularmente preferida a tendência à agregação espacial é calcula- da para regiões esferoidais com raio R centrado nos átomos em uma proteí- na (por exemplo, átomo no modelo estrutural de proteína). A tendência à agregação espacial pode também ser calculada para regiões esferoidais com raio R centradas nas ligações químicas, ou posicionadas no espaço próximo do modelo estrutural.
Correspondentemente, em uma outra concre- tização preferida a SAP pode ser calculada para uma região espacial defini- da centrada próximo de um átomo, por exemplo, centrado em um ponto no espaço que está entre 1 a 10 À, mais de preferência de 1 a 5À, com mais preferência de 1 a 2 À do centro de um átomo particular ou ligação química.
Em concretizações preferidas, o raio escolhido R está entre 1 À e 50 À, mais de preferência entre 1 À e 50 À.
Em concretizações particulares o raio escolhido é pelo menos 1 À, pelo menos 3 À, pelo menos 4 À, pelo V————
menos 5 À, pelo menos 6 À, pelo menos 7 À, pelo menos 8 À , pelo menos 9 À , pelo menos 10 À, pelo menos 11 À, pelo menos 12 À, pelo menos 15ÀÃ, pelo menos 20 À, pelo menos 25 À, ou pelo menos 30 À. Em concretizações particularmente preferidas, o raio escolhido está entre 5 À e 15 À, mais de preferência entre 5 À e 12 À, mais de preferência entre 5 À e 10 À. Em con- cretizações específicas o raio escolhido é 5 À ou 10 À. Em outras concretizações, a região para a qual a tendência à agregação espacial é calculada não é esférica. A forma possível da região S pode ulteriormente compreender um cubo, um cilindro, um cone, esferoide ' 10 elíptica, uma pirâmide, um hemisfério, ou qualquer outra forma que pode ser usada para cercar uma porção do espaço. Em tais concretizações, o tama- . nho da região pode ser escolhido usando-se medidas outras do que não rai- o, por exemplo, a distância do centro da forma para uma face ou vértice. Á Em uma concretização preferida, a SAP pode ser usada para se- lecionar resíduos em uma proteína que podem ser substituídos, assim au- mento da estabilidade da proteína. Em estudos anteriores duas principais abordagens para estabilizar uma proteína in vitro foram para (1) projetar a : própria sequência de proteínas e (2) incluem aditivos na formulação líquida. Ambas as abordagens foram investigadas e resultados significativos foram obtidos. A primeira abordagem contou com a triagem de bibliotecas extensas de variantes aleatórias in silico ou experimentalmente. Na segunda aborda- gem, triagem de alta capacidade para a estabilização de aditivos, bem como projeto racional de aditivos permite identificação de ótimas formulações para uma proteína terapêutica.
A presente invenção é esperada como simplificando o processo de melhoramento de estabilidade por identificação de pontos quentes exis- tentes para agregação computacionalmente, e análise de variantes com substituições naqueles sítios experimentalmente.
Assim, em termos gerais, um método para o cálculo da tendên- ciaãà agregação espacial para um átomo particular em uma proteína com- preende (a) identificação de um ou mais átomos em um modelo estrutural que representa a proteína, em que o(s) um ou mais átomos estão dentro de
37/79 | uma região especial definida centrada no ou próximo do átomo particular; (b) cálculo, para cada um do(s) um ou mais átomos na região espacial definida, uma razão de área acessível a solvente (SAA) dos átomos para a SAA de átomos em um resíduo idêntico que é totalmente exposto; (c) multiplicação decadarazão pela hidrofobicidade do átomo do(s) um ou mais átomos; e (d) soma dos produtos da etapa (c); pelo que a soma é a SAP para o átomo par- ticular.
Em uma concretização relacionada, a SAP pode ser calculada S de acordo com um diferente método compreendendo (a) identificação de um . 10 oumaisresíduos de aminoácidos em um modelo estrutural que representa a proteína, em que o(s) um ou mais resíduos de aminoácidos têm pelo menos . um átomo dentro de uma região espacial definida centrada no ou próximo do . átomo particular; (b) cálculo, para cada de um ou mais resíduos de aminoá- ' cido identificados, uma razão de área acessível a solvente (SAA) de átomos i 15 no aminoácido para o SAA de átomos em um resíduo idêntico que é total- mente exposto; (c) multiplicação de cada razão pela hidrofobicidade do(s) um ou mais resíduos de aminoácidos como determinado por uma escala de i hidrofobicidade de aminoácido; e (d) soma dos produtos da etapa (c); pelo que a soma é a SAP para o átomo particular. Em concretizações preferidas, o modelo estrutural é processado antes da etapa (a) por permissão que o modelo estrutural interaja com solvente em uma simulação da dinâmica mo- lecular. Quando um aminoácido é identificado como tendo pelo menos um átomo dentro da região espacial definida, o pelo menos um átomo pode ser necessário de ter exclusivamente um átomo em um aminoácido cadeia late- ral. Alternativamente pode ser um átomo necessário a ter um átomo de ca- deia principal.
Em outras concretizações, esse método pode ulteriormente compreender opcionalmente condução de uma simulação da dinâmica mo- lecular antes da etapa (a) e etapas de repetição (a) a (d), cada vez condu- —zindo uma outra estimulação dinâmica molecular em uma pluralidade de e- tapas de tempo, desse modo produzindo múltiplas somas como na etapa (d), e cálculo da média das somas; pelo que a média calculada é a SAP para o
« r | 38/79 átomo particular.
Em outras concretizações preferidas, a SAP pode ser usada pa- ra selecionar resíduos em uma proteína que podem ser substituídos, assim redução da afinidade de ligação da proteína para uma macromolécula.
Aquele versado na técnica apreciará que uma concretização da presente invenção que emprega a média de valores calculados sobre uma simulação da dinâmica molecular será mais computacionalmente intensiva. Tal concretização também, em alguns casos, proverá um mapa mais preciso é ou altamente resolvido da tendência à agregação espacial. No entanto, ex- , 10 periências discutidas aqui mostraram que o método é ainda altamente exato quando a média das dinâmicas moleculares não é empregada. Em uma : concretização preferida, valores de tendência à agregação espacial podem ' ser calculados para todas as estruturas de proteína em uma base de dados, Í por exemplo, um banco de dados de proteína (PDB, desse modo rapidamen- te identificando hidrofóbicos e placas em todas as estruturas de proteína co- nhecidas). Esse método permite triagem de grandes conjuntos de proteínas para identificar potenciais regiões propensas à agregação e/ou sítios de inte- Ú ração de proteína.
Em uma aplicação preferida, a tendência à agregação espacial é descritapela seguinte fórmula: SAA de átomos de cadeia (Tendência a agregaçãoespacial (SAP)) om; = =D” >L EsE— mao o [ondas detona! Tateral de resíduo totalmente expostos em que 1) SAA de átomos de cadeia lateral dentro do raio R é computada em cada simulação instantânea. SAA é de preferência calculada no modelo de simu- lação por computação do local do centro de uma esfera da sonda como quando ela gira sobre a superfície de proteína. A esfera da sonda tem o mesmo raio que de uma molécula de água, R= 1,4 A. Aquele versado na técnica apreciará que outros métodos de computação da SAA seriam com- patíveis com os métodos descritos aqui para calcular SAP. Por exemplo, a SAA pode ser calculada nos átomos de cadeia lateral no aminoácido unica-
mente. A SAA pode também ser calculada nos átomos de cadeia principal no aminoácido unicamente (isto é, aqueles átomos da cadeia principal de peptídeo e hidrogênios associados). Alternativamente, a SAA pode ser cal- culada nos átomos de cadeia principal no aminoácido unicamente com a exclusãode hidrogênios associados; 2) SAA de cadeia lateral de resíduo totalmente exposto (dizer para aminoá- cido 'X') é obtida, em uma concretização preferida, por cálculo da SAA de cadeias laterais do resíduo médio na conformação totalmente prolongada de tripeptídeo 'Ala-X-Ala'; e 3) Hidrofobicidade de átomo é obtida como descrita acima usando-se a es- cala de hidrofobicidade de Black e Mould (Black and Mould, Anal. Biochem. 1991, 193, 72-82).
O resíduo que é "totalmente exposto" é um resíduo, X, na con- formação totalmente prolongada do tripeptídeo Ala-X-Ala. Aquele versado na Í 15 técnica apreciará que essa disposição é projetada tal que um cálculo de SAN Y no tal um resíduo, X, fornecerá a máxima área acessível a solvente disponí- vel. Correspondentemente, é contemplado que outros resíduos além de ala- Ú nina pode ser usada no cálculo sem rompimento inteiro ou alteração dos resultados.
Como descrito acima, os métodos da presente invenção podem ser aplicados a qualquer modelo estrutural de proteína. Correspondentemen- te a SAP baseado justamente na estrutura de raios X pode ser indicada co- mo: SAA de átomos de cadeia (Tendência a agregação espacial (SAP))5S2X, = ta RCA Fa ad x hidrofobididade de átomo má | orendos ieâtomoi — | lateral de resíduo totalmente exposto Similarmente, se a estrutura de raios X não está disponível, o mesmo parâmetro de tendência à agregação espacial pode ser aplicado à estrutura gerada através de modelação por homologia, e um parâmetro de SAP pode assim ser indicado como: SAA deátomos de cadeia (Tendência a agregação espacial (SAP) = Zoo E) média — oriundos áeáiomo! — | de resíduo totalmente exposto
Em concretizações preferidas a tendência à agregação espacial é calculada para todos os átomos no modelo estrutural de proteína. Em al- gumas concretizações, os valores de tendência à agregação espacial ato- místicos podem ser calculados a média sobre cada resíduo de proteína indi- víidual, ou sobre grupos pequenos de resíduos.
Il. Usos da Invenção Em um aspecto, a presente invenção pode ser usada como des- crita acima para identificar resíduos hidrofóbicos de aminoácido, regiões ou placas em uma proteína. Sem querer ser mantido a valores limiares especí- ficos, átomos ou resíduos de aminoácido tendo a tendência à agregação espacial > O são considerados serem hidrofóbicos ou estar em uma região propensa à agregação. Dependendo do tipo de proteína, da estrutura parti- cular, e do solvente em que o solvente em que ele existe, pode ser desejável identificar átomos ou resíduos usando-se um corte que ligeiramente abaixo ' 15 de zero, por exemplo, por escolher átomos ou resíduos que têm uma ten- dência à agregação espacial de mais do que -0,1, -0,15, -0,2, etc. Alternati- vamente, pode ser desejável empregar um corte mais preciso, por exemplo, i O, 0,05, 0,1, 0,15, 0,2, etc., a fim de escolher os resíduos, placas ou átomos - hidrofóbicos mais fortes. Em uma outra concretização, pode ser vantajoso simplesmente selecionar átomos ou resíduos tendo tendência à agregação espacial que é maior do que átomos ou resíduos que estão próximos ou se- quencialmente (isto é, ao longo da sequência de proteínas) ou, em uma con- cretização preferida, espacialmente (isto é, na estrutura tridimensional). Um método preferido para a seleção de átomos ou resíduos em uma placa hidro- fóbicaé mapear valores de tendência à agregação espacial calculados, por exemplo, usando-se uma codificação de cor ou codificação numérica, sobre o modelo estrutural de proteína a partir do qual eles eram derivados, assim diferenças de visualização na tendência à agregação espacial através de uma superfície de proteína e portanto permitindo seleção fácil de resíduos ou placas hidrofóbicas. Em uma concretização particularmente preferida, os cálculos para tendência à agregação espacial são realizados separadamente usando-se dois valores escolhidos para o raio, uma resolução mais alta, por exemplo, 5 A, e uma de resolução mais baixa, por exemplo, 10 A. Em tal concretização de placas hidrofóbicas mais amplas e maiores podem ser vis- tas em uma estrutura de proteína com o mapa de resolução mais baixa. Uma vez que placas hidrofóbicas de interesse são selecionadas no mapa de resolução baixa, aquelas placas podem ser vistas em maiores detalhes no mapa de resolução que podem, em algumas concretizações, permitem que aquele versado na técnica mais facilmente ou mais exatamente escolham resíduos mutem ou modifiquem. Por exemplo, quando da visão de uma pla- ca hidrofóbica no mapa de resolução mais alta, pode ser desejável selecio- narpara mutação o resíduo que tem a classificação de SAP mais alta ou é o mais hidrofóbico (por exemplo, o resíduo de mais hidrofóbico resíduo na pla- ca de acordo com a escala de Black e Mould, Anal. Biochem. 19971, 193, 72- 82).
Em uma concretização específica um método para identificar uma região propensa à agregação na proteina compreende (a) mapeamen- to, sobre o modelo estrutural a SAP como calculada de acordo com qualquer um dos métodos descritos aqui para átomos na proteína; e (b) identificação Í de uma região dentro de na proteína tendo uma pluralidade de átomos tendo ' a SAP > O; em que a região propensa à agregação compreende os aminoá- cidos compreendendo a dita pluralidade de átomos. Em tal concretização a SAP pode ser calculada para todos os átomos em uma proteína ou uma por- ção dos átomos. É contemplado que aquele pode apenas calcular a SAP para resíduos ou grupos particulares de resíduos que são de interesse. Em uma concretização particular, pode ser informativo represen- tar graficamente as classificações de SAP dos átomos (ou a classificação de SAP quando tirando a média sobre resíduos de aminoácido). Tal diagrama que mostra a classificação de SAP ao longo dos átomos ou resíduos de uma proteína permite a identificação fácil de picos, que podem indicar candidatos para substituição. Em uma concretização particularmente preferida as classi- ficaçõesde SAP ao longo dos átomos ou resíduos na proteína são represen- tados graficamente em um gráfico e a área sob a curva (AUC) é calculada para picos no gráfico. Em tal concretização, picos com uma AUC maior re-
presenta ou mais regiões hidrofóbicas propensas à agregação. Em concreti- zações particulares será desejável selecionar para substituição de um ou mais resíduos que são identificados como existentes em um pico, ou, mais de preferência, em um pico com uma AUC grande.
Em concretizações particulares a presente invenção pode ser usada para produzir uma variante de proteína que exibe uma tendência re- duzida para agregação por substituição pelo menos um resíduo de aminoá- cido dentro de uma região propensa à agregação na proteína identificado por qualquer um dos métodos descritos aqui com um resíduo de aminoácido que é mais hidrofílico então o resíduo que está sendo substituído, tal que uma tendência à agregação da variante é reduzida. Como usado aqui, quando resíduos de aminoácido são chamados de "mais" ou "menos" hidro- fílicos ou hidrofóbicos, será apreciados pelo versado na técnica que isso sig- nifica mais ou menos hidrofóbicos quando comparados com um outro ami- “15 noácidode acordo com uma medição de hidrofobicidade (hidrofilicidade) co- nhecido na técnica, por exemplo, a escala de hidrofobicidade de Black e Mould.
Í Em uma concretização similar a presente invenção pode ser u- sada para produzir uma variante de proteína que exibe uma tendência redu- zida para agregação por geração de uma pluralidade das variantes de prote- ina por substituição, em cada variante pelo menos um resíduo dentro de uma região propensa à agregação na proteína, em que a região propensa à agregação é identificada usando-se classificações de SAP calculadas de acordo com qualquer método descrito aqui, em que um ou diferentes resí- duos, ou diferentes combinações de resíduos são substituídos em cada vari- ante, e em que o pelo menos um resíduo é substituído com um resíduo que é mais hidrofílico; e (b) seleção de uma variante de proteína preparada como na (a) que exibe uma tendência reduzida para agregação.
Além disso, um resíduo de aminoácido em uma região propensa à agregação pode ser deletada ao invés de substituída. Em algumas proteí- nas onde múltiplos resíduos de aminoácido são selecionados para substitui- ção, alguns resíduos podem ser substituídos enquanto outros são selecio-
nados.
Em outras concretizações múltiplas regiões propensas à agre- gação ou resíduos podem ser identificados em uma proteína inicial pelos métodos descritos acima (por exemplo, por uso de um corte de tendência à agregação espacial acima do que os resíduos são selecionados). Subse- quentemente, uma pluralidade das variantes de proteína pode ser gerada por substituição na dita proteína inicial um ou mais são resíduos de aminoá- cido selecionados (ou um ou mais resíduos que caem na placa selecionada) com resíduos de aminoácido que são mais hidrofílicos, tal que uma plurali- dadedas variantes de proteína são criadas que representam uma variedade de diferentes substituições de aminoácido.
Essa população pode então ser triada para selecionar uma ou mais variantes de proteína que têm uma ten- dência reduzida para agregação.
Aquele versado na técnica apreciará que múltiplas regiões propensas à agregação podem ser identificadas, e que uma ou mais substituições e/ou deleções podem ser produzidas em uma ou À mais regiões propensas à agregação.
A hidrofobicidade relativa dos aminoá- cidos pode ser determinada pela escala de hidrofobicidade de Black e Mould ' como descrito acima.
Em concretizações específicas, um aminoácido a ser : substituído é selecionado do grupo que compreende ou que consiste em Fe, Leu, lle, Tyr, Trp, Val, Met, Pro, Cys, Ala, ou Gly.
Em concretizações relacio- nadas, o aminoácido mais hidrofílico que será substituído na proteína será escolhido do grupo compreendendo ou que consiste em Thr, Ser, Lys, GIn, Asn, His, Glu, Asp, e Arg.
Variantes de proteína podem ser produzidos por qualquer méto- do conhecido na técnica incluindo mutagênese de sítio dirigido e outra tecno- logia de DNA recombinante, por exemplo, vide Patentes US Nos. 5284760; 5556747; 5789166; 6878531, 5932419; e, 6391548 que são incorporadas aqui por referência.
Em concretizações particulares a presente invenção pode ser usada para produzir uma variante de proteína que exibe uma tendência re- duzida para agregação por substituição pelo menos um resíduo de aminoá- cido dentro de uma região propensa à agregação na proteína identificado por qualquer um dos métodos descritos aqui com um resíduo de aminoácido natural, um resíduo de aminoácido modificado, um resíduo de aminoácido incomum, um resíduo de aminoácido não natural, ou um análogo ou deriva- do de aminoácido que é mais hidrofílico do que o resíduo que está sendo substituído, tal que uma tendência à agregação da variante é reduzida.
A síntese de aminoácidos não naturais é conhecido por aqueles versados na técnica, e é ulteriormente descrita, por exemplo, na publicação de patente U.S. No. 2003-0082575. Em geral, qualquer método conhecido na técnica para sintetizar ou incorporar aminoácidos não naturais, modifica- dos ou incomuns nas proteínas podem ser empregados incluindo, mas não limitados àqueles métodos descritos ou referenciados nas publicações Liao J. Biotechnol Prog. 2007 Jan-Feb;23(1):28-31; Rajesh,and Igbal. Curr Pharm Biotechnol. 2006 Aug;7(4):247-59; Cardillo e outros Mini Rev Med Chem. 2006 Mar;6(3):293-304; Wang e outros Annu Rev Biophys Biomol Struct.
' 15 2006;35:225-49; Chakraborty e outros, and Glicoconj J. 2005 Mar;22(3):83- : 93 que são todos incorporados aqui por referência. Como um outro exemplo, a tecnologia de Ambrx ReCODEº pode ser empregada para desenvolver e i incorporar aminoácidos não naturais, ou aminoácidos incomuns em proteí- nas como indicados pelos métodos descritos aqui.
Variantes de proteína de acordo com a invenção podem exibir estabilidade melhorada ou aumentada como determinado, por exemplo, por estudos de estabilidade acelerados. Estudos de estabilidade acelerados e- xemplares incluem, mas não são limitados a, estudos que caracterizam tem- peraturas de armazenagem aumentadas. Uma diminuição na formação de agregados observada para uma variante de proteína quando comparados com a proteína inicial ou de tipo selvagem indica uma estabilidade diminuí- da. Estabilidade das variantes de proteína podem também ser testadas por medição da mudança na transição de temperatura de fusão de uma variante quando comparado com a proteína inicial ou de tipo selvagem. Em tal con- cretização, estabilidade aumentada estaria evidente quando um aumento na transição de temperatura de fusão na variante. Métodos adicionais para a medição de agregação de proteína são descritos no pedido de patente U.S.
| 45179 No. 10/176.809 que é incorporado aqui por referência.
Em um outro aspecto da invenção a tendência à agregação es- pacial calculada pode ser usada para identificar proteína - sítios de interação de proteína na superfície de uma estrutura de proteína. É conhecido na téc- nica que sítios de interação de proteína frequentemente contêm resíduos hidrofóbicos ou placas hidrofóbicas. É exceto que os métodos descritos aqui serão úteis na localização de sítios de ligação por identificação de placas hidrofóbicas. Tais placas hidrofóbicas então serão candidatas para sítios de reconhecimento de proteína - ligante ou proteína - proteína.
Em um outro aspecto a invenção também inclui métodos para identificar uma região de ligação de macromolécula na proteína, compreen- dendo (a) mapeamento, sobre um modelo estrutural da proteina a SAP co- mo calculada de acordo com qualquer um dos aspectos precedentes para átomos na proteína; e (b) identificação de uma região dentro na proteína tendo uma pluralidade de átomos tendo a SAP > O; em que a região de liga- ção de macromolécula compreende os aminoácidos compreendendo a dita pluralidade de átomos.
] Em um outro aspecto a invenção inclui métodos para identificar uma região de ligação de macromolécula na proteína, compreendendo iden- tifcação de um ou mais aminoácidos contendo um ou mais átomos tendo uma SAP maior do que um limiar escolhido; em que a SAP é calculada de acordo com o método de qualquer um dos aspectos anteriores e em que a região de ligação de macromolécula compreende os aminoácidos identifica- dos Em um outro aspecto a invenção inclui métodos para identificar uma região de ligação de macromolécula em uma proteína, compreendendo representação gráfica de valores de SAP como calculados em qualquer um dos aspectos precedentes, cálculo, para picos no diagrama, da área sob a curva (AUC) e identificação de uma ou mais regiões de proteina com uma —AUC positiva, em que a região de ligação de macromolécula compreende as regiões de proteína identificadas.
Em um outro aspecto a invenção pode ser usada para produzir uma variante de proteína que exibe uma afinidade de ligação reduzida para uma macromolécula, compreendendo substituição ou deleção de pelo me- nos um resíduo de aminoácido dentro de uma região de ligação de macro- molécula para uma macromolécula na proteína, em que a região de ligação de macromolécula é identificada usando-se Classificações de SAP calcula- das de acordo com qualquer um dos aspectos anteriores; e em que, se o resíduo de aminoácido for substituído, ele é substituído com um resíduo de aminoácido que é mais hidrofílico, tal que a afinidade de ligação para uma macromolécula da variante é reduzida.
Em certas concretizações pelo me- nos um resíduo é substituído e pelo menos um resíduo é deletado.
Em um outro aspecto a invenção também inclui métodos de produção de uma vari- ante de proteína que exibe uma afinidade de ligação alterada para uma ma- cromolécula, compreendendo (a) geração de uma pluralidade das variantes de proteína por substituição em cada variante pelo menos um resíduo dentro í 15 de uma região de ligação de macromolécula para uma macromolécula na proteína, em que a região de ligação de macromolécula é identificada usan- do-se Classificações de SAP calculadas de acordo com qualquer um dos Í aspectos precedentes, em que um ou diferentes resíduos, ou diferentes combinações de resíduos são substituídos em cada variante; e (b) seleção de uma variante de proteína preparada como na (a) que exibe uma afinidade de ligação alterada para uma macromolécula.
Em certas concretizações o pelo menos um resíduo de aminoácido dentro da região de ligação de ma- cromolécula é o resíduo mais hidrofóbico em uma região de ligação de ma- cromolécula.
Em certas concretizações o pelo menos um resíduo de amino- ácido dentro de uma região propensa à agregação é Fe, Leu, Ile, Tyr, Trp, Val, Met, Pro, Cys, Ala, ou Gly.
Em certas concretizações o resíduo de ami- noácido que é mais hidrofílico é selecionado do grupo que consiste em Thr, Ser, Lys, GIn, Asn, His, Glu, Asp, e Arg.
Em certas concretizações o resíduo de aminoácido que é mais hidrofílico é um aminoácido incomum, não natural ou modificado.
Em certas concretizações o resíduo de aminoácido que é mais hidrofílico é determinado de acordo com escala de hidrofobicidade de Black e Mould.
Em certas concretizações pelo menos dois resíduos de ami-
noácidos dentro da região de ligação de macromolécula são substituídos.
Em certas concretizações pelo menos três resíduos de aminoácidos dentro da região de ligação de macromolécula são substituídos.
Em certas concre- tizações pelo menos um resíduo é substituído dentro de mais do que uma dasregiões propensas à agregação dentro da proteína.
Em certas concreti- zações a região propensa à agregação é identificada de acordo com o mé- todo de qualquer um dos aspectos precedentes para a identificação de uma região propensa à agregação na proteína.
Em certas concretizações que podem ser combinadas com as concretizações precedentes, a macromolé- culaé uma outra proteína, um polinucleotídeo ou um polissacarídeo.
Em cer- tas concretizações que podem ser combinadas com as concretizações pre- cedentes, a proteína é selecionada do grupo que consiste em um anticorpo, um fragmento de Fab, um fragmento de Fab”, um fragmento de Fd, um fragmento de Fv, um fragmento de F(ab'),, e um fragmento de Fc.
Em certas concretizações que podem ser combinadas com as concretizações prece- dentes, a proteína é uma citocina, uma quimiocina, uma lipocina, uma mioci- na, um neurotransmissor, uma neurotrofina, uma interleucina, ou um interfe- ron.
Em certas concretizações que podem ser combinadas com as concreti- zações precedentes, a proteína é um hormônio ou um fator de crescimento.
Em certas concretizações a macromolécula é um receptor de hormônio ou receptor de fator de crescimento.
Em certas concretizações a proteína é um receptor ou um domínio de receptor.
Em certas concretizações a macromo- lécula é um agonista de receptor ou um antagonista de receptor do receptor ou domínio de receptor.
Em certas concretizações que podem ser combina- dascom as concretizações precedentes, a proteína é um neurotransmissor ou neurotrofina.
Em certas concretizações a macromolécula é um receptor de neurotransmissor ou receptor de neurotrofina.
Em algumas concretizações, a invenção ulteriormente refere-se a código de computador para a determinação de SAP de acordo com os mé- todos da invenção.
Em outras concretizações, a invenção refere-se a um computador, a supercomputador, ou agrupamentos de computadores dedi- cado a realizar os métodos da invenção.
Em ainda outro aspecto, a invenção provê um serviço com base na web, com base no servidor, ou com base na internet para a determinação de regiões propensas à agregação na proteína, o serviço compreendendo aceitação de dados sobre uma proteína (por e- xemplo, o modelo estrutural de proteína) a partir de um usuário (por exem- plo, sobre a internet) ou recuperação de tais dados a partir de uma base de dados tal que o provedor de serviço pode gerar, recuperar, ou acessar uma estrutura estática da proteína, opcionalmente incluindo modelagem da dinãâ- mica molecular da proteína para prover uma estrutura dinâmica da proteína, determinação de SAP para átomos ou resíduos da proteína com base na estrutura estática ou dinâmica assim gerado, e retorno dos dados de SAP, por exemplo, quando um modelo estrutural mapeado com os ditos dados de SAP pelo provedor de serviço, para um usuário. Em algumas concretiza- ções, o usuário é uma pessoa. Em outras concretizações o usuário é um sistema de computador ou algoritmo de computador automatizado.
. 15 Em algumas concretizações a presente invenção provê um sis- tema de cálculo de SAP compreendendo: um servidor de web para a provi- são de um serviço de web para o cálculo SAP para um usuário terminal atra- í vés da Internet; uma base de dados para a armazenagem da informação geral no método de cálculo, hidrofobicidade de aminoácido, etc., e um servi- dorde cálculo para a realização de um cálculo de SAP com base na infor- mação na base de dados e informação provida ou transmitida através da internet pelo usuário.
Em algumas concretizações, o servidor de web e o servidor de cálculo são um mesmo sistema de computador. Em algumas concretizações osistema de computador é um supercomputador, um agrupamento de com- putador, ou uma única estação de trabalho ou servidor.
Em uma concretização relacionada o servidor de web de um sis- tema de cálculo de SAP ulteriormente compreende um controlador para o controle da operação total, uma unidade de ligação de rede para a ligação à Internet, e uma unidade de serviço de web para a provisão de um serviço de web para o cálculo SAP para o usuário terminal ligado através da Internet. Além disso, concretizações da presente invenção ulteriormente referem-se a produtos de armazenagem no computador com um meio legí- vel no computador que contêm código de programa para a realização de várias operações implementadas por computador, por exemplo, cálculo da SAP para um modelo estrutural, cálculo de SAA, cálculo de SAA eficaz, ma- nipulação de modelos estruturais, implementação de simulações dinâmicas moleculares, organização e armazenagem de dados relevantes, ou realiza- ção de outras operações descritas aqui.
O meio legível no computador é qualquer um dispositivo de armazenagem de dados que pode armazenar dados que podem depois disso ser lidos por um sistema de computador.
E- xemplos de meio legível no computador incluem, mas não são limitados a discos rígidos, discos flexíveis, drives rápidos ("flash"), discos óticos (por exemplo, CDs, DVDs, HD-DVDs, discos de Blu-Ray, etc.) e dispositivos de disco rígido especialmente configurados tais como circuitos integrados de aplicação-específicos (ASICs) ou dispostivos lógicos programáveis (PLDs). O meio legível no computador pode também ser distribuído como sinal de dados expressos no transportador sobre uma rede de sistema de computa- dores acoplado de modo que código legível no computador seja armazenado | e executado em uma forma distribuída.
Será apreciado por aqueles versados na técnica que os elementos de hardware e software descritos acima são de projeto e construção-padrão.
As concretizações relacionadas com computa- dor, internet, servidor, e serviço descritas acima podem ulteriormente se a- plicar à SAA e à SAA eficaz bem como SAP.
Ill.
Composições farmacêuticas contendo peptídeos e variantes de peptídeo da invenção Em um outro aspecto, a presente invenção provê uma composi- ção, por exemplo, uma composição farmacêutica, contendo uma ou mais variantes de proteína produzidas pelos métodos da invenção, formulada jun- tamente com um veículo farmaceuticamente aceitável.
Composições farma- cêuticas da invenção também podem ser administradas em terapia de com- binação, isto é, combinadas com outros agentes.
Por exemplo, a terapia de combinação pode incluir uma proteína da presente invenção combinada com pelo menos um outro agente anticâncer.
Como usado aqui, "veículo farmaceuticamente aceitável" inclui qualquer um de e todos os solventes, meio de dispersão, revestimentos, a- gentes antibacterianos e antifúngicos, agentes de atraso de absorção e iso- tônicos, e similares que são fisiologicamente compatíveis. De preferência, o veículo é adequado para administração intravenosa, intramuscular, subcutã- nea, parenteral, espinhal ou epidérmica (por exemplo, por injeção e infusão). Dependendo da rota de administração, do composto ativo, isto é, uma prote- Ína ou sua variante da invenção, pode ser revestido em um material para proteger o composto da ação de ácidos e de outras condições naturais que podem inativaro composto.
Os compostos farmacêuticos da invenção podem incluir um ou mais sais farmaceuticamente aceitáveis. Um "sal farmaceuticamente aceitá- vel" refere-se a um sal que retém a atividade biológica desejada do compos- to de origem e não inclui do composto de origem e não provê quaisquer efei- Ã 15 tos toxicológicos indesejáveis (vide por exemplo, Berge, S.M., e outros (1977) J. Pharm. Sci. 66:1-19). Exemplos de tais sais incluem sais de adição de ácido e sais de adição de base. Sais de adição de ácido incluem aqueles derivados de ácidos inorgânicos não tóxicos, tais como clorídrico, nítrico, - fosfórico, sulfúrico, bromídrico, iodídrico, fosforoso e similares, bem como de ácidos orgânicos não tóxicos tais como ácidos mono- e dicarboxílicos alifáti- cos, ácidos alcanoicos fenil-substituídos, ácidos hidróxi alcanoicos, ácidos aromáticos, ácidos sulfônicos alifáticos ou aromáticos e similares. Sais de adição de base incluem aqueles derivados de metais alcalinoterrosos, tais como sódio, potássio, magnésio, cálcio e similares, bem como de aminas orgânicas não tóxicas, tais como N N'-dibenziletilenodiaminay, N- metilglucamina, cloroprocaína, colina, dietanolamina, etilenodiamina, procaí- na e similares.
Uma composição farmacêutica da invenção também pode incluir um antioxidante farmaceuticamente aceitável. Exemplos de antioxidantes farmaceuticamente aceitáveis incluem: (1) antioxidantes solúveis em água, tais como ácido ascórbico, cisteína, cloridrato, bissulfato de sódio, metabis- sulfeto de sódio, sulfeto de sódio e similares; (2) oxidantes solúveis em óleo,
tais como palmitato de ascorbila, hidroxianisol butilado (BHA), hidroxitolueno butilado (BHT), lecitina, galato de propila, alfa-tocoferol, e similares; e (3) agentes de quelação de metal, tais como ácido cítrico, ácido etilenodiamina tetra- acético (EDTA), sorbitol, ácido tartárico, ácido fosfórico, e similares.
Exemplos de veículos aquosos e não aquosos adequados que podem ser empregados nas composições farmacêuticas da invenção inclu- em água, etanol, polióis (tais como glicerol, propileno glicol, polietileno glicol, e similares), e suas misturas adequadas, óleos vegetais, tal como óleo de oliva, e ésteres orgânicos injetáveis, tal como oleato de etila. Fluidez ade- quada pode ser mantida, por exemplo, pelo uso de materiais de revestimen- to, tal como lecitina, pela manutenção do tamanho de partícula exigida no caso de dispersões, e pelo uso de tensoativos.
Essas composições podem também conter auxiliares tais como preservativos, agentes de umectação, agentes de emulsificação e agentes h 15 de dispersão. Prevenção da presença de micro-organismos pode ser asse- : gurada tanto por procedimentos de esterilização, quanto por inclusão de vá- rios agentes antibacterianos e antifúngico, por exemplo, parabeno, clorobu- tanol, ácido fenol sórbico, e similares. Pode também ser desejável incluir agentes isotônicos, tais como açúcares, cloreto de sódio, e similares nas composições. Além disso, absorção prolongada da forma farmacêutica inje- tável pode ser realizada pela inclusão de agentes que atrasam a absorção tais como monoestearato de alumínio e gelatina.
Veículos farmaceuticamente aceitáveis incluem soluções ou dis- persões aquosas estéreis e pós estéreis para a preparação extemporânea das soluções ou dispersão injetáveis. O uso de tais meio e agentes para substâncias farmaceuticamente aceitáveis é conhecido na técnica. Exceto à medida em que qualquer meio ou agente convencional seja incompatível com o composto ativo, seu uso nas composições farmacêuticas da invenção seja contemplado. Compostos ativos suplementares podem também ser in- corporados nas composições.
Formulações exemplares compreendem pelo menos uma varian- te de proteína da invenção e podem compreender concentrações muito bai-
xas de agentes de estabilização (ou desagregação) que podem, além dos métodos descritos aqui, ser usados para prevenir ou diminuir agregação de uma proteína. Correspondentemente, métodos convencionais usados para prevenir agregação podem ser empregados no desenvolvimento das com- posições farmacêuticas contendo variantes de proteína produzidas pelos métodos da presente invenção. Por exemplo, uma variedade de compostos de estabilização e desagregação pode ser incluída nas composições farma- cêuticas da invenção dependendo do seu uso pretendido e de sua toxicidade biológica. Tais compostos de estabilização podem incluir, por exemplo, ci- clodextrinae seus derivados (a patente U.S. No. 5730969), composições de alquilglicosídeos (o pedido de patente U.S. No. 11/474.049), o uso de molé- culas de chaperona (por exemplo, LEA (Goyal e outros, Biochem J. 2005, 388(Pt 1):151-7; os métodos da patente U.S. No. 5688651), compostos de betaína (Xiao, Burn, Tolbert, Bioconjug Chem. 2008 May 23), tensoativos (por exemplo, Pluronic F127, Pluronic F68, Tween 20 (Wei e outros Interna- tional Journal of Pharmaceutics. 2007, 338(1-2):125-132)), e os métodos descritos nas patentes U.S. Nos. 5696090, 5688651, e 6420122 que são ' incorporadas aqui por referência.
Formulações exemplares também compreendem uma variante de proteína da invenção que exibe uma tendência alterada para a interação com um par de ligação juntamente com um transportador, auxiliar e/ou exci- piente farmaceuticamente aceitável. Além disso, proteínas, e em particular anticorpos, são estabiliza- dos em formulações usando-se combinações de diferentes classes de exci- pientes, por exemplo, (1) dissacarídeos (por exemplo Sacarose, Trealose) ou polióis (por exemplo Sorbitol, Manitol) agem como estabilizadores pela exclusão preferencial e são também capazes de agir como crioprotetores durante a liofilização, (2) tensoativos (por exemplo Polysorbat 80, Polysorbat 20) agem por minimização de interações de proteínas nas interfaces como líquido/gelo, líquido/superfície de material e/ou interfaces de líquido/ar e (3) tampões (por exemplo fosfato-, citrato-, histidina) auxiliam a controlar e man- ter o pH da formulação. Correspondentemente, tais dissacarídeos polióis,
tensoativos e tampões podem ser usados além dos métodos da presente invenção para ulteriormente estabilizar proteínas e prevenir sua agregação.
Composições terapêuticas tipicamente devem ser estéreis e es- táveis sob as condições de fabricação e armazenagem.
A composição pode ser formulada como uma solução, microemulsão, lipossoma, ou outra estru- tura ordenada adequada para dar alta concentração de fármaco.
O veículo pode ser um meio de dispersão ou solvente contendo, por exemplo, água, etanol, poliol (por exemplo, glicerol, propileno glicol, e polietileno glicol líqui- do, e similares), e suas misturas adequadas.
A fluidez apropriada pode ser mantida, por exemplo, pelo uso de um revestimento tal como lecitina, pela manutenção do tamanho de partícula exigido no caso de dispersão e pelo uso de tensoativos.
Em muitos casos, será preferível incluir agentes isotôni- cos, por exemplo, açúcares, polialcoóis tal como manitol, sorbitol, ou cloreto de sódio na composição.
Absorção prolongada das composições injetáveis pode ser realizada por inclusão na composição de um agente que atrase absorção, por exemplo, sais de monoestearato e gelatina.
Soluções injetáveis estéreis podem ser preparadas por incorpo- ração do composto ativo na quantidade exigida em um solvente apropriado : com um ou uma combinação de ingredientes enumerados acima, quando exigido, seguido por microfiltração por esterilização.
Em geral, dispersões são preparadas por incorporação do composto ativo em um veículo estéril que contém um meio de dispersão básico e os outros ingredientes exigidos oriundos daqueles enumerados acima.
No caso de pós estéreis para a pre- paração de soluções injetáveis estéreis, os métodos preferidos de prepara- ção são secagem a vácuo e secagem por congelamento (liofilização) que fornecem um pó do ingrediente ativo mais qualquer ingrediente desejado adicional a partir de sua solução anteriormente filtrada estéril.
A quantidade de ingrediente ativo que pode ser combinada com um material de veículo para produzir uma forma de dosagem única variará dependendo do indivíduo a ser tratado, e do modo particular de administra- ção.
A quantidade de ingrediente ativo que pode ser combinada com um ma- terial de veículo para produzir uma forma de dosagem única em geral será aquela quantidade da composição que produz um efeito terapêutico. Em ge- ral, fora de cem por cento, essa quantidade variará de cerca de 0,01 por cento a cerca de noventa e nove por cento de ingrediente ativo, de preferên- cia de cerca de 0,1 por cento a cerca de 70 por cento, mais de preferência de cercade 1 por cento a cerca de 30 por cento de ingrediente ativo na combinação com um veículo farmaceuticamente aceitável.
Regimes de dosagem são ajustados para prover a ótima respos- ta desejada (por exemplo, uma resposta terapêutica). Por exemplo, um único bolus pode ser administrado, várias doses divididas podem ser administra- das durante um tempo ou a dose pode ser proporcionalmente reduzida ou diminuída como indicada pelas exigências da situação terapêutica. É espe- cialmente vantajoso formular composições parenterais na forma unitária de dosagem para facilidade de administração e uniformidade de dosagem. Forma unitária de dosagem como usada aqui refere-se a unidades fisica-
15. mente discretas adequadas como dosagens unitárias para os indivíduos a serem tratados; cada unidade contém uma quantidade predeterminada do composto ativo calculada para produzir o efeito terapêutico desejado em as- sociação com o veículo farmacêutico adequado. A especificação para as formas unitárias de dosagem da invenção são ditadas por e diretamente de- pendente (a) das únicas características do composto ativo e do efeito tera- pêutico particular a ser alcançado e (b) das limitações inerentes da técnica de combinação de tal composto ativo para o tratamento de sensibilidade nos indivíduos.
Para a administração da proteína, a dosagem varia de cerca de —0,0001a100 mg/kg, e mais usualmente de 0,01 a 5 mg/kg do peso de corpo do hospedeiro. Por exemplo, dosagens podem ter de 0,3 mg/kg de peso de corpo, de 1 mg/kg de peso de corpo, de 3 mg/kg de peso de corpo, de 5 mg/kg de peso de corpo ou de 10 mg/kg de peso de corpo ou dentro da faixa de 1-10 mg/kg. Um regime de tratamento exemplar vincula administração uma vez porsemana, uma vez a cada duas semanas, uma vez a cada três semanas, uma vez a cada quatro semanas, uma vez por mês, uma vez a cada 3 meses ou uma vez a cada três a 6 meses. Regimes preferidos de dosagem para uma proteína da invenção incluem 1 mg/kg de peso de corpo ou de 3 mg/kg de peso de corpo via administração intravenosa, com o anti- corpo sendo dado usando-se uma das seguintes escalas de administração dosada: (i) a cada quatro semanas para seis dosagens, então a cada três meses; (ii) acada três semanas; (iii) de 3 mg/kg de peso de corpo uma vez seguido por 1 mg/kg de peso de corpo a cada três semanas. Alternativamente uma proteína da invenção pode ser adminis- trada como uma formulação de liberação sustentada, caso esse em que ad- ministração menos frequente é exigido. Dosagem e frequência variam de- pendendo da meia-vida da substância administrada no paciente. Em geral, anticorpos de ser humano mostram a meia-vida mais longa por anticorpos humanizados, anticorpos quiméricos, e anticorpos de não ser humano. À dosagem e a frequência de administração podem variar dependendo de se o tratamento é profilático ou terapêutico. Em aplicações profiláticas, uma do- sagem relativamente baixa é administrada em intervalos relativamente infre- J quentes durante um período de tempo longo. Alguns pacientes continuam a receber tratamento para o resto de suas vidas. Em aplicações terapêuticas, uma dosagem relativamente alta em intervalos relativamente curtos é algu- mas vezes necessários até que a progressão da doença seja reduzida ou seja terminada, e de preferência até que o paciente mostre melhoramento parcial ou completo de sintomas da doença. Depois disso, ao paciente pode ser administrado um regime profilático.
Níveis de dosagem reais dos ingredientes ativos nas composi- ções farmacêuticas da presente invenção podem ser variados de modo a se obter uma quantidade do ingrediente ativo que seja eficaz para alcançar a resposta terapêutica desejada para um paciente particular, composição, e modo de administração, sem ser tóxico para o paciente. O nível de dosagem selecionado dependerá de uma variedade de fatores farmacocinéticos inclu- indo a atividade das composições particulares da presente invenção empre- gada,ouda sua amida, sal ou éster, da rota de administração, do tempo de administração, da taxa de excreção do composto particular a ser emprega- da, da duração do tratamento, de outros fármacos, de compostos e/ou mate-
riais usados na combinação com as composições particulares empregados, da idade, do sexo, do peso, da condição, da saúde geral e do histórico mé- dico anterior do paciente a ser tratado, e como fatores bem-conhecidos nas técnicas médicas.
Uma "dosagem terapeuticamente eficaz" da proteína da inven- ção de preferência resulta em uma diminuição na severidade dos sintomas da doença, um aumento na frequência e duração de períodos livres de sin- toma da doença, ou uma prevenção de dano ou incapacidade devido à afli- ção da doença. Por exemplo, para o tratamento de tumores, uma "dosagem terapeuticamente eficaz" de preferência inibe o crescimento de célula ou crescimento de tumor por pelo menos cerca de 20%, mais de preferência por pelo menos cerca de 40%, ainda mais de preferência por pelo menos cerca de 60%, e ainda com mais preferência por pelo menos cerca de 80% em relação aos indivíduos não tratados. A capacidade de um composto de inibir crescimento de tumor pode ser avaliada em uma previsão de sistema de modelo de animal da eficácia nos tumores de ser humano. Alternativamente, essa propriedade de uma composição pode ser avaliada por exame da ca- pacidade do composto de inibir, tal inibição in vitro por ensaios conhecidos pelo versado praticante. Uma quantidade terapeuticamente eficaz de um composto terapêutico pode diminuir o tamanho de tumor, ou de outra manei- ra melhorar os sintomas em um indivíduo. Aquele versado comum na técnica seria capaz de determinar tais quantidades com base em tais fatores como o tamanho do indivíduo, a severidade dos sintomas do indivíduo, e a composi- ção particular ou rota de administração selecionada.
Uma composição da presente invenção pode ser administrada via uma ou mais rotas de administração usando-se uma ou mais de uma variedade de métodos conhecidos na técnica. Como será apreciado pelo versado na técnica, a rota e/ou o modo de administração variarão depen- dendo dos resultados desejados. Rotas de administração preferidas para as porções de ligação da invenção incluem rotas intravenosa, intramuscular, intradérmica, intraperitoneal, subcutânea, espinhal ou outras rotas parenteral de administração, por exemplo, por injeção ou infusão. A frase "administra-
ção parenteral" como usada aqui significa modos de administração outros que não administração enteral e tópica, usualmente por injeção, e inclui, sem limitação, injeção ou infusão intravenosa, intramuscular, intra-arterial, intrate- cal, intracapsular, intraorbital, intracardíaca, intradérmica, intraperitoneal, transtraqueal, subcutânea, subcuticular, intra-articular, subcapsular, suba- racnoide, intraespinhal, epidural e intraesternal.
Alternativamente, proteína da invenção pode ser administrada via uma rota não parenteral, tal como rota tópica, epidérmica ou mucosal de administração, por exemplo, intranasalmente, oralmente, vaginalmente, re- talmente, sublingualmente ou topicamente.
Os compostos ativos podem ser preparados com veículos que protegerão o composto contra liberação rápida, tal como uma formulação de liberação controlada, incluindo implantes, emplastros transdérmicos, e sis- temas de fornecimento microencapsuladas. Polímeros biocompatíveis, bio- —degradáveis podem ser usados, tais como acetato de vinil etileno, polianidri- dos, ácido poliglicólico, colágeno, poliortoésteres, e ácido poliláctico. Muitos métodos para a preparação de tais formulações são patenteados ou em ge- ral conhecidos por aqueles versados na técnica. Vide, por exemplo, Sustai- ned and Controlled Release Drug Delivery Systems, J.R. Robinson, ed., Marcel Dekker, Inc., New York, 1978.
Composições terapêuticas podem ser administradas com dispo- sitivos médicos conhecidos na técnica. Por exemplo, em uma concretização preferida, uma composição terapêutica da invenção pode ser administrada com um dispositivo de injeção hipodérmica sem agulha, tais como os dispo- sitivos descritos nas Patentes U.S. Nos. 5.399.163; 5.383.851; 5.312.335;
5.064.413; 4.941.880; 4.790.824; ou 4.596.556. Exemplos de implantes e módulos bem-conhecidos úteis na presente invenção incluem: a patente de . U.S. no. 4.487.603, que descreve uma bomba de microinfusão implantável para a distribuição da medicação em uma taxa controlada; a patente de U.S.
no. 4.486.194, que descreve um dispositivo terapêutico para a administração de medicamentos através da pele; a patente de U.S. no. 4.447.233, que descreve uma bomba de infusão de medicamento para o fornecimento de medicação em uma taxa de infusão exata; a patente de U.S. no. 4.447.224, que descreve um aparelho de infusão implantável de fluxo variável para o fornecimento de fármaco contínuo; a patente de U.S. no. 4.439.196, que descreve um sistema de fornecimento de fármaco osmótico tendo comparti- mentos de múltiplas câmaras; e a patente de U.S. no. 4.475.196, que des- creve um sistema de fornecimento de fármaco osmótico. Essas patentes são incorporadas aqui por referência. Muitos outros tais implantes, sistemas de fornecimento e módulos são conhecidos por aqueles versados na técnica.
EXEMPLOS Introdução dos Exemplos Técnicas de simulação moleculares para a previsão de regiões propensas à agregação e estudo do mecanismo de agregação principalmen- te empregaram modelos de simulação comparativamente simples (Ma e Nussinov. Curr. Opin. Chem. Biol. 2006, 10, 445-452; Cellmer, e outros, TRENDS in Biotechnology 2007, 25(6), 254) ao contrário dos modelos ato- místicos detalhados que podem ser empregados na presente invenção. À menor parcela detalhada dos modelos de simulação empregados era o mo- delo de rede, que foi usada nos numerosos estudos de agregação de proteí- na (Harrison e outros J. MoL Biol. 1999, 286,593-606; Dima and Thirumalai. Proteína Sci. 2002, 11, 1036-1049; Leonhard e outros Proteína Sci. 2004, 13, 358-369; Patro and Przybycien. Biophys. J. 1994, 66, 1274-1289; Patro and Przybycien. Biophys. J. 1996, 70, 2888-2902; Broglia e outrosProc. Natl. Acad. Sci. U.S.A. 1998,95, 12930-12933; Istrail e outros Comput. Biol. 1999, 6, 143-162; Giugliarelli e outros Chem. Phys. 2000, 113, 5072-5077; Bratko e outrosJ. Chem. Phys. 2001, 114,561-569; Bratko and Blanch J. Chem. Phys. 2003, 118, 5185-5194; Combe and Frenkel Chem. Phys. 2003, 118, 9015- 9022; Toma and Toma. Biomacromoléculas 2000, 1, 232-238; Gupta e outros Proteína Sci. 1998, 7, 2642-2652; and Nguyen and Hall Biotechnol. Bioeng. 2002, 80, 823-834). Aqui cada resíduo é apresentado como uma conta que — ocupa um único sítio em uma rede tridimensional. Por causa de sua simplici- dade, o modelo de rede é menos computacionalmente exigente e foi usado para estimular grandes sistemas por escalas de tempo longo. Embora esses modelos de rede provejam discernimento na agregação de proteína subja- cente de física básica, eles não exatamente representam a estrutura secun- dária e terciária, e não podem adequadamente representar diferentes intera- ções de nível atomístico tal como ligação de hidrogênio.
Um modelo mais detalhado em comparação com o modelo de rede é o modelo de resolução intermediária em que poucos átomos são u- sualmente combinados em uma única conta, e pseudoligações são algumas vezes introduzidas para manter os ângulos de ligação da cadeia principal e estados de isomerização (Smith and Hall, Mol. Biol. 2001, 312, 187-202; Smith and Hall. Proteínas: Struct., Funct., Genet. 2001, 44, 344-360; Smith and Hall. Proteínas: Struct., Funct., Genet. 2001, 44, 376-391; Nguyen, e outros, Proteína Sci. 2004, 13, 2909-2924; Nguyen and Hall, Proc. Natl. A- cad. Sci. U.S.A., 2004, 101(46), 16180-16185; Nguyen and Hall. J. Am. Chem. Soc., 2006, 128, 1890-1901; Jang, e outros, Biophys. J. 2004, 86, 31- ' 15 49; Jang, e outros, Proteína Sci. 2004, 13, 40-53). Esse modelo foi usado com sucesso para estimular a formação de fibrilas a partir de sistemas con- tendo entre 12 e 96 peptídeos de polialanina (16 resíduos cada) partindo de um estado aleatório (Nguyen and Hall, Proc. Natl. Acad. Sci. U.S.A., 2004, 101(46), 16180 -16185; Nguyen and Hall, J. Am. Chem. Soc., 2006, 128, 1890-1901). Dokholyan e cotrabalhadores aplicavam tal modelo para estudar a formação de estrutura de folha B fibrilar por oito proteínas de domínio de Src SH3 do modelo (Ding, e outros, Mol. Biol. 2002, 324, 851-857) ou por 28 peptídeos de modelo AB (1-40) (Peng, e outros, Phys. ReV. E: Stat. Phinter- discip. Top. 2004, 69, 41908-41914.).
Ao contrário dos modelos mais simples, modelos atomísticos in- cluem todos os detalhes atomísticos tal como ligação de hidrogênio e são assim mais exatos do que a rede ou os modelos de resolução intermediária. Tais modelos atomísticos foram usados ou com um solvente explícito, ou com um solvente implícito onde o solvente é tratado como uma série contí- nua. O modelo explícito é mais exato do que o modelo implícito, mas é tam- bém mais computacionalmente exigente. Tal modelo atomístico com solven- te implícito foi usado para estudar os estágios anteriores de agregação do heptapeptíideo GNNQQNY (SEQ ID NO: 1), que é uma parte da proteína de levedura Sup35 (Gsponer, e outros, Proc.
Natl.
Acad.
Sci.
U.S.A. 2003, 100, 5154-5159.). Um modelo similar foi usado para a agregação de peptídeo amiloide de Ab16-22 (KLVFFAE (SEQ ID NO: 2)) em folhas b antiparalelas (Klimov and Thirumalai, Structure 2003, 11, 295-307). Dokholyan e cotraba- lhadores (Khare, e outros, Proteínas. 2005, 61 , 617-632.) usavam um mode- lo atomístico explícito para investigar tendência à agregação ordenada ao longo da sequência da dismutase de superóxido (SOD1) de Cu, Zn da enzi- ma . Eles decompuseram a sequência de SOD1 em heptapeptídeos de so- breposição e realizaram um grande número de simulações da dinâmica mo- lecular em água explícitas (cada uma de 0,5 ns) de segmentos monomérico, dimérico e tetramérico.
Com isso eles identificaram as regiões amiloidogêni- cas na sequência de SOD1 a ser: as duas terminais, as fitas B 4 e 7, e os dois laços entrelaçados.
Um protocolo de simulação da dinâmica molecular similar foi de- senvolvida para se obter a informação estrutural na agregação de B ordena- da de polipeptídeos amiloidogênico (Cecchini e outros, J Mol Biol. 2006, 357, i 1306-1321.). O procedimento é com base na resolução da cadeia de poli- peptídeo em segmentos de sobreposição e simulações da dinâmica (MD) moleculares em equilíbrio de um pequeno número de cópias de cada seg- mento.
A tendência à agregação de B ao longo da sequência do peptídeo de AB AB (142) de Alzheimer demonstrou ser altamente heterogênea com um máximo no segmento V.2HHQKLVFFAA,, (SEQ ID NO: 3) e um mínimo nos quatro dipeptídeos similares a giro.
Usando-se essa técnica, a mudança pre- vistana tendência à agregação de um mutante de ponto duplo do domínio N-terminal do priônio de levedura Ura2p foi verificado in vitro usando-se um ensaio de ligação de tioflavina T.
Tal procedimento para decompor a cadeia de polipeptídeo em segmentos de sobreposição seria extremamente desafi- ante para sistemas tais como anticorpos por causa de seu vasto tamanho.
Ainda uma simulação atomística de um único anticorpo total no solvente ex- plícito é uma exigência muito computacional por causa do vasto tamanho de um anticorpo.
Portanto, não parece existir simulação atomística de anticorpo total na literatura.
No entanto, têm havido simulações atomísticas de partes pe- quenas do anticorpo, principalmente para o fragmento de Fab (Noon, e ou- tros, PNAS. 2002, 99, 6466; Sinha and Smith-Gill, Cell Biochemistry and Bi- ophysics. 2005, 43,253). No trabalho atual, simulações atomísticas de uma molécula de anticorpo inteira com um solvente explícito foram realizadas. Com base nessas simulações, as regiões propensas à agregação no anti- corpo foram identificadas usando-se o parâmetro de 'Tendência à agregação espacial' descrito aqui. Essas regiões propensas à agregação foram então transformadas para projetar anticorpos com estabilidade aumentada. Os E- xemplos descritos aqui se referem a concretizações particulares da inven- ção.
Exemplo 1: Metodologia Da Simulação De Dinâmica Molecular Simulações dinâmicas moleculares foram realizadas para um anticorpo inteiro usando-se uma totalidade de modelo de átomo. A estrutura inicial para a simulação para o anticorpo inteiro foi obtida a partir das estrutu- ras de raios X dos fragmentos de Fab e Fc individuais. A estrutura de raios X de um fragmento de Fab de comprovação de conceito (POC) foi selecionada por modelagem sobre a estrutura de raios X de Fc obtida a partir do anticor- podelgGl1HZH (Saphire e outros, Science. 2001, 293, 1155). 1HZH foi es- colhido uma vez que a estrutura de raios X é conhecida para o anticorpo in- teiro e uma vez que a estrutura de Fc é a mesma para a totalidade da classe de IgGI de anticorpos. A estrutura de um anticorpo de POC inteiro foi então obtida por alinhamento dos fragmentos de Fab e Fc usando-se a estrutura de1HZHcomo um molde de modelo. A fim de alinhar os fragmentos na dis- tância e orientação corretas, o RMSD (Desvio de Quadrado Médio de Raiz) foi minimizado entre os resíduos de CYS comuns dos fragmentos e o mode- lo de anticorpo inteiro (1HZH). Os resíduos de CYS foram escolhidos uma vez que cada domínio de anticorpo (cHl, cH2 etc.) contém uma ligação de dissulfeto, e assim resíduos de CYS são amplamente distribuídos através da estrutura de anticorpo. A estrutura de anticorpo inteiro resultante foi então usada para realizar simulações de átomo explícitas para 30ns. Um padrão de glicosilação de GO foi usado para as simulações uma vez que isso é o padrão de glicolisação mais comum observadas nos anticorpos. O pacote de estimulação de CHARMM (Brooks e outros J. Com- put. Chem., 1983,4, 187) foi usado para arranjo e análise, e o pacote de NAMD (Phillips e outros Journal of Computational Chemistry. 2005, 26, 1781) para a realização de simulações. O campo de força atomística inteiro de CHARMM (MackKerell e outros J. Phys Chem. B. 1998, 102, 3586) foi u- sado para uma proteína e modelo de solvente de TIP3P (Jorgensen e outros J. Chem. Phys., 1983, 79, 926) para água. As simulações foram realizadas a 298Ke1atm no conjunto de NPT. Os parâmetros para os grupos de açúcar envolvidos na glicolisação do fragmento de Fc foram divididos a serem con- sistentes com o campo de força de CHARMM, seguindo do campo de força de CSFF (Kuttel e outros J. Comput. Chem., 2002, 23, 1236). Os estados de protonação de resíduos de Histidina de um pH 7 foram escolhidos com base ó 15 na proximidade espacial de grupos eletro-negativos. O anticorpo inteiro foi separado em uma caixa ortorrômbica uma vez que essa minimiza o número de moléculas de água exigido e assim minimiza o tempo computacional.
Condições de limite periódicas foram usadas em todas as 3 direções. Um õ revestimento de solvação de água de 8 À foi usado em cada direção da cai- xa ortorrôômbica. O tamanho de sistema total resultante era de 202130 áto- mos. Íons suficientes foram adicionados para neutralizar a carga total do sis- tema. A neutralidade de carga é exigida pela técnica de soma de Ewald em- pregada para calcular a contribuição de interações eletroestáticas no siste- ma.
Depois que o anticorpo foi solvatado, a energia foi inicialmente minimizada com SD (Steepest Descents) por fixação da proteína para permi- tir que a água diminua a tensão em volta da proteína. Então os obstáculos foram removidos e a estrutura foi ulteriormente minimizada com SD e ABNR (Newton-Raphson de Base Adotada). O sistema foi então lentamente aque- cido para a temperatura ambiente com aumento de 5ºC a cada 0,5 ps usan- do-se uma etapa de menos tempo. O sistema foi então equilibrado para ins antes das propriedades de computação de interesse oriundas da simulação.
As configurações foram protegidas a cada 0,1 ps durante a simulação para outra análise estatística. Exemplo 2: Cálculo da tendência à agregação espacial (SAP) A fim de superar as deficiências de SAA, um novo parâmetro foi definido chamado Tendência à agregação espacial' como descrito acima.
Nesse exemplo a 'Tendência à agregação espacial" foi calculado para regiões esferoidais com raio R centrado em cada átomo no anticorpo descrito no Exemplo 1. O valor de Tendência à agregação espacial foi assim avaliado com uma média de simulação de 30 ns para o fragmento de Fc do anticorpo para dois raios diferentes de placas (R = 5 À, 10 À) (Aquele versa- do na técnica apreciará várias etapas de tempo para a simulação que pode ser escolhida de acordo com os recursos computacionais disponíveis e a resolução desejada do resultado). Em ambos os casos foi observado que a maioria dos valores eram negativos, indicando que regiões mais expostas são hidrofílicas. Isso era como esperado uma vez que a maior parte da su- h perfície de proteína exposta é usualmente hidrofílica. Foi também observado que há poucas regiões com picos positivos para a Tendência à agregação espacial indicando alta hidrofobicidade exposta. Indo dos raios inferiores de placas (5À) até os raios superiores (10À) eliminam alguns picos, enquanto que alguns outros picos são aumentados. Alguns picos foram eliminados uma vez que nessas regiões uma placa hidrofóbica pequena (com menos do que raio de 5 À) está envolvida por placas hidrofílicas; assim, tirando a mé- dia sobre 10 À leva a uma diminuição eficaz na hidrofobicidade para a regi- ão. Enquanto que em algumas outras regiões a Tendência à agregação es- pacialaR=10À é aumentada por causa de placas hidrofóbicas envolvendo uma placa hidrofóbica similar.
Acima, a Tendência à agregação espacial foi calculada como uma média durante a experiência de simulação de 30 ns. Os resultados cal- culados usando-se a simulação foram comparados com a Tendência à agre- gação espacial de exatamente a estrutura de raios X, sem simulação mole- cular. A Tendência à agregação espacial (raios X) era similar àquela do valor médio de simulação, tendo picos nas mesmas localizações mas com essas diferenças na magnitude dos picos.
As diferenças eram mais altas com o raio mais largo da placa, R = 10 À.
Isso é provável uma vez que as diferen- ças são aditivas quando olhando nos tamanhos de placa grandes.
Essas diferenças surgem devido à mudança da exposição de superfície dos resí- duos na experiência de simulação dinâmica.
No entanto, essa comparação mostra que uma boa estimativa inicial de Tendência à agregação espacial, especialmente para raio pequeno de placa R, pode ser obtida a partir da própria estrutura de raios X.
Os valores de Tendência à agregação espacial oriundos da si- mulaçãoparaR=5Àe10 À foram mapeados sobre a estrutura de anticor- po.
Em ambos os casos, a superfície de anticorpo foi colorida de acordo com os valores da Tendência à agregação espacial.
Valores positivos de Ten- dência à agregação espacial (hidrofóbicos) são mostrados em cinza ou preto enquanto valores negativos (hidrofílicos) são em cinza mais claro ou branco.
Ú 15 A intensidade de cor é proporcional à magnitude de SES.
Portanto uma pla- - ca hidrofóbica altamente exposta seria preto profundo, e similarmente um hidrofílico altamente exposto será branco mais brilhante.
Também a repre- sentação estrutural do anticorpo é com base na área acessível a solvente para cada resíduo.
Em ambos os raios usados no cálculo da Tendência à agregação espacial (5 À e 10 À) foi observado que a superfície é predomi- nantemente branca indicando que a superfície é principalmente hidrofílica.
Isso é novamente como esperado uma vez que a maior parte da superfície de proteína é usualmente hidrofílica.
No entanto, algumas áreas pretas são observáveis, indicando regiões hidrofóbicas expostas.
O contraste entre as regiões branca e preta é mais proeminente nos raios mais altos de placa usados no cálculo de SAP, R = 10 À.
Essas regiões pretas (hidrofóbicas) têm excelente correlação com regiões do anticorpo conhecidas como intera- gindo com outras proteínas: uma região preta profunda na região principal é onde o receptor de Fc interage, uma região preta na fragmento de Fc é onde proteina A e proteina G interagem, e uma placa preta no fim do fragmento de Fab é onde o anticorpo se liga a antígenos.
Tendência à agregação es- pacial foi representada graficamente para R = 5 À e 10 À respectivamente,
em que a mesma correlação de picos com interação de regiões podem ser observados. Os sítios de interação de proteína foram obtidos a partir de es- trutura de raios X de complexos de proteína, entradas de PDB de 1T89, 1FC2, e 1FCC (Radaev, J. Biol. Chem. 2001, 276 (19) 16469; Deisenhofer e outros Hoppe-Seilers Z Physiol Chem. 1978. 359, 975-985; Deisenhofer, J. Biochemistry. 1981, 20, 2361-2370; Sauer-Eriksson e outros Structure. 1995, 3, 265). As interações hidrofóbicas se correlacionam muito bem com os pi- cos positivos e as interações hidrofílicas se correlacionam bem com os picos negativos. Portanto, o parâmetro de tendência à agregação espacial pode ser usado para prever os sítios de ligação de proteínas também. Nas poucas exceções em que resíduos com baixa Tendência à agregação espacial (isto é, próximo a zero, ou positivo ou negativo) também interagem, foi observado que as interações são realmente com os átomos da própria cadeia da cadeia principal, ao invés de com as cadeias laterais.
í 15 Apesar das placas pretas já mostradas para interagir com outras y proteínas, placas pretas adicionais na superfície de anticorpo foram identifi- cadas. Uma placa no fundo de Fc é significativamente hidrofóbica, mas é um tanto enterrada dentro da, com a região hidrofílica em suas bordas. Similar- mente duas placas são hidrofóbicas e expostas a solvente, mas elas estão seapresentando para dentro do interior do anticorpo. Essas placas poderiam ainda estar potencialmente envolvidas nas interações com outras proteínas se elas forem expostas devido a mudanças conformacionais significativas ou dobramento do anticorpo. Todas as placas hidrofóbicas poderiam também ser observadas no raio da placa menor (R = 5 À), embora com menos con- traste em comparação como raio de placa mais alto (R = 10 À). Os valores de Tendência à agregação espacial (raios X) que são baseados exatamente a estrutura de raios X foram também mapeados sobre a superfície de anticorpo, para compará-los com os valores médios de simu- lação. Placas propensas à agregação hidrofóbicas pretas são totalmente similares entre a Tendência à agregação espacial calculada ou através de simulação ou usando-se exatamente a estrutura de raios X. Há naturalmente algumas diferenças, tal como a intensidade de placas na região onde Proteí-
na A e G interagem. No entanto, essa comparação demonstra que Tendên- cia à agregação espacial (raios X) baseada exatamente na estrutura de raios X pode ser usada para se obter uma boa descrição da distribuição de placas hidrofóbicas na superfície. Isso é importante uma vez que a simulação ato- miísticade um anticorpo inteiro é computacionalmente exigente. Para as pro- teínas que carecem de um modelo estrutural de raios X, o mesmo parâmetro de Tendência à agregação espacial pode ser aplicado à estrutura gerada através da modelação por homologia ou prognóstico da estrutura ab -initio. À estrutura de homologia foi observada ser muito similar à estrutura de raios X, eseus valores de Tendência à agregação espacial são também similares à estrutura de raios X.
Assim Tendência à agregação espacial identifica as placas hi- drofóbicas na superfície do anticorpo. Essas placas poderiam ser nativamen- te expostas ou expostas devido a flutuações dinâmicas ou dobramento par- É 15 cial do anticorpo. Algumas dessas placas hidrofóbicas também se correla- cionam bem com regiões que interagem com outras proteínas. A fim de tes- tar se essas placas hidrofóbicas previstas pela Tendência à agregação es- | pacial estão envolvidas na agregação também, mutações nessas regiões específicas foram realizadas para mudar os resíduos hidrofóbicos em resí- duos hidrofílicos. O anticorpo resultante mostrou menos comportamento de agregação e estabilidade melhorada. Apesar da identificação de resíduos propensos à agregação, foi também observado que o método de SAP corre- tamente identifica as regiões do anticorpo propensas à ligação com outras proteínas. Portanto, o método poderia ser amplamente aplicado a todas as proteínas para identificar as regiões propensas à agregação ou ligar regiões com outras proteínas. Exemplo 3: Seleção de sítios de anticorpo para projeção de estabilidade Os sítios a serem projetados para a estabilidade de anticorpo fo- ram selecionados com base em um parâmetro de SAP. Esse parâmetro es- —pacial leva em conta (1) Área acessível a solvente (SAA) de cada resíduo, (2) a hidrofobicidade do resíduo, e (3) as contribuições espaciais de todos os resíduos dentro de um certo raio. Nesse exemplo, os resíduos hidrofóbicos que correspondem aos picos positivos em CH2 foram mudados em resíduos não hidrofóbicos. Foi esperado que isso melhoraria a estabilidade de proteí- na total. Os dois sítios selecionados (A1 e A2) correspondem a dois resíduos muito hidrofóbicos. Uma análise foi realizada de substituições desses resí- duos com lisina, um aminoácido muito hidrofílico com cadeia lateral positi- vamente carregada. Variante A1 e Variante A2 diferem do tipo selvagem por única substituição de amino. Exemplo 4: Expressão e purificação das variantes de anticorpo Variantes de anticorpo foram geradas por mutagênese de sítio- direcionada. Todos os construtos foram confirmados por sequenciação de DNA. DNA de plasmídio na escala de mg foi purificado de culturas bacteria- nas e transitoriamente foi transfectado para dentro de células de HEK 293. Anticorpo de tipo selvagem e variantes foram purificados do sobrenadante de cultura de tecido na coluna de proteína A e foram passados sobre uma colunade Q Sepharose para remover impurezas negativamente carregadas. Em pH 7,0 e abaixo, os anticorpos são positivamente carregados e perma- necem no fluxo positivamente carregado e permanecem no fluxo passante, enquanto impurezas negativamente carregadas se ligam à matriz positiva- mente carregada da coluna de Q Sepharose. A solução com anticorpo purifi- cadofoiconcentrada e o tampão foi trocado com tampão de His a 20 mM pH 6,5 para dar uma concentração final de 150 mg/ml.
Como um controle de qualidade, alíquotas das amostras purifi- cadas e concentradas foram analisadas por SDS-PAGE e dicroísmo circular. Tanto condições de redução quanto de não redução foram usadas para os géisde proteina. Comparou-se também a estrutura secundária de tipo sel- vagem de anticorpo e variante A1 por dicroísmo circular. Exemplo 5: Caracterização biofísica A estabilidade da Variante A1 foi comparada com tipo selvagem em uma experiência de agregação acelerada. Amostras a 150 mg/ml em tampão de His a20mM pH 6,5 foram incubadas a 58ºC por até 24 horas. À incubação foi parada por diluição da amostra a 10 mg/ml com tampão de K- fosfato a 15 mM, pH 6,5, e o porcento de agregação foi determinado por
SEC-HPLC. Agregação foi calculada como a soma de áreas de todos os pi- cos não monoméricos dividida pela área total de todos os picos. A média de 2 a 4 amostras para cada ponto de tempo é mostrado. Os agregados para Variante A1 são tão baixos quanto 80% dos agregados para tipo selvagem. Assim, uma mutação de único ponto reduz a formação de agregados por 20%.
Tipo selvagem e Variante A1 foram comparadas por microcalo- rimetria de varredura diferencial (DSC, Microcal). Todos os anticorpos são proteínas de múltiplos domínios. Análise de DSC indica diferentes tempera- turas de fusão para diferentes domínios (lonescu, R.M., e outros, J Pharm Sci. 2008, 97(4): p. 1414-26; Mimura, Y., e outros, J Biol Chem. 2001, 276(49): p. 45539-47.). Os domínios de CH2 e CH3 constantes de Fc de IgG1 de ser humano têm temperaturas de fusão em volta de 70ºC e 82ºC, respectivamente, a pH neutro (lonescu, R.M., e outros, J Pharm Sci. 2008, “15 897(4):p.1414-26; Mimura, Y., e outros, Role of oligosaccharide residues of , IgG1-Fc in Fc gamma RiIlb binding. J Biol Chem, 2001. 276(49): p. 45539-
47.). Dependendo da sequência dos domínios variáveis de anticorpo, frag- mentos de Fab podem ter diferentes ponto de fusão com relação a CH2 e CH3. Anticorpo C contém um domínio de Fab com dobramento de transição quecaientre as transições de CH2 e CH3. Assim, CH2 é o domínio de anti- corpo com a temperatura de fusão mais baixa.
Tipo selvagem e Variante A1 foram analisadas a uma concen- tração de 2 mg/ml em tampão de His a 15 mM pH 6,5 e uma taxa de aque- cimento de 1,5 grau por minuto. Os dados da amostra foram analisados por subtração dos dados de referência, normalização para uma concentração de proteína e volume de célula de DSC, e interpolação de uma linha de base cúbica. Uma comparação dos termogramas mostra um aumento da transi- ção de fusão de CH2 na Variante A1 em comparação com tipo selvagem.
Análise de Variante A2, também projetada para estabilidade com base nos valores de Tendência à agregação espacial, recapítula as desco- bertas para a Variante A1.
Em resumo, a análise biofísica das variantes de anticorpo proje-
tadas demonstrou uma agregação reduzida e uma estabilidade aumentada.
A forte correlação entre sítios projetados, estabilidade de variante, e perfis de DSC é evidência da eficácia da metodologia para estabilização de proteí- nas terapêuticas.
Exemplo6:SAA eficaz Foi observado que os picos em SAA eficaz (soma de 3 resíduos) podem se correlacionar com as regiões propensas à agregação em uma es- trutura de proteína.
Correspondentemente, a SAA eficaz pode ser usada como um método separado, ainda que menos poderoso, para identificar re- giões propensas à agregação de uma proteína.
Valores de SAA altamente eficazes (soma de 3 resíduos) indicam a regiões mais hidrofóbicas e valores menores indicam baixos valores indicam as regiões mais hidrofílicas.
Dados na proteína de teste que tem uma tendência à formação de agregado foram obtidos a partir de simulações moleculares curtas de 1,2 ns (dobrada) e 1 ns á 15 (mal-dobrada ("mis-folded"). A SAA eficaz foi representada graficamente pa- bp ra resíduos da proteína e foi observada que havia boa correlação entre os picos da SAA eficaz e mal emparelhamentos na rede de ligação da estrutura de proteína.
Isso indica que a SAA eficaz estava exatamente identificando resíduos da estrutura de proteína que promovem proteína mal-dobrada ou agregação.
Vários mutantes da proteína de teste foram produzidos e pelo menos um mostrou resultados promissores na retenção de uma estrutura de proteína adequadamente dobrada.
Exemplo 7: Previsão de regiões de ligação de proteína usando-se SAP O método de SAP foi usado para prever sítios de ligação de pro- teína.
Regiões de ligação foram previstas para duas diferentes proteínas: um anticorpo de IIG1 e EGFR.
Um anticorpo de IgG1 é bem-conhecido como ligando com as proteínas tais como receptor de Fc, Proteína A e Proteína G.
A EGFR liga com fator de crescimento epidérmico (EGF), fator de cresci- mento de transformação (TGFa) e também com ele mesmo para formar um dímero.
Essas regiões de ligação para o anticorpo de IgG1 e EGFR foram usados como modelos para demonstrar a capacidade da ferramenta de SAP na previsão das regiões de ligação.
Métodos De Simulação Moleculares Simulações dinâmicas moleculares foram realizadas para um anticorpo de IgG1 inteiro usando-se um modelo de átomo inteiro com solven- te explícito. A estrutura de partida para a simulação foi obtida por ligação da estruturade raios X dos fragmentos Fab e Fc individuais do anticorpo. A es- trutura de raios X do fragmento de Fab foi obtida a partir de Novartis Pharma AG. A estrutura de raios X de fragmento de Fc foi obtida a partir daquela de um outro Anticorpo de IgG1 de sequência similar, 1HZH (Saphire e outros, Science. 2001, 293, 1155). A estrutura de um anticorpo inteiro foi obtida por alinhamento dos fragmentos de Fab e Fcs usando-se uma estrutura de 1HZH como um molde de modelo. Essa estrutura de anticorpo foi chamada anticorpo A. A fim de alinhar os fragmentos na distância e orientação correta, o RMSD (Desvio ao Quadrado Médio de Raiz) foi minimizado entre os resí- duos de CYS comuns dos fragmentos e do modelo de anticorpo inteiro (1HZH). Essa estrutura foi então usada para realizar simulações de átomo . explícitas para 30 ns. Os resíduos de CYS no anticorpo A resultante foram todos envolvidos nas ligações de dissulfeto, incluindo aquela na região prin- cipal. Um padrão de glicolisação de GO foi usado para as simulações uma - vez que esse é um dos padrões de glicosilação mais comuns observados nosanticorpos.
O pacote de CHARMM de estimulação de (Brooks e outros J. Comput. Chem., 1983, 4, 187) foi usado para configuração e análise, e o pacote de NAMD (Phillips e outros Journal of Computational Chemistry., 2005, 26, 1781) para realização de simulações. O campo de força totalmente atomístico de CHARMM (Phillips e outros Journal of Computational Chemis- try. 2005, 26, 1781) foi usado para o modelo de solvente de TIP3P e proteí- na (Jorgensen e outros J. Chem. Phys., 1983, 79, 926) para água. As simu- lações foram realizadas a 298 K e 1 atm no conjunto de NPT. Os parâmetros para os grupos de açúcar envolvidos na glicosilação do fragmento de Fc fo- ram derivados na consistência com o campo de força de CHARMM, segundo o campo de força de CSFF (Kuttel e outros J. Comput. Chem., 2002, 23, 1236). Os estados de protonação de resíduos de histidina a pH 7 foram de-
cididos com base na proximidade espacial de grupo eletro-negativos.
O anti- corpo inteiro foi solvatado em uma caixa ortorrômbica uma vez que isso mi- nimiza o número de moléculas de água exigido e assim minimiza o tempo computacional exigido.
Condições de limite periódicas foram usadas em to- dasas3 direções.
Um revestimento de solvação de água de 8 À foi usado em cada direção da caixa ortorrômbica.
O tamanho de sistema total resultan- te era 202.130 átomos.
Foi observado que a caixa ortorrômbica permaneceu estável durante a simulação de 30 ns sem qualquer mudança significativa nas dimensões da caixa em todos os três eixos.
As dimensões de caixa ini- cialeram de 161,9 À, 1454 À e 83,2 À, respectivamente, e elas mudavam muito pouco durante a simulação de 30 ns, terminando a 161,2 À, 144,7 Ã e 82,8 À respectivamente.
O anticorpo não girou significativamente durante a simulação de 30 ns, desse modo mantendo a distância mínima entre o anti- corpo e suas imagens periódicas de mais do que 14 À.
Íons suficientes fo- ram adicionados para neutralizar a carga total do sistema.
A neutralidade de carga foi exigida pela técnica de soma de Ewald que foi usada para calcular contribuição devido às interações eletroestáticas.
Depois que o anticorpo foi solvatado, a energia foi inicialmente minimizada com SD (Steepest Descent) por fixação da proteína para permitir quea água diminua a tensão em volta da proteína.
Então os obstáculos fo- ram removidos e a estrutura foi ulteriormente minimizada com SD e ABNR (Newton-Raphson de Base Adotada). O sistema foi então lentamente aque- cido para a temperatura ambiente com aumentos de 5ºC a cada 0,5 ps u- sando-se uma primeira etapa de 1 fs.
O sistema foi então equilibrado para 1 nsantesdo início da computação das várias propriedades de simulação.
As configurações foram protegidas a cada 0,1 ps durante a simulação para ou- tra análise estatística.
Ferramentas de SAP para prever regiões de ligação de um anticorpo de 1gG1 A ferramenta de SAP foi aplicada às configurações de proteína obtidas a partir de simulações moleculares.
Para previsões mais rápidas nas aplicações de altas quantidades produzidas, a ferramenta de SAP pode também ser aplicada a uma estrutura de raios X de proteína ou estrutura derivada por homologia, com uma advertência que poderia levar a uma per- da de precisão. O valor de SAP para cada átomo na proteína foi definido como se segue, = EE (Tendência a agregação espacial (SAP)) mo; = tt restinato neo dus ts x Hidrofobicidade de resíduo o | det delt orando deito Samanta todas) Aqui 1) SAA de átomos de cadeia lateral dentro do raio R é computada em cada simulação instantânea 2) SAA de cadeia lateral de resíduo totalmente exposto (dizer para aminoá- cido 'X') é obtida por cálculo da SAA de cadeias laterais do meio resíduo na conformação totalmente prolongado de tripeptídeo 'Ala-X-Ala". 3) Hidrofobicidade de resíduo é obtida a partir de a escala de hidrofobicidade de Black e Mould (S. D. Black and D. R. Mould, Anal. Biochem. 193, 72 - (1991)). A escala é normalizada tal que glicina tem uma hidrofobicidade de : zero. Portanto, aminoácidos que são mais hidrofóbicos do que glicina são positivos e menos hidrofóbicos do que glicina são negativos na escala hidro- fóbica.
SAP dá a hidrofobicidade dinamicamente exposta de uma certa placa entrada no dado átomo na superfície de proteína. SAP é calculada para regiões esferoidais com raio R centrada em cada átomo na proteína.
Issodá um único valor de SAP para cada átomo. Então a SAP para um resí- duo é obtida por cálculo da média da SAP de todos seus átomos constituin- tes. Os valores de SAP foram assim avaliados usando-se R=10 À para um anticorpo de IgG1, e os valores foram mapeados sobre a superfície de anti- corpo usando-se uma escala de cor para indicar o valor de SAP dentro de umafaixade-O0,5a+0,5. Esses valores de SAP foram calculados por cálculo da média sobre a simulação atomística de anticorpo total de 30 ns. Observar que um valor de SAP a cada resíduo dá a hidrofobicidade exposta total de uma placa centrada naquele resíduo, e não exatamente a hidrofobicidade para um único resíduo. A escala de hidrofobicidade (S. D. Black and D. R.
Mould, Anal. Biochem. 193, 72 (1991)) foi também diretamente mapeada sobre a superfície para comparação. Quando da visão do mapa hidrofóbico, as regiões hidrofóbicas apareceram ser aleatoriamente distribuídas através de toda a superfície, e seria difícil de escolher uma certa região hidrofóbica a sermais dominante em comparação com a outra. No entanto, no exame do mapa de SAP da mesma estrutura, era fácil de marcar as altas regiões de SAP, que indicam regiões hidrofóbicas dinamicamente expostas. É termodi- namicamente desfavorável para essas placas a serem expostas a água por causa de sua natureza hidrofóbica. Portanto, elas poderiam estar envolvidas naligação de proteína a fim de reduzir sua exposição a solvente. Essas altas regiões de SAP foram identificadas como '1' até '8'. Placas '1' e '6' estavam localizadas no fragmento de Fab, e placas '2' até '5' estavam localizadas no fragmento de Fc. Placas de '1' a '3' estavam abertamente expostas e, por- tanto, poderiam facilmente interagir com outras proteínas. Por outro lado, ' 15 placasde'4'a'6' eram solvente acessível mas voltadas para dentro da pro- s teína, tornando-as duras para elas interagirem com outras proteínas a não ser que elas estejam mais abertamente expostas devido ao desdobramento.
A seguir, a correlação de altas regiões de SAP que representam placas hidrofóbicas expostas com regiões de ligação de proteína foi testada.
As regiões de ligação do anticorpo com receptor de Fc, proteína A, e proteí- na G foram mapeados no topo dos valores de SAP. Os sítios de ligação de proteína foram obtidos a partir de estruturas de raios X de complexos de pro- teina, entradas de PDB de 1T89, 1FC2, e 1FCC (S. Radaev, e outros, J. Bi- ol. Chem, 276 (19) 16469 (2001); Deisenhofer, J., e outros Hoppe-Seiler's Z.
Physiol. Chem. 359, 975-985 (1978); Deisenhofer, J, Biochemistry 20, 2361- 2370 (1981); Sauer-Eriksson A. E. e outros, Structure, 3, 265 (1995)). Uma certa forte correlação foi encontrada entre placas hidrofóbicas identificadas através de SAP e de regiões de ligação de proteína. O antígeno ligado com a região de laço de CDR comercializou placa '1' de SAP, o receptor de Fc ligacom placa "'2' de SAP, e proteína A e proteína G ligam com placa '3' de SAP. Além do mais, DeLano e outros (DeLano W. L., e outros, Science 287, 1279 (2000)) mostraram que a região onde proteína A e proteína G ligam
(placa '3' de SAP) é uma região de ligação de consenso que é dominante para os peptídeos de aleatórios de ligação selecionados in vitro para alta afinidade. Placa '3' é também conhecida como ligando com fator reumatoide e receptor de Fc neonatal. Portanto, a acessabilidade hidrofóbica de placa '3' como indicada através de SAP torna-a uma região favorável para ligar com numerosas proteínas. Totalmente notável, todas as 3 placas abertamente expostas (placa de '1' a '3' de SAP) estavam envolvidas na ligação. O núcleo da placa está envolvida nas interações hidrofóbicas, enquanto que as franjas estão envolvidas nas interações polares.
SAP a R = 10 À foi analisada para encontrar as amplas placas hidrofóbicas envolvidas na ligação com outras proteínas. Essas placas po- dem ser exploradas em mais detalhes usando-se a SAP em resolução mais alta, isto é, em um raio menor de R usado em um cálculo de SAP. Portanto, os valores de SAP foram calculados a R = 5 À para o anticorpo. Esses valo- í 15 resde SAP foram mapeados sobre a superfície de anticorpo. Aqui, os valo- . res de SAP positivos indicam placas hidrofóbicas dinamicamente expostas, enquanto que os valores de SAP negativos indicam placas hidrofílicas dina- micamente expostas. Regiões de ligação com o receptor de Fc, proteína A e proteína G foram também identificadas. Similar a resultados com SAP a R= 10ÃÁ,a SAPaR=5ÃÀ também mostraram forte correlação entre regiões de ligação de proteína e picos nos valores de SAP. As regiões de ligação hidro- fóbicas se correlacionaram bem com os picos positivos, e as regiões de liga- ção hidrofílicas (polares) correlacionadas bem com os picos negativos. Nas poucas exceções em que resíduos com baixa SAP (isto é, próximo a zero, ou positivo ou negativo) também interagiram, observou-se que as interações eram realmente com os átomos da própria cadeia de cadeia principal, ao invés de com as cadeias laterais.
SAP prevê tanto regiões de ligação quanto regiões propensas à agregação Foi demonstrado que os picos em SAP também correspondem a regiões que são propensas a autoagregação de proteína (Chennamsetty, N., e outros). Projeto de anticorpos terapêuticos com estabilidade aumentada (Apresentado)). Agregação é uma principal trajetória de degradação para proteínas terapêuticas que levam a sua perda de atividade e imunogeneci- dade potencial. Mutações projetadas nos picos de SAP levam a anticorpos estáveis com menos tendência à agregação (Chennamsetty, N., e outros. Projeto de anticorpos terapêuticos com estabilidade aumentada (Apresenta- do)) Os 8 mutantes gerados por mudança dos resíduos hidrofóbicos nos picos de SAP em resíduos hidrofílicos eram A1 (L235K), A2 (1253K), A3 (L309K), A4 (L235K L309K), A5 (L234K L235K), A6 (L2358S), A7 (V282K), e AB (L235K V282K L309K). Os mutantes foram então testados quanto seu comportamento de agregação usando-se experiências de agregação acele- radas sob estresse de calor a 150 mg/ml. Os resultados de SEC-HPLC (cromatografia líquida de alto de desempenho de exclusão de tamanho) mostraram aumento de monômero de 91% para o tipo selvagem a 92 a 97% para as variantes, indicando menos tendência à agregação dos mutantes. Portanto, os sítios com alta SAP também representam as regiões de alta . 15 tendência à agregação.
p A ferramenta de SAP assim previa tanto regiões de ligação de proteína quanto regiões propensas à agregação. Uma explicação provável é que agregação de proteína é também uma forma de proteína-ligação de pro- teina, embora dentro das proteínas da mesma espécie. Além do mais, foi mostrado que há uma sobreposição entre algumas das regiões propensas à agregação e regiões de ligação de proteína. Essa sobreposição era evidente a partir dos resíduos L235 e 1253 que estão envolvidas tanto na agregação quanto ligação de proteína. Análise de SAP similar e na projeção de proteína foram realizados em um outro Anticorpo de IgG1 onde ele mostrou que as regiões propensas à agregação se sobrepõem com regiões de ligação de proteína (Chennamsetty, N., e outros Projeto de anticorpos terapêuticos com estabilidade aumentada (Apresentado)). Nesse caso, as mutações foram realizadas nas regiões de CDR onde o anticorpo se liga a antígeno. Os mu- tantes resultantes nas regiões de CDR mostraram menos tendência à agre- gação, mas poderiam não se ligar a antígeno e perdem sua atividade. As- sim, há características comuns a ligação de proteína e regiões propensas à agregação. Isso é de acordo com outras previsões computacionais produzi-
das a partir das sequências que ligação de proteína e regiões propensas à agregação se sobrepõem (Wang, X. e outros, mAbs, 1, 1-14 (2009)). Assim, as placas hidrofóbicas dinamicamente expostas identificadas através de SAP estão envolvidas tanto na ligação de proteína quanto na autoagregação deproteina.
A sobreposição entre sítios de ligação de proteína e sítios pro- pensos a agregação no entanto, apresenta um novo desafio no projeto de proteína terapêutica uma vez que a agregação necessita ser evitada en- quanto preservando a ligação de proteína necessária para sua função. Para resolver esse desafio, uma análise de SAP na resolução mais alta (a R=5 À) pode ser usada para localizar ou modificar sítios propensos à agregação em volta das regiões de ligação sem perturbar a ligação de proteína. Por exemplo, usando-se análise de SAP no Anticorpo de IgG1 foi determinado que sítios 1253, L309 e V282 são todas partes de uma ampla placa (região '3'de SAP) envolvidas na agregação (Chennamsetty, N., e outros. Projeto de V anticorpos terapêuticos com estabilidade aumentada (Apresentado)). Mutan- tes que envolvem sítios L309 e V282 (A3 (L309K), A4 (L235K L309K), A7 (V282K), e A8 (L235K V282K L309K)) foram projetados, deixando fora do sítio 1253 que estava envolvido na ligação a proteína A. Os mutantes resul- tantes mostravam menos tendência à agregação enquanto ainda se ligando a proteína A. Assim, tecnologia de SAP pode ser eficazmente usada para projetar proteínas com uma tendência à agregação menor enquanto preser- vando a capacidade de ligação de proteína.
SAP prevê regiões de ligação de EGFR Além de anticorpos, análise de SAP foi realizada em uma outra proteína chamada receptor de fator de crescimento epidérmico (EGFR) para predizer suas regiões de ligação. EGFR é um receptor de superfície de célu- la ativado por ligação de ligantes específicos incluindo receptor de fator de crescimento epidérmico (EGF) e fator de crescimento de transformação B (TGFB). Ultraexpressão ou ultra-atividade de EGFR estava associada nume- rosos cânceres tais como câncer de pulmão e câncer de cérebro. EGFR também liga com ele próprio para formar dímeros. Uma análise de SAP foi realizada em EGFR para ver se as regiões de ligação previstas coincidirem com as regiões de ligação de EGF, TGFa, e com um outro EGFR na forma dimérica.
Os valores de SAP avaliados para EGFR a R = 10 À foram ma- — peados sobre a superfície de EGFR.
Esses valores de SAP foram calculados por realização da análise diretamente na estrutura de raios X de EGFR obti- da a partir da entrada de PDB 1IVO (Ogiso, H.e outros, Cell, 110: 775-787 (2002)). A escala de hidrofobicidade (S.
D.
Black and D.
R.
Mould, Anal.
Bio- chem. 193, 72 (1991)) foi também mapeada sobre a superfície de EGFR pa- ra comparação.
Como visto anteriormente no caso do anticorpo, os resíduos hidrofóbicos para EGFR foram distribuídos através de toda a superfície, e seria difícil de isolar aqueles potencialmente envolvidos na ligação.
No en- tanto, foi relativamente mais fácil manchar as altas regiões de SAP, que indi- cam regiões hidrofóbicas espacialmente expostas.
Duas tais principais pla-
' 15 casforam identificadas e foram comercializadas como '1' e '2',
' As regiões de ligação conhecidas de EGFR com EGF, TGFa, e com um outro EGFR na forma dimérica foram mapeadas no topo dos valores de SAP.
Esses sítios de ligação de proteína foram obtidos a partir de estrutu- ras de raios X de complexos de proteína, entradas de PDB de 1IVO e IMOX
(Ogiso,H., e outros Cell, 110: 775-787 (2002); Garrett, T.P.J., e outros Cell, 110: 763-773 (2002)). O mapeamento indicou uma forte correlação entre placas hidrofóbicas identificadas através de SAP e regiões de ligação de proteína.
EGFR liga com EGF e TGFa na placa '1' de SAP e uma outra placa menor.
Também liga com um outro EGFR na placa '2' SAP.
Assim, as duas principais placas de SAP são ambas envolvidas na ligação.
Novamente co- mo no caso de anticorpo, o núcleo das placas está envolvido nas interações hidrofóbicas, enquanto que as franjas estão envolvidas nas interações pola- res.
Assim, SAP exatamente previa as regiões de ligação de EGFR.
Conclusões
Uma ferramenta computacional chamada SAP foi descrita, que provê uma medição da exposição dinâmica de placas hidrofóbicas que pode ser usada para prever regiões de ligação de proteína.
Usando-se duas prote-
ínas de modelo, um anticorpo de IgG1 e EGFR, foi mostrado que SAP exa- tamente prevê regiões de ligação de proteína. No caso do Anticorpo de IgG1, as regiões de ligação com receptor de Fc, proteína A e proteína G se correlacionaram bem com picos de SAP. Para EGFR, as regiões de ligação comEGF,TGFB,e com um outro EGFR se correlacionaram bem com picos de SAP. Assim, SAP foi mostrado extrair na previsão de regiões de ligação, e a importância de placas hidrofobicamente expostas para proteína-ligação de proteína foi determinada. A mesma análise de SAP poderia ser realizada em outras proteínas como bem para prever suas regiões de ligação. Além disso, foi mostrado que algumas das regiões de ligação de proteína se so- brepõem com regiões propensas à agregação. Esse apresenta um desafio para o projeto de proteína terapêutica uma vez que agregação desfavorável deve der evitada enquanto preservando a ligação de proteína necessária para sua fusão. Foi mostrado que esse desafio pode ser superado usando- se análise de SAP seguido por projeção de proteína. Usando-se SAP, os E sítios próximos ao sítio de ligação que estão envolvidos na agregação pode ser detectada e modificada para diminuir tendência à agregação enquanto Ô preservando ligação. Isso foi demonstrado usando-se o Anticorpo de Ig9G1 onde as regiões propensas à agregação próximos aos sítios de ligação de proteína A foram modificados para diminuir agregação enquanto preservan- do a capacidade de ligação. Projeção de proteína similar com base na SAP poderia ser realizado próximo às regiões de ligação de antígeno para dimi- nuir tendência à agregação enquanto preservando atividade. Assim, a ferra- menta de SAP descrita aqui poderia ser usada para projetar proteínas tera- pêuticas estáveis, enquanto ao mesmo tempo preservando seus sítios de ligação. A ferramenta de SAP poderia ser também usada para determinar os sítios de ligação ainda desconhecidos para numerosas proteínas funcionan- do de iniciativos genômicos estruturais, desse modo provendo importantes indícios para sua função.
Equivalentes Aqueles versados na técnica reconhecerão, ou serão capazes de determinar usando-se não mais do que a experimentação rotineira, mui-
tos equivalentes para as concretizações específicas da invenção descritos aqui.
Pretende-se que tais equivalentes estejam incluídos pelas seguintes reivindicações.

Claims (16)

  1. U7 ] REINVINDICAÇÕES : 1. Método para identificar uma região propensa à agregação em uma proteína, caracterizado pelo fato de que compreende: (a) mapeamento, sobre um modelo estrutural da proteina, a SAP como calculada por () identificação de um ou mais átomos ou resíduos de ami- noácidos em um modelo estrutural que representa a proteína, em que um ou mais átomos estão dentro de uma região especial definida centrada no ou próxima do átomo particular ou um ou mais resíduos de aminoácidos tem pelomenos um átomo dentro de uma região espacial definida centrada no ou próxima do átomo particular; (ii) — cálculo, para um ou mais átomos na região espacial de- finida, de uma razão de área acessível a solvente (SAA) dos átomos para a SAA de átomos em um resíduo idêntico que é totalmente exposto; (ii) multiplicação de cada razão pela hidrofobicidade do á- tomo de um ou mais átomos; e (iv) — soma dos produtos da etapa (c); de modo que a soma é a SAP para o átomo particular; e em que, opcionalmente, a SAP para o átomo particular é calculada por con- dução de uma simulação dinâmica molecular antes da etapa (i) e etapas de repetição (i) a (iv), cada vez conduzindo uma simulação dinâmica molecular adicional em uma pluralidade de etapas, desse modo produzindo múltiplas somas como na etapa (iv), e calculando a média das somas; de modo que a média calculada é a SAP para o átomo particular; e (b) identificação de uma região dentro da proteína tendo uma plura- lidade de átomos tendo a SAP > O; em que a região propensa à agregação compreende os aminoácidos com- preendendo a dita pluralidade de átomos.
  2. 2. Método de acordo com a reivindicação 1, caracterizado pelo fatodequea identificação compreende representação gráfica dos valores de SAP; cálculo, para picos no diagrama, da área sob a curva (AUC); e identifi- cação de uma ou mais regiões de proteína com uma AUC positiva, em que a
    - 217 É região propensa à agregação compreende as regiões de proteína identifica- : das.
  3. 3. Método de produção de uma variante de proteína que exibe uma propensão reduzida para agregação, caracterizado pelo fato de que compreende: substituição ou deleção de pelo menos um resíduo de aminoácido dentro de uma região propensa à agregação na proteína, em que a região propensa à agregação é identificada usando-se classífica- ções de SAP calculadas por: () identificação de um ou mais átomos ou resíduos de aminoácidos em um modelo estrutural que representa a proteína, em que um ou mais á- tomos estão dentro de uma região espacial definida centrada no ou próxima do átomo particular ou um ou mais resíduos de aminoácidos tem pelo menos um átomo dentro de uma região espacial definida centrada no ou próxima do átomo particular; (ii) — cálculo, para um ou mais átomos na região espacial definida, de uma razão de área acessível a solvente (SAA) dos átomos para a SAA de átomos em um resíduo idêntico que é totalmente exposto; (ii) — multiplicação de cada razão pela hidrofobicidade do átomo de umourmais átomos; e (iv) soma dos produtos da etapa (c); de modo que a soma é a SAP para o átomo particular; e em que, opcionalmente, a SAP para o átomo particular é calculada por con- dução de uma simulação dinâmica molecular antes da etapa (i) e etapas de repetição (i) a (iv), cada vez conduzindo uma simulação dinâmica molecular adicional em uma pluralidade de etapas, desse modo produzindo múltiplas somas como na etapa (iv), e calculando a média das somas; de modo que a média calculada é a SAP para o átomo particular, e em que, se o resíduo de aminoácido for substituído, ele é substituído por um resíduo de aminoácido que é mais hidrofílico, tal que a propensão à agrega- ção da variante é reduzida.
  4. 4. Método de produção de uma variante de proteína que exibe
    - 37 Á uma propensão reduzida para agregação, caracterizado pelo fato de que compreende: Í (a) geração de uma pluralidade de variantes de proteína por substitui- ção em cada variante de pelo menos um resíduo dentro de uma região pro- pensaà agregação na proteína, em que a região propensa à agregação é identificada usando-se classifica- ções de SAP calculadas por: () identificação de um ou mais átomos ou resíduos de ami- noácidos em um modelo estrutural que representa a proteína, em que um ou mais átomos estão dentro de uma região espacial definida centrada no ou próxima do átomo particular ou um ou mais resíduos de aminoácidos tem pelo menos um átomo dentro de uma região espacial definida centrada no ou próximo do átomo particular; (ii) — cálculo, para um ou mais átomos na região espacial de- finida, de uma razão de área acessível a solvente (SAA) dos átomos para a SAA de átomos em um resíduo idêntico que é totalmente exposto; (ii) multiplicação de cada razão pela hidrofobicidade do á- tomo de um ou mais átomos; e (iv) — soma dos produtos da etapa (c); de modo que a soma é aSAPparao átomo particular; e em que, opcionalmente, a SAP para o átomo particular é calculada por con- dução de uma simulação dinâmica molecular antes da etapa (i) e etapas de repetição (i) a (iv), cada vez conduzindo uma simulação dinâmica molecular adicional em uma pluralidade de etapas, desse modo produzindo múltiplas somas como na etapa (iv), e calculando a média das somas; de modo que a média calculada é a SAP para o átomo particular, em que, um ou diferentes resíduos, ou diferentes combinações de resíduos são substituídos em cada variante; em que pelo menos um resíduo é substituído por um resíduo que é mais hi- drofílice (b) seleção de uma variante de proteína preparada como em (a) que exibe uma propensão reduzida para agregação.
    p 47 '
  5. 5. Método de acordo com a reivindicação 3 ou 4, caracterizado : pelo fato de que pelo menos dois resíduos de aminoácidos dentro da região propensa à agregação são substituídos.
  6. 6. Método de acordo com a reivindicação 3 ou 4, caracterizado —pelofatode que pelomenos um resíduo é substituído dentro de mais do que uma região propensa a agregações dentro da proteína.
  7. 7. Método de acordo com qualquer uma das reivindicações 1 a 6, caracterizado pelo fato de que a proteína é selecionada do grupo que consiste em um anticorpo, um fragmento de Fab, um fragmento de Fab”, um fragmento de Fd, um fragmento de Fv, um fragmento de F(ab'), e um frag- mento de Fc.
  8. 8. Método de produção de uma composição farmacêutica com- preendendo uma variante de proteína que exibe uma propensão reduzida para agregação, caracterizado pelo fato de que compreende a formulação deuma variante de proteína obtida pelo método como definido na reivindica- ção 3 ou 4, juntamente com um veículo, auxiliar e/ou excipiente farmaceuti- camente aceitável.
  9. 9. Método para identificar uma região de ligação de macromolé- cula na proteína, caracterizado pelo fato de que compreende: (a) mapeamento, sobre um modelo estrutural da proteina da SAP como calculada por: () identificação de um ou mais átomos ou resíduos de ami- noácidos em um modelo estrutural que representa a proteína, em que um ou mais átomos estão dentro de uma região espacial definida centrada no ou próxima do átomo particular ou um ou mais resíduos de aminoácidos tem pelo menos um átomo dentro de uma região espacial definida centrada no ou próxima do átomo particular; (ii) cálculo, para um ou mais átomos na região espacial de- finida, de uma razão de área acessível a solvente (SAA) dos átomos para a —SAA de átomos em um resíduo idêntico que é totalmente exposto; (ii) — multiplicação de cada razão pela hidrofobicidade do á- tomo de um ou mais átomos; e
    ' (iv) soma dos produtos da etapa (c); de modo que a soma é : a SAP para o átomo particular; e em que, opcionalmente, a SAP para o átomo particular é calculada por con- dução de uma simulação dinâmica molecular antes da etapa (i) e etapas de repetição (i) a (iv), cada vez conduzindo uma simulação dinâmica molecular adicional em uma pluralidade de etapas, desse modo produzindo múltiplas somas como na etapa (iv), e calculando a média das somas; de modo que a média calculada é a SAP para o átomo particular, (b) identificação de uma região dentro da proteína tendo uma pluralidade de átomos tendo uma SAP > O; em que a região de ligação de macromolécula compreende os aminoácidos compreendendo a dita pluralidade de átomos.
  10. 10. Método de acordo com a reivindicação 9, caracterizado pelo fato de que a identificação compreende representação gráfica dos valores de SAP; cálculo, para picos no diagrama, da área sob a curva (AUC) e identifi- cação de uma ou mais regiões de proteína com uma AUC positiva, em que a região de ligação de macromolécula compreende as regiões de proteína i- dentificadas.
  11. 11. Método de produção de uma variante de proteína que exibe uma afinidade de ligação reduzida para uma macromolécula, caracterizado pelo fato de que compreende: substituição ou deleção de pelo menos um resíduo de aminoáci- do dentro de uma região de ligação da macromolécula para a macromolécu- la na proteína, em que a região de ligação da macromolécula é identificada u- sando-se classificações de SAP calculadas por: () identificação de um ou mais átomos ou resíduos de ami- noácidos em um modelo estrutural que representa a proteína, em que um ou mais átomos estão dentro de uma região espacial definida centrada no ou próxima do átomo particular ou um ou mais resíduos de aminoácidos tem pelo menos um átomo dentro de uma região espacial definida centrada no ou próxima do átomo particular;
    . 67 Ã (ii) — cálculo, para um ou mais átomos na região espacial de- ' finida, de uma razão de área acessível a solvente (SAA) dos átomos para a SAA de átomos em um resíduo idêntico que é totalmente exposto; (ii) — multiplicação de cada razão pela hidrofobicidade do á- tomode um ou mais átomos; e (iv) soma dos produtos da etapa (c); de modo que a soma é a SAP para o átomo particular; e em que, opcionalmente, a SAP para o átomo particular é calculada por con- dução de uma simulação dinâmica molecular antes da etapa (i) e etapas de repetição (i) a (iv), cada vez conduzindo uma simulação dinâmica molecular adicional em uma pluralidade de etapas, desse modo produzindo múltiplas somas como na etapa (iv), e calculando a média das somas; de modo que a média calculada é a SAP para o átomo particular, e em que, se o resíduo de aminoácido for substituído, ele é substituído por um resíduo de aminoácido que é mais hidrofílico, tal que a propensão de ligação pela macromolécula da variante é reduzida.
  12. 12. Método de produção de uma variante de proteína que exibe uma afinidade de ligação alterada para uma macromolécula, caracterizado pelo fato de que compreende: (a) geração de uma pluralidade das variantes de proteína por substi- tuição em cada variante de pelo menos um resíduo dentro de uma região de ligação de macromolécula para uma macromolécula na proteína, em que a região de ligação de macromolécula é identificada usando-se clas- sificações de SAP calculadas por: () identificação de um ou mais átomos ou resíduos de ami- noácidos em um modelo estrutural que representa a proteína, em que um ou mais átomos estão dentro de uma região espacial definida centrada no ou próxima do átomo particular ou um ou mais resíduos de aminoácidos tem pelo menos um átomo dentro de uma região espacial definida centrada no ou próximado átomo particular; (i) cálculo, para um ou mais átomos na região espacial de- finida, de uma razão de área acessível a solvente (SAA) dos átomos para a
    . 77 õ SAA de átomos em um resíduo idêntico que é totalmente exposto; (ii) multiplicação de cada razão pela hidrofobicidade do á- o tomo de um ou mais átomos; e (iv) — soma dos produtos da etapa (c); de modo que a soma é aSAP parao átomo particular; e em que, opcionalmente, a SAP para o átomo particular é calculada por con- dução de uma simulação dinâmica molecular antes da etapa (i) e etapas de repetição (i) a (iv), cada vez conduzindo uma simulação dinâmica molecular adicional em uma pluralidade de etapas, desse modo produzindo múltiplas somas como na etapa (iv), e calculando a média das somas; de modo que a média calculada é a SAP para o átomo particular, (b) seleção de uma variante de proteína preparada como em (a)que exibe uma afinidade de ligação alterada para a macromolécula.
  13. 13. Método de acordo com a reivindicação 11 a 12, caracteriza- do pelo fatode que pelo menos dois resíduos de aminoácidos dentro da re- gião de ligação de macromolécula são substituídos.
  14. 14. Método de acordo com a reivindicação 11 ou 12, caracteri- zado pelo fato de que pelo menos um resíduo é substituído dentro de mais do que uma região de ligação de macromolécula dentro da proteína.
  15. 15. Método de produção de uma composição farmacêutica com- preendendo uma variante de proteina que exibe uma propensão alterada para a interação com um par de ligação, caracterizado pelo fato de que compreende a formulação de uma variante de proteína obtida pelo processo como definido na reivindicação 11 ou 12, juntamente com um veículo, auxili- are/ouexcipiente farmaceuticamente aceitável.
  16. 16. Invenção, caracterizada por quaisquer de suas concretiza- ções ou categorias de reivindicação englobadas pela matéria inicialmente revelada no pedido de patente ou em seus exemplos aqui apresentados.
BRPI0915414-0A 2008-06-20 2009-06-19 Métodos para identificar uma região propensa à agregação e uma região de ligação de macromolécula em uma proteína, bem como métodos para produzir uma variante de proteína e uma composição farmacêutica. BRPI0915414A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US7446608P 2008-06-20 2008-06-20
US61/074,466 2008-06-20
PCT/US2009/047954 WO2009155518A1 (en) 2008-06-20 2009-06-19 Methods to identify macromolecule binding and aggregation prone regions in proteins and uses therefor

Publications (1)

Publication Number Publication Date
BRPI0915414A2 true BRPI0915414A2 (pt) 2021-09-08

Family

ID=41066301

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0915414-0A BRPI0915414A2 (pt) 2008-06-20 2009-06-19 Métodos para identificar uma região propensa à agregação e uma região de ligação de macromolécula em uma proteína, bem como métodos para produzir uma variante de proteína e uma composição farmacêutica.

Country Status (14)

Country Link
US (2) US20110257104A1 (pt)
EP (1) EP2310970B1 (pt)
JP (1) JP5694150B2 (pt)
KR (1) KR101854724B1 (pt)
CN (1) CN102099809B (pt)
AU (1) AU2009259906B2 (pt)
BR (1) BRPI0915414A2 (pt)
CA (1) CA2727936C (pt)
ES (1) ES2417781T3 (pt)
MX (1) MX2010014062A (pt)
PL (1) PL2310970T3 (pt)
PT (1) PT2310970E (pt)
RU (1) RU2571217C2 (pt)
WO (1) WO2009155518A1 (pt)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2543680A1 (en) * 2011-07-07 2013-01-09 Centre National de la Recherche Scientifique Multispecific mutated antibody Fab fragments
US10431325B2 (en) * 2012-08-03 2019-10-01 Novartis Ag Methods to identify amino acid residues involved in macromolecular binding and uses therefor
WO2014052713A2 (en) 2012-09-27 2014-04-03 Massachusetts Institute Of Technology Her2-and vegf-a-binding proteins with enhanced stability
KR101400717B1 (ko) * 2012-12-28 2014-05-29 (주)신테카바이오 전체원자기반 고분자 복합체의 시뮬레이션 시스템 및 방법
EP2973132B1 (en) * 2013-03-15 2020-05-06 Zymeworks, Inc. Systems and methods for identifying thermodynamic effects of atomic changes to polymers
GB201310859D0 (en) * 2013-06-18 2013-07-31 Cambridge Entpr Ltd Rational method for solubilising proteins
US20160162625A1 (en) 2013-09-26 2016-06-09 Synopsys, Inc. Mapping Intermediate Material Properties To Target Properties To Screen Materials
WO2015048532A1 (en) 2013-09-26 2015-04-02 Synopsys, Inc. Parameter extraction of dft
WO2015048509A1 (en) 2013-09-26 2015-04-02 Synopsys, Inc. First principles design automation tool
US10516725B2 (en) 2013-09-26 2019-12-24 Synopsys, Inc. Characterizing target material properties based on properties of similar materials
US10489212B2 (en) 2013-09-26 2019-11-26 Synopsys, Inc. Adaptive parallelization for multi-scale simulation
CN104077457B (zh) * 2014-07-11 2017-03-15 哈尔滨工业大学 一种利用计算机模拟纳米物质在水环境中聚集的界面相互作用的方法
CN104239732A (zh) * 2014-09-24 2014-12-24 湖南大学 一种运行于多核计算机平台的并行通用序列的比对方法
KR101975639B1 (ko) * 2016-09-06 2019-05-07 숙명여자대학교산학협력단 단백질 응집가능성 예측방법
EP3518971A4 (en) 2016-09-28 2020-05-13 Board Of Regents, The University Of Texas System ANTIBODIES AND THERAPEUTIC PROTEIN FORMULATIONS AND USES THEREOF
CN107203702B (zh) * 2017-01-13 2020-04-21 北京理工大学 一种分析蛋白质侧链构象含时动力学演化的方法
GB201809341D0 (en) 2018-06-07 2018-07-25 Ucb Biopharma Sprl Multi-domain proteins with increased native state colloidal stability
CN109903818B (zh) * 2019-02-21 2022-03-18 深圳晶泰科技有限公司 基于恒定pH分子动力学模拟的蛋白质质子化状态确定方法
CN110551195B (zh) * 2019-08-01 2022-08-09 天津科技大学 一种α-突触核蛋白聚集诱导发光体系及其构建与应用
CN112466414B (zh) * 2020-12-04 2024-04-09 南通海智医药科技有限公司 蛋白药物活性的分子保护及其处方设计方法
CN113436675B (zh) * 2021-06-24 2024-03-26 广州医科大学附属第一医院(广州呼吸中心) 基于血液滤过方式清除体外循环突触核蛋白的方法
CN114512180B (zh) * 2022-02-15 2023-07-21 哈尔滨工业大学 基于蛋白质表面低熵水合层识别的蛋白质-蛋白质对接方法及装置

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6277375B1 (en) 1997-03-03 2001-08-21 Board Of Regents, The University Of Texas System Immunoglobulin-like domains with increased half-lives
BR0010909A (pt) 1999-05-24 2002-02-19 Sankyo Co Composição farmacêutica, agente que tem atividade indutora de apoptose, e, uso de um anticorpo fas anti-humano
WO2003074679A2 (en) 2002-03-01 2003-09-12 Xencor Antibody optimization
US7317091B2 (en) 2002-03-01 2008-01-08 Xencor, Inc. Optimized Fc variants
JP2003263465A (ja) * 2002-03-07 2003-09-19 Enkaku Iryo Kenkyusho:Kk 蛋白質結合性ペプチドの設計・選出方法
AU2003251592A1 (en) 2002-06-21 2004-01-06 Biogen Idec Inc. Buffered formulations for concentrating antibodies and methods of use thereof
GB0325817D0 (en) 2003-11-05 2003-12-10 Univ Cambridge Tech Method and apparatus for assessing polypeptide aggregation
WO2005092925A2 (en) 2004-03-24 2005-10-06 Xencor, Inc. Immunoglobulin variants outside the fc region
JP4958555B2 (ja) 2004-09-22 2012-06-20 協和発酵キリン株式会社 安定化されたヒトIgG4抗体
RU2412947C2 (ru) 2004-09-23 2011-02-27 Дженентек, Инк. Антитела, сконструированные на основе цистеинов, и их конъюгаты
US8008453B2 (en) 2005-08-12 2011-08-30 Amgen Inc. Modified Fc molecules
WO2007103288A2 (en) 2006-03-02 2007-09-13 Seattle Genetics, Inc. Engineered antibody drug conjugates
TW200806317A (en) 2006-03-20 2008-02-01 Wyeth Corp Methods for reducing protein aggregation
CA2644663A1 (en) 2006-03-23 2007-09-27 Kirin Pharma Kabushiki Kaisha Agonist antibody to human thrombopoietin receptor
KR101328756B1 (ko) 2006-05-30 2013-11-18 제넨테크, 인크. 항체 및 면역접합체 및 이들의 용도
US20100297103A1 (en) 2006-09-14 2010-11-25 Medical & Biological Laboratories Co., Ltd. Antibody having enhanced adcc activity and method for production thereof
CN100455598C (zh) 2006-11-29 2009-01-28 中国抗体制药有限公司 功能人源化抗人cd20抗体及其应用
CA2675847C (en) 2007-01-18 2014-12-30 Eli Lilly And Company Pegylated a.beta. fab
EP2310412B1 (en) 2008-06-20 2018-02-21 Novartis AG Immunoglobulins with reduced aggregation

Also Published As

Publication number Publication date
AU2009259906B2 (en) 2016-06-16
KR101854724B1 (ko) 2018-05-04
WO2009155518A1 (en) 2009-12-23
CA2727936C (en) 2019-02-26
US9922164B2 (en) 2018-03-20
PT2310970E (pt) 2013-07-26
JP2011526382A (ja) 2011-10-06
PL2310970T3 (pl) 2013-10-31
RU2571217C2 (ru) 2015-12-20
EP2310970A1 (en) 2011-04-20
MX2010014062A (es) 2011-02-22
US20110257104A1 (en) 2011-10-20
CN102099809B (zh) 2014-05-07
EP2310970B1 (en) 2013-05-29
CN102099809A (zh) 2011-06-15
JP5694150B2 (ja) 2015-04-01
AU2009259906A1 (en) 2009-12-23
RU2011101997A (ru) 2012-07-27
CA2727936A1 (en) 2009-12-23
KR20110052580A (ko) 2011-05-18
US20160364521A1 (en) 2016-12-15
ES2417781T3 (es) 2013-08-09

Similar Documents

Publication Publication Date Title
US9922164B2 (en) Methods to identify macromolecule binding and aggregation prone regions in proteins and uses therefor
Lilyestrom et al. Influence of the cosolute environment on IgG solution structure analyzed by small-angle X-ray scattering
Wang et al. Structure-based design for binding peptides in anti-cancer therapy
Houde et al. Biophysical characterization of proteins in developing biopharmaceuticals
Hudgens et al. Interlaboratory comparison of hydrogen–deuterium exchange mass spectrometry measurements of the Fab fragment of NISTmAb
Klett et al. MM-ISMSA: an ultrafast and accurate scoring function for protein–protein docking
Clark et al. Small-angle neutron scattering study of a monoclonal antibody using free-energy constraints
Huang et al. Replica exchange Gaussian accelerated molecular dynamics: Improved enhanced sampling and free energy calculation
Kuhn et al. Improved solution-state properties of monoclonal antibodies by targeted mutations
Fujimoto et al. Carbohydrate recognition by the antiviral lectin cyanovirin-N
Codina et al. An expanded conformation of an antibody Fab region by X-ray scattering, molecular dynamics, and smFRET identifies an aggregation mechanism
Liang et al. Prediction of immunogenicity for humanized and full human therapeutic antibodies
Temelso et al. Structural analysis of α-fetoprotein (afp)-like peptides with anti-breast-cancer properties
Goulet et al. Toward a combinatorial approach for the prediction of IgG half-life and clearance
Ostrowska et al. Varying molecular interactions explain aspects of crowder-dependent enzyme function of a viral protease
Pohl et al. Electrostatics drive oligomerization and aggregation of human interferon alpha-2a
Guest et al. Molecular simulation of αvβ6 integrin inhibitors
Boreak et al. In-silico modulation of Interleukin-8 (IL8) for the therapeutic management of endodontic pulpitis
US20210088528A1 (en) Methods related to a structure of high-affinity human pd-1/pd-l2 complex
Can et al. Conformational dynamics of bacterial trigger factor in apo and ribosome-bound states
Shen et al. Molecular insights into the improved bioactivity of interferon conjugates attached to a helical polyglutamate
Polimeni et al. A multi-scale numerical approach to study monoclonal antibodies in solution
Chowdhury et al. Characterizing Protein–Protein Interactions and Viscosity of a Monoclonal Antibody from Low to High Concentration Using Small-Angle X-ray Scattering and Molecular Dynamics Simulations
WO2021147642A1 (en) Methods, models and systems related to antibody immunogenicity
Ko Molecular Understanding of the Effects of Stabilizing Excipient during Lyophilization of Biopharmaceuticals

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE AS 11A E 12A ANUIDADES.

B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]

Free format text: EM VIRTUDE DO ARQUIVAMENTO PUBLICADO NA RPI 2647 DE 28-09-2021 E CONSIDERANDO AUSENCIA DE MANIFESTACAO DENTRO DOS PRAZOS LEGAIS, INFORMO QUE CABE SER MANTIDO O ARQUIVAMENTO DO PEDIDO DE PATENTE, CONFORME O DISPOSTO NO ARTIGO 12, DA RESOLUCAO 113/2013.