PT1604209E

PT1604209E - Ensaio de pesquisa

Info

Publication number: PT1604209E
Application number: PT04719437T
Authority: PT
Inventors: Fredrik Nilsson
Original assignee: Immunovia Ab
Priority date: 2003-03-12
Filing date: 2004-03-11
Publication date: 2009-02-02
Also published as: CA2518632C; PL1604209T3; CA2518632A1; AU2004219906B2; EP1604209B1; DE602004017286D1; AU2004219906B9; GB0305656D0; JP4833057B2; DK1604209T3; EP1604209A1; JP2006523829A; ES2319422T3; WO2004081575A1; ATE412187T1; AU2004219906A1

Description

ΕΡ 1 604 209/ΡΤ

DESCRIÇÃO "Ensaio de pesquisa"

O presente invento refere-se a um ensaio de pesquisa. ANTECEDENTES DO INVENTO A genómica funcional é um campo de investigação com o objectivo de compreender o que cada gene faz, como é regulado e como interagem diferentes genes e produtos génicos. Um aspecto importante da genómica funcional é o de compreender a estrutura e função de produtos génicos, tais como proteínas, bem como ser capaz de determinar onde, quando e até que ponto os genes são expressos. O termo perfil de expressão ou análise da expressão engloba habitualmente tanto os estudos da expressão do ARNm (análise da transcrição) como a análise proteica (análise do proteoma ou proteómica). A análise da transcrição é tipicamente efectuada utilizando ADN num formato de micromatriz (microarray) , permitindo a detecção paralela de milhares ou dezenas de milhar de moléculas de ARNm simultaneamente (p.ex., utilizando microarrays comercialmente disponíveis em p.ex. Affymetrix, EUA). Tipicamente, estes arrays são utilizados para mapear a distribuição de transcritos em diferentes tecidos ou estudar as diferenças nos níveis de expressão de ARNm p.ex. entre indivíduos saudáveis e doentes. As aplicações no desenvolvimento e descoberta de fármacos incluem a identificação de alvos e estratificação dos pacientes. O perfil de expressão proteica, ou proteómica, é a análise global do teor proteico por exemplo num tecido ou numa população de células. A electroforese bidimensional conjugada com espectroscopia de massa é uma técnica bem estabelecida para análise de amostras proteicas complexas com um poder de resolução suficientemente elevado para separar milhares de proteínas. As principais desvantagens desta técnica são a falta de intervalo dinâmico (as proteínas estruturais e as enzimas metabólicas abundantes tendem a mascarar espécies 2 ΕΡ 1 604 209/ΡΤ menos abundantes), ο baixo rendimento e a elevada intensidade de trabalho. A Dessorção/Ionização a Laser Realçado de Superfície (SELDI) (Weinberger et al., Journal of Chromatography B 782 : 307-316, 2002) é uma técnica baseada no enriquecimento selectivo de uma subpopulação de proteínas numa superfície de afinidade (p.ex., permuta iónica, fase inversa, anticorpos) seguido de análise espectrométrica de massa através de espectrometria de massa de Dessorção/Ionização a Laser Assistida por Matriz/Tempo de Voo (MALDI-TOF), uma técnica em que um co-precipitado de uma matriz absorvente de luz UV e biomoléculas é irradiado por um pulso de laser de nanossegundos. A maior parte da energia do laser é absorvida pela matriz, o que previne a fragmentação indesejada da biomolécula. As biomoléculas ionizadas são aceleradas num campo eléctrico e separadas de acordo com a sua razão de massa para carga num tubo de voo. No entanto, o poder de resolução deste sistema é limitado devido à resolução restrita da espectrometria de massa MALDI-TOF para análise de proteínas grandes e à separação sub-óptima de proteínas alcançada pela técnica empregue de separação tipo de extracção em fase sólida passo-a-passo.

Outra técnica alternativa é referida como etiquetas de afinidade codificadas por isótopos (ICAT) (Gygi et al., Nature Biotechnology 17(1): 994-9, 1999), que utiliza uma etiquetas de biotina específica de cisteína para comparar o padrão de expressão proteica em duas amostras diferentes. A etiqueta permite a extracção do péptido contendo cisteína de misturas proteicas digeridas com tripsina, o que reduz a complexidade dos fragmentos peptídicos até um nível em que a análise pode ser realizada mais facilmente. Através da utilização de duas etiquetas diferentes com diferentes composições isotópicas, os péptidos originários de duas amostras diferentes podem ser distinguidos quando analisados através de espectrometria de massa e pode-se obter uma estimativa relativa da abundância. No entanto, as limitações da técnica ICAT incluem a redução insuficiente da complexidade de amostras altamente complexas, requerendo assim mais separação através de cromatografia liquida e o facto das proteínas sem cisteínas não serem detectadas. 3 ΕΡ 1 604 209/ΡΤ

Todas as técnicas acima mencionadas sofrem de um conjunto de limitações em relação por exemplo à sensibilidade, velocidade, resolução e capacidade para serem aplicadas a diferentes tipos de proteínas p.ex. proteínas solúveis e ligadas à membrana. WO 02/086081 refere-se a um método de identificação de uma proteína incluindo a clivagem da proteína com um agente proteolítico para produzir fragmentos peptídicos, o contacto dos fragmentos com um array compreendendo reagentes de ligação, a detecção da ligação e a comparação com um conjunto de referência.

Outros métodos de análise de amostras proteicas conhecidos na arte anterior incluem a captura de péptidos gerados através de tripsina utilizando anticorpos, cada um dos quais se liga especificamente a um péptido conhecido de uma proteína conhecida (Scrivener, E. et al., Proteomics 3(2): 122-8, 2003; WO 02/25287). Os péptidos capturados são então caracterizados através de espectrometria de massa MALDI-TOF. Uma abordagem semelhante é descrita por Nelson et al. (1995,

Anal. Chem. 67: 1153-8) em que anticorpos específicos capturam proteínas intactas e as proteínas capturadas são eluídas e analisadas através de espectrometria de massa.

Ambas as abordagens pressupõem a identidade dos componentes proteicos a analisar e requerem a criação de moléculas de ligação para cada proteína individual. Assim, para desenhar um array para detectar e medir p.ex. 2000 proteínas, estas 2000 proteínas ou péptidos têm de ser isolados ou sintetizados seguido de criação de 2000 anticorpos específicos ou outras moléculas de ligação. Em contraste, o presente invento pode detectar um grande número de péptidos, tal como 10000, o que pode representar o mesmo número de proteínas, através da utilização de muitos menos, tais como apenas 200, ligantes diferentes.

DESCRIÇÃO DO INVENTO

Assim, um primeiro aspecto do presente invento proporciona um método para analisar uma amostra heterogénea de 4 ΕΡ 1 604 209/ΡΤ péptidos ou proteínas ou fragmentos peptídicos, compreendendo o método: a) a separação da amostra heterogénea de péptidos ou proteínas ou fragmentos peptídicos em classes heterogéneas através da ligação de membros de cada classe a uma localização definida separada por espaços num array, em que os membros de cada classe têm um motivo comum a essa classe; e b) a caracterização dos péptidos ou proteínas ou fragmentos peptídicos, em cada classe através da determinação da massa dos péptidos ou proteínas ou fragmentos peptídicos, nas classes heterogéneas e da determinação da abundância de péptidos ou proteínas ou fragmentos peptídicos de diferente massa nas classes heterogéneas. A amostra heterogénea de péptidos ou proteínas pode ser extraída de uma célula ou amostra de tecido ou derivada de fragmentação de uma amostra heterogénea de péptidos e proteínas extraídos de uma célula ou amostra de tecido, tipicamente (mas não necessariamente) de origem humana. A célula ou amostra de tecido pode ser derivada de tecido normal ou doente. A célula ou amostra de tecido pode ser derivada de tecidos em vários estados de diferenciação ou actividade. Fontes adicionais apropriadas de proteínas e péptidos incluem procariotas, linhas celulares eucarióticas, materiais de tecidos de ratinhos knock-out e outros modelos animais bem como plantas transgénicas e material vegetal. A amostra heterogénea pode ser processada antes da análise para remover proteínas ou péptidos particularmente abundantes, tais como albumina e/ou imunoglobulinas numa amostra de soro ou para enriquecer uma amostra numa determinada proteína ou péptido ou grupo de proteínas ou péptidos.

Cada classe heterogénea de péptidos ou proteínas consiste em todos os péptidos ou proteínas na amostra heterogénea que se ligarão a uma molécula de ligação especifica presente no array. A molécula de ligação é seleccionada quanto à sua capacidade para se ligar a um motivo, em vez de uma determinada proteína ou péptido e assim uma molécula de ligação pode ligar-se a diferentes tipos de proteínas e péptidos contendo o mesmo motivo. De preferência, cada 5 ΕΡ 1 604 209/ΡΤ molécula de ligação é específica para um dado motivo. Assim, uma classe heterogénea de proteínas e péptidos que se ligam a uma dada molécula de ligação num método do presente invento compreende tipicamente em média, pelo menos dois, mais tipicamente mais de dois, tal como 10, 20, 50, 100, 200, 500, 1000 ou mais tipos diferentes de proteínas ou péptidos. Por "tipo diferente" incluímos o significado de proteínas e péptidos que diferem na sequência de aminoácidos, massa, modificação pós-tradução e semelhantes.

Assim, as proteínas e péptidos são classificados pelo presente invento com base na sua capacidade para serem capturados e retidos por uma molécula de ligação específica. Uma classe heterogénea de péptidos ou proteínas ligar-se-á a uma molécula de ligação específica devido à presença de um motivo comum a todos os membros de uma determinada classe. A identidade do motivo ligado em cada classe de péptidos é, por essa razão, uma consequência da especificidade de ligação da molécula de ligação que define essa classe. O motivo pode ser uma sequência de aminoácidos linear ou não linear tal como de quatro, cinco, seis, sete, oito, nove, dez ou mais aminoácidos. Um motivo linear é formado de aminoácidos contíguos. Um motivo não linear compreende aminoácidos que não são adjacentes na sequência mas que são postos em íntima proximidade uns com os outros em resultado da dobragem tridimensional da proteína ou péptido.

As moléculas de ligação no array podem ser específicas para sequências em determinadas localizações dentro de uma proteína ou péptido, tais como sequências no terminal C, no terminal N ou numa posição definida relativamente a uma característica interna, tal como uma sequência ou um aminoácido modificado. Por exemplo, todas as moléculas de ligação no array podem ser específicas para sequências C-terminais, mas cada tipo de molécula de ligação pode ser específica para uma sequência C-terminal diferente de outros tipos de molécula de ligação no array. "constantes" e

De modo semelhante, as podem ser específicas para mistura de aminoácidos moléculas de ligação no array sequências que contenham uma variáveis. Os 6 ΕΡ 1 604 209/ΡΤ aminoácidos constantes (tal como definido mais abaixo) podem proporcionar uma característica constante comum a todos os motivos que se ligam a todas as moléculas de ligação no array. No entanto, a identidade exacta do motivo que se liga a cada tipo de molécula de ligação do array pode diferir com base na inclusão, em cada motivo, de um conjunto diferente de aminoácidos variáveis.

Habitualmente o motivo em cada péptido ou proteína conterá três, quatro ou cinco aminoácidos variáveis. Estes aminoácidos variáveis podem ser identificados como parte do motivo em virtude da sua posição dentro do péptido ou proteína (p.ex., relativamente ao terminal C, ao terminal N ou a uma característica interna) e/ou através da formação de uma motivo maior que contenha também aminoácidos “constantes".

Adicionalmente ou alternativamente uma característica do motivo pode ser a presença de um aminoácido modificado, tal como um aminoácido fosforilado ou um aminoácido glicosilado. De preferência, o motivo deve conter pelo menos um aminoácido não modificado. De maior preferência, todos os aminoácidos no motivo são não modificados.

Fragmentação da amostra O método do presente invento pode compreender o passo inicial de fragmentação da amostra heterogénea de proteínas ou péptidos para produzir uma amostra heterogénea de fragmentos peptídicos. A fragmentação de uma amostra heterogénea de proteínas ou péptidos pode ser vantajosa porque pode aumentar o número de moléculas peptídicas que representam cada proteína ou péptido original. Por exemplo, se uma proteína na amostra original for fragmentada, a ligação de qualquer um dos seus múltiplos fragmentos pode ser utilizada como um marcador da presença e abundância dessa proteína. Por outras palavras, a fragmentação aumenta a possibilidade de qualquer proteína ou péptido particular ser representado em qualquer dada classe heterogénea. Isto significa que podem ser utilizadas menos moléculas de ligação sem reduzir a informação que pode ser obtida a partir de cada amostra analisada. 7 ΕΡ 1 604 209/ΡΤ A fragmentação permite também a detecção de proteínas transmembranares que, sem fragmentação, não podem ser analisadas.

Tabela 1

Enzima Local Preferido tripsina Rx = Lys, Arg quimiotripsina Rx = Tyr, elevado Phe, Leu, Ile, Vai , Trp e His a pH pepsina Rx = Phe, Leu, muitos outros trombina Rx = Arg papaina Rx- Arg, Lys, Phe-X (lado CO do resíduo a seguir a Phe) bromelaína Rx = Lys, Ala, Tyr, Gly protease de Rx = Glu, Asp Staphylococcus aureus Factor Xa Rx = Ile- Glu-Gly-Arg termolisina R2 = Tyr, Phe, Leu, Ile, Vai, Trp e His

Em que Ri e R2 são definidos de acordo com a seguinte fórmula:

terminal N---NH-CHRX-C0-NH-CHR2-C0---terminal C O passo de fragmentação da amostra heterogénea de proteínas, polipéptidos ou péptidos pode ser alcançado através de qualquer método conhecido na arte. Por exemplo, pode ser utilizada clivagem química ou enzimática. São conhecidos na arte numerosos métodos de clivagem química ou enzimática (i.e. dirigidos por proteases). Por exemplo, as proteases incluem tripsina, quimiotripsina, pepsina, trombina, papaína, bromelaína, termolisina, subsilisina, Factor Xa, protease de Staphylococcus aureus e carboxipeptidase A. Numa concretização preferida, o método de fragmentação clivará proteínas, polipéptidos ou péptidos em localizações definidas. A clivagem enzimática é tipicamente dirigida à sequência, tal como mostrado na Tabela 1 acima. Os métodos de clivagem química podem também ser dirigidos à sequência, p.ex. fragmentação com brometo de cianogénio, que clivará uma proteína ou péptido no lado C-terminal da metionina. 8 ΕΡ 1 604 209/ΡΤ

Assim, por exemplo, a clivagem por tripsina é um meio de fragmentação dirigido à sequência, uma vez que a clivagem é dirigida pela presença de resíduos de arginina ou lisina numa proteína, polipéptido ou péptido e produz concordantemente fragmentos de clivagem que têm, como seu resíduo C-terminal, uma arginina ou lisina. O perito na arte está a par de muitos outros meios de fragmentação “dirigida", tal como os descritos em WO 02/25287.

Habitualmente, o motivo em cada fragmento estará na mesma localização em cada fragmento, relativamente ao local de clivagem. Assim, por exemplo, quando são criados fragmentos através de um mecanismo de clivagem dirigido à sequência (ver abaixo), o motivo pode então compreender um ou mais aminoácidos adjacentes ao local do terminal criados pela clivagem, alguns dos quais podem ser constantes em resultado do mecanismo de clivagem dirigido à sequência.

Assim, um ou mais aminoácidos que formam a sequência que dirige a clivagem podem ser mantidos no fragmento. Por exemplo, quando clivagem por tripsina é utilizada como método de fragmentação então os fragmentos produzidos têm, como seu resíduo C-terminal, uma arginina ou lisina. Assim o motivo pode englobar aminoácidos que fazem parte do local de clivagem.

Assim, o motivo em cada fragmento gerado pode compreender um ou mais, tal como dois, três, quatro ou mais aminoácidos constantes. Para os fins do presente invento, o perito na arte apreciará que o termo "constante", quando utilizado no contexto de um aminoácido dentro de um motivo, inclui posições de aminoácidos em que existe um baixo nível de variabilidade, tal como 2, 3, 4, 5, 6, 7, 8, 9 ou 10 possibilidades diferentes. São preferidos números menores. Por exemplo, o motivo em fragmentos trípticos pode compreender o aminoácido C-terminal, que é assim um resíduo constante de arginina ou lisina. Por outras palavras, a identidade de um aminoácido "constante" não é tão aleatória como noutras posições "variáveis".

Assim, o motivo pode ser formado a partir de uma mistura de aminoácidos constantes e não constantes (i.e. variáveis). 9 ΕΡ 1 604 209/ΡΤ

Habitualmente ο motivo conterá três, quatro ou cinco aminoácidos variáveis, sendo os outros aminoácidos no motivo (se houver algum) constantes entre todos os fragmentos.

Arrays O passo de separação da amostra heterogénea de proteínas, péptidos e/ou fragmentos destes em classes heterogéneas com base na presença de um motivo é alcançado através da ligação de membros de cada classe a uma localização definida separada por espaços num array.

Os arrays per se são bem conhecidos na arte. Tipicamente são formados por uma estrutura linear ou bidimensional possuindo regiões espaçadas (i.e. discretas) ("pontos"), possuindo cada uma área finita, formada à superfície de um suporte sólido. Um array pode também ser uma estrutura em conta em que cada conta pode ser identificada através de um código molecular ou código de cor ou identificada num fluxo contínuo. A análise pode também ser efectuada sequencialmente quando a amostra é passada por uma série de pontos cada um adsorvendo a classe de moléculas da solução. O suporte sólido é tipicamente vidro ou um polímero, sendo os polímeros mais vulgarmente utilizado celulose, poliacrilamida, nylon, poliestireno, poli(cloreto de vinilo) ou polipropileno. Os suportes sólidos podem estar na forma de tubos, contas, discos, placas de silicone, microplacas, membrana de poli(difluoreto de vinilideno) (PVDF), membrana de nitrocelulose, membrana de nylon, outras membranas porosas, membrana não porosa (p.ex., plástico, polímero, perspex, silicone, entre outras), uma variedade de palitos poliméricos ou uma variedade de poços de microtítulo ou qualquer outra superfície adequada para imobilização de proteínas, polinucleótidos e outras moléculas adequadas e/ou de condução de um imunoensaio. Os processos de ligação são bem conhecidos na arte e consistem geralmente na ligação cruzada covalente ou adsorção física de uma molécula proteica, polinucleótido ou semelhante ao suporte sólido. A localização de cada ponto pode ser definida através da utilização de técnicas bem conhecidas, tais como impressão de contacto ou de não contacto, máscara ou fotolitografia. Para revisões ver Jenkins, R.E., Pennington, 10 ΕΡ 1 604 209/ΡΤ S.R. (2001, Proteomics 2: 13-29) e Lai et al. (2002, Drug

Discov. Today 15: 7(18 Supl): S143-9).

Tipicamente o array é um microarray. Por "microarray" incluímos o significado de um array de regiões possuindo uma densidade de regiões discretas de pelo menos cerca de 100/cm2, e de preferência de pelo menos cerca de 1000/cm2. As regiões num microarray têm dimensões típicas, p.ex., diâmetros, no intervalo de entre cerca de 10-250 pm, e estão separadas de outras regiões no array por cerca da mesma distância.

Tipicamente os pontos no array compreendem vários tipos diferentes de molécula de ligação (tal como definido acima), sendo cada tipo imobilizado num ponto separado no array. Assim através da utilização de um método de criação de pontos com localizações definidas, é possível conhecer a identidade e/ou a afinidade de ligação de cada ponto no array.

De preferência, cada tipo de molécula de ligação e por essa razão, cada ponto, é capaz de se ligar especificamente a um motivo definido tal como definido acima e os diferentes tipos de molécula de ligação têm especificidades de ligação diferentes. Assim as proteínas, péptidos e/ou fragmentos destes que se ligam a um ponto partilharão um motivo comum. Inversamente, as proteínas, péptidos e/ou fragmentos destes em pontos diferentes são separados em classes heterogéneas com base na presença de motivos diferentes.

Assim, quando o motivo é uma sequência terminal, tal como uma sequência C-terminal, então a molécula de ligação num ponto ligar-se-á especificamente a proteínas, péptidos e/ou fragmentos destes que compreendam uma dada primeira sequência C-terminal, enquanto uma molécula de ligação noutro ponto se ligará especificamente a proteínas, péptidos e/ou fragmentos destes que compreendam uma dada segunda sequência C-terminal, sendo a primeira e a segunda sequências C-terminais diferentes.

Numa concretização, todas as moléculas de liqação no array são específicas para motivos C-terminais. Noutra concretização, todas as moléculas de ligação no array são específicas para motivos N-terminais. Noutra concretização, 11 ΕΡ 1 604 209/ΡΤ todas as moléculas de ligação no array são específicas para motivos que não sejam posicionalmente conservados.

Quando as proteínas ou péptidos são fragmentados antes da análise, os motivos alvo definidos podem ser seleccionados dependendo do método de fragmentação utilizado. Por exemplo, quando é utilizada clivagem por tripsina como método de fragmentação, então, tal como discutido acima, os fragmentos produzidos têm como resíduo C-terminal uma arginina ou lisina. Assim, pode ser útil separar fragmentos com base, por exemplo, nos seus primeiros quatro resíduos C-terminais. Uma vez que cada fragmento terá uma arginina ou lisina como seu resíduo C-terminal verificar-se-á variabilidade apenas nas posições 2, 3 e 4 (relativamente ao resíduo C-terminal que, neste contexto, é designado como posição 1). Neste exemplo, o nível máximo de variabilidade apresentada pelo tetrapéptido C-terminal será de 2x20x20x20 = 16 000 possíveis motivos diferentes. Utilizando o mesmo esquema, se o motivo utilizado para classificar fragmentos trípticos for baseado, por exemplo, nos primeiros cinco resíduos C-terminais, então o nível máximo de variabilidade apresentada será de 2x20x20x20x20 = 320 000 possíveis motivos diferentes. O perito na arte apreciará que o número total de motivos terminais diferentes gerado pode ser aumentado através do aumento do número de aminoácidos variáveis em cada motivo alvo e diminuído através da substituição de aminoácidos variáveis por aminoácidos constantes. Para além disso, a abundância de cada motivo numa amostra heterogénea de proteínas, péptidos ou fragmentos destes pode ser aumentada através da redução do tamanho do motivo e diminuída através do aumento do tamanho do motivo.

Assim, um método de fragmentação que utiliza um mecanismo de clivagem dirigido à sequência para gerar fragmentos possuindo um aminoácido terminal definido ou uma sequência terminal definida pode ser utilizado para reduzir o número total de motivos terminais diferentes, para qualquer dado comprimento do motivo.

Um array adequado para utilizar num método tal como definido acima pode compreender vários tipos diferentes de 12 ΕΡ 1 604 209/ΡΤ molécula de ligação, cada tipo imobilizado numa localização definida e discreta no array, em que cada tipo de molécula de ligação é capaz de se ligar especificamente a um motivo tal como definido acima e em que os diferentes tipos de molécula de ligação têm especificidades de ligação diferentes. Não é necessário que o array possua tantos tipos diferentes de moléculas de ligação como os possíveis motivos diferentes. Isto porque cada molécula de ligação é específica apenas para um motivo, não uma proteína particular (ao contrário dos métodos da arte anterior, tais como WO 02/25287), e assim múltiplas proteínas, péptidos ou fragmentos destes diferentes podem ligar-se a um dado ponto no array. Para além disso, quando a amostra proteica ou peptídica é fragmentada antes da análise, cada proteína ou péptido na amostra original pode gerar múltiplos fragmentos. Assim o array pode proporcionar um número adequado de tipos diferentes de molécula de ligação de modo a que pelo menos um fragmento de cada proteína ou péptido na amostra se possa ligar especificamente a uma molécula de ligação.

De facto, o perito na arte apreciará que a amostra heterogénea de proteínas ou péptidos possa ser caracterizada utilmente mesmo que nem todas as proteínas ou péptidos da amostra não fragmentada possam estar representados.

Idealmente, o número de tipos diferentes de molécula de ligação proporcionado num array é adequado para capturar pelo menos 10, 20, 30, 40, 50, 60, 70, 80, 90, 95, 98, 99 ou substancialmente 100% dos tipos de proteínas ou péptidos na amostra, ou pelo menos um fragmento derivado da percentagem acima referida de tipos de proteínas ou péptidos na amostra. A percentagem tal como aqui se utiliza não se refere ao teor proteico total em massa, uma vez que uma amostra pode compreender muitas proteínas diferentes mas uma proteína particular pode predominar e, nesse caso, a ligação da proteína predominante até à exclusão de todas as outras pode representar a captura de uma elevada percentagem de proteína da amostra, contudo produziria pouca ou nenhuma informação proteómica. Em vez disso, a percentagem é utilizada para reflectir a variedade de diferentes espécies proteináceas na amostra, independentemente da abundância de cada espécie. Assim cada tipo diferente de proteína ou péptido na amostra 13 ΕΡ 1 604 209/ΡΤ não fragmentada representa "um" e a percentagem de captura de proteínas ou péptidos de uma amostra pode ser determinada através da divisão da soma de todos os diferentes tipos de proteínas ou péptidos capturados, tal como determinado através do método do presente invento, pela soma de todas as proteínas ou fragmentos peptídicos diferentes na amostra não fragmentada, tal como determinado através de métodos conhecidos na arte anterior, tais como electroforese bidimensional conjugada com espectrometria de massa, e multiplicando por cem.

Como exemplo in silico, uma degradação por tripsina estimulada de 10000 sequências proteicas extraídas de SwissProt resulta em 400000 fragmentos peptídicos. A abundância de fragmentos possuindo cada tipo de motivo tetrapeptídico C-terminal possível varia entre 0-10%. Um array adequado pode ser formado através da escolha de moléculas de ligação com afinidade para motivos adequadamente abundantes, e assim um número limitado de diferentes moléculas de ligação será capaz de capturar um grande conjunto de fragmentos diferentes. Por exemplo, apenas 200 dessas moléculas de ligação diferentes, cada uma capturando em média 100 péptidos, capturará 20000 fragmentos de uma digestão tríptica de uma preparação proteica feita a partir de uma amostra de tecido. A análise in silico de um proteoma teórico consistindo em todas as sequências proteicas humanas em SwissProt (aproximadamente 10500 sequências) indica que, se os motivos forem escolhidos aleatoriamente a partir de todos os motivos possíveis com uma frequência teórica de aproximadamente 100 no proteoma acima definido, os péptidos capturados conterão um ou mais péptidos de 75% de todas essas proteínas. Uma selecção racional de moléculas de ligação para evitar sobreposições desnecessárias (através da captura de muitos péptidos de certas proteínas e de nenhum das outras) aumentará mais a cobertura.

Deste modo, o array pode ter pelo menos cerca de 10, 50, 100, 150, 200, 250, 300, 350, 400, 500, 600, 700, 800, 900, 1000 ou mais tipos diferentes de moléculas de ligação tal como definido acima.

Cada ponto no array pode ligar-se em média a 2, 4, 6, 8, 10, 20, 40, 60, 80, 100, 200, 400, 600, 800, 900, 1000, 1500, 14 ΕΡ 1 604 209/ΡΤ 2000 ou mais tipos diferentes de proteínas, péptidos ou fragmentos destes, possuindo cada um o mesmo motivo. Neste contexto, "tipos diferentes" de proteínas, péptidos ou fragmentos destes refere-se a proteínas, péptidos ou fragmentos destes, que tenham pelo menos um dos seguintes: sequências diferentes; massas moleculares diferentes; e/ou modificações pós-tradução diferentes.

Moléculas de ligação

As moléculas de ligação podem ser seleccionadas a partir de uma biblioteca, com base na sua capacidade para se ligarem a um dado motivo, tal como discutido abaixo.

Pelo menos um tipo, mais tipicamente todos os tipos, das moléculas de ligação podem ser um anticorpo ou fragmentos ou variantes deste.

Assim, um fragmento pode conter um ou mais dos domínios variável pesado (VH) ou variável leve (VL) . Por exemplo, o termo fragmento de anticorpo inclui moléculas semelhantes a Fab (Better et al., Science 240: 1041, 1988); moléculas Fv (Skerra et al. , Science 240 : 1038, 1988); moléculas Fv de cadeia simples (ScFv) em que os domínios parceiros VH e VL estão ligados através de um oligopéptido flexível (Bird et al., Science 242: 423, 1988; Huston et al., Proc. Natl. Acad. Sei. USA 85: 5879, 1988) e anticorpos de domínio simples (dAb) compreendendo domínios V isolados (Ward et al., Nature 341: 544, 1989). O termo "variante de anticorpo" inclui quaisquer anticorpos sintéticos, anticorpos recombinantes ou híbridos de anticorpos, tais como, mas não se limitando a uma molécula de anticorpo de cadeia simples produzida através de apresentação fágica das regiões variável e/ou constante da cadeia leve e/ou pesada da imunoglobulina ou outra molécula imuno-interactiva capaz de se ligar a um antigénio num formato de imunoensaio que seja conhecido dos peritos na arte.

Uma revisão geral das técnicas envolvidas na síntese de fragmentos de anticorpo que mantenham os seus locais de 15 ΕΡ 1 604 209/ΡΤ ligação específicos encontra-se em Winter e Milstein, Nature 349: 293-299, 1991.

Adicionalmente ou alternativamente pelo menos um tipo, mais tipicamente todos os tipos de moléculas de ligação são um aptâmero.

Adicionalmente ou alternativamente pelo menos um tipo, mais tipicamente todos os tipos de moléculas de ligação são um polinucleótido.

Selecção das moléculas de ligação

Bibliotecas moleculares tais como bibliotecas de anticorpos (Clackson et al., Nature 352: 624-628, 1991; Marks et al., J. Mol. Biol. 222(3): 581-97, 1991), bibliotecas peptídicas (Smith, Science 228(4705): 1315-7, 1985), bibliotecas de ADNc expresso (Santi et al., J. Mol. Biol. 296(2): 497-508, 2000), bibliotecas noutras estruturas para além da estrutura de anticorpo tais como aficorpos (Gunneriusson et al., Appl. Environ. Microbiol. 65(9): 4134- 40, 1999) ou bibliotecas baseadas em aptâmeros (Kenan et al.,

Methods Mol. Biol. 118: 217-31, 1999) podem ser utilizadas como fonte a partir da qual as moléculas de ligação que são específicas para um dado motivo são seleccionadas para utilizar nos método do presente invento.

As bibliotecas moleculares podem ser expressas in vivo em células procarióticas (Clackson et al., op. cit., 1991; Marks et al. , op. cit., 1991) ou eucarióticas (Kieke et al., Proc.

Natl. Acad. Sei. USA 96 (10) : 5651-6, 1999) ou podem ser expressas in vitro sem envolvimento de células (Hanes e Pluckthun, Proc. Natl. Acad. Sei. USA 94(10): 4937-42, 1997;

He e Taussig, Nucleic Acids Res. 25(24): 5132-4, 1997; Nemoto et al., FEBS Lett. 414(2): 405-8, 1997).

Em casos em que bibliotecas baseadas em proteínas são utilizadas frequentemente os genes codificando as bibliotecas de potenciais moléculas de ligação são empacotados em vírus e a potencial molécula de ligação é apresentada à superfície do vírus (Clackson et al., op. cit., 1991; Marks et al., op. cit., 1991; Smith, op. cit., 1985). 16 ΕΡ 1 604 209/ΡΤ

Tal sistema mais vulgarmente utilizado, actualmente, é o de bacteriófagos filamentosos apresentando fragmentos de anticorpo à sua superfície, sendo os fragmentos de anticorpo expressos como uma fusão com a proteína de revestimento menor do bacteriófago (Clackson et al., op. cit., 1991; Marks et al., op. cit., 1991). No entanto, foram também utilizados outros sistemas para apresentação utilizando outros vírus (EP 39578), bactérias (Gunneriusson et al., op. cit., 1999;

Daugherty et al., Protein Eng. 11 (9): 825-32, 1998; Daugherty et al., Protein Eng. 12(7): 613-21, 1999) e levedura (Shusta et al., J. Mol. Biol. 292(5): 949-56, 1999).

Adicionalmente, foram recentemente apresentados sistemas de apresentação utilizando a ligação do produto polipeptídico ao seu ARNm codificante nos designados sistemas de apresentação ribossómica (Hanes e Pluckthun, op. cit., 1997; He e Taussig, op. cit., 1997; Nemoto et al., op. cit., 1997), ou alternativamente a ligação do produto polipeptídico ao ADN codificante (ver Patente U.S. N.° 5856090 e WO 98/37186).

Quando são seleccionadas potenciais moléculas de ligação a partir de bibliotecas é habitualmente empregue um ou poucos péptidos selectores possuindo motivos definidos. Os resíduos de aminoácidos que proporcionam estrutura, menor flexibilidade no péptido ou cadeias laterais com carga, polares ou hidrófobas permitindo a interacção com a molécula de ligação, podem ser utilizados no desenho de motivos para péptidos selectores. Por exemplo: i) A prolina pode estabilizar uma estrutura peptídica uma vez que a sua cadeia lateral se liga tanto ao carbono alfa como ao azoto; ii) A fenilalanina, a tirosina e o triptofano têm cadeias laterais aromáticas e são altamente hidrófobos, enquanto a leucina e a isoleucina têm cadeias laterais alifáticas e são também hidrófobos; iii) A lisina, a arginina e a histidina têm cadeias laterais básicas e terão carga positiva a pH neutro, enquanto o aspartato e o glutamato têm cadeias laterais ácidas e terão carga negativa a pH neutro; 17 ΕΡ 1 604 209/ΡΤ iv) A asparagina e a glutamina são neutras a pH neutro mas contêm um grupo amida gue pode participar em ligações de hidrogénio; v) As cadeias laterais da serina, treonina e tirosina contêm grupos hidroxilo, gue podem participar em ligações de hidrogénio.

Tipicamente a selecção de moléculas de ligação pode envolver a utilização de tecnologia de arrays e sistemas para analisar a ligação a pontos correspondentes aos tipos das moléculas de ligação.

As potenciais moléculas de ligação, p.ex. fragmentos de anticorpo numa biblioteca, podem ser clonadas e colocadas em pontos num formato de array. A posição do ponto pode correlacionar-se com a identidade do clone. De seguida, deixar-se-á os péptidos selectores possuindo motivos definidos ligarem-se ao array. Nos pontos que contiverem moléculas de ligação contra o motivo definido de um determinado péptido selector, esse péptido selector particular liga-se e a ligação dá um sinal legível permitindo ao utilizador determinar a posição do ponto e assim a identidade do clone do qual foi obtida a molécula de ligação positiva. Os falsos positivos (p.ex., moléculas de ligação que se ligam a regiões do péptido selector diferentes do motivo) podem ser evitados através da medição da capacidade dos putativos positivos para se ligarem a péptidos semelhantes sem o motivo, em que a ligação desses péptidos semelhantes indica que o putativo ligante é um falso positivo.

De modo semelhante, podem ser pesquisadas bibliotecas de potenciais moléculas de ligação polinucleotídicas quanto à capacidade para se ligarem a péptidos selectores possuindo motivos definidos (p.ex., utilizando o chip Affymetrix comercialmente disponível).

Uma vez isolado um número adequado de moléculas de ligação, o perito pode produzir um array.

Um método para produzir uma biblioteca de moléculas de ligação pode compreender os seguintes passos: 18 ΕΡ 1 604 209/ΡΤ a) proporcionar, como primeiro componente, um péptido selector compreendendo um motivo tal como definido acima; b) proporcionar, como segundo componente, uma fonte de moléculas de ligação candidatas, tal como uma biblioteca molecular tal como definido acima; c) combinar o primeiro e segundo componentes; e d) identificar moléculas de ligação candidatas que sejam capazes de se ligar especificamente ao motivo do péptido selector no primeiro componente.

Uma biblioteca, tipicamente uma biblioteca em que os membros tenham sido pré-seleccionados através do método de cima pode compreender pelo menos 10, 50, 100, 150, 200, 250, 300 ou mais tipos diferentes de moléculas de ligação, sendo cada tipo capaz de se ligar especif icamente a um motivo tal como definido acima e os diferentes tipos possuindo diferentes especificidades de ligação. Pelo menos uma molécula de ligação da biblioteca, habitualmente todas as moléculas de ligação numa biblioteca, podem ser anticorpos ou fragmentos ou variantes destes, tais como Fv, scFv ou Fab; aptâmeros; e/ou polinucleótidos.

Uma biblioteca de moléculas de ligação tal como definido acima pode ser utilizada para produzir um array tal como descrito acima.

Um método para produzir um array adequado para utilizar num método de acordo com o primeiro aspecto do presente invento pode compreender: a) proporcionar uma biblioteca de diferentes tipos de moléculas de ligação, sendo cada tipo capaz de se ligar especificamente a um motivo tal como definido acima e os diferentes tipos possuindo diferentes especificidades de ligação; b) imobilizar as moléculas de ligação num array de modo a que diferentes tipos de moléculas de ligação sejam imobilizadas em localizações definidas e discretas.

Os métodos de imobilização de moléculas de ligação tais como anticorpos, aptâmeros, polinucleótidos e semelhantes em 19 ΕΡ 1 604 209/ΡΤ localizações definidas e discretas num array são discutidos acima e em qualquer caso são bem conhecidos na arte.

Um sistema para análise de uma amostra heterogénea de proteínas ou péptidos pode compreender um array tal como descrito acima e um transportador de dados compreendendo informação sobre a identidade e/ou a propriedade de ligação e posição de cada tipo de molécula de ligação diferente no array. O transportador de dados pode ser um transportador de dados electrónico, tipicamente na forma de um transportador de dados legível em computador. A informação pode correlacionar a posição (ponto) no array com a identidade de um clone da biblioteca que tenha contribuído com a molécula de ligação nesse ponto do array, permitindo deste modo que o utilizador investigue melhor as características de uma molécula de ligação produzida por um dado clone. Adicionalmente ou alternativamente, o transportador de dados pode compreender informação sobre as características de ligação de uma molécula de ligação numa dada posição no array.

Condições de pesquisa

Tendo proporcionado um array adequado, é possível analisar uma amostra de acordo com o método do presente invento. Para separar uma amostra heterogénea de proteínas, péptidos e/ou fragmentos destes em classes heterogéneas através da ligação de cada membro da classe a uma localização espaçada definida num array, possuindo cada classe heterogénea um motivo comum a essa classe, é importante para as condições de ligação que sejam adequadamente rigorosas para evitar substancialmente ligação não específica. A formação de complexos molécula de ligação:motivo pode ser efectuada sob uma variedade de condições. As soluções reaccionais contendo fragmentos peptídicos podem conter vários graus de sal ou serem apresentadas a vários níveis de pH. Adicionalmente, a reacção de ligação pode ser realizada a temperaturas variáveis. Em geral as condições de pH variarão de 2-10 (de preferência em torno de pH 8), as temperaturas de 0°C-100°C e as condições salinas de 1 μΜ a 5 M (no caso de NaCl). 20 ΕΡ 1 604 209/ΡΤ

Após ο passo de combinação da amostra heterogénea de proteínas, péptidos e/ou fragmentos destes com o array sob condições gue permitam ligação específica, o array é tipicamente lavado para remover proteínas, péptidos ou fragmentos destes não ligados. As soluções apropriadas para lavagem podem conter sais, tais como cloreto de sódio, agentes de tamponamento tais como tampão fosfato, agentes caotrópicos tais como ureia e detergentes tais como Tween-20. A concentração destes componentes, bem como o pH da solução, podem ser optimizados para se obter uma condição de lavagem adeguadamente rigorosa. Antes da análise de espectrometria de massa MALDI-TOF (ver abaixo), o array deve ser lavado com água destilada para remover sais, detergentes, polímeros ou outros compostos que possam interferir com a análise.

Os peritos podem adaptar as condições de reacção de ligação e de lavagem para alcançar uma condição apropriada para evitar a ligação não específica através da aplicação de uma mistura de proteínas, péptidos e/ou fragmentos destes possuindo sequências conhecidas a um array e da determinação de se quaisquer proteínas, péptidos e/ou fragmentos destes se ligam não especificamente (i.e. a pontos possuindo moléculas de ligação de um tipo que seja específico para um motivo que não esteja contido numa proteína, péptido e/ou fragmento destes da mistura). Se ocorrer ligação não específica, o rigor das condições utilizadas pode ser aumentado. Alternativamente, o utilizador pode substituir a molécula de ligação responsável pela ligação de baixa especificidade por uma molécula de ligação com uma especificidade mais elevada.

As constantes de afinidade são uma medida da interacção entre um determinado ligando e o seu receptor cognato. A “afinidade de ligação" ou a medida da força de associação entre uma determinada molécula de ligação e o seu motivo alvo é geralmente medida através de constantes de afinidade para as concentrações de equilíbrio de configurações associadas ou dissociadas da molécula de ligação ao seu alvo. De preferência, a ligação de uma molécula de ligação ao seu motivo deve ocorrer a uma afinidade de cerca de KD = 10”6 M ou mais para ser útil para o presente invento, sendo preferível mais de cerca de 10”7 M, e ainda de maior preferência entre cerca de 10”8 M e cerca de 10”11 M. Os fragmentos de anticorpo 21 ΕΡ 1 604 209/ΡΤ terão geralmente afinidades de ligação no intervalo de cerca de 1CT7 M a 1CT8 M.

Caracterização de classes heterogéneas de proteínas, péptidos e/ou fragmentos destes ligados

Uma vez separadas em classes heterogéneas num array, as proteínas, péptidos ou fragmentos destes em cada classe podem então ser melhor caracterizados através de técnicas analíticas conhecidas na arte tais como a espectrometria de massa de dessorção (p.ex., espectrometria de massa MALDI-TOF; ver Roepstorff, P., EXS 88: 81-97, 2000), para produzir informação na forma de espectrogramas de massa, em que cada pico indicará a presença, a massa e a quantidade relativa de um péptido específico.

Quando a fragmentação da amostra é efectuada antes da análise da amostra, a identidade da proteína ou do péptido a partir do qual o fragmento capturado é derivado (i.e. a “proteína original") pode ser determinada através de espectrometria de massa de dissociação induzida por colisão, que pode ser utilizada para obter informação estrutural de um péptido.

Também, se a especificidade da molécula de ligação for conhecida e forem utilizadas condições suficientemente rigorosas, pode-se saber se uma proteína, péptido ou fragmento deste capturado num dado ponto compreende um dado motivo. Por exemplo, se o motivo for os primeiros quatro aminoácidos C-terminais, então é possível deduzir a sequência do tetrapéptido C-terminal de todas as proteínas, péptidos ou fragmentos destes num dado ponto. A informação sobre o teor do motivo, em combinação com a determinação exacta da massa obtida através de espectrometria de massa, pode ser suficiente para fazer corresponder a informação à proteína, péptido ou fragmento destes gerado através de análise in silico de uma base de dados de sequências proteicas ou uma digestão in silico de sequências aí presentes. 22 ΕΡ 1 604 209/ΡΤ

Deste modo, ο passo de caracterização das proteínas, péptidos ou fragmentos destes em cada classe heterogénea compreende a caracterização das proteínas, péptidos ou fragmentos destes ligados em cada localização definida e discreta no array, através da determinação da massa das proteínas, péptidos ou fragmentos destes em cada classe e/ou a abundância de cada proteína, péptido ou fragmento destes de diferente massa em cada classe. Habitualmente isto é efectuado através de espectrometria de massa de dessorção. O passo de caracterização dos fragmentos em cada classe heterogénea pode compreender adicionalmente a determinação da identidade das proteínas ou péptidos na amostra heterogénea não fragmentada a partir dos quais são derivados os fragmentos detectados (i.e. os “originais"). Isto é tipicamente efectuado através de espectrometria de massa induzida por colisão. Os dados assim adquiridos podem produzir informação da sequência ou podem ser utilizados para pesquisar bases de dados de sequências proteicas quanto a sequências correspondentes. A intensidade relativa do sinal obtido a partir de um péptido específico através de espectrometria de massa é dependente da concentração, do peso molecular e das características de ionização do péptido. A qualidade da quantificação pode ser melhorada através da adição de proteínas de referência marcadas com isótopos (Goshe, B.G. e Smith, D.S., Curr. Opinion. Biotech. 14: 101-109, 2003). A informação em relação à abundância de um fragmento e à identidade da proteína ou péptido original pode ser utilizada para quantificar a proteína ou péptido original na amostra heterogénea não fragmentada.

Um dos benefícios do presente invento pode ser observado na análise de cada classe heterogénea de proteínas, péptidos ou fragmentos destes. O presente invento proporciona um método no qual cada classe heterogénea é analisada sem necessidade de mais separação dos componentes de cada classe. Assim, o presente invento tem vantagens em relação aos métodos da arte anterior que utilizam múltiplos passos de separação por afinidade (tal como WO 02/060377), uma vez que os métodos da arte anterior assentam em múltiplos passos de captura/eluição dos péptidos e num sistema complexo de manuseamento de 23 ΕΡ 1 604 209/ΡΤ fluidos, que são laboriosos e demorados. Em contraste, o presente invento proporciona um método de um único passo para subfraccionamento de proteínas, péptidos ou fragmentos destes em diferentes classes heterogéneas seguido de caracterização directa de cada classe, p.ex. através de espectrometria de massa.

Adicionalmente, o presente invento proporciona informação qualitativa e quantitativa acerca de cada classe heterogénea. Por exemplo, pode ser determinado o peso molecular e a abundância de cada uma das espécies dentro de cada classe. Isto é uma melhoria em relação à arte anterior (p.ex., WO 02/060377) que apenas proporciona a determinação da quantidade total de proteína em qualquer ponto.

Aplicações

Uma aplicação do presente invento é para comparação entre amostras diferentes. Os peritos apreciarão que os dados gerados pelo método de acordo com o presente invento podem ser extremamente complexos e podem envolver vários milhares de diferentes unidades de dados. Pode ser apropriado recolher, armazenar e analisar os dados gerados através de meios electrónicos. Por essa razão, um transportador de dados pode compreender informação obtenível através de um método de acordo com primeiro aspecto do presente invento. Podem ser proporcionados um sistema electrónico de processamento de dados, tal como um computador, compreendendo um transportador de dados compreendendo informação obtenível através de um método de acordo com primeiro aspecto do presente invento e meios para comparar a informação obtenível através da análise de diferentes amostras. Neste contexto, um meio para comparação é tipicamente um programa de computador desenhado para comparar dados gerados a partir da análise de uma variedade de amostras e realçar diferenças entre as amostras, permitindo deste modo que o utilizador identifique prontamente proteínas e péptidos de interesse candidatos.

Tais comparações podem incluir amostras a partir p.ex. de tecido normal e doente ou p.ex. a partir de tecidos em vários estados de diferenciação ou activação. O presente invento pode, assim, ser utilizado para comparar rapidamente e 24 ΕΡ 1 604 209/ΡΤ eficazmente um grande conjunto de amostras para pesquisar diferenças na composição em proteínas ou péptidos. Tais diferenças podem ser utilizadas para a identificação de moléculas com potencial como alvo de fármacos.

Deste modo, um método de identificação de diferenças na composição entre duas ou mais amostras heterogéneas de proteínas, polipéptidos ou péptidos pode compreender a análise de cada amostra através de um método de acordo com o primeiro aspecto do presente invento, para deste modo identificar quaisquer diferenças.

Um array ou sistema tal como descrito acima pode ser utilizado para analisar uma ou mais amostras heterogéneas de proteínas, péptidos e/ou fragmentos destes, utilizando métodos tais como os descritos acima. A utilização pode ser identificar uma proteína relacionada com doença através da análise de pelo menos uma amostra, tipicamente uma amostra ex vivo, derivada de um indivíduo com a doença e pelo menos uma outra amostra, tipicamente uma amostra ex vivo, derivada de um indivíduo sem a doença. Doenças adequadas para análise incluem doenças neurodegenerativas, cancro, doenças inflamatórias, doenças cardiovasculares e distúrbios metabólicos.

Assim, um método para identificação de uma proteína, polipéptido ou péptido relacionado com doença pode compreender a identificação de diferenças entre duas ou mais amostras através do método de cima, em que pelo menos uma das amostras analisadas é derivada de um indivíduo com a doença e a outra amostra analisada é derivada de um indivíduo sem a doença.

Para além disso, uma vez identificada uma proteína ou péptido relacionado com doença, pode ser proporcionado um método de diagnóstico do estado de doença de um indivíduo compreendendo a análise de uma amostra, tipicamente uma amostra ex vivo tomada a partir do indivíduo, através de um método de acordo com o primeiro aspecto do presente invento e a determinação de se os resultados correspondem com a proteína, polipéptido ou péptido relacionado com a doença, identificado através do método tal como descrito acima. 25 ΕΡ 1 604 209/ΡΤ

Após diagnóstico de um indivíduo como possuindo uma doença ou condição através da utilização dos métodos de cima, esse indivíduo pode ser caracterizado como estando a necessitar de um regime de tratamento apropriado à dada condição diagnosticada. Assim, um método de tratamento de um indivíduo identificado como estando a necessitar dele através de um método de diagnóstico tal como definido acima pode compreender a administração de uma quantidade eficaz de um agente farmacêutico apropriado ao estado de doença do indivíduo. Os médicos assistentes serão capazes de determinar a quantidade eficaz de um agente farmacêutico com base na idade, no peso, no género e na condição do paciente.

Um agente farmacêutico pode ser utilizado no fabrico de um medicamento para tratamento de um indivíduo identificado como estando a necessitar dele através de um método de diagnóstico tal como definido acima. O presente invento será agora descrito com mais detalhe através de referência às seguintes Figuras e Exemplos não limitantes em que: A Figura 1 mostra uma perspectiva esquemática de uma concretização do presente pedido.

As Figuras 2-14 mostram espectros de massa gerados através de análise de fragmentos peptídicos trípticos ligados a moléculas de ligação seleccionadas quanto às suas capacidades para se ligarem a tetrapéptidos ou hexapéptidos C-terminais diferentes possuindo arginina ou lisina como resíduo C-terminal.

Exemplo 1

Este exemplo descreve como um microarray pode ser produzido e utilizado para detectar péptidos gerados a partir de uma mistura proteica heterogénea. Neste exemplo, escolhemos fragmentar as proteínas em péptidos através de digestão com tripsina e capturar as subclasses de fragmentos peptídicos utilizando moléculas Fv de cadeia simples (scFv) com propriedades de ligação dirigidas ao terminal C dos péptidos. 26 ΕΡ 1 604 209/ΡΤ

Criaçao de moléculas de ligação

Desenho de péptidos selectores: São utilizados péptidos sintéticos como agentes de captura ao isolar moléculas Fv de cadeia simples (scFv) adequadas a partir de uma biblioteca de apresentação fágica. Os péptidos são desenhados para capturar partículas fágicas apresentando scFv com afinidade para um tetrapéptido C-terminal no qual o último aminoácido (i.e. C-terminal) era uma lisina ou uma arginina. Pode ser adicionado um espaçador do lado N-terminal deste tetrapéptido bem como uma biotina N-terminal. As sequências de aminoácidos são desenhadas para incluírem aminoácidos que seja provável gerarem bons epítopos, tais como aminoácidos hidrófobos (fenilalanina, tirosina, triptofano, leucina e isoleucina) ou aminoácidos com carga (aspartato, glutamato, asparagina, glutamina e histidina). A metionina é excluída devido à sua tendência para oxidar, e a cisteína é excluída para evitar problemas com a dimerização devido à formação de pontes dissulfureto. As sequências dos tetrapéptidos são também escolhidas com base na sua frequência na proteína de ocorrência natural. Exemplos de sequências adequadas são biotina-SGSG-XXXX-COOH em que XXXX pode ser p.ex. EDFR, EPER, HPDK, LPSR, LQSK, PEEK, WDSR ou YLDK.

Selecção de ligantes específicos a partir de uma biblioteca de apresentação fágica A selecção de ligantes específicos a partir da biblioteca n-CoDeR pode ser efectuada utilizando contas magnéticas revestidas com estreptavidina (Hawkins, R.E., Russel, S.J. e Winter, G., J. Mol. Biol. 226: 889-896, 1992). A construção e o manuseamento da biblioteca de apresentação fágica n-CoDeR de scFv são descritos em Sõderlind et al., Nature Biotech 18: 852-856, 2000.

Um volume contendo 1-2χ1013 CFU da reserva de fagos da biblioteca é misturado com péptido selector biotinilado (concentração final de péptido de aprox. 10“7 M) . Adicionar BSA até uma concentração final de 3%, azida de sódio até uma concentração final de 0,02% e Tween 20 até uma concentração final de 0,05 %. Incubar à temperatura ambiente com agitação suave durante 1 h. Adicionar as contas magnéticas (pré- 27 ΕΡ 1 604 209/ΡΤ bloqueadas com albumina) e incubar durante 15 minutos à temperatura ambiente com agitação suave. Concentrar as contas com o magnete e remover o sobrenadante. Lavar as contas com 3x1 ml de BSA a 3%, Tween 20 a 0,05%, azida de sódio a 0,02% em PBS, seguido de 3x1 ml de Tween 20 a 0,05% em PBS e finalmente 3x1 ml de PBS. Eluir os fagos de ligação através da adição de 400 μΐ de solução de reserva de tripsina (1 mg/ml, Boehringer-Mannheim). Incubar durante 30 minutos à temperatura ambiente. Transferir o eluato para um tubo fresco e adicionar 40 μΐ de solução de reserva do inibidor de tripsina aprotinina (2 mg/ml). Determinar a quantidade de fagos no eluato (através da medição da quantidade de CFU após infecção de E. coli). São produzidas novas reservas de fagos de scFv a partir do eluato através da infecção de E. coli em crescimento logarítmico com os fagos eluídos. Adicionar ampicilina para eliminar bactérias não infectadas. As bactérias infectadas são amplificadas durante aproximadamente 3 horas, seguido de infecção com fagos ajudantes e indução de IPTG para a produção de fagos de apresentação de scFv. O ciclo de selecção descrito acima é repetido duas vezes, mas com uma concentração de antigénio de 1CT8 M para o segundo ciclo e de 1CT9 M para o terceiro. O eluato final resultante é armazenado a 4°C.

Pesquisa primária de moléculas de ligação 0 processo de selecção pode gerar dezenas de milhares de clones fágicos, incluindo ligantes não específicos e ligantes específicos de diferente qualidade. Também, nem todos os clones produzirão scFv funcionais. Os bancos de fagos eluídos da terceira selecção são utilizados para infectar E. coli e o ADN plasmídico (fagemídeo) é isolado. O ADN específico do fago é eliminado através de digestão com enzimas de restrição e o material religado é transformado em E. coli. Os clones transformados, i.e. expressando scFv, são seleccionados utilizando ampicilina. Para identificar os clones que irão gerar as melhores moléculas de ligação para a dada aplicação, é empregue um procedimento de pesquisa de dois passos. A pesquisa primária é desenhada para avaliar as propriedades de ligação de um grande número de scFv expresso (tipicamente 10 000) contra um ligando previsto e um não ligando previsto e diferenciará entre scFv com interacção específica vs. não 28 ΕΡ 1 604 209/ΡΤ específica com ο péptido selector bem como proporcionará uma medida aproximada da qualidade relativa entre os ligantes específicos. A pesquisa primária é tipicamente efectuada utilizando sistemas de elevado rendimento automatizados para apanhar, expressar e ensaiar os clones.

Tipicamente são apanhadas 10 000 colónias através de um apanhador de colónias Qbot (Genetix; Hampshire, UK) e transferidas para placas de 384 poços para crescimento individual de um dia para o outro. São transferidos 5 μΐ de suspensão bacteriana (replicados) para placas de Expressão para crescimento e expressão num sistema automatizado (Thermo CRS; Burlington, Ontário, Canadá).

No sistema ELISA (Thermo CRS), as placas de ensaio são pré-revestidas com estreptavidina (0,1 pg/poço), incubadas de um dia para o outro e lavadas. As placas são então revestidas com péptidos biotinilados (1 pmol/poço) , incubadas durante 1 hora (ou durante a noite a +4°C), lavadas e bloqueadas (tampão de bloqueio: Gelatina a 0,45% em PBS lx com Tween a 0,05%).

Os sobrenadantes das placas de expressão são então adicionados (10 μΐ) às placas de ensaio e incubados durante 1 hora, seguido de um passo de lavagem.

Um anticorpo secundário (anticorpo de ratinho anti-his conjugado com HRP) é então adicionado e incubado durante 1 hora, seguido de um passo de lavagem. O substrato (Pirce Supersignal ELISA Pico) é adicionado seguido de 10 min de incubação antes da leitura em modo de Luminescência.

Os activos (clones com uma razão de mais de 10 vezes a do sinal de ELISA entre os péptidos alvo e não alvo) são apanhados e testados novamente (para confirmação). A especificidade dos clones é tipicamente efectuada numa pesquisa secundária onde é testado um conjunto maior de 29 ΕΡ 1 604 209/ΡΤ péptidos. Os clones seleccionados com elevada especificidade são então sequenciados para obter clones confirmados únicos. São sequenciados até 96 clones através de PCR de colónias e sequenciação por ciclos de terminação com corante, utilizando o Analisador de ADN ABI PRISM 3100 (Applied Biosystems, Warrinqton, UK).

Sequenciação

Os clones identificados como ligantes específicos durante a pesquisa são analisados através de sequenciação do ADN para identificar clones únicos. O gene codificando scFv é sequenciado de acordo com o método de terminação da cadeia didesoxi utilizando ADN amplificado por PCR como molde, iniciadores produzidos para esse fim e o estojo Big Dye Terminator RR (Applied Biosystems, EUA) . Os fragmentos terminados são separados e analisados utilizando um 3100 Genetic Analyser (Applied Biosystems).

Caracterização dos ligandos

Um modo de determinar se o scFv capturará de facto um número e tipo de péptidos adequados de uma amostra digerida com tripsina é extracção de imunoafinidade conjugada com análise espectrométrica de massa.

Uma amostra contendo proteínas plasmáticas é reduzida (p.ex. com mercaptoetanolamina) , alquilada (p.ex. com iodoacetamida) e digerida com tripsina (20 pg de tripsina/mg de proteína plasmática, incubação de 6 h a 37°C). O scFv etiquetado com 6xHis pode ser capturado numa coluna pequena (ZipTip™, Millipore), previamente modificada com iões Ni2+ (protocolo TN229, Millipore, USA) . Em princípio, a imobilização de scFv selectivo a péptidos de proteínas hidrolisadas com tripsina de interesse é efectuada através de ciclos consecutivos de aspiração-dispensa de uma solução de scFv (10-50 pg/ml num tampão neutro ou ligeiramente básico, ~10 μΐ) na ZipTip™ modificada com Ni. Após remoção das moléculas de scFv não ligadas, os antigénios são capturados nas colunas de afinidade de um modo semelhante ao descrito 30 ΕΡ 1 604 209/ΡΤ

acima (p.ex., através de ciclos consecutivos de aspiração-dispensa de ~10 μΐ do digerido de tripsina, previamente diluído até uma concentração de 2-3 mg de proteína/ml em PBS). Após o aprisionamento dos antigénios, a coluna é repetidamente lavada para remover os péptidos não ligados. Este passo de lavagem foi efectuado com PBS ou, se for necessária uma lavagem mais rigorosa, com solução contendo uma elevada concentração de sal (p.ex., cloreto de sódio), agentes desnaturantes (por exemplo, guanidina ou ureia) ou um detergente, tal como Tween 20. Os péptidos capturados são eluídos em «1 μΐ de meio de eluição (p.ex., ácido acético a 5% ou acetonitrilo a 50% + ácido trifluoroacético a 0,1% (TFA)) directamente sobre uma placa alvo de MALDI-TOF (dessorção/ionização laser assistida por matriz/tempo de voo). A solução da matriz (p.ex., ácido alfa-ciano-4- hidroxicinâmico, saturado em TFA a 1%, acetonitrilo a 75%) é então adicionada sobre cada ponto de amostra e deixada secar. Alternativamente, o composto da matriz pode ser directamente dissolvido na solução utilizada para eluição dos péptidos da coluna de imunoextracção.

As amostras assim preparadas são então analisadas através de espectrometria de massa MALDI-TOF

Criação de arrays de afinidade

Os scFv etiquetados com 6xHis seleccionados são expressos em E. coli, dialisados e purificados numa coluna de Ni-NTA. Após eluição, os scFv são concentrados até 1-3 mg/ml em PBS. Depois, os scFv com diferente selectividade são colocados em pontos (utilizando qualquer uma da tecnologia actualmente existente para colocar proteínas em pontos, por exemplo, impressão de não contacto ou de contacto) num suporte adequado (p.ex., lâminas de vidro derivado ou fundos de poços de uma placa de microtítulo) . Os scFv podem ser imobilizados covalentemente (p.ex., através de grupos amino, aldeído ou epoxi reactivos) à superfície do suporte ou não covalentemente (por exemplo, adsorção passiva em superfícies de poliestireno ou de nitrocelulose modificadas: para revisão, ver Jenkins R.E. e Pennington, S.R., Proteomics 1: 13-29, 2001). Para além disso, a imobilização orientada de scFv é possível, através de uma lâmina de vidro modificada com niquelato capaz de se ligar 31 ΕΡ 1 604 209/ΡΤ à etiqueta 6*His, ou através de ligação covalente a lâminas de vidro modificadas com maleimida, ligando-se covalentemente a uma etiqueta Cys, previamente introduzida na estrutura de scFv. O elevado rendimento do microarray pode ser explorado através de colocação de 1000-20000 scFv diferentes na mesma lâmina para análise simultânea de muitos antigénios da mesma amostra. Neste exemplo, podem ser suficientes 200-300 moléculas de ligação diferentes, cada uma colocada em duplicado ou triplicado, dando um número total de pontos de 400-1000. Os arrays podem ser armazenados a 4°C durante várias semanas.

Análise de uma amostra complexa

Preparação da amostra: A amostra a analisar, p.ex. plasma, pode ser directamente digerida com tripsina após ser transferida para ou diluída num tampão adequado (p.ex. bicarbonato de sódio 50 mM, pH 7,0). Alternativamente, a amostra pode ser previamente fraccionada para enriquecer proteínas de interesse ou para remover certos componentes tais como albumina e imunoglobulinas (Anderson N.L., Anderson N.G., Mol. Cell. Proteomics 1 (11): 845-67, 2002) para aumentar o limite de detecção. As proteínas da amostra podem ser reduzidas e carboximetiladas para evitar pontes dissulfureto entre péptidos contendo cisteína.

Aplicação da amostra: 10-200 μΐ da amostra digerida com tripsina são aplicados no microarray impresso e incubados durante 2 horas, utilizando uma câmara de incubação (Arrayit Hybridization Cassette, TeleChem International Inc, USA) ou um instrumento de processamento de amostras automático (p.ex. ProteinArray Workstation, Perkin-Elmer, USA). Lavar o microarray repetidamente com p.ex. tampão fosfato 50 mM, pH 7,0, Tween a 0,1%, e cloreto de sódio 100 mM. Para condições de lavagem mais rigorosas, podem ser adicionados diferentes sais ou detergentes a várias concentrações.

Detecção: A matriz de absorção de UV (ácido alfa-ciano-4-hidroxicinâmico, saturado em TFA a 1%, acetonitrilo a 75%) é adicionada ao array (100-500 μΐ/ponto). O array é montado sobre uma placa alvo de MALDI-TOF (Borrebaeck, C.A.K., Ekstrõm, S., Malmborg Hager, A.C., Nilsson, J., Laurell, T. e 32 ΕΡ 1 604 209/ΡΤ

Marko-Varga, G., Biotechniques 30: 1126-1132, 2001) e são obtidos espectros de massa para cada ponto utilizando um espectrómetro de massa MALDI-TOF no modo reflector.

Exemplo 2

Este exemplo descreve como pode ser produzido e utilizado um array de colunas de afinidade para detectar péptidos gerados a partir de uma mistura de proteínas heterogénea. Neste exemplo, escolhemos fragmentar as proteínas em péptidos através de digestão com tripsina e capturar subclasses de fragmentos peptídicos utilizando moléculas Fv de cadeia simples (scFV) com propriedades de ligação dirigidas ao terminal C dos péptidos.

Criação de moléculas de ligação

Desenho de péptidos selectores: Foram utilizados péptidos sintéticos como agentes de captura ao isolar moléculas Fv de cadeia simples adequadas a partir de uma biblioteca de apresentação fágica. Os péptidos foram desenhados para capturar partículas fágicas apresentando scFv com afinidade para um tetrapéptido ou hexapéptido C-terminal no qual o último aminoácido era uma lisina ou uma arginina. Foi adicionado um espaçador do lado N-terminal deste péptido bem como uma biotina N-terminal. As sequências de aminoácidos foram desenhadas para incluírem aminoácidos que seja provável gerarem bons epítopos, tais como aminoácidos hidrófobos (fenilalanina, tirosina, triptofano, leucina e isoleucina) ou aminoácidos com carga (aspartato, glutamato, asparagina, glutamina e histidina). A metionina foi excluída devido à sua tendência para oxidar, e a cisteína foi excluída para evitar problemas com dimerização devido à formação de pontes dissulfureto. As sequências dos péptidos foram também escolhidas com base na sua frequência nas proteínas de ocorrência natural. Os péptidos utilizados como selectores e competidores neste exemplo estão descritos na Tabela 2. 33 ΕΡ 1 604 209/ΡΤ

Tabela 2. Péptidos utilizados durante a selecção

Nome Sequência FN1 Biotina-SGSG-EDFR (-COOH) FN2 Biotina-SGSG-EPER (-COOH) FN3 Biotina-SGSG-EPFR (-COOH) FN4 Biotina-SGSG-HPDK (-COOH) FN5 Biotina-SGSG-LPSR (-COOH) FN6 Biotina-SGSG-LQSK (-COOH) FN7 Biotina-SGSG-PEEK (-COOH) FN8 Biotina-SGSG-TGEK (-COOH) FN9 Biotina-SGSG-WDSR (-COOH) FN10 Biotina-SGSG-YLDK (-COOH) FN11 SGSG-ASAK (-COOH) FN12 SGSG-ASAR (-COOH) FN13 Biotina-SGSG-LYEIAR (-COOH) FN14 Biotina-SGSG-DFAEDK (-COOH) FN15 Biotina-SGSG-LTEFAK (-COOH) FN16 Biotina-SGSG-TEEQLK (-COOH) FN17 Biotina-SGSG-SSAYSR (-COOH)

Selecção de liqantes específicos a partir de uma biblioteca de apresentação fáqica A selecção de ligantes específicos a partir da biblioteca n-CoDeR foi efectuada utilizando contas magnéticas revestidas com estreptavidina (Hawkins, R.E., Russel, S.J. e Winter, G., J. Mol. Biol. 226 : 889-896, 1992). A construção e o manuseamento da biblioteca de apresentação fágica de scFv n-CoDeR são descritos em Sõderlind et al., Nature Biotech 18: 852-856, 2000. Foram efectuados três ciclos consecutivos de selecção: Selecção 1. A biblioteca fágica n-CoDeR™ (Lib 2000) foi primeiro previamente seleccionada contra um péptido biotinilado irrelevante (biotina-GIVKYLYEDEG, 10“7 M) . O péptido foi capturado em contas magnéticas com estreptavidina e as contas foram removidas através de centrifugação. Esta pré-selecção remove os ligantes contra a estreptavidina, biotina e o ligante SGSG. 34 ΕΡ 1 604 209/ΡΤ

As reservas de fagos pré-seleccionados (uma biblioteca equivalente por banco de péptidos) foram seleccionadas contra quatro bancos de péptidos biotinilados (5χ1(Γ8 M de cada péptido) . A composição dos bancos era tal como mostrada na Tabela 3. Os péptidos competidores FN11 (1CT6 M) e FN12 (1CT6 M) foram adicionados aos bancos R e aos bancos K, respectivamente.

Tabela 3. Bancos de péptidos alvo utilizados na selecção 1

Tetra - Banco R Tetra - Banco K Hexa - Banco R Hexa - Banco K FN1 FN4 FN 13 FN14 FN2 FN6 FN 17 FN 15 FN3 FN7 FN 16 FN5 FN8 FN9 FN10

Os péptidos foram capturados em contas magnéticas com estreptavidina e os fagos não específicos foram removidos através de lavagem (as contas foram concentradas utilizando um magnete). Os fagos ligados a contas foram eluídos utilizando tripsina e os bancos de fagos eluídos foram amplificados em E. coli HB101F' . As reservas de fagos eluídos a partir da selecção 1 foram previamente seleccionadas contra um péptido irrelevante tal como descrito acima. As reservas de fagos previamente seleccionadas foram então utilizadas para seleccionar ligantes para péptidos biotinilados individuais (2xl0“8 M de cada péptido). Foram efectuadas 15 selecções separadas. Desta vez ambos os péptidos competidores, FN11 e FN12 (2xlCT7 M de cada), foram adicionados a todas as selecções.

Os péptidos foram capturados em contas magnéticas com estreptavidina e os fagos não específicos foram removidos através de lavagem. Os fagos ligados às contas foram eluídos utilizando ácido. Os bancos de fagos eluídos não foram amplificados mas utilizados directamente na selecção 3. A selecção 3 foi efectuada como selecção de fase sólida em placas ELISA de 96 poços. Os bancos de fagos eluídos da selecção 2 foram primeiro pré-seleccionados contra 35 ΕΡ 1 604 209/ΡΤ estreptavidina (0,5 yg/poço, 8 poços por selecçao) e depois avidina (0,5 yg/poço, 8 poços por selecção).

As reservas de fagos pré-seleccionados foram utilizadas para seleccionar fagos contra péptidos alvo carregados em avidina (10 pmol de péptido/poço, 8 poços por selecção). Ambos os péptidos competidores (2x10 7 M de cada) foram adicionados a todas as selecções. Os fagos não específicos foram removidos através de lavagem e os fagos ligados aos poços foram eluídos utilizando tripsina. A qualidade dos bancos de fagos da selecção 3 foi avaliada em ELISA de fagos. Os bancos de fagos eluidos foram amplificados em E. coli HB101F' e uma série de diluição de bancos amplificados foi testada contra um péptido alvo e um péptido não alvo. Para identificar os clones que irão gerar as melhores moléculas de ligação para a dada aplicação, foi empregue um procedimento de pesquisa de dois passos. A pesquisa primária é desenhada para avaliar as propriedades de ligação de um grande número de scFv expressos (tipicamente 10000) contra um ligando previsto e um não ligando previsto e diferenciará entre scFv com interacção específica vs. não específica com o péptido selector bem como proporcionará uma medida aproximada da qualidade relativa entre ligantes específicos. Com base no ELISA de fagos, foram identificadas as selecções que mostraram resultados de enriquecimento em ligantes específicos. Bancos de fagos eluídos a partir da selecção 3 foram utilizados para infectar E. coli HB101F' e foi isolado o ADN fagemídeo. 0 ADN especifico do fago foi eliminado através de digestão com enzimas de restrição e o material novamente ligado foi transformado em E. coli TOP10 quimicamente competente. Os transformantes, i.e. clones expressando scFv, foram seleccionados em placas de LA contendo ampicilina.

Clones bacterianos únicos foram apanhados e o scFv foi expresso em LB em placas de 384 poços para subsequente pesquisa com ELISA de luminescência (lum ELISA). Foram apanhadas 1920 colónias para cada alvo excepto FN9 (768 colónias) e FN15 (1008 colónias). 36 ΕΡ 1 604 209/ΡΤ A pesquisa de lum ELISA foi efectuada num formato de 384 poços. Cada scFv foi pesquisado contra um péptido alvo e um péptido não alvo. Os péptidos biotinilados (1 pmol/poço) foram carregados em estreptavidina (0,1 pg/poço) e detectados utilizando um anticorpo anti-His conjugado com HRP.

Todas as selecções de hexa-péptidos (FN13-FN17) e três das selecções de tetra-péptidos (FN1, FN3, FN9) mostraram presença de ligantes scFv específicos na pesquisa primária robotizada.

Os clones identificados como ligantes específicos durante a pesquisa foram analisados através de sequenciação de ADN para identificar clones únicos.

Os genes codificando scFv foram sequenciados de acordo com o método de terminação da cadeia didesoxi utilizando ADN amplificado por PCR como molde, iniciadores produzidos para esse fim e o estojo Big Dye Terminator RR (Applied Biosystems, USA) . Os fragmentos terminados foram separados e analisados utilizando um 3100 Genetic Analyser (Applied Biosystems).

Para determinar que scFv capturará um número e tipo adequado de péptidos a partir de uma amostra digerida com tripsina, os scFv foram conjugados com um meio de cromatografia (Poros AL, Applied Biosystems) e empacotados em pontas de carregamento de géis para gerar pequenas colunas de afinidade.

As amostras foram reduzidas com mercaptoetanolamina, alquiladas com iodoacetamida e digeridas com tripsina (PBS pH 7,4, 20 pg de tripsina/mg de proteína, 6 h de incubação a 37°C). As colunas de afinidade foram utilizadas para capturar péptidos de homogenatos de fígado de ratinho digeridos com tripsina, os péptidos capturados foram eluídos e analisados através espectrometria de massa de dessorção/ionização laser assistida por matriz.

Criação de um array de colunas de afinidade

Foram seleccionados 14 scFv com base na sua capacidade para capturar subgrupos diferentes de péptidos das proteínas 37 ΕΡ 1 604 209/ΡΤ do fígado de ratinho tripsinizadas. A reacção de conjugação dos scFv ao meio de cromatografia POROS-AL (Applied Biosystems, Foster City, USA) foi utilizada de acordo com as instruções do fabricante. A lama foi empacotada em pontas de carregamento de géis (Invitrogen) para gerar colunas de afinidade com um comprimento de leito de aproximadamente 2 cm.

Análise de amostras complexas

Homogenato de fígado de ratinho foi alquilado e fragmentado tal como acima e diluído 2 vezes em PBS, pH 7,4. As colunas de afinidade foram lavadas com 2χ10 μΐ de ácido acético a 5% e equilibradas com 2χ10 μΐ de PBS, pH 7,4. Foram carregados 10 μΐ da amostra na coluna seguido de lavagem com 2χ10 μΐ de PBS, pH 7,4. A coluna foi eluída num alvo Massprep MALDI (Micromass, UK) com 7 μΐ de ácido acético a 5%. O eluato foi deixado a secar e o poço alvo foi lavado duas vezes com ácido trifluoroacético a 0,1%. Finalmente foram adicionados 1 μΐ de 0,5 mg/ml de ácido a-Ciano-4-hidroxicinâmico em acetonitrilo a 75%/ácido trifluoroacético a 1%. As amostras foram analisadas utilizando um espectrómetro de massa Micromass Maldi Reflectron.

Resultados

As Figuras 2-15 mostram os espectros de massa gerados. Cada espectro contém aproximadamente 20-100 picos distintos, sinal que tem uma razão sinal-ruído acima de 3, com quase todos os picos correspondendo a um único péptido. Podem ser detectados alguns picos em todos os espectros, estes correspondem a péptidos que se ligam não especificamente ao material de Poros. O número total de péptidos que pode ser detectado utilizando este array está bastante acima de 500.

Lisboa, 2009-01-21

Claims

ΕΡ 1 604 209/ΡΤ 1/5 REIVINDICAÇÕES 1. Método para análise de uma amostra heterogénea de péptidos ou proteínas ou fragmentos peptídicos, compreendendo o método: a) separação da amostra heterogénea de péptidos ou proteínas ou fragmentos peptídicos, em classes heterogéneas, através da ligação de membros de cada classe a uma localização definida espaçada numa matriz (array), em que os membros de cada classe têm um motivo comum a essa classe; e b) caracterização dos péptidos ou proteínas ou fragmentos peptídicos, em cada classe, através da determinação da massa dos péptidos ou proteínas ou fragmentos peptídicos, nas classes heterogéneas, e determinação da abundância dos péptidos ou proteínas ou fragmentos peptídicos de diferente massa nas classes heterogéneas.
2. Método de acordo com a reivindicação 1 em que a amostra heterogénea de péptidos ou proteínas ou fragmentos peptídicos é um extracto do teor proteico total de um tipo de células ou tecidos.
3. Método de acordo com a reivindicação 1 ou 2 em que, antes da realização do passo (a) da reivindicação 1, é formada a amostra heterogénea de fragmentos através de fragmentação de uma amostra heterogénea de proteínas ou péptidos.
4. Método de acordo com a reivindicação 3 em que a fragmentação é efectuada através de clivagem química ou enzimática.
5. Método de acordo com a reivindicação 3 ou 4 em que a fragmentação é efectuada utilizando um mecanismo de clivagem dirigido à sequência.
6. Método de acordo com qualquer uma das reivindicações 3 a 5 em que a fragmentação é efectuada através da digestão da amostra heterogénea de proteínas ou péptidos com tripsina.
7. Método de acordo com qualquer uma das reivindicações antecedentes em que o motivo em cada péptido ou proteína ou ΕΡ 1 604 209/ΡΤ 2/5 fragmento peptídico, está na mesma localização em cada péptido ou proteína ou fragmento peptídico, relativamente ao terminal C, ao terminal N ou a uma característica interna.
8. Método de acordo com qualquer uma das reivindicações antecedentes em que a amostra é uma amostra heterogénea de fragmentos de proteínas ou péptidos e o motivo em cada fragmento está na mesma localização em cada fragmento, relativamente ao local de clivagem.
9. Método de acordo com qualquer uma das reivindicações antecedentes em que o motivo em cada péptido ou proteína ou fragmento peptídico tem três, quatro, cinco, seis ou mais aminoácidos de comprimento.
10. Método de acordo com qualquer uma das reivindicações antecedentes em que o motivo contém três, quatro ou cinco aminoácidos variáveis, sendo os outros aminoácidos no motivo constantes entre todos os péptidos ou proteínas ou fragmentos peptídicos.
11. Método de acordo com qualquer uma das reivindicações antecedentes em que o motivo está no terminal C.
12. Método de acordo com uma das reivindicações 1 a 10 em que o motivo está no terminal N.
13. Método de acordo com qualquer uma das reivindicações antecedentes em que o array compreende vários tipos diferentes de moléculas de ligação, cada tipo imobilizado numa localização definida espaçada no array, em que cada tipo de molécula de ligação é capaz de se ligar especificamente a um motivo definido tal como definido em qualquer uma das reivindicações antecedentes e em que os diferentes tipos de moléculas de ligação têm diferentes especificidades de ligação.
14. Método de acordo com a reivindicação 13 em que o número de tipos diferentes de moléculas de ligação proporcionado no array é adequado à captura de pelo menos 10% dos péptidos na amostra não fragmentada ou, quando a amostra é uma amostra heterogénea de fragmentos de proteínas ou ΕΡ 1 604 209/ΡΤ 3/5 péptidos, pelo menos um fragmento de pelo menos 10% das proteínas ou péptidos na amostra não fragmentada.
15. Método de acordo com a reivindicação 13 em que o número de tipos diferentes de moléculas de ligação proporcionados no array é adequado à captura de pelo menos 50% dos péptidos na amostra não fragmentada ou, quando a amostra é uma amostra heterogénea de fragmentos de proteínas ou péptidos, pelo menos um fragmento de pelo menos 50% das proteínas ou péptidos na amostra não fragmentada.
16. Método de acordo com a reivindicação 13 em que o número de tipos diferentes de moléculas de ligação proporcionados no array é adequado à captura de substancialmente 100% dos péptidos na amostra não fragmentada ou, quando a amostra é uma amostra heterogénea de fragmentos de proteínas ou péptidos, pelo menos um fragmento de substancialmente 100% das proteínas ou péptidos na amostra não fragmentada.
17. Método de acordo com qualquer uma das reivindicações 13 a 16 em que o array tem pelo menos cerca de 10, 50, 100, 150, 200, 250, 300 ou mais tipos diferentes de moléculas de ligação nele proporcionadas.
18. Método de acordo com qualquer uma das reivindicações 13 a 17 em que pelo menos um tipo de moléculas de ligação é um anticorpo ou um fragmento ou uma sua variante, tal como Fv, scFv ou Fab.
19. Método de acordo com qualquer uma das reivindicações 13 a 18 em que pelo menos um dos tipos das moléculas de ligação é um aptâmero.
20. Método de acordo com qualquer uma das reivindicações 13 a 19 em que pelo menos um dos tipos das moléculas de ligação é um polinucleótido.
21. Método de acordo com qualquer uma das reivindicações antecedentes em que o passo (b) da reivindicação 1 compreende a caracterização dos péptidos ou proteínas ou fragmentos ΕΡ 1 604 209/ΡΤ 4/5 peptídicos ligados, em localizações definidas e discretas no array.
22. Método de acordo com qualquer uma das reivindicações antecedentes em que o passo (b) da reivindicação 1 compreende a caracterização dos péptidos ou proteínas ou fragmentos peptídicos, nas classes heterogéneas, através de espectrometria de massa de dessorção ou de espectrometria de massa de dissociação induzida por colisão.
23. Método de acordo com qualquer uma das reivindicações antecedentes em que a informação derivada do passo (b) da reivindicação 1 é utilizada para determinar a identidade da proteína ou péptido original na amostra heterogénea não fragmentada de que é derivada a proteína ou o fragmento peptídico detectados.
24. Método de acordo com qualquer uma das reivindicações antecedentes em que a informação derivada do passo (b) da reivindicação 1 é utilizada para determinar a abundância da proteína ou péptido original na amostra heterogénea não fragmentada de que é derivada a proteína ou o fragmento peptídico detectados.
25. Método para identificação de diferenças na composição entre duas ou mais amostras heterogéneas fragmentadas ou não fragmentadas de péptidos ou proteínas ou fragmentos peptídicos, compreendendo a análise de cada amostra através do método de acordo com qualquer uma das reivindicações antecedentes e a comparação dos resultados para deste modo identificar quaisquer diferenças.
26. Método para identificação de uma proteína ou péptido relacionados com uma doença compreendendo a identificação de diferenças entre duas ou mais amostras através do método da reivindicação 25, em que pelo menos uma das amostras analisadas é derivada de um indivíduo com a doença e outra das amostras analisadas é derivada de um indivíduo sem a doença.
27. Método para análise de uma amostra heterogénea de péptidos ou proteínas ou fragmentos peptídicos, compreendendo o método: ΕΡ 1 604 209/ΡΤ 5/5 a) proporcionar, como primeiro componente, um péptido selector compreendendo um motivo tal como definido em qualquer uma das reivindicações 7 a 12; b) proporcionar, como segundo componente, uma fonte de moléculas de ligação candidatas; c) combinar o primeiro e o segundo componentes; d) identificar moléculas de ligação candidatas que sejam capazes de se ligar especificamente ao motivo do péptido selector no primeiro componente; e) imobilizar as moléculas de ligação identificadas no passo (d) num array de modo a que diferentes tipos de moléculas de ligação sejam imobilizados em localizações definidas e discretas; f) proporcionar uma amostra heterogénea de péptidos ou proteínas ou fragmentos peptídicos, amostra esta que compreende péptidos ou proteínas ou fragmentos peptídicos, cada um possuindo um motivo que é ligado por uma molécula de ligação imobilizada no passo (e); g) separar a amostra heterogénea de péptidos ou proteínas ou fragmentos peptídicos, em classes heterogéneas, através da ligação de membros de cada classe às moléculas de ligação imobilizadas no passo (e); e h) caracterizar os péptidos ou proteínas ou fragmentos peptídicos em cada classe, através da determinação da massa dos péptidos ou proteínas ou fragmentos peptídicos, nas classes heterogéneas, e da determinação da abundância dos péptidos ou proteínas ou fragmentos peptídicos, de diferente massa, nas classes heterogéneas. Lisboa, 2009-01-21