PT1074621E - Gene humano tsc403 - Google Patents

Gene humano tsc403 Download PDF

Info

Publication number
PT1074621E
PT1074621E PT99901209T PT99901209T PT1074621E PT 1074621 E PT1074621 E PT 1074621E PT 99901209 T PT99901209 T PT 99901209T PT 99901209 T PT99901209 T PT 99901209T PT 1074621 E PT1074621 E PT 1074621E
Authority
PT
Portugal
Prior art keywords
gene
tsc403
cancer
seq
protein
Prior art date
Application number
PT99901209T
Other languages
English (en)
Inventor
Masato Horie
Masami Nagata
Kouichi Ozaki
Yoshikazu Shimada
Original Assignee
Otsuka Pharma Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Otsuka Pharma Co Ltd filed Critical Otsuka Pharma Co Ltd
Publication of PT1074621E publication Critical patent/PT1074621E/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4738Cell cycle regulated proteins, e.g. cyclin, CDC, INK-CCR
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4747Apoptosis related proteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Cell Biology (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Liquid Crystal Substances (AREA)
  • Epoxy Resins (AREA)
  • Glass Compositions (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Description

DESCRIÇÃO GENE HUMANO TSC403
DOMÍNIO TÉCNICO A presente invenção tem por objecto um gene que se utiliza como um indice na profilaxia, diagnóstico e terapêutica de doenças humanas e, mais particularmente, um novo gene humano especifico do pulmão, que é homólogo de lamp-1 e lamp-2 humanos [glicoproteina da membrana lisossomal; Saito, 0. et al., J. Biol. Chem., 267, 57 00 — 5711 (1992); Sawada, R. et al., J. Biol. Chem., 268, 12675-12681 (1993); Sawada, R. et al., J. Biol. Chem., 269, 1425-1431 (1994)] e suspeita-se que actua como um oncogene. A presente invenção ainda tem por objecto um novo gene humano que é análogo dos de rato, murganho, leveduras, nematóides, genes humanos conhecidos e outros genes e, através da análise do ADNc, do mapeamento de cromossomas e da análise funcional do seu ADNc, que podem ser utilizados no diagnóstico do gene e para o desenvolvimento de novas fármacos terapêuticos.
Além disso, a presente invenção tem por objecto novas proteínas codificadas pelos referidos genes e os seus anticorpos específicos.
TÉCNICA ANTERIOR A informação genética nos organismos é acumulada sob a forma de matrizes (ADN) de quatro tipos de bases ou seja A, C, G e T, no núcleo da célula e esta informação genética é conservada para a manutenção da linhagem e da ontogénese. 1
Num ser humano, diz-se que o número dessas bases é de aproximadamente três biliões (3xl09) e estima-se que essa população inclui 5-100 milhares de genes. A informação genética está envolvida na manutenção de fenómenos vitais através da criação de proteínas reguladoras, proteínas estruturais, enzimas, etc. em conjunto com o fluxo de transcrição de ARNm de genes (ADN) e a tradução consequente em proteínas. É geralmente reconhecido que qualquer anomalia do fluxo anterior de um gene até à sua proteína do produto da tradução leva a um erro do sistema de protecção da vida, inclusive da proliferação e da diferenciação das células e pode ser a causa de várias doenças. Os resultados das análises genéticas feitas até hoje sugerem que os genes de vários receptores, tais como a insulina, LDL e outros receptores e os das enzimas metabólicas associadas com o crescimento e a diferenciação das células, tais como a protease, ATPase, superóxido-dismutase, etc., são considerados ferramentas úteis para o desenvolvimento de produtos farmacêuticos.
No entanto, a análise dos genes humanos e o estudo das suas funções e relações com as várias doenças estão ainda em fase incipiente e ainda há muito a ser conhecido. Assim, a análise de novos genes, as explorações analíticas nas funções e nas relações desses genes com as doenças e os estudos para o estabelecimento dos diagnósticos do gene que exploram os genes assim analisados e os estudos de aplicação farmacêutica sobre esses genes são temas de enorme interesse para esta indústria.
Enquanto isso, o carcinoma do pâncreas é um dos tumores malignos do aparelho digestivo com pior 2 prognóstico, ocupando a quarta e a quinta posições na lista das causas de morte relacionadas com o cancro no Japão e nos países ocidentais, respectivamente (Poston, J. G., et al., Gut., 32, 800-812 (1991)). O objectivo mais importante na investigação sobre o cancro consiste em identificar alterações nos genes, na fase inicial da oncogénese. A identificação dessas alterações deve levar ao desenvolvimento de ferramentas genéticas para o diagnóstico precoce e novas modalidades terapêuticas para o tratamento eficaz desta doença letal. A elucidação das funções fisiológicas desses genes e as informações resultantes são importantes para a explicação dos mecanismos da génese e do aparecimento de doenças neoplásicas e têm sido exigidas não só no domínio da investigação científica fundamental, mas também do ponto de vista de caracterização e do tratamento de tumores malignos na área farmacêutica.
DESCRIÇÃO DA INVENÇÃO
Assim, assumindo que se providencia um novo gene humano, os seus níveis de expressão em várias células, bem como a sua estrutura e funções podem ser elucidados e, através da análise dos produtos de expressão do gene, a clarificação da patologia, do diagnóstico e da terapia das doenças associadas com o gene, tais como doenças hereditárias e cancros, tornar-se-ão viáveis. O objecto da presente invenção consiste em providenciar esses novos genes humanos.
Com este objectivo em mente, os requerentes fizeram uma intensa investigação, conforme se descreve a seguir. Assim, para começar, os requerentes sintetizaram ADNcs a 3 partir dos ARNms extraídos de vários tecidos humanos, tais como cérebro de feto humano, vaso sanguíneo de adulto e placenta, clonaram-nos em vectores para a construção de bibliotecas, fizeram culturas de células de Escherichia coli transformadas com cada biblioteca em meio de ágar, recolheram as colónias de transformantes de forma aleatória e transferiram-nas para placas de microtitulação para preparar e registar os clones de E. coli contendo vários genes humanos. Depois, fez-se uma cultura de cada um desses clones, extraiu-se e purificou-se o ADN e utilizou-se o ADNc assim obtido como uma matriz, realizou-se uma reacção de amplificação com a terminação da cadeia específica para as referidas 4, pelo processo do terminador de desoxi e usando um sequenciador de ADN automático, determinando-se a sequência de cerca de 400 nucleótidos da extremidade 5' do gene humano em cada clone registado. Com base na informação assim obtida, da sequência de nucleótidos dos genes humanos, explorou-se uma nova família de genes semelhantes aos genes conhecidos de bactérias, leveduras, nematóides, murinos, seres humanos e genes de plantas. A tecnologia anterior, para a análise do ADNc, está descrita em detalhe no relatório de Fujiwara et al. [Fujiwara, Tsutomu, Saibo Kogaku (Cell Engineering), 14, 645-654 (1995)].
Como resultado, entre os clones de ADNc retirados arbitrariamente a partir da biblioteca de ADNc de cérebro fetal humano, os requerentes encontraram um clone comportando um novo gene que codifica para uma sequência de aminoácidos com uma homologia elevada com p33INGI que é considerada como sendo uma proteína supressora de cancro [GenBank A. C. No. AF001954, Garkavetsev, et al., Nature, Genet., 14, 415-420 (1996); Garkavetsev, et al, Mol. Cell. Biol., 17, 2014-2019 (1997); re-escrita-GenBank A. C. No. AF044076]. 4
Além disso, com a finalidade de fornecer essas informações exigidas pela indústria, em particular o código genético para uma nova proteína com homologia com o gene lamp-1 e o gene lamp-2, os requerentes fizeram uma exploração intensiva dos genes derivados de vários tecidos humanos diferentes e conseguiram isolar e caracterizar um novo gene específico do pulmão que se coaduna com o propósito anterior. A presente invenção foi desenvolvida a partir da constatação anterior.
Assim, em primeiro lugar, a presente invenção providencia um gene que contém uma sequência de nucleótidos que codifica para a sequência de aminoácidos da SEQ ID NO: 1 (doravante referido como gene TSC403), em particular o referido gene que é um gene humano.
Além disso, a presente invenção providencia uma nova proteína codificada pelo referido gene TSC403 (adiante designada por proteína TSC403) e um anticorpo com uma afinidade de ligação para a referida proteína.
Além disso, a presente invenção providencia um gene TSC403 que é qualquer um dos polinucleótidos (a) e (b) que se seguem, em particular o referido gene que é um gene humano. (a) um polinucleótido que contém a sequência de nucleótidos da SEQ ID NO: 2 ou um uma sua cadeia complementar; (b) um polinucléótido que híbrida especificamente com o referido polinucleótido (a) em condições de 6 x SSC a 65 °C durante a noite ou 4 x SSC complementado com formaldeído a 50 %, a 37 °C, durante a noite e lava-se 5 com 2 x SSC a 65 °C, durante 30 minutos e que é útil como um marcador de cancro. A presente invenção providencia ainda um gene TSC403 com a sequência de nucleótidos da SEQ ID NO: 3. A presente invenção providencia ainda sondas de oligonucleótidos e iniciadores tal como definido nas reivindicações.
Além disso, descreve-se um gene humano (a seguir denominado como o gene humano ING1L) contendo uma sequência de nucleótidos que codifica para a sequência de aminoácidos da SEQ ID NO: 4.
Além disso, a presente invenção também tem por objecto uma proteína (a seguir denominada como proteína humana ING1L) que é codificada pelo referido gene humano ING1L e um anticorpo que se liga à referida proteína.
Além disso, tem por objecto um gene humano ING1L compreendendo qualquer um dos polinucleótidos (a), (b) e (c) que se seguem. (a) um polinucleótido que contém a sequência de nucleótidos da SEQ ID NO: 5; (b) um polinucleótido contendo uma sequência de nucleótidos que hibridam com um ADN com a sequência de nucleótidos da SEQ ID NO: 5, em condições severas; e (c) um polinucleótido com pelo menos 95 % de homologia com um polinucleótido que codifica para um polipéptido contendo a sequência de aminoácidos da SEQ ID NO: 4. 6 A presente invenção providencia ainda um gene humano ING1L com a sequência de nucleótidos da SEQ ID NO: 6.
Além disso, tem por objecto um oligonucleótido tendo uma sequência constituída por pelo menos 15 nucleótidos consecutivos na sequência de nucleótidos da SEQ ID NO: 5 e um fragmento de ADN para ser utilizado como uma sonda específica ou um iniciador para a detecção de genes com a referida sequência de oligonucleótidos. A representação de aminoácidos, péptidos, sequências de nucleótidos, nucleótidos, etc., por abreviaturas, na presente memória descritiva, está em conformidade com as regras recomendadas pela IUPAC-IUB [IUPAC-IUB Communication on Biological Nomenclature, Eur. J. Biochem., 138, 9] (1984)], "Guideline for Preparation of a Specification or Equivalent Referring to a Nucleotide Sequence and/or an Amino Acid Sequence" (editado pelo Instituto de patentes do Japão) e as convenções relativas à utilização de códigos ou símbolos na técnica. 0 gene TSC403, de acordo com a presente invenção, vai ser agora descrito em detalhe.
Como um exemplo específico do gene TSC403, de acordo com a presente invenção, pode-se mencionar o gene deduzido a partir da sequência do ADN de um produto de RCP com o nome "TSC403", tal como descrito no exemplo que aparece aqui a seguir. A sua sequência de nucleótidos está ilustrada na SEQ ID NO: 3.
Este gene é um ADNc humano que codifica para uma nova proteína específica do pulmão com uma sequência de 416 resíduos de aminoácidos, conforme ilustrado na SEQ ID NO: 1 7 (doravante referida como "proteína TSC403") e este ADNc tem um comprimento total de 3.198 nucleótidos. A proteína TSC403 da presente invenção ocorre como um produto de expressão do gene da presente invenção. A pesquisa de homologia, usando o programa FAST [Person, WR, et al. Proc. Natl. Acad. Sal., EUA, 85, 2444-2448 (1988)] em função do banco de dados GenBank/EMBL revelou que este gene é homólogo do gene humano lamp-1 e do gene humano lamp-2 (ver a literatura citada antes).
Neste contexto, é sabido que os referidos genes humanos lamp são expressos em níveis elevados numa linhagem de células de cancro colorectal altamente metastásica e ligam-se à E-selectina na célula endotelial vascular. Por isso, suspeita-se que estes genes estejam associados com a malignidade dos cancros (literatura citada antes). 0 gene TSC403, de acordo com a presente invenção, é também um gene relacionado com o cancro, que se espera que encontre aplicação como um marcador de cancro.
Além disso, o locus cromossómico deste gene da presente invenção é 3q27, onde a aberração cromossómica é detectada em vários cancros. Este facto, mesmo isolado, sugere fortemente a relação deste gene da presente invenção com diversas doenças neoplásicas.
Além disso, verificou-se que o gene TSC403, de acordo com a presente invenção, exibe uma elevada expressão em várias espécies de cancro, sugerindo o seu valor como um marcador para prever a oncogénese e a malignidade. 8
Assim, o gene TSC403 ou um produto desse gene, de acordo com a presente invenção, fornece as informações ou os meios, de imensa importância, para a elucidação, compreensão, diagnóstico, profilaxia e tratamento de várias doenças neoplásicas, tais como cancro colorectal, cancro do útero, cancro de do ovário, cancro do pulmão e cancro de pâncreas, entre outros. Além disso, este gene da presente invenção pode ser utilizado, com vantagem, no desenvolvimento de novos fármacos que induzem a expressão do gene para o uso no tratamento das referidas doenças neoplásicas.
Além disso, a detecção da expressão do gene da presente invenção ou a expressão de seu produto num indivíduo ou num determinado tecido, bem como a detecção de uma mutação (eliminação ou mutação pontual) ou a anomalia da expressão do referido gene pode ser explorada com vantagem na explorção e no diagnóstico das referidas doenças neoplásicas. 0 gene humano INGlL vai agora ser descrito em detalhe.
Como exemplo específico do gene humano INGlL, pode-se mencionar o gene deduzido a partir da sequência do ADN comportado pelo clone designado por "GEN-146F11" e descrito no exemplo que aparece aqui a seguir. A sequência de nucleótidos deste gene está ilustrada na LISTAGEM DE SEQUÊNCIAS. Assim, o gene comportado por este clone tem um quadro de leitura aberta de 840 nucleótidos (região deduzida dos aminoácidos traduzidos; a sequência está ilustrada na SEQ ID NO: 5), que codifica a sequência de 280 resíduos de aminoácidos como se ilustra na SEQ ID NO: 4 na LISTAGEM DE SEQUÊNCIAS e na sequência de nuoleótidos de 9 comprimento completo do clone de ADNc que consiste em 1.078 nucleótidos, como ilustrado na SEQ ID NO: 6.
Na sequência anterior, a SEQ ID NO: 6, o codão de iniciação está localizado na posição 92-94 e o codão de terminação na posição 932-934. A sequência semelhante ao sinal de poliadenilação (ATTAAA) está localizada na posição 1058-1063.
Como mencionado antes, o gene humano ING1L da presente invenção tem uma homologia elevada com p33ING1 e pode ser utilizado na análise de genes humanos com base na sua informação genética e nos estudos sobre as relações entre as várias funções dos genes assim analisados em relação a diversas doenças e podem ainda ser melhor explorados no diagnóstico de genes e na terapia genética de doenças relacionadas com genes e estudos de aplicação dos genes no domínio farmacêutico. Assim, as funções da proteína (produto do gene) codificada pelo gene humano ING1L da presente invenção, podem ser previstas a partir de genes homólogos conhecidos e, como resultado da provisão do gene aqui descrito, é agora possível produzir uma proteína recombinante por clonagem do gene candidato num vector de expressão e investigar a sua actividade enzimática, a sua actividade de ligação e outras funções. Particularmente, uma vez que se suspeita que o gene aqui descrito funciona como um oncogene, esta função pode ser utilizada, com vantagem, no desenvolvimento de produtos farmacêuticos tais como fármacos anticancro. A proteína (doravante referida como "proteína humana de ING1L"), codificada pelo gene humano ING1L aqui descrito, tem uma sequência com um elemento semelhante a um dedo, Zn, na sua região do terminal C e esta região, em 10 particular, é considerada como tendo uma elevada homologia com o referido p33ING1.
Neste contexto, tem sido relatado que o referido p33ING1 é inactivado em várias linhagens de células derivadas de cancro, incluindo uma linha de células de cancro da mama [a literatura citada antes]. Além disso, foi recentemente demonstrado que o referido p33IHG1 regula negativamente a proliferação celular através de p53, que é conhecido por ser um produto de gene supressor de cancro [Garkavetsev, et al., Nature, 391, 295-298 (1998)]. Além disso, em vários tecidos humanos neoplásicos, o nivel de expressão do gene humano ING1L é especialmente elevado. A partir destas verificações, suspeita-se que a proteína humana de ING1L é positivamente moduladora da proliferação celular através de sua interacção com p53.
Além disso, na análise de Northern blot, verificou-se a expressão do gene humano ING1L, aqui descrita, nos 16 tecidos derivados de órgão de seres humanos adultos analisados e verificou-se um reforço da sua expressão em vários tecidos neoplásicos, incluindo cancro colorectal, cancro de esófago, cancro do tubo uterino e cancro do estômago, em comparação com tecidos normais. Estas verificações sugerem que o gene aqui descrito pode ser usado para o diagnóstico de doenças neoplásicas e outras associadas a elas, verificando a sua expressão em vários tecidos e, como corolário, encontra aplicação na triagem de compostos antimitóticos ou compostos anticancerígenos. 0 gene da presente invenção inclui, especificamente, polinucleótidos contendo as sequências de nucleótidos da SEQ ID NO: 2 que codifica para as sequências de aminoácidos da SEQ ID NO: 1 e polinucleótidos que hibridam com ADNs 11 contendo as sequências de nucleótidos da SEQ ID NO: 2, em condições severas, conforme definido nas reivindicações.
Portanto, o gene da presente invenção inclui os genes que codificam as sequências de aminoácidos correspondentes a certas modificações das sequências de aminoácidos definidas antes.
Assim, o gene da presente invenção inclui genes contendo sequências de nucleótidos que codificam para as sequências de aminoácidos resultantes da eliminação, substituição ou adição de um ou uma pluralidade de aminoácidos, na ou para a sequência de aminoácidos da SEQ ID NO: 1 (ou seja, sequências de aminoácidos modificadas) . 0 gene com uma sequência de nucleótidos que codifica para essa sequência de aminoácidos modificada necessita apenas de ser tal forma que, utilizando-o, pode-se detectar o gene da presente invenção que codifica para a sequência de aminoácidos não modificada.
Incidentalmente, enquanto essas modificações (mutação, etc.) de sequências de aminoácidos podem ser espontâneas, por exemplo, mutações e modificações pós-translacionais, as modificações podem ser feitas artificialmente, assim como utilizando um gene de origem natural (por exemplo, um gene especifico da presente invenção).
Os meios para fazer essas modificações artificiais incluem técnicas de engenharia genética tal como mutagénse especifica do sitio (dirigida) [Methods in Enzymology, 154: 350, 367-382 (1987); número 100: 468 (1983); Nucleic Acids Res., 12: 9441 (1984); Zoku Seikagaku Jikken Koza 1 "Idenshi Kenkyuho II" [Experimental Biochemistry Series 1 "Methods for Gene Research II" (editado por Japanese 12
Biochemical Society), p 105 (1986)], etc. e técnicas da química de síntese, tal como o processo do fosfotriéster e o processo do fosfoamidato [J. Am. Chem. Soc., 89: 4801 (1967); número 91: 3350 (1968); Science, 150: 178 (1968); Tetrahedron Lett., 22: 1859 (1981); número 24: 245 (1983)] bem como uma combinação adequada dessas técnicas.
Como um exemplo do gene, de acordo com a presente invenção, pode-se mencionar o gene que compreende um polinucleótido com a sequência de nucleótidos SEQ ID NO: 2 ou com uma sequência complementar. Esta sequência de nucleótidos representa um exemplo da combinação de codões para cada resíduo de aminoácido da sequência de aminoácidos anterior (SEQ ID NO: 1) . Obviamente, o gene da presente invenção não se limita à combinação anterior, mas pode-se utilizar o gene com uma sequência nucleótidos concebida por meio da selecçâo de uma combinação arbitrária de codões para cada um dos referidos resíduos de aminoácidos. A selecçâo dos referidos codões pode ser feita por uma operação de rotina. Nesta selecçâo, a frequência do codão do hospedeiro a ser utilizado pode ser tomada em consideração [Nucleic Acids Res., 9: 43 (1981)].
Além disso, enquanto o gene da presente invenção é apresentado como a sequência de nucleótidos de um ADN de hélice simples como, por exemplo, ilustrado na SEQ ID NO: 3, a presente invenção obviamente engloba um polinucleótido compreendendo uma sequência de nucleótidos complementar dessa sequência de nucleótidos e um componente contendo ambas bem como, e para além disso, não se limita a um ADN tal como o ADNc.
Além disso, como mencionado antes, o gene da presente invenção não se limita ao que compreende um polinucleótido 13 com a sequência de nucleótidos da SEQ ID NO: 2 ou uma sequência complementar dela, mas inclui um que compreende uma sequência de nucleótidos com um determinado grau de homologia com essa sequência de nucleótidos. Mais particularmente, está incluído o gene compreendendo um polinucleótido com pelo menos 95 % de homologia com um polinucleótido que codifica para um polipéptido possuindo a sequência de aminoácidos da SEQ ID NO: 1.
Além disso, o gene da referida sequência de nucleótidos, com uma homologia definida, inclui o que híbrida com um ADN com a sequência de nucleótidos da SEQ ID NO: 2, em condições severas, tais como as descritas a seguir e não perde o ADN, mesmo quando o híbrido é lavado em determinadas condições.
Como exemplo, pode-se mencionar um gene com uma sequência de nucleótidos que, quando hibridada com um ADN com a sequência de nucleótidos da SEQ ID NO: 2 em 6 x SSC a 65 °C, durante a noite ou em 4 x SSC complementado com formaldeído a 50 %, a 37 °C, durante a noite e depois lavados em 2 x SSC a 65 °C, durante 30 minutos, não serão separados do ADN. Aqui, SSC significa tampão-padrão de citrato salino (citrato salino padrão, 1 x SSC = NaCl 0,15 M, citrato de sódio 0,015 M). Um exemplo preferido do referido gene é um gene com uma sequência de nucleótidos, que, mesmo quando hibridada com um ADN com a sequência de nucleótidos da SEQ ID NO: 2 em polietileno-glicol (PEG) a 7%/sulfato de dodecilo e sódio a 10 % (SDS), a 65 °C, durante a noite e lavada em 0,lx SSC/SDS a 0,1 %, a 65 °C, durante 30 minutos, não se separam do ADN. O gene da presente invenção pode ser facilmente produzido e adquirida por técnicas normalizadas de 14 engenharia genética [Molecular Cloning 2 a ed, Cold Spring Harbor Lab. Press (1989); Zoku Seikagaku Jikken Koza "Idenshi Kenkyuho I, II, III" [New Experimental Biochemistry Series "Methods for Gene Research I, II, III" (editado pela Sociedade Japonesa de Bioquímica), (1986), etc.] com base na informação da sequência dos exemplos específicos ilustrados na SEQ ID NO: 3.
Mais particularmente, o gene objectivo pode ser adquirido através da construção de uma biblioteca de ADNc a partir de uma fonte adequada contendo o gene da presente invenção e da selecção do clone desejado a partir desta biblioteca de ADNc, utilizando uma sonda adequada ou um anticorpo específico para o gene da presente invenção, de uma maneira conhecida per se [Proc. Natl. Acad. Sei., USA., 78: 6613 (1981); Science, 222: 778 (1983), etc.].
No procedimento anterior, a fonte de ADNc inclui várias células ou tecidos em que o gene da presente invenção é expresso e as células da cultura derivam dele. Particular-mente, no caso do gene TSC403 da presente invenção, os tecidos do pulmão podem ser citados, a título de exemplo. 0 isolamento de todo o ARN dessa fonte, o isolamento e a purificação do ARNm, a síntese do ADNc e a sua clonagem podem ser realizados por um processo de rotina. As bibliotecas de ADNc também estão disponíveis comercialmente. Na prática da presente invenção, podem utilizar-se essas bibliotecas comerciais de ADNc, que estão disponíveis, por exemplo, na Clontech Lab. Inc. 0 processo de triagem para o gene da presente invenção a partir de uma biblioteca de ADNc não está particularmente restrito, podendo utilizar-se, selectivamente, um processo convencional. Para ser específica, pode-se mencionar, a 15 título de exemplo, a selecção de um clone de ADNc através de uma técnica de imuno-triagem usando um anticorpo específico contra a proteína produzida pelo ADNc, a hibridação de placa ou a técnica de hibridação de colónias, utilizando uma sonda com uma afinidade de ligação selectiva para a sequência objectivo de ADN ou uma combinação entre elas.
Quanto à sonda a ser utilizada no procedimento anterior, geralmente é útil utilizar um ADN sintetizado quimicamente, de acordo com as informações da sequência de nucleótidos no gene da presente invenção. Obviamente, também é possível usar o gene já obtido ou um seu fragmento como a referida sonda. A sequência de nucleótidos que pode ser usada como a referida sonda inclui uma sequência parcial de nucleótidos correspondente à SEQ ID NO: 2, mas que consiste em pelo menos 15 nucleótidos consecutivos, de preferência dentro do intervalo de 20-30 nucleótidos. Além disso, os clones positivos contendo as respectivas sequências anteriores, também podem ser utilizados como a referida sonda. A referida triagem pode ser realizada através do procedimento que utiliza, como sonda de triagem, um conjunto de iniciadores paralelos e anti-paralelos com base nas informações de sequência parcial de aminoácidos próxima de um extracto natural isolado e purificado a partir de uma dada linha de células ou de tecidos.
Além disso, a referida triagem pode ser realizada através do processo de clonagem por interacção da proteína usando a proteína TSC403 em lugar do referido anticorpo específico.
1G
Na presente invenção, a expressão de ARNm em células, em condições diferentes ou entre uma pluralidade de grupos de células, pode ser estudada em comparação directa utilizando o processo da expressão diferencial [Liang, P., et al., Science, 257, 967-971 (1992)].
Na obtenção do gene da presente invenção, a amplificação do ADN/ARN por RCP [Science, 230, 1350 (1985)] também pode ser usada com vantagem. Particularmente no caso em que é dificil obter um ADNc de comprimento completo a partir de uma biblioteca, pode-se utilizar, com vantagem, o processo RACE [do inglês, rapid amplification of cDNA ends; amplificação rápida das extremidades do ADN] [Jikken Igaku (Experimental Medicine), 12 (6): 35 (1994)], em particular o processo 5' -RACE [Frohman, Μ. A., et al., Proc. Natl. Acad. Sei., USA., 8: 8998 (1988)]. Os iniciadores para serem utilizados nesses processos de RCP podem ser criteriosamente estabelecidos de acordo com as informações da sequência do gene da presente invenção e podem ser sintetizados pelo processo convencional. O isolamento e a purificação do fragmento de ADN/ARN amplificado podem ser realizados por técnicas convencionais, como mencionado aqui antes, por exemplo, por electroforese em gel. A sequência de nucleótidos do gene da presente invenção ou qualquer um dos seus vários fragmentos de ADN pode ser determinada por um processo de rotina, por exemplo, pelo processo de didesoxi [Proc. Natl. Acad. Sei., USA., 74: 5463 (1977)], o processo de Maxam-Gilbert [Methods in Enzymology, 65: 499 (1980)] ou, de uma forma mais expedita, por meio de um estojo comercial de sequenciação. 17
Com o gene da presente invenção, o produto do gene pode ser produzido facilmente, numa produção em larga escala e com uma boa reprodutibilidade, por meio de tecnologia-padrão de engenharia genética. A presente invenção ainda tem por objecto um vector (vector de expressão) que comporta o referido gene TSC403, células hospedeiras transformadas utilizando o referido vector e um processo de produção da proteína TSC403 que compreende o crescimento das referidas células hospedeiras. A produção da referida proteína de TSC403 pode ser realizada por tecnologia-padrão de ADN recombinante [Science, 224: 1431 (1984): Biochem. Biophys. Res. Comm., 130: 692 (1985): Proc. Natl Acad. Sei. USA, 80: 5990 (1983) e a literatura de referência aí citada].
Como as referidas células hospedeiras, pode-se utilizar qualquer uma das células procarióticas e das células eucarióticas. Como hospedeiras procarióticas, pode-se utilizar normalmente e abundantemente vários procariotos, tais como Escherichia coli e Bacillus subtilis. As células hospedeiras preferidas são as derivadas de Escherichia coli, particularmente as células K12 de E. coli.
As células hospedeiras eucarióticas incluem, entre outras, as células de vertebrados e de leveduras. Entre as primeiras células, pode-se mencionar, como exemplo, a linha celular de macaco COS [Cell, 23: 175 (1981)], células de ovário de hamster chinês e a sua linha de di-hidrofolato-redutase [Proc. Natl. Acad. Sei., USA., 77: 4216 (1980)]. Quanto às últimas células, as células de leveduras 18 pertencentes ao género Saccharomyces podem ser citadas como exemplos, mas não se trata de opções exclusivas.
Quando se utilizam as células procarióticas como células hospedeiras, selecciona-se um vector que pode ser replicado na célula hospedeira e, para a expressão do gene, providencia-se um plasmido de expressão com um promotor e a sequência de SD (Shine-Dalgarno) a montante do gene da presente invenção, bem como se pode utilizar, com vantagem, um codão de iniciação (por exemplo ATG) necessários para iniciar a síntese de proteínas. Como o vector mencionado antes, é usual utilizar um plasmido derivado de E. coli, tais como pBR322, pBR325, pUC12, pUCl3, etc., embora não sejam opções exclusivas e podem utilizar-se vários outros vectores conhecidos. Como vectores comerciais para sistemas utilizando E. coli, pode-se citar, a título de exemplo, pGEX-4T (Amersham Pharmacia Biotech), pMAL-c2, pMAL-p2 (New England Biolabs), pET21, pET21/laca (Invitrogen), pBAD/His (Invitrogen), entre outros.
Como vector de expressão para ser usado quando se utilizam células de um animal vertebrado pode citar-se, geralmente, um vector tendo uma região promotora a montante do gene a ser expresso, sítios de união do ARN, sítio de poliadenilação, sequência da extremidade da transcrição, etc., e, quando necessário, o vector ainda tem uma origem de replicação. Como exemplo específico do vector anterior, pode mencionar-se, por exemplo, pSV2dhfr contendo um promotor precoce de SV40 [Mol. Cell. Biol., 1: 854 (1981)]. Além dos anteriores, podem utilizar-se vários outros vectores comerciais conhecidos. Como vectores comerciais que podem ser usados em sistemas de expressão que utilizam células de origem animal, pode-se mencionar vários vectores disponíveis para uso de células de animais, tais como 19 pEGFP-N, pEGFP-C .. __________ pcADN3.1/His (Invitrogen), etc. e vectores disponíveis para a utilização de células de insectos, como pFastBacHT (Gibco BRL), pAcGHLT (PharMingen ) , pAc5/V5-His, pMT/V5-His e pMT/Bip/V5-His (todos da Invitrogen). (Clontech),
PIND (Invitrogen),
Como exemplo específico do vector de expressão que pode ser usado quando se utilizam células de levedura como células hospedeiras, pode-se mencionar pAM82 com um promotor para o gene da fosfatase ácida [Proc. Natl. Acad. Sei., USA., 80: 1 (1983)]. Os vectores de expressão comerciais para a utilização de células de levedura incluem pPICZ (Invitrogen) e pPICZ (Invitrogen). O promotor não está particularmente limitado. Quando se utiliza uma estirpe de bactéria do género Escherichia como hospedeiro, pode-se utilizar, com vantagem, promotor de triptofano (ptr), promotor de lpp, promotor de lac, promotor de recA, promotor de PL/promotor PR, etc. Quando o hospedeiro é um organismo do género Bacillus, são escolhas preferidas o promotor SP01, o promotor SP02, o promotor penP, etc. O promotor que pode ser utilizado, com vantagem, quando se utiliza uma levedura como hospedeiro inclui o promotor de pH05, o promotor de PGK, o promotor GAP e o promotor de ADH, entre outros. O promotor preferido, nos casos em que se utilizam células de animais como as referidas células hospedeiras, inclui o promotor derivado de SV40, o promotor de retrovírus, o promotor de metalotioneína, o promotor de choque térmico, o promotor de citomegalovírus e o promotor SR, entre outros.
Como vectores de expressão para o gene da presente invenção, o vector convencional de expressão da proteína de fusão também pode ser usado com vantagem. Como exemplo de 20 um vector deste tipo, pode-se mencionar pGEX (Promega) para a expressão de uma proteína de fusão com a glutationa-S-transferase (GST). 0 processo de introdução do referido ADN recombinante objectivo (vector de expressão) na célula hospedeira (processo de transformação) não está particularmente limitado e portanto podem-se utilizar vários processos padronizados. A cultura do transformante resultante também pode ser realizada por um processo de rotina. Por meio dessa cultura, a proteína objective, codificada pelo gene da presente invenção, é expressa, produzida e acumulada na célula transformante ou segregada extracelularmente ou na membrana celular. 0 meio para a referida cultura pode ser criteriosamente seleccionado entre os meios convencionais, de acordo com o tipo de células hospedeiras adoptadas e a cultura também pode ser realizada em condições adequadas para a proliferação das células hospedeiras. A proteína recombinante assim produzida pode, eventualmente, ser isolada e purificada por vários procedimentos de isolamento, utilizando as suas propriedades químicas, físicas ou outras propriedades [Seikagaku (Biochemical) Data Book II, pp.1175-1259, Ia Ed., Ia impressão, 23 de Junho de 1980, Tokyo Kagaku Dojin; Biochemistry, 25 (25): 8274 (1986); Eur. J. Biochem., 163: 313 (1987), etc.]. Os procedimentos mencionados antes incluem, especificamente, o tratamento-padrão de reconstituição, o tratamento com um agente de precipitação de proteína (coagulação), centrifugação, processo de choque osmótico, rompimento sonoro, ultrafiltração, vários tipos de cromatografia, por exemplo, cromatografia de peneiros 21 moleculares (filtração em gel), cromatografia de adsorção, cromatografia de permuta iónica, cromatografia de afinidade, cromatografia liquida de alta resolução (CLAR), etc., diálise e as suas combinações. 0 procedimento particularmente preferido é a cromatografia de afinidade utilizando uma coluna conjugada com um anticorpo especifico contra a proteína TSC403, de acordo com a presente invenção. A presente invenção providencia ainda a nova proteína TSC403 que se pode obter como descrito antes e a tecnologia de produção desta proteína. A proteína, de acordo com a presente invenção, encontra aplicação no campo farmacêutico, tal como mencionado antes.
Além disso, a proteína da presente invenção pode ser usada como um imunógenio para a preparação de um anticorpo específico contra a referida proteína. 0 componente para ser usado aqui como antigénio pode ser a proteína produzida em grande quantidade por qualquer uma dessas técnicas de engenharia genética ou um seu fragmento e usando esse antigénio, pode-se obter o anti-soro objectivo (anticorpo policlonal) e o anticorpo monoclonal. A tecnologia de produção desses anticorpos é bem conhecida dos especialistas na matéria e a produção de anticorpos relevantes para a presente invenção também pode ser feita de acordo com essa tecnologia estabelecida [Zoku Seikagaku Koza "Men-eki Seikagaku Kenkyuho" (New Immunobio chemistry Series, "Methods in Immuno biochemistry"), editado pela Sociedade Bioquímica Japonesa (1986), entre outras] . 22
Por exemplo, o animal imune para ser utilizado na colheita do anti-soro podem ser livremente escolhido entre animais comuns, como coelho, cobaia, rato, murganho, galinha, cabra e ovelha e a imunização com o referido antigénio e a recolha de sangue também pode ser realizado como um processo de rotina. A preparação do referido anticorpo monoclonal pode também ser realizada num processo de rotina, ou seja, através da preparação de uma célula de fusão a partir da célula de plasma (células imunes) de um animal imunizado com o referido imunogénio e uma célula de plasmocitoma, a selecção de um clone que produz o anticorpo objectivo e o crescimento do clone. 0 animal imune é geralmente seleccionado tendo em consideração a sua compatibilidade com a célula de plasmocitoma para ser usada para a fusão de células e, geralmente, utiliza-se, com vantagem, o murganho ou o rato. A imunização pode ser realizada da mesma forma que na preparação do referido anti-soro e, eventualmente, o adjuvante usual pode ser usado em combinação com o antigénio. A célula de plasmocitoma a ser utilizada para a referida fusão não está particularmente limitada, mas pode ser qualquer uma das várias células de mieloma, tais como p3 (p3/x63-Ag8) [Nature, 256: 495-497 (1975)], p3-Ul [Current Topics in Microbiology and Immunology, 81: 1-7 (1978)], NS-1 [Eur. J. Immunol., 6: 511-519 (1976)], MPC-11 [Cell, 8: 405-415 (1976)], SP2/0 [Nature, 276: 269-271 (1978)], etc., R210 [Nature, 277: 131-133 (1979)], etc. A partir de ratos e de células derivadas deles. A fusão entre a referida célula imunitária e as células de plasmocitoma pode ser efectuada na presença de 23 um promotor de fusão convencional, como o polietileno-glicol (PEG), o vírus Sendai (HVJ) ou similar, de acordo com um protocolo conhecido. 0 isolamento do hibridoma objectivo também pode ser realizado por um processo conhecido [Meth. in Enzymol., 73: 3 (1981); a referida Zoku Experimental Biochemistry Series; etc.]. A pesquisa da linha cellular, que tem por objectivo produzir o anticorpo e a preparação de um anticorpo monoclonal, pode também ser realizadas da maneira convencional. Por exemplo, a pesquisa de uma linha de produção de anticorpos pode ser feita por meio de várias técnicas que são geralmente utilizadas para a detecçâo de anticorpos, tais como ELISA [Meth. in Enzymol., 70: 419-439 (1980)], o processo da placa, o processo do ensaio pontual, o processo da reacção de aglutinação, o processo de Ouchterlony, o radioimunoensaio, etc., utilizando a proteína da presente invenção como um antigénio. O isolamento do anticorpo da presente invenção, a partir do hibridoma obtido antes, pode ser efectuado pelo processo que compreende o crescimento do hibridoma, por um processo de rotina e a recuperação do anticorpo como um sobrenadante da cultura ou o processo que compreende a administração do hibridoma a um mamífero compatível, para deixá-lo multiplicar-se in vivo e recuperar o anticorpo sob a forma de um fluido de ascite. O primeiro processo é adequado para a preparação de um anticorpo de alta pureza, enquanto o último processo é adequado para produções elevadas. O anticorpo produzido desta maneira pode ser purificado por um procedimento de rotina, como coagulação, filtração em gel, cromatografia de afinidade ou similar. 24 0 anticorpo assim obtido é caracterizado pelo facto de ser capaz de se ligar à proteína da presente invenção. Esta característica pode ser explorada para a purificação da proteína da presente invenção e a análise e a identificação da proteína através de uma técnica imunológica. A presente invenção ainda tem por objecto esse novo anticorpo.
Com base na informação da sequência do gene da presente invenção, que foi gerado pela presente invenção, pode-se detectar a expressão do gene da presente invenção no indivíduo ou em vários tecidos, através da utilização de uma parte ou da totalidade da sequência de nucleótidos do referido gene.
Na presente invenção, com a finalidade de detectar a presença de um gene TSC403 cujo nível de expressão é elevado, num tecido de cancro, pode-se preparar uma amostra biológica, tal como uma amostra de sangue ou de soro, eventualmente extraindo o ADN e realizando uma análise para verificar se a amostra contém um gene sensível a TSC403.
De acordo com a presente invenção, com a finalidade de detectar a presença de um marcador de malignidade em células ou tecidos, a progressão da malignidade para uma perturbação prodrómica ou prognóstico, prepara-se uma amostra biológica de malignidade e analisa-se quanto à presença de um oncogene de TSC403. Ao utilizar esta técnica, pode-se detectar a presença de um tal marcador de malignidade em células ou tecidos, a progressão da malignidade para uma perturbação prodrómica ou prognóstico. Portanto, a presente invenção permite o diagnóstico de um cancro, a avaliação do efeito de uma terapia contra o cancro ou a previsão do prognóstico de um cancro. 25 A detecção anterior, pode ser feita da seguinte forma. Por exemplo, com base nas informações sobre o gene TSC403 obtidas através da utilização de uma amostra de um paciente portador de tumor, prepara-se primeiro um fragmento de ADN concebido para ser utilizado na triagem do gene TSC403 e/ou na amplificação do gene. 0 fragmento de ADN anterior inclui o seguinte. (1) 0 fragmento com a natureza de uma sonda para a hibridação da placa, a hibridação da colónia, as análises de Southern blot, Northern blot, etc. (2) 0 fragmento com a natureza de uma sonda para a preparação do fragmento de ADN total ou parcial do gene TSC403, amplificado por RCP, que é uma reacção em cadeia da polimerase para a amplificação de uma sequência de nucleótidos com uma polimerase.
Para a construção desses fragmentos de ADN, prepara-se primeiro um iniciador com a mesma sequência que o gene TSC403. Utilizando este iniciador como uma sonda de rastreamento, faz-se reagir com uma amostra biológica (amostra de ácido nucleico), para confirmar a presença de um gene com a sequência do gene TSC403. A amostra de ácido nucleico anterior pode ser preparada por vários processos, providenciando uma detecção fácil da sequência-alvo, tal como desnaturação, digestão restrita, electroforese ou "dot blotting". 0 processo da referida triagem é, de preferência, a RCP, de um ponto de vista da sensibilidade. Este processo não está particularmente limitado na medida em que utiliza um fragmento do gene TSC403 como iniciador e pode ser qualquer um dos protocolos [Science, 230: 1350-1354 (1985)] 26 e todas as versões de RCP que foram recentemente desenvolvidos ou que se esperam que venham a ser utilizadas no futuro [Sakaki, Y. et al. (ed.), Jikken Egaku (Experimental Medicine), suplemento 8 (9) (1990), Yodosha; Protein Nucleic Acid Enzyme; suplemento especial, Kyoritsu Publishing Co., 35 (17) (1990)].
Os fragmentos de ADN para serem utilizados como iniciadores são oligo-ADNs sintetizados quimicamente. Esses oligo-ADNs podem ser sintetizados usando um sintetizador automático de ADN, por exemplo, LKB Gene Assembler Plus da Pharmacia (Pharmacia). O comprimento do iniciador (iniciador paralelo ou iniciador anti-paralelo) pode ser, por exemplo, o equivalente a cerca de 10-50 nucleótidos, mais preferencial-mente, cerca de 15-30 nucleótidos. A sonda, para se usar na triagem anterior, é geralmente uma sonda marcada, mas pode ser uma sonda não marcada. A triagem pode depender da ligação especifica, com um ligando marcado directa ou indirectamente. O processo de marcação de uma sonda ou de um ligando é conhecido na técnica e a técnica anterior relevante inclui a tradução de cortes, iniciação aleatória e o tratamento de cinases, entre outros. A substância que pode ser usada como marcador inclui radioisótopos, biotina, grupos fluorescentes, grupos quimio-luminescentes, enzimas e anticorpos que podem ser tomados por meio desses processos conhecidos. A detecção mencionada antes pode ser realizada por um processo de rotina. Por exemplo, a amplificação do ARN por RCP-TI [reacção em cadeia de polymerase - transcriptase inversa; ES Kawasaki, et al. Amplification of RNA. no PCR Protocol, A Guide to Methods and Applications, Academic Press, Inc., San Diego, 21-27 (1991)], Análise de Northern 27 blot [Molecular Cloning, Cold Spring Harbor Lab. (1989)], determinação do nível celular, por exemplo, RCP-TI in situ [Nucl. Acids Res., 21: 3159-3166 (1993)] e hibridação in situ, o processo NASBA [Nucleic acid sequence-based amplification, Nature, 350: 91-92 (1991)], modificações dessas técnicas que são conhecidas na técnica e vários outros processos que podem ser sempre utilizados, invariavelmente, com sucesso. O processo de ensaio, de acordo com a presente invenção, pode ser efectuado, de uma forma expedita, utilizando um estojo de reagentes de ensaio para a detecção do gene TSC403 em amostras. A presente invenção também tem por objecto um estojo de ensaio para a detecção do gene TSC403 que contém o referido fragmento do gene TSC403. É importante que este estojo de ensaio contenha pelo menos um fragmento de ADN que hibrida com uma parte ou com a totalidade da sequência de nucleótidos da SEQ ID NO: 2 ou com uma sequência de nucleótidos complementar, como um componente essencial. Como outros componentes, o estojo pode conter um agente de marcação e os reagentes necessários para a RCP, tal como a Taq ADN polimerase, o trifosfato de desoxinucleótido e iniciadores, entre outros. O agente de marcação inclui radioisótopos e modificadores químicos tal como substâncias fluorescentes. Estas podem ser utilizadas como pré-conjugado em relação ao fragmento de ADN.
Para maior comodidade, na prática do ensaio, o estojo de ensaio da presente invenção pode conter um diluente de reacção adequado, um anticorpo padrão, um tampão, um tampão de lavagem, uma solução tampão da reacção, etc. 28 A presente invenção também tem por objecto um processo para o diagnóstico de cancro, utilizando o processo de ensaio anterior, um reagente de diagnóstico para ser usado no referido diagnóstico e um estojo de diagnóstico.
Através da sequenciação do gene TSC403 numa amostra de ensaio, tal como as obtidas através do processo de ensaio anterior da presente invenção, directa ou indirectamente, pelo processo convencional, é possível descobrir um novo gene relacionado com TSC403 (gene mutante), que é altamente homólogo do gene TSC403 de tipo selvagem. Assim, a presente invenção também tem por objecto um processo de triagem de um gene relacionado com TSC403 numa amostra de ensaio, que compreende a realização do referido ensaio e a sequenciação do gene TSC403 na amostra.
Além disso, utilizando a proteína codificada pelo gene TSC403 da SEQ ID NO: 1, uma proteína que tem uma sequência de aminoácidos resultante da eliminação, substituição ou adição de um ou vários aminoácidos da, na ou para a referida sequência da SEQ ID NO: 1 ou um anticorpo contra esse fragmento (anticorpo policlonal ou monoclonal, a seguir referido aqui como "anticorpo TSC403"), pode-se analisar, com sucesso, o referido gene TSC403 de tipo selvagem e o gene mutante de TSC403. A presente invenção também tem por objecto um processo de ensaio desse gene TSC403 de tipo selvagem ou de um gene mutante de TSC403.
De acordo com esta metodologia de ensaio, a gravidade do distúrbio, num estado neoplásico ou de malignidade de um neoplasma pode ser detectada a partir de uma alteração no gene TSC403 de tipo selvagem. A alteração mencionada antes 29 pode ser determinada ou detectada pela sequenciação do gene TSC403 por qualquer uma das técnicas convencionais de sequenciação mencionadas antes e, mais preferencialmente, pelo processo de ensaio utilizando o referido anticorpo de TSC403. Desta forma, pode-se detector a presença de uma anomalia (mutação) na proteína de TSC403 numa amostra de ensaio ou a presença ou a ausência da proteína de TSC403.
No procedimento de ensaio que utiliza um anticorpo anti-TSC403 da presente invenção, o anticorpo pode ser utilizado para imunoprecipitar a proteína de TSC403 de uma solução contendo o material biológico obtido a partir de um indivíduo humano, tal como sangue ou soro ou provocar a reacção com a proteína de TSC403 no Western Blot em gel de poliacrilamida ou no "imunoblot".
Além disso, utilizando o anticorpo anti-TSC403, num procedimento de um ensaio imuno-histoquímico, pode-se detectar a proteína de TSC403 numa secção de parafina ou numa amostra de tecido congelada. A tecnologia de produção e o processo de purificação que pode ser usado para o referido anticorpo anti-TSC403 são bem conhecidos na técnica. Tais técnicas conhecidas podem ser utilizadas para a produção e a purificação do referido anticorpo. 0 protocolo mais preferido, relevante para a detecção de um TSC403 de tipo selvagem ou um seu mutante, inclui um ensaio em sanduíche utilizando um anticorpo monoclonal e/ou um anticorpo policlonal. Entre outras técnicas de detecção preferidas pode-se citar o ensaio imuno-absorvente ligado à enzima (ELISA), rádio-imunoensaio (RIA), ensaio imuno-radiométrico (IRMA) e ensaio imunoenzimométrico (IEMA). 30
Além disso, tem por objecto um receptor da proteína de TSC403 existente numa fracção da membrana da célula ou na superfície da célula e com actividade de ligação à proteína de TSC403. Este receptor de proteína de TSC403 pode ser produzido e obtido, por exemplo, adicionando uma proteína de TSC403 marcada a uma fracção da membrana da célula que contém o receptor ou de uma amostra biológica que o contém, extracção, isolamento e purificação do conjugado de proteína-receptor resultante (produto da reacção de ligação à proteína de TSC403) e identificação da sequência de aminoácidos do produto isolado. A preparação e a sequenciação da proteína de TSC403 podem ser facilmente realizadas por um especialista na matéria, de acordo com procedimentos estabelecidos. 0 receptor da proteína de TSC403 ou os seus fragmentos podem ser aplicados para selecção de várias fármacos. Por meio dessa tecnologia, os compostos capazes de reagir com o referido receptor (compostos de baixo peso molecular, compostos de alto peso molecular, proteínas, fragmentos de proteínas, antigénios, anticorpos, etc.) podem ser excluídos. 0 receptor ou um seu fragmento, que é utilizado nessa selecção pode ser aproveitado como um produto imobilizado numa matriz sólida adequada ou sob a forma de uma substância livre numa solução transportada para a superfície da célula.
Um exemplo da selecção de fármacos anterior é a triagem em que as células hospedeiras procarióticas ou eucarióticas, transformadas de forma estável com uma proteína recombinante que expressa a proteína de TSC403 ou um seu fragmento, é utilizada, de preferência, num ensaio de ligação competitiva. Como alternativa, as referidas células hospedeiras, seja na forma livre ou imobilizada, 31 são usadas no ensaio padrão de ligação. Mais particularmente, a selecção de fármacos anterior pode incluir a reacção do receptor da proteína de TSC403 ou de um seu fragmento, com a proteína de TSC403 ou um seu fragmento, na presença de um candidato a fármaco, para causar a formação de um complexo e detectar o grau de inibição da formação do complexo pelo candidato a fármaco anterior.
Assim, pode-se providenciar um processo para a selecção do fármaco, que compreende o contacto de um fármaco candidato com o receptor da proteína de TSC403 ou um seu fragmento e depois faz-se a detecção da presença do complexo resultante ou a presença de um complexo do receptor da proteína de TSC403 ou um seu fragmento e o ligando por uma técnica conhecida per se.
Além disso, analisando a actividade do receptor da proteína de TSC403 é possível avaliar se um candidato a fármaco é capaz de antagonizar o receptor da proteína de TSC403 e, consequentemente, inibir a actividade da proteína de TSC403, por exemplo, a actividade que promove a mitose.
Nesse ensaio de ligação comparativo, marca-se o receptor da proteína de TSC403 ou um seu fragmento. Quando o receptor da proteína livre TSC403 ou um seu fragmento é separado do complexo correspondente e se mede a quantidade de marcador da substância livre (a que não formou complexo), o valor medido serve como um parâmetro da ligação do fármaco candidato ao receptor da proteína de TSC403. Além disso, o referido valor medido serve também como uma medida da inibição da ligação do receptor da proteína de TSC403 à proteína de TSC403. Além disso, o referido valor medido serve também como uma medida da 32 inibição da ligação do receptor da proteína de TSC403 à proteína de TSC403. Analisando, desta maneira, um pequeno péptido (pseudo-péptido) da proteína de TSC403, pode-se analisar o candidato a fármaco como uma substância que tem actividade que antagoniza com o receptor da proteína de TSC403.
Outro protocolo para a selecção de fármacos consiste na triagem de um composto que tenha uma afinidade de ligação adequada para o receptor da proteína de TSC403. Resumidamente, este processo compreende a síntese de um grande número de compostos diferentes do péptido do ensaio, num suporte sólido como a superfície de um pino de plástico ou outro material, e a reacção dos compostos de ensaio com o receptor da proteína de TSC403 e, após a lavagem, faz-se a detecção dos produtos da reacção de ligação, por um processo conhecido [por exemplo, a publicação da patente PCT No. WO 84-03564]. O receptor de proteína de TSC403 purificada pode ser directamente revestido na placa a ser utilizada no referido processo de selecção de fármacos. Além disso, o anticorpo pode ser capturado com um anticorpo não neutralizante contra o polipéptido e o receptor da proteína de TSC403 pode ser imobilizado numa fase sólida. A memória descritiva vai agora ser dirigida à utilização de um ensaio comparativo de selecção de fármacos. Para a ligação ao receptor da proteína de TSC403 ou um seu fragmento, é necessário um anticorpo de neutralização capaz de se ligar especificamente ao receptor da proteína de TSC403 que vá causar a concorrência com o composto candidato. Por meio dessa reacção comparativa com o anticorpo de neutralização, pode-se detectar a presença 33 de qualquer péptido com um ou mais determinantes antigénicos do receptor da proteína de TSC403.
Além disso, em ligação com a selecção dos fármacos, um outro processo compreende a utilização de uma linha de células hospedeiras eucarióticas ou células que contêm um gene TSC403 não funcional. A linha de células hospedeiras ou as células são levadas a multiplicarem-se na presença de um fármaco candidato, por um tempo pré-determinado e determina-se a velocidade de crescimento das células hospedeiras para ver se, por exemplo, o fármaco candidato é capaz de inibir o crescimento das células. Os meios para medir a referida velocidade de crescimento incluem um processo para determinar a actividade biológica do receptor da proteína de TSC403.
Além disso, de acordo com a presente invenção, para o desenvolvimento de uma proteína derivada de TSC403, mais activa ou estável ou de um fármaco que irá melhorar ou interferir com a função da proteína de TSC403 in vivo, é possível a preparação de proteínas bioactivas ou dos seus análogos estruturais, com os quais a referida proteína interage, tal como um agonista do receptor da proteína de TSC403, um antagonista do receptor da proteína TSC403 ou do receptor ou uma proteína de TSC40 3 ou um inibidor, por exemplo. Os análogos estruturais mencionados antes podem ser caracterizados por meio da análise da estrutura tridimensional de um complexo entre a proteína de TSC403 e uma proteína de terceiros, por cristalografia de raios X ou modelos de computador ou uma combinação dessas técnicas. A informação estrutural sobre esses análogos estruturais também pode ser obtida por modelização de proteínas com base nas estruturas das proteínas homólogas. 34
Como um processo para providenciar o referido derivado de proteína de TSC403 mais activo ou estável, pode-se mencionar uma técnica de rastreio de alanina. Esta técnica compreende a substituição de um resíduo de alanina por cada um de alguns resíduos de aminoácidos da referida proteína e a determinação do efeito da substituição na actividade da proteína resultante. Por outras palavras, esta técnica é tal que, por meio da referida substituição de resíduos de aminoácidos da proteína e a referida análise, determina-se o domínio de importância em relação à actividade ou à estabilidade da proteína. Esta técnica possibilita a concepção de um derivado de proteína de TSC403 mais activo ou estável.
Além disso, agora é possível isolar um anticorpo específico do alvo seleccionado por meio de um ensaio funcional e a análise da sua estrutura cristalina. Como regra, o farmacóforo que fornece uma base para a subsequente concepção de fármacos pode ser obtido por meio desta abordagem. Através da geração de um anticorpo anti-idiotipo para um anticorpo funcional fármaco-activo, pode-se identificar ou isolar um péptido a partir de um banco de péptidos, química ou biologicamente construídos. Assim, espera-se que o péptido seleccionado sirva também como um farmacóforo.
Assim, é agora possível conceber e desenvolver fármacos que têm o inibidor da proteína de TSC403, actividade agonista ou antagonista para a proteína de TSC403, tendo uma actividade melhorada, estabilidade e outras características.
Também é possível preparar uma quantidade suficiente de proteína de TSC403 usando um gene clonado de TSC403 e 35 realizando investigações cristalográficas por meio de raios X e outras investigações analíticas. Além disso, como resultado da condição da proteína de TSC403 da SEQ ID NO: 1, de acordo com a presente invenção, é agora possível providenciar um programa de modelos em computador ou técnicas como um substituto ou como um complemento para a cristalografia de raios X. A presente invenção permite a produção de um murganho knockout, comportando o gene TSC403 (rato mutante). Por esta abordagem, pode-se verificar qual a região da sequência de nucleótidos do gene TSC403 que influencia as referidas actividades divergentes da proteína de TSC403 in vivo, isto é, digamos as funções dos produtos dos genes TSC403 ou os produtos dos genes TSC403 modificados, in vivo.
Esta é uma técnica para modificar intencionalmente a informação genética de um organismo utilizando uma recombinação homóloga de genes e um protocolo conhecido de utilização de células estaminais embrionárias (células EE) [Capeccchi. M. R., Science, 244, 1288-1292 (1989)]. A produção anterior de murganhos mutantes pertence à competência dos especialistas na matéria e o gene TSC403 de tipo selvagem ou o gene TSC403 mutante, de acordo com a presente invenção, pode ser submetido a esta modificação [Tetsuo Noda (ed.): Jikken Igaku (Experimental Medicine), suplemento, 14 (20) (1996), Yodosha] para assim produzir o respectivo murganho mutante, de uma forma expedita. Utilizando esta técnica, é possível conceber e desenvolver fármacos que têm o inibidor da proteína de TSC403, actividade agonista ou antagonista para a proteína com melhor actividade ou estabilidade da proteína de TSC403. 36
Assim, a presente invenção tem também por objecto um iniciador especifico para a detecção do gene TSC403 da presente invenção e/ou um fragmento de ADN para ser usado como o iniciador especifico, um processo para o diagnóstico de cancro que os utiliza e ainda um estojo para esse diagnóstico.
Por exemplo, a sonda do gene TSC403, de acordo com a presente invenção, pode ser produzida e adquirida pela técnica-padrão de RCP, utilizando dois tipos de iniciadores (iniciador paralelo e iniciador anti-paralelo), que são específicos para o gene TSC403 da presente invenção. Com a sonda assim construída, pode-se detectar a expressão dos genes da presente invenção em vários tecidos neoplásicos e outros.
DESCRIÇÃO SUMÁRIA DOS DESENHOS A f ig. 1 é uma fotografia, em substituição de um desenho, que mostra uma distribuição do gene TSC403 da presente invenção em tecidos humanos, como encontrados pela análise de Northern blot, de acordo com o exemplo 1-(2) . A f ig. 2 é uma fotografia, em substituição de um desenho, que mostra os resultados da análise de RCP- -TI de vários tecidos normais e tecidos de cancro, de acordo com o exemplo 1- (4). A f ig. 3 é uma fotografia, em substituição de um desenho, que mostra a expressão do gene TSC403 em tecidos humanos, como verificado pela análise de Northern , de acordo com o exemplo 1-(5) . A fig. 4 é uma fotografia, em substituição de um desenho, que mostra a expressão do gene TSC403 em 37 tecidos humanos, como verificado pela análise de Northern, de acordo com um exemplo l-(5). A fig. 5 é uma fotografia, em substituição de um desenho, que mostra a expressão do gene TSC403 em tecidos humanos, como verificado pela análise de Northern, de acordo com o exemplo l-(5). A fig. 6 é uma fotografia, em substituição de um desenho, que mostra as células de controlo no ensaio de formação de foco, de acordo com o exemplo l-(6). A fig. 7 é uma fotografia, em substituição de um desenho, que mostra as células transgénicas como transformadas com o gene TSC403 da presente invenção no ensaio de formação de foco, de acordo com o exemplo 1-(6) . A fig. 8 mostra o resultado de um estudo de homologia entre a sequência de aminoácidos prevista da proteína codificada pelo gene humano ING1L, aqui descrita e a de p33lNGl [GenBank A. C. No. AF044076]. A fig. 9 é uma fotografia, em substituição de um desenho, que mostra os resultados de uma análise de Northern blot de 16 células humanas derivadas de órgãos de adultos, de acordo com o exemplo 2-(2). A fig. 10 é uma fotografia, em substituição de um desenho, que mostra os resultados de uma análise de Northern blot de tecido de cancro colorectal de um paciente, de acordo com o exemplo 2-(2).
MELHOR PRÁTICA PARA REALIZAÇÃO DA PRESENTE INVENÇÃO
Os exemplos a seguir servem para ilustrar a presente invenção com mais detalhe. 38
Exemplo 1
Gene TSC403 (1-1) Procedimento para a visualização de imagens por meio da marcação com [γ-33Ρ]ΑΤΡ
Para a confirmação do gene humano expresso por uma técnica especifica do tecido, utilizou-se o processo de visualização de imagens com o marcador [γ-33Ρ]ΑΤΡ. Este processo foi feito, basicamente, de acordo com o protocolo de Liang [Liang P., et al., Science, 257, 967-971 (1992)].
Assim, o ARN de poli A (0,2 yg), isolado de cada um dos 13 tecidos humanos (cérebro de adulto, cérebro fetal, pulmão, figado, estômago, pâncreas, baço, glândula mamária, próstata, placenta, testículos, rins e coração; Clontech) foi misturado com 25 pmole de iniciador de oligo-dT ancorado em 3' G(T) 15 MA (M significa uma mistura de G, A e C) em 8 μΐ de água tratada com pirocarbonato de dietilo e a mistura foi aquecida a 65 °C durante 5 minutos. A esta solução, adicionou-se 4 yL de 5 x tampão da primeira hélice (BRL), 2 μΐ de DTT 0,1 M (BRL), 1 μΐ de dNTPs 250 mM (BRL), 1 μΐ de inibidor de ribonuclease (40 unidades; Toyobo) e 1 μΐ de Superscript II de transcriptase inversa (200 unidades; BRL) . O volume final de cada mistura reaccional foi de 20 μΐ. Cada solução foi incubada a 37 °C, durante 1 hora e diluída 2,5 vezes, pela adição de 30 μΐ de água destilada e a diluição foi armazenado a -20 °C até ser utilizada. O ADNc foi amplificado por RCP na presença do iniciador, marcado com [γ-33Ρ]ΑΤΡ (Pharmacia) e ancorado em 39 3'. Esta amplificação do ADNc, por RCP, foi realizada da seguinte forma.
Assim, 20 pL de cada mistura de RCP continha 2 μΐ da mistura reaccional de TI, 2 μΐ de 10 χ tampão de RCP (Takara), 4 pL de dNTPs 2,5 mM, 0,25 μΐ de ExTaq ADN polimerase (5U/ml; Takara), 25 pmole de iniciador de oligo-dT marcado com [a-33P]ATP, ancorado em 3' e 25 pmole de iniciador 5' (n 0 20, um iniciador de desoxioligonucleótido 10-mer tendo uma sequência aleatória da sequência SEQ ID NO: 7). A RCP foi realizada nas seguintes condições: um ciclo de 95 °C durante 3 min, 40 °C durante 5 min.; e 72 °C durante 5 min; 40 ciclos de 95 °C durante 0,5 min, 40 °C durante 2 min. e 72 °C durante 1 min; e hibridação a 72 °C durante5 min.
Extraiu-se a amostra da RCP com etanol voltou a suspender-se em corante de sequenciação de formamida e fez-se reagir num gel de sequenciação de acrilamida a 6 % -ureia 7,5 M. Secou-se o gel sem fixação e fez-se uma autoradiografia durante a noite. (1-2) (1-2) Sub-clonagem do fragmento de ADN amplificado
Marcou-se um papel de filtro 3MM, no qual se colocou o gel seco antes, com uma tinta radioactiva e fez-se o registo do auto-radiograma com o marcador. Cortou-se o gel contendo a banda objectivo de ADNc juntamente com o papel de filtro 3 MM e agitou-se em 300 μΐ de dH20, durante 1 hora. Após a remoção do gel de poliacrilamida e do papel de filtro, recuperou-se o ADNc por precipitação em etanol, na presença de 1 μΐ de 10 mg/ml de glicogénio e NaOAc 0,3 M como veiculo e dissolveu-se novamente em 10 pL de dH20. Para a reamplificação, utilizou-se 5 pl desta solução. As 40 condições da RCP e os iniciadores utilizados foram os mesmos utilizados para a primeira RCP. 0 produto da reamplificação, de um tamanho adequado, foi recuperado como o primeiro produto da RCP e este produto da RCP foi clonado no sitio Hinc II do vector pUC118 (Takara) . A sequência de ácidos nucleicos foi determinada utilizando o sequenciador automático ABI377 (Applied BioSystems).
Ao comparar os vários padrões de imagem obtidos com os ARNms isolados de 13 tipos de tecidos humanos, podia-se identificar um produto da RCP expresso especificamente nos pulmões. Este produto foi designado por TSC403DD.
Este produto consistia em 252 nucleótidos. A comparação destes dados dos nucleótidos com as sequências do AND, na base de dados do GenBank/EMBL, usando o programa FASTA [Person, W. R., et al. Proc. Natl. Acad. Sei., EUA, 85, 2444-2448 (1988)] revelou que este produto da RCP não tem homologia com nenhuma das sequências de ADN conhecidas. (1-3) Triagem de ADNc
Construiu-se uma biblioteca de ADNc de pulmão humano normal utilizando ADNc de pulmão humano normal iniciado por hexâmeors aleatórios + oligo(dT) e Uni-ZAP™ XR (Stratagene). Todos os ΙχΙΟ6 clones foram isolados pelo processo descrito antes e realizou-se uma triagem utilizando o fragmento de ADNc marcado com [a-32P]-dCTP. Os clones positivos foram seleccionados e os sítios clonados de ADNc foram extirpados in vivo em pBluescript II SK(-).
Como resultado, identificaram-se cerca de 100 placas para o referido TSC403DD. Com base neste resultado, a 41 quantidade de transcrição na população de ARN total foi calculada como sendo cerca de 0,01 %. A sequência de ADNc montada (TSC403) , homóloga de TSC403DD é composta por 3198 nucleótidos inclusive de um quadro de leitura aberta de 1248 nucleótidos que codifica para uma proteína de 416 resíduos de aminoácidos com uma massa molecular calculada de 44316 Da. A partir da sequência primária, verificou-se que este produto do gene (proteína TSC403) era uma proteína com um domínio de transmembrana.
Verificou-se que o seu locus cromossómico era 3q27, em que as aberrações cromossómicas são observadas em diversos tipos de cancros.
Além disso, o gene TSC403 da presente invenção, tem cerca de 30 % de homologia com lamp-1 e lamp-2 humanos. (2) Expressão em tecidos
Para traçar o perfil de expressão de TSC403, em tecidos, realizou-se a Northern blotting usando vários tecidos humanos.
Na análise de Northern blot, utilizou-se MTN humano (Northern de múltiplos tecidos) blot I e II (Clontech). O fragmento de ADNc foi preparado usando um conjunto de iniciadores de sequências promotoras de T3 e T7 e marcaram-se com [a-32P]-dCTP por RCP. A membrana contendo o produto de amplificação foi submetida à pré-hibridação (nas condições do protocolo do produto) e depois a hibridação, de acordo com o protocolo do produto. 42
Após a hibridação, a membrana foi lavada e exposto por autoradiografia a -80 °C durante, 24 horas. Os resultados estão ilustrados na fig 1.
Os tecidos humanos usados e representados no desenho são o coração, o cérebro, a placenta, o pulmão, o figado, o músculo-esquelético, o rim, o pâncreas, o baço, o timo, a próstata, os testículos, o ovário, o intestino delgado, o cólon e leucócitos de sangue periférico; L.S.P.).
Como se pode ver, a partir do desenho, detectou-se, especificamente, um transcrito homólogo de TSC403 no pulmão.
(3) FISH O FISH para o mapeamento dos cromossomas foi realizado pelo processo conhecido [Takahashi E., et al., Hum. Genet., 86, 14-16 (1990)] utilizando 0,5 yg de cada ADN de cosmido como sonda. O FISH foi registado numo filme Provia 100 (Fuji, ISO 100) ou com um sistema de câmara CCD (Applied Imaging, Cyto Vision).
Como resultado, os 100 sinais obtidos com as células nas bandas R típicas (pro) da metáfase foram localizados na banda 3q27. Portanto, o locus cromossómico de TSC403 poderia ser identificado como 3q27.
(4) Expressão em linhas de células cancerosas e tecidos de cancro conforme analisado por RCP-TI
Para investigar se a expressão do gene TSC403 seria mutada em linhas de células humanas cancerosas e tecidos cancerígenos, submeteu-se a análise por RCP-TI, quatro 43 linhas de células [Aspei (adenocarcinoma metastático, J. Natl. Câncer Inst., 67, 563-569 (1981)) Bxpc3 (adenocarcinoma indiferenciado; Cancro Invest., 4, 15-23 (1986)), MiaPaca2 (adenocarcinoma, Int. J. Câncer, 19, 128-135 (1977)) e PANC1 (epitelióides, carcinoma do dueto pancreático, Int. J. Câncer, 15, 741-747 (1975)) e 9 tecidos cancerígenos (doados pelo Dr. Nakamura, do Instituto de Ciências Médicas da Universidade de Tóquio)].
Assim, tratou-se 10 pL do ARN total isolado de cada uma das linhas de células ou do tecido de cancro usando ISOGEN (Wako Chemical Ind.) com 10 unidades de ADNase I isento de RNase (Boehringer Mannheim), durante 15 minutos, extraiu-se duas vezes com fenol-clorofórmio e precipitou em etanol. Sintetizou-se o ADN de hélice simples por meio do Superscript I™ RNase H-transcriptase inversa (Life Technology), utilizando iniciadores de oligo-(dT) e aleatórios. Utilizou-se uma porção de 2 pL de cada produto para a amplificação por RCP.
Os iniciadores Pl e P2, com as sequências de nucleótidos descritas na SEQ ID NO: 8 e na SEQ ID NO: 9 foram usados durante 25 ciclos de amplificação por RCP. A RCP foi realizada em 20 pl de uma solução de ADN 25 ng, iniciadores de 10 pM cada, dNTP 2,5 mM e 0,25 U de Extaq ADN polimerase (Takara). O produto da RCP foi dissolvido em gel de agarose a 1,5 % corado com brometo de etidio.
Os resultados da análise de RCP-ΤΙ de quatro linhas de células (coluna 1 = AsPc-1, coluna 2 = BxPc-3, coluna 3 = MIApaca, coluna 4 = PANC-1), tecido pancreático normal (pâncreas normal, colunas 1 e 2), tecido de cancro do 44 pâncreas (cancro de pâncreas, colunas 1-11) e tecido normal do pulmão (pulmão normal) pelo processo anterior está ilustrado na fig. 2. É evidente, a partir da fig. 2, que a expressão de TSC403 não foi encontrada no tecido pancreático normal (pâncreas normal, colunas 1 e 2), mas foi encontrada exclusivamente no tecido de cancro do pâncreas (cancro do pâncreas, colunas 1-11 e linhas de células, colunas 1-4).
Incidentalmente, as 4 linhas celulares utilizadas antes foram depositadas na ATCC e os seus números de acesso são os seguintes.
Aspc-1; CRL-1682 BxPc-3; CRL-1687 MIApaca; CRL-1420 PANC-1; CRL-1469 (5) Expressão do gene TSC403 em vários tipos de cancro (Análise de "Northern blot") A expressão do gene TSC403 foi estudada por hibridação do gene TSC403 com o "blot" (Invitrogen) comportando vários tecidos de cancro e amostras de ARNm de tecido normal (análise do tumor por Northern blot). Todos os tecidos cancerígenos e os tecidos normais utilizados foram adquiridos na Invitrogen.
Os resultados estão ilustrados na fig. 3, fig. 4 e fig. 5. Os tecidos de cancro e os tecidos normais, representados em cada desenho, são os seguintes.
Fig. 3: 45
Tumor cerebral, cérebro normal, tumor do rim, rim normal, tumor do figado, fígado normal, tumor do pulmão, pulmão normal, tumor da mama, mama normal, tumor uterino, útero normal, tumor da trompa de falópio, trompa de falópio normal, tumor de ovário, ovário normal.
Fig. 4:
Tumor do esófago, esófago normal, tumor do estômago, estômago normal, tumor do cólon, cólon normal, tumor do recto, recto normal, tumor de tiróide, tiróide normal, tumor das supra-renais, supra-renais normais, tumor da parótida, parótida normal, linfoma, nódulos linfáticos normais.
Fig. 5:
Tumor do rim, rim normal, tumor do ureter, ureter normal, tumor de bexiga, bexiga normal, tumor do estômago, estômago normal, tumor do ovário (4 casos), ovário normal (4 casos) . A partir dos desenhos anteriores, a expressão significativa de TSC403 pode encontrar-se no pulmão normal. Além disso, a expressão do gene TSC403 foi observada em tumores de mama (fig. 3), tumor da trompa de falópio (fig. 3), tumor do esófago (fig. 4), tumor do cólon (fig. 4), tumor do recto (fig. 4), tumor da tiróide (fig. 4), tumor de parótida (fig. 4), tumor do ureter (fig. 5), tumor do ovário (fig. 5, 2 dos 4 casos) . (6) Ensaio de formação de foco por meio da expressão do gene TSC403 46
Ligou-se o quadro de leitura aberta de comprimento completo do gene TSC403 ao sitio BamHl-Xhol do vector pADNC 3.1/His (Invitrogen) para se obter um vector de expressão do gene TSC403.
Depois, usando o vector de expressão obtido antes, realizou-se um ensaio de formação de foco usando células NIH3T3, de acordo com o processo descrito na literatura [Shin, C., Shilo, B., Goldfarb, MP, et al. Proc. Natl. Acad. Sei., EUA., 76, 5714-5718 (1979)] para ver se o gene TSC403 tem um efeito tumorigénico nas células.
Os resultados estão ilustrados na fig. 6 (células de controlo não transformadas com o gene TSC403) e fig. 7 (células transformadas com o gene TSC403).
Como se torna evidente a partir da comparação das duas figuras, formou-se um foco definido, como se mostra na fig. 7, quando o gene TSC403 foi expresso à força em células, por meio da introdução do gene. É assim evidente que o gene TSC403, quando sobre-expresso, à força, provoca uma perda de sensibilidade ao fenómeno de inibição de contacto que é uma das transformações malignas das células, estando assim profundamente envolvido na tumorigénese das células.
Exemplo 2
Gene humano ING1L
(1) Clonagem e sequenciação do ADN do gene humano ING1L
Pela sequenciação de clones de ADNc, seleccionados arbitrariamente de uma biblioteca de ADNc de cérebro humano fetal e pela pesquisa em bases de dados, isolou-se, pelo 47 procedimento que se segue, um clone (GEN-146F11) comportando um ADNc que codifica para uma sequência de aminoácidos tendo uma elevada homologia com p33™G1, uma proteina considerada como sendo uma proteina supressora do tumor.
Assim, o ARNm extraído de cérebro humano fetal foi comprado à Clontech e foi usado como material inicial. A partir do ARNm, sintetizou-se o ADNc e clonou-se no vector λ ZAPII (Stratagene) para construir uma biblioteca de ADNc (Otsuka GEN Research Institute, Otsuka Pharmaceutical) . Pelo processo de excisão in vivo [Short, J. M. et al., Nucleic Acids Res., 16, 7583-7600 (1988)], originou-se a formação de colónias de Escherichia coli comportando o gene humano, em meio de agar e extraiu-se ao acaso e os clones de E. coli contendo o gene humano foram registados numa placa microtituladora de 96 poços. Os clones registados foram armazenadas a -80 °C.
Em seguida, cada clone registado foi cultivado em 1,5 ml de meio LB, durante 24 horas e usando um extractor automático de plasmidos PI-100 (Kurabo), extraíu-se o ADN e purificou-se. O ARN de E. coli contaminado foi decomposto por meio do tratamento com RNase e removeu-se. Finalmente, o ADN foi dissolvido em 30 pL e utilizou-se uma porção de 2 pL para uma estimativa grosseira da dimensão e da quantidade do ADN pelo processo do minigel. Utilizou-se uma outra porção de 7 pL para a reacção de sequenciação e a porção remanescente, de 21 pl, foi armazenada como um ADN de plasmido, a 4 °C.
Depois, realizou-se um terminador de didesoxi de Sanger [Sanger, F., et al., Proc. Natl. Acad. Sei., U.S.A., 74, 5463-5467 (1977)] usando T3, T7 ou um iniciador 48 sintético de oligonucleótido ou um processo de ciclo de sequenciação que é o processo de terminação de didesoxi combinado com o processo de RCP [Carothers, A. M., et al., Bio. Techniques, 7, 494-499 (1989)]. Estes são os processos de reacção de extensão de cadeia com terminação especifica para 4 tipos de bases, usando uma pequena quantidade de ADN de plasmido (cerca de 0,1-0,5 g) como matriz.
Usando um iniciador marcado com FITC (isotiocianato de fluoresceína), como o iniciador da sequência, realizaram-se cerca de 25 ciclos de reacção utilizando Taq polimerase. Do fragmento de ADN marcado por fluorescência, determinou-se a sequência de cerca de 400 nucleótidos da extremidade 5' do ADNc com o sequenciador automático de ADN ALF™ DNA (Pharmacia) . A região não traduzida de 3' tem uma heterogeneidade elevada entre os genes e é adequada para a diferenciação de genes individuais. Portanto, a sequenciação da região da extremidade 3' também foi realizada nalguns casos. A enorme informação da sequência de nucleótidos gerada com o sequenciador de ADN foi transmitida a um computador de 64 bits, DEC3400, para a análise informatizada da homologia. Esta análise da homologia foi realizada por meio de uma pesquisa num banco de dados (Gen-Bank, EMBL), de acordo com o programa FASTA da UWGCG [Pearson, W. R. e Lipman, D. J., Proc. Natl. Acad. Sei., USA., 85, 2444-2448 (1988)] . O processo de análise anterior para uma biblioteca de ADNc de cérebro fetal humano está descrito em detalhe por Fujiwara et al. [Fujiwara, T., et al., DNA Res., 2, 107-111 (1991)] . 49
Cerca de 5.040 ESTs (marcadores das sequências expressas: sequenciaram-se sequências parciais de ADN do fragmento do gene expresso), seleccionados aleatoriamente a partir da biblioteca de ADNc de cérebro fetal humano construída como antes. O clone, denominado GEN-146F11 na pesquisa de sequências no GenBank/EMBL, de acordo com o programa FASTA, mostrou comportar um gene que codifica para uma sequência de aminoácidos como uma homologia elevada com p33ING1 [GenBank A. C. No. AF001954].
Para esclarecer a sequência de comprimento complete, no referido clone GEN-146F11, realizou-se uma reacção de sequenciação de ADN utilizando T7ADN polimerase e um iniciador sintético. Além disso, usando um ADN de hélice dupla, inserido num vector (vector pBluescript; Stratagene) como matriz e um oligonucleótido sintético como iniciador, a sequência de nucleótidos do ADNc, inclusive de toda a região de codificação, foi determinada pelo processo de Sanger de terminação da cadeia de didesoxi e comparou-se a sequência com as sequências de ADN de vários outros genes relacionados. A SEQ ID NO: 6 mostra a sequência de ácidos nucleicos do clone GEN-146F11 (ADNc); a SEQ ID NO: 5 mostra a sequência de ácidos nucleicos da região de codificação do referido clone; e a SEQ ID NO: 4 mostra a sequência de aminoácidos deduzida, codificada pela referida sequência de ácidos nucleicos.
Nas sequências de nucleótidos anteriores, a sequência de sinal de iniciação foi encontrada na posição 92-94 e suspeita-se que seja o codão de iniciação da tradução. O 50 previsto codão de paragem foi encontrado na posição 932— 934. 0 ADNc tem um comprimento de 1078 nucleótidos e contém um quadro de leitura aberta de 840 pares de bases codificado para uma proteína prevista de 280 resíduos de aminoácidos.
Pela pesquisa da homologia, usando o programa FASTA, verificou-se que este gene codifica uma sequência de aminoácidos com uma elevada homologia com p33ING1 [GenBank A. C. No. AF044076] . A homologia da sequência de nucleótidos foi de 60,0 %.
Ao nível da sequência de aminoácidos, investigou-se a homologia entre a sequência de aminoácidos deduzida da proteína codificada pelo gene aqui descrito e a sequência de p33™Gl [GenBank A. C. No. AF044076] . O resultado está ilustrado na figura 8. A fig. 8 mostra a sequência de aminoácidos descritos por uma única letra; a linha superior representa a sequência da proteína humana ING1L codificada pelo gene descrito aqui (indicado como INGILh) e a linha do fundo representa a sequência de p33ING1 [Garkavetsev, et al., Nature. Genet., 14, 415-420 (1996); Garkavetsev, et al.,
Mol. Cell. Biol., 17, 2014-2019 (1997), GenBank A. C. No. AF001954; contudo, esta sequência foi revista posteriormente e a sequência corrigida está ilustrada no GenBank A. C. No. AF044076; indicada, no desenho, como p33ING1] .
Além disso, no mesmo desenho, a área a cheio (quadro preto) indica os resíduos de aminoácidos idênticos e a área 51 sombreada (quadro sombreado) indica análogos dos resíduos de aminoácidos. 0 símbolo ---- na linha INGlLh indica um intervalo.
Pode-se ver, a partir do desenho, que a sequência de aminoácidos codificada pelo gene aqui descrito tem 58,9 % de homologia (calculada com base na sequência corrigida de p33ING1) com a sequência de aminoácidos de p33ING1. (2) Análise de Northern blot A expressão do ARNm humano de ING1L em tecidos humanos normais foi avaliado por Northern blotting usando um clone de ADNc humano marcado, por meio do processo aleatório de iniciação de oligunucleótidos, como sonda. A análise de Northern blot foi realizada utilizando um blot de MTN humano (Human Multiple Tissue Northern; Clontech) de acordo com o protocolo do produto.
Assim, a sequência completa do referido clone GEN-146F11 foi amplificada por RCP e o produto da RCP foi q p marcado com [ P]-dCTP (estojo de marcação de ADN iniciado aleatoriamente, Boehringer Mannheim) para uso como uma sonda. 0 blot foi submetido a 4 horas de pré-hibridção e depois a uma hibridização numa solução de formamida a 50 %/5><SSC/10xsolução Decherd/solução de SDS a 2 % (contendo 100 yg/ml de ADN desnaturado de esperma de salmão), a 42 °C, durante a noite. Após duas lavagens com 2xSSC/SDS a 0,1 %, à temperatura ambiente, realizaram-se 2 lavagens com 0,2xSSC/SDS a 0,1 %, a 65 °C, durante 15 minutos. O filtro foi exposto contra o filme de raios X (Kodak) a -70 °C. 52
Os resultados da exposição de 18 horas estão ilustrados na fig. 9.
Como se pode ver na fig. 9, a expressão foi encontrada nos 16 tecidos derivados de órgãos de adultos humanos (coração, cérebro, placenta, pulmão, figado, músculo esquelético, rim, pâncreas, baço, timo, próstata, testículos, útero, intestino delgado, cólon e leucócitos de sangue periférico; a mesma nomenclatura aplica-se às legendas do desenho) e detectaram-se duas transcrições de 1,5 kb e 1,3 kb.
Além disso, para os vários tecidos de tumor de cancro colorectal, cancro do esófago, cancro do útero e cancro de estômago, também se realizou uma análise semelhante de Northern blot utilizando um blot de TP humano (Human Tumor Painel Blot; Invitrogen), de acordo com o protocolo do produto.
Os resultados nos tecidos de pacientes com cancro colorectal estão ilustrados na fig. 10.
No desenho, T representa o tecido do tumor colorectal (indicada como T: tumor no desenho) e N representa o tecido colorectal normal (indicado como N: normal no desenho). Um conjunto de T e N é o tecido proveniente de um paciente e o desenho mostra os resultados para os tecidos, derivados de 4 pacientes. É evidente, a partir do desenho, que, em cada paciente individual, o nível de expressão do gene humano ING1L é elevado no tecido canceroso, quando comparado com o tecido normal. 53
Com base nas observações anteriores, acredita-se que o gene humano ING1L aqui descrito é útil para a investigação e a terapia do cancro, especialmente para aplicação em diagnóstico de cancro e que, se qualquer outro inibidor antagonista de produtos de expressão do gene humano ING1L for desenvolvido no futuro, encontrará aplicação como um agente anticancro. (3) Mapeamento do cromossoma por FISH e técnicas de hibridação por radiação 0 FISH, para o alinhamento dos cromossomas, foi realizado pelo processo conhecido [Takahashi E., et al., Hum. Genet., 86, 14-16 (1990)] utilizando 0,5 yg de cada ADN de cosmido como sonda. O FISH foi registado no filme Provia 100 (Fuji, ISO 100) ou com um sistema de câmara CCD (Applied Imaging, Cyto Vision).
Como resultado, os sinais das células em (pró)metáfase da banda R tipica 100, indicaram que o locus do gene humano INGlL era um cromossoma 4q35.1.
APLICABILIDADE INDUSTRIAL
De acordo com a presente invenção, providencia-se não só um novo gene TSC403 especifico do pulmão, mas também uma proteína codificada por ele. Através da sua utilização, providencia-se de uma tecnologia através da qual pode-se ter mais esclarecimentos sobre os cancros, por exemplo, cancro do pulmão e cancro do pâncreas e o processo de oncogénese que encontra aplicação no seu diagnóstico, profilaxia e tratamento. 54
Também tem por objecto um novo gene humano ING1L que permite a detecção da expressão do gene em diferentes tecidos, a produção de uma proteína humana de ING1L, que é o produto da expressão do gene, por tecnologia de engenharia genética e a produção de um anticorpo específico contra a referida proteína. Esta, por sua vez, permite a investigação, no ciclo celular, da inibição do crescimento ou da activação de várias células, o estudo do envelhecimento metabólico e a apoptose das células e a exploração, tratamento ou diagnóstico de doenças relacionadas, tais como cancros, tal como mencionado antes. Além disso, a presente invenção permite o desenvolvimento ou o rastreio de inibidores antagonistas da referida proteína humana de ING1L, nomeadamente os supressores do crescimento celular e fármacos anticancro.
LISTAGEM DE SEQUÊNCIAS <110> Ostuka Pharmaceutical Co., ltd. <120> Gene humano TSC403 e gene humano INGIL <130> P99-04 <14 0> <141> <150> JP H10-38133, JP H10-73234 e JP H10-134679 <151> 1998-02-03, 1998-03-05 e 1998-04-28 <160> 9
<170> Patentln Ver. 2.0 <210> 1 <211> 416 <212> PRT <213> Biblioteca de ADNc de pulmão normal humano < 4 0 0 > 1 55
Me t Pro Arg G!o teu Ser Âia Aia Ala Ala leu Phe Ala Ser leu Ala i § 10 15 Vai lie Leu His Asp Gly Ser Gin Ket Arg Ala Lys Ala Phe Pro Gltí 20 25 30 m Arg Asp Tyr Ser Gin Pro Thr Ala Aia Ala Thr Vai Gin Asp Ile 35 40 45 Lys Lys Pro Va! Gin Gin Pro Ala Lys Gin Ala Pro Bis Gin Thr leu 50 55 60 Ala Ai a Arg Phe Mel Asp Giy His lie Thr Phe Gin Thr Ala Ala Thr 65 70 15 80 Vai lys lie Pro Thr Thr Thr Pro Aia Thr Thr Lys Asn Thr Aia Thr 85 90 95 56
Thr Ser Pr» Me Thr Tyr Thr Leu Vai Thr Thr Gin Ala Thr Pro Asn 100 105 Π0 km Ser Bis Thr Ala Pro Pro Vai Thr Glu Va! Thr Vai Gly Pro Ser m 120 125 leu Ala Pr» Tyr Ser Leu Pro Pro Thr Me Thr Pro Pro Ala His Thr 130 135 140 Ala Gly Thr Ser Ser Ser Thr Vai Ser His Thr Thr Gly Asa Thr Thr 145 HO 155 ISO Gin Pro Ser Asn Gin Thr Thr Leu Pro Ala Thr Leu Ser fie Ala Leu 185 170 175 His Lys Ser Thr Thr Gly Gin Lys Pro Asp Gin Pro Thr His Ala Pro ISO 185 190 Gly thr Thr Ala áia AU His Asn Thr Thr Arg Thr Ala Ala Pro Ala 195 200 205 Ser Thr Vai Pro Gly Pro Thr Leu Ala Pro Gin Pro Ser Ser Vai Lys 210 215 220 Thr Gly lie Tyr Gin Vai Leu Asn Gly Ser Arg Leu Cys He Lys Ala 225 230 235 240 Glu Mel Gly Me Gin Leu lie Vai Gin Asp Lys Glu Ser Vai Phe Ser 345 250 255 Pro Arg Arg Tyr Phe Asn Me Asp Pro Asa Ala Thr Gin Ala Ser Gly 250 265 27G km Cys Gly Thr Arg Lys Ser Asa Leu Leu leu Asn Phe Gin Gly Gly 275 280 235 Phe Vai Asa Leu Thr Phe Thr Lys Asp Giu Giu Ser Tyr Tyr lie Ser 290 2-95 300 Glu Vai Gly Ala Tyr Leu Thr Vai Ser Asp Pro Giu Thr Vai Tyr Gin 305 310 315 320 Gly He Lys His Ala Vai Vai Met Phe Gin Thr Ala Vai Gly His Ser 57 325 330 335
Phç lys Cys Vai Ser GIu Gin Ser Leu Gin leu Ser Ala His teu Gin 340 345 350 Vai Lys Thr Thr Asp Vai Gin Leu Gin Ala Fhe Asp Phe Gin Asp Asp 355 360 365 His Fhe Gly Asn Vai Asp Giu Cys Ser Ser Asn Tyr Thr Ile Vai Leu 3T0 375 380 Pro Vai He Gly Ala Ile Yal Vai Gly Leu Cys Leu alei Gly Set Gly 385 390 395 400 Vai Tyr Lys Ik* Arg Leu Arg Cys Gin Ser Ser Gly Tyr Gin Arg Ile 405 410 415
<210> 2 <211> 1248 <212> ADN <213> Biblioteca de ADNc de pulmão normal humano <400> 2 atgccccggc sgctcagcgc ggcggccgcg cícítcgcgt ccctggccgí aatttígcac S0 gaíggcagte migagagc aaaagcattt ccagaaacca gagaítatic tcaacctact 120 gcsgcagcaa cagtacagga caiaaaaaaa celgiccagc aaccagciaa gcaagcaccí 180 caccaaacít Ugcagcaag aílatggat ggtc&talca ccíHe&aac agcggccaca 240 gtaaaaaUc caacaacuc cecígcaact acaaaaaaca ctgcaaceac cagcccaaií 200
acçíacaccc tggtcacaac ccaggccaca cccaacaact «caeaeagc tcctccagtt ISO actgaagtla caglcggccc tagcUagce cctlaUcac tgccacccac catcacccca 420 eeagctcaía cagçiggaac cagttcaica acçgtcagct acacaactgg gaacaccact 480 caacccagta accagaccac ccttccagca actítalcga tagcactgca caaaagcaca §40 accggkaga agcctgatca acccacccal gecccaggaa caacggeagc tgcecacaaí 600 accacccgca cagctgcacc tgcctccacg gtíeetgggc ccacccUgc acctcageca 660 ícgkagka agacíggaai tUtcaggM cUaacggaa gcagaetctg talaaaagca T20 gâgatgggga íacagcigat tgttcaagac aaggagicgg mutcacc tcggagatac itcaacaícg atcceaacgc aacgcaagcc tctgggaac! gtggcacccg aaaatccaac eUctgitga aítítcaggg cggalttgtg aaiclcacai ttaccaagga tgaagaatca tatUtatca gtgaagtggg agcctaíltg acçgtctcag aíccagagac agittaccaa ggaatcaaac atgcggtggt gaíglíecag acagcagícg egcaiUctt caagtgcgig agigaacaga gcctccagtí gtcagceeac clgcaggiga aaacaaccga tgtccaactt eaagcettig aíiltgaaga tgaccacílt gguatgtgg ilgagtgclc gtctgacíac acaattgtgc ticeígígat íggggccatc giggtfggtc tctgcctíal gggtatgggí gteUtaaaa íecgcctaag gtgtcaatca tcíggatacc agagaale
<210> 3 <211> 3198 <212> ADN <213> Biblioteca de ADNc de pulmão normal humano <220>
<221> CDS <222> (64).. (1311) < 4 0 0 > 3 840 900 §60 Ϊ020 teso ! 140 1200 1248 ggeaccgatt cggggcctgc ccggacttcg ccgcacgctg cagaaectcg cccagcgccç aec aíg ccr cgg cag cíc age gcg Me i Pro Arg Gin Leu Ser AU 1 5 gcc g£a aít tíg çac gat ggc agi Ala Va! Ite Leu His Asp Gly Ser 20 gaa ace aga gat Ul ict caa cct GU Ihr Arg Asp Tyr Ser Gin Pro 35 ata aaa aaa CCt gtc cag caa cca gcg gcc gcg cic t tc gcg tcc ctg AU AU AU leu Pite Ala Ser Leu 10 15 caa atg aga gea aaa gea ttl cca CU Mct Arg Ala Lys Aia Phe Pro 25 30 act gea gea m aca gU cag gac Tlu Ala AU ÁU Tjir Vai Gin Asp 40 45 gei aag caa gea cct CSC caa act 60 108 156 204 252 59
He Lys Lys Pro Vai Gín Gin Pro Ala Lys Gin Ala Pro His Gla Thr 50 55 60 Ha gea gea aga t íc atg gat ggt cai ate acc tit caa aca gcg gee 300 leu Ala Ala Arg Phe Mçt Asp Gly His Jle Thr Phe Gín Thr Ala Ala 65 70 75 aca gta aaa alí cca aca act acc cca gea act aca aaa aac act gea 348 Th r Vai Lys lie Pro Thr Thr Thr Pro Ala Thr Thr Lys Asn Thr Ala 80 §5 90 S5 acc acc age cca aí! acc iac acc cíg gtc aca acc cag gee aca ccc 398 Thr Thr Ser Pro fie Thr Tyr Thr Leu Vai Thr Thr Gin Ala Thr Pro (00 105 110 aac aac tea eac aca gct cct cca gtt ací gaa gtt aca gtc ggc cct 444 Asn Asn Ser Mis Thr Ala Pro Pro Vai Thr Gla Vai Thr Vai Gly Pro !!5 120 125 age Me gee ccl taí iça ctg eea ccc acc ale acc cca cca gct eat 492 Ser Leu Ala Pro Tyr Ser Leu Pro Pro Thr Jle Thr Pro Pro Ala His 130 135 140 aca gct gga acc agi tea tea acc gtc age CSC aca act ggg aac acc 540 Thr Ala Gly Thr Ser Ser Ser Thr Vai Ser His Thr Thr Gly Asn Thr Í45 ISO 155 act caa ccc agí aac cag acc acc et í cca gea act í ta ícg ata gea 588 Thr Gla Pro Ser Â5B Gin Thr Thr Lea Pro Ala Thr Leu Ser Jle Ala (¢0 185 1 TO 175 cíg CSC aaa age aca acc ggt cag aag cct gat caa ccc acc eat gee 838 Leu Sis lys Ser Thr Thr Gly Gín Lys Pro Asp Gin Pre Thr His Aía m 135 190 cca gga aca acg gea gct gee cac aal acc acc ege aca gct gea cct 684 Pro Gly Thr Thr Ai a Ala Ala His Ass Thr Thr Arg Thr Ala Ala Pro (95 260 205 60 gcc tcc aeg gtt cel ggg ecc acc ctt gca cct cag cca teg íca gtc 732 Aí a Ser lltr Vaí Ff 0 Gly Pro Thr Leu Ala Pro Gin Pro Ser Ser Vai 210 215 220 aag act gga atí iat cag glt cta aac gga age aga etc tgí ata aaa 780 lys Tftr Gly íle Tyr Gin Vai Leu Asn Gly Ser Arg leu Cys lie Lys 225 230 235 gca gag atg ggg ata cag ctg att gtt caa gac aag lag teg gtt ttt 828 AS a GU Meí Gly íle Gin Leu lie Vat Gin Asp Lys GU Ser Vâl Phe 240 245 250 255 i ca CC! cgg aga tac ttc aac ate gac cec aac gca aeg caa gee te t 876 Ser Pro Arg Arg Tyr Phe Asn ile Asp Pro Asn AU Thr GU Ala Ser 260 265 270 ggg aac tgt ggc acc cga aaa tcc aac ctt ctg ttg aa! m cag ggc 924 Gly Asn Cys G!y Thr Arg lys Ser Aso Leu Leu Leu Asn Phe Glo Gly 27S 280 285 gm ttl gig aa í cíc aca tu acc aag gat gaa gaa tea tat tat aic 972 Gly Pite Vai Asn Leu lltr Phe Thr Lys Asp Gíu Glu Ser Tyr Tyr He 290 295 300 agt gaa gtg gga gcç tat Hg acc gtc i ca gat cca 8*8 aca glt tac 1020 Ser Gíu Vai Gly Ala Tyr Leu Thr Vai Ser Asp Pro Gíu Thr Vaí Tyr 305 310 315 caa gga ate aaa cal gcg gtg gtg atg í tc cag aca gca gtc 888 cat 1068 Gin Giy lie Lys Hí s Ala Vai Vai Mel Phe Gin Thr AU Vai Giy His 320 325 330 335 lec Itc aag tge gtg agt gaa cag age c tc cag ttg tea gcç eae ctg ma Ser Phe Lys Cys Vai Ser Glu Gin Ser Leu fil Ώ Leu Ser AU HU Leu 340 345 350 cag 8*8 aaa aca acc gat gtc caa ctt caa gee itt gat ttl gaa gat 1164 Gin Vai Lys Thr lltr ASP Vaí GJfj Leu Gin Ala Phe Asp Phe GU Asp 61 355 300 365 gae cac Ui gga aat gtg gat gag tgc teg tct gac iac aca aii gtg Asp His ?he Giy Asn Vai Asp Glu Cys Ser Scr A$p Tyr Tbr He Vai 370 375 350 cít cci gtg ait ggg gcc ale gig gH ggt cíc tgc cít atg ggt atg te# Pro Vai He Gly Ala He Vai Vai Giy teu Cys teu Mei Giy tiet 385 390 395 ggt gtc iat aaa ate ege eta agg tgl caa tea teí gga tac cag aga Gly Vai Tyr Lys lie Arg Lea Arg Cys Gig Ser Ser Gly Tyr Gin Arg 400 405 418 415 ate uattgttgc ccggggggaa igaaaataat ggaatttaga gaactclttc Í212 1260 1308 1361
He aícccttcca ggatggatgt aaceaccatc tietatteaa caaiíictaa atacttitíg títccttug aatattííag ataiaígíaa agtagaalaa taclgtgtgt gcattgaaga tatcaaatgg actttcagtg attccíggtg tagcacftaa gagtítcact cUgícacec tcçgcctccc gggtlcaagt gcacacacta ccacgccigg íggccagact ggtcitgaae tgctgggaít acaggcatga aaagaacaac atateteagg aíe&getial atittUatc tggclacaga tggtagaael taacaaaglg eeagagtcta igggaaatte ceteagaglg atgaagtgag icatgtgtga UiaUttat gaaagatata ccaetcaaag leaacaíttg gccítcuat tataaaccaa UitaUtta eccttgakt ctttíactal clgtgtttla ctcctfticc acUtaaati aggetggagt acagtggcac gaitcíectg citc&gettc ctaattíttg tatítítatt tcttgaectc aggtgatcca gccattgcgc ceggcettaa Ugtctaag: gtttUatgt tigatgacíc ctgclccaga aaacaafaag caagagacaa ggctaagcac títaíetata tgggtecíte a&aeaatgta iíiaagtlea ggcagcacat gígagctgtt taUítciag agatatgíig aaiiaacaía gggtcaatig íaaefaatac taaeaaagcc ttígcttigi iggtttcatg taaeaiacat tgtítftgít íiUgagacg gaieicggcí taíggcaacc ccgaglagct gggat tacag aíagaegggí ticaccaigt eceacctcag ccieccaaag atgututt taatcatcaa aaaaccaaea aaaagaaeaa algctagací aagaattagg íaataatggc cctUattat teteatttea ttetcacaae 1421 1485 1541 1601 1561 1721 1781 1841 1901 1961 2021 2081 2141 2201 2261 2321 2381 igsgactue gggaactgaa gctigaattc aigííggkt iacaagaaca atgacaccac accUacagg gaaatgggH ieacttaaat gtcacctggc 2441 gacakaagg kítiggtct 2501 acktgcctg aaggctcaca 2561 iatccaggat caígagacat 2621 ectatcctta aUaakctc 2681 glcagt tgc t caíttttaíg 2741 aactcaaagt atífítaaat 2801 icttgagígt aíagccccat 2861 tccUtígít eactttatíe 2921 titgctgctã aagaaaggaa 298! aaticítagt caaggaaiaa 3041 Utccttatg ackagtaag 3101 ígtagtaaag gtttttgeaa 3161 3198 ítaíaagígs atgagiaaac taaeigatgg cagagccaga íc tccctaca «mgttacc cctcaíacca geatacgck tagggtagat gaaaggagag csctctclgg aaggagactg ggaítgclta gctgggctgi UtUtgata atagagaaac cítgtggiaa cttgetgctt ígíagagcag cctgccaaga ciaagtcagg aigttaacag tlcaagtcag cetagagacc ttggeaaggt cctgactita taaaaacíta cítiggaaaa clftgeagal aacaaaatag aggggctttg taaaacaiía aaagalgaag gcatcaaala ttcgckacc aaetgtktl cígcacítca iaiecataU atítlaíttc tgeígtmt aaaaglccae ataaeccíag atgngactt kckatgtg gtcttaataa aacaitgaaí aaaaaaaaaa aaaaaaa <210> 4 <211> 280
<212> PRT cérebro normal humano <213> Biblioteca de ADNc de <400> 4
Mel leu GJy Glu Gin Gin Glu Gin 1 5 Thr Gly Cl u Arg Ser Arg leu Leu 20 Gi a Cys Vai Gi u Ser leu Pro Hi$ 35 40 leu Arg Glu Leu Aso Asn Lys Tyr 50 55 Aso val Tyr Glu Lys Tyr Lys Lys leu Tyr Ser Ser Ala Ala Leu leu 10 15 Thr Cys Tyr Val Gin Asp Tyr leu 25 30 Asp Met Gin Arg Asn Vai Ser Vai 45 Glu Glu Thr Leu Lys Glu Ite Asp SO Glu Asp Asp Leu Asn Gin Lys lys 65 70 75 80
Arg Leu GU Gin Leu Leu Gin Arg Ala Leu Jle Asn Ser Gin Glu teu 85 90 95 Gly Asp G í u Lys lie Gin 11 e Vai Thr Gin Mel Leu Glu Leu Vai 6U 100 105 110 As 8 Arg Ala Arg Gin Hei Glu leu His Ser Gín Cys Phe Gin Asp Pro Π5 120 125 Ata Clu Ser Glu Arg Ala Ser Asp Lys Ala Lys Me í Asp Ser Ser Gin 130 135 140 Pro Clu Arg Ser Ser Arg Arg Pro Arg Arg Gin Arg Thr Ser Glu Ser 145 ISO 155 160 Arg Asp leu Cys His Mel AU Asn Gly He Glu Asp Cys Asp Asp Gin 165 170 175 Pro Pro Lys GIu Lys Lys Ser Lys Ser AU Lys Lys Lys Lys Arg Ser 180 185 190 Lys AU Lys Gin Glu Arg Glu AU Ser Pro Vai Glu Phe Ala íie Asp 195 200 205 Pro Asn Cl u Pro Thr Tyr Cys teu Cys Asn Gin Vai Ser Tyr Gly Glu 210 215 220 yet lie Gíy Cys Asp Asn Glu Gin Cys Pro He Glu irp Phe His Phe 225 230 235 240 Ser Cys Vai Ser Leu Thr Tyr Lys Pro Lys Gly Lys írp Tyr Cys Pro 245 250 255 Lys Cys Arg Gly Asp Asn Glu Lys Thr Met Asp Lys Ser Thr Glu Lys 260 265 270 Thr Lys Lys Asp Arg Arg Ser Arg 275 280 < 210 > 5 <211> 840
< 212 > ADN <213> Biblioteca de ADNc de cérebro normal humano <400> 5 64 atgítagggc ageagcagcá gcãactgtae ícgtcggccg cgctcelgac cggggagcgg 60 agccggetgc Icacctgcta cglgcaggac lacctigagt gcgíggagtc gcigccccac i20 gacatgcaga ggaacgtgtc ígtgcígcga gagctggaea acaaatatca agaaacgtta 180 aaggaaatíg atgatgteU cgaaaaatat aagaaacaag atgaíttaaa ccagaagaaa 240 cgiciaeagc agcttctcca gagagcacta altaaiagtc aagaattggg agatgaaaaa 300
atacagatíg ítacacaaat gçtcgaaug gtggaaaaie gggcaagaca aatggagtta SSO cacícacagt gttíccaaga Ícctgclgaa agtgaacgag cctcagaíaa agcaaagatg 420 gatkcagçc aaccagaaag atcUcaaga agaccaegca ggcagcggac cagtgaaagc 480 cgtgatttat gtcacatggc aaatgggatí gaagacigig algatcagcc aectaaagsa S40 aagaaaícca agtcagcaaa gaaaaagaaa cgctccaagg ccaagcagga aagggaagcl 600
Icacctgttg agtltgcaat agatcctaat gaacetacaí actgctt&tg caaccaagtg 660
Icttatgggg agaigalagg atgtgacaat gaacagtgtc caattgaatg glticactU 720 ícatgtgitt caeítaccía laaaccaaag gggaaaiggl attgcccaaa gtgcagggga 780 gataaígaga aaaeaatgga caaaagkci gaaaagacaa aaaaggatag aagatcgagg 840
<210> 6 <211> 1078 <212> ADN <213> Biblioteca de ADNc de cérebro normal humano < 2 2 0 >
<221> CDS <222> (92).. (931) <400> 6 tccaagctga gçígsgggcc cgcggcggcc gcggccggtg catgtgcggc tgçíggatgc ggaggcggcg gegacggcgc ggatcggcag g atg tu ggg cag cag cag cag 1 ί2
Met Leu Giy Gin Gin Gin Gin 5 caa ctg lac tcg tcg gcc gcg cíc ctg acc ggg gag cgg age cgg ctg 160 Gin Leu Tyr Ser Ser Ala Aía Leu Leu Thr Giy Glu Arg Ser Arg Leu 10 15 20 cíc ace igc tac gíg cag gac tac ct t gag tgc gtg gag tcg ctg ccc 208 Leu Thr Cys Tyr Vai Gin Asp Tyr teu 6!« Cys Vai Glu Ser Leu Pre 25 30 35 cac gac atg cag agg aac gte ict gtg cfg cga gag ctg gac aac £33. 256 iíis Asp I4et Gin Arg Asa Vai Ser Vai Leu Arg Glu Leu Asp Ásn Lys m 45 50 53 tat caa gaa acg tta aag gaa att gaí gat gtc tac gaa aaa tat aag 304 Tyr Gin Giu Thr Leu Lys Gin ile ASP Asp Vai Tyr Glu Lys Tyr Lys 60 65 70 aaa gaa gai ÍUÍ Ha aac cag aag aaa cgt cia cag cag ctt cíc cag 352 Lys Glu Asp Asp Lea Asa Gin Lys Lys Arg Leu Gin Gi n Leu Leu Gin 75 SÓ §5 aga gca cia at 1 aat agt caa gaa Hg gga gat gaa aaa ata cag att 400 Arg Ala Leu He Asa Ser Gin Gtu Leu Giy Asp Glu lys lie Gin líe 00 95 100 gtt aca caa atg cíc gaa ttg gtg gãâ aat cgg gca aga caa atg gag 448 Vai Thr Gin Mel Leu G1 u Leu Vai Glu Asn Arg Aia Arg Gin Slet Glu 105 i 30 115 £ ta cac tca cag tgl Hc caa gat cct gct gaa agt gaa cga gcc tca 406 Leu Hts Ser Gin Cys Fhe Gin Asp Pru Ala Gin Ser Glu Arg Ala Ser 120 125 130 135 gat aaa gca aag atg gat ícc age caa cca gaa aga te t tca aga aga 544 Asp Lys Ala Lys Mei Asp Ser Ser Gin Pro GlU Arg Ser Ser Arg Arg
I4Õ 14$ ISO 66 ccc cgc agg cag cgg acc agt gaa age cgt gat tta tgt cac atg gea 502 Pro Arg Arg Gin Arg Thr Ser Clu Ser Arg Asp Leu Cys Mis Met Aía 155 160 165 aaí ggg átt gaa gac tgt gái gat cag cca cci aaa gaa aag aaa tcc 640 Aso Gty lie Giu Âsp Cys Asp Asp Gin Pro Pro Lys Giu Lys Lys Ser 170 175 180 aag iça gca aag aaa aag aaa cgc íçç aag gee aag cag gaa agg gaa 688 Lys Ser Ala Lys Lys Lys Lys Arg Ser Lys Ala Lys Sía Giu Arg Giu 185 190 SS5 get íea cct gU gag tu gca ata gat cct aal gaa cct aca tac tgc 736 Aía Ser Pro Vai Gin Pbe Ala X ie Asp Pro Asn Glu Pro Thr Tyr Cys 200 205 210 215 íía tge aac caa gtg ici tai ggg gag atg ata gga tgt gac aat gaa ?S4 Leu Cys Asn Gin Vai Ser Tyr Gly Glu Met i te Gly Cys Asp Asn Giu 220 225 230 cag tgt cca at t gaa tgg tu cac itt t ca tgt «u tea eu acc tat 832 Cia Cys Pro í ie Giu trp Phe His Pite Ser Cys Vai Ser Leu Thr Tyr 235 240 245 aaa cca aag ggg aaa tgg tai tgc cca aag tgc agg gga gat aat gag 889 Lys Pro lys Gly Lys trp Tyr Cys Pro lys Cys Arg Gly Asp Asa Giu 250 255 260 aaa aca atg gac aaa agí aci gaa aag aca aaa aag gat aga aga teg 328 Lys Thr Met Asp Lys Ser Tiir Giu Lys Thr Lys Lys Asp Arg Arg Ser 265 220 275 «gg íagtaaaggc catccacaít tiaaagggtt aíttgaelâi tatataatce 981
Arg 280 gtttgctítc agaaaatgtt tlagggtaaa tgcaíaagac íatgcaaiaa (tattaatea íÔ41 ítagíattaa iggigtaíia aaagtígttg taeilig 1978
<210> 7 <211> 10 <212> ADN <213> Sequência de iniciadores de RCP para TSC403 < 4 0 0 > 7 gatctgacac 10
< 210 > 8 <211> 28 <212> ADN <213> iniciador de RCP PI < 4 0 0 > 8
gatcggatcc aggaggatgc gggtccgg 28 <210> 9 <211> 30 <212> ADN <213> iniciador de RCP P2 <400> 9 gatcctcgag ttactgtggt ggctgctgct 30 68

Claims (9)

  1. REIVINDICAÇÕES 1. Polinucleótido caracterizado pelo facto de ter uma sequência de nucleótidos que codifica para a sequência de aminoácidos ilustrada na SEQ ID NO: 1 ou para uma sua sequência complementar.
  2. 2. Polinucleótido caracterizado pelo facto de se seleccionar entre (a) e (b) que se seguem: (a) um polinucleótido que contém a sequência de nucleótidos ilustrada na SEQ ID NO: 2 ou uma sua sequência complementar, (b) um polinucléótido que híbrida especificamente com o referido polinucleótido (a) em condições de 6 x SSC a 65 °C durante a noite ou 4 x SSC complementado com formaldeído a 50 %, a 37 °C, durante a noite e que se lava com 2 x SSC, a 65 °C, durante 30 minutos e que é útil como marcador de cancro.
  3. 3. Polinucleótido, de acordo com a reivindicação 2, caracterizado pelo facto de ter a sequência de nucleótidos ilustrada na SEQ ID NO: 3.
  4. 4. Processo para o diagnóstico de cancro caracterizado pelo facto de compreender a detecçâo da expressão do polinucleótido definido nas reivindicações 1 ou 2, utilizando uma sonda que tem uma sequência constituída por pelo menos 15 nucleótidos consecutivos na sequência de nucleótidos ilustrada na SEQ ID NO: 2 ou um iniciador que tem uma sequência que consiste em pelo menos 15 nucleótidos consecutivos na sequência de nucleótidos ilustrada na SEQ ID NO: 2. 1
  5. 5. Processo de diagnóstico, de acordo com a reivindicação 4, caracterizado pelo facto de o cancro se seleccionar entre cancro da glândula mamária, cancro da trompa uterina, cancro do esófago, cancro do cólon, cancro do recto, cancro da glândula tiróide, cancro da glândula parótida, cancro da uretra, cancro de ovário e cancro do pâncreas.
  6. 6. Oligonucleótidos, sondas e iniciadores caracterizados pelo facto de compreenderem uma sequência consistindo em pelo menos 15 nucleótidos consecutivos na sequência de nucleótidos ilustrada na SEQ ID NO: 2 ou na SEQ ID NO: 3, adequados para serem utilizados num processo de acordo com as reivindicações 4 e 5.
  7. 7. Estojo de diagnóstico para o cancro, caracterizado pelo facto de conter uma sonda com uma sequência que consiste em pelo menos 15 nucleótidos consecutivos na sequência de nucleótidos ilustrada na SEQ ID NO: 2 ou um iniciador que tem uma sequência que consiste em pelo menos 15 nucleótidos consecutivos na sequência de nucleótidos ilustrada na SEQ ID NO: 2 como componente essencial.
  8. 8. Proteína caracterizada pelo facto de ter uma sequência de aminoácidos ilustrada na SEQ ID NO: 1.
  9. 9. Anticorpo caracterizado pelo facto de ter uma afinidade de ligação específica para a proteína definida na reivindicação 8. 2
PT99901209T 1998-02-03 1999-02-02 Gene humano tsc403 PT1074621E (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP3813398 1998-02-03
JP7323498 1998-03-05
JP13467998 1998-04-28

Publications (1)

Publication Number Publication Date
PT1074621E true PT1074621E (pt) 2010-11-09

Family

ID=27289711

Family Applications (1)

Application Number Title Priority Date Filing Date
PT99901209T PT1074621E (pt) 1998-02-03 1999-02-02 Gene humano tsc403

Country Status (11)

Country Link
US (2) US6403785B1 (pt)
EP (1) EP1074621B1 (pt)
JP (1) JP4348504B2 (pt)
CN (1) CN1246457C (pt)
AT (1) ATE479753T1 (pt)
CA (1) CA2319668C (pt)
CY (1) CY1110911T1 (pt)
DE (1) DE69942723D1 (pt)
DK (1) DK1074621T3 (pt)
PT (1) PT1074621E (pt)
WO (1) WO1999040190A1 (pt)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU4089699A (en) * 1998-05-28 1999-12-13 Incyte Pharmaceuticals, Inc. Tumor suppressor
US6790948B1 (en) * 1999-02-26 2004-09-14 The United States Of America As Represented By The Department Of Health And Human Services Tumor suppressor gene p33ING2
WO2002064788A2 (en) * 2000-11-20 2002-08-22 Diadexus, Inc. Compositions and methods relating to lung specific genes and proteins

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5356817A (en) * 1988-06-09 1994-10-18 Yale University Methods for detecting the onset, progression and regression of gynecologic cancers
US6117633A (en) 1995-12-08 2000-09-12 University Technologies International Inc. DNA sequence encoding the tumor suppressor gene ING1
WO1998023747A2 (en) * 1996-11-27 1998-06-04 Schering Corporation Isolated mammalian dendritic cell genes; related reagents
AU4089699A (en) 1998-05-28 1999-12-13 Incyte Pharmaceuticals, Inc. Tumor suppressor

Also Published As

Publication number Publication date
EP1074621A1 (en) 2001-02-07
US6403785B1 (en) 2002-06-11
CN1289366A (zh) 2001-03-28
CY1110911T1 (el) 2015-06-10
ATE479753T1 (de) 2010-09-15
DE69942723D1 (de) 2010-10-14
DK1074621T3 (da) 2010-10-18
US20020151025A1 (en) 2002-10-17
EP1074621A4 (en) 2005-03-23
CA2319668C (en) 2007-04-10
WO1999040190A1 (fr) 1999-08-12
EP1074621B1 (en) 2010-09-01
CN1246457C (zh) 2006-03-22
CA2319668A1 (en) 1999-08-12
JP4348504B2 (ja) 2009-10-21

Similar Documents

Publication Publication Date Title
US20020102569A1 (en) Diagnostic marker for cancers
WO2001009318A1 (fr) Genes associes au cancer du foie
JP2001515349A (ja) Tm4sfヒト腫瘍関連抗原
JP2002513554A (ja) ヒト転写調節分子
US20040058358A1 (en) Lipid metabolism transcription factor
JP2003521231A (ja) 核酸結合タンパク質
JPH07143884A (ja) 腫瘍サプレッサー遺伝子メルリンおよびその用途
US20060275314A1 (en) Transmembrane protein differentially expressed in cancer
PT1074621E (pt) Gene humano tsc403
US8148343B2 (en) Tumor suppressor factor
US20050054826A1 (en) Human diaphanous-3 gene and methods of use therefor
JP2001525675A (ja) 腫瘍関連抗原
JP4058567B2 (ja) Tsa305遺伝子
EP1179589A1 (en) MMX-1, a member of the family of human cancer/testis antigens, a protein encoded thereby and a process for determining whether a tumor sample has metastatic potential
US20040253598A1 (en) Vesicle-associated proteins
US20030054446A1 (en) Novel retina-specific human proteins C7orf9, C12orf7, MPP4 and F379
ES2348656T3 (es) Human tsc403 gene and human ing1l gene.
US6503502B1 (en) Nucleotide sequences, proteins, drugs and diagnostic agents of use in treating cancer
JP2000517170A (ja) 新規なヒトマクロファージ抗原
JP2005505267A (ja) 癌において差次的に発現する膜貫通タンパク質
JP2005521382A (ja) 細胞成長、分化および細胞死関連タンパク質
AU2006201164A1 (en) Tumour suppressor factor
AU784629B2 (en) Tumour suppressor factor
WO2001009322A1 (fr) Recepteurs couples a la proteine de liaison guanosine triphosphate, genes correspondants, et leur production et utilisation
JP2001501087A (ja) ヒトGTP結合タンパク質γ―3