Relatório Descritivo da Patente de Invenção para CÉLULAS PRODUTORAS DE POLIPEPTÍDIO.
A presente invenção se refere ao campo da produção de polipeptídios. Descreve um ácido nucléico compreendendo um ácido nucléico de splicing alternativo, células compreendendo esse ácido nucléico, um método para o isolamento de células que expressem um polipeptídio heterólogo, que utiliza um ácido nucléico compreendendo um primeiro ácido nucléico que codifica um polipeptídio heterólogo, um segundo ácido nucléico compreendendo um ácido nucléico de splicing alternativo e um terceiro ácido nucléico que codifica pelo menos um fragmento de um domínio transmembrana ou um peptídio de sinal para uma âncora GPI, e também um método para a produção de polipeptídios heterólogos.
Fundamentos da Invenção
Sistemas de expressão para a produção de polipeptídios recombinantes são bem conhecidos no estado da técnica e são descritos por, por exemplo, Marino, M.H., Biopharm. 2 (1989) 18-33; Goeddel, D.V., et al., Methods Enzymol. 185 (1990) 3-7; Wurm, F., e Bernard, A., Curr. Opin. Biotechnol. 10 (1999) 156-160. Para a produção de polipeptídios e proteínas usadas em aplicações farmacêuticas, empregam-se, de preferência, células hospedeiras de mamíferos, como células CHO, células BHK, células NSO, células Sp2/0, células COS, células HEK, células PER.C6® e outras. O ácido nucléico que codifica o polipeptídio é de preferência introduzido na célula hospedeira compreendido em um ácido nucléico, como, por exemplo, um vetor de expressão. Os elementos essenciais de um vetor de expressão são uma unidade de propagação de plasm ídio procariótico, por exemplo, para Escherichia coli, compreendendo uma origem de replicação e um marcador de seleção, um marcador de seleção eucariótica e um ou mais cassetes de expressão para a expressão do(s) gene(s) estrutural(ais) de interesse, cada um compreendendo um promotor, um gene estrutural e um terminador de transcrição, incluindo um sinal de poliadenilação. Para expressão transitória em células de mamíferos, pode-se incluir uma origem de replicação de mamífero, como a SV40 Ori ou OriP de EBV. Como promotor, pode-se selecio2 nar um promotor constitutivo ou induzível. Para transcrição otimizada, podese incluir uma seqüência Kozak na região não traduzida 5'. Para processamento de mRNA, em particular terminação de transcrição e splicing prémRNA, podem-se incluir sinais de splicing de mRNA, dependendo da orga5 nização do gene estrutural (organização éxon-íntron), assim como um sinal de poliadenilação.
A expressão de um gene é realizada como expressão transitória ou permanente. O(s) polipeptídio(s) de interesse pode(m) ser um polipeptídio secretado, contendo uma extensão N terminal (também conhecida como o 10 sinal de seqüência), que é necessária para o transporte/secreção do polipeptídio através da célula e para o meio extracelular, ou pode ser um polipeptídio citosólico.
Para a produção em grande escala de um polipeptídio, tem de se estabelecer uma linhagem celular altamente produtora. Após a transfec15 ção de uma linhagem de células hospedeiras, como células CHO, células NSO, células Sp2/0, células BHK, células COS, células PER.C6®, ou células HEK, em geral uma pluralidade de clones com diferentes características são obtidos devido a, por exemplo, a ampla diferença de polipeptídios expressados por plasm ídios transitoriamente transfectados ou integrados de maneira 20 estável. Para fins de seleção, o ácido nucléico introduzido nas células possui, além disso, um marcador selecionável, por exemplo, um gene que confere resistência contra uma substância de outra forma fatal.
Após a transfecção e por crescimento em um meio seletivo apropriado, um clone altamente produtor tem de ser isolado. Isso é demorado 25 e, conseqüentemente, caro. Foram desenvolvidos vários métodos para lidar com esse problema.
Um desses métodos é a amplificação de gene. Nele, células deficientes da enzima diidrofolato redutase (DHFR) são transfectadas com um vetor/plasmídio que contém um primeiro cassete de expressão para a ex30 pressão da proteína DHFR e um segundo cassete de expressão para a expressão de um polipeptídio heterólogo de interesse. Usando-se um meio de cultura depletado de glicina, hipoxantina e timidina, estabelecem-se condi ções seletivas de crescimento. Para a amplificação, adiciona-se um inibidor de DHFR, metotrexato (MTX) (Kaufman, R.J., et al., J. Mol. Biol. 159 (1982) 601-621; US 4.656.134).
Alternativamente, moléculas repórteres, como cloranfenicolacetil-transferase, luciferase, proteína fluorescente verde ou betagalactosidase, podem ser fusionadas ao polipeptídio heterólogo para o qual se deseja uma linhagem celular altamente produtora, e usadas como um marcador de seleção indireta. A seleção ocorre na presença de um substrato ou co-fator exógeno adicionado.
Um método adicional para a identificação de um clone altamente produtor é uma transcrição ligada de um gene de marcador selecionável e um gene estrutural que codifica um polipeptídio heterólogo mediante um sítio de entrada em ribossomo interno (IRES). Com esse projeto, a expressão do polipeptídio heterólogo jpode ser correlacionada com a expressão do marcador selecionável.
Imunoglobulinas humanas são produzidas por linfócitos especializados: as células B. Essas células não apenas secretam imunoglobulinas (slg), elas também apresentam imunoglobulinas em sua membrana celular externa como imunoglobulinas ligadas à membrana plasmática (mlg). Essas mlg's desempenham um importante papel no início de uma resposta imunológiea. As imunoglobulinas ligadas à membrana plasmática apresentadas têm a função de receptores celulares para seus antígenos correspondentes.
Começando em 1980, foram publicados artigos tratando da origem de formas secretadas e ligadas a membrana plasmática de imunoglobulinas. Early et al. (Early, P., et al., Cell 20 (1980) 313-319) relataram que, em camundongos, duas espécies de mRNA que codificam a cadeia pesada de imunoglobulinas se originam do mesmo transcrito primário de um único gene μ de imunoglobulina. A formação das formas secretada (slg) e ligada a membrana plasmática (mlg) resulta do splicing alternativo do pré-mRNA de cadeia pesada. Para a isoforma slg, todos os éxons que codificam os domínios da imunoglobulina e o íntron após o éxon que codifica o domínio C terminal são retidos no mRNA, e o sinal de poliadenilação que se localiza a jusante do códon de parada no intron é usado para divagem e poliadenilação do transcrito primário. Para a isoforma mlg, um sítio doador de splice 5' alternativo depois do éxon que codifica o domínio C terminal da forma secretada (isto é, CH3 ou CH4, respectivamente) liga a região constante aos éxons a jusante Ml e M2 que codificam um domínio transmembrana. Nesse caso, a seqüência que codifica os aminoácidos terminais e o códon de parada da forma secretada, assim como o sinal de poliadenilação intrônico adjacente para a forma slg são removidos pelo splicing juntamente com o íntron.
Por exemplo, a razão entre o mRNA que codifica a forma de cadeia pesada da imunoglobulina secretada e o mRNA que codifica a forma de cadeia pesada da imunoglobulina ligada a membrana plasmática é de 10:1 a 100:1. Essa razão é estabelecida principalmente durante o splicing prémRNA. Os mecanismos de controle de tradução e pós-tradução contribuem apenas em pequena medida (veja, por exemplo, Xiang, S. D., et al., Immun. Cell Biol. 79 (2001) 472-481).
A imunoglobulina ligada à membrana plasmática da célula tem a mesma seqüência de aminoácidos e estrutura secundária que seu análogo secretado. A diferença é uma extensão C terminal da cadeia pesada de slg compreendendo um domínio transmembrana. Esse domínio transmembrana tem, em geral, um comprimento entre aproximadamente 40 e aproximadamente 75 resíduos de aminoácidos. Para imunoglobulinas murídeas e humanas, o domínio transmembrana pode ser subdividido em três regiões estruturais distintas: uma região extracelular N terminal de 13-67 resíduos de aminoácidos, um trecho transmembrana conservado central de 25 resíduos de aminoácidos, e uma região citoplasmática C terminal de 3 - 28 resíduos de aminoácidos (Major, J.G., et al., Mol. Immunol. 33 (1996) 179-187).
Vetores de expressão compreendendo um gene selecionável amplificável, um gene de proteína fluorescente e um gene que codifique um produto desejado de maneira que otimize a ligação transcricional e de tradução é relatado em WO 01/04306. Em WO 01/38557, relata-se um método para a triagem de múltiplas células transformadas/transfectadas para identificar células que expressem pelo menos dois peptídios ou proteínas de inte resse. Esses dois peptídios/proteínas estão ligados mediante um IRES (sítio de entrada em ribossomo interno) a um gene de marcador fluorescente.
Animais e células transgênicas que compreendem um transgene marcador de formação de imagem são relatados no pedido de patente norteamericana 2003/0033616. O pedido de patente norte-americana 2005/0032127 relata um método para a seleção não invasiva de células vivas únicas sob condições suaves a partir de misturas de células ou culturas celulares, com relação a um desempenho de produção específico, por métodos de detecção de fluorescência-microscópicos. Um método para a identificação e isolamento de células que produzem proteínas secretadas é relatado no pedido de patente norte-americana 2002/0168702.
Um vetor de expressão consistindo em um gene que codifica uma proteína de interesse que esteja funcionalmente ligada a um promotor de hamster, um gene que codifica uma proteína fluorescente e, de preferência, um gene marcador de seleção amplificável é relatado no pedido de patente norte-americana 2004/0148647.
Sumário da Invenção
A presente invenção compreende um ácido nucléico compreendendo na direção 5' a 3':
a) um primeiro ácido nucléico que codifica um polipeptídio heterólogo sem um códon de parada de tradução em fase de leitura,
b) um segundo ácido nucléico começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3' compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilação, e
c) um terceiro ácido nucléico que codifica:
i) pelo menos um fragmento de um domínio transmembrana, ou ii) um peptídio de sinal para uma âncora GPI.
Aspectos adicionais da presente invenção são um vetor adequado para células eucarióticas, compreendendo o ácido nucléico da invenção, e uma célula eucariótica, compreendendo pelo menos um ácido nucléico de acordo com a invenção.
A presente invenção também compreende um método para a seleção de uma célula eucariótica que expresse um polipeptídio heterólogo, em que o método compreende:
a) a transfecção de uma célula eucariótica com um ácido nucléico compreendendo, na direção 5' a 3':
i) um primeiro ácido nucléico que codifica um polipeptídio heterólogo sem um códon de parada de tradução em fase de leitura, ii) um segundo ácido nucléico começando com um sítio doador de splice e terminado por um sítio receptor de splice compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilaÇão, iii) um terceiro ácido nucléico que codifica:
iiia) pelo menos um fragmento de um domínio transmembrana, ou iiib) um peptídio de sinal para uma âncora GPI,
b) o cultivo da dita célula transfectada sob condições adequadas para a produção de pré-mRNA a partir do dito ácido nucléico, o processamento do dito pré-mRNA e a tradução do dito mRNA processado em um polipeptídio, em que a dita célula transfectada produz polipeptídio heterólogo solúvel e polipeptídio heterólogo ligado a membrana plasmática por splicing alternativo do dito pré-mRNA, e
c) a seleção de uma célula com polipeptídio heterólogo ligado a membrana plasmática para ser a dita célula que expressa um polipeptídio heterólogo.
Em uma modalidade, o método da invenção é para a seleção de uma célula eucariótica que expresse uma imunoglobulina, em que o método compreende:
a) a transfecção de uma célula eucariótica com um ácido nucléico compreendendo, na direção 5' a 3':
i) um primeiro ácido nucléico que codifica pelo menos um fragmento de uma cadeia pesada de imunoglobulina sem um códon de parada de tradução em fase de leitura, ii) um segundo ácido nucléico começando com um sítio doador de splice e terminado por um sítio receptor de splice compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilação, iii) um terceiro ácido nucléico que codifica:
iiia) pelo menos um fragmento de um domínio transmembrana, ou iiib) um peptídio de sinal para uma âncora GPI,
b) o cultivo da dita célula transfectada sob condições adequadas para a produção de pré-mRNA a partir do dito ácido nucléico, o processamento do dito pré-mRNA e a tradução do dito mRNA processado em uma cadeia pesada de imunoglobulina, em que a dita célula transfectada produz cadeia pesada de imunoglobulina solúvel e cadeia pesada de imunoglobulina ligada a membrana plasmática por splicing alternativo do dito pré-mRNA, e
c) a seleção de uma célula com cadeia pesada de imunoglobulina ligada a membrana plasmática para ser a dita célula que expressa uma imunoglobulina.
A presente invenção também compreende um método para a produção de um polipeptídio codificado por um ácido nucléico de acordo com a invenção, por:
a) fornecimento de uma célula eucariótica,
b) transfecção da dita célula eucariótica com um ácido nucléico de acordo com a invenção,
c) cultivo da dita célula transfectada sob condições adequadas para a expressão do dito ácido nucléico,
d) recuperação do dito polipeptídio do meio de cultura ou do citoplasma da dita célula.
A presente invenção também compreende um ácido nucléico compreendendo, na direção 5' a 3':
a) um primeiro sítio de clonagem múltipla,
b) um ácido nucléico começando com um sítio doador de splice
5' e terminado por um sítio receptor de splice 3', em que:
i) o dito ácido nucléico compreende um códon de parada de tradução e um sinal de poliadenilação, e ii) o dito ácido nucléico não é constitutivamente removido durante o processamento de pré-mRNA,
c) um segundo sítio de clonagem múltipla.
A invenção também compreende um vetor compreendendo o ácido nucléico não removido constitutivamente de acordo com a invenção. Descrição Detalhada da Invenção
A presente invenção compreende um método para a seleção de uma célula eucariótica que expresse um polipeptídio ou proteína heteróloga, em que o método compreende:
a) a transfecção de uma célula eucariótica com um ácido nucléico compreendendo, na direção 5' a 3':
i) um primeiro ácido nucléico que codifica um polipeptídio ou proteína heteróloga sem um códon de parada de tradução, ii) um segundo ácido nucléico começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3', compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilação, iii) um terceiro ácido nucléico que codifica:
iiia) pelo menos um fragmento de um domínio transmembrana, ou iiib) um peptídio de sinal para uma âncora GPI,
b) o cultivo da dita célula transfectada sob condições adequadas para a produção de pré-mRNA a partir do dito ácido nucléico, o processamento do dito pré-mRNA, e a tradução do dito mRNA processado em um polipeptídio ou proteína, em que a dita célula transfectada produz polipeptídio ou proteína heteróloga solúvel e polipeptídio ou proteína heteróloga ligada a membrana plasmática por splicing alternativo do dito pré-mRNA,
c) a seleção de uma célula com polipeptídio ou proteína heteróloga ligada a membrana plasmática para ser a dita célula que expressa um polipeptídio ou proteína heteróloga.
Métodos e técnicas utilizáveis para a realização da presente invenção são descritos em, por exemplo, Ausubel, F.M. (ed.), Current Protocols in Molecular Biology, Volumes I a III (1997); Glover, N.D., e Hames, B.D., ed., DNA Cloning: A Practical Approach, Volumes I e II (1985), Oxford University Press; Freshney, R.l. (ed.), Animal Cell Culture - a practical approach, IRL Press Limited (1986); Watson, J.D., et al., Recombinant DNA, Segunda Edição, CHSL Press (1992); Winnacker, E.L., From Genes to Clones; N.Y., VCH Publishers (1987); Celis, J., ed., Cell Biology, Segunda Edição, Academic Press (1998); Freshney, R.I., Culture of Animal Cells: A Manual of Basic Technique, Segunda Edição, Alan R. Liss, Inc., N.Y. (1987).
O uso de tecnologia de DNA recombinante permite a produção de inúmeros derivados de um polipeptídio. Esses derivados podem, por exemplo, ser modificados em posições de aminoácidos individuais ou várias por substituição, alteração, troca, deleção ou inserção. A modificação ou derivatização pode, por exemplo, ser realizada por meio de mutagênese direcionada a sítio. Essas modificações podem ser facilmente realizadas por aqueles versados na técnica (veja, por exemplo, Sambrook, J., et al., Molecular Cloning: A laboratory manual (1999) Cold Spring Harbor Laboratory Press, New York, USA; Hames, B. D., e Higgins, S.G., Nucleic acid hybridization - a practical approach (1985) IRL Press, Oxford, England).
Dentro do âmbito da presente invenção, alguns dos termos usados são definidos a seguir:
Um ácido nucléico, conforme aqui usado, refere-se a uma molécula de polinucleotídeo, por exemplo, a tipos de DNA e/ou RNA. Essa molécula de polinucleotídeo pode ser uma molécula de polinucleotídeo de ocorrência natural ou uma molécula de polinucleotídeo sintética ou uma combinação de uma ou mais moléculas de polinucleotídeo de ocorrência natural ou seus fragmentos com uma ou mais moléculas de polinucleotídeo sintéticas. Também estão englobadas por esta definição moléculas de polinucleotídeo de ocorrência natural em que um ou mais nucleotídeos tenham sido trocados, por exemplo, por mutagênese, deletados ou acrescentados. O áci do nucléico pode ser isolado ou integrado em outro ácido nucléico, por exemplo, em um vetor de expressão ou no cromossomo de uma célula hospedeira eucariótica. Um ácido nucléico também é caracterizado por sua seqüência de ácido nucléico, que consiste em nucleotídeos individuais. Sabese na técnica como deduzir uma seqüência de aminoácidos a partir do ácido nucléico codificador correspondente e também como derivar um ácido nucléico correspondente a partir da seqüência de aminoácidos codificada. Assim, uma seqüência de aminoácidos também é caracterizada por seu ácido nucléico. Da mesma forma,, um ácido nucléico é dado por uma seqüência de aminoácidos correspondente.
As expressões plasmídio ou vetor, que são usadas de maneira intercambiável neste pedido, incluem, por exemplo, plasmídios bifuncionais e de expressão, assim como plasmídios de transfecção. Tipicamente, o plasmídio também compreenderá uma origem de replicação (por exemplo, a origem de replicação ColEI e oriP) e um marcador selecionável (por exemplo, um gene de resistência a ampicilina ou tetraciclina) para replicação e seleção, respectivamente, do plasm ídio em bactérias.
Um cassete de expressão refere-se a um construto que contém os elementos reguladores necessários para a expressão pelo menos do gene estrutural contida em uma célula. Opcionalmente, estão contidos elementos adicionais que permitem a secreção do polipeptídio ou proteína expressada.
Um gene designa um segmento, por exemplo, em um cromossomo ou em um plasm ídio, que é necessário para a expressão de um polipeptídio ou proteína. Além da região codificadora, o gene compreende outros elementos funcionais, incluindo um promotor, um ou mais introns e/ou éxons e um ou mais terminadores.
O termo gene estrutural, conforme usado neste pedido, designa a região codificadora de um gene, isto é, os éxons, sem uma seqüência de sinal, mas com introns intervenientes.
Um marcador selecionável designa um gene que permite que células portadoras do gene sejam especificamente selecionadas para ou contra, na presença ou ausência de um agente de seleção correspondente. Um marcador selecionável positivo utilizável é um gene de resistência a antibiótico. Esse marcador selecionável permite que a célula hospedeira transformada com o gene seja positivamente selecionada na presença do antibiótico correspondente; uma célula hospedeira não transformada não seria capaz de crescer ou sobreviver sob as condições de cultura seletivas, isto é, na presença do agente de seleção, em um meio seletivo.
Marcadores selecionáveis podem ser positivos, negativos ou bifuncionais. Marcadores selecionáveis positivos permite a seleção de células portadoras do marcador, ao passo que marcadores selecionáveis negativos permitem que células portadoras do marcador sejam seletivamente eliminadas. Tipicamente, um marcador selecionável conferirá resistência a um fármaco ou compensará um defeito metabólico ou catabólico na célula hospedeira. Marcadores selecionáveis utilizáveis com células eucarióticas incluem, por exemplo, os genes da aminoglicosida fosfotransferase (ΑΡΗ), como higromicina fosfotransferase (hyg), neomicina e G418 APH, diidrofolato redutase (DHFR), timidina quinase (tk), glutamina sintetase (GS), asparagina sintetase, triptofano sintetase (agente seletivo indol), histidinol desidrogenase (agente seletivo histidinol D), e genes que codificam resistência a puromicina, bleomicina, fleomicina, cloranfenicol, Zeocin e ácido micofenólico. Genes marcadores adicionais são descritos no WO 92/08796 e WO 94/28143.
Elementos reguladores, conforme aqui usado, referem-se a seqüências nucleotídicas presentes em cis e/ou trans, necessárias para a transcrição e/ou tradução do gene compreendendo o gene estrutural de interesse. Os elementos reguladores transcricionais normalmente compreende um promotor a montante da seqüência de gene a ser expressada, sítios de início e término de transcrição e uma seqüência de sinal de poliadenilação. O termo sítio de início de transcrição refere-se ao nucleotídeo no gene que corresponde ao primeiro ácido nucléico a ser incorporado no transcrito primário, isto é, o pré-mRNA; o sítio de início de transcrição pode se superpor à seqüência promotora. O termo sítio de término de transcrição refere-se a uma seqüência nucleotídica normalmente presente na extremidade 3' de um gene de interesse a ser transcrito, que faz com que a RNA polimerase termine a transcrição. A seqüência de sinal de poliadenilação, ou sinal de adição de poli-A fornece o sinal para a divagem em um sítio específico na extremidade 3' de um mRNA eucariótico e a adição pós-transcricional de uma se5 qüência de cerca de 100 - 200 nucleotídeos adenina (cauda poliA) à extremidade 3' clivada no núcleo. A seqüência de sinal de poliadenilação pode incluir a seqüência de consenso AATAAA localizada cerca de 10 - 30 nucleotídeos a montante do sítio de divagem.
Elementos reguladores de tradução incluem um códon de início 10 de tradução (AUG) e um de parada (TAA, TAG ou TGA). Um sítio de entrada em ribossomo interno (IRES) pode ser incluído em alguns construtos.
Um promotor refere-se a uma seqüência de polinucleotídeo que contra a transcrição de um gene ou seqüência de ácido nucléico à qual está operacionalmente ligado. Um promotor inclui sinais para a ligação de 15 RNA polimerase e início de transcrição. O promotor usado será funcional no tipo de célula da célula hospedeira em que se considera a expressão da seqüência selecionada/operacionalmente ligada. Um grande número de promotores, incluindo promotores constitutivos, induzíveis e reprimíveis de várias fontes diferentes, são conhecidos na técnica (e estão identificados em 20 bases de dados como o GenBank) e estão disponíveis como ou dentro de polinucleotídeos clonados (por exemplo, de depositários como a ATCC, assim como outras fontes comerciais ou individuais). Um promotor compreende uma seqüência nucleotídica que dirige a transcrição de um gene estrutural. Tipicamente, um promotor está localizado na região não codificadora 5' 25 ou não traduzida de um gene, proximal ao sítio de início de transcrição de um gene estrutural. Elementos de seqüência dentro de promotores que funcionam no início da transcrição são freqüentemente caracterizados por seqüências nucleotídicas de consenso. Esses elementos promotores incluem sítios de ligação de RNA polimerase, seqüências TATA, seqüências CAAT, 30 elementos específicos para diferenciação (DSEs; McGehee, R.E. Jr., et al., Mol. Endocrinol. 7 (1993) 551-60), elementos de resposta a AMP cíclico (CREs), elementos de resposta sérica (SREs; Treisman, R., Seminars in
Cancer Biol. 1 (1990) 47-58), elementos de resposta a glicocorticóides (GREs) e sítios de ligação para outros fatores de transcrição, como CRE/ATF (O'Reilly, M.A., et al., J. Biol. Chem. 267 (1992) 19938- 43), AP2 (Ye, J., et al., J. Biol. Chem. 269 (1994) 25728-34), SPI, proteína de ligação a elemento de resposta a cAMP (CREB; Loeken, M.R., Gene Expr. 3 (1993) 253-64) e fatores de octâmeros (veja, genericamente, Watson et al., eds., Molecular Biology of the Gene, 4- ed., The Benjamin/Cummings Publishing Company, Inc. (1987), e Lemaigre, F.P. e Rousseau, G.G., Biochem. J. 303 (1994) 1-14). Se um promotor for um promotor induzível, então, a taxa de transcrição aumenta em resposta a um agente indutor. Em contraste, a taxa de transcrição não é regulada por um agente indutor, se o promotor for um promotor constitutivo. Também se conhecem promotores reprimíveis. Por exemplo, o promotor c-fos é especificamente ativado por ligação do hormônio de crescimento a seu receptor na superfície celular. A expressão regulada por tetraciclina (Tet) pode ser conseguida por promotores híbridos artificiais, que consistem, por exemplo, em um promotor CMV seguido por dois sítios Tet-operadores. O Tet-repressor se liga a dois sítios Tet-operadores e bloqueia a transcrição. Com a adição do indutor tetraciclina, o Tet-repressor é liberado dos sítios Tet-operadores, e a transcrição prossegue (Gossen, M. e Bujard, H. PNAS 89 (1992) 5547-5551). Para outros promotores induzíveis, incluindo metalotioneína e promotores de choque térmico, veja, por exemplo, Sambrook et al. (supra) e Gossen et al., Curr. Opin. Biotech. 5 (1994) 516-520. Entre os promotores eucarióticos que foram identificados como promotores fortes para expressão de alto níveis estão o promotor precoce SV40, promotor tardio maior de adenovirus, promotor de metalotioneína-l de camundongo, repetição terminal longa do vírus do sarcoma de Rous, fator 1 alfa de alongamento de hamster chinês (CHEF-I, veja, por exemplo, US 5.888.809), EF-I alfa humano, ubiquitina e promotor precoce imediata de citomegalovírus humano (CMV IE).
O promotor pode ser constitutivo ou induzível. Um intensificador (isto é, um elemento de DNA de ação cis, que age sobre um promotor para aumentar a transcrição) pode ser necessário para funcionar em conjun to com o promotor para aumentar o nível de expressão obtido apenas com ο promotor, e pode ser incluído como um elemento regulador de transcrição. Frequentemente, o segmento polinucleotídico contendo o promotor incluirá uma seqüência intensificadora também (por exemplo, CMV ou SV40).
Operacionalmente ligado refere-se a uma justaposição de dois ou mais componentes, em que os componentes assim descritos estão em uma relação que permite que funcionem de sua maneira desejada. Por exemplo, um promotor e/ou intensificador estão operacionalmente ligados a uma seqüência codificadora, se agir em cis para controlar ou modular a transcrição da seqüência codificadora ligada. Geralmente, mas não necessariamente, as seqüências de DNA que estão operacionalmente ligadas são contíguas e, quando necessário para unir duas regiões codificadoras de proteínas, como um líder secretor e um polipeptídio, ou um polipeptídio e um domínio transmembrana, ou um polipeptídio e um peptídio de sinal para uma âncora GPI, ou um polipeptídio e um códon de parada de tradução, contíguas e em fase de leitura. Entretanto, embora um promotor operacionalmente ligado em geral esteja localizado a montante da seqüência codificadora, não é necessariamente contígua a ela. Intensificadores não têm de ser contíguos. Um intensificador está operacionalmente ligado a uma seqüência codificadora se o intensificador aumentar a transcrição da seqüência codificadora. Intensificadores operacionalmente ligados podem estar localizados a montante, dentro ou a jusante de seqüências codificadoras e a uma distância considerável do promotor. Um sítio de poliadenilação está operacionalmente ligado a uma seqüência codificadora se estiver localizado na extremidade a jusante da seqüência codificadora, de modo que a transcrição se processe da seqüência codificadora para a seqüência de poliadenilação. A ligação é realizada por métodos recombinantes conhecidos na técnica, por exemplo, usando-se metodologia de PCR e/ou por ligação em sítios de restrição convenientes. Se não existirem sítios de restrição convenientes, então, usam-se adaptadores ou elos oligonucleotídicos sintéticos de acordo com a prática convencional.
O termo produção de pré-mRNA, conforme aqui usado, desig na um processo de transcrição de DNA em seu pré-mRNA complementar. O DNA eucariótico é composto por regiões codificadoras e não codificadoras, que são chamadas de éxons (codificadoras) e introns (não codificadoras). No processo de transcrição de DNA em seu pré-mRNA complementar, a organização genômica de éxons e introns é mantida.
O termo processamento de pré-mRNA, conforme aqui usado, designa um processo de modificação pós-transcricional. Nessa etapa, os introns do pré-mRNA são submetidos a splicing, isto é, removidos do prémRNA, a extremidade 5' do mRNA processado é capeada, e se realizada a poliadenilação 3'. O mRNA nuclear final, isto é, maduro, é obtido nessa etapa.
O termo domínio transmembrana, conforme usado neste pedido, designa um polipeptídio ou proteína que é codificada no nível do DNA por pelo menos um éxon e que compreende uma região extracelular, uma transmembrana e uma intracelular. Um domínio transmembrana em geral compreende três regiões estruturais distintas: uma região extracelular N terminal, um trecho transmembrana conservado central e uma região citoplasmática C terminal. Em uma modalidade, o domínio transmembrana compreende, na direção N para C terminal, uma região extracelular e uma região transmembrana. O domínio transmembrana também pode compreender uma região intracelular ou citoplasmática.
O termo um fragmento de um domínio transmembrana, conforme usado neste pedido, designa a parte de um domínio transmembrana que atravessa a membrana celular, isto é, que está localizada dentro da membrana cleular, isto é, o trecho transmembrana.
O termo ácido nucléico de splicing alternativo designa um ácido nucléico começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3'. Esse ácido nucléico contém um códon de parada de tradução e um sinal de poliadenilação. Esse ácido nucléico de splicing alternativo compreende uma região não codificadora que não é constitutivamente removida do pré-mRNA correspondente, como, por exemplo, o íntron depois do éxon que codifica um domínio de cadeia pesada de imunoglobuli na Ch3 ou Ch4. O evento de splicing alternativo que ocorre no sítio doador de splice 5' do ácido nucléico de splicing alternativo é um evento de decisão quanto a se o ácido nucléico de splicing alternativo é removido do pré-mRNA ou se é pelo menos mantido e compõe o mRNA maduro (processado).
O termo splicing alternativo e seus equivalentes gramaticais, conforme aqui usado, refere-se a um processo em células eucarióticas em que, a partir de um único pré-mRNA, devido a um processamento diferente de um ou mais introns, diferentes mRNAs maduros podem ser obtidos, e portanto, diferentes isoformas de um polipeptídio podem ser expressadas. Em uma modalidade da invenção, um único, isto é, apenas um, intron do pré-mRNA produzido por ser removido alternativamente. Em outra modalidade, o segundo ácido nucléico pode ser removido alternativamente. Uma modalidade adicional compreende o segundo ácido nucléico e um íntron alternativamente removível. O processamento diferente é uma decisão de sim/não, isto é, no processo de splicing alternativo, o íntron a ser processado, isto é, o ácido nucléico de splicing alternativo, é pelo menos parcialmente retido ou removido. Isso não deve ser entendido como um mecanismo de ponto de bifurcação resultando em diferentes éxons a seguir. É, de fato, um mecanismo em que um ácido nucléico de splicing alternativo é removido ou peto menos parcialnTente mantido no mRNA maduro. Com esse mecanismo, o ácido nucléico de splicing alternativo e, portanto, o códon de parada de tradução em fase de leitura nele compreendido é retido ou removido.
O splicing alternativo é um importante mecanismo regulador em células eucarióticas. Com o splicing alternativo, diferentes combinações de éxons em um mRNA maduro podem ser obtidas a partir do mesmo prémRNA, dando origem a uma pluralidade de diferentes proteínas codificadas pelo mesmo DNA.
O termo expressão, conforme aqui usado, refere-se a processos de transcrição e/ou tradução que ocorram dentro de uma célula. O nível de transcrição de um produto desejado em uma célula pode ser determinado com base na quantidade do mRNA correspondente que está presente na célula. Por exemplo, mRNA transcrito a partir de uma seqüência selecionada pode ser quantificado por PCR ou por hibridização Northern (veja Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press (1989)). Polipeptídios podem ser quantificados por vários métodos, por exemplo, por ELISA, por ensaio de atividade biológica do polipeptídio ou por emprego de ensaios que sejam independentes dessa atividade, como Western blotting, eletroforese em SDS gel de poliacrilamida, NMR ou radioimunoensaio, por exemplo, usando anticorpos que reconheçam e se liguem ao polipeptídio (veja Sambrook et al., 1989, supra).
Uma célula hospedeira refere-se a uma célula na qual se introduz um ácido nucléico heterólogo que codifica um polipeptídio ou proteína. A célula hospedeira inclui tanto células procarióticas, que são usadas para a propagação de plasmídios, e células eucarióticas, que são usadas para a expressão do ácido nucléico heterólogo. De preferência, as células eucarióticas são células de mamíferos. De preferência, as células de mamíferos são células CHO, células BHK, células NSO, células Sp2/0, células COS, células HEK, células PER.C6®.
Um polipeptídio é um polímero que consiste em aminoácidos unidos por ligações peptídicas, quer produzidos naturalmente, quer sinteticamente. Polipeptídios de menos de cerca de 20 resíduos de aminoácidos podem ser chamados de peptídios, ao passo que polipeptídios consistindo em mais de 100 resíduos de aminoácidos ou consistindo em duas ou mais cadeias polipeptídicas podem ser chamados de proteínas.
Uma proteína é uma macromolécula compreendendo pelo menos uma cadeia polipeptídica com um comprimento de 100 aminoácidos ou mais ou compreendendo duas ou mais cadeias polipeptídicas.
Polipeptídios e proteínas também podem compreender componentes não peptídicos, como grupos carboidrato, íons metálicos, lipídios, ésteres de ácidos carboxílicos ou suas combinações. Os substituintes não peptídicos podem ser acrescentados pela célula em que o polipeptídio ou proteína é produzida e podem variar com o tipo de célula. Polipeptídios e proteínas são aqui definidos em termos de suas estruturas principais de aminoácidos; adições, como grupos carboidrato, em geral não são especifica18 das, mas podem estar presentes.
DNA heterólogo ou ácido nucléico heterólogo refere-se a uma molécula de DNA ou a um ácido nucléico, ou a uma população de moléculas de DNA ou a uma população de ácidos nucléicos, que não existem natural5 mente dentro de uma dada célula hospedeira. Moléculas de DNA heterólogas a uma célula hospedeira particular podem conter DNA derivado da espécie da célula hospedeira (isto é, DNA endógeno), contanto que o DNA hospedeiro esteja combinado com DNA não hospedeiro (isto é, DNA exógeno). Por exemplo, uma molécula de DNA contendo um segmento de DNA 10 não hospedeiro que codifica um polipeptídio operacionalmente ligado a um segmento de DNA hospedeiro compreendendo um promotor é considerada uma molécula de DNA heterólogo. Inversamente, o DNA heterólogo pode compreender um gene estrutural endógeno operacionalmente ligado a um promotor exógeno.
Um peptídio ou polipeptídio codificado por um ácido nucléico não hospedeiro, isto é, heterólogo, é um peptídio ou polipeptídio heterólogo.
O termo polipeptídio biologicamente ativo, conforme aqui usado, refere-se a uma molécula orgânica, por exemplo, uma macromolécula biológica, como um peptídio, proteína, glicoproteína, nucleoproteína, muco20 proteína, lipoproteína, polipeptídio ou proteína sintética, que cause um efeito biológico quando administrado em ou a sistemas biológicos artificiais, como bioensaios usando linhagens celulares e vírus, ou in vivo a um animal, incluindo, mas não limitados a, avez e mamíferos, incluindo seres humanos. Esse efeito biológico pode ser, mas não se limita a, inibição ou ativação de uma 25 enzima, ligação a um receptor ou ligante, no sítio d eligação ou circunferencial, desencadeamento de sinal ou modulação de sinal. Em uma modalidade, do dito polipeptídio biologicamente ativo é selecionado do grupo de polipeptídios compreendendo imunoglobulinas, fragmentos de imunoglobulinas, conugados de imunoglobulinas e peptídios antifusogênicos.
Moléculas biologicamente ativas são, sem limitação, por exemplo, hormônios, citocinas, interleucinas, imunoglobulinas, peptídios antifusogênicos, fatores de crescimento, ligantes, agonistas ou antagonistas de re ceptor, agentes citotóxicos, agentes antivirais, agentes de formação de imagem, inibidores de enzimas, ativadores de enzimas ou moduladores da atividade de enzimas, como substâncias alostéricas, e conjugados desses.
O termo aminoácido, conforme usado neste pedido, designa um grupo de carbóxi α-aminoácidos, que, diretamente ou como precursores, possam ser codificados por ácidos nucléicos, compreendendo alanina (código de três letras: Ala, código de uma letra: A), arginina (Arg, R), asparagina (Asn, N), ácido aspártico (Asp, D), cisteína (Cys, C), glutamina (Gin, Q), ácido glutâmico (Glu, E), glicina (Gly, G), histidina (His, H), isoleucina (He, I), leucina (Leu, L), lisina (Lys, K), metionina (Met, M), fenilalanina (Phe, F), prolina (Pro, P), serina (Ser, S), treonina (Thr, T), triptofano (Trp, W), tirosina (Tyr, Y) e valina (Vai, V).
Um vetor de clonagem é um ácido nucléico, como um plasmídio, cosmídio, fagemídio ou cromossoma artificial bacteriano (BAC), que tenha a capacidade de se replicar de maneira autônoma em uma célula hospedeira. Vetores de clonagem tipicamente contêm um ou um pequeno número de sítios de reconhecimento de endonuclease de restrição que permitem a inserção de um ácido nucléico de uma maneira determinável, sem perda de uma função biológica essencial do vetor, assim como seqüências nucleotídicas que codificam um marcador selecionável, isto é, adequado para uso na identificação e seleção de células transformadas com o vetor de clonagem. Marcadores selecionáveis tipicamente incluem genes que conferem resistência a tetraciclina, neomicina, G418 ou ampicilina.
Um vetor de expressão é um ácido nucléico que codifica um polipeptídio ou proteína heteróloga para ser expressada em uma célula hospedeira. Tipicamente, um vetor de expressão compreende uma unidade de propagação de plasmídio procariótico, por exemplo, para E. coli, compreendendo uma origem de replicação procariótica e um marcador de seleção procariótica, um marcador de seleção eucariótica e um ou mais cassetes de expressão para a expressão de um ácido nucléico de interesse, cada um compreendendo um promotor, um ácido nucléico e um terminador de transcrição, incluindo um sinal de poliadenilação. A expressão do gene normal mente é colocada sob o controle de um promotor, e esse gene estrutural é dito operacionalmente ligado ao promotor. Da mesma forma, um elemento regulador e um promotor de núcleo estão operacionalmente ligados se o elemento regulador modular a atividade do promotor de núcleo.
Uma unidade de transcrição policistrônica é uma unidade de transcrição em que mais de um gene estrutural está sob o controle do mesmo promotor.
Um polipeptídio isolado ou uma proteína isolada é um polipeptídio ou proteína que seja essencialmente livre de componentes celulares 10 contaminantes, como carboidratos não covalentemente ligados, lipídios ou outras impurezas proteináceas, assim como impurezas não proteináceas associadas ao polipeptídio ou proteína na natureza. Tipicamente, uma preparação de polipeptídio/proteína isolada contém o polipeptídio/proteína em uma forma altamente purificada, isto é, pelo menos cerca de 80% pura, pelo 15 menos cerca de 90% pura, pelo menos cerca de 95% pura, mais de 95% pura ou mais de 99% pura. Uma maneira de mostrar que uma preparação particular contém um polipeptídio ou proteína isolada é pelo aparecimento de uma única banda na eletroforese em dodecil sulfato de sódio (SDS)-gel de poliacrilamida da preparação e coloração com Azul Brilhante de Coomassie 20 do gel. Entretanto, o termo isolado não exclui a presença do mesmo polipeptídio ou proteína em formas físicas alternativas, como dímeros ou formas alternativamente glicosiladas ou derivatizadas.
Conforme aqui usado, o termo imunoglobulina designa uma proteína consistindo em um ou mais polipeptídios substancialmente codifica25 dos por genes de imunoglobulinas. Essa definição inclui variantes, como formas mutantes, isto é, formas com substituições, deleções e inserções de um ou mais aminoácidos, formas truncadas, assim como formas fusionadas. Os genes de imunoglobulinas reconhecidos incluem os diferentes genes de regiões constantes, assim como a miríade de genes de regiões variáveis da 30 imunoglobulina. Imunoglobulinas podem existir em vários formatos, including, por exemplo, Fv, Fab, e F(ab)2, assim como cadeias simples (scFv) (por exemplo, Huston, J.S., et al., PNAS USA 85 (1988) 5879-5883; Bird,
R.E., et al., Science 242 (1988) 423-426; e, em geral, Hood et al., Immunology, Benjamin N.Y., 2- edição (1984) e Hunkapiller, T., e Hood, L, Nature 323(1986) 15-16).
Cada uma das cadeias polipeptídicas pesadas e leves de uma imunoglobulina, caso presentes, pode compreender uma região constante (em geral a parte terminal carboxila). A região constante da cadeia pesada medeia a ligação do anticorpo: i) a células portadoras de um receptor Fc, como células fagocíticas, ou ii) a células portadoras do receptor Fc neonatal (FcRn), também conhecido como receptor Brambell. Também medeia a liga10 ção a alguns fatores, incluindo fatores do sistema complemento clássico, como o componente C1q. Além disso, um domínio transmembrana pode seguir o domínio constante C terminal de uma cadeia pesada de imunoglobulina, isto é, o domínio CH3 ou CH4. Esse domínio transmembrana permite a formação de imunoglobulinas ligadas a membrana plasmática ou fragmentos 15 de imunoglobulinas ou imunoglobulina-polipeptídios de fusão.
Cada uma das cadeias polipeptídicas pesadas e leves de uma imunoglobulina, caso presentes, pode compreender um domínio variável (em geral, a parte amino terminal). O domínio variável de uma cadeia leve ou pesada de imunoglobulina compreende diferentes segmentos, isto é, quatro 20 regiões de armação (FR) e três regiões hipervariáveis (CDR).
O termo pelo menos um fragmento de designa uma fração de um ácido nucléico completo ou um polipeptídio completo, isto é, pelo menos 20%, pelo menos 40%, pelo menos 60% ou pelo menos 80% do ácido nucléico, polipeptídio ou domínio completo. Por exemplo, um ácido nucléico 25 que codifica pelo menos um fragmento de um domínio Ch3 ou Ch4 de imunoglobulina designa uma fração do ácido nucléico que codifica o domínio Ch3 ou Ch4 completo da imunoglobulina, isto é, pelo menos 20%, pelo menos 40%, pelo menos 60% ou pelo menos 80% do ácido nucléico que codifica o domínio CH3 ou Ch4 completo da imunoglobulina. Em uma modalidade, 30 um fragmento de uma cadeia pesada de imunoglobulina é um fragmento C terminal de uma cadeia pesada de imunoglobulina.
O termo um códon de parada de tradução em fase de leitura designa um códon de parada de tradução (TAA, TAG ou TGA) que suceda a uma região codificadora de um ácido nucléico sem um deslocmento de fase da fase de leitura com relação à região codificadora precedente do ácido nucléico, isto é, que termine a região codificadora durante a tradução. Um códon de parada de tradução em fase de leitura está operacionalmente ligado à região codificadora precedente de um ácido nucléico.
O termo sem um códon de parada de tradução em fase de leitura designa a ausência de um códon de parada de tradução (TAA, TAG ou TGA) no ácido nucléico designado e/ou a presença de um códon de parada de tradução, que pode ser encontrado dentro ou na extremidade de uma região codificadora de um ácido nucléico, mas que seja devido a um ou dois deslocamentos de pares de bases não reconhecidos durante a tradução do mRNA processado (isto é, fora de fase, não ligado operacionalmente) e, portanto, não termine a região codificadora no processo de tradução.
Terminador de transcrição, conforme designado neste pedido, é uma seqüência de DNA de 50 - 750 pares de bases de comprimento, que forneça à RNA polimerase o sinal para o término da síntese de mRNA. Terminadores muito eficientes (fortes) na extremidade 3' de um cassete de expressão são aconselháveis para evitar que a RNA polimerase continue lendo, particularmente quando se usam promotores fortes. Terminadores de transcrição ineficientes podem levar à formação de um mRNA do tipo óperon, o que pode ser a razão para uma expressão do gene indesejável, por exemplo, codificada por plasmídio.
Os termos não removido constitutivamente durante o processamento de pré-mRNA e não removido constitutivamente do pré-mRNA (correspondente), conforme usados neste pedido, designam um processo de splicing que não ocorre de maneira não excepcional durante o processo do pré-mRNA, isto é, o ácido nucléico de um íntron específico é removido apenas às vezes durante o processamento do pré-mRNA.Como resultado, dois mRNA maduros diferentes são obtidos, um com pelo menos uma parte do íntron e um sem o íntron.
O termo âncora GPI, conforme usado neste pedido, designa uma modificação pós-tradução fixada a uma terminação C de um polipeptídio ou proteína. Uma âncora GPI tem uma estrutura de núcleo compreendendo pelo menos um resíduo de fosfato de etanolamina, uma trimanosida, um resíduo de glucosamina residue e um inositol fosfolipídio. Apesar dessa estrutura de núcleo, uma âncora GPI normalmente possui uma certa microheterogeneidade e, conseqüentemente, uma proteína com uma âncora GPI normalmente é uma mistura de proteínas com âncoras GPI homólogas da mesma estrutura de núcleo com diferentes modificações da cadeia colateral.
O termo peptídio de sinal para uma âncora GPI designa uma seqüência de aminoácidos C terminal de um polipeptídio ou proteína que consiste em um aminoácido ao qual a âncora GPI pode ser fixada, um peptídio espaçador opcional e um peptídio hidrofóbico. Quase todo esse peptídio de sinal, isto é, o peptídio espaçador opcional e o peptídio hidrofóbico, é removido pós-tradução pela enzima GPI-transaminase, e se forma uma ligação entre o grupo amino do fosfato de etanolamina de núcleo da âncora GPI e o aminoácido ao qual a âncora GPI está ligada.
Após a transfecção com um ácido nucléico heterólogo, células que expressem um polipeptídio heterólogo codificado pelo ácido nucléico heterólogo têm de ser selecionadas. Para a seleção, usa-se um marcador. O marcador indica células em uma população que tenham sido transformadas com sucesso e facilita a seleção e o isolamento dessas células. Podem-se usar diferentes marcadores, como, por exemplo, marcadores selecionáveis, ou etiquetas detectáveis, como a Proteína Fluorescente Verde (GFP).
A seleção das células pode ser realizada em uma única etapa ou em múltiplas etapas. Em um procedimento de única/múltiplas etapas, a primeira seleção pode ser efetuada com base, por exemplo, em um nível de limitar de um marcador selecionável, como uma etiqueta detectável. Por exemplo, para a seleção por citometria de fluxo (por exemplo, por FACS Classificação de Células Ativada por Fluorescência), estabelece-se um nível de limiar de fluorescência, e células com uma fluorescência acima desse nível de limiar são selecionadas. Alternativamente, células nos 1 - 15% superiores (isto é, os 15% das células com a etiqueta detectável mais intensa), ou os 1 -10% superiores, ou 1 - 5% superiores, ou 5 -10% superiores ou 5 6% superiores da intensidade de fluorescência da população de amostra podem ser coletadas. Um método alternativo para a seleção de células é a ligação imunológica, por exemplo, a glóbulos magnéticos revestidos com Proteína A ou imunoglobulinas específicas. O painel de células selecionado pode ser tomado como a população básica para uma etapa de seleção adicional, por exemplo, por semeadura de uma única célula, cultivo e análise por ELISA (Ensaio Imunossorvente Ligado a Enzima), ou por clonagem de diluição limitada, ou por expansão por cultivo sob condições seletivas de cultura em um meio de seleção durante vários dias e uma seleção FACS adicional, ou por uma seleção FACS adicional com um nível de limiar mais alto, que pode se basear, por exemplo, nas intensidades de fluorescência detectadas em uma seleção FACS precedente, ou por um método de imunoprecipitação (veja, por exemplo, também o WO 2005/020924). A seleção de uma célula de acordo com a invenção pode ser efetuada por um método selecionado no grupo da citometria de fluxo, ELISA, imunoprecipitação, cromatografia de coluna de imunoafinidade, classificação por imunoafinidade com glóbulos magnéticos, métodos de isolamento à base de microscopia ou ligação imunológica. Em uma modalidade, a seleção de uma célula de acordo com a invenção pode ser efetuada por um método selecionado do grupo da citometria de fluxo, ELISA, imunoprecipitação, cromatografia em coluna de imunoafinidade, classificação por imunoafinidade com glóbulos magnéticos, métodos de isolamento à base de microscopia ou ligação imunológica, seguido por um método selecionado do grupo de semeadura e cultivo de célula única, diluição limitada ou expansão por cultivo, seguido por um método selecionado do grupo de FACS, imunoprecipitação, cromatografia em coluna de imunoafinidade, classificação por imunoafinidade com glóbulos magnéticos, métodos de isolamento à base de microscopia, ou ELISA.
Como a eficácia dos métodos de transfecção e vetores conhecidos na técnica é muito alta e, portanto, obtém-se uma pluralidade de células transfectadas, são preferidos marcadores que também permitam a corrleção do rendimento de expressão de uma célula transfectada com a intensidade detectada do marcador. Conseqüentemente, é funcional ligar a expressão do polipeptídio heterólogo de interesse à expressão do marcador
A presente invenção usa metodologia de splicing, isto é, splicing alternativo, para expressar um polipeptídio heterólogo e um marcador pelo mesmo ácido nucléico, isto é, pelo mesmo cassete de expressão, em que, por exemplo, não se emprega IRES. O marcador na presente invenção é uma forma ligada a membrana plasmática do polipeptídio heterólogo expressado. Na presente invenção, o marcador selecionável compreende como parte N terminal o polipeptídio heterólogo e como parte C terminal pelo menos um fragmento de um domínio transmembrana ou uma âncora GPI. Assim, o polipeptídio heterólogo produzido e a parte extracelular do marcador selecionável, isto é, a parte do marcador selecionável que é detectada, são idênticos.
A presente invenção compreende um método para a seleção de uma célula eucariótica que expresse um polipeptídio heterólogo, em que o método compreende:
a) a transfecção de uma célula eucariótica com um ácido nucléico compreendendo, na direção 5' a 3':
i) um primeiro ácido nucléico que codifica um polipeptídio heterólogo sem um códon de parada de tradução em fase de leitura, ii) um segundo ácido nucléico começando com um sítio doador de splice e terminado por um sítio receptor de splice compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilação, iii) um terceiro ácido nucléico que codifica:
iiia) pelo menos um fragmento de um domínio transmembrana, ou iiib) um peptídio de sinal para uma âncora GPI,
b) o cultivo da dita célula transfectada sob condições adequadas para a produção de pré-mRNA a partir do dito ácido nucléico, o processamento do dito pré-mRNA, e a tradução do dito mRNA processado em um polipeptídio heterólogo, em que a dita célula transfectada produz polipeptídio heterólogo solúvel e polipeptídio heterólogo ligado a membrana plasmática por splicing alternativo do dito pré-mRNA, e
c) a seleção de uma célula com polipeptídio heterólogo ligado a membrana plasmática para ser a dita célula que expressa um polipeptídio heterólogo.
Durante a transcrição do DNA, obtém-se uma cópia do DNA, o chamado RNA pré-mensageiro (pré-mRNA). Esse pré-mRNA tem a mesma organização do DNA de molde, isto é, tem uma organização de íntron-éxon genômico. Apenas os éxons contêm a informação da seqüência de aminoácidos do polipeptídio codificado.
Assim, os introns têm de ser removidos do pré-mRNA antes da tradução. Esse processo é chamado de splicing de RNA.
Um ácido nucléico de splicing se caracteriza por pelo menos um sítio doador de splice 5', um sítio receptor de splice 3' e um chamado sítio de ramificação, que normalmente se localiza 20 - 50 bases a montante do sítio receptor. Essa arquitetura efetua o reconhecimento e a excisão do ácido nucléico do sítio doador de splice 5' para o sítio receptor de splice 3' do pré-mRNA durante o splicing de RNA. Durante a etapa de splicing, gerase o mRNA maduro do qual um polipeptídio ou proteína é traduzida. Em uma modalidade da presente invenção, pelo menos um ácido nucléico, de preferência o segundo ácido nucléico, é um ácido nucléico de splicing, contendo elementos reguladores adicionais, como um códon de parada em fase de leitura e um sinal de poliadenilação.
Porém, o processo de splicing não é exclusivo. É possível, por exemplo, que um íntron não seja removido durante o processamento do prémRNA a partir do pré-mRNA e esteja, portanto, pelo menos parcialmente incrustado no mRNA maduro. Se um códon de parada em fase de leitura estiver presente nesse íntron opcionalmente incluído, a tradução pára nesse códon de parada, e se produz uma vriante do polipeptídio codificado.
O reconhecimento e a excisão de um íntron freqüentemente é regulada por elementos de ação cis adicionais no pré-mRNA. Devido a sua função e posição, esses elementos são chamados de intensificador de splice exônico (ESE), silenciador de splice exônico (ESS), intensificador de splice intrônico (ISE) ou silenciador de splice intrônico (ISS), respectivamente (Black, D. L, Annu Rev Biochem 72 (2003) 291-336).
O DNA genômico da maioria dos genes eucarióticos tem uma organização íntron-éxon. Por exemplo, dentro do éxon que codifica o domínio C terminal da forma secretada de uma cadeia pesada de imunoglobulina (isto é Ch3 ou Ch4, respectivamente) é um sítio doador de splice 5'.
Se esse sítio doador de splice não for eficaz no processamento do pré-mRNA de cadeia pesada, o íntron que segue esse éxon, que contém um códon de parada e um sinal de poliadenilação, é pelo menos parcialmente retido no mRNA maduro. O mRNA é, então, traduzido em uma cadeia pesada de imunoglobulina que termina com um domínio Ch3 ou Ch4 e representa uma imunoglobulina solúvel. Essa é a principal via de processamento de genes de cadeias pesadas de imunoglobulinas em células secretoras de imunoglobulinas.
Se esse sítio doador de splice for eficaz no processamento do pré-mRNA de cadeia pesada de imunoglobulina, o íntron consecutivo e, portanto, o códon de parada são removidos. Portanto, a tradução não pára depois do domínio C terminal de uma cadeia pesada de imunoglobulina. Além disso, a tradução continua com o sucessivo splicing a éxons que codificam um domínio transmembrana. Essa via de processamento menor para genes de cadeias pesadas de imunoglobulinas resulta em uma forma de imunoglobulina ligada a membrana plasmática apresentada na superfície cleular de uma célula produtora de imunoglobulinas.
Esse processo é chamado de splicing alternativo, e o ácido nucléico (isto é, o íntron) opcionalmente removido nesse processo é chamado de ácido nucléico de splicing alternativo.
Se um ácido nucléico que codifica um polipeptídio heterólogo ou uma proteína estiver ligado a um ácido nucléico que codifica pelo menos um fragmento de um domínio transmembrana ou a um ácido nucléico que codifica um peptídio de sinal para uma âncora GPI por um ácido nucléico de splicing alternativo, isto é, um ácido nucléico de splicing alternativo está locali zado entre esses dois ácidos nucléicos, e, dessa forma, esses três ácidos nucléicos estão operacionalmente ligados, duas variantes do polipeptídio ou proteína heteróloga são expressadas: uma variante solúvel, isto é, uma variante compreendendo apenas o polipeptídio ou proteína, e uma variante ligada a membrana plasmática, isto é, uma variante compreendendo tanto o polipeptídio ou proteína, quanto o domínio transmembrana ou a âncora GPI.
Em uma modalidade, ácido nucléico transfectado está compreendido em um cassete de expressão. Em uma modalidade, o primeiro ácido nucléico está sem um códon de parada de tradução em fase de leitura em sua terminação 3'. Em outra modalidade, os primeiro, segundo e terceiro ácidos nucléicos estão operacionalmente ligados. Em uma modalidade, o terceiro ácido nucléico codifica pelo menos um fragmento de um domínio transmembrana. Em outra modalidade, o fragmento de um domínio transmembrana é uma região transmembrana. Em uma modalidade, o terceiro ácido nucléico codifica um peptídio de sinal para uma âncora GPI. Em uma modalidade da invenção, o polipeptídio codificado pelo primeiro ácido nucléico é selecionado do grupo que compreende cadeias pesadas de imunoglobulinas, cadeias leves de imunoglobulinas, polipeptídios biologicamente ativos, seus fragmentos e seus polipeptídios de fusão. Em uma modalidade da invenção, o polipeptídio codificado pelo primeiro ácido nucléico é selecionado do grupo que compreende cadeias pesadas de imunoglobulinas, cadeias leves de imunoglobulinas, seus fragmentos, e suas fusões. Em uma modalidade, o terceiro ácido nucléico codifica pelo menos um fragmento de um domínio transmembrana de imunoglobulina.
Em maiores detalhes, a presente invenção compreende um método para a seleção de uma célula eucariótica que expresse uma cadeia pesada de imunoglobulina, em que o método compreende:
a) a transfecção de uma célula eucariótica com um ácido nucléico compreendendo, na direção 5' a 3':
i) um primeiro ácido nucléico que codifica uma cadeia pesada de imunoglobulina sem um códon de parada de tradução em fase de leitura, ii) um segundo ácido nucléico começando com um sítio doador de splice e terminado por um sítio receptor de splice compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilação, iii) um terceiro ácido nucléico que codifica:
iiia) pelo menos um fragmento de um domínio transmembrana, ou iiib) um peptídio de sinal para uma âncora GPI,
b) o cultivo da dita célula transfectada sob condições adequadas para a produção de pré-mRNA a partir do dito ácido nucléico, o processamento do dito pré-mRNA, e a tradução do dito mRNA processado em uma cadeia pesada de imunoglobulina, em que a dita célula transfectada produz cadeia pesada de imunoglobulina solúvel e cadeia pesada de imunoglobulina ligada a membrana plasmática por splicing alternativo do dito pré-mRNA, e
c) a seleção de uma célula com cadeia pesada de imunoglobulina ligada a membrana plasmática para ser a dita célula que expressa uma cadeia pesada de imunoglobulina.
Em uma modalidade, a presente invenção compreende um método para a seleção de uma célula eucariótica que expresse uma imunoglobulina, em que o método compreende:
a) a transfecção de uma célula eucariótica com um ácido nucléico compreendendo um primeiro cassete de expressão para uma cadeia leve de imunoglobulina e um segundo cassete de expressão compreendendo, na direção 5' a 3':
i) um primeiro ácido nucléico que codifica uma cadeia pesada de imunoglobulina sem um códon de parada de tradução em fase de leitura, ii) um segundo ácido nucléico começando com um sítio doador de splice e terminado por um sítio receptor de splice compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilaÇão, iii) um terceiro ácido nucléico que codifica:
iiia) pelo menos um fragmento de um domínio transmembrana, ou iiib) um peptídio de sinal para uma âncora GPI,
b) o cultivo da dita célula transfectada sob condições adequadas para a produção de pré-mRNA a partir do dito ácido nucléico, o processamento do dito pré-mRNA, e a tradução do dito mRNA processado em uma cadeia pesada de imunoglobulina, em que a dita célula transfectada produz imunoglobulina solúvel e imunoglobulina ligada a membrana por splicing alternativo do dito pré-mRNA, e
c) a seleção de uma célula com imunoglobulina ligada a membrana para ser a dita célula que expressa uma imunoglobulina.
Em uma modalidade, a presente invenção compreende um método para a seleção de uma célula eucariótica que expresse uma imunoglobulina, em que o método compreende:
a) a transfecção de uma célula eucariótica com dois ácidos nucléicos simultânea ou seqüencialmente, em que um ácido nucléico compreende um cassete de expressão para uma cadeia leve de imunoglobulina e o outro ácido nucléico compreende um cassete de expressão compreendendo, na direção 5' a 3':
i) um primeiro ácido nucléico que codifica uma cadeia pesada de imunoglobulina sem um códon de parada de tradução em fase de leitura, ii) um segundo ácido nucléico começando com um sítio doador de splice e terminado por um sítio receptor de splice compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilação, iii) um terceiro ácido nucléico que codifica:
iiia) pelo menos um fragmento de um domínio transmembrana, ou iiib) um peptídio de sinal para uma âncora GPI,
b) o cultivo da dita célula transfectada sob condições adequadas para a produção de pré-mRNA a partir do dito ácido nucléico, o processamento do dito pré-mRNA, e a tradução do dito mRNA processado em uma cadeia pesada de imunoglobulina, em que a dita célula transfectada produz imunoglobulina solúvel e imunoglobulina ligada a membrana por splicing alternativo do dito pré-mRNA, e
c) a seleção de uma célula com imunoglobulina ligada a membrana para ser a dita célula que expressa uma imunoglobulina.
Em uma modalidade, o domínio transmembrana codificado pelo terceiro ácido nucléico é um domínio transmembrana de imunoglobulina. Em uma modalidade da invenção, o segundo ácido nucléico compreende apenas um sítio doador de splice 5' e apenas um sítio receptor de splice 3'. Em outra modalidade da presente invenção, o segundo ácido nucléico é um intron de cadeia pesada de imunoglobulina de ocorrência natural, que segue o éxon que codifica um domínio de cadeia pesada de imunoglobulina Ch3 ou Ch4, em que no dito íntron pelo menos 50 nucleotídeos consecutivos estão deletados.
Por exemplo, para a expressão recombinante de cadeias pesadas de imunoglobulinas em células eucarióticas, emprega-se um ácido nucléico com organização genômica íntron-éxon ou contendo apenas as regiões codificadoras, isto é cDNA. Em ambos os casos, o ácido nucléico termina com o códon de parada após o éxon que codifica o domínio C terminal da cadeia pesada de imunoglobulina. Depois disso, na organização genômica, os sucessivos introns e éxons, compreendendo um ácido nucléico de splicing alternativo e um domínio transmembrana, são omitidos. Conseqüentemente, com esse ácido nucléico apenas a cadeia pesada de imunoglobulina solúvel é obtida.
Se para a expressão recombinante de imunoglobulinas ou seus fragmentos a organização genômica do gene de cadeia pesada de imunoglobulina for retida pelo menos parcialmente, isto é, se o íntron depois do éxon que codifica o domínio C terminal (isto é, o ácido nucléico de splicing alternativo) e o(s) sucessivo(s) éxon(s) que codifica(m) um domínio transmembrana forem retidos, é possível o splicing alternativo. No evento de splicing alternativo, os códons terminais 3' e o códon de parada do éxon que codifica o domínio CH3 ou CH4, respectivamente, são removidos como/com a seqüência intrônica, e se gera, ao invés, um mRNA maduro diferente, em que a região codificadora, isto é, a fase de leitura, é alongada em sua extremidade 3' pelo(s) éxon(s) adicionalmente mantido(s). Esse mRNA é traduzido em uma cadeia pesada de imunoglobulina estendida na terminação C, que contém um domínio transmembrana adicional ou seu fragmento, codificado pelo(s) éxon(s) 3' adicional(ais). Essa cadeia pesada de imunoglobulina alongada é incorporada durante a montagem de imunoglobulinas, resultando em imunoglobulinas ligadas à membrana plasmática. Descobriu-se agora, surpreendentemente, que, com esse ácido nucléico de acordo com a invenção, células transfectadas produtoras de um polipeptídio heterólogo podem ser selecionadas. Essa metodologia é genericamente aplicável e não se restringe a imunoglobulinas. Para praticar essa metodologia, o ácido nucléico para expressão recombinante de um polipeptídio heterólogo sem um códon de parada em fase de leitura tem de estar operacionalmente ligado a e em fase de leitura com o ácido nucléico de splicing alternativo derivado de uma imunoglobulina compreendendo um códon de parada de tradução em fase de leitura e um sítio de poliadenilação. O sucessivo terceiro ácido nucléico também e variável e pode ser selecionado de qualquer ácido nucléico que codifique um domínio transmembrana ou seu fragmento, assim como de qualquer ácido nucléico que codifique um peptídio de sinal para uma âncora GPI. Esses elementos, isto é, o ácido nucléico que codifica o polipeptídio, o ácido nucléico de splicing alternativo e o ácido nucléico que codifica o domínio transmembrana ou o peptídio de sinal para uma âncora GPI, podem ser selecionados e combinados de diferentes genes, assim como de diferentes organismos. O único pré-requisito é que os três ácidos nucléicos sejam combinados de modo que o códon de parada de tradução no ácido nucléico de splicing alternativo esteja em fase de leitura com a fase de leitura do ácido nucléico que codifica o polipeptídio, isto é, possa ser reconhecido pelo ribossomo e a tradução seja terminada.
Genericamente, com o splicing alternativo, opcionalmente uma fração da terminação C da forma solúvel do polipeptídio heterólogo é/pode ser removida do pré-mRNA como parte de um íntron. Essa fração engloba opcionalmente os códons terminais 3', a região não traduzida 3', o códon de parada e o sinal de poliadenilação da forma secretada. Conseqüentemente, o ácido nucléico começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3' que é removido opcionalmente se superpõe/pode se superpor à terminação C da variante não processada alternativamente.
Portanto, com o uso de um ácido nucléico de acordo com a invenção com uma organização genômica pelo menos parcialmente retida de um gene de cadeia pesada de imunoglobulina, duas variantes de um polipeptídio heterólogo podem ser obtidas, uma variante solúvel curta e uma variante ligada a membrana plasmática longa.
Em uma modalidade em que o primeiro ácido nucléico codifica uma cadeia pesada de imunoglobulina, o primeiro ácido nucléico compreende todos os éxons e todos, exceto um, introns do gene de cadeia pesada de imunoglobulina genomicamente organizado. Em uma modalidade, o terceiro ácido nucléico codifica um fragmento de um domínio transmembrana ou um peptídio de sinal para uma âncora GPI, em que o fragmento do domínio transmembrana é codificado por um único éxon. Em outra modalidade, o domínio transmembrana é um domínio transmembrana de imunoglobulina codificado por uma fusão MI-M2-éxon, isto é, por um único éxon sem o intron genomicamente interveniente. Em uma modalidade, o domínio transmembrana da imunoglobulina é codificado por um cDNA.
Com a introdução de um ácido nucléico com uma organização genômica global pelo menos parcialmente retida de um gene de cadeia pesada de imunoglobulina gene em uma célula hospedeira, obtém-se uma célula que expressa, por um lado, polipeptídio heterólogo solúvel e, por outro lado, polipeptídio heterólogo ligado a membrana plasmática. Por exemplo, para se obterem as duas variantes de imunoglobulina, isto é, para permitir splicing alternativo, não é necessário manter a organização genômica inteira do gene de cadeia pesada de imunoglobulina, isto é, todos os introns e éxons. É necessário apenas manter o sítio de splice alternativo em uma forma funcional. Um sítio de splice funcional é uma seqüência de ácido nucléico compreendendo um sítio doador de splice 5' e um sítio receptor de splice 3', permitindo, dessa forma, a excisão da seqüência de ácido nucléico interveniente do pré-mRNA. O reconhecimento e a excisão de um íntron freqüentemente são regulados por elementos de ação cis adicionais no pré-mRNA. Devido a sua função e posição, esses elementos são chamados de intensificador de splice exônico (ESE), silenciador de splice exônico (ESS), intensificador de splice intrônico (ISE) ou silenciador de splice intrônico (ISS), respectivamente (Black, D. L, Annu Rev Biochem 72 (2003) 291-336, que é aqui incorporado por referência).
Para a seleção de células transfectadas que expressem um polipeptídio heterólogo, podem-se usar diferentes métodos, como, sem limitação, métodos espectroscópicos, por exemplo, fluorescência, ELISA e suas variantes, por ensaio da atividade biológica ou por emprego d eensaios que sejam independentes dessa atividade, como Western blotting, eletroforese em SDS gel de poliacrilamida, ou radioimunoensaio, usando-se anticorpos que reconheçam e se liguem ao polipeptídio heterólogo. Como o polipeptídio heterólogo ligado a membrana plasmática tem a mesma seqüência de aminoácidos e estrutura secundária que o polipeptídio heterólogo solúvel, exceto por sua terminação C, pode ser determinado, por exemplo, com os mesmos anticorpos para a variante solúvel.
A variante ligada a membrana plasmática de um polipeptídio está firmemente conectada à célula que a expressa. Conseqüentemente, a variante ligada a membrana plasmática pode ser usada como um marcador par aisolar células que tenham sido transfectadas com sucesso com um ácido nucléico para a expressão de um polipeptídio ou proteína heteróloga, por exemplo, uma imunoglobulina. Em uma modalidade, o polipeptídio é uma imunoglobulina. Em uma modalidade, a imunoglobulina é selecionada do grupo de IgG, IgE, e IgA.
A razão molecular da variante solúvel do polipeptídio heterólogo para a variante ligada a membrana plasmática do polipeptídio heterólogo é de mais de 50:50 a menos de 100:0, de preferência de mais de 75:25 a menos de 100:0. Por exemplo, se uma célula eucariótica for transfectada com um ácido nucléico de acordo com a invenção que codifique uma imunoglobu lina, células transfectadas com sucesso podem ser selecionadas pelo aparecimento de imunoglobulina ligada a membrana.
Um ácido nucléico de acordo com a invenção é um ácido nucléico contendo, na direção 5' a 3', uma região codificadora para um polipeptídio heterólogo, um ácido nucléico de splicing alternativo e uma região codificadora para um domínio transmembrana ou seu fragmento ou uma região codificadora para um peptídio de sinal para uma âncora GPI. Em maiores detalhes, a presente invenção compreende um ácido nucléico, compreendendo:
a) um primeiro ácido nucléico que codifica um polipeptídio heterólogo sem um códon de parada de tradução em fase de leitura,
b) um segundo ácido nucléico começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3' compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilação, e
c) um terceiro ácido nucléico que codifica:
i) pelo menos um fragmento de um domínio transmembrana, ou . ii) um peptídio de sinal para uma âncora GPI.
Em outras modalidades, i) o sítio de splice 5' do intron de splice alternativo está localizado em 5' com relação ao códon de parada normal do ácido nucléico que codifica the polipeptídio heterólogo, ii) o segundo ácido nucléico é um ácido nucléico de splicing alternativo, e iii) o sítio de splice 5' é usado apenas às vezes e não constitutivamente, resultando em uma razão molecular de polipeptídio heterólogo normalmente processado, isto é, polipeptídio solúvel, para polipeptídio heterólogo alternativamente processado, isto é polipeptídio ligado a membrana plasmática, de mais de 50:50 a menos de 100:0. Em uma modalidade, o primeiro ácido nucléico e o segundo ácido nucléico estão operacionalmente ligados, isto é, o códon de parada de tradução do segundo ácido nucléico está em fase de leitura com a fase de leitura do primeiro ácido nucléico que codifica um polipeptídio ou seu fragmento.
O ácido nucléico que pode ser removido por splicing alternativo segue o ácido nucléico que codifica pelo menos um fragmento de um polipeptídio e precede o ácido nucléico que codifica pelo menos um fragmento de um domínio transmembrana ou que codifica um peptídio de sinal para uma âncora GPI. Em uma modalidade, o polipeptídio heterólogo é um polipeptídio de fusão compreendendo N terminalmente um polipeptídio de interesse e C terminalmente pelo menos um fragmento de um domínio de cadeia pesada de imunoglobulina Ch3 ou Ch4 ou sua variante. Em uma modalidade, o ácido nucléico compreende um quarto ácido nucléico entre o primeiro ácido nucléico e o segundo ácido nucléico e/ou o segundo ácido nucléico e o terceiro ácido nucléico. Isto é, o quarto ácido nucléico está localizado, por exemplo, depois do segundo ácido nucléico (isto é, depois do sítio receptor de splice 3') e antes da extremidade 5' do terceiro ácido nucléico.
Com um ácido nucléico de splicing alternativo localizado entre o ácido nucléico que codifica um polipeptídio heterólogo e o ácido nucléico que codifica um domínio transmembrana ou que codifica um peptídio de sinal para uma âncora GPI, duas variantes do polipeptídio heterólogo podem ser expressadas: um polipeptídio heterólogo sem domínio transmembrana ou âncora GPI e um polipeptídio heterólogo com domínio transmembrana ou âncora GPI. O polipeptídio heterólogo pode ser selecionado de, sem limitação, por exemplo, hormônios; citocinas; fatores de crescimento; ligantes, agonistas ou antagonistas de receptores; agentes citotóxicos; agentes antivirals; agentes de formação de imagem; inibidores de enzimas; ativadores de enzimas ou moduladores da atividade de enzimas, como substâncias alostéricas; imunoglobulinas; ou fusões ou seus fragmentos. Em uma modalidade, o polipeptídio é uma imunoglobulina, um polipeptídio de cadeia pesada de imunoglobulina ou uma fusão de imunoglobulina.
A invenção pode ser praticada com qualquer polipeptídio, qualquer domínio transmembrana e qualquer peptídio de sinal para uma âncora GPI, contanto que um ácido nucléico de splicing alternativo esteja incrustado. Em maiores detalhes, o fragmento de ácido nucléico começando com o sítio doador de splice 5' e terminado pelo sítio receptor de splice 3' tem de ser apropriadamente escolhido. O polipeptídio precedente e o domínio transmembrana ou âncora GPI sucessivo podem ser escolhidos livremente.
A presente invenção também compreende um ácido nucléico compreendendo:
a) um primeiro sítio de clonagem múltipla,
b) um ácido nucléico de splicing começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3', em que:
i) o ácido nucléico de splicing compreende um códon de parada e um sinal de poliadenilação, e ii) o ácido nucléico de splicing não é constitutivamente removido durante o processamento de pré-mRNA,
c) um segundo sítio de clonagem múltipla.
A presente invenção pode ser praticada, por exemplo, sem limitação, com o segundo ácido nucléico, isto é, o ácido nucléico de splicing alternativo, derivado do grupo de ácidos nucléicos que codificam o receptor C3b/C4b (receptor de complemento do tipo 1) (Hourcade, D., et al, J. Exp. Med. 168 (1988) 1255-1270), EGFR humano, de galinha e e rato (Callaghan, T., et al., Oncogene 8 (1993) 2939-2948; Reiter, J.L., e Maihle, N.J., Nuc. Acids Res. 24 (1996) 4050-4056; Petch, L, et al., Mol. Cell Biol. 10 (1990) 2973-2982), cadeia pesada α, ε, γ e μ de imunoglobulina (lg) (Zhang, K., et al., J. Exp. Med. 176 (1992) 233-243; Rogers, J.E., et al., Cell 20 (1980) 303312; Milcarek, C, e Hall, B„ Mol. Cell Biol. 5 (1985) 2514-2520; Kobrin, B.J., et al., Mol. Cell Biol. 6 (1986) 1687-1697; Cushley, W., et al., Nature 298 (1982) 77; Alt, F.W., et al., Cell 20 (1980) 293-301; Peterson, MX., Gene Exp. 2 (1992) 319-327), receptor PLA2 humano (Ancian, P., et al., J. Biol. Chem. 270 (1995) 8963-8970), Cek5 de galinha (Connor, RJ., e Pasquale, E.B., Oncogene 11 (1995) 2429-2438), FGFR humano (Johnson, D.E., et al, Mol. Cell Biol. 11 (1991) 4627-4634.
Em uma modalidade, o segundo ácido nucléico é um íntron de uma imunoglobulina localizado entre o éxon que codifica o domínio Ch3/Ch4 e o éxon que codifica pelo menos um fragmento do domínio transmembrana. Em uma modalidade, o segundo ácido nucléico é derivado do grupo de ácidos nucléicos que codificam cadeia pesada α (alfa) de imunoglobulina (lg) humana (hu), cadeia pesada δ (delta) de lg hu, cadeia pesada ε (epsilon) de lg hu, cadeia pesada yl, γ2, γ3 e γ4 (gama) de lg hu, cadeia pesada μ (mu) de lg hu, cadeia pesada de Ig murídea de tipo α (alfa), cadeia pesada de Ig muridea do tipo δ (delta), cadeia pesada de Ig murídea do tipo ε (epsilon), cadeia pesada de Ig murídea do tipo γΙ (gama 1), cadeia pesada de lg murídea do tipo γ2Α (gama 2A), cadeia pesada de lg murídea do tipo γ2Β (gama 2B), cadeia pesada de lg murídea do tipo γ3 (gama 3) e cadeia pesada de lg murídea do tipo μ (mu).
Em uma modalidade, o segundo ácido nucléico é selecionado do grupo de ácidos nucléicos que codificam cadeia pesada γΙ de imunoglobulina humana, cadeia pesada γ2 de imunoglobulina humana, cadeia pesada γ3 de imunoglobulina humana, cadeia pesada γ4 de imunoglobulina humana, cadeia pesada ε de imunoglobulina humana (1) e cadeia pesada ε de imunoglobulina humana (2). Em uma modalidade, o segundo ácido nucléico é derivado/selecionado do grupo de ácidos nucléicos que codificam cadeia δ pesada de imunoglobulina humana, cadeia pesada γΙ de imunoglobulina humana, cadeia pesada γ2 de imunoglobulina humana, cadeia pesada μ de imunoglobulina humana, cadeia pesada murídea do tipo a, cadeia pesada murídea do tipo γΙ, cadeia pesada murídea do tipo γ2Β, cadeia pesada murídea do tipo γ3, e cadeia pesada murídea do tipo μ.
A presente invenção pode ser praticada, por exemplo, sem limitação, com o terceiro ácido nucléico, no caso do ácido nucléico que codifica pelo menos um fragmento de um domínio transmembrana, selecionado do grupo de ácidos nucléicos que codificam receptor C3b/C4b (receptor de complemento tipo 1) (Hourcade, D., et al., J. Exp. Med. 168 (1988) 12551270), EGFR humano, de galinha e de rato (Callaghan, T., et al., Oncogene 8 (1993) 2939-2948; Reiter, J.L., e Maihle, N.J., Nuc. Acids Res. 24 (1996) 4050-4056; Petch, L, et al., Mol. Cell Biol. 10 (1990) 2973-2982), lg α, ε, γ, μ heavy chain (Zhang, Κ., et al., J. Exp. Med. 176 (1992) 233-243; Rogers,J.E., et al., Cell 20 (1980) 303-312; Milcarek, C, e Hall, B., Mol. Cell Biol. 5 (1985) 2514-2520; Kobrin, BJ., et al., Mol. Cell Biol. 6 (1986) 1687-1697; Cushley, W., et al., Nature 298 (1982) 77; Alt, F.W., et al., Cell 20 (1980) 293301; Peterson, M.L., Gene Exp. 2 (1992) 319-327), receptor PLA2 humano (Ancian, P., et al., J. Biol. Chem. 270 (1995) 8963-8970), Cek5 de galinha (Connor, R. J., e Pasquale, E.B., Oncogene 11 (1995) 2429-2438), FGFR humano (Johnson, D.E., et al., Mol. Cell Biol. 11 (1991) 4627-4634. Em uma modalidade, o terceiro ácido nucléico é selecionado do grupo de ácidos nucléicos que codificam cadeia pesada α (alfa) de imunoglobulina (Ig) humana (hu), cadeia pesada δ (delta) de Ig hu, cadeia pesada ε (epsilon)de Ig hu, cadeia pesada γΙ, γ2, γ3 e γ4 (gama)de Ig hu, cadeia pesada μ (mu) de Ig hu, cadeia pesada de Ig murídea do tipo α (alfa), cadeia pesada de Ig murídea do tipo δ (delta), cadeia pesada de Ig murídea do tipo ε (epsilon), cadeia pesada de Ig murídea do tipo γΙ (gama I), cadeia pesada de Ig murídea do tipo γ2Α (gama 2A), cadeia pesada de Ig murídea do tipo γ2Β (gama 2B), cadeia pesada de Ig murídea do tipo γ3 (gama 3) e cadeia pesada de Ig murídea do tipo μ (mu). Em uma modalidade, o terceiro ácido nucléico é selecionado do grupo de ácidos nucléicos que codificam cadeia pesada γΙ de imunoglobulina humana, cadeia pesada γ2 de imunoglobulina humana, cadeia pesada γ3 de imunoglobulina humana, cadeia pesada γ4 de imunoglobulina humana, cadeia pesada ε de imunoglobulina humana (1) e cadeia pesada ε de imunoglobulina humana (2). Em uma modalidade, o terceiro ácido nucléico é selecionado do grupo de ácidos nucléicos que codificam cadeia pesada δ de imunoglobulina humana, cadeia pesada γΙ de imunoglobulina humana, cadeia pesada γ2 de imunoglobulina humana, cadeia pesada μ de imunoglobulina humana, cadeia pesada murídea do tipo a, cadeia pesada murídea do tipo γΙ, cadeia pesada murídea do tipo γ2Β, cadeia pesada murídea do tipo γ3 e cadeia pesada murídea do tipo μ.
Além do grupo de ácidos nucléicos que codificam pelo menos um fragmento de um domínio transmembrana, o terceiro ácido nucléico pode ser selecionado do grupo de ácidos nucléicos que codificam um peptídio de sinal para uma âncora GPI. O grupo de ácidos nucléicos que codificam um peptídio de sinal para uma âncora GPI compreende o grupo de ácidos nucléicos que codificam um peptídio de sinal para uma âncora GPI derivado de diesterase alcalina humana, acetilcolina esterase, fosfatase alcalina (intestinal, de fígado e placenta), antígeno CAMPATH-1, antígeno carcinoembrionário, CD55, CD59, CD90, contactina-1, antígeno E48, receptor de folato A e
B, proteína p137 ancorada em GPI, antígeno 3 associado a função de linfócito, proteína de interação com mDIA, 5'-nucleotidase, fator ativador de uroquinase plasminogênio; de antígeno LY-6C murídeo, antígeno LY-6, 51nucleotidase, antígeno 0X45, antígeno 2 de célula tronco, molécula 1 de adesão de células vasculares, antígeno 2 de linfócito Qa (Qa2); de trealase de coelho; de proteína brevicano de rato, CD90, proteína glipicano, proteoglicano de sulfato de heparina, antígeno MRC OX-45, 5'-nucleotidase, glicoproteína maior de grânulo secretor pancreático, proteína RT6.2 de superfície de células T; de proteína de reparo de DNA de levedura PHRI, proteína 1 de superfície ancorada a glicofosfolipídio; de proteína precursora de amilóide suíno, dipeptidase; de proteínas de superfície de variantes diversas de Trypanosoma brucei, proteína repetitiva ácida policíclico; de proteína YN em 1.1 de superfície da variante Trypanosoma congolense; de melanotransferrina de galinha, molécula de adesão celular neutra; de acetilcolina esterase de Torpedo marmorata; de proteína de prion de hamster; de 5'-nucleotidase bovina; de proteína de membrana Gp64 de bolor, antígeno específico préesporo; e de Sgpl, Sgp2 de lula.
Na Tabela 1, são dados exemplos de seqüências de ácidos nucléicos do segundo ácido nucléico, de acordo com a invenção. Na Tabela 2, são dados exemplos de seqüências de ácidos nucléicos do terceiro ácido nucléico de acordo com a invenção e de seqüências de aminoácidos correspondentes às seqüências do terceiro ácido nucléico de acordo com a invenção. Na Tabela 3, são dados exemplos de seqüências de ácidos nucléicos do quarto ácido nucléico opcional e de seqüências de aminoácidos correspondentes aos quartos ácidos nucléicos opcionais de acordo com a invenção.
A Tabela 1 relaciona o sítio doador de splice 5', o segundo ácido nucléico (de splicing alternativo) e o sítio receptor de splice 3‘. Como a seqüência do segundo ácido nucléico em geral excede 1 kb, as seqüências relacionadas na Tabela 1 estão encurtadas e mostram aproximadamente o primeiro e os últimos 100 nucleotídeos do segundo ácido nucléico, separados por um número que se refere ao tamanho total do segundo ácido nucléi co completo. A seqüência completa do segundo ácido nucléico está contida na SEQ ID NO dada da listagem de seqüência. O códon de parada está sublinhado.
O sítio doador de splice é dado em um formato compreendendo a seqüência de consenso precedente do sítio doador de splice e os primeiros seis nucleotídeos do segundo ácido nucléico separados por uma linha vertical (veja também, por exemplo, Zhang, M.Q., Human Mol. Gen. 7 (1998) 919-932). Da mesma forma, o sítio receptor de splice é dado pela listagem dos últimos 6 nucleotídeos do segundo ácido nucléico e a seqüência de consenso do sítio receptor de splice sucessivo, que estão separadas por uma linha vertical. Os nucleotídeos diretamente depois (sítio doador de splice 5') e diretamente antes (sítio receptor de splice 31) da linha vertical são os primeiros e últimos nucleotídeos do segundo ácido nucléico (de splicing). O códon de parada no segundo ácido nucléico está sublinhado na Tabela 1.
O segundo ácido nucléico pode estar diretamente ligado ao ácido nucléico que codifica o polipeptídio heterólogo, isto é, o primeiro ácido nucléico, ou com uma pequena (9 a 21 bases) seqüência de ácido nucléico interveniente. Em uma modalidade, o ácido nucléico interveniente opcional (quinto) é derivado do ácido nucléico que precede o segundo ácido nucléico no genoma do qual o dito segundo ácido nucléico é obtido.
Na Tabela 2, relacionam-se exemplos de seqüências do terceiro ácido nucléico que codifica fragmentos dos domínios transmembrana e seqüências de aminoácidos de peptídios de sinal para âncoras GPI. Essa seqüência pode seguir diretamente ou com uma seqüência interveniente opcional, isto é, um quarto ácido nucléico, o sítio receptor de splice 3'. Na Tabela 3, relacionam-se exemplos de quartas seqüências de ácidos nucléicos e de seqüências de aminoácidos correspondentes aos quartos ácidos nucléicos.
Em uma modalidade, o ácido nucléico de acordo com a invenção compreende um quarto ácido nucléico entre o dito segundo ácido nucléico e o dito terceiro ácido nucléico. Em uma modalidade, o ácido nucléico de acordo com a invenção compreende um quinto ácido nucléico entre o dito primeiro ácido nucléico e o dito segundo ácido nucléico. Uma modalidade da presente invenção é que o dito terceiro ácido nucléico é obtido de i) o mesmo, ou ii) um gene ou organismo diferente do dito segundo ácido nucléico, isto é, o dito terceiro ácido nucléico não está necessariamente organizado 5 com o dito segundo ácido nucléico em um genoma.
As seqüências são derivadas de genomas ou bases de dados publicamente disponíveis (por exemplo, projeto do genoma humano, http://www.gdb.org/; base de dados do genoma de camundongo, http://www.informatics.jax.org/; SwissProt (http://www.expasy.org/sprot/).
Quando nenhuma anotação era acessível, as seqüências foram previstas ou complementadas pelo software ALOM (veja, por exemplo, Klein, P., et al., Biochim. Biophys. Acta 787 (1984) 221-226). No caso de domínios transmembrana completos, a seqüência entre parênteses é prevista por ALOM, além da seqüência dada no SwissProt.
Em uma modalidade, o segundo ácido nucléico é selecionado do grupo de ácidos nucléicos compreendendo SEQ ID NO: 001, 002, 003, 004, 005, 006, 007, 008, 009, 151, 152, 153, 154, 155, 156, 157, 158, 159, 169, 170, 171, 172, 173. Em uma modalidade, o segundo ácido nucléico do ácido nucléico de acordo com a invenção é selecionado do grupo de seqüências 20 de ácidos nucléicos de SEQ ID NO: 001 a SEQ ID NO: 009. Em uma modalidade, o segundo ácido nucléico é selecionado do grupo de ácidos nucléicos compreendendo SEQ ID NO: 002, 003, 156, 157, 170 e 171. Em uma modalidade, o terceiro ácido nucléico do ácido nucléico de acordo com a invenção é selecionado de ou é um fragmento de um ácido nucléico selecionado do 25 grupo de seqüências de ácidos nucléicos de SEQ ID NO: 010 a SEQ ID NO: 018, e de seqüências de ácidos nucléicos que codificam as seqüências de aminoácidos de SEQ ID NO: 019 a SEQ ID NO: 069. Em uma modalidade, o terceiro ácido nucléico do ácido nucléico de acordo com a invenção é selecionado de ou é um fragmento de um ácido nucléico selecionado do grupo 30 de seqüências de ácidos nucléicos de SEQ ID NO: 010, 011, 012, 013, 014, 015, 016, 017, 018, 160, 161, 163, 164, 165, 166, 167, 168, 174, 175, 176, e de seqüências de ácidos nucléicos que codificam as seqüências de aminoá43 cidos de SEQ ID NO: 019 a SEQ ID NO: 069 e 162. Em uma modalidade, o terceiro ácido nucléico do ácido nucléico de acordo com a invenção é selecionado de ou é um fragmento de um ácido nucléico selecionado do grupo de seqüências de ácidos nucléicos de SEQ ID NO: 011,012, 165, 166, 175 e de seqüências de ácidos nucléicos que codificam as seqüências de aminoácidos de SEQ ID NO: 019 a SEQ ID NO: 036. Em outra modalidade, o terceiro ácido nucléico do ácido nucléico de acordo com a invenção é selecionado de ou é um fragmento de um ácido nucléico selecionado do grupo de seqüências de ácidos nucléicos de SEQ ID NO: 011,012, 165, 166, e 175. Em uma modalidade, o quarto ácido nucléico do ácido nucléico de acordo com a invenção é selecionado de ou compreende um ácido nucléico selecionado do grupo de seqüências de ácidos nucléicos de SEQ ID NO: 070 a SEQ ID NO: 078 e de seqüências de ácidos nucléicos que codificam as seqüências de aminoácidos de SEQ ID NO: 079 a SEQ ID NO: 129.
Tabela 1: Exemplos de segundos ácidos nucléicos
proteína |
sítio doador de splice 5' |
SEGUNDO ÁCIDO NUCLÉICO (ÁCIDO NUCLÉICO DE SPLICING) |
SÍTIO RECEPTOR DE SPLICE 3' |
cadeia pesada δ de imunoglobulina humana |
GCT | GTGAG
T |
GTGAGTCACCCCCAGGCCCAGGGTTG GGACGGGGACTCTGAGGGGGGCCATA AGGAGCTGGAATCCATACTAGGCAGGGGTGGGCACTGGGCAGGGGCGGG ... (2.77 KB TOTAL) ... GACTCGCCGTCATTTCAGCTCCACGCT GTGCGGGGGTGGGTGGAGGGGTAGC CTGGCCCTCATGACCAGGGAGCTTCTCACTCAGCCCCTGTTCCTCCCCAG (SEQ ID NO: 001) |
CCCCAG|A |
cadeia pesada γ1 de imunoglobulina humana |
CGG | GTAAAT |
GTAAATGAGTGCCACGGCCGGCAAGC CCCCGCTCCCCAGGCTCTCGGGGTCG CGCGAGGATGCTTGGCACGTACCCCGTGTACATACTTCCCAGGCACCC ... (1.3 KB TOTAL) ...
CCCGGCCGGGCCCTACATCCTGGGTC CTGCCACAGAGGGAATCACCCCCAGA GGCCCAAGCCCAGGGGGACACAG- |
GTCCAG|A |
|
|
CACTGACCACCCCCTTCCTGTCCAG (SEQ ID NO: 002) |
|
cadeia pesada γ2 de imunoglobulina humana |
CGG | GTAAAT |
GTAAATGAGTGCCACGGCCGGCAAGC CCCCGCTCCCCAGGCTCTCGGGGTCG CGCGAGGATGCTTGGCACGTACCCCGTCTACATACTTCCCGGGCACCC ... (1.3 KB TOTAL) ...
CCCGGCCGGGCCCTACATCCTGGGTC CTGCCACAGAGGGAATCACCCCCAGAGGCCCGAGCCCAGCAGGACACAGTATTGACCACCCACTTCCTGTCCAG (SEQ ID NO: 003) |
GTCCAG|A |
cadeia pesada μ de imunoglobulina humana |
CCG |
GTAAA
C |
GTAAACCCACCCTGTACAACGTGTCCC TGGTCATGTCCGACACAGCTGGCACCTGCTACTGACCCTGC TGGCCTGCCCACAGGCTCGGGGCGGCTGGCC ... (1.9 KB TOTAL) ...
GCCTAGGGGCCAAGGGTGGGCCTAGA GGATGGGCCCCGGGGGGGCTTTGCT GGGTGCCACCCCAGCCTGACCCTATT CCCCCGTGCTGTGTCTCCTGCAG (SEQ ID NO: 004) |
CTGCAG|A |
cadeia pesada de Ig murídea tipo α |
CGG |
GTAAA
C |
GTAAACCCACCAATGTCAGCGTGTCTG TGATCATGTCAGAGGGAGATGGCATCTGCTACTGAGCCACCCT GCCTGTCCCTACTCCTGAAATAAACTC TGT ... (2.43 KB TOTAL) ... CCACTGTCCCCAAAGCCCAAGGAGGC ATAGAAGCAGAAACCTTAAGTCTGAGC CCCCATCCCCATGGGTTTGGATCTAGAAGGTCATCTATGTCTTACAG (SEQ ID NO: 005) |
TTACAG | A |
cadeia pesada de Ig murídea tipo ε |
TTG | GTAAC
A |
GTAACACCTCCCTCCATCCCTCCTAGG CCTCCATGTAGCTGTGGTGGGGAAGG TGGATGACAGACATCCGCTCACTGTTG TAACACCAG-
GAAGCTACCCCAATAAACACTCAGTGC
CTGATTAGAGCCCTGGGT ...(1.7KB |
TTGAAG|A |
(2) |
|
TOTAL)...
ACTGGCTGGTCCCACCCCATCCCAGAGCTAGACCTCCAGGACCTATGTATTGAAG (SEQ ID NO: 173) |
|
source |
sítio doador de splice 5' |
SEGUNDO ÁCIDO NUCLÉICO (ÁCIDO NUCLÉICO DE SPLICING) |
SÍTIO RECEPTOR DE SPLICE 3' |
cadeia pesada de lg murídea tipo γ1 |
CTG | GTAAAT |
gtaaatgatcccagtgtccttggagcc CTCTGGTCCTACAGGACTCTGACACCTACCTCCACCCCTCCCTGTGTAAATAA AGCACCCAGCACTGCCTTGG ... (1.4 KB TOTAL) ...
CTGCAGCI I ICTCCTGGGCCTCCATAC AGCCTCCTGCCACACAGGGAATGGCCCTAGCCCCACCTTA TTGGGACAAACACTGACCGCCCTCTCT GTCCAG
(SEQ ID NO: 006) |
GTCCAG|G |
cadeia pesada de lg murídea tipo γ2Β |
CGG | GTAAAT |
GTAAATGAGCTCAGCACCCACAAAGCT CTCAGGTCCTAAGAGACACTGGCACCCATATCCATGCATCCCTTGTATAAATAAAGCATCCAGCAAAGCCTGG ... (1.36 KB TOTAL)... AGATCTCTCCTCTGACTTCATGCAGAC ATGTCTGCCTCACAGGGAATCTCTCCC AGCATCAAC-
CATGTTGGGACAAACACTGACTGTCCT CTCTGTTCAG
(SEQ ID NO: 007) |
GTTCAG | G |
cadeia pesada de lg murídea tipo γ3 |
CTG | GTAAAT |
GTAAATGAGAACAGCACCTAGCCATTC CTCGGGTCTTACAAGACACTGATACCAGCCCTAACCGGTGAACCCTATAAATAAAGCACCCAGAGATGGGACC ... (TOTAL 1.47 KB) ...
CTGCAGCTTTCTCCTGGGCCTCCATGC AGCCTCCTGCCACA-
CAGGGAATGGCCCTAGCTCTACCTTGT TGGGACAAACACTGACTTTCCTCTCTG TTCAG |
GTTCAG|A |
|
|
(SEQ ID NO: 008) |
|
cadeia pesada de Ig murídea tipo μ |
CTG | GTAAA C |
GTAAACCCACACTGTACAATGTCTCCC TGATCATGTCTGACACAGGCGGCACCTGCTATTGACCATGCTAGCGCTCAACCAGGCAGGCCCTGGGTGTCCA ... (TOTAL 1.86 KB)... GTCAATACTCGCTAAGATTCTCCAGAA CCATCAGGGCACCCCAACCCTTATGCA AATGCTCAGTCACCCCAAGACTTGGCTTGACCCTCCCTCTCTGTG TCCCTTCATAG (SEQ ID NO: 009) |
TCATAG|A |
receptor 1 de fator de crescimento de fibroblastos humanos |
AAG | GTACAC |
GTACACACTGTAACTTCTCCTCTCGATGTCCT GCCCTCGCCACGGGCAC.GGGGGGAG CATGCAI I ICCAGGCTTGGGGAGACA CAGAGGCAGGAGAGCTGGAAGAATGG GCTCCTGCCTGCCTGGTGCCACATCCTGCCCCAGCTTTGAGGGCTGA ATCCTCTCAGCTCAGA ... (2KB TOTAL)
CATGGACGGGGCCCTCCAAGCCTGCT AACACCCTGTTCGCACTGACTCAG SEQ ID NO: 151) |
ACTCAG | C |
receptor de fator de crescimento epitelial murídeo |
TGG | GTACG
T |
GTACG
TTCAATGGCAGTGGATCTTAAAGACCI I I IGGATCTAAGA CCAGAAGCCA TCTCTGACTCCCCTCTCACC ...(2.7KB TOTAL)...
GTATGGAATG CCCATATTAC CTTCTCTTGTCTCTCATTCCAG (SEQ ID NO: 152) |
TTCCAG | G |
receptor 1 de comple mento huma- |
AGG | GTGAG
T |
GGGTGAGTTGGCAGCAACATCTCTTG G l I IAAGAGTTCCAGCACAGCGATAGT AC I I ICTAGCCACATCTCAGCAAGGAA ACTAGGCTATTGCCACCTGCTCTTAAGAGGCTTGAACACA ...(5.7KB TOTAL)... |
CTTTAG | G |
no (C3b/C 4b) |
|
TAGACTTCTCCTGCATTGTAATCCCTCT GGTTTGCCACATATGCATGCTGTCAGG AAGTTGATGAGGTATGTACAGCACAATTTA Illi CCA I I I I I IGCCTTTAG (SEQIDNO:153) |
|
receptor de interleucina 4 muridea |
ACC | GTGAG T |
GTGAGTAT-
CAGGGTCGTAGGCTGTGAGGATCTCTACAGCCG ...(1.3KB TOTAL)...
GGGCGGCCTCCCCATTCATGACTGI I I I ICTCCTTGCAG (SEQIDNO:154) |
TTGCAG|A |
cadeia pesada a de imunoglobulina humana |
CGG | GTAAA C |
GTAAACCCACCCATGTCAATGTGTCTG TTGTCATGGCGGAGGTGGACGGCACC TGCTACTGAGCCGCCCGCCTGTCCCC ACCCCTGAATAAACTCCATGCTCCCCC AAGCAGCCCCACGCTT ...(2.6KB TOTAL)... CCCAAGGAAGCATAGCCGCTGTTCACACGAGTCTGGGCCTGGCAG (SEQ ID NO: 155) |
TGGCAG| G |
cadeia pesada ε de imunoglobulina humana (1) |
CCG | GTAAAT |
GTAAATGACGTACTCCTGCCTCCCTCCCTCCCAGGG CTCCATCCAGCTGTG ...(1.9KB TOTAL) CGTTGACTGACTCGGGACCTGGGTGC CCACCCTCAG (SEQIDNO:156) |
CCTCAG|G |
cadeia pesada δ de imunoglobulina muridea |
GTG | GTAAG T |
GTAAGTCACAACTGGGTAAGAGTGTCA AGCAAGGACAGCACTTGGTACCTATGA TAGACAAATACTCCTG I I I GGGAAGAG GAGGTCTGCATTGTCTAGATAAGAGGA ACACTGTGCTTATCTGTTTCAGTTTAAA AGACAGAACTACATAACACTTCACCCTTTCTACAACACTTA-
GA I I I I ICAGCCCTCTCCTCTA ...(6.35KB TOTAL)...
TTCTGTAGGGTGGAGACCTTCTCAT- |
CCCTAG|G |
|
|
GAGCACTAGTTCTTCCCTAG (SEQ ID NO: 172) |
|
cadeia pesada ε de imunoglobulina humana (2) |
CCG | GTAAAT |
GTAAATGACGT ACTCCTGCCT CCCTCCCTCC CAGGGCTCCA TCCAGCTGTG ...(2.1KB TOTAL) GCCACTGTGG AGCCGGGAGG GCTGACTGGC CAGGTCCCCC AG (SEQ ID NO: 170) |
CCCCAG|A |
cadeia pesada γ3 de imunoglobulina humana |
CGG | GTAAAT |
GTAAAT-
GAGTGCGACGGCCGGCAAGCCCCCG CTCCCCGGGCTCTC
...(1.3 KB TOTAL) CCCCAGAGGCCCGAGCCCAGCAGGACACAGCACTGAC-
CACCCTCTTCCTGTCCAG (SEQ ID NO: 157) |
GTCCAG|A |
cadeia pesada γ4 de imunoglobulina humana |
TGG | GTAAAT |
GTAAATGAGTGCCAGGGCCGGCAAGC CCCCGCTCCCCGGGCTCTCGGGGTCG CGCGAGGATGCTTGGCACGTACCCCGTGTACATACTTC
...(1.3 KB TOTAL)
CCCCA-
GAGGCCCAAGCCCAGGGGGACACAGCACTGAC-
CACCCCCTTCCTGTCCAG (SEQ ID NO: 171) |
GTCCAG|A |
cadeia pesada de lg murídea tipo ε
(1) |
TTG | GTAAC A |
GTAACACCTCCCTCCATCCCTCCTAGG CCTCCATGTAGCTGTGGTGGGGAAGG TGGATGACAGACATCCGCTCACTGTTG TAACACCAG-
GAAGCTACCCCAATAAACACTCAGTGC
CTGATTAGAGCCCTGGGT ...(1.5KB TOTAL)...
CCACTCTAGCTTCATCAGAACTGCATG AGACAAGTATGGGGTCTACCCCCTCC CCACTGTCACCTGGAGTCTGGGGAAG CTAACTGGCTGGTCCCACCCCATCCCA GAGCTAGACCTCCAGGACC- |
TTGAAG|A |
bulina humana/trecho transmembrana |
CCTTCATCGTCCTCTTCCTCCTG AGCCTCTTCTACAGTACCACCGTCACCTTGTTCAAG |
|
cadeia pesada de Ig muridea tipo α/trecho transmembrana |
ACTGTGACCTTCCTCACCCTCTT CCTACTGAGCTTGTTCTACAGCACAGCACTCACTGTTACA |
014 |
cadeia pesada de Ig muridea tipo γΐ/trecho transmembrana |
GGGCTCTGGACGACCATCACCATCTTCATCAGCCTCTTCCTGCTCAGTGTGTGC(TACAGCGCTGCTGTC ACACTCTTCAAGGTA |
015 |
cadeia pesada de Ig muridea tipo v2B/trecho transmembrana |
GGGCTCTGGACGACCATCACCATCTTCATCAGCCTCTTCCTGCTCAGCGTGTGC(TACAGCGCCTCTGTC ACACTCTTC) |
016 |
cadeia pesada de Ig muridea tipo v3/trecho transmembrana |
GGGCTCTGGACGACCATCACCA TCTTCATCAGCCTCTTCCTGCTCAGCGTG TGCTACAGCGCCTCTGTCACCCTCTTC |
017 |
cadeia pesada de Ig muridea tipo μ/trecho transmembrana |
(AACCTGTGGAC-
CACTGCCTCCACC)TTCATCGTC CTCTTCCTCCTGAGCCTCTTCTA CAGCAC-
CACCGTCACCCTGTTC(AAGGTG ) |
018 |
acetilcolina esterase humana/peptidio de sinal de âncora GPI sem peptídio de elo opcional |
GE-
AARRPGLPLPLLLLHQLLLLFLSHL RRL |
019 |
fosfatase alcalina humana (intestinal)/peptidio de sinal de âncora GPI sem peptídio de elo opcional |
DAAHPVAASLPLLAGTLLLLGASAAP |
020 |
fosfatase alcalina humana (figado)/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
SSAGSLAAGPLLVALALYPLSVLF |
021 |
fosfatase alcalina humana |
DAAHPGRSVVPALLPLLAG- |
022 |
|
|
TATGTATTGAAG (SEQ ID NO: 158) |
|
cadeia pesada de Ig murídea tipo γ2Α |
TGG | GTAAAT |
GTAAATGAGCTCAGCACACACAATGCT CCTGGGTCCTAATGGACACTGGCACC CATATCCATGCATCCCTTGTATAAATAAAGCACCCAGCAAAGCCTGGGACCATGTAAAACTGT ...(1.35KB TOTAL)... GAAGGCTCCAGGAAGGGTCTGCTGTA CCAGTCAGGCTGGAGCTCTCTCCTCTA CTTCATGCAAACATGTCTGCATCACAG GGAATCTCTCCCAGCACCAACCATGTTGGGACAAACACTGACTGTCCT CTCTGTTCAG (SEQ ID NO: 159) |
GTTCAG|G |
receptor de interleucina 4 humana |
ACT | GTGAG
T |
GTGAGTATCAAGAGGCCTAAGCAATGGTAATCTCCACTCTCCATTCTTC CCCTG ...(3.1KB TOTAL)... GGAGCCCAGGCTGTACCATGGCTGACCTCAGCTCATGGCTTCC CCTCCCACTTCCAG (SEQ ID NO: 169) |
TTCCAG | C |
Tabela 2: Exemplos de terceiros ácidos nucléicos e aminoácidos correspondentes aos terceiros ácidos nucléicos.
fonte |
SEQÜÊNCIA DE NUCLEOTÍDEOS OU AMINOÁCIDOS |
SEQ ID NO: |
cadeia pesada δ de imunoglobulina humana/trecho transmembrana |
AGCCTGTGGACCACCCTGTCCA CGTTTGTGGCCCTCTTCATCCTC ACCCTCCTCTACAGCGGCATTGTCACTTTCATCAAGGTGAAG |
010 |
cadeia pesada γ1 de imunoglobulina humana/trecho transmembrana |
GGGCTGTGGACGACCATCACCA TCTTCATCACACTCTTCCTGTTAAGCGTGTG CTACAGTGCCACCGTCACCTTCTTC |
011 |
cadeia pesada γ2 de imunoglobulina humana/trecho transmembrana |
GGGCTGTGGACGACCATCACCA TCTTCATCACACTCTTCCTGCTAAGCGTGTG CTACAGTGCCACCATCACCTTCTTC |
012 |
cadeia pesada μ de imunoglo- |
AACCTGTGGGCCACCGCCTCCA |
013 |
(placenta)/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
TLLLLETATAP |
|
antígeno CAMPATH-1 humano/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
SASSNISGGIFLFFVANAIIHLFCFS |
023 |
antígeno carcinoembrionário humano/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
ASGTSPGLSAGATVGIMIGVLVGVALI |
024 |
CD55 humano (fator de aceleração de decaimento)/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
SGTTRLLSGHTCFTLTGLLGTLVT MGLLT |
025 |
CD59 humano/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
NGGTSLSEKTVLLLVTPFLAAAW SLHP |
026 |
antígeno CD90 humano (Thy/1 )/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
CEGISL-
LAQNTSWLLLLLLSLSLLQATDFM SL |
027 |
contactina-1 humana (CNTN1)/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
SGAPTLSPSLLGLLLPAFGILV |
028 |
antígeno E48 humano/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
DLCNEKLHNAAPTRTALAHSALSLGLALSLLAVILAPSL |
029 |
receptor de folato A humano/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
SGAGPWAAWPFLLSLALMLLWLL S |
030 |
receptor de folato B humano/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
NAGEMLHGTGGLLLSLALMLQLW LLG |
031 |
proteína p137 ancorada a GPI humana/peptídio de sinal de |
ARGLMNGYRGPAMDSEEDMMV TALHSLTLQTVVIHSLSSVLPGIT- |
032 |
âncora GPI sem peptídio de elo opcional |
LAIN |
|
antígeno-3 associado a função de linfócitos humanos/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
SSGHSRHRYALIPIPLAVITTCIVLYMNVL |
033 |
proteína de interação mDIA humana/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
SGASSLHRHFGLLLASLAPLVLCL SLL |
034 |
5'-nucleotidase humana/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
STGSHCHGSFSLIFLSLWAVIFVLYQ |
035 |
fator ativador de uroquinase plasminogênio humano/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
GAAPQPGPAHLSLTITLLMTARLWGGTLLWT |
036 |
antígeno LY-6C de proteína de superfície celular murídea/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
NAAVPTGASTWTMAGVLLFSLSS VILQTLL |
037 |
5'-nucleotidase murídea/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
NERLVSAAPGHALLSSVTLGLATSLSLLTVMAL CL |
038 |
antígeno 0X45 murídeo (BCM-1 ou Blast-1)/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
SAASHYQGSFPLVILSLSAVIFVLYQ |
039 |
antígeno 2 de célula tronco murídea/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
SSGVCWTATWLVVTTLIIHRILLT |
040 |
molécula 1 de adesão de células vasculares murídeas/peptídio de sinal de âncora GPI sem peptídio de elo |
NFSAAGLGLRASIPLLGLGLLLSLLALLQLSP |
041 |
opcional |
|
|
proteína brevicano de rato/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
AKSFYFICYLCLYLAL |
042 |
antígeno CD90 (Thy-1) de rato/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
GNSAEGSMPAFLLFLLLQLWDT |
043 |
proteína glipicano de rato/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
CGGISLLVQNTSWLLLLLLSLSFL QATDFISL |
044 |
antígeno MRC OX-45 de rato/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
SAATR-
PEPHYFFLLFLFTLVLAAARPRWR |
045 |
5'-nucleotidase de rato/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
SSGVHWIAAWLVVTLSIIPSILLA |
046 |
glicoproteína GP2 maior de membrana de grânulo secretor pancreático de rato/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
SAASHYQGSFPLIILSFWAVILVLYQ |
047 |
proteína RT6.2 de superfície de células T de rato/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
RNTGFLLAWPTFFLPVFLAWLF |
048 |
proteína PHR1 de reparo de DNA de levedura/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
SSAGARESCVSLFLVVLPSLLVQLLCLAE P |
049 |
proteína 1 de superfície ancorada a glicofosfolipídio de levedura/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
SSGVKATQQMSMVKLVSIITIVTAFVGGMSVVF |
050 |
proteína precursora de amilóide suíno/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
NAATNVKANLAQWFTSIISLSIAAGVGFALV |
051 |
dipeptidase suína/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
ARAAPTTSLGSLMTVSALAILGWS V |
052 |
proteína IL Tat 1.1 de superfície variante de Trypanosoma brucei/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
SAAPSLHLPPGSLLASLVPLLLLSL P |
053 |
proteína MIT 117a de superfície variante de Trypanosoma brucei/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
SNSFVIHKAPLFLAFLLF |
054 |
proteína MIT 118a de superfície variante de Trypanosoma brucei/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
DSSILVTKKFALTVVSAAFVALLF |
055 |
proteína MIT 221 de superfície variante de Trypanosoma brucei/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
NGSFLTSKQFAFSVVSAAFVALLF |
056 |
proteína MITat 1.1000BC de superfície variante de Trypanosoma brucei/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
SNSFVISKTPLWLAVLLF |
057 |
proteína MITat 1.5b de superfície variante de Trypanosoma brucei/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
DGSFLVNKKFALMVYDFVSLLAF |
058 |
proteína repetitiva ácida procíclica de Trypanosoma brucei/peptídio de sinal de âncora |
NGSFLTSKQFALMVSAAFVTLLF |
059 |
GPI sem peptídio de elo opcional |
|
|
proteína TxTat 1 de superfície variante de Trypanosoma brucei/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
GAATLKSVALPFAIAAAALVAAF |
060 |
proteína YNat 1.1 de superfície variante de Trypanosoma congolense/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
SNSFVINKAPLLLGFLLF |
061 |
melanotransferrina de galinha/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
SGSSHGTKAIRSILHVALLM |
062 |
molécula de adesão de células neurais de galinha/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
AGNKLIQQHLLVITFVPFIILGQLQGLG |
063 |
acetilcolina esterase de Torpedo marmorata/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
ATLGSPSTSSSFVSLLLSAVTLLLL C |
064 |
proteína prion de hamster/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
SSSGTSSSKGIIFYVLFSILYLIFY |
065 |
5'-nucleotidase bovina/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
SSAVLFSSPPVILLISFLIFLMVG |
066 |
proteína Gp64 de membrana de bolor/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
SAGSHCCGSFSLIFLSVLAVIIILYQ |
067 |
antígeno específico préesporo de bolor/peptídio de sinal de âncora GPI sem peptídio de elo opcional |
SSATTIAFNAFVVFAIVLSVLLF |
068 |
receptor 1 do fator de crescimento de fibroblastos humanos |
GSASTWASLSLIIFSMILSLC |
069 |
receptor do fator de crescimento epitelial murideo |
TCGCCCCTGTACCTGGAGATCA TCATCTATTGCA-
CAGGGGCCTTCCTCATCTCCTG CATGGTGGGGTCGGTCATCGTCTAC |
160 |
receptor 1 de complemento humano (C3b/C4b) |
AAGATACCATCTATTGCCACTGG GATTGTGGGTGGCCTCCTCTTC ATAGTGGTGGTGGCCCTTGGGA TTGGCCTATTCATGCGAAGACGT |
161 |
receptor 4 de interleucina humana |
THDALIVGTLSGTIFFILLIIFLSWIILK |
162 |
receptor 4 de interleucina murídea |
TTCGAGCAG-
CACCTCCTGCTGGGCGTCAGCG TTTCCTGCATTGTCA
TCCTGGCCGTCTGCCTGTTGTG CTATGTCAGCATCACCAAGATTAAG |
174 |
cadeia pesada a de imunoglobulina humana/trecho transmembrana |
CGCCTTCCACTGGGGGTCACCA TCTCCTGCCTCTGCATCCCGTT GI I I IGCCTGTTCTGTTACTTCA GCATTACCAAGATT |
163 |
cadeia pesada ε de imunoglobulina humana/trecho transmembrana |
ACCAT-
CACCTTCCTCACCCTCTTCCTGC TGAGCCTGTTCTATAGCACAGCACTGACCGTGACC |
164 |
cadeia pesada γ3 de imunoglobulina humana/trecho transmembrana |
TGGACGTGGACCGGCCTCTGCA TCTTCGCCGCACTCTTCCTGCT CAGCGTGAGCTACAGCGCCGCCATCACGCTCCTCATGGTGCAG |
165 |
cadeia pesada γ4 de imunoglobulina humana/trecho transmembrana |
GGGCTGTGGACGACCATCACCA TCTTCATCACACTCTTCCTGTTAAGCGTGTG CTACAGTGCCACCGTCACCTTCTTC |
166 |
cadeia pesada de lg murídea tipo ε/trecho transmembrana |
GGGCTGTGGACGACCATCACCA TCTTCATCACACTCTTCCTGCTAAGCGTGTG CTACAGTGCCACCGTCACCTTCTTC |
175 |
cadeia pesada de lg murídea tipo δ/trecho transmembrana |
GAGCTGTGGACCAGTATTTGTG TCTTCAT-
CACCCTGTTCCTGCTCAGTGTG AGCTATGGGGCCACTGTCACCG TCCTC |
167 |
cadeia pesada de lg murídea tipo y2A/trecho transmembrana |
GGCCTGTGGCCCACAATGTGCA CCTTCGTGGCCCTCTTCCTGCT CACACTGCTCTACAGTGGCTTCGTCACCTTCATCAAGGTA |
176 |
|
GGGCTCTGGACAACCATCACCA TCTTCATCAGCCTCTTCCTGCTCAGCGTG TGTTACAGCGCCTCTGTCACACTCTTC |
168 |
Table 3: Exemplos de quartos ácidos nucléicos e aminoácidos correspondentes aos quartos ácidos nucléicos.
fonte |
SEQÜÊNCIA DE NUCLEOTÍDEOS OU AMINOÁCIDOS |
SEQ ID NO: |
cadeia pesada δ de imunoglobulina humana |
ACCTGGCCATGACCCCCCTGATCCC |
070 |
cadeia pesada γ1 de imunoglobulina humana |
AGCTGCAACTGGAGGAGAGCTGTGCGGAG |
071 |
cadeia pesada γ2 de imunoglobulina humana |
AGCTGCAACTGGAGGAGAGCTGTGCGGAGGCGC |
072 |
cadeia pesada μ de imunoglobulina humana |
AGGGGGAGGTGAGCGCCGAC GAGGA |
073 |
cadeia pesada de lg murídea tipo α |
AACGTCAAGAGCCACTTTCCTATGTGCTAC T |
074 |
cadeia pesada de lg murídea tipo γ1 |
GGCTGCAACTGGACGAGACCTGTGCTGAGGCCCAGGACGGGGAGCTGG |
075 |
cadeia pesada de Ig murídea tipo γ2Β |
GGCTAGACCTGGATGATATCTGTGCTG |
076 |
cadeia pesada de Ig murídea tipo γ3 |
AGCTGGAACTGAATGAGACCTGT |
077 |
cadeia pesada de Ig murídea tipo μ |
AGGGGGAGGTGAATGCTGAGGAGGAAGGCTTTG |
078 |
acetilcolina esterase humana |
GFTH |
079 |
fosfatase alcalina humana (intestinal) |
ACTT |
080 |
fosfatase alcalina humana (fígado) |
CAPA |
081 |
fosfatase alcalina humana (placenta) |
AGTT |
082 |
antígeno CAMPATH-1 humano |
TSSP |
083 |
antígeno carcinoembrionário humano |
ITVS |
084 |
CD55 humano (fator de aceleração de decaimento) |
SGTT |
085 |
CD59 humano |
EQLE |
086 |
antígeno CD90 humano (Thy/1) |
KLVK |
087 |
contactoa-1 humana (CNTN1) |
QVKI |
088 |
antígeno E48 humano |
CCQE |
089 |
receptor de folato A humano |
AAAM |
090 |
receptor de folato B humano |
AMHV |
091 |
proteína p137 ancorada a GPI humana |
GSRG |
092 |
antígeno-3 associado a função de linfócitos humanos |
TCIP |
093 |
proteína de interação mDIA humana |
YGYS |
094 |
5'-nucleotidase humana |
RIKF |
095 |
fator ativador de uroquinase plasminogênio humano |
QYRS |
096 |
antígeno LY-6C de proteína de superfície celular murídea |
EDLC |
097 |
antígeno Ly-6 murídeo ThB |
TDLC |
098 |
5'-nucleotidase murídea |
RIKF |
099 |
antígeno 0X45 murídeo (BCM-1 ou Blast-1) |
DLAR |
100 |
antígeno 2 de célula tronco murídea |
SSFC |
101 |
molécula 1 de adesão de células vasculares murídeas |
HLMF |
102 |
proteína brevicano de rato/âncora GPI |
APSS |
103 |
antígeno CD90 (Thy-1) de rato |
KLVK |
104 |
proteína glipicano de rato |
GQKT |
105 |
antígeno MRC OX-45 de rato |
TLAR |
106 |
5'-nucleotidase de rato |
RIKF |
107 |
glicoproteína GP2 maior de membrana de grânulo secretor pancreático de rato |
NGTP |
108 |
proteína RT6.2 de superfície de células T de rato |
NCLY |
109 |
proteína PHR1 de reparo de DNA de levedura |
GSSS |
110 |
proteína 1 de superfície ancorada a glicofosfolipídio de levedura |
SSKK |
111 |
proteína precursora de amilóide suíno |
EPLS |
112 |
dipeptidase suína |
NYGY |
113 |
proteína ILTat 1.1 de superfície variante de Trypanosoma brucei |
NTTG |
114 |
proteína MIT 117a de superfície variante de Trypanosoma brucei |
NACK |
115 |
proteína MIT 118a de superfície variante de Trypanosoma brucei |
EKCR |
116 |
proteína MIT 221 de superfície variante de Trypanosoma brucei |
TTGS |
117 |
proteína MITat 1.1000BC de superfície variante de Trypanosoma brucei |
EKCC |
118 |
proteína MITat 1.5b de superfície variante de Trypanosoma brucei |
EDCR |
119 |
proteína repetitiva ácida procíclica de Trypanosoma brucei |
EPEP |
120 |
proteína TxTat 1 de superfície variante de Trypanosoma brucei |
NTTA |
121 |
proteína YNat 1.1 de superfície variante de Trypanosoma congolense |
SHLP |
122 |
melanotransferrina de galinha |
QCSG |
123 |
molécula de adesão de células neurais de galinha |
TVIP |
124 |
acetilcolina esterase de Torpedo marmorata |
DGEL |
125 |
proteína prion de hamster |
DGRR |
126 |
5'-nucleotidase bovina |
RIQF |
127 |
proteína Gp64 de membrana de bolor |
NNVC |
128 |
antígeno específico préesporo de bolor |
SI I I |
129 |
Em uma modalidade, o polipeptídio é uma cadeia pesada de imunoglobulina, e o domínio transmembrana é o de uma cadeia pesada de imunoglobulina. Para a expressão de uma imunoglobulina, o ácido nucléico da presente invenção é introduzido juntamente com um ácido nucléico que 5 codifica uma cadeia leve de imunoglobulina em uma célula hospedeira eucariótica. Esses ácidos nucléicos podem estar localizados no mesmo ácido nucléico ou em diferentes ácidos nucléicos.
A invenção engloba um vetor compreendendo o ácido nucléico da invenção, assim como uma célula eucariótica compreendendo o vetor da invenção.
A variante solúvel do polipeptídio heterólogo codificado pelo ácido nucléico de acordo com a invenção pode ser produzida pela transfecção de uma célula eucariótica com o ácido nucléico da invenção, cultivo da célula sob condições adequadas para a expressão do polipeptídio codificado pelo dito ácido nucléico, e recuperação do polipeptídio do citoplasma das células ou meio de cultura.
Para a fabricação de uma célula eucariótica de acordo com a invenção, apresenta-se um kit. O kit compreende um vetor contendo pelo menos dois sítios de clonagem múltipla e um ácido nucléico de splicing começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3', em que i) o ácido nucléico compreende um códon de parada de tradução e um sinal de poliadenilação, e ii) o ácido nucléico não é constitutivamente removido durante o processamento de pré-mRNA.
Em uma modalidade, a célula eucariótica da invenção é uma célula de mamífero. Em uma modalidade, a célula de mamífero é uma célula selecionada do grupo que compreende células CHO, células NSO, células Sp2/0, células COS, K652 cells, células BHK, células PER.C6® e células HEK.
Os exemplos a seguir, listagem de seqüência e figuras são apresentados para auxiliar na compreensão da presente invenção, cujo verdadeiro âmbito é exposto nas reivindicações anexas. Deve-se entender que se podem fazer modificações nos procedimentos apresentados, sem sair do espírito da invenção.
Descrição das Figuras
Figura 1: Cartões de plasmídios do vetor de expressão de slgG/mlgG pmlgG-A (A), vetor de expressão de slgG/mlgG pmlgGA-A (B) e vetor de expressão de slgG plgG-A (C). Os elementos de vetor representados são descritos em detalhes no texto.
Figura 2: Representação esquemática das estruturas de éxon intron dos cassetes de expressão de cadeia gama.
A: Estrutura da região constante de cadeia gama 1 em um vetor de expressão pmlgG-A. O fragmento de DNA de aprox. 7,2 kb é apresentado como uma linha preta. Os éxons são representados por caixas claras, 5 com suas designações indicadas acima. A posição do sítio de poliadenilação para a forma secretada [p(A)s] e para a forma ligada a membrana [p(A)m] da IgG é apresentada por barras pretas. A numeração dos introns e da 3' UTR é indicada abaixo do diagrama. Mostram-se as posições relativas do sítio de restrição Sphl no íntron 6 e o sítio Sph I com mutação na 3'UTR (entre pa10 rênteses).
B: Estrutura da região constante de cadeias gama 1 - gama 3 gama 4 híbridas de aprox. 4,8 kb em um vetor de expressão pmlgGA-A, conforme representado em A. Além disso, o diagrama indica as regiões derivadas dos três loci do gene de cadeia gama constante pesada de imunoglobu15 lina (IGHGI, IGHG3 e IGHG4).
Figura 3: Correlação da secreção de IgG e sinal de superfície celular em clones que expressam mlgG. Seis clones independentes de células Sp2/0-Agl4 transfectadas com o plasmídio pmlgG-A (esquerda), pmlgGA-A (meio) ou plgG-A como controle (direita) são cultivados durante 20 48 horas sob condições definidas. A intensidade de fluorescência mediana na citometria de fluxo, como uma medida da quantidade de IgG ligada à membrana plasmática, é representada por barras cinza. A concentração de IgG secretada nos sobrenadantes de cultura celular correspondentes é representada por diamantes pretos.
Figura 4: Gráfico de pontos FLI /FSC típico usado para a classificação de células em um citômetro de fluxo FACS Vantage (BD). A porta RI compreende 5,7% da população de células vivas representada que foram previamente conectadas por porta por um gráfico de pontos FSC/SSC. Células que se encontravam em RI foram coletadas durante o processo de classi30 ficação.
Figura 5: Determinação das taxas de produção específicas. Os clones 5B11, 9B3 e J5-H3 foram cultivados em balões rotativos durante 92 horas.
A: Crescimento celular. Nos momentos indicados, após o início das culturas rotativas, a contagem de células de cada clone foi medida com um contador de células CASY.
B: Produção de IgG. Nos momentos indicados (como em A), as concentrações de IgG nos sobrenadantes de cultura celular foram determinadas por cromatografia de afinidade de proteína A.
C: Taxas de produção específicas. O gráfico de barras mostra a taxa de produção específica média para cada clone calculada a partir das contagens celulares e medições de IgG nas primeiras 69 horas (veja Tabela 2 e veja texto para detalhes adicionais). Os desvios padrões são indicados por barras de erro.
Figura 6: Microscopia de imunofluorescência. O clone 5B11 (imagens 1, 4), que expressa slgG secretada e mlgG ligada a membrana, o clone J5-H3 (imagens 2, 5), que expressa apenas slgG secretada, ou células Sp2/0-Agl4 não transfectadas (imagens 3, 6) foram marcados para IgG na superfície celular (imagens 1-3), ou IgG intracelular (imagens 4-6), e imagens registradas em um microscópio de fluorescência Axiophot.
Figura 7: Análise de mRNA por Northern blot.
A: Auto-radiografia de um Northern blot hibridizado com sonda A marcada com [a-32P] (pistas 1 - 3) ou sonda B (pistas 4 - 6). Em cada pista, 10 pg de RNA total isolados do clone 5B11 (pistas 1, 4), clone J5-H3 (pistas 2, 5) ou células Sp2/0-Agl4 não transfectadas (pistas 3, 6) foram separados por eletroforese em gel de agarose desnaturante e transferidos para uma membrana de náilon.
B: Representação esquemática das duas isoformas de mRNA que codificam a cadeia pesada de mlgG ligada a membrana ou slgG secretada. Os éxons são representados por caixas. As regiões complementares às sondas A e B estão marcadas com barras pretas.
Figura 8: Análise de imunotransferência de isoformas de cadeia pesada de IgG. Os clones 5B11 (pistas 1, 4), J5-H3 (pistas 2, 5) ou células Sp2/0-Agl4 não transfectadas (pistas 3, 6) foram extraídos de acordo com o método de extração com carbonato alcalino (veja texto). Imunoglobulinas das frações de membrana, que contêm proteínas de membrana integradas (pistas 1 - 3), ou das frações SN, que contêm predominantemente teores solúveis das células (pistas 4 - 6), foram purificadas por ensaio de extração de proteína A e separadas por eletroforese em SDS gel de poliacrilamida desnaturante. Depois da transferência e marcação com anticorpo secundário acoplado a peroxidase de raiz-forte, as cadeias pesadas foram visualizadas por uma reação de quimioluminescência. As cadeias pesadas de SlgG secretada (slgG HC) e cadeias pesadas de mlgG ligada a membrana (mlgG HC) estão indicadas. O painel inferior mostra uma exposição de curta duração de uma seção da transferência no painel superior.
Figura 9: Análise de mRNA por Northern blot. Auto-radiografia de Northern blots hibridizados com sonda A marcada com [a-32P] (painel esquerdo) ou sonda B (painel direito), conforme mostrado na figura 7B. Em cada pista, 10 pg de RNA total isolado dos clones 1A1, 1B6, 1C5 ou IDI (pistas 1 - 4) e dos clones 1D6, 2D6, KO2 ou KO6 (pistas 6 - 9) foram separados por eletroforese em gel de agarose desnaturante e transferidos para uma membrana de náilon. O clone 27 expressa apenas slgG e foi adicionado para controle (pistas 5, 10). Os mRNAs de cadeia pesada das isoformas mlgG e slgG estão indicados..
Figura 10: Cartão de plasmídio do vetor de expressão de slgG/lgG-GPI plgG-GPI-B.
Descrição das Tabelas
Tabela 1: Exemplos de segundos ácidos nucléicos.
Tabela 2: Exemplos de terceiros ácidos nucléicos e aminoácidos correspondentes aos terceiros ácidos nucléicos.
Tabela 3: Exemplos de quartos ácidos nucléicos e aminoácidos correspondentes aos quartos ácidos nucléicos.
Tabela 4: Primer oligonucleotídico para clonagem e mutagênese na construção do vetor de expressão de slgG/mlgG '.pmlgG-A1.
Tabela 5: SPR médio determinado para cada clone selecionado com base em quatro SPRs distintos, calculados em vários momentos duran65 te a fase de crescimento exponencial.
Tabela 6: A Tabela 4 mostra a distribuição de clones para diferentes níveis de concentração de IgG três semanas após deposições de células únicas em placas de 96 poços e análise dos sobrenadantes de cultura celular de 515 clones classificados para mlgG e de 550 clones de controle por ELISA.
Tabela 7: A Tabela 5 mostra a distribuição de clones para diferentes níveis de concentração de IgG na segunda seleção.
Tabela 8: Contagem de células de culturas de agitador no dia 0, 1,2, 3, 4 e 7 de cada clone determinada com um contador de células CASY® TT (Scharfe Systems).
Tabela 9: Determinação de produtividade de culturas de agitador de 10 dias por ELISA.
Descrição das Seqüências
SEQ ID NO: 001 Segundo ácido nucléico derivado de cadeia pesada δ de imunoglobulina humana
SEQ ID NO: 002 Segundo ácido nucléico derivado de cadeia pesada y1 de imunoglobulina humana
SEQ ID NO: 003 Segundo ácido nucléico derivado de cadeia pesada y2 de imunoglobulina humana
SEQ ID NO: 004 Segundo ácido nucléico derivado de cadeia pesada μ de imunoglobulina humana
SEQ ID NO: 005 Segundo ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo α
SEQ ID NO: 006 Segundo ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γΙ
SEQ ID NO: 007 Segundo ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γ2Β
SEQ ID NO: 008 Segundo ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γ3
SEQ ID NO: 009 Segundo ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo μ
SEQ ID NO: 010 Terceiro ácido nucléico derivado de cadeia pesada δ de imunoglobulina humana
SEQ ID NO: 011 Terceiro ácido nucléico derivado de cadeia pesada γ1 de imunoglobulina humana
SEQ ID NO: 012 Terceiro ácido nucléico derivado de cadeia pesada γ2 de imunoglobulina humana
SEQ ID NO: 013 Terceiro ácido nucléico derivado de cadeia pesada μ de imunoglobulina humana
SEQ ID NO: 014 Terceiro ácido nucléico derivado de cadeia pe10 sada de imunoglobulina murídea tipo α
SEQ ID NO: 015 Terceiro ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γ1
SEQ ID NO: 016 Terceiro ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γ2Β
SEQ ID NO: 017 Terceiro ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γ3
SEQ ID NO: 018 Terceiro ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo μ
SEQ ID NO: 019 Terceiro ácido nucléico derivado de AChE hu20 mana
SEQ ID NO: 020 Terceiro ácido nucléico derivado de fosfatase alcalina intestinal humana
SEQ ID NO: 021 Terceiro ácido nucléico derivado de fosfatase alcalina de fígado humana
SEQ ID NO: 022 Terceiro ácido nucléico derivado de fosfatase alcalina de placenta humana
SEQ ID NO: 023 Terceiro ácido nucléico derivado de antígeno CAMPATH-1 humano
SEQ ID NO: 024 Terceiro ácido nucléico derivado de antígeno 30 carcinoembrionário humano
SEQ ID NO: 025 Terceiro ácido nucléico derivado de CD55 humano
SEQ ID NO: 026 Terceiro ácido nucléico derivado de CD59 humano
SEQ ID NO: 027 Terceiro ácido nucléico derivado de CD90 humano
SEQ ID NO: 028 Terceiro ácido nucléico derivado de contactina- humana
SEQ ID NO: 029 Terceiro ácido nucléico derivado de antígeno
E48 humano
SEQ ID NO: 030 Terceiro ácido nucléico derivado de receptor de folato A humano
SEQ ID NO: 031 Terceiro ácido nucléico derivado de receptor de folato B humano
SEQ ID NO: 032 Terceiro ácido nucléico derivado de proteína p137 ancorada em GPI humana
SEQ ID NO: 033 Terceiro ácido nucléico derivado de antígeno-3 associado à função de linfócitos humano
SEQ ID NO: 034 Terceiro ácido nucléico derivado de proteína de interação com mDIA humana
SEQ ID NO: 035 Terceiro ácido nucléico derivado de 5'nucleotidase humana
SEQ ID NO: 036 Terceiro ácido nucléico derivado de fator ativador de uroquinase plasminogênio humano
SEQ ID NO: 037 Terceiro ácido nucléico derivado de antígeno
LY-6C de proteína de superfície celular murídeo
SEQ ID NO: 038 Terceiro ácido nucléico derivado de antígeno
LY-6 ThB murídeo
SEQ ID NO: 039 Terceiro ácido nucléico derivado de 5'nucleotidase murídea
SEQ ID NO: 040 Terceiro ácido nucléico derivado de antígeno
0X45 murídeo
SEQ ID NO: 041 Terceiro ácido nucléico derivado de antígeno 2 de célula tronco murídeo
SEQ ID NO: 042 Terceiro ácido nucléico derivado de molécula 1 de adesão de células vasculares murídea
SEQ ID NO: 043 Terceiro ácido nucléico derivado de brevicano de rato
SEQ ID NO: 044 Terceiro ácido nucléico derivado de antígeno CD90 de rato
SEQ ID NO: 045 Terceiro ácido nucléico derivado de glipicano de rato
SEQ ID NO: 046 Terceiro ácido nucléico derivado de antígeno
MRC 0X45 de rato
SEQ ID NO: 047 Terceiro ácido nucléico derivado de 5'nucleotidase de rato
SEQ ID NO: 048 Terceiro ácido nucléico derivado de glicoproteína GP2 maior de membrana de grânulo secretor pancreático de rato
SEQ ID NO: 049 Terceiro ácido nucléico derivado de proteína RT6.2 de superfície de células T de rato
SEQ ID NO: 050 Terceiro ácido nucléico derivado de proteína PHR1 de reparo de DNA de levedura
SEQ ID NO: 051 Terceiro ácido nucléico derivado de proteína-1 de superfície ancorada em glicofosfolipídio de levedura
SEQ ID NO: 052 Terceiro ácido nucléico derivado de proteína precursora de amilóide suína
SEQ ID NO: 053 Terceiro ácido nucléico derivado de dipeptidase suína
SEQ ID NO: 054 Terceiro ácido nucléico derivado de proteína IL Tat 1.1 de superfície variante de Trypanosoma brucei . SEQ ID NO: 055 Terceiro ácido nucléico derivado de proteína
MIT 117a de superfície variante de Trypanosoma brucei
SEQ ID NO: 056 Terceiro ácido nucléico derivado de proteína MIT 118a de superfície variante de Trypanosoma brucei
SEQ ID NO: 057 Terceiro ácido nucléico derivado de proteína
MIT 221 de superfície variante de Trypanosoma brucei
SEQ ID NO: 058 Terceiro ácido nucléico derivado de proteína MITat 1.1000 BC de superfície variante de Trypanosoma brucei
SEQ ID NO: 059 Terceiro ácido nucléico derivado de proteína MITat 1.5b de superfície variante de Trypanosoma brucei
SEQ ID NO: 060 Terceiro ácido nucléico derivado de proteína repetitiva ácida procíclica de Trypanosoma brucei
SEQ ID NO: 061 Terceiro ácido nucléico derivado de proteína TxTat 1 de superfície variante de Trypanosoma brucei
SEQ ID NO: 062 Terceiro ácido nucléico derivado de proteína YN em 1.1 de superfície variante de Trypanosoma congolense
SEQ ID NO: 063 Terceiro ácido nucléico derivado de melanotransferrina de galinha
SEQ ID NO: 064 Terceiro ácido nucléico derivado de molécula de adesão de células neurais de galinha
SEQ ID NO: 065 Terceiro ácido nucléico derivado de AChE de Torpedo marmorata
SEQ ID NO: 066 Terceiro ácido nucléico derivado de proteína de prion de hamster
SEQ ID NO: 067 Terceiro ácido nucléico derivado de 5'nucleotidase bovina
SEQ ID NO: 068 Terceiro ácido nucléico derivado de proteína Gp64 de membrana de bolor
SEQ ID NO: 069 Terceiro ácido nucléico derivado de antígeno específico de pré-esporo de bolor
SEQ ID NO: 070 Quarto ácido nucléico derivado de cadeia pesada δ de imunoglobulina humana
SEQ ID NO: 071 Quarto ácido nucléico derivado de cadeia pesada y1 de imunoglobulina humana
SEQ ID NO: 072 Quarto ácido nucléico derivado de cadeia pesada y2 de imunoglobulina humana
SEQ ID NO: 073 Quarto ácido nucléico derivado de cadeia pesada μ de imunoglobulina humana
SEQ ID NO: 074 Quarto ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo α
SEQ ID NO: 075 Quarto ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γ1
SEQ ID NO: 076 Quarto ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γ2Β
SEQ ID NO: 077 Quarto ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γ3
SEQ ID NO: 078 Quarto ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo μ
SEQ ID NO: 079 Quarto ácido nucléico derivado de AChE humana
SEQ ID NO: 080 Quarto ácido nucléico derivado de fosfatase alcalina intestinal humana
SEQ ID NO: 081 Quarto ácido nucléico derivado de fosfatase alcalina de fígado humana
SEQ ID NO: 082 Quarto ácido nucléico derivado de fosfatase alcalina de placenta humana
SEQ ID NO: 083 Quarto ácido nucléico derivado de antígeno
CAMPATH-1 humano *
SEQ ID NO: 084 Quarto ácido nucléico derivado de antígeno carcinoembrionário humano
SEQ ID NO: 085 Quarto ácido nucléico derivado de CD55 humano
SEQ ID NO: 086 Quarto ácido nucléico derivado de CD59 humano
SEQ ID NO: 087 Quarto ácido nucléico derivado de CD90 humano
SEQ ID NO: 088 Quarto ácido nucléico derivado de contactina-1 humana
SEQ ID NO: 089 Quarto ácido nucléico derivado de antígeno
E48 humano
SEQ ID NO: 090 Quarto ácido nucléico derivado de receptor de folato A humano
SEQ ID NO: 091 Quarto ácido nucléico derivado de receptor de folato B humano
SEQ ID NO: 092 Quarto ácido nucléico derivado de proteína p137 ancorada em GPI humana
SEQ ID NO: 093 Quarto ácido nucléico derivado de antígeno-3 associado à função de linfócitos humano
SEQ ID NO: 094 Quarto ácido nucléico derivado de proteína de interação com mDIA humana
SEQ ID NO: 095 Quarto ácido nucléico derivado de 51nucleotidase humana
SEQ ID NO: 096 Quarto ácido nucléico derivado de fator ativador de uroquinase plasminogênio humano
SEQ ID NO: 097 Quarto ácido nucléico derivado de antígeno de proteína LY-6C de superfície celular murídeo
SEQ ID NO: 098 Quarto ácido nucléico derivado de antígeno LY6 ThB murídeo
SEQ ID NO: 099 Quarto ácido nucléico derivado de 5'nucleotidase murídea
SEQ ID NO: 100 Quarto ácido nucléico derivado de antígeno 0X45 murídeo
SEQ ID NO: 101 Quarto ácido nucléico derivado de antígeno 2 de célula tronco murídeo
SEQ ID NO: 102 Quarto ácido nucléico derivado de molécula 1 de adesão de células vasculares murídea
SEQ ID NO: 103 Quarto ácido nucléico derivado de brevicano de rato
SEQ ID NO: 104 Quarto ácido nucléico derivado de antígeno
CD90 de rato
SEQ ID NO: 105 Quarto ácido nucléico derivado de glipicano de rato
SEQ ID NO: 106 Quarto ácido nucléico derivado de antígeno
MRC 0X45 de rato
SEQ ID NO: 107 Quarto ácido nucléico derivado de 5'nucleotidase de rato
SEQ ID NO: 108 Quarto ácido nucléico derivado de glicoproteína
GP2 maior de membrana de grânulo secretor pancreático de rato
SEQ ID NO: 109 Quarto ácido nucléico derivado de proteína RT6.2 de superfície de células T de rato
SEQ ID NO: 110 Quarto ácido nucléico derivado de proteína PHR1 de reparo de DNA de levedura
SEQ ID NO: 111 Quarto ácido nucléico derivado de proteína-1 de superfície ancorada em glicofosfolipídio de levedura
SEQ ID NO: 112 Quarto ácido nucléico derivado de proteína precursora de amilóide suína
SEQ ID NO: 113 Quarto ácido nucléico derivado de dipeptidase suína
SEQ ID NO: 114 Quarto ácido nucléico derivado de Proteína IL
Tat 1.1 de superfície variante de Trypanosoma brucei
SEQ ID NO: 115 Quarto ácido nucléico derivado de proteína MIT 117a de superfície variante de Trypanosoma brucei
SEQ ID NO: 116 Quarto ácido nucléico derivado de proteína MIT
118a de superfície variante de Trypanosoma brucei
SEQ ID NO: 117 Quarto ácido nucléico derivado de proteína MIT
221 de superfície variante de Trypanosoma brucei
SEQ ID NO: 118 Quarto ácido nucléico derivado de proteína MlTat 1.1000 BC de superfície variante de Trypanosoma brucei
SEQ ID NO: 119 Quarto ácido nucléico derivado de proteína MlTat 1.5b de superfície variante de Trypanosoma brucei
SEQ ID NO: 120 Quarto ácido nucléico derivado de proteína repetitiva ácida procíclica de Trypanosoma brucei
SEQ ID NO: 121 Quarto ácido nucléico derivado de proteína TxTat 1 de superfície variante de Trypanosoma brucei
SEQ ID NO: 122 Quarto ácido nucléico derivado de proteína YNat 1.1 de superfície variante de Trypanosoma congolense
SEQ ID NO: 123 Quarto ácido nucléico derivado de melanotransferrina de galinha
SEQ ID NO: 124 Quarto ácido nucléico derivado de molécula de adesão de células neurais de galinha
SEQ ID NO: 125 Quarto ácido nucléico derivado de AChE de Torpedo marmorata
SEQ ID NO: 126 Quarto ácido nucléico derivado de proteína de prion de hamster
SEQ ID NO: 127 Quarto ácido nucléico derivado de 5'nucleotidase bovina
SEQ ID NO: 128 Quarto ácido nucléico derivado de proteína Gp64 de membrana de bolor
SEQ ID NO: 129 Quarto ácido nucléico derivado de antígeno específico de pré-esporo de bolor
SEQ ID NO: 130 Gene de cadeia constante gama 1 de imunoglobulina humana (IGHG1) incluindo os éxons de CH1 a CH3 com todos os introns intervenientes e a região não traduzida 3' adjacente.
SEQ ID NO: 131 Seqüência de aminoácidos da região constante de cadeia γ codificada pelo plasm ídio plgG-A.
SEQ ID NO: 132 Primer oligonucleotídico TM-fw1
SEQ ID NO: 133 Primer oligonucleotídico TM-rv1
SEQ ID NO: 134 Primer oligonucleotídico Ml-rv
SEQ ID NO: 135 Primer oligonucleotídico M2-fw
SEQ ID NO: 136 Primer oligonucleotídico TM-fw2
SEQ ID NO: 137 Primer oligonucleotídico TM-rv2
SEQ ID NO: 138 Primer oligonucleotídico mutSphl-1
SEQ ID NO: 139 Primer oligonucleotídico mut Sphl-2
SEQ ID NO: 140 Gene de cadeia constante gama 1 de imunoglobulina humana (IGHG1) incluindo os éxons de CH1 a M2 com todos os introns intervenientes, o sítio de poliadenilação para a forma secretada de
IgG 1 no intron 6 e a 3'UTR contendo o sítio de poliadenilação para a forma ligada a membrana de IgG 1.
SEQ ID NO: 141 Seqüências de aminoácidos da isoforma curta (slgG) codificada pelo plasmídio pmlgG-A.
SEQ ID NO: 142 Seqüências de aminoácidos da isoforma longa (mlgG) da região constante de cadeia γ codificada pelo plasmídio pmlgG-A.
SEQ ID NO: 143 Gene de IGHG1 humana incluindo os éxons de CH1 a CH3 com todos os introns intervenientes, e a parte 5' adjacente do íntron 6 incluindo o sítio de poliadenilação para a forma secretada da imunoglobulina.
SEQ ID NO: 144 Seqüências de aminoácidos da isoforma curta (slgG) da região constante de cadeia γ codificada pelo plasmídio pmlgGA-A.
SEQ ID NO: 145 Seqüências de aminoácidos da isoforma longa (mlgG) da região constante de cadeia γ codificada pelo plasmídio pmlgGAA.
SEQ ID NO: 146 Seqüência codificada removida do plasmídio pmlgGA-B
SEQ ID NO: 147 Seqüência codificada inserida para a geração do plasmídio plgG-GPI-B (seqüência de aminoácidos do peptídio de sinal carbóxi terminal da fosfatase alcalina placentária humana (acesso NCBI: M13077; nucleotídeos: 1542 - 1643))
SEQ ID NO: 148 Seqüência de DNA da região constante do cassete de expressão de cadeia gama, de CH1 a 3'UTR do plasmídio de expressão plgG-GPI-B
SEQ ID NO: 149 Seqüência de aminoácidos da isoforma slgG da região constante de cadeia gama codificada pelo plasmídio plgG-GPI-B
SEQ ID NO: 150 Seqüência de aminoácidos da isoforma longa da região constante de cadeia gama incluindo peptídio de sinal carbóxi terminal da fosfatase alcalina placentária humana codificada pelo plasmídio plgG-GPI-B
SEQ ID NO: 151 Segundo ácido nucléico derivado de receptor 1 de fator de crescimento de fibroblastos humano
SEQ ID NO: 152 Segundo ácido nucléico derivado de receptor do fator de crescimento epitelial murfdeo
SEQ ID NO: 153 Segundo ácido nucléico derivado de receptor 1 de complemento humano (C3b/C4b)
SEQ ID NO: 154 Segundo ácido nucléico derivado de receptor de interleucina 4 murideo
SEQ ID NO: 155 Segundo ácido nucléico derivado de cadeia pesada a de imunoglobulina humana
SEQ ID NO: 156 Segundo ácido nucléico derivado de cadeia pesada ε de imunoglobulina humana (1)
SEQ ID NO: 157 Segundo ácido nucléico derivado de cadeia pesada γ3 de imunoglobulina humana
SEQ ID NO: 158 Segundo ácido nucléico derivado de cadeia pesada de lg murídea do tipo ε
SEQ ID NO: 159 Segundo ácido nucléico derivado de cadeia pesada de lg murídea do tipo γ2Α
SEQ ID NO: 160 Terceiro ácido nucléico derivado de receptor 1 de fator de crescimento de fibroblastos humano
SEQ ID NO: 161 Terceiro ácido nucléico derivado de receptor do fator de crescimento epitelial murídeo
SEQ ID NO: 162 Terceiro ácido nucléico derivado de receptor 1 de complemento humano (C3b/C4b)
SEQ ID NO: 163 Terceiro ácido nucléico derivado de receptor de interleucina 4 murídeo
SEQ ID NO: 164 Terceiro ácido nucléico derivado de cadeia pesada ade imunoglobulina humana
SEQ ID NO: 165 Terceiro ácido nucléico derivado de cadeia pesada ε de imunoglobulina humana
SEQ ID NO: 166 Terceiro ácido nucléico derivado de cadeia pesada γ3 de imunoglobulina humana
SEQ ID NO: 167 Terceiro ácido nucléico derivado de cadeia pesada de lg murídea do tipo ε
SEQ ID NO: 168 Terceiro ácido nucléico derivado de cadeia pesada de Ig murídea do tipo γ2Α
SEQ ID NO: 169 Segundo ácido nucléico derivado de receptor de interleucina 4 humano
SEQ ID NO: 170 Segundo ácido nucléico derivado de cadeia pesada ε de imunoglobulina humana (2)
SEQ ID NO: 171 Segundo ácido nucléico derivado de cadeia pesada γ4 de imunoglobulina humana
SEQ ID NO: 172 Segundo ácido nucléico derivado de cadeia pesada δ de imunoglobulina murídea
SEQ ID NO: 173 Segundo ácido nucléico derivado de cadeia pesada ε de imunoglobulina humana (2)
SEQ ID NO: 174 Terceiro ácido nucléico derivado de receptor de interleucina 4 humano
SEQ ID NO: 175 Terceiro ácido nucléico derivado de cadeia pesada γ4 de imunoglobulina humana
SEQ ID NO: 176 Terceiro ácido nucléico derivado de cadeia pesada de Ig murídea do tipo δ
Exemplos
Exemplo 1
Clonagem de fragmentos genômicos e construção de vetores de expressão eucariótica de SlgG/mlgG
a) Construção do vetor de expressão de slgG 'plgG-A'
Para a expressão de uma imunoglobulina com especificidade contra uma proteína A, construiu-se o vetor 'plgG-A'. Ele codificada a a forma secretada slgG da imunoglobulina e compreende os seguintes elementos (veja Figura 1C):
1. Uma unidade de transcrição para uma cadeia pesada gama (γ) 1 humana, composta por:
- o intensificador precoce imediato e o promotor do citomegalovírus humano (hCMV),
- uma região não traduzida 5' sintética incluindo uma seqüência de consenso Kozak (Kozak, M., Nucleic Acids Res. 15 (1987) 8125-48),
- uma seqüência de sinal de cadeia pesada de imunoglobulinuma murídea incluindo o intron de seqüência de sinal,
- um cDNA de cadeia pesada variável de um anticorpo com especificidade contra uma proteína A,
- um íntron 2 híbrido de cadeia pesada de camundongo/humana incluindo o intensificador μ de Ig de camundongo (região de comutação Jh3Jh4) unido ao gene de cadeia constante gama 1 de imunoglobulina humana (IGHG1) incluindo os éxons de CH1 a CH3 com todos os introns intervenientes e a região não traduzida 3' adjacente contendo o sítio de poliadenilação para a cadeia pesada da forma secretada de IgGL
A seqüência de nucleotídeos da região constante de cadeia pesada é relatada na SEQ ID NO: 130. A seqüência de aminoácidos da região constante de cadeia γ codificada pelo plasmídio plgG-A é relatada na SEQ ID NO: 131.
2. Uma unidade de transcrição para uma cadeia leve kapa (K) humana, composta por:
- o intensificador precoce imediato e promotor do citomegalovírus humano (hCMV),
- uma região não traduzida 5' sintética incluindo uma seqüência de consenso Kozak,
- uma seqüência de sinal de cadeia pesada de imunoglobulinuma murídea incluindo o íntron de seqüência de sinal,
- um cDNA de cadeia K variável de um anticorpo com especificidade contra uma proteína A
- o intensificador de íntron 2 Ig K de camundongo unido ao gene de regiãoc onstante kapa de imunoglobulina humana (IGKC), e
- a região não traduzida 3' do gene de IGKC humana contendo o sítio de poliadenilação.
3. Uma unidade de transcrição de neomicina fosfotransferase como um marcador selecionável para células de mamíferos.
4. Uma origem de replicação do vetor pUC18 para a replicação do plasmídio em E. coli.
5. Um gene de becta-lactamase que confere resistência a ampicilina em E. coli.
b) Construção do vetor de expressão de slgG/mlgG 'pmlgG-A'
Um fragmento genômico de 5,2 kb do locus gama 1 de região constante pesada de imunoglobulina humana (IGHG1) compreendendo a parte principal do íntron a jusante do éxon CH3 (intron 6), o éxon Ml, o intron a jusante do éxon Ml (intron 7), o éxon M2 e a região não traduzida 3' adjacente (3'UTR), incluindo o sinal de poliadenilação para a forma ligada a 10 membrana da cadeia gama 1 foi amplificado a partir de DNA genômico humano (Roche Diagnostics GmbH, Mannheim, Alemanha) por PCR usando ο Sistema de PCR de Molde Longo Expandido (Roche Diagnostics GmbH, Alemanha) e o primer oligonucleotídico especificado na Tabela 4.
Tabela 4: Primer oligonucleotídico para clonagem e mutagênese.
Uso para |
Nome |
Seqüência (na direção 5' para 3') |
SEQ ID
NO: |
Amplificaçã o do fragmento de IGHG1 genômico de 5,2 kb |
TM-fw1 |
GGCCGAGTCTGAGGCCTGAGTGGCAT GAGGGAGGCAGAGT |
132 |
TM-rv1 |
AACTGGATCCATGTAGAAAAGAGGAGAAGCCCCGGGGGTCCATGTAGT |
133 |
Amplificaçã o do fragmento de IGHG3 genômico de 1,1 kb |
TM-fw1 |
GGCCGAGTCTGAGGCCTGAGTGGCAT GAGGGAGGCAGAGT |
132 |
M1-rv |
GATCCACTTCACCTTGAAGAAGGTGACGGTGGCACTGTAGCACACGC |
134 |
Amplificaçã o do fragmento de IGHG4 genômico de 1,6 kb |
M2-fw |
CACCTTCTTCAAGGTGAAGTGGATCTT CTCCTCGGTGGTGGACCTGAAG |
135 |
TM-rv1 |
AACTGGATCCATGTAGAAAAGAGGAGAAGCCCCGGGGGTCCATGTAGT |
133 |
Amplificaçã |
TM-fw2 |
CTCCAGCAG-
CAGCTGCCCTGGGCTGGGCCACGA |
136 |
o do fragmento de IGHG3IGHG4 genômico |
TM-rv2 |
CAGGGATCCCCCGAGGTGCAGCTGGA CCAGCCTCCTCCTGACCGTGI I I I |
137 |
Mutação do sítio Sph I na 3'UTR |
mutSphl1 |
CTACCCCAGACCTCCGCTGCTTGGTG CcTGCAGGGCACTGGGGGCCAGGTGT CCCCTCAGCAGGACGT* |
138 |
mutSphl-
2 |
CCTGCTGAGGGGACACCTGGCCCCCA GTGCCCTGCAgGCACCAAGCAGCGGAGGTCTGGGGT* |
139 |
* Os nucleotídeos alterados para a mutagênese do sítio Sph I estão indicados por letras minúsculas.
O fragmento amplificado corresponde aos nucleotídeos
87203513 - 87208691 do contig genômico de cromossomo 14 de Homo sapiens (acesso NCBI: NT_026437, complemento reverso). O seqüenciamento do produto de PCR subclonado revelou uma identidade de 98 porcento em comparação com a seqüência de cromossomo 14 correspondente, com todas as diferenças encontradas em introns ou na região não traduzida 3' (3'UTR). O sítio de restrição Sph I de 219 pb a jusante do códon de parada do éxon M2 foi destruído por mutagênese direcionada a sítio com base em PCR usando os primers oligonucleotídicos especificados na Tabela 2. O fragmento foi, então, unido à parte de flanco 5' do íntron 6 por clonagem mediante um sítio de restrição Sph I no vetor de expressão de cadeia gama 1 de imunoglobulina plgG-A, levando, assim, a uma unidade de transcrição de cadeia gama 1 genomicamente organizada. Por subclonagem, construiuse o vetor de expressão eucariótica 'pmlgG-A', que codifica a forma secretada (slgG) e a forma ligada a membrana (mlgG) de um anticorpo com especificidade contra uma proteína A. O plasmídio contém os seguintes elementos (veja também a Figura IA):
1. A unidade de transcrição acima mencionada para uma cadeia pesada gama 1 humana, composta por:
- o intensificador precoce imediato e promotor do citomegalovírus humano (hCMV),
- uma região não traduzida 5' sintética incluindo uma seqüência de consenso Kozak,
- uma seqüência de sinal de cadeia pesada de imunoglobulinuma murídea incluindo o íntron de seqüência de sinal,
- um cDNA de cadeia pesada variável de um anticorpo com especificidade contra uma proteína A,
- um íntron 2 híbrido de cadeia pesada de camundongo/humana incluindo o intensificador mu (μ) de lg de camundongo da região de comutação Jh3-Jh4 (Banerji, J., et al., Cell 33 (1983) 729-740; Gillies, S.D., et al., Cell, 33 (1983) 717-728) unido ao gene de cadeia constante gama 1 de imunoglobulina humana (IGHG1) incluindo os éxons de CH1 a M2 com todos os introns intervenientes, o sítio de poliadenilação para a forma secretada de IgG 1 no íntron 6, e a 3'UTR contendo o sítio de poliadenilação para a forma ligada a membrana de IgGI.
A organização genômica da região constante de cadeia pesada é representada na Figura 2A, a seqüência de nucleotídeos é relatada na SEQ ID NO: 140. As seqüências de aminoácidos da isoforma curta (slgG) ou da isoforma longa (mlgG) da região constante de cadeia γ codificada pelo plasmídio pmlgG-A são relatadas na SEQ ID NO: 141 ou SEQ ID NO: 142, respectivamente.
2. Uma unidade de transcrição para uma cadeia leve kapa (K) humana, composta por:
- o intensificador precoce imediato e promotor do citomegalovírus humano (hCMV),
- uma região não traduzida 5' sintética incluindo uma seqüência de consenso Kozak,
- uma seqüência de sinal de cadeia pesada de imunoglobulinuma murídea incluindo o íntron de seqüência de sinal,
- um cDNA de cadeia K variável de um anticorpo com especificidade contra uma proteína A,
- o intensificador de íntron 2 lg K de camundongo (Emorine, L., et al., Nature 304 (1983) 447- 449; Picard, D., e Schaffner, W., Nature (1984)
307, 80-82) unido ao gene de região constante K de imunoglobulina humana (IGKC), e
- a 3'UTR do gene de IGKC humana contendo o sítio de poliadenilação.
3. Uma unidade de transcrição de neomicina fosfotransferase como um marcador selecionável para células de mamíferos.
4. Uma origem de replicação do vetor pUC18 para a replicação do plasmídio em E. coli.
5. Um gene de beta(P)-lactamase que confere resistência a ampicilina em E. coli.
c) Construção dos vetores de expressão de slgG/mlgG 'pmlgGAA‘ e 'pmlgGA-B'
De maneira similar à descrita no exemplo Ib), um fragmento genômico de 1,1 kb do locus de região gama 3 constante pesada de imunoglobulina humana (IGHG3) compreendendo a parte principal do íntron a jusante do éxon CH3 (íntron 6), e o éxon Ml foi amplificado por PCR (para os oligonucleotídeos, veja a Tabela 2). O fragmento corresponde aos nucleotídeos 87235195 - 87236300 do contig genômico de cromossomo 14 de Homo sapines (acesso NCBI: NT_026437, complemento reverso), com uma identidade de seqüência de 98 por cento. Todas as diferenças são encontradas dentro do íntron, exceto por uma única troca de nucleotídeo dentro do éxon M1 que é silenciosa e, portanto, não altera a seqüência de aminoácidos codificada. Da mesma forma, um fragmento genômico de 1,6 kb do locus da região gama 4 constante pesada de imunoglobulina humana (IGHG4) compreendendo o éxon M2 e a região não traduzida 3' adjacente, incluindo o sinal de poliadenilação para a forma ligada a membrana da cadeia gama 4 foi amplificado por PCR (para os oligonucleotídeos, veja a Tabela 2). O fragmento corresponde aos nucleotídeos 87087786 - 87089377 do contig genômico de cromossomo 14 de Homo sapines (acesso NCBI: NT_026437, complemento reverso), com uma identidade de seqüência de 98 por cento e todas as diferenças encontradas na 3'UTR. O sítio Sph I de 212 pb a jusante do códon de parada do éxon M2 foi destruído por mutagênese direcionada a sítio à base de PCR. Ambos os fragmentos foram unidos entre M1 e M2, amplificados por PCR (para os oligonucleotídeos, veja a Tabela 2) e, então, clonados no vetor de expressão de cadeia gama 1 por um sítio Sph I no íntron 6, levando, dessa forma, a um cassete de expressão de cadeia gama 1 - gama 3 - gama 4 híbrido, com uma organização genômica desprovida do íntron entre M1 e M2 (íntron 7). Por subclonagem, construiu-se o vetor de expressão eucariótica pmlgGA-A, que codifica a forma slgG secretada e a mlgG ligada a membrana de um anticorpo com especificidade contra uma proteína A. O plasmídio contém os seguintes elementos (veja também a Figura IB):
1. A unidade de transcrição acima mencionada para uma cadeia pesada gama 1 - gama 3 - gama 4 híbrida, composta por:
- o intensificador precoce imediato e promotor do citomegalovírus humano (hCMV),
- uma região não traduzida 5' sintética incluindo uma seqüência de consenso Kozak,
- uma seqüência de sinal de cadeia pesada de imunoglobulinuma murídea incluindo o íntron de seqüência de sinal,
- um cDNA de cadeia pesada variável de um anticorpo com especificidade contra uma proteína A,
- um íntron 2 híbrido de cadeia pesada de camundongo/humana incluindo o intensificador μ de Ig de camundongo (região de comutação Jh3Jh4) unido ao gene de IGHG1 humana, incluindo os éxons de CH1 a CH3 com todos os introns intervenientes, e a parte 5' adjacente do íntron 6, incluindo o sítio de poliadenilação para a forma secretada da imunoglobulina,
- a parte 3' do íntron 6 e o éxon Ml do gene de IGHG3 humana, e
- o éxon M2 e a região não traduzida 3' contendo o sítio de poliadenilação para a forma ligada a membrana da imunoglobulina do gene de IGHG4 humana.
A organização genômica da região constante de cadeia pesada é representada na Figura 2B, a seqüência de nucleotídeos é relatada na SEQ ID NO: 143. As seqüências de aminoácidos da isoforma curta (slgG) ou da isoforma longa (mlgG) da região constante de cadeia γ codificada pelo plasmídio pmlgGA-A são relatadas na SEQ ID NO: 144 ou SEQ ID NO: 145, respectivamente.
2. Uma unidade de transcrição para uma cadeia leve kapa humana, composta por:
- o intensificador precoce imediato e promotor do citomegalovírus humano (hCMV),
- uma 5'UTR sintética incluindo uma seqüência de consenso Kozak,
- uma seqüência de sinal de cadeia pesada de imunoglobulinuma murídea incluindo o íntron de seqüência de sinal,
- um cDNA de cadeia K variável de um anticorpo com especificidade contra uma proteína A,
- o intensificador de íntron 2 lg K de camundongo unido ao gene de região constante K de imunoglobulina humana (IGKC), e
- a região não traduzida 3' do gene de IGKC humana contendo o sítio de poliadenilação.
3. Uma unidade de transcrição de neomicina fosfotransferase como um marcador selecionável para células de mamíferos.
4. Uma origem de replicação do vetor pUC18 para a replicação do plasmídio em E. coli.
5. Um gene de becta-lactamase que confere resistência a ampicilina em E. coli.
Por troca das seqüências de cDNA que codificam as regiões variáveis da cadeia gama e kapa, construiu-se o vetor de expressão de slgG/mlgG 'pmlgGA-B1. Tem a mesma organização descrita para o pmlgGAA acima, mas codifica, ao invés, uma imunoglobulina com especificidade contra uma proteína B.
Exemplo 2
Transfecção e análise de células Sp2/0-Agl4
a) Cultivo e eletroporação de células Sp2/0-Agl4
Células de hibridoma Sp2/0-Agl4 (ATCC N9 CRL-1581, Shulman,
M., et al., Nature 276 (1978) 269-270) são cultivadas em meio RPMI (Invitrogen Corp., US) suplementado com 10% de soro de novilho fetal de IgG ultrabaixo (FCS) (Invitrogen Corp., US) e 2 mM de glutamina (Invitrogen Corp., US) a 37SC, 5% de CO2 e 95% de umidade. Para a transfecção, as células são eletroporadas com 10 pg de DNA plasm ídico por 106 células em 20 mM de tampão HEPES (ácido N-(2-hidroxietil)-piperazina-N'-2-etanossulfônico), pH 7,0, contendo 137 mM de NaCI, 5 mM de KCI, 0,7 mM de Na2HPO4 e 6 mM de glicose, a 4QC. A eletroporação é realizada a 220 V e 960 pF com urn dispositivo de eletroporação Genepulser (Bio-Rad Laboratories Inc., US). Depois da transfecção, as células são distribuídas em placas de 96 poços com 5.000 células em 100 pL de meio por poço. Para a seleção das células transfectadas, 500 pg/mL de G418 (Roche Diagnostics GmbH, Alemanha) são adicionados ao meio um dia antes da eletroporação. O meio é trocado cada dois a três dias, para manter a pressão de seleção. Cerca de duas semanas após a transfecção, clones de transfectoma são isolados das placas de 96 poços e adicionalmente propagados em recipientes de cultura apropriados. Para armazenamento, cerca de 106 células de um clone são congeladas em sulfóxido de dimetila a 10% (Sigma-Aldrich Co., Alemanha) em FCS de baixo IgG (Invitrogen Corp., US) e armazenadas em nitrogênio líquido.
As transfecções de cada uma das 106 células com os plasmídios pmlgG-A, pmlgGA-A e plgG-A levou a 15, 19 e 12 clones independentes, respectivamente. Para cada transfecção, 6 clones foram aleatoriamente selecionados para análise adicional.
b) Quantificação de IgG e análise por citometria de fluxo
105 células de cada clone do Exemplo 2a) foram semeadas em 2 mL de meio contendo G418 (conforme acima descrito) em placas de 6 poços e cultivadas durante 48 horas. Depois disso, os sobrenadantes foram coletados, e a quantidade de IgG secretada foi quantificada por imunoensaio de Fluorescência Resolvida no Tempo Homogênea (HTRF) usando o kit de detecção de Fc humana (CIS bio international), de acordo com o protocolo do fabricante. Para analisar os anticorpos ligados a membrana plasmática por citometria de fluxo, 105 células de cada clone foram lavadas duas vezes com PBS (salina tamponada com fosfato) a 4eC, então, ressuspensidas em 50 pL de fragmento F(ab')2 de IgG anti-humana de camundongo conjugado a FITO (Dianova, Alemanha), diluídas a 1:50 em PBS contendo 1% de BSA (Roche Diagnostics GmbH, Alemanha) e incubadas durante uma hora a 4eC 5 no escuro.
Depois de lavar duas vezes com PBS, as células foram ressuspendidas em PBS e analisadas com um citômetro de fluxo BD FACSCalibur (BD Biosciences, US). Como uma medida da quantidade de IgG ligada à superfície celular, determinou-se a intensidade de fluorescência mediana 10 para cada clone.
Na Figura 3, a intensidade de fluorescência mediana na citometria de fluxo é apresentada juntamente com a concentração de IgG no sobrenadante de cultura celular para cada clone. Observou-se que, para clones transfectados com pmlgG-A ou pmlgGA-A (isto é, plasmídios que codifi15 cam tanto a forma slgG, quanto a mlgG), uma quantidade aumentada de IgG secretada corresponde a um sinal de superfície celular elevado. Essa correlação não foi observada para clones transfectados com plgG-A (isto é, o plasmídio que codifica apenas slgG, a forma secretada do anticorpo). Exemplo 3
Classificação de células transfectadas de maneira estável por citometria de fluxo
Para a geração de clones que expressam de maneira estável IgG, 3 x 106 células Sp2/0-Agl4 foram transfectadas com o plasmídio pmlgGA-B por eletroporação, conforme acima descrito. Um dia depois da 25 transfecção, as células foram transferidas para 500 pg/mL de memio de seleção G418 e cultivadas reunidas durante cerca de duas semanas. Após a seleção, a IgG ligada à superfície das células transfectadas foi marcada, e as células com os sinais mais intensos foram classificadas por citometria de fluxo. Depois disso, 4 x 106 células do material reunido foram lavadas duas 30 vezes com meio a 49C, então, incubadas com fragmento F(ab')2 de IgG antihumana de camundongo conjugado a fluoresceína (FITO) (Dianova, Alemanha), diluído a 1:50 no meio, durante 20 minutos em gelo. Após duas etapas de lavagem com meio, as células foram ressuspendidas no meio e transferidas para um citômetro de fluxo BD FACSVantage (BD Biosciences, US). Estabeleceu-se uma porte englobando as células com os 5 - 6% superiores de intensidade de fluorescência da população de amostra (Figura 4), e célu5 Ias classificadas por essa porta foram coletadas. As células coletadas foram expandidas por cultivo em meio de seleção durante vários dias. Coom essas células, um segundo e, consecutivamente, um terceiro ciclo de classificação foram realizados, conforme acima descrito. Em vez de coletar as células classificadas de forma reunida, uma quarta etapa de classificação final foi 10 usada para deposições de células únicas em placas de 96 poços. A deposição levou a 141 clones independentes, dos quais 21 foram selecionados para análise de expressão de IgG por imunoensaio HTRF, conforme descrito no exemplo 2 b). Dois clones desses, 5B11 e 9B3, que mostraram as taxas de secreção de IgG mais elevadas e, correspondentemente, os sinais de 15 superfície celular mais fortes, foram adaptados para crescimento livre de soro em cultura rotativa para avaliação adicional de sua produtividade.
Exemplo 4
Determinação da produtividade específica de clones
Para a determinação de sua produtividade específica, os clones 20 5B11 e 9B3 foram cultivados sob condições definidas em meio ProCHO 6k (Cambrex Corp., US), suplementado com 1 x concentrado de Colesterol/Lipídio (Invitrogen Corp., US), 4 mM de Glutamina (Invitrogen Corp., US) e 250 pg/mL de G418 (Roche Diagnostics GmbH, Alemanha), em balões rotativos de 100 mL (Belco, US.). As células foram cultivadas a 37eC, 5% de 25 CO2 e 95% de umidade até atingirem uma fase de crescimento estacionário.
Em vários momentos durante a fase de crescimento exponencial, a contagem de células de cada clone foi determinada com um contador de células CASY (Schârfe Systems, Alemanha), e a concentração de IgG nos sobrenadantes foi determinada por cromatografia de afinidade por proteína A (veja 30 abaixo). Como referência, o clone J5-H3 foi cultivado e analisados sob condições iguais. Esses clone também era derivado de transfecção de células Sp2/0-Agl4 e expressa de maneira estável o anticorpo idêntico ao dos clones
5B11 e 9B3, embora apenas a forma secretada. O clone J5-H3 foi gerado de maneira convencional por várias etapas de diluição limitativa e subclonagem e foi selecionado de mais de 1.000 clones para atender às exigências de produtividade para um processo de fabricação industrial.
As concentrações de IgG nos sobrenadantes de cultura celular foram determinadas por cromatografia de afinidade analítica usando-se uma unidade de cromatografia Akta™explorer (GE Healthcare, anteriormente Amersham Biosciences, Suécia). Um volume definido de um sobrenadante de cultura celular foi aplicado a uma coluna de proteína A Sepharose para facilitar a ligação da IgG à matriz de afinidade. A coluna foi lavada com 100 mM de ácido cítrico a pH 5,0 e, então, os anticorpos ligados foram eluídos com 100 mM de ácido cítrico a pH 3,0. A eluição foi monitorizada por registro contínuo da absorção UV do eluído a 280 nm. A concentração de anticorpo de uma amostra foi calculada a partir da absorção de UV integrada, após calibração do sistema com amostras padronizadas contendo concentrações definidas de anticorpo.
Para cada clone, as taxas de produção específicas (SPRs) foram calculadas a partir das contagens de células e das concentrações de IgG nos sobrenadantes de cultura celular pela seguinte equação:
SPR = Ac(lgG)/c(células).Át. [pg/célula.dia] em que:
- Ác(lgG) é a diferença da concentração de IgG no sobrenadante entre o início e o fim do intervalo de tempo em [pg/mL],
- c(células) é a média aritmética da contagem de células do início e do fim do intervalo de tempo em [células/mL], e
- At é a extensão do intervalo de tempo em [dias].
Uma SPR média foi determinada para cada clone com base em quatro SPRs distintas calculadas em vários momentos durante a fase de crescimento exponencial (Figura 5 e Tabela 5).
Tabela 5: Determinação de taxas de produção específicas (SPR)
Clone |
forma de IgG expressada |
intervalo de tempo [h] |
SPR [pg.célula-
1 .d-1] |
SPR média ± DP
[pg.célula-1.d-1] |
Clone |
forma de IgG expressada |
intervalo de tempo [h] |
SPR [pg.célula1.d-1] |
SPR média ± DP [pg.célula-1 .d-1 ] |
5B11 |
slgG, mlgG |
0 - 26.2 |
16.9 |
18.3 ±3.4 |
26.2 - 45.3 |
22.3 |
45.3 - 52.7 |
14.3 |
52.7 - 68.5 |
19.6 |
9B3 |
slgG, mlgG |
0 - 25.7 |
19.9 |
16.3 ±5.3 |
25.7 - 45 |
19.3 |
45 - 52.4 |
8.5 |
52.4 -68.3 |
17.4 |
J5-
H3 |
slgG |
0-26 |
16.7 |
18.4 ±3.7 |
26 - 45.2 |
17.3 |
45.2-52.6 |
15.6 |
52.6-68.4 |
23.8 |
Ambos os clones classificados por mlgG ligada a membrana, 5B11 e 9B3, exibiram SPRs médias entre 15 e 20 pg.célula'1.d'1, que está em uma faixa que é adequada para fabricação de clones em escala industrial. As SPRs desses clones são comparáveis a uma SPR que pode ser con5 seguida com um clone obtido por uma estratégia trabalhosa convencional na mesma linhagem cleular e que expressa o mesmo anticorpo (clone J5-H3). Exemplo 5
Detecção de slgG e mlgG por microscopia de imunofluorescência
Anticorpos intracelulares e ligados à superfície celular foram de10 tectados por microscopia de imunofluorescência. Para a coloração intracelular, células fixadas a lâminas de microscópio revestidas com poli-L-lisina foram fixadas com 2% (v/v) de formaldeído em PBS durante 10 minutos, permeabilizadas com 0,2% (v/v) de Triton X-100 em PBS durante 10 minutos e lavadas duas vezes com PBS. Os sítios de ligação inespecífica foram blo15 queados com 3% (p/v) de BSA (albumina sérica bovina) em PBS durante 30 min. As células foram lavadas duas vezes com tampão de lavagem (WB: 0,2% (p/v) de BSA, 0,1% (v/v) de Tween 20 em PBS), então, incubadas com fragmento F(ab')2 de IgG de anti-humana cabra conjugado a R-Ficoeritrina (Dianova, Alemanha), diluídas a 1:50 em WB, durante uma hora. Depois de lavar quatro vezes com WB e duas vezes com H2O duplamente desionizada, as células foram montadas sob uma lamínula e armazenadas a 49C no escuro até a microscopia. Para a coloração dos anticorpos ligados a superfície celular, 105 células foram lavadas com 1% (p/v) de BSA fria em PBS, então, 5 os sítios de ligação inespecífica foram bloqueados com 1% de BSA em PBS no gelo durante 30 minutos. Para a marcação de IgG, as células foram incubadas com fragmento F(ab')2 de IgG de anti-humana cabra conjugado a RFicoeritrina (Dianova, Alemanha), diluídas a 1:50 em 1% (p/v) de BSA em PBS, durante uma hora em gelo. Depois de lavar três vezes com PBS frio, 10 as células foram fixadas a lâminas de microscopia revestidas com poli-Llisina e fixadas com 2% (v/v) de formaldeído em PBS durante 10 minutos à temperatura ambiente. Depois de lavar duas vezes com PBS, as células foram montadas sob uma lamínula e armazenadas a 4QC no escuro até a microscopia. As células intracelulares e marcadas na superfície foram analisa15 das em um microscópio de fluorescência Axiophot usando-se uma objetiva
Plan-APO CHROMAT 40x/1.0 (Carl Zeiss, Alemanha).
No clone 5B11, os anticorpos podem ser detectados na superfície celular (Figura 6, imagem 1), que é principalmente a forma mlgG, assim como no espaço intracelular (imagem 4), que são ambas formas de IgG nas 20 vias de expressão/secreção. Em contraste, no clone J5-H3 apenas anticorpos intracelulares podem ser detectados (Figura 6, imagens 2 e 5), pois esses clones não expressam mlgG. Nenhuma coloração, com ambos os métodos, é observada na linhagem celular não transfectada Sp2/0-Agl4 (Figura 6, images 3 e 6), pois essas células não expressam nenhuma IgG.
Exemplo 6
Detecção de isoformas de mRNA de cadeia γ por Northern blotting
Para definir a razão entre as duas isoformas de cadeia pesada que surgem por splicing alternativo/poliadenilação do transcrito primário, RNA de clones transfectados de maneira estável foi analisado por Northern 30 blot. Conseqüentemente, o RNA total foi isolado das células usando-se a tecnologia RNeasy (Qiagen, Alemanha). Em cada caso, 10 pg de RNA total foram, então, fracionados por eletroforese em gel de agarose desnaturante e transferidos para uma membrana de náilon usando o Sistema NorthernMax (Ambion Inc., US). Para a hibridização da membrana de transferência, duas sondas de DNA diferentes foram marcadas com [alfa-32P] pelo método de marcação aleatória usando-se o kit DECAprime II (Ambion Inc. US). Conforme representado na Figura 7B, a sonda Ά' é complementar ao mRNA de cadeia pesada entre os éxons CH1 e CH3 e, portanto, se hibridiza a ambas as isoformas. Em contraste, a sonda 'B' se liga apenas a uma 3‘UTR do mRNA de cadeia pesada de mlgG longa. Após hibridização e lavagem rigorosa da membrana, a transferência foi analisada por auto-radiografia.
A Figura 7A representa uma auto-radiografia de uma Northern blot com RNA total do clone 5B11, clone J5-H3 e linhagem celular Sp2/0Agl4. A hibridização com a sonda Ά' mostra um sinal de 1,8 kb predominante em ambos os clones que expressam anticorpo (pistas 1 e 2), o que corresponde aos tamanhos esperados da isoforma de mRNA curta que codifica a cadeia pesada da slgG. Na exposição longa representada, também são detectados alguns sinais fracos entre 2 e 4 kb. A banda de 3,3 kb, que só é vista no clone 5B11 (pista 1), representa a isoforma de mRNA longa, que codifica a cadeia pesada da mlgG, pois uma banda com o mesmo padrão de migração é detectada como um único sinal quando a transferência é hibridizada com a sonda 'B' (pista 4). A comparação das forças de sinais relativas das bandas de 1,8 kb e 3,3 kb na pista 1 sugere que o transcrito primário do transgene de cadeia pesada de anticorpo é processado predominantemente na isoforma de mRNA pequena, dando origem à forma slgG secretada do anticorpo. Apenas uma pequena quantidade (menos de 5%) é completamente spliced como isoforma de mRNA longa, levando, assim, à mlgG ligada a membrana plasmática.
Exemplo 7 Purificação e detecção de isoformas de cadeia pesada de IgG por extração com carbonato alcalino e imunotransferência
Para detectar a cadeia pesada de mlgG, proteínas de membrana foram extraídas de células transfectadas de maneira estável usando-se o método de extração com carbonato alcalino desenvolvido por Fujiki (Fujiki,
Y., et al., J. Cell Biol. 93 (1982) 97-102). Em cada caso, 107 células foram lavadas duas vezes com PBS, então, uma vez com NaCI a 0,1 M em gelo. Após ressuspensão em 1 mL Na2CO3 frio a 0,1 M, pH 11,5, as células foram rompidas por sonicação durante 20 segundos, incubadas em gelo durante 30 minutos e, então, centrifugadas durante 60 minutos com 200.000 x g a 4QC. Com essa etapa, as membranas celulares ainda contendo proteínas de membrana integradas são separadas do conteúdo solúvel. Os sobrenadantes foram coletados, e se adicionou Triton X-100 a uma concentração final de 1% (p/v), N-octil-beta-D-glucopiranosida a uma concentração final de 60 mM, TRIS-HCI pH 7,4 a uma concentração final de 50 mM e NaCI a uma concentração final de 300 mM (fração SN). Portanto, as pelotas de membrana foram resolvidas em 1,1 mL de Na2CO3 a 0,1 M, pH 11,5, 1% (p/v) de Triton X-100, 60 mM de N-octil-beta-D-glucopiranosida, 50 mM de TRIS-HCI pH 7,4 e 300 mM de NaCI. Os componentes insolúveis depois dessa etapa foram removidos por centrifugação durante 10 minutos a 15.000 x g, e os sobrenadantes foram coletados como fração de membrana. Ensaios de extração de proteína A foram realizados para purificar as isoformas de anticorpo das frações de membrana ou SN. Depois disso, cada fração foi incubada com 30 pL de volume de leito de Proteína A Sepharose (GE Healthcare, anteriormente Amersham Biosciences, Suécia) durante 60 minutos a 49C, então, lavada quatro vezes com PBS contendo 0,02% (v/v) de Igepal CA360. Proteínas ligadas à matriz de proteína A foram eluídas com o tampão de amostra de gel de proteína redutora a 709C e separadas por eletroforese em SDS gel de poliacrilamida (NuPAGE®-system, Invitrogen Corp., US). Depois da separação, as proteínas foram transferidas para uma membrana de PVDF (fluoreto de polivinilideno), de acordo com o método de imunotransferência semi-seco (Ausubel, F.A., et al. (eds.) Current Protocols in Molecular Biology, Vol. 2, John Wiley e Sons, Inc., New York (1995)). Cadeias pesadas de IgG imobilizadas na membrana foram marcadas com anticorpos IgG policlonais anti-humanos de coelho acoplados a peroxidase de raiz-forte (DakoCytomation, DAKO A/S, Denmark) e detectados por reação de quimioluminescência (LUMI-Light PLUS Western Blotting Kit, Roche Diagnostics
GmbH) em um LUMI-lmager F1 (Roche Diagnostics GmbH).
Um sinal forte de acordo com a cadeia pesada de slgG podia ser detectado na fração de membrana e SN de ambos os clones que expressam anticorpos (clones 5B11 e J5-H3, veja Figura 8, pistas 1, 2, 4 e 5). No caso 5 do clone 5B11, detecta-se uma proteína adicional que migra acima da cadeia pesada de slgG (Figura 8, pista 1).
Essa banda é predominantemente encontrada na fração de membrana desse clone, em que as proteínas de membrana integradas estão enriquecidas. Representa a maior isoforma de cadeia pesada de mlgG, que 10 tem um peso molecular calculado 8 kDa maior que o da cadeia pesada de slgG. Consistentemente, não há nenhum sinal correspondente no clone J5H3 (Figura 8, pista 2), pois esse clone expressa apenas a forma secretada do anticorpo.
Exemplo 8
Cultivo e transfecção de células CHO-K1.
Células CHO-K1 (ATCC No. CCL-61; Puck, T.T., et al., J. Exp. Med. 108 (1958), 945- 956), que tenham sido pré-adaptadas a crescimento livre de soro em cultura de suspensão, foram cultivadas em meio ProCHO4CDM (Cambrex Corp., US), suplementado com 8 mM de L-Alanil-L20 glutamina (Invitrogen Corp., US) e 1 x suplemento HT (Invitrogen Corp., US), a 37SC, 5% de CO2 e 95% de umidade em balões de suspensão. A cada 3 4 dias, as células são divididas com 2 x 105 células/mL em meio fresco. Para transfecção, as células são eletroporadas com 20 pg de DNA plasmídico por
7,5 x 106 células em um volume total de 200 pL de PBS à temperatura ambi25 ente. As eletroporações são realizadas com um dispositivo de eletroporação Gene Pulser XCell (Bio-Rad Laboratories, US) em uma cubeta com um vão de 2 mm, usando um protocolo de onda quadrada com um único pulso de 160 V durante 15 ms. Para a geração de clones que expressem IgG de maneira estável, 6 x 107 células foram eletroporadas com o plasmídio pmlgGA30 B conforme descrito. Depois disso, as células foram cultivadas reunidas no meio acima especificado durante cerca de duas semanas com 700 pg/mL de G418 (Roche Diagnostics GmbH, Alemanha) adicionado à cultura um dia após a transfecção para seleção de células transfectadas de maneira estável.
Exemplo 9
Classificação de células CHO-K1 transfectadas de maneira estável por citometria de fluxo
Após a seleção, a IgG ligada à superfície das células transfectadas foi marcada, e as células com os sinais mais intensos foram classificadas por citometria de fluxo. Conseqüentemente, 4 x 107 células do material reunido foram primeiro passadas através de uma malha de náilon de 40 μΜ para remover os agregados maiores e, então, incubadas com Accumax (PAA) durante 15 minutos a 37eC para separar agregados menores restantes. As células foram incubadas em 1 % (p/v) de BSA no meio (veja exemplo 8) durante 20 minutos em gelo, então, tingidas com 10 ng/mL de Proteína A Alexa Fluor 488 (Molecular Probes Inc., Invitrogen Corp., US), em urn volume total de 8 mL de meio com 1% (p/v) de BSA durante 30 minutos em gelo, no escuro. Após duas etapas de lavagem com 1% (p/v) de BSA no meio, as células foram ressuspendidas no meio e transferidas para um classificador de células BD FACSAria (BD Biosciences, US). A população de células únicas vivas foi passada por um porta de gráfico de pontos de espalhamento a frente/espalhamento lateral (FSC/SSC). Foi definida uma subpopulação englobando as células com os 5% superiores de intensidade de fluorescência das células vivas passadas pela porta, e cerca de 45.000 células dessa subpopulação foram coletadas (células reunidas classificadas para mlgG). Como controle, cerca de 40.000 células foram aleatoriamente coletadas a população de células vivas passadas pela porta FSC/SSC, independentemente de sua fluorescência (células reunidas de controle). As células reunidas coletadas foram expandidas por cultivo em meio de seleção (veja exemplo 8) durante duas semanas. Realizou-se, então, um segundo ciclo de classificação. As células do grupo de células reunidas classificadas para mlgG foram tingidas para IgG de superfície celular, conforme acima descrito. Usando-se um classificador de células BD FACSAria (BD Biosciences, US), as células com os 4% superiores de intensidade de fluorescência foram separadas da população de células únicas vivas (passadas pela porta do gráfico de pontos FSC/SSC).
As células classificadas foram coletadas como células únicas em placas de 96 poços. Das células reunidas de controle, coletaram-se células únicas aleatoriamente da população de células vivas não tingidas passadas pela porta FSC/SSC. Clones de células únicas foram expandidos por cultivo em meio de seleção (veja exemplo 8) durante três semanas.
Exemplo 10
Determinação das concentrações de IgG por ELISA
A concentração de imunoglobulina nos sobrenadantes de cultura celular foi determinada por um ELISA em sanduíche, que usou um fragmento F(ab')2 de IgG anti-humana biotinilada como um reagente de captura e, para detecção, um fragmento F(ab')2 de anticorpo IgG anti-humana conjugada a peroxidase.
Placas de 96 poços revestidas com estreptavidina (Placas de Tiras de Poliestireno Revestidas com Estreptavidina Pierce Reacti-Bind™, Código Ns 15121) foram revestidas com 0,5 pg/mL de fragmento F(ab')2 de anticorpo IgG policlonal anti-humano de cabra biotinilado (F(ab')2<h-Fcy>Bi; Dianova, Alemanha, Código N9 109-066-098) anticorpo de captura (0,1 mL/poço) em tampão diluente (tampão diluente: tampão PBS contendo 0,5% peso por volume (p/v) de albumina sérica bovina) por incubação durante uma hora à temperatura ambiente (TA) sob agitação. Depois disso, as placas foram lavadas três vezes com mais de 0,3 mL de tampão de lavagem (tampão de lavagem: PBS contendo 1% (p/v) de Tween 20). Sobrenadantes de cultura celular contendo IgG (amostras) foram diluídos serialmente (duas vezes) até uma concentração de 0,5 - 20 ng/mL em tampão diluente, adicionados aos poços e incubados durante uma hora à TA com agitação, Anticorpo padrão purificado (0,5 - 20 ng/mL) em tampão diluente foi usado para a geração de uma curva padrão de proteína IgG. Depois de lavar as placas três vezes com 0,3 mL/poço de tampão de lavagem, complexos ligados a Fey anti-humana foram detectados com o fragmento F(ab')2 conjugado a peroxidase de IgG anti-humana policlonal de cabra específica para F(ab')2 (F(ab')2<h-FcY>POD; Dianova, Alemanha, Código N9 109-036-098). Depois de lavar as placas três vezes com 0,3 mL/poço de tampão de lavagem, as placas foram reveladas com solução de substrato de peroxidase ABTS® (ácido 2,2'-azino-bis(3- etilbenzotiazolina-6-sulfônico) (Roche Diagnostics GmbH, Alemanha, Código N9 1684302). Após 10-30 minutos, mediu-se a absorbância a 405 nm e 490 nm contra um reagente em branco (tampão de incubação + solução de ABTS) em um leitor de placas Tecan Spectrafluorplus (Tecan Deutschland GmbH, Alemanha). Para uma correção de fundo, a absorbância a 490 nm foi subtraída da absorbância a 405 nm, de acordo com a seguinte fórmula:
ΛΔ_/Δ405ηπι /\490nm \ /A405nm *490nm brancox amostra ~ ™ amostra) ~ em branco M em /
O teor de IgG das amostras foi calculado a partir da curva padrão.
Exemplo 11
Triagem e seleção de clones de CHO que expressam mlgG
Três semanas após as deposições de células únicas em placas de 96 poços, os sobrenadantes de cultura celular de 515 clones classificados para mlgG e de 550 clones de controle foram analisados por ELISA (veja exemplo 10). A Tabela 6 mostra a distribuição dos clones para diferentes níveis de concentração de IgG.
Tabela 6: Triagem de clones depositados em placas de 96 poços por ELISA.
IgG em SN [pg/mL] |
Clones classificados para mlgG |
Clones de controle |
n9 de clo-
nes |
% de clones |
|
n9 de clo-
nes |
< 1 |
0 |
0 |
495 |
90.0 |
<2 |
65 |
12.6 |
44 |
8.0 |
<3 |
76 |
14.8 |
5 |
0.9 |
< 4 |
67 |
13.0 |
2 |
0.4 |
<5 |
66 |
12.8 |
0 |
0 |
<6 |
58 |
11.3 |
1 |
0.2 |
<7 |
35 |
6.8 |
0 |
0 |
<8 |
39 |
7.5 |
0 |
0 |
IgG em SN [gg/mL] |
Clones classificados para mlgG |
Clones de controle |
ns de clones |
% de clones |
|
nQ de clones |
<9 |
32 |
6.2 |
1 |
0.1 |
< 10 |
21 |
4.1 |
0 |
0 |
<11 |
16 |
3.1 |
0 |
0 |
< 12 |
9 |
1.8 |
1 |
0.2 |
< 13 |
6 |
1.1 |
1 |
0.2 |
< 14 |
4 |
0.8 |
|
|
< 15 |
3 |
0.6 |
|
|
< 16 |
2 |
0.4 |
|
|
< 17 |
3 |
0.6 |
|
|
< 18 |
2 |
0.4 |
|
|
< 19 |
1 |
0.2 |
|
|
<20 |
2 |
0.3 |
|
|
<21 |
1 |
0.2 |
|
|
<22 |
1 |
0.2 |
|
|
> 22 |
6 |
1.2 |
|
|
Observou-se que, na abordagem de controle, 90 por cento de todos os clones mostravam uma concentração de IgG de 1 pg/mL e menor. Em contraste, nenhum clone classificado para mlgG se achava nesse grupo. Além disso, nessa abordagem, concentrações de IgG de mais de 22 pg/mL 5 foram atingidas por 6 clones, ao passo que a maior concentração de IgG medida na abordagem de controle foi de 12,3 pg/mL. Todos os clones classificados para mlgG com mais de 10 pg/mL e todos os clones de controle com mais de 3 pg/mL foram, então, transferidos para placas de 24 poços para uma segunda triagem. Os clones cresceram por cultivo em meio de seleção 10 (veja exemplo 8) durante 20 dias, então, as concentrações de IgG nos sobrenadantes de cultura celular foram determinadas por ELISA. A Tabela 7 mostra a distribuição de clones para diferentes níveis de concentração de IgG.
Tabela 7: Triagem de clones depositados em 24 poços por ELISA.
IgG em SN [pg/mL] |
Clones classificados para mlgG |
Clones de controle |
n9 de clones |
% de clones |
|
n9 de clones |
<5 |
2 |
3.7 |
3 |
50.0 |
< 10 |
1 |
1.9 |
1 |
16.7 |
< 15 |
2 |
3.7 |
1 |
16.6 |
<20 |
1 |
1.8 |
1 |
16.7 |
<25 |
5 |
9.3 |
|
|
<30 |
12 |
22.2 |
|
|
<35 |
13 |
24.1 |
|
|
<40 |
7 |
12.9 |
|
|
<45 |
5 |
9.3 |
|
|
<50 |
4 |
7.4 |
|
|
<55 |
1 |
1.8 |
|
|
<60 |
1 |
1.9 |
|
|
average IgG conc. (pg/ml) |
31.4 |
6.1 |
Os clones de controle apresentavam níveis de expressão de até
16,8 pg/mL, com uma concentração média de IgG de 6,1 pg/mL. Em contraste, a expressão média dos clones classificados para mlgG foi de 31,4 pg/mL, com 58,9 pg/mL sendo a maior concentração de IgG observada em um clone desse grupo. Os seis clones classificados para mlgG com mais de 45 pg/mL e os dois clones de controle com mais de 10 pg/mL foram, então, transferidos para balões com agitação de 125 mL para avaliação adicional. Exemplo 12
Avaliação de produtividade para clones de CHO selecionados
Para adaptação à agitação, os clones selecionados do Exemplo foram transferidos para balões de agitação de 125 mL e cultivados em 25 mL de meio de seleção (veja exemplo 8) dirante uma semana, em um agitador giratório com 150 rpm, sob condições padronizadas (veja exemplo 8).
Depois disso, para cada clone, 25 mL de meio ProCHO5-CDM (Cambrex
Corp., US), suplementado com 8 mM de L-Alanil-L-glutamina (Invitrogen
Corp., US), 1x suplemento HT (Invitrogen Corp., US) e 400 pg/mL de G418 (Roche Diagnostics GmbH, Alemanha) foram inoculados com 1 x 106 células/mL e cultivados em balões de agitação de 125 mL conforme acima descrito. Nos dias 0, 1, 2, 3, 4 e 7, a contagem de células de cada clone foi determinada com um contador de células CASY® TT (Schãrfe Systems, Ale5 manha), indicando um crescimento comparável de todos os clones testados (veja Tabela 8).
Tabela 8: Contagem de células das culturas de agitador.
Clone |
contagem de células [106/mLj |
dia 0 |
|
dia 0 |
|
dia 0 |
|
Clones classificados para mlgG |
|
1A1 |
1.10 |
1.15 |
4.30 |
5.57 |
7.46 |
9.96 |
1B6 |
1.10 |
1.22 |
4.12 |
5.60 |
6.58 |
8.76 |
1C5 |
0.99 |
1.81 |
5.59 |
5.53 |
6.06 |
5.76 |
1D1 |
0.99 |
1.58 |
3.08 |
5.77 |
5.39 |
5.40 |
1D6 |
1.11 |
1.31 |
5.06 |
5.70 |
6.60 |
8.36 |
2D6 |
1.09 |
1.42 |
3.37 |
5.32 |
5.42 |
5.12 |
clones de controle |
|
KO2 |
1.07 |
1.42 |
3.23 |
4.94 |
5.06 |
7.12 |
KO6 |
1.03 |
1.55 |
5.89 |
5.56 |
7.44 |
8.00 |
No dia 10, os sobrenadantes de cultura celular foram coletados, e as concentrações de IgG foram determinadas por ELISA (veja Tabela 9).
Tabela 9: Determinação de produtividade de culturas de agitador de 10 dias por ELISA. .______________________._______________________
clone |
IgG no SN |jxg/mL] |
clones classificados para mlgG |
1A1 |
47.9 |
1B6 |
57.2 |
1C5 |
188.9 |
1D1 |
151.0 |
1D6 |
59.1 |
2D6 |
165.6 |
clones de controle |
KO2 |
56.5 |
clone |
IgG no SN [gg/mL] |
KO6 |
34.6 |
Observou-se que três dos seis clones classificados para mlgG (isto é clones 1 Al, 1B6 e 1D6) mostraram níveis de expressão em uma faixa comparável à dos dois clones de controle. Os outros três clones classificados para mlgG (isto é clones 1C5, 1D1 e 2D6) mostraram uma expressão de IgG acentuadamente elevada, que era até 3,3 vezes maior que a observada nos clones de controle.
Exemplo 13
Análise Northern blot de clones de CHO selecionados
Os seis clones classificados para mlgG e os dois clones de controle adaptados para crescimento em balões de agitador (veja exemplo 12) foram analisados por Northern blot para definir a razão entre as duas isoformas de cadeia pesada que surgem por splicing alternativo do transcrito primário. Para comparação, o clone '27' foi analisado em paralelo. Esse clone foi obtido por transfecção estável de células CHO-K1 com um vetor de expressão genomicamente organizado para apenas a forma secretada do anticorpo idêntico. O Northern blot foi realizado conforme descrito em detalhes no exemplo 6 e mostrado na Figura 9.
Exemplo 14
Construção do vetor de expressão de slgG/lgG-GPI 'plgG-GPI-B1
Para ancoragem em membrana plasmática de uma imunoglobulina, o domínio transmembrana nativo codificado pela parte 3' do éxon M1 e a região intracelular codificada pelo éxon M2 são substituídos pelo peptídio de sinal carbóxi terminal da fosfatase alcalina placentária humana que medeia a ancoragem de glicosilfosfatidilinositol (GPI). Conseqüentemente, a seqüência de DNA do plasmídio pmlgGA-B (veja exemplo Ic) que codifica os seguintes 53 aminoácidos: LWTTITIFITLFLLSVCYSATVTFFKVKWIFSSVYDLKQTIVPDYRNMIRQGA (SEQ ID NO: 146) é substituída pela seqüência de DNA que codifica a seguinte seqüência de aminoácidos do peptídio de sinal carbóxi terminal da fosfatase alcalina pia
100 centária humana (acesso NCBI: M 13077; nucleotídeos: 1542 -1643): AGTTDAAHPGRSWPALLPLLAGTLLLLETATAP (SEQ ID NO: 147).
A seqüência de ácido nucléico da região constante do cassete de expressão de cadeia gama, de CH1 a 3'UTR, do plasmídio de expressão 5 plgG-GPI-B é dada na SEQ ID NO: 148.
A seqüência de aminoácidos correspondente da isoforma slgG da região constante de cadeia gama codificada pelo plasmídio plgG-GPI-B é dada na SEQ ID NO: 149.
A seqüência de aminoácidos correspondente da isoforma longa 10 da região constante de cadeia gama incluindo peptídio de sinal carbóxi terminal da placental fosfatase alcalina de placenta humana codificada pelo plasmídio plgG-GPI-B é dada na SEQ ID NO: 150.
Esse plasmídio permite a expressão da forma secretada (slgG) e uma forma ancorada a GPI de um anticorpo por splicing alternativo do pré15 mRNA de cadeia pesada (veja figura 10).
101
Seqüência de Listagem <110> F. Hoffmann-La Roche AG <120> Células Produtoras de Polipeptídio <130> 23748 WO <150> EP 06010146.6 <151> 2006-05-17 <160>176 <170> Patentln versão 3.2 <210>1 <211> 2767 <212> DNA <213> Homo sapiens <400>1
gtgagtcacc |
cccaggccca |
gggttgggac |
ggggactçtg |
aggggggcca |
taaggagctg |
60 |
gaatccatac |
taggcagggg |
tgggcactgg |
gcaggggcgg |
ggctaggctg |
tcctgggcac |
120 |
acaggcccct |
tctcggtgtc |
cggcaggagc |
acagacttcc |
cagtactcct |
gggccatgga |
180 |
tgtcccagcg |
tccatccttg |
ctgtccacac |
cacgtgctgg |
cccaggctgg |
ctggcacagt |
240 |
gtaagaggtg |
gatacaaccc |
ctcgccgtgc |
cctgaggagt |
ggcggtttcc |
tcccaagaca |
300 |
ttccccacgg |
ctgggtgctg |
ggcacaggcc |
ttccctggtg |
tgaccgtgaa |
tgtggtcacc |
360 |
ctgaacagct |
gccctctctg |
gggacatctg |
actgtccaag |
accacagtca |
gcacctctgg |
420 |
gagccagagg |
ggtctccaga |
gacccccaga |
tgtcaggctt |
gggctcagtg |
cccagcgaaa |
480 |
ggtcagcccc |
acacatgccc |
ataatgggcg |
cccacccaga |
gtgacagccc |
ccagcctcct |
540 |
gccaggccca |
cccttttccg |
cccccttgag |
gcatggcaca |
cagaccagtg |
cgcccactgc |
600 |
ccgagcatgg |
ccccagtggg |
atgtggtggc |
cacgaggggc |
tgtacacaca |
gcaggaggct |
660 |
gtccgccctg |
ctcagggcct |
gctgcctatg |
ccccagctgt |
ccaaccaagg |
gaggcatgga |
720 |
agggcccctg |
gtgtaagctg |
gagccaggca |
cccaggcccc |
cggccaccct |
gcagagccaa |
780 |
ggaaaggaag |
acacccaagt |
caacaagggg |
cagggctgag |
ggctgtccca |
ggctcttttg |
840 |
gcccgagggg |
ctgccagcag |
ccctgacccg |
gcatgggcct |
tccccaaaag |
cgaccctgtg |
900 |
aggtggcctc |
acagagaacc |
ccctctgagg |
acagtgtctg |
accctgcctg |
cctcacacag |
960 |
atgggcccca |
cagcagtggg |
caacctgggg |
ggcagcagcc |
caacctgacc |
ctgcagggac |
1020 |
tgccccctgc |
agcagcagct |
gcttctcagt |
cccccaacct |
ccctgtcccc |
gccagagggt |
1080 |
cttccccgaa gctgcagccc caacccatgg ctgcccacct ggaaccggga ctccctgtcc 1140
102
actgccccct |
ccccttcggg |
gccccatctg |
tgctggggcc |
caggttcggc |
ctacagattc |
1200 |
ccatcattgc |
catggcctcc |
tgaccttgcc |
tatccacccc |
caaccaccgg |
ctccatgctg |
1260 |
accctccccc |
aggctcccac |
gcccagctgg |
ccggccatcc |
ccaggcacag |
acagtctggg |
1320 |
atctcacagg |
ttagcctgga |
ccatccacct |
ggccagacct |
gggagaggct |
ggaagctgcc |
1380 |
ctgccaccat |
gctccagggc |
cccaggttgc |
agtactatgg |
ggtgagggtg |
tgtgtgcaca |
1440 |
cctgtgtgta |
cctaggatat |
ccgagtgtac |
ccttgtgccc |
ccaagcacaa |
gtctccctcc |
1500 |
caggcagtga |
ggcccagatg |
gtgcagtggt |
tagagctgag |
gcttatccca |
cagagaaccc |
1560 |
tggcgccttg |
gtcaaggaag |
cccctatgcc |
tttcttgcct |
cgatttcccc |
tcttgtctgc |
1620 |
tgagccagca |
ggggccacgt |
cctgggctgc |
tgtgaggagg |
aagcaagttg |
gtgctaggag |
1680 |
gggctcctgt |
gtgtgcatgg |
gcgggagggg |
tgcaggtatc |
tgagcacccc |
ggtctccact |
1740 |
tgagagagca |
gggcaggagc |
tccctgaccc |
acccagacta |
cacacgctgt |
gtccacgtgt |
1800 |
ctcccattat |
ctgtggcaga |
ggatccggct |
tctttctcaa |
tttccagttc |
ttcacaaagc |
1860 |
aatgcctttg |
taaaatgcaa |
taagaaatac |
tagaaaaatg |
atatgaacag |
aaagacacgc |
1920 |
cgattttttg |
ttattagatg |
taacagacca |
tggccccatg |
aaatgatccc |
ggaccagatc |
1980 |
cgtccacacc |
cgccactcag |
cagctctggc |
cgagctcaca |
gtacaaccac |
aataaactct |
2040 |
tgttgaatga |
actctaggaa |
gtctgtgacg |
tggctggttc |
ttgtcaatgc |
ttcctgcctg |
2100 |
cccacaggct |
cttcctcgtg |
gatggggctg |
tgcttgccac |
ggaagcgcgt |
ttttcccggc |
2160 |
ctaggcttgc |
cttgggcccc |
actgccgtct |
ccagctggag |
atgaccttct |
atacacacat |
2220 |
ttgctcatga |
cagacccttg |
cttagccccc |
ttccatggct |
ccctcctgct |
gctgggataa |
2280 |
aatcaccttg |
cctggatatc |
ccctcctggg |
cccctttcca |
ccctccttag |
tcagcacccc |
2340 |
cagttcaggg |
cacctgcttt |
ccccgctgcg |
gagaagccac |
tctctccttg |
ctgcccggct |
2400 |
gtgtcttgcc |
ttccacacct |
tgtcacagtg |
gccacttcct |
aaggaaggcc |
tccctgtgtg |
2460 |
caggtgtgca |
gaagtgcccc |
agcctcccgt |
cacctttgtc |
acgggagccc |
aatccatgag |
2520 |
agtctatggt |
tctgtctgtc |
tgccccactc |
agggcagcga |
caagtccagg |
cggggaggac |
2580 |
acagtaggca |
gagatttgtc |
gaggggacat |
atgagcaaga |
gggtgaggct |
gggagctccc |
2640 |
tggagataac |
cacgcctcct |
gggaagactc |
gccgtcattt |
cagctccacg |
ctgtgcgggg |
2700 |
gtgggtggag |
gggtagcctg |
gccctcatga |
ccagggagct |
tctcactcag |
cccctgttcc |
2760 |
tccccag |
|
|
|
|
|
2767 |
<210> 2 <211> 1287 <212> DNA <213> Homo sapiens
103 <400> 2 gtaaatgagt gccacggccg gcaagccccc gctccccagg ctctcggggt cgcgcgagga60 tgcttggcac gtaccccgtg tacatacttc ccaggcaccc agcatggaaa taaagcaccc120 agcgcttccc tgggcccctg cgagactgtg atggttcttt ccacgggtca ggccgagtct180 gaggcctgag tggcatgagg gaggcagagt gggtcccact gtccccacac tggcccaggc240 tgtgcaggtg tgcctgggcc gcctagggtg gggctcagcc aggggctgcc ctcggcaggg300 tgggggattt gccagcgtgg ccctccctcc agcagcagct gccctgggct gggccacgag360 aagccctagg agcccctggg gacagacaca cagcccctgc ctctgtagga gactgtcctg420 ttctgtgagc gccctgtcct ccgacccgca tgcccactcg ggggcatgcc tagtccatgt480 gcgtagggac aggccctccc tcacccatct acccccacgg cactaacccc tggcagccct540 gcccagcctc gcacccgcat ggggacacaa ccgactccgg ggacatgcac tctcgggccc600 tgtggagaga ctggtccaga tgcccacaca cacactcagc ccagacccgt tcaacaaacc660 ccgcactgag gttggccggc cacacggcca ccacacacac acgtgcacgc ctcacacacg720 gagcctcacc cgggcgaacc gcacagcacc cagaccagag caaggtcctc gcacacgtga780 acactcctcg gacacaggcc cccacgagcc ccacgcggca cctcaaggcc cacgagccgc840 tcggcagctt ctccacatgc tgacctgctc agacaaaccc agccctcctc tcacaaggtg900 cccctgcagc cgccacacac acacagggga tcacacacca cgtcacgtcc ctggccctgg960 cccacttccc agtgccgccc ttccctgcag ctggggtcac atgaggtgtg ggcttcacca1020 tcctcctgcc ctctgggcct cagggaggga cacgggagac ggggagcggg tcctgctgag1080 ggccaggtcg ctatctaggg ccgggtgtct ggctgagccc cggggccaaa gctggtgccc1140 agggcgggca gctgtgggga gctgacctca ggacattgtt ggcccatccc ggccgggccc1200 tacatcctgg gtcctgccac agagggaatc acccccagag gcccaagccc agggggacac 1260 agcactgacc acccccttcc tgtccag1287 <210> 3 <211> 1301 <212> DNA <213> Homo sapiens <400> 3 gtaaatgagt gccacggccg gcaagccccc gctccccagg ctctcggggt cgcgcgagga60 tgcttggcac gtaccccgtc tacatacttc ccgggcaccc agcatggaaa taaagcaccc120 agcgctgccc tgggcccctg cgagactgtg atggttcttt ccgtgggtca ggccgagtct180 gaggcctgag tggcatgagg gaggcagagc gggttccact gtccccacac tggcccaggc240
104
tgtgcaggtg |
tgcctgggcc |
gcctagggtg |
gggctcagcc |
aggggctgcc |
ctcggcaggg |
300 |
tgggggattt |
gccagcgtgg |
ccctccctcc |
agcagcagct |
gccctgggct |
gggccacggg |
360 |
aagccctagg |
agcccctggg |
gacagacaca |
cagcccctgc |
ctctgtagga |
gactgtcctg |
420 |
tcctgtgagc |
gccctgtcct |
ccgacctcca |
tgcccactcg |
ggggcatgcc |
tagtccatgt |
480 |
gcgtagggac |
aggccctccc |
tcacccatct |
acccccacgg |
cactaacccc |
tggctgccct |
540 |
gcccagcctc |
gcacccgcat |
ggggacacaa |
ccgactccgg |
ggacatgcac |
tctcgggccc |
600 |
tgtggaggga |
ctggtccaga |
tgcccacaca |
cacactcagc |
ccagacccgt |
tcaacaaacc |
660 |
ccgcgctgag |
gttggccggc |
cacacggcca |
ccacacacac |
acgtgcacgc |
ctcacacacg |
720 |
gagcctcacc |
cgggcgaacc |
gcacagcacc |
cagaccagag |
caaggtcctc |
gcacacgtga |
780 |
acactcctca |
gacacaggcc |
cccacgagcc |
ccacgcggca |
cctcaaggcc |
cacgagccgc |
840 |
tcggcagctt |
ctccacatgc |
tgacctgctc |
agacaaaccc |
agccctcctc |
tcacaaggtg |
900 |
cccctgcagc |
cgccacacac |
acacaggccc |
ccacacacag |
gggaacacac |
gccacgtcgc |
960 |
gtccctggca |
ctggcccact |
tcccaatgcc |
gcccttccct |
gcagctgagg |
tcacatgagg |
1020 |
tgtgggcttc |
accatcctcc |
tgccctctgg |
gcctcaggga |
gggacacagg |
agatggggag |
1080 |
cgggtcctgc |
tgagggccag |
gtcgctatct |
agggctgggt |
gtctggctga |
gtcccggggc |
1140 |
caaagctggt |
gcccagggca |
ggcagctgtg |
gggagctgac |
ctcaggacac |
tgttggccca |
1200 |
tcccggccgg |
gccctacatc |
ctgggtcctg |
ccacagaggg |
aatcaccccc |
agaggcccga |
1260 |
gcccagcagg |
acacagtatt |
gaccacccac |
ttcctgtcca |
g |
|
1301 |
<210> 4 <211> 1914 <212> DNA <213> Homo sapiens <400> 4 gtaaacccac cctgtacaac gtgtccctgg tcatgtccga cacagctggc acctgctact60 gaccctgctg gcctgcccac aggctcgggg cggctggccg ctctgtgtgt gcatgcaaac120 taaccgtgtc aacggggtga gatgttgcat cttataaaat tagaaataaa aagatccatt180 caaaagatac tggtcctgag tgcacgatgc tctggcctac tggggtggcg gctgtgctgc240 acccaccctg cgcctcccct gcagaacacc ttcctccaca gcccccaccc ctgcctcacc300 cacctgcgtg cctcagtggc ttctagaaac ccctgaattc cctgcagctg ctcacagcag360 gctgacctca gacttgccat tcctcctact gcttccagaa agaaagctga aagcaaggcc420 acacgtatac aggcagcaca caggcatgtg tggatacaca tggacagaca cggacacaca480 caaacacatg gacacacaga gacgtgctaa cccatgggca cacacataca cagacatgga540
105
cccacacaca |
aacatatgtg |
gacacacatg |
tacaaacatg |
cacaggcaca |
caaagagaac |
600 |
actgactaca |
ggcacacaca |
cacacgggca |
cactacccac |
aggcacacaa |
cagatggaca |
660 |
cgcgtacaca |
gacatgcaca |
cacccacagg |
cacaacacgt |
gcgcatgccg |
gccggccccc |
720 |
gcccacattc |
tcccagggcc |
ctgccggata |
ctctgtccct |
gcagcagttt |
gctccctgcg |
780 |
ctgtgctggc |
cccggggctt |
tgggcccagg |
ctctgcttgt |
ccttctgtct |
ctgcttggag |
840 |
gtgctgccat |
ggcacccagc |
ttgggctctg |
cctggggagc |
ggaggcccca |
gggatagcat |
900 |
gtgacccctg |
ctgaggccag |
gctcctgatg |
aaggcagcag |
atagccccca |
cacccaccgg |
960 |
tgagcagaac |
cagagcctgt |
gccatgtgct |
gagagcaggc |
agtgactaag |
catatgggcc |
1020 |
cagagggcag |
agtggctgcc |
ctgggcagct |
gctcctctta |
gcaggaggcc |
tcaggagatg |
1080 |
agctagagca |
agtctgcccc |
tgcaaatacc |
acctgctccc |
caacccacag |
cagggagcag |
1140 |
gcgaggtcag |
acagcagcag |
cccgggaagg |
accgagcccc |
agcagggaag |
gcagggcccg |
1200 |
agtgaggtct |
ccacacccaa |
cgcacagtgc |
tgtctctaac |
tggggccacc |
tccgagtccc |
1260 |
cgccacactc |
ttggcccttt |
ggagtcctgg |
gctccaggtg |
tctcccaagg |
gcccatctgt |
1320 |
gcaggggatg |
caaccccccg |
aatgtcctca |
tcccactgtg |
gagctcaggt |
ctctgtctgc |
1380 |
tccctgggtc |
ctggcagggt |
aggacaagtc |
cgccaggatg |
tccccatgca |
gactctgctc |
1440 |
caagagggag |
ctggagagtc |
agggccttgg |
tgagggagtc |
aggatcgggt |
tccccccagc |
1500 |
tcagtcctcc |
cacctgccag |
cccccacagc |
acagggcagg |
gccacacccc |
ctgcttcccc |
1560 |
ctccaggaga |
gtcaggacat |
gctggccgct |
gctccgctgg |
ggccccgccc |
tccagccccc |
1620 |
accttggtct |
gtgtgctgca |
tcccccacgc |
tctctctgcc |
accccaggac |
tctgaggaaa |
1680 |
agacctcaga |
gtcccagccc |
tgcc-cagcct |
cggcctgtgc |
ccccgctgca |
tcaggctttc |
1740 |
aggggcccag |
cccatgccct |
gggcagtgcc |
cgagcccccc |
tgcacttgct |
ctccccaccc |
1800 |
ctgggtgcag |
cacagcctag |
gggccaaggg |
tgggcctaga |
ggatgggccc |
cgggggggct |
1860 |
ttgctgggtg |
ccaccccagc |
ctgaccctat |
tcccccgtgc |
tgtgtctcct |
gcag |
1914 |
<210> |
5 |
<211> |
2432 |
<212> |
DNA |
<213> |
Mus musculus |
<400> |
5 |
gtaaacccac |
caatgtcagc |
gtgtctgtga |
tcatgtcaga |
gggagatggc |
atctgctact |
60 |
gagccaccct |
gcctgtccct |
actcctgaaa |
taaactctgt |
gctcatccaa |
agtatccctg |
120 |
cacttccatc |
cagtgcctgt |
ccatcatcct |
tagggtctac |
agaacacagg |
gaggggtcag |
180 |
ggcccaggga |
gggagaaaca |
ccaccaccta |
agcttgtaag |
gcctcggaga |
ctttgaagac |
240 |
106
ccttcatgcc |
tagagtatat |
gtgtatgcat |
gtctatgtat |
tggtgagtgc |
ttatggatgg |
300 |
gtccatgtgc |
cttcatgtgt |
gtacctgtgt |
gcagcaagag |
aggagtgagt |
ttgtgtgcac |
360 |
ctatggttta |
taggtatgta |
tatgggtata |
agtacatatg |
tggacacact |
atatctatgt |
420 |
ccctgtgagc |
aagtgtgtgc |
ctgtgcatac |
ctatgagcat |
gcatatatct |
atgtgtgttc |
480 |
atgttggtgg |
aaacatgaga |
gtgtgtgcac |
ctgccctgtg |
aatgtgcaat |
gagtgaatgg |
540 |
gaagtaagaa |
taaactgggg |
atgaaatcca |
aggcgagcag |
actcagccaa |
gaaggcaaag |
600 |
ctcatgggag |
agtccccagg |
gcagtgggtt |
gctgcacaag |
tactctgagt |
ggtgggtggt |
660 |
gtggctgttt |
attagaccgc |
agcttctaac |
ccaaacaaga |
cagggataga |
tggagcaaaa |
720 |
gggtagcacc |
atcaaggctg |
gtgccgtgtg |
ggggtcacaa |
tagagatgat |
ggtatgagaa |
780 |
tgaagggatg |
aacacagggg |
cactgggaag |
aagatgccac |
gcaccctcag |
taggccatcc |
840 |
ctgaatggaa |
acatgcattc |
agggtgacca |
ctgactcatg |
agaaagacat |
atagcatggc |
900 |
acagacaacc |
ctcagcagca |
ccctgctctt |
cacacatgca |
catgggcata |
caccctgttc |
960 |
tgcatacatg |
cacatgggca |
tacatgcaca |
gacactcaca |
tttgcacact |
cacacagacc |
1020 |
tgaaccctgg |
aggaagatga |
agttcacagc |
ccacacccag |
cttctggaaa |
gcaaggggag |
1080 |
tcccctccaa |
gcccccggga |
gaatttccag |
gcccgacact |
gacaactaca |
cacaatggac |
1140 |
aagggcatag |
gcccctccag |
gtgccccctt |
tctaacctaa |
gtctcccttc |
ccatcctgag |
1200 |
cccaagtatc |
acaaaccaga |
agcaggataa |
gaggcaaatc |
tgggaagaag |
caggagcagg |
1260 |
ccatggagac |
cactcccaca |
caggcctcgg |
cctcctccat |
gggcacccct |
agaacacaaa |
1320 |
gttctacaac |
caggtatact |
tggagcccag |
gtgtccacaa |
gagggcagtg |
ggggccctgc |
1380 |
tcctgtctca |
caggccttca |
gaacttcggg |
gggggggggg |
aggagttgct |
ggtttctagc |
1440 |
aacttccctc |
tgctctcaga |
gcaagagtgg |
agtaaaggcc |
catgcatgcc |
ctggatactc |
1500 |
tccagcttga |
aagtccagtt |
ccctgagaat |
agcaagagca |
acagaccagc |
ttgggaaacc |
1560 |
tgactcagaa |
aagtaccata |
gccacccatg |
gaatccaagg |
cctggcccat |
gacagagaat |
1620 |
cctagtaagg |
aggagtcaat |
aggtgaaaga |
ctgaatcccc |
acagggagag |
ggggcagaga |
1680 |
agctggagaa |
tcacgatagt |
cgggaaagat |
gatgagtgag |
cggctggagg |
gtaatggatg |
1740 |
gctggctaca |
aggatgaacg |
atggggatga |
tggatggatt |
gatggatggc |
tgcagtgaca |
1800 |
gaaatacgag |
tggttgacta |
tcagtacaca |
tttcctactg |
ccacttaaaa |
tgaaactctg |
1860 |
tgcgcagaga |
acctgaggac |
agcagggttg |
gctctactgg |
gggtctttac |
tgttgcttaa |
1920 |
cccccagtca |
cagctcttaa |
gaatgcaaca |
gagtcctctg |
accacatgtc |
caggccttgg |
1980 |
tagtctaact |
ttggcccaga |
aatcacattg |
gcctgtatct |
gtttgaaggt |
gtctgatctt |
2040 |
acacaaccct |
agtacccaag |
ccaagattag |
cctaagaact |
ggggtttagg |
gaggtattgc |
2100 |
taaatatcta gaaaggactg agacctaagg agccttgggt tcaaactctt ctcagagttt 2160
107 gacagaaaca actctcttac catgacaggt ctctaattaa ggtttcccta agagagagag atgggtcttg gggccatctc aagaactgct gggattccag tcccttacct gggaccctgc ctcctcatta tccctgaaca agtcccttcc cgggaataag ggacccctac caccactgtc cccaaagccc aaggaggcat agaagcagaa accttaagtc tgagccccca tccccatggg tttggatcta gaaggtcatc tatgtcttac ag <210> 6 <211> 1411 <212> DNA <213> Mus musculus <400> 6 gtaaatgatc ccagtgtcct tggagccctc tggtcctaca ggactctgac acctacctcc acccctccct gtgtaaataa agcacccagc actgccttgg gaccctgcaa taatgtcctg gtgatttctg agatgtagag tctagctagg tcatggaatg aggggtctcc atggtttgag gcctgagttg tgactaagga aaaacccata ggcctacact gccacaccca gcacttttga atttgcctga catgaaaaga atttacctct ccctggaaag tggagcctta tccctaggca gttcccttac cagaccttcc tctagcttgc actttgttct gggcacagaa tgtgtctaac cccccaaagc aaggaagaca caacctctac ctccctcact ctgtccttac cccttttcct ggctaagcat ctcactgagt gcgctgaata gatgcatgtg gccacagtct tgcagacaga cccttgccat ctctccactc agctttccag aggctaagtc tagcccgtat ggtgataatg cagggagctc tatgctatct cagtgctatc agactcccaa gtggaggatg aacatggacc cattaaaacc aacctgcgca gcaacaccct gccaataagg cccgtatgtg aaaatgtgca cacatctaca catgcacagg cacacacaca cacacatgca tgggcacaca cacatacaga gagagagaat cacagaaact cccatgagca tcctatacag tactcaaaga taaaaaggta ccaggtctac ccacatgatc atcctcggca tttacaagtg ggccaactga tacagataaa acttttctat gccaaggacg ccaacatata cacaagtccg ctcatgacaa atctgtccct gaacctcaga ctggcgcccg tgactcatac agtggacact cctccaaagc tgtatagctt cctttacttc cctgtgtgta ctttctctga agtacactca tcacacagaa gaggccctgt gattactctg gccctctgtt cttggtcatc agagaataga cagaagatca ggcaaactac acagacactt cccacaatca tcacaggccc tgactctgct ctccagtctc aaaactgaag gctggagcac acagaataag ctcctgcaca ggccaggcca gtatcgggtc cagtgtgtct gactgagccc agggacaaaa tggcagcact ttggggaact gaggtttctg gtccaagaag gagagatgga ggcccaggga gggtctgctg acccagccca gcccagccca gctgcagctt
2220
2280
2340
2400
2432
120
180
240
300
360
420
480
540
600
660
720
780
840
900
960
1020
1080
1140
1200
1260
1320
108
tctcctgggc |
ctccatacag |
cctcctgcca |
cacagggaat |
ggccctagcc |
ccaccttatt |
1380 |
gggacaaaca |
ctgaccgccc |
tctctgtcca |
g |
|
|
1411 |
<210> 7 |
|
|
|
|
|
|
<211> 1357 |
r |
|
|
|
|
|
<212> DNA |
|
|
|
|
|
|
<213> Mus |
musculus |
|
|
|
|
|
<400> 7 |
|
|
|
|
|
|
gtaaatgagc |
tcagcaccca |
caaagctctc |
aggtcctaag |
agacactggc |
acccatatcc |
60 |
atgcatccct |
tgtataaata |
aagcatccag |
caaagcctgg |
taccatgtaa |
aactgtcctg |
120 |
gttctttcca |
aggtatagag |
catagctcac |
gggctgatag |
gtctggccag |
ggttggagga |
180 |
cagccttgtc |
tataggaaga |
gaatgaggtt |
tctgcactgc |
atgactcaga |
ggtcatgagt |
240 |
cattctgcct |
tggactgttg |
gggcttggct |
ttaggcagtg |
ccttttcctt |
gccttcccat |
300 |
gaaccagcag |
ctgccagaca |
tagagataat |
cctaggaagc |
ctcaaatgga |
taagcacaca |
360 |
aacccacctc |
ccttaggctg |
ttcctgtccc |
cctgccccat |
ttctctactt |
aggggttttt |
420 |
ctgagtctat |
tgtggagtga |
cacatggcca |
ggggcattcc |
atagaccttt |
gtcatctata |
480 |
ctctcaactc |
aggcagcttt |
tcacagacga |
ggtctgcaca |
cccatacaaa |
tggctcactc |
540 |
ctgcctgtgc |
cacctggggc |
tgaggcacat |
ggctcttgat |
gccccaaggg |
agggactatt |
600 |
agatagccac |
actcatgcta |
aatcctgacc |
ctgctgaaca |
ccatccagtc |
catatagcac |
660 |
atgtatcctc |
atgctcgtga |
gcacaaaacg |
catttaacac |
actgggacaa |
ctcctctgtg |
720 |
cccagcacag |
cacctacatc |
cagcaatgta |
tcaccataca |
cacggccaaa |
aattcaatgc |
780 |
ccacgtttct |
gccatcacaa |
tcagacacac |
ctttcctctt |
ctgaggacac |
tccattctcc |
840 |
gctcaaaaca |
agacctctga |
agccagattc |
atctctggta |
cctcggggtc |
atgcttcaac |
900 |
cccacatgaa |
taattcaaac |
catagccata |
atggtctgaa |
tcacttcaca |
ctgggatgtt |
960 |
cccaagttca |
ggcaagaaaa |
gccacaggct |
ctgctgatga |
ctgaagaata |
gcaaagggtc |
1020 |
agtccagctg |
tatagccact |
gttgacctgg |
gtcacaggcc |
ctgctgaccc |
tccaccttct |
1080 |
cctgtactga |
aggaatgaaa |
gatgagacaa |
gcatagaggg |
cacttgaata |
atccaggtca |
1140 |
ctctgaggtc |
catccaaggc |
attattggac |
tcaggtggag |
gaagctgaga |
ctgatgtccc |
1200 |
agagggaaag |
gaaggaaagc |
aggccccggg |
gagggtctgc |
tgtcccagtc |
aggctggaga |
1260 |
tctctcctct |
gacttcatgc |
agacatgtct |
gcctcacagg |
gaatctctcc |
cagcatcaac |
1320 |
catgttggga |
caaacactga |
ctgtcctctc |
tgttcag |
|
|
1357 |
<210> 8 <211> 1472
109 <212> DNA <213> Mus musculus <400> 8 gtaaatgaga acagcaccta gccattcctc gggtcttaca agacactgat accagcccta 60 accggtgaac cctataaata aagcacccag agatgggacc ttgtgagatt atcttggttc 120 tttacatggc acatagttca tgatacacct cagccacagg ctgtggggtc tggccagggt 180 tcaaggtgta agttaacatc caagaaagaa caaggtctta tactgccaga cccagggcat 240 gcaagtggac ctgcccttgc cagagatcat ccctctctgc atagcaagtt tgacccaagg 300 ggccctcttc atactcttcc ccacaaccag caactgttct gtgatgagtc tggagataga 360 aatatcgccc tagaaaatat ccaaagaaag gaacacagaa agtgtatccc acctcaacac 420 gaaccccacc ttcatttgtc tgtccttccc tctaccgtga ctcccctacc ttgacctagg 480 aggtctctgt atgtattaca tagacaggca ggaagactca tacatgaagc ccgttcatct 540 ccaccacacc cctagcgata gggataggga tgagtactcc taagagacta cctcccatat 600 gacattcact cacacctaag ttccaagaca ctgagagact tatgacccta gctgccccca 660 aggaagtaac taatcaaata cctacataga tgctgagacc agaactatta gaaccagcct 720 gctaagcatc actcaaccca catggtacct ccaagcctac atacatccac tgatacctca 780 cctaggcagc atgaatagca accaaaccca tcttagtgtc gggatatccc tagacactac 840 ctaaatgtac acatttggac cagtgaagat gaaatagctc tcatgggtac ctaactgttt 900 tcccctaaca cacacaagta ccttcagacc cattctgtcc ctctatgcct aagcccctat 960 tttcatccct tacagttaac actctcccat agctgtataa cctgactcac ttcccaatgt 1020 ggaccttcta ggaagcccag gtatcatcaa acgcaggccc tactctcact ctgtccctct 1080 gtactcagtc accagggaac aagcagtagg tcaggcaagc tgcagagcta ttacctacag 1140 ggcttccaag ccttgaatca gccaagccag ccccagtact gagggatagg gtagacaaaa 1200 agggttcctg catagcccag gccagcatca ggtccagtgt atctggctct acccagggac 1260 aaaacggcag cacattgggg agctgaggtt tctggttcac agagaacata aaggagagat 1320 ggccccaggg agggtcagat ggccccaggg agggtctgct gacccagtca ggctgcagct 1380 ttctcctggg cctccatgca gcctcctgcc acacagggaa tggccctagc tctaccttgt 1440 tgggacaaac actgactttc ctctctgttc ag 1472 <210> 9 <211> 1860 <212> DNA <213> Mus musculus
110 <400> 9 gtaaacccac actgtacaat gtctccctga tcatgtctga cacaggcggc acctgctatt60 gaccatgcta gcgctcaacc aggcaggccc tgggtgtcca gttgctctgt gtatgcaaac120 taaccatgtc agagtgagat gttgcatttt ataaaaatta gaaataaaaa aaatccattc180 aaacgtcact ggttttgatt atacaatgct catgcctgct gagacagttg tgttttgctt240 gctctgcaca caccctgcat acttgcctcc accctggccc ttcctctacc ttgccagttt300 cctccttgtg tgtgaactca gtcaggctta caacagacag agtatgaaca tgcgattcct360 ccagctactt ctagatatat ggctgaaagc ttgcctaacc tggtgcaggc agcattcagg420 cacatatata gacacacatg catttataca tagatatata ggtacacatg tgtagacaca480 tacatgaatg tgtattcatg gacacacaga caaaggtaca catatataca catgagttca540 tgcgcacaca catgcatgga cacttacaaa cgccttcaga gacaaatagg catagacaca600 caaccactca cagaaacaga taccaatatg catggtcctg tgtacacaga aacagactat660 aggcaaatat acacaaataa actatataga tacaaagata tgcatataca cacatgtaca720 gaaacatctt cacatgtgta cactaacatg tgaacaggta tagcacacag atacacctgg780 actctgacca gggctgtaat ctccaaggct cacggctcag agagcctaca ctaggctggg840 tcactgatac tcctcaggag cccactctat gattgggaga gataacccca ggtacaaagt900 atgcctatct gtctcaacac catggggcag aagatactcc actaaccacc catgacagaa960 agttagcctt ggctgtgtct ccattaatag aacacctcag aagaccaatg tgaaattgcc1020 taacccactc acacccaccc tgatctccag ttcaaaatgc agaaaacata atgcagttgt1080 ccaaaagatg ccccaaccac acacacacac acacacacac acacacacac acacacacac1140 acacacacac acacacacca tcaaggagcc tctgtaagga gtcaccaccc aataacactg1200 cctctttggg ctcatatcct ggacattctt catattcata tccatttggg gcctaggctt1260 tagatatccc caagggctca tctttacagg gatcagagat cccaataaat gccctggtcc1320 cacagcctcc ctcaggtatc tgtctgttta tctcttggta ccaagaccca acattgctgg1380 caggggtagg acaagcaacg cacgggaact ctgatcaaag aaagtcatga gatgcctgag1440 tccttcagga agtaaggagg gacaacctct ggtatccctg ttcttattgc taaagcccaa1500 gagacaggga gacctgctct aaattctcag tctaaacagc accgatggca ccacctgctc1560 agggaaagtc cagagcacac caatatcatt ttgccacagt tcctgagtct gcctttaccc1620 aggtccatac attgcatctg tcttgcttgc tctgctgccc cagggctcct ggaacaaagg1680 ctccaaatta gtgtgtccta cagcttggcc tgttctgtgc ctccgtctag cttgagctat1740 taggggacca gtcaatactc gctaagattc tccagaacca tcagggcacc ccaaccctta1800 tgcaaatgct cagtcacccc aagacttggc ttgaccctcc ctctctgtgt cccttcatag 1860
111
|
<210> |
10 |
|
<211> |
87 |
|
|
|
|
|
|
<212> |
DNA |
|
|
|
|
|
|
<213> |
Homo sapiens |
|
|
|
|
|
5 |
<400> |
10 |
|
|
|
|
|
|
agcctgtgga ccaccctgtc |
cacgtttgtg |
gccctcttca |
tcctcaccct |
cctctacagc |
60 |
|
ggcattgtca ctttcatcaa |
ggtgaag |
|
|
|
87 |
|
<210> |
11 |
|
|
|
|
|
|
<211> |
78 |
|
|
|
|
|
10 |
<212> |
DNA |
|
|
|
|
|
|
<213>. |
Homo sapiens |
|
|
|
|
|
|
<400> |
11 |
|
|
|
|
|
|
gggctgtgga cgaccatcac |
catcttcatc |
acactcttcc |
tgttaagcgt |
gtgctacagt |
60 |
|
gccaccgtca ccttcttc |
|
|
|
|
78 |
- 15 |
<210> |
12 |
|
|
|
|
|
|
<211> |
78 |
|
|
|
|
|
|
<212> |
DNA |
|
|
|
|
|
|
<213> |
Homo sapiens |
|
|
|
|
|
|
<400> |
12 |
|
|
|
|
|
20 |
gggctgtgga ccaccatcac |
catcttcatc |
acactcttcc |
tgctaagcgt |
gtgctacagt |
60 |
|
gccaccatca ccttcttc |
|
|
|
|
78 |
|
<210> |
13 |
|
|
|
|
|
|
<211> |
81 |
|
|
|
|
|
|
<212> |
DNA |
|
|
|
|
|
25 |
<213> |
Homo sapiens |
|
|
|
|
|
|
<400> |
13 |
|
|
|
|
|
|
aacctgtggg ccaccgcctc |
caccttcatc |
gtcctcttcc |
tcctgagcct |
cttctacagt |
60 |
accaccgtca ccttgttcaa g
|
<210> |
14 |
30 |
<211> |
63 |
|
<212> |
DNA |
|
<213> |
Mus musculus |
112 <400> 14
|
actgtgacct
aca |
tcctcaccct cttcctactg |
agcttgttct |
acagcacagc |
actcactgtt |
60
63 |
<210> |
15 |
5 |
<211> |
84 |
|
|
|
|
|
|
<212> |
DNA |
|
|
|
|
|
|
<213> |
Mus |
musculus |
|
|
|
|
|
<400> |
15 |
|
|
|
|
|
|
gggctctgga |
cgaccatcac catcttcatc |
agcctcttcc |
tgctcagtgt |
gtgctacagc |
60 |
10 |
gctgctgtca |
cactcttcaa ggta |
|
|
|
84 |
|
<210> |
16 |
|
|
|
|
|
|
<211> |
78 |
|
|
|
|
|
|
<212> |
DNA |
|
|
|
|
|
|
<213> |
Mus |
musculus |
|
|
|
|
15 |
<400> |
16 |
|
|
|
|
|
|
gggctctgga |
cgaccatcac catcttcatc |
agcctcttcc |
tgctcagcgt |
gtgctacagc |
60 |
|
gcctctgtca |
cactcttc |
|
|
|
78 |
|
<210> |
17 |
|
|
|
|
|
|
<211> |
78 |
|
|
|
|
|
20 |
<212> |
DNA |
|
|
|
|
|
|
<213> |
Mus |
musculus |
|
|
|
|
|
<400> |
17 |
|
|
|
|
|
|
gggctctgga |
cgaccatcac catcttcatc |
agcctcttcc |
tgctcagcgt |
gtgctacagc |
60 |
|
gcctctgtca |
ccctcttc |
|
|
|
78 |
25 |
<210> |
18 |
|
|
|
|
|
|
<211> |
84 |
|
|
|
|
|
|
<212> |
DNA |
|
|
|
|
|
|
<213> |
Mus |
musculus |
|
|
|
|
|
<400> |
18 |
|
|
|
|
|
30 |
aacctgtgga |
ccactgcctc caccttcatc |
gtcctcttcc |
tcctgagcct |
cttctacagc |
60 |
|
accaccgtca |
ccctgttcaa ggtg |
|
|
|
84 |
<210> 19
113 <211> 30 <212> PRT <213> Homo sapiens <400> 19
Gly Glu |
Ala |
Ala |
Arg |
Arg |
Pro |
Gly |
Leu |
Pro |
Leu |
Pro |
Leu |
Leu |
Leu |
Leu |
1 |
|
|
5 |
|
|
|
|
10 |
|
|
|
|
15 |
|
His Gin |
Leu |
Leu |
Leu |
Leu |
Phe |
Leu |
Ser |
His |
Leu |
Arg |
Arg |
Leu |
|
|
|
|
20 |
|
|
|
|
25 |
|
|
|
|
30 |
|
|
<210> |
20 |
|
|
|
|
|
|
|
|
|
|
|
|
|
<211> |
26 |
|
|
|
|
|
|
|
|
|
|
|
|
|
<212> |
PRT |
|
|
|
|
|
|
|
|
|
|
|
|
|
<213> |
Homo |
sapiens |
|
|
|
|
|
|
|
|
|
|
|
<400> |
20 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Asp Ala |
Ala |
His |
Pro |
Vai |
Ala |
Ala |
Ser |
Leu |
Pro |
Leu |
Leu |
Ala |
Gly |
Thr |
1 |
|
|
5 |
|
|
|
|
10 |
|
|
|
|
15 |
|
Leu Leu |
Leu |
Leu |
Gly |
Ala |
Ser |
Ala |
Ala |
Pro |
|
|
|
|
|
|
25 <210> 21 <211> 24 <212> PRT <213> Homo sapiens <400> 21
Ser Ser Ala Gly Ser Leu Ala Ala Gly Pro Leu Leu Vai Ala Leu Ala
1 |
5 |
10 |
15 |
Leu Tyr |
Pro Leu Ser Vai Leu Phe |
|
|
|
20 |
|
|
<210> |
22 |
|
|
<211> |
30 |
|
|
<212> |
PRT |
|
|
<213> |
Homo sapiens |
|
|
<400> |
22 |
|
|
Asp Ala Ala His Pro Gly Arg Ser Vai Vai Pro Ala Leu Leu Pro Leu
114
1 |
5 |
10 |
15 |
Leu j |
Ma Gly Thr Leu |
Leu Leu Leu Glu Thr Ala Thr |
Ala Pro |
|
20 |
25 |
30 |
<210: |
> 23 |
|
|
<211: |
> 26 |
|
|
<212: |
> PRT |
|
|
<213: |
> Homo sapiens |
|
|
<400: |
> 23 |
|
|
Ser . |
Ma Ser Ser Asn |
lie Ser Gly Gly lie Phe Leu |
Phe Phe Vai Ala |
1 |
5 |
10 |
15 |
Asn . |
Ma lie lie His |
Leu Phe Cys Phe Ser |
|
|
20 |
25 |
|
<210: |
> 24 |
|
|
<211: |
> 27 |
|
|
<212 |
> PRT |
|
|
<213 |
> Homo sapiens |
|
|
<400 |
> 24 |
|
|
Ala |
Ser Gly Thr Ser |
Pro Gly Leu Ser Ala Gly Ala |
Thr Vai Gly lie |
1 |
5 |
10 |
15 |
Met |
lie Gly Vai Leu |
Vai Gly Vai Ala Leu lie |
|
|
20 |
25 |
|
<210 |
> 25 |
|
|
<211 |
> 29 |
|
|
<212 |
> PRT |
|
|
<213 |
> Homo sapiens |
|
|
<400> 25
Ser |
Gly Thr |
Thr |
Arg |
Leu |
Leu |
Ser |
Gly |
His |
Thr |
Cys |
Phe Thr |
Leu Thr |
1 |
|
|
5 |
|
|
|
|
10 |
|
|
|
15 |
Gly |
Leu Leu |
Gly |
Thr |
Leu |
Vai |
Thr |
Met |
Gly |
Leu |
Leu |
Thr |
|
25 <210> 26 <211> 27
115
<212> |
PRT |
<213> |
Homo sapiens |
<400> |
26 |
Asn Gly Gly |
Thr |
Ser Leu Ser Glu Lys |
Thr Vai Leu Leu Leu Vai Thr |
1 |
|
|
5 |
|
|
|
|
10 |
|
|
|
|
15 |
|
Pro |
Phe Leu |
Ala |
Ala |
Ala |
Trp |
Ser |
Leu |
His |
Pro |
|
|
|
|
|
|
|
20 |
|
|
|
|
25 |
|
|
|
|
|
|
|
<210 |
> 27 |
|
|
|
|
|
|
|
|
|
|
|
|
|
<211 |
> 32 |
|
|
|
|
|
|
|
|
|
|
|
|
|
<212 |
> PRT |
|
|
|
|
|
|
|
|
|
|
|
|
|
<213 |
> Homo |
sapiens |
|
|
|
|
|
|
|
|
|
|
|
<400 |
> 27 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Cys |
Glu Gly |
He |
Ser |
Leu |
Leu |
Ala |
Gin |
Asn |
Thr |
Ser |
Trp |
Leu |
Leu |
Leu |
1 |
|
|
5 |
|
|
|
|
10 |
|
|
|
|
15 |
|
Leu |
Leu Leu |
Ser |
Leu |
Ser |
Leu |
Leu |
Gin |
Ala |
Thr |
Asp |
Phe |
Met |
Ser |
Leu |
25 30 <210> 28 <211> 22 <212> PRT <213> Homo sapiens <400> 28
Ser Gly Ala Pro Thr Leu Ser Pro Ser Leu Leu Gly Leu Leu Leu Pro
10 15
Ala Phe Gly lie Leu Vai <210> 29 <211> 39 <212> PRT <213> Homo sapiens <400> 29
Asp Leu Cys Asn Glu Lys Leu His Asn Ala Ala Pro Thr Arg Thr Ala
10 15
116
Leu Ala His Ser Ala Leu Ser Leu Gly Leu Ala Leu Ser Leu Leu Ala
25 30
Vai lie Leu Ala Pro Ser Leu <210> 30 <211> 24 <212> PRT <213> Homo sapiens <400> 30
Ser Gly Ala Gly Pro Trp Ala Ala Trp Pro Phe Leu Leu Ser Leu Ala
10 15
Leu Met Leu Leu Trp Leu Leu Ser <210> 31 <211> 26 <212> PRT <213> Homo sapiens <400> 31
Asn Ala Gly Glu Met Leu His Gly Thr Gly Gly Leu Leu Leu Ser Leu
5 10 15
Ala Leu Met Leu -Gin Leu Trp Leu Leu Gly
25 <210> 32 <211> 49 <212> PRT <213> Homo sapiens <400> 32
Ala |
Arg |
Gly |
Leu |
Met |
Asn |
Gly |
Tyr |
Arg |
Gly |
Pro |
Ala |
Met |
Asp |
Ser |
Glu |
1 |
|
|
|
5 |
|
|
|
|
10 |
|
|
|
|
15 |
|
Glu |
Asp |
Met |
Met |
Vai |
Thr |
Ala |
Leu |
His |
Ser |
Leu |
Thr |
Leu |
Gin |
Thr |
Vai |
|
|
|
20 |
|
|
|
|
25 |
|
|
|
|
30 |
|
|
Vai lie His Ser Leu Ser Ser Vai Leu Pro Gly lie Thr Leu Ala lie
117
As η <210> 33 <211> 30 <212> PRT <213> Homo sapiens <400> 33
Ser Ser Gly |
His Ser |
Arg |
His Arg Tyr |
Ala Leu |
lie Pro |
He |
Pro |
Leu |
1 |
|
5 |
|
|
|
|
10 |
|
|
|
|
15 |
|
Ala Vai |
lie |
Thr Thr |
Cys |
lie |
Vai |
Leu |
Tyr |
Met |
Asn |
Vai |
Leu |
|
|
|
|
20 |
|
|
|
25 |
|
|
|
|
30 |
|
|
<210> |
34 |
|
|
|
|
|
|
|
|
|
|
|
|
<211> |
27 |
|
|
|
|
|
|
|
|
|
|
|
|
<212> |
PRT |
|
|
|
|
|
|
|
|
|
|
|
|
<213> |
Homo |
sapiens |
|
|
|
|
|
|
|
|
|
|
|
<400> |
34 |
|
|
|
|
|
|
|
|
|
|
|
|
Ser Gly Ala |
Ser Ser |
Leu |
His |
Arg |
His |
Phe |
Gly |
Leu |
Leu |
Leu |
Ala |
Ser |
1 |
|
5 |
|
|
|
|
10 |
|
|
|
|
15
|
|
Leu Ala |
. Pro |
Leu Vai |
Leu |
Cys |
Leu |
Ser |
Leu |
Leu |
|
|
|
|
|
|
|
20 |
|
|
|
25 |
|
|
|
|
|
|
|
<210> |
35 |
|
|
|
|
|
|
|
|
|
|
|
|
<211> |
26 |
|
|
|
|
|
|
|
|
|
|
|
|
<212> |
PRT |
|
|
|
|
|
|
|
|
|
|
|
|
<213> |
Homo |
sapiens |
|
|
|
|
|
|
|
|
|
|
|
<400> |
35 |
|
|
|
|
|
|
|
|
|
|
|
|
Ser Thr |
Gly |
Ser His |
Cys |
His |
Gly |
Ser |
Phe |
Ser |
Leu |
He |
Phe |
Leu |
Ser |
1 |
|
5 |
|
|
|
|
10 |
|
|
|
|
15 |
|
Leu Trp Ala Vai lie Phe Vai Leu Tyr Gin
25 <210> 36 <211> 31
118 <212> PRT
<213> Homo sapiens |
|
<400> 36
Gly Ala Ala |
Pro Gin Pro Gly Pro Ala His Leu Ser Leu Thr lie Thr |
5 |
1 |
5 |
10 |
15 |
Leu Leu Met Thr Ala Arg Leu Trp Gly Gly Thr Leu Leu Trp Thr
25 30 <210> 37 <211> 30
10 |
<212> |
PRT |
|
|
|
|
|
|
|
|
|
|
|
|
<213> |
Mus musculus |
|
|
|
|
|
|
|
|
|
|
|
|
<400> |
37 |
|
|
|
|
|
|
|
|
|
|
|
|
Asn Ala |
Ala Vai Pro |
Thr |
Gly |
Ala |
Ser |
Thr |
Trp |
Thr |
Met |
Ala |
Gly |
Vai |
|
1 |
5 |
|
|
|
|
10 |
|
|
|
|
15 |
|
15 |
Leu Leu |
Phe Ser Leu |
Ser |
Ser |
Vai |
lie |
Leu |
Gin |
Thr |
Leu |
Leu |
|
|
- |
|
20 |
|
|
|
25 |
|
|
|
|
30 |
|
|
|
<210> |
38 |
|
|
|
|
|
|
|
|
|
|
|
|
<211> |
35 |
|
|
|
|
|
|
|
|
|
|
|
|
<212> |
PRT |
|
|
|
|
|
|
|
|
|
|
|
20 |
<213> |
Mus musculus |
|
|
|
|
|
|
|
|
|
|
|
|
<400> |
38 |
|
|
|
|
|
|
|
|
|
|
|
|
Asn Glu |
. Arg Leu Vai |
Ser |
Ala |
Ala |
Pro |
Gly |
His |
Ala |
Leu |
Leu |
Ser |
Ser |
|
1 |
5 |
|
|
|
|
10 |
|
|
|
|
15 |
|
|
Vai Thr |
Leu Gly Leu |
Ala |
Thr |
Ser |
Leu |
Ser |
Leu |
Leu |
Thr |
Vai |
Met |
Ala |
25 |
|
20 |
|
|
|
25 |
|
|
|
|
30 |
|
|
|
Leu Cys |
: Leu |
|
|
|
|
|
|
|
|
|
|
|
|
|
35 |
|
|
|
|
|
|
|
|
|
|
|
|
<210> |
39 |
|
|
|
|
|
|
|
|
|
|
|
|
<211> |
26 |
|
|
|
|
|
|
|
|
|
|
|
30 |
<212> |
PRT |
|
|
|
|
|
|
|
|
|
|
|
|
<213> |
Mus musculus |
|
|
|
|
|
|
|
|
|
|
|
<400> 39
119
|
Ser Ala Ala |
Ser |
His |
Tyr |
Gin |
Gly |
Ser |
Phe |
Pro |
Leu |
Vai |
He |
Leu |
Ser |
|
1 |
|
5 |
|
|
|
|
10 |
|
|
|
|
15 |
|
|
Leu Ser Ala |
Vai |
He |
Phe |
Vai |
Leu |
Tyr |
Gin |
|
|
|
|
|
|
|
|
20 |
|
|
|
|
25 |
|
|
|
|
|
|
|
5 |
<210> 40 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
<211> 24 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
<212> PRT |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
<213> Mus r |
nusculus |
|
|
|
|
|
|
|
|
|
|
|
|
<400> 40 |
|
|
|
|
|
|
|
|
|
|
|
|
|
10 |
Ser Ser Gly |
Vai |
Cys |
Trp |
Thr |
Ala |
Thr |
Trp |
Leu |
Vai |
Vai |
Thr |
Thr |
Leu |
|
1 |
|
5 |
|
|
|
|
10 |
|
|
|
|
15 |
|
|
lie lie His |
Arg |
lie |
Leu |
Leu |
Thr |
|
|
|
|
|
|
|
|
|
|
20 |
|
|
|
|
|
|
|
|
|
|
|
|
|
<210 |
> 41 |
|
|
|
|
|
|
|
|
|
|
|
|
|
15 |
<211 |
> 32 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
<212 |
> PRT |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
<213 |
> Mus n |
nusculus |
|
|
|
|
|
|
|
|
|
|
|
|
<400 |
> 41 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Asn |
Phe Ser |
Ala |
Ala |
Gly |
Leu |
Gly |
Leu |
Arg |
Ala |
Ser |
He |
Pro |
Leu |
Leu |
20 |
1 |
|
|
5 |
|
|
|
|
10 |
|
|
|
|
15 |
|
|
Gly |
Leu Gly |
Leu |
Leu |
Leu |
Ser |
Leu |
Leu |
Ala |
Leu |
Leu |
Gin |
Leu |
Ser |
Pro |
|
|
|
20 |
|
|
|
|
25 |
|
|
|
|
30 |
|
|
<210> 42 <2H> 16 <212> PRT <213> Mus musculus <400> 42
Ala Lys Ser Phe Tyr Phe lie Cys
Tyr Leu Cys Leu Tyr Leu Ala Leu <210> 43 <211> 22 <212> PRT
120 <213> Rattus norvegicus <400> 43
Gly Asn Ser |
Ala Glu Gly |
Ser |
Met |
Pro |
Ala |
Phe |
Leu |
Leu |
Phe |
Leu |
Leu |
1 |
|
5 |
|
|
|
10 |
|
|
|
|
15 |
|
Leu |
Gin Leu |
Trp Asp Thr |
|
|
|
|
|
|
|
|
|
|
|
|
20 |
|
|
|
|
|
|
|
|
|
|
<210 |
> 44 |
|
|
|
|
|
|
|
|
|
|
|
<211 |
> 32 |
|
|
|
|
|
|
|
|
|
|
|
<212 |
> PRT |
|
|
|
|
|
|
|
|
|
|
|
<213 |
> Rattus norvegicus |
|
|
|
|
|
|
|
|
|
|
<400 |
> 44 |
|
|
|
|
|
|
|
|
|
|
|
Cys |
Gly Gly |
lie Ser Leu |
Leu |
Vai |
Gin |
Asn |
Thr |
Ser |
Trp |
Leu |
Leu |
Leu |
1 |
|
5 |
|
|
|
10 |
|
|
|
|
15 |
|
Leu |
Leu Leu |
Ser Leu Ser |
Phe |
Leu |
Gin |
Ala |
Thr |
Asp |
Phe |
He |
Ser |
Leu |
25 30
210> |
45 |
211> |
29 |
212> |
PRT |
213> |
Rattus norvegicus |
400> |
45 |
Ser Ala Ala Thr Arg Pro Glu Pro His Tyr Phe Phe Leu Leu Phe Leu
10 15
Phe Thr Leu Vai Leu Ala Ala Ala Arg Pro Arg Trp Arg
25 <210> 46 <211> 24 <212> PRT <213> Rattus norvegicus <400> 46
Ser Ser Gly Vai His Trp lie Ala Ala Trp Leu Vai Vai Thr Leu Ser
10 15 lie lie Pro Ser lie Leu Leu Ala
121
|
20 |
|
|
<210> |
47 |
|
|
<211> |
26 |
|
|
<212> |
PRT |
|
|
<213> |
Rattus norvegicus |
|
|
<400> |
47 |
|
|
Ser Ala |
l Ala Ser His Tyr Gin Gly Ser |
Phe |
Pro Leu lie lie Leu Ser |
1 |
5 |
10 |
15 |
Phe Trp Ala Vai lie Leu Vai Leu Tyr Gin
25 <210> 48 <211> 22 <212> PRT <213> Rattus norvegicus <400> 48
Arg Asn Thr Gly Phe Leu Leu Ala Trp Pro Thr Phe Phe Leu Pro Vai
10 15
Phe Leu Ala Trp Leu Phe <210> 49 <211> 30 <212> PRT <213> Rattus norvegicus <400> 49
Ser |
Ser |
Ala Gly Ala Arg Glu |
Ser Cys Vai |
Ser |
Leu Phe Leu Vai Vai |
1 |
|
|
|
5 |
|
|
|
|
10 |
|
|
|
|
15 |
Leu |
Pro |
Ser |
Leu |
Leu |
Vai |
Gin |
Leu |
Leu |
Cys |
Leu |
Ala |
Glu |
Pro |
|
|
|
|
20 |
|
|
|
|
25 |
|
|
|
|
30 |
|
<210> |
50 |
<211> |
33 |
<212> |
PRT |
<213> |
Candida albicans |
122 <400> 50
Ser Ser Gly Vai Lys Ala Thr Gin
5
Ser He He Thr He Vai Thr Ala
Phe <210> 51 <2H> 32 <212> PRT <213> Yeast sp.
<400> 51
Asn Ala Ala Thr Asn Vai Lys Ala
5
Ser He He Ser Leu Ser He Ala <210> 52 <211> 25 <212> PRT <213> porcine <400> 52
Ala Arg Ala Ala Pro Thr Thr Ser
5
Ala Leu Ala He Leu Gly Trp Ser <210> 53 <211> 26 <212> PRT <213> porcine <400> 53
Ser Ala Ala Pro Ser Leu His Leu
5
Gin Met Ser Met Vai Lys Leu Vai
15
Phe Vai Gly Gly Met Ser Vai Vai
30
Asn Leu Ala Gin Vai Vai Phe Thr
15
Ala Gly Vai Gly Phe Ala Leu Vai
30
Leu Gly Ser Leu Met Thr Vai Ser
15
Vai
Pro Pro Gly Ser Leu Leu Ala Ser
15
123
|
Leu Vai |
Pro |
Leu |
Leu |
Leu Leu |
|
|
|
20 |
|
|
|
<210> |
54 |
|
|
|
|
<211> |
18 |
|
|
|
5 |
<212> |
PRT |
|
|
|
|
<213> |
Trypanosoma brucei |
|
<400> |
54 |
|
|
|
|
Ser Asn |
. Ser |
Phe |
Vai |
He His |
|
1 |
|
|
5 |
|
10 |
Leu Phe |
|
|
|
|
<210> |
55 |
|
|
|
|
<211> |
24 |
|
|
|
|
<212> |
PRT |
|
|
|
- 15 |
<213> |
Trypanosoma brucei |
|
<400> |
55 |
|
|
|
|
Asp Ser |
Ser |
He |
Leu |
Vai Thr |
|
1 |
|
|
5 |
|
|
Ala Ala |
l Phe |
Vai |
Ala |
Leu Leu |
20 |
<210> |
56 |
20 |
|
|
|
<211> |
24 |
|
|
|
|
<212> |
PRT |
|
|
|
|
<213> |
Trypanosoma brucei |
25 |
<400> |
56 |
|
|
|
|
Asn Gli |
' Ser |
Phe |
Leu |
Thr Ser |
|
1 |
|
|
5 |
|
|
Ala Ala |
i Phe |
Vai |
Ala |
Leu Leu |
|
|
|
20 |
|
|
30 |
<210> |
57 |
|
|
|
|
<211> |
18 |
|
|
|
|
<212> |
PRT |
|
|
|
Ser Leu Pro
Lys Ala Pro Leu Phe Leu Ala Phe Leu
15
Lys Lys Phe Ala Leu Thr Vai Vai Ser
15
Phe
Lys Gin Phe Ala Phe Ser Vai Vai Ser
15
Phe
124 <213> Trypanosoma brucei <400> 57
Ser Asn Ser Phe Vai lie Ser Lys Thr Pro Leu Trp Leu Ala Vai Leu
10 15
Leu Phe <210> 58 <211> 23 <212> PRT <213> Trypanosoma brucei <400> 58
Asp Gly Ser Phe Leu Vai Asn Lys Lys Phe Ala Leu Met Vai Tyr Asp
10 15
Phe Vai Ser Leu Leu Ala Phe <210> 59 <211> 23 <212> PRT <213> Trypanosoma brucei <400> 59
Asn Gly Ser Phe Leu Thr Ser Lys Gin Phe Ala Leu Met Vai Ser Ala
10 15
Ala Phe Vai Thr Leu Leu Phe
20 |
<210> |
60 |
<211> |
23 |
<212> |
PRT |
<213> |
Trypanosoma brucei |
<400> |
60 |
Gly Ala Ala Thr Leu Lys Ser Vai Ala Leu Pro Phe Ala lie Ala Ala
10 15
Ala Ala Leu Vai Ala Ala Phe
125 <210> 61 <211> 18 <212> PRT <213> Trypanosoma brucei <400> 61
Ser . |
Asn Ser Phe Vai |
He Asn Lys |
Ala |
Pro |
Leu |
Leu |
Leu |
Gly |
Phe |
Leu |
1 |
.5 |
|
|
10 |
|
|
|
|
15 |
|
Leu |
Phe |
|
|
|
|
|
|
|
|
|
<210 |
> 62 |
|
|
|
|
|
|
|
|
|
<211 |
> 20 |
|
|
|
|
|
|
|
|
|
<212 |
> PRT |
|
|
|
|
|
|
|
|
|
<213 |
> Trypanosoma |
Congolense |
|
|
|
|
|
|
|
|
<400 |
> 62 . |
|
|
|
|
|
|
|
|
|
Ser |
Gly Ser Ser His |
Gly Thr Lys |
Ala |
He |
Arg |
Ser |
He |
Leu |
His |
Vai |
1 |
5 |
|
|
10 |
|
|
|
|
15 |
|
Ala Leu Leu Met
|
20 |
<210> |
63 |
<211> |
28 |
<212> |
PRT |
<213> |
Gallus sp |
<400> |
63 |
Ala Gly Asn Lys Leu lie Gin Gin His Leu Leu Vai He Thr Phe Vai
1015
Pro Phe He He Leu Gly Gin Leu Gin Gly Leu Gly
2025 <210>64 <211> 26 <212> PRT <213> Gallus sp.
126 <400> 64
Ala Thr Leu Gly Ser Pro Ser Thr Ser Ser Ser Phe Vai Ser Leu Leu
10 15
Leu Ser Ala Vai Thr Leu Leu Leu Leu Cys
25
210> |
65 |
211> |
25 |
212> |
PRT |
213> |
Torpedo marmorata |
:400> |
65 |
Ser Ser |
Ser |
Gly |
Thr |
Ser |
Ser |
Ser |
Lys |
Gly |
He |
He |
Phe |
Tyr |
Vai |
Leu |
1 |
|
|
5 |
|
|
|
|
10 |
|
|
|
|
15 |
|
Phe Ser |
lie |
Leu |
Tyr |
Leu |
He |
Phe |
Tyr |
|
|
|
|
|
|
|
|
|
20 |
|
|
|
|
25 |
|
|
|
|
|
|
|
<210> |
66 |
|
|
|
|
|
|
|
|
|
|
|
|
|
<211> |
24 |
|
|
|
|
|
|
|
|
|
|
|
|
|
<212> |
PRT |
|
|
|
|
|
|
|
|
|
|
|
|
|
<213> |
Hamster i |
sp. |
|
|
|
|
|
|
|
|
|
|
|
<400> |
66 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Ser Ser |
Ala |
Vai |
Leu |
Phe |
Ser |
Ser |
Pro |
Pro |
Vai |
He |
Leu |
Leu |
He |
Ser |
1 |
|
|
5 |
|
|
|
|
10 |
|
|
|
|
15 |
|
Phe Leu |
lie |
Phe |
Leu |
Met |
Vai |
Gly |
|
|
|
|
|
|
|
|
|
|
20 |
|
|
|
|
|
|
|
|
|
|
|
|
<210> |
67 |
|
|
|
|
|
|
|
|
|
|
|
|
|
<211> |
26 |
|
|
|
|
|
|
|
|
|
|
|
|
|
<212> |
PRT |
|
|
|
|
|
|
|
|
|
|
|
|
|
<213> |
Bos 1 |
taurus |
|
|
|
|
|
|
|
|
|
|
|
<400> |
67 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Ser Ala |
. Gly |
Ser |
His |
Cys |
Cys |
Gly |
Ser |
Phe |
Ser |
Leu |
He |
Phe |
Leu |
Ser |
1 |
|
|
5 |
|
|
|
|
10 |
|
|
|
|
15 |
|
Vai Leu |
i Ala |
Vai |
He |
He |
He |
Leu |
Tyr |
Gin |
|
|
|
|
|
|
127 <210> 68 <211> 23 <212> PRT <213> slime mold <400> 68
Ser Ser Ala Thr Thr He Ala Phe Asn Ala Phe Vai Vai Phe Ala He 15 10 15
Vai Leu Ser Vai Leu Leu Phe <210> 69 <211> 22 <212> PRT <213> slime mold <400> 69 ’
Gly Ser Ala Ser Thr Vai Vai Ala Ser Leu Ser Leu He He Phe Ser
10 15
Met He Leu Ser Leu Cys <210> 70 <211> 25 <212> DNA <213> Homo sapiens <400> 70 acctggccat gacccccctg atccc <210> 71 <211> 29 <212> DNA <213> Homo sapiens <400> 71 agctgcaact ggaggagagc tgtgcggag <210> 72 <211> 33
128
<212> |
DNA |
<213> |
Homo sapiens |
|
|
|
<400> |
72 |
|
|
|
|
agctgcaact |
ggaggagagc |
tgtgcggagg |
cgc |
33 |
<210> |
73 |
|
|
|
|
<211> |
25 |
|
|
|
|
<212> |
DNA |
|
|
|
|
<213> |
Homo sapiens |
|
|
|
<400> |
73 |
|
|
|
|
agggggaggt |
gagcgccgac |
gagga |
|
25 |
<210> |
74 |
|
|
|
|
<211> |
31 |
|
|
|
|
<212> |
DNA |
|
|
|
|
<213> |
Mus |
musculus |
|
|
|
<400> |
74 |
|
|
|
|
aacgtcaaga |
gccactttcc |
tatgtgctac |
t |
31 |
<210> |
75 |
|
|
|
|
<211> |
48 |
|
|
|
|
<212> |
DNA |
|
|
|
|
<213> |
MUS |
musculus |
|
|
|
<400> |
75 |
|
|
|
|
ggctgcaact |
ggacgagacc |
tgtgctgagg |
cccaggacgg ggagctgg |
48 |
<210> |
76 |
|
|
|
|
<211> |
27 |
|
|
|
|
<212> |
DNA |
|
|
|
|
<213> |
Mus |
musculus |
|
|
|
<400> |
76 |
|
|
|
|
ggctagacct |
ggatgatatc |
tgtgctg |
|
27 |
<210> 77 <211> 23 <212> DNA <213> Mus musculus
129 <400> 77 agctggaact gaatgagacc tgt <210> 78 <211> 33 <212> DNA <213> Mus musculus <400> 78 agggggaggt gaatgctgag gaggaaggct ttg <210> 79 <211> 4 <212> PRT <213> Homo sapiens <400> 79
Gly Phe Thr His <210> 80 <211> 4 <212> PRT <213> Homo sapiens <400> 80
Ala Cys Thr Thr <210> 81 <211> 4 <212> PRT <213> Homo sapiens <400> 81
Cys Ala Pro Ala <210> 82 <211> 4 <212> PRT
130 <213> Homo sapiens <400> 82
Ala Gly Thr Thr
5 |
<210> |
83 |
|
<211> |
4 |
|
<212> |
PRT |
|
<213> |
Homo sapiens |
|
<400> |
83 |
10 |
Thr Sei |
• Ser Pro |
|
1 |
|
|
<210> |
84 |
|
<211> |
4 |
|
<212> |
PRT |
15 |
<213> |
Homo sapiens |
|
<400> |
84 |
|
lie Thi |
: Vai Ser |
|
1 |
|
|
<210> |
85 |
20 |
<211> |
4 |
|
<212> |
PRT |
|
<213> |
Homo sapiens |
|
<400> |
85 |
|
Ser Gly Thr Thr |
25 |
1 |
|
|
<210> |
86 |
|
<211> |
4 |
|
<212> |
PRT |
|
<213> |
Homo sapiens |
30 |
<400> |
86 |
Glu Gin Leu Glu
131
|
<210> |
87 |
|
|
<211> |
4 |
|
|
<212> |
PRT |
|
|
<213> |
Homo |
sapiens |
5 |
<400> |
87 |
|
|
Lys Leu |
l Vai |
Lys |
|
1 |
|
|
|
<210> |
88 |
|
|
<211> |
4 |
|
10 |
<212> |
PRT |
|
|
<213> |
Homo |
sapiens |
|
<400> |
88 |
|
|
Gin Vai |
. Lys |
lie |
|
1 |
|
|
Í5 |
<210> |
89 |
|
|
<211> |
4 |
|
|
<212> |
PRT |
|
|
<213> |
Homo |
sapiens |
|
<400> |
89 |
|
20 |
Cys Cys |
; Gin |
Glu |
|
1 |
|
|
|
<210> |
90 |
|
|
<211> |
4 |
|
|
<212> |
PRT |
|
25 |
<213> |
Homo |
sapiens |
|
<400> |
90 |
|
Ala Ala Ala Met <210> 91 <211> 4 <212> PRT <213> Homo sapiens
132 <400> 91
Ala Met His Vai <210> 92
5 |
<211> |
4 |
|
|
<212> |
PRT |
|
|
<213> |
Homo |
sapiens |
|
<400> |
92 |
|
|
Gly Ser |
Arg |
Gly |
10 |
1 |
|
|
|
<210> |
93 |
|
|
<211> |
4 |
|
|
<212> |
PRT |
|
|
<213> |
Homo |
sapiens |
15 |
<400> |
93 |
|
- |
Thr Cys |
; lie |
Pro |
|
1 |
|
|
|
<210> |
94 |
|
|
<211> |
4 |
|
20 |
<212> |
PRT |
|
|
<213> |
Homo |
sapiens |
|
<400> |
94 |
|
|
Tyr Gli |
/· Tyr |
Ser |
|
1 |
|
|
25 |
<210> |
95 |
|
|
<211> |
4 |
|
|
<212> |
PRT |
|
|
<213> |
Homo |
sapiens |
|
<400> |
95 |
|
30 |
Arg lie |
; Lys |
Phe |
<210> 96
133 <211> 4 <212> PRT <213> Homo sapiens <400> 96
Gin Tyr Arg Ser <210> 97 <211> 4
<212: |
> PRT |
<213: |
> Mus musculus |
<400: |
> 97 |
Glu j |
\sp Leu Cys |
1 |
|
<210: |
> 98 |
<211: |
> 4 |
<212: |
> PRT |
<213: |
> Mus musculus |
<400: |
> 98 |
Thr Asp Leu Cys <210> 99 <211> 4 <212> PRT <213> Mus musculus <400> 99
Arg He Lys Phe <210> 100 <211> 4 <212> PRT <213> Mus musculus <400> 100
134
Asp Leu Ala Arg
|
<210> |
101 |
|
<211> |
4 |
5 |
<212> |
PRT |
|
<213> |
Mus musculus |
|
<400> |
101 |
|
Ser Sei |
: Phe Cys |
|
1 |
|
10 |
<210> |
102 |
|
<211> |
4 |
|
<212> |
PRT |
|
<213> |
Mus musculus |
|
<400> |
102 |
15 |
His Leu Met Phe |
|
1 |
|
|
<210> |
103 |
|
<211> |
4 |
|
<212> |
PRT |
20 |
<213> |
Rattus norvegicus |
<400> 103
Ala Pro Ser Ser
1 |
|
<210> |
104 |
25 |
<211> |
4 |
|
<212> |
PRT |
|
<213> |
Rattus norvegicus |
|
<400> |
104 |
Lys Leu Vai Lys i
<210> 105 <211> 4
135 <212> PRT <213> Rattus norvegicus <400> 105
Gly Gin Lys Thr <210> 106 <211> 4 <212> PRT <213> Rattus norvegicus <400>106
Thr Leu Ala Arg <210>107 <211>4 <212> PRT <213> Rattus norvegicus <400> 107
Arg He Lys Phe <210> 108 <211> 4 <212> PRT <213> Rattus norvegicus <400> 108
Asn Gly Thr Pro <210> 109 <211> 4 <212> PRT <213> Rattus norvegicus <400> 109
Asn Cys Leu Tyr
136 i
<210>110 <211> 4 <212> PRT <213> Candida albicans <400>110
Gly Ser Ser Ser <210>111 <211> 4 <212> PRT <213> Yeast sp.
<400>111
Ser Ser Lys Lys
151 <210>112 <211> 4 <212> PRT <213> porcine <400> 112
Glu Pro Leu Ser <210> 113 <211> 4 <212> PRT <213> porcine <400> 113
Asn Tyr Gly Tyr <210> 114 <211> 4 <212> PRT
137 <213> Trypanosoma brucei <400> 114
Asn Thr Thr Gly <210> 115 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 115
Asn Ala Cys Lys <210> 116 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 116
Glu Lys Cys Arg <210> 117 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 117
Thr Thr Gly Ser <210> 118 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 118
Glu Lys Cys Cys
138 <210> 119 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 119
Glu Asp Cys Arg <210> 120 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 120
Glu Pro Glu Pro <210> 121 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 121
Asn Thr Thr Ala <210> 122 <211> 4 <212> PRT <213> Trypanosoma congolense <400> 122
Ser His Leu Pro <210> 123 <211> 4 <212> PRT <213> Gallus sp.
139 <400> 123
Gin Cys Ser Gly .
<210> 124 <211> 4 <212> PRT <213> Gallus sp.
<400> 124
Thr Vai He Pro
1 <210> 125 <211> 4 <212> PRT <213> Torpedo marmorata <400> 125 ' Asp Gly Glu Leu <210> 126 <211> 4 <212> PRT <213> Hamster sp.
<400> 126
Asp Gly Arg Arg <210> 127 <211> 4 <212> PRT <213> Bos taurus <400> 127
Arg He Gin Phe <210> 128
140 <211> 4 <212> PRT <213> slime mold <400> 128
Asn Asn Vai Cys <210>129 <211> 4 <212> PRT <213> slime mold <400>129
Ser Thr Thr Thr <210> ' 130 <211> 2074 <212> DNA <213> Homo sapiens <400>130 cctccaccaa gggcccatcg gtcttccccc tggcaccctc ctccaagagc acctctgggg60 gcacagcggc cctgggctgc ctggtcaagg actacttccc cgaaccggtg acggtgtcgt120 ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta cagtcctcag180 gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc acccagacct240 acatctgcaa cgtgaatcac aagcccagca acaccaaggt ggacaagaaa gttggtgaga300 ggccagcaca gggagggagg gtgtctgctg gaagccaggc tcagcgctcc tgcctggacg360 catcccggct atgcagcccc agtccagggc agcaaggcag gccccgtctg cctcttcacc420 cggaggcctc tgcccgcccc actcatgctc agggagaggg tcttctggct ttttccccgg480 ctctgggcag gcacaggcta ggtgccccta acccaggccc tgcacacaaa ggggcaggtg540 ctgggctcag acctgccaag agccatatcc gggaggaccc tgcccctgac ctaagcccac600 cccaaaggcc aaactctcca ctccctcagc tcggacacct tctctcctcc cagattccag660 taactcccaa tcttctctct gcagagccca aatcttgtga caaaactcac acatgcccac720 cgtgcccagg taagccagcc caggcctcgc cctccagctc aaggcgggac aggtgcccta780 gagtagcctg catccaggga caggccccag ccgggtgctg acacgtccac ctccatctct840
141
tcctcagcac |
ctgaactcct |
ggggggaccg |
tcagtcttcc |
tcttcccccc |
aaaacccaag |
900 |
gacaccctca |
tgatctcccg |
gacccctgag |
gtcacatgcg |
tggtggtgga |
cgtgagccac |
960 |
gaagaccctg |
aggtcaagtt |
caactggtac |
gtggacggcg |
tggaggtgca |
taatgccaag |
1020 |
acaaagccgc |
gggaggagca |
gtacaacagc |
acgtaccgtg |
tggtcagcgt |
cctcaccgtc |
1080 |
ctgcaccagg |
actggctgaa |
tggcaaggag |
tacaagtgca |
aggtctccaa |
caaagccctc |
1140 |
ccagccccca |
tcgagaaaac |
catctccaaa |
gccaaaggtg |
ggacccgtgg |
ggtgcgaggg |
1200 |
ccacatggac |
agaggccggc |
tcggcccacc |
ctctgccctg |
agagtgaccg |
ctgtaccaac |
1260 |
ctctgtccct |
acagggcagc |
cccgagaacc |
acaggtgtac |
accctgcccc |
catcccggga |
1320 |
tgagctgacc |
aagaaccagg |
tcagcctgac |
ctgcctggtc |
aaaggcttct |
atcccagcga |
1380 |
catcgccgtg |
gagtgggaga |
gcaatgggca |
gccggagaac |
aactacaaga |
ccacgcctcc |
1440 |
cgtgctggac |
tccgacggct |
ccttcttcct |
ctacagcaag |
ctcaccgtgg |
acaagagcag |
1500 |
gtggcagcag |
gggaacgtct |
tctcatgctc |
cgtgatgcat |
gaggctctgc |
acaaccacta |
1560 |
cacgcagaag |
agcctctccc |
tgtctccggg |
taaatgagtg |
cgacggccgg |
caagcccccg |
1620 |
ctccccgggc |
tctcgcggtc |
gcacgaggat |
gcttggcacg |
taccccctgt |
acatacttcc |
1680 |
cgggcgccca |
gcatggaaat |
aaagcaccca |
gcgctgccct |
gggcccctgc |
gagactgtga |
1740 |
tggttctttc |
cacgggtcag |
gccgagtctg |
aggcctgagt |
ggcatgaggg |
aggcagagcg |
1800 |
ggtcccactg |
tccccacact |
ggcccaggct |
gtgcaggtgt |
gcctgggccg |
cctagggtgg |
1860 |
ggctcagcca |
ggggctgccc |
tcggcagggt |
gggggatttg |
ccagcgtggc |
cctccctcca |
1920 |
gcagcacctg |
ccctgggctg |
ggccacggga |
agccctagga |
gcccctgggg |
acagacacac |
1980 |
agcccctgcc |
tctgtaggag |
actgtcctgt |
tctgtgagcg |
ccctgtcctc |
cgacctccat |
2040 |
gcccactcgg |
gggcatgcga |
cagattgagg |
atcc |
|
|
2074 |
<210> 131 |
|
|
|
|
|
|
<211> 330 |
|
|
|
|
|
|
<212> PRT |
|
|
|
|
|
|
<213> Artificial |
|
|
|
|
|
<220>
<223> Amino acid sequence of the gamma-chain constant region encoded by plasmid plgG-A <400> 131
Ala Ser Thr Lys Gly Pro Ser Vai Phe Pro Leu Ala Pro Ser Ser Lys
10 15
Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Vai Lys Asp Tyr
142
25 30
|
Phe |
Pro |
Glu |
Pro |
Vai |
Thr |
Vai |
Ser |
Trp |
Asn |
Ser |
Gly |
Ala |
Leu |
Thr |
Ser |
|
|
|
35 |
|
|
|
|
40 |
|
|
|
|
45 |
|
|
|
|
Gly |
Vai |
His |
Thr |
Phe |
Pro |
Ala |
Vai |
Leu |
Gin |
Ser |
Ser |
Gly |
Leu |
Tyr |
Ser |
5 |
|
50 |
|
|
|
|
55 |
|
|
|
|
60 |
|
|
|
|
|
Leu |
Ser |
Ser |
Vai |
Vai |
Thr |
Vai |
Pro |
Ser |
Ser |
Ser |
Leu |
Gly |
Thr |
Gin |
Thr |
|
65 |
|
|
|
|
70 |
|
|
|
|
75 |
|
|
|
|
80 |
|
Tyr |
lie |
Cys |
Asn |
Vai |
Asn |
His |
Lys |
Pro |
Ser |
Asn |
Thr |
Lys |
Vai |
Asp |
Lys |
|
|
|
|
|
85 |
|
|
|
|
90 |
|
|
|
|
95 |
|
10 |
Lys |
Vai |
Glu |
Pro |
Lys |
Ser |
Cys |
Asp |
Lys |
Thr |
His |
Thr |
Cys |
Pro |
Pro |
Cys |
|
|
|
|
100 |
|
|
|
|
105 |
|
|
|
|
110 |
|
|
|
Pro |
Ala |
Pro |
Glu |
Leu |
Leu |
Gly |
Gly |
Pro |
Ser |
Vai |
Phe |
Leu |
Phe |
Pro |
Pro |
|
|
|
115 |
|
|
|
|
120 |
|
|
|
|
125 |
|
|
|
|
Lys |
Pro |
Lys |
Asp |
Thr |
Leu |
Met |
He |
Ser |
Arg |
Thr |
Pro |
Glu |
Vai |
Thr |
Cys |
15 |
|
130 |
|
|
|
|
135 |
|
|
|
|
140 |
|
|
|
|
|
Vai |
Vai |
Vai |
Asp |
Vai |
Ser |
His |
Glu |
Asp |
Pro |
Glu |
Vai |
Lys |
Phe |
Asn |
Trp |
|
145 |
|
|
|
|
150 |
|
|
|
|
155 |
|
|
|
|
160 |
|
Tyr |
Vai |
Asp |
Gly |
Vai |
Glu |
Vai |
His |
Asn |
Ala |
Lys |
Thr |
Lys |
Pro |
Arg |
Glu |
|
|
|
|
|
165 |
|
|
|
|
170 |
|
|
|
|
175 |
|
20 |
Glu |
Gin |
Tyr |
Asn |
Ser |
Thr |
Tyr |
Arg |
Vai |
Vai |
Ser |
Vai |
Leu |
Thr |
Vai |
Leu |
|
|
|
|
180 |
|
|
|
|
185 |
|
|
|
|
190 |
|
|
|
His |
Gin |
Asp |
Trp |
Leu |
Asn Gly |
Lys |
Glu |
Tyr |
Lys |
Cys |
Lys |
Vai |
Ser |
Asn |
|
|
|
195 |
|
|
|
|
200 |
|
|
|
|
205 |
|
|
|
|
Lys |
Ala |
Leu |
Pro |
Ala |
Pro |
He |
Glu |
Lys |
Thr |
He |
Ser |
Lys |
Ala |
Lys |
Gly |
25 |
|
210 |
|
|
|
|
215 |
|
|
|
|
220 |
|
|
|
|
|
Gin |
Pro |
Arg |
Glu |
Pro |
Gin |
Vai |
Tyr |
Thr |
Leu |
Pro |
Pro |
Ser |
Arg |
Asp |
Glu |
|
225 |
|
|
|
|
230 |
|
|
|
|
235 |
|
|
|
|
240 |
|
Leu |
Thr |
Lys |
Asn |
Gin |
Vai |
Ser |
Leu |
Thr |
Cys |
Leu |
Vai |
Lys |
Gly |
Phe |
Tyr |
|
|
|
|
|
245 |
|
|
|
|
250 |
|
|
|
|
255 |
|
30 |
Pro |
Ser |
Asp |
He |
Ala |
Vai |
Glu |
Trp |
Glu |
Ser |
Asn |
Gly |
Gin |
Pro |
Glu |
Asn |
|
|
|
|
260 |
|
|
|
|
265 |
|
|
|
|
270 |
|
|
|
Asn |
Tyr |
Lys |
Thr |
Thr |
Pro |
Pro |
Vai |
Leu |
Asp |
Ser |
Asp |
Gly |
Ser |
Phe |
Phe |
143
|
|
|
275 |
|
|
|
|
280 |
|
|
|
|
285 |
|
|
|
Leu |
Tyr |
Ser |
Lys |
Leu |
Thr |
Vai |
Asp |
Lys |
Ser |
Arg |
Trp |
Gin |
Gin |
Gly Asn |
|
|
290 |
|
|
|
|
295 |
|
|
|
|
300 |
|
|
|
|
Vai |
Phe |
Ser |
Cys |
Ser |
Vai |
Met |
HÍS |
Glu |
Ala |
Leu |
His |
Asn |
His |
Tyr Thr |
5 |
305 |
|
|
|
|
310 |
|
|
|
|
315 |
|
|
|
320 |
|
Gin |
Lys |
Ser |
Leu |
Ser |
Leu |
Ser |
Pro |
Gly |
Lys |
|
|
|
|
|
325 |
330 |
|
<210> |
132 |
|
|
|
|
|
<211> |
40 |
|
|
|
|
10 |
<212> |
DNA |
|
|
|
|
|
<213> |
Artificial |
|
|
|
|
|
<220> |
|
|
|
|
|
|
<223> |
TM-fwl |
|
|
|
|
|
<400> |
132 |
|
|
|
|
15 |
ggccgagtct gaggcctgag |
tggcatgagg |
gaggcagagt |
|
40 |
|
<210> |
133 |
|
|
|
|
|
<211> |
48 |
|
|
|
|
|
<212> |
DNA |
|
|
|
|
|
<213> |
Artificial |
|
|
|
|
20 |
<220> |
|
|
|
|
|
|
<223> |
TM-rvl |
|
|
|
|
|
<400> |
133 |
|
|
|
|
|
aactggatcc atgtagaaaa |
gaggagaagc |
cccgggggtc |
catgtagt |
48 |
|
<210> |
134
|
|
|
|
|
25 |
<211> |
47 |
|
|
|
|
|
<212> |
DNA |
|
|
|
|
|
<213> |
Artificial |
|
|
|
|
|
<220> |
|
|
|
|
|
|
<223> |
Ml-rv |
|
|
|
|
30 |
<400> |
134 |
|
|
|
|
|
gatccacttc accttgaaga |
aggtgacggt |
ggcactgtag |
cacacgc |
47 |
<210> 135
144 <211> 49 <212> DNA <213> Artificial <220>
<223> M2-fw <400> 135 caccttcttc aaggtgaagt ggatcttctc <210> 136 <211> 33 <212> DNA <213> Artificial <220>
<223> TM-fw2 <400> 136 ctccagcagc agctgccctg ggctgggcca <210> 137 <211> 50 <212> DNA <213> Artificial <220>
<223> TM-rv2 <400> 137 cagggatccc ccgaggtgca gctggaccag <210> 138 <211> 68 <212> DNA <213> Artificial <220>
<223> mutSphl-l <400> 138 ctaccccaga cctccgctgc ttggtgcctg ctcggtggtg gacctgaag 49 cga 33 cctcctcctg accgtgtttt 50 cagggcactg ggggccaggt gtcccctcag 60 caggacgt
145
<210> |
139 |
<211> |
62 |
<212> |
DNA |
<213> |
Artificial |
<220> |
|
<223> |
mutSphI-2 |
<400> |
139 |
cctgctgagg ggacacctgg cccccagtgc cctgcaggca ccaagcagcg gaggtctggg gt
210> |
140 |
211> |
6949 |
212> |
DNA |
213> |
Homo sapiens |
400> |
140 |
cctccaccaa |
gggcccatcg |
gtcttccccc |
tggcaccctc |
ctccaagagc |
acctctgggg |
60 |
gcacagcggc |
cctgggctgc |
ctggtcaagg |
actacttccc |
cgaaccggtg |
acggtgtcgt |
120 |
ggaactcagg |
cgccctgacc |
agcggcgtgc |
acaccttccc |
ggctgtccta |
cagtcctcag |
180 |
gactctactc |
cctcagcagc |
gtggtgaccg |
tgccctccag |
cagcttgggc |
acccagacct |
240 |
acatctgcaa |
cgtgaatcac |
aagcccagca |
acaccaaggt |
ggacaagaaa |
gttggtgaga |
300 |
ggccagcaca |
gggagggagg |
gtgtctgctg |
gaagccaggc |
tcagcgctcc |
tgcctggacg |
360 |
catcccggct |
atgcagcccc |
agtccagggc |
agcaaggcag |
gccccgtctg |
cctcttcacc |
420 |
cggaggcctc |
-tgcccgcccc |
actcatgctc |
agggagaggg |
tcttctggct |
ttttccccgg |
480 |
ctctgggcag |
gcacaggcta |
ggtgccccta |
acccaggccc |
tgcacacaaa |
ggggcaggtg |
540 |
ctgggctcag |
acctgccaag |
agccatatcc |
gggaggaccc |
tgcccctgac |
ctaagcccac |
600 |
cccaaaggcc |
aaactctcca |
ctccctcagc |
tcggacacct |
tctctcctcc |
cagattccag |
660 |
taactcccaa |
tcttctctct |
gcagagccca |
aatcttgtga |
caaaactcac |
acatgcccac |
720 |
cgtgcccagg |
taagccagcc |
caggcctcgc |
cctccagctc |
aaggcgggac |
aggtgcccta |
780 |
gagtagcctg |
catccaggga |
caggccccag |
ccgggtgctg |
acacgtccac |
ctccatctct |
840 |
tcctcagcac |
ctgaactcct |
ggggggaccg |
tcagtcttcc |
tcttcccccc |
aaaacccaag |
900 |
gacaccctca |
tgatctcccg |
gacccctgag |
gtcacatgcg |
tggtggtgga |
cgtgagccac |
960 |
gaagaccctg |
aggtcaagtt |
caactggtac |
gtggacggcg |
tggaggtgca |
taatgccaag |
1020 |
acaaagccgc |
gggaggagca |
gtacaacagc |
acgtaccgtg |
tggtcagcgt |
cctcaccgtc |
1080 |
146
ctgcaccagg |
actggctgaa |
tggcaaggag |
tacaagtgca |
aggtctccaa |
caaagccctc |
1140 |
ccagccccca |
tcgagaaaac |
catctccaaa |
gccaaaggtg |
ggacccgtgg |
ggtgcgaggg |
1200 |
ccacatggac |
agaggccggc |
tcggcccacc |
ctctgccctg |
agagtgaccg |
ctgtaccaac |
1260 |
ctctgtccct |
acagggcagc |
cccgagaacc |
acaggtgtac |
accctgcccc |
catcccggga |
1320 |
tgagctgacc |
aagaaccagg |
tcagcctgac |
ctgcctggtc |
aaaggcttct |
atcccagcga |
1380 |
catcgccgtg |
gagtgggaga |
gcaatgggca |
gccggagaac |
aactacaaga |
ccacgcctcc |
1440 |
cgtgctggac |
tccgacggct |
ccttcttcct |
ctacagcaag |
ctcaccgtgg |
acaagagcag |
1500 |
gtggcagcag |
gggaacgtct |
tctcatgctc |
cgtgatgcat |
gaggctctgc |
acaaccacta |
1560 |
cacgcagaag |
agcctctccc |
tgtctccggg |
taaatgagtg |
cgacggccgg |
caagcccccg |
1620 |
ctccccgggc |
tctcgcggtc |
gcacgaggat |
gcttggcacg |
taccccctgt |
acatacttcc |
1680 |
cgggcgccca |
gcatggaaat |
aaagcaccca |
gcgctgccct |
gggcccctgc |
gagactgtga |
1740 |
tggttctttc |
cacgggtcag |
gccgagtctg |
aggcctgagt |
ggcatgaggg |
aggcagagcg |
1800 |
ggtcccactg |
tccccacact |
ggcccaggct |
gtgcaggtgt |
gcctgggccg |
cctagggtgg |
1860 |
ggctcagcca |
ggggctgccc |
tcggcagggt |
gggggatttg |
ccagcgtggc |
cctccctcca |
1920 |
gcagcacctg |
ccctgggctg |
ggccacggga |
agccctagga |
gcccctgggg |
acagacacac |
1980 |
agcccctgcc |
tctgtaggag |
actgtcctgt |
tctgtgagcg |
ccctgtcctc |
cgacctccat |
2040 |
gcccactcgg |
gggcatgcct |
agtccatgcg |
cgtagggaca |
ggccctccct |
cacccatcta |
2100 |
cccccacggc |
actaacccct |
ggcagccctg |
cccagcctcg |
cacccgcatg |
gggacacaac |
2160 |
cgactccggg |
gacatgcact |
ctcgggccct |
gtggagggac |
tggtgcagat |
gcccacacac |
2220 |
acactcagcc |
cagacccgtt |
caacaaaccc |
cgcactgagg |
ttggccggcc |
acacggccac |
2280 |
cacacacaca |
cgtgcacgcc |
tcacacacgg |
agcctcaccc |
gggcgaaccg |
cacagcaccc |
2340 |
agaccagagc |
aaggtcctcg |
cacacgtgaa |
cactcctcgg |
acacaggccc |
ccacgagccc |
2400 |
cacgcggcac |
ctcaaggccc |
acgagccgct |
cggcagcttc |
tccacatgct |
gacctgctca |
2460 |
gacaaaccca |
gccctcctct |
cacaaggtgc |
ccctgcagcc |
gccacacaca |
cacaggcccc |
2520 |
cacacgcagg |
ggaacacacg |
ccacgtcgcg |
tccctggcac |
tggcccactt |
cccaatacag |
2580 |
cccttccctg |
cagctggggt |
cacatgaggt |
gtgggcttca |
ccatcctcct |
gccctctggg |
2640 |
cctcagggag |
ggacacggga |
gacggggagc |
gggtcctgct |
gagggccagg |
tcgctatcta |
2700 |
gggccgggtg |
tctggctgag |
tcccggggcc |
aaagctggtg |
cccagggcgg |
gcagctgtgg |
2760 |
ggagctgacc |
tcaggacatt |
gttggcccat |
cccggccggg |
ccctacatcc |
tgggccccgc |
2820 |
cacagaggga |
atcaccccca |
gaggcccaag |
cccaggggga |
cacagcactg |
accaccccct |
2880 |
tcctgtccag |
agctgcaact |
ggaggagagc |
tgtgcggagg |
cgcaggacgg |
ggagctggac |
2940 |
gggctgtgga cgaccatcac catcttcatc acactcttcc tgttaagcgt gtgctacagt 3000
147
gccaccgtca |
ccttcttcaa |
ggtcggccgc |
acgttgtccc |
cagctgtcct |
tgacattgtc |
3060 |
ccccatgctg |
tcacaaactg |
tctctgacac |
tgtcccacag |
gctgtcccca |
cctgtccctg |
3120 |
acgctgtccc |
ccatgctctc |
acaaactgtc |
cctgacattg |
tccccaatgc |
tgcccccacc |
3180 |
tgtccaacag |
tgtcccccag |
gctctcccca |
catgtccccg |
acactgtccc |
ccatgctgtc |
3240 |
cccatctgtc |
cccaacactg |
tcccccaccc |
tgtccccctt |
tgtccccaac |
actgtccccc |
3300 |
acagtttcca |
cctgtccctg |
acactgtccc |
ccatgctttc |
cccacctgtc |
cctgacacca |
3360 |
tcccccactc |
tgtcccctat |
agttcctggc |
cctgtccccc |
acgctgtccc |
ctacagtacc |
3420 |
tggcactgtc |
ccccatgctg |
tcccctcctg |
tatgaaaccc |
tgtcccacat |
gctgtcccca |
3480 |
cctgtccgtg |
acaatatccc |
ccacactgtc |
cccacctgtc |
cccgacactc |
tcctccacgt |
3540 |
tgttcttacc |
taaacccgac |
actttcctcc |
atgctgtccc |
cacccatctc |
cgacactgta |
3600 |
ccccacgttg |
tccccacctg |
tcctcaacac |
tgtcccccat |
gctgtcccca |
cctgtcccca |
3660 |
acactctcct |
ccatgctgtc |
cccacctgtc |
cctgatattg |
tcccccatgc |
agtctccacc |
3720 |
tgtccccaat |
gctgtccccc |
aggctgtacc |
taccagtaca |
acactgtccc |
ccatgctgtc |
3780 |
cccacctgtc |
cctgacactg |
tcccccacgc |
tgtcccctcc |
tgtccccgac |
actgtccccc |
3840 |
acactgtccc |
cacctgtccc |
caacactatc |
ctccatgctg |
tcccctcctg |
tccccacctg |
3900 |
tcccctacac |
tgtcccccat |
gctgtcccca |
ccagtcccca |
aaactttcct |
ccacactgtc |
3960 |
cccacctgtc |
cccaacactg |
tcccccacgc |
tatcccccct |
gtccccgaca |
atgtccccac |
4020 |
tgtttcctcc |
tgttccctcc |
tatccctgac |
actgtccgcc |
atgctgtccc |
cacctgtccc |
4080 |
tgacactgtc |
tcccactctg |
tcccctataa |
tccctgacac |
tgtcccccac |
gccgtcccct |
4140 |
cccgtatgca |
ccactgtccc |
ccaagctgtc |
cccacctgtc |
ctcaacacag |
tcccccatgc |
4200 |
tgtccccacc |
tgtccccaac |
actctcctcc |
atgtccccac |
ctgtccctga |
tattgtcccc |
4260 |
catgcagtcc |
ccacctgtcc |
ccgatgctgt |
cccccgggct |
gtacctacca |
gtccaacact |
4320 |
gtcccccaca |
'ctctccccac |
ctgtccctga |
tactgtcccc |
catgctgtcc |
ccacctgtcc |
4380 |
cggacactgt |
tctccacgat |
ctcccctcct |
gtccctgaca |
ctgtccccca |
cactgtcccc |
4440 |
acctgtcccc |
aacactatcc |
tccatcctgt |
cccaacctgt |
ctcctacact |
gtcccccatg |
4500 |
ctgtccccac |
cagtccccaa |
cactgtcctc |
catgctgtcc |
cccatgtccc |
caacactgtc |
4560 |
ccccatgcta |
cctcccctgc |
ccctgacaat |
gtccccactg |
tttcctgtcc |
cctcctatcc |
4620 |
ctgacactgt |
cccccatgct |
gtccccacct |
gtcccccaca |
tggtctccac |
cggtccctga |
4680 |
cactgtctcc |
cactctgtcc |
cctataatcc |
ctgacactgt |
cccccacacc |
gtcccctcct |
4740 |
gtatgcacca |
cggtccccca |
tgctgtcccc |
acctgtccct |
gatgctgtcc |
tccacacagt |
4800 |
ccccacctct |
ccctgacact |
gtccccatct |
ctccccaaca |
ctctcctcca |
tgctgtcctc |
4860 |
aactgtcccc aacactcttc cacactctgt ctccacctgt ccctgacact gtcccccaca 4920
148
|
ctgtcctcac |
ctgtgtctga |
cactgtcccc |
cacgctgtcc |
ccacctgtcc |
ctgacgctgt |
4980 |
|
cttctgtgct |
gtccacatgc |
tgttggtgcc |
ctggctctgc |
tctctatcac |
caagcctcag |
5040 |
|
agcaggcagt |
ggtgaggcca |
tggcacctgg |
gtggcatgag |
gggccggatg |
ggcctcaggg |
5100 |
|
gcagggctgt |
ggcctgcgtg |
gactgacagg |
tgggtgggcc |
ttgggggcag |
agaggtggcc |
5160 |
5 |
tcagtgccct |
gaggggtggg |
tggggctcgg |
gggcagggct |
gtggcctcgc |
tcacccctgt |
5220 |
|
gctgtgcctt |
gcctacaggt |
gaagtggatc |
ttctcctcgg |
tggtggacct |
gaagcagacc |
5280 |
|
atcatccccg |
actacaggaa |
catgatcgga |
cagggggcct |
agggccaccc |
tctgcggggt |
5340 |
|
gtccagggcc |
gcccagaccc |
cacacaccag |
ccatgggcca |
tgctcagcca |
ccacccaggc |
5400 |
|
cacacctgcc |
cccgacctca |
ccgccctcaa |
ccccatggct |
ctctggcctc |
gcagttgccc |
5460 |
10 |
tctgaccctg |
acacacctga |
cacgcccccc |
ttccagaccc |
tgtgcatagc |
aggtctaccc |
5520 |
|
cagacctccg |
ctgcttggtg |
cctgcagggc |
actgggggcc |
aggtgtcccc |
tcagcaggac |
5580 |
|
gtccttgccc |
tccggaccac |
aaggtgctca |
cacaaaagga |
ggcagtgacc |
ggtatcccag |
5640 |
|
gcccccaccc |
aggcaggagc |
tggccctgga |
gccaaccccg |
tccacgccag |
cctcctgaac |
5700 |
|
acaggcgtgg |
tttccagatg |
gtgagtggga |
gcatcagccg |
ccaaggtagg |
gaagccacag |
5760 |
15 |
caccatcagg |
ccctgttggg |
gaggcttccg |
agagctgcga |
aggctcactc |
agacggcctt |
5820 |
- |
cctcccagcc |
-cgcagccagc |
cagcctccat |
tccgggcact |
cccgtgaact |
cctgacatga |
5880 |
|
ggaatgacgt |
tgttctgatt |
tcaagcaaag |
aacgctgctc |
tctggctcct |
gggaacagtc |
5940 |
|
tcggtgccag |
caccacccct |
tggctgcctg |
cccacactgc |
tggattctcg |
ggtggaactc |
6000 |
|
gacccgcagg |
gacagccagc |
cccagagtcc |
gcactgggga |
gagaaggggc |
caggcccagg |
6060 |
20 |
acactgccac |
•ctcccaccca |
ctccagtcca |
ccgagatcac |
tcggagaaga |
gtctgggcca |
6120 |
|
tgtggccgct |
gcaggagccc |
cacagtgcaa |
gggtgaggat |
agcccaagga |
agggctgggc |
6180 |
|
atctgcccag |
acaggcctcc |
cacagaaggc |
tggtgaccag |
gtcccaggcg |
ggcaagactc |
6240 |
|
agccttggtg |
gggcctgagg |
acagaggagg |
cccaggagca |
tcggggagag |
aggtggaggg |
6300 |
|
acaccgggag |
agccaggggc |
gtggacacag |
ccagaactca |
tcacagaggc |
tggcgtccag |
6360 |
25 |
tcccgggt-ca |
tgtgcagcag |
gaacaagcag |
ccactctggg |
ggcaccaggt |
ggagaggcaa |
6420 |
|
gacgacaaag |
agggtgcccg |
tgttcttgcg |
aaagcggggc |
tgctggccac |
gagtgctgga |
6480 |
|
cagaggcccc |
cacgctctgc |
tgcccccatc |
acgccgttcc |
gtgactgtca |
cgcagaatct |
6540 |
|
gcagacagga |
agggagactc |
gagcgggagt |
gcggccagag |
cctgcctcgg |
ccgtcaggga |
6600 |
|
ggactcc-cgg |
gctcactcga |
aggaggtgcc |
accatttcag |
ctttggtagc |
ttttcttctt |
6660 |
30 |
cttttaaatt |
t.tctaaagct |
cattaattgt |
ctttgatgtt |
tcttttgtga |
tgacaataaa |
6720 |
|
atatcctttt |
taagtcttgt |
acttcgtgat |
gggagccgcc |
ttcctgtgtc |
cacgcgcctc |
6780 |
|
ctgcccccgg |
tgggaagcac |
ggtcaggagg |
aggctggtcc |
agctgcacct |
cgggggctcc |
6840 |
149 ctgcactcgc cccccgcctc ctgcagccac acgcattgcc cgagcgaccc tccctggccc ctgtcactac atggaccccc ggggcttctc ctcttttcta catggatcc
6900
6949 <210> 141 <211> 330 <212> PRT <213> Homo sapiens <400> 141
|
Ala
1 |
Ser Thr |
Lys |
Gly
5 |
Pro |
Ser |
Vai |
Phe |
Pro Leu
10 |
Ala |
Pro |
Ser |
Ser
15 |
Lys |
10 |
Ser |
Thr |
Ser |
Gly |
Gly |
Thr |
Ala |
Ala |
Leu |
Gly |
Cys |
Leu |
Vai |
Lys |
Asp |
Tyr |
|
|
|
|
20 |
|
|
|
|
25 |
|
|
|
|
30 |
|
|
|
Phe |
Pro |
Glu |
Pro |
Vai |
Thr |
Vai |
Ser |
Trp |
Asn |
Ser |
Gly |
Ala |
Leu |
Thr |
Ser |
|
|
|
35 |
|
|
|
|
40 |
|
|
|
|
45 |
|
|
|
|
Gly |
Vai |
His |
Thr |
Phe |
Pro |
Ala |
Vai |
Leu |
Gin |
Ser |
Ser |
Gly |
Leu |
Tyr |
Ser |
15 |
|
50 |
|
|
|
|
55 |
|
|
|
|
60 |
|
|
|
|
-· |
Leu |
Ser |
Ser |
Vai |
Vai |
Thr |
Vai |
Pro |
Ser |
Ser |
Ser |
Leu |
Gly |
Thr |
Gin |
Thr |
|
65 |
|
|
|
|
70 |
|
|
|
|
75 |
|
|
|
|
80 |
|
Tyr |
He |
Cys |
Asn |
Vai |
Asn |
His |
Lys |
Pro |
Ser |
Asn |
Thr |
Lys |
Vai |
Asp |
Lys |
|
|
|
|
|
85 |
|
|
|
|
90 |
|
|
|
|
95 |
|
20 |
Lys |
Vai |
Glu |
Pro |
Lys |
Ser |
Cys |
Asp |
Lys |
Thr |
His |
Thr |
Cys |
Pro |
Pro |
Cys |
|
|
|
|
100 |
|
|
|
|
105 |
|
|
|
|
110 |
|
|
|
Pro |
Ala |
Pro |
Glu |
Leu |
Leu |
Gly |
Gly |
Pro |
Ser |
Vai |
Phe |
Leu |
Phe |
Pro |
Pro |
|
|
|
115 |
|
|
|
|
120 |
|
|
|
|
125 |
|
|
|
|
Lys |
Pro |
Lys |
Asp |
Thr |
Leu |
Met |
He |
Ser |
Arg |
Thr |
Pro |
Glu |
Vai |
Thr |
Cys |
25 |
|
130 |
|
|
|
|
135 |
|
|
|
|
140 |
|
|
|
|
|
Vai |
Vai |
Vai |
Asp |
Vai |
Ser |
His |
Glu |
Asp |
Pro |
Glu |
Vai |
Lys |
Phe |
Asn |
Trp |
|
145 |
|
|
|
|
150 |
|
|
|
|
155 |
|
|
|
|
160 |
|
Tyr |
Vai |
Asp |
Gly |
Vai |
Glu |
Vai |
His |
Asn |
Ala |
Lys |
Thr |
Lys |
Pro |
Arg |
Glu |
|
|
|
|
|
165 |
|
|
|
|
170 |
|
|
|
|
175 |
|
30 |
Glu |
Gin |
Tyr |
Asn |
Ser |
Thr |
Tyr |
Arg |
Vai |
Vai |
Ser |
Vai |
Leu |
Thr |
Vai |
Leu |
|
|
|
|
180 |
|
|
|
|
185 |
|
|
|
|
190 |
|
|
|
His |
Gin |
Asp |
Trp |
Leu |
Asn |
Gly |
Lys |
Glu |
Tyr |
Lys |
Cys |
Lys |
Vai |
Ser |
Asn |
150
195 200 205
|
Lys |
Ala |
Leu |
Pro |
Ala |
Pro |
He |
Glu |
Lys |
Thr |
He |
Ser |
Lys |
Ala |
Lys |
Gly |
|
|
210 |
|
|
|
|
215 |
|
|
|
|
220 |
|
|
|
|
|
Gin |
Pro |
Arg |
Glu |
Pro |
Gin |
Vai |
Tyr |
Thr |
Leu |
Pro |
Pro |
Ser |
Arg |
Asp |
Glu |
5 |
225 |
|
|
|
|
230 |
|
|
|
|
235 |
|
|
|
|
240 |
|
Leu |
Thr |
Lys |
Asn |
Gin |
Vai |
Ser |
Leu |
Thr |
Cys |
Leu |
Vai |
Lys |
Gly |
Phe |
Tyr |
|
|
|
|
|
245 |
|
|
|
|
250 |
|
|
|
|
255 |
|
|
Pro |
Ser |
Asp |
He |
Ala |
Vai |
Glu |
Trp |
Glu |
Ser |
Asn |
Gly |
Gin |
Pro |
Glu |
Asn |
|
|
|
|
260 |
|
|
|
|
265 |
|
|
|
|
270 |
|
|
10 |
Asn |
Tyr |
Lys |
Thr |
Thr |
Pro |
Pro |
Vai |
Leu |
Asp |
Ser |
Asp |
Gly |
Ser |
Phe |
Phe |
|
|
|
275 |
|
|
|
|
280 |
|
|
|
|
285 |
|
|
|
|
Leu |
Tyr |
Ser |
Lys |
Leu |
Thr |
Vai |
Asp |
Lys |
Ser |
Arg |
Trp |
Gin |
Gin |
Gly |
Asn |
|
|
290 |
|
|
|
|
295 |
|
|
|
|
300 |
|
|
|
|
|
Vai |
Phe |
Ser |
Cys |
Ser |
Vai |
Met |
His |
Glu |
Ala |
Leu |
His |
Asn |
His |
Tyr |
Thr |
-15 |
305 |
|
|
|
|
310 |
|
|
|
|
315 |
|
|
|
|
320 |
- |
Gin |
Lys |
Ser |
Leu |
Ser |
Leu |
Ser |
Pro |
Gly |
Lys |
|
|
|
|
|
|
|
|
|
|
|
325 |
|
|
|
|
330 |
|
|
|
|
|
|
|
<210> |
142 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
<211> |
399 |
|
|
|
|
|
|
|
|
|
|
|
|
|
20 |
<212 |
;> PRT |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
<213 |
! > Homo |
sapiens |
|
|
|
|
|
|
|
|
|
|
|
|
<400> |
142 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ala |
Ser |
Thr |
Lys |
Gly |
Pro |
Ser |
Vai |
Phe |
Pro |
Leu |
Ala |
Pro |
Ser |
Ser |
Lys |
|
1 |
|
|
|
5 |
|
|
|
|
10 |
|
|
|
|
15 |
|
25 |
Ser |
Thr |
Ser |
•Gly |
Gly |
Thr |
Ala |
Ala |
Leu |
Gly |
Cys |
Leu |
Vai |
Lys |
Asp |
Tyr |
|
|
|
|
20 |
|
|
|
|
25 |
|
|
|
|
30 |
|
|
|
Phe |
Pro |
Glu |
Pro |
Vai |
Thr |
Vai |
Ser |
Trp |
Asn |
Ser |
Gly |
Ala |
Leu |
Thr |
Ser |
|
|
|
35 |
|
|
|
|
40 |
|
|
|
|
45 |
|
|
|
|
Gly |
Vai |
His |
Thr |
Phe |
Pro |
Ala |
Vai |
Leu |
Gin |
Ser |
Ser |
Gly |
Leu |
Tyr |
Ser |
30 |
|
50 |
|
|
|
|
55 |
|
|
|
|
60 |
|
|
|
|
|
Leu |
Ser |
Ser |
Vai |
Vai |
Thr |
Vai |
Pro |
Ser |
Ser |
Ser |
Leu |
Gly |
Thr |
Gin |
Thr |
|
65 |
|
|
|
|
70 |
|
|
|
|
75 |
|
|
|
|
80 |
151
|
Tyr |
He |
Cys |
Asn Vai Asn His
85 |
Lys |
Pro |
Ser
90 |
Asn Thr |
Lys |
Vai |
Asp
95 |
Lys |
|
Lys |
Vai |
Glu |
Pro |
Lys |
Ser |
Cys |
Asp |
Lys |
Thr |
His |
Thr |
Cys |
Pro |
Pro |
Cys |
|
|
|
|
100 |
|
|
|
|
105 |
|
|
|
|
110 |
|
|
5 |
Pro |
Ala |
Pro |
Glu |
Leu |
Leu |
Gly |
Gly |
Pro |
Ser |
Vai |
Phe |
Leu |
Phe |
Pro |
Pro |
|
|
|
115 |
|
|
|
|
120 |
|
|
|
|
125 |
|
|
|
|
Lys |
Pro |
Lys |
Asp |
Thr |
Leu |
Met |
He |
Ser |
Arg |
Thr |
Pro |
Glu |
Vai |
Thr |
Cys |
|
|
130 |
|
|
|
|
135 |
|
|
|
|
140 |
|
|
|
|
|
Vai |
Vai |
Vai |
Asp |
Vai |
Ser |
His |
Glu |
Asp |
Pro |
Glu |
Vai |
Lys |
Phe |
Asn |
Trp |
10 |
145 |
|
|
|
|
150 |
|
|
|
|
155 |
|
|
|
|
160 |
|
Tyr |
Vai |
Asp |
Gly |
Vai |
Glu |
Vai |
His |
Asn |
Ala |
Lys |
Thr |
Lys |
Pro |
Arg |
Glu |
|
|
|
|
|
165 |
|
|
|
|
170 |
|
|
|
|
175 |
|
|
Glu |
Gin |
Tyr |
Asn |
Ser |
Thr |
Tyr |
Arg |
Vai |
Vai |
Ser |
Vai |
Leu |
Thr |
Vai |
Leu |
|
|
|
|
180 |
|
|
|
|
185 |
|
|
|
|
190 |
|
|
- 15 |
His |
Gin |
Asp |
Trp |
Leu |
Asn |
Gly |
Lys |
Glu |
Tyr |
Lys |
Cys |
Lys |
Vai |
Ser |
Asn |
|
|
|
195 |
|
|
|
|
200 |
|
|
|
|
205 |
|
|
|
|
Lys |
Ala |
Leu |
Pro |
Ala |
Pro |
He |
Glu |
Lys |
Thr |
He |
Ser |
Lys |
Ala |
Lys |
Gly |
|
|
210 |
|
|
|
|
215 |
|
|
|
|
220 |
|
|
|
|
|
Gin |
Pro |
Arg |
Glu |
Pro |
Gin |
Vai |
Tyr |
Thr |
Leu |
Pro |
Pro |
Ser |
Arg |
Asp |
Glu |
20 |
225 |
|
|
|
|
230 |
|
|
|
|
235 |
|
|
|
|
240 |
|
Leu |
Thr |
Lys |
Asn |
Gin |
Vai |
Ser |
Leu |
Thr |
Cys |
Leu |
Vai |
Lys |
Gly |
Phe |
Tyr |
|
|
|
|
|
245 |
|
|
|
|
250 |
|
|
|
|
255 |
|
|
Pro |
Ser |
Asp |
lie |
Ala |
Vai |
Glu |
Trp |
Glu |
Ser |
Asn |
Gly |
Gin |
Pro |
Glu |
Asn |
|
|
|
|
260 |
|
|
|
|
265 |
|
|
|
|
270 |
|
|
25 |
Asn |
Tyr |
Lys |
Thr |
Thr |
Pro |
Pro |
Vai |
Leu |
Asp |
Ser |
Asp |
Gly |
Ser |
Phe |
Phe |
|
|
|
275 |
|
|
|
|
280 |
|
|
|
|
285 |
|
|
|
|
Leu |
Tyr |
Ser |
Lys |
Leu |
Thr |
Vai |
Asp |
Lys |
Ser |
Arg |
Trp |
Gin |
Gin |
Gly |
Asn |
|
|
290 |
|
|
|
|
295 |
|
|
|
|
300 |
|
|
|
|
|
Vai |
Phe |
Ser |
Cys |
Ser |
Vai |
Met |
His |
Glu |
Ala |
Leu |
His |
Asn |
His |
Tyr |
Thr |
30 |
305 |
|
|
|
|
310 |
|
|
|
|
315 |
|
|
|
|
320 |
|
Gin |
Lys |
Ser |
Leu |
Ser |
Leu |
Ser |
Pro |
Glu |
Leu |
Gin |
Leu |
Glu |
Glu |
Ser |
Cys |
325 330 335
152
Ala Glu Ala Gin Asp Gly Glu Leu Asp Gly Leu Trp Thr Thr He Thr
340
345
350
He Phe He Thr Leu Phe Leu Leu Ser Vai Cys Tyr Ser Ala Thr Vai
355
360
365
Thr Phe Phe Lys Vai Lys Trp He Phe Ser Ser Vai Vai Asp Leu Lys
370
375
380
Gin Thr He He Pro Asp Tyr Arg Asn Met He Gly Gin Gly Ala
385
390
395 <210> 143 <211> 4608 <212> DNA <213> Homo sapiens <400> 143 cctccaccaa gggcccatcg gtcttccccc tggcaccctc ctccaagagc acctctgggg60 gcacagcggc cctgggctgc ctggtcaagg actacttccc cgaaccggtg acggtgtcgt120 ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta cagtcctcag180 gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc acccagacct240 acatctgcaa cgtgaatcac aagcccagca acaccaaggt ggacaagaaa gttggtgaga300 ggccagcaca gggagggagg gtgtctgctg gaagccaggc tcagcgctcc tgcctggacg360 catcccggct atgcagcccc agtccagggc agcaaggcag gccccgtctg cctcttcacc420 cggaggcctc tgcccgcccc actcatgctc agggagaggg tcttctggct ttttccccgg480 ctctgggcag gcacaggcta ggtgccccta acccaggccc tgcacacaaa ggggcaggtg540 ctgggctcag acctgccaag agccatatcc gggaggaccc tgcccctgac ctaagcccac600 cccaaaggcc aaactctcca ctccctcagc tcggacacct tctctcctcc cagattccag660 taactcccaa tcttctctct gcagagccca aatcttgtga caaaactcac acatgcccac720 cgtgcccagg taagccagcc caggcctcgc cctccagctc aaggcgggac aggtgcccta780 gagtagcctg catccaggga caggccccag ccgggtgctg acacgtccac ctccatctct840 tcctcagcac ctgaactcct ggggggaccg tcagtcttcc tcttcccccc aaaacccaag900 gacaccctca tgatctcccg gacccctgag gtcacatgcg tggtggtgga cgtgagccac960 gaagaccctg aggtcaagtt caactggtac gtggacggcg tggaggtgca taatgccaag1020 acaaagccgc gggaggagca gtacaacagc acgtaccgtg tggtcagcgt cctcaccgtc1080 ctgcaccagg actggctgaa tggcaaggag tacaagtgca aggtctccaa caaagccctc 1140
153
|
ccagccccca |
tcgagaaaac |
catctccaaa |
gccaaaggtg |
ggacccgtgg |
ggtgcgaggg |
1200 |
|
ccacatggac |
agaggccggc |
tcggcccacc |
ctctgccctg |
agagtgaccg |
ctgtaccaac |
1260 |
|
ctctgtccct |
acagggcagc |
cccgagaacc |
acaggtgtac |
accctgcccc |
catcccggga |
1320 |
|
tgagctgacc |
aagaaccagg |
tcagcctgac |
ctgcctggtc |
aaaggcttct |
atcccagcga |
1380 |
5 |
catcgccgtg |
gagtgggaga |
gcaatgggca |
gccggagaac |
aactacaaga |
ccacgcctcc |
1440 |
|
cgtgctggac |
tccgacggct |
ccttcttcct |
ctacagcaag |
ctcaccgtgg |
acaagagcag |
1500 |
|
gtggcagcag |
gggaacgtct |
tctcatgctc |
cgtgatgcat |
gaggctctgc |
acaaccacta |
1560 |
|
cacgcagaag |
agcctctccc |
tgtctccggg |
taaatgagtg |
cgacggccgg |
caagcccccg |
1620 |
|
ctccccgggc |
tctcgcggtc |
gcacgaggat |
gcttggcacg |
taccccctgt |
acatacttcc |
1680 |
10 |
cgggcgccca |
gcatggaaat |
aaagcaccca |
gcgctgccct |
gggcccctgc |
gagactgtga |
1740 |
|
tggttctttc |
cacgggtcag |
gccgagtctg |
aggcctgagt |
ggcatgaggg |
aggcagagcg |
1800 |
|
ggtcccactg |
tccccacact |
ggcccaggct |
gtgcaggtgt |
gcctgggccg |
cctagggtgg |
1860 |
|
ggctcagcca |
ggggctgccc |
tcggcagggt |
gggggatttg |
ccagcgtggc |
cctccctcca |
1920 |
|
gcagcacctg |
ccctgggctg |
ggccacggga |
agccctagga |
gcccctgggg |
acagacacac |
1980 |
- 15 |
agcccctgcc |
tctgtaggag |
actgtcctgt |
tctgtgagcg |
ccctgtcctc |
cgacctccat |
2040 |
|
gcccactcgg |
gggcatgcct |
agtccatgcg |
cgtagggaca |
ggccctccct |
cacccatcta |
2100 |
|
cccccacggc |
actaacccct |
ggcagccctg |
cccagcctcg |
cacccacatg |
gggacacaac |
2160 |
|
cgactcctgg |
ggacatgcac |
tctcgggccc |
tgtggaggga |
ctggtccaga |
tgcccacaca |
2220 |
|
cacactcagc |
ccagacccgt |
tcaacaaacc |
ccgcactgag |
gttggccggc |
cacacggcca |
2280 |
20 |
ccacacacac |
acgtgcacgc |
ctcacacacg |
gagcttcacc |
cgggcgaacc |
gcacagcacc |
2340 |
|
cagaccagag |
caaggtcctc |
gcacacgtga |
acactcctcg |
gacacaggcc |
cccacgagcc |
2400 |
|
ccacgcggca |
cctcaaggcc |
cacgagccgc |
tcggcagctt |
ctccacttgc |
tgaccagctc |
2460 |
|
agacaaaccc |
agccctcctc |
tcacaaagtg |
cccctgcagc |
cgccacacac |
acacaggccc |
2520 |
|
ccacacacag |
gggaacacac |
gccacgtcac |
gtccctggca |
ctggcccact |
tcccaataca |
2580 |
25 |
gcccttccct |
gcagctgagg |
tcacatgagg |
tgtgggcttc |
accatcctcc |
tgccctctgg |
2640 |
|
gcctcaggga |
gggacacggg |
agacggggag |
tgggtcctgc |
tgagggccag |
gcctctatct |
2700 |
|
agggccgggt |
gtctggctga |
gtcccggggc |
caaagctggt |
gcccagggcg |
ggcagctgtg |
2760 |
|
gggagctgac |
ctcaggacac |
tgttggccca |
tcccggccgg |
gccctacatc |
ctgggccccg |
2820 |
|
ccacagaggg |
aatcaccccc |
agaggcccaa |
gcccaggggg |
acacagcact |
gaccaccccc |
2880 |
30 |
ttcctgtcca |
gagctgcaac |
tggaggagag |
ctgtgcggag |
gcgcaggacg |
gggagctgga |
2940 |
|
cgggctgtgg |
acgaccatca |
ccatcttcat |
cacactcttc |
ctgctaagcg |
tgtgctacag |
3000 |
|
tgccaccgtc |
accttcttca |
aggtgaagtg |
gatcttctcc |
tcggtggtgg |
acctgaagca |
3060 |
154
|
gaccatcgtc cccgactaca ggaacatgat aaggcagggg gcctagggcc accctctgcg |
3120
3180
3240
3300 |
gggtgtccag ggccgcccag |
accccacaca cgagccgtgg |
gccatgctca tggctctctg gcatagcagg |
gccaccaccc gcttcgcagt tctaccccag |
aggccacacc cgccctctga |
tgccccctga gccctgaaac |
cctcaccgcc gccccccttc |
ctcaacccca
cagaccctgt |
5 |
acctccgctg |
cttggtgcca |
gggcactggg |
ggccaggtgt |
cccctcagca |
ggacgtccct |
3360 |
|
gccctctgga |
ccaccaggtg |
ctcacacaaa |
aggaggtaac |
cggcatccca |
ggcccccact |
3420 |
|
caggcaggac |
ctcgccctgg |
agccaacccc |
gtccacgcca |
gcctcctgaa |
cacaggcatg |
3480 |
|
gtttccagat |
ggtgagtggg |
agcatcagtc |
gccaaggtag |
ggaagccaca |
gcaccatcag |
3540 |
|
gccctgttgg |
ggaggcttcc |
gagagctgcg |
aaggctcact |
cagacggcct |
tcctcccagc |
3600 |
10 |
ccgcagccag |
ccagcctcca |
ttccgggcac |
tcccgtgaac |
tcctgacatg |
aggaatgagg |
3660 |
|
ttgttctgat |
ttcaagcaaa |
gaacgctgct |
ctctggctcc |
tgagaacagt |
ctcggtgcca |
3720 |
|
gcaccacccc |
ttggctgcct |
gcccacactg |
ctggattctc |
gggtggaact |
cgacccgcag |
3780 |
|
ggacagccag |
ccccagagtc |
cgcactgggg |
agagaagggg |
ccaggcccag |
gacactgcca |
3840 |
|
cctcccaccc |
actccagtcc |
accgagatca |
ctcagagaag |
agcctgggcc |
atgtggccgc |
3900 |
15 |
tgcaggagcc |
ccacagtgca |
agggtgagga |
tagcccaagg |
aagggctggg |
catctgccca |
3960 |
- |
gacaggcctc |
ccacagaagg |
ctggtgacca |
ggtcccaggc |
gggcaagact |
cagccttggt |
4020 |
|
ggggcctgag |
gacagaggag |
gcccaggagc |
atcggggaga |
gaggtggagg |
gacaccggga |
4080 |
|
gagccaggag |
cgtggacaca |
gccagaactc |
accacagagg |
ctggcgtcca |
gtcccgggtc |
4140 |
|
acgtgcagca |
ggaacaagca |
gccactctgg |
gggcaccagg |
tggagaggca |
agacgacaaa |
4200 |
20 |
gagggtgccc |
gtgttcttgc |
gaaagcgggg |
ctgctggcca |
cgagtgctgg |
acagaggccc |
4260 |
|
ccacgctctg |
ctgcccccat |
cacgccgttc |
cgtgactgtc |
acgcagaatc |
cacagacagg |
4320 |
|
aagggaggct |
cgagcgggac |
tgcggccagc |
gcctgcctcg |
gccgtcaggg |
aggactcctg |
4380 |
|
ggctcactcg |
aaggaggtgt |
caccatttca |
gctttggctt |
ttcttcttct |
tttaaatttt |
4440 |
|
ctaaagctca |
ttaattgtct |
ttgatgtttc |
ttttttgatg |
acaataaaat |
atccttttta |
4500 |
25 |
agtcttgtac |
ttcgtgatgg |
gagccacctt |
cctgtgtcca |
cgcgcctcct |
gcccccggtg |
4560 |
|
gaaaacacgg |
tcaggaggag |
gctggtccag |
ctgcacctcg |
ggggatcc |
|
4608 |
<210> 144 <211> 330 <212> PRT <213> Artificial <220>
<223> Amino acid sequence of the short (slgG) isoform of the
155 gamma-chain constant region encoded by plasmid pmlgGdelta-A <400> 144
|
Ala
1 |
Ser Thr |
Lys |
Gly Pro
5 |
Ser Vai |
Phe |
Pro Leu
10 |
Ala |
Pro |
Ser |
Ser
15 |
Lys |
5 |
Ser |
Thr |
Ser |
Gly |
Gly |
Thr |
Ala |
Ala |
Leu |
Gly |
Cys |
Leu |
Vai |
Lys |
Asp |
Tyr |
|
|
|
|
20 |
|
|
|
|
25 |
|
|
|
|
30 |
|
|
|
Phe |
Pro |
Glu |
Pro |
Vai |
Thr |
Vai |
Ser |
Trp |
Asn |
Ser |
Gly |
Ala |
Leu |
Thr |
Ser |
|
|
|
35 |
|
|
|
|
40 |
|
|
|
|
45 |
|
|
|
|
Gly |
Vai |
His |
Thr |
Phe |
Pro |
Ala |
Vai |
Leu |
Gin |
Ser |
Ser |
Gly |
Leu |
Tyr |
Ser |
10 |
|
50 |
|
|
|
|
55 |
|
|
|
|
60 |
|
|
|
|
|
Leu |
Ser |
Ser |
Vai |
Vai |
Thr |
Vai |
Pro |
Ser |
Ser |
Ser |
Leu |
Gly |
Thr |
Gin |
Thr |
|
65 |
|
|
|
|
70 |
|
|
|
|
75 |
|
|
|
|
80 |
|
Tyr |
He |
Cys |
Asn |
Vai |
Asn |
His |
Lys |
Pro |
Ser |
Asn |
Thr |
Lys |
Vai |
Asp |
Lys |
|
|
|
|
|
85 |
|
|
|
|
90 |
|
|
|
|
95 |
|
15 |
Lys |
Vai |
Glu |
Pro |
Lys |
Ser |
Cys |
Asp |
Lys |
Thr |
His |
Thr |
Cys |
Pro |
Pro |
Cys |
|
|
|
|
100 |
|
|
|
|
105 |
|
|
|
|
110 |
|
|
|
Pro |
Ala |
Pro |
Glu |
Leu |
Leu |
Gly |
Gly |
Pro |
Ser |
Vai |
Phe |
Leu |
Phe |
Pro |
Pro |
|
|
|
115 |
|
|
|
|
120 |
|
|
|
|
125 |
|
|
|
|
Lys |
Pro |
Lys |
Asp |
Thr |
Leu |
Met |
He |
Ser |
Arg |
Thr |
Pro |
Glu |
Vai |
Thr |
Cys |
20 |
|
130 |
|
|
|
|
135 |
|
|
|
|
140 |
|
|
|
|
|
Vai |
Vai |
Vai |
Asp |
Vai |
Ser |
His |
Glu |
Asp |
Pro |
Glu |
Vai |
Lys |
Phe |
Asn |
Trp |
|
145 |
|
|
|
|
150 |
|
|
|
|
155 |
|
|
|
|
160 |
|
Tyr |
Vai |
Asp |
Gly |
Vai |
Glu |
Vai |
His |
Asn |
Ala |
Lys |
Thr |
Lys |
Pro |
Arg |
Glu |
|
|
|
|
|
165 |
|
|
|
|
170 |
|
|
|
|
175 |
|
25 |
Glu |
Gin |
Tyr |
Asn |
Ser |
Thr |
Tyr |
Arg |
Vai |
Vai |
Ser |
Vai |
Leu |
Thr |
Vai |
Leu |
|
|
|
|
180 |
|
|
|
|
185 |
|
|
|
|
190 |
|
|
|
His |
Gin |
Asp |
Trp |
Leu |
Asn |
Gly |
Lys |
Glu |
Tyr |
Lys |
Cys |
Lys |
Vai |
Ser |
Asn |
|
|
|
195 |
|
|
|
|
200 |
|
|
|
|
205 |
|
|
|
|
Lys |
Ala |
Leu |
Pro |
Ala |
Pro |
He |
Glu |
Lys |
Thr |
He |
Ser |
Lys |
Ala |
Lys |
Gly |
30 |
|
210 |
|
|
|
|
215 |
|
|
|
|
220 |
|
|
|
|
|
Gin |
Pro |
Arg |
Glu |
Pro |
Gin |
Vai |
Tyr |
Thr |
Leu |
Pro |
Pro |
Ser |
Arg |
Asp |
Glu |
225
230
235
240
156
Leu Thr |
Lys |
Asn Gin Vai
245 |
Ser |
Leu |
Thr |
Cys
250 |
Leu |
Vai |
Lys |
Gly |
Phe
255 |
Tyr |
Pro |
Ser |
Asp |
lie |
Ala |
Vai |
Glu |
Trp |
Glu |
Ser |
Asn |
Gly |
Gin |
Pro |
Glu |
Asn |
|
|
|
260 |
|
|
|
|
265 |
|
|
|
|
270 |
|
|
Asn |
Tyr |
Lys |
Thr |
Thr |
Pro |
Pro |
Vai |
Leu |
Asp |
Ser |
Asp |
Gly |
Ser |
Phe |
Phe |
|
|
275 |
|
|
|
|
280 |
|
|
|
|
285 |
|
|
|
Leu |
Tyr |
Ser |
Lys |
Leu |
Thr |
Vai |
Asp |
Lys |
Ser |
Arg |
Trp |
Gin |
Gin |
Gly |
Asn |
|
290 |
|
|
|
|
295 |
|
|
|
|
300 |
|
|
|
|
Vai |
Phe |
Ser |
Cys |
Ser |
Vai |
Met |
His |
Glu |
Ala |
Leu |
His |
Asn |
His |
Tyr |
Thr |
305 |
|
|
|
|
310 |
|
|
|
|
315 |
|
|
|
|
320 |
Gin |
Lys |
Ser |
Leu |
Ser |
Leu |
Ser |
Pro |
Gly |
Lys |
|
|
|
|
|
|
325 330 <210> 145 <211> 399 <212> PRT <213> Artificial <220>
<223> Amino acid sequence of the long (mlgG) isoform of the gamma-chain constant region encoded by plasmid pmlgGdelta-A <400> 145
Ala |
Ser |
Thr |
Lys |
Gly |
Pro |
Ser |
Vai |
Phe |
Pro |
Leu |
Ala |
Pro |
Ser |
Ser |
Lys |
1 |
|
|
|
5 |
|
|
|
|
10 |
|
|
|
|
15 |
|
Ser |
Thr |
Ser |
Gly |
Gly |
Thr |
Ala |
Ala |
Leu |
Gly |
Cys |
Leu |
Vai |
Lys |
Asp |
Tyr |
|
|
|
20 |
|
|
|
|
25 |
|
|
|
|
30 |
|
|
Phe |
Pro |
Glu |
Pro |
Vai |
Thr |
Vai |
Ser |
Trp |
Asn |
Ser |
Gly |
Ala |
Leu |
Thr |
Ser |
|
|
35 |
|
|
|
|
40 |
|
|
|
|
45 |
|
|
|
Gly |
Vai |
His |
Thr |
Phe |
Pro |
Ala |
Vai |
Leu |
Gin |
Ser |
Ser |
Gly |
Leu |
Tyr |
Ser |
|
50 |
|
|
|
|
55 |
|
|
|
|
60 |
|
|
|
|
Leu |
Ser |
Ser |
Vai |
Vai |
Thr |
Vai |
Pro |
Ser |
Ser |
Ser |
Leu |
Gly |
Thr |
Gin |
Thr |
65 |
|
|
|
|
70 |
|
|
|
|
75 |
|
|
|
|
80 |
Tyr |
He |
Cys |
Asn |
Vai |
Asn |
His |
Lys |
Pro |
Ser |
Asn |
Thr |
Lys |
Vai |
Asp |
Lys |
157
|
Lys |
Vai Glu |
Pro
100 |
Lys |
Ser |
Cys |
Asp |
Lys
105 |
Thr His |
Thr |
Cys |
Pro
110 |
Pro |
Cys |
|
Pro |
Ala |
Pro |
Glu |
Leu |
Leu |
Gly |
Gly |
Pro |
Ser |
Vai |
Phe |
Leu |
Phe |
Pro |
Pro |
|
|
|
115 |
|
|
|
|
120 |
|
|
|
|
125 |
|
|
|
5 |
Lys |
Pro |
Lys |
Asp |
Thr |
Leu |
Met |
He |
Ser |
Arg |
Thr |
Pro |
Glu |
Vai |
Thr |
Cys |
|
|
130 |
|
|
|
|
135 |
|
|
|
|
140 |
|
|
|
|
|
Vai |
Vai |
Vai |
Asp |
Vai |
Ser |
His |
Glu |
Asp |
Pro |
Glu |
Vai |
Lys |
Phe |
Asn |
Trp |
|
145 |
|
|
|
|
150 |
|
|
|
|
155 |
|
|
|
|
160 |
|
Tyr |
Vai |
Asp |
Gly |
Vai |
Glu |
Vai |
His |
Asn |
Ala |
Lys |
Thr |
Lys |
Pro |
Arg |
Glu |
10 |
|
|
|
|
165 |
|
|
|
|
170 |
|
|
|
|
175 |
|
|
Glu |
Gin |
Tyr |
Asn |
Ser |
Thr |
Tyr |
Arg |
Vai |
Vai |
Ser |
Vai |
Leu |
Thr |
Vai |
Leu |
|
|
|
|
180 |
|
|
|
|
185 |
|
|
|
|
190 |
|
|
|
His |
Gin |
Asp |
Trp |
Leu |
Asn |
Gly |
Lys |
Glu |
Tyr |
Lys |
Cys |
Lys |
Vai |
Ser |
Asn |
|
|
|
195 |
|
|
|
|
200 |
|
|
|
|
205 |
|
|
|
- 15 |
Lys |
Ala |
Leu |
Pro |
Ala |
Pro |
He |
Glu |
Lys |
Thr |
He |
Ser |
Lys |
Ala |
Lys |
Gly |
|
|
210 |
|
|
|
|
215 |
|
|
|
|
220 |
|
|
|
|
|
Gin |
Pro |
Arg |
Glu |
Pro |
Gin |
Vai |
Tyr |
Thr |
Leu |
Pro |
Pro |
Ser |
Arg |
Asp |
Glu |
|
225 |
|
|
|
|
230 |
|
|
|
|
235 |
|
|
|
|
240 |
|
Leu |
Thr |
Lys |
Asn |
Gin |
Vai |
Ser |
Leu |
Thr |
Cys |
Leu |
Vai |
Lys |
Gly |
Phe |
Tyr |
20 |
|
|
|
|
245 |
|
|
|
|
250 |
|
|
|
|
255 |
|
|
Pro |
Ser |
Asp |
He |
Ala |
Vai |
Glu |
Trp |
Glu |
Ser |
Asn |
Gly |
Gin |
Pro |
Glu |
Asn |
|
|
|
|
260 |
|
|
|
|
265 |
|
|
|
|
270 |
|
|
|
Asn |
Tyr |
Lys |
Thr |
Thr |
Pro |
Pro |
Vai |
Leu |
Asp |
Ser |
Asp |
Gly |
Ser |
Phe |
Phe |
|
|
|
275 |
|
|
|
|
280 |
|
|
|
|
285 |
|
|
|
25 |
Leu |
Tyr |
Ser |
Lys |
Leu |
Thr |
Vai |
Asp |
Lys |
Ser |
Arg |
Trp |
Gin |
Gin |
Gly |
Asn |
|
|
290 |
|
|
|
|
295 |
|
|
|
|
300 |
|
|
|
|
|
Vai |
Phe |
Ser |
Cys |
Ser |
Vai |
Met |
His |
Glu |
Ala |
Leu |
His |
Asn |
His |
Tyr |
Thr |
|
305 |
|
|
|
|
310 |
|
|
|
|
315 |
|
|
|
|
320 |
|
Gin |
Lys |
Ser |
Leu |
Ser |
Leu |
Ser |
Pro |
Glu |
Leu |
Gin |
Leu |
Glu |
Glu |
Ser |
Cys |
30 |
|
|
|
|
325 |
|
|
|
|
330 |
|
|
|
|
335 |
|
|
Ala |
Glu |
Ala |
Gin |
Asp |
Gly |
Glu |
Leu |
Asp |
Gly |
Leu |
Trp |
Thr |
Thr |
He |
Thr |
340 345 350
158
|
He Phe He |
Thr Leu |
Phe |
Leu |
Leu |
Ser |
Vai |
Cys |
Tyr |
Ser |
Ala |
Thr |
Vai |
|
355 |
|
|
|
360 |
|
|
|
|
365 |
|
|
|
|
Thr Phe Phe |
Lys Vai |
Lys |
Trp |
He |
Phe |
Ser |
Ser |
Vai |
Vai |
Asp |
Leu |
Lys |
|
370 |
|
|
375 |
|
|
|
|
380 |
|
|
|
|
5 |
Gin Thr He |
Vai Pro |
Asp |
Tyr |
Arg |
Asn |
Met |
He |
Arg |
Gin |
Gly |
Ala |
|
|
385 |
|
390 |
|
|
|
|
395 |
|
|
|
|
|
|
<210> 146 |
|
|
|
|
|
|
|
|
|
|
|
|
|
<211> 53 |
|
|
|
|
|
|
|
|
|
|
|
|
|
<212> PRT |
|
|
|
|
|
|
|
|
|
|
|
|
10 |
<213> Homo |
sapiens |
|
|
|
|
|
|
|
|
|
|
|
|
<400> 146 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Leu Trp Thr |
Thr He |
Thr |
He |
Phe |
He |
Thr |
Leu |
Phe |
Leu |
Leu |
Ser |
Vai |
|
1 |
5 |
|
|
|
|
10 |
|
|
|
|
15 |
|
|
Cys Tyr Ser |
Ala Thr |
Vai |
Thr |
Phe |
Phe |
Lys |
Vai |
Lys |
Trp |
He |
Phe |
Ser |
- 15 |
|
20 |
|
|
|
25 |
|
|
|
|
30 |
|
|
|
Ser Vai Vai |
Asp Leu |
Lys |
Gin |
Thr |
He |
Vai |
Pro |
Asp |
Tyr |
Arg |
Asn |
Met |
|
35 |
|
|
|
40 |
|
|
|
|
45 |
|
|
|
|
He Arg Gin |
Gly Ala |
|
|
|
|
|
|
|
|
|
|
|
|
50 |
|
|
|
|
|
|
|
|
|
|
|
|
20 |
<210> 147 |
|
|
|
|
|
|
|
|
|
|
|
|
|
<211> 34 |
|
|
|
|
|
|
|
|
|
|
|
|
|
<212> PRT |
|
|
|
|
|
|
|
|
|
|
|
|
|
<213> Homo |
sapiens |
|
|
|
|
|
|
|
|
|
|
|
|
<400> 147 |
|
|
|
|
|
|
|
|
|
|
|
|
25 |
Ala Gly Thr |
Thr Asp |
Ala |
Ala |
His |
Pro |
Gly |
Arg |
Ser |
Vai |
Vai |
Pro |
Ala |
|
1 |
5 |
|
|
|
|
10 |
|
|
|
|
15 |
|
|
Leu Leu Pro |
Leu Leu |
Ala |
Gly |
Thr |
Leu |
Leu |
Leu |
Leu |
Glu |
Thr |
Ala |
Thr |
25 30
Ala Pro <210> 148 <211> 4551
159 <212> DNA <213> Artificial <220>
<223> DNA sequence of the gamma-chain expression cassette constant region, from CHI to 3'UTR of expression plasmid plgG-GPI-B <400> 148 cctccaccaa gggcccatcg gtcttccccc tggcaccctc ctccaagagc acctctgggg60 gcacagcggc cctgggctgc ctggtcaagg actacttccc cgaaccggtg acggtgtcgt120 ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta cagtcctcag180 gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc acccagacct240 acatctgcaa cgtgaatcac aagcccagca acaccaaggt ggacaagaaa gttggtgaga300 ggccagcaca gggagggagg gtgtctgctg gaagccaggc tcagcgctcc tgcctggacg360 catcccggct atgcagcccc agtccagggc agcaaggcag gccccgtctg cctcttcacc420 cggaggcctc tgcccgcccc actcatgctc agggagaggg tcttctggct ttttccccgg480
-15 ctctgggcag gcacaggcta ggtgccccta acccaggccc tgcacacaaa ggggcaggtg540 ctgggctcag acctgccaag agccatatcc gggaggaccc tgcccctgac ctaagcccac600 cccaaaggcc aaactctcca ctccctcagc tcggacacct tctctcctcc cagattccag660 taactcccaa tcttctctct gcagagccca aatcttgtga caaaactcac acatgcccac720 cgtgcccagg taagccagcc caggcctcgc cctccagctc aaggcgggac aggtgcccta780 gagtagcctg catccaggga caggccccag ccgggtgctg acacgtccac ctccatctct840 tcctcagcac ctgaactcct ggggggaccg tcagtcttcc tcttcccccc aaaacccaag900 gacaccctca tgatctcccg gacccctgag gtcacatgcg tggtggtgga cgtgagccac960 gaagaccctg aggtcaagtt caactggtac gtggacggcg tggaggtgca taatgccaag1020 acaaagccgc gggaggagca gtacaacagc acgtaccgtg tggtcagcgt cctcaccgtc1080 ctgcaccagg actggctgaa tggcaaggag tacaagtgca aggtctccaa caaagccctc1140 ccagccccca tcgagaaaac catctccaaa gccaaaggtg ggacccgtgg ggtgcgaggg1200 ccacatggac agaggccggc tcggcccacc ctctgccctg agagtgaccg ctgtaccaac1260 ctctgtccct acagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga1320 tgagctgacc aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga1380 catcgccgtg gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc1440 cgtgctggac tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag1500 gtggcagcag gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta1560
160
|
cacgcagaag |
agcctctccc |
tgtctccggg |
taaatgagtg |
cgacggccgg |
caagcccccg |
1620 |
|
ctccccgggc |
tctcgcggtc |
gcacgaggat |
gcttggcacg |
taccccctgt |
acatacttcc |
1680 |
|
cgggcgccca |
gcatggaaat |
aaagcaccca |
gcgctgccct |
gggcccctgc |
gagactgtga |
1740 |
|
tggttctttc |
cacgggtcag |
gccgagtctg |
aggcctgagt |
ggcatgaggg |
aggcagagcg |
1800 |
5 |
ggtcccactg |
tccccacact |
ggcccaggct |
gtgcaggtgt |
gcctgggccg |
cctagggtgg |
1860 |
|
ggctcagcca |
ggggctgccc |
tcggcagggt |
gggggatttg |
ccagcgtggc |
cctccctcca |
1920 |
|
gcagcacctg |
ccctgggctg |
ggccacggga |
agccctagga |
gcccctgggg |
acagacacac |
1980 |
|
agcccctgcc |
tctgtaggag |
actgtcctgt |
tctgtgagcg |
ccctgtcctc |
cgacctccat |
2040 |
|
gcccactcgg |
gggcatgcct |
agtccatgcg |
cgtagggaca |
ggccctccct |
cacccatcta |
2100 |
10 |
cccccacggc |
actaacccct |
ggcagccctg |
cccagcctcg |
cacccacatg |
gggacacaac |
2160 |
|
cgactcctgg |
ggacatgcac |
tctcgggccc |
tgtggaggga |
ctggtccaga |
tgcccacaca |
2220 |
|
cacactcagc |
ccagacccgt |
tcaacaaacc |
ccgcactgag |
gttggccggc |
cacacggcca |
2280 |
|
ccacacacac |
acgtgcacgc |
ctcacacacg |
gagcttcacc |
cgggcgaacc |
gcacagcacc |
2340 |
|
cagaccagag |
caaggtcctc |
gcacacgtga |
acactcctcg |
gacacaggcc |
cccacgagcc |
2400 |
-15 |
ccacgcggca |
cctcaaggcc |
cacgagccgc |
tcggcagctt |
ctccacttgc |
tgaccagctc |
2460 |
|
agacaaaccc |
agccctcctc |
tcacaaagtg |
cccctgcagc |
cgccacacac |
acacaggccc |
2520 |
|
ccacacacag |
gggaacacac |
gccacgtcac |
gtccctggca |
ctggcccact |
tcccaataca |
2580 |
|
gcccttccct |
gcagctgagg |
tcacatgagg |
tgtgggcttc |
accatcctcc |
tgccctctgg |
2640 |
|
gcctcaggga |
gggacacggg |
agacggggag |
tgggtcctgc |
tgagggccag |
gcctctatct |
2700 |
20 |
agggccgggt |
gtctggctga |
gtcccggggc |
caaagctggt |
gcccagggcg |
ggcagctgtg |
2760 |
|
gggagctgac |
ctcaggacac |
tgttggccca |
tcccggccgg |
gccctacatc |
ctgggccccg |
2820 |
|
ccacagaggg |
aatcaccccc |
agaggcccaa |
gcccaggggg |
acacagcact |
gaccaccccc |
2880 |
|
ttcctgtcca |
gagctgcaac |
tggaggagag |
ctgtgcggag |
gcgcaggacg |
gggagctgga |
2940 |
|
cggggccggc |
accaccgacg |
ccgcgcaccc |
ggggcggtcc |
gtggtccccg |
cgttgcttcc |
3000 |
25 |
tctgctggcc |
gggaccctgc |
tgctgctgga |
gacggccact |
gctccctagg |
gccaccctct |
3060 |
|
gcggggtgtc |
cagggccgcc |
cagaccccac |
acacgagccg |
tgggccatgc |
tcagccacca |
3120 |
|
cccaggccac |
acctgccccc |
tgacctcacc |
gccctcaacc |
ccatggctct |
ctggcttcgc |
3180 |
|
agtcgccctc |
tgagccctga |
aacgcccccc |
ttccagaccc |
tgtgcatagc |
aggtctaccc |
3240 |
|
cagacctccg |
ctgcttggtg |
ccagggcact |
gggggccagg |
tgtcccctca |
gcaggacgtc |
3300 |
30 |
cctgccctct |
ggaccaccag |
gtgctcacac |
aaaaggaggt |
aaccggcatc |
ccaggccccc |
3360 |
|
actcaggcag |
gacctcgccc |
tggagccaac |
cccgtccacg |
ccagcctcct |
gaacacaggc |
3420 |
atggtttcca gatggtgagt gggagcatca gtcgccaagg tagggaagcc acagcaccat 3480
161
|
caggccctgt |
tggggaggct |
tccgagagct |
gcgaaggctc |
actcagacgg |
ccttcctccc |
3540 |
|
agcccgcagc |
cagccagcct |
ccattccggg |
cactcccgtg |
aactcctgac |
atgaggaatg |
3600 |
|
aggttgttct |
gatttcaagc |
aaagaacgct |
gctctctggc |
tcctgagaac |
agtctcggtg |
3660 |
|
ccagcaccac |
cccttggctg |
cctgcccaca |
ctgctggatt |
ctcgggtgga |
actcgacccg |
3720 |
5 |
cagggacagc |
cagccccaga |
gtccgcactg |
gggagagaag |
gggccaggcc |
caggacactg |
3780 |
|
ccacctccca |
cccactccag |
tccaccgaga |
tcactcagag |
aagagcctgg |
gccatgtggc |
3840 |
|
cgctgcagga |
gccccacagt |
gcaagggtga |
ggatagccca |
aggaagggct |
gggcatctgc |
3900 |
|
ccagacaggc |
ctcccacaga |
aggctggtga |
ccaggtccca |
ggcgggcaag |
actcagcctt |
3960 |
|
ggtggggcct |
gaggacagag |
gaggcccagg |
agcatcgggg |
agagaggtgg |
agggacaccg |
4020 |
10 |
ggagagccag |
gagcgtggac |
acagccagaa |
ctcaccacag |
aggctggcgt |
ccagtcccgg |
4080 |
|
gtcacgtgca |
gcaggaacaa |
gcagccactc |
tgggggcacc |
aggtggagag |
gcaagacgac |
4140 |
|
aaagagggtg |
cccgtgttct |
tgcgaaagcg |
gggctgctgg |
ccacgagtgc |
tggacagagg |
4200 |
|
cccccacgct |
ctgctgcccc |
catcacgccg |
ttccgtgact |
gtcacgcaga |
atccacagac |
4260 |
|
aggaagggag |
gctcgagcgg |
gactgcggcc |
agcgcctgcc |
tcggccgtca |
gggaggactc |
4320 |
- 15 |
ctgggctcac |
tcgaaggagg |
tgtcaccatt |
tcagctttgg |
cttttcttct |
tcttttaaat |
4380 |
- |
tttctaaagc |
tcattaattg |
tctttgatgt |
ttcttttttg |
atgacaataa |
aatatccttt |
4440 |
|
ttaagtcttg |
tacttcgtga |
tgggagccac |
cttcctgtgt |
ccacgcgcct |
cctgcccccg |
4500 |
|
gtggaaaaca |
cggtcaggag |
gaggctggtc |
cagctgcacc |
tcgggggatc |
c |
4551 |
<210> 149 <211> 330 <212> PRT <213> Artificial <220>
<223> amino acid sequence of the slgG isoform of the gamma-chain constant region encoded by plasmid plgG-GPI-B <400> 149
|
Ala |
Ser |
Thr Lys |
Gly |
Pro |
Ser |
Vai |
Phe |
Pro |
Leu |
Ala |
Pro |
Ser |
Ser |
Lys |
|
1 |
|
|
5 |
|
|
|
|
10 |
|
|
|
|
15 |
|
|
Ser |
Thr |
Ser Gly |
Gly |
Thr |
Ala |
Ala |
Leu |
Gly |
Cys |
Leu |
Vai |
Lys |
Asp |
Tyr |
30 |
|
|
20 |
|
|
|
|
25 |
|
|
|
|
30 |
|
|
|
Phe |
Pro |
Glu Pro |
Vai |
Thr |
Vai |
Ser |
Trp |
Asn |
Ser |
Gly |
Ala |
Leu |
Thr |
Ser |
162
|
Gly |
Vai |
His |
Thr |
Phe |
Pro |
Ala |
Vai |
Leu |
Gin |
Ser |
Ser |
Gly |
Leu |
Tyr |
Ser |
|
|
50 |
|
|
|
|
55 |
|
|
|
|
60 |
|
|
|
|
|
Leu |
Ser |
Ser |
Vai |
Vai |
Thr |
Vai |
Pro |
Ser |
Ser |
Ser |
Leu |
Gly |
Thr |
Gin |
Thr |
|
65 |
|
|
|
|
70 |
|
|
|
|
75 |
|
|
|
|
80 |
5 |
Tyr |
He |
Cys |
Asn |
Vai |
Asn |
His |
Lys |
Pro |
Ser |
Asn |
Thr |
Lys |
Vai |
Asp |
Lys |
|
|
|
|
|
85 |
|
|
|
|
90 |
|
|
|
|
95 |
|
|
Lys |
Vai |
Glu |
Pro |
Lys |
Ser |
Cys |
Asp |
Lys |
Thr |
His |
Thr |
Cys |
Pro |
Pro |
Pro |
|
|
|
|
100 |
|
|
|
|
105 |
|
|
|
|
110 |
|
|
|
Glu |
Leu |
Leu |
Gly |
Gly |
Pro |
Ser |
Vai |
Phe |
Leu |
Phe |
Pro |
Pro |
Lys |
Pro |
Lys |
10 |
|
|
115 |
|
|
|
|
120 |
|
|
|
|
125 |
|
|
|
|
Asp |
Thr |
Leu |
Met |
He |
Ser |
Arg |
Thr |
Pro |
Glu |
Vai |
Thr |
Cys |
Vai |
Vai |
Vai |
|
|
130 |
|
|
|
|
135 |
|
|
|
|
140 |
|
|
|
|
|
Asp |
Vai |
Ser |
His |
Glu |
Asp |
Pro |
Glu |
Vai |
Lys |
Phe |
Asn |
Trp |
Tyr |
Vai |
Asp |
|
145 |
|
|
|
|
150 |
|
|
|
|
155 |
|
|
|
|
160 |
15 |
Gly |
Vai |
Glu |
Vai |
His |
Asn |
Ala |
Lys |
Thr |
Lys |
Pro |
Arg |
Glu |
Glu |
Gin |
Tyr |
|
|
|
|
|
165 |
|
|
|
|
170 |
|
|
|
|
175 |
|
|
Asn |
Ser |
Thr |
Tyr |
Arg |
Vai |
Vai |
Ser |
Vai |
Leu |
Thr |
Vai |
Leu |
His |
Gin |
Asp |
|
|
|
|
180 |
|
|
|
|
185 |
|
|
|
|
190 |
|
|
|
Trp |
Leu |
Asn |
Gly |
Lys |
Glu |
Tyr |
Lys |
Cys |
Lys |
Vai |
Ser |
Asn |
Lys |
Ala |
Leu |
20 |
|
|
195 |
|
|
|
|
200 |
|
|
|
|
205 |
|
|
|
|
Pro |
Ala |
Pro |
He |
-Glu |
Lys |
Thr |
He |
Ser |
Lys |
Ala |
Lys |
Ala |
Cys |
Pro |
Gly |
|
|
210 |
|
|
|
|
215 |
|
|
|
|
220 |
|
|
|
|
|
Gin |
Pro |
Arg |
Glu |
Pro |
Gin |
Vai |
Tyr |
Thr |
Leu |
Pro |
Pro |
Ser |
Arg |
Asp |
Glu |
|
225 |
|
|
|
|
230 |
|
|
|
|
235 |
|
|
|
|
240 |
25 |
Leu |
Thr |
Lys |
Asn |
Gin |
Vai |
Ser |
Leu |
Thr |
Cys |
Leu |
Vai |
Lys |
Gly |
Phe |
Tyr |
|
|
|
|
|
245 |
|
|
|
|
250 |
|
|
|
|
255 |
|
|
Pro |
Ser |
Asp |
He |
Ala |
Vai |
Glu |
Trp |
Glu |
Ser |
Asn |
Gly |
Gin |
Pro |
Glu |
Asn |
|
|
|
|
260 |
|
|
|
|
265 |
|
|
|
|
270 |
|
|
|
Asn |
Tyr |
Lys |
Thr |
Thr |
Pro |
Pro |
Vai |
Leu |
Asp |
Ser |
Asp |
Gly |
Ser |
Phe |
Phe |
30 |
|
|
275 |
|
|
|
|
280 |
|
|
|
|
285 |
|
|
|
|
Leu |
Tyr |
Ser |
Lys |
Leu |
Thr |
Vai |
Asp |
Lys |
Ser |
Arg |
Trp |
Gin |
Gin |
Gly |
Asn |
300
295
290
163
Val Phe Ser Cys Ser
Vai Met His Glu Ala Leu His Asn His Tyr Thr
305
310
315
320
Gin Lys Ser Leu Ser Leu Ser Pro Gly Lys
325
330 <210> 150 <211> 380 <212> PRT <213> Artificial <220>
<223> amino acid sequence of the long isoform of the gamma-chain constant region including the carboxy-terminal signal peptide of the human placental alkaline phosphatase encoded by plasmid plgG-GPI-B <400> 150
Ala |
Ser Thr |
Lys |
Gly |
Pro |
Ser |
Val |
Phe |
Pro |
Leu |
Ala |
Pro |
Ser |
Ser |
Lys |
1 |
|
|
|
5 |
|
|
|
|
10 |
|
|
|
|
15 |
|
Ser |
Thr |
Ser |
Gly |
Gly |
Thr |
Ala |
Ala |
Leu |
Gly |
Cys |
Leu |
Val |
Lys |
Asp |
Tyr |
|
|
|
20 |
|
|
|
|
25 |
|
|
|
|
30 |
|
|
Phe |
Pro |
Glu |
Pro |
Val |
Thr |
Val |
Ser |
Trp |
Asn |
Ser |
Gly |
Ala |
Leu |
Thr |
Ser |
|
|
35 |
|
|
|
|
40 |
|
|
|
|
45 |
|
|
|
Gly |
Val |
His |
Thr |
Phe |
Pro |
Ala |
Val |
Leu |
Gin |
Ser |
Ser |
Gly |
Leu |
Tyr |
Ser |
|
50 |
|
|
|
|
55 |
|
|
|
|
60 |
|
|
|
|
Leu |
Ser |
Ser |
Val |
Val |
Thr |
Val |
Pro |
Ser |
Ser |
Ser |
Leu |
Gly |
Thr |
Gin |
Thr |
65 |
|
|
|
|
70 |
|
|
|
|
75 |
|
|
|
|
80 |
Tyr |
He Cys |
Asn |
Val |
Asn |
His |
Lys |
Pro |
Ser |
Asn |
Thr |
Lys |
Val |
Asp |
Lys |
|
|
|
|
85 |
|
|
|
|
90 |
|
|
|
|
95 |
|
Lys |
Val |
Glu |
Pro |
Lys |
Ser |
Cys |
Asp |
Lys |
Thr |
His |
Thr |
Cys |
Pro |
Pro |
Cys |
|
|
|
100 |
|
|
|
|
105 |
|
|
|
|
110 |
|
|
Pro |
Ala |
Pro |
Glu |
Leu |
Leu |
Gly |
Gly |
Pro |
Ser |
Val |
Phe |
Leu |
Phe |
Pro |
Pro |
|
|
115 |
|
|
|
|
120 |
|
|
|
|
125 |
|
|
|
Lys |
Pro |
Lys |
Asp |
Thr |
Leu |
Met |
He |
Ser |
Arg |
Thr |
Pro |
Glu |
Val |
Thr |
Cys |
130
135
140
164
|
Val |
Val |
Val |
Asp |
Val |
Ser |
His |
Glu |
Asp |
Pro |
Glu |
Val |
Lys |
Phe |
Asn |
Trp |
|
145 |
|
|
|
|
150 |
|
|
|
|
155 |
|
|
|
|
160 |
|
Tyr |
Val |
Asp |
Gly |
Val |
Glu |
Val |
His |
Asn |
Ala |
Lys |
Thr |
Lys |
Pro |
Arg |
Glu |
|
|
|
|
|
165 |
|
|
|
|
170 |
|
|
|
|
175 |
|
5 |
Glu |
Gin |
Tyr |
Asn |
Ser |
Thr |
Tyr |
Arg |
Val |
Val |
Ser |
Val |
Leu |
Thr |
Val |
Leu |
|
|
|
|
180 |
|
|
|
|
185 |
|
|
|
|
190 |
|
|
|
His |
Gin |
Asp |
Trp |
Leu |
Asn |
Gly |
Lys |
Glu |
Tyr |
Lys |
Cys |
Lys |
Val |
Ser |
Asn |
|
|
|
195 |
|
|
|
|
200 |
|
|
|
|
205 |
|
|
|
|
Lys |
Ala |
Leu |
Pro |
Ala |
Pro |
He |
Glu |
Lys |
Thr |
He |
Ser |
Lys |
Ala |
Lys |
Gly |
10 |
|
210 |
|
|
|
|
215 |
|
|
|
|
220 |
|
|
|
|
|
Gin |
Pro |
Arg |
Glu |
Pro |
Gin |
Val |
Tyr |
Thr |
Leu |
Pro |
Pro |
Ser |
Arg |
Asp |
Glu |
|
225 |
|
|
|
|
230 |
|
|
|
|
235 |
|
|
|
|
240 |
|
Leu |
Thr |
Lys |
Asn |
Gin |
Val |
Ser |
Leu |
Thr |
Cys |
Leu |
Val |
Lys |
Gly |
Phe |
Tyr |
|
|
|
|
|
245 |
|
|
|
|
250 |
|
|
|
|
255 |
|
- 15 |
Pro |
Ser |
Asp |
He |
Ala |
Val |
Glu |
Trp |
Glu |
Ser |
Asn |
Gly |
Gin |
Pro |
Glu |
Asn |
- |
|
|
|
260 |
|
|
|
|
265 |
|
|
|
|
270 |
|
|
|
Asn |
Tyr |
Lys |
Thr |
Thr |
Pro |
Pro |
Val |
Leu |
Asp |
Ser |
Asp |
Gly |
Ser |
Phe |
Phe |
|
|
|
275 |
|
|
|
|
280 |
|
|
|
|
285 |
|
|
|
|
Leu |
Tyr |
Ser |
Lys |
Leu |
Thr |
Val |
Asp |
Lys |
Ser |
Arg |
Trp |
Gin |
Gin |
Gly |
Asn |
20 |
|
290 |
|
|
|
|
295 |
|
|
|
|
300 |
|
|
|
|
|
Val |
Phe |
Ser |
Cys |
Ser |
Val |
Met |
His |
Glu |
Ala |
Leu |
His |
Asn |
His |
Tyr |
Thr |
|
305 |
|
|
|
|
310 |
|
|
|
|
315 |
|
|
|
|
320 |
|
Gin |
Lys |
Ser |
Leu |
Ser |
Leu |
Ser |
Pro |
Glu |
Leu |
Gin |
Leu |
Glu |
Glu |
Ser |
Cys |
|
|
|
|
|
325 |
|
|
|
|
330 |
|
|
|
|
335 |
|
25 |
Ala |
Glu |
Ala |
Gin |
Asp |
Gly |
Glu |
Leu |
Asp |
Gly |
Ala |
Gly |
Thr |
Thr |
Asp |
Ala |
|
|
|
|
340 |
|
|
|
|
345 |
|
|
|
|
350 |
|
|
|
Ala |
His |
Pro |
Gly |
Arg |
Ser |
Val |
Val |
Pro |
Ala |
Leu |
Leu |
Pro |
Leu |
Leu |
Ala |
|
|
|
355 |
|
|
|
|
360 |
|
|
|
|
365 |
|
|
|
|
Gly |
Thr |
Leu |
Leu |
Leu |
Leu |
Glu |
Thr |
Ala |
Thr |
Ala |
Pro |
|
|
|
|
30 |
|
370 |
|
|
|
|
375 |
|
|
|
|
380 |
|
|
|
|
<210> 151 <211> 2061
165 <212>
DNA <213>
Homo sapiens <400>
151 gtacacactg taacttctcc tctcgatgtc ctgccctcgc cacgggcacg gggggagcat gcatttccag gcttggggag acacagaggc aggagagctg gaagaatggg ctcctgcctg120 cctggtgcca catcctgccc cagctttgag ggctgaatcc tctcagctca gagaagagct180 tccctagttt tgcaggcgca cggaggcctc ccacccgtac acctgcctct gctctccccc240 tggccattgc aatgcatgcc cgggatctgg gtttaccctg cagcccgact cctccagggc300 aggctccttc cgtccttggg tccagcagcc tcccccctcc gctgggtact gagcatctga360 aaagtctcag atagggccct acacctcttc tcccttctca agtgctcagc ccaggggtgg420 ggcttgctgc ttgcaaagag cagcccaccc tcctgtactg ccatcctatt gcctttgaag480 aaggaggtca gcctggacag gtgaactgag ttgccttcag aaaggcctgt ctcaggcagc540 cgcagcaggc ttcacgatgt ccatgtatcc tgtttgcctg ctgccgtctc tcctctccca600 agaggggagg tctgcgtgtt gagccaggga ggaaggagcc tgcagcctgc tcagggtggt660 ggctggtgac tgcggggcca gggcttgctg ctgtctctcg gaatgtcctg catgtgggtc720 , tggctgttcc tgctggcact gccctcttct ctctcccctc ctttcccact ctgccctgct780 tgcccgtcag ggtctccgga tgcccctgct ggaggcagag aagcgttctg tttttatcat840 ' cgtccctgtc ttggtcctgt ccgtgctccc catgtgctcc caatcagttg tcttcgttcc900 tcaacatcag ggaaagaaaa aacagcaaca cttctccctg tcatcagctc tgctgtctcc960 ttgtcaggcc ttgggacgtt ctctgggctc agtctagggt cgtgcctcat gcctcatgcc1020 tctctgggaa ggttcccagg ggcgccgcct ccatggttgg ctggtgggtt ttaaagggga1080 aggttgggag gaggcctgtg gaaggaggag ggccgtccac acccgtgggg caaagcgtgt1140 tccatgaaac cagtgctgtg cgtgctggga tgaaagcctc ccagcctctc gtgctgaagg1200 gaaaggtgga ccgaactggc ttagctgctg tggcaatggg gtggggggtg agtcctaatc1260 agaaggtggg agaagagaat aacaaaatgg aactccgccc cctgccgcca catttcctta1320 agttttagga gttggggcct atgagtagaa tttgaaagaa ctaccaaaaa agcttatttt1380 tggaaattaa gtcagctttg cctgtggttt ggctaggaat aaatatttac ctgtgtgccc1440 ctacagagat gacacagacc caaagtggga cattgagcaa ggcacaggct ggttcccctc1500 ctgtcctctg tcctcattct gtgagtgcca ccatcaccag gtactgtggc ctgcagaaat1560 aaacgaggca ccaaccctgc cctcagggac cccgtgtctt cttagggaca gaggactcag1620 aaacatctgt gtccccgcat gttaagtgca tgcacacagt gctgaggctt tgcagagaag1680 ggccatggct ccctgaggag accaagaaag gcacatagaa gtgacttctc agctggccct 1740
166 tgcaggatcc ctgggtgcct gtacctctcc agtccagctg agcaaggagg ctcaggaatt1800 aatgaagatg gggcttgtgt agcacgatgg ttctaggcca tcccttttcc atggctcaag1860 tccattgaag gcagcctcca aaatcagggg gttgcctgat cctcctagtg ccacaatccc1920 agtcctagct agaacttgcc atggttcttc tccctaaaag ttcccagggg acaggagaca1980 ggtgttgctt ttctaatgga gcgggacctc gcatggacgg ggccctccaa gcctgctaac2040 accctgttcg cactgactca g2061 <210>152 <211>2726 <212> DNA <213> Mus musculus <400>152 tacgttcaat ggcagtggat cttaaagacc ttttggatct aagaccagaa gccatctctg60 actcccctct caccttccag tttcttccaa atcctctggg ccagccagag gtctcagatt120 ctgccctctt gccctgtgcc caccttgttg accactggac agcatatgtg atggctactg180
- 15 ctagtgccag cttcacaaga ggttaacact acggactagc cattcttcct atgtatctgt240 _ ttctgcaaat acagccgctt tacttaagtc tcagcacttc ttagtctcct cttttcctct300 cagtagccca aggggtcatg tcacaaacat ggtgtgaagg gctactttgt caaatgaaaa360 ggtctatctt ggggggcatt tttttctttt ctttttttct tgaaacacat tgcccagcaa420 agccaataaa tttctctcat cattttgttt ctgataaatt cttactattg attgaaatgc480 ttccctgagg aacattaaat tatgtatgaa tttccattca aagtcatcat gcagcagtgg540 tatcaagcag gcagcatcta gtgcagaact gagattgtct acagaatgcc tgcttgatgc600 tcagccttat atcccagtta cggaca-tgtc tacaaatagc ccttctctta ccatctctcc660 cttaacttca tgatgtggta gctgattcct tctgccatca actgaaatgg caaaataaag720 gaaagcctga atcctgtctc ccctcttagt ttccaaggac acttgcccag aaaaatgcgc780 cccccccccc ccgtatcccc aggcagcatc caggactttc ttaaatggtt ctctgtacaa840 tcccaccttt aaaacagtca gtgaccattc tttgtaatca ttactttatt aatggttttc900 ttttctaaac cacctgcctt tgctgttgta gcttctcaat acatgctctg agacaaatca960 ttccttatat attccaatat tgctgaaaac tcattaattt ttactaatag ggggttgttt1020 tctaaagctc aggaaatgac ttgtactccc taagtaggaa atgttgcaaa ccaccatttc1080 atgatgtaca gttgattcaa ttaagtcagg tctgtgagga ctttggttcc ttatctatat1140 gtaaataatg ctgataccaa atctttgcta ttcattaaca tgtaatcttg caaataataa1200 taaatttaac agaaactcaa attgaggtag attcttaagg ataatagctt tcagcctagc 1260
167
cataaaagaa |
atgaaaaaat |
agt-ctttaaa |
gatcccaaat |
tcagaattag |
taatattaat |
1320 |
tcagatagtc |
cttcgtaaga |
ttgaaaaaca |
tgacttctga |
tttctcatct |
ttccaaagtt |
1380 |
agacttgacc |
ttggtgagat |
ggcaaagtta |
aaaaattcct |
ggggtttaag |
gatatattgg |
1440 |
ggcaacagtc |
acagcaacgg |
tgatgctttt |
tatatctaaa |
tcctgtcagg |
ttttgtttcc |
1500 |
actgagctca |
ttcattcacc |
tagggatctc |
attaaaagta |
ggggaccggg |
ctggtgagat |
1560 |
ggctcagcag |
gtaagagcac |
ccgactgctc |
ttccgaaggg |
cctgagttca |
aatcccagaa |
1620 |
accacatggt |
ggctcacaac |
catccgtaac |
aagatctgac |
tccctcttct |
ggtgtgtctg |
1680 |
aagacagcta |
cagtgtactt |
acatataata |
aataaataaa |
tcttaaaaaa |
aaaaaaaaag |
1740 |
taggggaccc |
tatcagaggt |
ctcaatgtgc |
ctggaaggtc |
tcccaacatg |
gctgtgggaa |
1800 |
aatgcctgac |
aatttttttt |
caattgcatg |
tgtgttctcc |
gagaaaggat |
aagatgcaag |
1860 |
tttatataag |
aagcaggatt |
tacttatact |
aaaatgcctt |
acacgtaagg |
ttcaggtagc |
1920 |
atcgtggcag |
agagggtaga |
aagactgtaa |
gagccagagg |
accaggatgt |
ccgctcttag |
1980 |
tgtcttctat |
atatgaaaga |
aagctgtacc |
cgtgaattct |
caaacagttg |
tctacatatc |
2040 |
acctgcacaa |
tggccgttct |
ggaaatctaa |
aaaaaacaaa |
aaacaaacaa |
acaaataaat |
2100 |
aaataaataa |
atatcaaaaa |
atcaaaaacc |
acccctagat |
gaaaagctac |
aagtaattaa |
2160 |
aagctgctaa |
aagggggaga |
atcaattttc |
tccagagaca |
agtccctgat |
aggtcatcca |
2220 |
atttcgggtg |
atcagcccta |
agcacataca |
catataagca |
atactaaacg |
gacacagctg |
2280 |
gtctatatac |
ttacaacttg |
gggcttgaag |
gaagttggtg |
gggaaggggg |
gagagtagta |
2340 |
atgatgtatg |
taaatacagt |
actcatgtac |
gaaactcccc |
aaaaataaag |
aattcttaaa |
2400 |
attattaaaa |
actggtattc |
ttgtcttgga |
ctattttctg |
aattttatat |
taatattttc |
2460 |
atcatcaaaa |
gactataaaa |
tgattataat |
aatgagagaa |
gttcagatga |
aacatcaact |
2520 |
gtcttaaatg |
tagaaaagga |
aactgacttc |
aggcagagaa |
gctaaaaatg |
ttggcaacct |
2580 |
tgccttggga |
cttagccacc |
agtcatttcc |
tctatataag |
tcacccatat |
cccaatttct |
2640 |
gagataattt |
taaatgttat |
cactgtgtca |
aaggtgcagg |
acatgtatgg |
aatgcccata |
2700 |
ttaccttctc |
ttgtctctca |
ttccag |
|
|
|
2726 |
<210> |
153 |
<211> |
5686 |
<212> |
DNA |
<213> |
Homo sapiens |
<400> |
153 |
gggtgagttg gcagcaacat ctcttggttt aagagttcca gcacagcgat agtactttct agccacatct cagcaaggaa actaggctat tgccacctgc tcttaagagg cttgaacaca
120
168 ggtgttaact cctgattgaa atgaacaaag ataggagaag attaggggga aaatctgtat180 ccttgctgga aaccagggca gtgcacatat aaagagtatg ctgttcactg gatgggaagg240 aaaaaaactt agaagtgtag tagtcaaagc acacaaacaa ccctaaccca gagtagacat300 tgctggaaga aagggaagac catgtagcag ctgtgtgaga gaatgaatct taatgataac360 agcatgatcc cttgctaggg ctgccatcaa aaagtacagg ccttcctcgt tttattgtac420 ttcgcagatg ttatgctttt tacaaattga acgcttgtgg gaacgctgtg taagcatgtt480 cgtcggcatc atttatccaa cagcgtgtgt tgacttcgtg tctctgtgta gcattttgat540 tattctcaca gtatcccaga tgttttcatt attatcatgt ctgtgatagt gatctgtcat60Ò cagtgatctt tgatgttact attgtcattg tttggggtcc ctacgaactg cacccatata660 agacagaaaa cttaatcaat aaatgtgcgt gctttgactg ctccatggac tagacattcc720 ccttctgtct ccctctcttc aggactccct aatccctgag acacaataat actaaaatga780 ctccaattaa taaccctaca atagccttta agtgttgaca tgaagggaag agtcatgcat840 ctcttacttt aaatcaaaag ctagagatga ttaagcttac tgaggaagat acgttgaaaa900 ccaagatagg ccaaaagcca ttcctcatgt gccaaacagc tagaaagttg taaaggcaaa960 gtaaaaatac ttgaaggaaa tttaaaatgc tcttccagtg aacacatgta tgataagaag1020 . gtaaaacagc cttattgctg atatggaaga agttttagtg gtctagacat aagatcaaac1080 tagaaacatt tcctgaagcc aaagcgtaat cctgagcaag gccgtaactc tcttcaattc1140 tgtgaaggct gacagaagct ggaagctagc agaatttggt tcctgaggtt taaggaaaga1200 agccctctcc ataacataaa ggtccaaggt gaagcagcca gtgctcatat agaagttgca1260 gcaagttatc tagaaaatct agctaagatc actgacgaag gtgttacact aaataacaga1320 ttttccatgt agacaaaaca gccatctatt ggactttcat agctagagag gagaagccaa1380 tacctgggtt caaagcttca aagaacaggc tgacttttta ggagctaatg ccgctggtga1440 ctttgagttg aagccaatgt tcaccgacca ttctaaaaat cctagggccc ttaagcatta1500 agttaaatat accttgcctg tgtctataaa tggaagaaca aagcctgatg acagaggtat1560 gtttgcggca tagtttactg aatattttaa gcccactgtt gagatctagt gctcagaaaa1620 acagattcct ttcaaaatat tactgctcat tgacattgca cctaagcagc caagagctct1680 aatggagaag gacatggaga tgaatggagt tttcctgcct gctaacaaca gcagccattc1740 tgcagcccat ggctgaagga gtaattttga ctttcaagtt tcactattta agaaatacat1800 tttgtaaggt gagtccccac agacagtaat tcctctgatg gatctgaaca aaataagttg1860 aaaactgctg gaaagaattc atcattctac ataccattaa gaacattcgt gattcatggg1920 aagagcttaa aatatcaaca ttaataggag tttggtagaa gttaattcca accctcatgg1980 ctgactttga gaggttcaag acttcagcgg aggaaataac tgaagatgtg gtgaaaatcg 2040
169
caagagaact |
acaattagaa |
gtggagcctg |
aagacgtgac |
tgaattgcga |
caaattcatg |
2100 |
atcaaacttg |
aacagatgag |
gagttgcttc |
tcatgaatca |
gcagagaaag |
tggttttttt |
2160 |
gaggtggagt |
gtcttcctgg |
tgatgatgac |
atgagcattg |
tgaaaatgac |
cacaaaggat |
2220 |
acagaatatt |
acaaaaactt |
aggtgataaa |
gcagcagcag |
tatcgggagg |
attaactcca |
2280 |
attttgaaag |
cagttcagag |
ggtaaaatgt |
tatcaaacag |
cattgcatgc |
tagaaaaatc |
2340 |
ttttgtgaaa |
ggaagagtcc |
atcaatacag |
caattttatt |
gctgtctcag |
cttaagaaat |
2400 |
tgccacagcc |
accccagcct |
tcagcaacca |
ccaccctgat |
cagtcagcag |
ccatcaacct |
2460 |
tgaggcaaga |
ccctccacca |
acaaaaagat |
tacaaattat |
tgaaggtcag |
ataatcttta |
2520 |
gtattttctt |
atcaataaac |
ctttttttaa |
agtatgactt |
tgtttagaca |
taatgctatt |
2580 |
tcacacttaa |
tagactaccg |
tatagtataa |
acacaacttt |
tagactcact |
gagaaatcaa |
2640 |
aaaattcatc |
tgactcattt |
gttgtgatat |
gtgttttatt |
gtggtggtct |
ggaactgaac |
2700 |
ctgcaatata |
tttgaggaat |
gtctgtaaca |
cgaagtgggc |
ggcttaatac |
aacagaagtt |
2760 |
tttggagttc |
cattctagag |
actggaaatc |
caaaatcaag |
gttttgggag |
ggccacgctc |
2820 |
cctctgaatc |
ctgtagggaa |
ggatccttca |
ttgcatcttc |
cagcttctgg |
agccacaggc |
2880 |
cttccttggc |
atgtggcagc |
agaactccaa |
tttctgtctc |
tgtcctcata |
tggccatctt |
2940 |
ccctctgggt |
ctgtgtcctc |
atatgctgtt |
ctctctgtgc |
atgtctgttt |
ccaaagtttt |
3000 |
cccttttaat |
aaggacacca |
gtcacactgg |
attagggcct |
accttcatga |
cctcacctta |
3060 |
acttgattgc |
gtctgcaaag |
atcgtatttc |
caaataaggt |
cacatccaca |
gggactggag |
3120 |
gttaagactt |
cagcatactc |
aggggagaca |
caattcaacc |
tataacagag |
cccctttgaa |
3180 |
aatgtcaggc |
atcaggtgct |
cacagcacac |
ggtccagctg |
ttggtgctca |
cccttgctca |
3240 |
gcacacggtg |
gaggctctgc |
ctcaatctca |
ttcttcatgg |
gaacagctaa |
gccaggtagc |
3300 |
gaatacgagt |
tacgtttgtg |
tcaccacagc |
agacactgaa |
aggaagtttg |
tggtgtccag |
3360 |
cacatttgcc |
agcataggcc |
tcacagacca |
caacacctag |
aatctgacaa |
aaattagaat |
3420 |
aaatccgatg |
tctccttttc |
tctctttttt |
taagcatttt |
taaatacaat |
tggtaaattt |
3480 |
cctgactgta |
ccctactcat |
cttgcattgc |
tgaataagtg |
aggaacctct |
ctatggcatg |
3540 |
aagcagaaaa |
ccattgagct |
tatgagaaga |
aacaggaaat |
acatgtaaaa |
gagaccagtc |
3600 |
tgaaaaatca |
ggagaaattt |
tacaaaagag |
atttactgcc |
aagaaaccag |
ggaaactttc |
3660 |
agaacactct |
ccttttcata |
tttgtaacaa |
gattcaattg |
tacaaatact |
tctgtgaaac |
3720 |
tagccatgaa |
gtgtgtacat |
gaatgaatat |
atgtattcag |
tgtgtttata |
tatttcattt |
3780 |
catacatgtg |
atctatatca |
tatatatata |
tatatatata |
tatatatatc |
acaatgaata |
3840 |
ttgcagaaaa |
ttaaagcaaa |
gagtaagaag |
agttaaccaa |
atgttccctg |
aatgcagtgg |
3900 |
gaaaagatga |
aaaggagaag |
acaggcaagc |
acagtggctc |
acacatgtaa |
tcccaacata |
3960 |
170
ttgagaggcc |
ggggcaagag |
gatcacttga |
gcccaggagc |
tcaagaccag |
cctggacaac |
4020 |
atggcaaaaa |
cccatctcta |
caaaaaagta |
taaaaattag |
ctgggcatgg |
cagcatgtga |
4080 |
ctgtagtcac |
agctaggcag |
gagaatgaag |
tgggaggatc |
acctgagccc |
aggaggctga |
4140 |
ggcttcagtg |
agccttgatg |
gcaaccctgc |
actccagcct |
ggatgacaga |
atgagaccct |
4200 |
gtctcaaaaa |
aggaaaaaga |
gaagacatat |
gtaacacagt |
gtcaggattc |
aaaatacatg |
4260 |
tagcaaaaat |
tccagaaggg |
taagcaaata |
agcccatacc |
tagccatcac |
tagggaaact |
4320 |
tctgtgtttc |
agggatagag |
aaaaaaactc |
tgattccaga |
aataaaatgt |
gaaaatataa |
4380 |
tacccgcaaa |
agaaataaat |
ttattgacac |
cacattgatt |
ctatattgta |
taagatatat |
4440 |
tgtataacac |
taaattgtag |
aagatagcac |
ttctcttgag |
ccaagctaat |
atgcacacct |
4500 |
agaggctcca |
ggtacacatt |
aaaggataag |
caaagacaca |
aaaattgtac |
catttaagta |
4560 |
tgtttcccag |
gcaattcata |
agcaaatttt |
taaaaaggag |
aatgatgaat |
tccaaaggaa |
4620 |
atctcaatga |
gataggatgt |
aggtaaaaag |
aaaaaacaac |
aataaaaaaa |
acatacacac |
4680 |
aaaatcttgg |
caatgtaata |
ataatttatt |
aataatctct |
ctaaactcat |
agaatatatc |
4740 |
aataaaacta |
gaaaatgtga |
gacagcaaga |
aaagataggc |
tagacttaca |
ttacagaaaa |
4800 |
gatgagtaga |
ctgactatat |
agagtttgac |
tctaaaattg |
agaaaagagg |
tttaaatatg |
4860 |
tgtcacgtgt |
atatgtataa |
tatacatgca |
cacatataaa |
atgaaattcc |
tcactggaaa |
4920 |
aaatattaag |
tttaatttcc |
aaattattag |
aatgactaaa |
acagttgaat |
ctatctgttc |
4980 |
catatagtaa |
ttgaggggga |
aggaaaagga |
atagcaagga |
atccattttt |
ctcttccacc |
5040 |
agaaataagc |
tccctcatgt |
ttgggtcagg |
tcactttatt |
cattgctttc |
tccacatcct |
5100 |
catcattagg |
catcatgaaa |
tcaatgaaaa |
ggcagtgaaa |
gaatgatgat |
gaaagctaat |
5160 |
caaatgtatc |
atttacctca |
atacgtttgg |
tttaatcttc |
ttgttgaaag |
acaaattctc |
5220 |
ctagacagga |
tcaaaagcaa |
catatcttgt |
atttataaaa |
aacatgtctc |
aagtaaaatg |
5280 |
acatagtatt |
atacacacac |
acacacatac |
acacacacac |
acacattaag |
ggaaaatgca |
5340 |
gacaaaaaat |
ggcagaaata |
atatttagag |
aaagatagaa |
tttaagaaaa |
aaaattgtca |
5400 |
aacaggtctg |
caaaataatt |
gttttatttt |
ggtgccagtt |
acagtccgca |
atgaagcgaa |
5460 |
gatattaaga |
agcaaagtgg |
gccaggagaa |
attagagcag |
aaatatctct |
ttcaatagtg |
5520 |
agagaatagg |
aaaaagaagt |
agaaaagctg |
ggaacaatag |
gtaaagttta |
ggctaggcct |
5580 |
tagacttctc |
ctgcattgta |
atccctctgg |
tttgccacat |
atgcatgctg |
tcaggaagtt |
5640 |
gatgaggtat |
gtacagcaca |
atttattttc |
cattttttgc |
ctttag |
|
5686 |
<210> 154 |
|
|
|
|
|
|
<211> 1260 |
|
|
|
|
|
<212> DNA
171 <213> Mus musculus <400>154 gtgagtatca gggtcgtagg ctgtgaggat ctctacagcc gtgtatattc tctgttcaga60 aattccctct ggctgaccgt ggcgttttcc gttctaggat gcctctaact atacatccct120 gtggctgtgg tgtggtgatc cgagggctgc actaacacac agatttctgt ggttgtcact180 gttcagggcc acagaatgac tgagtcttct ttctatacag tatgcagtag ctggatagtc240 aggactgggg aaggttgtgt gaggttgact cggtggtacc gctgaggagg aaaagggctt300 gtccagagca ggcgtgatgt acagcgcaca ttgttttttt cagcaagtaa tgaaaatctg360 tgactgagtg accttggggg ctgcggtggt gaggagagct cacgggaatc ctggagcagt420 gtagctggcg tgtcaaaagc agaaacgcag gagatgggtc agtgcgccga ggcccggagt480 ttaaatcccc agagcccacg taaaagcctt gcgcagtagc acgcatgcgt aatcctgatg540 gagcaattag gagaagccgg tggccggcta gcctgtgcag actgtgaaaa cagagcatct600 gaagctgtgt gaaaggctag ctcgcctgtg ctcctcagat cctgacatac gccatctcga660 gcaaaagatt aacaatcgat taaaacccac acatgaaaac aaagaaacca gttagctcca720 gataaaagca aatgccagga aggaaaggag gcagagggca ggggtggagg agcaggtggg780 agaggatgac gtcagagaaa tctcagtggc cgtgaacaag gaagatattc cagggcttgt840 tctgaatgtg tgatctttta aaccatgtgg ccctcttagc ctgtgagaaa agtccatttc900 tagccctgct gaacagagaa gcccagggga gcaaccaact ggccttcggt cactcagcaa960 ggacctagta gaggctggct ttgaacttga gccctccagg gcacttgacc tctgagcttt1020 gggaaaacaa gcgaggcagc ttcacgctgt tgtgatctgg acttggatca gggccagtga1080 ggacagggac agggatgggt gtgataagga cttggtgtgt aagagggaga gttggggaga1140 caggtgggag ggctatctgt agccaggtaa ccaagggtcc caggggaacc cccagtgtgg1200 acgcggactg cacatgacac agggcggcct ccccattcat gactgttttt ctccttgcag1260 <210> 155 <211> 2627 <212> DNA <213> Homo sapiens <400> 155 gtaaacccac ccatgtcaat gtgtctgttg tcatggcgga ggtggacggc acctgctact60 gagccgcccg cctgtcccca cccctgaata aactccatgc tcccccaagc agccccacgc120 ttccatccgg cgcctgtctg tccatcctca gggtctcagc acttgggaaa gggccagggc180 atggacaggg aagaataccc cctgccctca gcctcggggg gcccctggca cccccctgag240
172
cctttccacc |
ctggtgtgag |
tgtgagttgt |
gagtgtgaga |
gtgtgtggtg |
caggaggcct |
300 |
cgctggtgtg |
agatcttagg |
tctgccaagg |
caggcacagc |
ccaggatggg |
ttctgagaga |
360 |
tgcacatgcc |
ccggacagtt |
ctgagtgagc |
agtggcatgg |
ccgtttgtcc |
ctgagagagc |
420 |
cgcctctggc |
tgtagctggg |
agggaatagg |
gagggtaaaa |
ggagcaggct |
agccaagaaa |
480 |
ggcgcaggta |
gtggcaggag |
cggcgaggga |
gtgaggggct |
ggactccagg |
gccccactgg |
540 |
gaggacaagc |
tccaggaggg |
ccccaccacc |
ctagtgggtg |
ggcctcagga |
cgtcccactg |
600 |
acgcatgcag |
gaaggggcac |
ctccccttaa |
ccacactgct |
ctgtacgggg |
cacgtgggca |
660 |
caggtgcaca |
ctcacactca |
catatacgcc |
tgagccctgc |
aggagcggaa |
cgttcacagc |
720 |
ccagacccag |
ttccagaaaa |
gccaggggag |
tcccctccca |
agcccccaag |
ctcagcctgc |
780 |
tcccctaggc |
ccctctggct |
tccctgtgtt |
tccactgtgc |
acagatcagg |
caccaactcc |
840 |
acagacccct |
cccaggcagc |
ccctgctccc |
tgcctggcca |
agtctcccat |
cccttcctaa |
900 |
gcccaactag |
gacccaaagc |
atagacaggg |
aggggccacg |
tggggtggca |
tcagaagcag |
960 |
gccagtgaga |
cagggcctgc |
ccagggccct |
ctgcatgcct |
ctggcttctg |
cctggggctc |
1020 |
ccaggagtgt |
aagaacagtc |
ccacaaccac |
tgtggggaca |
cctggcaccc |
agactcccac |
1080 |
aagggggcag |
tggggcccct |
gctcgtgcct |
tagacatctt |
ccgggcctcc |
ccagggcccc |
1140 |
ccgccttctg |
gctgcctccc |
tctgctctca |
gggccaaggt |
gaggtggagg |
ccactgtcac |
1200 |
ccctgagggt |
ccagtcacca |
gagggtaatt |
gagagcaaca |
ggtcactcgg |
ggaagccctg |
1260 |
ccacagagaa |
gccctccagc |
ccatgggacc |
caggacctgg |
cccaggggag |
gggcttttaa |
1320 |
agagaggggg |
aaagagggag |
aatcaacaga |
tgaggggctg |
aaccagcaga |
cagagatcag |
1380 |
gcagacacat |
gggtagatcc |
taggacatat |
aatgaatgga |
tgggtggatg |
gaggattggt |
1440 |
agacggagga |
tggatgggtg |
ggtaaatggc |
tggatggagg |
atggacagat |
ggatatatga |
1500 |
tggatggatg |
aaggacgggt |
ggatggagga |
tggatgagtg |
gatgaatgaa |
ggatggaaga |
1560 |
tggatggatg |
gatgggtgga |
tggactgatg |
gatgatggat |
ggatggatgg |
atggatgatg |
1620 |
gatggatggg |
taggcggatg |
gaggatggaa |
gggtggatgg |
aggatggaag |
atagatggag |
1680 |
gggtgaatgg |
aggatgggtg |
gactgacgga |
ggattgagga |
tactggggtg |
ggtgggtggg |
1740 |
tagatctatg |
gaggataggt |
gtatggaaga |
taattggatg |
gagaattgct |
ttatgaatgg |
1800 |
atgaatgaag |
agatggaaaa |
tagctttata |
gatggatggg |
tgaatggatg |
gatggataga |
1860 |
tggaagaagg |
atgaatggat |
ggaaaatagc |
tttatagata |
tatgggtgga |
tatttaagtg |
1920 |
atagccttac |
attaatagat |
gaatggagga |
tgaatggttg |
ggtgagtggg |
taggagtgtt |
1980 |
actgatggag |
gggtggatat |
acggataata |
gctttataga |
tggatggatg |
gatagatgga |
2040 |
tggaaggata |
gaaagacagg |
tgaatgactg |
gatgtatcag |
catatgacaa |
gcaggtacag |
2100 |
ctgtacatgg gaggtctatg ccctgagacc ctgaggaaaa tgaggatgcc cgtgctggtg 2160
173 gccctcacct ggccctcgct tgtaacccct cagccacatt ccctgggaag gcaacagagg2220 cctctggtct tgcccattca acctttggca cactgagtgt cagacccagg tctctgtctt2280 ggacccagat ctccttgagg gtgggtgtgt ctggtcctct ctggccccgg gacccagtca2340 ctgaatacgt ggctgggact gagacggggt ggggtgggag gggcgggagg gtacctcggg2400 ctcaagcttc ccttggagaa gcagatggtg tccactttct gccctgccaa gtctctccct2460 gaagtgccct aagaatgtca aagacagaag gtcccagccc ctcacctggg actctgcctc2520 ctcatcctcc ctgggggagt ctcaggcctt agatggggac ccagacccca ctgtccccag2580 accccaagga agcatagccg ctgttcacac gagtctgggc ctggcag2627 <210>156 <211> 1937 <212> DNA <213> Homo sapiens <400> 156 gtaaatgacg tactcctgcc tccctccctc ccagggctcc atccagctgt gcagtgggga60
-15 ggactggcca gaccttctgt ccactgttgc aatgacccca ggaagctacc cccaataaac120 tgtgcctgct cagagcccca ggtacaccca ttcttgggag cgggcagggc tgtgggcagg180 tgcatcttgg cacagaggaa tgggcccccc aggaggggca gtgggaggag gtgggcaggg240 ctgagtcccc ccaggagagg cggtgggagg aggtgggcag ggctgaggtg ccactcatcc300 atctgccttc gtgtcagggt tatttgtcaa acagcatatc tgcagggact catcacagct360 accccgggcc ctctctgccc ccactctggg tctaccccct ccaaggagtc caaagaccca420 ggggaggtcc tcagggaagg ggcaagggag cccccacagc cctctctctt gggggcttgg480 cttctacccc cctggacagg agcccctgca cccccaggta tagatgggca cacaggcccc540 tccaggtgga aaaacagccc taagtgaaac ccccacacag acacacacga cccgacagcc600 ctcgcccaag tctgtgccac tggcgttcgc ctctctgccc tgtcccgcct tgccgagtcc660 tggccccagc accggggccg gtggagccga gcccactcac accccgcagc ctccgccacc720 ctgccctgtg ggcacaccag gcccaggtca gcagccaggc cccctctcct actgcccccc780 accgcccctt ggtccatcct gaatcggccc ccaggggatc gccagcctca cacacccagt840 ctcgcccact cacgcctcac tcaaggcaca gctgtgcaca cactaggccc catagcaact900 ccacagcacc ctgtaccacc accagggcgc catagacacc ccacacgtgg tcacacgtgg960 cccacactcc gcctctcacg ctgcctccag cgaggctact gccaagccct tcctctgagc1020 catacctggg ccgctggatc ccagagagaa atggagaggc cctcacgtgg tgtcctccag1080 tccaaccctc cctgtcaccc tgtcagcagc agcaccccac agccaaacac aggatggatg 1140
174 cgtgggctcc atcccccact cacccacacc ggaaccccag agcaggctac gtgcccctca1200 cagacctcaa acccacatgt gcatctgaca ccccagatcc aaacgctccc cccggtcatg1260 cacaccaagg gcacagcacc caccaaatcc acacggaaac acgggcaccg ggcaccccat1320 gagcacaaag cccctccatg tctgaagaca gtccctgcac accgtcacag ccatacattc1380 agcttcactc tcacgtccca gcccacctgc acccagctct gggcctggag cagcagaaag1440 aggtgtgagg gcccgaggcg ggacctgcac ctgctgatga cccgggacca gcaggcagct1500 cacggtgttg gggaagggag tggagggcac ccagggcagg agccagaggg accaggctgg1560 tgggcggggc cgggccgggg tagggccagg aggcagctct ggacacccac aggcctgggc1620 tcatagtcca caccaggaca gcccctcaga gcacccatgc agtgagtccc aggtcttggg1680 agccaggccg cagagctcac gcatccttcc gagggccctg agtgaggcgg ccactgctgt1740 gccgaggggt tgggtccttc tctggggagg gcgtggggtc tagagaggcg gagtggaggt1800 aaccagaggt caggagagaa gccgtaagga acagagggaa aatggggcca gagtcggggc1860 gcagggacga gaggtcagga gtggtcggcc tggctctggg ccgttgactg actcgggacc 1920 tgggtgccca ccctcag1937
- 15 <210> 157 , <211> 1301 <212> DNA <213> Homo sapiens <400>157 gtaaatgagt gcgacggccg gcaagccccc gctccccggg ctctcggggt cgcgcgagga60 tgcttggcac gtaccccgtg tacatacttc ccgggcaccc agcatggaaa taaagcaccc120 agcgctgccc tgggcccctg cgagactgtg atggttcttt ccacgggtca ggccgagtct180 gaggcctgag tggcatgagg gaggcagagc gggtcccact gtccccacac tggcccaggc240 tgtgcaggtg tgcctgggcc gcctagggtg gggctcagcc aggggctgcc ctcggcaggg300 tgggggattt gccagcgtgg ccctccctcc agcagcagct gccctgggct gggccacggg360 aagccctagg agcccctggg gacagacaca cagcccctgc ctctgtagga gactgtcctg420 tcctgtgagc gccctgtcct ccgacccgca tgcccactcg ggggcatgcc tagtccatgt480 gcgtagggac aggccctccc tcacccatct acccccacgg cactaacccc tggcagccct540 gcccagcctc gcacccgcat ggggacacaa ccgactccgg ggacatgcac tctcgggccc600 tgtggagaga ctggtccaga tgcccacaca cacactcagc ccagacccgt tcaacaaacc660 ccgcactgag gttggccggc cacacggcca ccacacacac acgtgcacgc ctcacacacg720 gagcctcacc cgggcgaacc gcacagcacc cagaccagag caaggtcctc gcacacgtga780
175 acactcctcg gacacaggcc cccacgagcc ccacgcggca cctcaaggcc cacgagccgc840 tcggcagctt ctccacatgc tgaccagctc agacaaaccc agccctcctc tcacaaggtg900 cccctgcagc cgccacacac acacaggccc ccacacacag gggaacacac gccacgtcgc960 gtccctggca ctggcccact tcccaataca gcccttccct gcagctgggg tcacatgagg1020 tgtgggcttc accatcctcc tgccctctgg gcctcaggga gggacacggg agacggggag1080 tgggtcctgc tgagggccag gtcgctatct agggccgggt gtgtggctga gtcccggggc1140 caaagctggt gcccagggcg ggcagctgtg gggagctgac ctcaggacac tgttggccca1200 tcccggccgg gccctacatc ctgggtcctg ccacagaggg aatcaccccc agaggcccga1260 gcccagcagg acacagcact gaccaccctc ttcctgtcca g1301 <210> 158 <211>1553 <212> DNA <213> Mus musculus <400>158 gtaacacctc cctccatccc tcctaggcct ccatgtagct gtggtgggga aggtggatga60 cagacatccg ctcactgttg taacaccagg aagctacccc aataaacact cagtgcctga120 ttagagccct gggtgcctgt tcttggggaa ggcaggttat gggcagaaat atcttggcct180 ' gaaagaaggg acaccccaag agaaggacag gagtgaagca tggctcaccc atctgtctat240 gtgttggata tttgacaaat aggacatcac aggacttcag cataggtacc cctggtcctt300 cctgctcttc actggatatc atgcacctga tctctagaga tgcagctaaa atgagccagt360 ctgggaaacc tcagcaccca cctctcagtc ttgcaagctc ctgctcccag acattcctgg420 atactaaacc ccttcaggta gagaaacagc caaagtcaac atctaggacg caggactcaa480 catggtcctg ctccttccct ctctactcaa cagccattga ggctgagccc accgccccaa540 ccgcctgcct tgccaaatga tcacaccagg cctggtgctc ctcgtcttac tacctaaact600 cactccaacc caaattcatc ccaaggacca gaatgggctg acagcctcat acagtcaggt660 tcccccatct atgacatgtt ttcacatgca tgcacacaca cacacacaca cacacacaca720 cacacacaca cacacacaca cacacaggct tcattgagct ctctggttta gcaatagccc780 aaagcaagcc atacatccat cccagttcca gaaggataag aaaaccagaa ccaagacaca840 cccacaccta ttccataccc aaccaacagc acatatggct tacacacctg agattagtgg900 ctcccatcat gtacacacac atgcacacaa aggagcccat acatacccat catttccaga960 ggtaagtatc taacctttgg atctgagata tctctgagga acaccaatgg cagagtcaac1020 cagcacctca gcctccagac taaatcctta cattttggcc caccccaagc catgagagat 1080
176 ggaggagggt ggaggcctga gctgcgggaa agcagagaca ggaagatgga ctgtttggtg agagtagtaa accagacaat ggggagacta aggcaggagt agagccccta caaggcccag agtctgcttt agagtccatg tgtcctgacc tgcccctcag atgccacaac caagatttct ggttccagag catgcatgca ggccctagaa atggacctat gagctcagag ccttcctaga 5 gagccctggg tactctctga acaaaaggca attctgtgta gaggcatcct gtggccaaag accctaagac agtcatacac acacacacac acacacacac acacacacac aacacacaca acacacacaa cacaggtagg ttttatcatg ctctttggtt tagcaatagc cctgttgatg gtgggggata ctgggtcact gtgggcactg gagtagaaag agggaatgaa cag <210> 159 <211> 1354 <212> DNA <213> Mus musculus <400> 159 gtaaatgagc tcagcacaca caatgctcct gggtcctaat ggacactggc acccatatcc atgcatccct tgtataaata aagcacccag caaagcctgg gaccatgtaa aactgtcctg gttctttcca aggtatagag catagctcac gggctgatag ttctagccag ggttggagga cagccttgtc tttaggtttc tgcactgcag gactcagagc tcatgagtca tcttggcctg ' aagagtggaa cttagcttta ggcagtatct ttcctttact tcccacaaac cagcagctgc cagacataga gataatccta ggaagcctca aatggagaag cacacaaacc cacctccctc aggctgttcc tctccccagg ccccacttct ttacctaagg gtttctctga gtctattgta gaggcacaca tggccaggga tattccggag acccttagca tccatacact caactcaggc agcttttcac aggtgaggtc tgcacatcca tacagacggc tcactcctgc ctgtgccacg tggggctgag gcacatggct cttgctgccc caagggaggg actattagat agccacagtc atgctgaatc ctgacccatt caaattagcc tgctgaacac catccagtcc atatagcaca 25 tgtatccaca tgcacgtgtg cacacacaca tttaacacac tgggacaact cctctgtgcc ctgcacagca cctacatcca gcaatgtatc accatacaca cggccaaaaa ttcaatgccc acgtttctgc catcacaaac agacacacct ttcctctctg tggccactgc attatatgct caacacaaga cctctgaagc cagatccatc tctggtacct cagggtcatg cttcaacccc acatgaatta tgcaaaccat agccataatg gtctgaatca cttcacattg gaatggtccc 30 aagatcaggc aagaaaagcc acaggctctg ttgatgactg aaggacagca aagggtcagt ccagctgtat aaccactgtt gacctgggtc acagaccctg ctgaccctcc atattctctt
1140
1200
1260
1320
1380
1440
1500
1553
120
180
240
300
360
420
480
540
600
660
720
780
840
900
960
1020
1080 gtactgaatg aatgaaaaat gagacaagca tagagggccc ttgcacaatc taggtcagta 1140
177 tgaggtctac ccgaggcatc attggagtca gctggaggaa gctgagactg atgtcccaga gggaaaggaa aagaaagaag gctccaggaa gggtctgctg taccagtcag gctggagctc tctcctctac ttcatgcaaa catgtctgca tcacagggaa tctctcccag caccaaccat gttgggacaa acactgactg tcctctctgt tcag <210> 160 <211> 81 <212> DNA <213> Homo sapiens <400>160 tcgcccctgt acctggagat catcatctat tgcacagggg ccttcctcat ctcctgcatg gtggggtcgg tcatcgtcta c <210>161 <211> 90 <212> DNA <213> Mus musculus <400>161 aagataccat ctattgccac tgggattgtg ggtggcctcc tcttcatagt ggtggtggcc cttgggattg gcctattcat gcgaagacgt <210> 162 <211> 29 <212> PRT <213> Homo sapiens <400> 162
Thr His Asp Ala Leu He Vai Gly Thr Leu Ser Gly Thr He Phe Phe
5 10 15
He Leu Leu He He Phe Leu Ser Trp He He Leu Lys
1200
1260
1320
1354 <210> 163 <211> 81 <212> DNA <213> Mus musculus <400> 163
178
cgccttccac tgggggtcac |
catctcctgc |
ctctgcatcc |
cgttgttttg |
cctgttctgt |
60 |
tacttcagca ttaccaagat |
t |
|
|
|
81 |
<210> |
164 |
|
|
|
|
|
<211> |
63 |
|
|
|
|
|
<212> |
DNA |
|
|
|
|
|
<213> |
Homo sapiens |
|
|
|
|
|
<400> |
164 |
|
|
|
|
|
accatcacct tcctcaccct |
cttcctgctg |
agcctgttct |
atagcacagc |
actgaccgtg |
60 |
acc |
|
|
|
|
|
63 |
<210> |
165 |
|
|
|
|
|
<211> |
87 |
|
|
|
|
|
<212> |
DNA |
|
|
|
|
|
<213> |
Homo sapiens |
|
|
|
|
|
<400> |
165 |
|
|
|
|
|
tggacgtgga ccggcctctg |
catcttcgcc |
gcactcttcc |
tgctcagcgt |
gagctacagc |
60 |
gccgccatca cgctcctcat |
ggtgcag |
|
|
|
87 |
<210> |
166 |
|
|
|
|
|
<211> |
78 |
|
|
|
|
|
<212> |
DNA |
|
|
|
|
|
<213> |
Homo sapiens |
|
|
|
|
|
<400> |
166 |
|
|
|
|
|
gggctgtgga cgaccatcac |
catcttcatc |
acactcttcc |
tgttaagcgt |
gtgctacagt |
60 |
gccaccgtca ccttcttc |
|
|
|
|
78 |
<210> |
167
|
|
|
|
|
|
<211> |
78 |
|
|
|
|
|
<212> |
DNA |
|
|
|
|
|
<213> |
Mus musculus |
|
|
|
|
|
<400> |
167 |
|
|
|
|
|
gagctgtgga ccagtatttg |
tgtcttcatc |
accctgttcc |
tgctcagtgt |
gagctatggg |
60 |
gccactgtca ccgtcctc <210> 168 <211> 78
179
<212> |
DNA |
|
|
<213> |
Mus |
musculus |
|
<400> |
168 |
|
|
gggctctgga |
caaccatcac catcttcatc agcctcttcc tgctcagcgt gtgttacagc |
60 |
gcctctgtca |
cactcttc |
78 |
<210> |
169 |
|
|
<211> 3111 <212> DNA <213> Homo sapiens <400> 169
gtgagtatca |
agaggcctaa |
gcaatggtaa |
tctccactct |
ccattcttcc |
cctgtggcca |
60 |
gacacttccc |
ctggctgagt |
ctctgggctt |
ttatatcata |
ggatgcctct |
aatggcaatc |
120 |
ctgccattag |
atacacctgc |
cgtggtgtat |
ctgccaggta |
ggcaggctag |
gctgcagtaa |
180 |
caaacaagcc |
cacaatttcc |
atggcttaac |
actatgggaa |
tatatttctt |
gctcacgtaa |
240 |
caagctaacg |
tgaatgttgc |
tggtttgtag |
gtggtttccc |
tccctgtaga |
aatctgggga |
300 |
gtgaggttct |
ttccatcttg |
tggtgccgtc |
attctccagg |
acaaagattc |
ttacctactt |
360 |
ttgtgtcctg |
gtttcctttg |
gcagcctggt |
gaagcctatg |
gacctcattt |
cagaatattt |
420 |
ttaaatacat |
aaaatcccag |
cctgggcaat |
atagtgaaac |
ccccatctgt |
acaaaaatta |
480 |
gccaggcatg |
gtggcatgca |
cctgtagtcc |
caggtactgg |
gaaggctgag |
gtgggaggat |
540 |
cacttgagcc |
caggagtttg |
aggctgcagt |
gagccgtgat |
cgtaccactt |
tactcccacc |
600 |
tgggtgacag |
agcaagagcc |
catctctaaa |
aataaataaa |
tacaatgaaa |
taaaataaaa |
660 |
taaatagaac |
tacagaggaa |
actaattgta |
ttgaaatgca |
gttataaaac |
atttaaacac |
720 |
atttttaatc |
tagagatata |
tgtgcttctt |
tattaagatc |
tataaataat |
aagttctagg |
780 |
ggtagctcgc |
ataaatactg |
taatttcaaa |
gtagataagc |
ataaataata |
ctttatgata |
840 |
ctgaaattgt |
gatgtgatat |
gagaatagct |
gtgagttttg |
ttttgctggg |
gacaggatca |
900 |
gtgatgctgt |
cattactggg |
gtctcttccc |
tccattcttt |
ttttaaaatt |
gtattttatt |
960 |
ttatttttaa |
aattttaaaa |
taaatagaga |
cagggtatca |
ctatgttgcc |
caggctgctt |
1020 |
ttgacctcct |
gggctccagt |
gatcttccca |
tcttggcttc |
ccaaagtgct |
gggattacaa |
1080 |
gtgggagcca |
gtgttcctgg |
ccccttcctc |
cattcttaat |
ggaaggagat |
gctaggtgtg |
1140 |
agaggttagg |
gaaagtaaag |
atgtaatttc |
tttcccatcc |
aagttctcag |
acccctgaat |
1200 |
tctacctgca |
gccatgttgg |
tccatcaacc |
ccaagtgaag |
aatccctgct |
ctagggcccc |
1260 |
accattgtct |
gtatccagcc |
agcagaagag |
gcgtgattat |
ggagatcaca |
tctgcttctt |
1320 |
180
gaaagcagac |
agcccggaag |
tgggccgcat |
cacttcctct |
caaattctat |
tggtgaaaat |
1380 |
ggtcacatga |
ctacacatag |
ccacaaagga |
ggctgggaac |
tttctcactt |
ggaacctaca |
1440 |
tcccagaaac |
aactcttttc |
agtgaggtat |
cccacaggtc |
tttcgcagta |
gaaatattga |
1500 |
ttatctcaca |
taaaatgaag |
tcttacaaat |
ggacctactg |
ggttttgtac |
agcagccaag |
1560 |
tgatatctct |
tcccttctgc |
tgtcttccct |
tctgccatcc |
ttcacatggt |
ggcattgtat |
1620 |
ccttagactt |
gccacccatg |
ccctcaggtt |
ggccgttgca |
cactgtctta |
cataaagcag |
1680 |
gaaggaaagg |
aaaggctgct |
acgagagagt |
gtaccttgtg |
catctctttt |
ttaatcagga |
1740 |
agcaaacatc |
tttctagaag |
cttccctagc |
aaaattcccc |
ttacatctca |
ttggccaaga |
1800 |
ctgttacatg |
ttacatggtt |
actgttatta |
cttgctcatt |
gcaaggaaga |
ctgggaactc |
1860 |
aaatgcctgg |
aaaaaggaac |
aggataatcg |
tgattggctc |
aagccttagg |
gtgggcatgg |
1920 |
ctccctgaca |
agggagagag |
gaaaaagctg |
ttgagtgaag |
aagactgctt |
cagtttcccc |
1980 |
atctgtataa |
tgggaggagt |
aagggctgtc |
gtaaaaactc |
aatgaaagaa |
gattcttcaa |
2040 |
cgtggtaggt |
gcagtggcag |
ctggcagtac |
cctgaccctg |
ccaccgcaca |
gccctctcag |
2100 |
cattgctcat |
cctgcactgt |
ggatatcagt |
tgagccacgt |
gtctcctgcc |
ctgggctgtg |
2160 |
agctccatag |
gcagggtctc |
catggctgta |
tctccagaac |
ccagcacaga |
accaggtgct |
2220 |
tgggaaagtt |
ttgaattgat |
tctcatctgc |
cattggcatg |
gggaagggaa |
ctagcttgta |
2280 |
tgaaacagat |
aacaatgtat |
gggaccctca |
ttcattattt |
cagcaaatat |
ttgctgagtt |
2340 |
cctcctacat |
ggctagccct |
gtgctagaca |
ctggggaatc |
ggcgatgaac |
aaagcagata |
2400 |
gaaatcccca |
ctcttgtgga |
gctgacattc |
tggagggaga |
gacaaaaagc |
aaacatataa |
2460 |
agaaagaaag |
aaatcacatg |
gatctggatg |
acagtgagtg |
ctgggaagaa |
aataaaagca |
2520 |
gaggaagggg |
atggagcgat |
gggcaggggg |
caacggtagg |
gagggtgtcg |
gggaaaactt |
2580 |
tttggagaat |
gtgacgatga |
aagtgaacaa |
ggagaagtca |
accgtgttga |
gatgatggca |
2640 |
gctaatgatg |
tggacaggcc |
actctgttct |
gagtgcatta |
tctattgatt |
catcatgtca |
2700 |
tcctcgcaac |
agccctgcac |
gatcaattct |
gtcattaacc |
ccatagtaca |
gatgaggatg |
2760 |
cggaggcaca |
gagaagataa |
gggacttgtc |
ctgtgtcaca |
cagcaaggag |
ccatccggct |
2820 |
cctaagttgg |
tgcatttgac |
ttctgtgctt |
ccggaaagaa |
agagcagcaa |
gtttaagatc |
2880 |
tggaggtggc |
actgagcttt |
ggaggagcag |
ggggcaatga |
ggtggccggt |
gtgacgagga |
2940 |
ctcaatgtgc |
aagagggaga |
gtggtgggga |
gatgaggtgg |
aggggtggtc |
ggcggtcaga |
3000 |
tcgtggaggg |
tctcggacga |
gggtcctgac |
cctgggtctc |
cagtcctggg |
aagtggagcc |
3060 |
caggctgtac |
catggctgac |
ctcagctcat |
ggcttcccct |
cccacttcca |
g |
3111 |
<210> 170 |
|
|
|
|
|
|
2093
181 <212> DNA <213> Homo sapiens <400>170 gtaaatgacg tactcctgcc tccctccctc ccagggctcc atccagctgt gcagtgggga60 ggactggcca gaccttctgt ccactgttgc aatgacccca ggaagctacc cccaataaac120 tgtgcctgct cagagcccca ggtacaccca ttcttgggag cgggcagggc tgtgggcagg180 tgcatcttgg cacagaggaa tgggcccccc aggaggggca gtgggaggag gtgggcaggg240 ctgagtcccc ccaggagagg cggtgggagg aggtgggcag ggctgaggtg ccactcatcc300 atctgccttc gtgtcagggt tatttgtcaa acagcatatc tgcagggact catcacagct360 accccgggcc ctctctgccc ccactctggg tctaccccct ccaaggagtc caaagaccca420 ggggaggtcc tcagggaagg ggcaagggag cccccacagc cctctctctt gggggcttgg480 cttctacccc cctggacagg agcccctgca cccccaggta tagatgggca cacaggcccc540 tccaggtgga aaaacagccc taagtgaaac ccccacacag acacacacga cccgacagcc600 ctcgcccaag tctgtgccac tggcgttcgc ctctctgccc tgtcccgcct tgccgagtcc660 tggccccagc accggggccg gtggagccga gcccactcac accccgcagc ctccgccacc720 ctgccctgtg ggcacaccag gcccaggtca gcagccaggc cccctctcct actgcccccc780 accgcccctt ggtccatcct gaatcggccc ccaggggatc gccagcctca cacacccagt840 ctcgcccact cacgcctcac tcaaggcaca gctgtgcaca cactaggccc catagcaact900 ccacagcacc ctgtaccacc accagggcgc catagacacc ccacacgtgg tcacacgtgg960 cccacactcc gcctctcacg ctgcctccag cgaggctact gccaagccct tcctctgagc1020 catacctggg ccgctggatc ccagagagaa atggagaggc cctcacgtgg tgtcctccag1080 tccaaccctc cctgtcaccc tgtcagcagc agcaccccac agccaaacac aggatggatg1140 cgtgggctcc atcccccact cacccacacc ggaaccccag agcaggctac gtgcccctca1200 cagacctcaa acccacatgt gcatctgaca ccccagatcc aaacgctccc cccggtcatg1260 cacaccaagg gcacagcacc caccaaatcc acacggaaac acgggcaccg ggcaccccat1320 gagcacaaag cccctccatg tctgaagaca gtccctgcac accgtcacag ccatacattc1380 agcttcactc tcacgtccca gcccacctgc acccagctct gggcctggag cagcagaaag1440 aggtgtgagg gcccgaggcg ggacctgcac ctgctgatga cccgggacca gcaggcagct1500’ cacggtgttg gggaagggag tggagggcac ccagggcagg agccagaggg accaggctgg1560 tgggcggggc cgggccgggg tagggccagg aggcagctct ggacacccac aggcctgggc1620 tcatagtcca caccaggaca gcccctcaga gcacccatgc agtgagtccc aggtcttggg1680 agccaggccg cagagctcac gcatccttcc gagggccctg agtgaggcgg ccactgctgt 1740
182 gccgaggggt tgggtccttc tctggggagg gcgtggggtc tagagaggcg gagtggaggt1800 aaccagaggt caggagagaa gccgtaagga acagagggaa aatggggcca gagtcggggc1860 gcagggacga gaggtcagga gtggtcggcc tggctctggg ccgttgactg actcgggacc1920 tgggtgccca ccctcagggc tggctggcgg ctccgcgcag tcccagaggg ccccggatag1980 ggtgctctgc cactccggac agcagcaggg actgccgaga gcagcaggag gctctgtccc2040 ccacccccgc tgccactgtg gagccgggag ggctgactgg ccaggtcccc cag2093 <210>171 <211> 1285.
<212> DNA <213> Homo sapiens <400>171
gtaaatgagt |
gccagggccg |
gcaagccccc |
gctccccggg |
ctctcggggt |
cgcgcgagga |
60 |
tgcttggcac |
gtaccccgtg |
tacatacttc |
ccgggcgccc |
agcatggaaa |
taaagcaccc |
120 |
agcgctgccc |
tgggcccctg |
cgagactgtg |
atggttcttt |
ccacgggtca |
ggccgagtct |
180 |
gaggcctgag |
tggcatgagg |
gaggcagagc |
gggtcccact |
gtccccacac |
tggcccaggc |
240 |
tgtgcaggtg |
tgcctgggcc |
gcctagggtg |
gggctcagcc |
aggggctgcc |
ctcggcaggg |
300 |
tgggggattt |
gccagcgtgg |
ccctccctcc |
agcagcacct |
gccctgggct |
gggccacgag |
360 |
aagccctagg |
agcccctggg |
gacagacaca |
cagcccctgc |
ctctgtagga |
gactgtcctg |
420 |
ttctgtgagc |
gccctgtcct |
ccgacccgca |
tgcccactcg |
ggggcatgcc |
tagtccatgt |
480 |
gcgtagggac |
aggccctccc |
tcacccatct |
acccccacgg |
cactaacccc |
tggcagccct |
540 |
gcccagcctc |
gaacccacat |
ggggacacaa |
ccgactccgg |
ggacatgcac |
tctcgggccc |
600 |
tgtggaggga |
ctggtccaga |
tgcccacaca |
cacaotcagc |
ccagacccgt |
tcaacaaacc |
660 |
ccgcactgag |
gttggccggc |
cacacggcca |
ccacacacac |
acgtgcacgc |
ctcacacacg |
720 |
gagcctcacc |
cgggcgaacc |
gcacagcacc |
cagaccagag |
caaggtcctc |
gcacacgtga |
780 |
acactcctca |
gacacaggcc |
cccacgagcc |
ccacgcggca |
cctcaaggcc |
cacgagccgc |
840 |
tcggcagctt |
ctccacatgc |
tgaccagctc |
agacaaaccc |
agccctcctc |
tcacaaggtg |
900 |
cccctgcagc |
cgccacacac |
acaggggaac |
acacgccacg |
tcgcgtccct |
ggcactggcc |
960 |
cacgtcccaa |
tacagccctt |
ccctgcagct |
ggggtcacat |
gaggggtggg |
tttcaccatc |
1020 |
ctcctgccct |
ctggggctca |
gggagggaca |
cgggagacgg |
ggagtgggtc |
ctgctgaggg |
1080 |
ccaggtcgct |
atctagggcc |
gggtgtctgg |
ctgagcccca |
gggccaaagc |
tggtgcccag |
1140 |
ggtggacagc |
ttccgggagc |
tgacctcagg |
acattgttgg |
cccatcccgg |
ccgggcccta |
1200 |
catcctgggc |
cccgccacag |
agggaatcac |
ccccagaggc |
ccaagcccag |
ggggacacag |
1260 |
183 cactgaccac ccccttcctg tccag1285 <210> 172 <211>6350 <212> DNA <213> Mus musculus <400>172 gtaagtcaca actgggtaag agtgtcaagc aaggacagca cttggtacct atgatagaca60 aatactcctg tttgggaaga ggaggtctgc attgtctaga taagaggaac actgtgctta120 tctgtttcag tttaaaagac agaactacat aacacttcac cctttctaca acacttagat180 ttttcagccc tctcctctat ggtgtttcct gaaccctgaa gaaagtgata tagatgttta240 tttattttct agggccactg ttccaaagaa acaatcacgt attattagca gcttgaccag300 gtgtgaattt cccccagtat ccacttctgc tccctgtggg atgaagtccc tccataagta360 aagttgaagg ctgtgggcat aaatgcaaat gcctgtaatc caattttaca agtccatgac420 atacatttaa caaacaatag cagttacttc tctactggag cctatgaact ccccagctat480 aggtttttcc cttctgcaga gcagagctta aatccaatag ggaagaagtt ggttgtaccc540 ataactgcca taccactatt acaccaataa gcacatctta catagcaaga caattagtgt600 agcactcaaa gtccatgttc aagagagaat gttggcaaca gcctatataa catctcccag660 cacagaaaag aaaaggaaag gaaaggaaag gaaaggaaag gaaaggaaag gaaaggaaag720 gaaaggaaag gaaaggaaag gaaaggaaag gaaagaaaag aaaagaaaag aaaagaaaag780 aaaagaaaag aaaagaaaag aaaagaaaag aaaagaaaag aaaagaaaag aaaagaaagg840 aaaagaaagg aaaagaaagg aagacagcca gaaggcagct tccacttcag tcctagccca900 tgttttctat gtcttacagc caaggttagt gaagtctcta gcagtaggaa tttatcatct960 acttctggca tgcaagtaaa atcaatggtg ataacttttg tggtttgtgg ctccttggga1020 gcctccctga acaataattt atgcagaggt agcccagctt tgccactggg gcttccatta1080 aacaaacttt ggattgaggg agtgtctttt tctacctgca cacagtgatt cctatgtttt1140 aactcttaat gagtcactgt tgtttgttgt tgttgttatt gttgttgtta ttgttgttgt1200 tgttgttgtt tctatcaacc cagacactat agggctataa ggcaggtgga agcatcactg1260 gctccagctg ttctcagtca tgctcttcct atcaatgttt gtgtaatgac tgcccctttt1320 actgtcggtt ttctatgggt gcctatggat aacgctgggt tgggcgaaac ccttgatggc1380 agcttttccc actgcttgct tatccatgta ggtgagagca cattcactct cacttgagag1440 gcttaggcct ttatgaagtc tgcctgacat atgggatagg taggcttata tgcttaccca1500 tcatgcaccc atgtgctggt accataagca agatcagacc tcacctgttc atgtagcatg 1560
184
cagaggatca |
gaatatttca |
caagaatgcc |
agaagctctc |
attactctct |
ggccttctct |
1620 |
taaagatcac |
atcctctaac |
aaagcttacc |
aaagccacta |
acatctgagt |
tagtcctact |
1680 |
caggtacaca |
tttcttaatg |
ctccagcaaa |
agcatctcta |
cccacttcat |
tgggcactaa |
1740 |
acaccacttc |
tcacatgttt |
agagtttttt |
gttaagactt |
taaattatct |
ttcagtcatg |
1800 |
tctgatgttc |
atgggcacct |
cagccagtaa |
taactgagtg |
tttctggtgt |
gtgcaggttt |
1860 |
ttgtctgttt |
tgtgttgttt |
atatgccagg |
aaaaagctgt |
ttagtacaga |
tctaattggc |
1920 |
attccccttc |
cttcatggtg |
tggatatttc |
ttttgagtta |
aaacatcccc |
tcttgtggca |
1980 |
gggggagggc |
tagaggtcaa |
tggaatgatt |
tcccgagttt |
ccttggataa |
atgaaacctt |
2040 |
tgtctcaggg |
aaggaagaat |
ggttctactt |
ctgtttctcc |
acttcatgat |
gctgactcta |
2100 |
gcctcttcca |
tgccccgtgt |
ctccaggcta |
tgaaggaatc |
cagcatgctt |
ttctctcttc |
2160 |
cttccttatc |
ttcttcatgg |
gttccaagtg |
ggttcctgtg |
gtttccacag |
gaaaggcttt |
2220 |
ttagcacaaa |
tctgatctgt |
actgtctttc |
ctttatcccc |
tgccagctct |
gagacagaaa |
2280 |
gccagcatct |
ctatcagaat |
ctctcttttg |
ccttcagaat |
cagagaccac |
tgtgaaaggc |
2340 |
agcatccgtg |
catctttttt |
tccattgtac |
tccttcatta |
cgtgagcaag |
atttttctaa |
2400 |
gcagatagct |
tagccttcat |
cgcacatctt |
agcacacact |
gcaaatgtca |
cacagacagc |
2460 |
ttgctatgcc |
atcccatgta |
tactattttc |
aaggattgca |
ataccttctc |
tgatctgaaa |
2520 |
tccattcaag |
taaaacaaca |
tgttgcaggt |
ccaattcaag |
aggcatgcca |
cctcatacca |
2580 |
tataaaagaa |
gatggtcagc |
aaaaattcct |
gctctctcag |
acaactcaga |
cttgggagca |
2640 |
gaaattccta |
tcacctctag |
cagggagtaa |
acaactacta |
ctacagctgg |
aagcatacta |
2700 |
tctcctacca |
taaaagatgc |
tagcttctct |
gacaccttag |
acctgaggca |
aggaatcctc |
2760 |
tgcctcattt |
ctttcgtctg |
ctggaaagcc |
tacaggacta |
agggctgctg |
taagcttgac |
2820 |
acaagcttga |
ggttgaaagg |
tgtcagacag |
gcttcacctg |
aggggcccta |
tatatgagtg |
2880 |
tagtgaggat |
ggaacaggct |
acgtggggca |
tcctccggca |
tcttgtcctc |
agagtggcct |
2940 |
tcagagccca |
ggctcaagtc |
agccatactt |
ccccacttag |
actctggaaa |
tgCcacagta |
3000 |
tgtccacaac |
ctccacaccc |
agctacacaa |
aattgagaga |
gggacctagt |
gggactgcag |
3060 |
caatcacatg |
aggccatacc |
tggaccagcc |
aagctgccag |
tataacagtc |
gtggctctga |
3120 |
gattttgaaa |
gcttggtctg |
ttgtctatgc |
ctcgggatct |
ttgggatgcc |
ttaggatcca |
3180 |
tcgagaaagt |
tctagagatc |
atgcctgttt |
ctggctgcac |
tgtactgact |
gagaacaggg |
3240 |
gctacagcac |
cactgtttct |
catggcctac |
ttcctgccag |
gtggtgcctc |
attagtactg |
3300 |
aaaggagcct |
gacctacact |
tgccccaaat |
tggccttttc |
ttttcccctg |
tggcattggt |
3360 |
tcctcaaagg |
acactaaggt |
tttctcttac |
ttgactccct |
caggatctct |
ctacagattt |
3420 |
tcacaggtca |
ctcctcagag |
ctagagtcat |
accagcatga |
ctatcctctg |
cccacattca |
3480 |
185
|
cacagcatgc ctgcctctct tctgtgcttc atcacaccaa |
ttaggaagtc atctgcccct acatgtcttg cccctgagaa |
tgggcatgct ctgtagtcat |
cttcattagg gcctgttggt gtcccacata tcgactagca |
ttgttcccac ctctccctac acacttcttc cctcctgact |
3540
3600
3660
3720 |
gccccacttc aggtagatac caataatgtt |
cccttgttct atctgcctga cttagttctg |
5 |
tgtctctatg |
atgccattct |
tcccctccta |
cccatccatc |
accctgttgc |
caaggcactc |
3780 |
|
tctgagacat |
cttgtttcta |
catagataca |
gaagaacatt |
tgattaggca |
tgtaggccat |
3840 |
|
ggtgaaagaa |
aaacaccaag |
taaactttta |
acatcacaat |
tttatttaaa |
actactagag |
3900 |
|
aggactcagc |
aatgctcaaa |
gagactaaat |
tcccaggtga |
aaggagatgg |
gatgttgtat |
3960 |
|
tctaggcaca |
gacagacaga |
gcagtgggac |
atatgtaatc |
accaagaaat |
cagccaaatt |
4020 |
10 |
tttaataaac |
accttagctg |
ccgagaggga |
tgagaacaca |
gaagaatccc |
aaattctgag |
4080 |
|
ccaatcacca |
ctcacttaac |
ctcccaccca |
ggacactgct |
aagcaagaaa |
caccttcgag |
4140 |
|
cacagtgtgg |
gcagaatatc |
catcttgtac |
cagctccaag |
gcctgctgaa |
tataagggtt |
4200 |
|
atcccaaagc |
acctagagcc |
agaagtcaac |
tatgataccc |
cagctccagc |
acagctcagt |
4260 |
|
tcccagttcc |
aaaaaacagg |
tcttccatgc |
ctggtggata |
agatgatatg |
cacttgtatc |
4320 |
15 |
tcacccccag |
actctacaat |
ccatgtatat |
acaatgccta |
gcatgcaatc |
agtaattaca |
4380 |
|
agatacaaat |
gattgataac |
caagacagag |
acagtacatg |
ggattagacc |
tgaggtacgg |
4440 |
|
gaaaggttgg |
gaaagcattc |
atagtgtccc |
ttgctacaag |
aagtcccaga |
gctttgcagg |
4500 |
|
gtgtgagcag |
attctaacct |
cccccattgg |
caagtcttct |
caaagctgct |
tctgctacta |
4560 |
|
gagaaccctc |
tttcccagcc |
acctgccact |
atttatcact |
tatctgagtt |
ttccccatga |
4620 |
20 |
ttctaggatg |
ctaccacctc |
ctgcctgagt |
cagacggtcc |
ttccaggaga |
cctgatggtc |
4680 |
|
ctgcccttgc |
ctgagacctt |
tctaggctga |
atggtcatca |
tgtccactgt |
ctggttagct |
4740 |
|
tggttgcctc |
tgtgttaagt |
tgcttcatac |
tacatgtagc |
aaggaaagtt |
acctttccac |
4800 |
|
ttctcaggac |
actgtaaaga |
agcacttctg |
taaattatag |
tgagaaacga |
tcaataataa |
4860 |
|
atgaaatgaa |
caaacataaa |
cctctcttat |
ctctatggga |
cctgccctaa |
ggcctcttgt |
4920 |
25 |
ggatgcctga |
aaccttgagt |
gttcttaagc |
catgtgtcac |
ttcagtcatt |
aacctgtggc |
4980 |
|
tgaggtggat |
cctgactgac |
aaacagacag |
gcatgtagac |
agcttgaagc |
ctggacaaag |
5040 |
|
agaaggttga |
•cgttccaggc |
aaagcaagag |
cctatcacat |
tgttccaaag |
tgtgtgattt |
5100 |
|
agaatcagaa |
gatttcttgt |
ttaaaatata |
ctcaaaaagt |
tataaaatat |
cagccaggac |
5160 |
|
tagtcataaa |
gcttaaatct |
gagagagaga |
gagagagaga |
gagagagaga |
gagaggtgtt |
5220 |
30 |
catgtatata |
catatgtgtg |
tgtgtgtata |
tatatgtatg |
tatatgtatg |
tatatgtgta |
5280 |
|
tattggtgtt |
tgggtgtcag |
attccctgga |
attaaagtta |
taaacagtta |
tgagctgcaa |
5340 |
|
agtaggcttt |
ccaatgtctt |
gttctccaac |
cataggtaat |
tgaaactgga |
aactacaggt |
5400 |
186
aaaggaggct |
gccaagtgtt |
tcttattatg |
ctaagattca |
gtgttctaca |
atattcacat |
5460 |
gatttcactt |
tgatatggtg |
aaatgccttt |
aggccaacgc |
atccacagac |
ttcacagtga |
5520 |
ccccagctga |
gcttacatat |
aatgtcaaac |
agcacttgtt |
gaatagatac |
ccaggcagcc |
5580 |
ctgtgaccca |
tggtgttttc |
cttaattctt |
cccatctgcc |
ttggactttc |
acaccttgag |
5640 |
ttgagatgtg |
ctttctgtag |
aaatgtattt |
ccctaggtct |
gtacatcagc |
caccaccctt |
5700 |
tctgatcttg |
gaccatactt |
cagtctccag |
ctgggatatt |
catatgcatg |
cttagatatg |
5760 |
gcataaccat |
cgttaacgtc |
ttctgttacc |
tttaggatta |
agttaccgta |
gctaggatgc |
5820 |
tttccaatct |
ctccctccat |
ttgcaaaggc |
tcagggttcc |
ttctgactct |
ggagtagtac |
5880 |
tctttcccaa |
tgagtgcacc |
atgaccacta |
ttcttcctta |
gaatgttact |
cccctttctc |
5940 |
tgcctttttc |
atggcacatc |
tttctgagaa |
aacctacctg |
gtctagctgc |
tctttctggg |
6000 |
tcttcttaag |
tagtaaccta |
actcctgcac |
catccgtgtg |
gcagtgacat |
agatccacat |
6060 |
caggtttgga |
ttcagatatt |
ccaatcccat |
gcagaccaat |
ctatgtgtga |
gattccagga |
6120 |
tccagcaggc |
tggggcatgg |
gttgaggggt |
aggattcttt |
ggggcaaagt |
ggttagtagg |
6180 |
cacttgggac |
tggaagtgat |
aagtattagc |
gggaggaggg |
catatgatca |
aaacattgct |
6240 |
gctggatgtg |
aaagctgtac |
cttcaggttc |
agtgttcagg |
agaccaggtt |
aataagaaat |
6300 |
gatctttctg |
tagggtggag |
accttctcat |
gagcactagt |
tcttccctag |
|
6350 |
<210> 173 <211> 1739 <212> DNA <213> Mus nusculus <400> 173
gtaacacctc |
cctccatccc |
tcctaggcct |
ccatgtagct |
gtggtgggga |
aggtggatga |
60 |
cagacatccg |
ctcactgttg |
taacaccagg |
aagctacccc |
aataaacact |
cagtgcctga |
120 |
ttagagccct |
gggtgcctgt |
tcttggggaa |
ggcaggttat |
gggcagaaat |
atcttggcct |
180 |
gaaagaaggg |
acaccccaag |
agaaggacag |
gagtgaagca |
tggctcaccc |
atctgtctat |
240 |
gtgttggata |
tttgacaaat |
aggacatcac |
aggacttcag |
cataggtacc |
cctggtcctt |
300 |
cctgctcttc |
actggatatc |
atgcacctga |
tctctagaga |
tgcagctaaa |
atgagccagt |
360 |
ctgggaaacc |
tcagcaccca |
cctctcagtc |
ttgcaagctc |
ctgctcccag |
acattcctgg |
420 |
atactaaacc |
ccttcaggta |
gagaaacagc |
caaagtcaac |
atctaggacg |
caggactcaa |
480 |
catggtcctg |
ctccttccct |
ctctactcaa |
cagccattga |
ggctgagccc |
accgccccaa |
540 |
ccgcctgcct |
tgccaaatga |
tcacaccagg |
cctggtgctc |
ctcgtcttac |
tacctaaact |
600 |
cactccaacc |
caaattcatc |
ccaaggacca |
gaatgggctg |
acagcctcat |
acagtcaggt |
660 |
187
tcccccatct |
atgacatgtt |
ttcacatgca |
tgcacacaca |
cacacacaca |
cacacacaca |
720 |
cacacacaca |
cacacacaca |
cacacaggct |
tcattgagct |
ctctggttta |
gcaatagccc |
780 |
aaagcaagcc |
atacatccat |
cccagttcca |
gaaggataag |
aaaaccagaa |
ccaagacaca |
840 |
cccacaccta |
ttccataccc |
aaccaacagc |
acatatggct |
tacacacctg |
agattagtgg |
900 |
ctcccatcat |
gtacacacac |
atgcacacaa |
aggagcccat |
acatacccat |
catttccaga |
960 |
ggtaagtatc |
taacctttgg |
atctgagata |
tctctgagga |
acaccaatgg |
cagagtcaac |
1020 |
cagcacctca |
gcctccagac |
taaatcctta |
cattttggcc |
caccccaagc |
catgagagat |
1080 |
ggaggagggt |
ggaggcctga |
gctgcgggaa |
agcagagaca |
ggaagatgga |
ctgtttggtg |
1140 |
agagtagtaa |
accagacaat |
ggggagacta |
aggcaggagt |
agagccccta |
caaggcccag |
1200 |
agtctgcttt |
agagtccatg |
tgtcctgacc |
tgcccctcag |
atgccacaac |
caagatttct |
1260 |
ggttccagag |
catgcatgca |
ggccctagaa |
atggacctat |
gagctcagag |
ccttcctaga |
1320 |
gagccctggg |
tactctctga |
acaaaaggca |
attctgtgta |
gaggcatcct |
gtggccaaag |
1380 |
accctaagac |
agtcatacac |
acacacacac |
acacacacac |
acacacacac |
aacacacaca |
1440 |
acacacacaa |
cacaggtagg |
ttttatcatg |
ctctttggtt |
tagcaatagc |
cctgttgatg |
1500 |
gtgggggata |
ctgggtcact |
gtgggcactg |
gagtagaaag |
agggaatgaa |
cagtcagtgg |
1560 |
ggaaaggaca |
tctgcctcta |
gggctgaaca |
gagactggag |
cagtctcaga |
gcaggtggga |
1620 |
tggggacctc |
tgccactcta |
gcttcatcag |
aactgcatga |
gacaagtatg |
gggtctaccc |
1680 |
cctccccact |
gtcacctgga |
gtctggggaa |
gctaactggc |
tggtcccacc |
ccatcccag |
1739 |
<210> 174 <211> 93 <212> DNA <213> Homo sapiens <400> 174
ttcgagcagc |
acctcctgct |
gggcgtcagc |
gtttcctgca ttgtcatcct ggccgtctgc |
60 |
ctgttgtgct |
atgtcagcat |
caccaagatt |
aag |
93 |
<210> |
175 |
|
|
|
|
<211> |
78 |
|
|
|
|
<212> |
DNA |
|
|
|
- |
<213> |
Homo sapiens |
|
|
|
<400> |
175 |
|
|
|
|
gggctgtgga cgaccatcac catcttcatc acactcttcc tgctaagcgt gtgctacagt 60 gccaccgtca ccttcttc
188 <210> 176 <211> 84 <212> DNA <213> Mus musculus <400> 176 ggcctgtggc ccacaatgtg caccttcgtg gccctcttcc tgctcacact gctctacagt 60 ggcttcgtca ccttcatcaa ggta 84