MXPA98008107A - Proteinas de superficie de alto peso molecular dehaemofilus no tipificable - Google Patents

Proteinas de superficie de alto peso molecular dehaemofilus no tipificable

Info

Publication number
MXPA98008107A
MXPA98008107A MXPA/A/1998/008107A MX9808107A MXPA98008107A MX PA98008107 A MXPA98008107 A MX PA98008107A MX 9808107 A MX9808107 A MX 9808107A MX PA98008107 A MXPA98008107 A MX PA98008107A
Authority
MX
Mexico
Prior art keywords
thr
ser
val
leu
gly
Prior art date
Application number
MXPA/A/1998/008107A
Other languages
English (en)
Inventor
J Barenkamp Stephen
Original Assignee
St Louis University
Washington University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by St Louis University, Washington University filed Critical St Louis University
Publication of MXPA98008107A publication Critical patent/MXPA98008107A/es

Links

Abstract

La presente invención se refiere a proteínas superficiales de alto peso molecular de Haemophilus influenzae no tipificable que exhiben propiedades inmunogénicas y genes que codifican para las mismas. ESpecíficamente, se han clonado, expresado y secuenciado genes que codifican para dos proteínas de alto peso molecular, inmunodominantes, HMW1 y HMW2, mientras que también se han clonado, expresado y secuenciado genes que codifican para proteínas de alto peso molecular, HMW3 y HMW4.

Description

PROTEÍNAS DE SUPERFICIE DE ALTO PESO MOLECULAR DE HAEMOFILUS NO TIPIFICABLE CAMPO DE LA INVENCIÓN Esta invención se refiere a proteínas de alto peso molecular de Haemophilus no tipificable.
ANTECEDENTES DE LA INVENCIÓN Los Haemophilus influenzae no tipificables son organismos no encapsulados que se definen por su carencia de reactividad con los antisueros contra los antígenos capsulares de H_¡_ influenzae, conocidos. Estos organismos habitan comúnmente el tracto respiratorio superior de los humanos y frecuentemente son responsables de una variedad de infecciones superficiales comunes, mucosales, tal como otitis media, sinusitis, conjuntivitis, bronquitis crónica y neumonía. La otitis media permanece como un problema de salud importante para niños y la mayoría de los niños han tenido al menos un episodio de otitis por su tercer año y aproximadamente un tercio de los niños han tenido tres o más episodios. El Haemophilus influenzae no tipificable da cuenta en general de aproximadamente 20 a 25 % de la otitis media aguda y de un gran porcentaje de casos de otitis media crónica con efusión.
P697 Un primer paso crítico en la patogénesis de estas infecciones es la colonización de la mucosa del tracto respiratorio. Las moléculas superficiales de la bacteria median la adherencia, por lo tanto, son de interés particular como posibles candidatos de vacuna. Toda vez que los organismos no tipificables no tienen una cápsula de polisacárido, no se controlan por las presentes vacunas contra Haemophilus influenzae tipo b (Hib) , que se dirige hacia los polisacáridos capsulares, bacterianos, Hib. Sin embargo, las cepas no tipificables producen antígenos superficiales que pueden producir como respuesta anticuerpos bacterianos. Se han identificado dos de las principales proteínas de la membrana exterior, P2 y P6 como los objetivos de la actividad bacteriana del suero humano. Sin embargo, se ha mostrado que es variable la secuencia de la proteína P2 , en particular en las cepas no tipificables de Haemophilus . De esta manera, una vacuna en base a P2 no protegería contra todas las cepas del organismo. Se han identificado previamente por Barenkamp y colaboradores (Pediatr. Infect. Dis. J., 9:333-339, 1990) un grupo de proteínas de alto peso molecular (HMW) del Haemophilus influenzae no tipificable que parece ser los principales objetivos de los anticuerpos presentes en los sueros de humanos convalecientes. El examen de una serie P697 de aislados del oído medio reveló la presencia de dos o más de estas proteínas de la mayoría de las cepas. Sin embargo, antes de la presente invención, eran desconocidas las estructuras de esas proteínas y sus secuencias de codificación de ácidos nucleicos, como lo fueron los aislados puros de estas proteínas. Además, no era conocida la identificación de los epítopes accesibles de la superficie de estas proteínas.
SUMARIO DE LA INVENCIÓN El inventor, en un esfuerzo para caracterizar adicionalmente las proteínas de Haemophilus no tipificable, de alto peso molecular (HMW) , ha clonado, expresado y secuenciado los genes que codifican para dos proteínas de HMW, in unodominantes, designadas HMWl y HMW2 (de una cepa de Haemophilus, no tipificable, de prototipo, y ha clonado, expresado y secuenciado los genes que codifican para dos proteínas de HMW, inmunodominantes, adicionales, (designadas HMW3 y HMW4) de otra cepa de Haemophilus, no tipificable. Por lo tanto, de acuerdo con un aspecto de la presente invención, se proporciona una molécula de ácido nucleico, aislada y purificada, que codifica para una proteína de alto peso molecular de una cepa de Haemophilus, no tipificable, particularmente una molécula de ácido P697 nucleico que codifica para la proteína HMWl, HMW2 , HMW3 ó HMW4, así como cualquier variante o fragmento de esta proteína que retenga la capacidad inmunológica para proteger contra la enfermedad provocada por una cepa de Haemophilus no tipificable. La molécula de ácido nucleico puede tener una secuencia de ADN mostrada en la Figura 1 (SEQ ID No . 1) y que codifica para HMWl, para la cepa 12 que tiene la secuencia de aminoácidos derivada de la Figura 2 (SEQ ID No. 2) . La molécula de ácido nucleico puede tener la secuencia de ADN mostrada en la Figura 3 (SEQ ID No . 3) y que codifica para la proteína HMW2 para la cepa 12 que tiene la secuencia de aminoácidos derivada de la Figura 4 (SEQ ID No. 4) . La molécula de ácido nucleico puede tener la secuencia de ADN mostrada en la Figura 8 (SEQ ID No. 7) y que codifica para HMW3 , para la cepa 5 que tiene la secuencia de aminoácidos derivada de la Figura 10 (SEQ ID No. 9) . La molécula de ácido nucleico puede tener una secuencia de ADN mostrada en la Figura 9 (SEQ ID No . 8) y que codifica para la proteína HMW4 para la cepa 5 que tiene la secuencia de aminoácidos derivada de la Figura 10 (SEQ ID No. 10) . En otro aspecto de la invención, se proporciona una molécula de ácido nucleico, asilada y purificada, que codifica para una proteína de alto peso molecular de una P697 cepa de Haemophilus, no tipificable, que se selecciona a partir del grupo que consiste de: (a) una secuencia de ADN como se muestra en cualquiera de las Figuras 1, 3, 8 y 9 (SEQ ID Nos. 1, 3, 7 y 8) ; (b) una secuencia de ADN que codifica para una secuencia de aminoácidos como se muestra en cualquiera de las Figuras 2, 4 y 10 (SEQ ID Nos. 2, 4, 9 y 10); y (c) una secuencia de ADN que hibridiza bajo condiciones severas a cualquiera de las secuencias de (a) y (b) , Una secuencia de ADN de acuerdo con (c) puede ser una que tenga al menos aproximadamente 90 % de identidad de secuencia respecto a las secuencias de ADN de (a) o (b) . El inventor ha encontrado además que el procedimiento correcto de la proteína HMW requiere de la presencia de secuencias de ácidos nucleicos, adicionales, en la dirección 3'. Por consiguiente, un aspecto adicional de la presente invención proporciona una agrupación génica aislada y purificada que comprende una primera secuencia de nucleótidos que codifica para una proteína de alto peso molecular de una cepa de Haemophilus, no tipificable, y al menos una secuencia de nucleótidos en la dirección 3' para efectuar la expresión de un producto génico de la primera secuencia de nucleótidos codificada completamente por el gen estructural . La agrupación génica puede comprender una secuencia de ADN que codifique para la proteína de alto peso molecular HMWl ó HMW2 y dos genes no esenciales en la dirección 3 ' . La agrupación génica puede tener la secuencia de ADN mostrada en la Figura 6 (SEQ ID No . 5) ó la Figura 7 (SEQ ID No. 6) . En un aspecto adicional, la presente invención incluye un vector adaptado para la transformación de un hospedero, que comprende una molécula de ácido nucleico como se proporciona en la presente, particularmente la agrupación génica proporcionada en la presente. El vector puede ser un vector de expresión o un plásmido adaptado para la expresión de la proteína de alto peso molecular, codificada, fragmentos o análogos de la misma, en un hospedero heterólogo u homólogo y que comprende un medio de expresión acoplado operativamente a la molécula de ácido nucleico. El medio de expresión puede incluir una porción de ácido nucleico que codifica para una secuencia guía para la secreción desde el hospedero de la proteína de alto peso molecular. El medio de expresión puede incluir una porción de ácido nucleico que codifique para una señal de lipidación, para la expresión desde el hospedero de una forma lipidada de la proteína de alto peso molecular. El hospedero puede ser seleccionado de, por ejemplo, E. Coli, Bacillus, Haemophilus, hongos, levadura, baculovirus, y los sistemas de expresión de virus de Semliki Forest. La invención incluye además una proteína de alto peso molecular, recombinante, de Haemophilus no tipificable, o fragmento análogo de la misma, producible por el hospedero transformado . En otro aspecto, la invención proporciona una proteína de alto peso molecular, aislada y purificada, de Haemophilus influenzae, no tipificable, que se codifica por una molécula de ácido nucleico como se proporciona en la presente. Esas proteínas de alto peso molecular se pueden producir de manera recombinante, para estar desprovistas de las proteínas no de alto peso molecular del Haemophilus influenzae no tipificable o de fuentes naturales. Esta proteína se puede caracterizar por al menos un epítope B-celular, expuesto en la superficie, que se reconoce por el anticuerpo monoclonal AD6 (ATCC ) . Esta proteína puede ser HMWl codificada por la secuencia de ADN mostrada en la Figura 1 (SEQ ID No. 1) y que tiene la secuencia de aminoácidos derivada de la Figura 2 (SEQ ID No. 2), y que tiene un peso molecular aparente de 125 kDa. Esta proteína puede ser HMW2 codificada por la secuencia de ADN mostrada en la Figura 3 (SEQ ID No . 3) y que tiene la secuencia de aminoácidos, derivada, de la Figura 4 (SEQ ID No. 4) y que tiene un peso molecular aparente de 120 kDa. Esta proteína puede ser HMW3 codificada por la secuencia de ADN mostrada en la Figura 8 (SEQ ID No . 7) y que tiene la secuencia de aminoácidos derivada de la Figura 10 (SEQ ID No. 9) y que tiene un peso molecular aparente de 125 kDa. Esta proteína puede ser HMW4 codificada por la secuencia de ADN mostrada en la Figura 9 (SEQ ID No. 8) y que tiene la secuencia de aminoácidos, derivada, mostrada en la Figura 10 (SEQ ID No . 10) y que tiene un peso molecular aparente de 123 kDa. Un aspecto adicional de la invención proporciona una proteína de alto peso molecular, aislada y purificada, de Haemophilus influenzae, no tipificable, que se relaciona antigénicamente a la proteína de superficie de hemaglutinina filamentosa de Bordetella pertussis, particularmente HMWl, HMW2 , HMW3 ó HMW4. Las nuevas proteínas de alto peso molecular de Haemophilus no tipificable se pueden usar como moléculas portadoras por el enlace a un antígeno, hapteno o polisacárido para producir como respuesta inmunitaria el antígeno, hapteno o polisacárido. Un ejemplo de este polisacárido es un polisacárido protector contra Haemophilus influenzae tipo b. En un aspecto adicional de la invención, se proporciona un péptido sintético que tiene una secuencia de aminoácidos que contiene al menos 6 aminoácidos y no más de 150 aminoácidos y que corresponde al menos a un y epítope protector de una proteína de alto peso molecular de Haemophilus influenzae, no tipificable, específicamente a HMWl, HMW2, HMW3 ó HMW4. El epítope puede ser uno reconocido por al menos uno de los anticuerpos monoclonales AD6 (ATCC _____) y 10C5 (ATCC _____) . Específicamente, el epítope se puede localizar en el espacio de los 75 aminoácidos de carboxi terminal de la proteína HMWl ó HMW2 y se reconoce por el anticuerpo monoclonal AD6. La presente invención también proporciona una composición inmunogénica que comprende una cantidad inmunoefectiva de un componente activo, que puede ser la alta proteína de alto peso molecular o péptido sintético proporcionada en la presente, que se puede formular junto con un portador farmacéuticamente aceptable el mismo. La composición inmunogénica se puede formular como una vacua para la administración in vivo a un huésped. La composición inmunogénica se puede formular como una micropartícula, cápsula, ISCOM o preparación de liposomas. La composición inmunogénica se puede usar en combinación con una molécula de selección de objetivo para distribuir a control células específicas del sistema inmunitario o las superficies mucosales. Algunas moléculas de selección de objetivo incluyen vitamina B12 y fragmentos de toxinas P697 bacterianas, como se describe en WO 92/17167 (Biotech Australia, Pty, Ltd.); y anticuerpos monoclonales, como se describe en la Patente Norteamericana No. 5,194,254 (Barber y colaboradores) . Las composiciones inmunogénicas de la invención (incluyendo vacunas) pueden comprender además al menos otro material inmunogénico o inmunoestimulante y el material inmunoestimulante puede ser al menos un adyuvante. Los adyuvantes adecuados para el uso en la presente invención incluyen (pero no se limitan a) fosfato de aluminio, hidróxido de aluminio, QS21, Quil Al, derivados y componentes de los mismos, matriz ISCOM, fosfato de calcio, hidróxido de calcio, hidróxido de zinc, un análogo de clicolípido, un éster de octadecilo de un aminoácido, un muramil-dipéptido-polifosfazaro, ISCOPROP, DC-chol, DDBA y una lipoproteínas y otros adyuvantes para inducir una respuesta Thl. Las combinaciones ventajosas de adyuvantes se describen en la solicitud de Patente Norteamericana Coopendiente, No. de Serie 08/261,194 presentada el 6 de Junio de 1994, asignada a Connaught Laboratories Limited y la descripción de la cual se incorpora en la presente por referencia. En un aspecto adicional de la invención, se proporciona un método para generar una respuesta inmunitaria en un hospedero, que comprende administrar a éste una cantidad inmunoefectiva de la composición inmunogénica como se proporciona en la presente. La respuesta inmunitaria puede ser una respuesta inmunitaria moral o mediada por células. Los hospederos en los cuales se puede conferir protección contra la enfermedad incluyen primates incluyendo humanos. La presente invención proporciona adicionalmente un método para producir anticuerpos específicos para una proteína de alto peso molecular de Haemophilus influenzae no tipificable que comprende: (a) administrar la proteína de alto peso molecular o epítope que contiene el péptido proporcionado en la presente a por lo menos un ratón para producir al menos un ratón inmunizado; (b) remover lo B-linfocitos de al menos un ratón inmunizado; (c) fusionar los B-linfocitos de al menos un ratón inmunizado con células de mieloma, produciendo de este modo hibridomas; (d) clonar los hibridomas; (e) seleccionar clonas que producen el anticuerpo anti-proteína de alto peso molecular; (f) cultivar las clonas que producen anticuerpos anti-proteína de alto peso molecular; y (g) aislar los anticuerpos anti-proteína de alto peso molecular de los cultivos.
P697 Los aspectos adicionales de la presente invención incluyen el anticuerpo monoclonal AD6 y el anticuerpo monoclonal 10C5. La presente invención proporciona, en un aspecto adicional de la misma, un método para producir una composición inmunogénica, que comprende administrar la composición inmunogénica proporcionada en la presente a un primer hospedero de prueba para determinar una cantidad de una frecuencia de administración de la misma para producir como respuesta una respuesta inmunitaria, seleccionada, contra una proteína de alto peso molecular de Haemophilus influenzae, no tipificable, y formular la composición inmunogénica en una forma adecuada para la administración a un segundo hospedero de acuerdo con la cantidad determinada y la frecuencia determinada de administración. El segundo hospedero puede ser un humano . La nueva proteína de cubierta proporcionada en la presente es útil en los procedimientos de diagnóstico y equipos para detectar anticuerpos para proteína de alto peso molecular de Haemophilus influenzae no tipificable. Los anticuerpos monoclonales adicionales específicos para la proteína de alto peso molecular o epítopes de la misma, son útiles en el procedimiento y equipos de diagnóstico para detectar la presencia de la proteína de alto peso molecular.
P697 Por consiguiente, un aspecto adicional de la invención proporciona un método para determinar la presencia en una muestra, de anticuerpos específicamente reactivos con una proteína de alto peso molecular de Haemophilus influenzae, que comprende los pasos de: (a) poner en contacto la muestra con la proteína de alto peso molecular o péptido que contiene el epítope como se proporciona en la presente para producir complejos que comprenden la proteína de cualquiera de los anticuerpos presentes en la muestra específicamente reactiva con ésta; y (b) determina la producción de los complejos.
En un aspecto adicional de la invención, se proporciona un método para determinar la presencia, en una muestra, de una proteína de alto peso molecular de Haemophilus influenzae o un péptido que contiene el epítope, que comprende los pasos de: (a) inmunizar un hospedero con la proteína o péptido como se proporciona en la presente, para producir anticuerpos específicos para la proteína o el péptido; (b) poner en contacto la muestra con los anticuerpos para producir complejos que comprenden ya sea la proteína de alto peso P697 molecular o el péptido que contiene el epítope presente en la muestra y los anticuerpos específicos; y (c) determinar la producción de los complejos.
Un aspecto adicional de la invención proporciona un equipo de diagnóstico para determinar la presencia de anticuerpos en una muestra, específicamente reactiva con una proteína de alto peso molecular de Haemophilus influenzae no tipificable o péptido que contiene el epítope, que comprende: (a) la proteína de alto peso molecular o el péptido que contiene el epítope como se proporciona en la presente; (b) un medio para poner en contacto la proteína o el péptido con la muestra para producir complejos que comprenden la proteína o el péptido y cualquier anticuerpo presente en la muestra; y (c) un medio para determinar la producción de los complejos.
La invención también proporciona un equipo de diagnóstico para detectar la presencia, en una muestra, de una proteína de alto peso molecular de Haemophilus influenzae, o péptido que contiene el epítope, que P697 comprende: (a) un anticuerpo específico para la nueva proteína de cubierta como se proporciona en la presente; (b) un medio para poner en contacto el anticuerpo con la muestra para producir un complejo que comprende la proteína o péptido y el anticuerpo específico de la proteína; y (c) un medio para determinar la producción del complejo.
En esta solicitud, el término "proteína de alto peso molecular" se usa para definir una familia de proteínas de alto peso molecular de Haemophilus influenzae, que tienen en general un peso molecular aparente desde aproximadamente 120 y hasta aproximadamente 130 kDa e incluye proteínas que tienen variaciones en sus secuencias de aminoácidos. En esta solicitud, una primera proteína o péptido es un "análogo funcional" de una segunda proteína o péptido, si la primera proteína o péptido se relaciona inmunológicamente a y/o tiene la misma función como la segunda proteína o péptido. El análogo funcional puede ser, por ejemplo, un fragmento de la proteína o mutante por sustitución, adición o supresión de la misma. La invención también se extiende a los análogos funcionales.
P697 Las ventajas de la presente invención incluyen: una proteína de alto peso molecular, de cubierta, aislada y purificada, de Haemophilus influenzae, producida de manera recombinante para estar desprovista de las proteínas no de alto peso molecular de Haemophilus influenzae o de fuentes naturales así como moléculas de ácido nucleico que codifican para la misma; anticuerpos monoclonales humanos específicos para la proteína de alto peso molecular, que reconocen los epítopes conservados en estas proteínas; y equipos de diagnóstico y reactivos inmunológicos para la identificación específica de los hospederos infectados por Haemophilus influenzae .
BREVE DESCRIPCIÓN DE LOS DIBUJOS Las Figuras de ÍA a ÍG contiene la secuencia de ADN de un gen que codifica para la proteína HMWl (SEQ ID No. 1) . El marco de lectura abierto de hmwlA se extiende de los nucleótidos 351 a 4958; Las Figuras 2A y 2B contienen la secuencia de aminoácidos derivada de la proteína HMWl (SEQ ID No. 2 ) ; Las Figuras de 3A a 3G contienen la secuencia de ADN de un gen que codifica para la proteína HMW2 (SEQ ID No. 3). El marco de lectura abierto de hmw2A se extiende desde los nucleótidos 382 a 4782; P697 Las Figuras 4A y 4B contienen la secuencia de aminoácidos derivada de HMW2 (SEQ ID No. 4) ; La Figura 5A muestra los marcos de restricción de los fagos recombinantes respectivos que contienen los genes estructurales de HMWl o HMW2 y de las subclonas de los plásmidos de HMWl . Las secuencias sombreadas indican la ubicación de los genes estructurales . En el fago recombinante, la transcripción prosigue de izquierda a derecha para el gen HMWl y de derecha a izquierda para el gen HMW2 ; La Figura 5B muestra el mapa de restricción del vector de expresión T7, pT7-7, este vector contiene el promotor fl0,de la ARN-polimerasa de T7, un sitio de unión ribosómico (rbs) y el sitio de inicio de traducción para la proteína del gen 10 T7 en la dirección 5' desde un sitio de clonación múltiple; Las Figuras de 6A a 6L contienen la secuencia de ADN de una agrupación génica para el gen hmwl (SEQ ID No. 5), que comprende los nucleótidos 351 a 4958 (ORF a) (como la Figura 1) , así como dos genes adicionales en la dirección 3 ' en la región de flanqueo 3 ' , que comprende ORF b, nucleótidos de 5114 a 6748 y c, nucleótidos de 7062 a 9011; Las Figuras de 7A a 7L contienen la secuencia de ADN de una agrupación génica para el gen hmw2 (SEQ ID No.
P697 6) , que comprende los nucleótidos 792 a 5222 (ORF A) (como en la Figura 3), así como dos genes adicionales en la dirección 3' en la región de flanqueo 3', que comprende ORF b, nucleótidos de 5375 a 7009, y c, nucleótidos de 7249 a 9198; Las Figuras 8A y 8B contienen las secuencias de ADN de un gen que codifica para la proteína HMW3 (SEQ ID No . 7 ) ; Las Figuras 9A y 9B contienen la secuencia de ADN de un gen que codifica para la proteína HMW4 (SEQ ID No. 8) ; Las Figuras 10A a 10L contienen una tabla de comparación para la secuencia de aminoácidos derivada para las proteínas HMW2 (SEQ ID No . 2), HMW2 (SEQ ID No. 4), HMW3 (SEQ ID No. 9), y HMW4 (SEQ ID No. 10); La Figura 11 ilustra un ensayo De inmunotransferencia Western de los lisados de fagos que contienen ya sea las proteínas recombinantes HMWl ó HMW2. Los lisados se sondearon con una muestra de suero de adulto, absorbida con E. coli con el anticuerpo de alto título contra proteínas de alto peso molecular. Las flechas indican las principales bandas inmunorreactivas de 125 y 120 kDa en los lisados de HMWl y HMW2 , respectivamente ; La Figura 12 es un ensayo De inmunotransferencia P697 Western de los productos celulares tratados con sonido separados a partir de E. coli transformada con el plásmido pT7-7 (sendas 1 y 2), pHMWl-2 (sendas 3 y 4), pHMWl-4 (sendas 5 y 6) ó pHMWl-14 (sendas 7 y 8) . Los productos tratados con sonido se probaron con una muestra de suero de adulto absorbido con E. coli con el anticuerpo de alto título contra las proteínas de alto peso molecular. Las sondas marcadas con U e I secuencian los productos tratados con sonidos preparados antes y después de la indicación de las muestras en crecimiento con IPTG, respectivamente. Las flechas indican las bandas de proteínas de interés como se discute posteriormente; La Figura 13 es una descripción gráfica de un ensayo ELISA con un antisuero rHMWl valorado contra hemaglutinina filamentosa purificada de B. pertussis. Ab = anticuerpo. La Figura 14 es un ensayo De inmunotransferencia Western de los productos celulares tratados con sonidos de un panel de cepas de H. influenzae, no tipificable, epidemiológicamente no relacionadas. Los productos tratados con sonido se sondearon con antisuero de conejo preparado contra la proteína recombinante HMW1-4. Las designaciones de las cepas indican por los números por abajo de cada línea; La Figura 15 es un ensayo De inmunotransferencia P697 Western o productos celulares tratados con sonidos de un panel de cepas de H. influenzae, no tipificables, epidemiológicamente no relacionados. Los productos tratados con sonido se sondearon con el anticuerpo monoclonal X13, un anticuerpo IgG murino que reconoce la hemaglutinina filamentosa de B. pertussis. Las designaciones de las cepas se indican por los números por abajo de cada línea; La Figura 16 muestra un ensayo de inmunotransferencia de los productos celulares tratados con sonidos de los derivados de la cepa 12 de H. influenzae no tipificable. Los productos tratados con sonido se sondearon con antisuero de conejo preparado contra la proteína recombinante HMWl. Bandas: 1, cepas tipo silvestre; 2, mutante de HMW2 ; 3 mutante de HMWl; 4, mutante doble de HMWl, HMW2. La Figura 17 muestra el conteo bacteriano del oído medio en los animales de control inmunizados con PBS (panel izquierdo) y los animales inmunizados con HMW1/HMW2 (panel derecho) siete días después de la inoculación del oído medio con la cepa 12 de Haemophilus influenzae no tipificable. Los datos se transformaron por logaritmo y las sendas o bandas horizontales indican el promedio y las desviaciones estándar de los conteos bacterianos del fluido del oído medio para solo los animales infectados en cada P697 grupo; La Figura 18 es un diagrama esquemático de los plásmidos recombinantes pGEMEXR-hmwl . Las enzimas de restricción son BamHI, E-EcoRI, C-Clal, RV-EcoRV, Bst-BstEII y H-HindIII; La Figura 19 es un diagrama esquemático de los plásmidos recombinantes pGEMEXR-hmw2. Las enzimas de restricción son E-EcoRI, H-HindlII, Hc-HindII, N-Mlul y X-Xhol ; La Figura 20 es una micrografía inmunoelectrónica de las cepas de Haemophilus influenzae, no tipificables, representativas, después de la incubación con el anticuerpo monoclonal AD6 seguido por la incubación con la IgG antiratón de cabra conjugada con partículas de oro coloidal de 10 nm. Las cepas son: panel superior izquierdo-cepa 12; panel superior derecho-mutante de cepa 12 deficiente en la expresión de las proteínas de alto peso molecular; panel izquierdo inferior-cepa 5; panel derecho inferior-cepa 15. La Figura 21 es un ensayo De inmunotransferencia Western con las proteínas recombinantes Mab AD6 6 HMW2 ó HMW2. El panel superior izquierdo indica los segmentos de los genes estructurales hm lA ó hmw2A, que se expresan en las proteínas recombinantes . Los números de sendas corresponden a los segmentos indicados; La Figura 22 es un ensayo De inmunotransferencia P697 Western con las proteínas recombinantes Mab 10C5 y HMWl ó HMW2. El panel superior indica los segmentos de los genes estructurales hmwlA ó hmw2A que se expresan en las proteínas recombinantes . Los números de sendas o bandas corresponden a los segmentos indicados; La Figura 23 es un ensayo De inmunotransferencia Western con Mab AD6 y un panel de las cepas de Haemophilus influenzae, no tipificable, no relacionadas, que expresan proteínas similares a HMW1/HMW2. Los productos celulares preparados con sonido se prepararon a partir de muestras recientemente cultivadas de cada cepa antes de los análisis De inmunotransferencia Western.
DESCRIPCIÓN GENERAL DE LA INVENCIÓN La secuencia de ADN de los genes codifican para las proteínas HMWl y HMW2 de la cepa 12 de Haemophilus influenzae no tipificable, mostrados en las Figuras 1 y 3, respectivamente, se mostraron que son 80 % idénticas, con los primeros 1259 pares de bases de los genes que son idénticos. El marco de lectura abierto se extiende desde los nucleótidos 351 a 4958 y desde el nucleótido 382 a 4782, respectivamente. La secuencia de aminoácidos derivada de las dos proteínas HMW, mostradas en las Figura 2 y 4, respectivamente, son aproximadamente 70 % idénticas. Además, las proteínas codificadas están antigénicamente P697 relacionadas a la proteína de superficie de la hemaglutinina filamentosa de Bordetella pertussis. Se encontró que un anticuerpo monoclonal preparado contra hemaglutinina filamentosa (FHA) de Bordetella pertussis, reconoce a ambas de las proteínas de alto peso molecular. Estos datos sugieren que las proteínas HMW y FHA pueden servir para funciones biológicas similares. Las secuencia de aminoácidos derivada de las proteínas HMWl y HMW2 mostraron similitud de secuencia a aquélla de la proteína FHA. Además, se ha mostrado que estas proteínas antigénicamente relacionadas se producen por la mayoría de las cepas no tipificables de Haemophilus . Los antisueros formulados contra la proteína expresada con el gen HMWl reconoce tanto la proteína HMW2 como la FHA de B_¡_ pertussis . La presente invención no incluye una proteína de alto peso molecular aislada y purificada de Haemophilus no tipificable, que está antigénicamente relacionada a la FHA de la B. pertussis, que se puede obtener de fuentes naturales o se produce de manera recombinante. Una genoteca de fagos, de una cepa conocida de Haemophilus no tipificable se preparó por métodos normales y se inspeccionó la genoteca para las clonas que expresan las proteínas de alto peso molecular, usando un antisuero de alto título contra HMW. Se purificaron con placa y subclonaron un número de clonas de ADN fuertemente P697 reactivos, en un plásmido de expresión T7. Se encontró que todos expresaron ya sea una o la otra de las dos proteínas de alto peso molecular designadas HMWl y HMW2 , con pesos moleculares aparentes de 125 y 120 kDa, respectivamente, codificadas por los marcos de lectura abiertos de 4.6 kb y 4.4 kb, respectivamente. Las clonas representativas que expresan ya sea HMWl ó HMW2 se caracterizaron además y los genes se aislaron, purificaron y secuenciaron. La secuencia de ADN de HMWl se muestra en la Figura 1 y la secuencia de aminoácidos derivada, correspondiente, en la Figura 2. De manera similar, las secuencias de ADN de HMW2 se muestran en la Figura 3 y la secuencia de aminoácidos, derivada, correspondiente en la Figura 4. La purificación parcial de las proteínas aisladas y el análisis de la secuencia N terminal indicó que las proteínas expresadas están truncadas, puesto que su secuencia inicia en el número de residuo 442 de ambos productos génicos HMWl y HMW2 de longitud completa. Los estudios de subclonación con respecto a los genes hmwl y hmw2 indicaron que el procedimiento correcto de las proteínas HMW requirió los subproductos de genes adicionales en la dirección 3'. Se ha encontrado que los genes hmwl como hmw2 están flanqueados por dos marcos de lectura abiertos (ORF), en la dirección 3', designados b y P697 c, respectivamente (ver Figuras 6 y 7) . Los ORF b son de 1635 pb de longitud, extendiéndose desde los n5114 a 6748 en el caso de hmwl y de los nucleótidos 5375 a 7009 en el caso de hmw2 , con sus secuencias de aminoácidos derivadas que so 99 % idénticas. Las secuencias de aminoácidos derivadas demuestran similitud con las secuencias de aminoácidos derivadas de dos genes que codifican para las proteínas requeridas para la secreción y activación de las hemolisinas de J _ mirabilis y S . marcescens . Los ORF c son de 1950 pb de longitud, extendiéndose desde los nucleótidos 7062 a 9011 en el caso de hmwl y de los nucleótidos 7249 a 9198 en el caso de hmw2 , con sus secuencias de aminoácidos derivadas que son 96 % idénticas. Los ORF c de hmwl se preceden por una serie de repeticiones en tándem, directas, de 9 pb. En las subclonas de los plásmidos, la interrupción del ORF b o c de hmwl da por resultado el procedimiento defectuoso y la secreción defectuosa del producto génico o estructural de hmwl. Las dos proteínas de alto peso molecular HMWl y HMW2 se han aislado y purificado por los procedimientos descritos posteriormente en los ejemplos y se muestran que son protectoras contra la otitis medias en chinchillas y que funcionan como adhesinas. Estos resultados indican el P697 potencial para el uso de estas proteínas de alto peso molecular y las proteínas estructuralmente relacionadas de otras cepas no tipificables de Haemophilus influenzae como componentes en las composiciones inmunogénicas para proteger un hospedero susceptible, tal como un infante humano contra enfermedades provocadas por la infección con Haemophilus influenzae no tipificable. Puesto que las proteínas proporcionadas en la presente son buenos antígenos interreactivos y se presentan en la mayoría de las cepas de Haemophilus no tipificables, es evidente que estas proteínas HMW pueden llegar a ser constituyentes integrales de la vacuna universal de Haemophilus . En realidad, estas proteínas se pueden usar no solo como antígenos protectores contra la otitis, sinusitis y bronquitis provocada por las cepas de Haemophilus no tipificable, sino también se puede usar como portadores para los polisacáridos Hib protectores en una vacuna de conjugado contra la meningitis. Las proteínas también se pueden usar como portadores para otros antígenos, haptenos y polisacáridos de otros organismos, para inducir inmunidad a estos antígenos, haptenos y polisacáridos . Las secuencias de nucleótidos que codifican para dos proteínas de alto peso molecular de una cepa de Haemophilus no tipificable, diferente (designadas HMW3 y P697 HMW4) , específicamente la cepa 5 se han elucidado, y se presentan en las Figuras 8 y 9 (SEQ ID No . 7 y 8) . La HMW3 tiene un peso molecular aparente de 125 kDa, mientras que la HMW4 tiene un peso molecular aparente de 123 kDa. Estas proteínas de alto peso molecular están relacionadas antigénicamente a las proteínas HMWl y HMW2 y a la FHA. La Figura 10 contiene una comparación de múltiples secuencias de las secuencias de aminoácidos derivadas para las cuatro proteínas de alto peso molecular identificadas en la presente (HMWl, SEQ ID No. 2; HMW2 , SEQ ID No. 4; HMW3 , SEQ ID No. 9; HMW4, SEQ ID No . 10) . Como se puede ver a partir de esta comparación, las distancias de la secuencia de aminoácidos idéntica se puede encontrar a todo lo largo de la longitud de la comparación, con HMW3 que asemeja más cercanamente a HMWl y HMW4 que asemeja más cercanamente a HMW2. Esta información es altamente sugestiva de una homología de secuencia considerable entre las proteínas de alto peso molecular de varias cepas de Haemophilus, no tipificables. Esta información también es sugestiva de que las proteínas HMW3 y HMW4 tendrán las mismas propiedades inmunológicas que las proteínas HMWl y HMW2 y que las proteínas HMW correspondientes de otras cepas de Haemophilus, no tipificables, tendrán las mismas propiedades inmunológica como las proteína HMWl y HMW2. Además, los mutantes de las cepas de H.
P697 influenzae no tipificables, que son deficientes en la expresión de HMWl ó HMW2 o que se han construido ambas y examinado en cuanto a su capacidad para adherirse a las células epiteliales humanas, cultivadas. Las agrupaciones génicas hmwl y hmw2 se han expresado en E. coli y se han examinado para la adherencia in vitro. Los resultados de este experimento, descrito posteriormente, demuestra que tanto HMWl como HMW2 median la unión y, por lo tanto, son adhesinas y que esta función está presente aún en la ausencia de otras estructurales superficiales de H. influenzae. La capacidad de una proteína de superficie, bacteriana, para funcionar como una adhesina proporciona fuerte evidencia in vitro de su papel potencial como un antígeno protector. En vista de la considerable homología de secuencia entre las proteínas HMW3 y HMW4 y las proteínas HMWl y HMW2 , estos resultados indican que HMW3 y HMW4 también probablemente van a funcionar como adhesinas y que otras proteínas HMW de otras cepas de Haemophilus influenzae no tipificable probablemente van funcionar de manera similar como adhesinas. Esta predicción se produce por los resultados descritos en los ejemplos posteriores. Con el aislamiento y purificación de las proteínas de alto peso molecular, el inventor es capaz de determinar los epítopes protectores principales de las proteínas por correlación convencional de los epítopes y la P697 síntesis de los péptidos que corresponden a estos determinantes para la incorporación en vacunas completamente sintéticas o recombinantes. Por consiguiente, la invención también comprende un péptido sintético que tiene al menos 6 y no más de 50 aminoácidos y que tiene una secuencia de aminoácidos que corresponde a al menos un epítope protector de una proteína de alto peso molecular de un Haemophilus influenzae no tipificable. Estos péptidos son de longitud variable, que constituyen porciones de las proteínas de alto peso molecular, que se pueden usar para inducir inmunidad, ya sea directamente o como parte de un conjugado, contra los organismos respectivos y los componentes activos constitutivos de composiciones inmunogénicas para la protección contra las enfermedades correspondientes. En particular, el solicitante ha buscado identificar regiones de las proteínas de alto peso molecular que se demuestra experimentalmente que son epítopes B-celulares, expuestos en la superficie, y que son comunes en todas las cepas o al menos un gran número de cepas no tipificable de Haemophilus influenzae . La estrategia que se ha adoptado por el inventor ha sido: (a) generar un panel de anticuerpos monoclonales reactivos con las proteínas de alto peso molecular; P697 (b) detectar aquellos anticuerpos monoclonales que sean reactivos con los epítopes superficiales de bacterias intactas, usando microscopía inmunoelectrónica u otras técnicas de detección adecuadas ; (c) correlacionar los epítopes reconocidos por el anticuerpo monoclonal al determinar la reactividad de los anticuerpos monoclonales con un panel de proteínas de fusión recombinantes; y (d) determinar la reactividad de los anticuerpos monoclonales con las cepas de Haemophilus influenzae, no tipificable, heterólogas, usando el ensayo De inmunotransferencia Western normal.
Usando este planteamiento, el inventor ha identificado un anticuerpo monoclonal, designado AD6, (ATCC ), que reconoció un epítope B-celular, expuesto en la superficie, común a todas las H. influenzae no tipificables que expresan las proteína HMWl y HMW2. El epítope reconocido por este anticuerpo se correlacionó a una secuencia de 75 aminoácidos en el carboxi terminal de las proteínas HMWl como HMW2. La capacidad para identificar los epítopes expuestos en la superficie, compartidos, en las proteínas de adhesión de alto peso molecular, sugiere que sería posible desarrollar vacunas en base a péptidos, P697 recombinantes o sintéticos que serían protectoras contra la enfermedad provocada por la mayoría de las cepas de Haemophilus influenzae no tipificables. La presente invención también proporciona cualquier variante o fragmento de las proteínas que retienen la capacidad inmunológica potencial para proteger contra la enfermedad provocada por las cepas de Haemophilus, no tipificables. Las variantes se pueden construir por presiones parciales o mutaciones de los genes y la expresión de los genes modificados, resultantes, para dar las variantes proteicas . Es claramente aparente para un experto en la técnica, que las varias modalidades de la presente invención tienen muchas aplicaciones en los campos de la vacunación, diagnosis, tratamiento de infecciones bacterianas y la generación de reactivos inmunológicos . Una discusión no limitante adicional de estos usos se presenta adicionalmente a continuación: 1_?. Preparación de Vacuna y Uso Las composiciones inmunogénicas, adecuadas para ser usadas como vacunas se pueden preparar a partir de las proteínas de alto peso molecular de Haemophilus influenzae, así como análogos y fragmentos de las mismas, y péptidos sintéticos que contienen los epítopes de la proteína, como P697 se describe en la presente. Las composiciones inmunogénicas producen como respuesta una respuesta inmunitaria que produce anticuerpos, incluyendo anticuerpos anti-proteína de alto peso molecular, y anticuerpos que son opsonizantes o bactericidas. Las composiciones inmunogénicas, incluyendo vacunas, se pueden preparar como soluciones inyectables, líquidas o emulsiones. El componente activo se puede mezclar con excipientes farmacéuticamente aceptables que son compatibles con el mismo. Estos excipientes pueden incluir, agua, solución salina, dextrosa, glicerol, etanol y combinaciones de los mismos. Las composiciones inmunogénicas y las vacunas pueden contener además sustancias auxiliares, tal como agentes humectantes o emulsionantes, agentes amortiguadores del pH, o adyuvantes para mejorar la efectividad de la misma. Las composiciones inmunogénicas y vacunas se pueden administrar de manera parenteral, por inyección subcutáneamente o intramuscularmente. De manera alternativa, las composiciones inmunogénicas formadas de acuerdo con la presente invención se pueden formular y administrar de manera de provocar una respuesta inmunitaria en las superficies mucosales. De esta manera, la composición inmunogénica se puede administrar a las superficies mucosales, por ejemplo, por vía nasal u oral P697 (intragástrica) . Alternativamente, pueden ser deseables otros modos de administración incluyendo supositorios y formulaciones orales. Para los supositorios, los aglutinantes y portadores pueden incluir, por ejemplo, polialquilenglicoles o triglicéridos. Las formulaciones orales pueden incluir incipientes normalmente empleados tal como por ejemplo, sacarina, celulosa y carbonato de magnesio, todas de grado farmacéutico. Estas composiciones pueden tomar la forma de soluciones, suspensiones, tabletas, pildoras, cápsulas, formulaciones de liberación sostenida o polvos, y contienen desde aproximadamente 1 hasta 95 % del componente activo. Las preparaciones y vacunas inmunogénicas se administran de una manera compatible con la formulación de dosificación, y en una cantidad tal que será terapéuticamente efectiva, protectora e inmunogénica. En la cantidad que se va administrar depende el sujeto que se va a tratar, incluyendo, por ejemplo, la capacidad de extremo inmunitario del individuo para sintetizar anticuerpos y, si es necesario, para producir una respuesta inmunitaria mediada por células. Las cantidades precisas del ingrediente activo requeridas para ser administradas dependen del juicio del médico tratante. Sin embargo, los intervalos adecuados de dosificación son fácilmente determinables por un experto en la técnica y pueden ser del orden de microgramos de las P697 proteínas HMW. Los regímenes adecuados para la administración inicial y dosis de refuerzo son también variables, pero pueden incluir una administración inicial seguida por administraciones subsecuentes. La dosis puede depender también de la ruta de administración y variará de acuerdo con la talla del hospedero. La concentración del componente activo en una composición inmunogénica de acuerdo con la invención es en general de aproximadamente 1 hasta 95 %. Una vacuna que contiene el material antigénico de solo un patógeno es una vacuna monovalente. Las vacunas que contienen material antigénico de varios patógenos son vacunas combinadas y también corresponden a la presente invención. Estas vacunas combinadas contienen, por ejemplo, material de varios patógenos o de varias cepas del mismo patógeno, o de combinaciones de varios patógenos. Se pueden mejorar significativamente la inmunogenicidad si los antígenos se co-administran con adyuvantes, comúnmente usados como solución al 0.05 ó 0.01 % en solución salina amortiguada con fosfato. Los adyuvantes mejoran la inmunogenicidad de un antígeno, pero no son necesariamente inmunogénicos por sí mismos. Los adyuvantes pueden actuar al retener el antígeno de manera local cerca del sitio de administración para producir un efecto de depósito, facilitando una liberación sostenida, P697 lenta del antígeno de células del sistema inmunitario. Los adyuvantes también pueden atraer células del sistema inmunitario a un depósito de antígenos y estimular estas células para producir respuestas inmunitarias. Los agentes o adyuvantes inmunoestimuladores se han usado durante muchos años para mejorar las respuestas inmunitarias del hospedero, a por ejemplo, vacunas. Los adyuvantes intrínsecos, tal como, lipopolisacáridos, normalmente son los componentes de las bacterias muertas o atenuadas usadas como vacunas. Los adyuvantes intrínsecos son inmunomoduladores que se enlazan típicamente de manera no covalente a los antígenos y se formulan para mejorar las respuestas inmunitarias del hospedero. De esta manera, se han identificado adyuvantes que mejoran la respuesta inmunitaria a antígenos distribuidos de manera parenteral. Sin embargo, algunos de estos adyuvantes son tóxicos, y pueden provocar efectos laterales indeseables, haciéndolos inadecuados para el uso en humanos y muchos animales . En realidad, solo el hidróxido de aluminio y fosfato de aluminio (colectivamente referidos de manera común como alumbre) se usan rutinariamente como adyuvantes en vacunas humanas y de veterinaria. La eficacia del alumbre en el incremento de la respuesta de anticuerpos a los toxoides de difteria y tétanos está bien establecida y se ha formulado con alumbre una vacuna de HBsAg. Mientras que la utilidad P697 del alumbre está bien establecida para algunas aplicaciones, tiene limitaciones. Por ejemplo, el alumbre es ineficaz para la vacunación contra la influenza y produce inconsistentemente una respuesta inmunitaria mediada por células. Los anticuerpos producidos por los antígenos con adyuvante de alumbre son principalmente del isotipo IgGl en el ratón, que no pueden ser óptimos para la protección por algunos agentes de vacuna. Un amplio intervalo de adyuvantes intrínsecos puede provocar respuestas inmunitarias potentes a los antígenos. Estos incluyen saponinas formadas en complejo a los antígenos de la proteína de membrana (complejos de inmunoestimulación) , polímeros plurónicos con aceite mineral, microbacterias muertas en aceite mineral, el adyuvante completo de Freund, productos bacterianos, tal como muramil-dipéptido (MBP) y lipopolisacárido (LPS) , así como el lípido A, y liposomas. Para inducir de manera ineficiente las respuestas inmunitarias humorales (HIR) y la inmunidad mediada por células (CMI) , los inmunógenos frecuentemente se emulsionan en adyuvantes. Muchos adyuvantes son tóxicos y, entre otros, producen formación de granulomas, inflamaciones agudas y crónicas (adyuvante completo de Freund, FCA) , citólisis (polímeros Plurónicos y saponinas) , y pirogenicidad, artritis y uveitis anterior (LPS y MDP) .
P697 Aunque el FCA es un excelente adyuvante y se usa ampliamente en la investigación, no está permitido para el uso en vacunas humanas o veterinarias, debido a su toxicidad. Las características deseables de los adyuvantes ideales incluyen: (1) carencia de toxicidad; (2) capacidad de estimular una respuesta inmunitaria duradera; (3) simplicidad para fabricar estabilidad en el almacenamiento a largo plazo; (4) capacidad para producir tanto CMI como HIR a antígenos administrados por varias rutas, si se requiere; (5) sinergia con otros adyuvantes; (6) capacidad de interactuar selectivamente con poblaciones de células que presentan antígenos (APC) ; (7) capacidad para producir específicamente respuestas inmunitarias específicas de las células TH1 ó TH2, apropiadas; y (8) capacidad para incrementar selectivamente los niveles apropiados del isotipo de anticuerpo (por ejemplo, IgA) contra antígenos. La Patente Norteamericana No. 4,855,283 otorgada a Lockhoff y colaboradores el 8 de Agosto de 1989 que se incorpora en la presente por referencia a esto, enseña P697 análogos de glicolípido que incluye N-glicosilamidas, N-glicosilureas y N-glicosilcarbamatos, cada uno de los cuales está sustituido en el residuo de azúcar por un aminoácido, como inmunomoduladores o adyuvantes. De esta manera, Lockhoff y colaboradores (Patente Norteamericana No. 4,855,283 y referencia 29) reportó que los análogos de los N-glicolípidos que exhiben similitudes estructurales a los glicolípidos que se presentan de manera natural, tal como los glicoesfingolípidos y los glicocerolípidos, son capaces de producir fuertes respuestas inmunitarias tanto en la vacuna del virus de herpes simple como la vacuna de virus de la pseudorrabia. Algunos glicolípidos se han sintetizado para alquilaminas de cadena larga y ácidos grasos que se enlazan directamente con los azúcares a través del átomo de carbono anomérico, para limitar las funciones de los residuos lipidíeos que se presentan de manera natural . La Patente Norteamericana No. 4,258,029 otorgada a Moloney, incorporada en la presente por referencia, enseña que el clorhidrato de octadecil-tirosina (OTH) funcionó como un adyuvante cuando se acomplejó con el toxoide de tétano y la vacuna del virus de la poliometilisis tipo I, II y III, inactivado con formalina. También Nixo-George y colaboradores (referencia 30) reportan esteres de octadecilo de los aminoácidos P697 aromáticos acomplejados con un antígeno superficial de la hepatitis B que mejoran las respuestas inmunitarias del hospedero contra el virus de la hepatitis B. La lipidación de los péptidos sintéticos se ha usado también para incrementar su inmunogenicidad. De esta manera, Wiesmuller 1989, describe un péptido con una secuencia homologa a una proteína viral de la enfermedad de pie y boca, acoplada a un adyuvante, tripalmitil-s-gliceril-cisteinilserilserina, que es un análogo sintético de la parte N-terminal de la lipoproteína de las bacterias gram negativas. Además, Deres y colaboradores 1989, reportan la inoculación in vivo de los linfocitos T citotóxicos, específicos del virus, con la vacuna de lipopéptido sintético que comprendió péptidos sintéticos modificados derivados de la nucleoproteína del virus de la influencia por el enlace a un lipopéptido, N-palmitil-s- [2, 3-bis (palmitilxi) - (2RS) -propil- [R] -cisteina (TPC) . 2. Inmunoensayos La proteína de alto peso molecular de Haemophilus influenzae de la presente invención es útil como un inmunógeno para la generación de anticuerpos anti-proteína, como un antígeno en los inmunoensayos incluyendo los ensayos de inmunoabsorbentes enlazados a enzimas (ELISA) , RÍA y otros ensayos de unión de anticuerpos no enlazados a P697 enzimas, o procedimientos conocidos en la técnica para la detección de anticuerpos. En los ensayos ELISA, la proteína se moviliza en una superficie seleccionada, por ejemplo, una superficie capaz de unir proteínas, tal como las cavidades de una placa de poliestireno para microtitulación. Después del lavado para remover la proteína incompletamente absorbida, la proteína tal como una solución de albúmina o suero bovino (BSA) , que se conoce que es antigénicamente neutral con respecto a la muestra de prueba, se puede unir a la superficie seleccionada. Esto permite bloquear los sitios de absorción no específicos en la superficie inmovilizante y reduce de esta manera el fondo provocado por las uniones no específicas de los antisueros sobre la superficie. La superficie inmovilizante o de inmovilización luego se pone en contacto con una muestra, tal como materiales clínicos o biológicos, que se van a probar de una manera conductiva para la formación de complejo inmunitario (antígeno/anticuerpo) . Esto puede incluir la dilución de la muestra con diluyentes, tal como soluciones de BSA, gamma-globulina bovina (BGG) y/o solución salina amortiguada con fosfato (PBS) /Tween. La muestra luego se deja incubar durante aproximadamente dos a cuatro horas, a temperaturas tal como del orden de aproximadamente 252 a 372C. Después de la incubación, la superficie puesta en P697 contacto con la muestra se lava para remover el material que no formó el inmunocomplejo. El procedimiento de lavado puede incluir el lavado con una solución, tal como PBS/Tween o un amortiguador de borato. Después de la formación de los inmunocomplejos específicos entre la muestra de prueba y la proteína de unión, el lavado subsecuente, la ocurrencia, y la cantidad uniforme, de formación del inmunocomplejo se puede terminar al someter al inmunocomplejo a un segundo anticuerpo que tiene especificidad para el primer anticuerpo. Si la muestra de prueba es de origen humano, el segundo anticuerpo es un anticuerpo que tiene especificidad para inmunoglobulinas humanas y en general IgG. Para proporcionar un medio de detección, el segundo anticuerpo puede tener una actividad asociada tal como una actividad enzimática que generará, por ejemplo, un desarrollo de color en la incubación con un substrato cromogénico apropiado. Luego, se puede lograr la cuantificación al medir el grado de generación de color usando, por ejemplo, un espectrofotómetro de espectro visible. 3. Uso de las Secuencias como Sondas de Hibridación Las secuencias de nucleótidos de la presente invención, que comprenden la secuencias de los genes que codifican para las proteínas de alto peso molecular de P697 cepas específicas de Haemophilus influenzae no tipificables, ahora permiten la identificación y clonación de los genes de cualquier especie de Haemophilus no tipificable y otras cepas de Haemophilus influenzae no tipificable. Las secuencia de nucleótidos que comprenden las secuencias de los genes de la presente invención son útiles por su capacidad para formar selectivamente moléculas dúplex con distancias complementarias de otros genes de proteínas de alto peso molecular de Haemophilus no tipificable. Dependiendo de la aplicación, se pueden emplear una variedad de condiciones de hibridación para lograr grados variables de selectividad de la sonda hacia los otros genes. Para un alto grado de selectividad, se usan condiciones relativamente severas para formar los compuestos dúplex, tal como condiciones de bajo contenido de sal y/o alta temperatura, tal como las proporcionadas por NaCl de 0.02 N a 0.15 M a temperaturas de entre aproximadamente 502C a 702C. Para algunas aplicaciones, se requieren condiciones de hibridación menos severas tal como sal de concentración de 0.15 M a 0.9 M, temperaturas que varían de entre aproximadamente 202C y 502C. Las condiciones de hibridación también se pueden poner más severas por la adición de cantidades crecientes de formamida, para desestabilizar el complejo dúplex híbrido.
P697 De esta manera, las condiciones de hibridación particulares se pueden manipular fácilmente, y serán en general un método de elección dependiendo de los resultados deseados. En general, las temperaturas de hibridación convenientes en la presencia de formamida al 50 % son: 422C para una sonda que es de 95 a 100 % homologa al fragmento objetivo, de 372C para una homología de 90 a 95 % y de 322C para una homología de 85 a 90 %. En una modalidad de diagnóstico clínico, las secuencias de ácido nucleico de los genes de la presente invención se pueden usar en combinación con un medio apropiado, tal como una etiqueta, para determinar la hibridación. Se conocen en la técnica una amplia variedad de medios indicadores apropiados, incluyendo radioactivos, enzimáticos y otros ligandos, tal como avidina/biotina, que son capaces de proporcionar una señal detectable. En algunas modalidades de diagnóstico, se puede usar una marca de enzima tal como ureasa, fosfatasa alcalina, peroxidasa, en lugar de una marca radioactiva. En el caso de las marcas de enzima, se conocen substratos indicadores colorimétricos que se pueden emplear para proporcionar un medio visible al ojo humano o de manera espectrofotométrica para identificar la hibridación específica con muestras que contienen las secuencias génicas que codifican para las proteínas de alto peso molecular de Haemophilus no P697 tipificable. Las secuencia de nucleótidos de los genes de la presente invención son útiles como sondas de hibridación en hibridaciones en solución y en modalidades que emplean procedimientos en fase sólida. En modalidades que comprenden procedimientos en fase sólida, el ADN de prueba (o ARN) de las muestras, tal como muestras clínicas, incluyendo exudados, fluidos corporales (por ejemplo, suero, fluido amniótico, efusión del oído medio, esputo, fluido de lavado broncoalveolar) o incluso tejidos, se absorbe o se fija de otra manera a una matriz seleccionada o superficie. El ácido nucleico de hebra individual, fijado, luego se somete a la hibridación específica con sondas seleccionadas que comprenden las secuencias de ácido nucleico de los genes o fragmentos del mismo de la presente invención bajo condiciones deseadas. Las condiciones seleccionadas dependerán de las circunstancias particulares en base a los criterios particulares requeridos dependiendo de, por ejemplo, los contenidos G+C, tipo de ácido nucleico de objetivo, fuente de ácido nucleico, tamaño de la zona de hibridación, etc. Después del lavado de la superficie de hibridación para remover las moléculas de sonda no unidas de manera específica, se detecta la hibridación específica, o aún se cuantifica, por medio de la etiqueta. Como con la selección de los péptidos, se prefiere P697 seleccionar las porciones de la secuencia de ácido nucleico que están conservadas entre especies de Haemophilus no tipificable. La zona seleccionada puede ser al menos aproximadamente de 18 pb y puede estar en el intervalo de aproximadamente 30 pb a aproximadamente 90 pb de largo. 4. Expresión de los Genes de las Proteínas de Alto Peso Molecular Los vectores de plásmidos que contienen las secuencias de replicón y control, que se derivan de especies compatibles con la célula hospedadora, se pueden usar para la expresión de los genes que codifican para las proteínas de alto peso molecular de Haemophilus no tipificable en los sistemas de expresión. El vector porta ordinariamente un sitio de replicación, así como secuencias de marcado que son capaces de proporcionar la selección fenotípica en células transformadas. Por ejemplo, la E. coli se puede transformar usando pBR322 que contiene genes para la resistencia a ampicilina y tetraciclina y proporciona así un medio fácil para identificar las células transformadas. El plásmido pBR322, u otro plásmido o fago microbiano también debe contener o estar modificado para contener promotores que se pueden usar por una célula hospedadora para expresión de sus propias proteínas. Además, los vectores de fagos que comprenden las secuencias de replicón y control que son compatibles con el P697 hospedador se pueden usar como un vector transformante en unión con estos hospedadores . Por ejemplo, el fango en lambda GEM^-ll se puede utilizar en la fabricación de vectores de fago recombinantes que se pueden usar para transformar células hospedadoras, tal como E. coli LE392. Los promotores comúnmente usados en la construcción de ADN recombinante incluyen los sistemas promotores de ß-lactamasa (penicilinasa) y lactosa (Chang y colaboradores, 1978: Itekura y colaboradores 1977 Goeddel y colaboradores, 1979; Goeddel y colaboradores, 1980) y otros promotores microbianos tal como sistema promotor T7 (Patente Norteamericana No. 4,952,496). Los detalles con relación a las secuencias de nucleótidos de los promotores se conocen, permitiendo que un experto en la técnica los ligue funcionalmente con genes. El promotor particular usado será en general una materia de elección dependiendo de los resultados deseados. Se pueden usar los hospederos que son apropiados para la expresión de los genes que codifican para las proteínas de alto peso molecular, fragmentos, análogos o variantes de las mismas, incluyen estructura, especies de Bacillus, Haemophilus, hongos, levadura o el sistema de expresión de baculovirus. De acuerdo con esta invención, se prefiere elaborar las proteínas de alto peso molecular por métodos recombinantes particularmente, puesto que la proteína de P697 alto peso molecular que se presenta de manera natural, como se purifica de un cultivo de especies de Haemophilus no tipificable, puede incluir cantidades traza de materiales tóxicos u otros contaminantes . Este problema se puede evitar al usar proteínas producidas recombinantemente en sistemas heterólogos que se pueden aislar del hospedero de una manera para minimizar contaminante en el material purificado. Los hospederos particularmente deseables para la expresión a este respecto incluyen bacterias gram positivas que no tienen LPS y, por lo tanto, están libre de endotoxinas . Estos hospederos incluyen especies de bacillus y pueden ser particularmente útiles para la producción de la proteína de alto peso molecular, no pirogénica, fragmentos o análogos de la misma. Además, en métodos recombinantes de producción permiten la fabricación de HMWl, HMW2, HMW3 ó HMW4 , y las proteínas HMW correspondientes de otras cepas Haemophilus influenzae, no tipificable, o fragmentos de los mismos, separada de otros y desprovista de las proteínas no de HMW de Haemophilus influenzae no tipificables.
Depósitos Biológicos Ciertos hibridomas que producen anticuerpos monoclonales específicos para la proteína de alto peso molecular de Haemophilus influenzae, de acuerdo con los P697 aspectos de la presente invención que se describen y hacen referencia en la presente, se han depositado con American Type Culture Collection (ATCC) localizada en 123012 Parklawn Drive, Rockville, Marylan, USA, 20852, de acuerdo con el tratado de Budapest y antes de la presentación de esta solicitud. Las muestras de los hibridomas depositados llegarán a estar disponibles al público en la concesión de una patente en base a esta solicitud de Patente. La invención descrita y reivindicada en la presente no se va a limitar en el alcance por los hibridomas depositados, puesto que la modalidad depositada se propone únicamente como una ilustración de la invención. Cualquier hibridoma equivalente o similar que produzca anticuerpos similares o equivalentes, como se describe en esta solicitud, que está dentro del alcance de la invención.
Resumen del Depósito Hibridomas Designación ATCC Fecha Depositada AD6 10C5 EJEMPLOS La descripción anterior describe en general la presente invención. Se podrá comprender más completamente la invención con referencia a los siguientes ejemplos P697 específicos. Estos ejemplos se describen únicamente para propósitos de ilustración y no intentan limitar el alcance de la invención. Se contemplan cambios en la forma o sustitución de los equivalentes de acuerdo a las circunstancias o a la oportunidad. Aunque se han empleado en la presente términos específicos, estos términos se proponen en un sentido descriptivo y no para propósitos de limitaciones . Los métodos de la genética molecular, bioquímica de las proteínas e inmunología usados, pero no descritos explícitamente de esa descripción, y los ejemplos se reportan ampliamente en la literatura científica y quedan dentro de la capacidad de aquellos expertos en la técnica.
Ejemplo 1 Este ejemplo describe el aislamiento del ADN que codifica para las proteínas HMWl y HMW2 , la clonación y expresión de estas proteínas, y la secuenciación y análisis de secuencia de las moléculas de ADN que codifican para las proteínas HMWl y HMW2. Se aislaron en cultivo puro las cepas 5 y 12 de H. influenzae, no tipificables, del fluido del oído medio de niños con otitis media aguda. El ADN cromosómico de la cepa 12, que proporciona los genes que codifican para las proteínas HMWl y HMW2 , se preparó al preparar las P697 digestiones por restricción, parciales, Sau3A del ADN cromosómico y el fraccionamiento en los gradientes de sacarosa. Las fracciones que contienen los fragmentos de ADN en el intervalo de 9 a 20 pb se mezclaron y se preparó una biblioteca por enlace en los brazos ?EMBL3. Las mezclas de enlace se empacaron in vitro y se amplificaron por placa en un lisógeno P2 de E. coli LE392. Para los estudios de subclonación de plásmidos el ADN de un fago recombinante representativo se subclonó en el plásmido de expresión T7 pT7-7, que contiene el promotor flO de T7-ARN-polimerasa, un sitio de unión de ribosoma y el sitio de inicio de traducción para la proteína del gen 10 T7 en la dirección 5' desde un sitio de clonación múltiple (ver Figura 5B) . Se realizó el análisis de la secuencia de ADN por el método de didesoxi y ambas hebras del gen HMWl y una hebra individual del gen HMW2 se secuenciaron. El análisis De inmunotransferencia Western se utilizó para identificar las proteínas recombinantes que se producen por las clonas del fago reactivo (Figura 11) . Los lisados de los fagos se cultivaron en células LE392 o placas escogidas directamente de un tamiz de células LE392 en placas PT, se solubilizaron en un amortiguador de muestra de electroforesis en gel antes de la electroforesis. Se realizó la electroforesis en gel de P697 dodecil-sulfato de sodio-poliacrilamida (SDS-PAGE) en geles de Laemmli modificados con poliacrilamida al 7.5 % ó 11 %. Después de la transferencia de las proteínas a las láminas de nitrocelulosa, las láminas se sondearon secuencialmente con una muestra de suero humano absorbida con E. coli, que contiene el anticuerpo de alto título a las proteínas de alto peso molecular y luego con el segundo anticuerpo de inmunoglobulína G (IgG) anti-humano, de cabra, conjugada con fosfatasa alcalina. Los sueros de adulto saludables contuvieron anticuerpo de alto título dirigido contra las proteínas de alto peso molecular, expuestas en la superficie, de H. influenzae no tipificable. Una muestra de suero se usó como el antisuero de detección después de que se ha absorbido extensivamente con células LE392. Para identificar las proteínas recombinantes que se producen por E. coli transformada con plásmidos recombinantes, los plásmidos de interés se usaron para transformar E. coli BL21 (DE3)/pLysS. Las cepas transformadas se cultivaron a una A600 de 0.5 en caldo L que contiene 50 µg de ampicilina por ml . Luego se adicionó IPTG a 1 mM. Una hora más tarde, se recolectaron las células y se preparó un producto de las células tratado con sonido. Las concentraciones de la proteína de las muestras se determinaron por el método de ácido biciconínico . Los productos celulares tratados con sonidos que contienen 100 P697 µg de proteína total se solubilizaron en amortiguador de muestra de electroforesis, se sometieron a la electroforesis en gel de SDS-poliacrilamida, y luego se transfirieron a nitrocelulosa. La nitrocelulosa luego se sondeó secuencialmente con la muestra de suero adulto absorbida con E. coli y luego con el segundo anticuerpo de IgG anti-humano, de cabra, conjugada con fosfatasa alcalina. También se realizó el análisis De inmunotransferencia Western (Western inmunoblot) para determinar si las cepas de H. influenzae, no tipificable, homologas y heterólogas expresaron proteínas de alto peso molecular relacionadas antigénicamente a la proteína codificada por el gel HMWl clonado (rHMWl) . Los productos celulares de las células bacterianas tratados con sonido se solubilizaron en amortiguador de muestra de electroforesis, se sometieron a electroforesis en gel de SDS-poliacrilamida, de transfirieron a nitrocelulosa. La nitrocelulosa se sondeó secuencialmente con antisuero de rHMWl de conejo, policlonal, y luego con el segundo anticuerpo de IgG, anti-conejo, de cabra, conjugada con fosfatasa alcalina. Finalmente, se realizó el análisis de inmunotransferencia Western (Western biot) para determinar si las cepas de Haemophilus no tipificables expresaron P697 proteínas relacionadas antigénicamente a la proteína de la hemaglutinina filamentosa de Bordetella pertussis. El anticuerpo monoclonal X3C, un anticuerpo de inmunoglobulina G (IgG) murino, que reconoce la hemaglutinina filamentosa, se usó para sondear los productos celulares tratados con sonido para el ensayo De inmunotransferencia Western. Se usó para la detección un segundo anticuerpo de IgG antiratón de cabra, conjugado con fosfatasa alcalina. Para generar el antisuero de proteína recombinante se transformaron las E. coli BL21 (D3E3/pLysS con pHMWl-4 y se indujo la expresión de la proteína recombinante con IPTG, como se describe anteriormente. Se preparó un producto celular de las células bacterianas, tratado con sonido, y se separó en un sobrenadante y fracción de sedimento por centrifugación a 10,00 x g durante 30 minutos. La proteína recombinante se fraccionó con la fracción de sedimento. Se inmunizó subcutáneamente un conejo en un programa bisemanal con 1 mg de proteína de la fracción de sedimento, la primera dosis dada con el adyuvante completo de Freund y las dosis subsecuentes con el adyuvante completo de Freund. Después de la cuarta inyección, el conejo se sangró. Antes del uso en el ensayo de inmunotransferencia Western, el antisuero se absorbió extensivamente con los productos tratados consumidos de la cepa de E. coli hospedadora transformada con el vector, de P697 clonación solo. Para valorar la coparticipación de los determinantes antigénicos entre la HMWl y la hemaglutinina filamentosa, se revistieron placas (Costar, Cambridge, Mass) del ensayo inmunosorbente enlazado a enzimas (ELISA) con 60 µl por cavidad, de una solución 4 µg/ml de hemaglutinina filamentosa en la solución salina amortiguada con fosfato de Dulbecco, durante 2 horas a temperatura ambiente. Las cavidades se bloquearon durante 1 hora con albúmina de suero bovino al 0.1 % en la solución salina amortiguada con fosfato de Dulbecco, antes de la adición de las disoluciones de suero. El antisuero de rHMWl se diluyó en serie en Bir al 0.1 % (Sigma, San Luis, Mo.) en la solución salina amortiguada con fosfato de Dulbecco, y se incubó durante 3 horas a temperatura ambiente. Después del lavado, las placas se lavaron con el anticuerpo (Bio-Rad) IgG, anti-conejo de cabra conjugado con peroxidasa durante 2 horas a temperatura ambiente y se reveló subsecuentemente con ácido 2 , 2 ' -azino-bis (3-etilbentiazolina-6-sulfónico (Sigma) a una concentración de 0.54 en mg/ml) en amortiguador de citrato de sodio 0.1 M, pH 4.2, que contiene 0.03 % de H202. Se leyeron las absorbancias en un vector de ELISA automatizado. Se recuperaron como sigue la HMWl o HMW2 que expresan el fago recombinantes. Se seleccionó la P697 biblioteca genómica de la cepa 12 en H. influenzae, no tipificable, para clonas que expresan proteínas de alto peso molecular con una muestra de suero humano, absorbida con E. coli que contiene un alto título de anticuerpos dirigidos contra las proteínas de alto peso molecular. Se identificaron numerosas clonas fuertemente reactivas junto con unas más débilmente reactivas. Veinte clonas fuertemente reactivas se purificaron en placas y se examinaron por De inmunotransferencia Western para la expresión de proteínas recombinantes. Cada uno de las clonas fuertemente reactivas expresó uno de los dos tipos de proteínas de alto peso molecular, designadas a HMWl y HMW2. Las bandas principales de proteína inmunorreactiva, en los lisados de HMWl y HMW2 tuvieron masas moleculares aparentes de 125 y 120 kDa, respectivamente. Además de las bandas principales, cada lisado contuvo bandas de proteína menores o peso molecular aparente más alto. Las bandas de proteína vistas en el lisado de HMW2 a las masas moleculares de menos de 120 kDa no se observaron de manera regular y presumiblemente representan productos de degradación proteolítica. Los lisados de EL 392 infectados con el vector de clonación ?EMBL3 fueron no reactivos cuando se valoraron inmunológicamente con la misma muestra de suero. De esta manera, la actividad mostrada no fue debida a las proteínas de E. coli interreactivas o las P697 proteínas codificadas por ?EMBL3. Además, las proteínas recombinantes no se unieron simplemente a la inmunoglobulina no específicamente, puesto que las proteínas no fueron reactivas con el conjugado de IgG antihumano de cabra, solo, con sueros de conejo normales, o con suero de un número de infantes jóvenes saludables. Las clonas representativas que expresan cualquiera de las proteínas recombinantes HMWl ó HMW2 se caracterizaron adicionalmente. Los mapas de restricción de los dos tipos de fago fueron diferentes entre sí, incluyendo las regiones que purifican para los genes estructurales HMWl y HMW2. La Figura 5 muestra los mapas de restricción del fago recombinante representativo que contiene los genes estructurales HMWl ó HMW2. Las ubicaciones de los genes estructurales son idénticas por las barras sombreadas . Se construyeron las clonas de los plásmidos de HMWl al usar el plásmido de expresión T7 , T7-7 (Figura 5A y B) . Las subclonas de plásmido de HMW2 también se construyeron y los resultados con estas últimos subclonas fueron similares a aquéllos observados con las construcciones de HMWl. La ubicación y dirección apropiadas de la transcripción del gen estructural HMWl se determinaron inicialmente al usar HPMWl de plásmido (Figura 5B) . Este P697 plásmido se construyó al insertar el fragmento BamHI-SalI de 8.5 kb de ?HMWl en pT7-7 cortado con BamHI y Ball. El E. coli transformado con pHMWl expresó una proteína recombinante inmunorreactiva con una masa molecular aparente de 115 kDa, que fue fuertemente inducible con IPTG. Esta proteína fue significativamente más pequeña que la proteína principal de 125 kDa expresada por el fago padre, indicando que ya sea se expresó como una proteína de fusión o se truncó en el carboxi terminal . Para localizar de manera más precisa el extremo 3' del gen estructural, se construyeron plásmidos adicionales con supresiones progresivas desde el extremo 3 ' de la construcción de pHMWl . El plásmido pHMWl-1 se construyó por ingestión de pHMWl con petl, aislamiento del fragmento de 8.8 kb resultante, y religación. El plásmido pHMWl-2 se construyó por digestión de pHMWl con HindIII, el aislamiento del. Fragmento de 7.5 kb resultante, y religación. E. coli transformado con ya sea el plásmido pHMWl-2 también expresó una proteína recombinante inmunorreactiva con una masa molecular aparente de 115 kDa. Estos resultados indican que el extremo 3' del gen estructural fue 5' del sitio HindIII, la Figura 12 demuestra los resultados del De inmunotransferencia Western con células transformadas con pHMWl-2 antes y después de IPTG (sendas 3 y 4 respectivamente) . La proteína P697 recombinante de 115 kDa se indica por la flecha. Los transformantes también demuestran bandas interreactivas de bajo peso molecular aparente y, probablemente, represente productos de degradación parcial. Se muestran por comparación los resultados para E. coli transformada con el vector de clonación pT7-7 solo (Figura 12 sendas 1 y 2). Para localizar de manera más precisa el extremo 5' del gen, se construyeron los plásmidos pHMWl-4 y pHMWl-7. Se construyó el plásmido pHMWl-4 al clonar el fragmento BamHI-HindIII de 5.1 kb de ?HMWl en un plásmido derivado de pT7-7 que contiene un fragmento EcoRI-BamHi de 3.8 kb en la dirección 5'. E. coli transformado con pHMWl-3 expresó una proteína inmunorreactiva con una masa molecular aparente de aproximadamente 160 kDa (Figura 12, senda 6) . Aunque la producción de proteína fue inducible con IPTG, los niveles de producción de proteína en estos transformantes fueron sustancialmente menores que aquéllos obtenidos con los transformantes de pHMWl-2 descritos anteriormente. Los plásmidos pHMWl-7 se construyeron al digerir pHMWl-4 con Ndel y Spal . El fragmento 9.0 kb generado por esta doble digestión se aisló, se volvió rumbo a los extremos, y se volvió a ligar. E. coli transformado con pHMWl-7 también expresó una proteína inmunorreativa con una masa molecular aparente de 160 kDa, una proteína idéntica en tamaño a aquélla expresada en los transformantes de pHMWl-4. Los P697 resultados indicaron que el codón de iniciación para el gen estructural HMWl fue 3' del sitio Spel. El análisis de la secuencia de ADN (descrito posteriormente) confirmó esta conclusión. Como se señala anteriormente, las clonas de fago ?HMWl expresaron una banda inmunorreactiva principal de 125 kDa, mientras que las clonas de plásmido de HMWl, pHMWl-4 y pHMWl-7, que contuvieron lo que se cree que es el gen de longitud completa, expresaron una proteína inmunorreactiva de aproximadamente 160 kDa. Esta discrepancia de tamaño fue desconcertante. Una posible explicación fue que un gen adicional o genes necesarios para el procesamiento correcto del producto génico HMWl se suprimieron en el proceso de subclonación. Para hacer frente a esta posibilidad, se construyó el plásmido pHMWl-14. Esta construcción se generó al digerir pHMWl con Ndel y Mlul y al insertar el fragmento de Ndel-Mlul de 7.6 kpb aislado de pHMW2-4. Esta construcción contendría el gen HMWl de longitud completa así como el 3 ' de ADN del gen HMWl que estaba presente en el fago MHW1 original. E. coli transformado con este plásmido expresó proteínas inmunorreactivas principales con masas moleculares aparentes de 125 y 160 kDa así como productos de degradación adicionales (Figura 12, sendas 7 y 8) . Las bandas de 125 y 160 kDa fueron idénticas a las bandas inmunorreactivas principales y menores en los P697 lisados de fago HMWl. De manera interesante, la construcción pHMWl-14 también expresó cantidades significantes de proteína en la condición no inducida, una situación no observada con las construcciones anteriores. La relación entre las proteínas de 125 y 160 kDa permaneció algo no clara. El análisis de la secuencia, descrito posteriormente reveló que el gen HMWl sería pronosticado para codificar para una proteína de 159 kDa. Se cree que la proteína de 160 kDa es una forma precursora de la proteína madura de 125 kDa, con la conversión desde una proteína a la otra que es dependiente de los productos de los dos genes en la dirección 3'. El análisis de la secuencia del gen HMWl (Figura 1) reveló un cuadro de lectura abierto de 4,608 pb (ORF), que empieza con un codón ATG en el nucleótido 351 que termina con un codón finalizador TAG en el nucleótido 4959. Un sitio de unión de ribozoma, putativo, con la secuencia AGGAG empieza 10 pb en la dirección 5' del codón de iniciación putativo. Otros cinco codones ATG en estructuras se localizan dentro de los 250 pb del inicio del ORF, pero ninguno de estos se prosiguió con un sitio de unión de ribozomas, típico. La región del flanqueo 5' del ORF contuvo una serie de repeticiones en tándem directas, con la secuencia ATCTTTC de 7 pb repetida 16 veces. Estas repeticiones en tándem se detienen 100 pb en 5' del codón de iniciación putativo.
P697 Una repetición invertida de 8 pb característica de un terminador transcripcional independiente de RHO está presente, inicial en el nucleótido 4983, 25 pb 3' de la detención traduccional presumida. Los codones de terminación múltiples están presentes en los tres cuadros de lectura tanto en la dirección 3' como en la dirección 5' del ORF. La secuencia de aminoácidos derivada de la proteína codificada por el gen HMWl (Figura 2) tiene un peso molecular de 159,000, un buen acuerdo con los pesos moleculares aparentes de las proteínas expresadas por los transformantes HMWl-4 y HMW1-7. Las secuencias de aminoácidos derivada del término amino no demostró las características de una secuencia adicional típica. El sitio Ba HI usado en la generación de pMHWl no comprendió el pb 1743 al pb 1748 de la secuencia de nucleótidos. El ORF en la dirección 3' del sitio de BamHi se pronosticó que codifica para una proteína de 111 kDA, un buen acuerdo con los 115 kDA estimados para la masa molecular aparente de la proteína de fusión codificada por pMHWl . La secuencia del gen HMW2 (Figura 3) consistente de un ORF de 4,431-pb, que empieza con un codón ATG en el nucleótido 352 que termina con un codón finalizador TAG en el nucleótido 4783. Los primeros 1,259 pb de ORF del gen HMW2 fueron idénticos a aquellos del gen HMWl. Posteriormente, las secuencias empiezan a dirigir, pero son P697 80 % idénticas. Con la excepción de una base individual del nucleótido 93 de la secuencia HMW2 , las regiones de flanqueo 5 ' de los genes HMWl y HMW2 son idénticas para los 130 pb en la dirección 5' desde los codones de iniciación respectivos. De esta manera, el gen HMW2 se prosigue el mismo conjunto de repeticiones en tándem y el mismo sitio de unión de ribosoma, putativo que está situado en 5' del gen HMWl. Un terminador transcripcional putativo idéntico a aquél identificado 3' del ORF de HMWl se señala, empezando de nucleótido 4804. La discrepancia de longitudes de los dos genes se debe principalmente por una separación de 186 pb en la secuencia HMW2 , empezando en la posición de los nucleótidos 3839. La secuencia de aminoácidos derivada de la proteína codificada por el gen MHW2 (Figura 4) de un peso molecular de 155,000 y es 71 % idéntica con la secuencia de aminoácidos derivada del gen HMWl. Las secuencias de aminoácidos derivadas de los genes tanto en HMWl como HMW2 (Figuras 2 y 4) demuestran similitud de secuencia con la secuencia de aminoácidos derivada de la hemaglutinina filamentosa de Bordetella pertussis, una proteína asociada en la superficie de este organismo. Las marcas TFASTA iniciales y optimizadas para la comparación de secuencias a HMWl-hemaglutinina filamentosa fueron 87 y 186, respectivamente, con el tamaño P697 de palabra de 2. La marca z para comparación fue 45.8. Las marcas TFASTA iniciales y optimizadas para la compración de la secuencia HMW2-hemaglutinina filamentosa fueron 68 y 196, respectivamente. La marca z para esta última comparación fue de 48.7. Las magnitudes de las marcas TFASTA, iniciales y optimizadas, y las marcas z sugieren que existió una relación biológicamente significante entre los productos génicos HMWl y HMW2 y la hemaglutinina filamentosa. Cuando las secuencias de aminoácidos derivadas de HMWl, HMW2 , y los genes de hemaglutinina filamentosa se alinean y se comparan, las similitudes son más notables en los extremos amino-terminales de las tres secuencias. Doce de los primeros 22 aminoácidos en las secuencias de péptidos pronosticadas fueron idénticas. Además, las secuencias demostraron una estancia de 5 aminoácidos, común a Asn-Pro-Asn-Gly-Ile, y varias instancias más cortas de identidad de secuencia dentro de los primeros 200 aminoácidos.
Ejemplo 2: Este ejemplo describe una relación de la hemaglutinina filamentosa y la proteína HMWl. Para explorar adicionalmente la relación de la hemaglutinina filamentosa-HMWl, se valoró la capacidad del antisuero preparado contra la proteína recombinante HMW1-4 P697 (rHMWl) para reconocer la hemaglutinina filamentosa, purificada (Figura 13). El antisuero rHMWl demostró reactividad en ELISA con hemaglutinina filamentosa de una manera dependiente de la dosis. El suero de conejo inmunitario tuvo reactividad mínima en este ensayo. El antisuero HMWl también se examinó en un ensayo De inmunotransferencia Western y demostró una reactividad débil pero positiva, con la hemaglutinina filamentosa en este sistema también. Para identificar la proteína de Haemophilus nativo que corresponde al producto génico HMWl para determinar el grado al cual las proteínas antigénicamente relacionadas al producto génico clonado HMWl fueron comunes entre otras cepas de H. influenzae, no tipificables, se seleccionó un panel de cepas de Haemophilus por De inmunotransferencia Western con el antisuero rMHWl . Los antisueros reconocieron tanto una banda de proteína de 125 y 120 de kDa en la cepa homologa 12 (Figura 14) , los productos proteicos, maduros, putativos, de los genes HMWl y HMW2 , respectivamente. La proteína de 120 kDa aparece como una banda individual en la Figura 14, en donde apareció como un doblete en los lisados de fago HMW2 (Figura 11) . Cuando se usa para seleccionar las cepas de H. influenzae, no tipificables, heterólogas, el antisuero P697 rMHWl reconoció las proteínas de alto peso molecular en 75 % de las 125 cepas de epidemiológicamente no relacionadas. En general, el antisuero reaccionó con una o dos bandas de proteína en el intervalo de 100 a 150 kDa en cada una de las cepas heterólogas en un patrón similar pero no idéntico en la cepa homologa (Figura 14) . El anticuerpo monoclonal X3C es un anticuerpo IgG murino dirigido contra la proteína de hemaglutinina filamentosa de B. pertussis. Este anticuerpo puede inhibir la unión de las células de B. pertussis a las células de ovario de Hámster chino y las células HeLa en cultivo e inhibirá la hemaglutinación de los eritrocitos por la hemaglutinina filamentosa purificada. Se realizó un ensayo De inmunotransferencia Western en el cual este anticuerpo se seleccionó contra el mismo panel de cepas H. influenzae identificables discutidas anteriormente (Figura 14) . El anticuerpo monoclonal X3C reconoció tanto las proteínas de alto peso molecular en la cepa 12 de H. influenzae, no tipificable, que se reconocieron por los antisueros de proteína recombinante (Figura 15) . Además, el anticuerpo monoclonal reconoció a sus bandas de proteína en un subconjunto de cepas de H. influenzae, no tipificable, heterólogas, que fueron idénticas a aquéllas reconocidas por el antisuero de proteína recombinante, como se puede ver en comparación con las Figuras 14 y 15.
P697 Ocasionalmente, el anticuerpo monoclonal de hemaglutinina filamentosa pareció reconocer solo una de las dos bandas que se ha reconocido por el antisuero de proteína recombinante (comparar la senda 18 de la cepa de las Figuras 14 y 15, a manera de ejemplo) . El anticuerpo X3C, monoclonal, completo, reconoció las bandas de proteínas de alto peso molecular idénticas a aquéllas reconocidas por el antisuero rMHWl en aproximadamente 35 % de la colección de cepas de H. influenzae no identificables .
Ejemplo 3 Este ejemplo describe las propiedades de la adhesina de las proteínas HMWl y HMW2. Se construyeron mutantes deficientes en la expresión de las proteínas HMWl, HMW2 , o ambas, para examinar el papel de estas proteínas en la adherencia bacteriana. Se empleó la siguiente estrategia. Se digirió la pMHWl-14 (ver Ejemplo 1, Figura 5A) con BamHi y luego se ligó a un cartucho de canamicina aislado en un fragmento de BamHi de 1.3 kb de pUC4R. El plásmido resultante (pMHWl-17) se linealizó por digestión con Xbal y se transformó en la cepa 12 de H. influenzae no tipificable, seguido por la selección de colonias resistentes a la canamicina. El análisis Southern de una serie de estas colonias demostró dos poblaciones de transformantes, una P697 con una inserción en el gen estructura HMWl y la otra con una inserción en el gen estructural HMW2. Un mutante de cada una de estas clases se seleccionó para estudios adicionales . Se recuperaron los mutantes deficientes en la expresión de ambas proteínas usando el siguiente protocolo. Después de la supresión de fragmento de 2.1 kb de ADN entre dos sitios EcoRI que se extienden la porción 3' del gen estructural HMWl y la porción 5' de un gen en la dirección 3' que codifica para una proteína de procesamiento no esencial en pMHW-15, el cartucho de canamicina de pUC4K se insertó en un fragmento EcoRI de 1.3 kb. El plásmido resultante (pMHWl-16) se linearizó por digestión con Xbal y se transformó en la cepa 12, seguido nuevamente por la selección para las colonias resistentes a canamicina. El análisis Southern de una muestra representativa de estas colonias demostró que en siete de ocho casos, la inserción en ambos locus HMWl y HMW2 ha ocurrido. Se seleccionó un mutante para los estudios adicionales. Para confirmar los fenotipos propuestos, las cepas mutantes se examinaron por análisis De inmunotransferencia Western con un antisuero policlonal contra la proteína HMWl recombinante. La cepa parenteral expresó tanto la proteína HMWl de 125 kDa como la proteína HMW2 de 120 kDa (Figura 16) . En contraste, el mutante HMW2 P697 falló al expresar la proteína de 120 kD, y el mutante HMW2 falló para expresar la proteína de 125 kD. El doble mutante careció de la expresión de cualquier proteína. En base a los listados de células completas, los perfiles de la membrana exteriores y la morfología de la colonia, la cepa tipo silvestre y los mutantes fueron en otros aspectos idénticos entre sí. La microscropía electrónica por transmisión demostró que ninguna de las cuatro cepas expresó pilis. La capacidad de la cepa 12 tipo silvestre para adherirse a las células epiteliales Chang se examinó. En estos ensayos, se inocularon bacterias en caldo y se dejaron crecer a una densidad de aproximadamente 2 x 109 ufc/ml. Aproximadamente 2 x 107 ufe se inocularon en las monocapas de células epiteliales, y las placas se centrifugaron suavemente a 165 x g durante 5 minutos para facilitar el contacto entre las bacterias y la superficie epitelial. Después de la incubación durante 30 minutos a 372C en C02 al 5 %, las monocapas se enjuagaron 5 veces con PBS para remover los organismos no adherentes y se trataron con tripsina-EDTA (tripsina al 0.05 % , EDTA al?.5 %) en PBS para liberarlas del soporte plástico. Los contenidos de las cavidades se agitaron, y las diluciones se colocaron en placa en medio sólido para producir el número de bacterias adherentes por monocapa. Se calculó el por ciento de adherencia al dividir el número de unidades formadoras de colonias adherentes por monocapa por el número de unidades formadoras de colonias inoculadas . Como se representa en la Tabla 1 posterior (la Tabla 1 aparece al final del texto descriptivo) , esta cepa se adhirió de manera completamente eficiente, con casi 90 % de la unión del inoculo a monocapa . La adherencia por el mutante que expresa HMWl pero no HMW2 (HMWl') también fue completamente eficiente y comparable con aquélla para la cepa tipo silvestre. En contraste, la unión por la cepa que expresa HMW2 pero deficiente en la expresión de HMWl (HMWl') fue disminuida aproximadamente 15 veces con relación al tipo silvestre. La adherencia por el doble mutante (MHW1 ' /MHW2 ' ) se disminuyó aún adicionalmente, aproximadamente 50 veces en comparación con el tipo silvestre y aproximadamente 3 veces en comparación con el mutante HMWl. Considerados conjuntamente, estos resultados sugieren que tanto la proteína HMWl como la proteína MHW2 influyen en la unión a las células epiteliales Chang. De manera interesante, la adherencia óptima a esta células epiteliales Chang. De manera interesante, la adherencia óptima a esta línea celular parece requerir HMWl pero no HMW2.
P697 Ejemplo 4 Este ejemplo ilustra la preparación y expresión de proteína HMW3 y HMW4 y su función como adhesivas. Usando los plásmidos pMHWl-16 y pMHWl-17 (ver Ejemplo 3) y el siguiente esquema similar a aquel empleado con la cepa 12 como se describe en el Ejemplo 3, se aislaron 3 mutantes de la cepa 5 de H. influenzae, no tipificable, incluyendo uno con el gen de canamicina insertado en el locus similar a HMWl (designado a hmw3) , un segundo con una inserción en el locus similar a hmw2 (designado a hmw4) , y un tercero con insersiones en ambos locus. Como se pronostica, el análisis por De inmunotransferencia Western (Western inmunoblot) demostró que el mutante con inserción del cartucho de canamicina en el locus similar a hmwl tuvo pérdida de expresión de la proteína HMW3 de 125 kD, mientras que el mutante con la insersión con el locus similar a hmw2 falló para expresar la proteína HMW4 de 123 kD. El mutante con una doble inserción fue incapaz de expresar cualquiera de las proteínas de alto peso molecular. Como se muestra en la Tabla 1 posterior, la cepa 5 tipo silvestre demostró una adherencia de alto nivel, con casi 80 % del inoculo que se adhiere por monocapa. La adherencia por el mutante deficiente en la expresión de la proteína similar a HMW2 (es decir, preferentemente HMW4) también fue completamente alto. En contraste, la adherencia por el mutante incapaz de expresar la proteína diferente a HMWl (es decir, proteína HMW3 ) se redujo aproximadamente 5 veces con relación al tipo silvestre, y se disminuyó la unión por el mutante doble aún adicionalmente, aproximadamente 25 veces. El examen de las muestras teñidas con Giemsa confirmó estas observaciones (no mostrada) . De esta manera, los resultados con la cepa 5 para las proteínas HMW3 y HMW4 corroboran los hallazgos con la cepa 12 y las proteínas HMWl y HMW2.
Ejemplo 5 Este ejemplo contiene datos adicionales que se relacionada a las propiedades de adhesina de las proteínas HMWl y HMW2. Para confirmar una función de adherencia para las proteínas HMWl y HMW2 y para examinar el efecto de HMWl y HMW2 independientemente de otras estructuras de superficie de H. influenzae, las agrupaciones génicas hmwl y hmw2 se introdujeron en DH5a de E. coli, usando los plásmidos pHMWl-14 y pHMW2-21, respectivamente. Como un control, el vector de clonación pT7-7 también se transforma en DH5a de E. coli. En análisis por De inmunotransferencia Western demostró que DH5a de E. coli que contiene los genes hmwl P697 expresó una proteína de 125 kDa, mientras que la misma cepa que tiene los genes hmw2 expresó una proteína de 120 kDa. El DH5a E. coli que contiene pT7-7 falló en reaccionar con el antisuero contra HMWl. La microscopía electrónica por transmisión no reveló pilis u otros anexos superficiales en cualquiera de las cepas de E. coli. La adherencia por las cepas E. coli fue cuantificada y comparada por la adherencia de la cepa 12 de H. influenzae, no tipificable, tipo silvestre. Como se muestra en la Tabla 2 posterior, la adherencia por el vector que contiene el DH5a de E. coli solo fue menor que el 1 % de aquél de la cepa 12. En contraste, el DH5a de E. coli que tiene la agrupación génica hmwl demostró niveles de adherencia comparables a aquéllos para la cepa 12. La adherencia por DH5a de E. coli que contiene los genes hmw2 fue de aproximadamente 6 veces menor que la unión por la cepa 12 pero se incremento 20 veces sobre la adherencia por DH5a de E. coli con pT7-7 solo. Estos resultados indican que las proteína HMWl y HMW2 son capaces de mediar independientemente la unión a las células congentivales de Chang. Estos resultados son consistentes con los resultados con los mutantes de H. influenzae reportados en los Ejemplo 3 y 4, que proporcionan evidencia adicional que, con las células epiteliales de Chang, HMWl es una adhesina más eficiente de los que es HMW2.
P697 Los experimentos con HM101 de E. coli que tiene pT7-7, pHMWl-14, o pHMW2-21 confirmaron los resultados obtenidos con los derivados de DH5a (ver Tabla 2) Ejemplo 6 Este ejemplo ilustra la copurificación de las proteínas HMWl y HMW2 de la cepa H. influenzae no tipificable, tipo silvestre. Las HMWl y HMW2 se aislaron y purificaron a partir de la cepa 12 de H. influenzae, no tipificable (NTHI) de la siguiente manera. Las bacterias de Haemophilus no tipificable de cultivo concentrado congelado se pasaron sobre una placa de chocolate y se cultivaron durante la noche a 37a C en un incubador con C02 al 5 %. 50 ml del cultivo de inicio de caldo de infusión de cerebro-corazón (BHI) complementado con 20 µg/ml cada uno de hemina y NAD se inoculó con crecimiento en placa de chocolate. El cultivo de inicio se cultivo hasta que la densidad óptica (O.D. - 600 nm) alcanzó 0.6 a 0.8 y luego las bacterias en el cultivo de inicio se usaron para inocular 6 matraces de 500 ml de BHI complementado usando 8 a 10 ml por matraz. Las bacterias se cultivaron en matraces de 500 ml durante 5 a 6 grados adicionales tiempo en el cual la O.D. fue de 1.5 mayor. Los cultivos se centrifugaron a 10,000 rpm durante 10 minutos.
P697 Los sedimentos bacterianos se volvieron a dispersar en un volumen total de 250 ml de una solución de extracción que comprende NaCl 0.5 ml, Na2EDTA 0.01 M, Tris 0.01 M, 1, 10-fenantrolina 50 µm, pH 7.5. Las células no se trataron con sonido o se rompieron de otra manera. Las células redispersadas se dejaron asentar en hielo a 0e C durante 60 minutos. Las células redispersadas se centrifugaron a 10,000 rpm durante 10 minutos a 42 C para remover la mayoría de las células intactas y los desechos celulares. El sobrenadante se colectó y se centrifugó a 100,000 x g durante 60 minutos a 42 C. El sobrenadante nuevamente se colectó y se dializó a 42 C contra fosfato de sodio 0.01 M, pH 6.0. La muestra se centrifugó a 10,000 rpm durante 10 minutos a 42 C para remover los desechos insolubles precipitados de la solución durante la diálisis. El sobrenadante se aplicó a una columna de sefarosa SM de 10 ml que se ha prepuesto en equilibrio con fosfato de sodio 0.01 M, pH 6. Después de la aplicación de esta columna, la columna se lavó con fosfato de sodio 0.01 M. La proteínas se elevaron desde la columna con un gradiente de KCL 0-0.5 M en fosfato de Na 0.1 M, pH 6, y las fracciones se colectaron para el examen en gel. Los geles de Comasie de las fracciones de la columna se llevaron a cabo para identificar aquellas fracciones que contienen proteínas de P697 alto peso molecular. Las fracciones que contiene las proteínas de alto peso molecular se mezclaron y se concentraron a un volumen de 1 a 3 ml en la preparación para la aplicación de la muestra a la columna de filtración de gel . Una columna en filtración de gel CL-4B de sefarosa se puso en equilibrio con solución salina amortiguada con fosfato, pH 7.5. La muestra de proteína de alto peso molecular, concentrada, se aplicó a la columna de filtración en gel y se colectaron las fracciones de la columna. Se realizaron los geles de Coomassie en las fracciones de la columna para identificar aquellos que contiene las proteínas de alto peso molecular. Se mezclaron las fracciones de la columna que contiene las proteínas de alto peso molecular.
Ejemplo 7 Este Ejemplo ilustra el uso de proteínas HMWl y HMW2 específicas en los estudios de inmunización. Las proteínas HMWl y HMW2 copurificadas, preparadas como se describe en el Ejemplo 6 se probaron para determinar si protegerían contra la otitis media experimental provocada por la cepa homologa. Chinchillas adultos sanasd de 1 a 2 años de edad con peso de 350 a 500 g, recibieron 3 inyecciones P697 subcutáneas, mensuales, con 40 µg de una mezcla de proteína HMW1-HMW2 en el adyuvante de Freud. Los animales de control recibieron su solución salina amortiguada con fosfato en el adyuvante de Freud. Un mes después de la última inyección, los animales se estimularon por inoculación intrabular con 300 ufe de la cepa 12 de NTHI . La infección del oído medio se desarrollo en 5 de 5 animales de control contra 5 de 10 animales inmunizados. Aunque solo 5 de 10 chinchillas se protegieron en esta prueba, las condiciones de la prueba son muy severas, requiriendo bacterias que se inyecten directamente en el espacio del oído medio y proliferen, ya que es en esencia una cavidad de acceso pequeña. Como se ve a partir de los datos adicionales posteriores, se puede logra la producción completa de las chinchillas. Los 5 animales inmunizados con HMW1/HMW2 que no desarrollaron otitis media no demostraron signos de inflamación del oído medio cuando se examinaron por otoscopía ni hubo infecciones del oído medio detectables. Entre los 5 animales inmunizados con HMW/HMW2 que se van a ser infectados, la duración total de la infección del oído medio, se valora por la persistencia del fluido del oído medio positivo del cultivo, no fue diferente de los controles. Sin embargo, el grado de inflamación de las membranas timpáticas fue subjetivamente menor que en los P697 animales inmunizados con HMW1/HMW2. Cuando se realizaron los conteos bacterianos cuantitativos en los especímenes de los fluidos del oído medio recuperados de los animales infectados, diferencias notables fueron aparentes entre los animales inmunizados con H-MW1/HMW2 y PBS (Figura 17) mostrado en la Figura 17 están los conteos bacterianos de fluido del oído medio, cuantitativos, de los animales en el día 7 después del a estimulación, un punto en el tiempo asociado con la máxima cuenta de colonia en el fluido del oído medio. Los datos se transformaron por logaritmo para propósitos de comparación estadística. Los datos de los animales de control se muestran en la izquierda y los datos de los animales inmunizados con proteínas de alto peso molecular en la derecha. Las dos líneas horizontales indican el promedio respectivo y las desviaciones estándar de los conteos de colonia de fluido de oído medio para los animales infectados en cada grupo. Como se puede ver a partir de esta Figura, los animales inmunizados con HMW1/HMW2 tiene cuentas bacterianas de fluido del oído medio significativamente menores que los controles inmunizados con PBS, media geométrica de 7.4 x 106 y 1.3 x 103, respectivamente (p = 0.02, prueba de la t de Student). Los títulos de los anticuerpos en suero después de la inmunización fueron comparables en animales no infectados e infectados. Sin embargo, la infección de P697 animales inmunizados se asoció uniformemente con la apariencia de las bacterias reguladas descendentemente en la expresión de las proteínas HMW, sugiriendo selección bacteriana en respuesta a la presión inmunológica. Aunque estos datos muestran que la protección después de la inmunización no fue completa, estos datos sugieren que las proteínas de adhesina de HMW son potencialmente importantes antígenos protectores que pueden comprender un componente de una vacuna de NTHI de varios componentes. Además, se ha logrado la protección completa en el modelo de chinchilla a una estimulación de menor dosis como se expone en la Tabla 3 posterior. Grupos de cinco animales se inmunizaron con 20 µg de la mezcla HMW1/HMW2 preparada como se describe en el Ejemplo 6 en los días 1, 28 y 42 en la presencia de alumbre. SE colectaron muestras sanguíneas en el día 53 para inspeccionar la respuesta de los anticuerpos. En el día 56, el oído izquierdo de los animales se estimuló con aproximadamente 10 ufe de la cepa 12 de H. influenzae. Se inspeccionó la infección del oído en el día 4. Cuatro animales en el grupo 3 se infectaron previamente por la cepa 12 de H. influenzae y se recuperaron completamente durante al menos un mes antes de la segunda estimulación.
P697 Ejemplo 8 Este Ejemplo ilustra la provisión de los péptidos sintéticos que corresponden a una porción solo de la proteína HMWl . Un número de péptidos sintéticos se derivó de HMWl. Luego, se formularon antisueros para estos péptidos. Se mostró que los antisueros anti-péptido al péptido HMW1-P5 reconocen la HMWl. El péptido HMW1-P5 cubre los aminoácidos 1453 a 1481 de HMWl, tiene la secuencia VDEVIEAKRILEKVKDLSDEEREALAKLG (SEQ ID No : 11), y representa las bases 1498 a 1576 en la Figura 10. Este hallazgo demuestra que la secuencia de ADN y la proteína derivada están siendo interpretadas en el cuadro de lectura correcto y que se pueden producir péptidos derivados de la secuencia que serán inmunogénicos.
Ejemplo 9 Este ejemplo describe una generación de anticuerpos monoclonales a las proteínas de alto peso molecular de H. influenzae no tipificable. Se generaron anticuerpos monoclonales usando técnicas normales. En resumen, ratones BALB/c hembras ( de 4 a 6 semanas de edad) se inmunizaron por inyección intraperitoneal con las proteínas de alto peso molecular purificadas de la cepa 5 o cepa 12 de Haemophilus, no P697 tipificable, como se describe en el ejemplo 6. La primera inyección de 40 a 50 µg de proteína se administró con el adyuvante completo de Freund, y la segunda dosis, recibida cuatro o cinco semanas después de la primera, se administró con solución salina amortiguada con fosfato. Tres días después de la segunda inyección, los ratones se sacrificaron y se fusionaron los linfocitos esplénicos con células de plasmadtoma SP2/0-Agl4. Dos semanas después de la fusión, se seleccionaron los sobrenadantes de hibridoma para la presencia de los anticuerpos específicos a las proteínas de alto peso molecular por un ensayo de transferencia de mancha. Las proteínas de alto peso molecular, purificadas, a una concentración de 10 µg por ml en solución salina amortiguada con Tris (TBS) , se usaron para sensibilizar láminas de nitrocelulosa (Bio-Rad Laboratories, Richmond, CA) al remojar durante 20 minutos. Después de un paso de bloqueo con gelatina con TBS- gelatina al 3 %, la nitrocelulosa se incubó durante 60 minutos a temperatura ambiente con los sobrenadantes individuales de hibridomas, a una dilución de 1:5 en TBS -Tween al 0.2 %, usando un aparato de microfiltración Bio-Dot de 96 cavidades (BioRad) . Después del lavado, las láminas se incubaron durante una hora con los anticuerpos anti(IgG + IgM de ratón) de cabra, aislados por afinidad, conjugados con fosfatasa P697 alcalina (Tago, Inc., Burlingame, CA) . Después de los lavado adicionales, se identificaron los sobrenadantes positivos por incubación de la lámina de nitrocelulosa en amortiguador de fosfatasa alcalina (Tris 0.10 M, NaCl 0.10 M, MgCl- 0.005 M) que contiene nitroazul de tetrasolio (0.1 mg/ml) y fosfato de 5-bromo-4-cloro-3-indoilo (BCIP) (0.05 mg/ml) . Para los estudios de microscopía inmunoelectrónica y de isotipificación de anticuerpos que se describen posteriormente, los anticuerpos monoclonales se purificaron de los sobrenadantes de hibridoma. Los anticuerpos recuperados en este trabajo fueron todos de la clase IgG. Para purificar los anticuerpos monoclonales, los sobrenadantes de hibridoma se sometieron primero a la precipitación con sulfato de amonio (concentración final de 50 % a 02 C) . Después de la incubación durante la noche, el precipitado se recuperó por centrifugación y se volvió a solubilizar en solución salina amortiguada con fosfato. La solución luego se dializó durante la noche contra amortiguador de fosfato de sodio 0.01 M, pH 6.0. El día siguiente, la muestra se aplicó a una columna de DEAE-Sepacel, previamente puesta en equilibrio con el mismo amortiguador de fosfato y las proteínas se eluyeron subsecuentemente con un gradiente de KCL. Las fracciones de la columna que contienen los anticuerpos monoclonales se P697 identificaron por examen de las muestras en geles de Comassie para las bandas de proteína típicas de las cadenas ligeras y pesadas. El isotipo de cada anticuerpo monoclonal se termino por la inmunodifusión usando el método de Ouchterlony. Las placas de inmunodifusión de prepararon en portaobjetos de vidrio con 10 ml de agarosa grado ADN, al 1 % (FMC Bioproducts, Rookland, ME) en solución salina amortiguada con fosfato. Después de que solidifica la agarosa, se pincharon cavidades de 5 mm en la agarosa en un patrón circular. La cavidad central contuvo una preparación concentrada del anticuerpo monoclonal que se evalúa y las cavidades circundantes contuvieron los anticuerpos específicos de la subclase, anti-ratón de cabra (Tago) . Las placas se incubaron durante 48 horas en una cámara de humedad a 42 C y luego se examinaron para líneas blancas de inmunoprecipitación. Los sobrenadantes de hibridoma que fueron reactivos en el ensayo de biot descrito anteriormente, se examinaron por el análisis De inmunotransferencia Western, ambos que confirman la reactividad, con las proteínas de alto peso molecular de la cepa de Haemophilus, no tipificable, homologa, y que examinan la inter-reactividad con las proteínas similares en cepas heterólogas. Los productos celulares tratados con sonido de Haemophilus P697 influenzae, no tipificable, que contienen 100 µg de la proteína total se solubilizaron en amortiguador de mezcla de electrofóresis, se sometieron a electrofóresis en gel de SDS-poliacrilamida, en geles de acrilamina al 7.5 %, y luego se transfirieron a nitrocelulosa usando un aparato de transferencia electroforético Genie (Idea Scientific Company, Corvallis, OR) durante 45 minutos a 24 V. Después del tratamiento, la lámina de nitrocelulosa se bloqueo y luego se sondeo subsecuencialmente con el sobrenadante de hibridoma, con el segundo anticuerpo anti(IgG + IgM de ratón) de cabra, conjugado con fosfatasa alcalina, y finalmente se detectaron los anticuerpos unidos por incubación con solución de nitroazul-tetrasolio/BCIP. Este mismo ensayo se empleo para examinar la reactividad de los anticuerpos monoclonales con las proteínas de fusión recombinantes expresadas en E. coli (ver posteriormente) . En la preparación para inmunoelectromicroscopia, se cultivaron bacterias durante la noche en agar de chocolate complementado y se dispersaron varias colonias en solución salina amortiguada con fosfato que contiene albúmina al 1 % . Luego se aplicó una gota de 20 µl de esta suspención bacteriana a una rejilla revestida con carbón y se incubó durante 2 minutos. Se removió el fluido en exceso y el espécimen luego se incubó durante 5 minutos con el anticuerpo monoclonal específico de la proteína de alto P697 peso molecular, purificado, que se analiza. Después de la remoción del líquido en exceso y un lavado con solución salina amortiguada con fosfato, el espécimen se incubó con IgG anti-ratón conjugado a las partículas de oro coloidal de 10 nm. Después de los lavados finales con solución salina amortiguada con fosfato, la muestra se enjuagó con agua destilada. La tinción de las células bacterianas se realizó con acetato de uranilo al 0.5 % durante 1 minuto. Luego se examinaron las muestras en un microscopio electrónico Philips 201c. Se recuperaron catorce hibridomas diferentes que produjeron anticuerpos monoclonales reactivos con las proteínas HMWl y HMW2 purificadas de la cepa 12 de Haemophilus no tipificable en el ensayo de detección por inmunotransferencia. De los anticuerpos monoclonales detectados por la microscopía inmunoelectrónica a la fecha, como se describe posteriormente, dos se demostraron que se unen a los epítopes superficiales en la cepa 12 de prototipo. Estos dos anticuerpos monoclonales, desigandos AD6 (ATCC-) y 10C5 (ATCC-), fueron ambos de la subclase de IgG 1.
Ejemplo 10 Este ejemplo describe la identificación de los epítopes B-celulares, expuestos en la superficie de las P697 proteínas de alto peso molecular de H. influenzae, no tipificable. Para correlacionar los epítopes reconocidos por los anticuerpos monoclonales, se examinó su reactividad con un panel de proteínas de fusión recombinantes expresadas por los plásmidos recombinantes de pGEMEXR . Estos plásmidos se construyeron al clonar varios segmentos de los genes estructurales hmwlg o hmw2A en los vectores de expresión T7 , pGEMEXR -1 y pGEMEXR-2 (Promega Corporation, Madison, Wl) . Se muestran en las Figuras 18 y 19 los diagramas esquemáticos que representan los segmentos derivados de las agrupaciones génicas hmwlg y hmw2A clonadas en los plásmidos de expresión pGEMEXR. Estos segmentos se insertaron tal que se crearon fusiones en estructura en cada sitio de unión. De esta manera, estos plásmidos codifican para proteínas de fusión recombinantes que contiene los aminoácidos del gen 10 de T7 codificado por pGEMEXR en las regiones indicadas por las barras resaltadas y los aminoácidos codificados por hmwlg o hmw2A en las regiones indicadas por las barras negras en estas Figuras. Se presenta un codón finalizador en la unión de los segmentos negro y blanco de cada barra . Se seleccionaron cuatro sitios discretos dentro del gen estructural hmwlA como los extremos 5 ' del os insertos hmwl. Para cada extremo 5', se creo una serie de P697 insertos progresivamente más pequeños al tomar ventaja de los sitios de restricción en la dirección 3', convenientes. El primer plásmido recombinante representado en la Figura 18 se construyó al aislar un fragmento BamHI-HindIII de 4.9 Kbp de pHMW-14 (Ejemplo 1, Figura 5A) , que contiene la agrupación génica hmwl completa y al insertarla en pGEMEXR digerido con BamHI-HindIII . El segundo plásmido recombinante en este conjunto se construyó al digerir el plásmido "padre" con EstEII-HindIII, recuperando el fragmento más grande de 6.8 Kbp, volviendo romo el extremo con ADN-polimerasa de Klenow y religando. El tercer plásmido recombinante de este conjunto de construyó al digerir el plásmido "padre" con Clal-HindIII, recuperando el fragmento más grande de 6.0 kbp, volviendo a los extremos romos, religando. El próximo conjunto de cuatro plásmidos recombinantes de hmwl se derivó de un plásmido "padre" construido al ligar un fragmento de EcoRI de 2.2 kbp de la agrupación génica hmwl en pGEMEXR digerido con EcoRI . Los otros tres plásmidos recombinantes en este segundo conjunto se construyeron al digerir en los sitios EstEII, EcoRV, y Clal en la dirección 3', respectivamente, usando técnicas similares a aquellas descritas anteriormente. El tercer conjunto de tres plásmidos recombinantes representados se derivó de un plásmido "padre" construido por digestión doble del primer plásmido P697 recombinante descrito anteriormente (es decir, uno que contiene el fragmente BamHI-HindIII de 4.9 kbp) con BamHI y Clal volviendo romos los extremos, y religando. Esto dio por resultado una construcción que codifica para una proteína recombinante con una función en la estructura en el sitio Clal del gen hmwlA. Los dos plásmidos restantes en este tercer conjunto se construyeron al digerir en los sitios EstEII y EcoRV, en la dirección 3", respectivamente. Finalmente, el cuarto conjunto de dos plásmidos recombinantes se derivó de un plásmido "padre" construido por digestión doble de la construcción BamHI-HindIII original con HincII y EcoRV, luego religando. Esto dio por resultado una construcción que codifica para una proteína recombinante con una fusión en estructura en el sitio EcoRV del gen hmwlA. El plásmido restante en este cuarto conjunto se construyó al digerir en el sitio BstEII en la dirección 3 ' . Tres sitios discretos con el gen estructural hmw2A se seleccionaron como los extremos 5 ' de los insertos hmw2. El primer plásmido recombinante representado en la Figura 19 se construyó al aislar un fragmento de EcoRI-Xhol de 6.0 kbp de pHMW2-21, que contiene la agrupación génica hmw2, y al insertarla en pGEMEXR digerido con EcoRI-SalI. El segundo plásmido recombinante en este conjunto se construyó al digerir en un sitio Mlul cerca del extremo 3 ' P697 del gen hmw2A. El segundo conjunto de los dos plásmidos recombinantes hmw2 se derivó de un plásmido "padre" construido al aislar un fragmento de HindIII de 2.3 kbp de pHMW2-21 y al insertarlo en pGEMEXR-2 digerido con HindIII. El plásmido restante en este segundo conjunto se construyó al digerir en el sitio Mlul en la dirección 3 ' . Finalmente, el último plásmido representado se construyó al aislar un fragmento HincII-HincIII de 1.2 kbp de la ubicación indicada en la agrupación génica hmw2 e insertándolo en pGEMEXR digerido con HincII-HincIII. Cada uno de los plásmidos recombinantes se usó para transformar la cepa JMl01 de E. coli. Los transformantes resultantes se usaron para generar las proteínas de fusión recombinantes empleadas en los estudios de correlación. Para preparar las proteínas recombinantes, las cepas transformadas de E. coli se cultivaron a un A600 de 0.5 en caldo L que contiene 50 µg de ampicilina por ml . Luego se adicionó IPTG a 1 mm y mGPl-2, el fago M13 que contiene el gen T7-ARN-polimerasa; se adicionó en multiplicidad de infección de 10. Una hora más tarde, se recolectaron las células, y se preparó un producto celular tratado con sonido. Las concentraciones de proteína de las muestras se determinaron y los productos celulares tratados con sonidos que contiene 100 µg de proteína total se solubilizaron en amortiguador de muestra de electroforesis, P697 se sometieron a electroforesis en gel de SDS-poliacrilamida, y se examinaron en geles de Coomassie para valorar el nivel de expresión de las proteínas de fusión recombinantes. Una vez que se confirmaron los altos niveles de expresión de las proteínas de fusión recombinantes, los productos celulares tratados con sonido se usaron en los análisis De inmunotransferencia Western descritos anteriormente. Se muestra en la Figura 20 una micrografía electrónica que demuestra la unión en la superficie de Mab AD6 a las cepas de Haemophilus influenzae, no tipificable, representativas. En el panel superior izquierdo de la Figura está la cepa 12 de Haemophilus no tipificable, y en el panel superior derecho está un derivado de la cepa 12 que no expresa por más tiempo las proteínas de alto peso molecular. Como se puede ver, las partículas de oro coloidal decoran la superficie de la cepa 12, indicando el anticuerpo AD6 unido en la superficie. En contraste, no fueron evidentes partículas de oro en la superficie del mutante de la cepa 12 que no expresó por más tiempo las proteínas de alto peso molecular. Estos resultados indican que el anticuerpo monoclonal AD6 está reconociendo un epítope expuesto en la superficie en las proteínas de alto peso molecular de la cepa 12. Se realizaron estudios análogos con el anticuerpo monoclonal 10C5 demostrando P697 demasiada unión a los epítopes accesibles en la superficie en las proteínas HMWl y HMW2 de alto peso molecular de la cepa 12. Habiendo identificado dos anticuerpos monoclonales de unión en la superficie, el epítope que cada anticuerpo monoclonal reconoció se correlacionó. Para lograr esta tarea, los dos conjuntos de plásmidos recombinantes que contienen varias porciones de ya sea los genes estructurales hmwla o hmw2A (Figuras 18 y 19) se emplearon. Con estos conjuntos complementarios de plásmidos recombinantes, los epítopes reconocidos por los anticuerpos monoclonales se correlacionaron a regiones relativamente pequeñas de las proteínas HMWl y HMW2 muy grandes . Para localizar los epítopes reconocidos por Mab AD6, el patrón de reactividad de este anticuerpo monoclonal con un conjunto grande de proteína de fusión recombinante se examinó. La Figura 21 es un ensayo De inmunotransferencia Western que demuestra el patrón o diseño de reactividad de Mab AD6 con 5 proteínas de fusión recombinantes, un subconjunto pertinente del número más grande originalmente examinado. Del análisis del patrón de reactividad de Mab AD6 con este conjunto de proteínas, uno es capaz de correlacionar el epítope que reconoce un segmento muy corto de las proteínas HMWl y HMW2. Un breve P697 resumen de este análisis de da a continuación. Por referencia, las porciones pertinentes de los genes estructurales hmwlA y hmw2A que se expresaron en las proteínas recombinantes que se examinan, se indican en el diagrama en la parte superior de la Figura . Como se muestra en la senda 1, el Mab AD6 reconoce un epítope codificado por el fragmento 1, un fragmento que abarca un cuarto distante del gen hmwlA. La reactividad se pierde cuando solo la porción del gen que comprende el fragmento 2 se expresa. Esta observación localiza el epítope de AD6 en algún lugar dentro de los últimos 180 aminoácidos en el extremo carboxi terminal de la proteína HMWl . El Mab AD6 también reconoce un epítope codificado por el fragmento 3, derivado del gen estructural hmw2A. Esto es un fragmento mas bien grande que abarca cerca de un tercio del gen. La reactividad se pierde cuando se expresa el fragmento 4. La única diferencia entre los fragmentos 3 y 4, es que los últimos 225 pares de base en el extremo 3' del gen estructural hmw2A se suprimen en esta última construcción. Esta observación indica que el epítope de AD6 se codifica por este segmento terminal corto del gen hmw2A. Se proporciona un fuerte soporte para esta idea por la unión demostrada de Mab AD6 a la proteína recombinante codificada por el fragmento 5, un fragmento que abarca un décimo distal del gen estructural hmw2A. Tomados conjuntamente, P697 estos datos se identifican el epítope AD6 como común tanto para ambas proteínas HMWl y HMW2 y coloca su ubicación con 75 aminoácidos del carboxi terminal de las dos proteínas. La Figura 22 es un ensayo De inmunotransferencia Western que demuestra el patrón de diseño de reactividad de Mab 10C5 con las mismas proteínas de fusión recombinantes examinadas en la Figura 21. Como se muestra en la senda 1, Mab 10C5 reconoce un epítope codificado con el fragmento 1. En contraste con Mab AD6, Mab 10C5 también reconoce un epítope codificado por el fragmento 2. También en contraste con Mab AD6, el Mab 10C5 no reconoce ninguna de las proteínas de fusión recombinantes derivadas de la hmw2A. De esta manera, estos datos se identifican el epítope de 10C5 como que es único a la proteína HMWl y como que se codifica por el fragmento designado como fragmento 2 en esta Figura. Este fragmento corresponde a un segmento de 155 aminoácidos codificado por el segmento EcoRV-BstEII del den estructural hmwlA. Habiendo identificado las ubicaciones aproximadas de los epítopes en HMWl y HMW2 reconocidas por los dos anticuerpos monoclonales, se determinó a continuación el grado al cual estos epítopes estaban compartidos por las proteínas de alto peso molecular de las cepas de Haemophilus, no tipificable, heterólogas. Cuando se examinan en ensayos De inmunotransferencia Western P697 productos celulares, bacterianos, tratados con sonidos, al Mab AD6 fue reactivo con los epítopes expresados en las proteínas de alto peso molecular de 75 % de la colección del inventor de más 125 cepas de Haemophilus influenzae no tipificable. En realidad, este anticuerpo monoclonal pareció reconocer los epítopes expresados en las proteínas de alto peso molecular en virtualmente todas las cepas de Haemophilus, no tipificable, que se identificaron previamente cuando se expresan las proteínas similares a HMW1/HMW2. La Figura 23 es un ejemplo de un ensayo De inmunotransferencia Western que demuestra la reactividad de Mab AD6 con un panel representativo de estas cepas heterólogas. Como se puede ver, el anticuerpo monoclonal reconoce una o dos bandas en el intervalo de 100 a 150 kda en cada una de estas cepas. Por referencia, la cepa mostrada en la senda 1 es la cepa 12 de prototipo y las dos bandas visualizadas representan HMWl y HMW2 como las bandas inmunoreactivas inferiores, respectivamente. En contraste a la inter-reactividad amplia observada con Mab AD6, el Mab 10C5 fue mucho más limitado en su capacidad para reconocer las proteínas de alto peso molecular en cepas heterólogas. El Mab 10C5 reconoció proteínas de alto peso molecular en aproximadamente 40 % de las cepas que expresaron proteínas similares a HMW1/HMW2. Como fue el caso con Mab AD6, el Mab 10C5 no reconoció las proteínas en ninguna de las cepas P697 de Haemophilus, no tipificable, que no expresaron proteínas similares a HMW1/HMW2. De una manera limitada, se ha examinado la reactividad de Mab AD6 con los epítopes expuestos en la superficie en la cepas heterólogas. En el fondo los dos paneles de la Figura 20 son micrografías electrónicas que demuestran la reactividad de Mab AD6 con epítopes accesibles en la superficie en las cepas 5 y 15 de Haemophilus, no tipificable. Como se puede ver, las partículas de oro coloidal abundantes son evidentes en la superficies de cada una de estas cepas, confirmando su expresión superficial del epítope AD6. Aunque se limita en el alcance, estos datos sugieren que el epítope de AD6 puede ser un epítope accesible a la superficie, común, en las proteínas de adhesión de alto peso molecular de la mayoría de Haemophilus no tipificable que expresan proteínas similares a HMW1/HMW2.
SUMARIO DE LA DESCRIPCIÓN En resumen de esta descripción, la presente invención proporciona proteínas de alto peso molecular de Haemophilus no tipificable, genes que codifican para las mismas y vacunas que incorporan estas proteínas. Son posibles modificaciones dentro del alcance de esta invención.
P697 TABLA 1 Efecto de la mutación de las proteínas de alto peso molecular en la adherencia a células epiteliales Chang por H. influenzae no tipificable.
* Los números representan el promedio (± error estándar de la media) de las mediciones en triplicado o cuadruplicado de los experimentos representativos, t Valores de adherencia para los derivados de la cepa 12 P697 son relativos a la cepa 12 tipo silvestre; los valores para los derivados de la cepa 5 son relativos a la cepa 5 tipo silvestre.
TABLA 2 Adherencia por las agrupaciones génicas hmwl o hmw2 que tiene el DH5a y el HB101 de E. coli.
* El plásmido pHMWl-14 contiene la agrupación génica hmwl, mientras que pHMW2-21 contiene la agrupación génica hmw2 ; el pT7-7 es vector de clonación usado en estas construcciones . t Los números representan el promedio (± error estándar de la media) de las mediciones en triplicado de los experimentos representativos.
TABLA 3 Capacidad protectora de la proteína HMW contra la estimulación de H. influenzae no tipificable en el modelo de chinchilla.
P697 SEQUENCE LISTING (1) GENERAL INFORMATION: (i) .APPLICANT: Baren?amp, Stephen J (ii) TITLE OF INVENTION: High Molecular Wßig t Surface Proteins oí Non-Tpß----lß Haemap-úl-u- (ili) NUMBER OF SEQUENCES: 11 (iv) CORRESPONDENCE ADDRESS: (A) ADDRESSEE. Shoemaker and Mattare, Ltd (B) STREET: 2001 Jefferßon Daviß Hwy., 1201 Cryßtal Plaza Bldg. 1 (C) CITY: Arlxngcon (D) STATE: Virginia (E) COUNTRY: U.S.A, (F) ZIP: 22202-0286 (V) COMPUTER READABLE FORM: (A) MÉDIUM TYPE: Floppy dißk (B) COMPtJTER: IBM PC compatible (O OPERATING SYSTEM: PC-DOS/MS-DOS (D) SOFTWARE; Patentln Reléase #1.0, Versión #1.30 (vi) CURRENT APPLICATION DATA: (A) APPLICATION NDMBER: US 08/617,697 (B) FILING DATE: 01-APR-1996 (C) O-ASSZFICATION: (Vii ) PRIOR APPLICATION DATA: (A) APPLICATION NUMBER : US 08/302 , 832 (B) FILINO DATE : 05-OCT- 1994 (VÜ) PRIOR APPLICATION DATA: (A) APPLICATION NUMBER : US PCT/US93/02166 (B) FILINO DATE ; 16-MAR- 1993 (viii ) ATTORNEY/AGENT INFORMATION : (A) AME : Berkstresßer , Jerry W (B) REGISTRATION NUMBER .- 22 , 651 (C) REFERENCE/DOCKET NUMBER : 103ß - SS7 (ix) TE ECOMMUNICATION INFORMATION : (A) TEI-EPHONB : (703 ) 415 - 0810 (B) TELE FAX : ( 703 ) 415 - 0813 (2) INFORMATION FOR SEQ ID NO:l: (i) SEQUENCE CHARACTERISTICS : (A) LENOT--: 5116 base paire (B) TYPE: nucleic acid (O STRANDEDNESS : single (D) TOPOLOOY: linear (ii) MOLECULE TYPE: DNA (genomic) (Xi) SEQUENCE DESCRIPTION: SEQ ID NO:l: ACAOCOTTCT CTTAATACTA OTACAAACCC ACAATAAAAT ATOACAAACA ACAATTACAA 60 CACCTTTTTT GCAGTCTATA TGCAAATATT TTAAAAAATA OTATAAATCC GCCATATAAA 120 ATGGTATAAT CTTTCATCTT TCATCTTTCA TCTTTCATCT TTCATCTTTC ATCTTTCATC 180 TTTCATCTTT CATCTTTCAT CTTTCATCTT TCATCTTTCA TCTTTCATCT TTCATCTTTC 2 0 ACATOCCCTG ATQAACCOAG GGAAGGGAGG GAGGGGCAAG AATGAAGAGG GAGCTGAACG 300 AACOCAAATO ATAAAOTAAT TTAATTOTTC AACTAACCTT AGGAC?AAAAT ATOAACAAGC 360 TATATCCTCT CAAATTCAGC AAACOCCTOA ATGCTTTUGT TGCTGTsTCT GAATTGGCAC 420 0-?-qrrotoA CCATTCCACA GAAAAAOGCA GCGAAAAACC TGCTCOCATG AA?G GCGTC ßo ACTTAG-X-TT AAAGCCACTT TCCGCTATGT TACTATCTTT AGGTOTAACA TCTATTCCAC 540 AATCTOTTTT AOCAAOOOGC TTACAAOOAA TOGATGTAGT ACACGOCACA GCCACTATOC 600 AAOTAGATOG TAATAAAACC ATTATCCGCA ACAGTGTTGA CGATATCATT AATTGGAAAC 660 AATTTAACAT COACCAAAAT OAAATGsTGC AaTTTTTACA AOAAAACAAC AACTCCGCCO 720 TATTCAACCO TGTTACATCT AACCAAATCT CCCAATTAAA AGGOATTTTA OATTCTAACO 780 GACAAOTCTT TTTAATCAAC CCAAATGGTA TCACAATAGO TAAAGACOCA ATTATTAACA 840 CTAATOOCTT TACOOCTTCT ACGCTAOACA TTTCTAACaA AAACATCAAG OCOCGTAATT 900 TCACCrrCOA sCAAACCAAA OATAAAOCsc TCGCTOAAAT TGTOAATCAC GOTITAATTA 960 CTOTCGOTAA AGACOGCAGT GTAAATCTTA TTOOTOOCAA AGTGAAAAAC GAf-K -TOTOA 1020 TTAGCGTAAA TOOTOGCAGC ATTTCTTTAC TCGCAOGGCA AAAAATCACC ATCAGCGATA 1080 TAATAAACCC AACCATTACT TACAGCATTG CCGCGCCTGA AAAT3AAGCO OTCAATCTOG 1140 OCaATATTTT TGCCAAAGGC GOTAACATTA ATsTCCOTGC TOCCACTATT CGAAACCAAG 1200 GTAAACTTTC TGCTGATTCT OTAAOCAAAa ATAAAAGCOG CAATATTOTT CTTTCCGCCA 1260 AAsAGOGTGA AGCOGAAATT GGCGGTOTAA TTTCCGCTCA AAATCAOCAA OCTAAAGOCO 1320 GCAAOCTGAT GATTACAOOC GATAAAGTCA CATTAAAAAC AGGTGCAGTT ATCOACCTTT 1380 CAGGTAAAGA AaGGGOAQAA ACTTACCTTG GCGsTGACGA sCGCGOCGAA GGtAAAAAsa 1440 OCATTCAATT AOCAAAOAAA ACCTCTTTAG AAAAAGGCTC AACCATCAAT OTATCAGOCA 1500 AAGAAAAAGG COOACaCOCT ATTGTGTOGG GCGATATTaC GTTAATTGAC GGCAATATTA 1560 ACGCTCAAGG TASTOOTOAT ATCOCTAAAA CCCK-TOGTrr TOTGOAaACO TCOGGGCATO 1630 ATTTATTCAT CAAAGACAAT ßCAATTOTTG ACGCCAAAOA CT-XX-TTOTTA GACCCOOATA 1680 ATGTATCTAT TAATGCAOAA ACASCAOGAC GCAGCAATAC TTCAQAAGAC GATGAATACA 1740 CGGGATCCGG QAATASTGCC AGCACCCCAA AACGAAACAA AGAAAAOACA ACATTAACAA 1800 ACACAACTCT TOAGAOTATA CTAAAAAAAG GTACCmVT TAACATCACT GCTAATCAAC 1860 GCATCTATOT CAATAGCTCC ATTAATTTAT CCAATGOCAG CTTAACTCTT TOGAGTOAOG 1 20 ?rrCGGAGCGG TGsCGGCsTT GAGATTAACA ACGATATTAC CACCGOTGAT GATACCAOAG 1980 GTGCAAACTT AACAATTTAC TCAGOOGOCT OGGTTGATsT TCATAAAAAT ATCTCACTCG 2040 GOaCsCAAGG TAACATAAAC ATTACAGCTA AACAAGATAT CGCCTTTaAG AAAGGAAGCA 2 X00 ACCAAOTCAT TACAOOTCAA GGOACTATTA CCTCAGOCAA TCAAAAAOGT TT AGATTGA 2160 ATAATOTCTC TCTAAACGGC ACTGsCAGCs GACTGCAATT CACCACTAAA AOAACCAATA 2220 AATA 2280 CAATGÜG?T ACCGAAAAAT GAAAGTGGAT ATGATAAATT CAAAGGACGC ACGTACTOGA 2340 ATTTAACCTC CTTAAATGTT TCCGAGAOTO GCGAGTTTAA CCTCACTATT GACTCCAOAG 2400 GAAGCGATAG TGCAGGCACA CTTACCCAGC CTTATAATTT AAACGGTATA TCATTCAACA 2460 AAGACACTAC CTTTAATGTT GAACQAAATO CAAGAGTCAA CTTTGACATC AAGGCACCAA 2sao TAGOGATAAA TAAGTATTCT AGTTTGAATT ACGCATCATT TAATOGAAAC ATTTCAGTTT 2580 CGOGAGGGGG C-AGT-rrr--AT TGCACACTTC TCOCCGCATC CTCTAACGTC CAAACCCCCG 2640 GTGTAGTTAT AAATTCTAAA TACTTTAATG TTTCAACAGG GTCAAGTTTA AGATTTAAAA 2700 CTTCAOGCTC AACAAAAACT GGCTTCTCAA TAGAGAAAGA TTTAACTTTA AATOCCACCC 2760 GAGOCAACAT AACACTTTTG CAAGTTGAAG GCACCGATGG AATOATTOOT AAAOGCATTG 2820 TAOCCAAAAA AAACATAACC T-TOAAOGAG GTAACATCAC CTTTOOCTCC AGGAAAGCCG 2880 TAACAGAAAT COAAGGCAAT GTTACTATCA ATAACAACGC TAACGTCACT CTTATCGGTT 2940 CGGATTTTGA CAACCATCAA AAACCTTTAA CTATTAAAAA AGATGTCATC ATTAATAOCG 3000 GCAACCTTAC CGCTGGAGGC AATATTOTCA ATATAGCCGG AAATCTTACC GTTGAAAOTA 3060 ACGCTAATTT CAAAGCTATC ACAAATTTCA CTTTTAATGT AGGCGGCTTs TTTGACAACA 3120 AAGGCAATTC AAATATTTCC ATTGCCAAAO GAGGGGCTCG CTTTAAAGAC ATTGATAATT 180 CCAAOAATTT AAGCATCACC ACCAACTCCA GCTCCACTTA CCGCACTATT ATAAOCGGCA 3240 ATATAACCAA TAAAAACGGT GATTTAAATA TTACGAACOA AGGTAGTGAT ACTQAAATGC 3300 AAATTGOCOG CGATOTCTCG CAAAAAGAAG GTAATCTCAC GATTTCTTCT GACAAAATCA 3360 ATATTACCAA ACAGATAACA ATCAAGGCAG sTGTTGATGG GGAGAATTCC GATTCAC-ACO 3420 CGACAAACAA TGCCAATCTA ACCATTAAAA CCAAAGAATT GAAATTAACO CAAGACCTAA 3480 ATATTTCAGG TTTCAATAAA GCAGAGATTA CAGCTAAAGA TsOTAGTGAT TTAACTATTG 3540 GTAACACCAA TAGTGCTOAT GGTACTAATG CCAAAAAAGT AACCTTTAAC CAGGTTAAAG 3600 ATTCAAAAAT CTCTGCTOAC OGTCACAAGG TOACACTACA CAGCA?AGTO GAAACATCCG 3660 GTAOTAATAA CAACACTGAA GATAGCAGTO ACAATAATGC COGCTTAACT ATCGATOCAA 3720 AAAATOTAAC AGTAAACAAC AATATTACTT CTCACAAAGC AGTGAGCATC TCTGCGACAA 3780 GTOGA---AAAT TACCACTAAA ACAOGTACAA CCATTAACOC AACCACTGGT AACOTOGAGA 840 TAACCGCTCA AACAGGTAOT ATCCTAOGTO GAATTOAOTC CAOCTCTOGC TCTGTAACAC 3900 TTACTGCAAC COAGGOCOCT CTTGCTOTAA OCAATATTTC GGOCAACACC OTTACTOTTA 3960 CTGCAAATAG COOGGCATTA ACCAC?TGG CAGGCTCTAC AAGGAAAGGA ACCOAGAOGG 4020 TAACCACTTC AAGTCAATCA GGCGATATCG GCOGTACGAT TTCTGGTGGC ACAGTAOAGO 080 TTAAAGCAAC CSAAAGTTTA ACCACTCAAT CCAATTCAAA AATTAAAGCA AC?ACAGOCG 4140 AGGCTAACGT AACAAGTGCA ACAGGTACAA TTGGTGSTAC GATTTCCOGT AATACGGTAA 4200 ATGTTACGGC AAACGCTGGC GATTTAACAG TTGGGAATGG CSCAGAAATT AATGCGACAG 4260 AAGGAGCTGC AACCTTAACT ACATCATCGG GCAAATTAAC TACC3AAGCT AGTTCACACA 4320 TTACTTCAGC CAAGGGTCAG GTAAAtCTTT CAGCTCAGGA TGGTAGCGTT GCAGGAAGTA 43T0 TTAATGCCGC CAATGTQACA CTAAATACTA CAGGCACT-T AACTACCGTG AAGGGTTCAA 4440 ACATTAATOC AACCAGCGGT ACCTTGGTTA TTAACGCAAA AGACOCTOAG CTAAATGGCO 4500 CAGCATTGGG TAACCACACA GTGGTAAATG CAACCAACOC AAATGGCTCC GGCAGCGTAA 4560 TCGCGACAAC CTCAAOCAGA GTGAACATCA CTsGGGATTT AATCACAATA AATGGATTAA 4620 ATATCATTTC AAAAAACGGT ATAAACACCG TACTGTTAAA AGGCGTTAAA ATTOATGTGA 4680 AATACATTCA ACCGOGTATA GCAAGCGTAG ATGAAGTAAT TGAAGCGAAA COCATCCTTG 4740 AGAAGOTAAA AGATTTATCT GATGAAGAAA GAGAAGCGTT AGCTAAACTT GGAGTAAGTG 4800 CTGTACGTTT TATTGAGCCA AATAATACAA TTACAGTCOA TACACAAAAT GAATTTOCAA 4860 CCAGACCATT AAGTCGAATA sTGATTTCTs AAOGCAGGGC GTGTTTCTCA AACAOTGATG 4920 GCGCOACGGT GTGCGTTAAT ATCGCTGATA ACGGsCGGTA GCGGTC-AGTA ATTGACAAGG 4980 TAGATTTCAT CCTGCAATGA AGTCATTTTA TTTTCGTATT ATTTACTGTG TGOGTTAAAG 5040 TTCAsTACGG GCTTTACCCA TCTTOTAAAA AATTACGGAG AATACAATAA AGTATTTTTA 5100 ACAGOTTATT ATTATG 5116 (2) INFORMATION FOR SEQ ID NO: 2: (i) SEQUENCE CHARACTE ISTI S : (A) L---NGTH: 1536 amino acide (B) TYPE: amino «cid (C) STRANDEDNESS : single (D) TOPOLOGY! linear (ii) MOLECULE TYPE: DNA (genomlc) ( i) SEQUENCE DESCRIPTION: SEQ ID NO: 2: Met Asn Lyß lie T r Arg Leu Lyß Phe Ser Lys Arg Leu ?ßn Al* Leu 1 5 10 15 Val ?la Val Ser Glu Leu Ala Axg Gly Cys Asp Kiß Ser Thr Glu Lys 20 25 30 ßly Ser Glu Lys Pro Ala Arg Met Lyß Val Axg Bis Leu ?la Leu Lys 35 40 45 Pro Leu Ser ?la Met Leu Leu Ser Leu Gly Val Thr Ser l e Pro Gln 50 55 60 Ser Val Leu ?la Ser Gly Leu Gln Gly Met ?ßp Val Val Bis Gly Thx 65 70 75 80 ?la Thr Met sln Val ?ßp Gly Aßn Lyß Thr lie He ?rg ?sa Ser Val 85 90 95 ?ßp ?la He He Aßn Trp Lyß Gln Phe Aßn He Aßp Ola ?ßn Glu Met 100 105 110 Val Gln Phe Leu Gln Glu ?ßn ?ßn Aßn Ser ?la Val Phe ?ßn ?rg Val 115 120 125 Thr Ser ?sn Gln He Ser Gln Leu Lys Gly lie Leu Aßp -er ?ßn Gly 130 13S 140 Gln Val Phe Leu ie ?ßn Pro Asn Gly He Thr He Gly Lys ?ßp Ala 145 150 155 160 He He ?sn Thr ?sn Gly Phe Thx ?la Ser Thx Leu ?sp He Ser ?ßn 165 170 175 Glu ?sn He Lys Ala Arg Asn Phe Thr Phe Glu Gln Thr Lyß Aßp Lys 180 185 190 ?la Leu Ala Glu He Val Asn His Gly Leu He Thr Val Gly Lyß Aßp 195 200 205 Gly Ser Val ?ßn Leu He Gly Gly Lyß Val Lys ?sn Glu Gly Val He 210 215 220 Ser Val Asn Gly Gly Ser He Ser Leu Leu ?la Gly ßln Lyß He Thr 225 230 235 240 He Ser ?ßp He He ?sn Pro Thr He Thr Tyr Ser He ?la ?la Pro 245 250 255 Glu ?ßn Glu ?la Val ?sn Leu Gly ?ßp He Phß ?la Lyß Gly Gly ?ßn 260 265 270 He ?ßn Val ?rg ?la ?la Thr He ?rg ?an G n Gly Lys Leu Ser ?la 275 280 285 ?ßp Ser Val Ser Lys ?ßp Lyß Ser Gly ?ßn He Val Leu Ser ?la Lyß 290 29S 300 Glu Gly Glu ?la Glu He Gly Gly Val He Ser ?la Gln Asn sln Gln 305 310 315 320 ?la Lyß ßly Oly Lyß Leu Met He Thr Gly ?ßp Lyß Val Thr Leu Lyß 325 330 33S Thr Gly ?la Val He ?ßp Leu Ser Gly Lyß Glu Gly Oly Glu Thr Tyr 340 345 350 Leu ßly ßly ?ßp Glu ?rg Gly Glu Gly Lyß ?sn Gly He Gln Leu ?la 355 360 365 Lyß Lyß Thr Ser Leu Glu Lyß Gly Ser Thr He ?ßn Val Ser Gly Lyß 370 375 380 Qlu Lyß ßly Gly ?rg ?la He Val Trp ßly ?ßp He ?la Leu He ?ßp 385 390 39S 400 ßly ?ßn He ?ßn ?la ßln Gly Ser Gly ?ßp He ?la Lyß Tbr ßly Gly 405 410 415 Phe Val ßlu Thr Ser ßly Ríe ?ßp Leu Phe He Lyß ?ßp ?sn ?la He 420 425 430 Val Aßp ?la Lyß ßlu Trp Leu Leu ?ßp Phe ?ßp ?ßn Val Ser He ?ßn 435 440 445 ?la ßlu Thr ?la ßly ?rg Ser ?ßn Thr Ser ßlu ?ßp Aßp ßlu Tyr Thr 450 455 460 ßly Ser ßly Aßn Ser Ala Ser Thr Pro Lyß Arg ?sn Lys Glu Lyß Thr 465 470 475 480 Thr Leu Thr Asn Thr Thr Leu Glu Ser He Leu Lys Lys Gly Thr Phe 485 490 495 Val ?ßn He Thr ?la ?ßn Gln Arg He Tyr Val ?sn Ser Ser He ?ßn 500 S05 510 Leu Ser Aßn Gly Ser Leu Thr Leu Trp Ser Glu Gly Arg Ser Giy Gly 515 520 525 Gly Val Glu He Asn Asn ?sp He Thr Thr Gly Asp Asp Thr Arg Gly 530 535 S40 Ala Asn Leu Thr He Tyr Ser Gly Gly Trp Val Asp Val Kis Lyß Asn 545 550 555 560 He Ser Leu Oly Ala Gln Gly ?sn He Asn He Thr ?la Lyß Gln ?ßp 565 570 575 He ?la Phe Glu Lys sly Ser ?sn Gln Val He Thr Gly Gln aly Thr 580 585 590 He Thr Ser Gly Asn Gln Lyß Gly Phe ?rg Phe ?sn ?ßn Val Ser Leu 59S 600 605 ?ßn ßly Thr sly Ser Gly Leu Gln Phe Thr Thr Lyß ?rg Thr ?ßn Lyß 610 615 620 Tyx ?la He Thr ?an Lyß Phe Glu Gly Thr Leu ?sn He Ser Gly Lyß 625 630 635 640 Val ?ßn He Ser Met Val Leu Pro Lys ?an ßlu Ser ßly Tyr ?ßp Lyß 645 650 655 Phe Lyß ßly ?rg Thr Tyr Trp Aßn Leu Thr Ser Leu ?ßn Val Ser ßlu 660 665 670 Ser Gly Glu Phe ?ßn Leu Thr He Aßp Ser Arg Gly Ser ?ßp Ser ?la 675 680 685 ßly Thr Leu Thr Gln Pro Tyr A-sn Leu ?sn Gly He Ser Phe ?ßn Lys 690 695 700 ?ßp Thr Thr Phe ?ßn Val Glu Arg ?sn ?la ?rg Val ?ßn Phe ?ßp He 705 710 715 720 Lyß ?la Pro He sly He ?ßn Lyß Tyx Ser Ser Leu ?ßn Tyr ?la Ser 725 730 735 Phe ?ßn Gly ?ßn He Ser Val Ser Oly Oly ßly Ser Val ?ßp Phe Thr 740 745 750 Leu Leu ?la Ser Ser Ser ?ßn Val ßln Thr Pro Gly Val Val He ?ßn 755 760 765 Ser Lyß Tyr Phe ?ßn Val Ser Thr ßly Ser Ser Leu ?rg Phe Lyß Thr 770 775 780 Ser ßly Ser Thr Lyß Thr Oly Phe Ser He slu Lyß Aßp Leu Thr Leu 785 790 795 800 Aßn ?la Thr Gly sly ?ßn He Thr Leu Leu sln Val slu ßly Thr ?ßp 805 810 815 Gly Mßt He Gly Lys Oly He Val ?la Lys Lys ?ßn He Thr Phe slu 820 825 830 Gly Gly ?sn He Thr Phe sly Ser Arg Lys Ala Val Thr slu He Olu 835 840 845 Oly Aßn Val Thr He Asn Asn Asn Ala Asn Val Thr Leu He ßly Ser 850 855 860 ?sp Phe ?sp ?sn His Gln Lys Pro Leu Thr He Lys Lys ?ßp Val He 865 870 875 880 He Asn Ser Gly Aßn Leu Thr Ala Gly Gly Aßn Uß Vat Aßn He ?la 885 890 895 Oly ?ßn Leu Thx Val Olu Ser Asn Ala ?ßn Phe Lyß ?la He Thr ?ßn 900 90S 910 Phe Thr Phe Asn Val Gly Gly Leu Phe Asp Asn Lys Gly Aßn S^r ?ßn 915 920 925 He Ser He ?la Lyß ßly ßly ?la ?rg Phe Lyß ?ßp He ?ßp ?ßn Ser 930 935 940 Lyß ?ßn Leu Ser He Thr Thr ksn Ser Ser Ser Thr Tyr ?rg Thr He 945 950 9S5 960 He Ser aly ?ßn He Thx ?ßn Lyß ?ßn ßly ?ßp Leu ?ßn He Thr ?ßn 965 970 975 ßlu Gly Ser ?sp Thr Glu Met Gln He Gly Qly ?sp Val Ser ßln Lys 980 98S 990 ßlu ßly ?ßn Leu Thr He Ser Ser ?ßp Lyß He Aßn He Thr Lyß G n 995 1000 1005 He Thr He Lys Ala Gly Val Aßp Gly Glu Aßn Ser Asp Ser Aßp Ala 1010 1015 1020 Thr Aßn ?ßn Ala ?ßn Leu Thr He Lyß Thr Lys ßlu Leu Lyß Leu Thr 1025 1030 1035 1040 ßln ?ßp Leu ?ßn He Ser Qly Phe ?sn Lys Ala Glu He Thr ?la Lys 1045 1050 1055 ?ßp ßly Ser ?ßp Leu Thr He aly Aßn Thr ?ßn Ser ?la ?ßp Qly Thr 1060 1065 1070 ?ßn ?la Lyß Lyß Val Thr Phe ?sn Qln Val Lyß ?ßp Ser Lyß He Ser 1075 1080 1085 ?la ?ßp ßly Biß Lyß Val Thr Leu Biß Ser Lya Val ßlu Thr Ser ßly 1090 1095 1100 Ser ?ßn ?ßn ?sn Thr ßlu ?ßp Ser Ser ?ßp ?ßn ?ßn ?la ßly Leu Thr 1105 1110 1115 1120 He ?ßp ?la Lyß ?ßn Val Thr Val ?ßn ?ßn ?ßn He Thr Ser Ble Lyß 1125 1130 1135 ?la Val Ser He Ser Ala Thr Ser ßly ßlu He Thr Thr Lyß Thr sly 1140 1145 H50 Thr Thr He Aßn ?la Thr Thr Gly ?ßn Val Glu He Thr ?la ßln Thx 1155 1160 1165 Gly Ser He Leu Gly Gly He slu Ser Ser Ser Gly Ser Val Thr Leu 1170 1175 1180 Thr ?la Thr slu Gly Ala Leu Ala Val Ser Asn He Ser Gly Asp Thr 1185 1190 1195 1200 Val Thr Val Thr ?la Asn Ser Gly Ala Leu Thr Thr Leu ?la ßly Ser 1205 1210 1215 Thr He Lys Gly Thr slu Ser Val Thr Thr Ser Ser Gln Ser Gly ?ßp 1220 122S 1230 He Gly ßly Thr He Ser ßly Oly Thr Val Olu Val Lyß ?la Thr Glu 1235 1240 1245 Ser Leu Thr Thr sln Ser Asn Ser Lys He Lys Ala Thr Thr Gly Glu 1250 1255 1260 ?la ?ßn Val Thr Ser Ala Thr Gly Thr He Oly ßly Thr He Ser sly 1265 1270 1275 1280 Aßn Thr Val Aßn Val Thr Ala Asn Ala Gly Asp Leu Thr Val ßly ?ßn 1285 1290 129S ßly ?la ßlu He Aßn Ala Thr Glu Gly ?la ?la Thr Leu Thr Thr Ser 1300 1305 1310 Ser Gly Lys Leu Thr Thr Glu Ala Ser Ser His He Thr Ser Ala Lys 1315 1320 1325 ßly ßln Val ?ßn Leu Ser ?la sln ?ßp Gly Ser Val ?la aly Ser He 1330 1335 1340 ?ßn ?la ?la ?ßn Val Thr Leu Asn Thr Thr Gly Thr Leu Thr Thr Val 1345 1350 1355 1360 Lyß Gly Ser Aßn He Aßn Ala Thr Ser Oly Thr Leu Val He ?ßn ?la 1365 1370 1375 Lyß ?ßp ?la Glu Leu Asn Gly Ala Ala Leu Gly Aßn His Thr Val Val 1380 1385 1390 ?ßn ?la Thr ?ßn ?la Aßn Gly Ser aly Ser Val He Ala Thr Tbr Ser 1395 1400 1405 Ser ?rg Val ?ßn He Thr sly ?sp Leu He Thr He ?ßn Oly Leu ?ßn 1410 1415 1420 He He ßer Lyß ?ßn Qly He ?ßn Thr Val Leu Leu Lyß Gly Val Lya 142S 1430 1435 1440 He ?ßp Val Lyß Tyr He Gln Pro Gly He ?la Ser Val ?ßp Glu Val 1445 1450 1455 He Olu ?la Lyß ?rg He Leu ßlu Lyß Val Lyß Aßp Leu Ser ?ßp Olu 1460 1465 1470 Glu ?rg Glu ?la Leu Ala Lyß Leu Gly Val Ser ?la Val ?rg Pbe He 1475 1480 1485 Glu Pro ?ßn ?ßn Thr He Thx Val ?ßp Thr ßln ?ßn ßlu Pbe ?la Thr 1490 1495 1S00 ?rg Pro Leu Ser ?rg He Val He Ser ßlu sly ?rg Ala Cyß Phe Ser 1S0S 1510 1515 1520 Aßn Ser Aßp Gly Ala Thr Val Cys Val Aßn He Ala ?ßp ?ßn ßly ?rg 1525 1530 1535 (2 ) INFORM?TION FOR SEQ ID NO : 3 : ( i ) SEQUENCE CHARACTERISTICS : (A) LENC-TH : 4937 base pai rs (B) TYPE : nucleic acid (C) STRANDEDNESS : single (D) TOPOLOQY : linear (ii) MOLECUI-E TYPE : DNA (genocnic) (xi) SEQUENCE DESCRIPTION : SEQ ID NO : 3 : TA??T?T?C? ?GATAATAAA AATAAATCAA QArrTTTßTG ATG?C???C? ?C??TT?CAA 60 C?CCTTTTTT GCAGTCTATA TsC?AATATT TTAAAA???T AGT?TAA?TC CßCCATATA? 120 AATßGTATA? TCTTTCATCT TTC?TCTTT? ?TCTTTC TC TTTCATCTTT C?TCTTTC?T 180 CTTTC?TCTT TCATCTTTCA TCpTC?TCT TTCATCTTTC ?TCTTTC?TC TTTC?TCTTT 240 CACAT-lA?AT OATOAACCOA GGGA?GGGAs OGAGGGGC?A GA?TßAAQ?G OGAGCTOAAC 300 G??CGCAA?T ß?T?AAGTAA TTTAATTsTT CAACT??CCT TAßGA-3A?AA T?TGA?C??G 360 ?T?T?TCQTC TCAAATTCAG CAAACOCCTQ AATsCTTTOG TTOCTQTQTC TGA?TTGaC? 420 CGOOOTTGTQ ?CC?TTCC?C AGAAA?AGQC TTCCGCTATG TT?CTATCTT TAGOTßTA?C 480 C?CTTAOCßT T AAGCC?CT TTCCßCTATG TT?CT?TCrT T?ßsTOT??C ?TCT?TTCC? 540 C?ATCTOTTT T?GCAAGCGG CTTACAAOGA ATaaATGT?G TAC CGGCAC ?ßCC?CT?TO 600 CAAßT?ßATß GT??TAAAAC CATTATCCOC AACAGTOTTa ACQCTATCAT TAATTOGAAA 660 C ATTTAAC? TCGACCAAAA TGAAATOGTO C?GTTTTT?C ??G?AA?CA? CAACTCOGCC 720 OTATTC?ACC OTGTT?CATC TAACCAAATC TCCCA TT?? AAOßGATTTT AGATTCT??C 780 GGAC??GTCT TTTT??TC?? CCCAAATGQT ATCACAAT?G QT??AOACGC A?TTATTA?C 840 ACTA?TQOCT TT?CGGCTTC TACGCTAGAC ATTTC AACG AAAACATCAA GOCQCGT?AT 900 TTCACCTTCß ?GCAAACCAA AGAT???GCG CTCGCTOAAA TTQTOAATC? CGGTTT??TT 960 ?CTOTCGQTA AAGACGOCAG TQTA?ATCTT ATTOQTQOCA A?sTQAAA?? CGAGOGTßTG 1020 ?TT?GCGTAA ?TOGTOGC?O C-ATTTCTTTA CTCOC?ßOGC AAAAAATCAC CATCAGOGAT 1080 ?T?ATAAACC C??CC?TT?C TT?C?GC?TT GCCOCOCCTß ???ATß? OC ßGTC??TCTO 1140 GGCß?T?TTT TTQCCAAAßQ COQT??CATT AATQTCCGTQ CTQCC?CTAT TCGAAACC?? 1200 sGT???CTTT CTOCTSATTC TsTAAGC?AA GATA?AAOCß GCA?T?TTGT TCTTTCCOCC 1260 AAAGAGOGTG ?? CßO???T TsOCQGTgT? ATTTCCOCTC AAAATCAGCA AßCT???OGC 1320 ßOCAAGCTOA TGATT?CAGG CGATAA?GTC AC?TTAAAA? CAOGTGCAGT T?TCG?CCTT 1380 TCAßGTAAAß A?GGGGG?O? A?CTT?CCTT ßOCOOTSACG AOCOCOOCOA AOGTAA???C 1440 GGC?TTC?AT T?GCAAAOAA AACCTCTTTA GA?AAAGGCT CAACCATCA? TßT?TCAGGC 1500 A?AsAAAAAG GCOGAOOCCC TATTOTOTOG OGCOATATTO COTTAATTGA CGGC?AT?TT 1560 ??CQCTCA?s sT?sTGGTGA TATCsCTAAA ACCsOTOQTT TTGTs?Aa?C ?TCOGGOC?T 1620 T?TTTATCCA TTGACAGCAA TOCAATTOTT AAAACA?AAQ AsTQGTTsCT AGACCCTO?T 1680 OATCT??C?? TTOAAGCCG? AGACCCCCTT CGCAATAATA CCOGTATAAA TGATG?ATTC 1740 CCAAC?GGC? CCGsTGAAGC AAGCGACCCT AAAAAAAATA GCGAACTCAA ??CAACGCTA 1800 ?CC??T?C?? CTATTTC?AA TTATCTGAAA AACGCCTGGA CAATGAAT?T ??CQGCATCA 1860 AGAA??CTT? CCOTT??TAG CTCAATCAAC ATCOGAAGCA ACTCCCACTT ??TTCTCC?T 1920 ?GT???GGTC ?OCGTOGCss AGGCsTTC-AG ATTGATGGAG ATATTACTTC TA?AGGCQß? 1980 ??TTT??CC? TTT?TTCTGG CGGATGGGTT sATQTTCATA A???TATT?C GCTTG?TC?G 2040 GGTTTTTTAA ?T?TT?CCGC CGCTTCCGTA aCTTTTQAAG GTGGAAATA? C???GC?CGC 2100 G?CGCGGC?? ATGCTAAAAT TGTCGCCCAG GGCACTGTAA CCATTAC?GG AGAGOGAAAA 2160 GATTTC?OGG CT??C??CCT ?TCTTT?AAC GGAACGGGTA AAGGTCTG? T?TC?TTTCA 2220 TCAGTG??T? ATTTAACCCA CAATCTTAGT OOC?CA?TTA ACATATCTOO Q??TATAACA 2280 ?TT??CC??? CT?CG?O??? GA?C?CCTCQ T?TTOOCAAA CC?OCCATG? TTCGC?CTGO 2340 ?ACGTCAßTß CTCTT??TCT AOAa?C?GGC OCAAATTTTA CCTTTATT?A AT?C?TTTC? 2400 AßC??T?GC? AAßGCTTAAC AACACAßTAT AGAAQCTCTG CAOOGßTOAA TTTTAACOßC 24 0 GTA??TOGC? ?C?TOTC?TT CAATCTCAAA OAAßGAGCG? ?GTr? rrT CAAATTA??A 2520 CC???Cß?-A ACATG?ACAC AAGC?AACCT TTACC??TTC ßGTTTTT?GC CAATATC?CA 2580 GCCACTOßTO OGGGCTCTGT TTTTTTTGAT AT?T?TOCC? ?CCATTCTOG C?O?OOOOCT 2640 GAGTT??AAA TQAGTGAAAT TAAT?TCTCT AACOGCQCTA ATTTTACCTT ???TTCCCAT 2700 QTTCGCOOCs ATOACOCT-T T?AAATCAAC AAAGACTT?A CCATAAATGC ??CC??TTC? 2760 AATTTC?ßCC TCAG?C?G?C G??AGATQAT TTTtATOACa OaTACOC?CO C??TGCC?TC 2820 ??TTC??CCT ?CAACATATC CATTCTGGGC GOTAATOTCA CCCTTOGTßG AC?AAACTC? 2880 ?GC?aC?GC? TT?CsGGGAA TATTACTATC aAOAAAQCAa C???TGTTAC OCTAG??GCC 2940 AAT?ACGCCC CT??TCAOC? ???CATAAGa GATAG?OTT? T??AACTTOG CAGCTTGCTC 3000 GTT?ATOQG? sTTTAAOTTT ??CTsGCGAA AATGC?GATA TT???OOC?? TCTCACT?TT 3060 TC?GAAAOCQ CCACTTTTAA ?ßQAAAQACT AG?G?T?CCC T???T?TC?C COOC??TTTT 3120 ?CC??T??TO GCACTOCCGA AATTAATATA ACACAAOGAO TsßTAAA?CT TOGC??TOTT 3180 ACC??TO?Ta QTQ?T?T??? CATtACCACT CACsCTAAAC OC?ACCAA?O A?OC?TC?TC 3240 GßCGß-?G?TA TAATCAACAA A??AGGAAGC TTAAAT?TT? CAG?C?ßT?? TA?TO?TGCT 300 GAA?TCCAAA TTGGCOGC?? T?TCTCGCAA AAAGAAGGCA ?CCTC?CO?T TTCTTCCQ?T 3360 AAAATTAATA TCACC?AAC? QATAACAATC AA???GOGT? TTGATGGAOA Gß?CTCT?sT 3420 TC?O?TGCQA C??GTA?TOC CAACCT??CT ATTA?AACC? ??ß??TTGAA ?TTG?C?a?? 3480 G?CCTA?sT? TTTC?GGTTT CAATAAAGCA GAOATTACAG CC?AAG?TOG TAGAGATTTA 3540 ACT?TTGOC? ?CAGTA?TG? CGCTAACAGC GOTOCCGAAO CCAAAACACT ??CTTTT??C 3600 ??TOtTAAAG ATTC??AAAT CTCTGCT--AC GOTCACAATO TOACACT??? TAGCA?AGTG 3660 A???CATCTA sC?GCA?TGG COGACGTGAA AGCAATAGCO ACAACGATAC CGOCTTAACT 3720 ?TT?CTsCAA AAAATG AGA AGTAAACAAA GATATTACTT CTCTCAAAAC ?CT??ATATC 3780 ACcscsTcss AAAAssTTA CACCACAGCA GOCTCGACCA TTAACGCAAC AAATGGCAAA 3ß<o OCAAGTATTA CAACCAAAAC AGOTGATATC AGCOQTACGA TTTCCGGTAA CACGGTA?GT 3900 OTTAOCOCG? CTGGTaATTT AACCACTAAA TCCOOCTCAA AAATTG??QC GAAATCOGGT 3960 GAGGCTAATG TAACAAGTGC AACAGGTACA ATTGGCGsTA CAATTTCCGG TAATACGOTA 4020 A?TßTT?Csß CAAACGCTGG COATTTAACA OTTs?--AATs sCOCAOAAAT TA?TGCO?CA 4080 GA?GG?GCTG CAACCTTAAC CGCAACAGGG AATACCTTGA CTACTG??ßC CGGTTCTAQC 4140 ?TC CTTCAA CTAAGGGTCA GGTAGACCTC TTOGCTCAGA ATOOTAOCAT CsC?Gs??ßC 4200 ?TT?ATOCTO CTAATOTQAC ATTAAATACT ACAOGCACCT TA?CC?CCßT GGC?GGCTCG 4260 O?T?TTAAAG C??CCAGCGQ C-ACCTTGGTT ATTAACOCAA AAGATGCTAA GCTA??TOGT 4320 GATGC?TC?G GTG?TAQTAC AGAAGTGAAT GCAGTCAACG CAAGCGCCTC TGsTAGTGTs 4380 ACTGCßGCAA CCTCA?OCAO TOTGAATATC ACTGGsGATr T??ACACAGT A?ATOGGTT? 4440 AATATCATTT CQAAAGATGG TAGAAACACT GTOCGC- AA GAGGCAAGG? AATTOAGGTG 4500 ?AATATATCC ?GCC?GGTGT AOCAAGTOTA GAAaAAOT?? TTOA?sCGA? ?CGCGTCCTT 4560 G??? AGTAA A?GATTT?TC TGATGAAGAA AGAGAA?CAT TAGCT??ACT TGGTGT??GT 4620 GCTßTACGTT TTGTTaAGCC AAATAATACA AT ACAGTCA ATACACAAA? TGAATTTAC? 4680 ?CCAG?CCGT CA?OTCAAGT GATAATTTCT GAAGGTAAGs CsTsTTTCTC AAOTOOTAAT 4740 OßCsC?CG?Q TATGTACCAA TOTTOCTOAC GATOGACAGC COTAOTCAOT A?TTG?C??G 4800 ßT?OATTTCA TCCTßCAATG AAGTCATTTT ATTTTCsTAT TATTTACTGT sTGGGTT??A 4860 GTTCAGTACG GGCTTTACCC ATCTTGTAAA AAATTACOGA GAATACAATA ?AsTATTTTT 4920 A?C?GGTTAT T?TT?TQ 4937 (2 ) INFORMATION FOR SEQ ID NO : : (i ) SEQUENCE CKARACTERISTICS : (A) LENGTH : 1477 amino acide (B) TYPE : amino acid (O STRANDEDNESS : singl e (D) TOPOLOGYi linear (xi ) SEQUENCE DESCRIPTION : SEQ ID NO : 4 : Mee ?ßn Lyß He Tyr ?rg Leu Lys Phe Ser Lyß ?rg Leu ?ßn ?la Leu 1 5 10 1S Val ?la Val Ser ßlu Leu ?la ?rg ßly Cyß ?ßp Biß Ser Thr ßlu Lyß 20 25 30 ßly Ser ßlu Lyß Pro ?la ?rg Mee Lyß Val ?rg Hiß Leu ?la Leu Lyß 35 40 45 Pro Leu Ser Ala Met Leu Leu Ser Leu aly Val Thr Ser He Pro sln SO 55 60 Ser Val Leu -«-r Gly Leu Gln ßly Met ?ßp Val Val Hiß ßly Thr 65 70 75 80 ?la Thr Met sip Val Asp aly Asn Lys Thr He He Arg Asn Ser Val 85 90 95 Aßp ?la He lie ?sn Trp Lys Cln Phe ?sn He ?sp Oln ?an slu Met 100 IOS lio Val Gln Phe Leu Gln Qlu Asn Aßn Asn Ser Ala Val Phe Aßn Arg Val 115 120 125 Thr Ser ?an Gln He Ser Gln Leu Lyß sly He Leu ?ep Ser ?ßn Gly 130 135 140 ßln Val Phe Leu He A-sn Pro Asn Gly He Thr He Gly Lyß Asp Ala 14S 150 155 160 He He Aßn Thr Asn Gly Phe Thr Ala Ser Thr Leu Asp He Ser ?ßn 165 170 17S ßlu ?sn He Lys ?la ?rg ?sn Phe Thr Phe ßlu ßln Thr Lys ?ßp Lyß 180 18S 190 ?la Leu ?la slu He Val Aßn His sly Leu He Thr Val ßly Lyß ?ßp 195 200 205 ßly Ser Val ?ßn Leu He Gly Gly Lye Val Lyß ?sn Glu aly Val He 210 215 220 Ser Val ?ßn ßly sly Ser He Ser Leu Leu ?la Qly sln Lys He Thr 225 230 235 240 He Ser ?ßp He He ?ßn Pro Thr He Thr Tyr Ser He ?la ?la Pro 245 250 255 Qlu ?ßn Olu ?la Val ?ßn Leu sly ?ßp He Phe ?la Lyß ßly Oly ?ßn 260 26S 270 He ?an Val ?rg ?la Ala Thr He Axg Aßn sln aly Lys Leu Ser ?la 275 280 285 ' ?ßp Ser Val Ser Lye ?ep Lyß Ser sly ?sn He Val Leu Ser ?la Lyß 290 295 300 Olu ßly ßlu ?la ßlu He sly aly Val He Ser ?la Gln ?ßn Oln Gln 305 310 315 320 ?la Lya Gly Qly Lys Leu Met He Thr Gly ?ßp Lyß Val Thr Leu Lyß 325 330 335 Thr ßly ?la Val He ?ep Leu Ser ßly Lye ßlu sly sly ßlu Thr Tyr 340 345 350 Leu Gly Gly ?ßp ßlu ?rg ßly Glu Gly Lye ?ßn Gly He ßln Leu ?la 355 360 365 Lyß Lys Thr Ser Leu ßlu Lys Gly Ser Thr He ?ßn Val Ser ßly Lyß 370 375 380 ßlu Lyß ßly ßly Phe ?la He Val Trp aly ?ßp He ?la Leu He ?ßp 385 390 395 400 Gly ?ßn He ?ßn ?la ain sly Ser Gly ?ßp He ?la Lyß Thr Gly ßly 405 410 415 Phe Val Glu Thr Ser Oly H s Asp Leu Phe He Lys Asp Aßn Ala He 420 42S 430 Val ?ßp Ala Lys Glu Trp Leu Leu Asp Phe Asp ?ßn Val Ser He ?ßn 435 440 445 ?la ßlu ?sp Pro Leu Phe ?sn Aßn Thr Oly He Asn ?ßp Glu Phe Pro 450 4S5 460 Thr sly Thr Gly Glu Ala Ser Asp Pro Lys Lys Asn Ser Olu Leu Lys 465 470 475 480 Thr Thr Leu Thr Asn Thr Thr He Ser Asn Tyr Leu Lys Aßn Ala Trp 485 490 495 Thr Met Aßn He Thr Ala Ser Arg Lys Leu Thr Val ?sn Ser Ser He 500 505 510 ?ßn He Oly Ser Asn Ser Bis Leu He Leu Kis Ser Lyß Oly G n ?rg 515 520 525 Gly Gly ßly Val Gln He ?ßp sly Asp He Thr Ser Lyß Gly ßly ?ßn 530 535 540 Leu Thr. He Tyr Ser Gly Oly Trp Val ?ap Val Hiß Lyß ?ßn He Thr 545 550 555 560 Leu ?ßp ain aly Phe Leu ?ßn He Thr ?la ?la Ser Val ?la Pbe slu 565 570 575 Gly ßly ?ßn Aßn Lyß Ala ?rg Asp Ala Ala ?sn ?la Lyß He Val ?la 580 S85 590 ßln ßly Thr Val Thr He Tr ßly Glu ßly Lyß ?ßp Phe ?rg ?la ?ßn 595 600 605 ?ßn Val Ser Leu Aßn Gly Thr aly Lys Cly Leu Asn He He Ser Ser 610 615 620 Val ?ßn ?ßn Leu Thr Kiß Aen Leu Ser Oly Thr He Aßn He ßer aly 625 630 635 640 Aßn He Thr Ue Aßn Gln Thr Thr Arg Lyß Asn Thr Ser Tyr Trp Gln 645 6S0 655 Thr Ser Biß Aßp Ser Hiß Trp ?ßn Val Ser ?la Leu ?ßn Leu G u Thr 660 665 £70 Gly ?la ?ßn Phß Thr Phe Ue Lys Tyr He Ser Ser ?ßn Ser Lyß Gly 675 680 685 Leu Thr Thr Gln Tyr ?rg Ser Ser Ala ßly Val ?sn Phe ?ßn Gly Val 690 695 700 ?ßn ßly ?ßn Met Ser Phe ?ßn Leu Lyß ßlu Gly ?la Lyß Val ?ßn Phe 705 710 715 720 Lyß Leu Lyß Pro ?ßn ßlu ?ßn Met ?ßn Thr Ser Lyß Pro Leu Pro Ue 725 730 735 ?rg Phe Leu ?la ?ßn He Thr ?la Thr ßly ßly ßly Ser Val Phe Phe 740 745 750 Aßp He Tyr Ala Asn Hiß Ser sly Arg Oly Ala Olu Leu Lyß Mßt Ser 7SS 760 765 ßlu He ?ßn Ue Ser Asn Gly Ala Asn Phe Thr Leu Asn Ser His Val 770 775 780 Arg Gly Asp Asp Ala Phe Lys Ue Asn Lys Asp Leu Thr Ue Aßn Ala 78S 790 795 800 Thr Aßn Ser Aßn Phe Ser Leu Arg Gln Tbr Lyß Aßp ?ßp Phe Tyr ?ßp 805 810 815 Gly Tyr ?la Axg Asn ?la He Aßn Ser Thr Tyr Aßn He Ser He Leu 820 825 830 Gly Cly Aßn Val Thr Leu Gly Gly Gln Asn Ser Ser Ser Ser He Thr 835 840 845 Gly Asn lie Thr Ue Glu Lyß Ala Ala Asn Val Thr Leu Glu Ala ?ßn 8S0 855 860 ?ßn ?la Pro ?ßn Oln sln ?sn lie ?rg ?ßp Axg Val Ue Lyß Leu Gly 865 870 875 880 Ser Leu Leu Val Asn Gly Ser Leu Ser Leu Thr Gly Glu Asn Ala ?ßp ßßS 890 895 He Lyß Oly ?sn Leu Thr Ue Ser Olu Ser ?la Thr Phe Lyß ßly Lyß 900 905 910 Thr ?rg ?ßp Thr Leu ?en Ile Thr ßly ?ßn Phe Thr ?ßn ?ßn ßly Thr 915 920 925 ?la ßlu He ?ßn He Thr Oln Gly Val Val Lys Leu Gly ?ßn Val Thr 930 935 940 ?ßn Aßp aly Aßp Leu Asn Ue Thr Thr Hie ?la Lyß ?rg ?ßn Gln ?rg 945 950 955 960 Ser Ue l e Oly Gly ?ßp Ue Ue ?ßn Lye Lyß sly Ser Leu ?ßn Ue 965 970 975 Thr ?ßp Ser Asn Asn Aßp Ala Glu He Gln lie Gly sly Aßn He Ser 980 985 990 Oln Lyß Olu Oly Aen Leu Thr Ue Ser Ser ?ßp Lye l e ?ßn l e Thr 995 1000 1005 Lyß Oln He Thr He Lyß Lyß Oly He ?ap ßly ßlu ?ßp Ser Ser Ser 1010 1015 1020 ?ßp ?la Thr Ser ?ßn ?la ?ßn Leu Thr Ue Lyß Thr Lyß ßlu Leu Lyß 1025 1030 1035 1040 Leu Thr ßlu ?ßp Leu Ser He Ser Gly Phe Aßn Lyß ?la Glu He Thr 1045 1050 1055 ?la Lyß ?ßp Oly ?rg ?ßp Leu Thr He ßly ?sn Ser ?ßn ?ßp ßly ?ßn 1060 . 1065 1070 Ser ßly ?la Qlu ?la Lyß Thr Val Thr Phe ?ßn ?ßn Val Lyß ?ßp Ser 1075 1080 1085 Lyß He Ser ?la ?ßp Gly Hiß Aßn Val Thr Leu ?ßn Ser Lyß Val Lyß 1090 1095 1100 Thr Ser Ser Ser ?sn sly aly ?rg Glu Ser ?sn Ser Asp Asn Aßp Thr 1105 1110 1115 1120 Gly Leu Thr He Thr Ala Lys Asn Val Glu Val Asn Lys Asp He Thr 1125 1130 1135 Ser Leu Lys Thr Val Aßn lie Thr Ala Ser Glu Lyß Val Thr Thr Thr 1140 1145 1150 Ala Gly Ser Thr Ue Asn Ala Thr Asn Gly Lys ?la Ser lie Thr Thr 1155 1160 1165 Lys Tbr Gly ?ßp He Ser Gly Thr lie Ser Gly ?ßn Thr Val Ser Val 1170 1175 1180 Ser Ala Thr Val Asp Leu Thr Thr Lys Ser Gly Ser Lys Ue Glu Ala 1185 1190 1195 1200 Lyß Ser G y slu Ala Aßn Val Thr Ser Ala Thr ßly Thr Ue ßly Oly 1205 1210 1215 Thr He Ser Gly Asn Thr Val Aßn Val Thr Ala ?ßn ?la ßly ?ßp Leu 1220 1225 1230 Thr Val Gly ?sn aly ?la Glu He ?sn ?la Thr Glu Gly ?la ?la Thr 1235 1240 124S Leu Thr ?la Thr Gly ?sn Thr Leu Tbr Thr Glu ?la ßly Ser Ser lie 1250 12SS 1260 Thr Ser Thr Lys ßly Gln Val ?sp Leu Leu ?la Oln ?ßn ßly Ser He 1265 1270 1275 1280 ?la ßly Ser Ue ?ßn ?la Ala Aßn Val Thr Leu ?ßn Thr Thr ßly Thr 12B5 1290 1295 Leu Thr Thr Val ?la Gly Ser ?ßp He Lyß ?la Thr Ser Gly Thr Leu 1300 1305 1310 Val He ?ßn ?la Lyß Aßp Ala Lyß Leu Asn Gly Asp Ala Ser ßly ?ßp 1315 1320 1325 Ser Thr ßlu Val ?ßn ?la Val ?ßn ?la Ser aly Ser ßly Ser Val Thr 1330 1335 1340 ?la ?la Thr Ser Ser Ser Val ?ßn Ile Thr Oly ?ßp Leu ?ßn Thr Val 134S 1350 1355 1360 ?sn ßly Leu ?ßn Ue He Ser Lyß ?ßp ßly ?rg ?ßn Thr Val ?rg Leu 1365 1370 1375 ?rg ßly Lyß ßlu He Glu Val Lyß Tyr Ue Gln Pro Gly Val ?la Ser 1380 1385 13 0 Val Glu ßlu Val Ue Glu ?la Lye ?rg Val Leu ßlu Lyß Val Lyß ?ßp 1395 1400 1405 Leu Ser ?ßp ßlu ßlu ?rg Glu Thr Leu ?la Lyß Leu ßly Val ßer ?la 1410 141S 1420 Val ?rg Pbe Val ßlu Pro ?ßn ?ßn Thr He Thr Val Aßn Thr ßln Aßn 1425 1430 143S 40 ßlu Phe Thr Thr ?rg Pro Ser Ser ßln Val He He Ser Glu aly Lyß 1445 1450 1455 ?la Cyß Phe Ser Ser Gly Asn Gly ?la ?rg Val Cyß Thr ?ßn Val ?la 1460 146S 1470 ?sp ?ßp sly Gln Pro (2) INFORMATION FOR SEQ ID NO: 5: (i) SEQUE CE CHAR?CTERISTICS : (A) LENGTK: 9171 baae pa rs (B) TYPE: nucleic acid (C) STRANDEDNESS : single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: DNA (genomic) (Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 5: AC?GCGTTCT CTT?ATACTA GTACAAACCC ACAATAAAAT ATGACAAACA ACAATT?C?? 60 C CCtttrrt QCAaTCTATA TGCAAATAGG TTAAAAAAT? GTATAAATCC OCCAT?T??A 120 ?TOGTATAAT CTTTCATCTT TCATCTTTCA TCTTTCATCT TTCATCTTTC ATCTTTC?TC 180 TTTC?TCTTT C?TCTTTCAT CTTTCATCTT TCATCTTTCA TCTTTCATCT TTCATCTTTC 240 AC?TQ???Tß ATOAACCGAG GGAAGGGAGG GAGGGGCAAG AATGAAGAGG G?GCTG??CG 00 AACQCAAATO ATAAAO AAT TTAATTOTTC AACTAACCTT AGGAGAAAAT ATOAACAAGA 360 TATATCGTCT CAAATTCAGC AAACGCCTGA ATGCTTTGGT TGCTGTsTCT GAATTGGC?C 420 GGOGTTsTs? CC?TTCCACA sAAAAAGGCA GCGAAAAACC TGCTCGCATO AAAGTOCGTC 480 ACTT?sCOTT AA?OCCACTT TCCGCTATCT TACTATCTTT AGGTsTA?CA TCT?TTCC?C 540 ??TcrsTTTT ?scAAocaac TTACAAGOAA TOGA OTAG ACACOGCACA sccACT?toc 600 ??sTAOATss TAATAAAACC ATTATCCsCA ACAsTsTTaA CGCTATCATT AATTGG???C 660 ??TTTAACAT CGACCAAAAT GAAATGGTGC AsTTTT ACA AGAAAACAAC AACTCCOCCG 720 T?TTCAACCG TOTT?CATCT AACCAAATCT CCCAATTAAA AaGOATTTTA G?TTCTAACG 780 GACAAGTCTT TTT?ATCAAC CCAAATGGTA TCACAATAGO TAAAGACOCA ATTATT??CA 840 CT??TOGCTT T?CGGCTTCT ACOCTAGACA TTTCTAACGA AAACATCAAG OCßCOTAATT 900 TC?CCTTCQ? sCAAACCAAA GATAAAOCGC TCGCTOAAAT TsTGAATCAC GGTTTAATTA 960 CTGTCaaTAA AGACsGCAsT sTAAATCTTA TTGOTOGCAA AGTGAAAAAC GAG-GTOTOA 1020 TTAsCOTAA? TGßTOGCAGC ATTTCTTTAC TCGCAOGGCA AAAAATCACC ATCAGCGAT? 1080 T??TA??CCC ??CC?TT?CT T?CAGCATTG CCGCGCCTGA A?ATsAAGCG GTCAATCTGG 1140 sCG?TATTTT TGCC?AAGGC OGTAACATTA ATOTCCCTOC TsCCACT?TT Cs???CC??ß 1200 CTTTCCGCCA AA---AGGGTsA ?GCOOAAATT ssCGOTGTA? TTTCCsCTCA ??ATC?GC?? 1260 GCTA?AGGCG sC sCTsAT GATTACAGOC GATAAAGTCA CATTAAAAAC AGGTaC?GTT 1320 ?TCG?CCTTT CAOGTAA?GA ?GGsGGAaAA A<-TTACCTTG sCGsTGACaA GCOCGGCGAA 1380 GGTAAAAACs OCATTCAATT AGCAAAGAAA ACCTCTTTAG AAAAAOGCTC AACC?TCAAT 1440 GTATCAGGCA AAsAAAAAGG CGGACGCGCT ATTGTGTGGs GCGATATTGC GTTAATTCAC 1500 sscAATATTA ACGCTCAAGO TAOTOCTOAT ATCGCTAAAA ccostasttt TGTGsAG?cs ísßo TcsoßscATG ATTTATTCAT CAAAGACAAT scAATTotts ACOCCAAAGA stosttstt? 1620 GACCCGGATA ATCTATCTAT TAATGCAGAA ACAGCAGGAC GCAGCAATAC TTCAGAAG?C 1680 OATOAATACA CGGGATCCQs GAATAsrsCC AGCACCCCAA AACGAAACAA AGAA?AGACA 1740 ?CATT??CAA ACACAACTCT TGAGAGTATA CTAAAAAAAG GTACCTTTGT TA?CATC?CT 1800 GCT??TC??C GCATCTATOT CAATAOCTCC ATTAATTTAT CCAATOGCAG CTT?ACTCTT 1860 TGGAGTGAss stcsGA0C0G TascGscGTT CAGATTAACA ACCATATTAC CACcasTß?T 1920 OATACCAGAG GTGCAAACTT AACAATTTAC TCAOGCOOCT OOOTTOATOT TCATA?AAAT 1980 ATCTCACTCs GGGCGCAAGG TAACATAAAC ATTACAOCTA AACAAOATAT OSCCTTTGAG 2040 ??AOGAAGCA ACCAAOTCAT TACAOGTCAA GGGACTATTA CCTCAGGCAA TC?A?AAßGT 2100 TTT?GATTT? AT?ATCrTCTC TCTAAACsaC ACTOGCAOCO sACTGCAATT C?CCACTA?A 2160 ?ßAACCAATA AATACGCTAT CACAAATAAA TTTGAAssGA CTTTAAATAT TTCAßGaA?A 2220 GTß?ACATCT CAATsGTTTT ACCTAAAAAT GAAAOTGaAT ATOATAAATT C?AAOOACsC 2280 ACrr?CTGGA ATTTAACCTC GAAAGTOaAT ATOATA?ATT CAAAOGACsC CCTC?CT?TT 2340 GACTCC?GAO s?AGCG?TAG TGCAOGCACA CTTACCCAGC CTTATAATTT AA?COGT?T? 2400 TCATTCA?CA ?AOACACTAC CTTTAATOTr GAACGA?ATs CA?G?OTC?A CTTTQ?C?TC 2460 ??ßGC?CCAA T?GGsATAAA TAAOTATTCT ?GTTTa?ATT ACOCATCATT TA?TGG???C 2S20 ?TTTC?GTTT CGGGAGOOOG GAGTOTTOAT TTCACACTTC TCGCCTCATC CTCTA?COTC 2S80 CAA?CCCCCO OTßTAsTTAT AAATTCTAAA TACTTTAATs TTTCAACAGG sTC??GTTT? 26 0 ?s?TTT?AAA CTTCAOsCTC AACAAAAACT GGCTTCTCAA TAOAGAAAOA TTTA?CTTT? 2700 ??TOCC?CCG GAGGCAAC?T AACACTTTTG CAAsTTOAAs OCACCCATOO AATGATT6GT 2760 ???ßGCATTG TAOCCAAAAA AAACATAACC Trp-AAOGAO sTAAGATGAs aTTTGQCTCC 2820 AGG???QCCQ TAACAGAAAT CGAAGGCAAT GTTACTATCA ATAACAACGC TA?CGTC CT 2880 CTT?TCßßTT CQaATTTTGA CAACCATCAA AAACCTTTA? CTATT?AAAA AG?TOTC?TC 2940 ?TT??T?ocs scAACCTTAC csctsoAssc AATATTGTCA ATATAGCCOG ?AATCTT?cc 3000 sTTG???QT? ?COCT??TTT CAAAsCTATC ACAAATTTCA CTTTTAATsT AOGCßGCTTO 3060 TTTG?CA?CA ??GGCAATTC AAATATTTCC ATTGCC?AAG GAOßGGCTCO C-TTTA??G?C 20 ?rrO?T?ATT CCAAGAA?T AAOCATCACC ?CCAACTCC? OCTCCACTTA CCOCACT?TT 3180 AT?AGCGGCA ?TATAACC?A T?A?AAC K?T OATTTAAATA TTACOAACOA AOGT?sTG?T 3240 ACTGAA?TGC AAATTßßCsG CGATOTCTCG CAAAAAGAAG GTAATCTCAC GATTTCTTCT 3300 GAC???ATCA ?T?TT?CCAA ?CAGATA?CA ATCAAGGC?G GTOTTOATOa GGAaAATTCC 3360 GATTCAGACG CGAC?AACAA TGCCAATCTA ACCATTAAAA CCAAAGAATT GAAATTA?CO 3420 CAAOACCTAA ATATTTC?GG TTTCAATAAA OCAsAGATTA CAsCTAAAGA TOGT?sTQ?T 3480 TTAACTATTG QTAACACCAA TAGTOCTOAT OOTACTAATO CC?AAAAAOT ?ACCTTTAAC 3540 CAOGTTAAAG ?TTCAAAAAT CTCTGCT--AC GGTCAC??GG TCACACT?C? CAGC???ßTG 3600 CA??C?TCCO OTAOTAATAA CAACACTGAA GATAGC?GTs ACAATAATOC COGCTTA?CT 3660 ?TCG?TGC?? ??AATOT?AC AOTAAACAAC AATATT?CTT CTC?CAAAGC ACTßAGCATC 3720 TCTGCG?CAA C-TGGAGAAAT TACCACTAAA ACAGGT?CAA CCATTAACGC A?CC?CTGGT 3780 A?CGTOGAG? T??CCGCTCA AACAGOTAGT ATCCTAGGTs G?ATTGAGTC C?OCTCTOGC 3840 TCTGT??CAC TTACTGCAAC CGAOGOCGCT CTTOCTQTAA GCA?T?TTTC CGGC??C?CC 3 00 GTT?CTsTT? CTGC??ATAG CGGTGCATTA ACCACTTTOQ CAQOCTCTAC ??TT???ßG? 3960 ACCG?G?GTs T?ACCACTTC AAOTCAATCA OGCGATATCO OCOGTACG?T TTCTOßTßGC 40 0 ACAGTAG?GG TTA?AGCAAC CGAAAGTTTA ACCACTCAAT CCAATTC?? AATT???ßC? 4080 ?C??C?OGCQ ?GGCT?ACCT AACAAsT -A AC?OGT?C?A TTGGTQGTAC GATTTCCOGT 4140 A?T?COGT?? ?TGTT?CßGC A??CGCTGGC GATTTA?C?G TTGGGA?Tßß CsC?G???TT 4200 A?TGCG?CAQ AAOGAGCTCC A?CCTTAACT AC?TCATCGG QCAAATTAAC TACCOAAOCT 4260 AGTTC?C?C? TT?CTTC?OC C?AGGOTCAG OT?AATCTTT CAGCTC?OGA TGGT?GCGTT 4320 ßCAOG??ßT? TT??TßCCGC CAATsTG?CA CTAAAT?CT? CAOOCACTTT ??CT?CCGTQ 4380 ??GQGTTC?? ?CATT??TOC AACCAQCGsT ACCTTOGTT? TT??CGCAAA AG?CaCTG?Q 4440 CT???TGGCs C?OC?TTOOs TAACC?CACA OTOGTAAATs C?ACCA?CGC A??TGOCTCC 4soo GßC?ßCßT?? TCGCGAC?AC CTCAAOC?GA GTQA?C?TC? CTOGGGATTT A?TC?CA?T? 4S60 AATGß?TT?? ?T?TC?TTTC ?AAAAACOGT AT?AACACCG TACTGTT??? AOOCGTTA?A 4620 ATTGATGTQA AATACATTCA ACCGGGTAT? GCAAGCGTAG ATG?AGT?AT TGA?GCaA?? 4680 CaCATCCTTO ?G??OGT?AA AGATTT?TCT sATGAAG?AA aAOAAOCGTT AOCTA??CTT 4740 GOCsT?AaTQ CTOTACsTTT TATTGAaCCA AATAATACAA TTAC?GTCG? T?C?CA?AAT 4800 G??TTTOCAA CCAG?CCATT AAOTCGAATA sTOAnTCTG AAGGCAGGGC GTGTTTCTC? 4860 ??CAGTOATO GCOCGACGGT ßTQCsTT?AT ATCGCTQ?T? ?COQOCOGT? OCßsTC?OT? 4920 ?TTß?C??ßß TAOATTTCAT CCTOCA?TG? AOTC?TTTTA TTTTCTT?TT ?TTT?CTOTß 4 80 TOßßTT???ß TTCAOT?COG GCTTTACCCA TCTTGTA?AA ??TT?CGG?G AATACAAT?? 5040 ?ßT?TTTTT? ?CAGsTTATT ?TT?TGAAAA ?T?TAAAAAß CAG?TT???? CTC?GTOC?? 5100 TATCAGT?TT OCTTGGCCTQ OK-TTCTTCAT CATTaTATGC A---?AQ??ßCO TTTTT?OTA? S160 ??ßßCTTTC? ßTT?TCTßGT ßC?CTTO?AA CTTT??sTO? ?Q?CßCCC?? CTßTCTßTAO 5220 CAAATCTTT ?TCT?AAT?C CAAOGCTCOC AAACTTTA?C ??ACCTAA?A AC?OC?CAOC 5280 TTGA?TT?C? ßGCTOTOCTA GATA?a?TTG AGCC??ATAA GTTTG?TQTs AT?TTGCC?C 5340 ??CAA?CC?T T?COGATOOC AATATT?TOT TTGAGCTAGT CTCGAAATCA GCCOCAO?AA 5400 GCCAAGTTTT TTAT??GOCO ?OCCAGGGTT ?TAGTQAAGA ?AATATCOCT COTAGCCTOC 5460 CATCTTTGA? ACAAGGAAAA OTOTATOAAG ATGCTCOTCA aTOOTTCOAT TTOCOTOAAT 5520 TCA?T?TOGC AAAAGAA?AT CCACTTAAAG TCACTCOCOT OCATTACG?s TTAAACCCTA 5S80 AAAAC????C CTCTGATTTO OTAOTTOCAG ßTTTTTCGCC TTTTGGCAAA ACGO--T?GCT 5640 TTsTTTCCTA TGATAATTTC GGCsCAAGGG A-3TTTAACTA TCAACGTGTA AOTCTAGGTT 5700 TTGT?A?TGC CAATTTa?CC sGACATGATG ATsT?TTAAA TCTA?ACOCA TTG?CCAATG 5760 TA?AAOCACC ATCA??ATCT T?TaCOGTAG GCATAGOATA TACTT?TCCC TTTT?TG?T? 5820 A?C?CC??TC CTT??GTCTT TA ACCAGCA TGAOTTATOC TGATTCTAAT GAT?TCG?CO 5880 GCTT?CC?AG TGCGATTAAT COTAAATTAT CAAAAOGTCA ATCTATCTCT GCOAATCTGA 5940 ??TOGAOTTA TTATCTCCCG ACATTTAACC TTOGAATGß? ?G?CC?GTTT AAA?TT? TT 6000 TAGGCTACAA CTACCGCCAT ATTAATCAAA CATCCOAOTT ?AACACCCTO GGTGCAACGA 6060 ?O??????TT TGCAGTATC? OOCOTAAOTO C?OOCATTQ? TOGACAT?TC C?ATTT?CCC 6120 CTAA?AC??T CTTT??T?TT GATTTAACTC ?TC?TTATTA CGCO?GTAAA TT?CC?OOCT 6180 CTTTTOßAAT 6GAGC0CATT sGCOAAAC?T TT??TCOCAQ CT?TC?C?TT ?--K-A--?0CC? 6240 sTTTAßOGTT OAOTCAAGAß TTTGCTCAAG GTTOsCATTT T?OC?GTC?? TT?TCGOGTC 6300 ?GTTT?CTCT ?C?AGATATA AOTAOCATAO ATTTATTCTC TOT??CAGGT ACTT?TGGCG 6360 TC?G?GOCTT T??AT?COGC ßOTQCA?--TO aTG?OCOCGO TCTTGT?TGO COTAATOAAT 64 0 T??ßT?TßCC A??AT?C?CC O-K-TTTC?AA TCAOCCCTTA TOCGTTTT?T G?TOC?ßOTC 6480 ?ßTTCCGTTA TAATAGCaAA AATGCTAAAA CTTACaOCGA AOATATOCAC ?CGGT?TCCT 6540 CTQCOGGTTT ?OOCATT??? ?CCTCTCCTA CAC?A??CTT ??sCTT?G?T GCTTTTOTTG 6600 CTCOTCGCTT TTCAA?TOCC ?ATAßTG?CA ATTTG??TGG CAACAAAAAA COCACAAGCT 6660 C?CCT?C??C CTTCTOOGGT AGATTAACAT TCAGTTTCT? ?CCCTGA?AT TT??TC??CT 6720 ost??ßcatt ccsccT?CC? atttAT??c-t ATATGCTTTA cccocc??rr TACAOTCTAT 67ßo ACGCAACCCT GTTTTCATCC TTATATATCA AACAAACTAA GCAAACC??ß C???CC??flC 6840 ???CC??OC? A?CCAAGCAA ACCA?GCAAA CCAAGCA?AC C? ßCAAACC A?GC??ACC? 6 00 AGCAAACC?A GC???CC?Aß CAAACCAAOC AA?CC?AGCA ATOCT????A AC??TTT?T? 6960 TG?T???CT? A??C?T?CTC C?TACC?TGß CAATACAAGO OATTTAATAA T?Tß?C???? 7020 ß????TTT?C AAAOTGTTCC ACAAAATACO ACCGCTTC?C TTOTAGAATC A??C??CO?C 7080 C?AACTTCCC TGCAAAT?CT TAAACAACCA CCCA??CCC? ?CCT?TT?CO CCTOG??C?? 7140 C?TQTCßCC? ??AAAaATTA TGAGCTTOCT TOCCGCOAAT TA TßOCGAT TTTOß??A?? 7200 ?TGO?CQCT? ?TTTTGG?GG CsTTCACOAT A?TGAATTTß ACGCACCTOC TCAßCTOßCA 7260 T?TCT?CCCG ?AAAACT?CT ?ATTCATTTT OCCACTCOTC TCßCTA?TGC ??TT?C??C? 7320 CTCTTTTCCs ?CCCCO?ATT 0aCAATTTCC GAAGAAGOGO C?TTAAAO?T G?TT?GCCTO 7380 C??COCTOGT T0AC6CTGAT TTTTGCCTCT TCCCCCTACG TT??CGCAG? CC?T?TTCTC 7440 AATAAATATA AT?TC??CCC AGATTCCGAA sGTOOCTTTC ATTT?GCAAC AG?C ?CTCT 7S00 TCT?TTGCT? ?ATTCTOTAT TTTTTACTTA CCCGAATCCA ATOTCAATAT GAOTTTAa?T 7560 sCsTT?TGGG CAOGOAATCA ACAACTTTGT GCTTCATTsT sTTTTGCsTT GCAsTCTTCA 7620 cßrpT?TTG ot?ctacATC TGC ?TGCAT AAA?G?scas TOGTTTTACA Gtsotttcct 7ßßo AAAAAACTCG CCG?A?TTGC TAATTTAGAT GAATTßCCTO CAAATATCCT TC?Tß?TGT? 7740 T?T?TGC?CT GC?--rTT?TGA TTTAGCAAAA AAC?AGCACG ATCTTAAOCß TCC?TTAA?C 7800 GAACTTOTCC GC?AGC?TAT CCTCACGCAA GGATGGCAAß ?CCGCT?CCT TTAC?CCTTA 7860 GGTAAAAAGG ACGGCAAACC TaTOATßATG C-TACTOCTTO AACATTTTAA TTCOsOAC?T 7920 TCG?TTT?TC GCACGCATTC AACTTCAATG ATTOCTOCTC OA--AAAAATT CTATTTAOTC 7980 OGCTTAOGCC ?TO?OGOCsT TGATAACATA OsTCaAOAAs TGTTTOACsA sTTCTTTGA? 8040 ?TCAGTAGCA AT??T?T?AT OGAGAOACTG TTTTTTATCC sTAAACAGTG CGA??CTTTC 8100 C??CCCOC?ß TGTTCTATAT GCCAAGCATT OaCATGGAT? TT?CCACßAT TTTTßTC-AßC 8160 AAC?CTCßGC TTGCCCCTAT TC?AGCTsTA OCCTTOGGTC ATCCTOCCAC TAOOC?TTCT 8220 G??TTT?TTG ?rr?TßTCAT CsTAaAAaAT OATTATOTOG sC?GTGAAOA TrotTTT?-3C 8 80 G???CCCTTT T?CGCTT?CC CAAAOATGCC CTACCTTATO TACCATCTOC ACTCOCCCC? 8340 C??AA?GTGG ?TT?TOT?CT CAGGGAAAAC CCTOAAGTAG TC?ATATCGO TATTOCCOCT 8400 ?CC C??TG? ??TT???CCC TOAATTTTTQ CTA?CATTGC AAa???TC?G ?OATAAAOCT 8460 AAAGTCAAAA TACATTTTCA TTTCGCACTT OGACAATC?A C?GOCTTQAC ?C?CCCTT?T 8520 QTC???TOOT TT?TCGAAAQ CTATTTAGsT GACGATOCCA CTOCACATCC CC?OQC?CCT 8580 TATC?CG?Tr ?TCTQGC??T ?TTacsTGAT TQCOATATGC TACTA?ATCC QTTTCCTTTC 8640 QGT??T?CT? ?COGC?T??T TG?T?TOGTT ?CATT?OOTT T?OTTOGTGT ?TsC????CO 8700 GGGG?TG??ß T?C?TGAAC? TATTGATGAA OGTCTsTTT? ??CGCTT?Oa ?CT?CC?ß?? 8760 TGßCTG?TAß CCGAC?C?CG AGAAACATAT ATTOAATOTO CrTTOCGTCT AßC?G????C 8820 CATC??QAAC GCCTTOAACT CCaTCOTTAC ATCATAGAAA ACAACGOCTT AC?AAAQCTT 8880 TTT?C?OGCG ?CCCTCQTCC ?TTGOGCAAA ATACTOCTTA ?OAAAACAAA TC-AATOGAAS 8940 CGGA?ßCACT TGAGTA??AA AT??CGGTTT TTTA??GT?? A?ßTßCOGTT ??TTTTC??? 9000 OCGTTTT??? ??CCTCTCAA ?A?TC??CCO C?CTTTTATC TTT?T??COC TCCCOCOCOC 9060 T--ACAOTTTA TCTCTTTCTT ??AATACCCA TAAA?TTGTß OCA?T?OTTG GQTA?TC??? 9120 TTC?TTGTT GAT?COßCAA ACTAAAGACO OCOCaTTCTT COOCAOTCAT C 9171 (2) INFORMATION FOR SEQ ID NO: 6: (i) SEQUENCE CHAR?CTERISTICS : (A) LENGTH: 9323 baße pairs (B) TYPE i nucleic acid (C) STRANDEDNESS : single <D) TOPOI-OOY : linear (11) MOLSCULE TYPE: DNA (genomic) (xi) SEQUENCE DESCRIPTION: SEQ ID NO:6¡ CGCC?CTTCA ?TTTTGaATT sTTGAAATTC AACTAACCAA AAAGTOCGsT TAA??TCTGT 60 GG?G????T? OGTrCTAsTO AAOAACGAGs TAATTGTTCA AAAsßATAAA GCTCTCTTAA 120 TTG6GCATT6 GTTGGCGTTT CTTTTTCGGT T??TAGTAAA TTATATTCTa GACG?CTATO 180 C? TCC?CCA ACAACTTTAC COTTOCTT-T AAOCGTTAAT GTAAGTTCTT OCTCTTCTTO 240 GCGA?T?CGT ??TCCCATTT TTTQTTT?GC AAGAA?ATGA TCOGG?TAAT CAT??TAOGT 300 CrrsCCC??? ??TAAATTTT OATsTTCTAA AATCATAAAT TTTGCAAC-AT ATTGTOGC?A 360 TTCA?T?CCT ATTTGTGGCG AAATCGCCAA TTTTAATTCA ATTTCTTßTA sCAT?AT?TT 420 TCCCACTCAA ?TCAACTCGT TAAAT ATACA AGATAATAAA AATAAATCAA aATTTTTOTs 480 ATG?CAAACA ?CAATTACAA CACCTTTTTT GCAGTCTAT? TsCAAAT?TT TTA??? AAT 540 AOT?TA??TC COCCATATAA AATOGTATAA TCTTTCATCT TTCATCTTTC ?TCTTTCATC 600 TTTC?TCTTT C?TCTTTCAT CTTTCATCTT TCATCTTTCA TCTTTCATCT TTCATCTITC 660 ?TCTTTC?TC TTTCATCTTT CAC?TGAAAT G?Tß?ACCG? GGG??GGGAG OGAOOGOCAA 720 GAATG??GAO OGAGCTGAAC GAACGCAAAT GATAAAGTAA TTT??TTCTT CA?CTA?CCT 780 TAGO?G?A?A T?TGAACAAG ATATATCOTC TCAAATTCAG C??ACGCCTO AATOCTTTOO 840 TTßCTOTOTC TQAATTGOCA CGGGGTTGTG ACC?TTCC?C AG?AA?AOQC AGCOAAAA?C 900 CTOCTCßC?T Q???sTOCOT CACTGAGCCT TAAAOCC?CT TTCCOCTATß TT?CTATCTT 960 TA06T0TAAC ATCTATTCCA CAATCTOTTT TAGCAAGCGa CA?TTT??C? TCG?CC???? 1020 TGAAATOßTß CAOTTTTTAC AAGAAA?C?? GTAAT????C CATTATCCGC AACAGTOTTO 1080 ?CßCT?TC?T T??TTOGAA? C?ATTTA?CA TCGACCAAAA TGAAATßßTß CAGTTTTTAC 1140 ??GAAAAC?? CA?CTCCOCC GT?TTC??CC GTGTT?CATC TAACCAAATC TCCCA?TT?? 1200 AAGOGATT-T AC?TTCTAAC OGACAAOTCT TTTTA?TCAA CCCAAATOGT ATCACAATAO 1260 OT?AAG?COC A?TTATTAAC ACTAATOOCT TTACGGCTTC TACGCTAGAC ATTTCTA?Cs 1320 ????CATCA? OGCOCßTAAT T CACCTTCG AGC???CCAA AOATAAAGCG CTCGCTQ??? 1380 TTQT--AAT--A CQGTTGAATT ACTßTCQGT? ?A---ACGOCAO TQT???TCTT ?TTOQTGaC? 1440 AAGTGAAAAA OßAGßßTßTQ ?TT?GCOT?? ?TOßTQßCAß C-ATTTCTTTA CTX-ßK-?GOGC 1500 AAAAAATCAC C?TC ßCO?T AT??TAAACC C?ACCATTAC TTACAGC?TT ßCCOCOCCTQ 1560 A???TO??ßC ßßTCAATCTO OGCGATATTT TTsCCAAAGG CGGT??CATT A?TGTCCQTß 1620 CTßCCACTAT TCGAAACCAA OGTAAACTTT CTOCTO?TTC TOT?AOCA?? G?T?? ?ßCO 1680 ßC??T?TTOT TCTTTCCGCC A?Aß?OGGTs AAGCOG? ?T TGGCOGTGT? ATTTCCGCTC 1740 AAAATC?GC? AGCTAAAOGC ßGC?AGCTGA TOATAAAGTC CGATAAAGTC ACATTAAAAA 1800 C?ßßTßC?ßT T?TCQ?CCTT TC?GGT???O ??GGGGG?GA A?CTT?CCTT OOCOOTOACO 1860 AQCGCGGCGA AGGT?A?AAC OGCATTC??T TAGCAAAO?? AACCTCTTTA G???AAGGCT 1920 C? CCATCAA TOTATCAGGC AAAGAAAAAG GCGGACOCGC T?TTOTGTGa OGCGATATTO 1980 cstr??ttoA cosc?AT?TT ?ACGcrcA?a GTAstoataA TATC?ct??? ACCOOTOOTT 2040 TTGTGGAGAC ATCOGOGCAT TATTTATCCA TTOACACCAA TGCAATTCTT AAAACAAAAG 2100 ?GTGGTTsCT ?O?CCCTOAT OATGTA?C?A TTOAAGCCGA AGACCCCCTT OGCAATAATA 2160 CCOGTAT?AA TGATGAATTC CCAACAOGCA CCssTGAAGC AAOCOACCCT AAAAAA?AT? 2220 sCG??CTC?? ?ACAACGCTA ?CCAAT?C?A CTATTTCAAA TTATCTGAAA A?CGCCTOG? 2280 C?ATG??T?T AACGOCATCA AGAA?ACTTA CCOTTA?T?O CTCAATC??C ATCGs??GC? 2340 ?CTCCCACTT ??TTCTCCAT AQTAAAOOTC AGCGTOGCOG AOOCOTTCAO ATTGATGa?a 2400 AT?TT?CTTC T???OGCOaA AATTTAACCA TTTATTCTOs CGOATOOOTT GATsTTCAT? 2460 AAAATATT?C ßCTTG?TCAs sGTTTTTTAA ATATTACCOC COCTTCCOTA sCTTTTGAAa 2520 GTOGA??TAA CAAAßCACGC ßACGCGGCAA ATGCTAAAAT TOTCOCCCAa OGCACTGTAA 2580 CCATT?C?GO AG?ßßG?AA? GATTTC?Osa CTAAC?ACGT ATCTTTA??C sGA?COGGT? 2640 ?AOGTCTG?A TATC?T-TCA TC?ßTG?ATA ATTTAACCCA C?ATCTTAßT GOC?C??TT? 2700 ?C?T?TCTGG GAAT?TAACA ATT??CCAAA CTACG?G?? G?ACACCTCG T?TTGOCAAA 2760 CCAGCCATGA TTCOCACTOG AACOTCAOTO CTCTT??TCT ?G?G?CAGGC sC?A?TTTT? 2620 CCTTT?TT?? ATACATTTC? ?GCAATAOCA AAOGCTTAAC AAC?C?GT?T ?G??GCTCTG 2880 CAGßOOTOAA TTTT??CsOC GTAAATOGCA AC?TGTC?TT CA?TCTC?AA G??GGAGCOA 2940 ??GTT??TTT C??ATT?AAA CCA?ACsAGA ACATOA?CAC ??OCA??CCT TT?CC? TTC 3000 GßTTTTT?ßC C?ATATCACA ßCCACTOOTO OOGOCTCTßT TTTTTTTGAT AT?T?TGCC? 3060 ?CCATTCTGO CAGAOGOGCT G?GTTAAAAA TaAGTOAAAT TAATATCTCT ?ACGGCQCTA 3120 ATTTT?CCTT ??ATTCCCAT CrTTCaCGOCO ATGACOCTTT TAA?ATC??C AAAO?CTT?? 3180 CC?T???TGC A?CCAATTCA ?ATTTCAGCC TCAOACAGAC GAAAO?TOAT TTTTATG?OO 3240 ssTACOCACG CAATOCCATC AATGCAACCT ACAACATATC CATTCTsGGC GOT?ATGTCA 3300 cccrrootss ?C AAAcrcA AOCAOCAOCA TTACOGOGAA TATTACTATC GAaAA oc?s 3360 CAAATOTTAC OCT?O?AGCC A?TAACOCCC CTAATCAGCA AAACAT?AOO GATAG?GTT? 3420 T?AAACTTOG CAGCTTOCTC GTGAATOOGA GTTTAAsTTT A?CTaOCGAA ??TGCAG?T? 3480 TT???GGC?? TCTCACTATT TC?GAAAGCO CX-ACTTTTAA ?OaA??GACT AO?ß?T?CCC 3540 T???T?TCAC COsCAATTTT ACCAATAATO OCACGGCOGA A?TTAATATA AC?CA?ßOAG 3600 TOGT????CT TGGCAATsTT ACCAATGATO GTGATTTAAA CATTACCACT CACGCTAAAC 3660 aCAACCAAAG A?ßCATCATC ßGCGGAOATA TAATCAACAA A?AAGGAAGC TTAAATATTA 3720 CAGAC?sT?A T??TG?TßCT ß???TCC??? TTGOCGOCAA TATCTCOC? A??O??GOC? 3780 ?CCTCACG?T TTCTTCCOAT A??ATTAATA TCACCAAACA ßATAACAATC ?AA?AOGOT? 3840 TTOATßGAGA GßACTCT?sT TC?GATsCGA CA?GT??TOC C?ACCTAACT ?TT????CC? 3900 ??G??TTGAA ATTG?CAGAA GACCT??GT? TTTCAGGTTT CAATA?AGC? GAGATTAC?G 3 60 CC???G?TGO TAGAGATTTA ACTATTOQCA ACAOTAATGA CGOTAACAGC GGTsCCQAAs 4020 CCA??ACAOT AACTTTTAAC AATGTTAAAs ATTCAAAAAT CTCTGCTOAC sOTCAC??TG 4080 TGACACT??A TAGCAAAsTs AAAACATCTA sCAGCAATGG COGACOTOAA AsCAATAOCG 140 ?CAACGATAC CGGCTTAACT ATTACTGCAA AAAATsTAGA AGTAAACAAA GATATTACTT 4200 CTCTC??AAC AOTAAATATC ACCGCGTCGG AAAAGGTTAC CACCACAGCA GaCTCGACCA 4260 TT??CGCAAC AAATGOCAAA OCAAGTATTA C?ACCAAAAC ?GsTGATATC AßCGGTACGA 4320 TTTCCOGTAA CACGGTAAOT sTTAGCGCGA CTOGTGATTT AACC?CTAAA TCCGOCTCAA 4380 AAATTQAAGC GAAATCGGGT QAOOCTAATG TAACAAOTßC AAC?OGTACA ATTGGCGGTA 4440 C?A7TTCCs? T?ATACOCTA AATGTTACGG CAAACsCTQG CGATTTAAC? QTTGOGA?Ts 4500 GCGC?O??AT TAATOCOACA GAAOGAGCTa CAACCTTA?C COCAACAOOG ?ATACCTTGA 4560 CTACTGAAGC COGTTCTAGC ATCACTTCAA CTAAGGsTCA GOTAGACCTC TTOGCTCAGA 4620 ?TOGT?GCAT CßC?GGA?OC ATTA?TOCTG CTAATOTOAC ?TT??AT?CT AC?GGC?CCT 4680 T?ACCACCGT GGCAGGCTCa QATATTAAAG CAACCAOCGG C?CCTTGGTT ATT??CGC?? 4740 AAOATGCT?A GCTAAATGGT GATGCATCAG OTG?T?GT?C AO??GTß??T GC?GTC??CG 4800 ?CTGGGGATT TßßTAaTOTO ACTOCGGCAA CCTCAAOCAG TsTG??T?TC ?CTGGGG?TT 4860 TAAAC?C?QT AA?TGOGTTA AATATCATTT Ca?AAGATOQ T?--_???C?CT GTßCGCTTAA 4920 GAGGCAAGGA A?TTß?GGTG A?ATATATCC AGCC?GGTOT AGC??ßTGT? OAAGAAOTAA 4980 TTG?AGCGAA ?CßCGTCCTT GAAA?A-TAA AAOATTTATC TGATGAAGAA AOAG?AAC?T 5040 TAOCT??ACT TOGTsT??OT sCTßT?CGTT TTGTTO?GCC A??TAAT?C? ATT?C?GTCA 5100 ATAC?CAAAA TGAATTTACA ACCAC-ACCGT CAAOTCAAGT G?T??TTTCT G?AOGT??Oß S16 CGTGTTTCTC A?GTsGT??T OGCOC?CaAa TATOTACC?? TsTTOCTO?C G?TOG?CAGC 5220 CGT?GTC?QT AATTG?C??a sTAGATTTCA TCCTGCAATO ??OTCATTTT ?TTTTCGT?T 5 80 T?TTT?CTsT GTOaaTTAAA C?TCAOTACG OsCTTTACCC ?TCTTOT?AA ??ATTACTG? S340 GAATACAATA AAGTATTTTT AACAGOTTAT TATTATOAAA AATATAA?AA GCAGATTA?? 5 00 ACTC?OTGCA ATATCAGTAT TGCTTGGCCT OGCTTCTTCA TC?TTßT?TG CAG??GA?GC 5460 GTTTTTAsTA AA?QQCTTTC ?sTT?TCTOs TOCACTTGAA ACTTTA?QTG ?AG?COCCC? 5520 ?CTGTCTOTA OCAAAATCTT TATCTAAATA CCAAGGCTCß C???CTTT?? C???CCT??? S580 A?CAOCAC?ß CTTGAATTAC AGGCTGTsCT AG?TA?a?TT G?GCC???T? ??TTTG?TGT 5640 G?T?TTOCCa CA?C??ACCA TT?COGATso CAATATC?TQ TTTGAQCTAG TCTCGA ATC 5700 ?GCCGC?G?? ?GCC??GTTT TTT?T??GGC G-AOCCAGGGT TAT?GTO??ß ????T?TCOC 5760 TCOT?OCCTs CC?TCTTTG? ??CA?aGAAA ?QTQTATGAA GATOOTCOTC ?OTOßTTOO? 5820 TTTGCGTßAA TTT??T?TGG CAAAAaAA?A CCCOCTTAAG GTr?CCOGTQ T?C?TT?CG? 5880 ?CTAAACCCT AAAAACAAAA CCTCT??TTT GATAATTOCO GGCTTCTCGC CTTTTGOTAA 5940 AACOCßT?ßC TTT?TTTCTT ?Tß?T??TTT CGQCOCGAGA GA-JTTTA?CT ?CC??CßTßT 6000 ??GCTTßGGT TTTGTTAATO CCAATTT?AC TOOTCATOAT GATGTGTT?? TT?T?CC?GT 6060 ?TG?GTTATs CTQATTCTAA TGATATCGAC GGCTTACCAA sTGCGATT?? TCsT?AATTA 6120 TC?AAAQGTC AATCTATCTC TGCGAATCTG AAATOGAaTT ATT?TCTCCC ?ACATTT??C 6180 CTTßßC?Tßß ??O?CCAATT TAAAATTAAT TTAGGCTACA ACTACCGCCA TATTA?TC?A 6240 ACCTCCGCGT T??ATCsCTT OssTGAAACO AAGAAAAAAT TTsCAGTATC AGGCGT??GT 6 00 GC?GGC?TTG ATGGACATAT CCAATTTACC CCTAAAACAA TCTTTAATAT TGATTTA?CT 6360 C?TC?TT?TT ?CGCGAGTAA ATTACCAGGC TCTTTTGGAA TOGAOOOCAT TOsCGA?AC-A 64 0 TTTA?TCGCA ßCTATCACAT TAOCACAOCC AGTTTAsssT TGAsTCA?G? sTTTOCTC?? 6480 GOTTOGCATT TTAGCAGTCA ATTATCAOOT CAATTTACTC TACA?GATAT T?GC?GT?T? 6540 G?TTT?TTCT CTGT?ACAGG TACTTATGGC GTCAGAOGCT TTAAATACOs COQTQC??ßT 6600 GGTGAOCGCO ßTCTTGTATG GCaTAATGAA TTAAGTATGC CAAA?T?C?C CCOCTTCCAA 6660 ?TCAOCCCTT ?TßCsTTTT? TaATOCAOsT CAOTTCCßTr ATAAT?OCß? A?ATGCT??? 6720 ACTT?COGCG ??ß?T?TGC? CACOGTATCC TCTssGGGTT TAGGCATTA? ??CCTCTCCT 6780 ?CACAAAACT T??ßCCT?OA TGCTTTTsTT OCTCOTCGCT TTGCA?ATOC C??TAGTG?C 6840 ??TTTß??TG ßC??C??AAA ACGCACAAGC TCACCTACAA CCTTCTGGGG GAG?TT??C? 6900 TTC?ßTTTCT AACCCTG? A TTTAATCAAC TsGTAAGCGT TCCGCCTACC ?sTTTAT??C 6960 T?T?TOCTTT ?CCCGCCAAT TTACAGTCTA TAGGCAACCC TQTTTTT?CC CTT?T?T?TC 7020 ???TAAACAA OCTA?ßCTO? ßCTAAOCAAA CCAAGCAAAC TCA?OC??OC C??ßTAAT?C 7080 T???????C? ATTT?T?TGA TAAACTAAAG TATACTCCAT GCC?TßQCQ? T?C??OOG?T 7140 TTA?TA?T?T G?CAAAAGAA AATTTOCAAA ACOCTCCTCA ?Q?TOCO?CC OCTTT?CTTG 7200 COGAATT??G C??C?ATCAA ACTCCCCTOC GAATATTTA? AC?ACCACOC ?AOCCC?OCC 7260 T?TT?CßCTT QGAACAACAT ATCGCAAAAA AAGATTATGA ßTTTOCTTGT CGTß?ATT?? 7320 TGOTO?TTCT OG?AAAAATO OACOCTAATT TTGGAGOCsT TCACGATATT CAATTTGACs 7 B0 C?CCCGCTC? OCTOGCATAT CTACCCGAAA AATTACTA?T TT?TTTTaCC ACTCßTCTCO 7440 CTA?TOC??T T?CAAC?CTC TTTTCCs?CC CCOAATTOGC ??TTTCTG?? G??OOOGCßT 7500 T???OATGAT TAGCCTOCAA COCTOOTTaA COCtGATTTT TßCCTCTTCC CCCTACßTT? 7560 ?COCAGACCA T?TTCTC??T A?ATATAATA TCAACCC?GA TTCCQ??OGT QOCTTTC?TT 7620 TAOC??C?G? CA?CTCTTCT ATTQCTAAAT TCTGTATTTT TTACTT?CCC OAATCC?ATO 76ßO TC??T?Tß?ß TTT?GATaCO TTATOGOCAO OGAATCAACA ?CTTTGTQCT TC?TTOTßTT 7740 TTßCOTTßC? ßTCTTC?COT TTTATTOGTA CCGCATCTOC sTTTCATAAA ?GAGCGßTGO 7800 TTTTAC?GTs ßTTTCCT?AA AAACTCOCCs ?AATTQCTAA TTTAa?TGAA TTOCCTßC?? 7860 AT?TCCTTC? TGATGTATAT ATGCACTOCA sTTATGATTT AOCAA? ?AC AAßC?CQ?TG 7920 TTAAGCßTCC ATTAAACGAA C-TTGTCCOCA AOCATATCCT CACGCAAGß? TOOC??O?CC 7980 TCT?CCTTT? C?CCTTAQsT ?AAAAGGACs sCAAACCTGT GATO?TGsT? CTßCTTQ??C 8040 ?TTTT??TTC sGG?CATTCG ?TTTATCsTA CACATTCA?C TTCAATQATT sCTGCTCO?Q 8100 A?AAATTCTA TTT?sTCQGC TTAOOCCATa AGGOCOTTGA TAAA?TAOGT COAGAAGTOT 8160 TTßACOAOTT CTTTG?AATC ?GTAaCAATA ATATAATGGA GAGACTGTTT TTTATCCsTA 8220 AACAOTßcßA ??crrrcc?? cccs--?stst TCT?T?Tßcc ?AßcATTßsc ATGGATATTA ß?ßo CCACGATTTT TsTGAGCAAC ACTCGGCTTG CCCCTATTCA AGCTGTAGCC CTOGGTCATC 83 0 CTßCC?CT?C ßCATTCTQA? TTT?TTG?TT ATßTC?TCßT ?G??ß?TQAT T?TGTOOOCA 8400 GTGAAß?TTG TTTCAOCGAA ACCCTTTTAC GCTTACCCAA ?O?TsCCCT? CCTT?TGT?C 8460 CTTCTOCACT COCCCCACAA AAAOTGOATT ATGT?CTC?O GGA???CCCT G??GTAßTCA 8520 ?T?TCGßT?T TGCCOCTACC ACAATGAAAT TA?ACCCTGA ?TTTTTGCT? ?CATTOC??G 8580 ?AATCAßAGA TA?AGCTAAA OTCAAAATAC ATTTTC?TTT COCACTTOG? CA?TC??C?G 8640 GCTTG?C?CA CCCTTATCTC AAATOsrrTA TCGAAAGCT? TTTAGGTQAC G-ATGCC?CTG 8700 C?C?TCCCC? CGCACCTTAT CACGATTATC TGGC?AT?TT ßCßTß?TTTC O?T?TGCT?C 8760 T???TCCßTT TCCTTTCßGT AATACTAACO GCATAATTG? TATOOTT?C? TT?OOTTT?ß 8820 TTGGTßT?TO C????COGGO OATOAAOTAC ATGAAC?TAT TG?TGAAGGT CTGTTT???C 8880 GCTTAGG?CT ?CCAGAATGG CTOATAGCCG AC?C?CO?GA AACATATATT GA?TGTOCTT 8940 TGCGTCTAOC ?ß??AACCAT CAAGAACOCC TTGAACTCCa TCGTTACATC ?T?O????C? 9000 ?CßßCTT?C? ???GCTTTTT ACAOGCGACC CTCOTCCATT OGGCAAAAT? CTGCTT??O? 9060 AAACAAATGA ?TQGA?GCGG AAOCACTTGA GT??????T? ?CßQTTTTTT AAAßT????G 9120 TßCßGTT??T TTTCAAAGCO TTTTAAAAAC CTCTC?AAAA TCA?CCOC?C TTTT?TCTTT 9180 ATA?CG?TCC OßCACQCTGA CAsTTTATCA OCCTCCCGCC ?T????CTCC GCCTTTC?TG 9240 ßCGGAGATTT T?ßCC?AAAC TGOCAOAAAT TAAAGGCT?? A?TC?CC??? TTOCACCACA 9300 AAATCACCAA TACCC?CAAA AAA 9 3 (2) INFORMATION FOR SEQ ID NO : 7 : (i) SEQUENCE CHARACTERISTICS : (?) LENGTH : 4794 base pairs (B) TYPB: nucleic acid (C) STRANDEDNESS : single (D) TOPOLOßY: linear (Xi) SEQUKNCE DSSCRXPTION: SEQ ID NO: 7 : ATGAAC?AG? T?T?TCQTCT C???TTC?OC ???COCCTG? ?TOCTTTOßT TßCTßTOTCT 60 G??TTß?C?C GßGGTTßTQA CC?TTCCACA G?????OOC? GTO?????CC TGTTCOT?CO 120 ?AAOT?CßCC ?CTTOßCG?T AAAßCCACTT TCCßCTAT?T TOCT?TCTTT ßGGC?TOOC? 180 TCC?TTCCOC ??TCTQTTTT ?GCO?OCOGT TTACAOGGA? TO?OCßTCOT ?C?COGT?CA 240 GC??CC?TGC ??GT?ß?Css CAATAAAACC ACT?TCCQT? ?T?OCßTCAA TGCT?TC?TC 300 ?ATTGGAA?C A?TTT??CAT TGACCAAAAT GAAATGGTOC ?GTTTTT?CA AG?AAGC?ßC 360 A?CTCTGCCO TTTTC??CCG TGTTAC?TCr OACCAAATCT CCCAATTAAA AGGGATTTT? 420 GATTCTAACß GACAAGTCTT TTTAATCAAC CCAAATGGTA TCACAATAGG TAAAG?CGC? 480 ?TT?TT?AC? CT?ATGGCTT T?CTGCTTCT ?CGCT?OACA TTTCT?ACGA AAACATC??C 540 GCGCGT??TT TCACCCTTG? ßCA ACCAAß GAT?AAGCAC TCGCTGAAAT CGTGA?TC?C 600 GGTTT?ATTA CCOTTOOTAA ?GACGGT?sC OTA?ACCTT? TTGsTGGCAA ?GTGAAA??C 660 OAßßßCßTß? TTAGCGT?? TGGCGGTAGT ATTTCTTTAC TTOCAOGGCA A?AA?TC?CC 720 ?TC?GCß?T? TAATA?ATCC AACCATCACT TACAGCATTG CTOCACCTOA ??ACGAAOCG 780 ?TC??TCTOO GCGATATTTT TsCCAAAGGT OGTAACATTA ATOTCCGCGC TQCCACTATT 840 CGC?ATAAAO GT???CTTTC TGCCGACTCT sTAAOCAAAO ?TAAAAGTGs TAACATTOTT 900 CTCTCTßCCA ??O?AGGTO? ?GCOaAAATT GGCGGTOTA? TTTCCsCTC? ???TC?GC?? 960 sCC??AaßTO OT??ßTTO?T GATT?C?GGC G?T?AAGTTA CATTGAAAAC ßßOTOCAOTT 1020 ?TCQ?CCTTT CGOGT???G? ?OOGOGAGAA ?CTT?TCTTO OCOßTßACGA ßCGTOßCO?A 1080 GsTAAA?ACG QCATTC?ATT AOCAAAGAAA ACCACT-TAO A?AAAOQCTC A?C??TT??T 1140 GTßTCAßßTA ?AGAAAAAßß TQGGCOCGCT ATTOTATOOG GCO?T?TTGC GTTAATTQ?C 1200 GßCAAT?TT? ?TßCCC??OG T? AGATATC GCT????CTQ QTOGTTTTßT ßGAGACGTCG 1260 GGGC?TT?CT T?TCCATTQA TO?TAACsC? ATTQTTA??? CAAAAGA?TO OCT?CT?GAC 1320 CC?G?G??Tß TGACT?TTGA ?QCTCCTTCC GCTTCTCßCG TCOACCTßOO TGCCGAT?GG 1380 AATTCCCACT CGOCAGAOOT aAT?AA?GTQ ACCCTAAAAA A?AATA?CAC CTCCTTG?C? 1440 ?CACTA?CCA AT?C??CCAT TTCAAATCTT CraAAAAGTs CCC?COTOOT Q??CAT??CG 1500 ßCAAGOAGAA AACTTACCOT TAATAßCTCT ATCAGTATAO A?AG?OGCTC CCACTTA?TT 1560 CTCC?CAOTs AAGGTCAGGa CX?-TCAAGGT OTTCAGATTO ATAAAGATAT TACTTCTGA? 1620 ßßCßGAAATT TAACCATTTA TTCTGGCOGA TOGGTTGATa TTC?T?AA?? TATT?CGCrT 1680 GGT?ßCssCT TTTTAAAC?T C?C??CTAAA a?AGGAOAT? TCOCCTTCGA ?G?C??GTCT 1740 GGACOGA?C? ?CCT??CC?T T?CAOCCCAA OOGACCATCA CCTC?OOTAA T?ßT??COGC 1800 TTT?O?TTT? AC?ACOTCTC TCT???C?GC CTTOGCGG?? AOCTG?GCTT T?CTO?CAOC 18 0 ?O?GAGG?C? ß?OßTAG??a AACTA?GOGT AATATCTCA? ACAAATTTOA CGß?ACßTTA 1920 A?CATTTCCG ßA?CTßT?GA TATCTC??TG ?AAGCACCCA ?AGTCAOCTG ßTTTT?C?a? 1980 Q?C?A?OßAC ßC?CCT?CTT G??CGT??CC ?CTTT?AATG TTACCTCOOß T?GTAA?TTT 2040 ??CCTCTCCA TTOACAOCAC AOGAAßTOGC TC??C?OGTC CAAGCATACO CAATGCAGAA 2100 TT???TOGC? T??CATTT?A T??AGCCACT TTT??TATCG CACAAGOCTC A?C?ßCT??C 2160 TTT?GC?TC? AGGC?TC??T ??TsCCCTTT ??GAGTAACa CTA?CT?CGC ?TT?TTTAAT 2220 GAAGAT?TTT CAßTCTCAOG OGGGGGT?GC CTT?ATTTCA A?CTTAACGC CTCATCT?OC 2280 AAC?T?CAA? CCCCTGGCGT ?ATTATAAAA TCTCAAAACT TTAATGTCTC AGOAOGCTC-A 2340 ACTTTAA?TC TCAAOGCTQA AOOTTCAACA GAAACCsCTT TTTCAATAGA AAATQATTTA 2 00 ??CTT??ACC CCACCGOTOG CAATATAACA ATCAGACAAG TCGAOGOTAC CGATTCACGC 2 60 sTCAACAAAG GTOTCOCAGC CAAAAAAAAC ATAACTTTTA ?AGGGCGTAA TATC?CCTTC 2520 GGCTCTCAAA AAGCCACAAC AGAAATCAAA GGCAATsTTA CCATCAATAA A??C?CT??C 2580 GCT?CTCTTT GTGGTGCGAA TTTTsCCGAA AACAAATCGC CTTTAA?TAT ?CC?GGAA?T 2640 GTT?TT??T? ?TGGCA?CCT TACCACTGCC GGCTCCATTA TCAATATAGC CsOAAATCTT 2700 ACTOTTTC?? AAOGCGCTAA CCTTCAAGCT ATAACAAATT ?CACTTTTAA TGT?OCCOGC 2760 TC?TTTGAC? ACAATGOCGC TTCAAACATT TCCATTGCCA GAGGAGGGOC TA?ATTTA?A 2820 G?T?TC?AT? ?CACCAGTAG CT AAATATT ACCACCAACT CTOATACCAC TT?CCOC?CC 2880 ?TT?T????s GCA?TATATC CAACAAATCA GGTGATTTGA ATATTATTGA TA?AAAA?GC 2940 G?CßCTGAAA TCCAAATrss CGGCAATATC TCACAAAAAG AAGOCAATCT CAC??TTTCT 3000 TCTOATA??s TAAATATTAC CAATCAGATA ACAATCAAAG C?GOCGTTG? ?ßsGGGßOGT 3060 TCTGATTCAA GTOAOGCAGA AAATOCTAAC CTAACTATTC AAACCAAAGA OTTAAAATTG 3120 GC?GG?G?CC T?AATATTTC AGGCTT AAT AAAGCAGAAA TTACAOCTAA AAATGGC?GT 3180 QATTT??CT? rrßGCAATOC TAGCGGTGGT AATsCTGATG CTAAAAAAGT CACTTTTß?C 3240 A?OsTT?AAG ?TTCA? AAT CTCGACTOAC OOTC-ACAATO TAACACT?AA T?OCGAAGTG 3300 ??AACOTCT? ?TOGTAOTAG CAATGCTaGT AATCATAACA sC?CCGsTTT A?CCATTTCC 3360 QCA???ß?TQ TA?CGGTAAA CAATAACOTT ACCTCCCACA ?G?C AT??? T?TCTCTßCC 3420 ßC?ßC?ßG?A ATGTAACAAC CAAAGAAGOC ACAACTATCA ATOC??CC?C AOGC-AGCOTß 3480 GAAGT??CTß CTC?AAATGG TACAATT?AA GGCAACATT? CCTCOCA??? TOTAACAGTO 3540 ACAOCAACAQ ????TCTTC-T TACCACAGAO AATOCTOTCA TTAATOC??C C?GCGGC?C? 3600 GTAA?C?rTA GT?CAAAAAC AOOG ÍATATT AMOOTOGAA TTOAATCAAC TTCCOGTA?T 3660 GT??ATATTA C?ßCO?OCss CAATACACTT AAOOTAAOTA ATATCACTOC TC-AAGATßTA 3720 ?C?GTAACAa CGG?TaC?Ga ?OCCTTGACA ACTACAOC?Q QCTCAACCAT T?GTßCG?C? 3780 ?C?QGC??Tß CAA?T?TT?C AACCAA? CA GGTOATATCA ACsGT???GT TGAATCC?OC 3840 TCCGGCTCTG T??C?CTTGT TOCAACTOaA GCAACTCTTG CTsTAGGT?? T?TTTC?OßT 3 00 ??CACTOTTA CT?TT?CTGC ßGAT?OCGGT AAATTAACCT CCAC?ßTAGG TTCTAC??TT 3960 ?ATOGßACTA AT?GTGT?AC CACCTCAAGC CAATCAOsCG AT?TTG??GG T?CAATTTCT 4020 GGTA?T?CAß T?? TGTT?C AOCAAOCACT .TGATTTAA CTATTGGAAA TAßTGC???? 4080 ßTTGAAßCGA A???TßG?GC TQCAACCTTA ACTGCTO??T CAGQCAAATT AACC CCC?? 4140 ?CAOGCTCTA ßC?TTACCTC AAGCAATaGT CAGACAACTC TTAC-AOCCAA GG?T?GC?GT 4200 ?TCOC?Oß?? AC?TT ?TGC TGCT?ATQTG ACGTT??ATA CC?CAQGCAC TTT?ACTACT 4260 ACAOGOGATT C?AAaATrAA CGCA?CCAGT sGTACCTT?? C??TCAATOC AAAAG?TOCC 4320 ?? TTAGATs GTGCTGC?TC -V-GT-JACCOC ACAGTAGTAA ATGCAACTAA CGC-AAGTOGC 4380 TCTGGT?ACO TßACTOCOAA AACCTCAAGC AGCGTOAATA TCACCssGGA TTTAAACACA 4440 ATAAATGssT TAAATATCAT TTCGGAAAAT GGTAGAAACA CTGTsCGCTT AAGAOGCAAG 4500 GAAATTGATG TG??ATAT?T CCAACCAGGT OTAGCAAOCO TAGAAGAaGT A?TTs??GCG 4560 AAACßCßTCC TTsAsAAGGT AAAAOATTTA TCTGATGAAs AAACAsAAAC ACT?OCC??? 4620 CTTsßTGTAA sTsCTsTACO TTTCsTTC!As CCAA?T??Ts CCATTACsGT TA?T?C?CAA 4680 ??CaAOTTTA CA?CCAAACC ATCAAOTCAA OTOACAAnT CTGAAGGTAA OGCGTOTTTC 4740 TCAAßTGGT? ATGßCßCACG AGTATGTACC AATGTTaCTs ACOATOGACA GCAG 4794 (2) INFORMATION FOR SEQ ID NO: 8: (i) SEQUENCE CHARACTERISTICS : (A) LENGTK: 4803 base pairs (B) TYPE: nucleic acid (O STRANDEDNESS : single (D) TOPOLOGY: linear (Xi) SEQUENCE DESCRIPTION: SEQ ID NOi?: ATOA?C?AGA TAT?TCOTCT CAAATTCAGC AAACGCCTG? ?TOClTTQGT TOCTOTaTCT 60 O??TTG?C?C ßaGßTTOTGA CCATTCCACA OAAA??GGCA GTGA???ACC TaTTCGT?CG 120 A??ßT?cßcc ACTToacsTT AAAOCCACTT TecscTAT?T tacT TCTT oaoc?Toßc? ITO TCCATTCCGC A?TCTGTTTT AsCGAOCssT TTACAGGGAA TG?GCGTCGT ?C?CGGT?C? 240 GC??CCATOC AAOT?a?CGG CAATAAAACC ACTATCCGTA AT?ßCOTC?? TGCTATC?TC 300 AATTOG???C A?TTTAACAT TGACCAAAAT GAAATOaTOC AsTTTTTACA Aß???ßC?OC 360 AACTCTGCCG TTTTCA?CCs TCTTACATCT OACCAAATCT CCCAATTAAA AGOG?TTTT? 420 OATTCTA?CO GACAAGTCTT TTTAATCAAC CCAAATGGTA TCACAATAOG T?AAG?CGC? 480 ?TT?TT??C? CT??TGGC-T TACTaCTTCT ACOCTAGACA TTTCTA?CGA ???C?TC??O S40 GCscaT??TT TC?CCCTTGA sCAAACCAAG sATAAAOCAC TCGCTGA??T CGTO??TC?C 600 GGTTT??TT? CCßTTOOTAA AGACOOT?OC GTAAACCTT? TTOaTsGCA? AßTG?????C 6 0 G?GGGCGTQA TT?GCGTAAA TGGCGGTAGT ?TTTCTTTAC TTOCAGOGCA ?AAAATC?CC 720 ?TC?OCß?T? T??T???TCC ?ACCATCACT TACAOC?TTG CTOCACCTCA ??ACG?AOCG 780 ?TCAATCTQQ aCGATATTTT TsCCAAA?sT GGTAACATTA ?TGTCCGCßC TGCC?CT?TT 840 COC?ATA?Aß ßT??ACTTTC TGCCGACTCT ßTAAGC?A?G ?TAAAAGTQs T??C?TTGTT 900 CTCTCTOCC? ??ß??OGTGA ?GCGG?AATT GsCGGTsTA? TTTCCGCTCA A??TC?ßCAA 960 QCCA??ßßTß ßTA?GTTGAT GATTACAGOT GATAAAGTCA C?TTA??AAC ?GGTOCAGTT 1020 ATCG?CCTTT CAGGTAAAGA AGGGGG?GAG ACTTATCTTO GC6GTGATGA GCGTGGCOAA 1080 GOT???AATG ßT?TTC?ATT AGCGAAGAAA ACCTCTTT?G AAAAAGGCTC GAC?ATTAAT 1140 ßTATCAGGCA AAGAAAAAGG CGGGCOCGCT ATTGTATsGG GCOATATTGC ATTAATTAAT 1200 GGTAACATTA ?TaCTCAAGG TAGCCATATT GCTAAAACTG GCGGCTTTsT saAAACATCA 1260 CGACATOACT TATCCATTGG TGATGATGTO ATTCTTCACG CTAAAGAGTG sTTATTAGAC 1320 CCAGATGATG TGTCCATTGA AACTCTTACA TCTGGACOCA ATAATACCOG CGAAAACCAA 1380 GG?TATAC?A CAGGAGATOG GACTAAAGAG TCACCTAA?G GTAATAGTAT TTCTAAACCT 1440 ?CATT??CAA ?CTCAACTCT TOAOCAAATC CTAAGAAGAG GTTCTTATGT TAATATCACT 1500 GCT??TAATA O?ATTTATsT TAATAOCTCC ATC?ACTTAT CTAATOGCAO TTTAACACTT 1560 CACACTAA?C O?G?TGG?GT T?AAATTAAC GGTGATATTA CCTCAAACQA ?AATGGTAAT 1620 TTAACCATTA ??OCAGGCTC TTOGCTTOAT OTTCATAAAA ACATC?COCT TOOTACGGOT 1680 TTTTTGAATA TTGTCGCTGs sGATTCTGTA GCT?TGAGA OAsAsGGCGA TA??GCACGT 1740 AACGCAAC?G ATGCTCAA?T TACCGCACAA OGGACG?TAA CCGTCA?TAA AGATGATAAA 1800 CAATTTAaAT TC??T??TGT ?TCT?TTAAC OGOACGGGC? ?GGGTTTAAA GTTTATTGC? 1860 AATC?AAAT? ?TTTCACTC? TAAATTTaAT GscsAAATT? ACATATCTOO AATAßT?ACA 1 20 ATT??CCAAA CCACGAAAAA AGATOTTAAA TACTGGAATs CATCAAAAGA CTCTTACTOG 1980 AATßTTTCTT CTCTTACTTT G??T?CssTG C??A?ATTTA CCTTT?T??A ?TTCsTTC-AT 2040 ?GCßOCTC?? ?TTCCC??GA TTTGAGsTCA TCACsT?ß?A ßTTTTGCAQß OßTAC?TTTT 2100 AACGOCATCG GAGGCAAAAC ???CTTC?AC ATCGOAGCTA ACQCAAAAGC CTTATTT??? 2160 TTAA?ACC?? ?CGCCOCT?C AO?CCC???? AAAß??TT?C CTATT?CTTT T??COCC??C 22 0 ATT?C?GCT? CCOGTAACAO TGAT?OCTCT QTC-ATsTTTO ACATAC?COC C??TCTT?CC 2280 TCT?Q?GCTO CCGGCATAAA C?TOG?TTCA ATTAACATTA CCQGCsGGCT TO?CTTTTCC 2340 ?T??C?TCCC ?T??TCOCAA T?GT??TOCT TTTGAAATCA AAAAAG?CTT A?CT?T?AAT 2400 OCAACTOGCT CO??TTTT?G TCTTAAOCAA ACGAAAOATT CTTTTTATAA TGAAT?C?GC 2460 ???C?COCCA TT??CTCAAG TC?TAATCTA ACCATTCTTG OCGOCAATOT C?CTCT?GGT 2520 GGGG?AAATT CAACCAOTAG CATTACGGGC AATATCAATA TCACC?ATA? AOC???TßTT 2580 AC?TT?C??O CTOACACCAO CAACAGCAAC AOUMCTTOA AGAAAAGAAC TCTA?CTCTT 2640 OOC?AT?T?T CTUTTUAQßß GA?TTT??GC CT??CTOOTQ C??ATOCAAA CATTGTCOOC 2700 ??TCTTTCT? TTOCAGAAGA TTCC C?TTT AAAOOAGAAG CCAOTOACAA CCT???C?TC 2760 ?ccsacACCT TTACCAACAA CGOTACCOCC AACATTAATA TAAAACAAGG Astost???? 2820 CTCCAAOGCß ATATTATCAA TAAAGGTGGT TT?AATATC? CTACTAACOC CTCAGOCACT 2880 CAA????CC? TTATT?ACßG AAAT?T? CT AACGAAAA?G ßCOACTT?AA CATCAAGAAT 2940 ATTAAAGCCG ACsCCG??AT CCAA?TTGGC GGCA?TATCT CACAAAAAGA ?GOC??TCTC 3000 ?O?TTTCTT CTG?TAAAOT ???TATTACC AATCAG?TA? CAATCAAAGC AGGCGTTO?? 3060 GGGGOGCaTT CTO?TTC??G TOAGaCAGAA AATOCTAACC TAACTATTCA AACCA??G?G 3120 TTAAAATTGG CAGGAG?CCT AAATATTTCA GGCTTTAATA AAGCAGAAAT TACAsCT??? 3180 AATsscAsTQ ATTTAACTAT TOGCAATOCT AscssTssTA ATGCTGATGC TAAAAAAGTG 3240 ?CTT-TGACA AGGTTAAAGA TTCAAAAATC TCGACTOACO OTCACAATGT A?CACT?AAT 00 AGCGAAGTGA AA?CGTCT?A TOGTAOTAGC AATOCTOOTA ATOATAACAC CACCsGTTTA 3360 ACCATTTCCG CAAAAGATGT AACGGTAAAC AATAA OTTA CCTCCCACAA CACAATAAAT 3420 ATCTCTQCCG CAOCAGGAAA TOTAACAACC AAAOAAOOOA CAACTATCAA TOCAACCACA 3480 GsCAGCsTGa AAOTAACGOC TCAAAATOGT ACAATTA As sCAACATTAC CTCGCAAAAT 3540 GTA?CAsTGA CAsCAACAsA AAATCTTsTT ACCACAOACA ATOCTGTCAT TA?TGC?ACC 3600 ?GCGGC?C?G TAAACATTAs TACAAAAACA GGGGATATTA AAGGTGGAAt TGAATCAACT 3660 TCCGOTAATO TAAATATTAC AOCOAGCOGC AATACACTTA AGGTAAGTAA TATCACTGCT 3720 CA?GATGTAA CAOTAACAOC GOATGCAOGA GCCTTGACAA CTACAOCAGG CTCAACCATT 3780 AGTGCQ?CAA CAGGCA?TGC AAAT?TT?C? ACCAAAACAG OTGATATCAA CsGTAA?GTT 3840 OAATCCAGCT CCOGCTCTOT AACACTTGTT OCA?CTGG?G C ACTCTTGC TOT?GßT??T 3900 ATTTC?GGTA ACACTGTTAC TATTACTOCs CATAGCOOTA A?TTAACCTC CACAGT?OGT 3960 TCT?C??TT? ?TGGOACT?? TAGTOTAACC ACCTCAAOCC ?ATCAGGCGA TATTOAAGCT 4020 ?CA?TTTCTa OTAAT?C?GT A??TOTT?C? sCAAGCACTG GTGATTT?AC T?TTGG???T 4060 ?GTOC????ß TTGAAGCGAA ?AATOGAGCT GCAACCTTAA CTOCTGAATC AOGCA??TTA 4140 ?CC?CCC??? C?GGCTCTAfl CATT?CCTCA AGCAATGGTC ?G?CAACTCT T?C?GCCAAß 4200 G?T?ßC?GT? TCßCAßGAA? C?TTAATGCT OCT??TGTG? CGTTAAATAC C?CAQGC?CT 4260 TT??CT?CT? C?OGGGATTC AAAGATTAAC OCAACCAGTO sT?CCTT?AC ??TCAATOCA 4320 A?AGATGCCA AATTAGATOG TGCTOCATCA OGTO?CCOCA C?GT?GT?AA TGCAACT??C 4380 OC?AQTGOCT CTGGT?ACGT OACTsCGAAA ACCTCAAGCA OCOTQAATAT CACCGGGG?T 4440 TTAAACACAA TAAATGOGTT AAATATCATT TCGGAAAATG GTAOAAACAC TGTsCGCTTA 4500 AGAGGCAAGG AAATTGATaT GAAATATATC CAACCAGGTG TAGCAAOCCT AGAAGAGGTA 4560 ATTGAAGCGA AACGCOTCCT TGAGAAGOTA AAAOATTTAT CTOATGAAGA A?GAGAAACA 4 20 CTAOCCAAAC TTGQTsT?AG TGCTGTACGT TTCOTTaAGC CAAATAATCC C?TTACOGTT 4680 ?AT?CACAA? ACGAGTTTAC AACCAAACCA TCAAGTC?AG TG?CAATTTC TOA?OGT?AG 4740 GCaTGTTTCT CAAaTOGT?? TGOCGCACa? sT?TGT?CCA ?TGTTsCTGA CG?TOGACAG 4800 CAG 4803 (2) INFORMATION FOR SEQ SC NO: 9: (i) SEQÜENCE CHARACTERISTICS : (?) LENGTH: 1599 amino acide (B) TYPE; amino acid (C) STRANDEDNESS : ßingle (D) TOPOLOGY: linear (Xl) SEQUENCE DESCRIPTION: SEQ ID NO: 9: Met ?ßn Lys He Tyr Arg Leu Lyß Phe Ser Lyß Arg Leu Asn Ala Leu 1 5 10 15 Val ?la Val Ser Glu Leu Thr Arg Gly Cys Asp Hn Ser Thr Olu Lyß 20 25 30 Qly Ser Glu Lys Pro Val Arg Thr Lyß Val Arg Kiß Leu ?la Leu Lyß 35 40 45 Pro Leu Ser Ala Ue Leu Leu Ser Leu Gly Met Ala Ser Ue Pro Gln SO 55 60 Ser Val Leu Ala Ser Gly Leu G n Gly Met Ser Val Val Hiß Qly Thr 65 70 75 80 Ala Thr Mee Gln Val ?sp Gly Asn Lyß Thr Thr He ?rg ?ßn Ser Val 85 90 95 ?ßn ?la He lie Aßn Trp Lys Gln Phe Aßn He Asp Gln Aßn Qlu Met 100 105 110 Qlu ßln Phe Leu Gln Glu Ser Ser ?ßn Ser ?la Val Phe ?ßn ?rg Val US 120 125 Thr Ser Aßp G n Ue Ser Gln Leu Lye aly Ue Leu Aßp Ser ?ßn ßly 130 13S 140 ßln Val Phe Leu Ue Asn Pro Asn Oly lie Thr Ue ßly Lyß Aßp ?la 145 150 155 160 Uß lie Aßn Thr Aßn Gly Phe Thr Ala Ser Thr Leu ?ßp Ue Ser ?ßn 165 170 175 Glu ?ßn He Lys Ala Arg Asn Pbe Thr Leu Glu Glp Thr Lyß ?ßp Lyß 180 185 190 ?la Leu Ala Glu He Val Asn H s Gly Leu Ue Thr Val Oly Lyß ?ßp 19S 200 205 Oly Ser Val Asn Leu Ue Gly aly Lys Val Lyß Aßn ßlu aly Val Ue 210 215 220 Ser Val ?ßn Oly Gly Ser Ue Ser Leu Leu Ala Gly ßln Lyß Ue Thr 225 230 235 240 Ue Ser Aßp He Ue ?ßn Pro Thr tle Thr Tyr Ser Ue ?la ?la Pro 245 250 255 Olu Aßn ßlu ?la Ue Aßn Leu aly Asp lie Phe Ala Lyß ßly ßly ?ßn 260 265 270 Ue ?ßn Val ?rg ?la ?la Thr Ue ?rg ?ßn Lye ßly Lyß Leu Ser ?la 275 280 285 ?ßp Ser Val Ser Lyß rp Lyß Ser Oly Aßn Ue Val Leu Ser ?la Lyß 290 295 300 ßlu Oly Qlu ?la Olu Uß Gly Gly Val Ue Ser ?la Gln ?ßn Oln Oln 305 310 315 320 ?la Lyß Gly Gly Lyß Leu Mee lie Thx Gly ?ßp Lyß Val Thr Leu Lyß 325 330 335 Thr Gly Ala Val Ue Asp Leu Ser Gly Lys Glu Gly Gly slu Thr Tyr 340 345 3S0 Leu Oly Oly Asp Glu Arg Gly Glu Gly Lys Asn Gly Ue Gln Leu Ala 35S 360 365 Lyß Lyß Thr Tbr Leu slu Lys Gly Ser Thr He Asn Val Ser Oly Lys 370 375 380 slu Lyß Oly Gly Arg Ala He val Trp Gly Asp He ?la Leu Ue Aßp 385 390 395 400 aly Aen Ue ?ßn ?la Gln Gly Lys ?ßp Ue Ala Lyß Thr Gly Cly Phe 40S 410 415 Val Qlu Thr Ser Gly His Tyr Leu Ser Ue ?ep ?ßp ?ßn Ala Ue Val 430 425 430 Lyß Thr Lyß Qlu Trp Leu Leu ?sp Pro Glu ?ßn Val Thr He Glu ?la 435 440 445 Pro Ser ?la Ser ?rg Val Glu Leu Gly Ala ?ßp ?rg ?ßn Ser H ß Ser 450 455 460 ?la Glu Val Ue Lye Val Thr Leu Lys Lye ?sn ?ßn Thr Ser Leu Thr 465 470 475 460 Thr Leu Thr Aßn Thr Thr Ue Ser ?sn Leu Leu Lys Ser Ala Hiß Val 4T5 490 49S Val Aan Ue Thr Ala ?rg ?rg Lyß Leu Thr Val Aßn Ser Ser lie Ser 500 505 510 lie ßlu ?rg Gly Ser His Leu lie Leu Hiß Ser Olu Gly G n Gly Gly 515 520 525 Gln Oly Val Gln lie Asp Lys ?sp He Thr Ser Clu aly Cly ?ßn Leu S30 535 540 Thr lie Tyr Ser Gly Gly Trp Val Aßp Val Hiß Lyß Asn Ue Thr Leu 545 550 S5S 560 Cly Ser sly Phe Leu ?sn Ue Thr Thr Lyß Glu Gly Aßp Ue ?la Phe 565 570 S75 Qlu ?ßp Lyß Ser Oly ?rg Aßn Aßn Leu Thr Uß Thr Ala Oln Qly Thr 580 585 590 He Thr Ser Qly Aßn Ser Aßn Cly Phe Arg Phe ?ßn ?ßn Val Ser Leu 595 600 60S ?ßn Ser Leu aly Gly Lys Leu Ser Phe Thr ?sp Ser ?rg Glu ?ßp ?rg 610 615 620 Gly ?rg ?rg Thr Lyß Gly ?ßn Ue Ser ?sn Lyß Phß ?sp Gly Thr Leu 625 630 635 640 ?ßn He Ser aly Thr Val Asp Ue Ser Met Lyß Ala Pro Lyß Val Ser 645 650 655 Trp Phe Tyr Arg Asp Lyß sly Arg Thr Tyr Trp Aßn Val Thr Thr Leu 660 665 670 Aßn Val Thr Ser Gly Ser Lys Phe Asn Leu Ser Ue ?sp Ser Thr Oly 675 6-0 665 Ser Gly Ser Thr sly Pro Ser He ?rg Asn Ala Olu Leu ?sn Oly He 690 695 700 Thr Phe Asn Lys Ala Thr Phe Asn Ue Ala Gln Gly Ser Thr ?la ?sn 705 710 715 720 Phe Ser Ue Lyß Ala Ser Ue Met Pro Phe Lys Ser Asn ?la ?ßn Tyr 725 730 735 ?la Leu Phe ?ßn Olu Asp He Ser Val Ser sly sly Gly Ser Val ?ßn 740 745 750 Phe Lyß Leu ?sn ?la Ser Ser Ser Asn lie Gln Thr Pro Cly Val lie 755 760 765 Uß Lys Ser ßln Asn Phe ?sn Val Ser Gly ßly Ser Thr Leu ?ßn Leu 770 775 780 Lyß ?la ßlu ßly Ser Thr Glu Thr ?la Phe Ser Ue Glu ?ßn ?ßp Leu 785 790 795 800 ?ßn Leu ?sn ?la Thr Gly Gly ?ßn Ue Thr Ue ?rg Oln Val Glu Gly 805 810 815 Thr ?ßp Ser ?rg Val Asn Lys Gly Val Ala Ala Lys Lys ?ßn Ue Thr 820 825 830 Phe Lyß Oly Oly Aßn He Thx Phe Oly Ser Oln Lyß Ala Thr Thr Glu 835 840 845 He Lyß aly ?ßn Val Thr Ue ?ßn Lyß ?ßn Thr ?ßn ?la Thr Leu ?rg 850 855 860 Gly ?la ?sn Phe ?la Glu ?ßn Lyß Ser Pro Leu ?ßn Ue ?la Gly ?ßn 865 870 875 880 Val Ue ?ßn ?sn ßly ?ßn Leu Thr Thr ?la ßly Ser lie Ue ?ßn He 885 890 895 ?la ßly ?ßn Leu Thr Val Ser Lyß Gly ?la ?ßn Leu Gln ?la Ue Thr 900 905 910 ?ßn Tyr Tbr Pbe ?ßn Val Ala Oly Ser Phe Aßp Aßn ?ßn ßly ?la Ser 91S 920 925 ?ßn He Ser He ?la ?rg ßly Gly ?la Lyß Phe Lys ?ßp Ue ?ßn ?ßn 930 935 940 Thr Ser Ser Leu ?--n He Tbr Tbr Aßn Ser Aßp Thr Thr Tyr ?rg Thr 945 950 955 960 Ue He Lyß ßly ?ßn l e Ser ?ßn Lyß Ser ßly ?ßp Leu ?ßn Ue He 96S 970 975 ?ßp Lyß Lye Ser ?ßp ?la ßlu He Gln Ue ßly aly ?ßn Ue Ser Gln 980 985 990 Lyß Glu Gly ?ßn Leu Thr Ue Ser Ser ?ßp Lyß Val ?ßn Ue Thr ?ßn 995 1000 1005 Gln Ue Thr Ue Lys ?la Gly Val Glu Gly ßly ?rg Ser ?sp Ser Ser 1010 1015 1020 Glu ?la Glu ?ßn ?la ?sn Leu Thr Ue Oln Thr Lyß Clu Leu Lyß Leu 1025 1030 1035 10 0 ?la Gly ?sp Leu ?sn He Ser Gly Phe ?sn Lys Ala Glu Ue Thr ?la 1045 1050 10SS Lys ?sn Gly Ser ?sp Leu Thr lie Gly ?sn ?la Ser Gly Gly Asn ?la 1060 1065 1070 ?sp ?la Lys Lys Val Thr Phe ?sp Lys Val Lys ?sp Ser Lyß Ue Ser 1075 10T0 1085 Thr ?ßp Gly Klß ?sn Val Thr Leu Asn Ser Glu Val Lyß Thr Ser Aßn 1090 1095 1100 ßly Ser Ser ?ßn Ala Gly Asn Asp Asn Ser Thr Gly Leu Thr Ue Ser 1105 1110 1115 1120 ?la Lyß ?ßp Val Thr Val Asn Asn Asn Val Thr Ser Kiß Lyß Thr Ue 1125 1130 1135 ?ßn Ue Ser ?la ?la ?la Gly ?ßn Val Thr Thr Lyß Qlu Gly Thr Thr 1140 1145 1150 lie ?ßn ?la Thr Thr Gly Ser Val Glu Val Thr ?la Gln ?ßn Gly Thr 1155 1160 1165 Uß Lyß ßly ?ßn He Thr Ser Gln ?sn Val Thr Val Thr ?la Thr ßlu 1170 1175 1180 ?ßn Leu Val Thr Thr Olu ?ßn ?la Val He ?ßn ?la Thr Ser Oly Thr 1185 1190 1195 1200 Val ?ßn Ue Ser Thr Lyß Thr Oly ?sp lie Lys ßly ßly Ue Glu Ser 1205 1210 1215 Thr Ser Gly ?ßn Val Asn lie Tbr Ala Ser Gly Aßn Thr Leu Lyß Val 1220 1225 1230 Ser ?ßn Ue Thr Qly Oln Asp Val Thr Val Thr Ala Aßp ?la Gly ?la 1235 1240 1245 Leu Thr Thr Thr ?la Gly Ser Thr He Ser ?la Thr Thr Gly ?sn ?la 1250 1255 1260 ?ßn lie Thr Thr Lyß Thr Gly ?ßp Ue ?ßn Gly Lyß Val Glu Ser Ser 1265 1270 1275 1280 Ser ßly Ser Val Thr Leu Val ?la Tbx Qly ?la Thr Leu ?la Val aly 1285 1290 1295 ?ßn He Ser ßly ?sn Thr Val Thr He Thr ?la ?ßp Ser ßly Lyß Leu 1300 1305 1310 Thr ßer Thr Val ßly Ser Thr Ue ?ßn ßly Thr ?ßn Ser Val Thr Thr 1315 1320 132S Ser Ser ßln Ser ßly ?ßp He ßlu ßly Thr He Ser Gly ?ßn Thr Val 1330 1335 1340 ?ßn Val Thr ?la Ser Thr Gly Asp Leu Thr He Gly Aßn Ser ?la Lyß 1345 1350 1355 1360 Val ßlu ?la Lyß ?ßn Gly Ala Ala Thr Leu Thr Ala Glu Ser Gly Lyß 1365 1370 1375 Leu Thr Thr Gln Thr Gly Ser Ser Ue Tt-r Ser Ser ?ßn aly sln Thr 1380 1385 1390 Thr Leu Thr ?la Lys Asp Ser Ser Ue ?la Gly Asn He Asn Ala Ala 1395 1400 1405 ?sn Val Thr Leu Asn Thr Thr sly Thr Leu Thr Thr Thr Gly Asp Ser 1410 1415 1420 Lys He Asn ?la Thr Ser Gly Thr Leu Thr He ?sn ?la Lys ?ßp ?la 1425 1430 1435 1440 Lyß Leu ?ßp Oly ?la ?la Ser Oly ?ßp Arg Thr Val Val Asn ?la Thr 1445 1450 14S5 ?ßn ?la Ser Gly Ser Gly Asn Val Thr ?la Lyß Thr Ser Ser Ser Val 1460 1465 1470 ?ßn lie Thr Gly Asp Leu Asn Thr Ue Aßn Gly Leu Aßn Ue He Ser 1475 1480 1485 Glu ?ßn Gly ?rg ?sn Thr Val ?rg Leu ?rg Gly Lyß ßlu He ?ßp Val 1490 1495 1500 Lyß Tyr He ßln Pro Gly Val ?la Ser Val Olu Olu Val Ue ßlu ?la 1505 1510 1515 1520 Lyß ?rg Val Leu ßlu Lye Val Lys ?ßp Leu Ser ?ßp ßlu ßlu ?rg Glu 1525 1530 1535 Thr Leu ?la Lyß Leu Gly Val Ser ?la Val ?rg Phe Val ßlu Pro ?ßn 1540 1545 1550 ?ßn ?la He Thr Val ?ßn Tbr Gln ?ßn ßlu Phe Thr Thr Lys Pro Ser 1555 1560 1565 Ser ßln Val Thr lie Ser Glu Gly Lyß ?la Cya Pbß Ser Ser ßly ?ßn 1570 1575 1580 ßly Ala Arg Val Cys Thr Asn Val ?la ?ßp ?sp ßly ßln ßln Pro 1585 1590 1595 (2) INFORMATION FOR SEQ ID NO: 10: (i) SEQUENCE CHARACTERISTICS : (A) LENGTH: 1600 amino acide (B) TYPE: --mino acid (C) STRANDEDNESS : single (D) TOPOLOOY: linear (Xi) SEQÜENCE DESCRIPTZON: SEQ ID NO: 10: Met ?ßn Lyß He Tyr Arg Leu Lys Phe Ser Lyß Arg Leu ?ßn ?la Leu 5 10 15 Val ?la Val Ser Olu Leu Thr Arg Oly Cyß Aßp Hiß Ser Thr Olu Lyß 20 25 30 ßly Ser Olu Lyß Pro Val Arg Thr Lyß Val Arg Hiß Leu ?la Leu Lyß 35 40 45 Pro Leu Ser ?la Ue Leu Leu Ser Leu ßly Met ?la Ser Ue Pro ßln SO 55 60 Ser Val Leu Ala Ser Gly Leu Gln Gly Met Ser Val Val Hie Gly Thr 65 70 75 60 ?la Thr Mee sln Val Asp Oly Asn Lye Thr Thr Ue Arg Asn Ser Val 85 90 95 Asn Ala He Ue Asn Trp Lys Gln Phe Asn Ue Asp Gln Asn Glu Mee 100 105 110 Glu Gln Phe Leu G n Glu Ser Ser ?sn Ser Ala Val Phe ?sn Arg Val 115 120 125 Thr Ser Asp Gln Ue Ser Glp Leu Lys Gly Ue Leu Aßp Ser Asn ßly 130 135 140 Gln Val Phe Leu He Aan Pro Asn sly He Thr He sly Lys Asp Ala 145 150 15S 160 He He Asn Thr Asn Oly Phe Thr Ala Ser Thr Leu Aßp He Ser Aßn 165 170 17S Glu Aßn Ue Lys Ala ?rg Aßn Phe Thr Leu Qlu Gln Thr Lys ?ßp Lyß 180 185 190 ?la Leu ?la Glu lie Val ?ßn Hiß Gly Leu He Thr Val Cly Lyß ?sp 195 200 20S Gly Ser Val ?sn Leu Ue Qly Gly Lys Val Lyß ?ßn Glu Gly Val Ue 210 215 220 Ser Val ?en Oly Oly Ser He Ser Leu Leu ?la aly sln Lya lie Thr 225 230 235 240 He Ser Aßp He He Asn Pro Thr He Thr Tyr Ser He ?la ?la Pro 245 250 ' 2SS Olu ?ßn Glu ?la lie ?ßn Leu Gly Asp Ue Pbe ?la Lyß Gly Qly ?sn 260 265 270 He ?ßn Val ?rg ?la ?la Thr He ?rg ?ßn Lyß Gly Lyß Leu Ser ?la 275 280 285 ?ßp Ser Val Ser Lyß Asp Lys Ser Gly ?ßn He Val Leu Ser ?la Lyß 290 29S 300 Glu Gly Glu ?la Glu Ue Gly Gly Val Ue Ser ?la Gln ?ßn Gln G n 305 310 315 320 ?la Lyß Gly Oly Lyß Leu Mee He Thr Gly ?ßp Lyß Val Thr Leu Lyß 32S 330 33S Thr ß y ?la Val lie ?ßp Leu Ser 'Gly Lyß Glu ßly ßly ßlu Thr Tyr 340 34S 350 Leu ßly Gly ?sp Glu ?rg Gly slu Gly Lye ?ßn ßly Ue sln Leu ?la 35S 360 365 Lyß Lyß Thr Thr Leu Olu Lyß Oly Ser Thr Ue ?ßn Val Ser ßly Lyß 370 375 380 ßlu Lyß ßly sly ?rg ?la Ue Val Trp Gly ?sp Ue ?la Leu Ue ?sp 385 390 39S 400 aly ?ßn He ?ßn Ala ain Gly Ser Asp Ue Ala Lys Thr aly aly Pbe 405 410 41S Val Olu Thr Ser Oly His Asp Leu Ser Ue Gly Asp ?ßp Val He Val 420 42S 430 ?sp ?la Lys Glu Trp Leu Leu Asp Pro Asp Asp Val Ser lie Glu Thr 435 440 445 Leu Thr Ser ßly Arg Asn Asn Thr ßly ßlu Asn Gln ßly Tyr Thr Thr 450 455 460 ßly ?ßp aly Thr Lys slu Ser Pro Lys Gly Asn Ser Ue Ser Lys Pro 465 470 47S 480 Thr Leu Thr Asn Ser Thr Leu Glu Gln Ue Leu Arg Arg Gly Ser Tyr 485 490 495 Val ?ßn He Thr Ala Asn Asn Arg He Tyr Val Aßn Ser Ser He ?ßn 500 50S 510 Leu Ser ?ßn ßly Ser Leu Thr Leu Hiß Thr Lyß ?rg ?ßp sly Val Lya 515 520 525 He ?ßn Gly ?ßp Ue Thr Ser ?ßn Glu ?ßn Gly ?ßn Leu Thr Ue Lyß 530 535 540 ?la ßly Ser Trp Val Aßp Val Kis Lyß ?ßn Ue Thr Leu Gly Tbr Oly 545 550 555 560 Phe Leu ?ßn Ue Val ?la aly ?ßp Ser Val Ala Phe ßlu ?rg ßlu ßly 565 570 575 ?ßp Lyß ?la ?rg ?sn Ala Thr Aßp ?la ßln Ue Thr ?la ßln ßly Thr 580 585 590 He Thr Val ?ßn Lyß Aßp Asp Lyß ßln Phe Arg Phe Aßn ?ßn Val Ser S95 600 60S Leu ?ßn ßly Thr ßly Lyß Gly Leu Lyß Phe He ?la ?ßn ßln ?ßn ?ßn 610 615 620 Phe Thr Hiß Lye Phe ?sp sly slu He ?sn He Ser aly Ue Val Thr 625 630 635 640 Ue ?sn Gln Thr Tbr Lyß Lyß Aap Val Lye Tyr Trp Aen Ala Ser Lyß 64S 650 655 ?ßp Ser Tyr Trp ?ßn Val Ser ser Leu Thr Leu ?ßn Thr Val ßln Lyß 660 665 670 Phe Thx Phe He Lyß Phe Val ?sp Ser ßly Ser ?an ßly ßln ?ßp Leu 67S 680 685 ?rg Ser Ser ?rg ?rg Ser Phe ?la sly Val His Phe ?sn Cly He Gly 690 695 700 Gly Lyß Thr ?ßn Phe ?ßn He sly ?la ?ßn ?la Lyß ?la Leu Phe Lyß 705 710 715 720 Leu Lyß Pro ?ßn ?la ?la Thr ?sp Pro Lyß Lyß ßlu Leu Pro He Thr 725 730 735 Phe ?ßn ?la ?ßn He Thr ?la Thr sly ?en Ser Asp Ser Ser Val Mee 740 745 750 Phe ?sp lie Biß ?la ?ßn Leu Thr Ser ?rg ?la ?la Gly He ?ßn Mee 75S 760 765 ?sp Ser He ?ßn He Thr Gly Gly Leu Asp Phe Ser He Thr Ser His 770 775 780 ?sn ?rg ?ßn Ser ?sn ?la Phe Glu He Lys Lys ?sp Leu Thr He ?ßn 785 790 795 800 ?la Thr ßly Ser ?ßn Phe Ser Leu Lyß Oln Thr Lys ?sp Ser Phe Tyr 805 810 81S ?ßn Glu Tyr Ser Lyß His ?la He ?sn Ser Ser Kis ?sn Leu Thr He 820 825 830 Leu Gly ßly ?ßn Val Thr Leu aly Gly Olu ?ßn Ser Ser Ser Ser He 835 840 845 Thr Gly ?ßn Uß ?ßn Ue Thr Aen Lys ?la ?sn Val Tbr Leu Gln ?la 850 855 860 ?ßp Thr Ser ?ßn Ser ?ßn Thr Oly Leu Lys Lyß ?rg Thr Leu Thr Leu 865 870 875 880 Gly ?ßn He Ser Val Glu Gly ?ßn Leu Ser Leu Thr Gly ?la ?ßn ?la 88S 890 895 ?ßn He Val ßly ?ßn Leu Ser He ?la Glu ?sp Ser Thr Phe Lyß ßly 900 905 910 alu ?la Ser ?ßp ?ßn Leu ?ßn He Thr aly Thr Phe Thr ?ßn ?ßn Cly 915 920 925 Tbr ?la ?ßn lie ?ßn lie Lys Gly Val Val Lyß Leu sly ?ßp He ?ßn 930 935 940 ?ßn Lyß Oly Oly Leu ?ßn He Thr Thr ?ßn ?la Ser Oly Thr ßln Lyß 945 950 95S 960 Thr Ue He ?ßn ßly ?ßn Ue Thr ?sn ßlu Lys Gly ?sp Leu ?ßn ?le 965 970 975 Lyß ?ßn Ue Lyß ?la ?ßp ?la Glu He Gln He aly Gly ?ßn He Ser 980 985 990 Gln Lyß Clu Gly ?sn Leu Thr Ue Ser Ser ?ßp Lyß Val ?ßn lie Thr 995 1000 1005 ?ßn Gln He Thr He Lyß ?la Gly Val Glu Gly ßly Arg Ser Aßp Ser 1010 1015 1020 Ser Glu ?la ßlu ?ßn ?la ?an Leu Thr He Gln Thr Lyß ßlu Leu Lys 1025 1030 1035 1040 Leu ?la Gly ?ep Leu ?ßn lie Ser sly Phe ?ßn Lyß ?la ßlu He Thr 1045 10S0 1055 ?la Lyß ?ßn Gly Ser Aßp Leu Thr He Gly ?ßn ?la Ser Gly aly ?en 1060 1065 1070 ?la ?ßp ?la Lyß Lyß Val Thr Phe ?ßp Lyß Val Lye ?ßp Ser Lys lie 1075 1080 1085 Ser Thr ?ßp aly Hiß ?ßn Val Thr Leu ?sn Ser Glu Val Lyß Thr Ser 1090 1095 1100 ?ßn Gly Ser Ser Aan Ala Gly Asn Asp Asn Ser Thr Gly Leu Thr Ue 1105 1110 1115 1120 Ser Ala Lyß Asp Val Thr Val Asn Asn Asn Val Thr Ser Hiß Lyß Thr 1125 1130 1135 He ?ßn He Ser Ala Ala Ala Gly Asn Val Thr Thr Lys Glu Gly Thr 1140 H4S 1150 Thr He Asn ?la Thr Thr Gly Ser Val Glu Val Thr ?la Gln Asn Gly 1155 1160 1165 Thr He Lys Gly Asn He Thr Ser Gin ?sn Val Thr Val Thr ?la Thr 1170 1175 1180 Clu ?ßn Leu Val Thr Thr Glu Asn Ala Val He Asn Ala Thr Ser Gly 1185 1190 1195 1200 Thr Val Asn Ue Ser Thr Lys Thr Gly Asp He Lys Gly Cly He Glu 1205 1210 121S Ser Thr Ser aly Asn Val Aßn He Thr ?la Ser sly ?ßn Thr Leu Lyß 1220 1225 1230 Val Ser ?ßn He Thr Gly aln ?sp Val Thr Val Thr ?la ?ßp ?la Oly 1235 1240 1245 ?la Leu Thr Thr Thr Ala sly Ser Thr He Ser Ala Thr Thr Oly Aßn 1250 1255 1260 ?la ?ßn He Thr Thr Lyß Thr Gly ?ßp He ?ßn Oly Lyß Val ßlu ßer 1265 1270 127S 1280 Ser Ser ßly Ser Val Thr Leu Val ?la Thr ßly ?la Thr Leu ?la Val 1285 1290 129S Gly ?ßn Ue Ser Gly ?sn Thr Val Thr He Thr ?la ?sp Ser Gly Lyß 1300 1305 1310 Leu Thr Ser Thr Val Gly Ser Thr He ?ßn ßly Thr ?ßn Ser Val Thr 131S 1320 1325 Thr Ser Ser ßln Ser aly ?sp He Glu Gly Tbr Ue Ser aly ?ßn Thr 1330 1335 1340 Val ?ßn Val Thr ?la Ser Thr Gly ?ßp Leu Thr He Gly ?ßn Ser ?la 1345 1350 1355 1360 Lyß Val Glu ?la Lye ?ßn Gly ?la ?la Thr Leu Thr ?la Glu Ser Gly 1365 1370 137S Lyß Leu Thr Tbr Gln Thr ßly Ser Ser Ue Tbr Ser Ser ?ßn ßly ßln 1380 1385 1390 Thr Thr Leu Thr ?la Lyß ?ßp Ser Ser He ?la ßly ?ßn He ?ßn ?la 1395 1400 1405 ?la ?an Val Thr Leu ?ßn Thr Thr aly Thr Leu Thr Thr Thr ßly ?ßp 1410 1415 1420 Ser Lyß Z e ?ßn ?la Thr Ser Gly Thr Leu Thr Ue ?ßn ?la Lyß ?ßp 142S 1430 1435 1440 Ala Lys Leu Asp Gly Ala Ala Ser aly Aßp Arg Thr Val Val ?sn ?la 1445 14S0 14SS Thr ?ßn ?la Ser Gly Ser ßly ?ßn Val Thr Ala Lyß Thr Ser Ser Ser 1460 1465 1470 Val Aßn He Thr Gly Asp Leu Asn Thr He Asn Gly Leu Asn He He 1475 1480 148S Ser Glu Asn sly Arg Asn Thr Val Arg Leu Arg Cly Lys Clu He Aßp 1490 1495 1500 Val Lys Tyr Ue Gln Pro Gly Val Ala Ser Val Glu Glu Val He Glu 1S0S 1510 1515 1520 ?la Lys ?rg Val Leu Glu Lys Val Lys ?sp Leu Ser ?sp Glu Glu ?rg 1525 1530 1535 Glu Thr Leu ?la Lys Leu Gly Val Ser ?la Val ?rg Phe Val Glu Pro 1S40 1545 1550 ?ßn ?ßn Ala Ue Thr Val Asn Thr Gln ?ßn ßlu Phe Thr Thr Lyß Pro 1555 1S60 1565 Ser Ser Gln Val Thr He Ser Glu aly Lyß ?la Cyß b« ser Ser sly 1S70 1575 1580 ?ßn Gly ?la ?rg Val Cys Thr ?sn Val ?la ?ßp ?ßp Gly Gln ßln Pro 1585 1590 1595 1600 (2) INFORMATION FOR SEQ ID NO: 11: Ci) SEQUENCE CHARACTERISTICS : (?) LENOTH: 29 anu.no acide (B> TYPE: aniño acid (C) STRANDEDNESS : eingle (D) TOPOLOGY: linear (Xi) SEQUENCE DESCRIPTION: SEQ ID NO ¡11; Val ?op Glu Val He Glu ?la Lys ?rg He Leu Glu Lys Val Lyß ?ßp 1 5 10 15 Leu Ser ?ßp Glu Glu Arg slu Ala Leu Ala Lye Leu Gly 20 25

Claims (13)

  1. REIVINDICACIONES t 1. Una molécula de ácido nucleico, aislada y purificada, que codifica para una proteína de alto peso molecular (HMW) HMW3 o HMW4 de una cepa de Haemophilus, no tipificable, caracterizada por: (a) la secuencia de ADN mostrada en la Figura 8 (SEQ ID No: 7) y que codifica para la proteína HMW3 que tiene la secuencia de aminoácidos derivada de la Figura 10 (SEQ ID No: 9) , o (b) la secuencia de ADN mostrada en la Figura 9
  2. (SEQ ID No: 8) y que codifica para la proteína HMW4 que tiene la secuencia de aminoácidos derivada de la Figura 10 (SEQ ID No. 10) . 2. Una molécula de ácido nucleico, aislada y purificada, que codifica para una proteína de alto peso molecular (HMW) de una cepa de Haemophilus, no tipificable, caracterizada por: (a) una secuencia de ADN como se muestra en cualquiera de las Figuras 8 y 9 (SEQ ID Nos: 7 y 8); (b) una secuencia de ADN que codifica para una secuencia de aminoácidos como se muestra en la Figura 10
  3. (SEQ ID Nos: 9 y 10); o (c) una secuencia de ADN que codifica para una proteína de alto peso molecular de una cepa de Haemophilus, no tipificable, que hibridiza bajo condiciones severas a
  4. P697 cualquiera de las secuencias de ADN de (a) y (b) . 3. La molécula de ácido nucleico según la reivindicación 2, caracterizada en que la secuencia de ADN (c) tiene al menos una identidad de 90 % a las secuencias de ADN (a) o (b) . 4. Un vector para la transformación de un hospedero, caracterizado por la molécula de ácido nucleico reivindicada en las reivindicaciones 1, 2 o 3.
  5. 5. Una proteína de alto peso molecular, (HMW), aislada y purificada, de Haemophilus no tipificable, o cualquier variante o fragmento de la misma que retenga la capacidad inmunológica de proteger contra la enfermedad provocada por una cepa de Haemophilus no tipificable, que se caracteriza por al menos un epítope B-celular, expuesto en la superficie que se reconoce por el anticuerpo monoclonal AD6.
  6. 6. La proteína según la reivindicación 5, que es HMWl codificada por la secuencia de ADN mostrada en la Figura 1 (SEQ ID No: 1), y que tiene la secuencia de aminoácidos derivada de la Figura 2 (SEQ ID No: 2) y que tiene el peso molecular aparente de 125 kDa.
  7. 7. La proteína según la reivindicación 5, que es HMW2 codificada por la secuencia de ADN mostrada en la Figura 3 (SEQ ID No: 3), y que tiene la secuencia de aminoácidos derivada de la Figura 4 (SEQ ID No: 4) y que P697 tiene el peso molecular aparente de 120 kDa.
  8. 8. La proteína según la reivindicación 5, que es HMW3 codificada por la secuencia de ADN mostrada en la Figura 8 (SEQ ID No: 7) , y que tiene la secuencia de aminoácidos derivada de la Figura 10 (SEQ ID No: 9) y que tiene el peso molecular aparente de 125 kDa.
  9. 9. La proteína según la reivindicación 5, que es HMW4 codificada por la secuencia de ADN mostrada en la Figura 9 (SEQ ID No: 8), y que tiene la secuencia de aminoácidos derivada de la Figura 10 (SEQ ID No: 10) y que tiene el peso molecular aparente de 123 kDa.
  10. 10. Un conjugado que comprende una proteína según cualquiera reivindicación 5 a 9, enlazada a un antígeno, hapteno o polisacárido para producir una respuesta inmunitaria al antígeno, hapteno o polisacárido.
  11. 11. El conjugado según la reivindicación 10, caracterizado en que el polisacárido es un polisacárido protector contra Haemophilus influenzae tipo b.
  12. 12. Un péptido sintético caracterizado por una secuencia de aminoácidos que contiene al menos seis aminoácidos y no más de 105 aminoácidos y que corresponde a al menos un epítope protector de una proteína de alto peso molecular HMWl, HMW2, HMW3 o HMW4 de Haemophilus influenzae no tipificable, en donde el epítope se reconoce por al menos uno de los anticuerpos monoclonales ADß y 10C5. P697
  13. 13. El péptido según la reivindicación 12, caracterizado en que el epítope se localiza dentro de los 75 aminoácidos del carboxi terminal de la proteína HMWl o HMW2. P697
MXPA/A/1998/008107A 1996-04-01 1998-10-01 Proteinas de superficie de alto peso molecular dehaemofilus no tipificable MXPA98008107A (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US08617697 1996-04-01

Publications (1)

Publication Number Publication Date
MXPA98008107A true MXPA98008107A (es) 1999-09-20

Family

ID=

Similar Documents

Publication Publication Date Title
Sirakova et al. Role of fimbriae expressed by nontypeable Haemophilus influenzae in pathogenesis of and protection against otitis media and relatedness of the fimbrin subunit to outer membrane protein A
KR100271888B1 (ko) 모락셀라 카타랄리스의 유용한 항원과 관련된 방법 및 조성물
AU683435B2 (en) Haemophilus outer membrane protein
Nelson et al. Cloning and sequencing of Haemophilus influenzae outer membrane protein P6
Poulsen et al. A comparative genetic study of serologically distinct Haemophilus influenzae type 1 immunoglobulin A1 proteases
JPH09503210A (ja) ブランハメラ・カタラリスに対するワクチン
RU2194757C2 (ru) ФРАГМЕНТ ДНК, КОДИРУЮЩИЙ ФРАГМЕНТ БЕЛКА РЕЦЕПТОРА ТРАНСФЕРРИНА ШТАММА Haemophilus (ВАРИАНТЫ), ПЛАЗМИДНЫЙ ВЕКТОР (ВАРИАНТЫ), РЕКОМБИНАНТНЫЙ БЕЛОК (ВАРИАНТЫ), ВЫДЕЛЕННЫЙ И ОЧИЩЕННЫЙ БЕЛОК (ВАРИАНТЫ), ИММУНОГЕННАЯ КОМПОЗИЦИЯ И СПОСОБ ПОЛУЧЕНИЯ ВЫДЕЛЕННОГО И ОЧИЩЕННОГО БЕЛКА
JPH08245699A (ja) 緑膿菌膜タンパク質由来免疫原性ハイブリッドOprF−OprI
US6218141B1 (en) High molecular weight surface proteins of non-typeable haemophilus
HU220116B (hu) A Neisseria meningitidis transzferin-receptorának Tbp2-fragmentumai
BR9506272B1 (pt) proteÍna mutante isolada e purificada hin47 de haemophilus influenzae, molÉcula quimÉrica, molÉcula de Ácido nuclÉico, plasmÍdeo recombinante, cÉlula e. coli transformada, composiÇço imunogÊnica, processo para determinar a presenÇa de anticorpos, especificamente reativos com a proteÍna hin47 numa amostra, processo para determinar a presenÇa de proteÍna hin47 numa amostra e kit de diagnàstico para determinar a presenÇa de anticorpos numa amostra especificamente reativa com a proteÍna hin47.
AU723159B2 (en) High molecular weight surface proteins of non-typeable haemophilus
US6759213B1 (en) Haemophilus adhesion proteins
CA2148563C (en) Purified nontypable haemophilus influenzae p5 protein as a vaccine for nontypable haemophilus influenzae strain
US5993826A (en) Methods and compositions relating to useful antigens of moraxella catarrhalis
JP2011057691A (ja) Streptococcuspneumoniaeに対して免疫原性である複数抗原性ペプチド
AU696207B2 (en) High molecular weight surface proteins of non-typeable haemophilus
AU716506B2 (en) Transferrin receptor genes
US20020164354A1 (en) High molecular weight surface proteins of non-typeable haemphilus
MXPA98008107A (es) Proteinas de superficie de alto peso molecular dehaemofilus no tipificable
US6432669B1 (en) Protective recombinant Haemophilus influenzae high molecular weight proteins
CA2345208C (en) Protective recombinant haemophilus influenzae high molecular weight proteins
RU2196176C2 (ru) АНАЛОГ HIN47 Haemophilus С РЕДУЦИРОВАННОЙ ПРОТЕАЗНОЙ АКТИВНОСТЬЮ
KR100394454B1 (ko) 트랜스페린수용체유전자들
MXPA97009557A (es) Miembros de proteinas de choque termico estreptococales de la familia hsp7o