FR2814754A1 - Listeria innocua, genome et applications - Google Patents

Listeria innocua, genome et applications Download PDF

Info

Publication number
FR2814754A1
FR2814754A1 FR0012697A FR0012697A FR2814754A1 FR 2814754 A1 FR2814754 A1 FR 2814754A1 FR 0012697 A FR0012697 A FR 0012697A FR 0012697 A FR0012697 A FR 0012697A FR 2814754 A1 FR2814754 A1 FR 2814754A1
Authority
FR
France
Prior art keywords
seq
polypeptide
monocytogenes
nucleotide sequence
innocua
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR0012697A
Other languages
English (en)
Other versions
FR2814754B1 (fr
Inventor
Frederik Kunst
Philippe Glaser
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institut Pasteur de Lille
Original Assignee
Institut Pasteur de Lille
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to FR0012697A priority Critical patent/FR2814754B1/fr
Application filed by Institut Pasteur de Lille filed Critical Institut Pasteur de Lille
Priority to AU2002214081A priority patent/AU2002214081A1/en
Priority to EP01982519A priority patent/EP1322763A2/fr
Priority to PCT/FR2001/003061 priority patent/WO2002028891A2/fr
Priority to US10/398,221 priority patent/US20040018514A1/en
Priority to KR10-2003-7004886A priority patent/KR20030064404A/ko
Priority to CA002424952A priority patent/CA2424952A1/fr
Priority to JP2002532473A priority patent/JP2004515227A/ja
Publication of FR2814754A1 publication Critical patent/FR2814754A1/fr
Application granted granted Critical
Publication of FR2814754B1 publication Critical patent/FR2814754B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/505Medicinal preparations containing antigens or antibodies comprising antibodies
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/53DNA (RNA) vaccination
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Public Health (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Animal Behavior & Ethology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Veterinary Medicine (AREA)
  • General Engineering & Computer Science (AREA)
  • Pharmacology & Pharmacy (AREA)
  • General Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Oncology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Communicable Diseases (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

La présente invention concerne notamment une séquence nucléotidique issue de Listeria innocua correspondant à une séquence choisie parmi SEQ ID Ndegre 1 à SEQ ID Ndegre 11 et l'analyse comparative de ce génome avec celui de Listeria monocytogènes.

Description

<Desc/Clms Page number 1>
Figure img00010001
LISTERIA INNOCUA, GENOME ET APPLICATIONS
Figure img00010002

L'invention a pour objet la séquence génomique et des séquences nucléotidiques codant pour des polypeptides de Listeria innocua, tels que des polypeptides d'enveloppe cellulaire, sécrétés ou spécifiques, ou impliqués dans le métabolisme et dans le processus de réplication, ainsi que des vecteurs incluant lesdites séquences et des cellules ou animaux transformés par ces vecteurs.
L'invention concerne aussi la comparaison de ces séquences nucléotidiques avec celles codant pour les polypeptides de Listeria monocytogenes. L'invention concerne également des procédés de détection de ces acides nucléiques ou polypeptides et des kits de diagnostic de contamination par des bactéries du genre Listeria et des kits de typage de souches contaminantes. L'invention vise aussi une méthode de sélection de composés capables de moduler l'infection bactérienne engendrée par d'autres Listeria et un procédé de biosynthèse ou de biodégradation de molécules d'intérêt utilisant lesdites séquences nucléotidiques ou lesdits polypeptides. L'invention comprend enfin des compositions pharmaceutiques, notamment vaccinales, pour la prévention et/ou le traitement d'infections bactériennes, en particulier par Listeria, notamment monocytogenes, et des compositions contenant des anticorps dirigés contre des polypeptides spécifiques de
Figure img00010003

L. innocua ou de L. monocytogenes..
Dans les infections à Listeria, Listeria monocytogenes est la plus fréquente et la plus dangereuse. Listeria monocytogenes est un pathogène intracellulaire facultatif. Il s'agit de l'agent étiologique de la listériose, une infection liée à la nourriture posant des problèmes de santé publique de plus en plus importants, avec un impact économique important pour l'industrie alimentaire. La listériose est l'infection liée aux aliments la plus léthale (mortalité d'environ 30 %). Listeria monocytogenes possède la propriété inhabituelle d'être capable de traverser trois barrières : La barrière intestinale, la barrière hémato-encéphalique et la barrière placentaire. Les manifestations cliniques de la listériose incluent les méningites, méningo-encéphalites, avortements et septicémies. Cette infection est opportuniste et affecte principalement les femmes enceintes, les bébés, les personnes âgées et les personnes immuno-déprimées en particulier les personnes atteintes du SIDA. Cette
<Desc/Clms Page number 2>
Figure img00020001

maladie affecte également les individus sains et est responsable d'un nombre important d'épidémies en raison de produits alimentaires contaminés. Listeria monocytogenes est également d'une importance vétérinaire avec un risque principal pour les ovins (moutons) et les bovins. Listeria monocytogenes est particulièrement résistante au stress ou aux conditions extrêmes et il est important de rechercher sa présence avec soin non seulement pour des problèmes de sécurité alimentaire mais également pour des problèmes de sécurité environnementale.
Suite à la découverte d'une contamination, le typage de la ou les souches isolées est nécessaire pour identifier l'origine de la contamination. Par ailleurs, lorsqu'une même installation est contaminée par deux évènements successifs il est important de montrer avec certitude si ce sont deux contaminations indépendantes ou si une même souche est responsable de ces deux évènements. La méthode la plus performante actuellement utilisée, le profil de migration en gel en champs pulsé (PFGE) après digestion de l'ADN chromosomique est une méthode très lourde qui ne peut être mise en oeuvre de manière systématique. Une méthode alternative, moins performante mais automatisée, le ribotypage, présente un coût, par analyse, élevé qui limite son utilisation.
Il faut aussi souligner que le risque de listériose est très variable en fonction de la souche de Listeria contaminante. A l'extrême, certaines souches pourraient être considérées comme dangereuses et d'autres inoffensives (comme Listeria innocua). Ainsi, alors que des contaminations par les Listeria sont très fréquentes, le nombre de cas décrits est faible. Dans cette perspective, la disponibilité d'un outil permettant d'identifier le risque lié à une contamination (en fonction du type génomique de la souche et du nombre de bactéries par gramme d'aliment) permettrait aux industriels de réagir en fonction de ce risque.
La séquence complète du génome de Listeria monocytogenes a été établie pour la souche EGDe déposée à la CNCM sous le nO 1-2440 le 11 avril 2000 et décrite dans la demande de brevet français nO 00 04629 déposée le 11 avril 2000. Le génome de cette bactérie est circulaire et comporte environ 3000 kilobases. Son contenu en GC est d'environ 38 %. Les études des facteurs de virulence ont permis l'identification d'un locus de 15 kb qui peut être considéré comme étant un îlot de
<Desc/Clms Page number 3>
Figure img00030001

pathogénicité dans la mesure où il contient la plupart des gènes dont la fonction dans la virulence a été clairement identifiée.
La présente invention concerne les séquences nucléotidiques et polypeptidiques de Listeria innocua et la comparaison des séquences correspondantes avec celles de Listeria monocytogenes souche EGDe.
L'invention concerne également les séquences de Listeria monocytogenes 4b.
Ainsi, c'est un objet de la présente invention que de divulguer la séquence complète du génome de Listeria innocua, en particulier CLIP 11262 contenu dans la banque génomique préparée à partir du génome de cette souche et déposée à la CNCM le 2 octobre 2000 sous le numéro 1-2565 ainsi que de tous les gènes et séquences régulatrices non codantes contenus dans ledit génome.
La souche CLIP 11262 a été isolée d'un produit laitier. Cette souche est conservée au Centre National de Référence des Listeria à l'INSTITUT PASTEUR (centre collaborateur OMS).
La comparaison des séquences complètes des génomes de L. monocytogenes souche EGDe et Listeria innocua, souche CLIP 11262, montre qu'environ 86% de ces génomes sont très fortement conservés (80 à 95 % d'identité ADN). Par contre les 14% restant sont spécifiques de chaque souche. Pratiquement, une puce représentant l'ensemble des gènes de chaque espèce donnerait un signal positif pour l'ADN des deux souches pour 86% des sondes et pour 14% un signal uniquement avec l'ADN d'une des deux souches.
Ces résultats sont en accord avec les données de la littérature sur la diversité des souches de Listeria. Par ailleurs des données récentes du laboratoire sur le séquençage d'une souche épidémique de L. monocytogenes (serotype 4b (CLIP 80459)) confirme cette diversité mais surtout montre que les souches de serotype-4b sont sans doute aussi proches de L. innocua que de la souche de L. monocytogenes de sérotype-1/2a dont le génome a été séquencé. La souche CLIP 80459 est une souche épidémique. Elle est conservée au Centre National de Référence des Listeria de l'INSTITUT PASTEUR (centre collaborateur OMS). Il faut aussi souligner que la souche d'innoclla n'est pas pathogène et par conséquent que les gènes spécifiques
<Desc/Clms Page number 4>
Figure img00040001

de L. monocytogenes sont potentiellement impliqués dans la pathogénicité. Par ailleurs l'analyse du génome de la souche EGDe a permis d'identifier les principaux gènes de compétences, c'est-à-dire les gènes favorisant les transferts de gènes horizontaux. Certaines souches de Listeria doivent par conséquent avoir la capacité à être transformées. Des transferts horizontaux entre souches doivent ainsi être fréquents et expliquer la grande diversité observée entre les isolats.
La souche Listeria monocytogenes sérotype 4b est également identifiée dans la présente demande par Listeria monocytogenes 4b et de manière interchangeable.
L'ensemble de ces observations indique que les gènes identifiés comme variables entre L. monocytogenes souche EGDe et L. innocua doivent être représentatifs de la diversité génomique des Listeria.
L'invention concerne également de nouveaux outils pour le typage des souches de Listeria. Ces outils pourraient être du type"puce"à ADN ou d'un autre type. Les caractéristiques nouvelles de ces outils de typage seront les suivantes : * Rapidité et simplicité d'utilisation * Haut pouvoir de discrimination entre les souches * Possibilité de fournir des informations sur le contenu génomique de la souche analysée et de permettre éventuellement de prévoir le risque associé à une contamination par Listeria.
La présente invention concerne donc une séquence nucléotidique de Listeria innocua caractérisée en ce qu'elle correspond à une séquence choisie parmi SEQ ID NO 1 à SEQ ID NO 11.
La présente invention concerne également une séquence nucléotidique issue de Listeria innocua, caractérisée en ce qu'elle est choisie parmi : a) une séquence nucléotidique comportant au moins 75%, 80%, 85%, 90%,
95% ou 98% d'identité avec une séquence choisie parmi SEQ ID NO 1 à SEQ ID NO 11 ;
Figure img00040002

b) une séquence nucléotidique hybridant dans des conditions de forte stringence avec une séquence choisie parmi SEQ ID NO 1 à SEQ ID NO Il ;
<Desc/Clms Page number 5>
Figure img00050001

c) une séquence nucléotidique complémentaire d'une séquence choisie parmi SEQ ID NO 1 à SEQ ID NO 11 ou complémentaire d'une séquence nucléotidique telle que définie en a), ou b), ou une séquence nucléotidique de l'ARN correspondant à l'une des séquences a) ou b) ; d) une séquence nucléotidique d'un fragment représentatif d'une séquence
Figure img00050002

choisie parmi SEQ ID NO 1 à SEQ ID NO 11, ou d'un fragment représentatif d'une séquence nucléotidique telle que définie en a), b) ou c) ; e) une séquence nucléotidique comprenant une séquence telle que définie en a), b), c) ou d) ; et f) une séquence nucléotidique telle que définie en a), b), c), d) ou e) modifiée.
De façon plus particulière, la présente invention a également pour objet les séquences nucléotidiques caractérisées en ce qu'elles sont issues de SEQ ID ? 1 à SEQ ID ? 11 et en ce qu'elles codent pour un polypeptide, choisies parmi les séquences SEQ ID ? 12 à SEQ ID ? 689 et SEQ ID NO 2053 à SEQ ID NO 2056.
La présente invention concerne aussi de façon plus générale les séquences nucléotidiques issues de SEQ ID NI 1 à SEQ ID NI 11 et codant pour un polypeptide de L. innocua, telles qu'elles peuvent être isolées à partir de SEQ ID NI làSEQIDN ll.
De plus, les séquences nucléotidiques caractérisées en ce qu'elles comprennent une séquence nucléotidique choisie parmi : a) une séquence nucléotidique codant pour un polypeptide, choisie parmi les séquences SEQ ID Nui 12 à SEQ ID ? 689 et SEQ ID ? 2053 à SEQ ID ? 2056 ; b) une séquence nucléotidique comportant au moins 75%, 80%, 85%, 90%,
95% ou 98% d'identité avec une séquence nucléotidique codant pour un polypeptide, choisie parmi les séquences SEQ ID ? 12 à SEQ ID NI
689 et SEQ ID Nui 2053 à SEQ ID ? 2056 ;
<Desc/Clms Page number 6>
Figure img00060001

c) une séquence nucléotidique s'hybridant dans des conditions de forte stringence avec une séquence nucléotidique codant pour un polypeptide, choisie parmi les séquences SEQ ID NO 12 à SEQ ID N 689 et SEQ ID NO 2053 à SEQ ID NO 2056 ; d) une séquence nucléotidique complémentaire ou d'ARN correspondant à une séquence telle que définie en a), b) ou c) ; e) une séquence nucléotidique d'un fragment représentatif d'une séquence telle que définie en a), b), c) ou d) ; et f) une séquence telle que définie en a), b), c), d) ou e) modifiée, sont également des objets de l'invention.
La présente invention concerne également une séquence nucléotidique de Listeria monocytogenes sérotype 4b caractérisée en ce qu'elle correspond à SEQ ID NO 1068 à 2041.
La présente invention concerne également une séquence nucléotidique de Listeria innocua caractérisée en ce qu'elle est choisie parmi : a) une séquence nucléotidique comportant au moins 75%, 80%, 85%,
90%, 95% ou 98% d'identité avec SEQ ID No 1068 à SEQ ID NO 2041 ; b) une séquence nucléotidique hybridant dans des conditions de forte stringence avec SEQ ID NO 1068 à SEQ ID N 2041 ; c) une séquence nucléotidique complémentaire de SEQ ID
Figure img00060002

NO 1 ou complémentaire d'une séquence nucléotidique telle que définie en a), ou b), ou une séquence nucléotidique de l'ARN correspondant à l'une des séquences a) ou b) ; d) une séquence nucléotidique d'un fragment représentatif de SEQ ID NO
1068 à SEQ ID N 2041, ou d'un fragment représentatif d'une séquence nucléotidique telle que définie en a), b) ou c) ; e) une séquence nucléotidique comprenant une séquence telle que définie en a), b), c) ou d) ; et f) une séquence nucléotidique telle que définie en a), b), c), d) ou e) modifiée.
<Desc/Clms Page number 7>
Figure img00070001
De façon plus particulière, la présente invention a également pour objet les séquences nucléotidiques caractérisées en ce qu'elles sont issues de SEQ ID NO 1068 à SEQ ID N 2041 et en ce qu'elles codent pour un polypeptide, choisies parmi les séquences SEQ ID NO 690 à SEQ ID NO 1067 et SEQ ID NO 2049 à SEQ
Figure img00070002

ID N 2052. La présente invention concerne aussi de façon plus générale les séquences nucléotidiques issues de SEQ ID N 1068 à 2041, et codant pour un polypeptide de L. monocytogenes, telles qu'elles peuvent être isolées à partir de SEQ ID NO 690 à 1067 et SEQ ID NO 2049 à SEQ ID NO 2052.
De plus, les séquences nucléotidiques caractérisées en ce qu'elles comprennent une séquence nucléotidique choisie parmi : a) une séquence nucléotidique codant pour un polypeptide, choisie parmi les séquences SEQ ID NO 690 à SEQ ID N 1067 ; b) une séquence nucléotidique comportant au moins 75%, 80%, 85%, 90%,
95% ou 98% d'identité avec une séquence nucléotidique codant pour un polypeptide, choisie parmi les séquences SEQ ID N 690 à SEQ ID NO
1067 ; c) une séquence nucléotidique s'hybridant dans des conditions de forte stringence avec une séquence nucléotidique codant pour un polypeptide, choisie parmi les séquences SEQ ID N 690 à SEQ ID N 1067 ; d) une séquence nucléotidique complémentaire ou d'ARN correspondant à une séquence telle que définie en a), b) ou c) ; e) une séquence nucléotidique d'un fragment représentatif d'une séquence telle que définie en a), b), c) ou d) ; et f) une séquence telle que définie en a), b), c), d) ou e) modifiée, sont également des objets de l'invention.
Par acide nucléique, séquence nucléique ou d'acide nucléique, polynucléotide, oligonucléotide, séquence de polynucléotide, séquence nucléotidique, termes qui seront employés indifféremment dans la présente description, on entend désigner un enchaînement précis de nucléotides, modifiés ou non, permettant de définir un fragment ou une région d'un acide nucléique,
<Desc/Clms Page number 8>
Figure img00080001

comportant ou non des nucléotides non naturels, et pouvant correspondre aussi bien à un ADN double brin, un ADN simple brin qu'à des produits de transcription desdits ADNs. Ainsi, les séquences nucléiques selon l'invention englobent également les PNA (Peptid Nucleic Acid).
Il doit être compris que la présente invention ne concerne pas les séquences nucléotidiques dans leur environnement chromosomique naturel, c'est-à-dire à l'état naturel. Il s'agit de séquences qui ont été isolées et/ou purifiées, c'est-à-dire qu'elles ont été prélevées directement ou indirectement, par exemple par copie, leur environnement ayant été au moins partiellement modifié. On entend ainsi également désigner les acides nucléiques obtenus par synthèse chimique.
Par pourcentage d'identité entre deux séquences d'acides nucléiques ou d'acides aminés au sens de la présente invention, on entend désigner un pourcentage de nucléotides ou de résidus d'acides aminés identiques entre les deux séquences à comparer, obtenu après le meilleur alignement, ce pourcentage étant purement statistique et les différences entre les deux séquences étant réparties au hasard et sur toute leur longueur. On entend désigner par"meilleur alignement"ou "alignement optimal", l'alignement pour lequel le pourcentage d'identité déterminé comme ci-après est le plus élevé. Les comparaisons de séquences entre deux séquences d'acides nucléiques ou d'acides aminés sont traditionnellement réalisées en comparant ces séquences après les avoir alignées de manière optimale, ladite comparaison étant réalisée par segment ou par fenêtre de comparaison pour identifier et comparer les régions locales de similarité de séquence. L'alignement optimal des séquences pour la comparaison peut être réalisé, outre manuellement, au moyen de l'algorithme d'homologie locale de Smith et Waterman (1981, Ad.
App. Math. 2 : 482), au moyen de l'algorithme d'homologie locale de Neddleman et Wunsch (1970, J. Mol. Biol. 48 : 443), au moyen de la méthode de recherche de similarité de Pearson et Lipman (1988, Proc. Natl. Acad. Sci. USA 85 : 2444), au moyen de logiciels informatiques utilisant ces algorithmes (GAP, BESTFIT, BLAST P, BLAST N, FASTA et TFASTA dans le Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI). Afin d'obtenir l'alignement optimal, on utilise de préférence le programme BLAST, avec la matrice BLOSUM 62 On peut également utiliser les matrices PAM ou PAM250.
<Desc/Clms Page number 9>
Figure img00090001
Le pourcentage d'identité entre deux séquences d'acides nucléiques ou d'acides aminés est déterminé en comparant ces deux séquences alignées de manière optimale, la séquence d'acides nucléiques ou d'acides aminés à comparer pouvant comprendre des additions ou des délétions par rapport à la séquence de référence pour un alignement optimal entre ces deux séquences. Le pourcentage d'identité est calculé en déterminant le nombre de positions identiques pour lesquelles le nucléotide ou le résidu d'acide aminé est identique dans les deux séquences, en divisant ce nombre de positions identiques par le nombre total de positions comparées et en multipliant le résultat obtenu par 100 pour obtenir le pourcentage d'identité entre ces deux séquences.
Par séquences nucléiques présentant un pourcentage d'identité d'au moins 75%, de préférence 80%, 85% ou 90%, de façon plus préférée 95% voire 98%, après alignement optimal avec une séquence de référence, on entend désigner les séquences nucléiques présentant, par rapport à la séquence nucléique de référence, certaines modifications comme en particulier une délétion, une troncation, un allongement, une fusion chimérique et/ou une substitution, notamment ponctuelle, et dont la séquence nucléique présente au moins 75%, de préférence 80%, 85%, 90%, 95% ou 98%, d'identité après alignement optimal avec la séquence nucléique de référence. Il s'agit de préférence de séquences dont les séquences complémentaires sont susceptibles de s'hybrider spécifiquement avec les séquences de référence. De préférence, les conditions d'hybridation spécifiques ou de forte stringence seront telles qu'elles assurent au moins 75 %, de préférence 80%, 85%, 90%, 95% ou 98% d'identité après alignement optimal entre l'une des deux séquences et sa séquence complémentaire.
Une hybridation dans des conditions de forte stringence signifie que les conditions de température et de force ionique sont choisies de telle manière qu'elles permettent le maintien de l'hybridation entre deux fragments d'ADN complémentaires. A titre illustratif, des conditions de forte stringence de l'étape d'hybridation aux fins de définir les fragments polynucléotidiques décrits ci-dessus, sont avantageusement les suivantes
<Desc/Clms Page number 10>
Figure img00100001

L'hybridation ADN-ADN ou ADN-ARN est réalisée en deux étapes : (1) préhybridation à 42 C pendant 3 heures en tampon phosphate (20 mM, pH 7, 5) contenant 5 x SSC (1 x SSC correspond à une solution 0, 15 M NaCI + 0, 015 M citrate de sodium), 50 % de formamide, 7 % de sodium dodécyl sulfate (SDS), 10 x Denhardt's, 5 % de dextran sulfate et 1 % d'ADN de sperme de saumon ; (2) hybridation proprement dite pendant 20 heures à une température dépendant de la taille de la sonde (i. e. : 42OC, pour une sonde de taille > 100 nucléotides) suivie de 2 lavages de 20 minutes à 20 C en 2 x SSC + 2 % SDS, 1 lavage de 20 minutes à 20 C en 0, 1 x SSC + 0, 1 % SDS. Le dernier lavage est pratiqué en 0, 1 x SSC + 0, 1 % SDS pendant 30 minutes à 60 C pour une sonde de taille > 100 nucléotides. Les conditions d'hybridation de forte stringence décrites ci-dessus pour un polynucléotide de taille définie, peuvent être adaptées par l'homme du métier pour des oligonucléotides de taille plus grande ou plus petite, selon l'enseignement de Sambrook et al., (1989, Molecular cloning : a laboratory manual. 2" Ed. Cold Spring Harbor).
De plus, par fragment représentatif de séquences selon l'invention, on entend désigner tout fragment nucléotidique présentant au moins 15 nucléotides, de préférence au moins 30,75, 150,300 et 450 nucléotides consécutifs de la séquence dont il est issu.
Par fragment représentatif, on entend en particulier une séquence nucléique codant pour un fragment biologiquement actif d'un polypeptide, tel que défini plus loin.
Par fragment représentatif, on entend également les séquences intergéniques, et en particulier les séquences nucléotidiques portant les signaux de régulation (promoteurs, terminateurs, voire enhancers...).
Parmi lesdits fragments représentatifs, on préfère ceux ayant des séquences nucléotidiques correspondant à des cadres ouverts de lecture, dénommés séquences ORFs (ORF pour Open Reading Frame ), compris en général entre un codon d'initiation et un codon stop, ou entre deux codons stop, et codant pour des polypeptides, de préférence d'au moins 100 acides aminés, tel que par exemple, sans s'y limiter, les séquences ORFs qui seront décrites par la suite.
<Desc/Clms Page number 11>
Figure img00110001
La numérotation des séquences nucléotidiques ORFs qui sera utilisée par la suite dans la présente description correspond à la numérotation des séquences d'acides aminés des protéines codées par lesdites ORFs.
Les fragments représentatifs selon l'invention peuvent être obtenus par exemple par amplification spécifique telle que la PCR ou après digestion par des enzymes de restriction appropriés de séquences nucléotidiques selon l'invention, cette méthode étant décrite en particulier dans l'ouvrage de Sambrook et al.. Lesdits fragments représentatifs peuvent également être obtenus par synthèse chimique lorsque leur taille n'est pas trop importante, selon des méthodes bien connues de l'homme du métier.
Parmi les séquences contenant des séquences de l'invention, ou des fragments représentatifs, on entend également les séquences qui sont naturellement encadrées par des séquences qui présentent au moins 75%, 80%, 85%, 90%, 95% ou 98% d'identité avec les séquences selon l'invention.
Par séquence nucléotidique modifiée, on entend toute séquence nucléotidique obtenue par mutagénèse selon des techniques bien connues de l'homme du métier, et comportant des modifications par rapport aux séquences normales, par exemple des mutations dans les séquences régulatrices et/ou promotrices de l'expression du polypeptide, notamment conduisant à une modification du taux d'expression ou de l'activité dudit polypeptide.
Par séquence nucléotidique modifiée, on entend également toute séquence nucléotidique codant pour un polypeptide modifié tel que définit ci-après.
Les fragments représentatifs selon l'invention peuvent également être des sondes ou amorces, qui peuvent être utilisées dans des procédés de détection, d'identification, de dosage ou d'amplification de séquences nucléiques.
Une sonde ou amorce se définit, au sens de l'invention, comme étant un fragment d'acides nucléiques simple brin ou un fragment double brin dénaturé comprenant par exemple de 12 bases à quelques kb, notamment de 15 à quelques centaines de bases, de préférence de 15 à 50 ou 100 bases, et possédant une spécificité d'hybridation dans des conditions déterminées pour former un complexe d'hybridation avec un acide nucléique cible.
<Desc/Clms Page number 12>
Figure img00120001
Les sondes et amorces selon l'invention peuvent être marquées directement ou indirectement par un composé radioactif ou non radioactif par des méthodes bien connues de l'homme du métier, afin d'obtenir un signal détectable et/ou quantifiable (brevet FR 78 10975 et bDNA de Chiron EP 225 807 et EP 510 085).
Les séquences non marquées de polynucléotides selon l'invention peuvent être utilisées directement comme sonde ou amorce.
Les séquences sont généralement marquées pour obtenir des séquences utilisables pour de nombreuses applications. Le marquage des amorces ou des sondes selon l'invention est réalisé par des éléments radioactifs ou par des molécules non radioactives.
Parmi les isotopes radioactifs utilisés, on peut citer le 32p, le 33p, le 35S, le 3H ou le 1251. Les entités non radioactives sont sélectionnées parmi les ligands tels la biotine, l'avidine, la streptavidine, la dioxygénine, les haptènes, les colorants, les agents luminescents tels que les agents radioluminescents, chémoluminescents, bioluminescents, fluorescents, phosphorescents.
Les polynucléotides selon l'invention peuvent ainsi être utilisés comme amorce et/ou sonde dans des procédés mettant en oeuvre notamment la technique de PCR (amplification en chaîne par polymérase) (Rolfs et al., 1991, Berlin : SpringerVerlag). Cette technique nécessite le choix de paires d'amorces oligonucléotidiques encadrant le fragment qui doit être amplifié. On peut, par exemple, se référer à la
Figure img00120002

technique décrite dans le brevet américain US. NO 4, 683, 202. Les fragments amplifiés peuvent être identifiés, par exemple après une électrophorèse en gel d'agarose ou de polyacrylamide, ou après une technique chromatographique comme la filtration sur gel ou la chromatographie échangeuse d'ions, puis séquencés. La spécificité de l'amplification peut être contrôlée en utilisant les séquences nucléotidiques de polynucléotides de l'invention comme matrice, des plasmides contenant ces séquences ou encore les produits d'amplification dérivés. Les fragments nucléotidiques amplifiés peuvent être utilisés comme réactifs dans des réactions d'hybridation afin de mettre en évidence la présence, dans un échantillon biologique, d'un acide nucléique cible de séquence complémentaire à celle desdits fragments nucléotidiques amplifiés.
<Desc/Clms Page number 13>
Figure img00130001
L'invention vise également les acides nucléiques susceptibles d'être obtenus par amplification à l'aide d'amorces selon l'invention.
D'autres techniques d'amplification de l'acide nucléique cible peuvent être avantageusement employées comme alternative à la PCR (PCR-like) à l'aide de couple d'amorces de séquences nucléotidiques selon l'invention. Par PCR-like on entend désigner toutes les méthodes mettant en oeuvre des reproductions directes ou indirectes des séquences d'acides nucléiques, ou bien dans lesquelles les systèmes de marquage ont été amplifiés, ces techniques sont bien entendu connues. En général il s'agit de l'amplification de l'ADN par une polymérase ; lorsque l'échantillon d'origine est un ARN il convient préalablement d'effectuer une transcription reverse. Il existe actuellement de très nombreux procédés permettant cette amplification, comme par exemple la technique SDA (Strand Displacement Amplification) ou technique d'amplification à déplacement de brin (Walker et al., 1992, Nucleic Acids Res. 20 : 1691), la technique TAS (Transcription-based Amplification System) décrite par Kwoh et al. (1989, Proc. Natl. Acad. Sci. USA, 86,1173), la technique 3SR (Self-Sustained Sequence Replication) décrite par Guatelli et al. (1990, Proc. Natl. Acad. Sci. USA 87 : 1874), la technique NASBA (Nucleic Acid Sequence Based Amplification) décrite par Kievitis et al. (1991, J.
Virol. Methods, 35,273), la technique TMA (Transcription Mediated Amplification), la technique LCR (Ligase Chain Reaction) décrite par Landegren et al. (1988, Science 241,1077), la technique de RCR (Repair Chain Reaction) décrite par Segev (1992, Kessler C. Springer Verlag, Berlin, New-York, 197-205), la technique CPR (Cycling Probe Reaction) décrite par Duck et al. (1990, Biotechniques, 9,142), la technique d'amplification à la Q-béta-réplicase décrite par Miele et al. (1983, J. Mol. Biol., 171,281). Certaines de ces techniques ont depuis été perfectionnées.
Dans le cas où le polynucléotide cible à détecter est un ARNm, on utilise avantageusement, préalablement à la mise en oeuvre d'une réaction d'amplification à l'aide des amorces selon l'invention ou à la mise en oeuvre d'un procédé de détection à l'aide des sondes de l'invention, une enzyme de type transcriptase
<Desc/Clms Page number 14>
Figure img00140001

inverse afin d'obtenir un ADNc à partir de l'ARNm contenu dans l'échantillon biologique. L'ADNc obtenu servira alors de cible pour les amorces ou les sondes mises en oeuvre dans le procédé d'amplification ou de détection selon l'invention.
La technique d'hybridation de sondes peut être réalisée de manières diverses (Matthews et al., 1988, Anal. Biochem., 169,1-25). La méthode la plus générale consiste à immobiliser l'acide nucléique extrait des cellules de différents tissus ou de cellules en culture sur un support (tels que la nitrocellulose, le nylon, le polystyrène) et à incuber, dans des conditions bien définies, l'acide nucléique cible immobilisé avec la sonde. Après l'hybridation, l'excès de sonde est éliminé et les molécules hybrides formées sont détectées par la méthode appropriée (mesure de la radioactivité, de la fluorescence ou de l'activité enzymatique liée à la sonde).
Selon un autre mode de mise en oeuvre des sondes nucléiques selon l'invention, ces dernières peuvent être utilisées comme sondes de capture. Dans ce cas, une sonde, dite sonde de capture , est immobilisée sur un support et sert à capturer par hybridation spécifique l'acide nucléique cible obtenu à partir de l'échantillon biologique à tester et l'acide nucléique cible est ensuite détecté grâce à une seconde sonde, dite sonde de détection , marquée par un élément facilement détectable.
Parmi les fragments d'acides nucléiques intéressants, il faut ainsi citer en particulier les oligonucléotides anti-sens, c'est-à-dire dont la structure assure, par hybridation avec la séquence cible, une inhibition de l'expression du produit correspondant. Il faut également citer les oligonucléotides sens qui, par interaction avec des protéines impliquées dans la régulation de l'expression du produit correspondant, induiront soit une inhibition, soit une activation de cette expression.
De façon préférée, les sondes ou amorces selon l'invention sont immobilisées sur un support, de manière covalente ou non covalente. En particulier, le support peut être une puce à ADN ou un filtre à haute ou moyenne densité, également objets de la présente invention (brevets WO 97/29212, WO 98/27317, WO 97/10365 et WO 92/10588).
<Desc/Clms Page number 15>
Figure img00150001
On entend désigner par puce à ADN ou filtre haute densité, un support sur lequel sont fixées des séquences d'ADN, chacune d'entre elles pouvant être repérée par sa localisation géographique. Ces puces ou filtres diffèrent principalement par leur taille, le matériau du support, et éventuellement le nombre de séquences d'ADN qui y sont fixées.
On peut fixer les sondes ou amorces selon la première invention sur des supports solides, en particulier les puces à ADN, par différents procédés de fabrication. En particulier, on peut effectuer une synthèse in situ par adressage photochimique ou par jet d'encre. D'autres techniques consistent à effectuer une synthèse ex situé et à fixer les sondes sur le support de la puce à ADN par adressage mécanique, électronique ou par jet d'encre. Ces différents procédés sont bien connus de l'homme du métier.
Une séquence nucléotidique (sonde ou amorce) selon l'invention permet donc la détection et/ou l'amplification de séquences nucléiques spécifiques. En particulier, la détection de cesdites séquences est facilitée lorsque la sonde est fixée sur une puce à ADN, ou à un filtre haute densité.
L'utilisation de puces à ADN ou de filtres à haute densité permet en effet de déterminer l'expression de gènes dans un organisme présentant une séquence génomique proche de L. monocytogenes ou innocua et le typage de la souche en cause.
La séquence génomique de L. innocua et les séquences partielles de L. monocytogenes 4b, complétées par l'identification des gènes de ces organismes, telles que présentées dans la présente invention, servent de base à la construction de ces puces à ADN ou filtre.
La préparation de ces filtres ou puces consiste à synthétiser des oligonucléotides, correspondant aux extrémités 5'et 3'des gènes ou à des fragments plus internes pour amplifier des fragments d'une taille adaptée, par exemple comprise environ entre 300 et 800 bases. Ces oligonucléotides sont choisis en utilisant la séquence génomique et ses annotations divulguées par la présente invention. La température d'appariement des ces oligonucléotides aux places correspondantes sur l'ADN doit être approximativement la même pour
<Desc/Clms Page number 16>
Figure img00160001

chaque oligonucleotide. Ceci permet de préparer des fragments d'ADN correspondant à chaque gène par l'utilisation de condition de PCR appropriées dans un environnement hautement automatisé. Les fragments amplifiés sont ensuite immobilisés sur des filtres ou des supports en verre, silicium ou polymères synthétiques et ces milieux sont utilisés pour l'hybridation.
La disponibilité de tels filtres et/ou puces et de la séquence génomique correspondante annotée permet d'étudier l'expression de grands ensembles, voire de la totalité des gènes dans les micro-organismes associés à Listeria innocua et L. monocytogenes 4b, en préparant les ADN complémentaires, et en les hybridant à l'ADN ou aux oligonucléotides immobilisés sur les filtres ou les puces. De même, les filtres et/ou les puces permettent d'étudier la variabilité des souches ou des espèces, en préparant l'ADN de ces organismes et en les hybridant à l'ADN ou aux oligonucléotides immobilisés sur les filtres ou les puces.
Les différences entre les séquences génomiques des différentes souches ou espèces peuvent grandement affecter l'intensité de l'hybridation et, par conséquent, perturber l'interprétation des résultats. Il peut donc être nécessaire d'avoir la séquence précise des gènes de la souche que l'on souhaite étudier. La méthode de détection des gènes décrite plus loin en détail, impliquant la détermination de la séquence de fragments aléatoires d'un génome, et les organisant d'après la séquence du génome complet de L. innocua et L. monocytogenes 4b divulgué dans la présente invention, peut être très utile.
Les séquences nucléotidiques selon l'invention peuvent être utilisées dans des puces à ADN pour effectuer l'analyse de mutations. Cette analyse repose sur la constitution de puces capables d'analyser chaque base d'une séquence nucléotidique selon l'invention. On pourra notamment à cette fin mettre en oeuvre les techniques de micro-séquençage sur puce à ADN. Les mutations sont détectées par extension d'amorces immobilisées hybridant à la matrice des séquences analysées, juste en position adjacente de celle du nucléotide muté recherché. Une matrice simple-brin, ARN ou ADN, des séquences à analyser sera avantageusement préparée selon des méthodes classiques, à partir de produits amplifiés selon les techniques de type
<Desc/Clms Page number 17>
Figure img00170001

PCR. Les matrices d'ADN simple brin, ou d'ARN ainsi obtenues sont alors déposées sur la puce à ADN, dans des conditions permettant leur hybridation spécifique aux amorces immobilisées. Une polymérase thermostable, par exemple la Tth ou la Taq ADN polymérase, étend spécifiquement l'extrémité 3'de l'amorce immobilisée avec un analogue de nucléotide marqué complémentaire du nucléotide en position du site variable ; par exemple un cyclage thermique est réalisé en présence des didéoxyribonucléotides fluorescents. Les conditions expérimentales seront adaptées notamment aux puces employées, aux amorces immobilisées, aux polymérases employées, et au système de marquage choisi. Un avantage du microséquençage, par rapport aux techniques basées sur l'hybridation de sondes, est qu'il permet d'identifier tous les nucléotides variables avec une discrimination optimale dans des conditions de réactions homogènes ; utilisé sur des puces à ADN, il permet une résolution et une spécificité optimales pour la détection routinière et industrielle de mutations en multiplex.
L'utilisation des filtres à haute densité et/ou des puces permet ainsi d'obtenir des connaissances nouvelles sur la régulation des gènes dans les organismes d'importance industrielle, et en particulier les listera propagées dans diverses conditions. Elle permet aussi une identification rapide des différences entre les génomes des souches utilisées dans de multiples applications industrielles.
En outre, une puce à ADN ou un filtre peut être un outil extrêmement intéressant pour la détermination, la détection et/ou l'identification d'un microorganisme. Ainsi, on préfère également les puces à ADN selon l'invention qui contiennent en outre au moins une séquence nucléotidique d'un microorganisme autre que Listeria monocytogenes 4b ou Listeria innocua, immobilisée sur le support de ladite puce. De préférence, le microorganisme choisi l'est parmi les bactéries du genre Listeria (ci-après désignées comme bactéries associées à L. monocytogenes), ou les variants de Listeria monocytogenes EGD-e.
Une puce à ADN ou un filtre selon l'invention est un élément très utile de certains kits ou nécessaires pour la détection et/ou l'identification de microorganismes, en particulier les bactéries appartenant à l'espèce Listeria monocytogenes ou les microorganismes associés, également objets de l'invention.
<Desc/Clms Page number 18>
Figure img00180001
Par ailleurs, les puces à ADN ou les filtres selon l'invention, contenant des sondes ou amorces spécifiques de Listeria lnnocua ou monocytogenes, sont des éléments très avantageux de kits ou nécessaires pour la détection et/ou la quantification de l'expression de gènes de Listeria innocua ou monocytogenes (ou de microorganismes associés).
En effet, le contrôle de l'expression des gènes est un point critique pour optimiser la croissance et le rendement d'une souche, soit en permettant l'expression d'un ou plusieurs gènes nouveaux, soit en modifiant l'expression de gènes déjà présents dans la cellule. La présente invention fournit l'ensemble des séquences
Figure img00180002

naturellement actives chez L. ititiocita permettant l'expression des gènes. Elle permet ainsi la détermination de l'ensemble des séquences exprimées chez L. innoclla. Elle fournit également un outil permettant de repérer les gènes dont l'expression suit un schéma donné Pour réaliser cela, l'ADN de tout ou partie des gènes de L. innoclla et monocytogenes peut être amplifié grâce à des amorces selon l'invention, puis fixé à un support comme par exemple le verre ou le nylon ou une puce à ADN, afin de construire un outil permettant de suivre le profil d'expression de ces gènes Cet outil, constitué de ce support contenant les séquences codantes sert de matrice d'hybridation à un mélange de molécules marquées reflétant les ARN messagers exprimés dans la cellule (en particulier les sondes marquées selon l'invention). En répétant cette expérience à différents instants et en combinant l'ensemble de ces données par un traitement approprié, on obtient alors les profils d'expression de l'ensemble de ces gènes. La connaissance des séquences qui suivent un schéma de régulation donné peut aussi être mise à profit pour rechercher de manière dirigée, par exemple par homologie, d'autres séquences suivant globalement, mais de manière légèrement différente le même schéma de régulation. En complément, il est possible d'isoler chaque séquence de contrôle présente en amont des segments servant de sondes et d'en suivre l'activité à l'aide de moyen approprié comme un gène raporteur (luciférase, ss-galactosidase, GFP). Ces séquences isolées peuvent ensuite être modifiées et assemblées par ingénierie métabolique avec des séquences d'intérêt en vue de leur expression optimale.
<Desc/Clms Page number 19>
Figure img00190001
L'invention concerne également les polypeptides codés par une séquence nucléotidique selon l'invention, de préférence, par un fragment représentatif des séquences précédentes et correspondant à une séquence ORF. En particulier, les polypeptides de Listeria innocua de SEQ ID NO 12 à SEQ ID N 689 et SEQ ID NO 2042 et 2043 et SEQ ID NO 2047 et 2048 et SEQ ID Non 2053 à 2056 ou ceux de Listeria monocytogenes 4b, caractérisés en ce qu'ils sont choisis parmi les séquences SEQ ID NO 690 à SEQ ID NO 1067 et SEQ ID NO 2049 à SEQ ID NO 2052 sont objet de l'invention.
L'invention comprend également les polypeptides caractérisés en ce qu'ils comprennent un polypeptide choisi parmi : a) un polypeptide selon l'invention ;
Figure img00190002

b) un polypeptide présentant au moins 80 % de préférence 85 %, 90 %, 95 % et 98 % d'identité avec un polypeptide selon l'invention ; c) un fragment d'au moins 5 acides aminés d'un polypeptide selon l'invention, ou tel que défini en b) ; d) un fragment biologiquement actif d'un polypeptide selon l'invention, ou tel que défini en b) ou c) ; et e) un polypeptide selon l'invention, ou tel que défini en b), c) ou d) modifié.
Les séquences nucléotidiques codant pour les polypeptides décrits précédemment sont également objet de l'invention.
Dans la présente description, les termes polypeptides, séquences polypeptidiques, peptides et protéines sont interchangeables. Le terme polypeptide comprend toute séquence d'acides aminés permettant de générer une réponse anticorps.
Il doit être compris que l'invention ne concerne pas les polypeptides sous forme naturelle, c'est-à-dire qu'ils ne sont pas pris dans leur environnement naturel. En revanche, elle concerne ceux qui ont pu être isolés ou obtenus par purification à partir de sources naturelles, ou bien obtenus par recombinaison génétique, ou par synthèse chimique, et qu'ils peuvent alors comporter des acides aminés non naturels comme cela sera décrit plus loin.
<Desc/Clms Page number 20>
Figure img00200001
Par polypeptide présentant un certain pourcentage d'identité avec un autre, que l'on désignera également par polypeptide homologue, on entend désigner les polypeptides présentant par rapport aux polypeptides naturels, certaines modifications, en particulier une délétion, addition ou substitution d'au moins un acide aminé, une troncation, un allongement, une solution chimérique et/ou une mutation, ou les polypeptides présentant des modifications post-traductionnelles.
Parmi les polypeptides homologues, on préfère ceux dont la séquence d'acides aminés présentent au moins 80 %, de préférence 85 %, 90 %, 95 % et 98 % d'homologie avec les séquences d'acides aminés des polypeptides selon l'invention.
Dans le cas d'une substitution, un ou plusieurs acide (s) aminé (s) consécutifs) ou non consécutif (s) sont remplacés par des acides aminés équivalents .
L'expression acides aminés équivalents vise ici à désigner tout acide aminé susceptible d'être substitué à l'un des acides aminés de la structure de base sans cependant modifier essentiellement les activités biologiques des peptides correspondant telles qu'elles seront définies par la suite.
Ces acides aminés équivalents peuvent être déterminés soit en s'appuyant sur leur homologie de structure avec les acides aminés auxquels ils se substituent, soit sur des résultats d'essais comparatifs d'activité biologique entre les différents polypeptides susceptibles d'être effectués.
A titre d'exemple, on mentionne les possibilités de substitution susceptibles d'être effectuées sans qu'il résulte en une modification approfondie de l'activité biologique du polypeptide modifié correspondant. On peut remplacer ainsi la leucine par la valine ou l'isoleucine, l'acide aspartique par l'acide glutamine, la glutamine par l'asparagine, l'arginine par la lysine, etc... les substitutions inverses étant naturellement envisageables dans les mêmes conditions.
Les polypeptides homologues correspondent également aux polypeptides codés par les séquences nucléotidiques homologues ou identiques, telles que définies précédemment et comprennent ainsi dans la présente définition des polypeptides mutés ou correspondant à des variations inter ou intra espèces, pouvant exister chez Listeria, et qui correspondent notamment à des troncatures, substitutions, délétions et/ou additions, d'au moins un résidu d'acides aminés.
<Desc/Clms Page number 21>
Figure img00210001
Il est entendu que l'on calcule le pourcentage d'identité entre deux polypeptides de la même façon qu'entre deux séquences d'acides nucléiques. Ainsi, le pourcentage d'identité entre deux polypeptides est calculé après alignement optimal de ces deux séquences, sur une fenêtre d'homologie maximale. Pour définir ladite fenêtre d'homologie maximale, on peut utiliser les mêmes algorithmes que pour les séquences d'acide nucléique.
Par fragment biologiquement actif d'un polypeptide selon l'invention, on entend désigner en particulier un fragment de polypeptide, tel que défini ci-après, présentant au moins une des caractéristiques biologiques des polypeptides selon l'invention, notamment en ce qu'il est capable d'exercer de manière générale une activité même partielle, tel que par exemple : - une activité enzymatique (métabolique) ou une activité pouvant être impliquée dans la biosynthèse ou la biodégradation de composés organiques ou inorganiques ; - une activité structurelle (enveloppe cellulaire, molécule chaperonne, ribosome) ; une activité de transport (d'énergie, d'ion) ; ou dans la sécrétion de protéine ;
Figure img00210002

une activité dans le processus de réplication, amplification, préparation, transcription, traduction ou maturation, notamment de l'ADN, de l'ARN ou des protéines.
Par fragment de polypeptide selon l'invention, on entend désigner un polypeptide comportant au minimum 5 acides aminés, de préférence 10,15, 25,50, 100 et 150 acides aminés.
Les fragments de polypeptides peuvent correspondre à des fragments isolés ou purifiés naturellement présents dans les souches de Listeria, ou à des fragments qui peuvent être obtenus par clivage dudit polypeptide par une enzyme protéolitique telle que la trypsine ou la chymotrypsine ou la collagénase, par un réactif chimique (bromure de cyanogène, CNBr) ou en plaçant ledit polypeptide dans un environnement très acide (par exemple à pH = 2,5). Des fragments polypeptidiques
<Desc/Clms Page number 22>
Figure img00220001

peuvent également être préparés par synthèse chimique, à partir d'hôtes transformés par un vecteur d'expression selon l'invention qui contiennent un acide nucléique permettant l'expression dudit fragment, et placé sous le contrôle des éléments de régulation et/ou d'expression appropriés.
Par polypeptide modifié d'un polypeptide selon l'invention, on entend désigner un polypeptide obtenu par recombinaison génétique ou par synthèse chimique comme décrit plus loin, qui présente au moins une modification par rapport à la séquence normale. Ces modifications peuvent être notamment portées sur des acides aminés nécessaires pour la spécificité ou l'efficacité de l'activité, ou à l'origine de la conformation structurale, de la charge, ou de l'hydrophobicité du polypeptide selon l'invention. On peut ainsi créer des polypeptides d'activité équivalente, augmentée ou diminuée, ou de spécificité équivalente, plus étroite ou plus large. Parmi les polypeptides modifiés, il faut citer les polypeptides dans lesquels jusqu'à cinq acides aminés peuvent être modifiés, tronqués à l'extrémité N ou C-terminale, ou bien délétés, ou ajoutés.
Comme cela est indiqué, les modifications d'un polypeptide ont pour objectif notamment : de permettre sa mise en oeuvre dans des procédés de biosynthèse ou de biodégradation de composés organiques ou inorganiques, de permettre sa mise en oeuvre dans des procédés de réplication, d'amplification, de réparation et règle de transcription, de traduction, ou de maturation notamment de l'ADN, l'ARN, ou de protéines, - de permettre sa sécrétion améliorée, - de modifier sa solubilité, l'efficacité ou la spécificité de son activité, ou encore de faciliter sa purification.
La synthèse chimique présente également l'avantage de pouvoir utiliser des acides aminés non naturels ou des liaisons non peptidiques. Ainsi, il peut être intéressant d'utiliser des acides aminés non naturels, par exemple sous forme D, ou des analogues d'acides aminés, notamment des formes souffrées.
La présente invention fournit la séquence nucléotidique du génome de
Figure img00220002

Listeria innocua et la séquence partielle de Listeria monocytogenes sérotype 4b, ainsi que certaines séquences polypeptidiques.
<Desc/Clms Page number 23>
Figure img00230001
D'une manière préférée, l'invention est relative à une séquence nucléotidique selon l'invention, caractérisée en ce qu'elle code pour un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans la biosynthèse des acides aminés.
De manière préférée, l'invention est relative à une séquence nucléotidique selon l'invention, caractérisée en ce qu'elle code pour un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans la biosynthèse des cofacteurs, groupes prosthétiques et transporteurs.
De manière préférée, l'invention est relative à une séquence nucléotidique selon l'invention, caractérisée en ce qu'elle code pour un polypeptide d'enveloppe cellulaire ou présent à la surface de Listeria innocua ou monocytogenes 4b ou pour un de ses fragments.
De manière préférée, l'invention est relative à une séquence nucléotidique selon l'invention, caractérisée en ce qu'elle code pour un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans la machinerie cellulaire.
De manière préférée, l'invention est relative à une séquence nucléotidique
Figure img00230002

selon l'invention, caractérisée en ce qu'elle code pour un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans le métabolisme intermédiaire central.
De manière préférée, l'invention est relative à une séquence nucléotidique selon l'invention, caractérisée en ce qu'elle code pour un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans le métabolisme énergétique.
De manière préférée, l'invention est relative à une séquence nucléotidique selon l'invention, caractérisée en ce qu'elle code pour un polypeptide de Listeria
Figure img00230003

innocua ou monocytogenes 4b ou un de ses fragments impliqué dans le métabolisme des acides gras et des phospholipides.
De manière préférée, l'invention est relative à une séquence nucléotidique selon l'invention, caractérisée en ce qu'elle code pour un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans le métabolisme des nucléotides, des purines, des pyrimidines ou nucléosides.
<Desc/Clms Page number 24>
Figure img00240001
De manière préférée, l'invention est relative à une séquence nucléotidique selon l'invention, caractérisée en ce qu'elle code pour un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans les fonctions de régulation.
De manière préférée, l'invention est relative à une séquence nucléotidique selon l'invention, caractérisée en ce qu'elle code pour un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans le processus de réplication.
De manière préférée, l'invention est relative à une séquence nucléotidique selon l'invention, caractérisée en ce qu'elle code pour un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans le processus de transcription.
De manière préférée, l'invention est relative à une séquence nucléotidique selon l'invention, caractérisée en ce qu'elle code pour un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans le processus de traduction.
De manière préférée, l'invention est relative à une séquence nucléotidique selon l'invention, caractérisée en ce qu'elle code pour un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans le processus de transport et de liaison des protéines.
De manière préférée, l'invention est relative à une séquence nucléotidique selon l'invention, caractérisée en ce qu'elle code pour un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans l'adaptation aux conditions atypiques.
De manière préférée, l'invention est relative à une séquence nucléotidique selon l'invention, caractérisée en ce qu'elle code pour un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments dans la sensibilité aux médicaments et analogues.
De manière préférée, l'invention est relative à une séquence nucléotidique selon l'invention, caractérisée en ce qu'elle code pour un polypeptide de Listeria
Figure img00240002

innocua ou monocytogenes 4b ou un de ses fragments impliqué dans les fonctions relatives aux transposons.
<Desc/Clms Page number 25>
Figure img00250001
De manière préférée, l'invention est relative à une séquence nucléotidique selon l'invention, caractérisée en ce qu'elle code pour un polypeptide spécifique de Listeria innocua ou monocytogenes 4b ou un de ses fragments.
Sous un autre aspect, de manière préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il s'agit d'un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans la biosynthèse des acides aminés.
Sous un autre aspect, de manière préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il s'agit d'un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans la biosynthèse des cofacteurs, groupes prosthétiques et transporteurs.
Sous un autre aspect, de manière préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il s'agit d'un polypeptide d'enveloppe cellulaire ou de surface de Listeria innocua ou monocytogenes 4b ou un de ses fragments.
Sous un autre aspect, de manière préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il s'agit d'un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans la machinerie cellulaire.
Sous un autre aspect, de manière préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il s'agit d'un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans le métabolisme intermédiaire central.
Sous un autre aspect, de manière préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il s'agit d'un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans le métabolisme énergétique.
Sous un autre aspect, de manière préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il s'agit d'un polypeptide de Listeria innoclla ou monocytogenes 4b ou un de ses fragments impliqué dans le métabolisme des acides gras et des phospholipides.
<Desc/Clms Page number 26>
Figure img00260001
Sous un autre aspect, de manière préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il s'agit d'un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans le métabolisme des nucléotides, des purines, des pyrimidines ou nucléosides.
Sous un autre aspect, de manière préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il s'agit d'un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans les fonctions de régulation.
Sous un autre aspect, de manière préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il s'agit d'un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans le processus de réplication.
Sous un autre aspect, de manière préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il s'agit d'un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans le processus de transcription.
Sous un autre aspect, de manière préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il s'agit d'un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans le processus de traduction.
Sous un autre aspect, de manière préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il s'agit d'un polypeptide de
Figure img00260002

Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans le processus de transport et de liaison des protéines.
Sous un autre aspect, de manière préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il s'agit d'un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans l'adaptation aux conditions atypiques.
Sous un autre aspect, de manière préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il s'agit d'un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments dans la sensibilité aux médicaments et analogues
<Desc/Clms Page number 27>
Figure img00270001

Sous un autre aspect, de manière préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il s'agit d'un polypeptide de Listeria innocua ou monocytogenes 4b ou un de ses fragments impliqué dans les fonctions relatives aux transposons.
Sous un autre aspect, de manière préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il s'agit d'un polypeptide spécifique de Listeria innocua ou monocytogenes 4b ou un de ses fragments.
Il est important de noter toutefois qu'un organisme vivant est un tout et doit être pris comme tel. Ainsi, afin de pouvoir se développer et exhiber ses propriétés, tout organisme a besoin d'interactions entre les différentes voies métaboliques. Ainsi, la classification énoncée ci-dessus ne doit pas être considérée comme limitative, un gène pouvant être impliqué dans deux voies métaboliques distinctes.
La présente invention a également pour objet les séquences nucléotidiques et/ou de polypeptides selon l'invention, caractérisées en ce que lesdites séquences sont enregistrées sur un support d'enregistrement dont la forme et la nature facilitent la lecture, l'analyse et/ou l'exploitation de ladite ou desdites séquence (s).
Ces supports peuvent également contenir d'autres informations extraites de la présente invention, notamment les analogies avec des séquences déjà connues, et/ou des informations concernant les séquences nucléotidiques et/ou de polypeptides d'autres microorganismes afin de faciliter l'analyse comparative et l'exploitation des résultats obtenus.
Parmi cesdits supports d'enregistrement, on préfère en particulier les supports lisibles par un ordinateur, tels les supports magnétiques, optiques, électriques ou hybrides, en particulier les disquettes informatiques, les CD-ROM, les serveurs informatiques. De tels supports d'enregistrement sont également objet de l'invention.
Les supports d'enregistrement selon l'invention, avec les informations apportées, sont très utiles pour le choix d'amorces ou de sondes nucléotidiques pour la détermination de gènes dans Listeria innocua ou monocytogenes 4b ou souches proches de cet organisme. De même, l'utilisation de ces supports pour l'étude du polymorphisme génétique de souches proches de Listeria innocua ou monocytogenes 4b, en particulier par la détermination des régions de colinéarité, est
<Desc/Clms Page number 28>
Figure img00280001

très utile dans la mesure où ces supports fournissent non seulement la séquence nucléotidique du génome de Listeria innocua ou monocytogenes 4b, mais également l'organisation génomique dans ladite séquence. Ainsi, les utilisations de supports d'enregistrement selon l'invention sont également des objets de l'invention.
L'analyse d'homologie entre différentes séquences s'effectue en effet avantageusement à l'aide de logiciels de comparaison de séquences, tels le logiciel Blast, ou les logiciels de la trousse GCG, décrits précédemment.
L'invention vise également les vecteurs de clonage et/ou d'expression, qui contiennent une séquence nucléotidique selon l'invention.
Les vecteurs selon l'invention comportent de préférence des éléments qui permettent l'expression et/ou la sécrétion des séquences nucléotidiques dans une cellule hôte déterminée.
Le vecteur doit alors comporter un promoteur, des signaux d'initiation et de terminaison de la traduction, ainsi que des régions appropriées de régulation de la transcription. Il doit pouvoir être maintenu de façon stable dans la cellule hôte et peut éventuellement posséder des signaux particuliers qui spécifient la sécrétion de la protéine traduite. Ces différents éléments sont choisis et optimisés par l'homme du métier en fonction de l'hôte cellulaire utilisé. A cet effet, les séquences nucléotidiques selon l'invention peuvent être insérées dans des vecteurs à réplication autonome au sein de l'hôte choisi, ou être des vecteurs intégratifs de l'hôte choisi.
De tels vecteurs sont préparés par des méthodes couramment utilisées par l'homme du métier, et les clones résultant peuvent être introduits dans un hôte approprié par des méthodes standards, telle que la lipofection, l'électroporation, le choc thermique, ou des méthodes chimiques.
Les vecteurs selon l'invention sont par exemple des vecteurs d'origine plasmidique ou virale. Ils sont utiles pour transformer des cellules hôtes afin de cloner ou d'exprimer les séquences nucléotidiques selon l'invention.
L'invention comprend également les cellules hôtes transformées par un vecteur selon l'invention.
<Desc/Clms Page number 29>
Figure img00290001
L'hôte cellulaire peut être choisi parmi des systèmes procaryotes ou eucaryotes, par exemple les cellules bactériennes mais également les cellules de levure ou les cellules animales, en particulier les cellules de mammifères. On peut également utiliser des cellules d'insectes ou des cellules de plantes. Les cellules hôtes préférées selon l'invention sont en particulier les cellules procaryotes, de préférence les bactéries appartenant au genre Listeria, à l'espèce Listeria innocua
Figure img00290002

ou monocytogenes 4b, ou les microorganismes associés à l'espèce Listeria innocua y ou monocytogenes 4b. L'invention concerne également les végétaux et les animaux, excepté l'homme, qui comprennent une cellule transformée selon l'invention. Les cellules transformées selon l'invention sont utilisables dans des procédés de préparation de polypeptides recombinants selon l'invention. Les procédés de préparation d'un polypeptide selon l'invention sous forme recombinante, caractérisés en ce qu'ils mettent en oeuvre un vecteur et/ou une cellule transformée par un vecteur selon l'invention sont eux-mêmes compris dans la présente invention. De préférence, on cultive une cellule transformée par un vecteur selon l'invention dans des conditions qui permettent l'expression dudit polypeptide et on récupère ledit peptide recombinant.
Ainsi qu'il a été dit, l'hôte cellulaire peut être choisi parmi des systèmes procaryotes ou eucaryotes. En particulier, il est possible d'identifier des séquences nucléotidiques selon l'invention, facilitant la sécrétion dans un tel système procaryote ou eucaryote. Un vecteur selon l'invention portant une telle séquence peut donc être avantageusement utilisé pour la production de protéines recombinantes, destinées à être sécrétées. En effet, la purification de ces protéines recombinantes d'intérêt sera facilité par le fait qu'elles sont présentent dans le surnageant de la culture cellulaire plutôt qu'à l'intérieur des cellules hôtes.
On peut également préparer les polypeptides selon l'invention par synthèse chimique. Un tel procédé de préparation est également un objet de l'invention.
L'homme du métier connaît les procédés de synthèse chimique, par exemple les techniques mettant en oeuvre des phases solides (voir notamment Steward et al., 1984, Solid phase peptides synthesis, Pierce Chem. Company, Rockford, 111,2ème éd., (1984)) ou des techniques utilisant des phases solides partielles, par condensation de fragments ou par une synthèse en solution classique. Les
<Desc/Clms Page number 30>
Figure img00300001

polypeptides obtenus par synthèse chimique et pouvant comporter des acides aminés non naturels correspondant sont également compris dans l'invention.
L'invention est en outre relative à des polypeptides hybrides présentant au moins un polypeptide ou un de ses fragments selon l'invention, et une séquence d'un polypeptide susceptible d'induire une réponse immunitaire chez l'homme ou l'animal.
Avantageusement, le déterminant antigénique est tel qu'il est susceptible d'induire une réponse humorale et/ou cellulaire.
Un tel déterminant pourra comprendre un polypeptide ou un de ses fragments selon l'invention sous forme glycosylée utilisé en vue d'obtenir des compositions immunogènes susceptibles d'induire la synthèse d'anticorps dirigés contre des épitopes multiples. Lesdits polypeptides ou leurs fragments glycosylés font également partie de l'invention
Ces molécules hybrides peuvent être constituées en partie d'une molécule porteuse de polypeptides ou de leurs fragments selon l'invention, associée à une partie éventuellement immunogène, en particulier un épitope de la toxine diphtérique, la toxine tétanique, un antigène de surface du virus de l'hépatite B (brevet FR 79 21811), l'antigène VP 1 du virus de la poliomyélite ou toute autre toxine ou antigène viral ou bactérien.
Les procédés de synthèse des molécules hybrides englobent les méthodes utilisées en génie génétique pour construire des séquences nucléotidiques hybrides codant pour les séquences polypeptidiques recherchées. On pourra, par exemple, se référer avantageusement à la technique d'obtention de gènes codant pour des protéines de fusion décrite par Minton en 1984.
Lesdites séquences nucléotidiques hybrides codant pour un polypeptide hybride ainsi que les polypeptides hybrides selon l'invention caractérisés en ce qu'il s'agit de polypeptides recombinants obtenus par l'expression desdites séquences nucléotidiques hybrides, font également partie de l'invention.
L'invention comprend également les vecteurs caractérisés en ce qu'ils contiennent une desdites séquences nucléotidiques hybrides. Les cellules hôtes transformées par lesdits vecteurs, les animaux transgéniques comprenant une desdites cellules transformées ainsi que les procédés de préparation de polypeptides
<Desc/Clms Page number 31>
Figure img00310001

recombinants utilisant lesdits vecteurs, lesdites cellules transformées et/ou lesdits animaux transgéniques font également partie de l'invention.
Le couplage entre un polypeptide selon l'invention et un polypeptide immunogène, peut être effectué par voie chimique, ou par voie biologique. Ainsi, selon l'invention, il est possible d'introduire un ou plusieurs élément (s) de liaison, notamment des acides aminés pour faciliter les réactions de couplage entre le polypeptide selon l'invention, et le polypeptide immunostimulateur, le couplage covalent de l'antigène immunostimulateur pouvant être réalisé à l'extrémité N ou C-terminale du polypeptide selon l'invention. Les réactifs bifonctionnels permettant ce couplage sont déterminés en fonction de l'extrémité choisie pour réaliser ce couplage, et les techniques de couplage sont bien connues de l'homme du métier.
Les conjugués issus d'un couplage de peptides peuvent être également préparés par recombinaison génétique. Le peptide hybride (conjugué) peut en effet être produit par des techniques d'ADN recombinant, par insertion ou addition à la séquence d'ADN codant pour le polypeptide selon l'invention, d'une séquence codant pour le ou les peptide (s) antigène (s), immunogène (s) ou haptène (s). Ces techniques de préparation de peptides hybrides par recombinaison génétique sont bien connues de l'homme du métier (voir par exemple Makrides, 1996, Microbiological Reviews 60, 512-538).
De préférence, ledit polypeptide immunitaire est choisi dans le groupe des peptides contenant les anatoxines, notamment le toxoïde diphtérique ou le toxoïde tétanique, les protéines dérivées du Streptocoque (comme la protéine de liaison à la séralbumine humaine), les protéines membranaires OMPA et les complexes de protéines de membranes externes, les vésicules de membranes externes ou les protéines de chocs thermiques.
Les polypeptides hybrides selon l'invention sont très utiles pour obtenir des anticorps monoclonaux ou polyclonaux, capables de reconnaître spécifiquement les polypeptides selon l'invention. En effet, un polypeptide hybride selon l'invention permet la potentiation de la réponse immunitaire, contre le polypeptide selon l'invention couplé à la molécule immunogène. De tels anticorps monoclonaux ou polyclonaux, leurs fragments, ou les anticorps chimériques, reconnaissant les polypeptides selon l'invention, sont également objets de l'invention
<Desc/Clms Page number 32>
Figure img00320001

Les anticorps monoclonaux spécifiques peuvent être obtenus selon la méthode classique de culture d'hybridome décrite par Köhler et Milstein (1975, Nature 256,495).
Les anticorps selon l'invention sont par exemple des anticorps chimériques, des anticorps humanisés, des fragments Fab, ou F (ab') 2. Ils peuvent également se présenter sous forme d'immunoconjugués ou d'anticorps marqués afin d'obtenir un signal détectable et/ou quantifiable.
Ainsi, les anticorps selon l'invention peuvent être employés dans un procédé pour la détection et/ou l'identification de bactéries appartenant à l'espèce Listeria innocua ou monocytogenes 4b ou à un microorganisme associé dans un échantillon biologique, caractérisé en ce qu'il comprend les étapes suivantes : a) mise en contact de l'échantillon biologique avec un anticorps selon l'invention ; b) mise en évidence du complexe antigène-anticorps éventuellement formé.
Les anticorps selon la présente invention sont également utilisables afin de détecter une expression d'un gène de Listeria innocua ou monocytogenes 4b ou de microorganismes associés. En effet, la présence du produit d'expression d'un gène reconnu par un anticorps spécifique dudit produit d'expression peut être détectée par la présence d'un complexe antigène-anticorps formé après la mise en contact de
Figure img00320002

la souche de Listeria innocua ou monocytogenes 4b ou du microorganisme associé avec un anticorps selon l'invention. La souche bactérienne utilisée peut avoir été préparée , c'est-à-dire centrifugée, lysée, placée dans un réactif approprié pour la constitution du milieu propice à la réaction immunologique. En particulier, on préfère un procédé de détection de l'expression dans le gène, correspondant à un Western blot, pouvant être effectué après une électrophorèse sur gel de polyacrylamide d'un lysat de la souche bactérienne, en présence ou en l'absence de conditions réductrices (SDS-PAGE). Après migration et séparation des protéines sur le gel de polyacrylamide, on transfère lesdites protéines sur une membrane appropriée (par exemple en nylon) et on détecte la présence de la protéine ou du polypeptide d'intérêt, par mise en contact de ladite membrane avec un anticorps selon l'invention.
<Desc/Clms Page number 33>
Figure img00330001
Ainsi, la présente invention comprend également les kits ou nécessaires pour la mise en oeuvre d'un procédé tel que décrit (de détection de l'expression d'un gène de Listeria innocua ou monocytogenes 4b ou d'un microorganisme associé, ou pour la détection et/ou l'identification de bactéries appartenant à l'espèce Listeria innocua ou monocytogenes 4b ou un microorganisme associé), comprenant les éléments suivants : a) un anticorps polyclonal ou monoclonal selon l'invention ; b) éventuellement, les réactifs pour la constitution du milieu propice à la réaction immunologique ; c) éventuellement, les réactifs permettant la mise en évidence des complexes antigène-anticorps produits par la réaction immunologique.
Les polypeptides et les anticorps selon l'invention peuvent avantageusement être immobilisés sur un support, notamment une puce à protéines. Une telle puce à protéines est un objet de l'invention, et peut également contenir au moins un polypeptide d'un microorganisme autre que Listeria innocua ou monocytogenes 4b ou un anticorps dirigé contre un composé d'un microorganisme autre que Listeria innocua ou monocytogenes 4b.
Les puces à protéines ou filtres à haute densité contenant des protéines selon l'invention peuvent être construits de la même manière que les puces à ADN selon l'invention. En pratique, on peut effectuer la synthèse des polypeptides directement fixés sur la puce à protéines, ou effectuer une synthèse ex situ suivie d'une étape de fixation sur ladite puce du polypeptide synthétisé. Cette dernière méthode est préférable, lorsque l'on désire fixer des protéines de taille importante sur le support, ces protéines étant avantageusement préparées par génie génétique. Toutefois, si l'on ne désire fixer que des peptides sur le support de ladite puce, il peut être plus intéressant de procéder à la synthèse desdits peptides directement in situ.
Les puces à protéines selon l'invention peuvent être avantageusement utilisées dans des kits ou nécessaires pour la détection et/ou l'identification de bactéries associées à l'espèce Listeria innocua ou monocytogenes 4b ou à un microorganisme, ou de façon plus générale dans des kits ou nécessaires pour la détection et/ou l'identification de microorganismes. Lorsque l'on fixe les
<Desc/Clms Page number 34>
Figure img00340001

polypeptides selon l'invention sur les puces à ADN, on recherche la présence d'anticorps dans les échantillons testés, la fixation d'un anticorps selon l'invention sur le support de la puce à protéines permettant l'identification de la protéine dont ledit anticorps est spécifique.
De préférence, on fixe un anticorps selon l'invention sur le support de la puce à protéines, et on détecte la présence de l'antigène correspondant, spécifique de Listeria innocua ou monocytogenes 4b ou d'un microorganisme associé.
Une puce à protéines ci-dessus décrite peut être utilisée pour la détection de produits de gènes, pour établir un profil d'expression desdits gènes, en complément d'une puce à ADN selon l'invention.
Les puces à protéines selon l'invention sont également extrêmement utiles pour les expériences de protéomique, qui étudie les interactions entre les différentes protéines d'un microorganisme donné. De façon simplifiée, on fixe des peptides représentatifs des différentes protéines d'un organisme sur un support. Puis, on met ledit support en contact avec des protéines marquées, et après une étape optionnelle de rinçage, on détecte des interactions entre lesdites protéines marquées et les peptides fixés sur la puce à protéines.
Ainsi, les puces à protéines comprenant une séquence polypeptidique selon l'invention ou un anticorps selon l'invention sont objet de l'invention, ainsi que les kits ou nécessaires les contenant.
La présente invention couvre également un procédé de détection et/ou d'identification de bactéries appartenant à l'espèce Listeria innocua ou monocytogenes 4b ou à un microorganisme associé dans un échantillon biologique, qui met en oeuvre une séquence nucléotidique selon l'invention.
Il doit être entendu que le terme échantillon biologique concerne dans la présente invention les échantillons prélevés à partir d'un organisme vivant (en particulier sang, tissus, organes ou autres prélevés à partir d'un mammifère) ou un échantillon contenant du matériel biologique, c'est-à-dire de l'ADN ou de l'ARN Un tel échantillon biologique comprend aussi les compositions alimentaires contenant des bactéries (par exemple les fromages, les produits laitiers), mais également des compositions alimentaires contenant des levures (bières, pains) ou autres. Le terme échantillon biologique concerne aussi les bactéries isolées à partir de ces prélèvements ou compositions alimentaires.
<Desc/Clms Page number 35>
Figure img00350001
Le procédé de détection et/ou d'identification mettant en oeuvre les séquences nucléotidiques selon l'invention peut être de diverse nature.
On préfère un procédé comportant les étapes suivantes : a) éventuellement, isolement de l'ADN à partir de l'échantillon biologique à analyser, ou obtention d'un ADNc à partir de l'ARN de l'échantillon biologique ; b) amplification spécifique de l'ADN de bactéries appartenant à l'espèce
Listeria innocua ou monocytogenes 4b ou à un micro-organisme associé à l'aide d'au moins une amorce selon l'invention ; c) mise en évidence des produits d'amplification.
Ce procédé est basé sur l'amplification spécifique de l'ADN, en particulier par une réaction d'amplification en chaîne.
On préfère également un procédé comprenant les étapes suivantes : a) mise en contact d'une sonde nucléotidique selon l'invention avec un échantillon biologique, l'acide nucléique contenu dans l'échantillon biologique ayant, le cas échéant, préalablement été rendu accessible à l'hybridation, dans des conditions permettant l'hybridation de la sonde à l'acide nucléique d'une bactérie appartenant à l'espèce Listeria innocua ou monocytogenes 4b ou à un micro-organisme associé ; b) mise en évidence de l'hybride éventuellement formé entre la sonde nucléotidique et l'ADN de l'échantillon biologique.
Un tel procédé ne doit pas être limité à la détection de la présence de l'ADN contenu dans l'échantillon biologique à tester, il peut être également mis en oeuvre pour détecter l'ARN contenu dans ledit échantillon. Ce procédé englobe en particulier les Southern et Northern blot.
Un autre procédé préféré selon l'invention comprend les étapes suivantes : a) mise en contact d'une sonde nucléotidique immobilisée sur un support selon l'invention avec un échantillon biologique, l'acide nucléique de l'échantillon, ayant, le cas échéant, été préalablement rendu accessible à l'hybridation, dans des conditions permettant l'hybridation de la sonde à l'acide nucléique d'une bactérie appartenant à l'espèce Listeria innocua ou monocytogenes 4b ou à un micro-organisme associé ;
<Desc/Clms Page number 36>
Figure img00360001

b) mise en contact de l'hybride formé entre la sonde nucléotidique immobilisée sur un support et l'acide nucléique contenu dans l'échantillon biologique, le cas échéant après élimination de l'ADN de l'échantillon biologique n'ayant pas hybridé avec la sonde, avec une sonde nucléotidique marquée selon l'invention ; c) mise en évidence du nouvel hybride formé à l'étape b).
Ce procédé est avantageusement utilisé avec une puce à ADN selon l'invention, l'acide nucléique recherché s'hybridant avec une sonde présente à la surface de ladite puce, et étant détecté par l'utilisation d'une sonde marquée. Ce procédé est avantageusement mis en oeuvre en combinant une étape préalable d'amplification de l'ADN ou de l'ADN complémentaire obtenu éventuellement par transcription inverse, à l'aide d'amorces selon l'invention.
Ainsi, la présente invention englobe également les kits ou nécessaires pour la détection et/ou l'identification de bactéries appartenant à l'espèce Listeria innocua ou monocytogenes 4b ou à un micro-organisme associé, caractérisé en ce qu'il comprend les éléments suivants : a) une sonde nucléotidique selon l'invention ; b) éventuellement, les réactifs nécessaires à la mise en oeuvre d'une réaction d'hybridation ; c) éventuellement, au moins une amorce selon l'invention ainsi que les réactifs nécessaires à une réaction d'amplification de l'ADN.
De même, la présente invention englobe également les kits ou nécessaires pour la détection et/ou l'identification de bactéries appartenant à l'espèce Listeria innocua ou monocytogenes 4b ou à un micro-organisme associé, caractérisé en ce qu'il comprend les éléments suivants : a) une sonde nucléotidique, dite sonde de capture, selon l'invention ; b) une sonde oligonucléotidique, dite sonde de révélation, selon l'invention ; c) éventuellement, au moins une amorce selon l'invention ainsi que les réactifs nécessaires à une réaction d'amplification de l'ADN.
<Desc/Clms Page number 37>
Figure img00370001
Enfin, les kits ou nécessaires pour la détection et/ou l'identification de bactéries appartenant à l'espèce Listeria innocua ou monocytogenes 4b ou à un micro-organisme associé, caractérisé en ce qu'il comprend les éléments suivants : a) au moins une amorce selon l'invention ; b) éventuellement, les réactifs nécessaires pour effectuer une réaction d'amplification d'ADN ; c) éventuellement, un composant permettant de vérifier la séquence du fragment amplifié, plus particulièrement une sonde oligonucléotidique selon l'invention. sont également objets de la présente invention.
De préférence, lesdites amorces et/ou sondes et/ou polypeptides et/ou anticorps selon la présente invention utilisés dans les procédés et/ou kits ou nécessaires selon la présente invention sont choisis parmi les amorces et/ou sondes et/ou polypeptides et/ou anticorps spécifiques de l'espèce Listeria innocua ou monocytogenes 4b. De manière préférée, ces éléments sont choisis parmi les séquences nucléotidiques codant pour une protéine sécrétée, parmi les polypeptides sécrétés, ou parmi les anticorps dirigés contre des polypeptides sécrétés de Listeria innocua ou monocytogenes 4b.
La présente invention a également pour objet les souches de Listeria innocua ou monocytogenes 4b et/ou de microorganismes associés contenant une ou plusieurs mutation (s) dans une séquence nucléotidique selon l'invention, en particulier une séquence ORF, ou leurs éléments régulateurs (en particulier promoteurs).
On préfère, selon la présente invention, les souches de Listeria innocua ou monocytogenes 4b présentant une ou plusieurs mutation (s) dans les séquences nucléotidiques codant pour des polypeptides impliqués dans la machinerie cellulaire, en particulier la sécrétion, le métabolisme intermédiaire central, le métabolisme énergétique, les processus de synthèse des acides aminés, de transcription et de traduction, de synthèse des polypeptides.
Lesdites mutations peuvent mener à une inactivation du gène, ou en particulier lorsqu'elles sont situées dans les éléments régulateurs dudit gène, à une surexpression de celui-ci.
<Desc/Clms Page number 38>
Figure img00380001
L'invention concerne en outre l'utilisation d'une séquence nucléotidique selon l'invention, d'un polypeptide selon l'invention, d'un anticorps selon l'invention, d'une cellule selon l'invention, et/ou d'un animal transformé selon l'invention, pour la sélection de composé organique ou inorganique capable de moduler, de réguler, d'induire ou d'inhiber l'expression de gènes, et/ou de modifier la réplication cellulaire de cellules eucaryotes ou procaryotes ou capables d'induire, d'inhiber ou d'aggraver les pathologies liées à une infection par Listeria innocua ou monocytogenes 4b ou un de ses micro-organismes associés.
L'invention comprend également une méthode de sélection de composés capables de se lier à un polypeptide ou un de ses fragments selon l'invention, capables de se lier à une séquence nucléotidique selon l'invention, ou capable de reconnaître un anticorps selon la revendication, et/ou capables de moduler, de réguler, d'induire ou d'inhiber l'expression de gènes, et/ou de modifier la croissance ou la réplication cellulaire de cellules eucaryotes ou procaryotes, ou capables d'induire, d'inhiber ou d'aggraver chez un organisme animal ou humain les pathologies liées à une infection par Listeria, par exemple par L. monocytogenes 4b, ou un de ses micro-organismes associés, caractérisée en ce qu'elle comprend les étapes suivantes : a) mise en contact dudit composé avec ledit polypeptide, ladite séquence nucléotidique, avec une cellule transformée selon l'invention et/ou administration dudit composé à un animal transformé selon l'invention ; b) détermination de la capacité dudit composé à se lier avec ledit polypeptide ou ladite séquence nucléotidique, ou de moduler, de réguler, d'induire ou d'inhiber l'expression de gènes, ou de moduler la croissance ou la réplication cellulaire, ou d'induire, d'inhiber ou d'aggraver chez ledit animal transformé les pathologies liées à une infection par Listeria, par exemple L. monocytogenes 4b ou un de ses micro-organismes associés.
Les cellules et/ou les animaux transformés selon l'invention, pourront avantageusement servir de modèle et être utilisés dans des procédés pour étudier, identifier et/ou sélectionner des composés susceptibles d'être responsables de
<Desc/Clms Page number 39>
Figure img00390001

pathologies induites ou aggravées par Listeria monocytogenes, ou susceptibles de prévenir et/ou de traiter ces pathologies. En particulier, les cellules hôtes transformées, notamment les bactéries de la famille des Listeria dont la transformation par un vecteur selon l'invention peut par exemple accroître ou inhiber son pouvoir infectieux, ou moduler les pathologies habituellement induites ou aggravées par l'infection, pourront être utilisées pour infecter des animaux dont on suivra l'apparition des pathologies. Ces animaux non transformés, infectés par exemple avec des bactéries Listeria transformées, pourront servir de modèle d'étude. De la même manière, les animaux transformés selon l'invention pourront être utilisés dans des procédés de sélection de composés susceptibles de prévenir et/ou de traiter les maladies dues à Listeria. Lesdits procédés utilisant lesdites cellules transformées et/ou animaux transformés, font partie de l'invention.
Les composés susceptibles d'être sélectionnés peuvent être des composés organiques tels que des polypeptides ou hydrates de carbone ou tous autres composés organiques ou inorganiques déjà connus, ou des composés organiques nouveaux élaborés à partir de techniques de modélisation moléculaire et obtenus par synthèse chimique ou biochimique, ces techniques étant connues de l'homme de l'art.
Lesdits composés sélectionnés pourront être utilisés pour moduler la croissance et/ou la réplication cellulaire de Listeria innocua ou monocytogenes 4b ou tout autre micro-organisme associé et ainsi pour contrôler l'infection par ces micro-organismes. Lesdits composés selon l'invention pourront également être utilisés pour moduler la croissance et/ou la réplication cellulaire de toutes cellules eucaryotes ou procaryotes, notamment les cellules tumorales et les microorganismes infectieux, pour lesquelles lesdits composés s'avéreront actifs, les méthodes permettant de déterminer lesdites modulations étant bien connues de l'homme de l'art.
On entend désigner par composé capable de moduler la croissance d'un micro-organisme tout composé permettant d'intervenir, de modifier, de limiter et/ou de réduire le développement, la croissance, la vitesse de prolifération et/ou la viabilité dudit micro-organisme.
<Desc/Clms Page number 40>
Figure img00400001
Cette modulation peut être réalisée par exemple par un agent capable de se lier à une protéine et ainsi d'inhiber ou de potentialiser son activité biologique, ou capable de se lier à une protéine membranaire de la surface extérieure d'un microorganisme et de bloquer la pénétration dudit micro-organisme dans la cellule hôte ou de favoriser l'action du système immunitaire de l'organisme infecté dirigé à l'encontre dudit micro-organisme. Cette modulation peut être également réalisée par un agent capable de se lier à une séquence nucléotidique d'un ADN ou ARN d'un micro-organisme et de bloquer par exemple l'expression d'un polypeptide dont l'activité biologique ou structurelle est nécessaire à la croissance ou à la reproduction dudit micro-organisme.
On entend désigner par micro-organisme associé dans la présente invention, tout micro-organisme dont l'expression de gène peut être modulée, régulée, induite ou inhibée, ou dont la croissance ou la réplication cellulaire peut être également modulée par un composé de l'invention. On entend désigner également par microorganisme associé dans la présente invention, tout micro-organisme comportant des séquences nucléotidiques ou des polypeptides selon l'invention. Ces microorganismes peuvent dans certains cas comporter des polypeptides ou des séquences nucléotidiques identiques ou homologues à celles de l'invention et pourront également être détectés et/ou identifiés par les procédés ou kit de détection et/ou d'identification selon l'invention et également servir de cible pour les composés de l'invention. On entend aussi désigner par micro-organisme tout micro-organisme Listeria monocytogenes de tout sérotype.
L'invention concerne les composés susceptibles d'être sélectionnés par une méthode de sélection selon l'invention.
L'invention concerne également une composition pharmaceutique
Figure img00400002

comprenant un composé choisi parmi les composés suivants : a) une séquence nucléotidique selon l'invention ; b) un polypeptide selon l'invention ; c) un vecteur selon l'invention ; d) un anticorps selon l'invention ; et e) un composé susceptible d'être sélectionné par une méthode de sélection selon l'invention, éventuellement en association avec un véhicule pharmaceutiquement acceptable.
<Desc/Clms Page number 41>
Figure img00410001
On entend désigner par quantité efficace, une quantité suffisante dudit composé ou anticorps, oude polypeptide de l'invention, permettant de moduler la croissance de Listeria iwïocua ou monocytogenes 4b ou d'un micro-organisme associé.
L'invention concerne aussi une composition pharmaceutique selon l'invention pour la prévention ou le traitement d'une infection par une bactérie appartenant au genre Listeria ou par un micro-organisme associé.
L'invention vise en outre une composition immunogène et/ou vaccinale, caractérisée en ce qu'elle comprend un ou plusieurs polypeptides selon l'invention et/ou un ou plusieurs polypeptides hybrides selon l'invention.
L'invention comprend aussi l'utilisation d'une cellule transformée selon l'invention, pour la préparation d'une composition vaccinale.
L'invention vise également une composition vaccinale, caractérisée en ce qu'elle contient une séquence nucléotidique selon l'invention, un vecteur selon l'invention et/ou une cellule transformée selon l'invention.
L'invention concerne également les compositions vaccinales selon l'invention, pour la prévention ou le traitement d'une infection par une bactérie appartenant au genre Listeria ou par un micro-organisme associé.
De manière préférée, les compositions immunogènes et/ou vaccinales selon l'invention destinées à la prévention et/ou au traitement d'infection par Listeria ou par un micro-organisme associé seront choisies parmi les compositions immunogènes et/ou vaccinales comprenant un polypeptide ou un de ses fragments correspondant à une protéine, ou un de ses fragments, de l'enveloppe cellulaire de Listeria. Les compositions vaccinales comprenant des séquences nucléotidiques comprendront de préférence également des séquences nucléotidiques codant pour un polypeptide ou un de ses fragments correspondant à une protéine, ou un de ses fragments, de l'enveloppe cellulaire de Listeria.
Les polypeptides de l'invention ou leurs fragments entrant dans les compositions immunogènes selon l'invention peuvent être sélectionnés par des techniques connues de l'homme de l'art comme par exemple sur la capacité desdits polypeptides à stimuler les cellules T, qui se traduit par exemple par leur prolifération ou la sécrétion d'interleukines, et qui aboutit à la production d'anticorps dirigés contre lesdits polypeptides.
<Desc/Clms Page number 42>
Figure img00420001
Chez la souris, chez laquelle une dose pondérale de la composition vaccinale comparable à la dose utilisée chez l'homme est administrée, la réaction anticorps est restée par prélèvement du sérum suivi d'une étude de la formation d'un complexe entre les anticorps présents dans le sérum et l'antigène de la composition vaccinale, , nt selon tes techniques usuelles.
Selon l'invention, lesdites compositions vaccinales seront de préférence en
Figure img00420002

association avec un véhicule pharmaceutiquement acceptable et, le cas échéant, lvec un ou plusieurs adjuvants de l'immunité appropriés.
Aujourd'hui, divers types de vaccins sont disponibles pour protéger 'homme contre des maladies infectieuses : micro-organismes vivants atténués (M 5M-BCG pour la tuberculose), micro-organismes inactivés (virus de la grippe), les extraits acellulaires (Bordetella pertussis pour la coqueluche), protéines
Figure img00420003

recombinées (antigène de surface du virus de l'hépatite B), des polyosides : pneumocoques). Des vaccins préparés à partir de peptides de synthèse ou de microorganismes génétiquement modifiés exprimant des antigènes hétérologues sont en cours d'expérimentation. Plus récemment encore, des ADNs plasmidiques recombinés portant des gènes codant pour des antigènes protecteurs ont été proposés comme stratégie vaccinale alternative. Ce type de vaccination est réalisé lvec un plasmide particulier dérivant d'un plasmide de E. coli qui ne se réplique pas in vivo et qui code uniquement pour la protéine vaccinante. Des animaux ont été immunisés en injectant simplement l'ADN plasmidique nu dans le muscle. Cette technique conduit à l'expression de la protéine vaccinale in situ et à une réponse immunitaire de type cellulaire (CTL) et de type humoral (anticorps). Cette double induction de la réponse immunitaire est l'un des principaux avantages de la technique de vaccination avec de l'ADN nu.
Les compositions vaccinales comprenant des séquences nucléotidiques ou des vecteurs dans lesquels sont insérées lesdites séquences, sont notamment décrites
Figure img00420004

dans la demande internationale ? WO 90/11092 et également dans la demande internationale ? WO 95/11307.
La séquence nucléotidique constitutive de la composition vaccinale selon l'invention peut être injectée à l'hôte après avoir été couplée à des composés qui favorisent la pénétration de ce polynucléotide à l'intérieur de la cellule ou son transport jusqu'au noyau cellulaire. Les conjugués résultants peuvent être
<Desc/Clms Page number 43>
Figure img00430001

encapsulés dans des microparticules polymères, comme décrit dans la demande internationale ? WO 94/27238 (Medisorb Technologies International).
Selon un autre mode de réalisation de la composition vaccinale selon l'invention, la séquence nucléotidique, de préférence un ADN, est complexée avec du DEAE-dextran, avec des protéines nucléaires, avec des lipides ou encapsulée dans des liposomes ou encore introduite sous la forme d'un gel facilitant sa transfection dans les cellules. Le polynucléotide ou le vecteur selon l'invention peut aussi être en suspension dans une solution tampon ou être associé à des liposomes.
Avantageusement, un tel vaccin sera préparé conformément à la technique décrite par Tacson et al. ou Huygen et al. en 1996 ou encore conformément à la technique décrite par Davis et al. dans la demande internationale ? WO 95/11307.
Un tel vaccin peut être également préparé sous la forme d'une composition contenant un vecteur selon l'invention, placée sous le contrôle d'éléments de régulation permettant son expression chez l'homme ou l'animal. On pourra par exemple utiliser, en tant que vecteur d'expression in vivo de l'antigène polypeptidique d'intérêt, le plasmide pcDNA3 ou le plasmide pcDNAl/neo, tous les deux commercialisés par Invitrogen (R & D Systems, Abingdon, Royaume-Uni).
Un tel vaccin comprendra avantageusement, outre le vecteur recombinant, une solution saline, par exemple une solution de chlorure de sodium.
On entend désigner par véhicule pharmaceutiquement acceptable, un composé ou une combinaison de composés entrant dans une composition pharmaceutique ou vaccinale ne provoquant pas de réactions secondaires et qui permet par exemple la facilitation de l'administration du composé actif, l'augmentation de sa durée de vie et/ou de son efficacité dans l'organisme, l'augmentation de sa solubilité en solution ou encore l'amélioration de sa conservation. Ces véhicules pharmaceutiquement acceptables sont bien connus et seront adaptés par l'homme de l'art en fonction de la nature et du mode d'administration du composé actif choisi.
En ce qui concerne les formulations vaccinales, celles-ci peuvent comprendre des adjuvants de l'immunité appropriés qui sont connus de l'homme de l'art, comme par exemple l'hydroxyde d'aluminium, un représentant de la famille des muramyl peptides comme un des dérivés peptidiques du N-acétyl-muramyl, un lysat bactérien, ou encore l'adjuvant incomplet de Freund.
<Desc/Clms Page number 44>
Figure img00440001
De préférence, ces composés seront administrés par voie systémique, en particulier par voie intraveineuse, par voie intramusculaire, intradermique ou sous- cutanée, ou par voie orale. De manière plus préférée, la composition vaccinale comprenant des polypeptides selon l'invention, sera administrée à plusieurs reprises, de manière étalée dans le temps, par voie intradermique ou sous-cutanée.
Leurs modes d'administration, posologies et formes galéniques optimaux peuvent être déterminés selon les critères généralement pris en compte dans l'établissement d'un traitement adapté à un patient comme par exemple l'âge ou le poids corporel du patient, la gravité de son état général, la tolérance au traitement et les effets secondaires constatés.
Enfin, l'invention comprend l'utilisation d'une composition selon l'invention, pour le traitement ou la prévention de maladies induites ou aggravées par la présence de Listeria.
Par ailleurs, la présente invention a également pour objet une banque
Figure img00440002

d'ADN génomique d'une bactérie du genre Listeria, de manière préférée, Listeria innocua ou monocytogenes, de manière préférée la souche 4b.
Les banques d'ADN génomique décrites dans la présente invention, en particulier la banque Li-shotgun déposée à la CNCM le 2 octobre 2000 sous le
Figure img00440003

numéro d'ordre nO 1-2565 et la banque Lmb4b-shotgun déposée à la CNCM le 2 octobre 2000 sous le numéro d'ordre ne 1-2566, recouvrent en effet respectivement le génome de Listeria innocua et Listeria monocytogenes 4b. y Toutefois, bien que certaines régions n'aient pas pu être clonées dans ladite banque, en raison de problèmes de létalités chez Escherichia coli, ces régions peuvent facilement être amplifiées et identifiées par l'homme du métier, en utilisant des oligonucléotides spécifiques des séquences des extrémités des différents clones qui forment les contigs.
La présente invention concerne également les méthodes pour l'isolement d'un polynucléotide d'intérêt présent chez une souche de Listeria et absente chez une autre souche, qui utilise au moins une banque d'ADN basée par exemple sur un plasmide pcDNA2.1 contenant le génome de Listeria. La méthode selon l'invention pour l'isolement d'un polynucléotide d'intérêt peut comprendre les étapes suivantes :
<Desc/Clms Page number 45>
Figure img00450001

a) isoler au moins un polynucléotide contenu dans un clone de la banque d'ADN d'origine de Listeria, b) isoler : - au moins un polynucléotide génomique ou ADNc d'une listeria, ladite listera appartenant à une souche différente de la souche utilisée pour la construction de la banque d'ADN de l'étape a) ou, de façon alternative,
Figure img00450002

au moins un polynucléotide contenu dans un clone d'une banque d'ADN préparé à partir du génome d'une Listeria qui est différente de la Listeria utilisée pour la construction de la banque d'ADN de l'étape a). c) hybrider le polynucléotide de l'étape a) au polynucléotide de l'étape b) ; d) sélectionner les polynucléotides de l'étape a) qui n'ont pas formé de
Figure img00450003

complexe d'hybridation avec les polynucléotides de l'étape b) ; e) caractériser le polynucléotide sélectionné.
On peut préparer le polynucléotide de l'étape a) par la digestion d'au moins un clone recombinant avec une enzyme de restriction appropriée, et de façon optionnelle, l'amplification de l'insert polynucléotide qui en résulte.
Ainsi, la méthode de l'invention permet à l'homme du métier d'effectuer des études génomiques comparatives entre les différentes souches ou espèces du genre Listeria, par exemple entre les souches pathogéniques et leurs équivalents non pathogènes.
En particulier, il est possible d'étudier et de déterminer les régions de polymorphisme entre lesdites souches. EXEMPLE 1. Construction des banques L'ADN chromosomique des souches étudiées a été préparé par une méthode classique incluant un traitement à la protéinase K et une extraction au phénol (9).
Environ 10 ug d'ADN ont été cassés par nébulisation (1 minute sous une pression de 1 bar) (4). Les extrémités des fragments d'ADN ont été rendues franches en faisant agir la DNA-polymerase du bactériophage T4 pendant 15 minutes à 37 C en présence des 4 nucléotides tri-phosphate. L'enzyme a été inactivé par une incubation de 15 mn à 75 oc. Des adaptateurs (invitrogen Cat. N 408-18) ont
<Desc/Clms Page number 46>
Figure img00460001

ensuite été ligaturés à ces extrémités. Après ligature, les fragments d'ADN chromosomiques ayant une taille entre 1000 et 3000 paires de bases ont été purifiés après électrophorèse sur gel d'agarose. Le vecteur utilisé pour la construction de la banque, pcDNA2.1 (Invitrogen), a été digéré par l'enzyme BstXl et purifié par geneclean (BIO-101) après électrophorèse sur gel d'agarose. L'ADN chromosomique et le vecteur purifié ont été ligaturés par action de la ligase du bactériophage T4. Le mélange de ligation a été introduit par transformation dans la souche d'Escherichia coli XL2-blue (Stratagene). Environ 4000 colonies sont obtenues par ul du mélange de ligation.
Ce procédé est utilisé pour construire la banque Li-shotgun déposée à la CNCM le 2 octobre 2000 sous le no 1-2565 pour la souche Listeria innocua (CLIP 11262) et la banque Lm4b-shotgun déposée à la CNCM le 2 octobre 2000 sous le nO 1-2566 pour la souche Listeria monocytogenes sérotype 4b (CLIP 80459).
*2. Préparation des plasmides et séquençage Les plasmides ont été préparés par une méthode semi-automatique de préparation développée au laboratoire GMP (Génomique des Microorganismes Pathogènes de l'INSTITUT PASTEUR) basé sur la méthode de lyse alcaline (2). Les inserts chromosomiques ont été séquencés à partir de leurs deux extrémités en utilisant les primer T7 et universel en suivant les recommandations du fournisseur (PEbiosystems). Les séquences ont été déterminées en utilisant des séquenceurs automatiques de type 377 et 3700 (PE-Biosystem).
3. Assemblage des séquences Les séquences ont été assemblées en utilisant l'ensemble de logiciels développé à l'Université de Washington, Phred, Phrap et Consed (5,8). La finition de la séquence a été réalisée en utilisant l'ensemble de logiciel GMPTB (7). L'étape de finition correspond au reséquençage des régions où la séquence est peu sûr et le séquençage des régions situées entre les contigs. Elle a été réalisée soit en séquençant des produits de PCR soit en marchant sur les clones de la banque. Les séquences des oligonucleotides ont été définies en utilisant les logiciels consed et Primo (8,10).
<Desc/Clms Page number 47>
Figure img00470001
4. Annotation des séquences L'identification des phases codantes (CDS) a été réalisée en utilisant l'ensemble de logiciels GMPTB. Ce programme combine les résultats de différentes méthodes : (i) l'identification de phases ouvertes de lecture et leur tri en fonction de leur taille, (ii) l'analyse de la probabilité d'être codant en utilisant le logiciel Genemark (11), (iii) l'identification d'un début de traduction (codon d'initiation et séquence de fixation du ribosome), (iv) similarité de la séquence protéique déduite avec les séquences protéiques contenues dans les banques de séquence en utilisant le logiciel BLASTP.
Les fonctions des protéines codées par les phases codantes identifiées ont été prédites par l'analyse des résultats de recherche de similarités dans les banques en utilisant le logiciel BLASTP (1). 5. Comparaison des génomes-identification des CDS spécifiques de la souche
Figure img00470002

de L. monocytogenes EGDe et de la souche de L. innocua.
L'ensemble des séquences protéiques déduites des phases codantes prédites de chaque génome a été comparé à l'ensemble des séquences protéiques possiblement codées par l'autre génome en utilisant le logiciel BLASTP. Un seuil de 75% d'identité sur la totalité de la longueur de la protéine a été retenu pour identifier les protéines spécifiques d'un isolat. Cette valeur très élevée a été retenue car elle permet le mieux de discriminer les gènes orthologs des gènes paralogs (6). Pour les séquences protéiques pour lesquelles la conservation de séquence est élevée ( > à 70%) la conservation des séquences nucléotidiques des gènes sera elle aussi élevée et pourrait donner un signal dans des conditions d'hybridation peu stringente. Il sera nécessaire de tenir compte de cette éventualité dans l'analyse du résultat du test. 6. Exemples d'annotations 6.1. Gènes spécifique de L. monocytogenes. Il n'y a pas de similarité significative entre la séquence nucléotidique du gène de L. monocytogenes et le génome de L. innocua.
<Desc/Clms Page number 48>
Figure img00480001

ID du gène de ID du gène de % d'identité des % d'identité des du gn' innocua L. monocytogenes L. innocua séquences protéiques séquences m ill r s (meilleur score) (% de la séquence) nucléotidiques eueu 1814. 1 SEQ ID N 779 2601. 1 SEQ ID ? 851 615. 1 SEQID ? 1034 1713. 1 SEQ ID NO 772 5385. 1 SEQ ID 2042 25% (100%) < 40% 1656. 1 SEQ ID NO 768 526. 1 SEQ ID NO 684 36% (50%) : g 40% 3477. 1 SEQ ID NO 908 1614. 1 SEQ ID NO 632 33% (60%) : 9 40% 3418. 2 SEQ ID NO 904 1235. 1 SEQ ID NO 2043 30% (70%) < 40%
Figure img00480002

6. 2. Gènes spécifique de L. innocua : il n'y a pas de similarité significative entre la séquence nucléotidique du gène de L. innocua et le génome de L. monocytogenes.
Figure img00480003
ID du gène de ID du gène de % d'identité des % d'identité des ono L. innocua L. monocytogenes séquences séquences cy mu g (meilleur score) protéiques nucléotidiques m [e Ileur s 1259. 1 SEQ ID N 689 3320. 1 SEQ IDN 527 1348. 1 SEQ ID NO 596 1545. 1 SEQ ID NO 2044 26% (70%) 40% 4232. 1 SEQ ID NO 681 894. 1 SEQ ID NO 2045 30% (90%) < 40% 5550. 1 SEQ ID NO 519 312. 1 SEQ ID NO 2046 31% (60%) 40% 3320. 1 SEQ ID NO 527 558. 1 SEQ ID NO 1025 25% (50%) < 40%
Figure img00480004

6. 3. Gènes commun aux deux souches pour lesquels la similarité (identité) des séquences protéiques déduites est inférieur à 75% et valeur de la similarité au niveau nucléotidique.
Figure img00480005
ID du gène de ID du gène de % d'identité des % d'identité des L. monocytogenes L. innocua séquences protéiques séquences (meilleur score) (% de ! a séquence) nuctéotidiqucs 1343 SEQ ID NO 727 36. 1 SEQ ID NO 528 67% 725. 1 SEQ ID NO 1046 1402. 1 SEQ ID NO 2047 60% 1002. 1 SEQ ID NO 690 1021. 1 SEQ ID NO 666 65% 1974. 3 SEQ ID NO 789 897. 1 SEQ ID ? 2048 49% (100%) 58%
<Desc/Clms Page number 49>
Figure img00490001

6. 4. Gènes communs à L. monocytogenes et L. innocua
Figure img00490002

ID du gène de ID du gène de % d'identité des % d'identité des L. monocytogenes L. innocua séquences protéiques séquences (meilleur score) (% de la séquence) nuctéotidiques 1976. 1 SEQ ID NO 2049 5481. 1 SEQ ID NO 2053 82% 1979. 1 SEQ ID NO 2050 5476. 1 SEQ ID NO 2054 86% 1980. 1 SEQ ID NO 2051 5474. 1 SEQ ID NO 2055 80% 1983. 1 SEQ IDN 2052 5471. 1 SEQ IDN 2056 87% (100%) 79%
<Desc/Clms Page number 50>
Figure img00500001

Références 1. Altschul, S. F., T. L. Madden, A. A. Schaffer, J. Zhang, Z. Zhang, W. Miller, and D. J. Lipman. 1997. Gapped BLAST and PSI-BLAST : a new generation of protein database search programs. [Review] [90 refs]. Nucleic Acids Research. 25 : 3389- 402.
2. Birnboim, H. C. 1983. A rapid alkaline extraction method for the isolation of plasmid DNA. Method Enzymol. 100 : 243-255.
3. Braun, L., F. Nato, B. Payrastre, J. C. Mazie, and P. Cossart. 1999. The 213amino-acid leucine-rich repeat region of the listeria monocytogenes InlB protein is sufficient for entry into mammalian cells, stimulation of PI 3-kinase and membrane ruffling. MolMicrobiol. 34 : 10-23.
4. Buchrieser, C., C. Rusniok, L. Frangeul, E. Couvé, A. Billault, F. Kunst, E.
Camel, and P. Glaser. 1999. The 102 kb locus of Yersinia : séquence analysis and comparison of selected regions among different Yersinia pestles and
Figure img00500002

Yersinla strains Itifect. Immun. 67 : 4851-4861. 5. Ewing, B., and P. Green. 1998. Base-calling of automated sequencer traces using phred. II. Error probabilities. Genome Res. 8 : 186-194.
6. Fitch, W. S. 1970. Distingishing homologous from analogous proteins. Syst.
Zool. 19 : 99-113.
7. Frangeul, L., K. E. Nelson, C Buchrieser, A. Danchin, P. Glaser, and K. F. 1999.
Cloning and assembly strategies in microbial genome projects. Microbiology 145 : 2625-2634.
8. Gordon, D., C. Abajian, and P. Green. 1998. Consed : a graphical tool for sequence finishing. Genome Res. 8.195-202.
9. Jacquet, C., J. Bille, and J. Rocourt 1992. Typing of Listeria monocytogenes by retriction polymorphism of the ribonucleic acid gene region. Zentralbl Bakteriol.
276 : 356-365.
10. Li, P., K. C. Kupfer, C. J. Davies, D. Burbee, G. A. Evans, and H. R. Garner 1997. PRIMO : A primer design program that applies base quality statistics for automated large-scale DNA sequencing. Genomlcs. 40.476-485.
11. Lukashin, A. V., and M. Borodovsky. 1998. GeneMark. hmm : new solutions for gene finding. Nucleic Acids Res. 15 : 1107-1115.
<Desc/Clms Page number 51>
Figure img00510001
SEQ ID Prot No Blastp result on non-redondant protein bank. % homology 1 Comments SEQ ID ? 12 L !-1779. 1No Hits found SEQ ID ? 13 LI-4603. 1 No Hits found SEQ ID NO 14 LI-4611. 1 No Hits found SEQ ID N 15 LI-6102. 1 No Hits found SEQ D NO 16 LI-738. 2 SEQ ID NO 17 LI-1983. 1 No Hits found SEQIOW18 LI-2952. 1 No Hits found SEQ I DN 19 LI-3070. 1 No Hits found SEQ ID ? 20 LI-1237. 1 No Hits found SEQ IDN 21 LI-1718. 1 56 emblCAB83919 11 (AL162753) hypothetical protein NMA0630 [Neisseria meningitidis] Length = 304 SEQ ID NO 22 LI-1869. 1 No Hits found SEQIOW23 LI-1910. 1 No Hits found SEQIOW24 LI-3373 1 78 emb1CAB53845. 11 (AJ242593) gp55 [Bacteriophage A118] Length = 69 SEQ ID N 25 LI-372. 1 No Hits found SEQ ID ? 26 LI-3727 1 No Hits found SEQIOW27 LI-3807. 1 No Hits found SEQ IDN 28 LI-438. 1 No Hits found SEQ ID ? 29 LI-4981 1 No Hits found SEQ ID NO 30 LI-4992. 1 No Hits found SEQ ID ? 31 LI-6200. 1 SEQ ID N 32 LI-1487 1 No Hits found SEQ ID N 33 LI-1603. 1 No Hfts found SEQ ID N 34 LI-2986. 1 No Hits found SEQ ID NN 35 LI-3365. 1 41 embICAB53854. 1) (AJ242593) gp64 [Bacteriophage A118] Length = 41 SEQ ID N 36 LI-5554 1 No Hits found SEQ ID No 37 LI-5726 1 No Hits found SEQ ID NO 38 LI-1495. 1 No Hits found SEQ ID N"39 LI-2951. 1 No Hits found SEQ ID NO 40 LI-2959. 1 No Hits found SEQ ID NO 41 LI-5588. 1 No Hits found SEQ ID ? 42 LI-5922 1 No Hits found SEQ ID N"43 LI-6071. 1 No Hits found SEQ ID N 44 LI-6072 1 No Hits found SEQ ID ? 45 LI-2374 1 No Hits found SEQ ID NO 46 LI-2937. 1 51 pirllF70357 lipoprotem-AqUifex aeolicus gblMC06844 11 (AEOO0700) ! ! poprotein [Aqufex aeo ! ! cus] Length = 349 SEQ ID N 47 LI-41141 No Hits found SEQ ID N 48 LI-5780 1 No Hits found SEQ ID DN 49 LI-5706. 1 65 emblCAB53820 11 (AJ242593) gp34 [Bacteriophage AU18] Length = 72 SEQ ID N 50 LI-3139. 1 No Hits found SEQ ID N ? 51I-3800. 1 No Hits found SEQ ID NO 52 LI-385. 1 No Hits found SEQ ID N 53 LI-5458. 2
<Desc/Clms Page number 52>
Figure img00520001

SEQ ID N 54 LI-5803. 1 No Hits found SEQ ID N"55 LI-128. 1 No Hits found SEQ ID N"56 LI-2428. 1 No Hits found SEQ ID ? 57 LI-3087. 1 No Hits found SEQ ID NO 58 LI-5915. 1 No Hits found SEQ ID ? 59 LI-6036 1 No Hits found SEQ ID N 60 LI-175. 1 No Hits found SEQ ID N 61 LI-1816. 1 No Hits found SEQ ID ? 62 LI-2777. 1 46 gblAAC36979. 11 (L15633) [Conjugative transposon Tn916 (from Enterococcus faecalis, DS16), 3'end.], gene products [Transposon Tn916] gblAAB60027 11 (U09422) ORF8 [Enterococcus faecalis] prf ! 12114402V ORF 8 [Enterococcus faecalis] SEQ ID ? 63 LI-2932. 1 No Hits found SEQ ID N"64 LI-1611. 1 No Hits found SEQ ID N 65 LI-2702 1 No Hits found SEQ ID N 66 LI-2989. 1 No Hits found SEQ ID N"67 LI-4125. 1 No Hits found SEQ ID ? 68 LI-4628 1 No Hits found SEQ ID N 69 LI-5606. 1 No Hits found SEQ ID NO 70 LI-6148 2 SEQ ID N 71 LI-2237 1 No Hits found SEQ ID NO 72 LI-6190 1 SEQ ID ? 73 LI-4167. 1 No Hits found SEQ ID ? 74 LI-5459. 2 SEQ ID N 75 LI-568. 1 No Hits found SEQ ID N'76 LI-6191 1 SEQ ID ? 77 LI-1368. 1 No Hits found SEQ ID N 78 LI-1538 1 No Hits found SEQ ID ? 79 LI-2694. 1 No Hits found SEQ ID N 80 LI-678. 1 No Hits found SEQ ID N 81 LI-2181. 1 No Hits found SEQ ID ? 82 LI-3662. 1 No Hits found SEQ ID N 83 LI-6121. 1 No Hits found SEQ ID NO 84 LI-6163. 1 No Hits found SEQ ID ? 85 LI-1240 1 No Hits found SEQ ID ? 86 LI-2030. 1 No Hits found SEQ ID ? 87 LI-3363 1 No Hits found SEQ ID N 88 LI-4294 1 No Hits found SEQ ID N"89 LI-5611 2 SEQ ID N90 LI-6041. 1 No Hits found SEQ ID N 91 LI-61621 No Hits found SEQ ID N"92 LI-10821 No Hits found SEQ ID N 93 LI-1928 1 No Hits found SEQ ID ? 94 LI-2878. 1 36ppirC72489 hypothetical protein APE2554-Aeropyrum pernix (strain K1) dbjIBAA81571 11 (AP000064) 105aa long hypothetcal protein [Aeropyrum pernix] Length = 105 SEQ ID NO 95 LI-3676. 1 No Hits found SEQ ID N 96 LI-4023. 1 No Hits found SEQ ID N 97 LI-4475 1 No Hits found
<Desc/Clms Page number 53>
Figure img00530001

SEQ ID NO 98 LI-5540. 1 No Hits found SEQ ID NO 99 LI-2946. 1 No Hits found SEQ ID N"100 LI-2988. 1 No Hits found SEQ ID N'101 LI-2990. 1 No Hits found SEQ ID W 102 LI-439. 1 No Hits found SEQ ID N'103 LI-5607. 1 No Hits found SEQ) ID NO 104 LI-4005. 1 No Hits found SEQ ID ? 105 LI-4022. 1 No Hits found SEQ ID ? 106 LI-4683. 1 31 gblAAA72562. 11 (M15619) ORF16-lacZ fusion protein synthetic construct Length = 68 SEQ ID N 107 LI-4931. 1 No Hits found SEQ ID N 108 LI-1139. 1 No Hits found SEQ ID N 109 LI-3703. 1 43 gblAAC97745 11 (AF063866) ORF MSV233 hypothetical protein [Melanoplus sanguinipes entomopoxvirus] Length = 92 SEQ ID N 110 LI-6145. 1 No Hits found SEQ ID N 111 LI-2179. 1 No Hits found SEQ ID N 112 LI-3431. 1 No Hits found SEQ ID NO 113 LI-478. 1 No Hits found SEQ ID N'114 LI-71 1. 1 No Hits found SEQ IDN 115 LU-1092. 1 No Hits found SEQ ID N' 116 LI-2061. 1 No Hits found SEQ ID N 117 LI-3990. 1 No Hits found SEQ ID DN 118 LI-4006. 1 No Hits found SEQ ID N 119 LI-5373. 1 No Hits found SEQ DN 120 LI-5551. 1 52 gblAAA32614 11 (L31364) holin [Bacteriophage Tuc2009] Length = 88 SEQ ID ? 121 LI-3362. 1 No Hits found SEQ ID ? 122 LI-4107. 1 No Htts found SEQ ID DN 123 LI-4121. 1 No Hits found SEQ ID ? 124 LI-5546. 1 No Hlts found SEQ ID ? 125 LI-5548. 1 No Hits found SEQ ID W 126 LI-5710. 1 72 emblCAB53829 11 (AJ242593) gp40 [Bacteriophage AU 8] Length = 78 SEQ ID ? 127 LI-5957. 1 No Hits found SEQ ID ? 128 LI-6149. 2 SEQ ID N'129 LI-1615. 1 No Hits found SEQ ID N"130 LI-2926. 1 No Hits found SEQ ID N 131 LI-3068 1 No Hits found SEQ ID N 132 LI-5560 1 59 spIP45937) YQCB~BACSU HYPOTHETICAL 104 KD PROTEIN IN SPOIIICCWLA INTERGENIC REGION pirllA69949 hypothetlcal protem yqcB-Bacillus subtilis dbjlBAA06954 11 (D32216) ORF130 [Bacillus subtilis] dbjlBAA12418 1) (D84432) YqcB [Bacillus subti !) s] embCAB SEQ ID N 133 LI-6026. 1 No Hits found SEQ ID ? 134 LI-6098 1 No Hlts found SEQ ID NO 135 LI-2884. 1 No Hits found
<Desc/Clms Page number 54>
Figure img00540001

SEQ ID ? 136 LI-5567. 1 57 sp ! P45933 ! YQBRBACSU HYPOTHETiCAL 9. 5 KD PROTEIN IN SPOIIICCWLA INTERGENIC REGION pirllE69948 phage-related protein homolog yqbR-Bacillus subtilis dbjIBAA06950. 11 (D32216) ORF87 [Bacillus subtilis] dbjlBAA12414 1) (D84432) YqbR [Bacillus subtilis] SEQ ID ? 137 LI-5709 1 No Hits found SEQ ID N 138 LI-4219. 1 No Hits found SEQ ID ? 139 LI-5874. 1 No Hits found SEQ ID N'140 LI-6101. 1 No Hits found SEQ ID ? 141 LI-943. 1 No Hits found SEQ ID N 142 LI-3279. 1 No Hits found SEQ ID N 143 LI-3551. 1 No Hits found SEQ ID NO 144 LI-4065. 1 47 gblMB23085 11S43512~2 (S43512) orf2 immediately 5'to ejl [Bacteriophage EJ-1] Length = 85 SEQ ID N'145 LI-4113 1 57 pirlIT0901 1 probable transposase TnpA-Streptococcus pyogenes (fragment) gblAAB92607. 11 (AF026542) TnpA streptococcus pyogenes] Length = 364 SEQ ID N 146 LI-5362. 1 No Hits found SEQ ID ? 147 LI-1694 1 63 F75297 hypothet ! cal protein-Deinococcus radiodurans (strain R1) gblMF11800 11AE0020578 (AE002057) hypothetical protein [Deinococcus radtodurans] Length = 133 SEQ ID N'148 LI-4272 1 No Hits found SEQ ID ? 149 LI-4674. 1 63 pirF75297 hypothetical protein-Deinococcus radiodurans (strain R1) gblAAF11800 1jAE0020578 (AE002057) hypothetical protein [Deinococcus radiodurans] Length = 133 SEQ ID N'150 LI-5637. 1 No Hits found SEQ ID N 151 LI-6188 1 No Htts found SEQ ID ? 152 LI-1431 1 No Hits found SEQ ID N'153 LI-3567. 1 No Hits found SEQ ID N"154 LI-3993. 1 No Hits found SEQ ID NN 155 LI-4194. 1 71 gblAAD40364 11 (AF036485) putative transposase [Plasmid pNZ4000] Length = 226 SEQ ID N"156 LI-5299. 1 No Hits found SEQ ID No 157 LI-5570. 1 No Hits found SEQ ID N 158 LI-14931 No Hits found SEQ ID N 159 LI-3374 1 No Hits found SEQ ID NO 160 LI-3654 1 No Hrts found SEQ ID N 161 LI-4040 1 No Hits found SEQ ID N 162 LI-4069 2 SEQ ID ? 163 LI-4088 1 No Hits found SEQ ID N 164 LI-6132 1 No Hits found SEQ ID N"165 LI-1533. 1 No Hits found SEQ ID ? 166 LI-5750. 1 No Hits found SEQ ID ? 167 LI-6127. 1 55 plrllA41902 arsenical resistance operon repressor-Staphylococcus xylosus plasmid pSX267 Length = 104 SEQ ID N 168 LI-708. 1 No Hlts found SEQ ID N 169 LI-2517. 1 No Hits found SEQ ID N 170 LI-14381 No H ! ts found SEQ ID N 171 LI-3307. 1 No Hits found SEQ ID N 172 LI-41511 No Hits found
<Desc/Clms Page number 55>
Figure img00550001

SEQ ID ? 173 LI-550. 1 No Hits found SEQ IDN 174 LI-5573. 1 No Hits found SEQ ID ? 175 LI-2618. 1 No Hits found SEQ ID DN 176 LI-298. 1 No Hits found SEQ ID ? 177 LI-3652. 1 No Hits found SEQ ID N"178 LI-5585. 1 No Hits found SEQ ID ? 179 LI-5707. 1 44 gblAAC38975. 11 (AF041330) NADH dehydrogenase subunit 5 [Bodo saltans] Length =212 SEQ ID NO 180 LI-31. 1 No Hits found SEQ IDN 181 LI-4041. 1 No Hits found SEQ ID NO 182 LI-4828. 1 No Hits found SEQ ID NO 183 LI-2188 1 No Hits found SEQ ID ? 184 LI-5616. 1 No Hits found SEQ ID DN 185 LI-2350. 1 No Hits found SEQ ID N 186 LI-269. 1 No Hits found SEQ ID DN 187 LI-329. 1 No Hits found SEQ ID ? 188 LI-3992. 1 No Hits found SEQ ID ? 189 LI-5409. 1 No Hits found SEQ ID ? 190 LI-6056 1 No Hits found SEQ ID NO 191 LI-1183. 1 49 spIP10023IYGI2~BACTU HYPOTHETICAL 30. 3 KD PROTEIN (ORF 2) emblCAA31837 11 (X13481) ORF 2 [Bacillus thuringiensis] Length = 270 SEQIDN 192 LI-1282. 1 No Hlts found SEQ ID NO 193 LI-2924 1 No Hits found SEQ ID N 194 LI-4020. 1 57 gblAAD21914 11 (AF085222) unknown [Streptococcus us bacteriophage DT1] Length = 107 SEQ ID N'195 LI-5642. 1 54 spIP029091PTLA-STAAU PTS SYSTEM, LACTOSE-SPECIFIC liA COMPONENT (EIIA-LAC) (LACTOSE-PERMEASE tA COMPONENT) (PHOSPHOTRANSFERASE ENZYME Il, A COMPONENT) (Elli-LAC) gblAAA26648. 11 (J03479) enzyme III-lac (lacF) [Staphylococcus aureus] SEQ ID NO 196 LI-577. 1 No Hits found SEQ ID N* 197 LI-6012. 1 No Hits found SEQ ID N 198 LI-3900. 1 No Hits found SEQ ID N'199 LI-4195. 1 91 pirlIS49318 transposase-Enterococcus hirae insertion sequence IS1216 emblCAA57312 11 (X81654) transposase [Enterococcus hirae] emblCAA48844 11 (X69092) transposase [Enterococcus hirae] Length = 226 SEQ ID DN 200 LI-443. 1 No Hlts found SEQ ID ? 201 LI-4484 1 No Hits found SEQ ID NO 202 LI-4869. 1 No Hits found SEQ ID N 203 LI-5183 1 45 gblAAC38975 11 (AF041330) NADH dehydrogenase subunit 5 [Bodo saltans] Length = 212 SEQ ID N'204 LI-2365. 1 55 pirlIG72548 hypothetical protein APE1675-Aeropyrum pernix (strain K1) dbjlBAA80676 11 (AP000062) 155aa long hypothetcal protein [Aeropyrum pernix] Length = 155 SEQ ID N 205 LI-3400. 1 No Hlts found SEQ ID N 206 LI-3989. 1 56 emblCAB53822 11 (AJ242593) putative repressor protein [Bacteriophage A118] Length = 101 SEQ ID N 207 LI-41361 No Hits found SEQ N'208 LI-480. 1 No Hits found
<Desc/Clms Page number 56>
Figure img00560001

SEQ ID N* 209 LI-6104. 1 No Hfts found SEQ ! DN''209 U-6104. 1 NoHitsfound SEQ) DN 210 U-1935. 1No Hits found SEQ ID N 210 Ll-1935. 1 No Hits found SEQ ID N 211 LI-2169. 1 No Hits found SEQ ID NO 212 LI-4179. 1 54 pirllS38640 replication protein B-Pediococcus halophilus (ATCC 33315) (cryptic plasmid) embICAA53279. 11 (X75607) RepB [Tetragenococcus halophilus] prfll2207193B repB gene [Tetragenococcus halophilus] Length = 168 SEQ ID NO 213 LI-4533. 1 No Hits found SEQ ID N 214 LI-5677. 1 44 pirG72510 hypothetical protein APE2061-Aeropyrum pernix (strain K1) dbjlBAA81071. 11 (AP000063) 114aa long hypothetical protein [Aeropyrum pernix] Length = 114 SEQ IDN 215 LI-623. 1 No Hits found SEQ IDN 216 LI-807. 1 No Hits found SEQ ID N'217 LI-2866. 1 40 reflNP-010291. 11 YdrOO8cp pirlIS70313 hypothetical protein YDRO08c-yeast (Saccharomyces cerevisiae) Length = 116 SEQ ID N'218 LI-3022. 1 42 dbjIBAA87194. 11 (AB027890) Hypothetical protein [Schizosaccharomyces pombe] Length = 210 SEQ IDN 219 LI-508 1 No Hits found SEQ ID NO 220 LI-552. 1 No Hits found SEQiD N 221 LI-4086. 1 No Hits found SEQ ID NO 222 LI-4935. 1 No Hits found SEQ ID N'223 LI-1312 1 30 pirlIH72754 hypothetical protein APE0029-Aeropyrum pernix (strain K1) dbJIBM78938. 11 (AP000058) 138aa long hypothetcal protem [Aeropyrum pernix] Length = 138 SEQ ID No 224 LI-2970. 1 No Hits found SEQ ID N'225 LI-234. 1 49 pirlIT31613 hypothetical protein Y50E8Ai-Caenorhabditis elegans Length = 836 SEQ ID N 226 LI-1553. 1 No Hits found SEQ ID N 227 LI-2935. 1 No Hits found SEQ ID DN 228 LI-2941. 1 No Hits found SEQ ID N'229 LI-3325. 1 No Hits found SEQ ID NO 230 LI-4061. 1 No Hits found SEQ ID ? 231 LI-6086. 1 No Hits found SEQ ID ? 232 LI-2646. 1 49 pirS72740 B1177F1~12 protein-Mycobacterium leprae gblAAA17104 11 (U00011) p1177c, B1177F1~12 [Mycobacterium leprae] Length = 219" SEQ ID N 233 LI-3823. 1 55 pirC72455 hypothetical protein APE2287-Aeropyrum pernix (strain K1) dbjBAA81299. 11 (AP000064) 191aa long hypothetical protein [Aeropyrum pernix] Length = 191 SEQ IDN 234 LI-5622. 1 No Hits found SEQ ID W 235 LI-1499. 1 45 plr1lH72469 hypothetical protem APE2401-Aeropyrum pernix (strain Kl) dbjIBAA81416 1 (AP000064) 252aa long hypothetical protein [Aeropyrum pernix] Length = 252 SEQ ID ? 236 LI-4044. 1 No Hits found SEQ ID N'237 LI-4799 1 34 embICAB57660 11 (Yl8930) hypothetical protein [Sulfolobus solfataricus] Length = 108 SEQ ID N 238 LI-1044 1 No Hits found SEQ IDN 239 LI-1247. 1 No Hits found SEQ ID N'240 LI-5276. 1 No Hits found
<Desc/Clms Page number 57>
Figure img00570001

SEQ ID NO 241 LI-4038. 1 53 pir)) serine-rich protein-fission yeast (Schizosaccharomyces pombe) emb) CAA22127. 1j (AL033534) hypotheticai serine-rich secreted protein [Schizosaccharomyces pombe] Length = 534 SEQ ID N"242 LI-543. 1 No Hits found SEQ ID N 243 LI-5937. 1 55 gblAAC27928. 11 (AF062070) thermosensitive mutant immunity repressor [bacteriophage phi-105] Length = 147 '51 SEQ ID N'244 LI-2068. 1 pirlIF71456 hypothetical protein PH0308-Pyrococcus horikoshii 32 dbjBAA29381 11 (AP000001) 215aa long hypothetical protein [Pyrococcus horikoshii] Length = 215 SEQ ID NO 245 LI-3142. 1 No Hits found SEQ ID N 246 LI-4047. 1 No Hits found SEQ ID N"247 LI-4073. 1 No Hits found SEQ ID ? 248 LI-4483. 1 No Hits found SEQ ID N 249 LI-547. 1 35 pirA70002 protein kinase homolog ytvA-Bacillus subtilis gbAAC00382 11 (AF008220) putative protein kinase bacillus subtilis] emb1CAB15012. 11 (Z99119) similar to protein kinase (Bacillus subtilis] Length = 261 SEQ ID N'250 LI-5640. 1 44 spIQ453991PTCB-BACST PTS SYSTEM, CELLOBIOSE-SPECIFIC IIB COMPONENT (EIIB-CEL) (CELLOBIOSE-PERMEASE IIB COMPONENT) (PHOSPHOTRANSFERASE ENZYME Il, B COMPONENT) pirlIB49898 cellobiose phosphotransferase system celABacillus SEQ ID N 251 LI-689. 1 56 gil6321628 Cell wall protein ; Crh1 p sp1P533011YG46-YEAST HYPOTHETICAL 52. 8 KD PROTEIN IN BUB1-HIP1INTERGENIC REGION plrllS64507 probable membrane protein YGR189c-yeast (Saccharomyces cerevisiae) embICM97215. 11 (Z72974) ORF YGR189c [Sacch SEQ ID ? 252 LI-2066. 1 No Hits found SEQ ID ? 253 LI-4008. 1 No Hits found SEQ ID N 254 LI-4042. 1 No Hits found SEQ ID N"255 LI-4145. 1 95 gb1MB37344. 11 (U78967) cadmium resistance regulator protein [Lactococcus lactis] Length = 119 SEQ ID N'256 LI-5586. 1 51 spIP459241YQBH BACSU HYPOTHETICAL 14. 3 KD PROTEIN IN SPOIIICCWLA INTERGENIC REGION pirj) C69947 phage-reiated protein homolog yqbH-Bacillus subtilis dbjBAA12403. 11 (D84432) YqbH bacillus subtilis] emb) CAB14552 1) (Z99117) similarto phage-related p SEQ ID N 257 LI-4152 1 No Hlts found SEQ ID N 258 LI-4154. 1 No Hits found SEQ ID N 259 LI-41811 54 plrllT09011 probable transposase TnpA-Streptococcus pyogenes (fragment) gblMB92607 11 (AF026542) TnpA streptococcus pyogenes] Length = 364 SEQ ID N 260 LI-4220. 1 No Hits found SEQ ID N 261 LI-4477. 1 No Hits found SEQ ID N 262 LI-2014. 1 No Hlts found SEQ ID N 263 LI-5182 1 50 dbjlBAA97098 11 (AP002460) gene~id : F1 D9. 26-unknown protein {Arabtdopsis thaliana] Length = 260 SEQ ID N"264 LI-5545 1 No Hits found
<Desc/Clms Page number 58>
Figure img00580001

SEQ ID ? 265 LI-5549. 1 No Hits found SEQ ID NO 266 LI-5556. 1 No Hits found SEQ ID N 267 LI-6015. 1 No Hits found SEQ ID N'268 LI-6125 1 54 spIQ01256JARSR-STAXY ARSENICAL RESISTANCE OPERON REPRESSOR gblAAA27587. 11 (M80565) ars operon regulator protein (repressor) [Plasmid pSX267] Length = 104 SEQ ID N 269 LI-6186. 1 No Hits found SEQ ID N 270 LI-2659. 1 39 pirC69982 hypothetical protein yrzD-Bacillus subtilis embjCAB14726. 11 (Z99118) yrzD [Bacillus subtilis] Length = 98 SEQ ID N"271 LI-2949. 1 No Hits found SEQ ID N"272 LI-2961. 1 No Hits found SEQ ID N 273 LI-4478 1 No Hits found SEQ ID N'274 LI-283. 1 29 pirlID72568 hypothetical protein APE1830-Aeropyrum pernix (strain K1) dbj) BAA80833. 11 (AP000062) 100aa long hypothetical protein [Aeropyrum pernix] Length = 100 SEQ ID N 275 LI-4899. 1 No Hits found SEQ ID N 276 LI-521. 1 58 gblAAF41678 11 (AE002479) transcriptional regulator, MerR family [Neisseria meningitidis MC58] emb) CAB84745. 11 (AL162756) putative transcriptional regulator [Nelsseria meningitidis] Length = 135 SEQ ID N 277 LI-6126 1 51gblAAD51848 11AF178758-4 (AF178758) ArsD [Sinorhizobium sp. As4] Length = 119 SEQ ID N'278 LI-1390. 1 No Hits found SEQ ID N'279 LI-2968. 1 No Hits found SEQ ID N 280 LI-4132. 1 46 gblAAF13645. 1 ! AF18893543 (AF188935) pX02-40 [Bacillus anthracis] Length = 128 SEQ ID N'281 LI-6032. 1 No Hits found SEQ ID N"282 LI-4028. 1 No Hits found SEQ ID N 283 LI-773. 1 No Hits found SEQ ID N'284 LI-2038 1 46 spIP758691YCCR-ECOLI HYPOTHETICAL 24. 1 KDA PROTEIN IN SULAHELD INTERGENIC REGION pirllF64836 probable membrane protein bO959Escherich ! a coii gbAAC74045. 1 [ (AE000198) orf, hypothetica ! protein [Eschenchia coli] dbjBAA35717. 11 (D90733) ORFJD : o223 SEQ ID N 285 LI-2973. 1 No Hits found SEQ ID N 286 LI-2019. 1 No Hits found SEQ ID N 287 LI-2052 1 50 gblAAD01956 11 (AF033016) unknown [Listeria monocytogenes] Length =75 SEQ ID N 288 LI-2945. 1 No Htts found SEQ ID N 289 LI-4030 1 No Hits found SEQ ID ? 290 LI-4522 1 No Hits found SEQ ID N"291 LI-6030. 1 No Hits found SEQ ID N 292 LI-2456. 1 No Htts found SEQ ID N 293 LI-42151 No Hits found SEQ ID DN 294 LI-5926. 1 61 emblCAA70358 11 (Y09161) antigen C [Listeria monocytogenes] Length =138 SEQ ID N 295 LI-23161 38 spIP25958ICMG6~BACSU COMG OPERON PROTEIN 6 pirlIG69603 DNA transport machinery comGF-Bacillus subtilis emblCAB14399 11 (Z99116) probably part of the DNA transport machinery [Bacillus subtilis] Length = 127
<Desc/Clms Page number 59>
Figure img00590001

SEQ ID ? 296 LI-394. 1 No Hits found SEQ ID N 297 LI-5039. 1 No Hits found SEQ ID ? 298 LI-6068. 1 No Hits found SEQ ID NO 299 LI-6070. 1 No Hits found SEQ ID N'300 LI-825. 1 32 gblAAC69727 11 (AF061128) merozoite surface protein 1 [Plasmodium falciparum] Length = 402 SEQ ID N 301 LI-2972. 1 No Hits found SEQ ID N"302 LI-3339. 1 No Hits found SEQ ID N 303 LI-3371. 1 80 emblCAB53849 11 (AJ242593) gp59 [Bacteriophage AU18] Length =133 SEQ ID ? 304 LI-3529. 1 No Hits found SEQ ID ? 305 LI-4063. 1 No Hits found SEQ ID N"306 LI-4808. 1 38 spIO09788IYA9A~SCHPO HYPOTHETICAL 54. 2 KD SERINE-RICH PROTEIN C13G6. 10C IN CHROMOSOME 1 PRECURSOR pir rS62439 hypothetical protein SPAC13G6. 10c-fission yeast (Schizosaccharomyces pombe) pirllT37645 hypothetical serine rich protei SEQ ID N 307 LI-4099. 1 No Hits found SEQ ID N'308 LI-5587. 1 55 spIP459231YQBG-BACSU HYPOTHETICAL 14. 7 KD PROTEIN IN SPOIIICCWLA INTERGENIC REGION pir rB69947 hypothetical protein yqbG-Bacillus subtilis dbjBAA06940. 11 (D32216) ORF76 [Bacillussubtilis] dbjlBAA1240211 (D84432) YqbG [Bacillus subtilis] emblCAB1 SEQ ID N'309 LI-4963. 1 35 pirlIE69801 hypothetical protein yfhl-Bacillus subtilis embICAB12686. 11 (Z99108) yfhL [Bacillus subtilis] dbjIBAA24478. 11 (D85082) YfhL bacillus subtilis] Length = 110 SEQ ID N 310 LI-3199 1 No Hits found SEQ ID NO 311 LI-6057. 1 26 emb1CAB01605. 11 (Z78205) UL36 [Bovine herpesvirus 1] emb) CAA06097. 1 (AJO04801) very large virion protein (tegument) [Bovine herpesvirus type 1. 1] Length = 3247 SEQ ID N'312 LI-776. 1 34 spIP426221YHAI-ECOLI HYPOTHETICAL 13. 5 KD PROTEIN IN EXUR-TDCC INTERGENIC REGION pir rE65099 hypothetical 13 5 kD protein in exuR-tdcC intergenic ! on- Escherichiacoh (strainK-12) gbAAA57908. 1 (U18997) ORFo118 [Escherichia coli] gbl SEQ ID N'313 LI-3375 1 No Hits found SEQ ID N"314 LI-3377. 1 No Hits found SEQ ID N 315 LI-5565 1 68 spIP54338IXKDS~BACSU PHAGE-LiKE ELEMENT PBSX PROTEIN XKDS plrllB69733 PBSX prophage ORF xkdS-Bacillus subts embCAA94040. 11 (Z70177) homologous to yqbS of the skin element [Bacillus subtilis] emb1CAB13129. 11 (Z99110) PBSX prophage (Bacillus subtil SEQ ID ? 316 LI-5935 1 52 dbjlBAA36659 11 (AB016282) ORF2 [bacteriophage phi-105] Length = 148 SEQ ID N 317 LI-3998. 1 No Hits found SEQ ID N'318 LI-6005. 1 57 dbjIBAA36659 11 (AB01 6282) ORF2 [bacteriophage phi-105] Length = 148 SEQ ID NO 319 LI-1341 1 No Hits found
<Desc/Clms Page number 60>
Figure img00600001

SEQ ID NO 320 LI-2487. 1 30 sp) Q45460pPBABACSUCHOL) NE TRANSPORT ATP-BINDING PROTEIN OPUBA pir rG69669 choline ABC transporter (ATP-binding protein) opuBABacillus subtilis gb) AAC14356. 11 (AF008930) ATPase [Bacillus subtilis] emblCAB15378 11 (Z99121) choline ABC tr SEQ ID N 321 LI-3180. 1 No Hits found SEQ ID ? 322 LI-2997. 1 44 emblCAB53856 11 (AJ242593) gp66 [Bacteriophage AU18] Length = 144 SEQ ID N'323 LI-6045. 1 44 embICAB53856. 11 (AJ242593) gp66 [Bacteriophage AU18] Length = 144 SEQ ID N 324 LI-1517. 1 40 pilla28298 myosin heavy chain beta, cardiac muscle-golden hamster (fragment) emb1CM30256. 11 (X07273) beta-myosin heavy chain (974 Axa), S2 fragment and LMM region [Mesocricetus auratus] Length = 974" SEQ ID ? 325 LI-6006. 2 SEQ ID N'326 LI-3335. 1 34 gblAAF66771 11AF147806-35 (AF1 47806) major tegument protein [Gallid herpesvirus 2] Length = 3325 SEQ ID NO 327 LI-51. 1 No Hits found SEQ ID NO 328 LI-1931. 1 No Hits found SEQ ID N"329 LI-4521. 1 No Hits found SEQ ID N 330 LI-6028 1 51 spIP45911jYQAN~BACSU HYPOTHETICAL 16. 1 KD PROTEIN IN SPOIIICCWLA INTERGENIC REGION pir rE69945 hypothetical protein yqaN-Bacillus subtilis dbjlBAA06928 11 (D32216) ORF39 [Bacillus subtilis] dbj ! BAA12389. 11 (D84432) YqaN [Bacillus subtills] emblCAB1 SEQ ID N'331 LI-3319. 1 No Hits found SEQ ID N 332 LI-4250. 1 No Hits found SEQ ID NO 333 LI-108. 1 No Hits found SEQ ID ? 334 LI-4959. 1 41 spIP54940jYXEA~BACSU HYPOTHETICAL 13. 0 KD PROTEIN IN IDH-DEOR INTERGENIC REGION PRECURSOR pirj) C70074 hypothetica ! protein yxeA-Bacillus subtilis dbjjBAA08317. 11 (D45912) yxeA [Bacillus subtilis] emblCAB15998 11 (Z99124) yxeA [Bacillus sub SEQ ID NO 335 LI-846 1 No Hrts found SEQ ID NO 336 LI-4170. 1 No Hits found SEQ ID N'337 LI-5577. 1 83 spIP459291YQBM-BACSU HYPOTHETICAL 16. 3 KD PROTEIN IN SPOIIICCWLA INTERGENIC REGION pir rH69947 phage-related protein homolog yqbM-Bacillus subtilis dbj) BAA06945. 11 (D32216) ORF71 [Bacillus subtilis] dbjBAA12408 1 (D84432) YqbM [Bacillus subtilis] SEQ ID N 338 LI-779. 1 40p ! rF69168 hypothettcal protem MTH520-Methanobactenum thermoautotrophicum (strain ! nDe ! taH) gbAAB85026. 1HAE000835) unknown [Methanobactenum thermoautotrophicum] Length = 104 SEQ ID ? 339 LI-2822. 1 No Hits found SEQ ID DN 340 LI-2931. 1 83 emblCAB53814 11 (AJ242593) gp28 [Bacter ! ophageA118] Length = 149 SEQ ID ? 341 LI-2976 1 No Hits found SEQ ID ? 342 LI-3835. 1 36 emblCAB57639 11 (Y18930) hypothetical protein [Sulfolobus solfataricus] Length = 106
<Desc/Clms Page number 61>
Figure img00610001

SEQ ID N 343 LI-3613. 1 No Hits found SEQ ID N'344 LI-3988. 1 51 embICAB53821. Il (AJ242593) gp35 [Bacteriophage AU 8] Length = 163 SEQ ID No 345 LI-2287. 1 No Hits found SEQ ID N 346 LI-338. 1 No Hits found SEQ ID N 347 LI-4098. 1 25 pirll140868 hypothetical protein 3 nanH region-Clostridium perfringens embICAA60798. 11 (X87369) ORF3 [Clostridium perfringens Length = 265 SEQ ID No 348 LI-1716. 1 No Hits found SEQ ID N"349 LI-6063. 1 No Hits found SEQ ID N"350 LI-1117. 1 No Hits found SEQ ID ? 351 L !-4137. 1No Hits found SEQ ID No 352 LI-2778. 1 33 gblAAB60026. 11 (UO9422) ORF7 [Enterococcus faeca ! ! s] prf) j2114402U ORF 7 [Enterococcus faecalis] Length = 157 SEQ ID ? 353 LI-2783. 1 47gblAAF41678. 11 (AE002479) transcriptional regulator, MerR family [Neisseria meningitidis MC58] emb1CAB84745. 11 (AL 162756) putative transcriptional regulator [Neisseria meningitidis] Length = 135 SEQ ID N 354 LI-3846 1 No Hits found SEQ ID ? 355 U-929. 1 No Hits found SEQ ID N'356 LI-664. 1 No Hits found SEQ ID NO 357 LI-3625 1 51 plrllB70030 conserved hypothetical protem yvbK-Bacillus subtilis embCAB15394. 11 (Z99121) similar to hypothetical proteins from B. subtilis [Bacillus subtihs] Length = 155 SEQ ID N 358 LI-4119. 1 No Hits found SEQ ID N 359 LI-4479. 1 No Hits found SEQ ID N 360 LI-2939. 1 No Hits found SEQ ID N 361 LI-4012. 1 52 dbjlBAA97823 11 (AB044554) orf 16 staphylococcus aureus prophage ph ! PV83] Length = 159 SEQ ID N"362 LI-5553. 1 No Hits found SEQ ID N'363 LI-5583. 1 50 spIP5433OIXKDJ-BACSU PHAGE-LIKE ELEMENT PBSX PROTEIN XKDJ pirllB69732 PBSX prophage ORF xkdJ-Bacillus subtilis emb) CAA94065. 11 (Z70177) homologous to yqbJ of the skin element [Bacillus subtilis] emblCAB13121 11 (Z9911 0) PBSX prophage [Bacillus subtil SEQ ID N 364 LI-5612 2 SEQ ID N 365 LI-4016. 1 49 gblMC97922 11 (AF077306) gp151 [Streptococcus thermophilus bacteriophage Sf119] gbIMD440721IAF115102~31 (AF115102) orf151 gp streptococcus thermophilus bacteriophage Sfi19] Length = 151 SEQ ID N 366 LI-4193. 1 78 emblCAA63529 11 (X92946) transposase [Lactococcus lactis] Length 228 SEQ ID ? 367 LI-2609. 1 26 pirF72598 hypothetical protem APE1254-Aeropyrum pernix (strain K1) dbjlBM80244 11 (AP000061) 109aa long hypothehcal protem [Aeropyrum pernix] Length = 109 SEQ ID ? 368 LI-2940 1 No Hits found SEQ ID N 369 LI-4459. 1 No Hlts found SEQ ID N 370 LI-5315 1 69 sp066911 ! UVRAAQUAE EXCINUCLEASE ABC SUBUNIT A pirlIC70360 repair excision nuclease subun ! t A-Aqu ! fex aeohcus gbjAAC06874. 1 [ (AE000702) repair excision nuclease subunit A [Aquifex aeolicus] Length 926
<Desc/Clms Page number 62>
Figure img00620001

SEQ ID ? 371 LI-5576. 1 65 spIP45930IYQBN~BACSU HYPOTHETICAL 17. 1 KD PROTEIN IN SPOIIICCWLA INTERGENIC REGION pirlIA69948 phage-related protein homolog yqbN-Bacillus subtilis dbj) BAA06946. 11 (D32216) ORF55 bacillus subtilis] dbj) BAA12410. 11 (D84432) YqbN bacillus subtilis] SEQ ID N 372 LI-5578. 1 No Hits found SEQ ID N 373 LI-2967. 1 No Hits found SEQ ID N'374 LI-2836. 1 38 pirlIH72608 hypothetical protein APE1334-Aeropyrum pernix (strain K1) dbjlBAA80326 11 (AP000061) 211aa long hypothetical protein [Aeropyrum pernix] Length = 211 SEQ ID ? 375 LI-3370. 1 No Hits found SEQ ID N'376 LI-5584. 1 70 spIP459251YQBI-BACSU HYPOTHETICAL 19. 9 KD PROTEIN IN SPOIIICCWLA INTERGENIC REGION pill069947 phage-related protein homolog yqbl - Bacillus subtlhs dbj1BM06941. 11 (032216) ORF67 [Bacillus subtilis] dbj1BM12404. 11 (084432) Yqbl [Bacillus subtilis] SEQ ID ? 377 LI-5801 1 67 gblAAF04740. 11 (AF102169) multidrug resistance-like protein [Listeria monocytogenes] Length = 228 SEQ ID NO 378 LI-3338. 1 42 pirllT33369 hypothetical protein H02F09. 3-Caenorhabditis elegans gblMC64622 11 (AF077538) unknown [Caenorhabditis elegans] Length = 1275 SEQ ID NO 379 LI-4106. 1 65 spIQ993381'STB~BACTB INSERTION SEQUENCE IS232 PUTATIVE ATPBINDING PROTEIN pirlIB37801 IstB protein homolog-Bacillus thuringiensis gblAAA98141 11 (M38370) ORF2 [Insertion sequence IS232] Length = 250 SEQ ID NO 380 LI-4155. 1 21 plr1lF72491 hypothetical protein APE2573-Aeropyrum pernix (strain K1) dbjBAA81590. 11 (AP000064) 238aa long hypothetical protein [Aeropyrum pernix] Length = 238 SEQ ID N 381 LI-2451. 1 No Hits found SEQ ID N"382 LI-3987. 1 No Hrts found SEQ ID N 383 LI-4474. 1 No Hits found SEQ ID N 384 LI-494. 1 42 gblMF41678 11 (AE002479) transcriptional regulator, MerR family [Neisseria meningitidis MC58] embICAB84745. 11 (AL162756) putative transcriptional regulator [Neissena meningitidis] Length = 135 SEQ ID N 385 LI-2964 1 No Hits found SEQ ID N 386 LI-6202. 1 SEQ ID N'387 LI-2102 1 No Hits found SEQ ID ? 388 LI-1260. 1 No Hits found SEQ ID N 389 LI-2820. 1 94 gblAAF04738 11 (AF102167) stress protein-like protein [Listena monocytogenes] Length = 174 SEQ ID N 390 LI-3283 1 No Hlts found SEQ ID N 391 LI-3378. 1 No H) ts found SEQ ID N 392 LI-6009. 2 SEQ ID No 393 LI-624. 1 No Hits found SEQ ID N 394 LI-2969 1 No Hfts found SEQ ID N 395 LI-2999 1 No Hlts found SEQ ID ? 396 LI-4003 1 No ts found SEQ ID N 397 LI-6109 1 No Hits found
<Desc/Clms Page number 63>
Figure img00630001

SEQ ID N 398 LI-4081. 1 61 emblCAB83893 11 (AL 162753) hypothetical protein NMA0603 [Neisseria meningitidis] Length = 182 SEQ ID N'399 LI-4696. 1 67 spIP966741YDEQ-BACSU PUTATIVE NAD (P) H OXIDOREDUCTASE YDEQ pirlIC69779 NAD (P) H oxidoreductase homolog ydeQ-Bacillus subtilis dbjjBAA19364. 11 (AB001488) PROBABLE NAD (P) H OXIDOREDUCTASE.
[Bacillus subtilis] emb) CAB12337. 11 (Z99106) similarto NAD (P) H ox SEQ ID DN 400 LI-3361. 1 87 embCAB53787. 11 (AJ242593) putative terminase small subunit [Bactenophage A118] Length = 180 SEQ ID N'401 LI-2383. 1 25 gblAAC45309. 11 (U81957) putative DNA binding protein streptococcus gordonii] Length = 122 SEQ ID N 402 LI-2787. 1 No Hits found SEQ ID N 403 LI-4184. 1 72 gblAAB91419 11 (AF037091) RepB homolog [Lactobacillus rhamnosus] Length = 172 SEQ ID N'404 LI-4150 1 89 spIP192411BINR-STAAU DNA-INVERTASE BINR (TRANSPOSON TN552) plrllS16509 DNA-invertase-Staphylococcus aureus transposon Tn552 gblAAA26640 11 (M36694) DNA invertase (ttg start codon) staphylococcus aureus] Length = 192 SEQ ID N 405 LI-1323. 1 No Hlts found SEQ ID N'406 LI-3996. 1 No Hits found SEQ ID N'407 LI-5572 1 41 pirlIS49915 extensin-like protein-maize embICAA84230. 11 (Z34465) extensinlike protein [Zea mays] prf2111476A extensin-like demain [Zea mays] Length = 1188 SEQ ID ? 408 LI-4485 1 No Hits found SEQ ID N' 409 LI-6029. 1 No Hits found SEQ ID ? 410 LI-6076. 1 35 pir rS00250 myosm heavy chain-slime mold (Dictyostelium discoideum) (fragment) Length = 160 SEQ ID No 411 LI-4309 1 No Hits found SEQ ID N'412 LI-4140 1 83 gblAAF86683. 11 (AF1 79848) unknown [Lactococcus lactis subsp. lactis] Length = 196 SEQ ID N 413 LI-6189. 2 SEQ ID NO 414 LI-1239. 1 No Hits found SEQ ID N'415 LI-4079 1 57 embICAB83894. 11 (AL162753) hypothetical protein NMA0604 [Neisseria meningitidis] Length = 187 SEQ ID N"416 LI-4046 1 38 plrllT13523 hypothetical protem 34-Bacillus phage phi-105 dbJIBM36640 11 (AB016282) ORF34 [bacteriophage phi-105] Length = 200 SEQ ID NO 417 LI-5934. 1 No Hits found SEQ ID No 418 LI-2998. 1 35 pirlIT1 3190 hypothetical protein R242-Lactobacillus phage phi-gle emblCAA66766 11 (X98106) Rorf242 [Bacteriophage phig1e] Length = 242 SEQ ID N 419 LI-304. 1 20 emblCAA49825 11 (X70360) ORF2 [Azospirillum brasilense] Length = 173 SEQ ID ? 420 LI-4945 1 No Hlts found SEQ ID N 421 LI-1552. 1 29 dbjlBAA82251 11 (AB014440) orf3 staphylococcus aureus] Length =151 SEQ ID N 422 LI-4037. 1 51 dbjIBAA97848 11 (AB044554) orf 41-phi PVL orf 5 and 6 staphylococcus aureus prophage ! PV83] Length = 194
<Desc/Clms Page number 64>
Figure img00640001

SEQ ID N'423 LI-5108. 1 38 spIP54396jYPMB~BACSU HYPOTHETICAL 17. 9 KD PROTEIN IN DINGASPB INTERGENIC REGION pir)) F69938 hypothetical protein ypmB-Bacillus subtilis gblAAB38453. 11 (L47709) putative bacillus subt ! ! ! s] emb) CAB14154. 1j (Z99115) ypmB [Bacillus subtilis] SEQ ID W 424 LI-5561. 1 53 spIP54340IXKDU~BACSU PHAGE-LiKE ELEMENT PBSX PROTEIN XKDT pirllD69733 PBSX prophage ORF xkdU-Bacillus subtilis emb1CM94042. 11 (Z70177) homologous to yqcA of the skin element bacillus subtilisez emb1CAB13131. 11 (Z9911 0) PBSX prophage bacillus subtil SEQ ID N 425 LI-1717. 1 No Hits found SEQ ID N 426 LI-6043. 1 34 pirllT13190 hypothetical protein R242-Lactobacillus phage phi-gle emb1CAA66766. 11 (X98106) Rorf242 [Bacteriophage phig1e] Length = 242 SEQ ID N 427 LI-3740. 1 44 splP46330lYXBFBACSU HYPOTHETICAL 44. 3 KDA PROTEIN IN HTPGALDX ! NTERGEN ! C REG ! ON pirjjA70073 hypothetica ! protein yxbF-Bacillus subtilis dbjIBAA21600. 1l (AB005554) yxbF [Bacillus subtilis] embjCAB16021. 11 (Z99124) alternate gene name : yxaT bacillus SEQ ID DN 428 LI-6087. 1 49 splP397841PCFBACSU POSITIVE CONTROL FACTOR pir ! ! ! 40413 positive control factor (xre region) xpf-Bacillus subtilis embCAA84046. 11 (Z34287) ORF7 ; homology to regions 4. 1 and 4. 2 of sigma factors bacillus subtilis] emb ! CAA94057. 11 (Z70177) SEQ IDN 429 LI-2151. 1 No Hits found SEQ ID N 430 LI-4097. 1 No Hits found SEQ ID ? 431 LI-4146. 1 78gbAAB08926. 1 (U39859) invertase-enterococcal [Enterococcus faecalis] Length = 202 SEQ ID N 432 LI-1236. 1 No Hits found SEQ IDN 433 LI-3291. 1 No Hits found SEQ IDN 434 LI-4512. 1 30 pirF71011 hypothetical protein PH1388-Pyrococcus horikoshii dbjjBAA30494. 11 (AP000006) 119aa long hypothetical protein [Pyrococcus horikoshii] Length = 119 SEQ ID N'435 LI-4120. 1 32 gblAAC17959. 11 (AF022806) unknown [Pantoea citrea] Length = 208 SEQ IDN 436 LI-4223. 1 35 emblCAB88960 11 (AL353864) hypothetical protein SC8F11. 09. [Streptomyces coelicolor A3 (2)] Length = 137 SEQ IDN 437 LI-6183. 2 SEQ ID NO 438 LI-13451 43 emblCAB75242 11 (Al139075) putative periplasmic protein [Campylobacter jejunl] Length = 390 SEQ ID W 439 LI-3379 1 67 emblCAB5384111 (AJ242593) gp51 {Bacteriophage AU 8] Length =186 SEQ IDN 440 LI-5543. 1 No Hits found SEQ ID N 441 LI-6018 1 47 gblAAF43118 1) AF208055~5 (AF208055) Orf245 [bacteriophage phi31 1] gblAAF74061. 11 (AF212844) ORF245 [Lactococcus lactis] gbjAAF74095. 11 (AF212846) ORF245 [Lactococcus lactis bactenophage ut36. 1] gblMF74110 11 (AF212847) ORF245 [Lactococcus lactis bac SEQ IDN 442 LI-1951. 1 No Hits found SEQiDN 443 Li-4535. 1No Hfts found
<Desc/Clms Page number 65>
Figure img00650001

SEQ ID N 444 LI-1171. 1 37 gblAAF36806. 11 (AF155139) VanZF [Paenibacillus popilliae] Length = 206 SEQ ID N 445 LI-1215. 1 59 pirA69898 conserved hypothetical protein yoaZ-Bacillus subtilis gb ! AAB84456 1) (AF027868) YoaZ bacillus subtilis] emb) CAB13771. 11 (Z99114) similar to hypothetical proteins from B. subtilis bacillus subtilis] Length = 210 SEQ ID N'446 LI-4153. 1 64 spIP946061ATKC-CLOAB POTASSIUM-TRANSPORTING ATPASE C CHAIN (ATP PHOSPHOHYDROLASE [POTASSIUM-TRANSPORTING] C CHAIN) gb1AAC45479. 11 (U44892) KdpC [Clostridium acetobutylicum] Length = 204 SEQ ID N 447 LI-2943. 1 No Hits found SEQ ID NO 448 LI-2942. 1 No Hits found SEQ ID N 449 LM 120. 1 35 splP310781PETPRHOCA PETP PROTEIN pirllS22631 petPproteinRhodobacter capsulatus emb1CAA78097. 11 (Z12113) protein of unknown function [Rhodobacter capsulatus] Length = 166 SEQ ID NO 450 LI-4532. 1 No Hits found SEQ ID N 451 LI-3387 1 99 emblCAB53838 11 (AJ242593) putative recombinase [Bacteriophage A118] Length = 271 SEQ ID N 452 LI-11251 34 gblAAC97845 11 (AF063866) ORF MSV027 tryptophan repeat gene family protein [Melanoplus sanguinipes entomopoxvirus] Length = 297 SEQ ID NO 453 LI-4217 1 No Hits found SEQ ID N'454 LI-5704. 1 No Hits found SEQ ID DN 455 LI-2923. 1 41 gblAAC44021. 11 (U40830) Orf14. 9 protein [Streptococcus thermophilus] prf2209356Q ORF 14. 9 streptococcus thermophilus] Length = 191 SEQ ID N 456 LI-1393. 1 No Hits found SEQ ID N 457 LI-2461. 1 39 gblAAC44021 11 (U40830) Orf14. 9 protein [Streptococcus thermophilus] prf2209356Q ORF 14. 9 streptococcus thermophilus] Length = 191 SEQ ID N'458 LI-5483. 1 14 spIP057901FBOH-BOMMO FIBROIN HEAVY CHAIN PRECURSOR (FIB-H) (H-FIBROIN) gblAAF76983. 1 [AF2266881 (AF226688) fibroin heavy chain Fib-H [Bombyx mori] Length = 5263 SEQ ID N 459 LI-392. 1 49 emblCAB73650 11 (AL139079) putative ABC transport system ATP-binding protein [Campylobacter jejuni] Length = 217 SEQ ID N 460 LI-2950 1 No Hits found SEQ ID N"461 LI-6003 1 48 plrllB69784 conserved hypothetical protein ydhF-Bacillus subtills emb1CAB12392. 11 (Z99107) similar to hypothetical proteins from B. subtilis {Baci ! tus subt ! ! ! s] Length = 236 SEQ ID NO 462 LI-6065. 1 No Hits found SEQ ID N'463 LI-1578. 1 49 spIP469031NATA-BACSU ATP-BINDING TRANSPORT PROTEIN NATA (NA+ ABC TRANSPORTER) pir ! ! A69666 Na+ ABC transporter (extrusion) (ATPbinding protem) natA-Bacillus subtilis gblAAB53022 11 (U30873) NatA [Bacillus subtilis] dbjIBAA22236. 11 (AB0006 SEQ ID N 464 LI-4124. 1 82 gblAAC64335 11 (AF036485) putative transposase [Plasmid pNZ4000] Length = 226 SEQ ID N 465 LI-4139 1 82 gblAAC64335 11 (AF036485) putative transposase [Plasmid pNZ4000] Length = 226
<Desc/Clms Page number 66>
Figure img00660001

SEQ ID NO 466 LI-4166. 1 94 emb1CM64387. 11 (X94761) transposase [Streptococcus thermophilus] emblCAB52228. 11 (Z98171) transposase [Streptococcus thermophilus] Length = 226 SEQ ID N'467 LI-4182. 1 82 gblAAC64335 11 (AF036485) putative transposase [Plasmid pNZ4000] Length = 226 SEQ ID N 468 LI-6038. 1 No Hits found SEQ ID N 469 LI-4021. 1 No Hits found SEQ ID N 470 LI-5569. 1 66 splP459321YQBPBACSU HYPOTHETICAL 25. 3 KD PROTEIN IN SPOIIICCWLA INTERGENIC REGION pirllC69948 phage-related protein homolog yqbP-Bacillus subtilis dbjBAA06948. 11 (D32216) ORF85 [Bacillus subtilis] dbjlBAA12412 11 (D84432) YqbP [Bacillus subtilis] SEQ ID N 471 LI-4084. 1 96 embjCAA63529. 11 (X92946) transposase [Lactococcus lactis] Length = 228 SEQ ID N"472 LI-4177. 1 97 emb1CM63529. 11 (X92946) transposase [Lactococcus lactis] Length = 228 SEQ D ? 473 LI-6066 1 23 emblCAB53799 11 (AJ242593) gp13 [Bacteriophage A118] Length = 110 SEQ ID N'474 LI-6106. 1 97 embICAA63529. 11 (X92946) transposase [Lactococcus lactis] Length = 228 SEQ ID N475 LI-6113. 1 97 emblCM63529 11 (X92946) transposase [Lactococcus lactis] Length = 228 SEQ ID N476 Lt-4013164gbjAAC48871 1 (U51128) ORF245 [Lactococcus bacteriophage phi31] Length = 245 SEQ ID N 477 LI-5978. 1 61 emb ! CAB40581. 11 (AJ010128) DNA alkylation repair enzyme bacillus cereus] Length = 237 SEQ ID N'478 LI-6085. 1 53 spIP459151YQAS-BACSU HYPOTHETICAL 27. 7 KD PROTEIN IN SPOIIICCWLA INTERGENIC REGION pirllB69946 phage-related termina se small subunit homolog yqaS-Bacillus subtilis dbjjBAA06932. 11nD32216) ORF43 [Bacillus subtilis] dbj1BM12394. 11 (084432 SEQ ID N 479 LI-1346. 1 15 pir rE75471 transcription regulator, GntR family-Deinococcus radiodurans (strain R1) gblAAF10394. 11AE001936-3 (AE001936) transcriptional regulator, GntR family [Deinococcus radiodurans] Length = 267 SEQ D ? 480 LI-4506 1 No Hits found SEQ ID ? 481 LI-3994 1 54 gblAAB18697 11 (U38906) ORF22 [Bacteriophage r1t] Length = 228 SEQ ID NN 482 LI-6131. 1 54 gblAAB18697 11 (U38906) ORF22 [Bacteriophage r1t] Length = 228 SEQ ID ? 483 LI-4050. 1 No Hits found SEQ ID N'484 LI-284. 1 57 pirlIF69375 ABC transporter, ATP-binding protein homolog-Archaeoglobus fulgidus gblAAB90232. 11 (AE001034) ABC transporter, ATP-binding protein [Archaeoglobus fulgidus] Length = 285 SEQ ID N 485 LI-4160. 1 65 gblAAB39096 11 (U39673) KdpE [Clostridium acetobutylicum] Length 232 SEQ ID N 486 LI-529. 1 47 dbjIBAA03592 11 (D14877) positive regulator for virulence factors [Clostridium perfringens Length = 236 SEQ ID N 487 LI-3559 1 No Hits found
<Desc/Clms Page number 67>
Figure img00670001

SEQ ID N'488 LI-5643. 1 49 pirlID49898 cellobiose phosphotransferase system celc-Bacillus stearothermophilus gblAAA17391. 11 (U07818) putative phospho-betaglucosidase [Bacillus stearothermophilus] Length = 245 SEQ ID N489 LI-5720. 1 90 emblCAB53837 11 (AJ242593) gp47 [BacteriophageA118] Length =319 SEQ ID N 490 LI-2788. 1 46 gblAAF35174. 11 (AF193610) TndX [Clostridium difficile] Length = 533 SEQ ID N'491 LI-4054. 1 28 embICAB52531. 11 (AJ131519) hypothetical protein [Lactobacillus bacteriophage phi adh] Length = 247 SEQ ID N 492 LI-4095. 1 47 pirj) E71905 hypothetical protein jhp0651-Helicobacter pylori (strain J99) gblAAD06227 11 (AE001497) putative [Helicobacter pylori J99] Length = 234 SEQ ID ? 493 LI-5200. 1 34 2119294A YFW1 gene saccharomyces cerevisiae] Length = 605 SEQ ID N"494 LI-2995. 1 52 pir)) T12864 probable antirepressor-Bacillus subtilis phage SPBc2 emblCAB13959. 11 (Z99114) similar to phage-related DNA-binding protein anti-repressor [Bacillus subtilis] embjCABI 3985. 1l (Z99115) similar to phagerelated DNA-binding protein SEQ ID N 495 LI-5715 1 58 dbjlBAA97816 11 (AB044554) antlrepressor (Staphylococcus aureus prophage phiPV83] Length = 265 SEQ ID ? 496 LI-6019 1 38 p) rT00178 hypothetical protein 44-Staphylococcus aureus phage phi PVL dbjIBAA31918. 11 (AB009866) orf 44 [bacteriophage phi PVL] Length 161 SEQ ID ? 497 LI-2779. 1 27 pirj) G69486 probable iron-sulfur flavoprotein isf-3-Archaeoglobus fulgidus gb) AAB89371. 1) (AE000972) iron-su ! fur ftavoprotein (isf-3) [Archaeoglobus fulgidus] Length = 201 SEQ ID DN 498 LI-6144. 1 69 dbjlBAA97816 11 (AB044554) antirepressor [Staphylococcus aureus prophage phiPV83] Length = 265 SEQ ID NO 499 LI-19261 No Hits found SEQ ID N 500 LI-4026. 1 No Hits found SEQ ID NO 501 LI-13881 No Hits found SEQ ID ? 502 LI-2781. 1 47 pir rE70761 probable ketoacyl reductase-Mycobacterium tuberculosis (strain H37RV) emblCAA98318 11 (Z74020) hypothetical protein Rv1544 [Mycobacterium tuberculosis Length = 267 SEQ ID N"503 LI-3157 1 38 plrllG75518 probable beta-Iactamase-oeinococcus radiodurans (strain R1) gblAAF10013 11AE001903~1 (AE001903) beta-lactamase, putative [Deinococcus radiodurans] Length = 277 SEQ ID N'504 LI-485. 1 46 plrllH71283 conserved hypothetlcal integral membrane protein TP0771syphilis spirochete gblAAC65739. 11 (AE001248) conserved hypothetical Integral membrane protein [Treponema pallidum Length = 593 SEQ ID ? 505 LI-5604. 1 31 spIP45915jYQAS~BACSU HYPOTHETICAL 27. 7 KD PROTEIN IN SPOIIICCWLA INTERGENIC REGION pirllB69946 phage-related terminase small subunit homolog yqas-Bacillus subtilis dbjIBAA06932. 11 (D32216) ORF43 [Bac ! ! ! us subts] dbj) BAA12394. 1j (D84432 SEQ ID ? 506 U-4169 1No Hits found
<Desc/Clms Page number 68>
Figure img00680001

SEQ ID N"507 LI-522. 1 40 reflNP-013953. Il Ymr226cp spIQ05016IYM71-YEAST HYPOTHETICAL OXIDOREDUCTASE IN MRPL44-MTF1 INTERGENIC REGION pirllS57593 hypothetical protein YMR226c-yeast (Saccharomyces cerevisiae) emblCAA90197. 11 (Z49939) unknown saccharomyces cerevisiae] SEQ ID N"508 LI-1513. 1 No Hits found SEQ ID NO 509 LI-6136. 1 98 emb1CAB53838. 11 (AJ242593) putative recombinase [BacteriophageA118] Length = 271 SEQ ID ? 510 LI-3148. 1 75 pirS16647 sporulation dipeptide ABC transporter dppA-Bacillus subtilis Length = 274 SEQ ID N 511 LI-5558. 1 No Hits found SEQ ID N 512 LI-4123. 1 68 gblAAB01067. 11 (U23813) transposase [Lactococcus lactis] Length = 385 SEQ ID N'513 LI-6052. 1 33 embICAB53803. 11 (AJ242593) gp17 [Bacteriophage AU18] Length = 272 SEQ ID NO 514 LI-1577 1 42 pirllB71197 hypothetical protein PH1848-Pyrococcus horikoshil dbjBAA30969 11 (AP000007) 255aa long hypothetical protein [Pyrococcus horikoshii] Length = 255 SEQ ID N'515 LI-3333. 1 61 embICAB53803. 11 (AJ242593) gp17 [Bacter ! ophageA118] Length = 272 SEQ ID N 516 LI-523. 1 37 pirlB59099 hypothetical protein pXO1-66-Bacillus anthracis virulence plasmid pXO1 gbAAD32370. 1lad32370 (AF065404) po1-66 [Bacillus anthracis] Length = 361 SEQ ID N"517 LI-10251 No Hits found SEQ ID N"518 LI-2947. 1 No Hits found SEQ ID N"519 LI-5550. 1 30 pirlIT12790 N-acetylmuramoyl-L-alanine amidase homolog-Bacillus subtilis phage SPBc2 embCAB14059. 11 (Z99115) similarto N-acetylmuramoyl-Lalanine amidase bacillus subti ! ! s] gb) AAC38300. 1) (AF021803) Nacetylmuramoyl-L-alanine SEQ ID N'520 LI-733. 1 20 pirlIA71161 hypothetical protein PH0486-Pyrococcus horikoshii dbj) BAA29574 11 (AP000002) 170aa long hypothetical protein [Pyrococcus horikoshii] Length = 170 SEQ ID ? 521 LI-4067. 1 39 gblAAA63619 11 (U10992) abiD [Lactococcus lactis] Length = 366 SEQ ID N 522 LI-4670 1 50 emblCAA78595 11 (Z14225) SpoHJ [Bacillus subtilis] Length = 259 SEQ ID ? 523 LI-4460 1 No Hits found SEQ ID NO 524 LI-41741 61 gblAAF37879 11AF234619~2 (AF234619) OpuABC [Lactococcus lactis] Length = 573 SEQ ID ? 525 LI-4148 1 66 spIP18179ATBPSTAAU POTENTIAL ATP-BINDING PROTEIN (ORF 271) pirjlS11779 probable ATP-binding protein-Staphylococcus aureus transposon Tn552 emb1CAA36948. 11 (X52734) ORF271 (pot. ATP-binding protein) (AA 1- 271) [Staphylococcus au SEQ ID N 526 LI-454. 1 No Hlts found SEQ ID ? 527 LI-3320 1 97 splQ379791AEPE-BPA50 L-ALANOYL-D-GLUTAMATE PEPTIDASE pirllS69801 L-alanoyl-D-glutamate peptidase, 33. 4K-phage A500 emblCAA59365 11 (X85009) L-alanoyl-D-glutamate peptidase [Bacteriophage A500] Length = 289
<Desc/Clms Page number 69>
Figure img00690001

SEQ ID NO 528 LI-36. 1 26 9il6324372 anchorage subunit of a-agglutinin ; Aga1 p sp1P323231AGA1-YEAST A-AGGLUTININ ATTACHMENT SUBUNIT PRECURSOR pir rA41258 a-agglutinin core protein AGA1-yeast (Saccharomyces cerevisiae) gbjAAA34382. 11 (M60590) a-agglutinin core subunit [Saccharo SEQ ID NO 529 LI-6075. 1 32 pirllH45691 main capsid protein Gp34-Lactobacillus delbrueckii subsp. bulgaricus phage mv4 Length = 286 SEQ ID N'530 LI-781. 1 49 gblAAC56014. 11 (AE001272) conservedhypotheticalprotein [Lactococcus lactis] Length = 286 SEQ ID ? 531 LI-4053. 1 No Hits found SEQ ID N 532 LI-6025. 1 42 dbjBAA97828. 11 (AB044554) orf 21 [Staphylococcus aureus prophage phiPV83] Length = 257 SEQ ID ? 533 LI-2966. 1 32 gblAAC24147. 11 (AF071201) unknown [bacteriophage Felix 01] Length = 262 SEQ ID ? 534 LI-4130. 1 59pirjjB47092 copy control protein repB-Enterococcus faecalis plasmid pAD1 gbjAAB00504. 11 (L01794) replication-associated protein [Enterococcus faecalis] Length = 281 SEQ ID N 535 LI-3354. 1 96 emblCAB53792 11 (AJ242593) major capsid protein [Bacteriophage A118] Length = 299 SEQ ID DN 536 LI-2957. 1 19 gblAAC99858 11 (U31159) CR16 [Rattus norvegicus] gblAAC99859 11 (U31169) SH3 domain binding protein [Rattus norvegicus] Length = 485 SEQ ID ? 537 LI-2975. 1 40 gblAAF84386. 1) AE003986~16 (AE003986) hypothetical protein [Xylella fastidiosa] gblAAF84491. 1AE003993~10 (AE003993) hypothetical protein [Xylella fastidiosa] Length = 327 SEQ ID ? 538 LI-4138. 1 48 gblAAC56014. 11 (AE001272) conserved hypothetical protein [Lactococcus lachs Length = 286 SEQ ID NO 539 LI-5052. 1 48 pirllB70067 hypothetical protein ywqG-Bacillus subtilis emb1CAB07445. 11 (Z92952) unknown [Bacillus subtilis] emb ! CAB15639. 11 (Z99122) ywqG [Bacillus subtilis] Length = 261 SEQ ID DN 540 LI-3386. 1 67 emblCAB53839 11 (AJ242593) gp49 [Bacteriophage AU18] Length = 310 SEQ ID ? 541 LI-2987. 1 34 spIP45915IYQAS~BACSU HYPOTHETICAL 27. 7 KD PROTEIN IN SPOIIICCWLA INTERGENIC REGION pirB69946 phage-related terminase small subunit homolog yqaS-Bacillus subMis dbjlBAA06932 11 (D32216) ORF43 [Bacillus subtills] dbjlBAA 12394. 11 (084432 SEQ ID N'542 LI-395. 1 29 gblAAB49627 11 (U63134) the 5'end of the open reading frame shows similarity to the rgg protein of Streptococcus gordonii, Swiss-Prot Accession Number P49330 streptococcus pyogenes] Length = 252 SEQ ID ? 543 LI-3159. 1 47 pirA69856 polysugar degrading enzyme homolog ykfC-Bacillus subttlls emblCAA05579 11 (AJO02571) YkfC [Bacillus subtllis] emb1CAB13156. 11 (Z99110) similar to polysugar degrading enzyme [Bacillus subtilis] Length = 296
<Desc/Clms Page number 70>
Figure img00700001

SEQ IDN 544 LI-5590. 1 81 sp\P45921IYQBE~BACSU HYPOTHETICAL 34. 5 KO PROTEIN lN SPOIIICCWLA INTERGENIC REGION pir) H69946 phage-related protein homolog yqbe-Bacillus subtilis dbjIBAA06938. 11 (D32216) ORF53 [Bacillus subtilis] dbjjBAA12400. 11 (D84432) YqbE [Bacillus subtilis] SEQ ID NO 545 LI-1216. 1 51 pill069900 conserved hypothetical protein yobV-Bacillus subtilis gbAAB84472. 11 (AF027868) transcription regulator [Bacillus subtilis] embCABI 3802. 11 (Z99114) similarto hypothetical proteins [Bacillus subtilis] Length = 313 SEQ ID N'546 LI-6135. 1 97 embICAB53839. 11 (AJ242593) gp49 [Bacteriophage AU18] Length= 310 SEQ ID N'547 LI-6037. 1 57 pirlIT13262 integrase-Lactococcus lactis phage BK5-T gb) AAA98585. 11 (L44593) integrase [Lactococcus lactis phage BK5-T] Length = 374 SEQ ID N'548 LI-2934. 1 39 embICAA61519. 11 (X89234) phagelysin [Listeria innocua] Length = 287 SEQ ID NO 549 LI-4066 1 42 emb1CM61519. 11 (X89234) phagelysin [Listeria innocua] Length = 287 SEQ ID N'550 LI-1087 1 55 pirlIT13262 integrase-Lactococcus lactis phage BK5-T gbAAA98585. 11 (L44593) integrase [Lactococcus lactis phage BK5-T] Length = 374 SEQ ID NO 551 LI-6138. 1 94 emb1CAB53837. 11 (AJ242593) gp47 [Bacteriophage A118] Length = 319 SEQ IDN 552 LI-2142. 1 47 embCAA66252. 11 (X97651) abortive phage resistance mechanism [Lactococcus lactis] Length = 346 SEQ ID ? 553 LI-3995 154p ! rT13262 integrase-Lactococcus lactis phage BK5-T gblAAA98585. 11 (L44593) integrase [Lactococcus lactis phage BK5-T] Length = 374 SEQ ID N'554 LI-6130. 1 53 pirlIT13262 integrase-Lactococcus lactis phage BK5-T gblAAA98585. 11 (L44593) integrase [Lactococcus lact ! S phage BK5-T] Length = 374 SEQ ID NO 555 LI-53131 41 gblM046982 11 (AF070520) unknown [Sinorhizobium meliloti] Length- 332 SEQ ID N'556 LI-6021. 1 No Hits found SEQ ID DN 557 LI-5319. 1 19 spIQ00753IMSMRSTRMU MSM OPERON REGULATORY PROTEIN gblMA26932 11 (M77351) regulator protein streptococcus mutans] Length = 278 SEQ ID N'558 LI-5568 1 69 spIP459501YQBQ-BACSU HYPOTHETICAL 37. 0 KD PROTEIN IN SPOIIICCWLA INTERGENIC REGION pir)) D69948 phage-related protein homolog yqbQ-Bacillus subtllis dbjlBMO694911 (032216) ORF86 [Bacillus subilis] dbjBAA12413. 1l (D84432) YqbQ [Bacillus subtilis] SEQ ID ? 559 LI-2785 1 59 pirllS78538 site-specific recombinase tnpX-Clostridium perfringens transposon Tn4451 gblAAB51419. 11 (U15027) TnpX [Clostridium perfri n gens] Length = 707 SEQ ID ? 560 LI-4060 1 33 emblCAB53806 11 (AJ242593) gp20 [Bacteriophage AU 8] Length = 357
<Desc/Clms Page number 71>
Figure img00710001

SEQ ID No 561 LI-14. 1 71 sp ! 034755jYKOTBACSU HYPOTHET) CAL 38. 5 KDA PROTEIN IN TNRASSPD INTERGENIC REGION pirllF69860 dolichol phosphate mannose synthase homolog ykoT-Bacillus subtilis emb1CAB13196. 11 (Z99110) similar to dolichol phosphate mannose synthase [Bacill SEQ ID NO 562 LI-4122. 1 No Hits found SEQ ID N'563 LI-4955. 1 43 gblAAB67968. 11 (U77367) interna ! in [Listena monocytogenes] Length = 821 SEQ ID N'564 LI-4077. 1 70 pirlIA24455 repb protein-Bacillus sp. plasmids embICAA33714. 11 (Xl5670) repB protein (AA 1-334) [Bacillus sp.] gblAAA88362. 11 (M19465) alpha protein [Plasmid pUB1O] gblAAA84919. 11 (U32369) ORF alpha ; RepU is encoded within ORF alpha [Plasmid SEQ ID N 565 LI-4116. 1 67gblAAB01 067. 11 (U23813) transposase [Lactococcus lactis] Length = 385 SEQ ID N'566 LI-6051. 1 54 pirlIT13217 hypothetical protein R372-Lactobacillus phage phi-gle emblCM66746 1 (X98106) Rorf372 [Bacteriophage ph ! g1e] Length = 372 SEQ ID ? 567 LI-3329. 1 52 emblCAB53805 11 (AJ242593) gp19 [BacteriophageA118] Length = 342 SEQ ID ? 568 LI-9. 1 No Hits found SEQ D N'569 LI-6050. 1 47 embICAB53805. Il (AJ242593) gp19 [Bacteriophage A118] Length = 342 SEQ ID N 570 LI-6078. 1 37 emblCAB53790 11 (AJ242593) gp4 [Bacteriophage A118] Length = 379 SEQ ID N'571 LI-1308. 1 26 spIP199341TOLA-ECOLITOLAPROTEIN pirllJV0057tolAproteinEscherich ! a co ! ! gbAAA24683. 1 (M28232) to ! A [Escherich ! a coii] dbjlBAA35405 11 (D90713) TolA protein. [Escherichia coli] gblAAC73833. 11 (AE000177) membrane spanning protein, required for o SEQ ID N'572 LI-5609 1 23 pirlIC71907 probable type Il DNA modification enzyme (methyltransferase)Helicobacter pyion (strain J99) gb) AAD06206. 11 (AE001495) putative TYPE Il DNA MODIFICATION ENZYME (METHYLTRANSFERASE) [Helicobacter priori j L SEQ ID U-6120 1 83 gblAAD51846 1 ! AF178758~2 (AF178758) ArsB [S) norhizob ! um sp. As4] Length = 351 SEQ ID ? 574 LI-6185 1 50 pT00175 hypothetical protein 41-Staphylococcus aureus phage phi PVL dbjlBM31915 11 (AB009866) orf 41 [bacteriophage phi PVL] Length = 332 SEQ ID NO 575"U-6046 1 56 emblCAB53806 11 (AJ242593) gp20 [Bacteriophage AU18] Length = 357 SEQ ID N 576 LI-6122. 1 76 embjCAB85311. 11 (AL162758) putative integral membrane efflux protein [Neisseria meningitidis] Length = 350 SEQ ID ? 577 LI-3326. 1 55 emblCAB53806 11 (AJ242593) gp20 [Bacteriophage AU18] Length = 357 SEQ ID N'578 LI-1191 1 35 embICAB39003. 11 (AL034558) predicted using hexExon ; MAL3P2. 16 (PF0235w), Hypothet) cal protem, len 1214 aa [Plasmodium falciparum] Length = 1213"
<Desc/Clms Page number 72>
Figure img00720001

SEQ ID NO 579 LI-3160. 1 61 pirH69855 chloromuconate cycloisomerase homolog ykfB-Bacillus subtilis emblCAA05578 11 (AJ002571) YkfB bacillus subtilis] emb) CAB13155. 11 (Z99110) similar to chloromuconate cycloisomerase [Bacillus subtilis] Length = 366 SEQ ID N'580 LI-5564. 1 66 spIP459351YQBT-BACSU HYPOTHETICAL 35. 0 KD PROTEIN IN SPOIIICCWLA INTERGENIC REGION pirllG69948 phage-related protein homolog yqbT-Bacillus subtilis dbjjBAA06952. 11 (D32216) ORF89 bacillus subtilis] dbj1BM12416. 11 (084432) YqbT bacillus subtilis] SEQ ID N 581 LI-1601. 1 48 gblAAB67970. 11 (U77368) in ! D [Usteria monocytogenes] Length = 567 SEQ ID ? 582 LI-5593. 1 63 spIP45920jYQBDBACSU HYPOTHETICAL 36. 2 KD PROTEIN IN SPOIIICCWLA INTERGENIC REGION pirllG69946 phage-related protein homolog yqbO'-Bacillus subtilis dbjjBAA06937. 11 (D32216) ORF52 [Bacillus subtilis] dbjlBM12399 11 (D84432) YqbD [Bacillus subtilis] SEQ ID NO 583 LI-2944. 1 43 gblMF84513 11AEO03994~12 (AEO03994) hypothettcal protein [Xylella fastidiosa] Length = 387 SEQ ID N 584 LI-2978. 1 34 gblAAF84384. 1AE003986~14 (AE003986) hypothetical protein [Xylella fastidiosa] gblAAF84489. 1) AE003993~8 (AE003993) hypothetical protein [Xylella fastidiosa] Length = 397 SEQ ID ? 585 LI-455. 1 34 rA71237 hypothetical protein PH0155-Pyrococcus horikoshii dbjjBAA29224 11 (AP000001) 317aa long hypothetical protein [Pyrococcus horikoshii] Length = 317 SEQ ID N 586 LI-6111. 1 35gb ! AAD20952 11 (AF060119) methyltransferase [Pasteurella haemolytica] Length = 706 SEQ ID ? 587 LI-5933. 1 38 emblCAB96616 11 (AJ400629) integrase streptococcus pneumoniae bacteriophage MM 1 Length = 375 SEQ ID N'588 LI-4502. 2 SEQ ID N 589 LI-5275. 1 32 pirllB69981 N-acetylmuramoyl-L-alanine amidase homolog yrvJ-Bacillus subtilis emb1CAB14717. 11 (Z99118) similarto N-acetylmuramoyl-L-alanine amidase [Bacillus subtlhs] Length = 518 SEQ ID N 590 LI-4111. 1 55 emblCAA51756 11 (X73329) Na/H antiporter homolog [Lactococcus lactis] Length = 379 SEQ ID DN 591 LI-4183. 1 87gblAAB52513 11 (U44843) replication protein [Lactococcus lactis] Length =383 SEQ ID ? LI-2 2 SEQ ID ? 593 LI-3985 1 40 plrllT13182 integrase-Lactobacillus phage phi-ale emb) CAA66758. 11 (X98106) integrase [Bacteriophage phigle] emb1CM62092. 11 (X90510) integrase [Bactenophage phig1e] Length = 391 SEQ ID N 594 LI-4486. 1 No Hits found SEQ ID ? 595 LI-1342 1 61 plrllS76946 hypothetical protein-Synechocystis sp. (strain PCC 6803) dbjlBAA18858 11 (090917) hypothetical protein [Synechocystis sp.] Length = 407 SEQ ID N 596 LI-1348 1 26 dbjlBAA34922 11 (AB012764) Chitinase A [Clostridium paraputrificum] Length = 832 SEQ ID ? 597 LI-390 1 No Hits found SEQ ID ? 598 LI-4039 1 59 emblCAB63685 11 (AJ251790) hypothetical prote) n [Lactobaciiius casei bacteriophage A2] Length = 400
<Desc/Clms Page number 73>
Figure img00730001

SEQ ID N 599 LI-1088. 1 32 gbIAAF17614. 1IAF207855~3 (AF207855) specificity subunit Ua331 [Lactococcus lactis] Length = 414 SEQ ID N 600 LI-3255. 1 84 sp) P440991YA38~HAEIN HYPOTHETICAL PROTEIN H1038 pirll164018 hypothetical protein H) 1038-Haemophilus influenzae (strain Rd KW20) gbjAAC22698. 11 (U32784) conserved hypothetical protein [Haemophilus influenza Rd] Length = 400 SEQ ID ? 601 U-4036. 1 No Hits found SEQ ID NO 602 LI-1086. 1 35 pirllT30324 type 1 site-specifie deoxyribonuclease (EC 3. 1. 21. 3) Lldl chain hsdS-Lactococcus lactis plasmid plL2614 gblAAC15898. 11 (U90222) type IC specificity subunit [Lactococcus lactis] Length = 405 SEQ ID N 603 LI-4103. 1 41 gblAAC23674. 11 (AF064765) putative transposase [Lactococcus lactis] Length = 216 SEQ ID N 604 LI-4112. 1 79 spp521911ENO-STRTR ENOLASE (2-PHOSPHOGLYCERATE DEHYDRATASE) (2-PHOSPHO-D-GLYCERATE HYDRO-LYASE) gb) AAC64907. 1 (AF027167) eno ! ase [Streptococcusthermoph ! ! us] Length = 422 SEQ ID NO 605 LI-1186. 1 No Hits found SEQ ID NO 606 LI-4508. 1 41 pir1lA69774 integrase homolog ydcL-Bacillus subtilis dbj1BAA19318. 11 (AB001488) PROBABLE INTEGRASE. [Bacillus subtilis] emb) CAB12287. 11 (Z99106) similar to integrase [Bacillus subtilis] Length = 368 SEQ ID N'607 LI-4015 1 64 embICAB63670. 11 (AJ251789) hypothetical protein [Lactobacillus casei bacteriophage A2] Length = 455 SEQ ID N'608 LI-589. 1 38 pirlIT28677 rhoptry protein-Plasmodium yoelii gblAAA21304. 11 (L27838) rhoptry protein [Plasmodium yoelii] Length = 2269 SEQ ID N'609 LI-391. 1 31 spIQ58207JY797-METJA HYPOTHETICAL PROTEIN MJ0797 pir ! ! E64399 hypothetical protein MJ0797-Methanococcusjannaschii gb) AAB98792. 1 (U67524) hypothetical protein [Methanococcus jannaschii] Length = 367 SEQ ID N'610 LI-4715 1 41 refINP 013898. 11 Ymrl73w-ap piriIS69870 hypothetical protein YMR173w-ayeast (Saccharomyces cerevisiae) Length = 394 SEQ ID N'611 LI-5638 1 51 pirlIH70216 PTS system, celloblose-specific IIC component (celB) homologLyme diseasespirochetepiasmidB/cp26 gb) AAC66324. 1j (AE000792) PTS system, cellobiose-specific IIC component (ceIB) [Borrelia burgdorferi] Length SEQ ID N 612 LI-5645. 1 65 spp069011MALHFUSMR MALTOSE-6'-PHOSPHATE GLUCOSIDASE (6PHOSPHO-ALPHA-D-GLUCOSIDASE) gblAAB63015. 11 (U81185) MalH [Fusobacterium mortiferum] Length = 441 SEQ ID N'613 LI-4714. 1 26 spIP049291HRPX-PLALO HISTIDINE-RICH GLYCOPROTEIN PRECURSOR pirlIKGZQHL histidine-rich glycoprotein precursor-Plasmodium lophurae embICAA25698. 11 (X01469) histidine-rich protein [Plasmodium lophurae] prfll1101401A protei H H s rich [Plasmodium sp.] SEQ ID N'614 LI-5602. 1 72 spIP459161YQAT BACSU HYPOTHETICAL 50. 9 KD PROTEIN IN SPOIIICCWLA INTERGENIC REGION (ORF50) pir) C69946 phage-related terminase large subunit homolog yqaT-Bacillus subtilis dbjBAA06933 11 (D32216) ORF50 [Bacillus subtilis] dbj
<Desc/Clms Page number 74>
Figure img00740001

SEQ ID N 615 LI-2993. 1 17 pirj) C71907 probable type Il DNA modification enzyme (methyltransferase)Helicobacter pylori (strain J99) gblAAD06206. 11 (AE001495) putative TYPE Il DNA MODIFICATION ENZYME (METHYLTRANSFERASE) [Helicobacter pylori J99] L SEQ ID N 616 LI-6084. 1No Hits found SEQ ID N"617 LI-4092. 1 46 gbIMF13688. 1IAF188935~86 (AF188935) pX02-84 bacillus anthracis] Length = 490 SEQ ID NO 618 LI-5579. 1 65 spIP54331IXKDK~BACSU PHAGE-LiKE ELEMENT PBSX PROTEIN XKDK pir rC69732 PBSX prophage ORF xkdK-Bacillus subtilis embCAA94066. 11 (Z70177) xkdK [Bacillus subtilis] embCAB13122. 11 (Z99110) PBSX prophage [Bacillus subtilis] Length = 464 SEQ ID NO 619 LI-1526. 1 40 pirH72265 hypothetical protein TM1336-Thermotoga maritima (strain MSB8) gblMD36408 1AE0017883 (AE001788) permease, putative [Thermotoga maritima] Length = 390 SEQ ID NO 620 LI-528. 1 45 pirllC55521 virS protein-Clostndium perfringens gb) AAA58950. 11 (U04966) VirS [Clostridium perfringens] Length = 440 SEQ ID N'621 LI-4175 1 60 spIP370621NAPE-ENTFA NADH PEROXIDASE (NPXASE) pirllS18332 NADH peroxidase (EC 1. 11. 1. 1)-Enterococcus faecalis pdblINPXI Nadh Peroxidase (E C 1. 11. 1. 1) Non-Active FormWith Cys 42 Oxidized To A Sulfonic Acid (Cys42-So3h) pdbl2NPXI Nadh SEQ ID ? 622 LI-6035 1 No Hits found SEQ ID N'623 LI-2455. 1 No Hits found SEQ ID N 624 LI-4482. 1 No Hits found SEQ ID NO 625 LI-2982. 1 40 gbIMF84380. 1IAEO03986~10 (AEO03986) conserved hypothetical protein [Xylella fastidiosa] gblAAF84485. 1 ! AE0039934 (AE003993) conserved hypothetical protein [Xylella fastldiosa] Length = 467 SEQ ID N'626 LI-4147. 1 67 spIP184161TRA3-STAAU TRANSPOSASE FOR TRANSPOSON TN552 (ORF 480) pir rS11780 probable transposase-Staphylococcus aureus transposon Tn552 emb1CM36949. 11 (X52734) ORF480 (pot. transposase) (AA 1-480) [Staphylococcus aureus] Length = SEQ ID N 627 LI-2981. 1 28splP713851YE07HAEIN HYPOTHETICAL PROTEIN H ! 1407 pirllB64122 hypothetical protein H ! 1407-Haemophilus influenzae (strain Rd KW20) gblAAC23048. 11 (U32820) traN-related protein [Haemophilus influenzae Rd] Length = 447 SEQ ID NO 628 LI-2985. 1 45 emb1CM72650 11 (Y11901) hypothetical protein [Lactococcus lactis] Length = 462 SEQ ID N"629 LI-3. 1 41 spIP46917IGGM~BACSU MINOR TEICHOIC ACIDS BIOSYNTHESIS PROTEINGGAA pD69631 galactosamine-containing minorteichoic acid biosynthesis ggaA-Bacillus subtilis gblAAA73512. 11 (U13979) ggaA [Bacillus subts] embCAB15586. 11 (Z99122) memb SEQ ID NO 630 LI-4218. 1 No Hits found SEQ ID N 631 LI-457. 1 16 dbJIBAA78899 11 (AP000342) yjcA [Plasmid R100] Length = 436 SEQ ID DN 632 LI-16141 56 gblMB67970 11 (U77368) inID [Listena monocytogenes] Length = 567 1
<Desc/Clms Page number 75>
Figure img00750001

SEQ ID N 633 LI-3815. 1 29 pirllB26696 hypothetical protein 1 (CYb-COII intergenic region)-Leishmania tarentolae mitochondrion (fragment) gbjAAA96601. 11 (M10126) NH2 terminus uncertain [Leishmania tarentolae] Length = 443 SEQ ID N'634 LI-5621. 1 37 gblAAB81298. 11 (U53825) RofA streptococcus pyogenes] Length = 497 SEQ ID N 635 LI-3183. 1 No Hits found SEQ ID N 636 LI-4531. 1 No Hits found SEQ ID N 637 LI-652. 1 54 emblCAA07457. 11 (AJ007319) internalin H [Listeria monocytogenes] Length = 548 SEQ ID N 638 LI-6081. 1 No Hits found SEQ ID N"639 LI-3273. 1 24 emb1CAB01947. 11 (Z79692) ExpA5 [Sinorhizobium meliloti] Length = 390 SEQ ID ? 640 LI-6002. 1 57 pirlllMBP4 site-specific recombinase for integration and excision-Bacillus phage phi-105 dbjBAA36658. 11 (AB016282) site-specific recombinase for integration and excision [bacteriophage phi-105] Length = 474 SEQ ID N'641 LI-5600. 1 68 spIP459171YQBA-BACSU HYPOTHETICAL 58. 5 KD PROTEIN IN SPOIIICCWLA INTERGENIC REGION pirllD69946 phage-related protein homolog yqbA-Bacillus subtilis dbj) BAA06934. 11 (D32216) ORF51 [Bacillus subtilis] dbjlBAA12396 11 (D84432) YqbA bacillus subtilis] SEQ ID N 642 LI-1091. 1 84 gblAAC38346. 11 (AF013165) HsdM [Lactococcus lactis] Length = 515 SEQ ID ? 643 LI-4543. 1 No Hits found SEQ ID N 644 LI-1389. 1 25 spjP11055MYSE~HUMAN MYOSIN HEAVY CHAIN, FAST SKELETAL MUSCLE, EMBRYONIC (MUSCLE EMBRYONIC MYOSIN HEAVY CHAIN) (SMHCE) Length = 1940 SEQ ID N"645 LI-3152. 1 63 gbIMF73090. 1IAF103793~1 (AF1 03793) peptide binding protein OppA [Listeria monocytogenes] Length = 558 SEQ ID N'646 LI-6118. 1 55 pirllH69299 NADH oxidase (noxA-3) homolog-Archaeoglobus fulgidus gblMB90837 11 (AE001077) NADH oxidase (noxA-3) [Archaeoglobus fulgidus] Length = 551 SEQ ID N 647 LI-4879 1 77 splQ599251FTHS-STRMU FORMATE-TETRAHYDROFOLATE LIGASE (FORMYLTETRAHYDROFOLATE SYNTHETASE) (FHS) (FTHFS) gblMB49329 11 (U39612) formyl-tetrahydrofolate synthetase streptococcus mutans] Length = 556 SEQ ID N 648 LI-2212. 1 69 piH64879 probable membrane protein b1309-Escherichia coli gblAAC74391. 11 (AE000229) putative polysaccharide hydrolase [Escherichia coli] Length = 568 SEQ ID DN 649 LI-4128. 1 49 embjCAB43191. 11 (AJ011655) replication protein Rep63A bacillus thuringiensis] Length = 513 SEQ ID U-4158 1 72 spp32327ATKA~CLOAB POTASSIUM-TRANSPORTING ATPASE A CHAIN (ATP PHOSPHOHYDROLASE [POTASSIUM-TRANSPORTING] A CHAIN) gblAAC45477. 11 (U44892) KdpA [Clostridium acetobutylicum] Length = 556 SEQ ID N"651 LI-6124. 1 74 gblM051849 11AF178758~5 (AF178758) ArsA [Sinorhizobium sp. As4] Length = 587
<Desc/Clms Page number 76>
Figure img00760001

SEQ ID NO 652 LI-5597. 1 34 spIP45918IYQBB~BACSU HYPOTHETICAL 34. 9 KO PROTEIN lN SPOIIICCWLA INTERGENIC REGION pirllE69946 hypothetical protein yqbB-Bacillus subtilis dbj1BM06935. 11 (032216) ORF66 [Bacillus subtilis] dbjlBAA12397. 11 (D84432) YqbB bacillus subtilis] emblCAB1 SEQ ID N* 653 LI-4033. 1 38 gblAAF27357. 11AF198256-11 (AF198256) phage D3 terminasse-li protein [Haemophilus influenzae] Length = 555 SEQ ID N 654 LI-815. 1 57 spIP251461INLAUSMO INTERNALIN A PRECURSOR pir rS37387 internalin A precursor-Listeria monocytogenes Length = 800 SEQ ID NO 655 LI-5484. 1 15 emb1CM65738. 11 (X97014) ORF A [Ustena seetigeri] Length = 902 SEQ ID N 656 LI-5317. 1 45 embICAB72809. 11 (AL139074) excinuclease ABC subunit A [Campylobacter jejuni] Length = 941 SEQ ID N 657 LI-5644. 1 45 pirF69848 transcription antiterminator BglG family homolog yjdC-Bacillus subtilis embjCABI 3057. 11 (Z99110) similar to transcriptional antiterminator (Bg family) [Bacillus subtilis] Length = 648 SEQ ID ? 658 LI-6016. 1 27 pirlIT00175 hypothetical protein 41-Staphylococcus aureus phage phi PVL dbjlBAA31915 11 (AB009866) orf 41 [bacteriophage phi PVL] Length = 332 SEQ ID N 659 LI-648. 1 14gil6677945 suppressor of clear, C. elegans, homolog of dbj1BM74885. 11 (AB020669) Kit0862 protein [Homo sapiens] Length = 582 SEQ ID ? 660 LI-4168. 1 56 pirllF69869 heavy metal-transporting ATPase homolog ykWoJ-Bacillus subtilis emblCAB 3258. 11 (Z99111) similar to heavy metal-transporting ATPase [Bacillus subtilis] Length = 637 SEQ ID N* 661 LI-1442. 1 63 spIP251461INLA-LISMO INTERNALIN A PRECURSOR pirllS37387 internalin A precursor-Listeria monocytogenes Length = 800 SEQ ID NO 662 LI-17. 1 No Hits found SEQ ID NO 663 LI-1010 1 12 emb1CM68916. 11 (Y07639) internalin D [Listeria ivanovii] Length = 313 SEQ ID N'664 LI-2143. 1 42 spIP099751YCF2-MARPO HYPOTHETICAL 259 KD PROTEIN (ORF 2136) pirllA05037 hypothetical protein 2136-liverwort (Marchantia polymorpha) chloroplast embICAA28078. 11 (X04465) ORF2136 [Marchantia polymorpha] Length = 2136 SEQ ID N"665 LI-41571 82 spIO32328IATKB~CLOAB POTASSIUM-TRANSPORTING ATPASE B CHAIN (ATP PHOSPHOHYDROLASE [POTASSIUM-TRANSPORTING] B CHAIN) gblAAC45478 11 (U44892) KdpB [Clostridium acetobutylicum] Length = 685 SEQ ID N'666 LI-1021. 1 21 embICAA07456. 11 (AJO07319) internalin G [Listena monocytogenes] Length = 490 SEQ ID NO 667 LI-13. 1 No Hits found SEQ ID N'668 LI-4057. 1 14 embICAB52532. 11 (AJ131519) hypothetical protein lactobacillus bacteriophage phi adh] Length = 241 SEQ ID NO 669 LI-4019. 1 65 emb1CAB63672. 1 1 (AJ251789) hypothetical protein [Lactobacillus casei bacteriophage A2] Length = 770 SEQ ID N"670 LI-41021 25 dbJIBM8767211 (AB016260) Hypothetical gene, methylase gene homolog [Agrobacterium tumefaciens] Length = 1693 SEQ DN"671 L !-12. 1 53 plrllS49240 hypothetlcal protein 3 (capsulation locus)-Haemophilus influenzae (strain RM107) emblCM8575211 (Z37516) orf3 [Haemophilus influenzae] Length = 789
<Desc/Clms Page number 77>
Figure img00770001

SEQ ID N 672 LI-20. 1 39 gbjAAC45605. 11 (U82488) AMI [Listeria monocytogenes] Length = 917 SEQ ID N'673 LI-805. 1 74 embICAA65738. 11 (X97014) ORF A [Listeria seeligeri] Length = 902 SEQ ID N* 674 LI-1 188. 1 9 dbjIBAA84909. 11 (AB024946) orf74 [Escherichia coli] Length = 873 SEQ ID N 675 LI-1313. 1 76 pirllF69681 phosphoenolpyruvate synthase pps-Bacillus subtilis gblAAB84457. 11 (AF027868) PEP synthase bacillus subtilis] embICAB13775. 11 (Z99114) phosphoenolpyruvate synthase [Bacillus subtilis] Length = 866 SEQ ID N 676 LI-4164. 1 62 spIP94608IKDPDCLOAB SENSOR PROTEIN KDPD gbAAB39095. 11 (U39673) KdpD [Clostridium acetobutylicum] Length = 900 SEQ ID ? 677 LI-5773. 1 27 gblAAB67968. 11 (U77367) internalin [Listeria monocytogenes] Length = 821 SEQ ID DN 678 LI-1096. 1 85 gblAAC38345 11 (AF013165) HsdR [Lactococcus lactis] Length = 995 SEQ ID N'679 LI-4178 1 27 pirlID72308 conserved hypothetical protein-Thermotoga maritima (strain MSB8) gbiAAD36069. 1 ! AE001761~1 (AE001761) conserved hypothetical protein [Thermotoga maritima] Length = 967 SEQ ID N"680 LI-4052. 1 35 pirllT03323 gene 116 protein-Lactococcus phage blL170 gblAAC27195. 11 (AF009630) 116 [bacteriophage b ! L170] Length = 916 SEQ ID N"681 LI-4232. 1 15 spIP25146pNLA~LlSMO INTERNALIN A PRECURSOR pir rS37387 internalin A precursor-Listeria monocytogenes Length = 800 SEQ ID N 682 LI-5575. 1 20 spIP54334IXKDO~BACSU PHAGE-LIKE ELEMENT PBSX PROTEIN XKDO pirllF69732 PBSX prophage ORF xkdO-Bacillus subtilis embjCAA94037. 11 (Z70177) homologous to yqbO of the skin element [Bacillus subtilis] emb ! CAB13125. 11 (Z99110) PBSX prophage [Bacillus subtil SEQ ID N 683 LI-1720 1 18 emblCAB83920 11 (AL162753) hypothetical protein NMA0631 [Neisseria meningitidis] Length = 1082 SEQ ID N 684 LI-526. 1 30gblAAD39085. 1jAF091393~1 (AF091393) surface protein R28 streptococcus pyogenes] Length = 1260 SEQ ID N 685 LI-4192. 1 58 embCAB44655. 11 (Y18605) hypothetical protein RvD1-Rv2024c' [Mycobacterium bovis BCG] Length = 1606 SEQ ID NO 686 LI-2958. 1 39 pirlIT1 3216 minor capsid protein 1608-Lactobacillus phage phi-gle emblCAA66745 11 (X98106) minor capsid protein [Bacteriophage phig1 e] Length = 1608 SEQ ID NO 687 LI-3752. 1 27 plrllT28679 fibrinogen-binding protein homolog-Staphylococcus aureus emb1CAA06651. 11 (AJ005646) sdrD [Staphylococcus aureus] Length = 1315 SEQ ID ? 688 LI-6059 1i emblCAB63691 11 (AJ251790) hypothetical protein lactobacillus casei bacteriophage A2] Length = 465 SEQ ID N'689 LI-1259 1 48 spIQ078331WAPA-BACSU WALL-ASSOCIATED PROTEIN PRECURSOR plrllS32920 cell wall-associated protein precursor wapA-Bacillus subtilis gblAAA22883 11 (L05634) wall-associated protein [Bacillus subtilis] dbjBAA06656 11 (D31856) WapA protein bacillus subti
<Desc/Clms Page number 78>
Figure img00780001

SEOID Prot W COMMENTS Blastp result on non-redondant protein bank. % homology 1 Comments 1 SEQ ID ? 690 LM-1002. 1 Unknown, similarto internalin protein 23 gil2347104AAB67969. 11 (U77368) internalin [Listeria monocytogenes] Length = 548 SEQ ID N'691 LM-1005. 1 Unknown, similar to putative NAD (P)-53 gil13614241pprllS57559 strU protein-Streptomyces glaucescens dependent oxidoreductase SEQ ID NO 692 LM-10371 Unknown 15 gil74597611pirllC69520 hypothetical protein AF2163-Archaeoglobus fulgidus SEQ ID N 693 LM-1043. 1 Unknown, similar to efflux proteins 52 gil74744371pirllB70065 antibiotic resistance protein homolog ywoG-Bacillus subtilis SEQ ID NO 694 LM-1050. 1 Unknown, LPXTG protein withh LRR repeats 12 giI5059350IgbIAAD38982. 1IAF153770~1 (AF153770) immunoreactive 47 kDa antigen PG97 [Porphyromonas gingivalis] Length = 428 SEQ ID DN 695 LM-1067 2 Unknown, hypothetical secreted protein No Hits found SEQ ID NO 696 LM-1074. 1 internalin 98 gil23471021gb ! AAB67968. 11 (U77367) internalin [Listeria monocytogenes] Length = 821 SEQ ID ? 697 LM-1112. 2 Unknown, similar to B. subtilis transcription 61 gij1170575IspIP46337/10LR~BACSU DNA-BINDING PROTEIN IOLR repressor of myo-inositol catabolism operon loiR SEQ ID N'698 LM-1 114. 1 Unknown No Hits found SEQ ID DN 699 LM-1115 3 Unknown No Hits found SEQ ID N'700 LM-1 123. 1 Unknown No Hits found SEQ ID N'701 LM-1 127. 1 Unknown No Hits found SEQ ID DN 702 LM-1132. 1 Unknown, similarto transcription regulator 25 gil7481541) pirllT36904 probable transcription regulator-Streptomyces coelicolor SEQ ID N'703 LM-1 153. 2 Unknown, weakly similar to a bile acid 7-alpha No Hits found dehydratase SEQ ID DN 704 LM-1154. 1 unknown, similar to transcription regulator 43 gil75217441pirj) A70344 transcription regulator Crp/Fnr family-Aquifex aeolicus Crp/Fnr family SEQ ID ? 705 LM-1155. 1 Unknown, weakly similarto a putative 35 gil74747151pir rC69971 conserved hypothetical protein yraK-Bacillus subtilis haloacetate dehalogenase SEQ ID DN 706 LM-1156 1 Unknown No Hits found SEQID N 707 LM-1157. 1 Unknown No Hits found SEQ ID NN 708 LM-1158. 1 Unknown No Hits found SEQ ID N'709 LM-1 159. 1 unknown No Hits found SEQ IDN"710 LM-1160. 1 Unknown, hypothetical No Hits found SEQ ID DN 711 LM-1169. 1Unknown, similarto 6-phospho-beta-61 gil6851034lemb ! CAB71151. 11 (AJ250202) beta-glucosidase [Lactobacillus glucosidase plantarum] Length = 486
<Desc/Clms Page number 79>
Figure img00790001

SEQ ID NO 712 LM-1171. 1 Unknown, similarto phosphotransferase 63 gll6851033lembCAB71150. 11 (AJ250202) permease [Lactobacillus plantarum] system (PTS) beta-glucoside-specific enzyme Length = 577 IIABC component SEQ ID N'713 LM-1 172 1 Unknown No Hits found SEQ ID N'714 LM-1 173. 1 Unknown, similar to ribose 5-phosphate 70 gil7319801spIP37351IRPIB~ECOLI RIBOSE 5-PHOSPHATE ISOMERASE B isomerase (PHOSPHORIBOISOMERASE B) SEQ ID N'715 LM-1 174 1 Unknown, similar to Ribulose-5-Phosphate 3-58 gi128296131sp1P740611RPE~SYNY3 RIBULOSE-PHOSPHATE 3-EPIMERASE Epimerase (PENTOSE-5-PHOSPHATE 3-EPIMERASE) (PPE) (R5P3E) SEQ ID NO 716 LM-1175. 1 Unknown, slmilar to transcriptional regulator 51 giI1173387IspIP43472ISCRR~PEDPE SUCROSE OPERON REPRESSOR (SCR (Lacl family) OPERON REGULATORY PROTEIN) SEQ ID N'717 LM-1 176. 1 Unknown, similar to transcription regulator 24 gll21273591pirll140868 hypothetical protein 3 nanH region-Clostridium perfringens SEQ ID ? 718 LM-1228. 1 Unknown, similar to B. subtilis YxjH and YxjG 60 gil28285041spp42319lYXJH~BACSU HYPOTHETICAL 38. 3 KD PROTEIN IN proteins PEPT-KATB INTERGENIC REGION SEQ ID NO 719 LM-1243. 1 HEXOSE PHOSPHATE TRANSPORT 60 gi ! 136773IspIP27670IUHPT~SALTY HEXOSE PHOSPHATE TRANSPORT PROTEIN PROTEIN.
SEQ ID N'720 LM-12481 unknown, surface protein (LPXTG motif) 29 gil4173151spp326531MRP~STRSU MURAMIDASE-RELEASED PROTEIN PRECURSOR (136 KD SURFACE PROTEIN) SEQ ID N'721 LM-1249 1 unknown No Hits found SEQ ID DN 722 LM-12581 unknown, similar to transposases 57 gll74743371pirllH59102 hypothetical protein pXO1-96-Bacillus anthracis virulence plasmid pXO1 SEQ ID NO 723 LM-1259. 1 unknown, similartotransposases 62 gil929968 ! gblAAA74024. 11 (U30713) ORFA [Bacillus anthracis] SEQ ID ? 724 LM-1261 1 Unknown, similarto transporter 52 gil75144081pirllH71283 conserved hypothetical integral membrane protein TP0771-syphilis spirochete SEQ ID N 725 LM-12671 unknown No Hits found SEQ ID N'726 LM-1306 1 unknown No Hits found SEQ IDN 727 LM-1343 2 unknown 39 gil6322945NP013018. 11 nucleolar protein that is immunologically and structurally related to rat Nopp140, a nonribosomal protein of the nucleolus and coiled bodies. ; Srp40p SEQ ID N'728 LM-1 353 1 unknown, similar to membrane and transport 61 gi174736951pir1lA75272 probable transport protein-Deinococcus radiodurans proteins (strain R1) SEQ ID DN 729 LM-1354 1 unknown, similar to ABC transporter67g7445714p ! rE69762 ABC transporter (permease) homolog yclH-Bacillus subtilis SEQ ID N'730 LM-1 357. 1 unknown, conserved hypothetical protein 58 gil74759351pirllF69762 transporter homolog ycil-Bacillus subtilis SEQ ID NO 731 LM-1358. 1 unknown, similar to sensor protein histidine 33 gil25007651spIQ477451VANS ENTFA SENSOR PROTEIN VANSB (VANCOMYCIN kinases (2 components regulatory systems) B-TYPE RESISTANCE PROTEIN VANSB) (VANCOMYCIN HISTIDINE PROTEIN KINASE) SEQ ID N'732 LM-1 359 1 unknown, similar to transcription response 65 giI2500744IspIQ47744IVANR~ENTFA REGULATORY PROTEIN VANRB regulator SEQ ID N'733 LM-1 390. 1 unknown No Hits found
<Desc/Clms Page number 80>
Figure img00800001

SEQ ID NO 734 LM-1391. 1 unknown, similarto phosphotransferase 66 gil11000761gblAAC05713. 11 (L49336) PTS-dependent enzyme Il [Clostridium system (PTS) beta-glucoside-specific enzyme longisporum] Length = 616 ! ! ABC SEQ ID DN 735 LM-1392. 1 unknown, similarto glycerol kinase 58 gil66854721spQ9X0491GLK1THEMA GLYCEROL KINASE 1 (ATP : GLYCEROL 3-PHOSPHOTRANSFERASE 1) (GLYCEROKINASE 1) (GK 1) SEQ ID W 736 LM-1394. 1 unknown, similar to transketolase 54 gi128335261sp1Q580921TKTC~METJA PUTATIVE TRANSKETOLASE C-TERMINAL SECTION (TK) SEQ ID N'737 LM-1396 1 unknown, similar to transketolase 64 gil28335281spIQ58094ITKTN~METJA PUTATIVE TRANSKETOLASE N-TERMINAL SECTION (TK) SEQ ID NO 738 LM-1398. 3 unknown, similar to hypothetical proteins 42 gi174624741pir1lB72314 hypothetical protein-Thermotoga maritima (strain MSB8) SEQ ID NO 739 LM-1438. 1 Unknwon 89 gil4661441spIP333831YORX-LISMO HYPOTHETICAL 12. 2 KD PROTEIN IN PLCB-LDH INTERGENIC REGION PRECURSOR (ORFX) SEQ ID No 740 LM-1439 1 phospholipase C 95gil4643741spp333781PHLC~LISMO PHOSPHOLIPASE C PRECURSOR (PLC) (PHOSPHATIDYLCHOLINE CHOLINEPHOSPHOHYDROLASE) (LECITHINASE) SEQ ID NO 741 LM-1440. 1 No Hits found SEQ ID NO 742 LM-1441. 1 16gil6649606gblAAF21477. 1U91654~1 (U91654) merozoite surface antigen 2 [Plasmodium falciparum] Length = 233 SEQ ID ? 743 LM-1442 1 actin-assembly Inducing protein precursor 99 gil4614631sp) P33379tACTA~LISMO ACTIN-ASSEMBLY INDUCING PROTEIN PRECURSOR SEQ ID W 744 LM-1444. 1 Zmc metalloproteinase precursor 98 gil1309851p) P232241PRO1USMO ZINC METALLOPROTEINASE PRECURSOR SEQ ID N'745 LM-1445 1 listeriolysin 0 precursor 98 gil8870281gblAAA69528. 11 (U25446) listeriolysin 0 [Listeria monocytogenes] SEQ ID ? 746 LM-1446. 1 phosphatidylinositol-specific phospholipase c 97gil4644031splP340241PLCL LISMO 1-PHOSPHATIDYLINOSITOL PHOSPHODIESTERASE PRECURSOR (PHOSPHATIDYLINOSITOLSPECIFIC PHOSPHOLIPASE C) (Pl-PLC) SEQ ID NO 747 LM-1447. 1 listeriolysin positive regulatory protein 99 gil4644601spIP222621PRFA-LISMO LISTERIOLYSIN REGULATORY PROTEIN SEQ ID NO 748 LM-1518. 1 Unknown, similar to transcription antiterminator 42 gil74758831pirlIF69848 transcription antiterminator BGIG family homolog yjdcBglG family Bacillus subtilis SEQ ID DN 749 LM-15191 Unknown, similarto PTS system, fructose-51 gil74504991pirllH69626 PTS fructose-specific enzyme IIBC component fruAspecific IIA component Bacillus subtilis SEQ ID NN 750 LM-1520. 1 Unknown, similarto PTS system, fructose-69 gil418517) spIP32672pTWC ECOLI PTS SYSTEM, FRUCTOSE-LIKE-2 IIC specific IIC component COMPONENT (PHOSPHOTRANSFERASE ENZYME Il, C COMPONENT) SEQ ID NO 751 LM-1521. 1 Un known, similar to PTS system, fructose-72 gil4l85181spIP326731PTWB ECOLI PTS SYSTEM, FRUCTOSE-LIKE-2 IIB specific IIB component COMPONENT 1 (PHOSPHOTRANSFERASE ENZYME Il, B COMPONENT) SEQ ID NN 752 LM-1523. 1 Unknown. similar to an E. coli putative 36 gi125070301sp1P371911GATZ~ECOLI PUTATIVE TAGATOSE 6-PHOSPHATE tagatose 6-phosphate kinase KINASE GATZ SEQ ID NN 753 LM-1528. 1 Unknown No Hits found SEQ ID DN 754 LM-1538. 1 unknown No Hits found
<Desc/Clms Page number 81>
Figure img00810001

SEQ ID W 755 LM-15471 Internalin B 98 gil986841pirllC39930 hypothetical protein (internalin region)-Listeria monocytogenes Length = 630 SEQ ID W 756 LM-1549. 1 internalin A 95 gi131232261sp1P25146pNLA~LlSMO INTERNALIN A PRECURSOR SEQ ID DN 757 LM-156. 1 unknown BEST-BLASTP= No Hits found SEQ ID NO 758 LM-1571. 1 Unknown, conserved hypothetical protein 59 gi173884601sp1P758091YBJI~ECOLI HYPOTHETICAL 30. 2 KDA PROTEIN IN CMR-GRXA INTERGENIC REGION Length = 271 SEQ ID DN 759 LM-1572 1 Unknown, similarto unknown protein 48 gil7482419rllF69065 hypothetical protein MTH1490-Methanobacterium thermoautotrophicum (strain Delta H) SEQ ID ? 760 LM-1586 1 unknown, similar to B subtilis YkcC protein 82 gil3l231501spIO34319JYKCC BACSU HYPOTHETICAL 37. 4 KDA PROTEIN IN SPOI ! SA-HTRA INTERGENIC REGION SEQ ID ? 761 LM-1624. 2 Unknown 19 gil49594011gblAAD34335. 11AF115391 4 (AF115391) LaaC lactobacillus sakei] Length = 81 SEQ ID N'762 LM-1625 2 Unknown No Hits found SEQ ID W 763 LM-1627. 1 Unknown No Hits found SEQ ID W 764 LM-1631. 1 Unknown, conserved hypothetical protein 48 glj28515301sp1P323991YHGE~BACSU HYPOTHETICAL 84. 1 KD PROTEIN IN HEMY-GLTT INTERGENIC REGION (ORFB) SEQ ID ? 765 LM-1632 1 Unknown, similar to transcription regulator 40 giI6470204IgbIAAF13658. 1IAF188935~56 (AF188935) pX02-53 bacillus anthracis] Length = 482 SEQ ID NO 766 LM-1634. 1 Unknown, similar to penicillin acylase 61 gi117313091sp1P549481YXEI~BACSU HYPOTHETICAL 37. 2 KD PROTEIN IN IDH-DEOR INTERGENIC REGION SEQ ID W 767 LM-1655. 1 Unknown, simllar to transcription regulator 23 glj4823611plrllA42730 trans-acting positive regulator Mry-Streptococcus (VirR from Streptococcus pyogenes) pyogenes (type M6, strain D471) Length = 530 SEQ ID NO 768 LM-1656. 1 Unknown, putative membrane associated 19gil6731239gblAAF27178. 1jAF072716~1 (AF072716) membrane associated lipoprotein lipoprotein precursor [Mycoplasma mycoides mycoides SC] Length = 445 SEQ ID N'769 LM-1658 1 Unknown No Hits found SEQ ID N'770 LM-1659 3 Unknown No Hits found SEQ ID ? 771 LM-1660. 3 Unknown No Hits found SEQ ID ? 772 LM-1713. 1 Unknown, similar to transcriptional regulator 44 gi129966261gb1AAC46441. 11 (AFO09224) LysR-type transcriptional activator (LysR family) [Acinetobacter sp. ADP1] Length = 304 SEQ ID W 773 LM-1714. 1 Unknown, similarto acylase 43 gil74766831pirllE70610 hypothetical protein Rv1215c-Mycobacterium tuberculosis (strain H37RV) SEQ ID N'774 LM-1 718. 2 Unknown, similar to sugar transferase 22 gil45806341gblAAD24457. 1 JAF1 18389-14 (AF1 18389) Cps2K streptococcus suis] Length = 276 SEQ ID N'775 LM-1 760. 1 Unknown, similarto unknown proteins 26 gil7322701 IgblAAF59460. 11 (AC024760) contains similarity to TR : Q10466 [Caenorhabditis elegans] Length = 6677 SEQ ID DN 776 LM-1776 3 Unknown 51 gil74759031pirllC69931 transcription regu ! ator homo ! og yozG-Baci ! ! us subti ! ! s
<Desc/Clms Page number 82>
Figure img00820001

SEQ ID NN 777 LM-17781 Unknown, putative peptidoglycan bound 24 gil5327234lembICAB46338. 11 (AJ133114) R5 protein streptococcus protein (LPXTG motif) agalactiae] Length = 979 SEQ ID ? 778 LM-18. 1 Unknwon, similar to hypothetical PTS enzyme 40 gil7320281sp1P393021PTXB~ECOLl UNKNOWN PENTITOL IIB component PHOSPHOTRANSFERASE ENZYME Il, B COMPONENT SEQ ID N 779 LM-1814. 1 Unknown, similar te putative peptidoglycan 87 dog ! ycan87g1730252sp ! P54482 ! GCPEBACSU GCPE PROTEIN HOMOLOG acetylation protein SEQ ID N"780 LM-18271 Unknown, similar to E. coli LytB protein 75ggil17310041splP544731YQFPBACSU LYTB PROTEIN HOMOLOG SEQ ID N 781 LM-18381 internalin E 97 gil3980136lembCAA07458. 11 (AJ007319) internalin E [Listeria monocytogenes] Length = 499 SEQ ID N"782 LM-1840 1 internalin H 95 glj39801351emb1CAA07457. 11 (AJO07319) internalin H [Listeria monocytogenes] Length = 548 SEQ ID N'783 LM-1842 1 internalin G 98 gil3980134lembICAA07456. 11 (AJO07319) internalin G [Listeria monocytogenes] Length = 490 SEQ ID N'784 LM-1 856. 2 Unknown, similar to unknown protein 97 gi160022001emb1CAB56705. 11 (Y16468) hypothetical protein [Listeria monocytogenes] Length = 392 SEQ ID N'785 LM-1858 1 Unknown, similarto unknown protein 47 gil4661461spp333851YORZUSMO HYPOTHETICAL 16. 9 KD LIPOPROTEIN IN PLCB-LDH INTERGENIC REGION PRECURSOR (ORFZ) SEQ ID N 786 LM-1859 2 Unknown No Hits found SEQ ID N 787 LM-18611 76 gil31225921spp327971PFL~LACLA FORMATE ACETYLTRANSFERASE (PYRUVATE FORMATE-LYASE) SEQ ID N 788 LM-1972 3 Unknown, similarto internalin 19gil2230998lemb) CAA65738. 11 (X97014) ORF A [Ustena seeligeri] Length = 902 SEQ ID NO 789 LM-1974. 3 Unknown, similar to internalin 31 gil2230998lembjCAA65738. 11 (X97014) ORF A [Listeria seeligeri] Length = 902 SEQ ID DN 790 LM-19811 diol dehydratase-reactivating factor small chain 58 gil74672101pirT08598 probable diol dehydratase-reactivating factor small - Klebsiella oxytoca chain-Klebsiella oxytoca SEQ ID N 791 LM-1997. 1 unknown No Hits found SEQ ID ? 792 LM-2009 1 Unknown No Hits found SEQ DNA793 LM-2037. 1 Unknwon, similar to drug-export protein 66 gil7430060lpirF69763 multidrug resistance protein homolog ycnB-Bacillus subtilis SEQ ID ? 794 LM-2049. 3 Unknown No Hits found SEQ ID N 795 LM-2050. 1 Unknown No Hits found SEQ ID N 796 LM-208 1 No Hits found SEQ ID NO 797 LM-2106. 1 95 gil4336793blAAD17954. 11 (AF105341) pyrimidine nucleoside phosphorylase [Listeria monocytogenes] Length = 419 SEQ ID NO 798 LM-2116. 1 Unknown No Hits found SEQ ID N 799 LM-2130. 1 unknown No Hits found SEQ ID N'800 LM-2137 2 Unknown, similar to internalin 19 gil2230998lembICAA65738. 11 (X97014) ORF A [Listeria seeligeril Length 902
<Desc/Clms Page number 83>
Figure img00830001

SEQ ID NO 801 LM-2138. 1 unknown No Hits found SEQ DNA802 LM-2141. 1 Unknown 27 gi159123901emb1CAB56115. 11 (Y18096) coiled-coil protein [Sulfolobus solfataricus] Length = 464 SEQ ID NO 803 LM-2142. 1 Unknown No Hits found SEQ ID N* 804 LM-2145 1 Unknown 45 gil5484671spIP364961PEDB-PEDAC PEDIOCIN PA-1 IMMUNITY PROTEIN (PEDIOCIN ACH IMMUNITY PROTEIN) SEQ ID No 805 LM-2161. 2 Unknwon, similartotoxin components 17 gil67305371pdbl1QS21A Chain A, Crystal Structure OfV) p2With Nad Length = 401 SEQ ID DN 806 LM-221. 1 unknown 42 gil74796221pirllT35326 hypothetical protein SC5H1. 10c-Streptomyces coelicolor SEQ ID NO 807 LM-2215. 1 unknown No Hits found SEQ ID N"808 LM-223 1 unknown No Hits found SEQ ID NO 809 LM-2244. 1 53 gi161659701gb1AAF04740. 11 (AF1 02169) multidrug resistance-like protein [Listeria monocytogenes] Length = 228 SEQ ID N'810 LM-230 1 unknown No Hits found SEQ ID ? 811 LM-231 1 unknown, similarto regulatory proteins 54 gil7635981 lembCAB88816. 11 (AL353832) putative Mer-family transcriptional regulator. [Streptomyces coelicolor A3 (2)] Length = 135 SEQ ID ? 812 LM-232. 1 unknown, similarto B. subtllis YjcS protein 36 glj74751121pirllC69848 hypothetical protein yjcS-Bacillus subtilis SEQ ID W 813 LM-2323. 1 Unknown, similar to surface protein 16 gr11204571sp1P147381FNBA~STAAU FIBRONECTIN-BINOING PROTEIN PRECURSOR (FNBP) SEQ ID ? 814 LM-2334. 1 Unknown, conserved hypothetical protein 49 gil7471580lpirllE75635 conserved hypothetical protein-Deinococcus radiodurans (strain R1) SEQ ID NO 815 LM-2335. 2 Unknown, similarto unknown protein 34 gij74727821pir1lF75635 hypothetical protein-Oeinococcus radiodurans (strain R1) SEQ ID ? 816 LM-2336. 3 Unknown No Hits found SEO ID NO 817 LM-2358. 1 unknown, similar to efflux transporter 44 gil4467970lembICAB37973. 11 (X76640) hypothetical protein [Myxococcus xanthus] Length = 507 SEO ID NO 818 LM-2391. 1 Unknwon No Hits found SEQ ID N 819 LM-2392 1 unknwon No Hits found SEO ID NO 820 LM-2393. 1 No Hits found SEO ID NO 821 LM-2394. 1 unknown No Hits found SEO ID NO 822 LM-2395. 1 Unknwon No Hits found SEQ ID W 823 LM-2397. 1 Unknown No Hits found SEQ ID DN 824 LM-2398. 1 unknown No Hits found SEQ ID DN 825 LM-2400. 1 unknown No Hits found SEQ ID NO 826 LM-2401. 1 Unknwon No Hits found SEQ ID ? 827 LM-24041UnknwonNo Hits found
<Desc/Clms Page number 84>
Figure img00840001

SEQ ID N 828 LM-241. 2 unknown 50 g)) 7380228lemb) CAB84814. 1) (AL162756) hypothetical protein [Neisseria meningitidis] Length = 181 SEQ ID N 829 LM-2438. 1 unknwon, surface anchored protein 21 gil1396871splP11000 ! WAPASTRMU WALL-ASSOCIATED PROTEIN PRECURSOR SEQ ID NO 830 LM-2448. 2 autolyse ; amidase 99 gil26536551gblAAC46384. 11 (AF035424) autolysin ; amidase [Listeria monocytogenes] Length = 917 SEQ ID NO 831 LM-245. 1 unknown No Hits found SEQ ID N 832 LM-246. 1 unknown No Hits found SEQ ID N 833 LM-247. 3 unknown, similarto methylases 42 gil74697651pirllS76841 hypothetical protein-Synechocystis sp. (strain PCC 6803) SEQ ID NO 834 LM-2474. 1 Unknown 49 gil75926331dbjIBAA94339. 11 (AB033763) hypothetical protein staphylococcus aureus] SEQ ID N 835 LM-2475. 1 Unknown, putalve secreted and Lysin rich 26 g1J59211461dbj1BAA84590. 11 (ABO03084) RNA polymerase sigma 70 protein [Helicobacter pylori] Length = 675 SEQ ID N 836 LM-2489. 2 Unknown, similarto phospho-N-74 g417313lsplQ03521) MRAY~BACSU PHOSPHO-N-ACETYLMURAMOYLacetylmuramoyl-pentapeptide transferase PENTAPEPTIDE-TRANSFERASE (UDP-MURNAC-PENTAPEPTIDE PHOSPHOTRANSFERASE) SEQ ID N 837 LM-2495. 1 cell-division protein FtsA 74 gij120567IspIP28264IFTSA~BACSU CELL DIVISION PROTEIN FTSA SEQ ID ? 838 LM-2503 1 Unknown, similar to internalin protein 35 glj23471021gb1AAB67968. 11 (U77367) internalin [Listeria monocytogenes] Length = 821 SEQ ID NO 839 LM-2504 1 Unknown, putative peptldoglycan bound 8 gl174855171pirllT41744 hypothetical protein F15J1. 40-Arabidopsis thaliana protein (LPXTG motif) SEQ ID NO 840 LM-2513. 1 No Hits found SEQ ID NO 841 LM-2521. 1 creatinine amidohydrolase 46 gil74795691pirllT35153 hypothetical protein SC5A7. 04c SC5A7. 04cStreptomyces coelicolor SEQ DNA842 LM-2522. 1 52 gil7436634ipir)) F72422 2-dehydro-3-deoxyphosphogluconate aldolase/4hydroxy-2-oxoglutarate aldolase-Thermotoga maritima (strain MSB8) SEQ ID ? 843 LM-2523 1 54 gil1176259plP45548 ! PHPECOLI PHOSPHOTRIESTERASE HOMOLOGY PROTEIN SEQ ID NO 844 LM-2524. 1 55 gil7480860lpirllT37066 probable integral membrane protein-Streptomyces coelicolor SEQ ID NO 845 LM-2527. 1 50 giI2851672lspIP39303IPTXA~ECOLI UNKNOWN PENTITOL PHOSPHOTRANSFERASE ENZYME Il, A COMPONENT SEQ ID NO 846 LM-2528. 1 50 gil7443060lpirllD70044 transcription regulator GntR family homolog yvoaBacillus subtilis SEQ DNA847 LM-2597. 3 unknown, similartoMINORTEICHOICACIDS 22 gil2l98542lembICAA59781. 11 (X85787) ss-1, 3-NBIOSYNTHESIS PROTEIN GGAB acetylglucosaminyltransferase [Streptococcus pneumoniae] Length = 306
<Desc/Clms Page number 85>
Figure img00850001

SEQ ID ? 848 LM-2598 3 86 gi136083941gb1AAC35920. 11 (AF071 085) putative glucose-1-phosphate thymidyl transferase [Enterococcus faecalis] Length = 288 SEQ ID ? 849 LM-2599 1 74 gil36083951gblAAC35921. 11 (AF071085) dTDP-4-dehydrorhamnose 3, 5epimerase [Enterococcus faecalis] Length = 190 SEQ ID N'850 LM-2600 1 75 gil74372381pirlIH69105 dTDP-glucose 4, 6-dehydratase-Methanobacterium thermoautotrophicum (strain Delta H) SEQ ID NO 851 LM-2601 1 unknown, similarto DTDP-L-RHAMNOSE 68 gil36083971gblAAC35923. 11 (AF071085) putative dTDP-4-keto-L-rhamnose SYNTHASE reductase [Enterococcus faecalis] Length = 299 SEQ ID ? 852 LM-2602 1unknown, s ! m) ! artoTE ! CHO ! CAC ! D34g1074220p ! rS49240 hypothet ! ca ! prote ! n 3 (capsulation locus)BIOSYNTHESIS PROTEIN B PRECURSOR Haemophilus influenzae (strain RM107) SEQ IDN 853 LM-2606 1 TEICHOIC ACIDBBIOSYNTHESIS PROTEIN B 58 gil135272lspIP27621 ! TAGBBACSU TEICHOIC ACID BIOSYNTHESIS PROTEIN B PRECURSOR. PRECURSOR SEQ ID ? 854 LM-2608 1 unknown, similar to glycosyltransferase 46 gil4580634IgbIAA024457. 1IAF118389~14 (AF118389) Cps2K streptococcus suis] Length = 276 SEQ ID NO 855 LM-2609. 1 unknown, slumilar to glysosyltransferase 30 gil6983732lembICAB75371. 1j (AL139298) putative glycosyltransferase [Streptomyces coelicolor A3 (2)] Length = 1135 SEQ ID DN 856 LM-2618. 1 integrase 46 gil74755801pirA69774 integrase homolog ydcL-Bacillus subtilis SEQ ID NN 857 LM-2619. 1 unknown, similarto a protein encoded by 53 gi132431811gb1AAC34795. 11 (AF063010) unknown [Enterococcus faecium] Tn916 Length = 143 SEQ ID ? 858 LM-2650. 2 Similar to heme A farnesyltransferase 67 gill8418761dbjIBAAl 1110. 11 (D70843) heme O synthetase bacillus stearothermophilus] Length = 307 SEQ ID ? 859 LM-2664. 2 73 gil3990581spIP31104JAROC-BACSU CHORISMATE SYNTHASE (5ENOLPYRUVYLSHIKIMATE-3-PHOSPHATE PHOSPHOLYASE) (VEGETATIVE PROTEIN 216) (VEG216) SEQ ID ? 860 LM-2689 1 unknown, conserved hypothetical protein, 60 giI418459IspIP32726IYLXS~BACSU HYPOTHETICAL 17. 6 KDA PROTEIN IN similar to B. subtilis YlxS protein NUSA 5'REGION (P15A) (ORF1) SEO ID W 861 LM-270. 1 unknown 37 gil74450621pir rE72278 transcription regulator, RpiR family-Thermotoga maritima (strain MSB8) SEQ ID ? 862 LM-272. 1 Unknown, similar to PTS system, fructose-50 gi 17083001spp547451HRSAECOLI HRSA PROTEIN specific IIABC component SEQ ID W 863 LM-273. 1 Unknown, weakly similar to sugar hydrolase 49 gil25066211sp1P547461YBGG~ECOLI HYPOTHETICAL 100. 0 KDA PROTEIN IN HRSA-CYDA) NTERGEN) C REG ! ON SEQ ID ? 864 LM-274. 1 Unknown, similarto Sucrose phosphoryase59g ! [7466753 [p ! rH64879 probab ! e membrane protein b1309-Escherichia coli SEQ ID W 865 LM-275. 1 Unknown, conserved hypothetical protein 64ggil11761521sp) P445071YHADHAEIN HYPOTHETICALPROTEIN H ! 0091 SEQ ID W 866 LM-2761. 1 No Hits found SEQ ID DN 867 LM-284. 1 unknown No Hits found SEQ ID ? 868 LM-2928 1 Unknown, similarto oxidoreductase 51 gil7499000lpirllT16059 hypothetical protein F13D11. 4-Caenorhabditis elegans
<Desc/Clms Page number 86>
Figure img00860001

SEQ ID N 869 LM-2929 1 Unknown, similar to transcriptional regulator 41 gi17444887\pir1lB69970 transcription regulator atorMerRfam)) yhomo ! og yraB- (MerR family) Bacillus subtilis SEQ ID NO 870 LM-3009. 3unknown BEST-BLASTP=34gi [7470965pir [ [T28679 fibrinogen-binding protein homolog-Staphylococcus aureus SEQ ID N 871 LM-3010. 1 unknown, highly similarto TN916 ORF23 79 gil5325561gblAAB60010. 11 (U09422) ORF23 [Enterococcus faecalis] SEQ ID W 872 LM-3011. 1 unknown, highly simllarto TN916 ORF22 82 g1j532555IgbIAAB60011. 11 (U09422) ORF22 [Enterococcus faecalis] SEQ ID NO 873 LM-3012. 1 unknown, highly similarto TN916 ORF21 80 gi15325541gb1AAB60012. 11 (U09422) ORF21 [Enterococcus faecalis] SEQ ID NO 874 LM-3013. 1 unknown, highly similarto TN916 ORF20 68 gil532553igblAAB60013. 11 (UO9422) ORF20 [Enterococcus faecalis] SEQ ID W 875 LM-3014. 1 unknown, similar to B. subtilis YddA protein 47 gi174598231pir1lB69775 hypothetical protein yddA-Bacillus subtilis BEST-BLASTP= SEQ ID ? 876 LM-3016 1 unknown, highly similarto TN916 ORF18 56 gil532551gblAAB60015. 1 ! (U09422) ORF18 [Enterococcus faecalis] SEQ ID NO 877 LM-3017. 1 unknown, highly similarto TN916 ORF17 73 gi\532550IgbIAAB60016. 11 (U09422) ORF17 [Enterococcus faecalls] SEQ ID DN 878 LM-3018. 1 unknown, highly similarto TN916 ORF16 92 gil5325491gblAAB60017. 11 (U09422) ORF16 [Enterococcus faecalis] SEQ ID W 879 LM-3020. 1 unknown, highly similar to TN916 ORF15 70 gil5325481gb ! AAB60018. 11 (U09422) ORF15 [Enterococcus faecalis] SEQ ID ? 880 LM-3022. 1 unknown, highly similarto TN916 ORF14 and 82 gil5325471gblAAB60019. 11 (U09422) ORF14 [Enterococcus faecalis] to L. monocytogenes P60 protein SEQ ID NO 881 LM-3023. 1 unknown, highly similar to TN916 ORF13 71 gil5325461gb1AAB60020. 11 (U09422) ORF13 [Enterococcus faecalis] SEQ ID ? 882 LM-3024 1 CADMIUM EFFLUX SYSTEM ACCESSORY 69 gi131218311sp1Q564051CAOC~LlSMO CADMIUM EFFLUX SYSTEM ACCESSORY PROTEIN PROTEIN SEQ ID NO 883 LM-3056. 1 Unknown, similartoplsX protein involved mn 75 gil6686325 ! spIP71018pLSXBACSU FATTYACID/PHOSPHOLIPID SYNTHESIS fatty acid/phospholipid synthesis PROTEIN PLSX SEQ ID NO 884 LM-3101. 1 Unknown, similar to B. subtilis comG operon 30 gil3287181 lembICAA75315. 11 (YI 5043) homology to ComYD from protein 6 Streptcoccus gordonii, and ComGD from Bacillus subtilis [Lactococcus lactis subsp. cremoris] Length = 150 SEQ ID W 885 LM-3116. 2 unknown, similar to hypothetical proteins 63 gi117309571sp1P508391YPSB~BACSU HYPOTHETICAL 11. 6 KD PROTEIN IN COTD-KDUD INTERGENIC REGION SEQ ID NI 886 LM-3169. 1 83 gil466194\spIP35163IRESO~BACSU TRANSCRIPTIONAL REGULATORY PROTEIN RESD SEQ ID NO 887 LM-3181. 2 73 giI1710383Isp\P46352IRIPX~BACSU PROBABLE INTEGRASE/RECOMBINASE RIPX SEQ ID W 888 LM-3244. 3 unknown, similar to carbonic anhydrase 40 g43894471pdbl1 KOQIB Chain B, Neisseria Gonorrhoeae Carbonic Anhydrase Length = 221 SEQ ID NO 889 LM-3284. 1 Unknown, putative secreted protein 49 gi11406961sp1P100241YG13~BACTU HYPOTHETICAL 13. 4 KD PROTEIN (ORF 3) SEQ ID W 890 LM-3285. 1 Unknown, putative secreted protein 34 gill40696lspIP100241YG13-BACTU HYPOTHETICAL 13. 4 KD PROTEIN (ORF 3) SEQ ID ON 891 LM-3286. 1 Unknown, putative secreted protein 50 g ! ! 1406961spp100241YG13~BACTUHYPOTHETICAL13. 4KDPROTEIN (ORF 3)
<Desc/Clms Page number 87>
Figure img00870001

SEQ ID N 892 LM-3330. 2 Unknown, similar to oxetanocin A resistance 70 gil74745451pirllF69784 conserved hypothetical protein ydhJ-Bacillus subtilis protein oxrB SEQ ID NO 893 LM-3331. 1 Unknown No Hits found SEQ ID N 894 LM-3332. 1 Unknown No Hits found SEQ ID NO 895 LM-3333. 1 Unknown No Hits found SEQ ID N 896 LM-3334. 1 Unknown No Hits found SEQ ID ? 897 LM-3335. 2 Unknown 31 glj74797131pirllT35598 hypothetical protein SC6G9. 01c-Streptomyces coelicolor (fragment) SEQ ID DN 898 LM-3336 3 Unknown, weakly similarto site-specific DNA-24 gil1769991 lembICAA65779. 1 ! (X97069) site-specific DNA-methyltransferase methyltransferase [Bacillus stearothermophilus] Length = 259 SEQ ID ? 899 LM-3337. 3 Unknown 18 gil74633371pirllG70163 hypothetical protein BB0512-Lyme disease spirochete SEQ ID N 900 LM-3344. 1 Unknown 11 glj74942941pirllD71614 hypothetical protein PFB0460c-malaria parasite (Plasmodium falciparum) SEQ ID N 901 LM-3361. 2 35 giI1730885IspIP50728IYPBB~BACSU HYPOTHETICAL40. 7 KD PROTEIN IN FER-RECQ INTERGENIC REGION SEQ ID NO 902 LM-338. 1 Unknown, similarto lipase 39 gil74488821pirllC69464 carboxylesterase (estA) homolog-Archaeoglobus fulgidus SEQ ID N 903 LM-3398 1 cystemyl-tRNA synthetase 76 gil5490241sp ! Q067521SYCBACSU CYSTEINYL-TRNA SYNTHETASE (CYSTE ! NE-TRNA L ! GASE) (CYSRS) SEQ ID N'904 LM-3418 2 unknown, peptidoglycan linked protein 13 gil2230998lembICAA65738. 11 (X97014) ORF A [Listeria seeligeri] Length = (LPxTG) 902 SEQ ID N'905 LM-345 1 Unknown, similar to transcription regulator 46 gil74428761pirllF70203 xylose operon regulatory protein (xylR-2) homologLyme disease spirochete SEQ ID NO 906 LM-3463. 2 unknown No Hits found SEQ ID ? 907 LM-3469. 2 Unknown No Hits found SEQ ID NO 908 LM-3477. 1Unknown, s ! mi ! arto interna ! ! n42g2347102 ! gbAAB67968. 1 (U77367) internalin [Listeria monocytogenes] Length = 821 SEQ ID ? 909 LM-3480. 3 Unknown 54 gil74757811pirllA70002 protein kinase homolog ytvA-Bacillus subtilis SEQ ID ? 910 LM-3494. 3 unknown, similarto B. subtilis protein YkvS 53 gil74751551pirllB69869 hypothetical protein ykvS-Bacillus subtilis SEO ID NO 911 LM-3512. 1 Unknown, similar to conjugated bile acid 82 gq729058IspIO06115ICBH~LACPL CHOLOYLGL YCINE HYDROLASE hydrolase (CONJUGATED BILE ACID HYDROLASE) (CBAH) (BILE SALT HYDROLASE) SEQ ID NO 912 LM-3517. 2 Unknown, similar to unknown proteins 73 gil74295441pirllE69879 conserved hypothetical protein yloV-Bacillus subtilis SEQiDN 913 LM-3528. 2 Unknown, similartoheme0oxygenase 71 gil4584149lembCAB40605. 11 (AJ010111) cytochrome aa3 controlling protein [Bacillus cereus] Length = 311
<Desc/Clms Page number 88>
Figure img00880001

SEQ ID W 914 LM-3538. 3 unknown, similarto transcnptional regulator, 50 gil7442860lpirD69834 transcription regulator Lac family homolog yhjmLac ! family Bacillus subtilis SEQ ID W 915 LM-3562. 2 No Hits found SEQ ID NO 916 LM-3582. 1 Unknown, similar to transcription regulator 43 gil7521750lpirllC70487 transcription regulator TetR/AcrR family-Aquifex TetR/AcrR family aeolicus SEQ ID NO 917 LM-360. 1 unknown No Hits found SEQ ID W 918 LM-3609. 1 unknown, similar to AUTOLYSIN (EC 3. 5. 1. 28) 24gil584748jspIP37710ALYSENTFA AUTOLYSIN (N-ACETYLMURAMOYL-L- (N-ACETYLMURAMOYL-L-ALANNE ALANINE AMIDASE) AMIDASE) SEQ ID N 919 LM-3612 1 unknown, similarto TEICHOIC ACI! 35 gil1074220lpirllS49240 hypothetical protein 3 (capsulation locus)BIOSYNTHESIS PROTEIN B PRECURSOR Haemophilus influenzae (strain RM107) SEQ ID ? 920 LM-3614. 3 unknown, similar to B. subtilis YfhO protein 40 glj74750031pirllG69801 hypothetical protein yfhO-Bacillus subtilis SEQ ID ? 921 LM-3676 2 65 gill 7067971spIP499371FHUG BACSU FERRICHROME TRANSPORT SYSTEM PERMEASE PROTEIN FHUG SEQ ID W 922 LM-3681. 2 unknown No Hits found SEQ ID NO 923 LM-3691. 2 Unknown, putative peptdoglycan bound protein 31 gil74709651pirllT28679 fibrinogen-binding protein homolog-Staphylococcus (LPXTG motif) BEST-BLASTP= aureus SEQ ID ? 924 LM-3700 2 Unknwon, peptidoglycan anchored protein 22 gi ! 74709651pir1lT28679 fibrinogen-binding protein homolog-Staphylococcus aureus SEQ ID DN 925 LM-3728. 1 unknown No Hits found SEQ ID W 926 LM-3746. 2 Unknown, similarto N-acetyltransferase 29 gil74279031pirllB70064 probable phosphinothricin N-acetyltransferase (EC 2. 3. 1.-) ywnH-Bacillus subtilis SEQ ID ? 927 LM-375. 1 Unknwon, similar to oxidoreductases 68 gi174479231pir1lH72307 oxidoreductase, aldo/keto reductase familyThermotoga maritima (strain MSB8) SEQ ID ? 928 LM-3750. 2 Unknown, similartotransposase 57 gil74743371pirllH59102 hypothetical protein pXO1-96-Bacillus anthracis virulence plasmid pXO1 SEQ ID ? 929 LM-3754. 2 No Hits found SEQ ID W 930 LM-376. 1 Unknown, similar to transcription regulator 60 gil74448871pirllB69970 transcription regulator MerR family homolog yraB- (merR family) Bacillus subtilis SEQ ID ? 931 LM-377 1 Unknwon No Hits found SEQ ID ? 932 LM-3779. 3 internalin C 92 gi115469051emb1CAA65088. 11 (X95822) internalin family protein [Listeria monocytogenes] SEQ ID ? 933 LM-378. 1 Unknwon No Hits found SEQ ID ? 934 LM-379. 1 Unknwon No Hits found SEQ ID W 935 LM-380. 1 Unknwon No Hits found SEQ ID No 936 LM-3811. 3 Unknown 20 gil21287911pirllA64465 hypothetical protein MJ1322-Methanococcus jannaschii SEQ ID ? 937 LM-3836. 1 No Hits found
<Desc/Clms Page number 89>
Figure img00890001

SEQ ID NN 938 LM-3848. 1 riboflavin kinase and FAD synthase 66 gil74446381pirrD69692 riboflavin kinase/FAD synthaseribC-Bacillus subtilis SEQ ID N'939 LM-3853 2 Unknown, weakly similar to transposase 45 gil74741931pirllT09011 probable transposase TnpA-Streptococcus pyogenes (fragment) SEQ ID NO 940 LM-387. 1 Unknown No Hits found SEQ ID ? 941 LM-388. 1 unknown No Hits found SEQ ID W 942 LM-3887. 1 unknown No Hits found SEQ ID W 943 LM-389. 1 unknown No Hits found SEQ ID W 944 LM-3890. 1 Unknown 78gil62261261spp322331SECGBACSU PROBABLE PROTEIN-EXPORT MEMBRANE PROTEIN SEC SEQ ID ? 945 LM-390. 3 unknown No Hits found SEQ ID ? 946 LM-3905. 2 Unknown No Hits found SEQ ID ? 947 LM-392. 3 unknown No Hits found SEQ ID DN 948 LM-3929. 1 unknown No Hits found SEQ ID ? 949 LM-3934 1Unknown, simt ! artotransposase62g929968gb) AAA74024. 1 (U30713) ORFA [Bacillus anthracis] SEQ ID ? 950 LM-395. 2 Unknown, similar to dinitrogenase reductase 47 gil6136600lsplQ585881YB87METJA HYPOTHETICAL PROTEIN MJ1187 ADP-ribosylation system SEQ ID NO 951 LM-3951. 1 Unknown 14 gi113897371gb1MB03089. 11 (U55187) arabinosidase [Butyrivibrio fibrisolvens] Length = 789 SEQ ID ? 952 LM-3953 1 Hypothetical orf No Hits found SEQ ID ? 953 LM-3954. 2 Unknown No Hits found SEQ ID DN 954 LM-3958. 1 58 giI5929908IgbIAAD56637. 1IAF174588~1 (AF174588) ComK [Listeria monocytogenes] Length = 190 SEQ ID ? 955 LM-3973. 2 LlPOPROTEIN SIGNAL PEPTIDASE (EC 56 gi14002021sp1P310241LSPA~STMU LlPOPROTEIN SIGNAL PEPTIDASE 3. 4. 23. 36) (PROLIPOPROTEIN SIGNAL (PROLIPOPROTEIN SIGNAL PEPTIDASE) (SIGNAL PEPTIDASE Il) (SPASE PEPTIDASE) (SIGNAL PEPTIDASE Il) Il) (SPASE Il).
SEQ ID ? 956 LM-3976. 4 Unknown, similar to repressor (penicilinase 53 splP065551BLA) BACLI PENICILLINASE REPRESSOR (REGULATORY PROTEIN repressor) BLAI) (BETA-LACTAMASE REPRESSOR PROTEIN) SEQ ID DN 957 LM-3995. 1 unknown No Hits found SEQ ID ? 958 LM-4013. 2 unknown, similar to transcriptional regulator 56 gil17309431sp ! P541821YPOPBACSU HYPOTHETICAL TRANSCRIPTIONAL (MarR family) REGULATOR lN UVRX-ILVA INTERGENIC REGION SEQ ID NO 959 LM-402. 1 Unknown No Hits found SEQ ID NO 960 LM-4040. 1 Unknown No Hits found SEQ ID W 961 LM-4065. 1 47 gil7480201irllT37067 hypothetical protein SCJ21. 18c-Streptomyces coelicolor (fragment) SEQ ID N'962 LM-4096. 1 Unknown No Hits found SEQ ID NO 963 LM-4097. 1 Unknown No Hits found
<Desc/Clms Page number 90>
Figure img00900001

SEQ ID ? 964 LM-4106. 1 Unknown, similar to putative transcription 72 gil7474280lpirH59095 hypothetical protein pXO1-40-Bacillus anthracis regulator virulence plasmid pXO1 SEQ ID W 965 LM-4118. 1 Unknown No Hits found SEQ ID DN 966 LM-4119. 1 unknown No Hits found SEO ID W 967 LM-4121. 1 unknown No Hits found SEQ ID NO 968 LM-4137. 1 unknown No Hits found SEQ ID W 969 LM-4147. 1 unknown, highly similarto TN916 ORF8 61 gil4311291gblAAC36979. 11 (L15633) [Conjugative transposon Tn916 (from Enterococcus faecalis, DS16), 3'end.], gene products [Transposon Tn916] SEQ ID W 970 LM-4148. 1 unknown, highly similarto TN916 ORF19 89 gij5325521gb1AAB60014. 11 (U09422) ORF19 [Enterococcus faecalis] SEQ ID N'971 LM-4149 2 unknown 18 gil63252481refINP-015316. 11 YpIO09cp SEQ ID N'972 LM-4152. 2 unknown, similar to transcriptional regulator No Hits found SEQ ID ? 973 LM-41661 Unknown, hypothetical gene No Hits found SEQ ID W 974 LM-417. 1 hosphoribosylaminoimidazole carboxylase 1 84 glj1316261sp1P120441pUR6~BACSU PHOSPHORIBOSYLAMINOIMIDAZOLE CARBOXYLASE CATALYTIC SUBUNIT (AIR CARBOXYLASE) (AIRC) SEQ ID NO 975 LM-4174. 1 unknown No Hits found SEQ ID DN 976 LM-4175. 1 unknown 53 gil74750181pirllF69808 hypothetical protein yfkK-Bacillus subtilis SEQ ID DN 977 LM-4188 1 No Hits found SEQ ID N'978 LM-4192 1 unknown No Hits found SEQ ID DN 979 LM-4193 1 unknown No Hits found SEQ ID DN 980 LM-4195 1 Unknown No Hits found SEQ ID NO 981 LM-4197. 1 Unknown No Hits found SEQ ID DN 982 LM-4200. 1 unknown No Hits found SEQ ID NO 983 LM-4203. 1 49 gil74751291pir)) G69854 hypothetical protein yjzD-Bacillus subtilis SEQ ID W 984 LM-4207. 1 unknwon 48 gi157303201emb1CAB52541. 11 (AJ131519) hypothetical protein lactobacillus bacteriophage phi adh] Length = 61 SEO ID W 985 LM-4209. 1 Bacteriophage AU18 gp65 protein 69gil5823667lemb ! CAB53855. 11 (AJ242593) gp65 [BacteriophageA118] Length = 54 SEQ ID DN 986 LM-4211. 1 No Hits found SEQ ID NO 987 LM-4213. 1 Unknown No Hits found SEQ ID NO 988 LM-4214. 1 Unknown No Hits found SEQ ID NO 989 LM-4215. 1 gp44 [Bacteriophage A118] 57 gi158236461emb1CAB53834. 11 (AJ242593) gp44 [BacteriophageA118] Length = 72 SEQ ID NO 990 LM-4216. 1 Unknown, similar to transcription regulator 53 gi111767251sp1P459031YOAF ~BACSU HYPOTHETICAL TRANSCRIPTIONAL REGULATOR iN SPON ! C-CWLA iNTERGENiC REGION (ORF8) SEQ ID ? 991 LM-4226 1 No Hits found
<Desc/Clms Page number 91>
Figure img00910001

SEQ ID ? 992 LM-4227. 1 Unknown, similar to repressor protein 67 gil75213521pirlIG75183 probable repressor protein PAB7155-Pyrococcus abyssi (strain Orsay) SEQ ID NO 993 LM-4236. 1 unknown No Hits found SEQ ID DN 994 LM-4246. 1 Unknwon, hypothetical protein No Hits found SEQ ID NO 995 LM-4251. 1 Unknown, Hypothetical No Hits found SEQ ID ? 996 LM-4262. 2 Unknown, similarto penicillinase antirepressor 44 spIP122871BLAR~BACLI REGULATORY PROTEIN BLAR1 SEQ ID NO 997 LM-4267 1 unknown, similar to regulatory proteins 18 gil24953681spIQ560701MARA-SALTY MULTIPLE ANTIBIOTIC RESISTANCE PROTEIN MARA SEQ ID NO 998 LM-4268. 1 unknown No Hits found SEQ ! D ?'999'LM-4295. 1 No Hits found SEQ ID NO 1000 LM-4342. 1 46 pirH70081 hypothetical protein yxlE-Bacillus subtilis dbjBAA11736. 11 (D83026) hypothetical [Bacillus subtilis] embCAB15893. 11 (Z99123) yx ! E [Baci ! ! us subt ! ! is] Length = 62 SEQ ID NO 1001 LM-4351 1 No Hits found SEQ ID ? 1002 LM-48 1 Unknown, conserved hypothetical protein 40gil48951341gblAAD32741. 11 (AF127374) MmcQ [Streptomyces lavendulae] Length = 123 SEQ IDDN 1003 LM-49 1 UnknownNo Hits found SEQ ID W 1004 LM-494 1 Unknown, slmllar to transcriptional regulator 29 gil74781151pirllH70940 probable helix-turn-helix motif at aa 18-39Mycobacterium tuberculosis (strain H37RV) SEQ ID W 1005 LM-497. 1 Unknown, weakly simllar to 12 gi158236301emb1CAB53818. 11 (AJ242593) gp32 [BacteriophageA118] Length = gp32Bacteriophage A118 protem 246 SEQ ID W 1006 LM-501. 1 No Hits found SEQ ID W 1007 LM-502. 1 Unknown No Hits found SEQ ID NO 1008 LM-506. 1 Unknown, similar to anti-repressor 83gil5823644lembCAB53832. 11 (AJ242593) putative anti-repressor promoter [Bacteriophage Al 18] BEST-BLASTP= [Bacteriophage A118] Length = 262 SEQ ID W 1009 LM-509. 1 Unknown, similarto bacteriophage proteins 48 gil6599320lemb) CAB63666. 11 (AJ251789) hypothetical protein lactobacillus casei bacteriophage A2] Length = 163 SEQ ID W 1010 LM-51. 1 Unknown, weakly simllar to AraC-like 17 giI7387707IspIO87389IGLXA~RHIME TRANSCRIPTIONAL REGULA TOR GLXA transcription regulator SEOIDNO1011 LM-510 1 Unknown 26 gij60155111emb1CAA63097. 11 (X92187) p22 erf-like protein [unidentified] Length = 207 SEQ ID NO 1012 LM-512. 1 Unknown, similarto protein gp49 63 gij58236511emb1CAB53839. 11 (AJ242593) gp49 [Bacteriophage A118] Length = [Bacteriophage A118] 310 SEQ ID NO 1013 LM-514. 1 Unknown, similarto protein gap51 59 gil5823653lembCAB53841. 11 (AJ242593) gp51 [Bacteriophage A118] Length = [Bacteriophage AU 8] 186 SEQ ID NO 1014 LM-517. 1 Unknown, similarto a bacteriophage protein 34 gil5001708lgblAAD37108. 1AF10987414 (AF109874) unknown [Bacteriophage Tuc2009] Length = 131
<Desc/Clms Page number 92>
Figure img00920001

SEQ DNA 1015 LM-518. 1 Unknown 26 gi226483Q52118YM03ERWSTHYPOTHET ! CAL31. 4KDAPROTEiNtN MOBD 3'REGION SEQ ID W 1016 LM-520. 1 Unknown No Hits found SEQ ID W 1017 LM-527. 1 No Hits found SEQ ID W 1018 LM-529. 1 37 gil5823599lembICAB53787. 11 (AJ242593) putative terminase small subunit [Bacteriophage A118] Length = 180 SEQ ID NO 1019 LM-535. 156gi) 2120257) pir)) S58142 coat protein-phage SPP1 SEQ ID W 1020 LM-541. 1 71 gi158236111emb1CAB53799. 11 (AJ242593) gp13 [BacteriophageA118] Length = 110 SEQ ID W 1021 LM-549. 1 94 gil5823615lembjCAB53803. 11 (AJ242593) gp17 [Bacteriophage A118] Length = 272 SEQ ID W 1022 LM-552. 199 il5823617lembtCAB53805. 11 (AJ242593) gp19 [Bacteriophage AU18] Length = 342 SEQ ID DN 1023 LM-553 1 91 gil5823618lemblCAB53806 11 (AJ242593) gp20 [Bacteriophage AU18] Length = 357 SEQ ID N'1024 LM-554 1 86 gi 15823619 lem bICAB53807. 11 (AJ242593) gp21 [Bacteriophage A118] Length = 105 SEQ ID W 1025 LM-558 1 99 giI2801778IgbIAAC38580. 11 (AF042193) peptidoglycan Iytic enzyme [Listeria monocytogenes] Length = 281 SEQ ID DN 1026 LM-559. 1 No Hlts found SEQ ID W 1027 LM-56. 1 Unknown, similar to hydrolase (esterase) 43 gil7474811pirllE700100 dihydrolipoamide S-acetyltransferase homolog yugFBacillus subtilis SEQ ID NO 1028 LM-560. 1 47 gil74600361pirllT13226 hypothetical protein R232-Lactobacillus phage phi-gle SEQ ID W 1029 LM-561. 1 No Hits found SEQ IN NO 1030 LM-587. 1 Unknown, similarto Bacillus anthracis CapA 63 gil4584121 lembICAB40617. 11 (AJO07788) related sequence M24150 bacillus protein (polyglutamate capsule biosynthesis) cereus] Length = 367 SEQ ID DN 1031 LM-611. 1 Unknown, similarto ornithine 58 gil66857091sp) 09365610TCPYRAB ORNITHINE CARBAMOYLTRANSFERASE carbamoyltransferase (OTCASE) SEQ ID ? 1032 LM-613. 1 Unknown, similar to amino acid transporter 42 gil60094381dbBAA84897. 11 (AB024946) orf62 [Escherichia collez Length = 486 SEQ IN NO 1033 LM-614. 1 Unknown, conserved hypothetical protein 61 gil5712716jgblAAD47622. 11 (AF153708) unknown [Pseudomonas sp. BG33R] Length = 376 SEQ ID W 1034 LM-615. 1 carbamate kinase 76 gil6980398ipdbl1B7BIA Chain A, Carbamate Kinase From Enterococcus Faecium SEQ ID ? 1035 LM-616. 1 Unknown, conserved hypothetical protein 58 gil5712716igblAAD47622. 11 (AF153708) unknown [Pseudomonas sp. BG33R) Length = 376 SEQ ID N'1036 LM-617 1 Unknown, conserved hypothetical protein, 43 gil42061841gblAAD11507. 11 (U60828) unknown [Lactococcus lactis] Length hypothetical regulator 244
<Desc/Clms Page number 93>
Figure img00930001

SEQ ID NO 1037 LM-653. 1 Unknown, similar to flagellar motor switch 53 gil2l2O5l7lpirllJC4505 flagella motor switch protein fliY-syphilis spirochete protein fliY C-terminal part SEQ ID NO 1038 LM-692. 1 Unknown No Hits found SEQ IDN 1039 LM-710. 1 67 gil28334061spp468291BGLAECOLI 6-PHOSPHO-BETA-GLUCOSIDASE BGLA SEQ ID NO 1040 LM-711. 2 67 gi17304181sp1P407391PTBA~BACSU PTS SYSTEM, BETA-GLUCOSIDES-SPECIFIC IIABC COMPONENT (EIIABC-BGL) (BETA-GLUCOSIDES-PERMEASE IIABC COMPONENT) (PHOSPHOTRANSFERASE ENZYME Il, ABC COMPONENT) (EII-BGL) SEQ ID N 1041 LM-712. 2 70 gil729940IspIP398051L1CT BACSU TRANSCRIPTION ANTITERMINATOR LlCT SEQ ID N"1042 LM-716 1 No Hlts found SEQ ID NO 1043 LM-721. 1 51 gil7434480lpirllB69785 cellobiose phosphotransferase system enzym homolog ydhN-Bacillus subtilis SEQ ID N 1044 LM-723. 1 63gil6002243lembCAB56688. 11 (AL121596) Beta-glucosidase (EC 3. 2. 1. 21) [Streptomyces coelicolor A3 (2)] Length = 762 SEQ ID N 1045 LM-724 1 62 g ! p450520pirA69785ce ! ! ob ! ose phosphotransferase system enzym homolog ydhM-Bacillus subtilis SEQ ID ? 1046 LM-725 1 Unknown, similarto cellobiose 55 gll74499921pirllC69785 cellobiose phosphotransferase system enzym homolog phosphotransferase system enzyme IIC ydhO-Bacillus subtilis SEQ ID NO 1047 LM-726. 1 Unknown, similar to lichenan operon 55 gil11688851sp1P463211CELR~BACSU PUTATIVE CE OPERON REGULATOR transcription antiterminator licr SEQ ID N 1048 LM-728. 1 Unknown 97 gI14138150IembICAAO7718. 11 (AJO07877) ADP ribosyl glycohydrolase [Listena monocytogenes] Length = 327 SEQ ID NO 1049 LM-730. 1 beta-glucoside-specific phosphotransferase 94gil4138149lembICAA07717. 11 (AJ007877) PTS enzyme Il [Listeria enzyme Il monocytogenes] Length = 640 SEQ ID NO 1050 LM-731. 2 transcription antiterminator 96 gil4138148lembCAA07716. 11 (AJ007877) antiterminator [Listeria monocytogenes] Length = 270 SEQ ID NO 1051 LM-757. 1Unknown, simiiarto mterna ! in proteins38g ! p347102gbAAB67968. 1 ! (U77367) internalin [Listeria monocytogenes] Length = 821 SEQ ID ? 1052 LM-80. 1 unknown No Hits found SEQ IDN 1053 LM-812. 1 Unknown, similar to unknown protein 43gil40337151gblAAC97152. 11 (U49397) unknown streptococcus pyogenes] Length = 591 SEQ ID NO 1054 LM-842. 1 Unknown 57 gill044888lembICAA63151. 11 (X92423) sepA [Listeria monocytogenes] Length = 391 SEQ ID NO 1055 LM-843. 1 Unknown No Hits found SEQ ID NO 1056 LM-857. 1 Unknown, similar to transcnption regulator 48 gil7443060lpirllD70044 transcription regulator GntR family homolog yvoaGntR family Bacillus subtilis SEQ ID DN 1057 LM-858 1 Unknown, weakly similarto mannose-6-40 gil74802381pirllT37128 hypothetical protein SCJ4. 45c-Streptomyces coelicolor phosphate isomerase SEQ ID DN 1058 LM-879 1 Unknown 49 gil3786190lemblCAA71106. 11 (Y09988) hypothetical protein [Listeria ivanovii] Length = 171
<Desc/Clms Page number 94>
Figure img00940001

SEQ ID NO 1059 LM-880.
1 Unknown No Hits found SEQ ID NO 1060 LM-881. 1 unknown No Hits found SEQ ID ? 1061 LM-896.
1 No Hits found SEQ ID ? 1062 LM-906.
1 Unknown, conserved hypothetical protein 34 gij74762171pir1lB70617 hypothetical protein Rv0143c-Mycobacterium tuberculosis (strain H37RV) SEQ ID W 1063 LM-924.
1 ABC-transporter ATP binding protein 60 gil74791181pirllT34822 ABC-transporter ATP binding protein-Streptomyces coelicolor SEQ ID DNA 1064 LM-968.
1 Unknown, similar to transposase 62 gil9299681gblAAA74024. 11 (U30713) ORFA [Baci ! ! us anthracis] SEQ ID W 1065 LM-969.
1 Unknown, similarto transposase (N-terminal 49 gil74743371pirllH59102 hypothetical protein pXO1-96-Bacillus anthracis part) virulence plasmid pXO1 SEQ ID NO 1066 LM-970.
1 Unknown, similarto transposase C-terminal 59 gil74743371pirllH59102 hypothetical protein pXO1-96-Bacillus anthracis part virulence plasmid pXO1 SEQ ID DN 1067 LM-973.
1 Unknwon, similarto internalin proteins 24 gil23471051gblAAB67970. 11 (U77368) ! n ! D [Usteria monocytogenes] Length = 567

Claims (94)

REVENDICATIONS
1. Séquence nucléotidique issue de Listeria innocua caractérisée en ce qu'elle correspond à une séquence choisie parmi SEQ ID N 1 à SEQ ID N 11.
2. Séquence nucléotidique issue de Listeria innocua, caractérisée en ce qu'elle est choisie parmi : a) une séquence nucléotidique comportant au moins 75 % d'identité avec une séquence choisie parmi SEQ ID ? 1 à SEQ ID ? 11 ; b) une séquence nucléotidique hybridant dans des conditions de forte stringence avec une séquence choisie parmi SEQ ID N 1 à SEQ ID ?
Figure img00950003
11 ; c) une séquence nucléotidique complémentaire d'une séquence choisie parmi SEQ ID N 1 à SEQ ID ? 11 ou complémentaire d'une séquence nucléotidique telle que définie en a), ou b), ou une séquence nucléotidique de l'ARN correspondant à l'une des séquences a) ou b) ; d) une séquence nucléotidique d'un fragment représentatif d'une séquence
Figure img00950004
choisie parmi SEQ ID NO 1 à SEQ ID NO 11, ou d'un fragment représentatif d'une séquence nucléotidique telle que définie en a), b) ou c) ; e) une séquence nucléotidique comprenant une séquence telle que définie en a), b), c) ou d) ; et f) une séquence nucléotidique telle que définie en a), b), c), d) ou e) modifiée.
3. Séquence nucléotidique selon la revendication 2, caractérisée en ce qu'il s'agit d'une séquence issue d'une séquence choisie parmi SEQ ID N 1 à SEQ ID ?
11, et en ce qu'elle code pour un polypeptide, ladite séquence nucléotidique étant choisie de préférence parmi les séquences SEQ ID ? 12 à SEQ ID ? 689 et SEQ ID ? 2053 à SEQ ID ? 2056.
4. Séquence nucléotidique caractérisée en ce qu'elle comprend une séquence nucléotidique choisie parmi : a) une séquence nucléotidique selon la revendication 3 ; b) une séquence nucléotidique comportant au moins 75 % d'identité avec une séquence nucléotidique selon la revendication 3 ;
<Desc/Clms Page number 96>
Figure img00960001
c) une séquence nucléotidique s'hybridant dans des conditions de forte stringence avec une séquence nucléotidique selon la revendication 3 ; d) une séquence nucléotidique complémentaire ou d'ARN correspondant à une séquence telle que définie en a), b) ou c) ; e) une séquence nucléotidique d'un fragment représentatif d'une séquence telle que définie en a), b), c) ou d) ; et f) une séquence telle que définie en a), b), c), d) ou e) modifiée.
5. Polypeptide codé par une séquence nucléotidique selon l'une des revendications
2 à 4.
6. Polypeptide selon la revendication 5, caractérisé en ce qu'il est choisi parmi les
Figure img00960002
polypeptides codés par une séquence choisi parmi SEQ ID NO 12 à SEQ ID NO 689 et SEQ ID NO 2053 à SEQ ID NO 2056.
7. Polypeptide caractérisé en ce qu'il comprend un polypeptide choisi parmi : a) un polypeptide selon l'une des revendications 5 et 6 ; b) un polypeptide présentant au moins 80 % d'identité avec un polypeptide selon l'une des revendications 5 et 6 ; c) un fragment d'au moins 5 acides aminés d'un polypeptide selon l'une des revendications 5 et 6, ou tel que défini en b) ; d) un fragment biologiquement actif d'un polypeptide selon l'une des revendications 5 et 6, ou tel que défini en b) ou c) ; et e) un polypeptide selon l'une des revendications 5 et 6 ou tel que défini en b), c) ou d) modifié.
8. Séquence nucléotidique codant pour un polypeptide selon la revendication 7.
9. Séquence nucléotidique codant pour un polypeptide spécifique de L. innocua, caractérisée en ce qu'elle est choisie parmi SEQ ID NO 12 à SEQ ID NO 689.
10. Séquence nucléotidique issue de Listeria monocytogenes sérotype 4b caractérisée en ce qu'elle correspond à une séquence choisie parmi SEQ ID NO 1068 à SEQ ID NO 2041.
11. Séquence nucléotidique issue de Listeria monocytogenes sérotype 4b, caractérisée en ce qu'elle est choisie parmi : a) une séquence nucléotidique comportant au moins 75 % d'identité avec une séquence choisie parmi SEQ ID N 1068 à SEQ ID NO 2041 ;
<Desc/Clms Page number 97>
Figure img00970001
b) une séquence nucléotidique hybridant dans des conditions de forte stringence avec une séquence choisie parmi SEQ ID N 1068 à SEQ ID N 2041 ; c) une séquence nucléotidique complémentaire d'une séquence choisie parmi SEQ ID N 1068 à SEQ ID N 2041 ou complémentaire d'une séquence nucléotidique telle que définie en a), ou b), ou une séquence nucléotidique de l'ARN correspondant à l'une des séquences a) ou b) ;
Figure img00970002
d) une séquence nucléotidique d'un fragment représentatif d'une séquence choisie parmi SEQ ID N 1068 à SEQ ID N 2041, ou d'un fragment représentatif d'une séquence nucléotidique telle que définie en a), b) ou c) ; e) une séquence nucléotidique comprenant une séquence telle que définie en a), b), c) ou d) ; et f) une séquence nucléotidique telle que définie en a), b), c), d) ou e) modifiée.
12. Séquence nucléotidique selon la revendication 11, caractérisée en ce qu'il s'agit
Figure img00970003
d'une séquence issue d'une séquence choisie parmi SEQ ID N 1068 à SEQ ID N 2041, et en ce qu'elle code pour un polypeptide, ladite séquence nucléotidique étant choisie de préférence parmi les séquences SEQ ID N 690 à SEQ ID NO 1067 et SEQ ID NO 2049 à SEQ ID NO 2052.
13. Séquence nucléotidique caractérisée en ce qu'elle comprend une séquence nucléotidique choisie parmi : a) une séquence nucléotidique selon la revendication 12 ; b) une séquence nucléotidique comportant au moins 75 % d'identité avec une séquence nucléotidique selon la revendication 12 ; c) une séquence nucléotidique s'hybridant dans des conditions de forte stringence avec une séquence nucléotidique selon la revendication 12 ; d) une séquence nucléotidique complémentaire ou d'ARN correspondant à une séquence telle que définie en a), b) ou c) ; e) une séquence nucléotidique d'un fragment représentatif d'une séquence telle que définie en a), b), c) ou d) ; et une séquence telle que définie en a), b), c), d) ou e) modifiée.
<Desc/Clms Page number 98>
Figure img00980001
14. Polypeptide codé par une séquence nucléotidique selon l'une des revendications 11 à 13. 15. Polypeptide selon la revendication 14, caractérisé en ce qu'il est choisi parmi les polypeptides codés par une séquence choisi parmi SEQ ID N 690 à SEQ ID NO
Figure img00980002
1067 et SEQ ID NO 2049 à SEQ ID NO 2052.
16. Polypeptide caractérisé en ce qu'il comprend un polypeptide choisi parmi : a) un polypeptide selon l'une des revendications 14 et 15 ; b) un polypeptide présentant au moins 80 % d'identité avec un polypeptide selon l'une des revendications 14 et 15 ; c) un fragment d'au moins 5 acides aminés d'un polypeptide selon l'une des revendications 14 et 15, ou tel que défini en b) ; d) un fragment biologiquement actif d'un polypeptide selon l'une des revendications 14 et 15, ou tel que défini en b) ou c) ; et e) un polypeptide selon l'une des revendications 14 et 15 ou tel que défini en b), c) ou d) modifié.
17. Séquence nucléotidique codant pour un polypeptide selon la revendication 16.
18. Séquence nucléotidique codant pour un polypeptide spécifique de L. monocytogenes, caractérisée en ce qu'elle est choisie parmi SEQ ID N 690 à SEQ ID NO 1067.
19. Séquence nucléotidique codant pour un polypeptide présentant au moins 87 % d'identité entre L. innocua et L. monocytogenes, caractérisée en ce qu'elle est choisie parmi SEQ ID NO 2049 à SEQ ID NO 2056.
20. Séquence nucléotidique selon l'une des revendications 2 à 4,8, 9, 11 à 13,17 à
19, caractérisée en ce qu'elle code pour un polypeptide de L. innocua ou L. monocytogenes impliqué dans la biosynthèse des acides aminés ou l'un de ses fragments.
21. Séquence nucléotidique selon l'une des revendications 2 à 4,8, 9, 11 à 13,17 à
19, caractérisée en ce qu'elle code pour un polypeptide de L. innocua ou L. monocytogenes impliqué dans la biosynthèse des cofacteurs, groupes prosthétiques et transporteurs ou l'un de ses fragments.
22. Séquence nucléotidique selon l'une des revendications 2 à 4,8, 9, 11 à 13,17 à
19, caractérisée en ce qu'elle code pour un polypeptide d'enveloppe cellulaire
<Desc/Clms Page number 99>
Figure img00990001
ou situé à la surface de L. innocua ou L. monocytogenes ou l'un de ses fragments. 23. Séquence nucléotidique selon l'une des revendications 2 à 4,8, 9, 11 à 13,17 à
19, caractérisée en ce qu'elle code pour un polypeptide de L. innocua ou L.
Figure img00990002
monocytogenes impliqué dans la machinerie cellulaire ou l'un de ses fragments. y 24. Séquence nucléotidique selon l'une des revendications 2 à 4,8, 9, 11 à 13,17 à
19, caractérisée en ce qu'elle code pour un polypeptide de L. innocua ou L. monocytogenes impliqué dans le métabolisme intermédiaire central ou l'un de ses fragments.
25. Séquence nucléotidique selon l'une des revendications 2 à 4,8, 9, 11 à 13,17 à
19, caractérisée en ce qu'elle code pour un polypeptide de L. innocua ou L. monocytogenes impliqué dans le métabolisme énergénique ou l'un de ses fragments.
26. Séquence nucléotidique selon l'une des revendications 2 à 4,8, 9, 11 à 13,17 à
Figure img00990003
19, caractérisée en ce qu'elle code pour un polypeptide de L. innocua ou L. monocytogenes impliqué dans le métabolisme des acides gras et des phospholipides ou l'un de ses fragments.
27. Séquence nucléotidique selon l'une des revendications 2 à 4,8, 9, 11 à 13,17 à
19, caractérisée en ce qu'elle code pour un polypeptide de L. innocua ou L. monocytogenes impliqué dans le métabolisme des nucléotides, des purines, des pyrimidines ou nucléosides ou l'un de ses fragments.
28. Séquence nucléotidique selon l'une des revendications 2 à 4,8, 9, 11 à 13,17 à
19, caractérisée en ce qu'elle code pour un polypeptide de L. innocua ou L. monocytogenes impliqué dans les fonctions de régulation ou l'un de ses fragments.
29. Séquence nucléotidique selon l'une des revendications 2 à 4,8, 9, 11 à 13,17 à
19, caractérisée en ce qu'elle code pour un polypeptide de L. innocua ou L.
Figure img00990004
monocytogenes impliqué dans le processus de réplication ou l'un de ses y fragment.
30 Séquence nucléotidique selon l'une des revendications 2 à 4,8, 9, 11 à 13,17 à
Figure img00990005
19, caractérisée en ce qu'elle code pour un polypeptide de L. innocua ou L. monocytogenes impliqué dans le processus de transcription ou l'un de ses y fragments.
<Desc/Clms Page number 100>
Figure img01000001
31. Séquence nucléotidique selon l'une des revendications 2 à 4, 8, 9, 11 à 13, 17 à 19, caractérisée en ce qu'elle code pour un polypeptide de L. innocua ou L. monocytogenes impliqué dans le processus de traduction ou l'un de ses fragments.
32. Séquence nucléotidique selon l'une des revendications 2 à 4,8, 9, 11 à 13,17 à
Figure img01000002
19, caractérisée en ce qu'elle code pour un polypeptide de L. innocua ou L. monocytogenes impliqué dans le processus de transport et de liaison des protéines ou l'un de ses fragments.
33. Séquence nucléotidique selon l'une des revendications 2 à 4, 8, 9, 11 à 13, 17 à 19, caractérisée en ce qu'elle code pour un polypeptide de L. innocua ou L. monocytogenes impliqué dans l'adaptation aux conditions atypiques ou l'un de ses fragments.
34. Séquence nucléotidique selon l'une des revendications 2 à 4,8, 9, 11 à 13,17 à
19, caractérisée en ce qu'elle code pour un polypeptide de L. innocua ou L. monocytogenes impliqué dans la sensibilité aux médicaments et analogues ou l'un de ses fragments.
35. Séquence nucléotidique selon l'une des revendications 2 à 4,8, 9, 11 à 13,17 à
19, caractérisée en ce qu'elle code pour un polypeptide de L. innocua ou L. monocytogenes impliqué dans les fonctions relatives aux transposons ou l'un de ses fragments.
36. Polypeptide selon l'une des revendications 5 à 7, et 14 à 16, caractérisé en ce qu'il s'agit d'un polypeptide de L. innocua ou L. monocytogenes impliqué dans la biosynthèse des acides aminés ou l'un de ses fragments.
37. Polypeptide selon l'une des revendications 5 à 7, et 14 à 16, caractérisé en ce qu'il s'agit d'un polypeptide de L. innocua ou L. monocytogenes impliqué dans la biosynthèse des cofacteurs, groupes prosthétiques et transporteurs ou l'un de ses fragment.
38. Polypeptide selon l'une des revendications 5 à 7, et 14 à 16, caractérisé en ce qu'il s'agit d'un polypeptide d'enveloppe cellulaire ou situé à la surface de L. innocua ou L. monocytogenes ou l'un de ses fragments.
39. Polypeptide selon l'une des revendications 5 à 7, et 14 à 16, caractérisé en ce
Figure img01000003
qu'il s'agit d'un polypeptide de L. innocua ou L. monocytogenes impliqué dans la machinerie cellulaire ou l'un de ses fragments.
<Desc/Clms Page number 101>
Figure img01010001
40. Polypeptide selon l'une des revendications 5 à 7, et 14 à 16, caractérisé en ce qu'il s'agit d'un polypeptide de L. innocua ou L. monocytogenes impliqué dans le métabolisme intermédiaire central ou l'un de ses fragements.
41. Polypeptide selon l'une des revendications 5 à 7, et 14 à 16, caractérisé en ce qu'il s'agit d'un polypeptide de L. innocua ou L. monocytogenes impliqué dans le métabolisme énergétique ou l'un de ses fragments.
42. Polypeptide selon l'une des revendications 5 à 7, et 14 à 16, caractérisé en ce qu'il s'agit d'un polypeptide de L. innocua ou L. monocytogenes impliqué dans le métabolisme des acides gras et des phospholipides ou l'un de ses fragments.
43. Polypeptide selon l'une des revendications 5 à 7, et 14 à 16, caractérisé en ce qu'il s'agit d'un polypeptide de L. innocua ou L. monocytogenes impliqué dans le métabolisme des nucléotides, des purines, des pyrimidines ou nucléosides ou l'un de ses fragments.
44. Polypeptide selon l'une des revendications 5 à 7, et 14 à 16, caractérisé en ce
Figure img01010002
qu'il s'agit d'un polypeptide de L. innocua ou L. monocytogenes impliqué dans les fonctions de régulation ou l'un de ses fragments.
45. Polypeptide selon l'une des revendications 5 à 7, et 14 à 16, caractérisé en ce qu'il s'agit d'un polypeptide de L. innocua ou L. monocytogenes impliqué dans le processus de réplication ou l'un de ses fragments.
46. Polypeptide selon l'une des revendications 5 à 7, et 14 à 16, caractérisé en ce qu'il s'agit d'un polypeptide de L. innocua ou L. monocytogenes impliqué dans le processus de transcription ou l'un de ses fragments.
47. Polypeptide selon l'une des revendications 5 à 7, et 14 à 16, caractérisé en ce qu'il s'agit d'un polypeptide de L. innocua ou L. monocytogenes impliqué dans le processus de traduction ou l'un de ses fragments.
48. Polypeptide selon l'une des revendications 5 à 7, et 14 à 16, caractérisé en ce qu'il s'agit d'un polypeptide de L. innocua ou L. monocytogenes impliqué dans le processus de transport et de liaison des protéines ou l'un de ses fragments.
49. Polypeptide selon l'une des revendications 5 à 7, et 14 à 16, caractérisé en ce qu'il s'agit d'un polypeptide de L. innocua ou L. monocytogenes impliqué dans l'adaptation aux conditions atypiques ou l'un de ses fragments.
<Desc/Clms Page number 102>
Figure img01020001
50. Polypeptide selon l'une des revendications 5 à 7, et 14 à 16, caractérisé en ce qu'il s'agit d'un polypeptide de L. innocua ou L. monoc u ytogenes impliqué dans q la sensibilité aux médicaments et analogues ou l'un de ses fragments 51 Polypeptide selon l'une des revendications 5 à 7, et 14 à 16, caractérisé en ce
Figure img01020002
qu'il s'agit d'un polypeptide de L. innocua ou L. monocytogenes impliqué dans qu ytogenes imp les fonctions relatives aux transposons ou l'un de ses fragments.
52. Séquence nucléotidique utilisable comme amorce ou comme sonde, caractérisée en ce que ladite séquence est choisie parmi les séquences nucléotidiques selon l'une des revendications 2 à 4,8 à 13 et 17 à 35.
53. Séquence nucléotidique selon la revendication 52, caractérisée en ce qu'elle est marquée par un composé radioactif ou par un composé non radioactif.
54. Séquence nucléotidique selon l'une des revendications 52 et 53, caractérisée en ce qu'elle est immobilisée sur un support, de manière covalente ou non- covalente.
55. Séquence nucléotidique selon la revendication 54, caractérisée en ce qu'elle est immobilisée sur un support tel qu'un filtre à haute densité ou une puce à ADN.
56. Séquence nucléotidique selon l'une des revendications 53 à 55 pour la détection et/ou l'amplification de séquences nucléiques.
57. Puce à ADN ou filtre, caractérisé en ce qu'il contient au moins une séquence nucléotidique selon la revendication 55.
58. Puce à ADN ou filtre selon la revendication 57, caractérisé en ce qu'il contient en outre au moins une séquence nucléotidique d'un micro-organisme autre que
Figure img01020003
L. innocua ou L. monocytogenes, immobilisée sur le support de ladite puce.
59. Puce à ADN ou filtre selon la revendication 58, caractérisé en ce que le microorganisme autre est choisi parmi un micro-organisme associé à L. innocua ou L. monocytogenes, une bactérie du genre Listeria, et un variant de L. innocua ou L. monocytogenes.
60. Kit ou nécessaire pour la détection et/ou l'identification de bactéries appartenant à l'espèce L. innocua ou L. monocytogenes ou à un micro-organisme associé, caractérisé en ce qu'il comprend une puce à ADN ou un filtre selon la revendication 57.
<Desc/Clms Page number 103>
Figure img01030001
61. Kit ou nécessaire pour la détection et/ou l'identification d'un micro-organisme, caractérisé en ce qu'il comprend une puce à ADN ou un filtre selon l'une des revendications 58 et 59.
62 Kit ou nécessaire pour la détection et/ou la quantification de l'expression d'au moins un gène de L. innocua ou L. monocytogenes, caractérisé en ce qu'il comprend une puce à ADN ou un filtre selon l'une des revendications 57 à 59 63. Vecteur de clonage, et/ou d'expression, caractérisé en ce qu'il contient une séquence nucléotidique selon l'une des revendications 1 à 4,8, 9, 11 à 13 et 17 à
35.
64. Cellule hôte, caractérisée en ce qu'elle est transformée par un vecteur selon la revendication 63.
65. Cellule hôte selon la revendication 64, caractérisée en ce qu'il s'agit d'une bactérie appartenant au genre Listeria.
66. Cellule hôte selon la revendication 65, caractérisée en ce qu'il s'agit d'une bactérie appartenant à l'espèce L. innocua ou L. monocytogenes.
67. Végétal ou animal, excepté l'Homme, comprenant une cellule transformée selon l'une des revendications 64 à 66.
68. Procédé de préparation d'un polypeptide, caractérisé en ce que l'on cultive une cellule transformée par un vecteur selon la revendication 63 dans des conditions permettant l'expression dudit polypeptide et que l'on recupère ledit polypeptide recombinant.
69. Polypeptide recombinant susceptible d'être obtenu par un procédé selon la revendication 68.
70 Procédé de préparation d'un polypeptide synthétique selon l'une des revendications 5 à 7,14 à 16, et 36 à 51, caractérisé en ce que l'on effectue une synthèse chimique dudit polypeptide.
71. Polypeptide hybride, caractérisé en ce qu'il comprend au moins la séquence d'un polypeptide selon l'une des revendications 5 à 7,14 à 16,36 à 51 et 69, et une séquence d'un polypeptide susceptible d'induire une réponse immunitaire chez l'homme ou l'animal.
72. Séquence nucléotidique codant pour un polypeptide hybride selon la revendication 71.
<Desc/Clms Page number 104>
Figure img01040001
73. Vecteur caractérisé en ce qu'il contient une séquence nucléotidique selon la revendication 72.
74 Anticorps monoclonal ou polyclonal, ses fragments, ou anticorps chimérique, caractérisé en ce qu'il est capable de reconnaître spécifiquement un polypeptide selon l'une des revendications 5 à 7,14 à 16,36 à 51,69 et 71 75. Anticorps selon la revendication 74, caractérisé en ce qu'il s'agit d'un anticorps marqué.
76. Procédé pour la détection et/ou l'identification de bactéries appartenant à
Figure img01040002
l'espèce L. innocua ou L. monocytogenes ou à un microorganisme associé dans y un échantillon biologique, caractérisé en ce qu'il comprend les étapes suivantes : a) mise en contact de l'échantillon biologique avec un anticorps selon l'une des revendications 74 et 75 ; b) mise en évidence du complexe antigène-anticorps éventuellement formé 77 Procédé pour la détection de l'expression d'un gène de L. innocua ou L. monocytogenes caractérisé en ce que l'on met en contact une souche de L. innocua ou L. monocytogenes, avec un anticorps selon la revendication 74 ou 75 et que l'on détecte le complexe antigène/anticorps éventuellement formé.
78. Kit ou nécessaire pour la mise en oeuvre d'un procédé selon la revendication 76 ou 77, caractérisé en ce qu'il comprend les éléments suivants : a) un anticorps selon l'une des revendications 74 et 75 ; b) éventuellement, les réactifs pour la constitution du milieu propice à la réaction immunologique ; c) éventuellement, les réactifs permettant la mise en évidence des complexes antigène-anticorps produits par la réaction immunologique.
79. Polypeptide selon l'une des revendications 5 à 7,14 à 16,36 à 51,69 et 71, ou anticorps selon l'une des revendications 74 et 75, caractérisé en ce qu'il est immobilisé sur un support, notamment une puce à protéine.
80. Puce à protéine, caractérisée en ce qu'elle contient au moins un polypeptide selon l'une des revendications 5 à 7,14 à 16,36 à 51,69 et 71, ou au moins un anticorps selon l'une des revendications 74 et 75, immobilisé sur le support de ladite puce.
<Desc/Clms Page number 105>
Figure img01050001
81. Puce à protéine selon la revendication 80, caractérisée en ce qu'elle contient en outre au moins un polypeptide de micro-organisme autre que L. innocua ou L. monocytogenes ou au moins un anticorps dirigé contre un composé de micro- organisme autre que L. innocua ou L. monocytogenes, immobilisé sur le support de ladite puce.
82. Kit ou nécessaire pour la détection et/ou l'identification de bactéries appartenant à l'espèce L. innocua ou L. monocytogenes ou à un micro-organisme associé, caractérisé en ce qu'il comprend une puce à protéine selon l'une des revendications 80 et 81.
83. Kit ou nécessaire pour la détection et/ou l'identification d'un micro-organisme, caractérisé en ce qu'il comprend une puce à protéine selon la revendication 81.
84. Procédé de détection et/ou d'identification de bactéries appartenant à l'espèce L. innocua ou L. monocytogenes ou à un micro-organisme associé dans un échantillon biologique, caractérisé en ce qu'il met en oeuvre une séquence nucléotidique selon l'une des revendications 2 à 4,8, 9, 11 à 13,17 à 35,52 à
56 et 72.
85. Procédé selon la revendication 84, caractérisé en ce qu'il comporte les étapes suivantes : a) éventuellement, isolement de l'ADN à partir de l'échantillon biologique à analyser, ou obtention d'un ADNc à partir de l'ARN de l'échantillon biologique ; b) amplification spécifique de l'ADN de bactéries appartenant à l'espèce L. innocua ou L. monocytogenes ou à un micro-organisme associé à l'aide d'au moins une amorce selon l'une des revendications 52 à 56 ; c) mise en évidence des produits d'amplification.
86 Procédé selon la revendication 84, caractérisé en ce qu'il comprend les étapes suivantes : a) mise en contact d'une sonde nucléotidique selon l'une des revendications 52 à 56, avec un échantillon biologique, l'acide nucléique contenu dans l'échantillon biologique ayant, le cas échéant, préalablement été rendu accessible à l'hybridation, dans des conditions permettant l'hybridation de la sonde à l'acide nucléique d'une bactérie
<Desc/Clms Page number 106>
Figure img01060001
appartenant à l'espèce L. innocua ou L. monocytogenes ou à un microorganisme associé ; b) mise en évidence de l'hybride éventuellement formé entre la sonde nucléotidique et l'acide nucléique de l'échantillon biologique.
87. Procédé selon la revendication 84, caractérisé en ce qu'il comprend les étapes suivantes : a) mise en contact d'une sonde nucléotidique immobilisée sur un support selon la revendication 54 avec un échantillon biologique, l'acide nucléique de l'échantillon ayant, le cas échéant, été préalablement rendu accessible à l'hybridation, dans des conditions permettant l'hybridation de la sonde à l'acide nucléique d'une bactérie appartenant à l'espèce L. innocua ou L. monocytogenes ou à un micro-organisme associé ; b) mise en contact de l'hybride formé entre la sonde nucléotidique immobilisée sur un support et l'acide nucléique contenu dans l'échantillon biologique, le cas échéant après élimination de l'acide nucléique de l'échantillon biologique n'ayant pas hybridé avec la sonde, avec une sonde nucléotidique marquée selon la revendication 53, c) mise en évidence du nouvel hybride formé à l'étape b).
88. Procédé selon la revendication 87, caractérisé en ce que, préalablement à l'étape a), l'ADN de l'échantillon biologique ou l'ADNc obtenu éventuellement par transcription inverse de l'ARN de l'échantillon, est amplifié à l'aide d'au moins une amorce selon l'une des revendications 52 à 56.
Figure img01060002
89. Kit ou nécessaire pour la détection et/ou l'identification de bactéries appartenant à l'espèce L. innocua ou L. monocytogenes ou à un microorganisme associé, caractérisé en ce qu'il comprend les éléments suivants : a) une sonde nucléotidique selon l'une des revendications 52 à 56 ; b) éventuellement, les réactifs nécessaires à la mise en oeuvre d'une réaction d'hybridation ; c) éventuellement, au moins une amorce selon l'une des revendications 52 à 56 ainsi que les réactifs nécessaires à une réaction d'amplification de l'ADN.
<Desc/Clms Page number 107>
Figure img01070001
90. Kit ou nécessaire pour la détection et/ou l'identification de bactéries appartenant à l'espèce L. innocua ou L. monocytogenes ou à un micro-organisme associé, caractérisé en ce qu'il comprend les éléments suivants : a) une sonde nucléotidique, dite sonde de capture, selon la revendication 54 ; b) une sonde oligonucléotidique, dite sonde de révélation, selon la revendication 53 ; c) éventuellement, au moins une amorce selon l'une des revendications 52 à 56 ainsi que les réactifs nécessaires à une réaction d'amplification de l'ADN.
91. Kit ou nécessaire pour la détection et/ou l'identification de bactéries appartenant à l'espèce L. innocua ou L. monocytogenes ou à un micro-organisme associé, caractérisé en ce qu'il comprend les éléments suivants : a) au moins une amorce selon l'une des revendications 52 à 56 ; b) éventuellement, les réactifs nécessaires pour effectuer une réaction d'amplification d'ADN ; c) éventuellement, un composant permettant de vérifier la séquence du fragment amplifié, plus particulièrement une sonde oligonucléotidique selon l'une des revendications 52 à 56.
92. Procédé selon les revendications 76,77 et 84 à 88 ou kit ou nécessaire selon les revendications 78,82, 83 et 89 à 91 pour la détection et/ou l'identification de
Figure img01070002
bactéries appartenant à l'espèce L. innocua ou L. monocytogenes, caractérisé en y ce que ladite amorce et/ou ladite sonde sont choisies parmi les séquences nucléotidiques selon l'une des revendications 2 à 4,8, 9, 11 à 13,17 à 35,52 à
Figure img01070003
56, et 72 spécifiques de l'espèce L. innocua ou L. monocytogenes, en ce que lesdits polypeptides sont choisis parmi les polypeptides selon l'une des revendications 5 à 7, 14 à 16, 36 à 51, 69 et 71 spécifiques de l'espèce L. innocua ou L. monocytogenes et en ce que lesdits anticorps sont choisis parmi les anticorps selon l'une des revendications 74 et 75 dirigés contre les polypeptides choisis parmi les polypeptides selon l'une des revendications 5 à 7, 14 à 16,36 à 51,69 et 71 spécifiques de l'espèce L. innocua ou L. monocytogenes.
<Desc/Clms Page number 108>
Figure img01080001
93. Souche de L. innocua ou L. monocytogenes, caractérisée en ce qu'elle contient au moins une mutation dans au moins une séquence nucléotidique selon l'une des revendications 2 à 4, 8,9, 11 à 13,17 à 35.
94. Souche de L. innocua ou L. monocytogenes selon la revendication 93, caractérisée en ce que la mutation mène à une inactivation du gène 95. Souche de L. innocua ou L. monocytogenes selon la revendication 93, caractérisée en ce que la mutation mène à une surexpression du gène.
96. Utilisation d'une séquence nucléotidique selon l'une des revendications 2 à 4,8,
9, 11 à 13,17 à 35, d'un polypeptide selon l'une des revendications 5 à 7,14 à
16,36 à 51,69 et 71, d'un anticorps selon l'une des revendications 74 et 75, d'une cellule selon l'une des revendications 64 à 66, et/ou d'un animal transformé selon la revendication 67 pour la sélection de composé organique ou inorganique capable de moduler, de réguler, d'induire ou d'inhiber l'expression de gènes, et/ou de modifier la réplication cellulaire de cellules eucaryotes ou procaryotes ou capables d'induire, d'inhiber ou d'aggraver chez un organisme animal ou humain les pathologies liées à une infection par L. monocytogenes ou par un micro-organisme associé.
97. Méthode de sélection de composé capable de se lier à un polypeptide selon l'une des revendications 5 à 7,14 à 16,36 à 51,69 et 71, capable de se lier à une séquence nucléotidique selon l'une des revendications 2 à 4,8, 9, Il à 13,
17 à 35, ou capable de reconnaître un anticorps selon l'une des revendications
74 et 75, et/ou capable de moduler, de réguler, d'induire ou d'inhiber l'expression de gènes, et/ou de modifier la réplication cellulaire de cellules eucaryotes ou procaryotes, ou capables d'induire, d'inhiber ou d'aggraver chez un organisme animal ou humain les pathologies liées à une infection par L. monocytogenes, caractérisée en ce qu'elle comprend les étapes suivantes : a) mise en contact dudit composé avec ledit polypeptide, ladite séquence nucléotidique, avec une cellule transformée selon l'une des revendications 64 à 66, et/ou administration dudit composé à un animal transformé selon la revendication 67 ; b) détermination de la capacité dudit composé à se lier avec ledit polypeptide ou ladite séquence nucléotidique, ou de moduler, de réguler, d'induire ou d'inhiber l'expression de gènes, ou de moduler la
<Desc/Clms Page number 109>
Figure img01090001
croissance ou la réplication cellulaire, ou d'induire, d'inhiber ou d'aggraver chez ledit organisme animal ou humain les pathologies liées à une infection par L. monocytogenes ou par un micro-organisme associé.
98. Composition pharmaceutique comprenant un composé choisi parmi les composés suivants : a) une séquence nucléotidique selon l'une des revendications 2 à 4,8, 9, 11 à 13, 17 à 35 ; b) un polypeptide selon l'une des revendications 5 à 7,14 à 16,36 à 51,69 et 71 ; c) un vecteur selon la revendication 63 ou 73 ; d) un anticorps selon la revendication 74 ou 75.
99. Composition selon la revendication 98, éventuellement en association avec un véhicule pharmaceutiquement acceptable.
100. Composition pharmaceutique selon l'une des revendications 98 et 99 pour la prévention ou le traitement d'une infection par une bactérie appartenant à l'espèce L. monocytogenes ou par un micro-organisme associé.
101 Composition immunogène, caractérisée en ce qu'elle comprend un ou plusieurs polypeptides selon l'une des revendications 5 à 7,14 à 16,36 à 51,69, et/ou un ou plusieurs polypeptides hybrides selon la revendication 71.
102. Utilisation d'une cellule selon l'une des revendications 64 à 66, ou d'un vecteur selon l'une des revendications 63 ou 73 pour la préparation d'une composition vaccinale.
103. Composition vaccinale, caractérisée en ce qu'elle contient un polynucléotide selon l'une des revendications 1 à 4,8, 9, 11 à 13 et 17 à 35, un vecteur selon l'une des revendications 63 ou 73, et/ou une cellule selon l'une des revendications 64 à 66.
104. Composition immunogène capable d'induire une réponse immunitaire cellulaire ou humorale pour la prévention ou le traitement d'une infection par bactérie appartenant à l'espèce L. monocytogenes ou par un micro-organisme associé, caractérisée en ce qu'elle comprend une composition immunogène selon l'une des revendications 101 et 103, en association avec un véhicule
<Desc/Clms Page number 110>
Figure img01100001
pharmaceutiquement acceptable et, éventuellement un ou plusieurs adjuvants de l'immunité appropriés.
105. Banque génomique d'une bactérie du genre Listeria.
106 Banque d'ADN génomique d'une bactérie du genre Listeria selon la revendication 105, caractérisée en ce que ladite banque d'ADN est clonée dans un plasmide.
107. Banque d'ADN génomique selon la revendication 105 ou 106, caractérisée
Figure img01100002
en ce que ladite bactérie est L. innocua ou L. monocytogenes sérotype 4b 108. Banque selon la revendication 105 ou 106, caractérisée en ce qu'il s'agit de la banque Li-shotgun déposée à la CNCM le 2 octobre 2000 sous le ne 1-2565.
109. Banque selon la revendication 105 ou 106, caractérisée en ce qu'il s'agit de la banque Lm4b-shotgun déposée à la CNCM le 2 octobre 2000 sous le nO 1-
2566.
110. Banque génomique selon la revendication 105, caractérisée en ce que la bactérie est L. innocua ou L. monocytogenes.
111. Utilisation des banques génomiques selon l'une des revendications 105 à
110 pour isoler des séquences nucléotidiques spécifiques de L. innocua et L. monocytogenes, caractérisée en ce que les séquences nucléotidiques de L. innocua et L. monocytogenes sont alignées et en ce que les données obtenues par cet alignement sont traitées pour isoler lesdites séquences spécifiques.
112. Composition pharmaceutique selon l'une des revendications 98 à 100, caractérisée en ce qu'elle comprend des anticorps dirigés contre des
Figure img01100003
polypeptides spécifiques de L. innocua ou L. monocytogenes. 113. Procédé d'identification de séquences spécifiques de L. innocua ou L. monocytogenes, caractérisé par l'alignement des séquences nucléotidiques de L. monocytogenes et de celles de L. innocua selon les revendications 1 à 4,8 à 13 et 17 et le traitement des données obtenues par cet alignement pour isoler lesdites séquences spécifiques.
FR0012697A 2000-10-04 2000-10-04 Listeria innocua, genome et applications Expired - Fee Related FR2814754B1 (fr)

Priority Applications (8)

Application Number Priority Date Filing Date Title
FR0012697A FR2814754B1 (fr) 2000-10-04 2000-10-04 Listeria innocua, genome et applications
EP01982519A EP1322763A2 (fr) 2000-10-04 2001-10-04 Listeria innocua , genome et applications
PCT/FR2001/003061 WO2002028891A2 (fr) 2000-10-04 2001-10-04 Listeria innocua, genome et applications
US10/398,221 US20040018514A1 (en) 2000-10-04 2001-10-04 Listeria inocua, genome and applications
AU2002214081A AU2002214081A1 (en) 2000-10-04 2001-10-04 Listeria inocua, genome and applications
KR10-2003-7004886A KR20030064404A (ko) 2000-10-04 2001-10-04 리스테리아 이노큐아, 게놈 및 이의 용도
CA002424952A CA2424952A1 (fr) 2000-10-04 2001-10-04 Listeria innocua, genome et applications
JP2002532473A JP2004515227A (ja) 2000-10-04 2001-10-04 リステリア・インノキュア、ゲノムおよびその用途

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0012697A FR2814754B1 (fr) 2000-10-04 2000-10-04 Listeria innocua, genome et applications

Publications (2)

Publication Number Publication Date
FR2814754A1 true FR2814754A1 (fr) 2002-04-05
FR2814754B1 FR2814754B1 (fr) 2005-09-09

Family

ID=8855008

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0012697A Expired - Fee Related FR2814754B1 (fr) 2000-10-04 2000-10-04 Listeria innocua, genome et applications

Country Status (8)

Country Link
US (1) US20040018514A1 (fr)
EP (1) EP1322763A2 (fr)
JP (1) JP2004515227A (fr)
KR (1) KR20030064404A (fr)
AU (1) AU2002214081A1 (fr)
CA (1) CA2424952A1 (fr)
FR (1) FR2814754B1 (fr)
WO (1) WO2002028891A2 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110511987A (zh) * 2019-08-28 2019-11-29 华南理工大学 一种基于特异性基因靶标lmo1341的单增李斯特菌的PCR检测方法

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7939087B2 (en) 2000-10-27 2011-05-10 Novartis Vaccines And Diagnostics, Inc. Nucleic acids and proteins from Streptococcus groups A & B
AU2012200299B2 (en) * 2000-10-27 2014-10-02 J. Craig Venter Institute, Inc. Nucleic acids and proteins from streptococcus groups A and B
US7368547B2 (en) * 2003-02-03 2008-05-06 Mississippi State University Use of novel virulence-specific genes as targets for diagnosis and potential control of virulent strains of Listeria monocytogenes
US20060257894A1 (en) * 2003-09-16 2006-11-16 Michel Doumith Molecular typing of listeria monocytogenes, hybridization supports and kits for said molecular typing
EP1809746A1 (fr) * 2004-07-06 2007-07-25 Warnex Research Inc. Polynucleotides pour la detection de l'espece listeria
US20060057613A1 (en) * 2004-07-26 2006-03-16 Nanosphere, Inc. Method for distinguishing methicillin resistant S. aureus from methicillin sensitive S. aureus in a mixed culture
US7439022B2 (en) * 2005-06-15 2008-10-21 Kraft Foods Holdings, Inc. Nucleic acids for detection of Listeria
DK2020449T3 (da) * 2006-04-24 2013-01-14 Sigma Alimentos Sa De Cv Fremgangsmåde til detektion og multipel, simultan kvantificering af patogener ved hjælp af real-time polymerasekædereaktion
WO2009035954A1 (fr) * 2007-09-12 2009-03-19 3M Innovative Properties Company Procédés de détection de listeria monocytogenes
IE20080050A1 (en) * 2008-01-24 2009-11-11 Univ Cork Listeria monocytogenes cytotoxin Listeriolysin S
EP2588628A1 (fr) * 2010-06-30 2013-05-08 Life Technologies Corporation Détection d'espèces listeria dans des échantillons alimentaires et environnementaux et procédés et compositions afférents
US20120052495A1 (en) * 2010-08-30 2012-03-01 Samsung Techwin Co., Ltd. Oligonucleotides for detecting listeria monocytogenes and use thereof
US20120052492A1 (en) * 2010-08-30 2012-03-01 Samsung Techwin Co., Ltd. Oligonucleotides for detecting listeria spp. and use thereof
US9422529B2 (en) 2010-12-22 2016-08-23 The Board Of Regents Of The University Of Texas System Alphavirus compositions and methods of use
WO2012088473A1 (fr) * 2010-12-22 2012-06-28 The Board Of Regents Of The University Of Texas System Compositions à base d'alphavirus et leurs procédés d'utilisation
CN102676506A (zh) * 2012-05-30 2012-09-19 曹际娟 单核细胞增生李斯特氏菌核酸标准样品、其建立方法及应用
CN104017873B (zh) * 2014-05-30 2017-05-10 浙江万里学院 用于同时检测海洋中五种致病菌以及三种毒力基因的多重pcr引物及其设计方法
CN103981275A (zh) * 2014-05-30 2014-08-13 浙江万里学院 用于同时检测海洋中四种致病菌的多重pcr引物及其设计方法
JP2017525377A (ja) * 2014-08-25 2017-09-07 ジーンウィーブ バイオサイエンシズ,インコーポレイティド 非複製的形質導入粒子及び形質導入粒子に基づくレポーターシステム
US11008602B2 (en) 2017-12-20 2021-05-18 Roche Molecular Systems, Inc. Non-replicative transduction particles and transduction particle-based reporter systems
CN112725474B (zh) * 2020-12-30 2022-05-20 广东省微生物研究所(广东省微生物分析检测中心) 含有特异性分子靶标的单核细胞增生李斯特菌标准菌株及其检测和应用
NL2036756B1 (en) * 2024-01-05 2024-08-29 Shihezi Univ Fluorescent pcr method for detecting listeria monocytogenes and mycobacterium tuberculosis in milk

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0805214A2 (fr) * 1996-04-30 1997-11-05 Universita' Degli Studi di Udine Procédé et amorces d'identification de Listeria monocytogenes dans un substrat organique

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5610012A (en) * 1994-04-08 1997-03-11 Wisconsin Alumni Research Foundation DNA probes specific for virulent listeria monocytogenes
WO2001077335A2 (fr) * 2000-04-11 2001-10-18 Institut Pasteur Genome de listeria monocytogenes, polypeptides et utilisations

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0805214A2 (fr) * 1996-04-30 1997-11-05 Universita' Degli Studi di Udine Procédé et amorces d'identification de Listeria monocytogenes dans un substrat organique

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ANDREAS BUBERT ET AL.: "Detection and differentiation of Listeria spp. by a single reaction based on multiplex PCR", APPLIED AND ENVIRONMENTAL MICROBIOLOGY, vol. 65, no. 10, October 1999 (1999-10-01), pages 4688 - 4692, XP002172242 *
ANDREAS BUBERT ET AL.: "The homologous and heterologous regions within the iap gene allow genus- and species-specific identification of Listeria spp. by polymerase chain reaction", APPLIED AND ENVIRONMENTAL MICROBIOLOGY, vol. 58, no. 8, August 1992 (1992-08-01), pages 2625 - 2632, XP001010399 *
T. CHAKRABORTY ET AL.: "Genome organization and the evolution of the virulence gene locus in Listeria species", INTERNATIONAL JOURNAL OF MEDICAL MICROBIOLOGY, vol. 290, no. 2, May 2000 (2000-05-01), pages 167 - 174, XP001010398 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110511987A (zh) * 2019-08-28 2019-11-29 华南理工大学 一种基于特异性基因靶标lmo1341的单增李斯特菌的PCR检测方法
CN110511987B (zh) * 2019-08-28 2023-07-18 华南理工大学 一种基于特异性基因靶标lmo1341的单增李斯特菌的PCR检测方法

Also Published As

Publication number Publication date
EP1322763A2 (fr) 2003-07-02
US20040018514A1 (en) 2004-01-29
WO2002028891A3 (fr) 2003-01-03
CA2424952A1 (fr) 2002-04-11
JP2004515227A (ja) 2004-05-27
WO2002028891A2 (fr) 2002-04-11
AU2002214081A1 (en) 2002-04-15
KR20030064404A (ko) 2003-07-31
FR2814754B1 (fr) 2005-09-09

Similar Documents

Publication Publication Date Title
FR2814754A1 (fr) Listeria innocua, genome et applications
WO2002092818A2 (fr) Sequence du genome streptococcus agalactiae et ses utilisations
KR100886095B1 (ko) 폴리펩티드 항원을 암호화하는 신규한 스트렙토코쿠스 뉴모니애 개방형 판독 프레임 및 이를 포함하는 조성물
CN107257853B (zh) 新型肠出血性大肠杆菌噬菌体Esc-CHP-1及其用于抑制肠出血性大肠杆菌增殖的用途
CA2404988A1 (fr) Genome de listeria monocytogenes, polypeptides et utilisations
FR2862659A1 (fr) Genome de legionella pneumophila souche paris- applications diagnostiques et epidemiologiques
PT1812058E (pt) Antigénios de chlamydia trachomatis para vacina e utilização em diagnóstico
CN107208067B (zh) 新型肠侵袭性大肠杆菌噬菌体Esc-COP-4及其用于抑制肠侵袭性大肠杆菌增殖的用途
US20200109395A1 (en) Genetic systems that defend against foreign dna and uses thereof
JP2022519699A (ja) 遺伝子改変ラクトバチルス(Lactobacillus)及びその使用
JP2010189411A (ja) 病原菌株に特異的な新規生成物およびそのワクチンとしての使用および免疫療法における使用
EP1003888A2 (fr) Sequences nucleiques de polypeptides exportes de mycobacteries, vecteurs les comprenant et applications au diagnostic et a la prevention de la tuberculose
NO20141517L (no) Ny type III-sekresjonsvei i Aeromonas salmonicida og anvendelse derav
WO2001077334A2 (fr) Genome de lactococcus lactis, polypeptides et utilisations
JP2004514451A (ja) マイコバクテリア感染に対する防御
WO2000001825A1 (fr) ANTIGENE D&#39;HELICOBACTER (η-GLUTAMYLTRANSPEPTIDASE) ET SEQUENCES CODANT POUR CET ANTIGENE
Naser et al. Effect of IS900 gene of Mycobacterium paratuberculosis on Mycobacterium smegmatis
JP4183504B2 (ja) ストレプトコッカス遺伝子
KR101992013B1 (ko) 병원성 장내세균에 대해 사멸능을 갖는 신규 박테리오파지 및 이의 용도
AU2021240230B2 (en) Vaccines and vaccine components for inhibition of microbial cells
US20030124567A1 (en) Use of a leptospire protein preventing and/or diagnosing and/or treating animal or human leptospirosis
FR2767336A1 (fr) Vecteurs recombinants, polynucleotide codant pour un polypeptide pd428 de 12kd de mycobacteries appartenant au complexe de mycobacterium tuberculosis et applications au diagnostic et a la prevention de la tuberculose

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20080630