EP3526344B1

EP3526344B1 - Identifizierung und antibiotische charakterisierung von krankheitserregern in metagenomischen proben

Info

Publication number: EP3526344B1
Application number: EP17780452.3A
Authority: EP
Inventors: Pierre Mahe; Maud TOURNOUD; Stéphane SCHICKLIN; Ghislaine GUIGON; Etienne Ruppe
Original assignee: Biomerieux SA
Current assignee: Biomerieux SA
Priority date: 2016-10-13
Filing date: 2017-10-12
Publication date: 2020-09-30
Anticipated expiration: 2037-10-12
Also published as: JP7068287B2; EP3526344A1; CN109923217B; JP2019537780A; CN109923217A; US20190252042A1; US11749381B2; WO2018069430A1

Claims

Verfahren zur Identifizierung eines Krankheitserregers, der in einer metagenomischen Probe enthalten ist, und zum Identifizieren pathogener Marker in dem Genom des Krankheitserregers, wobei das Verfahren die folgenden Schritte umfasst:
- Aufarbeiten (12) der metagenomischen Probe, um DNA zumindest von Krankheitserregern zu extrahieren, die in der Probe vorliegen,

- Sequenzieren (14) der extrahierten DNA, um auf diese Weise einen Satz digitaler Nukleinsäuresequenzen oder "Leseeinheiten" zu erhalten,

- Vergleichen (22) des Satzes von Leseeinheiten mit einer ersten Datenbank, die Genome bekannter Krankheitserreger umfasst, um Leseeinheiten des Satzes den bekannten Krankheitserregern zuzuordnen;

- Erstellen (26) einer Gesamtheit von Leseeinheiten, die zumindest Leseeinheiten umfasst, welche einem Krankheitserreger unter den bekannten Krankheitserregern zugeordnet wurde, und Zusammenfügen (28) der Leseeinheiten in der Gesamtheit, um mindestens eine zusammengefügte digitale Nukleinsäuresequenz oder "Contig" zu erstellen,

- Vergleichen (30) der erstellten Contigs mit einer zweiten Datenbank von bekannten pathogenen genetischen Markern, um zu prüfen, ob die erstellten Contigs einen bekannten Marker enthalten,
dadurch gekennzeichnet,

- dass das Verfahren den Schritt des Vergleichens (24) des Satzes von Leseeinheiten mit der zweiten Datenbank umfasst, um Leseeinheiten des Satzes den bekannten pathogenen Markern zuzuordnen, wobei eine Leseeinheit einem bekannten pathogenen Marker zugeordnet wird, wenn sie vollständig in dem Marker enthalten ist oder wenn sie sich beidseitig über den Marker hinweg erstreckt, und

- dass die Gesamtheit weiterhin die Leseeinheiten umfasst, welche den bekannten pathogenen Markern zugeordnet wurden, wobei die Contigs auf diese Weise ausgehend von Leseeinheiten, welche dem bekannten Krankheitserreger zugeordnet wurden, und Leseeinheiten, welche den bekannten pathogenen Markern zugordnet wurden, zusammengefügt werden.
Verfahren gemäß Anspruch 1, wobei die Leseeinheiten, welche sich beidseitig über den Marker hinweg erstrecken, Abschnitte aufweisen, die mit einer Länge von mindestens 20 bp in dem Marker enthalten sind.
Verfahren gemäß Anspruch 1 oder 2, wobei die Leseeinheiten eine durchschnittliche Länge von L bp haben, wobei L > 100, und wobei die Leseeinheiten, welche sich beidseitig über den Marker hinweg erstrecken, einen Abschnitt im Bereich von [1; L-50] bp haben, der außerhalb des Markers liegt.
Verfahren gemäß Anspruch 1, 2 oder 3, wobei die Leseeinheiten, welche sich beidseitig über den Marker hinweg erstrecken, einen ersten Abschnitt, welche in dem Marker enthalten ist, und einen zweiten Abschnitt aufweisen, welcher außerhalb des Markers liegt, und wobei die Länge des zweiten Abschnitts auf Grundlage einer Kartierung gegenüber dem Leistungskennwert der ARD-Datenbank gewählt wird.
Verfahren gemäß Anspruch 4, wobei die Länge des zweiten Abschnitts derart gewählt wird, dass die Wahrscheinlichkeit einer richtigen Zuordnung gegenüber der 'ARD-Datenbank mindestens 70 %, vorzugsweise mindestens 80 % beträgt.
Verfahren gemäß einem beliebigen der vorhergehenden Ansprüche, wobei der Vergleich des Satzes von Leseeinheiten mit der zweiten Datenbank das Kartieren jeder der Leseeinheiten auf den pathogenen Markern der zweiten Datenbank umfasst, unabhängig von den übrigen Leseeinheiten des Satzes.
Verfahren gemäß einem beliebigen der vorhergehenden Ansprüche, wobei es sich bei der Sequenzierung um eine Sequenzierung mit gepaarten Enden handelt und wobei, wenn eine Leseeinheit einem Marker zugeordnet wird, auch eine Leseeinheit, welche komplementär zu dieser Leseeinheit ist, der Gesamtheit beigefügt wird.
Verfahren gemäß einem beliebigen der vorhergehenden Ansprüche, wobei im Falle eines erstellten Contigs, der ausschließlich Leseeinheiten umfasst, welche einem bekannten Marker zugeordnet wurden, festgestellt wird, dass dieser bekannte pathogene Marker Bestandteil des Genoms des bekannten Krankheitserregers ist, wenn: $D_{ARD} \in [\frac{1}{3} \times D_{path}; 3 \times D_{path}]$
wobei D_ARD ein Medianwert der Sequenzierungstiefe der Leseeinheiten ist, welche dem bekannten Marker zugeordnet wurden, und D_path ein Medianwert der Sequenzierungstiefe der Leseeinheiten ist, welche dem bekannten Krankheitserreger zugeordnet wurden, und vorzugweise > 1.
Verfahren gemäß einem beliebigen der vorhergehenden Ansprüche, wobei es weiterhin einen Schritt des Vergleichen der Contigs mit 16SrDNA-Sequenzen und/oder metaphlan2-Markern einer Datenbank umfasst, und wobei der bekannte Krankheitserreger auf Grundlage dieses Vergleichs bestätigt wird.
Verfahren gemäß einem beliebigen der vorhergehenden Ansprüche, wobei die Probe einem Menschen oder einem Tier abgenommen wird, und wobei die erste Datenbank auch Genome der Flora und von Wirten umfasst, und wobei Leseeinheiten, die Genomen der Flora und von Wirten zugeordnet wurden, herausgefiltert werden.
Verfahren gemäß einem beliebigen der vorhergehenden Ansprüche, wobei es sich bei der metagenomischen Probe um einer bronchoalveoläre Lavage-Probe, eine Urinprobe oder eine Blutprobe handelt.
Verfahren gemäß einem beliebigen der vorhergehenden Ansprüche, wobei es sich bei den pathogenen Markern um Marker der Antibiotikaresistenz oder um Virulenzmarker handelt.
Maschinenlesbares Medium, das Anweisungen zur Ausführung eines Verfahren speichert, welches von einem Computer durchgeführt wird, wobei das Verfahren Folgendes umfasst
- Vergleichen eines Satzes von Leseeinheiten, der erstellt wurde, indem DNA sequenziert wurde, die aus einer metagenomischen Probe extrahiert wurde, mit einer ersten Datenbank, die Genome bekannter Krankheitserreger umfasst, um Leseeinheiten des Satzes den bekannten Krankheitserregern zuzuordnen;

- Erstellen einer Gesamtheit von Leseeinheiten, die zumindest Leseeinheiten umfasst, welche einem Krankheitserreger unter den bekannten Krankheitserregern zugeordnet wurde, und Zusammenfügen der Leseeinheiten in der Gesamtheit, um mindestens eine zusammengefügte digitale Nukleinsäuresequenz oder "Contig" zu erstellen,

- Vergleichen der erstellten Contigs mit einer zweiten Datenbank von bekannten pathogenen genetischen Markern, um zu prüfen, ob die erstellten Contigs einen bekannten Marker enthalten,
dadurch gekennzeichnet,

- dass das Verfahren den Schritt des Vergleichens des Satzes von Leseeinheiten mit der zweiten Datenbank umfasst, um Leseeinheiten des Satzes den bekannten pathogenen Markern zuzuordnen,

- dass die Gesamtheit weiterhin die Leseeinheiten umfasst, welche den bekannten Markern zugeordnet wurden, wobei die Contigs auf diese Weise ausgehend von Leseeinheiten, welche dem bekannten Krankheitserreger zugeordnet wurden, und Leseeinheiten, welche den bekannten pathogenen Markern zugordnet wurden, zusammengefügt werden.
Maschinenlesbares Medium gemäß Anspruch 13, wobei es Anweisungen zur Ausführung eines Verfahrens gemäß einem beliebigen der Ansprüche 2 bis 12 speichert.