-
Technisches Gebiet
-
Die Erfindung betrifft die Anwendung eines Polymerase-Kettenreaktionsverfahrens (PCR-Verfahrens), insbesondere zur Detektion des Vorliegens eines Erregers. Weiterhin betrifft die vorliegende Erfindung die Auswertung von qPCR-Messungen.
-
Technischer Hintergrund
-
Zur Detektion von DNA-Strangabschnitten in einer zu untersuchenden Substanz, wie beispielsweise einem Serum oder dergleichen, werden in automatisierten Systemen PCR-Verfahren durchgeführt. Die PCR-Systeme ermöglichen es, bestimmte zu detektierende DNA-Strangabschnitte, die z.B. einem Erreger zuzuordnen sind, zu amplifizieren und zu detektieren. Ein PCR-Verfahren umfasst generell eine zyklische Anwendung der Schritte der Denaturierung, des Annealing und der Elongation. Insbesondere wird beim PCR-Prozess ein DNA-Doppelstrang in Einzelstränge aufgespalten und diese jeweils durch Anlagerung von Nukleotiden wieder vervollständigt, um die DNA-Strangabschnitte in jedem Zyklus zu vervielfältigen.
-
Das qPCR-Verfahren ermöglicht die Erregerlast, nachgewiesen mit diesem Prozess, zu quantifizieren. Dazu sind die Nukleotide zumindest teilweise mit Fluoreszenzmolekülen versehen, die bei Anbinden an den Einzelstrang des zu detektierenden DNA-Strangabschnitts eine Fluoreszenzeigenschaft aktivieren. Nach dem Aufbau der Doppelstränge kann nach jedem Zyklus ein Fluoreszenzwert ermittelt werden, der von der Anzahl der erzeugten DNA-Strangabschnitte abhängt.
-
Im Laufe der Amplifikation kann dann aus den ermittelten Fluoreszenzwerten eine qPCR-Kurve, ermittelt werden, die bei Vorliegen des zu detektierenden DNA-Strangabschnitts in der zu untersuchenden Substanz einen sigmoidförmigen Verlauf hat. Die gemessenen qPCR-Kurven können in der Realität mit Artefakten behaftet sein, so dass in der Regel mehrere parallele Messungen durchgeführt werden, um durch eine Mittelwertbildung der Messwerte eine genauere Auswertung der qPCR-Kurven zu ermöglichen.
-
Insbesondere ist es wünschenswert, frühzeitig während der Messung eine Aussage über den zeitlichen Verlauf der qPCR-Kurve zu erhalten, um den Zeitaufwand für die Auswertung zu reduzieren.
-
Offenbarung der Erfindung
-
Erfindungsgemäß sind ein Verfahren zum Durchführen eines qPCR-Verfahrens gemäß Anspruch 1 sowie eine Vorrichtung und ein qPCR-System gemäß den nebengeordneten Ansprüchen vorgesehen.
-
Weitere Ausgestaltungen sind in den abhängigen Ansprüchen angegeben.
-
Gemäß einem ersten Aspekt ist ein Verfahren zum Betreiben eines quantitativen Polymerase-Kettenreaktions (qPCR)-Verfahren vorgesehen, mit folgenden Schritten:
- - Zyklisches Ausführen von qPCR-Zyklen
- - Messen eines Intensitätswertes nach oder während jedem qPCR-Zyklus, um eine qPCR-Kurve aus Intensitätswerten zu erhalten;
- - Nach einer bestimmten Minimalanzahl von qPCR-Zyklen; Schätzen des weiteren Verlaufs des qPCR-Kurve mithilfe eines datenbasierten trainierbaren qPCR-Modells;
- - Betreiben des qPCR-Verfahrens abhängig von dem weiteren Verlauf der qPCR-Kurve.
-
Das qPCR-Verfahren weist eine zyklische Wiederholung der Schritte der Denaturierung, des Annealing und der Elongation auf. Bei der Denaturierung wird bei einer hohen Temperatur die gesamte doppelsträngige DNA in der zu untersuchenden Substanz in zwei Einzelstränge aufgespalten. In dem Schritt des Annealing wird an die Einzelstränge einer der zugegebenen Primer angebunden, die den Startpunkt der Amplifizierung der zu detektierenden DNA-Strangabschnitte vorgeben. Bei dem Schritt der Elongation wird ein zweiter komplementärer DNA-Strangabschnitt aus freien Nukleotiden auf den mit dem Primer versehenen Einzelsträngen aufgebaut. Nach jedem dieser Zyklen hat sich also idealerweise die DNA-Menge der zu detektierenden DNA-Strangabschnitte verdoppelt.
-
Durch die Anwendung des qPCR-Verfahrens werden in die zu detektierenden DNA-Strangabschnitte Fluoreszenzmoleküle als Marker eingebaut, so dass über eine Messung der Intensität der Fluoreszenz nach jedem Elongationsschritt ein zeitlicher Verlauf der Intensitätswerte ermittelt werden kann. Die so erhaltene qPCR-Kurve weist dabei drei distinkte Phasen auf, nämlich eine Baseline, in der die Intensität der Fluoreszenz des von eingebauten Markern emittierten Fluoreszenzlichts noch nicht von der Hintergrund-Fluoreszenz zu unterscheiden ist, einer exponentiellen Phase, in der die Fluoreszenzintensität über die Baseline ansteigt, also sichtbar wird, wobei durch die Verdoppelung der DNA-Stränge in jedem Zyklus das Fluoreszenzsignal proportional zur Menge der zu detektierenden DNA-Strangabschnitte exponentiell ansteigt, und einer Plateau-Phase, in der die Reagenzien, d. h. der Primer und die freien Nukleotide, nicht mehr in den benötigten Konzentrationen vorhanden sind und keine weitere Verdoppelung stattfindet.
-
Für den Nachweis eines vorgegebenen zu detektierenden DNA-Strangabschnitts, der beispielsweise einem Erreger entsprechen kann, ist hierbei der sogenannte ct (cycle threshold)-Wert maßgeblich. Der ct-Wert bestimmt den Beginn der exponentiellen Phase und wird durch Überschreiten eines spezifischen Grenzwerts, der für den jeweils zu detektierenden DNA-Strangabschnitt festgelegt ist und der für alle Proben für den zu detektierenden DNA-Strangabschnitt identisch ist, ermittelt oder rechnerisch durch die zweite Ableitung der qPCR-Kurve in der exponentiellen Phase ermittelt und dem Intensitätswert des steilsten Anstiegs der qPCR-Kurve entspricht. Ist der Zielwert bekannt, kann durch Rückrechnung die Anfangskonzentration des zu detektierenden DNA-Strangabschnitts in der zu untersuchenden Substanz bestimmt werden.
-
In der Realität sind die qPCR-Kurven sehr ungenau und erheblichen Schwankungen unterworfen. Es besteht einerseits eine Baseline-Drift, mit der das Ansteigen der Hintergrundfluoreszenz über die Messzyklen bezeichnet wird. Das heißt, dass, selbst wenn keine Amplifikation stattfindet, das Fluoreszenzsignal ansteigt. Weitere Einflussfaktoren, die sich negativ auf die Genauigkeit der qPCR-Kurve auswirken, können beispielsweise aus thermischem Rauschen, Schwankungen bzw. Zumesstoleranzen in der Reagenzkonzentration, Bläschen und Artefakten im Fluoreszenzvolumen resultieren.
-
In herkömmlichen qPCR-Systemen findet einerseits eine softwarebasierte Korrektur der qPCR-Kurven statt, andererseits kann vorgesehen sein, eine Probe unter gleichen Bedingungen mehrfach zu messen und die resultierenden qPCR-Kurven durch Mittelwertbildung zu glätten. Dies erfordert jedoch einen erhöhten Aufwand.
-
Eine Idee der Erfindung besteht darin, mithilfe eines datenbasierten PCR-Modells einen Verlauf der qPCR-Kurve bereits nach wenigen Messzyklen vorherzusagen. Der geschätzte vorhergesagte Gesamtverlauf der qPCR-Kurve kann nun für eine frühzeitige Diagnose verwendet werden. Einerseits ermöglicht die vorhergesagte qPCR-Kurve anzugeben, ob der zu detektierende DNA-Strangabschnitt in der zu untersuchenden Substanz vorkommt, und/oder den ct-Wert frühzeitig zu bestimmen, ohne das Messverfahren vollständig durchzuführen. Dies erlaubt es, das Messverfahren unter Umständen vorzeitig abzubrechen.
-
Es kann bekanntes Domänenwissen über qPCR-Kurvenverläufe bzw. deren Statistik verwendet werden, um das Training des datenbasierten PCR-Modells zu verbessern. Z.B. kann das Wissen genutzt werden, dass qPCR-Kurven nur monoton steigen können. Damit kann man z.B. einen weiteren Loss-Term für das Training des Vorhersagenetzes verwenden, der eine Verletzung der Monotonie bestraft, wie z.B. Loss = - ReLU(Ipred(t) - Ipred(t + 1)) mit Ipred dem prädizierten Intensitätswert. Weiterhin kann das Vorwissen berücksichtigt werden, dass qPCR-Kurven mit einem niedrigen Wert starten. Damit kann man z.B. einen weiteren Loss-Term für das Training verwenden, der hohe Werte zu Beginn bestraft, z.B. Loss = - Ipred(t) / t^2.
-
Weiterhin kann das datenbasierte trainierbare qPCR-Modell ein neuronales Netz aufweisen, um mithilfe einer Anzahl von insbesondere aufeinanderfolgenden Intensitätswerten einen oder mehrere darauffolgende Intensitätswerte zu schätzen.
-
Insbesondere kann zur Ermittlung der vollständigen qPCR-Kurve das datenbasierte trainierbare qPCR-Modell rekursiv mithilfe von gemessenen und/oder geschätzten Intensitätswerten verwendet werden.
-
Es kann vorgesehen sein, dass das neuronale Netz ein tiefes neuronales Netz oder ein rekurrentes neuronales Netz, insbesondere ein LSTM, umfasst.
-
Das datenbasierte PCR-Modell kann beispielsweise ein tiefes neuronales Netz oder ein rekurrentes neuronales Netz sein, das mit einer Anzahl der zuletzt erfassten Intensitätswerte als Eingangsgrößen einen oder mehrere zu erwartende Intensitätswerte ermittelt. Das PCR-Modell kann mehrfach iterativ verwendet werden, um mit vorhergesagten Intensitätswerten als Eingangsgrößen weitere Intensitätswerte von weiter in der Zukunft liegenden Messzyklen zu bestimmen und so basierend auf anfänglich ermittelten Intensitätswerten die gesamte qPCR-Kurve zu prädizieren. Mit anderen Worten, es können die bei einer vorherigen Iteration geschätzten Intensitätswerte als Eingangsgrößen für eine Berechnung nachfolgender Intensitätswerte verwendet werden.
-
Bei Verwendung eines rekurrenten neuronalen Netzes wird eine Zeitreihe von gemessenen Intensitätswerten dem neuronalen Netz sukzessive zugeführt und jeweils ein interner Zustand zu einer Zeitreihe ermittelt. Dieser interne Zustand wird gemeinsam mit einem oder mehreren nächsten Intensitätswerten, dem neuronalen Netz rekurrent zugeführt, um einen oder mehrere vorhergesagte Intensitätswerte zu ermitteln. Durch rekurrente Anwendung des Verfahrens kann die gesamte qPCR-Kurve vorhergesagt werden.
-
Gemäß einer Ausführungsform kann das qPCR-Verfahren betrieben werden, indem aus dem geschätzten Verlauf der qPCR-Kurve ein ct-Wert ermittelt wird,
- - wobei signalisiert wird, wenn ein ct-Wert ermittelbar ist,
- - wobei der ct-Wert signalisiert wird,
- - wobei das zyklische Ausführen von qPCR-Zyklen abgebrochen wird, wenn ein ct-Wert ermittelt worden ist.
-
Durch Auswertung der so ermittelten Intensitätswerte der qPCR-Kurve kann ein ct-Wert bestimmt werden (ct: Cycle Threshold), der den Beginn der exponentiellen Phase markiert und der auf die Anfangskonzentration des zu detektierenden DNA-Strangabschnitts zurückgerechnet werden kann. Der ct-Wert gibt denjenigen Zyklus der Analyse an, bei dem die exponentielle Phase beginnt. Dieser Wert wird entweder durch Überschreiten eines spezifischen Grenzwerts, der für den jeweiligen zu detektierenden DNA-Strangabschnitts festgelegt ist, ermittelt oder rechnerisch durch die zweite Ableitung der exponentiellen Phase, die den steilsten Anstieg der Kurve signalisiert.
-
Das datenbasierte PCR-Modell vermeidet mögliche fehlerhafte oder ungenaue Grundannahmen über die zugrundeliegenden typischen PCR-Kurvenverläufe und bildet auch unbekannte Zusammenhänge und Dynamiken ab. Zudem ermöglicht die Vorhersage der qPCR-Kurven eine frühzeitige Diagnose, noch bevor der gesamte PCR-Kurvenverlauf gemessen ist.
-
Das Training der datenbasierten PCR-Modelle kann basierend auf unbearbeiteten Verläufen von Intensitätswerten verschiedener PCR-Messungen vorgenommen werden, ohne dass eine manuelle Bewertung der Verläufe der Intensitätswerte vorgenommen werden muss. Dies ermöglicht ein schnelles und einfaches Training des PCR-Modells auf Grundlage einfacher und vollständiger Messungen von PCR-Kurven.
-
Der während einer Messung geschätzte PCR-Funktionsverlauf kann dazu verwendet werden, das Messverfahren vorzeitig abzubrechen, wenn ein ct-Wert durch das Verfahren vorhergesagt wird oder wenn bis zu einem bestimmten Zyklus der ct-Wert nicht feststellbar war.
-
Insbesondere kann zudem eine statistische Verteilung über die Unsicherheit der Vorhersage des nächsten Intensitätswerts ermittelt werden. Eine Vorhersage mit einer hohen oder geringen Unsicherheit kann dazu verwendet werden, um eine frühzeitige Angabe über das Vorliegen oder Nicht-Vorliegen des zu detektierenden DNA-Strangabschnitts abzugeben oder festzustellen, weitere Messpunkte aufzunehmen. Somit kann beispielsweise das Messverfahren abgebrochen werden, wenn der vorhergesagte PCR-Kurvenverlauf einen ct- Wert bestimmt, der eine Unsicherheit an dem bestimmten ct-Wert aufweist, der unterhalb einer vorgegebenen Unsicherheitsschwelle liegt.
-
Es kann vorgesehen sein, dass die bestimmte Minimalanzahl von qPCR-Zyklen zwischen 5 und 15 vorgegeben ist.
-
Weiterhin kann für die geschätzten Intensitätswerte jeweils ein Unsicherheitsmaß bestimmt werden, der ein Maß für die Zuverlässigkeit der Vorhersage des geschätzten Intensitätswerts angibt, wobei der Unsicherheitswert von dem neuronalen Netz oder von einem Unsicherheits-Modell bereitgestellt wird.
-
Das Unsicherheits-Modell kann auf einen Unterschied zwischen vom Modell vorhergesagten Intensitätswerten und tatsächlich erhaltenen Intensitätswerten trainiert werden. Je weiter das Training des qPCR-Modells fortgeschritten ist, desto kleiner werden die Unsicherheiten bei der Vorhersage von neuen Intensitätswerten. D.h. die Unsicherheit bei der Vorhersage ergibt sich aus der Treffsicherheit z.B. bei den unmittelbar vorangehenden Intensitätswerten. Wenn die Treffsicherheit bei zuvor bestimmten Intensitätswerten ausreichend groß und die Unsicherheit ausreichend gering geworden ist, kann den Voraussagen des qPCR-Modells vertraut werden.
-
Zudem kann z.B. ein Unsicherheitswert als sogenannte „aleatoric uncertainty“ geschätzt werden, wie z.B. aus A. Kendall et al. , „What Uncertainties Do We Need in Bayesian DeepLearning for Computer Vision?“, https://arxiv.org/abs/1703.04977 bekannt ist.
-
Das qPCR-Verfahren kann betrieben werden, indem aus dem geschätzten Verlauf der qPCR-Kurve ein ct-Wert ermittelt wird, wobei das zyklische Ausführen von qPCR-Zyklen abgebrochen wird, wenn ein ct-Wert basierend auf einer qPCR-Kurve bestimmt ist, die für den ct-Wert ein Unsicherheitsmaß unter einem vorgegeben Unsicherheitsschwellenwert aufweist.
-
Gemäß einer Ausführungsform kann das datenbasierte qPCR-Modell mit vollständig vermessenen qPCR-Kurven trainiert werden, wobei zum Training des qPCR-Modells ein Fehler einer Modellvorhersage und der entsprechende tatsächlich gemessene Intensitätswert verwendet wird.
-
Gemäß einer Ausführungsform kann das datenbasierte qPCR-Modell mit vollständig vermessenen qPCR-Kurven trainiert werden, wobei zum Training des qPCR-Modells eine qPCR-Kurve mithilfe des qPCR-Modells geschätzt wird und ein Fehlers aus einem tatsächlich gemessenem Kurvenverlauf und einem geschätzten Kurvenverlauf zum Trainieren der Parameter des datenbasierten qPCR-Modells für das Trainieren des qPCR-Modells verwendet wird.
-
Es kann vorgesehen sein, dass der Fehler abhängig von einer vorgegebenen Reaktionseffizienz bestimmt wird.
-
Figurenliste
-
Ausführungsformen werden nachfolgend anhand der beigefügten Zeichnungen näher erläutert. Es zeigen:
- 1 eine schematische Darstellung eines Zyklus eines PCR-Verfahrens;
- 2 eine schematische Darstellung einer typischen qPCR-Kurve mit einem Intensitätswerteverlauf;
- 3 ein gemessener Verlauf einer qPCR-Kurve;
- 4a und 4b ideale Verläufe der qPCR-Kurve für den Fall einer nicht nachweisbaren Substanz bzw. einer nachweisbaren Substanz; und
- 5 ein Flussdiagramm zur Veranschaulichung eines Verfahrens zum Betreiben einer QPCR-Messung.
-
Beschreibung von Ausführungsformen
-
1 zeigt eine schematische Darstellung eines an sich bekannten PCR-Verfahrens mit den Schritten der Denaturierung des Annealing und der Elongation.
-
In dem Schritt des Annealing S1 wird bei einer hohen Temperatur von beispielsweise über 90°C die doppelsträngige DNA in einer Substanz in zwei Einzelstränge aufgebrochen. In einem nachfolgenden Annealing-Schritt S2 wird an die Einzelstränge an einer bestimmten DNA-Position, die einen Beginn eines zu detektierenden DNA-Strangabschnitts markiert, ein sogenannter Primer angebunden. Dieser Primer stellt den Startpunkt einer Amplifizierung des DNA-Strangabschnitts dar. In einem Elongationsschritt S3 wird beginnend an der von dem Primer markierten Position aus der Substanz zugesetzten freien Nukleotiden der komplementäre DNA- Strangabschnitts an den Einzelsträngen aufgebaut, so dass am Ende des Elongationsschrittes die zuvor aufgespaltenen Einzelstränge zu vollständigen Doppelsträngen ergänzt worden sind.
-
Durch Versehen der freien Nukleotide bzw. des Primers mit Fluoreszenzmolekülen, die nur in dem an den DNA-Strangabschnitt gebundenen Zustand Fluoreszenzeigenschaften aufweisen, ist es möglich, durch Ermitteln einer Intensität einer Fluoreszenz im Anschluss an den Elongationsschritt S3 einen Intensitätswert durch eine geeignete Messung zu erhalten. Der gemessenen Intensität des Fluoreszenzlichts wird ein Intensitätswert zugeordnet.
-
Das Verfahren der Schritte S1 bis S3 wird zyklisch ausgeführt und die Intensitätswerte aufgezeichnet, um einen Intensitätswerteverlauf als eine qPCR-Kurve zu erhalten.
-
Der Intensitätswerteverlauf hat im Idealfall einen Verlauf, der in 2 dargestellt ist. 2 zeigt einen Verlauf einer normalisierten Intensität über dem Zyklusindex Z. Dieser Verlauf unterteilt sich in drei Abschnitte, nämlich einen Baseline-Abschnitt B, in dem die Fluoreszenz der eingebauten Fluoreszenzmoleküle noch nicht von einer Hintergrundfluoreszenz zu unterscheiden ist, einen exponentiellen Abschnitt E, in dem die Intensitätswerte sichtbar sind und exponentiell ansteigen, und in einem Plateau-Abschnitt P, in dem sich der Anstieg der Intensitätswerte abflacht, da die verwendeten Reagenzien (Lösung mit Nukleotiden) aufgebraucht sind und keine weitere Anbindung an aufgebrochenen Einzelsträngen stattfindet.
-
In 3 ist beispielhaft ein bei einer realen Messung erhaltener Verlauf der Intensitätswerte als qPCR-Kurve dargestellt. Man erkennt starke Schwankungen, die sich aus einer Hintergrundfluoreszenz, thermisches Rauschen, Schwankungen in den Reagenzkonzentrationen sowie Bläschen und Artefakte im Fluoreszenzvolumen ergeben können. Man erkennt, dass die Bestimmung des Baseline-Abschnitts, des exponentiellen Abschnitts und des Plateau-Abschnitts der qPCR-Kurve nicht ohne weiteres möglich ist.
-
4a und 4b zeigen ideale Verläufe einer qPCR-Kurve ohne Vorliegen eines nachzuweisenden DNA-Strangabschnitts bzw. mit Vorliegen eines nachzuweisenden DNA-Strangabschnitts.
-
In 5 ist ein Flussdiagramm zur Veranschaulichung eines Verfahrens zum Betreiben eines qPCR-Messverfahrens dargestellt. Das Verfahren kann auf einer Datenverarbeitungseinrichtung ausgeführt werden, die einen qPCR-Prozess auf einem qPCR-System steuert und die von einem qPCR-System mit jedem Zyklus einen Intensitätswert, der die Intensität einer Fluoreszenz einer während der qPCR gebildeten Substanz angibt, bereitstellt. In der Datenverarbeitungseinrichtung kann das nachfolgend beschriebene Verfahren in Software und/oder Hardware implementiert sein.
-
In Schritt S11 wird ein Intensitätswert des zuletzt ausgeführten Zyklus einer qPCR-Messung empfangen.
-
In Schritt S12 wird überprüft, ob eine für eine Bestimmung eines geschätzten Verlaufs der qPCR-Kurve notwendige Anzahl von Intensitätswerten vorliegt. Beispielsweise kann die notwendige Anzahl von Intensitätswerten drei, vier oder mehr als vier betragen. Wird festgestellt, dass eine ausreichende Anzahl von Intensitätswerten vorliegt (Alternative: Ja), so wird das Verfahren mit Schritt S13 fortgesetzt, anderenfalls (Alternative: Nein) wird zu Schritt S11 zurückgesprungen.
-
In Schritt S13 wird aus den gemessenen Intensitätswerten der Verlauf der qPCR-Kurve ermittelt. Dazu wird der bisher erfasste Verlauf der Intensitätswerte bzw. eine vorgegebene Anzahl zurückliegender Intensitätswerte einem qPCR-Modell zugeführt, mit dem der weitere Verlauf der qPCR-Kurve geschätzt werden kann. Das qPCR-Modells kann beispielsweise als ein tiefes neuronales Netz ausgebildet sein. Dem tiefen neuronalen Netz werden als Eingangsgrößen die aufeinanderfolgenden, zurückliegenden Intensitätswerte zugeführt, so dass ein oder mehrere unmittelbar darauf folgende geschätzte Intensitätswerte bestimmt werden.
-
Das tiefe neuronale Netz ist so trainiert, dass basierend auf den Eingangsgrößen, die die aufeinanderfolgenden Intensitätswerte angeben, ein oder mehrere nachfolgende Intensitätswerte geschätzt werden. Dieser geschätzte Intensitätswert kann der Reihe der Intensitätswerte hinzugefügt werden und das qPCR-Modell anschließend erneut verwendet werden, um einen oder mehrere nächste Intensitätswerte zu ermitteln, und zwar basierend auf der Anzahl der letzten Zeitschritte der gemessenen und/oder geschätzten Intensitätswerte. Somit kann bis zu einer vorgegebenen Maximalanzahl von üblicherweise etwa 50 Zyklen ausgehend von einer Anzahl von gemessenen Intensitätswerten weitere Intensitätswerte mithilfe des qPCR-Modells geschätzt werden. Man erhält einen geschätzten Verlauf einer qPCR-Kurve.
-
Für jeden der geschätzten Intensitätswerte kann zudem ein Unsicherheitswert ermittelt werden. Dieser Unsicherheitswert kann aus dem verwendeten tiefen neuronalen Netz des qPCR-Modells direkt ermittelt werden oder mithilfe eines weiteren Unsicherheitsmodells für jeden der Schätzwerte ermittelt werden.
-
In Schritt S14 wird für jeden der Intensitätswerte der qPCR-Kurve überprüft, ob der jeweilige Intensitätswert mit einer vorgegebenen Sicherheit einen vorgegebenen Schwellenwert überschreitet. Die Zykluszahl, bei dem diese Überschreitung erstmalig auftritt, wird ct-Wert genannt und stellt den Zyklus dar, zu dem die sichtbare exponentielle Phase beginnt. Die Existenz eines ct-Werts gibt an, dass der zu detektierende DNA-Strangabschnitt in der vermessenen Substanz vorliegt. Die Höhe des ct-Werts ermöglicht es, eine Konzentration des zu detektierenden DNA- Strangabschnitts in der Substanz anzugeben. Wird in Schritt S14 festgestellt, dass ein ct- Wert vorliegt, so kann in Schritt S15 dieser ct-Wert signalisiert werden und das qPCR-Verfahren abgebrochen werden. Andernfalls kann das Verfahren mit Schritt S16 fortgesetzt werden.
-
In Schritt S16 wird überprüft, ob eine vorgegebene Maximalanzahl von Messzyklen durchgeführt wurde. Ist dies der Fall (Alternative: Ja), wird das Verfahren mit Schritt S17 beendet und das Nicht-Vorliegen eines ct-Werts signalisiert. Andernfalls (Alternative: Nein) wird zu Schritt S11 zurückgesprungen.
-
Das qPCR-Modell kann beispielsweise ein tiefes neuronales Netz beinhalten, in dem die vorbestimmte Anzahl der zuletzt gemessenen Intensitätswerte vorgegeben werden, um den nachfolgenden Intensitätswert zu ermitteln.
-
Entsprechend kann auch ein rekurrentes neuronales Netz vorgegeben werden, das eine Reihe von Intensitätswerten auf einen nachfolgenden Intensitätswert abbildet, wobei jeder Intensitätswert zu einem internen Zustand führt. Bei Verwendung eines rekurrenten neuronalen Netzes als qPCR-Modell kann dieses als LSTM-(Long Short-Term Memory-) Architektur verwendet werden. Diese LSTM-Architektur ist besonders vorteilhaft, um dem qPCR-Modell gezielte Manipulationen des internen Zustands zu ermöglichen. Weiterhin kann als das rekurrente neuronale Netzwerk ein GRU verwendet werden.
-
Vorzugsweise kann die Netzwerkarchitektur sogenannte zeitliche Konvolutionsschichten enthalten. Dabei werden nun Gewichte über die zeitliche Dimension zwischen linearen Filtern geteilt, was zu einer Reduktion der notwendigen Netzwerkparameter des verwendeten qPCR-Modells führt. Konvolutionen über Eingangsdimensionen sind insbesondere vorteilhaft, wenn das Eingangssignal über diese Dimension eine Korrelation aufweist, wie dies z. B. bei Pixeln eines Bildes und auch bei Messwerten einer Zeitreihe der Fall ist. Insbesondere kann das neuronale Netz des qPCR-Modells aus mehreren aufeinander aufbauenden Schichten von zeitlichen Konvolutionsschichten aufweisen, um Zusammenhänge über weite Bereiche der Intensitätswerte repräsentieren zu können.
-
Als zusätzliche Eingangsgröße für das qPCR-Modell kann der momentane Zeitpunkt (Zyklusindex) innerhalb der qPCR-Kurve vorgegeben werden.
-
Das qPCR-Modell kann aus vollständig gemessenen qPCR-Kurvenverläufen trainiert werden.
-
Zum Training des qPCR-Modells kann ein Fehler eines einzelnen Vorhersageschritts, d. h. die Abbildung der Mindestanzahl der als Letztes gemessenen Intensitätswerte auf den entsprechend nächsten Intensitätswert verwendet werden
-
Alternativ kann der Fehler bei der Vorhersage der gesamten qPCR-Kurve verwendet werden. Das Training kann dabei so erfolgen, dass zunächst nur anhand der Mindestanzahl von Intensitätswerten Gesamtkurvenverläufe der qPCR-Kurve durch das zunächst zufällig initialisierte QPCR-Modell vorhergesagt werden. Anhand des Fehlers aus tatsächlich gemessenem Kurvenverlauf und vorhergesagtem Kurvenverlauf kann ein Gradientensignal für die Parameter des datengetriebenen Verfahrens ermittelt und zur Optimierung z. B. mithilfe eines stochastischen Gradientenabstiegsverfahrens verwendet werden. Der Fehler kann der Summe der Einzelfehler der Intensitätswerte entsprechen bzw. der Summe der quadrierten Einzelfehler der Intensitätswerte entsprechen.
-
Insbesondere kann beim Training eine Reaktionseffizienz R berücksichtigt werden, so dass diese bei der Vorhersage eines nächsten Intensitätswertes berücksichtigt werden kann, dass die Reaktionseffizienz stets kleiner ist I(t+1)/I(t) < 2R. Dieses Systemwissen kann direkt zur Formulierung des Fehlers L für das Training des qPCR-Modells formuliert werden, z. B. L(p) = L((I(t+1)(p) / I(t)) - 2R), wobei ReLU die Rectified-Linear-Unit-Aktivierungsfunktion darstellt und p die Parameter des qPCR-Modells.