DE102008054345B4 - Verfahren und Vorrichtung zur Detektion von Kampfstoffen - Google Patents

Verfahren und Vorrichtung zur Detektion von Kampfstoffen Download PDF

Info

Publication number
DE102008054345B4
DE102008054345B4 DE102008054345A DE102008054345A DE102008054345B4 DE 102008054345 B4 DE102008054345 B4 DE 102008054345B4 DE 102008054345 A DE102008054345 A DE 102008054345A DE 102008054345 A DE102008054345 A DE 102008054345A DE 102008054345 B4 DE102008054345 B4 DE 102008054345B4
Authority
DE
Germany
Prior art keywords
substances
data
space
training
units
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE102008054345A
Other languages
English (en)
Other versions
DE102008054345A1 (de
Inventor
Patentinhaber gleich
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to DE102008054345A priority Critical patent/DE102008054345B4/de
Publication of DE102008054345A1 publication Critical patent/DE102008054345A1/de
Application granted granted Critical
Publication of DE102008054345B4 publication Critical patent/DE102008054345B4/de
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/02Mechanical
    • G01N2201/022Casings
    • G01N2201/0221Portable; cableless; compact; hand-held

Abstract

Verfahren zur Detektion biologischer Kampfstoffe und anderer Substanzen mittels ständig oder temporär mit einer zentralen Einheit in Verbindung stehender transportabler Einheiten, wobei das Verfahren aus den Schritten a) Messung charakteristischer Merkmale und der Konzentration der Substanzen mit einer Messeinheit und Bereitstellung der Messergebnisse in Form parametrisierter Kurven, b) Training der zentralen Einheit mit den vorliegenden Messdaten, die verschiedene zu detektierende Klassen von Substanzen repräsentieren, c) Erstellung eines Modells dieser Substanzen, d) Übertragung des Modells in die transportablen Einheiten, e) Erfassung und Verarbeitung neuer Messdaten in den transportablen Einheiten, so dass diese neuen Daten den trainierten Klassen der zu detektierenden Substanzen visuell und graduell zugeordnet werden können, f) Sammlung neuer Messdaten in den transportablen Einheiten und Übertragung zur zentralen Einheit zum Zwecke späterer Verarbeitungen sowie g) Anpassung des Modells mit neu vorliegenden Daten und anschließende Übertragung in die transportablen Einheiten besteht.

Description

  • Die Erfindung betrifft ein Verfahren zur Detektion biologischer Kampfstoffe und anderer Substanzen. Weiterhin umfasst die Erfindung eine lernfähige, als zentrale Einheit ausgeprägte Vorrichtung, die mit multiplen transportablen Einheiten temporär in Verbindung steht.
  • Zur Detektion solcher Substanzen werden mit einem geeigneten Messverfahren zunächst parametrisierte Kurven (z. B. Spektren) für jeweils einen Messvorgang erstellt. Pro Substanz wird eine bestimmte Anzahl von die zu detektierenden Klassen repräsentierenden Messkurven als Trainingsdaten erstellt und einer Trainingseinheit zugeführt, die daraus ein Modell ermittelt, das dazu dient, die Detektion durchzuführen und festzustellen, ob neue Messdaten im Bereich einer vorher trainierten Klasse liegen.
  • Dieses Modell wird dann mittels einer Datenübertragung von einer als zentrale Einheit agierenden Trainingseinheit in multiple transportable Einheiten, die Arbeitseinheiten, transferiert, wonach diese in der Lage sind, die trainierten Substanzen zu detektieren. Eine solche Organisation führt zu hoher Einsatzeffizienz und stützt die Vorstellung einer zweckgebundenen, zentral verwalteten und feldtauglichen Einsatzstruktur.
  • Für den Nachweis bakterieller Kampfstoffe wurden in den letzten Jahren mehrere Laborverfahren bekannt und neben den traditionell eingesetzten Methoden, wie z. B. PCR und Massenspektrometrie, praktisch angewendet. Solche Detektionssysteme sind laborgebunden und deshalb für den mobilen Einsatz unbrauchbar. Das Verkleinerungspotenzial zur Datenerfassung geeigneter Messverfahren, wie z. B. der NIR- und der Raman-Spektroskopie, ermöglicht den Bau kleiner multipler Einheiten (Arbeitseinheiten) für den Feldeinsatz.
  • In der Messeinheit ME (2 und 3) können verschiedene Messverfahren zum Einsatz kommen:
    Massenspektrometer in allen Formen, bei denen Spektren ähnlich den Raman-Spektren generiert werden können [1]. Massenspektrometer weisen jedoch höhere Fehlertoleranzen als Ramanspektrometer auf.
  • Biosensoren, die mit Minichips realisiert sind und auf denen meist Spannungspotenziale oder Chemolumineszenzen gemessen werden [2]. Diese Sensoren reagieren sehr spezifisch und die Minichips sind in der Lage, stofftypische parametrisierte Kurven zu erzeugen.
  • Lab-on-a-chip-Konzept, bei dem alle labortypischen Komponenten (Probenaufbereitung, Messung usw.) möglichst auf einem Chip integriert sind und somit mir geringe Stoffmengen genutzt werden [3]. Solche Vorrichtungen können vielfältig ausgelegt sein, wie z. B. als klassische Biosensoren, als molekularbiologische Techniken (Real-time-PCR), als immunologische Methoden (ELISA) oder auch als Probenaufarbeitungen, wie z. B. das Isolieren von DNS aus Bakterien, Zellen usw. Sie sind in der Lage, stofftypische parametrisierte Kurven zu erzeugen.
  • Die gleiche Fähigkeit haben auch andere spektroskopische Verfahren, die zur Zeit noch Gegenstand der Forschung sind, wie z. B. das LIBS-System (Laser-induced-breakdown Spektroskopie) oder die Terahertzspektroskopie zur Personenüberwachung oder auch zur Detektion biologischer Kampfstoffe.
  • Allgemein und besonders bei den genannten Verfahren besteht das Problem, charakteristische Information aus der Gesamtheit der Daten herauszufiltern und aufzubereiten, um die typischen Stoffinformationen dann in Verbindung mit den zu ihrer Gewinnung eingesetzten Messverfahren in einer Datenbank zur Verfügung zu stellen. Dazu wird aufgrund der Datenfülle, die Milliarden von Mikroorganismen liefern, eine Methode benötigt, die aus den jeweiligen Messdaten zur Klassifizierung ausreichende Information herausarbeitet, um die Charakteristika der Stoffe zu erhalten. Beim erfindungsgemäßen Verfahren werden diese Charakteristika mit einer Wavelet-Transformation in Verbindung mit einem bestimmten Diskriminanzverfahren ermittelt, das als die Stoffcharakteristika beschreibende Koeffizienten nur Werte verwendet, die einen bestimmten Schwellenwert überschreiten. Da die Wavelet-Transformation mittelwertbildende Eigenschaften hat, genügen wenige Koeffizienten, um einen Stoff für Klassifizierungen ausreichend zu charakterisieren. Zur Speicherung der Charakteristika in einer Datenbank sind Art des Verfahrens, Kalibrierinformationen und ermittelte Wavelet-Koeffizienten als Daten erforderlich. Diese Voraussetzungen sind beim erfindungsgemäßen Verfahren gegeben. Bei der Anwendung des unten vorgestellten Ausführungsbeispiels kann somit die Messeinheit ME für verschiedene Einsatzfälle mit verschiedenen Messverfahren ausgerüstet werden, um eine optimale Ausstattung der Detektionseinheiten zu ermöglichen.
  • Abkürzungen:
    • X-Raum:
      Eingangsraum
      Y-Raum:
      Einbettungsraum
      Z-Raum:
      Merkmalsraum
      D:
      Dimension des X-Raums
      WT:
      Wavelet-Transformation
      NN:
      Nächste Nachbarpunkte
      K:
      Anzahl der NN
      TP, Xi:
      Trainingspunkt
      NOP:
      Nachbarschaftserhaltende Orthogonale Projektion
      MF:
      Mannigfaltigkeit
      KNN:
      Künstliches Neuronales Netz
      WK:
      Wavelet-Koeffizient
      d:
      Dimension des Y-Raums, Z-Raums
      N:
      Anzahl der TP
      Waj, Wij:
      Rekonstruktionsgewichte
      η →j):
      Distanzen zu den NN
      AP, Xa:
      Anfragepunkt
      ROC:
      Receiver operating characteristics
  • Um aus den der Trainingseinheit präsentierten Messdaten effizient und präzise ein robustes und redundanzfreies Modell bilden zu können, wird eine Wavelet-Transformation (WT) in Verbindung mit einem zweistufigen adaptiven Verfahren angewendet.
  • Die WT hat mittelnde Eigenschaften, erlaubt es, unwesentliche Komponenten zu vernachlässigen (Verhinderung des Übertrainierens), verändert die Struktur der Daten nicht (euklidische Distanz) und überführt die Messdaten in eine Koeffizientendarstellung. Diese Koeffizienten bilden den Eingangsvektor x → der Dimension D im Eingangsraum X (2). Jeder Eingangsvektor repräsentiert einen Messwert. Alle Vektoren bilden die Menge der Trainingspunkte (TP) der Anzahl N.
  • Die erste Stufe des nachfolgend angewendeten adaptiven Verfahrens besteht aus einer Dimensionsreduktion (DR): sie bettet die aus TP bestehende Trainingsmenge in einem niedrigdimensionalen Raum Y der Dimension d ein (2). Diese Stufe ist als unüberwacht trainierbares Künstliches Neuronales Netz (KNN) mit globalem Optimum auffassbar, bestehend aus D × N Neuronen auf der Eingangsseite (X-Raum) und d × N Neuronen auf der Ausgangsseite (Y-Raum). Jedes Ausgangsneuron ist über K Wichtungen mit K Neuronen auf der Eingangsseite so verbunden, dass die Nächste-Nachbar-Beziehungen der Trainingspunkte erhalten bleiben.
  • Aus der Literatur sind verschiedene Verfahren zur Dimensionsreduktion bekannt, die strecken- und winkeltreu sind und nach dem Prinzip der nachbarschaftserhaltenden Abbildung arbeiten [4, 5, 6, 7, 8, 9, 10, 11, 12]. Aus diesen Verfahren wurde ein geeignetes ausgewählt und um die für die vorliegende Aufgabe speziellen Erfordernisse erweitert, und zwar die nachbarschaftserhaltende orthogonale Projektion (NOP-Verfahren).
  • Um spektrale Methoden, zu denen die Dimensionsreduktion zählt, numerisch stabil anwenden zu können, müssen die Daten im X-Raum glatt, gut abgetastet sein und dürfen keine Lücken aufweisen. Eine zusammenhängende Mannigfaltigkeit (MF) mit limitierter Krümmung ist dazu Voraussetzung. Ausreißer in den Eingangsdaten müssen entfernt werden, um ein Modell zur redundanzfreien Repräsentation der intrinsischen Charakteristik der MF im X-Raum erstellen zu können. Ein weiterer wesentlicher Beitrag der Datenvorverarbeitung ist die Lösung der bekannten Probleme mit Lücken und Sprüngen in der MF, die sich im X-Raum befindet.
  • Diese Lücken und Sprünge werden erfindungsgemäß mit Hilfe eines speziell entwickelten Interpolationsverfahrens, der Füllwertmethode, eliminiert. Dazu wird im Modul DVT überprüft, ob Punktwerte in einer nach euklidischer Distanz geordneten Liste der Trainingspunkte (Liste der TPi) in einzelnen Dimensionen bei aufeinander folgenden Punkten einen Gradienten aufweisen. der ein vordefiniertes Maß überschreitet. In solchen Fällen werden mittels der Füllwertmethode solange Zwischenwerte eingefügt, bis das vordefinierte Maß unterschritten wird, um im X-Raum eine MF zu erhalten, die den Glattheitsanforderungen der später folgenden Dimensionreduktion genügt.
  • Die zweite Stufe des adaptiven Verfahrens besteht aus Skalierung und Anpassung (SA) der im Y-Raum eingebetteten Daten auf die Daten im Z-Raum und ermöglicht die visuelle und graduelle Darstellung trainierter Messdaten (Trainingsphase) in diesem auch als Merkmalsraum bezeichneten Z-Raum (4) bzw. die Einordnung neuer Messdaten bei der Klassifizierung (Arbeitsphase) mit den Arbeitseinheiten. Diese Stufe ist als überwacht trainierbares KNN auffassbar, bestehend aus d × N Neuronen auf der Eingangsseite (Y-Raum) und d × N Neuronen auf der Ausgangsseite (Z-Raum), die über eine Wichtung miteinander verbunden sind (5).
  • Nach dem Trainingsvorgang (Trainingsphase) wird das Modell an die Detektionseinheiten (Arbeitseinheiten) übertragen, die dann in die Lage versetzt sind, die eintrainierten Charakteristiken der als Trainingsmenge zugrunde liegenden Substanzen mit hoher Wahrscheinlichkeit zu erkennen. Die Struktur dieser Arbeitseinheiten ist in Form von Modulen in 3 aufgezeigt. Die gemessenen Substanzen können z. B. nach dem Zugehörigkeitsgrad eingeordnet werden, um die Stoffe visuell und graduell den trainierten Gruppen/Klassen zuordnen zu können (4). Eine einfachere Anzeige, oh ein neuer Messwert zu einer der trainierten Klassen angehört, kann z. B. mit Farben realisiert werden: rot für der Fall der Zuordnung, gelb bei Überschreitung eines gewissen Zuordnungsgrades und grün bei keiner Zuordnung.
  • Aufgabenstellung
  • Der Erfindung liegt die Aufgabe zugrunde, gefährliche Substanzen, wie z. B. biologische Kampfstoffe, mit transportablen Einheiten zu detektieren, entsprechende Meldungen bzw. Alarme in Echtzeit zu erzeugen, diese zu registrieren und in Form von Signalen für eine Weiterverarbeitung zur Verfügung zu stellen.
  • Die Aufgabe wird erfingungsgemäß durch ein Verfahren zur Messung und Verarbeitung im Detektionsbereich befindlicher Messproben mit folgenden Verarbeitungsschritten gelöst:
    • a) Training der zentralen Einheit mit den vorliegenden Messdaten, die verschiedene zu detektierende Substanzen repräsentieren,
    • b) Erstellung eines Modells dieser Substanzen,
    • c) Übertragung des Modells in die transportablen Einheiten,
    • d) Erfassung und Verarbeitung neuer Messdaten in den transportablen Einheiten, so dass diese neuen Daten den trainierten Klassen visuell und graduell zugeordnet werden können.
  • Weiterhin betrifft die Erfindung eine diesbezügliche Vorrichtung, die in Echtzeit leicht einsetzbar ist und dessen zentrale Einheit (Trainingseinheit)
    • e) das gebildete Modell mittels einer Datenübertragung in die transportablen Einheiten (Arbeitseinheiten) transferiert und
    • f) neue, von als gefährlich einzustufenden Stoffen stammende und mit einer Arbeitseinheit erfasste Messdaten zu beurteilen, gegebenenfalls in das Detektionsmodell mit einzubeziehen und anschließend in die Arbeitseinheiten zu transferieren.
  • Vorteilhafte Ausbildungen der Erfindung ergeben sich aus den abhängigen Ansprüchen.
  • Es erweist sich als vorteilhaft, neue mit den Arbeitseinheiten erfasste Messdaten in der Trainingseinheit überprüfen zu können.
  • Weiterhin erweist es sich als vorteilhaft, für die Trainingsmenge nur Trainingspunkte zuzulassen, die innerhalb von gruppenspezifisch definierten Varianzgrenzwerten liegen.
  • Weiterhin erweist es sich als vorteilhaft, die Messdaten mit der WT in die Koeffizientendarstellung zu überführen, da die mittelnde Eigenschaft der WT das Verfahren unempfindlich gegen spektrale Spitzen sein lässt.
  • Weiterhin erweist es sich als vorteilhaft, die Messdaten mit der WT in die Koeffizientendarstellung zu überführen, da gezielt unwesentliche Koeffizienten ausgeschlossen werden können und somit eine Datenreduktion erreicht wird.
  • Ferner erweist sich die Anwendung der WT als vorteilhaft, da durch den Ausschluss von Koeffizienten, die kleiner als ein definierter Grenzwert sind, der Trainingsgrad bei der Adaption optimiert werden kann.
  • Weiterhin erweist es sich als vorteilhaft, mittels eines geeigneten Interpolationsverfahrens Zwischenwerte zu den Trainingspunkten so einzufügen, dass im Eingangsraum (X-Raum) eine glatte, zusammenhängende MF mit limitierter Krümmung entsteht, die keine Lücken und Sprünge aufweist, und zwar als Voraussetzung zur numerisch stabilen Anwendbarkeit spektraler Methoden, zu denen die Verfahren zur Dimensionsreduktion gehören.
  • Weiterhin erweist es sich als vorteilhaft, die Einfügung der Zwischenwerte so zu gestalten, dass die Eigenwerte der MF im X-Raum nur minimal oder gar nicht verändert werden.
  • Weiterhin erweist es sich als vorteilhaft, die Trainingsvektoren mit einer Dimensionsreduktion in einen niedrigdimensionalen Raum einzubetten, da die Daten durch diesen Vorgang redundanzfrei werden.
  • Weiterhin erweist es sich als vorteilhaft, den inneren Informationsgehalt der Trainingsdaten mittels einer Dimensionsredukion und einer dabei ausgeführten Multiskalenanalyse zu ermitteln und die den größten Informationsgehalt aufweisenden d Komponenten zur Darstellung im Einbettungsraum (Y-Raum) zu verwenden (2). Dies reduziert die Datenmenge, entfernt redundante Information und optimiert den Trainingsgrad bei der Adaption.
  • Weiterhin erweist es sich als vorteilhaft, dass durch die Dimensionsreduktion Strecken und Winkel in den lokalen Umgebungen der TP erhalten bleiben. Dies garantiert Stetigkeit und führt zu hoher Präzision bei der nachfolgenden Stufe Skalierung und Anpassung (SA).
  • Weiterhin erweist es sich als vorteilhaft, dass das verwendete Dimensionsreduktionsverfahren die Ursprungsdaten bei der Optimierung mit einbezieht (NOP) und auf diese Weise auch globale Verhältnisse weitestgehend erhalten bleiben. Dies ist die Voraussetzung dafür, dass die nachfolgende Stufe SA eindeutige Ergebnisse liefert.
  • Schließlich erweist es sich als vorteilhaft, mit der Stufe Skalierung und Anpassung (SA) die Trainingsdaten des Y-Raumes auf die normierte Darstellung im Z-Raum anzupassen, da auf diese Weise nicht nur eine eindeutige Zuordnung zu einer Klasse, sondern auch der Zugehörigkeitsgrad bei Ähnlichkeiten abgelesen werden kann (4).
  • Ausführungsbeispiel
  • Ein Ausführungsbeispiel der Erfindung ist in den Zeichnungen dargestellt und wird im Folgenden näher erläutert. Dabei zeigen 1 eine schematische Darstellung der Interaktionen zwischen der Trainingseinheit und den Arbeitseinheiten, 2 eine Verarbeitungsstruktur der Trainingseinheit, 3 eine Verarbeitungsstruktur der Arbeitseinheiten, 4 eine visuelle und graduelle Darstellung der Klassifizierung im Merkmalsraum, 5 ein überwachtes KNN zur Verknüpfung des Y-Z-Raumes und 6 eine Rekonstruktion eines Anfragepunktes im Z-Raum.
  • In 1 ist in Form einer schematischen Darstellung erfindungsgemäß die Vorrichtung aufgezeigt, die aus der Trainingseinheit (TE) und den temporär mit ihr in Verbindung stehenden mehrfach vorhandenen Arbeitseinheiten (AE) besteht. Die Eingangsdaten (ED) werden der Trainingsmenge (TM) der TE zugeführt, das Modell (M) in der TE gebildet, an die AE übertragen und in Form von Werten, Anzeigen und/oder Signalen anwendungsgerecht zur Verfügung gestellt.
  • In 2 ist die Anordnung der die Trainingseinheit bildenden Verarbeitungsmodule dargestellt. Im Einzelnen sind dies die Module Messeinheit (ME), Datenvorverarbeitung der Trainingseinheit (DVT), Nachbarschaftserhaltende Beziehungen (NB), Dimensionsreduktion (DR) sowie Skalierung und Anpassung (SA).
  • In 3 ist die Anordnung der die Arbeitseinheit bildenden Verarbeitungsmodule dargestellt. Dies sind die Module Messeinheit (ME), Datenvorverarbeitung der Arbeitseinheit (DVA), Bestimmung Nächster Nachbarpunkte (NB) und Linear-Kombination (LK).
  • In 4 ist die Anordnung der mit den Gruppenwerten trainierten Klassen der verschiedenen zu detektierenden Stoffe im Merkmalsraum dargestellt. Jedes Trapez repräsentiert auf der oberen Linie, die den Zugehörigkeitsgrad Eins anzeigt, den rezeptiven Bereich der Klassen.
  • In 5 ist die Struktur des überwacht trainierten KNN dargestellt. Die Trainingspunkte TP1, ..., TPN bestehen im beispielhaft dargestellten zweidimenionalen Fall (d = 2) aus zwei Neuronen, wobei die hochgestellte Zahl die Dimension und die tiefgestellte Zahl den Index i in der Liste der TPi angibt. Die Gewichte F verbinden die entsprechenden Neuronen im Z-Raum mit den Neuronen im Y-Raum.
  • In 6 ist die Rekonstruktion eines Anfragepunktes Xa im Z-Raum mit den im X-Raum bestimmten NN-Gewichten Waj dargestellt. Die mit den NN-Punkten korrespondierenden Trainingspunkte Za1, ..., ZaK bestehen im beispielhaft dargestellten zweidimensionalen Fall (d = 2) aus zwei Neuronen, wobei die hochgestellte Zahl die Dimension und die tiefgestellte Zahl mit dem Index aj die Nummer des NN des Anfragepunktes Xa angibt. Mit den Gewichten Waj wird die Position von Xa im Z-Raum bestimmt.
  • Arbeitsweise
  • Trainingsprozedur: Bei der Trainingsprozedur kommen die in 2 dargestellten Module zum Einsatz. Diese Module enthalten die im Folgenden modular gruppierten Verfahrensschritte.
  • Modul Messeinheit (ME): Modul ME in 2 misst mit einer geeigneten Vorrichtung (z. B. Raman-, NIR-Spektrometer) charakteristische Merkmale der Proben und stellt die Messergebnisse in Form parametrisierter Kurven, z. B. Spektren, zur Weiterverarbeitung zur Verfügung.
  • Modul Datenvorverarbeitung der Trainingseinheit (DVT): Mit diesem Modul wird zuerst überprüft, ob sich alle als Trainingsmengen verschiedener Gruppen vorliegenden Trainingspunkte innerhalb gruppenspezifisch definierter Varianzgrenzwerte bewegen. Wenn dies zutrifft, werden diese TP in eine Trainingsmenge TPi übernommen, für die Weiterverarbeitung zugelassen, dann mittels einer Wavelet-Transformation in eine Koeffizientendarstellung überführt und danach zur Bildung der Eingangsvektoren x →i verwendet. Darauf folgend werden die den Gruppen bzw. Klassen zugehörigen TPi den korrespondierenden Gruppenwerten, die die Klassen im Z-Raum repräsentieren, in Form von Wertepaaren zugeordnet. Diese Werte werden in einer nach Gruppen geordneten Liste der TPi abgespeichert, so dass die TPi nach aufsteigender Distanz zu einem Referenzpunkt, z. B. dem Eins-Vektor, im X-Raum geordnet sind und der Index i die Listenposition angibt. Eine Ordnung nach abfallendem Distanzmaß ist auch möglich. Die ebenfalls zur Datenvorverarbeitung gehörenden Komponenten Wavelet-Transformation, Bildung der Eingangsvektoren und Füllwertmethode sind erfindungsgemäß wie folgt ausgeführt.
  • Wavelet-Transformation: Um die WT anwenden zu können, muss die Anzahl der Messpunkte der Kurven, die die in Abhängigkeit eines Parameters gemessenen Spektralwerte repräsentieren, 2n entsprechen. Im Ausführungsbeispiel liegen 470 Messwerte vor. Diese wurden mit Nullen auf 29 = 512 Messwerte ergänzt. Anschließend wurde die WT mit einem geeigneten Mutter-Wavelet, z. B. dem Haar-Wavelet, durchgeführt. Eigenschaften einer solchen WT sind Erhaltung euklidischer Distanz und lineare Unabhängigkeit der Koeffizienten WK1, ..., WKN bei orthonormaler Basis. Mithin können die Signale lokal gezielt verändert werden, d. h. unwesentliche Koeffizienten können entfallen, die Koeffizienten mit den höchsten Energieinhalten bilden die Hauptmerkmale und repräsentieren näherungsweise das zugrunde liegende Signal. Durch die mittelnde Eigenschaft, der WT wird Rauschen weitestgehend ausgefiltert und die Auswahlmöglichkeit relevanter WT-Koeffizienten verhindert ein Übertrainieren des KNN, dessen Feinstruktur auf diese Weise gezielt eingestellt werden kann. Zur Bildung der Eingangsvektoren wurden alle Koeffizienten verwendet, die größer als ein vordefinierter Grenzwert sind. Zusätzlich ist die Möglichkeit zum Ausschluss des größten Koeffizienten vorgesehen, der den Mittelwert des zugrunde liegenden Signals repräsentiert.
  • Bildung der Eingangsvektoren: Im Falle von Klassifizierungsaufgaben oder stark heterogenen Eingangsdaten, bei denen verschiedene Gruppen von Trainingsmustern oder Trainingsmuster mit Bereichen sehr unterschiedlicher Charakteristik erfasst werden müssen und jede Gruppe oder jeder Bereich l andere relevante Koeffizienten WK(l) = {WK1(l), ..., WKD(l)} haben kann, wird der Eingangsvektor mit den Koeffizienten aus der Vereinigungsmenge x →(i) = ⋃ M / l=1WK(l) der relevanten Koeffizienten 1, ..., D aller Gruppen oder Bereiche l = 1, ..., n gebildet. Auf diese Weise können die TP aller Gruppen/Bereiche im
    Figure 00060001
    D abgebildet werden. Sind beispielsweise in Gruppe/Bereich 1 die WT-Koeffizienten k = 1, 3, 5, 7 und in Gruppe/Bereich 2 die Koeffizienten k = 1, 4, 5, 7, 16 relevant, so muss die Dimension des Eingangsvektors D = 6 sein, damit die Koeffizienten k = 1, 3, 4, 5, 7 und 16 zur Bildung der MF genutzt werden können. Die so erzeugten Eingangsvektoren x →i mit i = 1, ..., N sind Repräsentanten der TP und bilden zunächst nicht zusammenhängende Häufungen im Eingangsraum (X-Raum).
  • Füllwertmethode: Sie füllt die Lücken in der MF des X-Raums harmonisch mit Datenpunkten aus. Die eingefügten Füllwerte verändern die in der Stufe 1 der Trainingsphase ermittelten Eigenwerte nur unwesentlich oder im Optimalfall nicht. Die Einfügung beginnt zwischen Punkt 1 und 2 und endet bei Punkt N – 1 und N der MF. Sie wird mit einer Spline-Interpolation, die die Eigenschaft der Krümmungsstetigkeit aufweist, für jede Dimension nach Gleichung (1) in den Intervallen von TP zu TP durchgeführt, wobei S(t) den Wert des einzufügenden Punktes (Ordinate), der Parameter t die Position (Mantisse), P0 den Anfangspunkt des Intervalls, P1 den Endpunkt des Intervalls, T0 die Tangente in P0 und T1 die Tangente in P1 angeben. Der Vorgang wird in jedem Intervall solange wiederholt, bis ein vorher definiertes Abbruchkriterium erfüllt ist. Mögliche Abbruchkriterien sind: der Abstand zwischen zwei DP ist kleiner als die Maximaldistanz, die Krümmung der MF im Gebiet des Intervalls ist kleiner als die Maximalkrümmung, der Winkel zwischen Anfangs- und Endtangente des Intervalls ist kleiner als der maximal zulässige Winkel oder das entsprechende Cosinus-Maß. S(t) = P0(2t3 – 3t2 + 1) + P1(–2t3 + 3t2) + T0(t3 – 2t2 + t) + T1(t3 – t2) (1)
  • Parameter zur Füllwertmethode: Grenzwert für die maximale Abweichung zwischen zwei NN-Punkten im Raum ist der Parameter Maximalabweichung. Die korrekte Zahl n der Einfügepunkte, die in allen D Dimensionen eingefügt werden müssen, ist erreicht, wenn dieser Wert bei allen Datenpunkten (DP) X m / i zu X m / i+1 in den Dimensionen m = 1, ..., D des betreffenden Intervalls unterschritten wird, wobei ein DP auch Füllwerte repräsentiert. Die Maximale Füllwertanzahl pro Verbindungsabschnitt begrenzt die Füllwertanzahl beim Verbinden nicht zusammenhängender Datenbereiche, wenn in dem so entstehenden künstlich erzeugten Zwischengebiet keine Trainingspunkte vorliegen und dieser Bereich nicht genutzt wird. Es werden dort auch keine als positiv zu klassifizierenden DP in der Arbeitsprozedur erwartet und Messwerte müssen folglich dort nicht hochgenau generalisiert werden. Deshalb wird an diesen Stellen ein größerer Wert für die Krümmung zugelassen, der über der vordefinierten Maximalabweichung liegen kann. Dieser Datenbereich dient dazu, nicht zusammenhängende Gebiete der MF miteinander zu verbinden, um die MF für die erste Stufe DR so vorzubereiten, dass die bekannten numerischen Probleme bei zu großen Sprüngen in der MF umgangen werden. Weiterhin besteht die Möglichkeit, den Parameter Maximalabweichung an die Varianz bestimmter Datenbereiche zu koppeln, um in diesen Bereichen die Trennschärfe den Gegebenheiten der dort vorliegenden Datencharakteristik anpassen zu können. In Bereichen geringer Varianz wird auf diese Weise die Trennschärfe erhöht und in Bereichen großer Streubreite (große Punkt-zu-Punkt-Distanz) die Trennschärfe herabgesetzt, d. h. der rezeptive Bereich vergrößert. Die Trennschärfe kann auch durch Berechnungen, die auf Werten der Häufungscharakteristik basieren, oder durch den Häufungen zugeordnete Parameter zur Einstellung einer häufungsorientierten Maximalabweichung an bestimmte Datenbereiche angepasst werden.
  • Nachbarschaftserhaltende Orthogonale Projektion (NOP-Methode): Die NOP-Methode ist die erste Stufe des adaptiven Verfahrens und besteht aus fünf, im Folgenden aufgeführten Schritten:
    • 1. Bestimmung der Nächsten Nachbarpunkte,
    • 2. Bestimmung der Rekonstruktionsgewichte,
    • 3. Normierung der Rekonstruktionsgewichte,
    • 4. Bestimmung der Eigenwerte und
    • 5. Rekonstruktion.
  • Die in 2 gezeigten Module Nachbarschaftserhaltende Beziehungen (NB) und Dimensionsreduktion (DR) bestehen aus den Schritten 1, 2 und 3 bzw. 4 und 5 der NOP-Methode.
  • Schritt 1, Bestimmung der NN-Punkte: Die Nächsten Nachbarpunkte Xj, j = 1, ..., K im X-Raum werden mittels eines geeigneten Distanzmaßes bestimmt, das bei der Erstellung der Liste der TPi (Modul DVT) gewählt wurde. Einerseits ist die maximale Krümmung der MF, die mit der Füllwertmethode eingeprägt wurde, ausschlaggebend dafür, wieviele NN zugelassen werden können, um topologieerhaltend in einen niedrigdimensionalen Raum einbetten zu können. Andererseits wirken sich viele NN dabei mittelnd auf die Rauschanteile in der MF aus. Im Ausführungsbeispiel wurden acht NN verwendet. Der maximale Distanzwert jedes TPi zu seinen NN wird für jeden TP in die Liste der TPi eingetragen. Dieses von der Punkt-zu-Punkt-Distanz im NN-Bereich abhängige Distanzmaß wird für die Bildung des rezeptiven Bereiches mit Gleichung (18) in der Arbeitsphase benötigt.
  • Schritt 2, Bestimmung der Rekonstruktionsgewichte: Für jeden TP werden die Distanzen η →j zu den NN erfasst und in der NN-Matrix η j gespeichert. Für die Weiterverarbeitung wird die lokale Gram-Matrix G mit Gleichung (2) gebildet. Sie enthält die Differenzen zwischen Trainingsvektor x →i und NN-Matrix η j. Die Gram-Matrix ist symmetrisch, positiv definit, enthält keine negativen Eigenwerte und ist somit invertierbar. Gjk = (x →i – η →j)·(x →i – η →k) (2)
  • Schritt 3, Normierung der Rekonstruktionsgewichte: Damit die Rekonstruktionsgewichte invariant gegenüber der Transformation ins Niedrigdimensionale werden, wird die Summe der Rekonstruktionsgewichte Wj für jeden TP mit Gleichung (3) auf Eins normiert.
  • Figure 00080001
  • Schritt 4, Bestimmung der Eigenwerte: Mit den im X-Raum ermittelten Gewichten Wij wird die Struktur der MF im d-dimensionalen Raum rekonstruiert. Die charakteristischen Merkmale der hochdimensionalen Eingangsdaten x →i bleiben dabei erhalten. Die Abbildung erfolgt möglichst winkel- und streckentreu. Die Ausgangsdaten y →i repräsentieren die globalen inneren Koordinaten der MF. Um die sogenannte Einbettung durchzuführen, muss folgende, auf lokal linearen Rekonstruktionsflächen basierende Kostenfunktion minimiert werden:
    Figure 00080002
  • Die Gewichte Wij werden beim Optimieren der Ausgänge y →i fixiert. Dazu wird Gleichung (4) mit M = (IW)T(IW) (5) in die quadratische Form überführt und lautet dann
    Figure 00080003
  • Die normierten NN-Beziehungen aller TP sind in der Matrix W untergebracht. Die resultierende, mit. Gleichung (5) gebildete Matrix, die quadratische Matrix M, ist dünn besetzt, symmetrisch und halbpositiv definit. Sie enthält damit keine negativen Eigenwerte und ist alternativ auch mit
    Figure 00080004
    bestimmbar. Bei der Einbettung müssen die Ausgangspunkte mit Hilfe der Gewichte Wij im d-dimensionalen Raum so positioniert werden, dass die Nachbarschaftsbeziehungen erhalten bleiben. Dazu werden für die Optimierung zwei Nebenbedingungen eingeführt. Als erste Nebenbedingung wird gefordert, dass die Ausgänge y →i rotiert werden können, ohne den Wert der Kostenfunktion Φ(y) zu verändern, so dass die Kovarianz der Ausgänge gleich der Einheitsmatrix I wird:
    Figure 00080005
  • Mit der zweiten Nebenbedingung NB 2: Y = V T·X mit V T V = I (9) wird eine lineare Abbildung in der Form Y = V T·X für eine zunächst unbekannte und noch zu bestimmende Matrix V erzwungen.
  • Die folgende Formulierung mit Ausdrücken dieser zunächst unbekannten Matrix V lautet: Φ(Y) = ∥V T X(IW T)∥ 2 / F = tr[V T XMX T V] mit M = (IW)T(IW)
  • Durch die multiplikative Verknüpfung mit X und die Forderung nach Orthonormalität der Spalten von V mit V T V = I wird die Zielfunktion weiter eingeschränkt. Dies führt zu folgendem konvexen Optimierungsproblem:
    Figure 00090001
  • Dabei stellt die quadratische Form der Kostenfunktion (4) die Existenz eines globalen Minimums sicher.
  • Schritt 5, Rekonstruktion: Die Einbettung in den niedrigdimensionalen Y-Raum der Dimension d wird nicht durch Rekonstruktion mittels einer Linearkombination y →i = Σ K / j=1Wijy →j, sondern durch Projektion mit der Beziehung (11) ausgeführt. Die Einbettung von Eingangsvektoren x →i in den niedrigdimensionalen Raum wird mittels einer Matrix-Vektor-Operation für einzelne Vektoren mit (11) ermöglicht. y → = V T·x → und für alle Trainingsvektoren mit Y = V T·X (11)
  • Für die Aufgabenstellung ist die Rekonstruktion mit den Hauptkomponenten als zweidimensionale Darstellung ausreichend.
  • Die Transformationsmatrix V in (11) wurde durch Optimierung der Matrix
    Figure 00090002
    ermittelt, die eine Verknüpfung der in den Gewichten Wij gespeicherten Nachbarschaftsbeziehungen als Träger der topologieerhaltenden Information und der Eingangsinformation X (Trainingspunkte) darstellt. Hervorzuheben ist hier die wichtige Eigenschaft, dass sich die Abbildung neuer Datenpunkte in den Einbettungsraum Y nach Bestimmung von V auf eine Matrix-Vektor-Multiplikation reduziert. Unter Verwendung dieser Transformationsmatrix V gestaltet sich die Einbettung als besonders einfach.
  • Bei der Einbettung mit Gleichung (11) werden die Ausgangspunkte mit Hilfe der Gewichte Wij im d-dimensionalen Raum so positioniert, dass die Nachbarschaftsbeziehungen erhalten bleiben.
  • Figure 00090003
  • Modul Skalierung und Anpassung (SA): Dieses in 2 dargestellte Modul repräsentiert die zweite Stufe des adaptiven Verfahrens und bildet die in den Y-Raum projizierten TP im Z-Raum mit Gleichung (14) ab. Die dazu erforderlichen Faktoren werden mit Gleichung (13) aus den Wertepaaren (Xi, Zi) in der TPi-Liste und den Yi bestimmt.
  • Figure 00090004
  • Im Z-Raum können die Zi für die TP zu Überprüfungszwecken mit Gleichung (15) für jede Dimension m = 1, ..., d bestimmt werden, wobei Wij die im X-Raum mit Gleichung (3) bestimmten normierten NN-Gewichte des jeweiligen TPi mit i = 1, ... N für die Trainingspunktenummer und j = 1, ..., K für die Nummerierung der NN sind.
  • Figure 00090005
  • Im zweidimensionalen Fall gibt m = 1 den Mantissenwert und m = 2 den Ordinatenwert im Z-Raum für Zi an.
  • Arbeitsprozedur: Hier kommen die in 3 dargestellten Module zum Einsatz, die die im Folgenden modular gruppierten Verfahrensschritte enthalten.
  • Modul Messeinheit (ME): Dieses Modul (3) misst mit einer geeigneten Vorrichtung (z. B. Raman- oder NIR-Spektrometer) charakteristische Merkmale der Proben und stellt die Messergebnisse in Form parametrisierter Kurven, z. B. Spektren, der Weiterverarbeitung zur Verfügung.
  • Modul Datenvorverarbeitung der Arbeitseinheit (DVA): Dieses Modul (3) überführt mittels einer Wavelet-Transformation (erläutert bei Modul DVT) die in Modul ME in Form diskreter Messwerte gebildete Messkurve in eine Koeffizientendarstellung. Bestehend aus den Koeffizienten k, die in Modul DVT unter Bildung des Eingangsvektors in der Trainingsprozedur festgelegt wurden, wird diese Koeffizientendarstellung anschließend zur Bildung des Eingangsvektors x →a verwendet. Die Werte der Koeffizienten k bestimmen die Position im X-Raum. Der Vektor x →a wird anschließend mit dem Modul NB aus 3 weiterverarbeitet.
  • Modul Nachbarschaftserhaltende Beziehungen (NB): Dieses Modul (3) realisiert die Schritte 1, 2 und 3 der NOP-Methode (beschrieben bei Modul DR der Trainingseinheit im Abschnitt Trainingsprozedur). Zur Bestimmung der Rekonstruktionsgewichte wird Gleichung (16) anstatt Gleichung (3) verwendet.
  • Figure 00100001
  • Nach dieser Bearbeitung liegen die Rekonstruktionsgewichte Waj vor und werden dem Modul LK zugeführt.
  • Modul Linear-Kombination (LK): Für den Arbeitspunkt AP (Anfragepunkt Xa) werden die Za im Z-Raum mit Gleichung (17) für jede Dimension m = 1, ..., d bestimmt.
  • Figure 00100002
  • Im zweidimensionalen Fall gibt m = 1 den Mantissenwert und m = 2 den Ordinatenwert im Z-Raum für Zi an.
  • Dieser Datenpunkt wird dann erfindungsgemäß in dem in 4 wiedergegebenen Diagramm angezeigt, das eine mögliche Darstellung der unterschiedlichen trainierten Klassen im Merkmalsraum Z repräsentiert. Ein Zugehörigkeitsgrad von Eins bedeutet dabei, dass der Anfragepunkt Xa im rezeptiven Bereich der Klasse oder der Häufung liegt, in der dieser Anfragepunkt abgebildet wird. Werte zwischen 0 und 1 in den Klassenbereichen zeigen den Zugehörigkeitsgrad, die Ähnlichkeit zu dieser Klasse an. Werte zwischen den Bereichen zweier Häufungen zeigen an, zu welchem Grad der Anfragepunkt Xa hin zu einer Häufung tendiert. Werte auf der linken (min) oder der rechten Begrenzungslinie (max) zeigen an, dass der Anfragepunkt Xa keine Ähnlichkeit mit einer Häufung hat.
  • Klassifizierungsgrenze: Bedingt durch die Normierung der Distanzsumme auf Eins, die bei der Bestimmung der Rekonstruktionsgewichte mit Gleichung (3) in der Trainingsphase für jedes Xi durchgeführt worden ist, geht die Information der absoluten Distanz verloren. Um eine Klassifizierungsgrenze (rezeptiver Bereich) zu erhalten, die eine optimale Klassifizierung ermöglicht, werden der rezeptive Bereich und der Zugehörigkeitsgrad in folgender Weise bestimmt, womit die Zugehörigigkeit eines AP (Zugehörigkeitsgrad) zu einer Klasse angezeigt werden kann. Durch die Kopplung des Parameters Maximalabweichung mit der Gruppenvarianz bei der Füllwertmethode wird erreicht, dass der rezeptive Bereich der Häufungen/Klassen ihrer Datencharakteristik angepasst wird.
  • Rezeptiver Bereich: Der maximale Abstand jedes TP zu seinen NN im X-Raum ist mit DistMax2NN bezeichnet. Er wird in der Trainingsphase gemessen, den TPs zugeordnet und gespeichert. Der Parameter BereichFaktor dient der Anpassung des rezeptiven Bereichs der Häufungen. Sein optimaler Wert wird mit einer ROC-Analyse ermittelt. Der Bereichsfaktor ist der Reziprokwert des optimalen Schwellenwertes, der bekanntlich bei der kleinsten Distanz zum Optimalpunkt (Selektivität = 1, Spezifizität = 0) vorliegt. Der rezeptive Bereich jedes TP ist mit BereichFaktor·DistMax2NN und der rezeptive Bereich (RB) jeder Klasse durch Überlagerung der Bereiche um jeden TP einer Klasse festgelegt. RB = BereichFaktor·MaxDist2NN (18)
  • Zugehörigkeitsgrad: In Gleichung (19) bedeutet MaxDistXa2NN die maximale Distanz eines Xa zu seinen NN. Wenn MaxDistXa2NN kleiner als oder gleich MaxDist2NN ist, so ist der Wert des Zugehörigkeitsgrades für diesen AP gleich Eins. Dieser Wert entspricht einer Zugehörigkeit von 100%. Wenn MaxDistXa2NN größer als MaxDist2NN ist, wird der Wert des Zugehörigkeitsgrades mit Gleichung (19) berechnet. APs, die mit ihren Wichtungen zu einer Gruppe passen, jedoch weiter entfernt sind, werden auf diese Weise im Zugehörigkeitsgrad reduziert. Dabei entspricht 0 ... < 1 einer Zugehörigkeit von 0 ... < 100%. Es ist somit möglich zu erkennen, mit welcher Gruppe ein AP die größte Ähnlichkeit aufweist, auch wenn kein sehr hoher Zugehörigkeitsgrad um Eins erreicht wurde. Zugehoerigkeitsgrad = MaxDistXa2NN / RB (19)
  • Vorteile der Erfindung
  • Ausführung der Detektionseinheit für Kampfstoffe und andere Substanzen als transportables feldtaugliches Gerät (Arbeitseinheit).
  • Ausführung einer zentral agierenden Einheit (Trainingseinheit) zur Erstellung eines Detektionsmodells und Übertragung dieses Modells in die Arbeitseinheiten, die dann eigenständig in der Lage sind, Detektion und Klassifizierung durchzuführen. Diese Organisation bietet hohe Einsatzeffizienz und eine zweckgebundene, zentral verwaltete Einsatzstruktur.
  • Erhalt globaler Topologie mit Modul DR:
    Die charakteristischen Merkmale und der intrinsische Informationsgehalt der hochdimensionalen Eingangsdaten x →i bleiben bei der Transformation in einen niedrigdimensionalen Raum erhalten. Die Abbildung bei der Dimensionsreduktion wird möglichst winkel- und streckentreu durchgeführt. Die Ausgangsdaten y →i repräsentieren weitestgehend auch den globalen inneren Zusammenhang der MF.
  • Ausführung einer Füllwertmethode zur Lösung der bekannten Probleme mit Lücken und Sprüngen in der MF bei Dimensionsreduktionsverfahren, die zu den spektralen Methoden zu zählen sind. Mit der Füllwertmethode werden Lücken und Unstetigkeiten der im Eingangsraum befindlichen MF beseitigt und eine maximal zugelassene Krümmung eingeprägt. Dadurch wird sichergestellt, dass die MF in allen Bereichen stetig ist, und es wird ermöglicht, eine Dimensionsreduktion für die im Eingangsraum befindliche MF mit hoher Präzision durchzuführen.
  • Mit der in der Datenvorverarbeitung angewendeten WT ist der Trainingsgrad des adaptiven Verfahrens gezielt einstellbar. Durch diese Maßnahme wird ein Übertrainieren des die zugrunde liegende MF annähernden Modells vermieden.
  • Die Mittelungseigenschaft der WT lässt das Verfahren gegenüber spektralen Spitzen unempfindlich sein und bildet die Basis für ein robustes Messverfahren, das als weiteres Merkmal auch Resistenz gegen elektrische Störsignale aufweist.
  • Ausführung des NOP-Verfahrens zur Dimensionsreduktion und Einbettung von TPs in einen niedrigdimensionalen Baum. Das Verfahren erstellt in einem unüberwachten Lernvorgang eine Transformationsmatrix, mit der es ermöglicht wird, die TPs im niedrigdimensionalen Raum so abzubilden, dass weitestgehend die Topologie (innere charakteristische topologische Struktur) der MF durch Nutzung nachbarschaftserhaltender Beziehungen im Einbettungsraum rekonstruiert wird. Die Anordnung der Datenpunkte im Einbettungsraum der rekonstruierten MF ist redundanzfrei, weist minimalen Energieinhalt auf und repräsentiert das globale Optimum.
  • Ausführung einer Matrix-Vektor-Multiplikation zur Einbettung von TPs in den niedrigdimensionalen Raum. Die Anordnung der Datenpunkte der im Einbettungsraum rekonstruierten MF weist minimalen Energieinhalt auf und repräsentiert das globale Optimum. Mit der Transformationsmatrix V wird es ermöglicht, auch untrainierte TPs durch eine Matrix-Vektor-Multiplikation in diesen Einbettungsraum präzise abzubilden.
  • Ausführung einer Skalierung und Anpassung mittels einer Anordnung, die als überwachter Lernvorgang eine Transformationsmatrix erstellt und mit dieser die TPs vom Einbettungsraum in den Merkmalsraum so projiziert, dass in diesem eine anwendungsorientierte Darstellung der trainierten Klassen entsteht. Neu detektierte Messwerte unbekannter Substanzen können dann mit den mit ihren NN im Eingangsraum gebildeten Rekonstruktionsgewichten direkt im Merkmalsraum visuell und graduell eingeordnet werden. Zur Klassifizierung eines neuen Messwertes und dessen Zuordnung zu einer der trainierten Klassen ist nur ein Verarbeitungsschritt erforderlich.
  • Stand der Technik
  • Eine kompakte transportable Vorrichtung zur Detektion biologischer Kampfstoffe und anderer Substanzen, wie sie in der Beschreibung und im Ausführungsbeispiel vorgestellt wurde, ist in dieser Form bisher nicht bekannt.
  • Es gibt zwar laborgebundene Verfahren, die die Raman-Spektroskopie oder andere Messverfahren nutzen, jedoch sind diese nicht als transportable Einheiten für den Einsatz vor Ort geeignet. Weiterhin setzen solche Laborverfahren hohe Wissensstände der Bediener voraus und sind auch deshalb nicht für unkomplizierten Einsatz unter nicht optimalen Bedingungen geeignet.
  • Weiterhin verfügen Standardgeräte für den Laborbetrieb nicht über speziell für die Belange feldtauglichen Einsatzes optimierte Betriebsprogramme, die ihre Funktionalität auch bei nicht optimalen Umgebungsbedingungen sicherstellt.
  • Bekannt sind zwar auch Verfahren zur Erfassung von Messdaten mittels spezieller Detektoren zur Erkennung biologischer Kampfstoffe. Diese verfügen jedoch nicht über die Fähigkeit, mit einer als zentrale Einheit agierenden Trainingseinheit in Verbindung zu stehen, um das Gesamtsystem durch Nutzung neuer erfasster Daten schnell und präzise mittels eines in die Detektionseinheiten übertragenen Modells an veränderte Situationen anzupassen, wie dies bei dem in der Beschreibung und im Ausführungsbeispiel vorgestellten Verfahren und der entsprechenden Vorrichtung der Fall ist.
  • Weiterhin verfügen bekannte Vorrichtungen nicht über die Fähigkeit, für verschiedenste Substanzen mittels einer Detektionseinheit, die mit einem Modell auf die charakteristischen Eigenschaften dieser Substanzen eingestellt ist, in Echtzeit entsprechende Meldungen und Informationen zu erzeugen, damit angemessen und unmissverständlich auf gefährliche Situationen reagiert werden kann. Es gibt zwar Detektoren und Indikatoren, die auf der Basis spezieller Wirkungsmechanismen für einen bestimmten Stoff eine Warnanzeige ermöglichen, diese sind jedoch nicht wie das in der Beschreibung und im Ausführungsbeispiel vorgestellte Verfahren und die Vorrichtung speziell an bestimmte Situationen adaptierbar, meist für für eine Substanz einsetzbar und können nicht auf einfache Weise im Verbund auf gleiche Präzisionsanforderungen überprüft oder kalibriert werden.
  • Weiterhin verarbeiten andere Verfahren die Messdaten nicht in einem Schritt. Die zur Klassifizierung oft genutzten Support-Vektor-Maschinen (SVM) sind besonders zur Verarbeitung großer Datenmengen geeignet, da zur Klassifizierung in der Arbeitsphase nur die sogenannten Support-Vektoren (SV) herangezogen werden müssen. Sie weisen ein globales Optimum und gute Generalisierungseigenschaften auf, jedoch hat diese Methode keine mittelwertbildenden Eigenschaften und ist somit nicht unempfindlich gegen spektrale Spitzen und elektrische Störsignale. Weiterhin ist mit einem Satz von SV nur die Bearbeitung einer Klasse möglich. Parametersuche und Bestimmung der Kernfunktionen sind kompliziert und erweisen sich bei der praktischen Anwendung als sehr zeitaufwendig, insbesondere dann, wenn neue Messdaten verschiedenen Klassen zugeordnet werden sollen. Es liegt kein Modell vor, dass alle Trainingsdaten gemeinsam repräsentiert, weshalb jeder neue Eingangsdatenwert mit verschiedenen SV-Sätzen gegenüber nur einem Modell beim vorgestellten NOP-Verfahren verarbeitet werden muss.
  • Klassifikationsverfahren sind so gestaltet, dass Zuordnungen zwischen zwei Klassen oder einer Klasse gegen den Rest entschieden werden. Um Zugehörigkeiten bei mehreren Klassen zu bestimmen, sind aus diesem Grunde immer mehrere Klassifizierungsdurchläufe erforderlich. Dies erfordert Rechenzeit und Aufwand, da für jede Klasse ein einzelnes Modell zu erstellen ist. Eine wie in der Beschreibung dargestellte Multiklassenzuordnung, die in einem Durchgang und mit einem Modell funktioniert, ist bisher so nicht bekannt.
  • Bisher ebenfalls noch nicht bekannt ist ein Verfahren, das mittels eines unüberwachten Lernvorgangs Eingangsdaten in einen niedrigdimensionalen Raum so überführt, dass diese Anordnung sowohl im Nah- als auch im Fernbereich topologieerhaltende Eigenschaften aufweist und mit einem daran anschließenden überwachten Lernvorgang diese direkt an Ausgangskurven für Anzeige-, Registrier- oder Steuerungszwecke anpasst. Verfahren, die auf iterativem Wege ein KNN optimieren, leiden unter lokalen Minima (Backpropagation-Algorithmus) und weisen keine minimale Anzahl von Verbindungsknoten (Simulated Annealing) auf.
  • Andere Verfahren zur Dimensionsreduktion benötigen glatte, gut abgetastete Eingangsdaten, weisen nur lokale (LLE) oder globale Topologierhaltung (ISOMAP) auf und ihre Ausgangskonfigurationen sind nicht direkt für Anzeige-, Registrier- oder Steuerungs- und Klassifizierungszwecke nach Anspruch 1 brauchbar. Zwar sind Verfahren zur Dimensionsreduktion bekannt, die ebenfalls einen rezeptiven Bereich definieren, jedoch nicht in Verbindung mit der Glättung der MF nach Anspruch 9 und nicht mit den Merkmalen nach Anspruch 1.
  • Literatur
    • [1] Warscheid et al. 2003, MALDI Analysis of Bacilli in Spore Mixtures by Applying a Quadrupole Ion, Trap TOF Tandem Mass Spectrometer, Analytical Chemistry; 75(20): 5608–17
    • [2] Delehanty et al. 2002, A Microarray Immunoassay for Simultaneous Detection of Proteins and Bacteria, Analytical Chemistry: 74: 5681–5687
    • [3] Kuske et al. 1998, Small-Scale DNA Sample Preparation Method for Field PCR Detection of Microbial Cells and Spores in Soil, Applied and Environmental Microbiology; 64(7): 2663–72
    • [4] Bengio, Yoshua; et al. Out-of-Sample Extensions for LLE, ISOMAP, MDS, Eigenmaps and Spectral Clustering, Université de Montreal. Internet 2003 (http://www.iro.umontreal.ca/lisa/pointeurs/tr1238.pdf)
    • [5] Brand, Matthew: A unifying theorem for spectral embedding and clustering, Mitsubishi Electric Research Labs, Cambridge MA 02139 USA. Internet 2006 (http://www.merl.com)
    • [6] Chang, Hong; Yeung, Dit-Yan: Robust Locally Linear Embedding, Department of Computer Science Hong Kong University and Technology, Clear Water Bay. Kowloon, Hong Kong. Internet 2006 (www.cs.ust.hk/~dyyeung/paper/pdf/yeung.pr2006.pdf)
    • [7] Ham, Jihun; Lee, Daniel D.: Mika, Sebastian; Schölkopf, Bernhard: A kernel view of the dimensionality reduction of manifolds. In: Technical Report No. TR-110, Max-Planck-Institut für biologische Kybernetik. (2003)
    • [8] Kokiopoulu, E.; Saad, Y.: Orthogonal Neighborhood Preserving Projections: A projection-based dimensionality reduction technique. Internet 2006 (http://lts1pc19.epfl.ch/repository/Kokiopoulou2006_1475.pdf)
    • [9] Roweis, Sam; Saul, Lawrence: Nonlinear dimensionality Reduction by locally linear embedding. In: SCIENCE. (2000), vol. 290). S. 2323–S. 2326
    • [10] Saul, Lawrence K.: Roweis, Sam T.: Think Globally, Fit Locally: Unsupervised Learning of Low Dimensional Manifolds. In: Journal of Machine Learning Research. (2003), vol. 4, S. 119–S. 155
    • [11] Weinberger, Kilian Q.: Saul, Lawrence K.: Unsupervised learning of image manifolds by semidefinite programming. In: Proceedings of the 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, (2004), vol. 2, S. 988–995
    • [12] Xiao, Lin; Sun, Jun; Boyd, Stephen: A Duality View of Spectral Methods for Dimensionality Reduction. In: Proceedings of the 23rd International Conference on Machine Learning, Pittsburgh. (2006)

Claims (8)

  1. Verfahren zur Detektion biologischer Kampfstoffe und anderer Substanzen mittels ständig oder temporär mit einer zentralen Einheit in Verbindung stehender transportabler Einheiten, wobei das Verfahren aus den Schritten a) Messung charakteristischer Merkmale und der Konzentration der Substanzen mit einer Messeinheit und Bereitstellung der Messergebnisse in Form parametrisierter Kurven, b) Training der zentralen Einheit mit den vorliegenden Messdaten, die verschiedene zu detektierende Klassen von Substanzen repräsentieren, c) Erstellung eines Modells dieser Substanzen, d) Übertragung des Modells in die transportablen Einheiten, e) Erfassung und Verarbeitung neuer Messdaten in den transportablen Einheiten, so dass diese neuen Daten den trainierten Klassen der zu detektierenden Substanzen visuell und graduell zugeordnet werden können, f) Sammlung neuer Messdaten in den transportablen Einheiten und Übertragung zur zentralen Einheit zum Zwecke späterer Verarbeitungen sowie g) Anpassung des Modells mit neu vorliegenden Daten und anschließende Übertragung in die transportablen Einheiten besteht.
  2. Verfahren nach Anspruch 1, wobei die charakteristischen Merkmale in Form diskret dargestellter Kurvenzüge bereitgestellt werden.
  3. Verfahren nach Anspruch 2, wobei die in Form diskreter Kurvenzüge vorliegenden Merkmale der Substanzen mit einer Wavelet-Transformation unter Erhaltung der euklidischen Distanz in eine Koeffizientendarstellung überführt werden.
  4. Verfahren nach Anspruch 3, wobei zur Bildung eines die charakteristischen Merkmale repräsentierenden Vektors nur solche mit einer Wavelet-Transformation erzeugten Koeffizienten herangezogen werden, die oberhalb eines bestimmten Schwellenwertes liegen.
  5. Verfahren nach Anspruch 4, wobei der den Mittelwert der Messkurve darstellende Wavelet-Koeffizient nicht zur Bildung des Vektors herangezogen wird, der die charakteristischen Merkmale repräsentiert.
  6. Verfahren nach Anspruch 1, wobei die Messeinheit für verschiedene Einsatzfälle mit unterschiedlichen Messverfahren ausgerüstet werden kann.
  7. Verfahren nach einem der Ansprüche 4 oder 5, wobei Datensätze für die stoffspezifischen Eigenschaften der Substanzen bestehend aus den ermittelten Wavelet-Koeffizienten, Kennungen für die verwendeten Messverfahren und zugehörigen Kalibrierdaten in einer Datenbank abgelegt werden.
  8. Vorrichtung ausgebildet zur Durchführung des Verfahrens nach einem der Ansprüche 1 bis 7.
DE102008054345A 2008-11-03 2008-11-03 Verfahren und Vorrichtung zur Detektion von Kampfstoffen Expired - Fee Related DE102008054345B4 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102008054345A DE102008054345B4 (de) 2008-11-03 2008-11-03 Verfahren und Vorrichtung zur Detektion von Kampfstoffen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102008054345A DE102008054345B4 (de) 2008-11-03 2008-11-03 Verfahren und Vorrichtung zur Detektion von Kampfstoffen

Publications (2)

Publication Number Publication Date
DE102008054345A1 DE102008054345A1 (de) 2010-05-20
DE102008054345B4 true DE102008054345B4 (de) 2013-08-01

Family

ID=42104890

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102008054345A Expired - Fee Related DE102008054345B4 (de) 2008-11-03 2008-11-03 Verfahren und Vorrichtung zur Detektion von Kampfstoffen

Country Status (1)

Country Link
DE (1) DE102008054345B4 (de)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116363601B (zh) * 2023-06-02 2023-07-25 北京建工环境修复股份有限公司 一种污染监测设备的数据采集与分析方法及系统
CN117011717B (zh) * 2023-10-07 2023-12-19 北京建工环境修复股份有限公司 一种基于物联网的全氟化合物污染评价方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10330368A1 (de) * 2003-06-30 2005-02-03 Pronet Gmbh Verfahren und Anordnung zur Identifizierung und/oder Differenzierung von durch Sensoren angezeigten Stoffen in Gasgemischen sowie ein entsprechendes Computerprogramm und ein entsprechendes computerlesbares Speichermedium

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10330368A1 (de) * 2003-06-30 2005-02-03 Pronet Gmbh Verfahren und Anordnung zur Identifizierung und/oder Differenzierung von durch Sensoren angezeigten Stoffen in Gasgemischen sowie ein entsprechendes Computerprogramm und ein entsprechendes computerlesbares Speichermedium

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
DELEHANTY, James B. ; LIGLER, Frances S.: A microarray immunoassay for simultaneous detection of proteins and bacteria. In: Analytical Chemistry. 2002, Bd. 74, H. 21, S. 5681-5687. ISSN 0003-2700 *
DELEHANTY, James B. ; LIGLER, Frances S.: A microarray immunoassay for simultaneous detection of proteins and bacteria. In: Analytical Chemistry. 2002, Bd. 74, H. 21, S. 5681–5687. ISSN 0003-2700
KUSKE, Cheryl R. [u.a.]: Small-scale DNA sample preparation method for field PCR detection of microbial cells and spores in soil. In: Applied and Environmental Microbiology. 1998, Bd. 64, H. 7, S. 2463-2472. ISSN 0099-2240 *
KUSKE, Cheryl R. [u.a.]: Small-scale DNA sample preparation method for field PCR detection of microbial cells and spores in soil. In: Applied and Environmental Microbiology. 1998, Bd. 64, H. 7, S. 2463–2472. ISSN 0099-2240
WARSCHEID, Bettina [u.a.]: MALDI analysis of Bacilli in spore mixtures by applying a quadrupole ion trap time-of-flight tandem mass spectrometer. In: Analytical Chemistry. 2003, Bd. 75, H. 20, S. 5608-5617. ISSN 0003-2700 *
WARSCHEID, Bettina [u.a.]: MALDI analysis of Bacilli in spore mixtures by applying a quadrupole ion trap time-of-flight tandem mass spectrometer. In: Analytical Chemistry. 2003, Bd. 75, H. 20, S. 5608–5617. ISSN 0003-2700

Also Published As

Publication number Publication date
DE102008054345A1 (de) 2010-05-20

Similar Documents

Publication Publication Date Title
Verbeeck et al. Unsupervised machine learning for exploratory data analysis in imaging mass spectrometry
CN111062250B (zh) 基于深度特征学习的多受试者运动想象脑电信号识别方法
DE60130742T2 (de) Mustererkennung mit hierarchischen Netzen
CN105868793B (zh) 基于多尺度深度滤波器的极化sar图像分类方法
DE112018000349T5 (de) Visuelles Analysesystem für auf einem konvolutionalen neuronalen Netz basierte Klassifizierer
CN109376753B (zh) 一种三维空谱空间维像元类属概率计算方法
Zhang et al. Spatially aware clustering of ion images in mass spectrometry imaging data using deep learning
CN107844751A (zh) 引导滤波长短记忆神经网络高光谱遥感图像的分类方法
CN105139371A (zh) 一种基于pcnn与lp变换的多聚焦图像融合方法
CN115170961A (zh) 一种基于深度跨域少样本学习的高光谱图像分类方法及系统
Lavine et al. Search prefilters for library matching of infrared spectra in the PDQ database using the autocorrelation transformation
Dadon et al. Sequential PCA-based classification of mediterranean forest plants using airborne hyperspectral remote sensing
CN100464693C (zh) 基于像素的舌苔舌质颜色提取及分类方法
Gurubasava et al. Analysis of agricultural soil pH using digital image processing
DE102008054345B4 (de) Verfahren und Vorrichtung zur Detektion von Kampfstoffen
Kong et al. Texture based image recognition in microscopy images of diffuse gliomas with multi-class gentle boosting mechanism
CN113191206B (zh) 基于黎曼特征迁移的脑磁图信号分类方法、装置及介质
CN101216878A (zh) 基于广义非线性判别分析的人脸识别方法
DE102010046867A1 (de) Verfahren zur Klassifizierung von Mustern in Bilddatensätzen
Tuccitto et al. Revealing contamination and sequence of overlapping fingerprints by unsupervised treatment of a hyperspectral secondary ion mass spectrometry dataset
Pattanaik et al. ILCAN: a new vision attention-based late blight disease localization and classification
Chang et al. Fisher's linear spectral mixture analysis
CN115761256A (zh) 基于深度多层次表示学习的高光谱图像波段选择方法
CN111079850B (zh) 波段显著度的深度空谱联合高光谱图像分类方法
CN113311081A (zh) 基于三维液相色谱指纹的污染源识别方法及装置

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8122 Nonbinding interest in granting licences declared
8120 Willingness to grant licences paragraph 23
R016 Response to examination communication
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final

Effective date: 20131105

R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee

Effective date: 20140603