DE102020207364A1 - Vorrichtung und verfahren zum interaktiven ansehen und clustern von datensegmenten aus langen datenaufzeichnungen - Google Patents

Vorrichtung und verfahren zum interaktiven ansehen und clustern von datensegmenten aus langen datenaufzeichnungen Download PDF

Info

Publication number
DE102020207364A1
DE102020207364A1 DE102020207364.3A DE102020207364A DE102020207364A1 DE 102020207364 A1 DE102020207364 A1 DE 102020207364A1 DE 102020207364 A DE102020207364 A DE 102020207364A DE 102020207364 A1 DE102020207364 A1 DE 102020207364A1
Authority
DE
Germany
Prior art keywords
clusters
edss
display
rds
displaying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102020207364.3A
Other languages
English (en)
Inventor
Naoki Kobayashi
Masaharu Goto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Keysight Technologies Inc
Original Assignee
Keysight Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Keysight Technologies Inc filed Critical Keysight Technologies Inc
Publication of DE102020207364A1 publication Critical patent/DE102020207364A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • G06F16/287Visualization; Browsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/231Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0482Interaction with lists of selectable items, e.g. menus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • G06V10/7625Hierarchical techniques, i.e. dividing or merging patterns to obtain a tree-like representation; Dendograms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

Ein Verfahren zum Betreiben eines Datenverarbeitungssystems und eines computerlesbaren Mediums, das bewirkt, dass ein Datenverarbeitungssystem dieses Verfahren wie offenbart ausführt. Das Verfahren umfasst ein Bewirken, dass das Datenverarbeitungssystem eine Mehrzahl erster EDSs, die in eine Mehrzahl erster Cluster klassifiziert sind, und ein erstes RDS für jedes der Mehrzahl erster Cluster empfängt, und ein Anzeigen einer ersten Anzeige für jedes der ersten Cluster und ein RDS für jedes der ersten Cluster. Das Datenverarbeitungssystem empfängt Informationen von einem Benutzer, die ein oder mehrere der ersten Cluster spezifizieren, die weiter zu clustern sind, um eine spezifizierte Anzahl zweiter Cluster zu erreichen, in die das spezifizierte eine oder die mehreren ersten Cluster zu klassifizieren sind, und die ein zweites Clustern an den ausgewählten Clustern durchführt. Das Verfahren umfasst auch ein Anzeigen einer zweiten Anzeige, die eine Mehrzahl zweiter EDSs umfasst, die in die zweiten Cluster klassifiziert werden.

Description

  • Datenaufzeichnungssysteme sind nun dazu in der Lage, Datenmengen aufzuzeichnen, die so groß sind, dass die Zeit zum Durchsuchen der aufgezeichneten Daten durch serielles Lesen in den gespeicherten Daten bedeutsam wird. Übermäßig große Datensätze von einem Terabyte werden routinemäßig aufgezeichnet. Diese Datensätze können das Ergebnis einer Überwachung eines Stroms von Signalwerten, Bildern oder anderen Mengen von Interesse sein. In vielen Anwendungen von Interesse ist der Datenstrom aus einer Anzahl von Signalen von Interesse gebildet, die voneinander durch Hintergrunddaten getrennt sind. In der am 2. April 2019 eingereichten US-Patentanmeldung Nummer 16/373,343 ist ein System zum Vorverarbeiten eines derartigen Datenstroms ohne ausführliche vorherige Kenntnis des Signals von Interesse offenbart. Das Vorverarbeiten stellt eine Datenbank her, die Cluster ähnlicher Signale umfasst. Jedes Cluster ist gekennzeichnet durch ein repräsentatives Element dieses Clusters, die Anzahl von Elementen in dem Cluster und andere nützliche Informationen. Während dieses System das Datenvolumen, das nachvollzogen werden muss, um die Inhalte des Datenstroms zu verstehen, signifikant reduziert, stellt es immer noch Herausforderungen dar, den Datenstrom in Bezug auf die zugrunde liegenden Cluster zu verstehen, die für einen Benutzer wichtig sind.
  • Die Aufgabe der vorliegenden Erfindung besteht darin, ein Verfahren zum Betreiben eines Datenverarbeitungssystems und ein computerlesbares Medium mit verbesserten Charakteristika zu schaffen.
  • Diese Aufgabe wird gelöst durch ein Verfahren zum Betreiben eines Datenverarbeitungssystems gemäß Anspruch 1 oder ein computerlesbares Medium gemäß Anspruch 10.
  • Die vorliegende Erfindung umfasst ein Verfahren zum Betreiben eines Datenverarbeitungssystems und eines computerlesbaren Mediums, das bewirkt, dass ein Datenverarbeitungssystem dieses Verfahren ausführt. Das Verfahren läuft auf einem Datenverarbeitungssystem mit einer Benutzerschnittstelle und einer Anzeige. Das Verfahren umfasst ein Bewirken, dass das Datenverarbeitungssystem eine Mehrzahl erster extrahierter Datensegmente (EDSs), die in eine Mehrzahl erster Cluster klassifiziert sind, und ein erstes Referenzdatensegment (RDS) für jedes der Mehrzahl erster Cluster empfängt und ein Anzeigen, auf einer Region der Anzeige, einer ersten Anzeige für jedes der Mehrzahl erster Cluster und eines RDS für jedes der Mehrzahl erster Cluster. Das Verfahren umfasst auch ein Empfangen von Informationen von einem Benutzer, die eines oder mehrere der ersten Cluster spezifizieren, die weiter zu clustern sind, um eine spezifizierte Anzahl zweiter Cluster zu erreichen, in die das spezifizierte eine oder die mehreren ersten Cluster zu klassifizieren sind, und ein Durchführen eines zweiten Clusterns des einen oder der mehreren ersten Cluster. Das Verfahren umfasst ebenfalls ein Anzeigen einer zweiten Anzeige, die eine Mehrzahl zweiter EDSs umfasst, die als Ergebnis des zweiten Clusterns in die zweiten Cluster klassifiziert sind, auf einer ersten Anzeigeregion.
  • Bei einem Aspekt umfasst die erste Anzeige eine Anzahl von EDSs, die zu jedem der Mehrzahl erster Cluster gehören.
  • Bei einem weiteren Aspekt umfasst das zweite Clustern ein hierarchisches Clusterverfahren.
  • Bei einem weiteren Aspekt umfasst die erste Anzeige für jedes der Mehrzahl erster Cluster ein erstes RDS jedes der Mehrzahl erster Cluster, und eine Anzahl von EDSs, die zu jedem der Mehrzahl erster Cluster gehört, umfasst ein horizontales Anordnen und Anzeigen des ersten RDS und der Anzahl von EDSs in einem Format einer Mehrzahl von Feldern bzw. Kacheln für die Mehrzahl erster Cluster.
  • Bei einem weiteren Aspekt ist jedes der Felder durch einen horizontalen Anzeigebereich und einen vertikalen Anzeigebereich gekennzeichnet und wobei der horizontale und der vertikale Anzeigebereich derart unabhängig für jedes der Felder eingestellt werden, dass das erste RDS, das in diesem Feld angezeigt wird, im Wesentlichen den gesamten horizontalen und vertikalen Anzeigebereich belegt.
  • Bei einem weiteren Aspekt umfasst die erste Anzeige für jedes der Mehrzahl erster Cluster ein erstes RDS jedes der Mehrzahl erster Cluster, und eine Anzahl von EDSs, die zu jedem der Mehrzahl erster Cluster gehört, umfasst ein Anordnen und Anzeigen des ersten RDS und der Anzahl von EDSs in einem Format einer Mehrzahl listenformatierter Felder, die für die Mehrzahl erster Cluster vertikal angeordnet sind.
  • Bei einem weiteren Aspekt weist jedes der listenformatierten Felder die gleiche horizontale Skala auf.
  • Bei einem weiteren Aspekt weist jedes der listenformatierten Felder eine vertikale Skala auf, die für das diesem Feld zugeordnete RDS optimiert ist.
  • Bei einem weiteren Aspekt umfassen die Empfangsinformationen über erste Cluster, die als nächste Klassifizierungsziele aus der Mehrzahl erster Cluster ausgewählt werden, ein Anzeigen, auf einer zweiten Anzeigeregion, von RDSs all der ausgewählten ersten Cluster, um einander in einer gemeinsamen Amplitudenskala und in einer gemeinsamen Zeitskala zu überlappen.
  • Bei einem weiteren Aspekt umfassen die Empfangsinformationen über die ersten Cluster, die als nächste Klassifizierungsziele aus der Mehrzahl erster Cluster ausgewählt werden, ein Anzeigen, auf einer dritten Anzeigeregion, eines beliebigen der EDSs, die zu den ausgewählten ersten Clustern gehören.
  • Bei einem weiteren Aspekt umfasst ein Anzeigen, auf einer dritten Anzeigeregion, eines beliebigen der EDSs, die zu allen ausgewählten ersten Clustern gehören, durch Verwendung einer ersten Steuertaste nacheinander in der Reihenfolge der Zeitpunkte, zu denen die EDSs eingegeben wurden.
  • Bei einem weiteren Aspekt umfasst das Anzeigen der EDSs, die zu allen ausgewählten ersten Clustern gehören, durch Verwendung einer ersten Steuertaste nacheinander in der Reihenfolge der Zeitpunkte, zu denen die EDSs eingegeben wurden, ferner ein wiederholtes Anzeigen der EDSs, die zu allen ausgewählten ersten Clustern gehören, in einer Persistenzanzeige, wenn eine zweite Steuertaste gedrückt wird.
  • Bei einem weiteren Aspekt umfasst jedes der EDSs eine vektorwertige Zeitfunktion.
  • Bei einem weiteren Aspekt umfasst jedes der EDSs eine Mehrzahl von Bildern, die sich mit der Zeit verändern.
  • Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beigefügten Zeichnungen näher erläutert. Es zeigen:
    • 1 eine Datenstruktur, die bei einem Ausführungsbeispiel der vorliegenden Erfindung verwendet wird;
    • 2 die Komponenten eines Datenanalysesystems gemäß einem Ausführungsbeispiel der vorliegenden Erfindung;
    • 3 den Basisbildschirm, der verwendet wird, um mit dem Benutzer in einer EDS-Anzeigeeinheit 208 zu kommunizieren;
    • 4 ein Ausführungsbeispiel der Clusterauswahlunteranzeige 402, bei der der Listenmodus verwendet wird;
    • 5 ein Ausführungsbeispiel der vorliegenden Erfindung, bei dem eine EDS-Unteranzeige 412 durch eine Unteranzeige 712 ersetzt wird; und
    • 6 veranschaulicht eine mögliche Bildschirmanzeige für ein EDS.
  • Es wird eine Menge von Objekten betrachtet, bei denen jedes Objekt durch eine Signatur gekennzeichnet ist. Es werden zum Beispiel Objekte betrachtet, die Folgen aufgezeichneter Signalwerte sind, die irgendeine Extraktionsbedingung erfüllen, die zum Identifizieren der Objekte in dem aufzeichneten Strom verwendet wurde. Die einem Objekt entsprechende Signatur können die Signalwerte selbst, irgendeine Transformation der Signalwerte wie die Koeffizienten einer Fourier-Transformation des Signals als eine Zeitfunktion oder irgendeine andere Transformation der Signalwerte sein. Allgemein ist die einem Objekt entsprechende Signatur eine mehrwertige Größe; daher kann die Signatur als ein Vektor mit einer Mehrzahl von Komponenten angesehen werden.
  • In vielen Fällen liegt das Ziel des Clusterprozesses darin, Cluster von Objekten in einem Koordinatensystem zu entdecken, in dem jede Achse einer unterschiedlichen der Signaturkomponenten entspricht. Jedes Objekt kann als ein Punkt in jenem Koordinatensystem angesehen werden. Allgemein gibt es eine zwischen zwei Signaturen definierte Beziehung, die ein Maß der Ähnlichkeit der zwei Signaturen bereitstellt. Ein Cluster ist typischerweise als eine Gruppe von Objekten definiert, die einander nach einer Bewertung durch die Ähnlichkeitsmessung ähnlich sind.
  • Das Ähnlichkeitsmaß könnte zum Beispiel der Abstand zwischen den zwei Signaturen in dem Signaturraum sein. Alle Objekte, die ein Ähnlichkeitsmaß aufweisen, das geringer ist als irgendeine vorbestimmte Schwelle von einem der Objekte, werden dahin gehend definiert, in dem gleichen Cluster zu sein.
  • Die Art, in der die vorliegende Erfindung ihre Vorteile bereitstellt, ist unter Bezugnahme auf ein Datenerfassungssystem leichter verständlich, bei dem ein Signal in einem Eingangsdatenkanal digitalisiert und auf einem Speicherungsgerät wie einem Plattenlaufwerk gespeichert wird. Der Datenstrom kann dahin gehend betrachtet werden, Signale von Interesse zu enthalten, die durch einen „Extraktionsalgorithmus“ definiert sind, der eine Folge der Signalwerte identifiziert, die als das EDS von Interesse ist.
  • Allgemein muss ein Benutzer der aufgezeichneten Daten dazu in der Lage sein, die verschiedenen Signale in den Daten zu verstehen und Signale von Interesse wiederzugewinnen. Zum Zweck dieser Erörterung wird angenommen, dass der Benutzer keine eingehende Kenntnis aller Signale in dem Datenstrom von Interesse hat. Zusätzlich wird angenommen, dass die Anzahl von Datenstromsignalen zu groß ist, als dass der Benutzer sie einzeln überprüfen könnte. Daher muss der Benutzer dazu in der Lage sein, wichtige Merkmale von Signalen nachzuvollziehen, ohne den gesamten Datenstrom anzusehen. Zu diesem Zweck ist es wirkungsvoll, Cluster ähnlicher Signale zu definieren. Durch Untersuchen repräsentativer Teile derartiger Cluster kann der Benutzer bessere Kenntnis der Signale gewinnen, die aufgezeichnet werden, und die notwendigen Parameter spezifizieren, um Signale von Interesse wiederzuerlangen, und ausgewählte Cluster auf der Basis eines Ansehens der Signale kombinieren, die den Clustern entsprechen.
  • Die vorliegende Erfindung stellt einem Benutzer Hilfsmittel bereit, die es dem Benutzer ermöglichen, Cluster in der Sammlung von Signalen zu definieren, die auf der Basis eines Ähnlichkeitsalgorithmus aufgezeichnet wurden. Der Wahrscheinlichkeitsalgorithmus berechnet ein Wahrscheinlichkeitsmaß, das bezogen ist auf die Ähnlichkeit zwischen zwei Signalen. Algorithmen zum Clustern von Objekten auf der Basis eines Ähnlichkeitsmaßes sind im Stand der Technik bekannt. Leider ist die rechnerische Arbeitsbelastung, die bei einer Anwendung vieler dieser Algorithmen inhärent ist, von N2-ter Ordnung oder höher, wobei N die Anzahl von Signalen ist. Da ein aufgezeichneter Datenstrom mehrerer Terabytes mehr als mehrere Millionen Signale aufweisen kann, ist ein Clustern der aufgezeichneten Signale in einem Zeitabschnitt von Minuten oft nicht praktisch anwendbar, es sei denn, irgendein Mechanismus zum Reduzieren der Anzahl von Signalen, die auf einmal geclustert werden müssen, ist bereitgestellt.
  • Wie nachfolgend ausführlicher beschrieben wird, werden kleine Cluster von Signalen von Interesse während des Aufzeichnungsprozesses oder während der Wiedergabe eines Datenstroms detektiert, der zuvor aufgezeichnet wurde. Diese kleinen Cluster werden anschließend unter Verwendung der vorliegenden Erfindung kombiniert, um größere Cluster bereitzustellen, die mit den Clustern von Signalen in dem Eingangsdatenstrom zusammenfallen. Die kleinen Cluster werden erstellt, ohne dass eine ausführliche vorbestimmte Beschreibung der Signale, die zu Clustern sind, erforderlich ist. Idealerweise enthält jedes dieser Cluster einen Abschnitt eines einzelnen Clusters der zugrunde liegenden Signale, die in dem Eingangsdatenstrom vorliegen. Jedes Cluster wird an einem beobachteten Signal in dem Eingangsdatenstrom wie nachfolgend erörtert begonnen. Die Größe des Clusters wird durch einen Ähnlichkeitsalgorithmus bestimmt, der einen Schwellenwert umfasst, der bestimmt, ob ein zweites Signal in dem ersten Cluster enthalten sein soll wie ein erstes Signal. Die Art, in der die Cluster kombiniert werden oder in der ein Cluster in kleinere Cluster zerlegt wird, wird nachfolgend ausführlicher erörtert.
  • Um die folgende Erörterung zu vereinfachen, wird angenommen, dass die Signale von Interesse die Rohdatenwerte sind und die „Signatur“ für jedes Signal von Interesse der Vektor von Signalwerten ist. Andere Fälle werden nachfolgend ausführlicher erörtert. Es wird angenommen, dass der Datenstrom hauptsächlich aus einzelnen Signalen besteht, die durch Regionen getrennt sind, die keine Datensegmente von Interesse umfassen. Datenstromsegmente, die den Extraktionsalgorithmus erfüllen, werden als EDSs bezeichnet.
  • Idealerweise würde jedes EDS die Datenproben enthalten, die einem Signal von Interesse ohne Hintergrundproben entsprechen. Es besteht jedoch üblicherweise eine Notwendigkeit, das EDS in einem kurzen Zeitabschnitt zu identifizieren, und daher schränkt diese Notwendigkeit den Extraktionsalgorithmus ein. Es gibt zahlreiche rechnerisch effiziente Verfahren zum Detektieren des Beginns irgendeines Signals, das sich von dem im Stand der Technik bekannten Hintergrund unterscheidet. Zum Beispiel kann der Extraktionsalgorithmus nach einer steigenden oder fallenden Flanke suchen. Ein Detektieren des Punktes, an dem das Signal zum Hintergrundpegel zurückkehrt, ist jedoch rechnerisch komplexer, insbesondere bei Vorliegen von Rauschen. Dementsprechend wird ein Extraktionsalgorithmus, bei dem das Ende des Signals von Interesse als eine feste Anzahl von Proben relativ zu dem Anfang des Signals definiert ist, als Algorithmus zum Definieren eines EDS bevorzugt. Wenn zwei Signale tatsächlich gleich wären, würden die EDSs für die zwei Signale immer noch übereinstimmen. Daher wird bei einem exemplarischen Ausführungsbeispiel angenommen, dass der Datenstrom hauptsächlich aus einzelnen Signalen besteht, die durch Regionen getrennt sind, die keine Datensegmente von Interesse enthalten. Wenn diese Annäherung das abschließende Clustern stört, können die EDSs aus dem Langzeitspeicher wiedergewonnen und ein Clustern auf der Basis eines genaueren Endes des Signals kann verwendet werden.
  • Ein „Ähnlichkeitsmaß“ ist auch für die EDSs durch einen Ähnlichkeitsalgorithmus definiert. Das Ähnlichkeitsmaß reflektiert den Grad der Ähnlichkeit zwischen zwei beliebigen EDSs. Das Ähnlichkeitsmaß ermöglicht es dem System, extrahierte Datensegmente in Cluster von EDSs zu gruppieren, die einander ähnlich sind. Bei einem Aspekt umfasst der Ähnlichkeitsalgorithmus einen Schwellenwert. Falls das Ähnlichkeitsmaß eine vorbestimmte Beziehung mit einem Schwellenwert hat, werden die zwei EDSs dahin gehend definiert, einander ähnlich zu sein. Zum Beispiel könnten die zwei EDSs dahin gehend definiert werden, einander ähnlich zu sein, falls das Ähnlichkeitsmaß geringer als der Schwellenwert ist. EDSs, die einander ähnlich sind, werden in einem Cluster gruppiert.
  • Wenn ein neues EDS gefunden wird, bestimmt das System, ob das EDS Teil eines bereits gefundenen Clusters ist. Falls das EDS Teil eines vorhandenen Clusters ist, wird das vorhandene Cluster aktualisiert, um das Hinzufügen des neuen EDS reflektieren. Falls das EDS keinem der vorhandenen Cluster ausreichend ähnlich ist, wird ein neues Cluster definiert, und das EDS wird diesem Cluster hinzugefügt.
  • Jedes Cluster wird durch einen RDS dargestellt. Falls ein neues EDS einem vorhandenen RDS ähnlich ist, wird das neue EDS als zu dem durch dieses RDS dargestellte Cluster gehörend gekennzeichnet. Falls das neue EDS keinem der vorhandenen RDSs ähnlich ist, wird ein neues Cluster für dieses EDS definiert, und dieses EDS wird das RDS für das neue Cluster.
  • Es wird nun auf 1 verwiesen, die eine Datenstruktur veranschaulicht, die bei einem Ausführungsbeispiel der vorliegenden Erfindung verwendet wird. Die Datenstruktur 100 umfasst einen Block für jedes der oben beschriebenen extrahierten Cluster. Exemplarische Blöcke sind gezeigt 101-103. Jeder Block umfasst das dem entsprechenden Cluster zugeordnete RDS und andere Informationen über das Cluster, wie die Anzahl von EDSs in dem Cluster und Informationen über das Ähnlichkeitsmaß, das verwendet wird, um das Cluster zu erzeugen. Jeder Block umfasst auch die EDSs, die als dem RDS ähnlich erkannt wurden. Exemplarische EDSs sind bei 104-106 gezeigt. Die EDSs können als die entsprechende Zeichenfolge von Datenwerten oder als Zeiger auf eine Speicherstelle gespeichert werden, die die Rohdatenwerte enthält.
  • Während die oben beschriebenen Beispiele ein Verfahren zum Erfassen der Cluster von EDSs und des RDS bereitstellen, das jedem Cluster zugeordnet ist, können andere Verfahren zum Bereitstellen des repräsentativen EDS verwendet werden, das jedem Cluster entspricht. Das oben beschriebene RDS ist das erste EDS, das keinem vorhandenen Cluster zugeordnet werden konnte. Sobald jedoch ein Cluster definiert wurde, kann die Wahl eines RDS für dieses Cluster auf andere Weise bestimmt werden. Zum Beispiel kann das RDS durch ein statistisches Verfahren ausgewählt werden, das zum Beispiel ein Berechnen von Ähnlichkeiten zwischen allen EDS, die zu jedem Cluster gehören, beinhaltet, indem eine Bewertungsfunktion, zum Beispiel ein euklidischer Abstand, verwendet wird und ein RDS als das repräsentative EDS ausgewählt wird, indem Medianwerte dieser Ergebnisse genommen werden. Für die Zwecke der vorliegenden Offenlegung kann jedes Verfahren zum Definieren eines RDS für ein Cluster von EDSs verwendet werden.
  • Es wird nun auf 2 verwiesen, die die Komponenten eines Datenanalysesystems gemäß einem Ausführungsbeispiel der vorliegenden Erfindung veranschaulicht. Das Analysesystem 200 umfasst eine EDS-Erfassungseinheit 202, eine EDS-Analyseeinheit 204, eine EDS-Klassifizierungseinheit 206 und eine EDS-Anzeigeeinheit 208. Die EDS-Erfassungseinheit 202 ist dazu ausgebildet, einen Eingangsdatenstrom zu erfassen, aus dem die EDSs zu extrahieren sind. Die Quelle des Datenstroms könnte ein Messgerät oder eine Datenaufzeichnungseinrichtung sein, die einen zuvor aufgezeichneten Datenstrom wiedergibt. Die EDS-Erfassungseinheit 202 extrahiert die EDSs aus dem erfassten Eingang, klassifiziert die EDSs mit Hilfe der EDS-Klassifizierungseinheit 206 in vorläufige Cluster und speichert das Ergebnis in der in 1 gezeigten Speicherstruktur. Bei einem Aspekt der Erfindung wird eine Extraktionsbedingung verwendet, um Datensegmente zu identifizieren, aus denen EDSs werden sollen.
  • Die EDS-Anzeigeeinheit 208 arbeitet dahin gehend, Daten von der EDS-Analyseeinheit 204 zu empfangen und die Daten auf der Anzeige 210 anzuzeigen, die Teil der EDS-Anzeigeeinheit 208 ist. Die EDS-Anzeigeeinheit 208 ist auch dazu ausgebildet, eine Benutzereingabe, die die Art spezifiziert, in der die Daten anzuzeigen sind, und Anweisungen zu verschiedenen Verarbeitungsschritten zu empfangen, die ein erneutes Clustern der EDSs in den aktuellen Clustern umfasst.
  • Wenn zum Beispiel ansprechend auf das Ergebnis einer Klassifizierung eine Klassifizierung zum weiteren Eingrenzen der Klassifizierung erforderlich ist, teilt der Benutzer der EDS-Anzeigeeinheit 208 einen neuen Klassifizierungsparameter mit. Dann empfängt die EDS-Klassifizierungseinheit 206 die Anweisung, führt die Anweisung aus und aktualisiert die Informationen zu einem Cluster innerhalb einer Speicherregion, um dadurch das Ergebnis weiter einzugrenzen.
  • Bei einem exemplarischen Ausführungsbeispiel werden die EDSs von der EDS-Erfassungseinheit 202 vorläufig klassifiziert. Anschließend können ansprechend auf eine Benutzereingabe ein oder mehrere der Cluster verarbeitet werden, um ein besseres RDS für dieses Cluster zu finden, das Cluster in mehrere Cluster aufzuteilen oder Cluster zu kombinieren. Zusätzlich können die Cluster unter Verwendung des gleichen Ähnlichkeitsalgorithmus eines anderen Algorithmus hierarchisch kombiniert werden. Die EDSs können auch verarbeitet werden, um eine Signatur für jedes EDS in einem Cluster bereitzustellen, und unter Verwendung der Signaturen und eines anderen Ähnlichkeitsalgorithmus oder einer anderen Schwelle neu klassifiziert werden.
  • Es wird nun auf 3 verwiesen, die den Basisbildschirm veranschaulicht, der verwendet wird, um mit dem Benutzer in der EDS-Anzeigeeinheit 208 zu kommunizieren. Bildschirm 400 weist drei Unteranzeigen auf, die bei 402, 410 und 412 gezeigt sind. Die Clusterauswahlunteranzeige 402 wird als die Clusterauswahlunteranzeige bezeichnet. Die Clusterunteranzeige 410 wird als die ausgewählte Clusterunteranzeige bezeichnet, und die EDS-Unteranzeige 412 wird als die EDS-Anzeige bezeichnet.
  • Die Clusterauswahlunteranzeige 402 enthält eine Mehrzahl von Fenstern, eines für jedes der Cluster in der aktuellen Sammlung von Clustern. Die aktuelle Sammlung von Clustern kann neue Cluster umfassen, die aus den vorläufigen Clustern erzeugt wurden. Ein exemplarisches Fenster ist bei 408 gekennzeichnet. Bei diesem Beispiel umfasst jedes Fenster eine Anzeige des diesem Cluster zugeordneten RDS, ein Kontrollkästchen, das der Benutzer verwenden kann, um dieses Cluster auszuwählen, und Informationen über die Anzahl der EDSs in dem Cluster.
  • Das besondere Anzeigeformat für die Clusterauswahlunteranzeige 402 ist in einem herunterklappbaren Menü 404 spezifiziert. Bei diesem Beispiel wird eine Anzeige mit Feldern ausgewählt. Bei einer Anzeige mit Feldern umfassen die Fenster für jedes Cluster eine Anzeige des RDS für dieses Cluster in einem Format, das dahin gehend optimiert ist, innerhalb des Raums, der für jedes Fenster zugewiesen ist, die größte Detailgenauigkeit für das RDS bereitzustellen. Daher sind die vertikale und die horizontale Achse des Graphen des RDS dahin gehend eingestellt, im Wesentlichen gleich dem horizontalen und dem vertikalen Ausmaß des RDS zu sein. Folglich können zwei RDSs nicht notwendigerweise durch ein Vergleichen der Anzeigen in ihren jeweiligen Fenstern verglichen werden. Andere Anzeigeformate, die derartige direkte Vergleiche ermöglichen, werden nachfolgend erörtert.
  • Im Allgemeinen weist eine Anzeige mit Feldern eine Mehrzahl von Reihen und Spalten von Fenstern auf. Jede Zeile weist eine Mehrzahl von Fenstern auf. Wenn die Anzahl von Clustern mehr Reihen erfordert, als auf dem Anzeigeraum zur Verfügung stehen, können die Zeilen der Fenster gescrollt werden. Die Clusterauswahlunteranzeige umfasst auch ein Menü 406, das es dem Benutzer ermöglicht, die Zählung der Anzahl von Clustern zu spezifizieren, die in der Unteranzeige anzuzeigen sind, ohne die Zeilen der Unteranzeige zu scrollen.
  • Wie zuvor erwähnt, umfasst jedes Fenster in der Clusterauswahlunteranzeige 402 ein Kontrollkästchen, das es dem Benutzer ermöglicht, das Cluster auszuwählen, das diesem Fenster für eine weitere Verarbeitung entspricht. Jedes der ausgewählten Cluster wird in der ausgewählten Clusterunteranzeige 410 angezeigt. Die RDSs, die jedem der ausgewählten Cluster entsprechen, werden in einer überlappenden Anzeige angezeigt, bei der die gemeinsame überlappende horizontale Anzeigeachse für alle RDSs gleich ist und die vertikale Skala dahin gehend gewählt ist, auszureichen, um zu ermöglichen, dass alle ausgewählten RDSs in der Unteranzeige angezeigt werden. Daher kann der Benutzer die ausgewählten Cluster besser vergleichen.
  • Bei einem Aspekt der vorliegenden Erfindung kann der Benutzer spezifizieren, dass die ausgewählten Cluster unter Verwendung von hierarchischem Clustern zu einer bestimmten Anzahl von Clustern zu kombinieren sind. Bei einem Aspekt wird für jedes der neu erstellten Cluster ein neues RDS ausgewählt. Die neu erstellten Cluster werden dann der Liste von Clustern hinzugefügt, die in der Clusterauswahlunteranzeige 402 angezeigt wird, und die Cluster, die kombiniert wurden, um die neuen Cluster bereitzustellen, werden entfernt.
  • Bei einem weiteren Aspekt der Erfindung kann ein einzelnes Cluster ausgewählt werden, und die EDS-Klassifizierungseinheit 206 kann eine Anweisung von dem Benutzer empfangen, die EDSs dieses Clusters unter Verwendung eines neuen Ähnlichkeitsmaßes in mehrere Cluster neu zu klassifizieren. Zum Beispiel könnte der ursprüngliche Ähnlichkeitsalgorithmus mit einer restriktiveren Schwelle verwendet werden.
  • Bei einem weiteren Neuklassifizierungsbeispiel können die EDSs des ausgewählten Clusters analysiert werden, um einen genaueren Endpunkt zu finden als den Endpunkt, der bei der vorläufigen Datensegmentextraktion verwendet wird. Wie oben erwähnt, wählt der Extraktionsalgorithmus bei einem Aspekt eine vorbestimmte Anzahl von Datenproben relativ zu dem Auslöser aus, der die Extraktion initiiert hat. Bei diesem Aspekt wird jedes EDS untersucht, um zu bestimmen, ob eine genauere Schätzung der Anzahl der Proben, die sich tatsächlich in dem Segment von Interesse befinden, bestimmt werden kann. Die genauere Schätzung wird dann verwendet, um den Endpunkt des EDS zu definieren. Diese Analyse kann zu Clustern führen, bei denen die EDSs unterschiedliche Längen aufweisen. Die Längen können dann verwendet werden, um das Cluster in eine Anzahl von Clustern neu zu klassifizieren, wobei jedes neue Cluster eine Länge innerhalb eines Bereichs von Längen hat, wobei verschiedene Cluster unterschiedliche Bereiche aufweisen.
  • Die oben beschriebenen Anzeigen arbeiten an den RDSs, die jedem der Cluster zugeordnet sind. Während ein RDS auch ein EDS ist, können die anderen EDSs in einem Cluster für einen Benutzer bei dem Verständnis des Datenstroms von Bedeutung sein. Die EDS-Unteranzeige 412 ermöglicht es dem Benutzer, die einzelnen EDSs anzusehen, die zu dem ausgewählten Cluster gehören. Bei diesem Ausführungsbeispiel werden die EDSs einzeln nacheinander angezeigt. Jedes EDS weist eine eindeutige Kennung auf. Bei dem vorliegenden Beispiel ist die Kennung ein Zeitstempel, der die Zeit in dem Datenstrom darstellt, zu der dieses EDS erschienen ist. Daher weisen die EDSs eine Reihenfolge auf. Die EDSs werden in einer EDS-Unteranzeige angezeigt, indem ein EDS unter Verwendung der Kennung dieses EDS spezifiziert wird.
  • Ein detailliertes EDS wird auf Fenster 414 der EDS-Unteranzeige 412 angezeigt. Ein EDS-Positionsanzeiger 418 zeigt für ein aktuell angezeigtes EDS Informationen (0 Tage 00:00:15. 114.474.000) zu einem Startpunkt und Endpunkt in Bezug auf einen zeitlichen Ort im ursprünglichen Datenstrom und die Anzahl von Datenpunkten in dem EDS und einen zugehörigen Clusternamen (C5) an. Eine Zeitleiste 424 und ein Aktuelle-Position-Anzeiger 426 geben den Ort des aktuell angezeigten EDS in der Zeitleiste 424 durch den Aktuelle-Position-Anzeiger 426 an. Ein Pfeilsymbol 420 mit einem Dreieck links und ein Pfeilsymbol 422 mit einem Dreieck rechts sind Bewegungsanweisungstasten, die zum Bewegen der Position des Aktuelle-Position-Anzeigers 426 um ein EDS zu verwenden ist. Ferner sind auf einem Block 416 oben links auf der Unteranzeige Bedienungssteuertasten, nämlich „Wiedergabe rückwärts“, „ein EDS zurück“, „Stopp“, „ein EDS vor“ und „Wiedergabe“ von links in der angegebenen Reihenfolge vorgesehen, und diese Tasten können verwendet werden, um ein EDS an einer gewünschten Position anzuzeigen. Auf der detaillierten EDS-Unteranzeige 412 wird jedes der zu einem der ausgewählten Cluster gehörenden EDSs angezeigt, und die Bedienungsknöpfe, die durch den Block 416 dargestellt sind, können zum Anzeigen von „ein EDS vor“, „ein EDS zurück“, „wiederholte Wiedergabe aller EDSs“ oder „wiederholte Wiedergabe rückwärts aller EDSs“ verwendet werden.
  • Ein Symbol 428 spezifiziert, ob ein Ein-Bildschirm-Anzeigemodus oder ein Zwei-Bildschirme-Anzeigemodus für die EDS-Unteranzeige 412 aktiv ist. Der Zwei-Bildschirme-Anzeigemodus wird nachfolgend ausführlicher erörtert.
  • Bei dem in 3 dargestellten Ausführungsbeispiel wurde Region 408 von einer Anzeige mit Feldern der RDSs der Cluster befüllt. Bei der Titelanzeige wurden die horizontale und die vertikale Achse der Graphen gewählt, um die Details der RDSs zu maximieren. Daher sind die horizontalen und die vertikalen Skalen von Graph zu Graph verschieden. Während diese Anordnung die größte Sichtbarkeit für jedes RDS in dem verfügbaren Raum bereitstellt, kann es in einigen Anwendungen der Unterschied bei den Skalen für den Benutzer schwierig machen, die verschiedenen RDSs vollständig nachzuvollziehen. Um auf dieses Problem einzugehen, stellt die vorliegende Erfindung einen „Listenmodus“ bereit, bei dem die horizontalen Skalen von grafischer Darstellung zu grafischer Darstellung gleich sind.
  • Es wird nun auf 4 verwiesen, die ein Ausführungsbeispiel der Clusterauswahlunteranzeige 402 veranschaulicht, bei der der Listenmodus verwendet wird. Eine Listenanzeige 600 ersetzt das in 3 gezeigte Fenster 402. Der Klassifizierungsergebnisanzeigebildschirm 602 verwendet eine Listenanzeige, die durch Auswählen des Modus „Liste“ aus dem herunterklappbaren Menü 604 gewählt wurde. Die repräsentativen grafischen Darstellungen jeweiliger Cluster und die Anzahl von EDSs von Elementen der jeweiligen Cluster werden vertikal übereinstimmend in einem Format eines Anzeigens einer Liste in einer Weise angezeigt, die analog ist zu der oben unter Bezugnahme auf 3 beschriebenen. Da auf der Listenanzeige nicht alle neun Cluster gleichzeitig angezeigt werden können, wird auf der rechten Seite der Anzeige 608 eine Scroll-Leiste 607 angezeigt. Die Anzeige jedes Clusters umfasst ein Kontrollkästchen zum Kontrollieren, ob das Cluster ausgewählt werden soll oder nicht, ein RDS, eine Länge, die die Länge des RDS angibt, und die Anzahl (Refs) von in diesem Cluster enthaltenen EDSs. Die übrigen in 3 gezeigten Unteranzeigen arbeiten analog, wenn der Listenmodus ausgewählt ist, und daher sind diese Unteranzeigen in 4 nicht gezeigt.
  • Bei den oben beschriebenen Ausführungsbeispielen hat die detaillierte EDS-Unteranzeige 412 eine Einzelansicht eines einzelnen EDS angezeigt. Es können jedoch auch Ausführungsbeispiele erstellt werden, bei denen die EDS-Unteranzeige mehrere Anzeigen aufweist. Es wird nun auf 5 verwiesen, die ein Ausführungsbeispiel der vorliegenden Erfindung veranschaulicht, bei der eine EDS-Unteranzeige 412 durch die Unteranzeige 712 ersetzt wird. Um die Zeichnung zu vereinfachen, ist nur die EDS-Unteranzeige gezeigt, die übrigen Unteranzeigen arbeiten wie oben beschrieben.
  • Dieser Zwei-Fenster-Modus wird durch Anklicken eines Symbols ausgewählt, das bei 716 gezeigt ist. In diesem Zwei-Fenster-Anzeigemodus zeigt Fenster 714 das aktuell ausgewählte EDS an, das in der oben beschriebenen Weise unter Bezugnahme auf 3 ausgewählt wurde. Fenster 720 zeigt eine detaillierte Ansicht des Abschnitts 716 der Anzeige in Fenster 714, das von dem Benutzer unter Verwendung des Zeigegeräts ausgewählt wird, das der Benutzerschnittstelle zugeordnet ist.
  • Bei einem weiteren Aspekt der Erfindung kann der Benutzer ausgewählte EDSs wiederholt in einer überlagerten Anzeige ansehen, die es dem Benutzer ermöglicht, die EDSs chronologisch in einer Weise zu betrachten, die es dem Benutzer ermöglicht, zu beobachten, wie jedes EDS sich zu dem nächsten EDS in der Folge „entwickelt“. Bei diesem Ausführungsbeispiel wählt der Benutzer die Cluster aus, die die EDSs enthalten, die anzuzeigen sind. Dann werden die einzelnen EDSs des ausgewählten Clusters oder der ausgewählten Cluster angezeigt. Dieser Anzeigemodus ist analog zu einer Persistenzanzeige bei einem Oszilloskop.
  • Für die Zwecke der vorliegenden Offenlegung ist eine „Persistenzanzeige“ als eine Anzeige mit den nachfolgenden Eigenschaften definiert. Alle ausgewählten EDSs werden unter Verwendung der gleichen horizontalen und vertikalen Achsen angezeigt, als ob eine einzige überlappende Anzeige geschaffen würde. Jedes EDS wird jedoch für einen endlichen Zeitabschnitt auf diese Anzeige „gemalt“, in dem das EDS anfänglich für einen ersten Zeitabschnitt in einem Hochintensitätsmodus angezeigt wird und dann über Niedrigintensitätsanzeigen verblasst, bis es von dem Bildschirm verschwindet. Die Zeit, die benötigt wird, um jedes der einzelnen EDS-Anzeigen sequentiell zu initiieren, wird als ein Anzeigezyklus bezeichnet. Der Anzeigezyklus ist in N Anzeigeintervalle geteilt, wobei N die Anzahl anzuzeigender EDS ist. Bei Beginn jedes Intervalls startet das nächste EDS in der Folge seine Anzeige. Die Zeit, während der ein beliebiges gegebenes EDS auf dem Bildschirm sichtbar ist, ist länger als ein Anzeigeintervall; daher entwickelt sich die Anzeige von einem EDS zu dem nächsten EDS. Bei einem Aspekt sind die EDSs in der chronologischen Reihenfolge dargestellt, in der sie in dem ursprünglichen Datenstrom erschienen sind, und jedes EDS ist zumindest drei Anzeigeintervalle lang sichtbar.
  • Bei weiteren Ausführungsbeispielen kann der Benutzer die Reihenfolge auswählen, in der die EDSs angezeigt werden. Wenn die verschiedenen Cluster zum Beispiel unter Verwendung von hierarchischem Clustern weiter geclustert werden, können die RDSs für jedes Cluster in einer Reihenfolge angezeigt werden, die die Entwicklung der RDSs nach oben in dem hierarchischen Clusterbaum darstellt.
  • Bei den oben beschriebenen Ausführungsbeispielen war der Eingangsdatenstrom skalarer Natur. Das heißt, er besteht bei jedem Taktzyklus aus einem einzigen Wert. Die Lehren der vorliegenden Erfindung können jedoch auf Vektoreingangsdatenströme angewendet werden. Bei einem vektorbewerteten Eingangsdatenstrom gibt es für jeden Zeitpunkt eine Mehrzahl von Skalarwerten. Ein derartiger Datenstrom kann als eine Mehrzahl von Eingangsdatenkanälen dargestellt sein, bei denen jeder Kanal von einem ADU verarbeitet wird, um bei jedem Taktzyklus einen Eingangsvektor bereitzustellen. Bei einem anderen Beispiel wird die Mehrzahl von Datenpunkten für jeden Zeitpunkt durch ein Umwandeln eines skalarwertigen Eingangsstroms erzeugt. Zum Beispiel kann ein Zeitbereichseingangssignal in ein Frequenzbereichssignal umgewandelt werden, indem der Zeitbereichseingangsstrom mit einem Bandpassfilter gefiltert wird, um eine Amplitude einer Frequenzkomponente als eine Zeitfunktion zu erzeugen. Eine Mehrzahl derartiger Filter stellt einen dreidimensionalen Eingangsstrom bereit, bei dem die erste Dimension Zeit, die zweite Dimension eine Frequenz und die dritte Dimension eine Amplitude der Frequenzkomponente ist. Die Auslöserschaltung, die einen Start eines neuen EDS definiert, kann auf einem der Kanäle oder einer Mehrzahl der Kanäle arbeiten.
  • Die Benutzerschnittstelle der vorliegenden Erfindung kann auf derartige vektorbewerteten Eingangsströme angewendet werden, sofern ein geeignetes Format zum Anzeigen der resultierenden EDSs und RDSs definiert werden kann. In dem Fall eines vektorisierten Wertdatenstroms mit zwei Komponenten für jeden Zeitpunkt kann eine dreidimensionale Anzeige verwendet werden, bei der die erste Achse Zeit, die zweite Achse eine der zwei Komponenten und die dritte Achse eine dritte Komponente ist. Die dritte Achse kann als ein Dichtewert derart dargestellt werden, dass die resultierende Anzeige einem Foto ähnelt, wobei die Graustufe den dritten Wert darstellt. Alternativ könnte die Anzeige eine perspektivische Ansicht einer dreidimensionalen Oberfläche sein. In dem Fall eines Drei-Komponenten-Vektors kann die vierte Komponente derart als eine Farbe codiert sein, dass jeder Punkt in dem Bild sowohl eine Farbe als auch eine Intensität hat.
  • Bei einem weiteren Beispiel, bei dem der Datenstrom aus dreidimensionalen Objekten wie z. B. konventionellen Bildern besteht, kann die Zeitachse als eine Folge der Bilder dargestellt sein. Es wird auf 6 verwiesen, die eine mögliche Bildschirmanzeige für ein derartiges EDS veranschaulicht. EDS 800 wäre dann eine Folge aufeinanderfolgender Bilder 801-804, die irgendeine Extraktionsbedingung erfüllten wie z.B. einen Szenenwechsel. Eine vergrößerte Anzeige einer derartigen Bildreihe könnte ein einzelnes Bild oder Teil eines einzelnen Bilds sowie eine Teilmenge der Bildreihe sein. Es sei darauf hingewiesen, dass die oben erörterte vierdimensionale Anzeige auch als eine Reihe von dreidimensionalen Anzeigen implementiert werden könnte.
  • Eine Ähnlichkeitsfunktion zwischen zwei Bildern zum Clustern von Bildern könnte als Kreuzkorrelation zwischen den Bildern oder eine Kreuzkorrelation zwischen den zwei Bildern implementiert werden, wobei ein Bild gegenüber dem anderen Bild verschoben ist. Es sei ebenfalls darauf hingewiesen, dass eine Folge von Bildern ein Spezialfall eines vektorbewerteten Eingangsdatenstroms ist, bei dem jeder „Vektor“ NxM Komponenten aufweist, die die Pixel der NxM Pixelbilder sind.
  • Alle anderen oben beschriebenen Merkmale in Bezug auf die Ausführungsbeispiele, bei denen die RDSs als zweidimensionale Graphen angezeigt sind, können mit einer derartigen dreidimensionalen Anzeige anstelle der zweidimensionalen Anzeigen verwendet werden.
  • Es wird erneut auf 2 verwiesen. Während die EDS-Klassifizierungseinheit 206 getrennt von der EDS-Analyseeinheit 204 gezeigt ist, kann die EDS-Klassifizierungseinheit 206 als Teil eines Allzweckcomputers implementiert sein, wobei die EDS-Anzeigeeinheit 208 auch Teil dieses Allzweckcomputers ist. Der Speicherblock, der die Clusterinformationen speichert, kann in dem Speicher des Allzweckcomputers oder in externen Speicherungsgeräten implementiert sein, die mit diesem Rechner verbunden sind.
  • Die Implementierung der EDS-Erfassungseinheit 202 kann als ein analoger Eingangskanal zu dem gewöhnlichen Computer implementiert sein, wenn die Datenraten ausreichend niedrig sind. In dem Fall, in dem der Datenstrom in digitaler Form voraufgezeichnet wird, ist die EDS-Erfassungseinheit 202 bevorzugterweise ein Eingangskanal des Allzweckcomputers. Alternativ kann die EDS-Erfassungseinheit 202 analog zu dem Eingangsabschnitt eines Oszilloskops in separater Hardware implementiert sein. Eingangshardware von diesem Typ kann mehrere Abtast- und Digitalisierungsschaltungen umfassen, die parallel arbeiten und die daher zu sehr hohen Dateneingangsraten fähig sind.
  • Der konventionelle Computer kann auch vorteilhaft als ein Multiprozessor implementiert sein. Das Übereinstimmen der EDSs miteinander in den verschiedenen Vorgängen des Clusterns und erneuten Clusterns ist ein Prozess, der durch Verwenden eines Multiprozessors beschleunigt werden kann, da die Ergebnisse einer Übereinstimmung zwischen zwei EDSs parallel zu einer Übereinstimmung zwischen zwei anderen EDSs getragen werden können, ohne die Übereinstimmung mit den zwei ursprünglichen EDSs zu stören. Der Multiprozessor kann ein konventioneller Mehrkerncomputer oder eine Grafikverarbeitungskarte mit Tausenden von Kernen sein.
  • Die vorliegende Erfindung umfasst auch ein computerlesbares Medium, das Anweisungen speichert, die bewirken, dass ein Datenverarbeitungssystem das Verfahren der vorliegenden Erfindung ausführt. Ein computerlesbares Medium ist definiert als ein beliebiges Medium, das einen patentierbaren Gegenstand gemäß 35 U.S.C. 101 bildet, und schließt jedes beliebige Medium aus, das keinen patentierbaren Gegenstand gemäß 35 U.S.C. 101 bildet. Beispiele für derartige Medien umfassen nichtflüchtige Medien wie Computerspeichergeräte, die Informationen in einem Format speichern, das von einem Computer oder Datenverarbeitungssystem lesbar ist.
  • Die oben beschriebenen Ausführungsbeispiele der vorliegenden Erfindung wurden bereitgestellt, um verschiedene Aspekte der Erfindung zu veranschaulichen. Es ist jedoch davon auszugehen, dass verschiedene Aspekte der vorliegenden Erfindung, die in unterschiedlichen spezifischen Ausführungsbeispielen gezeigt sind, kombiniert werden können, um andere Ausführungsbeispiele der vorliegenden Erfindung bereitzustellen. Zusätzlich werden verschiedene Modifikationen der vorliegenden Erfindung aus der vorhergehenden Beschreibung und den begleitenden Zeichnungen ersichtlich. Dementsprechend ist die vorliegende Erfindung lediglich durch den Schutzumfang der nachfolgenden Ansprüche einzuschränken.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • US 16/373343 [0001]

Claims (15)

  1. Verfahren zum Betreiben eines Datenverarbeitungssystems mit einer Benutzerschnittstelle und einer Anzeige (210), um es einem Benutzer zu ermöglichen, eine Mehrzahl von EDSs zu analysieren, wobei das Verfahren folgende Schritte aufweist: Bewirken, dass das Datenverarbeitungssystem eine Mehrzahl erster EDSs, die in eine Mehrzahl erster Cluster klassifiziert sind, und ein erstes RDS für jedes der Mehrzahl erster Cluster empfängt; Anzeigen, auf einer ersten Anzeigeregion der Anzeige (210), einer ersten Anzeige für jedes der Mehrzahl erster Cluster und eines ersten RDS für jedes der Mehrzahl erster Cluster; Empfangen von Informationen von einem Benutzer, die ein oder mehrere der Mehrzahl erster Cluster spezifizieren, die weiter zu Clustern sind, um eine spezifizierte Anzahl zweiter Cluster zu erreichen, in die das spezifizierte eine oder die mehreren ersten Cluster zu klassifizieren sind; Durchführen eines zweiten Clusterns des einen oder der mehreren ersten Cluster; und Anzeigen, auf einer ersten Anzeigeregion, einer zweiten Anzeige, die eine Mehrzahl zweiter EDSs aufweist, die als Ergebnis des zweiten Clusterns in die zweiten Cluster klassifiziert sind.
  2. Verfahren gemäß Anspruch 1, bei dem die erste Anzeige eine Anzahl von EDSs aufweist, die zu jedem der Mehrzahl erster Cluster gehören.
  3. Verfahren gemäß einem der vorhergehenden Ansprüche, bei dem das zweite Clustern ein hierarchisches Clusterverfahren aufweist.
  4. Verfahren gemäß einem der vorhergehenden Ansprüche, bei dem die erste Anzeige für jedes der Mehrzahl erster Cluster ein erstes RDS jedes der Mehrzahl erster Cluster aufweist, und eine Anzahl von EDSs, die zu jedem der Mehrzahl erster Cluster gehören, ein horizontales Anordnen und Anzeigen des ersten RDS und der Anzahl von EDSs in einem Format einer Mehrzahl von Feldern für die mehreren ersten Cluster umfasst, und bei dem jedes der Felder durch einen horizontalen Anzeigebereich und einen vertikalen Anzeigebereich gekennzeichnet ist und bei dem der horizontale und der vertikale Anzeigebereich für jedes der Mehrzahl von Feldern derart unabhängig eingestellt sind, dass das in diesem Feld angezeigte erste RDS im Wesentlichen alle horizontalen und vertikalen Anzeigebereiche belegt.
  5. Verfahren gemäß einem der vorhergehenden Ansprüche, bei dem die erste Anzeige für jedes der Mehrzahl erster Cluster ein erstes RDS von jedem der Mehrzahl erster Cluster aufweist, und eine Anzahl von EDSs, die zu jedem der Mehrzahl erster Cluster gehören, ein Anordnen und Anzeigen des ersten RDS und der Anzahl von EDSs in einem Format einer Mehrzahl listenformatierter Felder umfasst, die für die Mehrzahl erster Cluster vertikal angeordnet sind.
  6. Verfahren gemäß Anspruch 5, bei dem jedes der Mehrzahl listenformatierter Felder die gleiche horizontale Skala aufweist.
  7. Verfahren gemäß Anspruch 6, bei dem jedes der Mehrzahl listenformatierter Felder eine vertikale Skala aufweist, die für das diesem Feld zugewiesene RDS optimiert ist.
  8. Verfahren gemäß einem der vorhergehenden Ansprüche, bei dem das Empfangen von Informationen über die ersten Cluster, die als nächste Klassifizierungsziele aus der Mehrzahl erster Cluster ausgewählt werden, ein Anzeigen, auf einer dritten Anzeigeregion, eines beliebigen der Mehrzahl von EDSs umfasst, die zu den ausgewählten ersten Clustern gehören, wobei das Anzeigen eines beliebigen der EDSs, die zu allen ausgewählten ersten Clustern gehören, auf einem dritten Anzeigebereich ein Anzeigen der EDSs, die zu allen ausgewählten ersten Clustern gehören, nacheinander durch Verwendung einer ersten Steuertaste umfasst, die die EDSs in einer Reihenfolge anzeigt, die durch einen Zeitpunkt bestimmt wird, zu dem die EDSs eingegeben wurden.
  9. Verfahren gemäß einem der vorhergehenden Ansprüche, wobei das Empfangen von Informationen über die ersten Cluster, die als nächste Klassifizierungsziele aus der Mehrzahl erster Cluster ausgewählt werden, ein Anzeigen, auf einer dritten Anzeigeregion, eines beliebigen der Mehrzahl von EDSs umfasst, die zu den ausgewählten ersten Clustern gehören, wobei das Anzeigen der EDSs, die zu allen ausgewählten ersten Clustern gehören, nacheinander durch Verwendung einer ersten Steuertaste ferner ein wiederholtes Anzeigen der EDSs, die zu allen ausgewählten ersten Clustern gehören, in einer Persistenzanzeige umfasst, wenn eine zweite Steuertaste gedrückt wird.
  10. Computerlesbares Medium, das Anweisungen enthält, die bewirken, dass ein Datenverarbeitungssystem ein Verfahren ausführt, wenn dasselbe in das Datenverarbeitungssystem geladen wird, wobei das Verfahren bewirkt, dass das Datenverarbeitungssystem es einem Benutzer ermöglicht, eine Mehrzahl von EDSs zu analysieren, wobei das Verfahren folgende Schritte aufweist: Bewirken, dass das Datenverarbeitungssystem eine Mehrzahl erster EDSs, die in eine Mehrzahl erster Cluster klassifiziert sind, und ein erstes RDS für jedes der Mehrzahl erster Cluster empfängt; Anzeigen, auf einer ersten Anzeigeregion einer Anzeige (210), die dem Datenverarbeitungssystem zugeordnet ist, einer ersten Anzeige für jedes der Mehrzahl erster Cluster und eines RDS für jedes der Mehrzahl erster Cluster; Empfangen von Informationen von einem Benutzer, die ein oder mehrere der Mehrzahl erster Cluster spezifizieren, die weiter zu clustern sind, um eine spezifizierte Anzahl zweiter Cluster zu erreichen, in die das spezifizierte eine oder die mehreren ersten Cluster zu klassifizieren sind; Durchführen eines zweiten Clusterns des einen oder der mehreren ersten Cluster; und Anzeigen, auf der ersten Anzeigeregion, einer zweiten Anzeige, die jeweils eine Mehrzahl zweiter EDSs aufweist, die als Ergebnis des zweiten Clusterns in die zweiten Cluster klassifiziert sind.
  11. Verfahren gemäß einem der Ansprüche 1 bis 9 oder computerlesbares Medium gemäß Anspruch 10, bei dem die erste Anzeige für jedes der Mehrzahl erster Cluster ein erstes RDS jedes der Mehrzahl erster Cluster aufweist, und eine Anzahl von EDSs, die zu jedem der mehreren ersten Cluster gehören, ein horizontales Anordnen und Anzeigen des ersten RDS und der Anzahl von EDSs in einem Format einer Mehrzahl von Felder umfasst für die mehreren ersten Cluster.
  12. Verfahren gemäß einem der Ansprüche 1 bis 9 oder computerlesbares Medium gemäß Anspruch 10, bei dem das Empfangen von Informationen über erste Cluster, die als nächste Klassifizierungsziele aus der Mehrzahl erster Cluster ausgewählt werden, ein Anzeigen von RDSs aller ausgewählten ersten Cluster auf einer zweiten Anzeigeregion umfasst, um einander in einer gemeinsamen Amplitudenskala und in einer gemeinsamen Zeitskala zu überlappen.
  13. Verfahren gemäß einem der Ansprüche 1 bis 9 oder computerlesbares Medium gemäß Anspruch 10, bei dem das Empfangen von Informationen über die ersten Cluster, die als nächste Klassifizierungsziele aus der Mehrzahl erster Cluster ausgewählt werden, ein Anzeigen eines beliebigen der EDSs, die zu den ausgewählten ersten Clustern gehören, auf einer dritten Anzeigeregion umfasst.
  14. Verfahren gemäß einem der Ansprüche 1 bis 9 oder computerlesbares Medium gemäß Anspruch 10, bei dem jedes der EDSs eine vektorbewertete Zeitfunktion aufweist.
  15. Verfahren gemäß einem der Ansprüche 1 bis 9 oder computerlesbares Medium gemäß Anspruch 14, bei dem jedes der EDS eine Mehrzahl von Bildern aufweist, die sich mit der Zeit ändern.
DE102020207364.3A 2019-07-01 2020-06-15 Vorrichtung und verfahren zum interaktiven ansehen und clustern von datensegmenten aus langen datenaufzeichnungen Pending DE102020207364A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/459,425 2019-07-01
US16/459,425 US11100365B2 (en) 2019-07-01 2019-07-01 Apparatus and method for interactively viewing and clustering data segments from long data recordings

Publications (1)

Publication Number Publication Date
DE102020207364A1 true DE102020207364A1 (de) 2021-01-07

Family

ID=73919603

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102020207364.3A Pending DE102020207364A1 (de) 2019-07-01 2020-06-15 Vorrichtung und verfahren zum interaktiven ansehen und clustern von datensegmenten aus langen datenaufzeichnungen

Country Status (3)

Country Link
US (1) US11100365B2 (de)
CN (1) CN112183179A (de)
DE (1) DE102020207364A1 (de)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11429616B2 (en) * 2019-04-02 2022-08-30 Keysight Technologies, Inc. Data recording and analysis system
US11879943B1 (en) 2021-05-31 2024-01-23 Keysight Technologies, Inc. Method and apparatus for predicting failure of a component

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8131722B2 (en) * 2006-11-20 2012-03-06 Ebay Inc. Search clustering
JP2009042962A (ja) 2007-08-08 2009-02-26 Nikon Corp 検索システム
US10013641B2 (en) 2009-09-28 2018-07-03 Oracle International Corporation Interactive dendrogram controls
US9020271B2 (en) * 2012-07-31 2015-04-28 Hewlett-Packard Development Company, L.P. Adaptive hierarchical clustering algorithm
CN104090957A (zh) * 2014-03-10 2014-10-08 中国科学院软件研究所 一种异构网络可交互可视化方法
US9465917B2 (en) * 2014-05-30 2016-10-11 Roche Diabetes Care, Inc. Hazard based assessment patterns
US20150356160A1 (en) * 2014-06-05 2015-12-10 Deutsche Bank Ag System and method for facilitating interactive data visualization and manipulation
US10102281B2 (en) * 2014-10-16 2018-10-16 Accenture Global Services Limited Segmentation discovery, evaluation and implementation platform
US9558572B2 (en) 2014-12-18 2017-01-31 Business Objects Software Ltd. Visualization of data clusters
US10877997B2 (en) * 2017-06-28 2020-12-29 International Business Machines Corporation Clustering database data
US11036470B2 (en) * 2017-10-30 2021-06-15 Keysight Technologies, Inc. Method for analyzing the performance of multiple test instruments measuring the same type of part
US11194842B2 (en) * 2018-01-18 2021-12-07 Samsung Electronics Company, Ltd. Methods and systems for interacting with mobile device
CN108399267B (zh) * 2018-03-27 2020-04-14 东北大学 一种基于簇语义特征分析的反馈式聚类方法
US11176589B2 (en) * 2018-04-10 2021-11-16 Ebay Inc. Dynamically generated machine learning models and visualization thereof

Also Published As

Publication number Publication date
CN112183179A (zh) 2021-01-05
US20210004639A1 (en) 2021-01-07
US11100365B2 (en) 2021-08-24

Similar Documents

Publication Publication Date Title
EP2089886B1 (de) Verfahren zur zeitlichen segmentierung eines videos in videobildfolgen und zur auswahl von keyframes für das auffinden von bildinhalten unter einbeziehung einer subshot-detektion
DE112017002821T5 (de) Verfahren, System und Computerprogrammprodukt zur interaktiven Identifizierung von gleichen Personen oder Objekten in Videoaufnahmen
DE69021477T2 (de) Rekonstruktion redigierter digitaler Audiodateien.
DE102006034088A1 (de) Anzeigevorrichtung, Anzeigeprogrammspeichermedium und Anzeigeverfahren
DE102020207364A1 (de) Vorrichtung und verfahren zum interaktiven ansehen und clustern von datensegmenten aus langen datenaufzeichnungen
DE102007041893A1 (de) Verfahren zur Detektion und/oder Verfolgung von bewegten Objekten in einer Überwachungsszene mit Störern, Vorrichtung sowie Computerprogramm
DE102020101344A1 (de) Interaktive instrumenten-messanalytik
DE69120499T2 (de) Bildverbesserung in Videosichtgeräten
DE60007633T2 (de) Inhalt-basierte wiedergabe von seriendaten
DE102019133685A1 (de) Informationsverarbeitungssystem und -verfahren
DE102014208464A1 (de) Digitales Oszilloskop und Verfahren mit paralleler Akquisition und Signalnachverarbeitung
DE102019123005A1 (de) System und verfahren zur anzeige des objektbewegungsschemas
DE69938282T2 (de) Verfahren und Vorrichtung zum Erfassen von lokalen Videomerkmalen
DE2719175A1 (de) Schallanalysiereinrichtung
DE10027822B4 (de) Unterdrückung von Datenabtastwerten
DE3622222A1 (de) Zeichenerkennung in zweidimensionalen signalen
DE60313695T2 (de) Identifizierung von Testkanälen und damit zusammenhängenden Signal-Informationen innerhalb eines Datenaugen-Ausschnitts
DE102022117146A1 (de) Nutzungsorientierte komprimierung für datenströme aus einem test- und messinstrument
DE102007013958A1 (de) Rundfunkempfangsvorrichtung
DE19956625C2 (de) Echtzeit-Datensortierung und -reduktion
DE19951188B4 (de) Verfahren und Einrichtung zur Aufzeichnung von Impulssignalen
EP2082331A1 (de) Verfahren und vorrichtung zur inkrementierung von in speicherzellen eines speichers gespeicherten zählerständen
DE102019215765A1 (de) System zur datenaufzeichnung und -analyse
DE102014203090A1 (de) Verfahren zur Identifizierung einer kristallographischen Kandidatenphase eines Kristalls
DE4101169C2 (de) Meßverfahren zur komprimierten grafischen Darstellung von digital registrierten seismologischen Daten

Legal Events

Date Code Title Description
R012 Request for examination validly filed