-
Die Erfindung betrifft ein Verfahren zur Anordnung in einem Speicher befindlicher Dateninstanzen, vorzugsweise gleichen und/oder ähnlichen Datentyps, besonders bevorzugt von Audiodaten, mittels einer Datenverarbeitungsanlage bzw. -einrichtung. Darüber hinaus betrifft die Erfindung ein Programmprodukt zur Ausführung des oben genannten Verfahrens. Schließlich betrifft die Erfindung eine Datenverarbeitungsanlage bzw. -einrichtung zur Ausführung des oben genannten Verfahrens mittels des oben genannten Programmprodukts.
-
Mit Hilfe aktueller Datenverarbeitungsanlagen bzw. Datenverarbeitungseinrichtungen, wie insbesondere modernen Computersystemen, also beispielsweise Personal Computern (PCs), Laptops, Client-Server-Systemen, Mobiltelefonen und ähnlichem, lassen sich mit geringem Aufwand große Datenbestände verwalten. Bei den Daten handelt es sich üblicherweise um digitale Daten. Bei den Dateninstanzen handelt es sich insbesondere um Dateien, Datensätze oder Vergleichbares. Solche Datenbestände weisen dabei in der Regel eine Vielzahl sogenannter Dateninstanzen auf.
-
Die Dateninstanzen werden bzw. sind üblicherweise als einzelne Objekte in einem computerlesbaren Dateisystem eines Speichersystems abgelegt. Alternativ oder damit kombiniert können die Dateninstanzen aber beispielsweise auch als sogenannte Datensätze in einer Datenbank abgelegt sein.
-
Die Dateninstanzen bzw. deren Inhalt sind dabei häufig vorzugsweise gleichen und/oder ähnlichen Datentyps. Zur Vereinfachung wird im Folgenden der Begriff ”Dateninstanz” synonym mit deren eigentlichem Inhalt, also den Daten selber, verwendet. Dabei sollen die Dateninstanzen in der hier verwendeten Bezeichnungsweise vorzugsweise einen identischen oder zumindest ähnlichen bzw. vergleichbaren Datentyp aufweisen. Als Beispiel für hier zu betrachtende Dateninstanzen seien hier insbesondere Audiodaten genannt, also beispielsweise Musikstücke, Klänge oder beliebige andere Tondokumente, wie Geräusche oder ähnliches. Im vorliegenden Fall handelt es sich dabei also insbesondere um (Daten-)Instanzen des Datentyps ”Audiodaten”. Insbesondere liegen Audiodaten dabei in Form einzelner Audiodateien vor.
-
Jede Dateninstanz entspricht dabei vorzugsweise einer Audiodatei bzw. einem Audiodatensatz. Viele Computerbenutzer besitzen dabei heutzutage große Sammlungen von Audiodateien mit häufig wenigstens einigen hundert oder auch mehr als einigen tausend Stück. Diese sind typischerweise als rohe Audiodaten (WAV-Daten) und/oder als komprimierte Audiodaten, insbesondere in Formaten wie MP3, OGG, oder ähnlichem, vorhanden.
-
Die Audiodateien sind dabei üblicherweise auf einem Festspeicher eines modernen Computersystems abgelegt, also beispielsweise einer Festplatte, einem Flashspeicher oder ähnlichem. Auf solchen aktuell verfügbaren Festspeichern lassen sich aufgrund der großen Kapazitäten auch wesentlich größere Sammlungen vorhalten. Alternativ oder ergänzend können die Dateninstanzen beispielsweise auch zumindest teilweise in einem Netzwerk oder auf anderen Datenträgern, wie beispielsweise CDs, DVDs, USB-Sticks oder auch anderen Speicherkarten, abgelegt werden.
-
Um bei großen Datenmengen bzw. einer großen Anzahl von Dateien bzw. Dateninstanzen den Überblick zu behalten und/oder um Dokumente auffinden zu können, werden üblicherweise sogenannte Suchalgorithmen implementiert. Ein Suchalgorithmus ist ein insbesondere in einem Computerprogramm kodiertes Verfahren zur Suche nach Daten nach vorherbestimmten Kriterien.
-
Insbesondere bei Audiodaten arbeiten die Suchalgorithmen im Allgemeinen zumindest primär mit zusätzlichen Informationen, die beispielsweise als Bezeichnung vorhanden, also insbesondere als Name der Datei bzw. des Datensatzes, als zusätzliche Information in die jeweilige Dateninstanz integriert oder auf andere Weise angeordnet sind. Solche Zusatzinformationen werden im Allgemeinen auch als ”Metadaten” bezeichnet. Nach diesen Zusatzinformationen bzw. Metadaten lassen sich einzelne Dateninstanzen, beispielsweise über eine klassische Recherche nach Suchbegriffen, auffinden. Dabei wird zumeist von einem Benutzer wenigstens ein Suchbegriff bzw. Suchwort eingegeben, nach dem die Datenverarbeitungsanlage die Metadaten durchsucht. Eventuelle Treffer werden dann an den Benutzer gemeldet.
-
Aber auch eine Suche nach unterschiedlichen, zumeist rein technischen Eigenschaften der Dateninstanzen selber, wie beispielsweise der Abspiellänge oder dem Umfang bzw. Speicherplatz der zugeordneten Daten bzw. Inhalte, ist grundsätzlich möglich. Dazu werden die entsprechenden zu suchenden bzw. zu filternden Eigenschaften als Suchkriterium eingegeben. Ein entsprechendes Suchergebnis kann dann ermittelt werden. Gegebenenfalls kann dann eine Anzahl mit den Suchkriterien übereinstimmender Dateninstanzen ausgegeben werden.
-
Nachteilig an den bekannten Verfahren ist jedoch, dass die eigentlichen Inhalte der Dateninstanz, nämlich insbesondere die Klänge, Geräusche bzw. Musikstücke selber, bevorzugt in Bezug auf Ähnlichkeiten, ebenso wie die angeordneten dabei nur eingeschränkt über Suchbegriffe Berücksichtigung finden können. Im Übrigen ist im Vorhinein zumeist eine korrekte Zuordnung von Zusatzinformationen als Metadaten zu den einzelnen Dateninstanzen erforderlich, um entsprechend eine erfolgreiche Suche durchführen und die Suchergebnisse übersichtlich darstellen zu können.
-
Der vorliegenden Erfindung liegt die Aufgabe zugrunde, ein Verfahren zur Anordnung in einem Speicher befindlicher Dateninstanzen anzugeben. Mit diesem Verfahren soll vorzugsweise eine auf dem Inhalt der Dateninstanzen selber basierende, für den Benutzer komfortable Anordnung der Dateninstanzen insbesondere mit einer Suchmöglichkeit nach bzw. Vergleichsmöglichkeit der Dateninstanzen ermöglicht werden.
-
Die Aufgabe der Erfindung wird durch ein Verfahren gemäß Anspruch 1 gelöst.
-
Um dementsprechend mittels einer Datenverarbeitungseinrichtung allgemein Daten und hier die Dateninstanzen anordnen, bearbeiten und/oder durchsuchen zu können, befinden sich diese in einem Speicher der Datenverarbeitungsanlage bzw. werden diesem zugeführt. Vorzugsweise werden sie dazu zunächst in den Speicher, vorzugsweise einen Arbeitsspeicher, besonders bevorzugt einen schnellen flüchtigen Speicher, wie beispielsweise einem Direktzugriffsspeicher oder RAM (Random Access Memory), der Datenverarbeitungsanlage eingelesen. Dies geschieht beispielsweise durch Auslesen eines Festspeichers, und/oder anderen Datenträgers, durch direkte Aufnahme bzw. Digitalisierung von Dokumenten, durch Herunterladen aus einem Netzwerk oder ähnlichem. Die Dateninstanzen sind dabei bevorzugt vom gleichen und/oder ähnlichen Datentyp, besonders bevorzugt handelt es sich dabei zumindest überwiegend um Audiodaten. Im Folgenden wird, wie oben beschrieben, zur Vereinfachung der eigentliche Inhalt der Dateninstanzen mit den Dateninstanzen selber sprachlich gleichgesetzt, also synonym verwendete.
-
Zur Anordnung der Dateninstanzen wird bevorzugt eine Reihe von Schritten durchgeführt. Zunächst wird, in einem ersten Schritt a), eine aktuelle Anordnung der Dateninstanzen relativ zueinander ermittelt und/oder festgelegt. Die Anordnung erfolgt vorzugsweise in einem ein- oder mehrdimensionalen Raum, insbesondere in einer zweidimensionalen Fläche und/oder Ebene. Diese aktuelle Anordnung kann neu festgelegt werden, und/oder bereits aus einer bereits erfolgten Anordnung vorgegeben sein und/oder bevorzugt beim Einlesen der Dateninstanzen in den Speicher vorgegeben werden. Beispielsweise kann hierzu eine regelmäßige, insbesondere gitterförmige Anordnung vorgegeben werden. In einem nächsten Schritt b) wird in Bezug auf eine bzw. relativ zu wenigstens einer ausgewählten bzw. selektierten Dateninstanz eine direkte Ähnlichkeit der bzw. aller übrigen Dateninstanzen ermittelt. Dies bedeutet, dass insbesondere durch Vergleich zumindest einer Eigenschaft die relative Ähnlichkeit aller übrigen Dateninstanzen im direkten Vergleich zu dieser wenigstens einen selektierten Dateninstanz ermittelt wird. In einem weiteren Schritt c) wird ausgehend von der aktuellen Anordnung der Dateninstanz eine modifizierte Anordnung der Dateninstanz ermittelt und/oder festgelegt. Dazu wird vorzugsweise die oben beschriebene, direkte Ähnlichkeit zu der wenigstens einen selektierten Dateninstanz berücksichtigt. Diese modifizierte Anordnung der Dateninstanzen wird schließlich als neue aktuelle Anordnung verwendet. Der Vorteil dieses Verfahrens ist, dass, ausgehend von einer aktuellen Anordnung bzw. einer Ausgangssituation durch gezielte Auswahl bzw. Selektion einer Dateninstanz, auf einfache Weise die Ähnlichkeit aller übrigen Dateninstanzen zu dieser selektierten Dateninstanz ermittelt wird. Im Übrigen lässt sich vorzugsweise auch mehr als eine Dateninstanz auswählen bzw. selektieren. In diesem Fall werden die direkten Ähnlichkeiten zu allen selektierten Dateninstanzen vorzugsweise separat berechnet und in die Änderung der Anordnung der Dateninstanzen einbezogen. Somit lässt sich die Ähnlichkeit auch in Bezug auf mehrere ausgewählte Dateninstanzen parallel ermitteln.
-
Insbesondere solche Vergleiche der Inhalte der Dateninstanzen, also vorzugsweise der Audiodaten selber, beispielsweise im Rahmen einer Suche nach (zueinander) ähnlichen Dokumenten, sind bei den aus dem Stand der Technik bekannten Verfahren nur sehr eingeschränkt möglich.
-
Bei einer bevorzugten Ausbildung des Verfahrens wird die aktuelle Anordnung der Dateninstanzen relativ zueinander entsprechend ihrer insbesondere relativen Ähnlichkeit ermittelt und/oder festgelegt. Die Anordnung erfolgt vorzugsweise in dem ein- oder mehrdimensionalen Raum, bevorzugt in der zweidimensionalen Fläche bzw. Ebene. Bevorzugt wird die Anordnung proportional zur relativen Ähnlichkeit vorgenommen. Vorzugsweise wird zumindest ein insbesondere erstes Ähnlichkeitsmaß für die insbesondere relative Ähnlichkeit der Dateninstanzen zueinander ermittelt. Dies bedeutet vorzugsweise, dass die relative Ähnlichkeit aller Dateninstanzen zueinander berechnet wird. Das insbesondere erste Ähnlichkeitsmaß dient weiter bevorzugt zur Ermittlung zumindest einer ersten bzw. initialen Anordnung der Dateninstanzen. Dabei wird weiter bevorzugt nach dem Einlesen der Dateninstanzen insbesondere die relative Lage und/oder der relative Abstand der Dateninstanz zueinander festgelegt. Demnach kann das Ähnlichkeitsmaß dazu dienen, eine erste aktuelle Anordnung der Dateninstanzen festzulegen. Ausgehend davon wird dann vorzugsweise in einem nächsten Schritt des Verfahrens die direkte Ähnlichkeit der übrigen Dateninstanzen zu der, einer der bzw. den selektierten Dateninstanz vorzugsweise wie oben beschrieben ermittelt. Auch bezüglich der direkten Ähnlichkeit wird bevorzugt ein insbesondere zweites Ähnlichkeitsmaß ermittelt bzw. berechnet. Vorzugsweise wird das Ähnlichkeitsmaß bzw. werden die Ähnlichkeitsmaße mittels einer vorzugsweise mehrdimensionalen Projektion berechnet. Dabei werden weiter bevorzugt mehrere aus den Eigenschaften der Dateninstanzen, insbesondere deren Inhalts ermittelte Parameter berücksichtigt. Somit kann das Ähnlichkeitsmaß bzw. können die Ähnlichkeitsmaße insbesondere als Grundlage für eine erste (initiale), und/oder weitere Anordnung der Dateninstanzen, und/oder vorzugsweise einen Vergleich derselben miteinander, bzw. für eine Ermittlung von Ähnlichkeiten aller Dateninstanzen dienen. Zur Anordnung können die möglichen Positionen im Raum bzw. der Fläche als diskrete Werte vorgegeben sein. Dies bedeutet insbesondere, dass die Dateninstanzen nicht beliebig, sondern nur an bestimmten vorgegebenen Stellen des Raumes angeordnet werden können, beispielsweise an insbesondere regelmäßig angeordneten Gitterpunkten.
-
Die Anordnung kann insbesondere durch eine tatsächliche Positionierung der Dateninstanzen an entsprechenden Stellen bzw. Punkten des Raums bzw. der Fläche erfolgen. Dazu ist vorzugsweise eine entsprechende, den Raum bzw. die Fläche repräsentierende Datenstruktur vorhanden, vorzugsweise als Netz- oder Gitterstruktur. Die Dateninstanzen werden dann vorzugsweise an entsprechenden Stellen bzw. Gitterpunkten der Datenstruktur positioniert bzw. abgelegt. Insbesondere wird alternativ oder ergänzend die Anordnung durch Zuweisung entsprechender Positionierungsinformationen zu der jeweiligen Dateninstanz vorgenommen.
-
Die eigentlichen Positionierungsinformationen können insbesondere den einzelnen Dateninstanzen direkt zugeordnet werden oder auch vorzugsweise in einer separaten Datenstruktur, wie einer Tabelle, einer Datenbank, einem neuronalen Netz oder ähnlichem, gespeichert werden. Dazu können vorzugsweise Koordinaten in dem Raum bzw. der Ebene bezogen auf wenigstens einen Koordinatenursprung als Bezugspunkt verwendet werden. Besonders bevorzugt werden hierzu der Abstand und/oder die relative Position und/oder die vorzugsweise relative Lage zu anderen Dateninstanzen in dem ein- oder mehrdimensionalen Raum bzw. der zweidimensionalen Ebene zugrundegelegt. Die relative Anordnung erfolgt bevorzugt abhängig vom Grad der Ähnlichkeit, insbesondere proportional dazu. Dies bedeutet, dass Dateninstanzen mit größerer Ähnlichkeit in einem geringeren Abstand oder Distanz bzw. in einer größere Nähe angeordnet werden. Die relative Lage der einzelnen Dateninstanzen zueinander in einem mehrdimensionalen Raum bzw. einer zweidimensionalen Ebene wird insbesondere durch die relative Ähnlichkeit einer Mehrzahl von Dateninstanzen zueinander ermittelt. Dementsprechend können die Dateninstanzen auch im Raum verteilt sein. Vorzugsweise wird hierzu aber wenigstens ein weiteres Kriterium, wie beispielsweise eine Eigenschaft der Dateninstanzen zugrundegelegt, beispielsweise die Abspieldauer einer Audiodatei oder ähnliches.
-
Die Netzstruktur kann insbesondere nach Art eines neuronalen Netzes, also vorzugsweise ähnlich dem Aufbau und/oder der Funktionsweise eines menschlichen und/oder tierischen Gehirn, ausgebildet sein. Die einzelnen Knotenpunkte bzw. ”Neuronen” sind vorzugsweise lernfähig ausgebildet. Somit können insbesondere Ähnlichkeiten der Dateninstanzen symbolisierende Verknüpfungen zu benachbarten Knoten hergestellt und auch wieder entfernt werden. Weiter bevorzugt wird die Anordnung durch Ermittlung und Speicherung entsprechender Positionierungsinformationen vorgenommen. Dann werden statt der Dateninstanzen lediglich Verweise mit entsprechenden Positionierungsinformationen gespeichert. Somit wird insgesamt eine netzartige Struktur gebildet. Die Verknüpfungen und/oder Verweise auf die Dateninstanzen sind dabei bevorzugt mit deren jeweiligen Daten verbunden, können also auch separat gespeichert werden.
-
Insbesondere wird bei einer Änderung der Anordnung der Dateninstanzen, also vorzugsweise einer Lageänderung bzw. Bewegung der wenigstens einen selektierten Dateninstanz relativ zu den übrigen Dateninstanzen, zumindest eines der vorzugsweise das zweite Ähnlichkeitsmaß neu berechnet. Alternativ oder zusätzlich wird damit ebenfalls die Anordnung zumindest eines Teils der, vorzugsweise aller übrigen Dateninstanzen verändert, insbesondere in Abhängigkeit vom Grad ihrer direkten Ähnlichkeit zu der selektierten Dateninstanz. Besonders bevorzugt erfolgt eine Änderung der Anordnung durch eine Bewegung in Richtung der selektierten Dateninstanz. Dabei sind Stärke und Richtung der Änderung der Anordnung, insbesondere der Bewegung bzw. Positionsänderung der übrigen Dateninstanzen, bevorzugt vom Grad der Ähnlichkeit zu der selektierten Dateninstanz abhängig. Besonders bevorzugt werden dabei die Dateninstanzen um so mehr bzw. stärker bewegt, je größer ihre Ähnlichkeit mit der selektierten Dateninstanz ist. Dies bedeutet, dass anhand der Änderung der Anordnung und insbesondere Stärke der Bewegung der Dateninstanzen in Richtung der selektierten Dateninstanz deren Ähnlichkeit direkt ablesbar ist, da sie damit korreliert. Eine besondere Weiterbildung des Verfahrens sieht vor, dass die Ähnlichkeit der Dateninstanzen bzw. das erste und/oder das zweite Ähnlichkeitsmaß in vorzugsweise regelmäßiger zeitlicher Abfolge, besonders bevorzugt zumindest im Wesentlichen kontinuierlich ermittelt bzw. berechnet wird bzw. werden. Insbesondere erfolgt eine Neuberechnung zumindest bei Veränderung an wenigstens einer der Dateninstanzen bzw. an der Anordnung der Dateninstanzen. Damit ist sichergestellt, dass die Anordnung der Dateninstanzen jederzeit dem aktuellen Zustand der Dateninstanzen einerseits und der direkten Ähnlichkeit in Bezug auf selektierte Dateninstanz andererseits entspricht.
-
Bevorzugt wird jede der Dateninstanzen durch ein Symbol repräsentiert. Diese Symbole werden vorzugsweise mittels einer Anzeigeeinheit visuell, insbesondere graphisch dargestellt. Weiter bevorzugt werden die Symbole entsprechend der Anordnung der Dateninstanzen angeordnet bzw. dargestellt. Die Darstellung erfolgt besonders bevorzugt auf einer insbesondere ebenen, vorzugsweise ein- oder mehrdimensionalen, besonders bevorzugt zweidimensionalen Oberfläche. Hierzu eignet sich insbesondere ein bevorzugt berührungsempfindlicher Bildschirm, aber auch andere geeignete Anzeigeeinheiten sind denkbar. Durch die bevorzugt zweidimensionale Darstellung können einerseits die Ähnlichkeiten der Dateninstanzen durch gegenseitige Abstände und andererseits durch eine relative Lage zueinander in der Fläche bzw. in der Ebene dargestellt werden. Weiter bevorzugt werden die Dateninstanzen bzw. die Symbole zumindest zum Teil mit einem Stellvertreter der Dateninstanzen bzw. deren Inhalts, hier in Form einer Wellenform dargestellt. Wellenformen zeichnen sich im Allgemeinen durch einen zickzackartigen Linienverlauf aus. Die Wellenform ist dabei hier insbesondere zumindest als nahezu kreisförmig angeordnete bzw. verlaufende Kurve ausgebildet. Sie ist hier besonders bevorzugt als geschlossene Bahn der Wellenform ausgebildet. Dies bedeutet, dass die Wellenform sich auf einer zumindest nahezu kreisförmigen, geschlossenen Bahn erstreckt. Bevorzugt korrespondiert die Wellenform mit der Dateninstanz bzw. mit deren Inhalt, also vorzugsweise den Daten, besonders bevorzugt den Audiodaten selber. Die Wellenform repräsentiert dabei insbesondere den Verlauf wenigstens einer Eigenschaft der Audiodaten über die Länge der Aufzeichnung, wie die Lautstärke, Dynamik, etc. Damit werden indirekt die Daten repräsentiert bzw. dargestellt. Die enthaltenen Daten, vorzugsweise die Audiodaten, werden damit repräsentiert. Insbesondere wird die Wellenform um eine vorzugsweise zentrale Drehachse rotierend angezeigt. Dabei rotiert das Symbol bzw. die Wellenform weiter bevorzugt in Abhängigkeit von wenigstens einer Eigenschaft der Dateninstanz bzw. deren Inhalt unterschiedlich schnell. Als hierfür zu berücksichtigende Eigenschaften kommen beispielsweise die Länge, die Dynamik oder ähnliches der Daten der Dateninstanz in Betracht. Je länger beispielsweise die Spieldauer einer Dateninstanz ist, desto schneller (oder alternativ langsamer) wird sie um die vorzugsweise zentrale Achse gedreht. Dabei rotiert die Wellenform vorzugsweise in der Ebene der Darstellung, also insbesondere der zweidimensionalen Ebene. Für andere berücksichtigte Parameter gilt entsprechendes.
-
Die wenigstens eine selektierte Dateninstanz wird vorzugsweise durch einen Benutzer ausgewählt. Dazu dient vorzugsweise wenigstens eine insbesondere graphische Benutzerschnittstelle bzw. Eingabeeinheit. Insbesondere ist (ebenfalls) wenigstens ein Anzeigegerät, wie beispielsweise ein Bildschirm, vorgesehen, insbesondere mit dem Eingabegerät gekoppelt, sodass eine Benutzereingabe bzw. Bedienung vorgenommen werden kann. Weiter bevorzugt erfolgt die Anordnung der Dateninstanzen und/oder deren Darstellung vorzugsweise in direkter zeitlicher Folge auf die Selektion bzw. die Bewegung einer der Dateninstanzen. Somit kann insbesondere eine zumindest im Wesentlichen kontinuierliche Veränderung erreicht werden. Vorzugsweise wird die Anordnung der Dateninstanzen aufgrund einer Selektion einer oder mehrerer Dateninstanzen vorgenommen.
-
Die eingangs gestellte Aufgabe wird außerdem durch ein Programmprodukt bzw. ein Computerprogrammprodukt gemäß Anspruch 9 gelöst. Das Programmprodukt ist zur Ausführung des oben beschriebenen Verfahrens vorgesehen, wenn es auf einer programmtechnisch eingerichteten Datenverarbeitungsanlage abläuft. Als Datenverarbeitungsanlage bzw. Datenverarbeitungseinrichtung kommt insbesondere ein Rechner bzw. Computer, wie ein PC, ein Mobiltelefon, ein Laptop, ein Client-Server-System und dergleichen in Betracht.
-
Schließlich wird die eingangs gestellte Aufgabe durch eine Datenverarbeitungsanlage bzw. eine Datenverarbeitungseinrichtung gemäß Anspruch 10 gelöst. Demnach eignet sich beispielsweise eine wie oben beschriebene Datenverarbeitungsanlage zur Ausführung des oben beschriebenen Verfahrens, wobei vorzugsweise ein in einem der Datenverarbeitungsanlage zugeordneten Speicher hinterlegtes Programmprodukt, wie es oben ebenfalls beschrieben ist, Verwendung findet.
-
Die oben an verschiedenen Stellen genannte Datenverarbeitungsanlage weist vorzugsweise einen Rechner, bevorzugt eine Zentraleinheit auf, die für die Verarbeitung der Daten ausgebildet und/oder vorgesehen und/oder verantwortlich ist. Alternativ kann aber auch die Datenverarbeitung bzw. Auswertung extern erfolgen, insbesondere mittels eines separaten Rechners, der vorzugsweise über ein Netzwerk und/oder eine Leitung und/oder kabellos angebunden ist. Der Rechner bzw. die Zentraleinheit dient bevorzugt der Ermittlung von Ähnlichkeiten bzw. der Berechnung von Ähnlichkeitsmaßen. Dazu werden die Dateninstanzen zunächst in einem der Zentraleinheit zugeordneten Speicher abgelegt bzw. werden in einen solchen eingelesen. Insbesondere wird die Anordnung der Dateninstanzen entsprechend Ihrer Ähnlichkeit durch die Zentraleinheit vorgenommen. Dies kann einerseits bei einer ersten Anordnung auf Basis der relativen Ähnlichkeiten erfolgen. Andererseits kann diese aber ebenso entsprechend der direkten Ähnlichkeit bezüglich einer selektierten Dateninstanz ermittelt werden. Zur Selektion einer Dateninstanz ist ein Eingabegerät, wie eine Zeigevorrichtung, insbesondere eine Computermaus, ein berührungsempfindlicher Bildschirm oder ähnliches, vorhanden. Dabei ist vorzugsweise eine Anzeigeeinheit, wie beispielsweise ein Bildschirm oder ähnliches, zur visuellen Darstellung der Anordnung der Dateninstanzen vorgesehen. Die Anzeigeeinheit und/oder das Eingabegerät sind dabei mit dem Rechner bzw. der Zentraleinheit gekoppelt.
-
Ein bevorzugtes Ausführungsbeispiel der Erfindung wird im Folgenden anhand der Zeichnung näher beschrieben. In dieser zeigen:
-
1 eine Anzahl von Dateninstanzen in einer regelmäßigen Anordnung,
-
2 die nach dem Grad ihrer Ähnlichkeit umsortierten Dateninstanzen der 1,
-
3 die umsortierte Anordnung der Dateninstanzen gemäß 2 mit einer selektierten Dateninstanz,
-
4 eine Darstellung gemäß der 3 mit einer farblichen Hervorhebung der zu der selektierten Dateninstanz ähnlichen Dateninstanzen,
-
5 eine in Bezug auf die direkte Ähnlichkeit mit der selektierten Dateninstanz umsortierte Anordnung gemäß der 3,
-
6 ein erstes Beispiel einer Bewertung einer selektierten Dateninstanz basierend auf der Anordnung der 2,
-
7 ein zweites Beispiel einer Bewegung einer selektierten Dateninstanz basierend auf der Anordnung der 2,
-
8 ein drittes Beispiel einer Bewegung einer selektierten Dateninstanz basierend auf der Anordnung der 2,
-
9 ein Ablaufdiagramm für das hier beschriebene Verfahren, und
-
10 eine Datenverarbeitungsanlage mit einem Anzeigegerät und einem Eingabegerät mit als Symbol in Form von Wellenformen dargestellten Dateninstanzen.
-
Eine in den 1 bis 8 skizzierte Anzeigeeinheit 10 ist in der 10 dargestellt. Die Anzeigeeinheit 10 ist Teil einer Benutzerschnittstelle. Sie dient demnach der Bedienung durch eine Person, insbesondere einem Benutzer der Datenverarbeitungsanlage. Als weiterer Teil der Benutzerschnittstelle ist eine Eingabeeinheit 12, hier in Form einer Computermaus, vorgesehen. Sie kann beispielsweise durch eine Tastatur und/oder einen berührungsempfindlichen Bildschirm ergänzt oder ersetzt sein.
-
Zur Verarbeitung der Daten ist eine Zentraleinheit 14 abgebildet. Auf der Anzeigeeinheit 10 werden durch die Zentraleinheit 14 eine Vielzahl von Symbolen 20 dargestellt. Jedem Symbol 20 ist eine Dateninstanz zugeordnet. Im vorliegenden Fall handelt es sich bei den Dateninstanzen jeweils um Audiodaten, d. h. bei jeder Dateninstanz um jeweils eine Audiodatei bzw. einen Audiodatensatz. Es lassen sich grundsätzlich aber auch andere Datentypen berücksichtigen und/oder mehrere mit einem Symbol zusammengefasste Dateninstanzen.
-
Die Anordnung und Umsortierung der Dateninstanzen bzw. Symbole erfolgt hier im Folgenden nur beispielhaft. Es folgt keine tatsächliche Auswertung von Daten. Die Symbole 20 werden außerdem im Folgenden zum Teil mehrfach mit zusätzlichen Bezugszeichen versehen, um die Zuordnung bzw. Bezugnahme zu vereinfachen.
-
Die Symbole 20 sind in der 1 in einem regelmäßigen, d. h. hier in einem rechteckigen Gitter angeordnet, dargestellt. Dieser Zustand kann beispielsweise direkt nach dem Einlesen zu den Symbolen 20 gehörenden Dateninstanzen vorgesehen sein. Das (erste) bzw. initiale Anordnen wird auch als Schritt A bezeichnet, wie auch in 9 zu sehen ist.
-
In einem nächsten Schritt werden die Dateninstanzen entsprechend ihrer relativen Ähnlichkeit angeordnet. Dazu muss zunächst die Ähnlichkeit aller anzuordnenden Dateninstanzen ermittelt werden. Dazu wird ein Ähnlichkeitsmaß in Form einer mehrdimensionalen Projektion berechnet über alle zu betrachtenden Dateninstanzen als sogenannte relative Ähnlichkeit. Dies führt beispielsweise zu einer Anordnung gemäß 2. Die Symbole 20 sind hier gegenüber der ursprünglichen Anordnung gemäß 1 nach ihrer relativen Ähnlichkeit umsortiert worden. Dabei stehen kleinere Abstände zwischen den Symbolen 20 für größere Ähnlichkeiten der zugehörigen Daten. Dieser Schritt des Berechnens und Umsortierens bzw. Reorganisierens wird auch als Schritt B bezeichnet.
-
Als nächstes erfolgt die Auswahl bzw. die Selektion einer Dateninstanz, beispielsweise durch einen Benutzer. Dies wird durch den Benutzer beispielsweise durch Auswahl eines der Symbole 20 mit Hilfe der Eingabeeinheit 12 bzw. einer entsprechenden Zeigeeinrichtung erreicht. Die entsprechend selektierte Dateninstanz wird nun als ausgewähltes Symbol 22 dargestellt. Dieser Schritt der Auswahl wird auch als Schritt C bezeichnet.
-
Ausgehend von dem ausgewählten Symbol 22 wird nun die direkte Ähnlichkeit der Dateninstanzen zu den übrigen, nicht ausgewählten Symbolen 20 zu diesem selektierten Symbol 22 ermittelt. Dies wird üblicherweise durch die Zentraleinheit 14 vorgenommen. Einige der Dateninstanzen weisen zumindest keinerlei Ähnlichkeiten mit der durch das ausgewählte Symbol 22 repräsentierten Dateninstanz auf. Die entsprechenden Symbole 20 werden hier im gezeigten Beispiel nicht gesondert hervorgehoben. Dagegen werden Ähnlichkeiten zu der selektierten Dateninstanz aufweisenden Dateninstanzen hier durch fettgedruckt hervorgehobene Symbole 24 markiert. Für diese Symbole 24 bzw. zugehörigen Dateninstanzen wird das entsprechend berechnete Ähnlichkeitsmaß auf eine mehr oder weniger große Ähnlichkeit zu der selektierten Dateninstanz mit dem ausgewählten Symbol 22 hindeuten. Dieser Schritt der Ermittlung der direkten Ähnlichkeit wird auch als Schritt D bezeichnet.
-
Aufgrund der (direkten) Ähnlichkeit der durch die Symbole 20, 24 repräsentierten Dateninstanz zu der durch das ausgewählte Symbol 22 repräsentierten Dateninstanz erfolgt als nächstes eine Modfizierung der Anordnung der Symbole 24. Die Symbole 24 werden dazu, wie in 5 gegenüber 4 zu sehen ist, in Richtung des ausgewählten Symbols 22 verschoben. Dabei entspricht die Stärke der Verschiebung dem Grad der Ähnlichkeit der jeweils zugehörigen Dateninstanzen. Insbesondere das hier zusätzlich als ähnliches Symbol 26 bezeichnete Symbol 20 weist im vorliegenden Fall offensichtlich eine große Ähnlichkeit zu dem ausgewählten Symbol 22 auf. Dementsprechend ist die Bewegung in dessen Richtung wesentlich größer als beispielsweise bei den Symbolen 27. Zur besseren Verdeutlichung sind hier die (unähnlichen) nicht bewegten Symbole 27 grau schattiert dargestellt.
-
In den 6 bis 8 sind drei Beispiele für Bewegungen verschiedener ausgewählter Symbole 22, 32, 42 entlang von Trajektorien 28, 38, 48 dargestellt. Das jeweils ausgewählte Symbol 22, 32, 42 wird entsprechend im Bereich der Anzeigeeinheit 10 mittels der Eingabeeinheit 12 bewegt. Das jeweils ausgewählte Symbol 22, 32, 42 wird dementsprechend verlagert. Das ausgewählte Symbol 22, 32, 42 wird dabei entlang der jeweiligen Trajektorie 28, 38, 48 zu einer neuen Position 29, 39, 49 des ausgewählten Symbols 22, 32, 42, bewegt. Aufgrund der zumindest im Wesentlichen kontinuierlichen Berechnung bzw. Ermittlung der direkten Ähnlichkeit der zu dem jeweils ausgewählten Symbol 22, 32, 42 ähnlichen Symbole 24, 34, 44 erfolgt deren Bewegung einhergehend bzw. nachgelagert zu der Bewegung des ausgewählten Symbols 22, 32, 42 an die neue Position 29, 39, 49. Die nicht oder nur gering ähnlichen Symbole 27, 37, 47 werden nicht bewegt. Sie sind hier grau dargestellt.
-
Da im vorliegenden Fall in den 6, 7 und 8 jeweils unterschiedliche ausgewählte Symbole 22, 32 bzw. 42 an neue Positionen 29, 39, 49 bewegt werden, werden verschiedene Symbole 24, 34, 44 zu jeweils ähnlichen Dateninstanzen mit dem jeweiligen ausgewählten Symbol 22, 32, 42 mitbewegt. Je nach Grad der Ähnlichkeit mit dem jeweiligen ausgewählten Symbol 22, 32, 42 sind die Abstände bzw. die zurückgelegten Entfernungen entsprechend unterschiedlich. Die nicht oder nicht ausreichend ähnlichen Dateninstanzen werden als Symbole 27, 37, 47 nicht mitbewegt.
-
In der 9 ist ein skizzenhaftes Ablaufdiagramm für das hier beschriebene Verfahren dargestellt. Es umfasst hier Schritte A, B, C, D, E und F, die aber zum Teil auch bei der Umsetzung des Verfahrens fehlen können, ohne gravierend vom Kern des Verfahrens bzw. von der Aufgabenlösung abzuweichen. Schritt A betrifft das Darstellen der Dateninstanzen. Daran anschließend werden die Ähnlichkeiten der Dateninstanzen berechnet und die Anordnung bzw. die Darstellung entsprechend modifiziert als Schritt B. Die Selektion einer Dateninstanz durch einen Benutzer ist hier als Schritt C bezeichnet. Darin schließt sich die Ermittlung direkter Ähnlichkeiten als Schritt D an. Die Repositionierung der Dateninstanzen bzw. die Veränderung der Anordnung ist hier als Schritt E dargestellt. Schließlich ist die Verschiebung der selektierten Dateninstanz und die Anpassung der übrigen Dateninstanzen als Schritt F bezeichnet.
-
In den 1 bis 8 sind die Symbole 20 als Dokumentensymbole bzw. Karteikarten dargestellt. Dagegen zeigt die 10 Wellenformen 50 als Symboldarstellung. Die Wellenformen 50 sind dabei als unterschiedliche, im Wesentlichen kreisförmig geschlossene Figuren bzw. Bahnen mit zickzackartigen Verläufen dargestellt. Die Wellenform 50 repräsentiert dabei eine Eigenschaft der zugeordneten Dateninstanz, nämlich hier die Dynamik der Audiodaten im Verlauf über im Wesentlichen die jeweilige gesamte Spieldauer.
-
Ein Pfeil 52 skizziert beispielhaft eine Drehrichtung 52 einer der Wellenformen 50 um eine zentrale Drehachse 54. Die Drehrichtung 52 kann aber auch umgekehrt sein. Je Wellenform 50 ist hier eine eigene Drehachse 54 vorgesehen. Die Drehachse 54 ist dazu zumindest nahezu in der Mitte bzw. im Zentrum der Wellenform 50 angeordnet. Die Drehachse 54 verläuft hier senkrecht zur Zeichenebene und zeigt dementsprechend in diese hinein bzw. aus dieser heraus.
-
Die Drehgeschwindigkeit der Wellenform 50 ist hier nicht dargestellt. Sie kann beispielsweise von einzelnen oder mehreren Eigenschaften der durch das jeweilige Symbol 20 zu einer Dateninstanz repräsentierten Daten abhängen, beispielsweise von der (Abspiel-)Länge der dargestellten Audiodaten, dem Datenumfang, dem Tempo oder ähnlichem. Die Wellenform 50 selber repräsentiert dabei vorzugsweise eine graphische Darstellung der Dynamik bzw. Lautstärke der dargestellten Audiodatei.
-
Das (Computer-)Programmprodukt 18 wird in einem Speicher 16 der Zentraleinheit 10 einer Datenverarbeitungsanlage 11 eingelesen und von diesen ausgeführt.
-
Mit Hilfe des hier beschriebenen Verfahrens werden demnach Suchvorgänge ermöglicht bzw. lassen sich Ähnlichkeiten in einer Menge von Dateninstanzen gleichen oder ähnlichen Typs auf einfache Weise ermitteln und als Anordnung der die Dateninstanzen repräsentierten Symbole 20 darstellen. Ausgehend von einer (initialen) Anordnung der Dateninstanz wird durch Selektion wenigstens einer Dateninstanz durch einen Benutzer die Berechnung der Ähnlichkeit aller übrigen Dateninstanzen zu dieser selektierten Dateninstanz durchgeführt. Dann wird die Anordnung der Dateninstanzen derart modifiziert, dass zu der selektierten Dateninstanz ähnliche Dateninstanzen entsprechend dem Grad der Ähnlichkeit zu dieser hinbewegt werden. Eine Bewegung der selektierten Dateninstanz führt zu einer Mitbewegung der zu dieser ähnlichen Dateninstanzen. Die Verarbeitung des Programmprodukts 18 zur Ausführung des Verfahrens erfolgt durch eine Datenverarbeitungsanlage 11.
-
Bezugszeichenliste
-
- 10
- Anzeigeeinheit
- 11
- Datenverarbeitungsanlage
- 12
- Eingabeeinheit
- 14
- Zentraleinheit
- 16
- Speicher
- 18
- (Computer)Programmprodukt
- 20
- Symbol
- 22
- ausgewähltes Symbol
- 24
- (ähnliches) Symbol
- 26
- (ähnliches) Symbol
- 27
- (unähnliches) Symbol
- 28
- Trajektorie
- 29
- neue Position
- 32
- ausgewähltes Symbol
- 34
- (ähnliches) Symbol
- 37
- (unähnliches) Symbol
- 38
- Trajektorie
- 39
- neue Position
- 42
- ausgewähltes Symbol
- 44
- (ähnliches) Symbol
- 47
- (unähnliches) Symbol
- 48
- Trajektorie
- 49
- neue Position
- 50
- Wellenform
- 52
- Drehrichtung
- 54
- Drehachse