WO2015028497A1 - Datenauswertung und -analyse basierend auf mehrdimensionalen baeumen und erweiterung der suchanfragen - Google Patents

Datenauswertung und -analyse basierend auf mehrdimensionalen baeumen und erweiterung der suchanfragen Download PDF

Info

Publication number
WO2015028497A1
WO2015028497A1 PCT/EP2014/068146 EP2014068146W WO2015028497A1 WO 2015028497 A1 WO2015028497 A1 WO 2015028497A1 EP 2014068146 W EP2014068146 W EP 2014068146W WO 2015028497 A1 WO2015028497 A1 WO 2015028497A1
Authority
WO
WIPO (PCT)
Prior art keywords
search
categories
target
data
responses
Prior art date
Application number
PCT/EP2014/068146
Other languages
English (en)
French (fr)
Inventor
Christoph VON GLEICHEN
Original Assignee
Dataforce Verlagsgesellschaft Für Business Informationen Mbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dataforce Verlagsgesellschaft Für Business Informationen Mbh filed Critical Dataforce Verlagsgesellschaft Für Business Informationen Mbh
Publication of WO2015028497A1 publication Critical patent/WO2015028497A1/de

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion

Definitions

  • the invention relates to a method for evaluating and displaying data according to the preamble of claim 1 and to an analysis system according to claim 10.
  • Such methods or analysis systems are used in particular for the evaluation of large amounts of data.
  • the method is often implemented in software known as Bl-Tools, which provides access for appropriately trained users.
  • the data must first be categorized in order to be used for evaluation, for example in generic terms and categories. This achieves a structuring of the data on the basis of hierarchies and enables a simplified evaluation.
  • a search request is made by the user, wherein the search request includes a target size and the specification of the categories in which searched shall be.
  • the target size indicates what is being searched for. For example, these are key indicators, known as KPI's.
  • the search response is then a target value, that is usually a specific numerical value or a percentage indication of the target size in the or the corresponding categories.
  • search response For a more specific specification and limitation of the search response, a combination of categories can also be used in the search query. With multidimensional structures, relatively complex search queries result. Due to the high degree of complexity, the problem arises of making mistakes in the creation of search queries, which can thus lead to a search response which does not fit into the context and thus to a misinterpretation of the data.
  • Another problem is that it is only possible to search for concrete, ie known, target values. An inaccurate knowledge of the target values can therefore lead to the result that the correct search response can not be determined or at least several attempts are required until the correct search response is obtained. On the one hand, this is time-consuming and, by making many unnecessary search queries, results in an unnecessary load on the system, for example a server, as is generally used to integrate a database in which the data is stored.
  • the invention is based on the object to avoid the disadvantages of the prior art and in particular to provide a method or an analysis system that avoids an unnecessary system load. Furthermore, the risk of misinformation for the user is to be reduced by inaccurately asked search queries and the user may be made aware of additional findings that can be obtained from the data, which are related to his search request. The use of the method or the operation of the analysis system should thereby also by less trained users be possible and the effort to gain knowledge can be reduced.
  • a target value is provided according to the invention to generate additional search responses that provide target values for modified searches in which compared to the search query, the target size and / or one of the categories contained therein is varied, of the additional search queries generated
  • the search responses are delivered whose target values lie in an edge region of the set of the determined target values, the underlying modified search queries being stored for these additionally generated and supplied search responses.
  • the method according to the invention therefore, only a single search request has to be provided by the user, but not only the associated search response is delivered to him, but also related search queries located in the same context.
  • the number of search responses is thereby limited to a manageable amount so that only the target values lying in the border area are displayed. It is assumed that these target values lying in the peripheral area have a high relevance.
  • the space available for example on a display is optimally utilized.
  • the user can be alerted to significant changes in the data that often indicate problems.
  • the method according to the invention thus not only leads to a reduction of the search queries to be provided and thus to a reduction in the system load, but also offers optimized information transfer and thus increased security.
  • search response can be obtained by the search request comprising a combination of categories of different generic terms.
  • search request comprising a combination of categories of different generic terms.
  • search queries that, for example, do not lead to useful search responses due to a lack of suitable data and thus only represent an unnecessary burden on the system, are thus prevented.
  • a real-time presentation of the search responses can be achieved by generating and storing the search answers before a search query by forming the possible combinations of target variables and categories.
  • the otherwise inevitable due to the required computing time waiting after placing the search can be minimized.
  • the pre-calculation of the search responses for example, even in times where no search queries are currently being made. This results in a higher utilization of the system and a reduction of power peaks.
  • target variables and categories are provided for which a search response is available.
  • proposals for possible combinations may also be made. For example, an auto-completion when entering the search query can be provided. This increases the user-friendliness.
  • the burden on the system is kept low because search queries for which search queries can not be generated need not be processed at all.
  • the target variables and / or categories used in the modified search queries are preferably varied on the basis of stored relationships of the target variables with one another and with the categories. For example, the relationships are also stored in a database and determined from empirical values. In this way, it can be ensured that matching target values or search responses are output only in the same context, and thus no exposure is caused by undesired search responses.
  • target values are assigned to the target size, whereby the target values and / or the related target values are classified on the basis of the target value rules. For example, it may be provided to color the target value if it is within a certain interval. The visual recording of the information is thus simplified. At the same time a rating can be displayed, for example by a red color for a rather negative target value and a green color for a more positive target value.
  • the generated queries are for affiliation to individual
  • the data are assigned to the generic terms and categories according to the MECE principle.
  • the data in each tree is assigned to individual categories without any overlap.
  • Each tree forms a dimension in which the entirety of the data can be viewed. Accordingly, several trees allow a multi-dimensional view and thus a refined analysis of the data.
  • the methodical and systematic use of MECE compliant tree structures makes even complex data structures easy to understand.
  • an analysis system for carrying out the method according to the invention in that it has a memory for holding the data, a computation component for processing the search queries and for preparing the search responses, has a display for displaying the search responses and an input interface for entering the search requests.
  • the memory can have a database structure and be connected, for example, via an online access to the computing component.
  • the display is advantageously carried out via a screen, which may optionally be designed as a touch screen and thus has an integrated input interface. This can also be designed independently, for example, as a keyboard.
  • FIG. 2 shows a schematic representation of a search response with additionally generated search responses
  • Fig. 3 is an analysis system.
  • FIG. 1 the schematic structure of a tree structure 1 is shown.
  • a generic term 2 is clearly divided into categories 3, 4, which in turn are divided into categories 3.1, 3.2, 3.3 and 4.1, 4.2. This can then be followed by other subordinate categories. Data can thus be assigned to a category without any overlapping, with increasing category levels resulting in an ever finer subdivision. Parent categories always include all data of the lower categories.
  • a multi-dimensional viewing and evaluation of the data is possible.
  • the assignment of the data is carried out according to the MECE principle.
  • a tree structure is constructed starting from the generic term location.
  • the categories 3, 4 could then, for example, be continents, from which further categories 3.1, 3.2, 3.4, 4.1, 4.2, for example, countries, result.
  • a further subdivision by additional categories could be states / regions, districts, municipalities, cities, neighborhoods, streets, etc., so that a very fine-grained categorization of the data is possible.
  • Another tree structure for viewing the same data from another dimension could, for example, include the term thing as a generic term, which is then e.g. into the categories of vehicles, land vehicles, motor vehicles, passenger cars, vehicle class, ie upper class / middle class, etc. is divided. These data are then also assigned without overlapping.
  • the target is the new registrations.
  • the target value output in a search response is then the actual number as a numeric number.
  • Additional search queries are automatically generated by targeting the entered search query and evaluating it. For example, one of the search parameters (target size, categories) entered with the search query is always exchanged and evaluated. So that an unreasonable number of additional search responses is not presented to the user, it is intended to display only those which lie in an edge area of the determined target values.
  • the underlying search parameters, that is the modified search query are specified in the search response for these target values.
  • FIG. 1 A possible display of the search response and the additionally generated search responses is shown schematically in FIG.
  • the search response 5 determined on the specific search request is specified with the associated target value 6.
  • the user still receives additional information through additionally generated search responses 7, 8, which are graphically represented on the basis of stored target value rules.
  • the various search responses, that is, the determined information can be summarized in the form of a score card 9.
  • the additionally generated search response 7 is, for example, the display of a trend. As a target value rule is then deposited, with increasing registration numbers to indicate an upward arrow.
  • the further search response 8 is designed in the form of a traffic light and displays, for example, a green color if the registration numbers are higher than average in other cities, while a red color is displayed if the registration numbers are below averages of the admission numbers of other cities.
  • the target value rules can be designed, inter alia, in a competitive, plan-oriented or time-oriented manner and thus serve to obtain information quickly by specifying, for example, the graphical representation.
  • an analysis system 10 for performing the method according to the invention is shown schematically that has a memory 1 1 with a database for storing the data.
  • the memory 1 1 is connected for example via an online connection with a computing component 12, to which a display 13 is connected.
  • An input interface 14 is used to enter the search queries and possibly other commands.
  • the invention is not limited to one of the embodiments described above, but can be modified in many ways.
  • it may additionally be provided to predefine search queries contextually.
  • search queries are precalculated for all possible combinations of target variables and categories, provision can be made for permitting search queries directed specifically at target values or even open search queries.
  • a Bl tool is obtained in which the number of search responses to be entered is reduced and thus a system load is reduced. It is also possible for less experienced users to receive appropriate search responses and to evaluate the data. The users do not have to have any in-depth knowledge of statistics in order to interpret the search responses. In particular, not only an analysis is carried out in relation to the search query, but also an analysis of the environment. In addition, the optimum combination of categories for a target value can be found by displaying the search queries underlying the additionally generated search responses. Optionally, the optimal combinations for different views can also be found. All of the claims, the description and the drawings resulting features and advantages, including design details, spatial arrangements and method steps may be essential to the invention both in itself and in various combinations. Reference numeral list

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zur Auswertung von Daten sowie ein Analysesystem zur Durchführung des Verfahrens, wobei die Daten elektronisch gespeichert sind. Mindestens zwei Oberbegriffe (2) sind in überschneidungsfreie Kategorien (3, 4) unterteilt, wobei die Daten je Oberbegriff (2) einer Kategorie (3, 4) zugeordnet werden. Auf eine gestellte Suchanfrage, die eine Zielgröße und mindestens eine Kategorie (3, 4) umfasst, wird als Suchantwort (5) ein Zielwert (6) geliefert. Um eine unnötige Systembelastung beispielsweise durch wiederholte Eingaben gleicher oder ähnlicher Suchanfragen zu reduzieren, werden automatisch zusätzliche Suchantworten (7, 8) generiert, die Zielwerte für abgewandelte Suchanfragen liefern, bei denen gegenüber der gestellten Suchanfrage die Zielgröße und/oder eine der dort enthaltenen Kategorien (3, 4) variiert wird, wobei von den zusätzlich generierten Suchantworten (7, 8) nur die Suchantworten geliefert werden, deren Zielwerte in einem Randbereich der Menge der ermittelten Zielwerte liegen, wobei zu diesen zusätzlich generierten und gelieferten Suchantworten (7, 8) die zugrunde liegenden abgewandelten Suchfragen hinterlegt werden

Description

DATENAUSWERTUNG UND -ANALYSE BASIEREND AUF MEHRDIMENSIONALEN BAEUMEN UND ERWEITERUNG DER SUCHANFRAGEN
Die Erfindung betrifft ein Verfahren zur Auswertung und Darstellung von Daten gemäß dem Oberbegriff von Anspruch 1 sowie ein Analysesystem gemäß Anspruch 10.
Derartige Verfahren bzw. Analysesysteme kommen insbesondere zur Auswertung großer Datenmengen zum Einsatz. Das Verfahren wird dabei häufig in Software implementiert, die unter der Bezeichnung Bl-Tools bekannt ist und einen Zugang für entsprechend ausgebildete Benutzer bereitstellt.
Die Daten müssen, um zur Auswertung verwendet werden zu können, zunächst kategorisiert werden, beispielsweise in Oberbegriffe und Kategorien. Damit wird eine Strukturierung der Daten auf Basis von Hierarchien erreicht und eine vereinfachte Auswertung ermöglicht. Für die Auswertung der Daten wird durch den Benutzer eine Suchanfrage gestellt, wobei die Suchanfrage eine Zielgröße sowie die Angabe der Kategorien beinhaltet, in denen gesucht werden soll. Die Zielgröße bezeichnet dabei, was gesucht wird. Beispielsweise handelt es sich dabei um Schlüsselindikatoren, sogenannte KPI's.
Als Suchantwort wird dann ein Zielwert erhalten, also in der Regel ein konkreter Zahlenwert oder eine prozentuale Angabe für die Zielgröße in der oder den entsprechenden Kategorien.
Zur näheren Spezifizierung und Eingrenzung der Suchantwort kann dabei in der Suchanfrage auch eine Kombination von Kategorien verwendet werden. Bei mehrdimensionalen Strukturen ergeben sich dann relativ komplexe Suchanfragen. Dabei entsteht aufgrund der hohen Komple- xität das Problem, Fehler bei der Erstellung der Suchanfragen zu begehen, die damit zu einer nicht in den Kontext passenden Suchantwort und somit zu einer Fehlinterpretation der Daten führen können.
Ein weiteres Problem besteht darin, dass nur nach konkreten, also bekannten Zielgrößen ge- sucht werden kann. Eine ungenaue Kenntnis von den Zielgrößen kann also dazu führen, dass die richtige Suchantwort nicht ermittelt werden kann oder dass zumindest mehrere Versuche bis zum Erhalt der richtigen Suchantwort erforderlich sind. Dies ist zum einen zeitaufwendig und führt durch das Stellen vieler an sich unnötiger Suchanfragen zu einer unnötigen Belastung des Systems, beispielsweise eines Servers, wie er in der Regel zur Einbindung einer Datenbank, in der die Daten hinterlegt sind, verwendet wird.
Um zu vermeiden, eine falsche Eingrenzung der Suchantwort zu bewirken, beispielsweise durch Auswahl einer falschen Kategorie, und damit wesentliche Erkenntnisse aus den Daten nicht zu ermitteln, erfolgt häufig ein Herantasten an die gewünschte Suchanfrage durch Stellen mehrerer Suchanfragen mit steigender Komplexität. Dies führt allerdings wiederum zu einer relativ hohen Systembelastung zum Beispiel aufgrund der sich in weiten Teilen überschneidenden Suchanfragen, die einen Bedarf an Rechenleistung steigern.
Der Erfindung liegt die Aufgabe zu Grunde, die Nachteile des Standes der Technik zu vermei- den und insbesondere ein Verfahren beziehungsweise ein Analysesystem bereit zu stellen, dass eine unnötige Systembelastung vermeidet. Ferner soll die Gefahr einer Fehlinformation für den Benutzer durch ungenau gestellte Suchanfragen verringert werden und der Benutzer gegebenenfalls auf zusätzliche aus den Daten gewinnbare Erkenntnisse aufmerksam gemacht werden können, die mit seiner Suchanfrage in Zusammenhang stehen. Die Verwendung des Ver- fahrens beziehungsweise die Bedienung des Analysesystems soll dadurch auch durch weniger ausgebildete Benutzer möglich sein und der Aufwand zur Gewinnung von Erkenntnissen verringert werden.
Diese Aufgabe wird durch ein Verfahren gemäß Anspruch 1 sowie durch ein Analysesystem gemäß Anspruch 10 gelöst. Hauptmerkmale der Erfindung sind dabei im kennzeichnenden Teil von Anspruch 1 sowie von Anspruch 10 angegeben. Ausgestaltungen sind Gegenstand der Ansprüche 2 bis 9.
Bei einem Verfahren zur Auswertung von Daten, die elektronisch gespeichert sind, wobei min- destens zwei Oberbegriffe in überschneidungsfreie Kategorien unterteilt sind und die Daten je Oberbegriff (genau) einer Kategorie zugeordnet werden, wobei auf eine gestellte Suchanfrage, die eine Zielgröße und mindestens eine Kategorie umfasst, als Suchantwort ein Zielwert geliefert wird, ist erfindungsgemäß vorgesehen, zusätzliche Suchantworten zu generieren, die Zielwerte für abgewandelte Suchanfragen liefern, bei denen gegenüber der gestellten Suchanfrage die Zielgröße und/oder eine der dort enthaltenen Kategorien variiert wird, wobei von den zusätzlich generierten Suchantworten insbesondere nur die Suchantworten geliefert werden, deren Zielwerte in einem Randbereich der Menge der ermittelten Zielwerte liegen, wobei zu diesen zusätzlich generierten und gelieferten Suchantworten die zugrunde liegenden abgewandelten Suchfragen hinterlegt werden.
Mit Hilfe des erfindungsgemäßen Verfahrens muss durch den Benutzer also nur eine einzige Suchanfrage gestellt werden, wobei ihm jedoch nicht nur die dazugehörende Suchantwort geliefert wird, sondern auch im gleichen Kontext befindliche verwandte Suchantworten. Dabei wird die Anzahl der Suchantworten dadurch auf eine überschaubare Menge begrenzt, dass nur die im Randbereich liegenden Zielwerte angezeigt werden. Dabei wird davon ausgegangen, dass diese im Randbereich liegenden Zielwerte eine hohe Relevanz haben. Insgesamt wird so der beispielsweise auf einer Anzeige zur Verfügung stehende Raum optimal ausgenutzt. Zusätzlich kann der Benutzer damit beispielsweise auf signifikante Änderungen in den Daten aufmerksam gemacht werden, die häufig auf Probleme hinweisen. Das erfindungsgemäße Verfahren führt also nicht nur zu einer Verringerung der zu stellenden Suchanfragen und damit zu einer Reduzierung der Systembelastung, sondern bietet auch eine optimierte Informationsübergabe und damit eine erhöhte Sicherheit. Dabei kann durch die Speicherung der generierten Suchantworten mit den zugehörigen Suchanfragen eine mehrfache Berechnung vermieden werden, indem bei erneuter Eingabe einer derartigen Suchanfrage direkt auf die bereits hinterlegte Suchant- wort zurückgegriffen werden kann. Da nicht nur die zusätzlich generierten Suchantworten angegeben werden, sondern auch die zugehörenden Suchanfragen, kann eine Art Rückwärtssuche durchgeführt werden. Der Benutzer erhält so nicht nur die Informationen über einen bestimmten Zielwert, sondern auch, in wel- chen Kategorien, also für welche Daten, dieser zutreffend ist. Der Benutzer kann so gegebenenfalls gezielt in diesen Kategorien nach weiteren Zielgrößen recherchieren.
Eine genauere Eingrenzung der Suchantwort kann dadurch erhalten werden, dass die Suchanfrage eine Kombination von Kategorien unterschiedlicher Oberbegriffe umfasst. Damit ist also eine mehrdimensionale Suche möglich, die zu entsprechend genauen Ergebnissen führen kann.
Durch Vorgeben der auswählbaren Zielgrößen und/oder Kategorien kann die Benutzerfreundlichkeit gesteigert und es auch weniger professionellen Benutzern ermöglicht werden, sinnvolle Suchanfragen zu stellen. Suchanfragen, die beispielsweise mangels passender Daten nicht zu brauchbaren Suchantworten führen und damit nur eine unnötige Belastung des Systems darstellen würden, werden so verhindert.
Eine Echtzeitpräsentation der Suchantworten kann dadurch erreicht werden, dass die Suchant- worten vor Stellen einer Suchanfrage durch Bildung der möglichen Kombinationen von Zielgrößen und Kategorien generiert und abgelegt werden. Die sonst aufgrund der erforderlichen Rechenzeit unausweichlichen Wartezeiten nach Stellen der Suchanfrage können so minimiert werden. Dabei kann die Vorberechnung der Suchantworten beispielsweise auch in Zeiten erfolgen, in denen gerade keine Suchanfragen gestellt werden. Damit ergibt sich eine höhere Aus- lastung des Systems und eine Verminderung von Leistungsspitzen.
In einer bevorzugten Weiterbildung werden nur Kombinationen von Zielgrößen und Kategorien zur Auswahl gestellt, für die eine Suchantwort zur Verfügung steht. Dabei können gegebenenfalls auch Vorschläge für mögliche Kombinationen unterbreitet werden. Beispielsweise kann auch eine Auto- Vervollständigung bei Eingabe der Suchanfrage vorgesehen werden. Damit erhöht sich die Benutzerfreundlichkeit. Zusätzlich wird die Belastung des Systems gering gehalten, da Suchanfragen, für die keine Suchantworten generierbar sind, gar nicht erst zu bearbeiten sind. Vorzugsweise werden die in den abgewandelten Suchanfragen verwendeten Zielgrößen und/oder Kategorien auf Grundlage von hinterlegten Beziehungen der Zielgrößen untereinander und der Kategorien untereinander variiert. Die Beziehungen sind dabei beispielsweise ebenfalls in einer Datenbank hinterlegt und aus Erfahrungswerten ermittelt. Dadurch kann sichergestellt werden, dass nur in den gleichen Kontext passende Zielwerte bzw. Suchantworten ausgegeben werden und somit keine Belastung durch unerwünschte Suchantworten erfolgt.
Bevorzugterweise werden der Zielgröße Zielwertregeln zugeordnet, wobei auf Basis der Zielwertregeln eine Klassifizierung der Zielwerte und/oder der verwandten Zielwerte erfolgt. Bei- spielsweise kann vorgesehen werden, den Zielwert einzufärben, falls er in einem bestimmten Intervall liegt. Die visuelle Aufnahme der Informationen wird so vereinfacht. Gleichzeitig kann eine Bewertung dargestellt werden, beispielsweise durch eine rote Farbe für einen eher negativen Zielwert und eine grüne Farbe für einen eher positiven Zielwert. Bevorzugterweise werden die generierten Suchanfragen nach Zugehörigkeit zu einzelnen
Oberbegriffen und/oder Kategorien gefiltert. Damit ist es relativ einfach möglich, auf Basis der durch die generierten Suchanfragen bereits erhaltenen Suchantworten weitere Suchanfragen zu stellen und so, ohne dass gleiche Suchanfragen mehrfach gestellt werden müssen, die Suche zu verfeinern.
Für eine einfache und belastbare Auswertung der Daten ist es vorteilhaft, dass die Daten den Oberbegriffen und Kategorien nach dem MECE-Prinzip zugeordnet werden. Dabei erfolgt eine eindeutige, überschneidungsfreie Kategorisierung aller Daten in Baumstrukturen. Mehrere Bäume bzw. Baumstrukturen können ausgehend von jeweils einem Oberbegriff erstellt werden, wobei die Daten in jedem Baum überschneidungsfrei einzelnen Kategorien zugeordnet werden. Jeder Baum bildet eine Dimension, in der die Gesamtheit der Daten betrachtet werden kann. Dementsprechend ermöglichen mehrere Bäume eine mehrdimensionale Betrachtung und damit eine verfeinerte Auswertung der Daten. Durch die methodische und systematische Verwendung von MECE konformen Baumstrukturen können auch komplexe Datenstrukturen einfach ver- ständlich gemacht werden.
Die eingangs gestellte Aufgabe wird durch ein Analysesystem zur Durchführung des Verfahrens erfindungsgemäß dadurch gelöst, dass es einen Speicher zur Aufnahme der Daten, eine Rechenkomponente zur Verarbeitung der Suchanfragen und zur Ausarbeitung der Suchantworten, eine Anzeige zur Anzeige der Suchantworten und eine Eingabeschnittstelle zur Eingabe der Suchanfragen aufweist.
Der Speicher kann dabei eine Datenbankstruktur aufweisen und beispielsweise über einen Online Zugang mit der Rechenkomponente verbunden sein. Die Anzeige erfolgt dabei vorteilhafterweise über einen Bildschirm, der gegebenenfalls als Touch-Screen ausgebildet sein kann und so eine integrierte Eingabeschnittstelle aufweist. Diese kann aber auch eigenständig beispielsweise als Tastatur ausgebildet sein.
Für das Analysesystem gelten die in Zusammenhang mit der Würdigung des Verfahrens genannten Merkmale und Vorteile in sinngemäßer Weise.
Weitere Merkmale, Einzelheiten und Vorteile der Erfindung ergeben sich aus dem Wortlaut der Ansprüche sowie aus der folgenden Beschreibung von Ausführungsbeispielen anhand der Zeichnungen. Es zeigen:
Fig. 1 einen prinzipiellen Aufbau einer Baumstruktur,
Fig. 2 eine schematische Darstellung einer Suchantwort mit zusätzlich generierten Suchantworten und
Fig. 3 ein Analysesystem.
In Fig. 1 ist der schematische Aufbau einer Baumstruktur 1 dargestellt. Ein Oberbegriff 2 ist eindeutig in Kategorien 3, 4 unterteilt, die wiederum in Kategorien 3.1 , 3.2, 3.3 bzw. 4.1 , 4.2 unterteilt sind. Daran können sich dann weitere, untergeordnete Kategorien anschließen. Daten können so überschneidungsfrei jeweils einer Kategorie zugeordnet werden, wobei sich mit zunehmenden Kategorieebenen eine immer feinere Unterteilung ergibt. Übergeordnete Kategorien umfassen dabei immer alle Daten der davon ausgehenden, unteren Kategorien.
Mit Hilfe von mehreren Baumstrukturen, die jeweils einen Baum darstellen und auf die gleiche Datenbasis angewendet werden, ist eine mehrdimensionale Betrachtung und Auswertung der Daten möglich. Die Zuordnung der Daten erfolgt dabei nach dem MECE-Prinzip. Beispielsweise wird eine Baumstruktur ausgehend vom Oberbegriff Ort aufgebaut. Die Kategorien 3, 4 könnten dann beispielsweise Kontinente sein, aus denen sich weitere Kategorien 3.1 , 3.2, 3.4, 4.1 , 4.2, beispielsweise Länder, ergeben. Eine weitere Unterteilung durch zusätzliche Kategorien könnte dann Bundesländer/Regionen, Landkreise, Gemeinden, Städte, Stadtteile, Straßen etc. sein, so dass eine sehr feinstufige Kategorisierung der Daten möglich ist.
Eine weitere Baumstruktur zur Betrachtung der gleichen Daten aus einer weiteren Dimension könnte als Oberbegriff beispielsweise den Begriff Sache aufweisen, der dann z.B. in die Kategorien Fahrzeuge, Landfahrzeuge, Kraftfahrzeuge, Personenkraftwagen, Fahrzeugklasse, also Oberklasse/Mittelklasse etc. unterteilt wird. Auch diesen Kategorien werden die Daten dann überschneidungsfrei zugeordnet.
Bei der Auswertung der Daten durch eine entsprechende Suchanfrage erfolgt sozusagen ein Übereinanderlegen der Baumstrukturen bzw. von Kategorien verschiedener Baumstrukturen, wobei eine Schnittmenge der Daten erhalten wird. Für diese Schnittmenge wird dann ein zur einer Zielgröße gehörender Zielwert ermittelt.
Zu einer vollständigen Suchanfrage gehört in der Regel auch die Angabe der Zielgröße, also was gesucht werden soll. Beispielsweise soll nach der Anzahl Neuzulassungen in einer be- stimmten Stadt und für eine bestimmte Fahrzeugklasse gesucht werden. Die Zielgröße sind dabei die Neuzulassungen.
Der in einer Suchantwort ausgegebene Zielwert ist dann die tatsächliche Anzahl als numerische Zahl.
Häufig ist eine einzige Suchantwort bzw. ein einziger Zielwert aber nicht aussagekräftig genug. Gemäß dem Vorgehen nach dem Stand der Technik sind von einem Benutzer daher zusätzliche Suchanfragen zu stellen und die erhaltenen Suchantworten in einen gemeinsamen Kontext zu setzen. Hier setzt die Erfindung an.
Es werden automatisch zusätzliche Suchantworten generiert, indem die eingegebene Suchanfrage zielgerichtet abgewandelt und ausgewertet wird. Beispielsweise wird immer einer der mit der Suchanfrage eingegebenen Suchparameter (Zielgröße, Kategorien) ausgetauscht und ausgewertet. Damit nun dem Benutzer nicht eine unzumutbare Anzahl an zusätzlichen Suchantworten präsentiert wird, ist vorgesehen, nur diejenigen anzuzeigen, die in einem Randbereich der ermittelten Zielwerte liegen. Zu diesen Zielwerten werden dann insbesondere die zugrundeliegenden Suchparameter, also die abgewandelte Suchanfrage, in der Suchantwort angegeben.
Beim obigen Beispiel bleibend könnte beispielsweise als zusätzlich generierte Suchantwort angezeigt werden, in welchen Städten die meisten oder die wenigsten Zulassungen in der gleichen Fahrzeugklasse erfolgt sind. Eine weitere Suchantwort könnte beispielsweise historische Daten berücksichtigen und angeben, wie stark sich die Zulassungszahlen verändert haben.
Eine mögliche Anzeige der Suchantwort und der zusätzlich generierten Suchantworten ist in Fig. 2 schematisch dargestellt. Die auf die konkret gestellte Suchanfrage ermittelte Suchantwort 5 wird mit dem dazugehörenden Zielwert 6 angegeben. Der Benutzer erhält aber noch zusätzliche Informationen durch zusätzlich generierte Suchantworten 7, 8, die aufgrund hinterlegter Zielwertregeln grafisch dargestellt sind. Die verschiedenen Suchantworten, also die ermittelten Informationen, können dabei in Form einer Score-Card 9 zusammengefasst sein.
Bei der zusätzlich generierten Suchantwort 7 handelt es sich beispielsweise um die Anzeige eines Trends. Als Zielwertregel ist dann hinterlegt, bei steigenden Zulassungszahlen einen nach oben gerichteten Pfeil anzuzeigen. Die weitere Suchantwort 8 ist in Form einer Ampel gestaltet und zeigt beispielsweise eine grüne Farbe an, wenn die Zulassungszahlen höher sind als durchschnittlich in anderen Städten, während eine rote Farbe angezeigt wird, wenn die Zulassungszahlen unter einem Durschnitt der Zulassungszahlen anderer Städte liegt. Prinzipiell können die Zielwertregeln dabei unter anderem wettbewerbsorientiert, planorientiert oder zeitorientiert ausgestaltet werden und so zur schnellen Informationsgewinnung durch Vorgabe beispielsweise der grafischen Darstellung dienen.
Abhängig von den zur Verfügung stehenden Daten und dem jeweiligen Anwendungsbereich können nach diesem Prinzip unterschiedliche, kontextbezogene zusätzliche Suchantworten generiert und zusätzlich zur angefragten Suchantwort angezeigt werden. Die Anzahl vom Benutzer einzugebender Suchanfragen wird so deutlich verringert. Zusätzlich erhält der Benutzer die gewünschten Informationen in einer stark verkürzten Zeit. In Fig. 3 ist ein Analysesystem 10 zur Durchführung des erfindungsgemäßen Verfahrens schematisch dargestellt, dass einen Speicher 1 1 mit einer Datenbank zum Speichern der Daten aufweist. Der Speicher 1 1 ist beispielsweise über eine Online- Verbindung mit einer Rechenkomponente 12 verbunden, an die eine Anzeige 13 angeschlossen ist. Zur Eingabe der Suchanfragen und gegebenenfalls weiterer Befehle dient eine Eingabeschnittstelle 14.
Die Erfindung ist nicht auf eine der vorbeschriebenen Ausführungsformen beschränkt, sondern in vielfältiger weise abwandelbar. Beispielsweise kann zusätzlich vorgesehen sein, Suchanfragen kontextbezogen vorzugeben. Auch kann insbesondere dann, wenn Suchantworten für alle möglichen Kombinationen von Zielgrößen und Kategorien vorberechnet werden, vorgesehen werden, gezielt auf Zielwerte gerichtete Suchanfragen oder sogar offene Suchanfragen zu zuzulassen.
Durch das erfindungsgemäße Verfahren bzw. das erfindungsgemäße Analysesystem wird ein Bl-Tool erhalten, bei dem die Anzahl einzugebender Suchantworten verringert und damit eine Systembelastung reduziert wird. Dabei ist es auch für weniger geübte Benutzer möglich, zutreffende Suchantworten zu erhalten und die Daten auszuwerten. Die Benutzer müssen dabei keine vertieften Kenntnisse der Statistik haben, um die Suchantworten interpretieren zu können. Insbesondere erfolgt dabei nicht nur eine Analyse in Bezug auf die gestellte Suchanfrage, son- dem auch eine Analyse des Umfelds. Zusätzlich kann die für einen Zielwert optimale Kombination der Kategorien gefunden werden, indem die den zusätzlich generierten Suchantworten zu Grunde liegenden Suchanfragen angezeigt werden. Dabei können gegebenenfalls auch die optimalen Kombinationen für unterschiedliche Sichtweisen gefunden werden. Sämtliche aus den Ansprüchen, der Beschreibung und der Zeichnung hervorgehenden Merkmale und Vorteile, einschließlich konstruktiver Einzelheiten, räumlicher Anordnungen und Verfahrensschritten, können sowohl für sich als auch in den verschiedensten Kombinationen erfindungswesentlich sein. Bezugszei chen liste
1 . Baumstruktur
2. Oberbegriff
3. Kategorie
4. Kategorie
5. Suchantwort
6. Zielwert
7. Zusätzliche Suchantwort
8. Zusätzliche Suchantwort
9. Score Card
10. Analysesystem
1 1 . Speicher
12. Rechenkomponente
13. Anzeige
14. Eingabeschnittstelle
20

Claims

Patentansprüche
Verfahren zur Auswertung von Daten, die elektronisch gespeichert sind, wobei mindestens zwei Oberbegriffe (2) in überschneidungsfreie Kategorien (3, 4) unterteilt sind und die Daten je Oberbegriff (2) einer Kategorie (3, 4) zugeordnet werden, wobei auf eine gestellte Suchanfrage, die eine Zielgröße und mindestens eine Kategorie (3, 4) umfasst, als Suchantwort (5) ein Zielwert (6) geliefert wird,
dadurch gekennzeichnet, dass
zusätzliche Suchantworten (7, 8) generiert werden, die Zielwerte für abgewandelte Suchanfragen liefern, bei denen gegenüber der gestellten Suchanfrage die Zielgröße und/oder eine der dort enthaltenen Kategorien (3, 4) variiert wird, wobei von den zusätzlich generierten Suchantworten (7, 8) insbesondere nur die Suchantworten geliefert werden, deren Zielwerte in einem Randbereich der Menge der ermittelten Zielwerte liegen, wobei zu diesen zusätzlich generierten und gelieferten Suchantworten (7, 8) die zugrunde liegenden abgewandelten Suchfragen hinterlegt werden.
2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass die Suchanfrage eine Kombination von Kategorien (3, 4) unterschiedlicher Oberbegriffe (2) umfasst.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die auswählbaren Zielgrößen und/oder Kategorien (3, 4) vorgegeben werden.
4. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die
Suchantworten vor Stellen einer Suchanfrage durch Bildung der möglichen Kombinationen von Zielgrößen und Kategorien (3, 4) generiert und abgelegt werden.
5. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass nur
Kombinationen von Zielgrößen und Kategorien (3, 4) zur Auswahl gestellt werden können, für die eine Suchantwort zur Verfügung steht.
6. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die in den abgewandelten Suchanfragen verwendeten Zielgrößen und/oder Kategorien (3, 4) auf Grundlage von hinterlegten Beziehungen der Zielgrößen untereinander und der Kategorien (3, 4) untereinander variiert werden.
7. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass der Zielgröße Zielwertregeln zugeordnet werden, wobei auf Basis der Zielwertregeln eine Klassifizierung der Zielwerte und/oder der verwandten Zielwerte erfolgt.
8. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die zusätzlich generierten Suchanfragen nach Zugehörigkeit zu einzelnen Oberbegriffen und/oder Kategorien gefiltert werden.
9. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Daten den Oberbegriffen und Kategorien nach dem MECE-Prinzip zugeordnet werden.
10. Analysesystem (10) zur Durchführung des Verfahrens nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass es einen Speicher (1 1 ) zur Aufnahme der Daten, eine Rechenkomponente (12) zur Verarbeitung der Suchanfragen und zur Ausarbei- tung der Suchantworten, eine Anzeige (13) zur Anzeige der Suchantworten und eine Eingabeschnittstelle (14) zur Eingabe der Suchanfragen aufweist.
PCT/EP2014/068146 2013-08-28 2014-08-27 Datenauswertung und -analyse basierend auf mehrdimensionalen baeumen und erweiterung der suchanfragen WO2015028497A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102013109295.0 2013-08-28
DE102013109295.0A DE102013109295A1 (de) 2013-08-28 2013-08-28 Verfahren zur Auswertung von Daten und Analysesystem

Publications (1)

Publication Number Publication Date
WO2015028497A1 true WO2015028497A1 (de) 2015-03-05

Family

ID=51492296

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2014/068146 WO2015028497A1 (de) 2013-08-28 2014-08-27 Datenauswertung und -analyse basierend auf mehrdimensionalen baeumen und erweiterung der suchanfragen

Country Status (2)

Country Link
DE (1) DE102013109295A1 (de)
WO (1) WO2015028497A1 (de)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060271884A1 (en) * 2005-05-26 2006-11-30 Cogniscape, Llc Methods for defining queries, generating query results and displaying same
US8019742B1 (en) * 2007-05-31 2011-09-13 Google Inc. Identifying related queries
US20120303664A1 (en) * 2011-05-27 2012-11-29 Microsoft Corporation Enabling multidimensional search on non-pc devices
WO2012160456A1 (en) * 2011-05-26 2012-11-29 International Business Machines Corporation Hybrid and iterative keyword and category search technique

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7152059B2 (en) * 2002-08-30 2006-12-19 Emergency24, Inc. System and method for predicting additional search results of a computerized database search user based on an initial search query
US8554768B2 (en) * 2008-11-25 2013-10-08 Microsoft Corporation Automatically showing additional relevant search results based on user feedback

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060271884A1 (en) * 2005-05-26 2006-11-30 Cogniscape, Llc Methods for defining queries, generating query results and displaying same
US8019742B1 (en) * 2007-05-31 2011-09-13 Google Inc. Identifying related queries
WO2012160456A1 (en) * 2011-05-26 2012-11-29 International Business Machines Corporation Hybrid and iterative keyword and category search technique
US20120303664A1 (en) * 2011-05-27 2012-11-29 Microsoft Corporation Enabling multidimensional search on non-pc devices

Also Published As

Publication number Publication date
DE102013109295A1 (de) 2015-03-05

Similar Documents

Publication Publication Date Title
EP1145142A3 (de) Rechnersystem und methode zur anzeige von daten in einem interaktiven geteilten kreisdiagramm
DE102010005548A1 (de) Standardisierte Fensterverwaltung für Lernkurse im Internet
DE102019101524A1 (de) Vorrichtung und Verfahren zur Verwaltung von gemeinsam genutzten Fahrzeugen
DE102015111671A1 (de) Verfahren und Gerät zum Bestimmen von relativen Fahreigenschaften unter Verwendung von partizipativen Messsystemen
Zander Agricultural land use and conservation options: a modelling approach
DE112008001066T5 (de) Verfahren und System zur Bereitstellung eines virtuellen Stellenmarktes
DE10017551C2 (de) Verfahren zur zyklischen, interaktiven Bildanalyse sowie Computersystem und Computerprogramm zur Ausführung des Verfahrens
DE102012219284A1 (de) Interaktive vergleichende Analyse von Datenvisualisierungen mehrerer Objekte
WO2003016823A1 (de) Verfahren zum ermitteln von routen und darauf bezogenes navigationssystem
DE102006057921A1 (de) Verfahren und Vorrichtung zur Auswahl eines Ziels, insbesondere bei einem Navigationssystem
Jungwirth et al. Clustertypen: Eine Typologisierung und Charakterisierung regionaler Netzwerke
WO2015028497A1 (de) Datenauswertung und -analyse basierend auf mehrdimensionalen baeumen und erweiterung der suchanfragen
Berg-Schlosser Comparative area studies—the golden mean between area studies and universalistic approaches?
EP2059871A1 (de) System für ein objektororientiertes datenmanagement von informationsprozessen
DE112019006203T5 (de) Verfahren zur Klassifizierung von Inhalten und Verfahren zur Erzeugung eines Klassifizierungsmodells
DE102008012187A1 (de) Darstellung von Bildschirminhalten in Abhängigkeit von Kompetenzfunktionen
EP3412049A1 (de) Verfahren zum konfigurieren von mobilen online-diensten
EP2450846A1 (de) Verfahren und Vorrichtung zur Auswahl von Stahlsorten
DE69907488T2 (de) Simulationssystem ii
DE19639349A1 (de) Datenbank, Verfahren zum Ableiten einer Datenbank und Verfahren zur Abfrage einer Datenbank
DE202020102851U1 (de) Anlageobjektsystem
EP4156069A1 (de) Verfahren zur bestimmung einer technologischen relevanz wenigstens zweier technologie-portfolien sowie computerprogramm und computerlesbares speichermedium
DE102022213567A1 (de) Verfahren zum Betrieb eines Fahrzeugs mit einem batterieelektrischen Antrieb, Computerprogrammprodukt zur Ausführung eines derartigen Verfahrens, Fahrzeug sowie System mit mindestens einem Fahrzeug mit einem batterieelektrischen Antrieb
EP4047513A1 (de) Verfahren und system zur auswahl eines oder mehrerer teilbereiche eines landwirtschaftlichen schlags für eine probenahme von biomasse sowie verfahren zur vorhersage eines ertrags eines landwirtschaftlichen schlags
DE102021112418A1 (de) Verfahren zum Betreiben einer Energiemarktplattform für einen Energiehandel für zumindest einen Aggregator mittels einer elektronischen Recheneinrichtung, Computerprogrammprodukt sowie Energiemarktplattform

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14759124

Country of ref document: EP

Kind code of ref document: A1

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: FESTSTELLUNG EINES RECHTSVERLUSTS NACH REGEL 112(1)EPUE (EPA FORM 1205A VOM 29.06.2016)

122 Ep: pct application non-entry in european phase

Ref document number: 14759124

Country of ref document: EP

Kind code of ref document: A1