EP1629401A2 - Verfahren und anordnung sowie computerprogramm mit programmcode-mitteln und computerprogramm-produkt zur analyse von gem ss e iner datenbankstruktur strukturierten nutzdaten - Google Patents

Verfahren und anordnung sowie computerprogramm mit programmcode-mitteln und computerprogramm-produkt zur analyse von gem ss e iner datenbankstruktur strukturierten nutzdaten

Info

Publication number
EP1629401A2
EP1629401A2 EP03794981A EP03794981A EP1629401A2 EP 1629401 A2 EP1629401 A2 EP 1629401A2 EP 03794981 A EP03794981 A EP 03794981A EP 03794981 A EP03794981 A EP 03794981A EP 1629401 A2 EP1629401 A2 EP 1629401A2
Authority
EP
European Patent Office
Prior art keywords
user data
statistical
probability model
common
database structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP03794981A
Other languages
English (en)
French (fr)
Inventor
Michael Haft
Reimar Hofmann
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panoratio Database Images GmbH
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of EP1629401A2 publication Critical patent/EP1629401A2/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries

Definitions

  • the invention relates to an analysis of user data structured according to a database structure, such as customer or product data of a company. 0
  • C RM customer relationship management systems
  • SCM supply chain management systems
  • data warehouses data warehouses
  • Each data record Di represents a specific object from a group of objects, for example a specific customer from all registered customers of a company or a specific product from a product line of a company.
  • Each data record comprises a predeterminable number of entries, Ai, Bi, Ci, ..., the individually recorded data, with categories or attributes A, B, C, ... These categories or attributes represent properties of an object group pe, such as age (A), income (B), product purchased (C), ....
  • the entries Ai, Bi, Ci, ... for the respective categories A, B, C, ... can be numerical or semantic.
  • a well-known and frequently used data mining process is a so-called decision tree [5].
  • a disadvantage of many of the known and mentioned analysis methods is that they cannot be used adequately when analyzing large amounts of data. As a rule, there is one or multiple access to the whole Analyzing data stock, which is stored, for example, in a database, is necessary.
  • a determination of a common probability model P (A, B, C, ..., X) for a data structure (A, B, C, ...) based on a hidden variable X is known from [7].
  • the invention is based on the object of specifying an analysis method for the analysis of structured useful data which can also be used with large amounts of useful data and also has a high performance there.
  • a common statistical probability model is first determined for the user data structured according to the database structure.
  • the user data structured according to the database structure is then analyzed using a statistical analysis method, the statistical analysis method used in the analysis being applied to the common statistical probability model, not, as is customary, directly to the output data.
  • the arrangement for analyzing user data structured according to a database structure has:
  • a modeling unit with which a common statistical probability model for the user data structured according to the database structure can be determined
  • the invention is clearly based on a two-stage procedure.
  • the first step is to assume user data that can be specified and structured according to a database structure.
  • a database structure of this type should be understood to mean that the user data is based on a higher-level, fixed structure, for example, data sets with the same structure (Ai, Bi, Ci, ...) with the same entry categories A, B, C, .... Such structures are generally known.
  • a common, purpose-independent probability model as described, for example, in [7], [8], is formed from these user data to be analyzed and structured according to a database structure.
  • the computer program according to the invention with program code means is set up to carry out all steps according to the analysis method according to the invention when the program is executed on a computer.
  • the computer program product with program code means stored on a machine-readable carrier is set up to carry out all steps according to the analysis method according to the invention when the program is executed on a computer.
  • the arrangement and the computer program with program code means, set up to carry out all steps according to the inventive analysis method when the program is executed on a computer, and the computer program product with program code means stored on a machine-readable medium, set up all steps according to the Carrying out analysis methods according to the invention when the program is executed on a computer are particularly suitable for carrying out the analysis method according to the invention or one of its further developments explained below.
  • structured user data are used in user data records, for example user data records from a database.
  • Each user data record represents a specific object from a group of objects.
  • the user data associated with the respective user data record describe properties of the respective object.
  • the statistical analysis method is applied to the common statistical probability model in such a way that a common probability is used as an input variable for the statistical analysis method. driving is used.
  • the common probability results directly from the common probability model. This avoids unnecessary intermediate steps, costs computing time and extends response times.
  • a method based on a data mining method [4], [10], [11], [12] can be used as the statistical analysis method, for example a clustering method [5] or a decision tree [6] or association rules [9].
  • the analytical database image i.e. the common probability model is newly formed at predefinable time intervals, such as daily or weekly. Education can take place at night or on weekends.
  • the complete analytical database image is then available as required to significantly speed up analyzes.
  • the user data can be obtained from various data sources. The easiest way is to obtain the user data from a database in which the user data are stored and from which they are read. Because of the performance it can achieve in the analysis of data, the invention is particularly suitable where large amounts of data have to be processed or analyzed, such as in the area of customer relationship management (CRM) [1] or supply chain management [2]. or a data warehouse (DW) [3].
  • CRM customer relationship management
  • DW data warehouse
  • the object is a customer, which is described by at least two of the following properties, age, income, product purchased, date of purchase, frequency of purchases.
  • This enables eminently important issues to be solved for marketing departments, such as the customer behavior of certain customer groups.
  • targeted target groups can be determined when customers are acquired, customer groups can be selected for specific products and marketing campaigns, and customers can be served with more foresight.
  • Figure 1 sketch that schematically shows how a
  • Figures 2a to g sketches showing analysis results of an analysis system for analyzing customer data according to an embodiment.
  • Execution example Analysis system for analyzing customer behavior at a bank based on a customer relationship management system
  • the exemplary embodiment relates to an analysis system for analyzing customer data from a bank.
  • analysis system described below can be used not only at banks, but also at any company for the analysis of corresponding company data, such as for example in department stores or manufacturing companies.
  • FIG. 1 shows schematically the functioning 100 of the analysis system for analyzing bank customer data 110.
  • Functionality 100 is divided into knowledge acquisition 101 and implementation of the knowledge into intelligent operation of bank customers 102.
  • customer data 110 Large and thus difficult-to-handle amounts of customer data 110 are first condensed 111 into a statistical model 112, a common probability model, of customer behavior.
  • the shared probability model 112 used is one based on a hidden variable. The basics are described in [7].
  • statistical methods 120 in general data mining methods and here in this case a decision tree, are used, which are based on the statistical model.
  • the coupling is made possible by the fact that the data mining methods or decision tree 120 are based on a statistical framework, and thus use the same statistical terms or the same statistical language as the common probability model 112.
  • the results of the questions can be further implemented 121 in intelligent customer service 130.
  • Customer data ((Fig. 1, 110)
  • the customer data 110 in the analysis system is collected as part of a customer relationship management (CRM) 150.
  • CRM customer relationship management
  • CRM 150 large amounts of data 110 about the bank customers from all sales channels of the bank, such as direct contacts, web, call center, are recorded and stored.
  • the data is stored in a database in the form of customer-specific data records Di (AI, A2, ..., Bl-2, B2-3, ..., C, D, ...), the index i being the respective bank customer i features.
  • the common probability model 112 used is one based on a hidden variable X. The foundations for this are described in [7].
  • the common probability model 112 is written based on the hidden variable X as P (A, B, C, ..., X) for all attributes (A, B, C, ).
  • Such a statistical image of data represents a highly compressed form of knowledge about customers and can be used to efficiently and interactively explore dependencies 120, 140.
  • the common probability model 112 also provides quickly retrievable forecasts of further expected behavior and current needs of a customer.
  • the forecasts can also be used to serve customers proactively and in a targeted manner and to provide proactive, personal offers 130.
  • the decision tree [6] is placed 120 on the statistical model 112, the common probability model 112.
  • the common distribution P (A, B, C, ..., X) goes over all attributes of the customers by summation over the hidden variable X.
  • Structural learning immediately provides a common distribution P (A, B, C, ).
  • the structure of the models for example those with a predefined hidden variable or those that were generated by structure learning, or a combination of the above, is used to efficiently calculate necessary sums over the common distribution.
  • Decision trees are usually built using a known CHAID or a known CART procedure.
  • the necessary probabilities or distributions for the construction of the decision tree can (as usual) be determined from the data or also from the most accurate probability model described in the above (inference process).
  • 2a to 2g show examples of some of the possible interactive analyzes 140 that can be carried out with the decision tree 120 using the common probability model 112.
  • A1 " Giro / Salary Account “), P (A3
  • A1 " Giro / Salary Account ”) , P (A4
  • A1 "Giro / Salary Account”), P (A5
  • A1 "Giro / Salary Account”), P (B1-2
  • A1 "Giro / Salary Account ⁇ ), P ( B2-3
  • A1 "Gi ro / Salary Account “), P (B3-4
  • A1 " Giro / Salary Account ”) and P (C
  • A1 " Giro / Salary Account ”) and P (D
  • A1 " Giro / Salary - Account “).
  • P (A2 "insurance product
  • Fig. 2e shows the probability distributions P (A1), P (A2) P (A3) P (A4), P (A5), P (Bl-2), P (B2-3), P (B3-4) and P (C) and P (D).

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Fuzzy Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

" Verfahren und Anordnung sowie Computerprogramm mit Programmcode-Mitteln und Computerprogramm-Produkt zur Analyse von gemäss einer Datenbanksstruktur strukturierten nutzdaten".
Beschreibung
Verfahren und Anordnung sowie Computerprogramm mit Programmcode-Mitteln und Computerprogramm-Produkt zur Analyse von ge- 5 maß einer Datenbankstruktur strukturierten Nutzdaten
Die Erfindung betrifft eine Analyse von gemäß einer Datenbankstruktur strukturierten Nutzdaten, wie beispielsweise Kunden- oder Produktdaten eines Unternehmens . 0
Fast jeder Vorgang in einem Unternehmen, wie jeder Kontakt des Unternehmens mit einem Kunden oder jeder logistische Vorgang innerhalb eines Unternehmens, beginnend bei einer Bestellung eines Produkts bis hin zu einer Auslieferung des 5 fertigen Produkts, wird heute elektronisch unterstützt durchgeführt bzw. kontrolliert und gesteuert.
Dabei werden systematisch Daten, beispielsweise Kundendaten oder Produktdaten, erfasst und protokolliert, die Basis für 0 ökonomische, betriebswirtschaftliche und/oder marktstrategische Analysen sind, mit welchen die Daten in verwertbare öko^ nomische, betriebswirtschaftliche und/oder arktstrategische Erkenntnisse umgesetzt werden.
5 Wegen ihrer ökonomischen, betriebswirtschaftlichen und/oder marktstrategischen Bedeutung stellen diese Unternehmensdaten für die Unternehmen einen bedeutenden Vermögensgegenstand dar. Demzufolge unternehmen die Unternehmen große Anstrengungen bei der Erfassung und der Analyse dieser Daten.
Für die Erfassung solcher Unternehmensdaten stehen verschiedene, allgemein bekannte Systeme zur Verfügung, wie beispielsweise Customer Relationship Management Systeme (CRM) [1] , Supply Chain Management Systeme (SCM) [2] oder Data Wa- rehouses [3] . Nach der Erfassung werden die Daten meist in Datenbanken abgelegt und entsprechend strukturiert gespeichert. In der Regel werden dabei Datensätze Di= (Ai, Bi, Ci, ...) gebildet, wobei der Index i den jeweiligen Datensatz Di bezeichnet.
Jeder Datensatz Di repräsentiert ein bestimmtes Objekt aus einer Gruppe von Objekten, beispielsweise einen bestimmten Kunden aus allen erfassten Kunden eines Unternehmens oder ein bestimmtes Produkt aus einer Produktlinie eines Unternehmens.
Jeder Datensatz umfasst dabei eine vorgebbare Anzahl von Einträgen, Ai, Bi, Ci, ..., die einzelnen erfassten Daten, mit Kategorien bzw. Attributen A, B, C, .... Diese Kategorien bzw. Attribute repräsentieren Eigenschaften einer Objektgrup- pe, wie Alter (A) , Einkommen (B) , erworbenes Produkt (C) , ... . Die Einträge Ai, Bi, Ci, ... zu den jeweiligen Kategorien A, B, C, ... können dabei nummerischer oder semantischer Art sein.
Für die Analyse solcher Unternehmensdaten werden statistische Verfahren, sogenannte Data Mining Verfahren [4], [10], [11], [12], verwendet. Viele dieser Data Mining Verfahren bauen dabei auf einem statischen Framework auf, d.h. sie sind in einer statistischen Sprache formuliert.
Ein hinlänglich bekanntes und häufig eingesetztes Data Mining Verfahren ist ein sogenannter Entscheidungsbaum [5] .
Weitere bekannte und verwendete Data Mining Verfahren sind sogenannte Clustering Verfahren [6] oder Assoziationsregeln (Association Rules) [9] .
Nachteilig bei vielen der bekannten und genannten Analyseverfahren ist, dass sie bei der Analyse großer Datenmengen nur unzureichend anwendbar sind. In der Regel ist dort nämlich ein einmaliger oder mehrmaliger Zugriff auf den gesamten, zu analysierenden Datenbestand, welcher beispielsweise in einer Datenbank gespeichert ist, notwendig.
Bei großen Datenmengen führt dies zu langen Zugriffszeiten, zu langen Rechen- und Antwortzeiten und bedingt dadurch eine schlechte Performanz. Weiter ist auch eine hohe Rechenleistung bzw. Rechenkapazität von Nöten.
Aus [7] ist eine Ermittlung eines gemeinsamen Wahrscheinlich- keitsmodells P (A, B, C, ..., X) für eine Datenstruktur (A, B, C, ...) basierend auf einer versteckten Variable X bekannt.
Aus [8] ist eine Ermittlung eines gemeinsamen Wahrscheinlichkeitsmodells P (A, B, C, ...) für eine Datenstruktur (A, B, C, .-.) basierend auf ein Strukturlernen bekannt.
Der Erfindung liegt die Aufgabe zugrunde, ein Analyseverfahren zur Analyse strukturierter Nutzdaten anzugeben, welches auch bei großen Nutzdatenmengen anwendbar ist und auch dort eine hohe Performanz aufweist.
Diese Aufgabe wird durch das Verfahren und die Anordnung sowie durch das Computerprogramm mit Programmcode-Mitteln und das Computerprogramm-Produkt zur Analyse von gemäß einer Da- tenbankstruktur strukturierten Nutzdaten mit den Merkmalen gemäß dem jeweiligen unabhängigen Patentanspruch gelöst.
Bei dem Verfahren zur Analyse von gemäß einer Datenbankstruktur strukturierten Nutzdaten wird zuerst ein gemeinsames sta- tistisches Wahrscheinlichkeitsmodell für die gemäß der Datenbankstruktur strukturierten Nutzdaten ermittelt. Anschließend werden die gemäß der Datenbankstruktur strukturierten Nutzdaten unter Verwendung eines statistischen Analyseverfahrens analysiert, wobei das bei der Analyse verwendete statistische Analyseverfahren auf das gemeinsame statistische Wahrscheinlichkeitsmodell angewendet wird, nicht wie üblich unmittelbar auf die Ausgangsdaten. Die Anordnung zur Analyse von gemäß einer Datenbankstruktur strukturierten Nutzdaten weist auf:
- eine Modellierungseinheit, mit welcher ein gemeinsames statistisches Wahrscheinlichkeitsmodell für die gemäß der Datenbankstruktur strukturierten Nutzdaten ermittelbar ist, sowie
- eine Analyseeinheit, mit welcher die gemäß der Datenbankstruktur strukturierten Nutzdaten unter Verwendung eines statistischen Analyseverfahrens derart analysierbar sind, dass das bei der Analyse verwendete statistische Analyseverfahren auf das gemeinsame statistische Wahrscheinlichkeitsmodell angewendet wird.
Anschaulich gesehen basiert die Erfindung auf einer zweistufigen Vorgehensweise.
Auszugehen ist zunächst von vorgebbaren, gemäß einer Datenbankstruktur strukturierten Nutzdaten. Dabei unter einer der- artigen datenbankgemäßen Strukturierung zu verstehen, dass den Nutzdaten eine übergeordnete feste Struktur zugrunde liegt, beispielsweise jeweils gleich strukturierte Datensätze (Ai, Bi, Ci, ... ) mit gleichen Eintragskategorien A, B, C, ... . Derartige Strukturen sind allgemein bekannt.
Aus diesen zu analysierenden, gemäß einer Datenbankstruktur strukturierten Nutzdaten wird ein gemeinsames, zweckunabhängiges Wahrscheinlichkeitsmodell, wie beispielsweise in [7] , [8] beschrieben, gebildet.
Dieses stellt ein allgemeines, vollständiges und genaues Abbild einer Statistik der Datenstruktur der strukturierten Nutzdaten dar („Analytisches Datenbank-Abbild"" ) . Ferner ist es eine hochkomprimierte Form eines Wissens über die Nutzda- ten. Das allgemeine Abbild kann dann nachfolgend als Grundlage für die Analyse durch die statistischen Verfahren verwendet werden. Diese greifen dann nicht mehr auf den gesamten Nutzdatenbestand bzw. auf die einzelnen Nutzdaten zu, sondern nutzen das erstellte statistische Abbild, d.h. das gemeinsame Wahrscheinlichkeitsmodell, für die Analyse.
Dadurch können Zugriffs-, Rechen- und Antwortzeiten bei der Analyse reduziert und damit die Performanz gesteigert werden.
Das erfindungsgemäße Computerprogramm mit Programmcode- Mitteln ist eingerichtet, um alle Schritte gemäß dem erfindungsgemäßen Analyseverfahren durchzuführen, wenn das Programm auf einem Computer ausgeführt wird.
Das Computerprogramm-Produkt mit auf einem maschinenlesbaren Träger gespeicherten Programmcode-Mitteln ist eingerichtet, um alle Schritte gemäß dem erfindungsgemäßen Analyseverfahren durchzuführen, wenn das Programm auf einem Computer ausge- führt wird.
Die Anordnung sowie das Computerprogramm mit Programmcode- Mitteln, eingerichtet um alle Schritte gemäß dem erfinderischen Analyseverfahren durchzuführen, wenn das Programm auf einem Computer ausgeführt wird, sowie das Computerprogramm- Produkt mit auf einem maschinenlesbaren Träger gespeicherten Programmcode-Mitteln, eingerichtet um alle Schritte gemäß dem erfinderischen Analyseverfahren durchzuführen, wenn das Programm auf einem Computer ausgeführt wird, sind insbesondere geeignet zur Durchführung des erfindungsgemäßen Analyseverfahrens oder einer seiner nachfolgend erläuterten Weiterbildungen.
Bevorzugte Weiterbildungen der Erfindung ergeben sich aus den abhängigen Ansprüchen. Die im weiteren beschriebenen Weiterbildungen beziehen sich sowohl auf die Verfahren als auch auf die Anordnung.
Die Erfindung und die im weiteren beschriebenen Weiterbildun- gen können sowohl in Software als auch in Hardware, beispielsweise unter Verwendung einer speziellen elektrischen Schaltung, realisiert werden.
Ferner ist eine Realisierung der Erfindung oder einer im wei- teren beschriebenen Weiterbildung möglich durch ein computerlesbares Speichermedium, auf welchem das Computerprogramm mit Programmcode-Mitteln gespeichert ist, welches die Erfindung oder Weiterbildung ausführt.
Auch kann die Erfindung oder jede im weiteren beschriebene
Weiterbildung durch ein Computerprogrammerzeugnis realisiert sein, welches ein Speichermedium aufweist, auf welchem das Computerprogramm mit Programmcode-Mitteln gespeichert ist, welches die Erfindung oder Weiterbildung ausführt.
In einer Weiterbildung werden in Nutzdatensätzen strukturierte Nutzdaten verwendet, beispielsweise Nutzdatensätze aus einer Datenbank. Dabei repräsentiert jeder Nutzdatensatz ein bestimmtes Objekt aus einer Gruppe von Objekten. Die dem je- weiligen Nutzdatensatz zugehörigen Nutzdaten beschreiben dabei Eigenschaften des jeweiligen Objekts.
Für die Ermittlung des gemeinsamen statistischen Wahrscheinlichkeitsmodell können statistische Verfahren basierend auf einer versteckten Variable [7] oder Verfahren basierend auf ein Strukturlernen [8] verwendet werden. Auch eine Kombination beider Verfahren ist möglich.
Ferner ist es zweckmäßig, dass das statistische Analysever- fahren derart auf das gemeinsame statistische Wahrscheinlichkeitsmodell angewendet wird, dass eine gemeinsame Wahrscheinlichkeit als Eingangsgröße für das statistische Analysever- fahren verwendet wird. Die gemeinsame Wahrscheinlichkeit ergibt sich unmittelbar aus dem gemeinsamen Wahrscheinlichkeitsmodell. Dadurch lassen sich unnötige Zwischenschritte vermeiden, die Rechenzeit kosten und Antwortzeiten verlän- gern.
Als statistisches Analyseverfahren kann ein Verfahren auf Basis eines Data Mining Verfahrens [4], [10], [11], [12] verwendet wird, beispielsweise ein Clustering Verfahren [5] oder ein Entscheidungsbaum [6] oder Assoziationsregeln [9] .
Bei der Analyse unter Verwendung des statistischen Analyseverfahrens ist es möglich, Abhängigkeiten zwischen den Nutzdaten und/oder deren Signifikanzen basierend auf einem sta- tistischen Test zu ermitteln. Dies kann wegen der hochkomprimierten Form der Nutzdaten, d.h. des gemeinsamen Wahrscheinlichkeitsmodells, interaktiv und sehr effizient erfolgen.
Ferner ist es sinnvoll, die Ermittlung des gemeinsamen sta- tistischen Wahrscheinlichkeitsmodells und die Analyse des gemeinsamen statistischen Wahrscheinlichkeitsmodell durch das statistische Analyseverfahren zeit- und ortsverschieden durchzuführen.
So kann beispielsweise das Analytische Datenbank-Abbild, d.h. das gemeinsame Wahrscheinlichkeitsmodell, in vorgebbaren zeitlichen Intervallen, wie täglich oder wöchentlich, neu gebildet werden. Die Bildung kann nachts oder am Wochenende erfolgen. Das vollständige Analytische-Datenbank-Abbild steht dann bei Bedarf zur Verfügung, um Analysen erheblich zu beschleunigen.
Die Nutzdaten können aus verschiedenen Datenquellen bezogen werden. Am einfachsten ist der Bezug der Nutzdaten aus einer Datenbank, in welcher die Nutzdaten gespeichert sind und von welcher sie ausgelesen werden. Die Erfindung ist wegen der durch sie erreichbaren Performanz bei der Analyse von Daten insbesondere dort geeignet, wo große Datenmengen zu verarbeiten bzw. zu analysieren sind, wie im Bereich eines Customer Relationship Management (CRM) [1] oder eines Supply Chain Management [2] oder eines Data Ware- house (DW) [3] .
Im Bereich CMR kann eine Weiterbildung beispielsweise dazu eingesetzt werden, um Kundendaten zu analysieren. In diesem Fall ist das Objekt ein Kunde, welcher durch mindestens zwei der folgenden Eigenschaften, Alter, Einkommen, erworbenes Produkt, Datum des Erwerbs, Häufigkeit von Käufen, beschrieben wird. Dadurch lassen sich für Marketingabteilungen eminent wichtige Fragestellungen lösen, wie ein Kundenverhalten bestimmter Kundengruppen. Basierend darauf lassen sich gezielter Zielgruppen bei einer Akquisition von Kunden bestimmen, für bestimmte Produkte und Marketingkampagnen sinnvoller Kundengruppen auswählen und Kunden allgemein vorausschauender bedienen.
Ein Ausführungsbeispiel der Erfindung ist in Figuren dargestellt und wird im weiteren erläutert.
Es zeigen
Figur 1 Skizze, die schematisch eine Funktionsweise eines
Analysesystems zur Analyse von Kundendaten gemäß einem Ausführungsbeispiel zeigt;
Figuren 2a bis g Skizzen, die Analyseergebnisse eines Analysesystems zur Analyse von Kundendaten gemäß einem Ausführungsbeispiel zeigen.
Ausfü rungsbeispiel : Analysesystem zur Analyse eines Kundenverhaltens bei einer Bank basierend auf einem Customer Relationship Management System Gegenstand des Ausführungsbeispiels ist ein Analysesystem zur Analyse von Kundendaten einer Bank.
Vorwegzuschicken ist, dass das im Folgende beschriebene Analysesystem nicht nur bei Banken, sondern auch bei beliebigen Unternehmen zur Analyse von entsprechenden Unternehmensdaten einsetzbar ist, wie beispielsweise bei Warenhäuser oder produzierenden Unternehmen.
Funktionsweise des Analysesystems (Fig.l)
Fig.l zeigt schematisch die Funktionsweise 100 des Analysesystems zur Analyse der Bankkundendaten 110.
Die Funktionsweise 100 teilt sich auf in eine Wissensgewinnung 101 und eine Umsetzung des Wissens in eine intelligente Bedienung der Bankkunden 102.
Große und damit schwer handhabbare Mengen von Kundendaten 110 werden zunächst zu einem statistischen Modell 112, einem gemeinsamen Wahrscheinlichkeitsmodell, des Kundenverhaltens kondensiert 111.
Das verwendete gemeinsame Wahrscheinlichkeitsmodell 112 ist eines auf der Basis einer versteckten Variablen. Grundlagen dazu sind in [7] beschrieben.
Anzumerken ist, dass auch andere Arten von gemeinsamen Wahr- scheinlichkeitsmodellen verwendet werden können, wie beispielsweise solche auf der Basis von Strukturlernen [8] .
An Hand des gemeinsamen Wahrscheinlichkeitsmodells 112 lassen sich Eigenschaften der Kunden und insbesondere deren Verhal- ten über die Zeit sehr viel effizienter und flexibler explo- rieren als an Hand der Ausgangsdaten. Dazu werden statistische Verfahren 120, im allgemeinen Data Mining Verfahren und hier in diesem Fall ein Entscheidungsbaum, verwendet, welche bzw. welcher auf das statistische Modell aufsetzen bzw. aufsetzt.
Anzumerken ist, dass auch andere Data Mining Verfahren verwendet werden können, wie beispielsweise Clustering Verfahren oder Assoziations-Regeln.
Grundlagen von Data Mining Verfahren sind in [4] , [10] , [11] , [12], eines Entscheidungsbaums in [6] und von Clustering Verfahren in [5] beschrieben.
Ermöglicht wird die Kopplung dadurch, dass die Data Mining Verfahren bzw. der Entscheidungsbaum 120 auf einem statistischen Framework aufbauen bzw. aufbaut und damit die gleiche statistischen Begriffe bzw. die gleiche statistische Sprache wie das gemeinsame Wahrscheinlichkeitsmodell 112 benutzt.
Wichtige Fragestellungen (vgl. Figuren 2) können anhand des Entscheidungsbaums 120 im Rückgriff auf das gemeinsame Wahrscheinlichkeitsmodell 112 interaktiv beantwortet werden 140.
Damit ist nicht nur eine quantitative (wie viel Kunden?) son- dern auch eine qualitative Sicht auf die Kunden (welche Sorte von Kunden) möglich, z.B.:
- Wie viele und welche Qualität von Kunden kommen über welche Partnerschaften oder Kampagnen? Wie effizient sind meine Werbemaßnahmen? - Welche Kundenklassen mit welchen Präferenzen und Bedürfnissen gibt es? Wie und wann lassen sich diese Bedürfnisse am besten befriedigen?
Ergebnisse der Fragestellungen lassen sich weiterführend um- setzen 121 in eine intelligente Bedienung der Kunden 130. Kundendaten ( (Fig.1 , 110) Die Kundendaten 110 bei dem Analysesystem werden im Rahmen eines Customer Relationship Management (CRM) 150 erhoben.
Grundlagen eines CRM sind in [1] beschrieben.
Bei dem CRM 150 werden große Mengen an Daten 110 über die Bankkunden aus allen Vertriebskanälen der Bank, wie direkte Kontakte, Web, Call Center, erfasst und gespeichert.
Erfasst und gespeichert werden für die Kunden jeweils (sogenannte Attribute A, B, C, ...) :
- die erworbenen Bankprodukte A in der jeweiligen zeitlichen Reihenfolge (AI, A2, A3, ...),
- ein zeitlicher Kaufabstand B zwischen den Erwerbszeitpunk- ten der erworbenen Bankprodukten (Bl-2, B2-3, B3-4, ...),
- ein Geburtsdatum (C) ,
- ein Einkommen (D) ,
- eine Adresse (E) ,
- der letzter Bankbesuch (F) , - die letze Kontobewegung (G) .
Die Speicherung erfolgt in einer Datenbank in Form von kundenspezifischen Datensätzen Di (AI, A2, ..., Bl-2, B2-3, ..., C, D, ...), wobei der Index i den jeweiligen Bankkunden i kennzeichnet.
Gemeinsames Wahrscheinlichkeitsmodell (Fig.l, 112)
Das Wissen über die Bankkunden, das in diesen Daten 110 ver- borgen liegt, wird dann zu einem Modell, dem gemeinsamen Wahrscheinlichkeitsmodell 112, kondensiert.
Das verwendete gemeinsame Wahrscheinlichkeitsmodell 112 ist eines auf der Basis einer versteckten Variablen X. Grundlagen dazu sind in [7] beschrieben. Geschrieben wird das gemeinsame Wahrscheinlichkeitsmodell 112 basierend auf der versteckten Variablen X als P(A,B, C, ..., X) für alle Attribute (A, B, C, ...).
Ein solches statistischen Abbild von Daten stellt eine hochkomprimierte Form eines Wissens über Kunden dar und kann genutzt werden, um effizient und interaktiv Abhängigkeiten zu explorieren 120, 140.
An Hand des hier erstellten gemeinsamen Wahrscheinlichkeitsmodells 112 läßt sich nun das Wissen über die Kunden schnell über effizient abgreifen, insbesondere lassen sich Verhaltensweisen der Kunden einfach und flexibel studieren, lassen sich typische Verhaltensmuster und Entwicklungszyklen von Kunden effizient und intuitiv analysieren, lassen sich typische Kundensegmente und deren Präferenzen sicher und eindeutig bestimmen und erkennen 120, 140.
Ferner liefert das gemeinsame Wahrscheinlichkeitsmodell 112 über die beschriebene Analysefunktion hinaus schnell abrufbare Prognosen über weiter zu erwartendes Verhalten und aktuelle Bedürfnisse eines Kunden. Die Prognosen können weiter dazu genutzt werden, Kunden vorausschauend und gezielt zu bedienen und proaktive, persönliche Angebote zu unterbreiten 130.
Aufsatz eines Entscheidungsbaums auf das gemeinsame Wahr- sσheinlichkeitsmodell (Fig.l, 120)
In weiterer Verwendung des gemeinsamen Wahrscheinlichkeitsmo- dells 112 wird der Entscheidungsbaum [6] auf das statistische Modell 112, das gemeinsame Wahrscheinlichkeitsmodell 112, aufgesetzt 120.
Damit lassen sich beliebige Randverteilungen, wie die für ei- nen ersten Split des Entscheidungsbaums, nämlich P(A,X),
P(B,X), P(C,X), ..., und auch für alle weiteren Splits des Entscheidungsbaums ermitteln. Weiter lassen sich auch alle Grundwahrscheinlichkeitsverteilungen bzw. Grundwahrscheinlichkeiten P (A) , P(B), ... und beliebige bedingte Wahrscheinlichkeiten bzw. Wahrscheinlich- keitsverteilungen P(B|A), P(C|A), P(C|B), ... ermitteln.
Aus der gemeinsamen Verteilung P(A,B, C, ..., X) basierend auf der versteckten (oder latenten) Variable X geht zunächst die gemeinsame Verteilung P(A,B, C, ...) über alle Attribute der Kunden durch Summation über die versteckte Variable X hervor.
Strukturlernen liefert hier unmittelbar eine gemeinsame Verteilung P(A,B, C, ...).
Aus der gemeinsamen Verteilung lassen sich dann beliebige ein-dimensionale Randverteilungen (Marginale) P (A) , P(B), ..., niedrig-dimensionalere Verteilungen P(A,B), P(B,C), ... und beliebige bedingte Wahrscheinlichkeiten (ein- oder ehr- dimensionale) P(B|A), P(C|A), P(A,C|B), ... ableiten.
Dies erfolgt im Rahmen eines Inferenzprozesses, wie in [13] beschrieben.
Dabei wird nach [13] die Struktur der Modelle, beispielsweise welche mit einer vorgegebenen versteckten Variable oder welche, die durch Strukturlernen erzeugt wurden, oder eine Kombination der Vorgenannten, genutzt, um notwendigen Summen ü- ber die gemeinsame Verteilung effizient zu berechnen.
Entscheidungsbäume werden zumeist nach einem bekannten CHAID oder einem bekannten CART Verfahren aufgebaut.
Im Allgemeinen benötigt man zum Aufbau eines Entscheidungs- baums mit einer Zielvariablen (oder abhängigen Variablen) A für den sogenannten ersten Split zunächst alle paarweisen Verteilungen P(A,B), P(B,C), P(A,D), ... . Eine Selektion einer Variablen aus der Menge der Variablen B, C, D, ... , für den ersten Split erfolgt dann bei fast allen bekannten Verfahren basierend auf einem statistischen Krite- rium (einem statistischen Test und Signifikanzkriterien) basierend auf den paarweisen Verteilungen P(A,B), P(B,C), P(A, D), ... und einer bekannten Anzahl an Daten.
Wurde beispielsweise für den ersten Split die Variable D mit den beiden Werten dl und d2 gewählt., so benötigt man für den zweiten Split bedingte, paarweise Verteilungen der Form P(A,B|dl), P(A,B|d2), P(A,C|dl), P(A,C|d2), ... .
Die notwendigen Wahrscheinlichkeiten oder Verteilungen für den Aufbau des Entscheidungsbaums (bzw. als Grundlagen für die notwendigen statistischen Tests) können (wie üblich) aus den Daten oder auch aus einem möglichst genauen, im Obigen beschrieben Wahrscheinlichkeitsmodell (Inferenzprozess) ermittelt werden.
Interaktive Analysen (Fig.l, 140, Fig.2a bis 2g)
Fig. 2a bis 2g zeigen exemplarisch einige der möglichen interaktiven Analysen 140, welche mit dem Entscheidungsbaum 120 im Rückgriff auf das gemeinsame Wahrscheinlichkeitsmodell 112 durchgeführt werden können.
Fig.2a zeigt Wahrscheinlichkeitsverteilungen P(A1), P(A2) P(A3) P(A4), P(A5), P(Bl-2), P(B2-3), P(B3-4) und P(C) und P(D). Besondere gekennzeichnet ist P (Al= „Giro/Gehalts- Konto) =56, 125% .
Fig.2b zeigt nun bedingte Wahrscheinlichkeitsverteilungen unter der Bedingung Al= „Giro/Gehalts-Kontoλλ , nämlich P(A2|A1= „Giro/Gehalts-Konto"), P (A3 |A1= „Giro/Gehalts-Konto" ) , P(A4|A1= „Giro/Gehalts-Konto"), P(A5|A1= „Giro/Gehalts- Konto") , P(B1-2|A1= „Giro/Gehalts-Kontoλ ) , P(B2-3|A1= „Gi- ro/Gehalts-Konto") , P (B3-4 |A1= „Giro/Gehalts-Konto" ) und P(C|A1= „Giro/Gehalts-Konto") und P(D|A1= „Giro/Gehalts- Konto" ) . Besonders gekennzeichnet sind P (A2= „Versiche- rungspodukt |Al= „Giro/Gehalts-Konto) =29% und P (A2= „Spa- ren/Geldanlage | Al= „Giro/Gehalts-Konto) =50% .
Fig.2c zeigt nun bedingte Wahrscheinlichkeitsverteilungen unter den Bedingungen Al= „Giro/Gehalts-Konto" und A2= „Versicherungsprodukt", nämlich P(A3|A1= „Giro/Gehalts-Konto", A2= „Versicherungsprodukt") , P(A4|A1= „Giro/Gehalts-Konto", A2= „Versicherungsprodukt"), P(A5|A1= „Giro/Gehalts-Konto", A2= „Versicherungsprodukt"), ... . Besonders gekennzeichnet ist hier P(Bl-2= „Kaufabstand zwischen erstem und zweitem Produkt größer 3 Jahre |A1= „Giro/Gehalts-Konto" ,A2= „Versicherungs- produkt) =85%.
Fig.2d zeigt weitere bedingte Wahrscheinlichkeitsverteilungen unter den Bedingungen Al= „Giro/Gehalts-Konto" und A2= „Sparen/Geldanlage", nämlich P(A3|A1= „Giro/Gehalts-Konto", A2= „Sparen/Geldanlage"), P(A4|A1= „Giro/Gehalts-Konto", A2= „Sparen/Geldanlage"), P(A5|A1= „Giro/Gehalts-Konto", A2= „Sparen/Geldanlage"), ... . Besonders gekennzeichnet sind hier die Wahrscheinlichkeitsverteilungen P(B1-2|A1= „Giro/Gehalts-Konto" ,A2= „Sparen/Geldanlage") .
Fig.2e zeigt die Wahrscheinlichkeitsverteilungen P(A1), P(A2) P(A3) P(A4), P(A5), P(Bl-2), P(B2-3), P(B3-4) und P(C) und P(D). Besondere gekennzeichnet ist P (Al= „Giro/Gehalts- Konto) =56, 125% . Desweiteren zeigt Fig.2e die Wahrscheinlich- keitsverteilung der versteckten Variable X, bezeichnet hier als Segmente, nämlich P (Segmente). Besonders gekennzeichnet st P (Segmente=4) = 34%, was zeigt, dass 34% aller erfassten Bankkunden in das Segment 4 fallen.
Figuren 2f und 2g zeigen wiederum die bedingte Wahrscheinlichkeitsverteilungen, einmal unter der Bedingung Segmente=4 (Fig.2f) und das andere Mal unter der Bedingung C= Geburtsdatum zwischen 980 und 1990 (Fig.2g) .
Im Rahmen dieses Dokuments sind folgende Veröffentlichungen zitiert:
[1] Customer Relationship Management System, erhältlich am 31.08.2002 unter: http://www.crm-expo.com/.
[2] Supply Chain Management System, erhältlich am 31.06.2002 unter: http: //www. sap-ag.de/germany/solutions/scm/.
[3] Data Warehouse, erhältlich am 31.08.2002 unter: http : //www. data-warehouse-systeme . de/ .
[4] Heckermann, D., „Bayesian Networks for Data Mining", Data Mining and Knowledge Discovery, Seiten 79 bis 119, 1997.
[5] Kass, G., „An exploratory technique for investigating large quantities of categorical data" , Applied Sta- tistics, 29:2, Seiten 119 bis 117, 1980.
[6] Bezdek, J.C., Pal, S.K., „Fuzzy Models for Pattern Re- cognition", IEEE Press, 1992.
[7] Everitt, B. S., „An Introduction to Latent Variable Mo- dels" , London, Chapman and Hall, 1984.
[8] Reimar Hofmann, „Lernen der Struktur nichtlinearer Abhängigkeiten mit graphischen Modellen", Dissertation an der Technischen Universität München, Verlag: dissertati- on.de, ISBN: 3-89825-131-4.
[9] Ashoka Savasere, Edward Omiecinski, Shamkant B. Navathe, "An Efficient Algorithm for Mining Association Rules in Large Databases", The VLDB Journal, Seiten 432 bis 444", 1995. [10] Usama M. Fayyad, Gregory Piatetsky-Shapiro, Padhraic Smyth and Ramasamy Uthurusamy, "Advances in Knowledge Discovery and Data Mining", American Association for Ar- tificial Intelligence, CA, 1996. [11] lan H. Witten, Eibe Frank, Morgan Kaufmann, Data Mining, 2000.
[12] T. Hastie, R. Tibshirani, J. H. Friedman, „The Elements of Statistical Learning: Data Mining, Inference, and Prediction" , Springer Series in Statistics.
[13] Jensen, V. J., "An Introduction to Bayesian Networks", UCL Press, London, 1996.

Claims

Patentansprüche
1. Verfahren zur Analyse von gemäß einer Datenbankstruktur strukturierten Nutzdaten, - bei dem ein gemeinsames statistisches Wahrscheinlichkeitsmodell für die gemäß der Datenbankstruktur strukturierten Nutzdaten ermittelt wird, - bei dem die gemäß der Datenbankstruktur strukturierten Nutzdaten unter Verwendung eines statistischen Analysever- fahrens analysiert werden, wobei das bei der Analyse verwendete statistische Analyseverfahren auf das gemeinsame statistische Wahrscheinlichkeitsmodell angewendet wird.
2. Verfahren nach Anspruch 1, bei dem die gemäß der Datenbankstruktur strukturierten Nutzdaten in Nutzdatensätze strukturiert sind, welche Nutzdatensätze jeweils ein Objekt repräsentieren, wobei .die Nutzdaten eines Nutzdatensatzes Eigenschaften des jeweiligen Objekts beschreiben.
3. Verfahren nach Anspruch 1 oder 2, bei dem das gemeinsame statistische Wahrscheinlichkeitsmodell basierend auf einer versteckten Variable ermittelt wird.
4. Verfahren nach einem der Ansprüche 1 bis 3, bei dem das gemeinsame statistische Wahrscheinlichkeitsmodell basierend auf ein Strukturlernen ermittelt wird.
5. Verfahren nach einem der vorangehenden Ansprüche, bei dem das statistische Analyseverfahren derart auf das gemeinsame statistische Wahrscheinlichkeitsmodell angewendet wird, dass eine gemeinsame Wahrscheinlichkeit des gemeinsamen Wahrscheinlichkeitsmodells als Eingangsgröße für das statistische Analyseverfahren verwendet wird.
6. Verfahren nach einem der vorangehenden Ansprüche, bei dem als statistisches Analyseverfahren ein Verfahren auf Basis eines Data Mining Verfahrens verwendet wird.
7. Verfahren nach Anspruch 6, bei dem als statistisches Analyseverfahren ein Clustering Verfahren verwendet wird.
8. Verfahren nach Anspruch 6
Bei dem als statistisches Analyseverfahren ein Verfahren be- kannt unter dem Namen „Assoziationsregeln" verwendet wird.
9. Verfahren nach Anspruch 6, bei dem als statistisches Analyseverfahren ein Entscheidungsbaum verwendet wird.
10. Verfahren nach einem der vorangehenden Ansprüche, bei dem bei der Analyse unter Verwendung des statistischen Analyseverfahrens Abhängigkeiten zwischen den Nutzdaten ermittelt werden und/oder deren Signifikanzen basierend auf ei- nem statistischen Test ermittelt werden.
11. Verfahren nach einem der vorangehenden Ansprüche, bei dem die Ermittlung des gemeinsamen statistischen Wahrscheinlichkeitsmodells und die Analyse des gemeinsamen sta- tistischen Wahrscheinlichkeitsmodell durch das statistische Analyseverfahren zeit- und ortsverschieden durchgeführt werden.
12. Verfahren nach einem der vorangehenden Ansprüche, bei dem die Nutzdaten in einer Datenbank gespeichert werden.
13. Verfahren nach einem der Ansprüche 2 bis 12, bei dem das Objekt ein Kunde ist, welcher durch mindestens zwei der folgenden Eigenschaften, Alter, Einkommen, erworbe- nes Produkt, Datum des Erwerbs, Häufigkeit von Käufen, beschrieben wird.
14. Verfahren nach einem der vorangehenden Ansprüche, eingesetzt bei dem Data Warehouse, wobei die Nutzdaten das Data Warehouse beschreiben.
15. Verfahren nach einem der Ansprüche 1 bis 13, eingesetzt bei einem Customer Relationship Management oder einem Supply Chain Management, wobei die Nutzdaten Kundendaten oder Produktdaten sind.
16. Anordnung zur Analyse von gemäß einer Datenbankstruktur strukturierten Nutzdaten,
- mit einer Modellierungseinheit, mit welcher ein gemeinsames statistisches Wahrscheinlichkeitsmodell für die gemäß der Datenbankstruktur strukturierten Nutzdaten ermittelbar ist,
- mit einer Analyseeinheit, mit welcher die gemäß der Datenbankstruktur strukturierten Nutzdaten unter Verwendung eines statistischen Analyseverfahrens derart analysierbar sind, dass das bei der Analyse verwendete statistische A- nalyseverfahren auf das gemeinsame statistische Wahrscheinlichkeitsmodell angewendet wird.
17. Computerprogramm-Erzeugnis, das ein computerlesbares Speichermedium umfasst, auf dem ein Programm gespeichert ist, das es einem Computer ermöglicht, nachdem es in einen Speicher des Computers geladen worden ist, folgende Schritte durchzuführen zur Analyse von gemäß einer Datenbankstruktur strukturierten Nutzdaten,
- ein gemeinsames statistisches Wahrscheinlichkeitsmodell wird für die gemäß der Datenbankstruktur strukturierten
Nutzdaten ermittelt,
- die gemäß der Datenbankstruktur strukturierten Nutzdaten werden unter Verwendung eines statistischen Analyseverfahrens analysiert, wobei das bei der Analyse verwendete sta- tistische Analyseverfahren auf das gemeinsame statistische Wahrscheinlichkeitsmodell angewendet wird.
18. Computerlesbares Speichermedium, auf dem ein Programm gespeichert ist, das es einem Computer ermöglicht, nachdem es in einen Speicher des Computers geladen worden ist, folgende Schritte durchzuführen zur Analyse von gemäß einer Datenbank- Struktur strukturierten Nutzdaten,
- ein gemeinsames statistisches Wahrscheinlichkeitsmodell wird für die gemäß der Datenbankstruktur strukturierten Nutzdaten ermittelt,
- die gemäß der Datenbankstruktur strukturierten Nutzdaten werden unter Verwendung eines statistischen Analyseverfahrens analysiert, wobei das bei der Analyse verwendete statistische Analyseverfahren auf das gemeinsame statistische Wahrscheinlichkeitsmodell angewendet wird.
19. Computerprogramm mit Programmcode-Mitteln, um alle
Schritte gemäß Anspruch 1 durchzuführen, wenn das Programm auf einem Computer ausgeführt wird.
20. Computerprogramm mit Programmcode-Mitteln gemäß Anspruch 18, die auf einem computerlesbaren Datenträger gespeichert sind.
21. Computerprogramm-Produkt mit auf einem maschinenlesbaren Träger gespeicherten Programmcode-Mitteln, um alle Schritte gemäß Anspruch 1 durchzuführen, wenn das Programm auf einem Computer ausgeführt wird.
EP03794981A 2002-09-02 2003-09-02 Verfahren und anordnung sowie computerprogramm mit programmcode-mitteln und computerprogramm-produkt zur analyse von gem ss e iner datenbankstruktur strukturierten nutzdaten Withdrawn EP1629401A2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10240443 2002-09-02
PCT/EP2003/009752 WO2004025501A2 (de) 2002-09-02 2003-09-02 Verfahren und anordnung sowie computerprogramm mit programmcode-mitteln und computerprogramm-produkt zur analyse von gemäss einer datenbankstruktur strukturierten nutzdaten

Publications (1)

Publication Number Publication Date
EP1629401A2 true EP1629401A2 (de) 2006-03-01

Family

ID=31983891

Family Applications (1)

Application Number Title Priority Date Filing Date
EP03794981A Withdrawn EP1629401A2 (de) 2002-09-02 2003-09-02 Verfahren und anordnung sowie computerprogramm mit programmcode-mitteln und computerprogramm-produkt zur analyse von gem ss e iner datenbankstruktur strukturierten nutzdaten

Country Status (5)

Country Link
US (1) US20060173889A1 (de)
EP (1) EP1629401A2 (de)
JP (1) JP2005537585A (de)
AU (1) AU2003264251A1 (de)
WO (1) WO2004025501A2 (de)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103685475A (zh) * 2013-11-22 2014-03-26 广东泛在无线射频识别公共技术支持有限公司 一种实现跨机构共享产品主数据的数据定位方法及系统
US10909575B2 (en) 2015-06-25 2021-02-02 Salesforce.Com, Inc. Account recommendations for user account sets
US10715626B2 (en) 2015-06-26 2020-07-14 Salesforce.Com, Inc. Account routing to user account sets
US20160379266A1 (en) * 2015-06-29 2016-12-29 Salesforce.Com, Inc. Prioritizing accounts in user account sets

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5704017A (en) * 1996-02-16 1997-12-30 Microsoft Corporation Collaborative filtering utilizing a belief network

Also Published As

Publication number Publication date
US20060173889A1 (en) 2006-08-03
WO2004025501A2 (de) 2004-03-25
AU2003264251A1 (en) 2004-04-30
JP2005537585A (ja) 2005-12-08

Similar Documents

Publication Publication Date Title
DE69527880T2 (de) Bestimmung des Verhaltensprofils einer Funktionseinheit mittels unscharfer Logik
DE69809964T2 (de) Online-datenbank ausbeutung
DE69127847T2 (de) Verfahren und Gerät zur Klassifizierung von Daten
DE112019004260T5 (de) Analyse und korrektur der lieferketten-gestaltung durch maschinelles lernen
DE602004006485T2 (de) Verfahren zur automatisierten anmerkung von berichten mehrdimensionaler datenbanken mit informationsobjekten eines datenspeichers
EP3584751A1 (de) Verfahren zum erstellen eines digitalen zwillings
WO2000011581A1 (de) Verfahren zur fortschrittlichen mengenorientierten kostenzuweisung unter verwendung verschiedener informationsquellen
EP1403793A1 (de) Verfahren zur automatischen integrierten Belegablage bei der Protokollierung von Geschäftsvorfällen
WO2004083983A2 (de) Vergleich von modellen eines komplexen systems
CH704497B1 (de) Verfahren zum Benachrichtigen, Speichermedium mit Prozessoranweisungen für ein solches Verfahren.
DE102020126568A1 (de) Systeme und verfahren für das feature-engineering
WO2004083982A2 (de) Modellierung eines komplexen systems
Boztuğ et al. Modellierungsansätze in der Warenkorbanalyse im Überblick
Braunwarth et al. Economic evaluation and optimization of the degree of automation in insurance processes
Rippler Das Persona-Prinzip
Gedenk et al. Die Wirkung von Preis-und Nicht-Preis-Promotions auf die Markenloyalität
WO2004025501A2 (de) Verfahren und anordnung sowie computerprogramm mit programmcode-mitteln und computerprogramm-produkt zur analyse von gemäss einer datenbankstruktur strukturierten nutzdaten
DE10331810A1 (de) Herstellungsoptimierung und Synchronisationsprozess
EP2601594A1 (de) Verfahren und vorrichtung zur automatischen verarbeitung von daten in einem zellen-format
DE60128059T2 (de) Verfahren und Erzeugnis zum Bereitstellen einer Service-to-role-zuweisung um Anwendungsdienste in einem auf Rollen basierten Rechnersystem aufzurufen
DE102012025349A1 (de) Bestimmung eines Ähnlichkeitsmaßes und Verarbeitung von Dokumenten
EP3672200A1 (de) Verfahren zur zusammenarbeit von mehreren geräten eines lokalen netzwerks
DE202022102520U1 (de) System zur Analyse von Werbung auf Online-Videoplattformen für digitales Marketing durch maschinelles Lernen, um ein breites Publikum zu erreichen
Mütze et al. Die Auftragsfreigabe–Unterschätzte Aufgabe der Fertigungssteuerung?
DE10208682A1 (de) Verfahren und System zur automatischen verhaltensorientierten Optimierung eines Portfolios der finanziellen Instrumente

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20050303

AK Designated contracting states

Kind code of ref document: A2

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LI LU MC NL PT RO SE SI SK TR

RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: PANORATIO DATABASE IMAGES GMBH

PUAK Availability of information related to the publication of the international search report

Free format text: ORIGINAL CODE: 0009015

17Q First examination report despatched

Effective date: 20080207

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20080618