" Verfahren und Anordnung sowie Computerprogramm mit Programmcode-Mitteln und Computerprogramm-Produkt zur Analyse von gemäss einer Datenbanksstruktur strukturierten nutzdaten"."Method and arrangement as well as computer program with program code means and computer program product for the analysis of user data structured according to a database structure".
Beschreibungdescription
Verfahren und Anordnung sowie Computerprogramm mit Programmcode-Mitteln und Computerprogramm-Produkt zur Analyse von ge- 5 maß einer Datenbankstruktur strukturierten NutzdatenMethod and arrangement as well as computer program with program code means and computer program product for the analysis of useful data structured according to a database structure
Die Erfindung betrifft eine Analyse von gemäß einer Datenbankstruktur strukturierten Nutzdaten, wie beispielsweise Kunden- oder Produktdaten eines Unternehmens . 0The invention relates to an analysis of user data structured according to a database structure, such as customer or product data of a company. 0
Fast jeder Vorgang in einem Unternehmen, wie jeder Kontakt des Unternehmens mit einem Kunden oder jeder logistische Vorgang innerhalb eines Unternehmens, beginnend bei einer Bestellung eines Produkts bis hin zu einer Auslieferung des 5 fertigen Produkts, wird heute elektronisch unterstützt durchgeführt bzw. kontrolliert und gesteuert.Almost every process in a company, such as every contact of the company with a customer or every logistical process within a company, starting with an order for a product up to the delivery of the 5 finished product, is now carried out electronically supported, controlled and controlled.
Dabei werden systematisch Daten, beispielsweise Kundendaten oder Produktdaten, erfasst und protokolliert, die Basis für 0 ökonomische, betriebswirtschaftliche und/oder marktstrategische Analysen sind, mit welchen die Daten in verwertbare öko^ nomische, betriebswirtschaftliche und/oder arktstrategische Erkenntnisse umgesetzt werden.Based on systematic data, such as customer data or product data, recorded and logged, the basis for 0 economic, business and / or strategic marketing analyzes, with which the data into usable eco ^ nomic, business and / or arktstrategische findings are implemented.
5 Wegen ihrer ökonomischen, betriebswirtschaftlichen und/oder marktstrategischen Bedeutung stellen diese Unternehmensdaten für die Unternehmen einen bedeutenden Vermögensgegenstand dar. Demzufolge unternehmen die Unternehmen große Anstrengungen bei der Erfassung und der Analyse dieser Daten.5 Because of their economic, economic and / or market-strategic importance, these company data represent a significant asset for the companies. As a result, the companies make great efforts to collect and analyze this data.
Für die Erfassung solcher Unternehmensdaten stehen verschiedene, allgemein bekannte Systeme zur Verfügung, wie beispielsweise Customer Relationship Management Systeme (CRM) [1] , Supply Chain Management Systeme (SCM) [2] oder Data Wa- rehouses [3] .
Nach der Erfassung werden die Daten meist in Datenbanken abgelegt und entsprechend strukturiert gespeichert. In der Regel werden dabei Datensätze Di= (Ai, Bi, Ci, ...) gebildet, wobei der Index i den jeweiligen Datensatz Di bezeichnet.Various well-known systems are available for the collection of such company data, such as customer relationship management systems ( C RM ) [1], supply chain management systems (SCM) [2] or data warehouses [3]. After collection, the data are usually stored in databases and stored in a structured manner. As a rule, data sets Di = (Ai, Bi, Ci, ...) are formed, the index i denoting the respective data set Di.
Jeder Datensatz Di repräsentiert ein bestimmtes Objekt aus einer Gruppe von Objekten, beispielsweise einen bestimmten Kunden aus allen erfassten Kunden eines Unternehmens oder ein bestimmtes Produkt aus einer Produktlinie eines Unternehmens.Each data record Di represents a specific object from a group of objects, for example a specific customer from all registered customers of a company or a specific product from a product line of a company.
Jeder Datensatz umfasst dabei eine vorgebbare Anzahl von Einträgen, Ai, Bi, Ci, ..., die einzelnen erfassten Daten, mit Kategorien bzw. Attributen A, B, C, .... Diese Kategorien bzw. Attribute repräsentieren Eigenschaften einer Objektgrup- pe, wie Alter (A) , Einkommen (B) , erworbenes Produkt (C) , ... . Die Einträge Ai, Bi, Ci, ... zu den jeweiligen Kategorien A, B, C, ... können dabei nummerischer oder semantischer Art sein.Each data record comprises a predeterminable number of entries, Ai, Bi, Ci, ..., the individually recorded data, with categories or attributes A, B, C, ... These categories or attributes represent properties of an object group pe, such as age (A), income (B), product purchased (C), .... The entries Ai, Bi, Ci, ... for the respective categories A, B, C, ... can be numerical or semantic.
Für die Analyse solcher Unternehmensdaten werden statistische Verfahren, sogenannte Data Mining Verfahren [4], [10], [11], [12], verwendet. Viele dieser Data Mining Verfahren bauen dabei auf einem statischen Framework auf, d.h. sie sind in einer statistischen Sprache formuliert.Statistical methods, so-called data mining methods [4], [10], [11], [12], are used to analyze such company data. Many of these data mining methods are based on a static framework, i.e. they are formulated in a statistical language.
Ein hinlänglich bekanntes und häufig eingesetztes Data Mining Verfahren ist ein sogenannter Entscheidungsbaum [5] .A well-known and frequently used data mining process is a so-called decision tree [5].
Weitere bekannte und verwendete Data Mining Verfahren sind sogenannte Clustering Verfahren [6] oder Assoziationsregeln (Association Rules) [9] .Other known and used data mining methods are so-called clustering methods [6] or association rules [9].
Nachteilig bei vielen der bekannten und genannten Analyseverfahren ist, dass sie bei der Analyse großer Datenmengen nur unzureichend anwendbar sind. In der Regel ist dort nämlich ein einmaliger oder mehrmaliger Zugriff auf den gesamten, zu
analysierenden Datenbestand, welcher beispielsweise in einer Datenbank gespeichert ist, notwendig.A disadvantage of many of the known and mentioned analysis methods is that they cannot be used adequately when analyzing large amounts of data. As a rule, there is one or multiple access to the whole Analyzing data stock, which is stored, for example, in a database, is necessary.
Bei großen Datenmengen führt dies zu langen Zugriffszeiten, zu langen Rechen- und Antwortzeiten und bedingt dadurch eine schlechte Performanz. Weiter ist auch eine hohe Rechenleistung bzw. Rechenkapazität von Nöten.With large amounts of data, this leads to long access times, long computing and response times and, as a result, poor performance. A high computing power or computing capacity is also required.
Aus [7] ist eine Ermittlung eines gemeinsamen Wahrscheinlich- keitsmodells P (A, B, C, ..., X) für eine Datenstruktur (A, B, C, ...) basierend auf einer versteckten Variable X bekannt.A determination of a common probability model P (A, B, C, ..., X) for a data structure (A, B, C, ...) based on a hidden variable X is known from [7].
Aus [8] ist eine Ermittlung eines gemeinsamen Wahrscheinlichkeitsmodells P (A, B, C, ...) für eine Datenstruktur (A, B, C, .-.) basierend auf ein Strukturlernen bekannt.From [8] a determination of a common probability model P (A, B, C, ...) for a data structure (A, B, C, .-.) Is known based on a structure learning.
Der Erfindung liegt die Aufgabe zugrunde, ein Analyseverfahren zur Analyse strukturierter Nutzdaten anzugeben, welches auch bei großen Nutzdatenmengen anwendbar ist und auch dort eine hohe Performanz aufweist.The invention is based on the object of specifying an analysis method for the analysis of structured useful data which can also be used with large amounts of useful data and also has a high performance there.
Diese Aufgabe wird durch das Verfahren und die Anordnung sowie durch das Computerprogramm mit Programmcode-Mitteln und das Computerprogramm-Produkt zur Analyse von gemäß einer Da- tenbankstruktur strukturierten Nutzdaten mit den Merkmalen gemäß dem jeweiligen unabhängigen Patentanspruch gelöst.This object is achieved by the method and the arrangement as well as by the computer program with program code means and the computer program product for analyzing user data structured according to a database structure with the features according to the respective independent patent claim.
Bei dem Verfahren zur Analyse von gemäß einer Datenbankstruktur strukturierten Nutzdaten wird zuerst ein gemeinsames sta- tistisches Wahrscheinlichkeitsmodell für die gemäß der Datenbankstruktur strukturierten Nutzdaten ermittelt. Anschließend werden die gemäß der Datenbankstruktur strukturierten Nutzdaten unter Verwendung eines statistischen Analyseverfahrens analysiert, wobei das bei der Analyse verwendete statistische Analyseverfahren auf das gemeinsame statistische Wahrscheinlichkeitsmodell angewendet wird, nicht wie üblich unmittelbar auf die Ausgangsdaten.
Die Anordnung zur Analyse von gemäß einer Datenbankstruktur strukturierten Nutzdaten weist auf:In the method for the analysis of user data structured according to a database structure, a common statistical probability model is first determined for the user data structured according to the database structure. The user data structured according to the database structure is then analyzed using a statistical analysis method, the statistical analysis method used in the analysis being applied to the common statistical probability model, not, as is customary, directly to the output data. The arrangement for analyzing user data structured according to a database structure has:
- eine Modellierungseinheit, mit welcher ein gemeinsames statistisches Wahrscheinlichkeitsmodell für die gemäß der Datenbankstruktur strukturierten Nutzdaten ermittelbar ist, sowiea modeling unit with which a common statistical probability model for the user data structured according to the database structure can be determined, and
- eine Analyseeinheit, mit welcher die gemäß der Datenbankstruktur strukturierten Nutzdaten unter Verwendung eines statistischen Analyseverfahrens derart analysierbar sind, dass das bei der Analyse verwendete statistische Analyseverfahren auf das gemeinsame statistische Wahrscheinlichkeitsmodell angewendet wird.an analysis unit with which the user data structured according to the database structure can be analyzed using a statistical analysis method in such a way that the statistical analysis method used in the analysis is applied to the common statistical probability model.
Anschaulich gesehen basiert die Erfindung auf einer zweistufigen Vorgehensweise.The invention is clearly based on a two-stage procedure.
Auszugehen ist zunächst von vorgebbaren, gemäß einer Datenbankstruktur strukturierten Nutzdaten. Dabei unter einer der- artigen datenbankgemäßen Strukturierung zu verstehen, dass den Nutzdaten eine übergeordnete feste Struktur zugrunde liegt, beispielsweise jeweils gleich strukturierte Datensätze (Ai, Bi, Ci, ... ) mit gleichen Eintragskategorien A, B, C, ... . Derartige Strukturen sind allgemein bekannt.The first step is to assume user data that can be specified and structured according to a database structure. A database structure of this type should be understood to mean that the user data is based on a higher-level, fixed structure, for example, data sets with the same structure (Ai, Bi, Ci, ...) with the same entry categories A, B, C, .... Such structures are generally known.
Aus diesen zu analysierenden, gemäß einer Datenbankstruktur strukturierten Nutzdaten wird ein gemeinsames, zweckunabhängiges Wahrscheinlichkeitsmodell, wie beispielsweise in [7] , [8] beschrieben, gebildet.A common, purpose-independent probability model, as described, for example, in [7], [8], is formed from these user data to be analyzed and structured according to a database structure.
Dieses stellt ein allgemeines, vollständiges und genaues Abbild einer Statistik der Datenstruktur der strukturierten Nutzdaten dar („Analytisches Datenbank-Abbild"" ) . Ferner ist es eine hochkomprimierte Form eines Wissens über die Nutzda- ten.
Das allgemeine Abbild kann dann nachfolgend als Grundlage für die Analyse durch die statistischen Verfahren verwendet werden. Diese greifen dann nicht mehr auf den gesamten Nutzdatenbestand bzw. auf die einzelnen Nutzdaten zu, sondern nutzen das erstellte statistische Abbild, d.h. das gemeinsame Wahrscheinlichkeitsmodell, für die Analyse.This represents a general, complete and precise representation of a statistic of the data structure of the structured user data (“analytical database representation”). It is also a highly compressed form of knowledge about the user data. The general image can then subsequently be used as the basis for the analysis by the statistical methods. These then no longer access the entire user data inventory or the individual user data, but use the statistical image created, ie the common probability model, for the analysis.
Dadurch können Zugriffs-, Rechen- und Antwortzeiten bei der Analyse reduziert und damit die Performanz gesteigert werden.This allows access, computing and response times to be reduced during analysis and thus increased performance.
Das erfindungsgemäße Computerprogramm mit Programmcode- Mitteln ist eingerichtet, um alle Schritte gemäß dem erfindungsgemäßen Analyseverfahren durchzuführen, wenn das Programm auf einem Computer ausgeführt wird.The computer program according to the invention with program code means is set up to carry out all steps according to the analysis method according to the invention when the program is executed on a computer.
Das Computerprogramm-Produkt mit auf einem maschinenlesbaren Träger gespeicherten Programmcode-Mitteln ist eingerichtet, um alle Schritte gemäß dem erfindungsgemäßen Analyseverfahren durchzuführen, wenn das Programm auf einem Computer ausge- führt wird.The computer program product with program code means stored on a machine-readable carrier is set up to carry out all steps according to the analysis method according to the invention when the program is executed on a computer.
Die Anordnung sowie das Computerprogramm mit Programmcode- Mitteln, eingerichtet um alle Schritte gemäß dem erfinderischen Analyseverfahren durchzuführen, wenn das Programm auf einem Computer ausgeführt wird, sowie das Computerprogramm- Produkt mit auf einem maschinenlesbaren Träger gespeicherten Programmcode-Mitteln, eingerichtet um alle Schritte gemäß dem erfinderischen Analyseverfahren durchzuführen, wenn das Programm auf einem Computer ausgeführt wird, sind insbesondere geeignet zur Durchführung des erfindungsgemäßen Analyseverfahrens oder einer seiner nachfolgend erläuterten Weiterbildungen.The arrangement and the computer program with program code means, set up to carry out all steps according to the inventive analysis method when the program is executed on a computer, and the computer program product with program code means stored on a machine-readable medium, set up all steps according to the Carrying out analysis methods according to the invention when the program is executed on a computer are particularly suitable for carrying out the analysis method according to the invention or one of its further developments explained below.
Bevorzugte Weiterbildungen der Erfindung ergeben sich aus den abhängigen Ansprüchen.
Die im weiteren beschriebenen Weiterbildungen beziehen sich sowohl auf die Verfahren als auch auf die Anordnung.Preferred developments of the invention result from the dependent claims. The further developments described below relate both to the method and to the arrangement.
Die Erfindung und die im weiteren beschriebenen Weiterbildun- gen können sowohl in Software als auch in Hardware, beispielsweise unter Verwendung einer speziellen elektrischen Schaltung, realisiert werden.The invention and the further developments described below can be implemented both in software and in hardware, for example using a special electrical circuit.
Ferner ist eine Realisierung der Erfindung oder einer im wei- teren beschriebenen Weiterbildung möglich durch ein computerlesbares Speichermedium, auf welchem das Computerprogramm mit Programmcode-Mitteln gespeichert ist, welches die Erfindung oder Weiterbildung ausführt.Furthermore, an implementation of the invention or a further development described in the following is possible by means of a computer-readable storage medium on which the computer program with program code means which carries out the invention or further development is stored.
Auch kann die Erfindung oder jede im weiteren beschriebeneAlso, the invention or any described below
Weiterbildung durch ein Computerprogrammerzeugnis realisiert sein, welches ein Speichermedium aufweist, auf welchem das Computerprogramm mit Programmcode-Mitteln gespeichert ist, welches die Erfindung oder Weiterbildung ausführt.Further development can be realized by a computer program product which has a storage medium on which the computer program with program code means which carries out the invention or further development is stored.
In einer Weiterbildung werden in Nutzdatensätzen strukturierte Nutzdaten verwendet, beispielsweise Nutzdatensätze aus einer Datenbank. Dabei repräsentiert jeder Nutzdatensatz ein bestimmtes Objekt aus einer Gruppe von Objekten. Die dem je- weiligen Nutzdatensatz zugehörigen Nutzdaten beschreiben dabei Eigenschaften des jeweiligen Objekts.In a further development, structured user data are used in user data records, for example user data records from a database. Each user data record represents a specific object from a group of objects. The user data associated with the respective user data record describe properties of the respective object.
Für die Ermittlung des gemeinsamen statistischen Wahrscheinlichkeitsmodell können statistische Verfahren basierend auf einer versteckten Variable [7] oder Verfahren basierend auf ein Strukturlernen [8] verwendet werden. Auch eine Kombination beider Verfahren ist möglich.Statistical methods based on a hidden variable [7] or methods based on structural learning [8] can be used to determine the common statistical probability model. A combination of both methods is also possible.
Ferner ist es zweckmäßig, dass das statistische Analysever- fahren derart auf das gemeinsame statistische Wahrscheinlichkeitsmodell angewendet wird, dass eine gemeinsame Wahrscheinlichkeit als Eingangsgröße für das statistische Analysever-
fahren verwendet wird. Die gemeinsame Wahrscheinlichkeit ergibt sich unmittelbar aus dem gemeinsamen Wahrscheinlichkeitsmodell. Dadurch lassen sich unnötige Zwischenschritte vermeiden, die Rechenzeit kosten und Antwortzeiten verlän- gern.Furthermore, it is expedient that the statistical analysis method is applied to the common statistical probability model in such a way that a common probability is used as an input variable for the statistical analysis method. driving is used. The common probability results directly from the common probability model. This avoids unnecessary intermediate steps, costs computing time and extends response times.
Als statistisches Analyseverfahren kann ein Verfahren auf Basis eines Data Mining Verfahrens [4], [10], [11], [12] verwendet wird, beispielsweise ein Clustering Verfahren [5] oder ein Entscheidungsbaum [6] oder Assoziationsregeln [9] .A method based on a data mining method [4], [10], [11], [12] can be used as the statistical analysis method, for example a clustering method [5] or a decision tree [6] or association rules [9].
Bei der Analyse unter Verwendung des statistischen Analyseverfahrens ist es möglich, Abhängigkeiten zwischen den Nutzdaten und/oder deren Signifikanzen basierend auf einem sta- tistischen Test zu ermitteln. Dies kann wegen der hochkomprimierten Form der Nutzdaten, d.h. des gemeinsamen Wahrscheinlichkeitsmodells, interaktiv und sehr effizient erfolgen.When analyzing using the statistical analysis method, it is possible to determine dependencies between the user data and / or their significance based on a statistical test. This can be due to the highly compressed form of the user data, i.e. the common probability model, interactively and very efficiently.
Ferner ist es sinnvoll, die Ermittlung des gemeinsamen sta- tistischen Wahrscheinlichkeitsmodells und die Analyse des gemeinsamen statistischen Wahrscheinlichkeitsmodell durch das statistische Analyseverfahren zeit- und ortsverschieden durchzuführen.Furthermore, it makes sense to determine the common statistical probability model and to analyze the common statistical probability model using the statistical analysis method at different times and locations.
So kann beispielsweise das Analytische Datenbank-Abbild, d.h. das gemeinsame Wahrscheinlichkeitsmodell, in vorgebbaren zeitlichen Intervallen, wie täglich oder wöchentlich, neu gebildet werden. Die Bildung kann nachts oder am Wochenende erfolgen. Das vollständige Analytische-Datenbank-Abbild steht dann bei Bedarf zur Verfügung, um Analysen erheblich zu beschleunigen.For example, the analytical database image, i.e. the common probability model is newly formed at predefinable time intervals, such as daily or weekly. Education can take place at night or on weekends. The complete analytical database image is then available as required to significantly speed up analyzes.
Die Nutzdaten können aus verschiedenen Datenquellen bezogen werden. Am einfachsten ist der Bezug der Nutzdaten aus einer Datenbank, in welcher die Nutzdaten gespeichert sind und von welcher sie ausgelesen werden.
Die Erfindung ist wegen der durch sie erreichbaren Performanz bei der Analyse von Daten insbesondere dort geeignet, wo große Datenmengen zu verarbeiten bzw. zu analysieren sind, wie im Bereich eines Customer Relationship Management (CRM) [1] oder eines Supply Chain Management [2] oder eines Data Ware- house (DW) [3] .The user data can be obtained from various data sources. The easiest way is to obtain the user data from a database in which the user data are stored and from which they are read. Because of the performance it can achieve in the analysis of data, the invention is particularly suitable where large amounts of data have to be processed or analyzed, such as in the area of customer relationship management (CRM) [1] or supply chain management [2]. or a data warehouse (DW) [3].
Im Bereich CMR kann eine Weiterbildung beispielsweise dazu eingesetzt werden, um Kundendaten zu analysieren. In diesem Fall ist das Objekt ein Kunde, welcher durch mindestens zwei der folgenden Eigenschaften, Alter, Einkommen, erworbenes Produkt, Datum des Erwerbs, Häufigkeit von Käufen, beschrieben wird. Dadurch lassen sich für Marketingabteilungen eminent wichtige Fragestellungen lösen, wie ein Kundenverhalten bestimmter Kundengruppen. Basierend darauf lassen sich gezielter Zielgruppen bei einer Akquisition von Kunden bestimmen, für bestimmte Produkte und Marketingkampagnen sinnvoller Kundengruppen auswählen und Kunden allgemein vorausschauender bedienen.In the area of CMR, further training can be used, for example, to analyze customer data. In this case, the object is a customer, which is described by at least two of the following properties, age, income, product purchased, date of purchase, frequency of purchases. This enables eminently important issues to be solved for marketing departments, such as the customer behavior of certain customer groups. Based on this, targeted target groups can be determined when customers are acquired, customer groups can be selected for specific products and marketing campaigns, and customers can be served with more foresight.
Ein Ausführungsbeispiel der Erfindung ist in Figuren dargestellt und wird im weiteren erläutert.An embodiment of the invention is shown in figures and is explained below.
Es zeigenShow it
Figur 1 Skizze, die schematisch eine Funktionsweise einesFigure 1 sketch that schematically shows how a
Analysesystems zur Analyse von Kundendaten gemäß einem Ausführungsbeispiel zeigt;Analysis system for analyzing customer data according to an embodiment shows;
Figuren 2a bis g Skizzen, die Analyseergebnisse eines Analysesystems zur Analyse von Kundendaten gemäß einem Ausführungsbeispiel zeigen.Figures 2a to g sketches showing analysis results of an analysis system for analyzing customer data according to an embodiment.
Ausfü rungsbeispiel : Analysesystem zur Analyse eines Kundenverhaltens bei einer Bank basierend auf einem Customer Relationship Management System
Gegenstand des Ausführungsbeispiels ist ein Analysesystem zur Analyse von Kundendaten einer Bank.Execution example: Analysis system for analyzing customer behavior at a bank based on a customer relationship management system The exemplary embodiment relates to an analysis system for analyzing customer data from a bank.
Vorwegzuschicken ist, dass das im Folgende beschriebene Analysesystem nicht nur bei Banken, sondern auch bei beliebigen Unternehmen zur Analyse von entsprechenden Unternehmensdaten einsetzbar ist, wie beispielsweise bei Warenhäuser oder produzierenden Unternehmen.It must be said in advance that the analysis system described below can be used not only at banks, but also at any company for the analysis of corresponding company data, such as for example in department stores or manufacturing companies.
Funktionsweise des Analysesystems (Fig.l)Functioning of the analysis system (Fig.l)
Fig.l zeigt schematisch die Funktionsweise 100 des Analysesystems zur Analyse der Bankkundendaten 110.1 shows schematically the functioning 100 of the analysis system for analyzing bank customer data 110.
Die Funktionsweise 100 teilt sich auf in eine Wissensgewinnung 101 und eine Umsetzung des Wissens in eine intelligente Bedienung der Bankkunden 102.Functionality 100 is divided into knowledge acquisition 101 and implementation of the knowledge into intelligent operation of bank customers 102.
Große und damit schwer handhabbare Mengen von Kundendaten 110 werden zunächst zu einem statistischen Modell 112, einem gemeinsamen Wahrscheinlichkeitsmodell, des Kundenverhaltens kondensiert 111.Large and thus difficult-to-handle amounts of customer data 110 are first condensed 111 into a statistical model 112, a common probability model, of customer behavior.
Das verwendete gemeinsame Wahrscheinlichkeitsmodell 112 ist eines auf der Basis einer versteckten Variablen. Grundlagen dazu sind in [7] beschrieben.The shared probability model 112 used is one based on a hidden variable. The basics are described in [7].
Anzumerken ist, dass auch andere Arten von gemeinsamen Wahr- scheinlichkeitsmodellen verwendet werden können, wie beispielsweise solche auf der Basis von Strukturlernen [8] .It should be noted that other types of common probability models can also be used, such as those based on structural learning [8].
An Hand des gemeinsamen Wahrscheinlichkeitsmodells 112 lassen sich Eigenschaften der Kunden und insbesondere deren Verhal- ten über die Zeit sehr viel effizienter und flexibler explo- rieren als an Hand der Ausgangsdaten.
Dazu werden statistische Verfahren 120, im allgemeinen Data Mining Verfahren und hier in diesem Fall ein Entscheidungsbaum, verwendet, welche bzw. welcher auf das statistische Modell aufsetzen bzw. aufsetzt.Using the common probability model 112, properties of the customer and in particular their behavior over time can be explored much more efficiently and flexibly than on the basis of the initial data. For this purpose, statistical methods 120, in general data mining methods and here in this case a decision tree, are used, which are based on the statistical model.
Anzumerken ist, dass auch andere Data Mining Verfahren verwendet werden können, wie beispielsweise Clustering Verfahren oder Assoziations-Regeln.It should be noted that other data mining methods can also be used, such as clustering methods or association rules.
Grundlagen von Data Mining Verfahren sind in [4] , [10] , [11] , [12], eines Entscheidungsbaums in [6] und von Clustering Verfahren in [5] beschrieben.Basics of data mining procedures are described in [4], [10], [11], [12], a decision tree in [6] and clustering procedures in [5].
Ermöglicht wird die Kopplung dadurch, dass die Data Mining Verfahren bzw. der Entscheidungsbaum 120 auf einem statistischen Framework aufbauen bzw. aufbaut und damit die gleiche statistischen Begriffe bzw. die gleiche statistische Sprache wie das gemeinsame Wahrscheinlichkeitsmodell 112 benutzt.The coupling is made possible by the fact that the data mining methods or decision tree 120 are based on a statistical framework, and thus use the same statistical terms or the same statistical language as the common probability model 112.
Wichtige Fragestellungen (vgl. Figuren 2) können anhand des Entscheidungsbaums 120 im Rückgriff auf das gemeinsame Wahrscheinlichkeitsmodell 112 interaktiv beantwortet werden 140.Important questions (cf. FIGS. 2) can be answered 140 interactively using the decision tree 120 using the common probability model 112.
Damit ist nicht nur eine quantitative (wie viel Kunden?) son- dern auch eine qualitative Sicht auf die Kunden (welche Sorte von Kunden) möglich, z.B.:This not only enables a quantitative (how many customers?) But also a qualitative view of the customer (which type of customer), for example:
- Wie viele und welche Qualität von Kunden kommen über welche Partnerschaften oder Kampagnen? Wie effizient sind meine Werbemaßnahmen? - Welche Kundenklassen mit welchen Präferenzen und Bedürfnissen gibt es? Wie und wann lassen sich diese Bedürfnisse am besten befriedigen?- How many and what quality of customers come through which partnerships or campaigns? How efficient are my advertising measures? - Which customer classes with which preferences and needs are there? How and when can these needs best be met?
Ergebnisse der Fragestellungen lassen sich weiterführend um- setzen 121 in eine intelligente Bedienung der Kunden 130. Kundendaten ( (Fig.1 , 110)
Die Kundendaten 110 bei dem Analysesystem werden im Rahmen eines Customer Relationship Management (CRM) 150 erhoben.The results of the questions can be further implemented 121 in intelligent customer service 130. Customer data ((Fig. 1, 110) The customer data 110 in the analysis system is collected as part of a customer relationship management (CRM) 150.
Grundlagen eines CRM sind in [1] beschrieben.The basics of CRM are described in [1].
Bei dem CRM 150 werden große Mengen an Daten 110 über die Bankkunden aus allen Vertriebskanälen der Bank, wie direkte Kontakte, Web, Call Center, erfasst und gespeichert.With the CRM 150, large amounts of data 110 about the bank customers from all sales channels of the bank, such as direct contacts, web, call center, are recorded and stored.
Erfasst und gespeichert werden für die Kunden jeweils (sogenannte Attribute A, B, C, ...) :The following are recorded and saved for the customers (so-called attributes A, B, C, ...):
- die erworbenen Bankprodukte A in der jeweiligen zeitlichen Reihenfolge (AI, A2, A3, ...),- the acquired bank products A in the respective chronological order (AI, A2, A3, ...),
- ein zeitlicher Kaufabstand B zwischen den Erwerbszeitpunk- ten der erworbenen Bankprodukten (Bl-2, B2-3, B3-4, ...),- a time interval B between the purchase times of the acquired bank products (Bl-2, B2-3, B3-4, ...),
- ein Geburtsdatum (C) ,- a date of birth (C),
- ein Einkommen (D) ,- an income (D),
- eine Adresse (E) ,- an address (E),
- der letzter Bankbesuch (F) , - die letze Kontobewegung (G) .- the last bank visit (F), - the last account movement (G).
Die Speicherung erfolgt in einer Datenbank in Form von kundenspezifischen Datensätzen Di (AI, A2, ..., Bl-2, B2-3, ..., C, D, ...), wobei der Index i den jeweiligen Bankkunden i kennzeichnet.The data is stored in a database in the form of customer-specific data records Di (AI, A2, ..., Bl-2, B2-3, ..., C, D, ...), the index i being the respective bank customer i features.
Gemeinsames Wahrscheinlichkeitsmodell (Fig.l, 112)Common probability model (Fig. 1, 112)
Das Wissen über die Bankkunden, das in diesen Daten 110 ver- borgen liegt, wird dann zu einem Modell, dem gemeinsamen Wahrscheinlichkeitsmodell 112, kondensiert.The knowledge about the bank customers that is hidden in this data 110 is then condensed into a model, the common probability model 112.
Das verwendete gemeinsame Wahrscheinlichkeitsmodell 112 ist eines auf der Basis einer versteckten Variablen X. Grundlagen dazu sind in [7] beschrieben.
Geschrieben wird das gemeinsame Wahrscheinlichkeitsmodell 112 basierend auf der versteckten Variablen X als P(A,B, C, ..., X) für alle Attribute (A, B, C, ...).The common probability model 112 used is one based on a hidden variable X. The foundations for this are described in [7]. The common probability model 112 is written based on the hidden variable X as P (A, B, C, ..., X) for all attributes (A, B, C, ...).
Ein solches statistischen Abbild von Daten stellt eine hochkomprimierte Form eines Wissens über Kunden dar und kann genutzt werden, um effizient und interaktiv Abhängigkeiten zu explorieren 120, 140.Such a statistical image of data represents a highly compressed form of knowledge about customers and can be used to efficiently and interactively explore dependencies 120, 140.
An Hand des hier erstellten gemeinsamen Wahrscheinlichkeitsmodells 112 läßt sich nun das Wissen über die Kunden schnell über effizient abgreifen, insbesondere lassen sich Verhaltensweisen der Kunden einfach und flexibel studieren, lassen sich typische Verhaltensmuster und Entwicklungszyklen von Kunden effizient und intuitiv analysieren, lassen sich typische Kundensegmente und deren Präferenzen sicher und eindeutig bestimmen und erkennen 120, 140.With the help of the common probability model 112 created here, the knowledge about the customers can now be quickly and efficiently tapped; in particular, customer behavior can be studied easily and flexibly, typical customer behavior patterns and development cycles can be analyzed efficiently and intuitively, typical customer segments and determine and recognize their preferences reliably and clearly 120, 140.
Ferner liefert das gemeinsame Wahrscheinlichkeitsmodell 112 über die beschriebene Analysefunktion hinaus schnell abrufbare Prognosen über weiter zu erwartendes Verhalten und aktuelle Bedürfnisse eines Kunden. Die Prognosen können weiter dazu genutzt werden, Kunden vorausschauend und gezielt zu bedienen und proaktive, persönliche Angebote zu unterbreiten 130.In addition to the described analysis function, the common probability model 112 also provides quickly retrievable forecasts of further expected behavior and current needs of a customer. The forecasts can also be used to serve customers proactively and in a targeted manner and to provide proactive, personal offers 130.
Aufsatz eines Entscheidungsbaums auf das gemeinsame Wahr- sσheinlichkeitsmodell (Fig.l, 120)Attachment of a decision tree to the common probability model (Fig.l, 120)
In weiterer Verwendung des gemeinsamen Wahrscheinlichkeitsmo- dells 112 wird der Entscheidungsbaum [6] auf das statistische Modell 112, das gemeinsame Wahrscheinlichkeitsmodell 112, aufgesetzt 120.If the common probability model 112 is used further, the decision tree [6] is placed 120 on the statistical model 112, the common probability model 112.
Damit lassen sich beliebige Randverteilungen, wie die für ei- nen ersten Split des Entscheidungsbaums, nämlich P(A,X),This allows arbitrary edge distributions, such as those for a first split of the decision tree, namely P (A, X),
P(B,X), P(C,X), ..., und auch für alle weiteren Splits des Entscheidungsbaums ermitteln.
Weiter lassen sich auch alle Grundwahrscheinlichkeitsverteilungen bzw. Grundwahrscheinlichkeiten P (A) , P(B), ... und beliebige bedingte Wahrscheinlichkeiten bzw. Wahrscheinlich- keitsverteilungen P(B|A), P(C|A), P(C|B), ... ermitteln.Determine P (B, X), P (C, X), ..., and also for all other splits in the decision tree. Furthermore, all basic probability distributions or basic probabilities P (A), P (B), ... and any conditional probabilities or probability distributions P (B | A), P (C | A), P (C | B ), ... determine.
Aus der gemeinsamen Verteilung P(A,B, C, ..., X) basierend auf der versteckten (oder latenten) Variable X geht zunächst die gemeinsame Verteilung P(A,B, C, ...) über alle Attribute der Kunden durch Summation über die versteckte Variable X hervor.From the common distribution P (A, B, C, ..., X) based on the hidden (or latent) variable X, the common distribution P (A, B, C, ...) goes over all attributes of the customers by summation over the hidden variable X.
Strukturlernen liefert hier unmittelbar eine gemeinsame Verteilung P(A,B, C, ...).Structural learning immediately provides a common distribution P (A, B, C, ...).
Aus der gemeinsamen Verteilung lassen sich dann beliebige ein-dimensionale Randverteilungen (Marginale) P (A) , P(B), ..., niedrig-dimensionalere Verteilungen P(A,B), P(B,C), ... und beliebige bedingte Wahrscheinlichkeiten (ein- oder ehr- dimensionale) P(B|A), P(C|A), P(A,C|B), ... ableiten.Any one-dimensional marginal distributions (margins) P (A), P (B), ..., lower-dimensional distributions P (A, B), P (B, C), ... and derive any conditional probabilities (one-dimensional or one-dimensional) P (B | A), P (C | A), P (A, C | B), ...
Dies erfolgt im Rahmen eines Inferenzprozesses, wie in [13] beschrieben.This is done as part of an inference process, as described in [13].
Dabei wird nach [13] die Struktur der Modelle, beispielsweise welche mit einer vorgegebenen versteckten Variable oder welche, die durch Strukturlernen erzeugt wurden, oder eine Kombination der Vorgenannten, genutzt, um notwendigen Summen ü- ber die gemeinsame Verteilung effizient zu berechnen.According to [13], the structure of the models, for example those with a predefined hidden variable or those that were generated by structure learning, or a combination of the above, is used to efficiently calculate necessary sums over the common distribution.
Entscheidungsbäume werden zumeist nach einem bekannten CHAID oder einem bekannten CART Verfahren aufgebaut.Decision trees are usually built using a known CHAID or a known CART procedure.
Im Allgemeinen benötigt man zum Aufbau eines Entscheidungs- baums mit einer Zielvariablen (oder abhängigen Variablen) A für den sogenannten ersten Split zunächst alle paarweisen Verteilungen P(A,B), P(B,C), P(A,D), ... .
Eine Selektion einer Variablen aus der Menge der Variablen B, C, D, ... , für den ersten Split erfolgt dann bei fast allen bekannten Verfahren basierend auf einem statistischen Krite- rium (einem statistischen Test und Signifikanzkriterien) basierend auf den paarweisen Verteilungen P(A,B), P(B,C), P(A, D), ... und einer bekannten Anzahl an Daten.In general, to build a decision tree with a target variable (or dependent variable) A for the so-called first split, all pairwise distributions P (A, B), P (B, C), P (A, D),. ... A selection of a variable from the set of variables B, C, D, ..., for the first split then takes place in almost all known methods based on a statistical criterion (a statistical test and significance criteria) based on the pairwise distributions P (A, B), P (B, C), P (A, D), ... and a known number of data.
Wurde beispielsweise für den ersten Split die Variable D mit den beiden Werten dl und d2 gewählt., so benötigt man für den zweiten Split bedingte, paarweise Verteilungen der Form P(A,B|dl), P(A,B|d2), P(A,C|dl), P(A,C|d2), ... .If, for example, the variable D with the two values dl and d2 was selected for the first split, then for the second split conditional pairwise distributions of the form P (A, B | dl), P (A, B | d2) are required, P (A, C | dl), P (A, C | d2), ....
Die notwendigen Wahrscheinlichkeiten oder Verteilungen für den Aufbau des Entscheidungsbaums (bzw. als Grundlagen für die notwendigen statistischen Tests) können (wie üblich) aus den Daten oder auch aus einem möglichst genauen, im Obigen beschrieben Wahrscheinlichkeitsmodell (Inferenzprozess) ermittelt werden.The necessary probabilities or distributions for the construction of the decision tree (or as the basis for the necessary statistical tests) can (as usual) be determined from the data or also from the most accurate probability model described in the above (inference process).
Interaktive Analysen (Fig.l, 140, Fig.2a bis 2g)Interactive analyzes (Fig.l, 140, Fig.2a to 2g)
Fig. 2a bis 2g zeigen exemplarisch einige der möglichen interaktiven Analysen 140, welche mit dem Entscheidungsbaum 120 im Rückgriff auf das gemeinsame Wahrscheinlichkeitsmodell 112 durchgeführt werden können.2a to 2g show examples of some of the possible interactive analyzes 140 that can be carried out with the decision tree 120 using the common probability model 112.
Fig.2a zeigt Wahrscheinlichkeitsverteilungen P(A1), P(A2) P(A3) P(A4), P(A5), P(Bl-2), P(B2-3), P(B3-4) und P(C) und P(D). Besondere gekennzeichnet ist P (Al= „Giro/Gehalts- Konto) =56, 125% .2a shows probability distributions P (A1), P (A2) P (A3) P (A4), P (A5), P (Bl-2), P (B2-3), P (B3-4) and P (C) and P (D). P (Al = "Giro / Salary Account) = 56, 125% is particularly marked.
Fig.2b zeigt nun bedingte Wahrscheinlichkeitsverteilungen unter der Bedingung Al= „Giro/Gehalts-Kontoλλ , nämlich P(A2|A1= „Giro/Gehalts-Konto"), P (A3 |A1= „Giro/Gehalts-Konto" ) , P(A4|A1= „Giro/Gehalts-Konto"), P(A5|A1= „Giro/Gehalts- Konto") , P(B1-2|A1= „Giro/Gehalts-Kontoλ ) , P(B2-3|A1= „Gi-
ro/Gehalts-Konto") , P (B3-4 |A1= „Giro/Gehalts-Konto" ) und P(C|A1= „Giro/Gehalts-Konto") und P(D|A1= „Giro/Gehalts- Konto" ) . Besonders gekennzeichnet sind P (A2= „Versiche- rungspodukt |Al= „Giro/Gehalts-Konto) =29% und P (A2= „Spa- ren/Geldanlage | Al= „Giro/Gehalts-Konto) =50% .Fig. 2b now shows conditional probability distributions under the condition Al = "Giro / Salary Account λλ , namely P (A2 | A1 =" Giro / Salary Account "), P (A3 | A1 =" Giro / Salary Account ") , P (A4 | A1 = "Giro / Salary Account"), P (A5 | A1 = "Giro / Salary Account"), P (B1-2 | A1 = "Giro / Salary Account λ ), P ( B2-3 | A1 = "Gi ro / Salary Account "), P (B3-4 | A1 =" Giro / Salary Account ") and P (C | A1 =" Giro / Salary Account ") and P (D | A1 =" Giro / Salary - Account "). P (A2 = "insurance product | Al =" current account / salary account) = 29% and P (A2 = "savings / investment | Al =" current account / salary account) = 50% are particularly marked.
Fig.2c zeigt nun bedingte Wahrscheinlichkeitsverteilungen unter den Bedingungen Al= „Giro/Gehalts-Konto" und A2= „Versicherungsprodukt", nämlich P(A3|A1= „Giro/Gehalts-Konto", A2= „Versicherungsprodukt") , P(A4|A1= „Giro/Gehalts-Konto", A2= „Versicherungsprodukt"), P(A5|A1= „Giro/Gehalts-Konto", A2= „Versicherungsprodukt"), ... . Besonders gekennzeichnet ist hier P(Bl-2= „Kaufabstand zwischen erstem und zweitem Produkt größer 3 Jahre |A1= „Giro/Gehalts-Konto" ,A2= „Versicherungs- produkt) =85%.2c now shows conditional probability distributions under the conditions Al = "checking / salary account" and A2 = "insurance product", namely P (A3 | A1 = "checking / salary account", A2 = "insurance product"), P ( A4 | A1 = "Giro / Salary Account", A2 = "Insurance Product"), P (A5 | A1 = "Giro / Salary Account", A2 = "Insurance Product"), .... P (Bl-2 = "purchase gap between first and second product greater than 3 years | A1 =" current account / salary account ", A2 =" insurance product) is particularly marked here = 85%.
Fig.2d zeigt weitere bedingte Wahrscheinlichkeitsverteilungen unter den Bedingungen Al= „Giro/Gehalts-Konto" und A2= „Sparen/Geldanlage", nämlich P(A3|A1= „Giro/Gehalts-Konto", A2= „Sparen/Geldanlage"), P(A4|A1= „Giro/Gehalts-Konto", A2= „Sparen/Geldanlage"), P(A5|A1= „Giro/Gehalts-Konto", A2= „Sparen/Geldanlage"), ... . Besonders gekennzeichnet sind hier die Wahrscheinlichkeitsverteilungen P(B1-2|A1= „Giro/Gehalts-Konto" ,A2= „Sparen/Geldanlage") .2d shows further conditional probability distributions under the conditions Al = "checking / salary account" and A2 = "saving / investment", namely P (A3 | A1 = "checking / salary account", A2 = "saving / investment" ), P (A4 | A1 = "Giro / Salary Account", A2 = "Saving / Investment"), P (A5 | A1 = "Giro / Salary Account", A2 = "Saving / Investment"), .. . The probability distributions P (B1-2 | A1 = "current account / salary account", A2 = "savings / investment") are particularly marked here.
Fig.2e zeigt die Wahrscheinlichkeitsverteilungen P(A1), P(A2) P(A3) P(A4), P(A5), P(Bl-2), P(B2-3), P(B3-4) und P(C) und P(D). Besondere gekennzeichnet ist P (Al= „Giro/Gehalts- Konto) =56, 125% . Desweiteren zeigt Fig.2e die Wahrscheinlich- keitsverteilung der versteckten Variable X, bezeichnet hier als Segmente, nämlich P (Segmente). Besonders gekennzeichnet st P (Segmente=4) = 34%, was zeigt, dass 34% aller erfassten Bankkunden in das Segment 4 fallen.Fig. 2e shows the probability distributions P (A1), P (A2) P (A3) P (A4), P (A5), P (Bl-2), P (B2-3), P (B3-4) and P (C) and P (D). P (Al = "Giro / Salary Account) = 56, 125% is particularly marked. Fig. 2e also shows the probability distribution of the hidden variable X, referred to here as segments, namely P (segments). Particularly marked st P (segments = 4) = 34%, which shows that 34% of all recorded bank customers fall into segment 4.
Figuren 2f und 2g zeigen wiederum die bedingte Wahrscheinlichkeitsverteilungen, einmal unter der Bedingung Segmente=4
(Fig.2f) und das andere Mal unter der Bedingung C= Geburtsdatum zwischen 980 und 1990 (Fig.2g) .
FIGS. 2f and 2g again show the conditional probability distributions, once under the condition segments = 4 (Fig.2f) and the other time under the condition C = date of birth between 980 and 1990 (Fig.2g).
Im Rahmen dieses Dokuments sind folgende Veröffentlichungen zitiert:The following publications are cited in this document:
[1] Customer Relationship Management System, erhältlich am 31.08.2002 unter: http://www.crm-expo.com/.[1] Customer Relationship Management System, available on August 31, 2002 at: http://www.crm-expo.com/.
[2] Supply Chain Management System, erhältlich am 31.06.2002 unter: http: //www. sap-ag.de/germany/solutions/scm/.[2] Supply Chain Management System, available on June 31, 2002 at: http: // www. sap-ag.de/germany/solutions/scm/.
[3] Data Warehouse, erhältlich am 31.08.2002 unter: http : //www. data-warehouse-systeme . de/ .[3] Data Warehouse, available on August 31, 2002 at: http: // www. data warehouse systems. de /.
[4] Heckermann, D., „Bayesian Networks for Data Mining", Data Mining and Knowledge Discovery, Seiten 79 bis 119, 1997.[4] Heckermann, D., "Bayesian Networks for Data Mining", Data Mining and Knowledge Discovery, pages 79 to 119, 1997.
[5] Kass, G., „An exploratory technique for investigating large quantities of categorical data" , Applied Sta- tistics, 29:2, Seiten 119 bis 117, 1980.[5] Kass, G., "An exploratory technique for investigating large quantities of categorical data", Applied Statistics, 29: 2, pages 119 to 117, 1980.
[6] Bezdek, J.C., Pal, S.K., „Fuzzy Models for Pattern Re- cognition", IEEE Press, 1992.[6] Bezdek, J.C., Pal, S.K., "Fuzzy Models for Pattern Recognition", IEEE Press, 1992.
[7] Everitt, B. S., „An Introduction to Latent Variable Mo- dels" , London, Chapman and Hall, 1984.[7] Everitt, B.S., "An Introduction to Latent Variable Models", London, Chapman and Hall, 1984.
[8] Reimar Hofmann, „Lernen der Struktur nichtlinearer Abhängigkeiten mit graphischen Modellen", Dissertation an der Technischen Universität München, Verlag: dissertati- on.de, ISBN: 3-89825-131-4.[8] Reimar Hofmann, "Learning the structure of nonlinear dependencies with graphic models", dissertation at the Technical University of Munich, publisher: dissertation.de, ISBN: 3-89825-131-4.
[9] Ashoka Savasere, Edward Omiecinski, Shamkant B. Navathe, "An Efficient Algorithm for Mining Association Rules in Large Databases", The VLDB Journal, Seiten 432 bis 444", 1995.
[10] Usama M. Fayyad, Gregory Piatetsky-Shapiro, Padhraic Smyth and Ramasamy Uthurusamy, "Advances in Knowledge Discovery and Data Mining", American Association for Ar- tificial Intelligence, CA, 1996. [11] lan H. Witten, Eibe Frank, Morgan Kaufmann, Data Mining, 2000.[9] Ashoka Savasere, Edward Omiecinski, Shamkant B. Navathe, "An Efficient Algorithm for Mining Association Rules in Large Databases", The VLDB Journal, pages 432 to 444, 1995. [10] Usama M. Fayyad, Gregory Piatetsky-Shapiro, Padhraic Smyth and Ramasamy Uthurusamy, "Advances in Knowledge Discovery and Data Mining", American Association for Artificial Intelligence, CA, 1996. [11] lan H. Witten, Eibe Frank, Morgan Kaufmann, Data Mining, 2000.
[12] T. Hastie, R. Tibshirani, J. H. Friedman, „The Elements of Statistical Learning: Data Mining, Inference, and Prediction" , Springer Series in Statistics.[12] T. Hastie, R. Tibshirani, J.H. Friedman, "The Elements of Statistical Learning: Data Mining, Inference, and Prediction," Springer Series in Statistics.
[13] Jensen, V. J., "An Introduction to Bayesian Networks", UCL Press, London, 1996.
[13] Jensen, V.J., "An Introduction to Bayesian Networks", UCL Press, London, 1996.