JP2011034457A - Data mining system, data mining method and data mining program - Google Patents
Data mining system, data mining method and data mining program Download PDFInfo
- Publication number
- JP2011034457A JP2011034457A JP2009181900A JP2009181900A JP2011034457A JP 2011034457 A JP2011034457 A JP 2011034457A JP 2009181900 A JP2009181900 A JP 2009181900A JP 2009181900 A JP2009181900 A JP 2009181900A JP 2011034457 A JP2011034457 A JP 2011034457A
- Authority
- JP
- Japan
- Prior art keywords
- attribute
- classification
- grouping
- attributes
- hierarchy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007418 data mining Methods 0.000 title claims abstract description 70
- 238000000034 method Methods 0.000 title claims description 52
- 238000012360 testing method Methods 0.000 claims abstract description 122
- 238000004364 calculation method Methods 0.000 claims abstract description 41
- 238000012795 verification Methods 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims 2
- 238000005065 mining Methods 0.000 claims 2
- 238000012545 processing Methods 0.000 description 30
- 238000010586 diagram Methods 0.000 description 12
- 238000000546 chi-square test Methods 0.000 description 10
- 230000010365 information processing Effects 0.000 description 10
- 230000000694 effects Effects 0.000 description 7
- 238000013500 data storage Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 2
- 238000000729 Fisher's exact test Methods 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 235000015219 food category Nutrition 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、複数の属性と属性値とを含むデータから分析対象の属性に関連する属性を判定するデータマイニングシステム、データマイニング方法及びデータマイニング用プログラムに関する。 The present invention relates to a data mining system, a data mining method, and a data mining program for determining an attribute related to an attribute to be analyzed from data including a plurality of attributes and attribute values.
一般に、データマイニングシステムは、さまざまな属性をもったデータを入力として、属性間の関係の法則を計算(抽出)する。データマイニングシステムは、例えば、営業活動における顧客訪問の履歴データを入力として、営業活動の成功/失敗に関係深い属性が何かを計算(抽出)する。 In general, a data mining system calculates (extracts) a law of relation between attributes by using data having various attributes as input. For example, the data mining system calculates (extracts) what attributes are related to the success / failure of a sales activity by using, as an input, historical data of customer visits in the sales activity.
図1は、顧客訪問の履歴データの例を示す説明図である。図1に示す例では、履歴データは、訪問先、訪問日、訪問時間、訪問者及び成功/失敗を属性としたデータを含む。なお、図中の「…」は省略を示す。データマイニングシステムは、このようなデータが与えられた(入力された)時に、履歴データから、成功/失敗の属性と関係の深い属性を探す(抽出する)。データマイニングシステムは、属性間の関係があるかどうかを図るために、例えば、一般によく知られている、t検定などの検定手法を用いる。 FIG. 1 is an explanatory diagram showing an example of customer visit history data. In the example illustrated in FIG. 1, the history data includes data having attributes of visited place, visited date, visited time, visitor, and success / failure. In addition, "..." in a figure shows abbreviation. When such data is given (input), the data mining system searches (extracts) an attribute closely related to the success / failure attribute from the history data. In order to determine whether there is a relationship between attributes, the data mining system uses, for example, a well-known test method such as t-test.
しかし、このような検定を行うためには、数値属性を離散化したり、属性をグルーピングしたりする必要がある。この問題を解決することを目的とした装置として、例えば、特許文献1に記載された装置がある。
However, in order to perform such a test, it is necessary to discretize numerical attributes or group attributes. As an apparatus intended to solve this problem, for example, there is an apparatus described in
特許文献1に記載された装置では、入力データに対し、手続きファイルと呼ばれるルールを適用することで数値属性の離散化や属性のグルーピングを行う。たとえば、手続きファイルに、「訪問時間を、8:00以前、8:00から09:59、10:00から11:59、12:00から14:00、14:00から16:00、16:00以降、離散化」、「訪問先を、A産業とB興産、C興産とD会社、E会社とF会社、それ以外に離散化」などと記述することで、数値の離散化や属性のグルーピングを行う。
In the apparatus described in
しかし、特許文献1に記載された装置の問題点は、効率的ではないということである。その理由は、一つの属性に対し、一つの離散化やグルーピングのみを記述するのみでは、良い結果が得られないため、多くの試行錯誤が必要となるためである。
However, the problem with the device described in
特許文献1に記載された装置では、たとえば、「訪問時間を、8:00以前、8:00から09:59、10:00から11:59、12:00から14:00、14:00から16:00、16:00以降、離散化」というルールを記述したのち、あまり妥当な結果が得られない場合には、「訪問時間を0:00から11:59と12:00から23:59に離散化」というように新たなにルールを記述しなおす必要がある。また、仮に、ルールを複数記述できたとしても、特許文献1に記載された装置では、すべてのルールを適用したのちに検定を行う必要がある。
In the apparatus described in
そこで、本発明は、データマイニングにおいて、ユーザが試行錯誤することなく、効率的に属性の粒度を変更することができるデータマイニングシステム、データマイニング方法及びデータマイニング用プログラムを提供することを目的とする。 Accordingly, an object of the present invention is to provide a data mining system, a data mining method, and a data mining program that can efficiently change the granularity of attributes without trial and error by a user in data mining. .
本発明によるデータマイニングシステムは、複数の属性と属性値とを含むデータから分析対象の属性に関連する属性を判定するデータマイニングシステムであって、データから属性を選択し、予め記憶する属性に対応する分類を階層的にあらわす分類階層に基づいて、選択した属性の属性値をグループ化するグループ化手段と、グループ化手段がグループ化した属性値と分析対象の属性との関連性の強さを示す検定量を算出する検定量算出手段と、検定値算出手段が算出した検定量に基づいて、グループ化した属性値が分析対象の属性との関係において特徴的であるか否かを判定する判定手段とを含み、グループ化手段は、判定手段が特徴的でないと判定すると、分類階層のうち、前回のグループ化で用いた下位層よりも上位の階層の分類に基づいてグループ化処理を再度実行することを特徴とする。 The data mining system according to the present invention is a data mining system that determines an attribute related to an attribute to be analyzed from data including a plurality of attributes and attribute values, and selects an attribute from the data and corresponds to an attribute stored in advance Grouping means for grouping the attribute values of the selected attributes based on the classification hierarchy representing the classification to be performed, and the strength of the relationship between the attribute values grouped by the grouping means and the attributes to be analyzed A test amount calculating means for calculating a test amount to be displayed, and a determination for determining whether the grouped attribute value is characteristic in relation to the analysis target attribute based on the test amount calculated by the test value calculating means And when the determination means determines that the determination means is not characteristic, the grouping means classifies the classification hierarchy to a higher hierarchy than the lower hierarchy used in the previous grouping. Zui and executes a grouping process again.
本発明によるデータマイニング方法は、複数の属性と属性値とを含むデータから分析対象の属性に関連する属性を判定するデータマイニング方法であって、データから属性を選択し、予め記憶する属性に対応する分類を階層的にあらわす分類階層に基づいて、選択した属性の属性値をグループ化するグループ化ステップと、グループ化した属性値と分析対象の属性との関連性の強さを示す検定量を算出する検定量算出ステップと、算出した検定量に基づいて、グループ化した属性値が分析対象の属性との関係において特徴的であるか否かを判定する判定ステップとを含み、グループ化ステップで、特徴的でないと判定すると、分類階層のうち、前回のグループ化で用いた下位層よりも上位の階層の分類に基づいてグループ化処理を再度実行することを特徴とする。 The data mining method according to the present invention is a data mining method for determining an attribute related to an attribute to be analyzed from data including a plurality of attributes and attribute values, and selects an attribute from the data and corresponds to an attribute stored in advance A grouping step that groups the attribute values of the selected attribute based on the classification hierarchy that represents the classification to be performed hierarchically, and a test quantity that indicates the strength of the association between the grouped attribute value and the attribute to be analyzed A test amount calculation step for calculating, and a determination step for determining whether or not the grouped attribute value is characteristic in relation to the attribute to be analyzed based on the calculated test amount. If it is determined that it is not characteristic, the grouping process is executed again based on the classification of the higher hierarchy than the lower hierarchy used in the previous grouping in the classification hierarchy. It is characterized in.
本発明によるデータマイニング用プログラムは、複数の属性と属性値とを含むデータから分析対象の属性に関連する属性を判定するコンピュータに、データから属性を選択し、予め記憶する属性に対応する分類を階層的にあらわす分類階層に基づいて、選択した属性の属性値をグループ化するグループ化処理と、グループ化した属性値と分析対象の属性との関連性の強さを示す検定量を算出する検定量算出処理と、算出した検定量に基づいて、グループ化した属性値が分析対象の属性との関係において特徴的であるか否かを判定する判定処理とを実行させ、グループ化処理で、特徴的でないと判定すると、分類階層のうち、前回のグループ化で用いた下位層よりも上位の階層の分類に基づいてグループ化処理を再度実行させることを特徴とする。 The data mining program according to the present invention selects an attribute from data and determines a classification corresponding to an attribute stored in advance in a computer that determines an attribute related to the attribute to be analyzed from data including a plurality of attributes and attribute values. A grouping process that groups the attribute values of the selected attributes based on the hierarchical classification, and a test that calculates the test amount that indicates the strength of the relationship between the grouped attribute values and the attributes to be analyzed Based on the calculated amount and the calculated amount, the grouped attribute value is judged to determine whether the grouped attribute value is characteristic in relation to the attribute to be analyzed. If it is determined that it is not appropriate, the grouping process is performed again based on the classification of the higher hierarchy than the lower hierarchy used in the previous grouping in the classification hierarchy. .
本発明によれば、データマイニングにおいて、ユーザが試行錯誤することなく、効率的に属性の粒度を変更することができる。 According to the present invention, in data mining, the attribute granularity can be changed efficiently without trial and error by the user.
以下、本発明の実施形態について図面を参照して詳細に説明する。図2は、本発明によるデータマイニングシステムの構成の一例を示すブロック図である。図2に示すように、本発明の第1の実施形態におけるデータマイニングシステムは、プログラムに従って動作するデータ処理装置1001と、データ記憶装置1002と、データ群及び特徴を判断したい目的属性を受け取る(データ処理装置1001に入力する)入力手段101と、目的属性に関係のある属性のリストを出力する出力手段105とを含む。なお、本実施形態では、データマイニングシステムは、例えば、プログラムに従って動作するパーソナルコンピュータ等の情報処理装置によって実現される。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. FIG. 2 is a block diagram showing an example of the configuration of the data mining system according to the present invention. As shown in FIG. 2, the data mining system according to the first embodiment of the present invention receives a
データ処理装置1001は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。データ処理装置1001は、属性に対応する分類を階層的にあらわす分類階層を参照し、属性値のグループ化を行うグループ化手段102と、データ群及び目的属性を入力として所定の検定を行う検定量算出手段103と、検定結果に基づいて属性が特徴的(検定量で関連性が強いことを示す値となっていること)であるかを判定する判定手段104とを含む。
Specifically, the
データ記憶装置1002は、具体的には、磁気ディスク装置や光ディスク装置等の記憶装置によって実現される。図2に示すように、データ記憶装置1002は、属性分類階層記憶手段106を含む。
Specifically, the
これらの手段はそれぞれ概略つぎのように動作する。 Each of these means generally operates as follows.
入力手段101は、具体的には、キーボード等の入力装置によって実現される。入力手段101は、データ群と目的属性とを受け取る(データ処理装置1001に入力する)機能を備えている。データ群は、属性と属性値とを含む。また、目的属性とは、データマイニングを行うことによって、データ群に含まれる属性と規則性や関係性の検定対象となる属性である(なお、本実施形態では、このような属性をデータ群に含まれる属性とは区別して目的属性という)。たとえば、顧客訪問履歴データ(データ群)を入力とし、成功/失敗に関連する属性を求めたい場合には、入力手段101は、目的属性として、成功/失敗を入れる(データ処理装置1001に入力する)。本実施形態では、データマイニングシステムは、データマイニングを行うことによって、入力したデータ群に含まれる属性と、目的属性との規則性や関係性を導出する処理を行う。
Specifically, the
属性分類階層記憶手段106は、具体的には、磁気ディスク装置や光ディスク装置等の記憶装置によって実現される。属性分類階層記憶手段106は、属性とその属性に対応する分類階層とを記憶する。たとえば、属性分類階層記憶手段106は、属性が訪問時間であれば、分類階層として、午前や午後に分類し、さらに、午前を就業時間午前と早朝とに分類して記憶する。属性分類階層記憶手段106は、これらの分類階層を属性毎に記憶する。これらのデータ(分類階層)には、ユーザが予め作成したデータを用いて属性分類階層記憶手段106に記憶してもよいし、一般に公開されているデータを用いて属性分類階層記憶手段106に記憶してもよい。たとえば、属性が企業の場合には、東京証券取引所などが用いる企業分類を用いることができる。そして、図1に示すような顧客訪問履歴であれば、この企業分類を訪問先の分類階層として用いてもよい。
Specifically, the attribute classification hierarchy storage means 106 is realized by a storage device such as a magnetic disk device or an optical disk device. The attribute classification
グループ化手段102は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。グループ化手段102は、属性分類階層記憶手段106を参照し、入力データを、属性に対応する分類階層に基づいて、下位階層から順番にグループ化する機能を備えている。具体的には、グループ化手段102は、入力手段101が入力したデータ群から属性を一つ選択し、選択した属性に対応する分類階層があれば、その分類階層の最下層の分類に基づいて、属性値のグループ化を行う。たとえば、グループ化手段102は、顧客訪問履歴データ群から訪問時間属性を選択した場合、訪問時間属性に対応する分類階層の最下層が2時間ごとの分類であれば、属性値である実際の訪問時間を2時間毎にグループ化したデータを作成する。
Specifically, the grouping means 102 is realized by a CPU of an information processing apparatus that operates according to a program. The grouping means 102 has a function of referring to the attribute classification hierarchy storage means 106 and grouping input data in order from the lower hierarchy based on the classification hierarchy corresponding to the attribute. Specifically, the
また、グループ化手段102は、判定手段104から再グループ化する旨の指示を受け取る(入力される)と、先にグループ化した属性に対応する分類階層の一つ上の階層の分類に基づいて、属性値のグループ化を行う機能を備えている。さらに、グループ化手段102は、判定手段104から別の属性のグループ化をする旨の指示を受け取る(入力される)と、別の属性を一つ選択し、選択した属性に対応する分類階層に基づいて、属性値のグループ化を行う機能を備えている。
When the
検定量算出手段103は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。検定量算出手段103は、グループ化手段102から出力されたデータ群と目的属性(グループ化された入力データ)とに基づいて、目的属性と他の属性や属性値との関連性の強さを示す検定量を算出する機能を備えている。検定量算出手段103は、検定量を算出する際に、たとえば、一般的なカイ二乗検定などの方法を用いる。たとえば、データ群が顧客訪問の履歴データで、目的属性が成功/失敗であった場合、検定量算出手段103は、カイ二乗検定であれば、成功/失敗の属性と訪問時間の属性とに基づいて頻度表を作成する。そして、検定量算出手段103は、作成した頻度表を用いてカイ二乗検定を行う。 Specifically, the test amount calculation means 103 is realized by a CPU of an information processing apparatus that operates according to a program. Based on the data group output from the grouping means 102 and the objective attribute (grouped input data), the test amount calculation means 103 determines the strength of the relevance between the objective attribute and other attributes and attribute values. It has a function to calculate the test amount shown. The test amount calculation means 103 uses, for example, a method such as a general chi-square test when calculating the test amount. For example, when the data group is customer visit history data and the objective attribute is success / failure, the verification amount calculation means 103 is based on the success / failure attribute and the visit time attribute if the chi-square test is used. Create a frequency table. Then, the test amount calculation means 103 performs a chi-square test using the created frequency table.
判定手段104は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。判定手段104は、検定量算出手段103から検定結果を受け取り、その、検定結果が特徴的か否かを、所定の閾値に基づいて判断する機能を備えている。特徴的でないと判断した場合には、判定手段104は、階層を一つ上げてグループ化を行う旨の指示をグループ化手段102に伝える(出力する)。特徴的であると判定した場合には、判定手段104は、他の属性についてグループ化を行う旨の指示をグループ化手段102に伝える(出力する)。すべての属性のグループ化が終われば、判定手段104は、特徴的であった属性を出力手段105に渡す(出力する)。
Specifically, the
出力手段105は、具体的には、プログラムに従って動作する情報処理装置のネットワークインターフェース部やディスプレイ装置等の表示装置によって実現される。出力手段105は、判定手段104より属性リストを受け取り、これを出力する機能を備えている。出力手段105は、たとえば、ディスプレイ装置によって実現される場合、判定手段104の指示に従って、属性リストを表示する。また、出力手段105は、たとえば、ネットワークインターフェース部によって実現される場合、他のデータ処理装置などに属性リストを出力する。
Specifically, the
次に、図2及び図3を参照してデータマイニングシステムの動作について説明する。図3は、データマイニングシステムが実行する処理例を示す流れ図である。 Next, the operation of the data mining system will be described with reference to FIGS. FIG. 3 is a flowchart showing an example of processing executed by the data mining system.
データ群から所定の属性に関連する情報を抽出するために、ユーザが入力手段101を操作してデータ群と目的属性とを入力すると、入力手段101は、ユーザの操作に従って、データ群と目的属性とをデータ処理装置1001に入力する。ここで、本実施形態で入力手段101がデータ処理装置1001に入力するデータ群の例を図1に示す。図1に示す顧客訪問の履歴データは、営業部門の社員がどのような顧客にいつ訪問し、その営業活動が成功したか失敗したかを示すデータを含む。図1を参照すると、データ群は、訪問先、訪問日、訪問時間、訪問者及び成功/失敗を属性とする表形式のデータである。そして、図1に示す表内の各値は、属性に対する属性値を示す。図1に示すように、各データには、識別子IDが記されて(付されて)いる。ID1のデータは、属性「訪問先」の属性値が「A産業」であることを表している。なお、本実施形態では、入力手段101は、目的属性として「成功/失敗」を入力するものとする。これによって、ユーザは、どの行動が営業活動の成功、失敗に関係が深いかを知ることができる。
In order to extract information related to a predetermined attribute from the data group, when the user operates the
入力手段101がユーザの入力操作に従ってデータ処理装置1001にデータ群と目的属性とを入力すると、グループ化手段102は、入力されたデータ群を参照し、グループ化の対象となる属性を一つ選択する(図3のステップS11)。グループ化手段102は、属性の選択をランダムに行う。たとえば、グループ化手段102は、図1に示すデータ群に含まれる各属性から、訪問時間を選択する。
When the
次に、グループ化手段102は、属性分類階層記憶手段106を参照し、選択した属性に対応する分類階層を取得(抽出)する(図3のステップS12)。 Next, the grouping means 102 refers to the attribute classification hierarchy storage means 106 and acquires (extracts) a classification hierarchy corresponding to the selected attribute (step S12 in FIG. 3).
属性分類階層記憶手段106が記憶する分類階層の例を、図4、図5、図6に示す。本実施形態では、分類階層記憶手段106は、これらの分類階層を、すべて記憶しているものとする。
Examples of classification hierarchies stored in the attribute classification
図4は、訪問時間を示す属性に対応する分類階層の例を示す説明図である。図4を参照すると、訪問時間は、午前と午後とに分類されている。さらに、午前は、早朝と就業時間午前とに、午後は、昼休みと就業時間午後と深夜とに分類されている。さらに、就業時間午前は、8:00−10:00と10:00−12:00とに分類されている。 FIG. 4 is an explanatory diagram illustrating an example of a classification hierarchy corresponding to an attribute indicating a visit time. Referring to FIG. 4, the visit time is classified into morning and afternoon. Furthermore, morning is classified into early morning and working hours in the morning, and afternoon is classified into lunch break, working hours in the afternoon and late at night. Furthermore, the working hours in the morning are classified into 8: 00-10: 00 and 10: 00-12: 00.
図5は、訪問先を示す属性に対応する分類階層の例を示す説明図である。なお、図中の「…」は、省略を表す。図5には、訪問先企業の分類が示されている。このような企業分類として、一般に公開されている企業分類を流用することができる。たとえば、この図5に示す例は、広くインターネットで公開されているWikipediaにおける日本企業一覧の分類から抜粋した例である。 FIG. 5 is an explanatory diagram illustrating an example of a classification hierarchy corresponding to an attribute indicating a visited place. In addition, "..." in a figure represents abbreviation. FIG. 5 shows a classification of visited companies. As such a company classification, a public company classification can be used. For example, the example shown in FIG. 5 is an example extracted from the classification of the list of Japanese companies in Wikipedia widely released on the Internet.
図6は、訪問者を示す属性に対応する分類階層の例を示す説明図である。なお、図中「…」は省略を表す。図6には、訪問者の職域分類が示されている。このような分類については、たとえば、会社の人事データベースなどから取得可能である。 FIG. 6 is an explanatory diagram illustrating an example of a classification hierarchy corresponding to an attribute indicating a visitor. In the figure, "..." represents omission. FIG. 6 shows the job classification of visitors. Such classification can be obtained from, for example, a company personnel database.
本実施形態では、ステップS12において、グループ化手段102は、属性分類階層記憶手段106から、図4に示す訪問時間に対応する分類階層を選択(抽出)する。
In the present embodiment, in step S12, the
次に、グループ化手段102は、選択(抽出)した分類階層のうち、現在処理対象である階層の分類に基づいて、属性値のグループ化を行う(図3のステップS13)。ここでは、属性に対応する分類階層を選択した直後であるので、分類階層のうちの最下位の階層が、現在処理対象の階層となる。グループ化手段102は、この階層の分類に基づいて、データ群(ステップS11で選択した属性の属性値)をグループ化する。
Next, the
図1に示すデータ群をグループ化した例を図7に示す。図7を参照すると、訪問時間を示す属性の属性値が変化しているのがわかる。グループ化手段102は、訪問時間を示す属性に対応する分類階層のうち、最下位の階層である2時間毎の分類に基づいて、属性値をグループ化している。たとえば、データID1の訪問時間を示す属性の属性値が、「11:30」から「10:00−12:00」のグループに置き換わっている。また、データID2の訪問時間を示す属性の属性値が、「13:10」から「13:00−15:00」のグループに、データID3の訪問時間を示す属性の属性値が、「13:20」から「13:00−15:00」のグループにそれぞれ置き換わっている。
FIG. 7 shows an example in which the data group shown in FIG. 1 is grouped. Referring to FIG. 7, it can be seen that the attribute value of the attribute indicating the visit time has changed. The grouping means 102 groups attribute values based on the classification for every two hours, which is the lowest hierarchy among the classification hierarchies corresponding to the attribute indicating the visit time. For example, the attribute value of the attribute indicating the visit time of the
次に、検定量算出手段103は、グループ化手段102から出力されたグループ化後のデータと目的属性とに基づいて、目的属性と他の属性やグループ化した属性値との検定量を算出する。検定量算出手段103は、検定量の算出において、二つの変数の関係が強いか否かを測ることができる既存の手法を用いる。既存の手法には、たとえば、カイ二乗検定やフィッシャーの正確検定、また、決定木でよく用いられる情報利得比や、相関ルールで用いられるサポートとコンフィデンスなどがある。
Next, the test
ここで、検定量算出手段103が、検定量の算出において、カイ二乗検定を用いた場合の例について説明する。まず、カイ二乗検定を用いる場合、検定量算出手段103は、目的属性とグループ化対象の属性とに基づいて、頻度表を作成する。図8に頻度表の例を示す。図8に示す例は、横に目的属性である成功/失敗属性の属性値「成功」と「失敗」とを、縦にグループ化対象の処理対象の属性である訪問時間の一つの属性値「12:00−13:00」と「12:00−13:00以外」とをとる2×2の頻度表である。表内の値は、その条件に合致するデータ数である。検定量算出手段103は、この頻度表を用いて、以下のカイ二乗検定を行う。
Here, an example in which the test amount calculation means 103 uses a chi-square test in calculating the test amount will be described. First, when the chi-square test is used, the test
カイ二乗=Σ{(F(i,j)‐D(i,j))2/F(i,j)}、
D(i,j):頻度表のi行j列の値、
F(i,j):a(i)×b(j)/N、N:総頻度、
a(i):i行の値の合計値、
b(j):j列の値の合計値
Chi-square = Σ {(F (i, j) −D (i, j)) 2 / F (i, j)},
D (i, j): value of i row j column of the frequency table,
F (i, j): a (i) × b (j) / N, N: total frequency,
a (i): total value of i rows,
b (j): Total value of j columns
この式に当てはめると、以下のように計算できる。 When applied to this equation, it can be calculated as follows.
カイ二乗検定=(250×60/1260−50)2/(250×60/1260)+(1010×60/1260−10)2/(1010×60/1260)+(250×1200/1260−200)2/(250×1200/1260)+(1010×1200/1260−1000)2/(1010×1200/1260)=121.9047619+30.17444602+6.095238095+1.508722301=159.6831683 Chi-square test = (250 × 60 / 1260−50) 2 / (250 × 60/1260) + (1010 × 60 / 1260−10) 2 / (1010 × 60/1260) + (250 × 1200 / 1260−200) ) 2 / (250 × 1200/1260) + (1010 × 1200 / 1260−1000) 2 /(1010×1200/1260)=121.9047619+30.17444602+6.095238095+1.508722301=159.68316383
以上のように算出された値が、営業活動の成功/失敗(目的属性)と、その訪問時間が12:00−13:00(グループ化した属性値)か否かとに関する検定量となる。検定量算出手段103は、同じように、グループ化した他の各属性値でも検定量を算出する。そして、グループ化した全ての属性値について検定量を算出すると、検定量算出手段103は、グループ化した各属性値と検定量とを含むリストを判定手段104に渡す(出力する)。
The value calculated as described above is a verification amount relating to success / failure of sales activities (objective attribute) and whether or not the visit time is 12: 00-13: 00 (grouped attribute value). Similarly, the test amount calculation means 103 calculates a test amount for each of the other attribute values grouped. When the test amount is calculated for all the grouped attribute values, the test
また、図9に示すように、検定量算出手段103は、成功/失敗と訪問時間の各属性値とに基づいて、頻度表を作成する。これに基づいて上記と同じように処理することで、検定量算出手段103は、訪問時間の2時間毎集計(分類階層における特定の階層)と成功/失敗(目的属性)とに関する検定量を算出する。この場合、検定量算出手段103は、階層と検定量とを判定手段104に渡す(出力する)。
Further, as shown in FIG. 9, the test amount calculation means 103 creates a frequency table based on the attribute values of success / failure and visit time. Based on this, processing is performed in the same manner as described above, so that the test amount calculation means 103 calculates a test amount related to the summation of visit times every two hours (a specific layer in the classification layer) and success / failure (target attribute). To do. In this case, the test
次に、判定手段104は、出力された検定量が特徴的か否かを判断する(図3のステップS15)。判定手段104は、所定の閾値に基づいて、検定量が特徴的であるか否かを判断する。そして、判定手段104は、グループ化した属性値と検定量とを含むリストのうち、特徴的なグループ化した属性値をデータ処理装置に記憶させる。また、判定手段104は、全てのグループ化した属性値が特徴的であれば、出力された階層が目的属性との関係において特徴的であると判定する。
Next, the
ステップS15において、一つでも(すなわち、処理対象の階層でグループ化された属性値のうち一つでも)特徴的でない属性値があると判定した場合、判定手段104は、ステップS16に処理を移行する。一方、ステップS15において、全てのグループ化された属性値が特徴的であると判定した場合、判定手段104は、ステップS17に処理を移行する。
When it is determined in step S15 that there is an attribute value that is not characteristic (that is, even one attribute value grouped in the processing target hierarchy), the
ここで、特徴的か否かの判定において、たとえば、カイ二乗検定量の場合、有意水準5%を閾値とする。図8に示す例の場合、自由度1であるので、検定量が3.84以上であれば、判定手段104は、帰無仮説(二つの属性は独立である)を棄却し、二つの属性は独立ではないため特徴的であると判定する。図8に示す例の場合、検定量がこれを超えているので、判定手段104は、特徴的であると判定する。判定手段104は、他のグループ化した属性値についても判定を行い、一つでも特徴的でないグループ化した属性値がある場合には、ステップS16に処理を移行する。
Here, in determining whether or not it is characteristic, for example, in the case of a chi-square test amount, a significance level of 5% is set as a threshold value. In the case of the example shown in FIG. 8, since the degree of freedom is 1, if the test amount is 3.84 or more, the
ステップS15において、特徴的でない属性があると判定した場合には、判定手段104は、グループ化手段102に、処理対象の分類階層を一つ上にしてグループ化する旨の指示を出力する(ステップS16)。本実施形態では、判定手段104は、グループ化手段102に、訪問時間の属性値をビジネス時間の階層の分類に基づいてグループ化する旨の指示を出力する。
If it is determined in step S15 that there is a non-characteristic attribute, the
ステップS16において、判定手段が上記の指示を出力すると、グループ化手段102は、現在の階層(すなわち、前回よりも一つ上位の階層)の分類に基づいて属性値をグループ化する(図3のステップS13)。本実施形態では、グループ化手段102は、訪問時間の属性値をビジネス時間の階層の分類に基づいてグループ化する。ここでのグループ化処理の結果の例を、図10に示す。図10を参照すると、図1に示す例と比較して、訪問時間の属性値が「就業時間午前」や「就業時間午後」などに変更されていることがわかる。
When the determination unit outputs the above instruction in step S16, the
次に、再度、検定量算出手段103は、目的属性とグループ化後の他の属性や属性値との検定量を算出する(ステップS14)。そして、判定手段104は、検定量に基づいて、グループ化した属性値が特徴的か否かを判定する(ステップS15)。判定した結果、すべての属性が特徴的である場合、判定手段104は、ステップS17に処理を移行する。一方、すべての属性が特徴的でないと判定した場合には、判定手段104は、再度、ステップS16に処理を移行する。その後、ステップS15において、判定手段104が、すべての属性が特徴的であると判定するまで、データ処理装置1001は、ステップS13〜S16の処理を繰り返し行う。
Next, the test amount calculation means 103 again calculates the test amount of the target attribute and other attributes and attribute values after grouping (step S14). Then, the
次に、判定手段104は、入力されたデータ群のすべての属性について判定を行ったか否かを判定する(ステップS17)。そして、未判定の属性があると判定した場合には、判定手段104は、ステップS11に処理を移行する。その後、ステップS17において、判定手段104が、すべての属性について判定を行ったと判定するまで、データ処理装置1001は、ステップS11〜S17の処理を繰り返し行う。
Next, the
一方、ステップS17において、すべての属性についての判定が終わったと判定した場合、出力手段105は、判定手段104の指示に従ってデータ処理装置1001に記憶させていた特徴的な属性とその検定量とをディスプレイ装置等に出力する(ステップS18)。出力手段105が出力する属性リストと検定量の例を図11に示す。出力手段105は、たとえば、図11に示すように、特徴的であると判断した属性とその検定量とを含むリストを出力する。
On the other hand, if it is determined in step S17 that the determination for all the attributes has been completed, the
次に、本実施形態の効果について説明する。本実施形態では、属性の粒度を、ユーザが試行錯誤することなく効率的に変更できる。その理由は、グループ化手段が、属性分類階層に基づいて下位階層から順番にグループ化し、判定手段が、特徴的な階層であると判定すると、グループ化処理を止めるように制御するためである。 Next, the effect of this embodiment will be described. In the present embodiment, the granularity of the attribute can be changed efficiently without trial and error by the user. This is because the grouping means performs grouping in order from the lower hierarchy based on the attribute classification hierarchy, and controls the grouping process to stop when the determination means determines that it is a characteristic hierarchy.
また、本実施形態では、データマイニングにおいて、処理対象の属性の粒度の変更を、ルールを用いることなくできる。その理由は、グループ化手段が、属性分類階層記憶手段106が記憶する属性分類階層に基づいて、下位階層から順番にグループ化するためである。 In the present embodiment, in the data mining, the granularity of the attribute to be processed can be changed without using a rule. The reason is that the grouping means groups in order from the lower hierarchy based on the attribute classification hierarchy stored in the attribute classification hierarchy storage means 106.
実施形態2.
次に、本発明の第2の実施形態について、図面を参照して詳細に説明する。図12を参照すると、本発明の第2の実施形態におけるデータマイニングシステムは、第1の実施形態に比べ、グループ化手段102に代えて第2のグループ化手段202を含み、判定手段104に代えて第2の判定手段204を含む点で異なる。
Next, a second embodiment of the present invention will be described in detail with reference to the drawings. Referring to FIG. 12, the data mining system according to the second exemplary embodiment of the present invention includes a
以下、第1の実施形態と異なる点について主に説明する。第2のグループ化手段202は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。第2のグループ化手段202は、属性分類階層記憶手段106を参照し、入力データを分類階層の下位階層から順番にグループ化する機能を備えている。具体的には、第2のグループ化手段202は、入力手段101から、データ群を受け取る(入力される)と、データ群から属性を一つ選択し、選択した属性に対応する分類階層があれば、その分類階層の最下層の分類に基づいて、属性値のグループ化を行う。属性に対応する分類階層が複数ある場合には、第2のグループ化手段202は、いずれか一つを選択する。
Hereinafter, differences from the first embodiment will be mainly described. Specifically, the
たとえば、顧客訪問履歴データの訪問者属性に、図6に示す分類階層と図13に示す分類階層とが対応する場合、第2のグループ化手段202は、どちらかの分類階層を選択する。図13は、訪問者を示す属性に対応する部署ごとの分類階層を示す説明図である。 For example, when the classification hierarchy shown in FIG. 6 and the classification hierarchy shown in FIG. 13 correspond to the visitor attribute of the customer visit history data, the second grouping means 202 selects either classification hierarchy. FIG. 13 is an explanatory diagram showing a classification hierarchy for each department corresponding to an attribute indicating a visitor.
また、第2のグループ化手段202は、第2の判定手段204から再グループ化を実行する旨の指示を受け取る(入力される)と、先のグループ化の際に処理対象となった階層の一つ上の階層の分類に基づいて、グループ化を行う機能を備えている。さらに、第2のグループ化手段202は、第2の判定手段204から別の分類階層を選択する旨の指示を受け取る(入力される)と、現在処理対象の分類階層以外の分類階層を選択する機能を備えている。さらに、第2のグループ化手段202は、第2の判定手段204から別の属性でグループ化を実行する旨の指示を受け取る(入力される)と、データ群から別の属性を一つ選択し、選択した属性に含まれる属性値のグループ化を行う機能を備えている。
When the
第2の判定手段204は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。第2の判定手段204は、検定量算出手段103から検定結果を受け取る(入力される)と、所定の閾値に基づいて、検定結果が特徴的か否かを判定する機能を備えている。検定結果が特徴的でないと判定した場合には、第2の判定手段204は、階層を一つ上げてグループ化を行う旨の指示を第2のグループ化手段202に伝える(出力)する。一方、検定結果が特徴的であると判定した場合、第2の判定手段204は、属性に対応する他の分類階層があれば、これに基づいてグループ化を行う旨の指示を第2のグループ化手段202に伝える(出力する)。属性に対応する他の分類階層がない場合には、第2の判定手段204は、他の属性についてグループ化を行う旨の指示を第2のグループ化手段202に伝える(出力する)。また、すべての属性のグループ化が終了していると判定すると、第2の判定手段204は、特徴的であると判定した属性を出力手段105に渡す(出力する)。
Specifically, the
次に、図12及び図14を参照して、本実施形態におけるデータマイニングシステムの動作について、主に第1の実施形態と異なる部分について詳細に説明する。図14は、第2の実施形態におけるデータマイニングシステムが実行する処理例を示す流れ図である。 Next, with reference to FIG. 12 and FIG. 14, the operation of the data mining system in the present embodiment will be described in detail mainly for parts different from the first embodiment. FIG. 14 is a flowchart illustrating an example of processing executed by the data mining system according to the second embodiment.
第1の実施形態と異なるのは、属性に対応する他の分類階層があるか否かを判定するステップS21が追加されている点である。 The difference from the first embodiment is that step S21 for determining whether there is another classification hierarchy corresponding to the attribute is added.
ステップS21では、第2の判定手段204は、属性分類階層記憶手段106が記憶する分類階層に、属性に対応する他の分類階層があるか否かを判定する。そして、あると判定した場合には、第2の判定手段204は、ステップ12に処理を移行し、別の分類階層に基づいてグループ化を行う旨の指示を第2のグループ化手段202に出力する。一方、ないと判定した場合には、第2の判定手段204は、ステップS17に処理を移行し、第1の実施形態と同様に、未判定の属性があるか否かを判定する。
In step S <b> 21, the
ステップS21において、第2の判定手段204が、別の分類階層に基づいてグループ化を行う旨の指示を出力すると、ステップS12において、第2のグループ化手段202は、現在処理対象である分類階層と異なる分類階層を選択する。その後、第2の判定手段204は、第1の実施形態における処理と同様に、選択した分類階層に基づいて、属性値のグループ化を行う。
In step S21, when the
以上のように、本実施形態では、一つの属性に複数の分類階層が対応する場合、第2のグループ化手段は、いずれか一つの分類階層を選択する。そして、第2の判定手段は、未採用の分類階層を選択する旨の指示を第2のグループ化手段に出力する。そして、第2のグループ化手段は、第2の判定手段から出力された指示に従って、他の分類階層に基づいてグループ化処理を実行する。そのため、複数の分類階層が対応していても、すべての分類階層に対して特徴的か否かを判定することができる。 As described above, in the present embodiment, when a plurality of classification hierarchies correspond to one attribute, the second grouping unit selects any one of the classification hierarchies. Then, the second determination unit outputs an instruction to select an unadopted classification hierarchy to the second grouping unit. Then, the second grouping unit executes the grouping process based on another classification hierarchy according to the instruction output from the second determination unit. Therefore, even if a plurality of classification hierarchies correspond, it can be determined whether or not all the classification hierarchies are characteristic.
実施形態3.
次に、本発明の第3の実施形態について図面を参照して詳細に説明する。図15を参照すると、本発明の第3の実施形態におけるデータマイニングシステムは、第1の実施形態に比べ、纏め上げ手段301を追加で含む点で異なる。以下、第1の実施形態と異なる点について主に説明する。
Next, a third embodiment of the present invention will be described in detail with reference to the drawings. Referring to FIG. 15, the data mining system according to the third exemplary embodiment of the present invention is different from the first exemplary embodiment in that a
纏め上げ手段301は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。纏め上げ手段301は、出力する属性を検定量に基づいて順位付けした際に、近くの順位、または、差が小さい検定量で、分類階層において兄弟関係(同一階層)にある全ての分類がある場合には、これを纏めて親階層の分類として、出力手段105に出力する機能を備えている。このように、本実施形態では、纏め上げるとは、所定の関係にある複数の分類を1つの属性に置換することをいう。
Specifically, the
纏め上げ手段301は、近くの順位や、差が小さい検定量かどうかを、所定の閾値に基づいて判断する。たとえば、図11に示す属性と検定量の順位付けとを入力とし、前後3位以内を閾値とした場合を考える。分類階層を参照すると、順位3と順位4との属性は、「訪問時間13:00−15:00」と「訪問時間15:00−17:00」とで、兄弟関係にある分類であり、「訪問時間就業時間午後」の下位階層に属する全ての兄弟関係にある分類である。したがって、纏め上げ手段301は、この2つをまとめ、「訪問時間就業時間午後」とする。この際、纏め上げ手段301は、検定量として、順位が高いもの(すなわち、図11に示す順位3の検定値23.4)を採用する。なお、検定量を決定する方法として、これに限らず、たとえば、平均値や、2つの値を併記する方法を用いてもよい。
The
以上のように、本実施形態では、纏め上げ手段301は、出力する特徴的な属性のリストのうち、分類階層において近いものを纏め上げる。そのため、ユーザにとって見やすい分類を出力することができる。
As described above, in the present embodiment, the
実施形態4.
次に、本発明の第4の実施形態について図面を用いて詳細に説明する。図17を参照すると、本発明の第4の実施形態におけるデータマイニングシステムは、第1の実施の形態に比べ、組合せ手段401を追加で含む点で異なる。
Next, a fourth embodiment of the present invention will be described in detail with reference to the drawings. Referring to FIG. 17, the data mining system according to the fourth exemplary embodiment of the present invention is different from the first exemplary embodiment in that a
組合せ手段401は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。組合せ手段401は、入力手段101からデータ群と目的属性とを入力されると、データ群のうち、どれか二つ以上の属性の組合せを作成する機能を備えている。組合せ手段401は、データ群と目的属性と目的属性以外の属性の組合せとを、グループ化手段102に渡す(出力する)機能を備えている。
Specifically, the combination means 401 is realized by a CPU of an information processing apparatus that operates according to a program. The
グループ化手段102は、組合せ手段401から、データ群と目的属性と目的属性以外の属性の組合せとを出力されると、その属性の属性値のグループ化を行う機能を備えている。
The
次に、図17及び図18を参照して、本実施形態におけるデータマイニングシステムの動作について、主に第1の実施形態と異なる部分について詳細に説明する。図18は、第4の実施形態におけるデータマイニングシステムが実行する処理例を示す流れ図である。 Next, with reference to FIG. 17 and FIG. 18, the operation of the data mining system in the present embodiment will be described in detail mainly on the differences from the first embodiment. FIG. 18 is a flowchart illustrating an example of processing executed by the data mining system according to the fourth embodiment.
組合せ手段401は、データ群を参照し、目的属性以外の属性から、属性2つ以上の属性の組合せを選択する(図18に示すステップS41)。たとえば、図1に示すデータ群が入力された場合、組合せ手段401は、目的属性以外の属性の組み合わせとして、訪問先と訪問時間とを選択する。
The
次に、グループ化手段102は、属性の分類階層を取得(抽出)する(図18に示すステップS12)。 Next, the grouping means 102 acquires (extracts) the attribute classification hierarchy (step S12 shown in FIG. 18).
次に、グループ化手段102は、現在処理対象である階層の分類に基づいて属性値をグループ化する(図18に示すステップS13)。たとえば、データ群が図1に示すものであり、目的属性以外の属性の組合せが訪問先及び訪問時間であり、訪問時間に対応する分類階層が図4に示すものであり、訪問先に対応する分類階層が図5に示すものであった場合を想定する。この場合、グループ化手段102は、訪問時間及び訪問先に対応する分類階層を参照し、対応する分類階層の最下層の分類に基づいて、図19に示すように、その属性値をグループ化する。図19を参照すると、図1に比べ、訪問先及び訪問時間の属性値がグループ化されていることがわかる。一行目のデータを参照すると、訪問先がA産業から食料品カテゴリグループに変換され、訪問時間が11:10から10:00−12:00に変換されている。 Next, the grouping means 102 groups the attribute values based on the classification of the hierarchy that is the current processing target (step S13 shown in FIG. 18). For example, the data group is as shown in FIG. 1, the combination of attributes other than the objective attribute is the visit destination and the visit time, and the classification hierarchy corresponding to the visit time is as shown in FIG. 4, corresponding to the visit destination. Assume that the classification hierarchy is as shown in FIG. In this case, the grouping means 102 refers to the classification hierarchy corresponding to the visit time and the visit destination, and groups the attribute values based on the lowest classification of the corresponding classification hierarchy as shown in FIG. . Referring to FIG. 19, it can be seen that the attribute values of the visited place and the visited time are grouped as compared with FIG. Referring to the data in the first row, the visited place is converted from the A industry to the food category group, and the visiting time is converted from 11:10 to 10: 00-12: 00.
次に、検定量算出手段103は、検定量を算出する(図18のS14)。たとえば、カイ二乗検定を用いる場合、検定量算出手段103は、属性の組合せで頻度表を作成する。検定量算出手段が作成する頻度表の例を、図20に示す。図20は、訪問先が食料品で、かつ、訪問時間が12:00−13:00の場合の頻度表である。このほかの動作は、第1の実施形態と同様である。
Next, the test amount calculation means 103 calculates a test amount (S14 in FIG. 18). For example, when the chi-square test is used, the test
以上のように、本実施形態では、第1の実施形態の効果に加えて、属性の組合せをさらに考慮することで、より細かな分析を実現することができる。 As described above, in this embodiment, in addition to the effects of the first embodiment, more detailed analysis can be realized by further considering the combination of attributes.
次に、本発明によるデータマイニングシステムの最小構成について説明する。図21は、データマイニングシステムの最小の構成例を示すブロック図である。図21に示すように、データマイニングシステムは、最小の構成要素として、グループ化手段102と、検定量算出手段103と、判定手段104とを含む。
Next, the minimum configuration of the data mining system according to the present invention will be described. FIG. 21 is a block diagram illustrating a minimum configuration example of the data mining system. As shown in FIG. 21, the data mining system includes a
図21に示す最小構成のデータマイニングシステムでは、グループ化手段102は、複数の属性と属性値とを含むデータから属性を選択し、記憶部が記憶する属性に対応する分類を階層的にあらわす分類階層に基づいて、選択した属性の属性値をグループ化する。そして、検定量算出手段103は、グループ化手段102がグループ化した属性値及び選択した属性と分析対象の属性との関連性の強さを示す検定量を算出する。そして、判定手段104は、検定値算出手段103が算出した検定量に基づいて、グループ化された属性値及び選択した属性が分析対象の属性に対して特徴的であるか否かを判定する。そして、判定手段104が特徴的でないと判定すると、グループ化手段102は、分類階層のうち、前回より上位の階層の分類に基づいてグループ化処理を再度実行する。
In the data mining system with the minimum configuration shown in FIG. 21, the
従って、図21に示す最小構成のデータマイニングシステムによれば、データマイニングにおいて、分析粒度についてユーザが試行錯誤することなく、効率的に変更することができる。 Therefore, according to the data mining system having the minimum configuration shown in FIG. 21, in the data mining, the analysis granularity can be changed efficiently without trial and error by the user.
なお、本実施形態では、以下の(1)〜(6)に示すようなデータマイニングシステムの特徴的構成が示されている。 In this embodiment, the characteristic configuration of the data mining system as shown in the following (1) to (6) is shown.
(1)データマイニングシステムは、複数の属性と属性値とを含むデータ(例えば、図1に示す顧客訪問の履歴データ)から分析対象の属性(例えば、図1に示す成功/失敗)に関連する属性を判定するデータマイニングシステムであって、データから属性を選択し、予め記憶する(例えば、属性分類階層記憶手段106によって実現される)属性に対応する分類を階層的にあらわす分類階層に基づいて、選択した属性の属性値をグループ化するグループ化手段(例えば、グループ化手段102によって実現される)と、グループ化手段がグループ化した属性値と分析対象の属性との関連性の強さを示す検定量を算出する検定量算出手段(例えば、検定量算出手段103によって実現される)と、検定値算出手段が算出した検定量に基づいて、グループ化された属性値が分析対象の属性との関係において特徴的であるか否かを判定する判定手段(例えば、判定手段104によって実現される)とを含み、グループ化手段は、判定手段が特徴的でないと判定すると、分類階層のうち、前回のグループ化で用いた階層よりも上位の階層(例えば、図4に示すビジネス時間)の分類に基づいてグループ化処理を再度実行することを特徴とする。 (1) The data mining system relates to an analysis target attribute (for example, success / failure illustrated in FIG. 1) from data including a plurality of attributes and attribute values (for example, customer visit history data illustrated in FIG. 1). A data mining system for determining an attribute, wherein an attribute is selected from data and stored in advance (for example, realized by the attribute classification hierarchy storage means 106) based on a classification hierarchy that hierarchically represents a classification corresponding to the attribute Grouping means for grouping the attribute values of the selected attributes (for example, realized by the grouping means 102), and the strength of relevance between the attribute value grouped by the grouping means and the attribute to be analyzed Based on the test amount calculated by the test value calculation unit (for example, realized by the test amount calculation unit 103) and the test value calculation unit that calculates the test amount shown Determining means (for example, realized by the determining means 104) for determining whether or not the grouped attribute values are characteristic in relation to the attribute to be analyzed. If it is determined that it is not characteristic, the grouping process is performed again based on the classification of the classification hierarchy higher than the hierarchy used in the previous grouping (for example, the business time shown in FIG. 4). And
(2)データマイニングシステムにおいて、グループ化手段は、判定手段が全てのグループ化した属性値が分析対象の属性に対して特徴的であると判定すると、データから他の属性を選択してグループ化処理を再度実行するように構成されていてもよい。 (2) In the data mining system, when the grouping unit determines that all grouped attribute values are characteristic of the analysis target attribute, the grouping unit selects other attributes from the data and groups them You may be comprised so that a process may be performed again.
(3)データマイニングシステムは、複数の属性と属性値とを含むデータ及び分析対象の属性を入力として、分析対象の属性に関連する属性のリストを出力するデータマイニングシステムであって、属性に対応する分類を階層的にあらわす分類階層を記憶する属性分類階層記憶手段(例えば、属性分類階層記憶手段106によって実現される)と、データから、比較対象とする属性を一つ選択し、選択した属性に対応する分類階層を属性分類階層記憶手段から抽出し、抽出した分類階層の下位階層の分類に基づいて、データのうち比較対象とする属性に対応する属性値をグループ化するグループ化手段(例えば、グループ化手段102によって実現される)と、少なくとも分析対象の属性と比較対象とする属性、または分析対象の属性とグループ化手段がグループ化した比較対象とする属性の全ての属性値のいずれかに対し、分析対象の属性と比較対象とする属性と、または分析対象の属性と比較対象とする属性の属性値との関係性の強さを示す検定量を算出する検定量算出手段(例えば、検定量算出手段103によって実現される)と、検定量算出手段が算出した検定量が特定の閾値を越えるか否かによって特徴的であるか否かを判定し、特徴的でない属性または特徴的でない属性値を示す検定結果があると判定した場合に、グループ化手段に分類階層の一つ上の階層の分類に基づいてグループ化処理を実行させ、全ての比較対象の属性または属性値の検定結果が特徴的であると判定した場合に、グループ化手段に分類階層を変更することなく、未判定の別の属性を選択させ、全ての特徴的な属性のリストと検定量とを出力する判定手段(例えば、判定手段104によって実現される)とを含むことを特徴とする。 (3) A data mining system is a data mining system that receives data including a plurality of attributes and attribute values and attributes to be analyzed and outputs a list of attributes related to the attributes to be analyzed. Attribute classification hierarchy storage means (for example, realized by the attribute classification hierarchy storage means 106) that stores the classification hierarchy that represents the classification to be performed, and one attribute to be compared is selected from the data, and the selected attribute Grouping means (for example, grouping attribute values corresponding to the attributes to be compared among the data based on the classification of the lower hierarchy of the extracted classification hierarchy) And at least the attribute to be analyzed and the attribute to be compared, or the attribute to be analyzed and the group The attribute to be analyzed and the attribute to be compared, or the attribute value of the attribute to be analyzed and the attribute to be compared with Whether or not the test amount calculated by the test amount calculation means (for example, realized by the test amount calculation means 103) that calculates the test amount indicating the strength of the relationship exceeds a specific threshold Based on the classification of the hierarchy one level above the classification hierarchy in the grouping means when it is determined whether there is a test result indicating a non-characteristic attribute or a non-characteristic attribute value. Grouping process, and when it is determined that all the comparison target attributes or attribute value test results are characteristic, the grouping means does not change the classification hierarchy and assigns another undecided attribute. Let all select Characteristic list and test amounts of attributes and outputs the determination means (e.g., as implemented by the decision means 104), characterized in that it comprises a.
(4)データマイニングシステムにおいて、属性分類階層記憶手段は、一つの属性に対応する分類階層を記憶し、グループ化手段(例えば、第2のグループ化手段202によって実現される)は、属性に対応する分類階層を属性分類階層記憶手段からいずれか一つ選択し、判定手段(例えば、第2の判定手段204によって実現される)は、全ての比較対象の属性または属性の属性値の検定結果が特徴的であると判定し、かつ、比較対象の属性に対応するその他の分類階層がある場合、グループ化手段に未選択の分類階層を選択させるように構成されていてもよい。 (4) In the data mining system, the attribute classification hierarchy storage unit stores a classification hierarchy corresponding to one attribute, and the grouping unit (for example, realized by the second grouping unit 202) corresponds to the attribute. One of the classification hierarchies to be selected is selected from the attribute classification hierarchy storage unit, and the determination unit (for example, realized by the second determination unit 204) determines that all the attributes to be compared or the attribute result of the attribute are tested. If there is another classification hierarchy corresponding to the attribute to be compared and determined to be characteristic, the grouping unit may be configured to select an unselected classification hierarchy.
(5)データマイニングシステムにおいて、特徴的な属性のリストと検定量とを入力に、所定の条件を満たす属性同士を纏めて一つの属性とする纏め上げ手段(例えば、纏め上げ手段301によって実現される)を含み、纏め上げ手段は、所定の条件として、検定量順に順位づけした結果、異なる複数の属性が、所定の順位幅以内に含まれることと、所定の検定量の範囲に含まれることとの、少なくともいずれか一つを満たし、かつ、これらの属性が、対応する分類階層において兄弟階層であり同一の親分類を共有する場合に、親分類を新たな特徴的な属性として纏め上げて出力するように構成されていてもよい。
(5) In the data mining system, a grouping unit (for example, the
(6)データマイニングシステムは、グループ化手段によるグループ化の対象とする属性の組合せを生成する組合せ手段(例えば、組合せ手段401によって実現される)を含むように構成されていてもよい。 (6) The data mining system may include a combination unit (for example, realized by the combination unit 401) that generates a combination of attributes to be grouped by the grouping unit.
本発明は、顧客訪問履歴を利用して行動分析をする用途に適用可能である。また、販売履歴データを利用して販売商品分析をする用途にも適用可能である。 The present invention can be applied to a usage analysis using a customer visit history. Moreover, it is applicable also to the use which analyzes sales goods using sales history data.
101 入力手段
102 グループ化手段
103 検定量算出手段
104 判定手段
105 出力手段
106 属性分類階層記憶手段
202 第2のグループ化手段
204 第2の判定手段
301 纏め上げ手段
401 組合せ手段
1001 データ処理装置
1002 データ記憶装置
DESCRIPTION OF
Claims (14)
前記データから属性を選択し、予め記憶する前記属性に対応する分類を階層的にあらわす分類階層に基づいて、選択した前記属性の属性値をグループ化するグループ化手段と、
前記グループ化手段がグループ化した属性値と前記分析対象の属性との関連性の強さを示す検定量を算出する検定量算出手段と、
前記検定値算出手段が算出した検定量に基づいて、グループ化した前記属性値が前記分析対象の属性との関係において特徴的であるか否かを判定する判定手段とを含み、
前記グループ化手段は、前記判定手段が特徴的でないと判定すると、前記分類階層のうち、前回のグループ化で用いた階層よりも上位の階層の分類に基づいてグループ化処理を再度実行する
ことを特徴とするデータマイニングシステム。 A data mining system for determining an attribute related to an attribute to be analyzed from data including a plurality of attributes and attribute values,
Grouping means for selecting an attribute from the data and grouping attribute values of the selected attribute based on a classification hierarchy that hierarchically represents a classification corresponding to the attribute stored in advance;
A test amount calculating means for calculating a test amount indicating the strength of relevance between the attribute value grouped by the grouping means and the attribute to be analyzed;
Determination means for determining whether the grouped attribute values are characteristic in relation to the analysis target attribute based on the test amount calculated by the test value calculation means,
When the grouping unit determines that the determination unit is not characteristic, the grouping unit executes the grouping process again based on a classification of a hierarchy higher than the hierarchy used in the previous grouping among the classification hierarchies. A featured data mining system.
請求項1記載のデータマイニングシステム。 The grouping unit selects another attribute from the data and executes the grouping process again when the determining unit determines that all grouped attribute values are characteristic in relation to the attribute to be analyzed. 1. A data mining system according to 1.
前記属性に対応する分類を階層的にあらわす分類階層を記憶する属性分類階層記憶手段と、
前記データから、比較対象とする属性を一つ選択し、選択した前記属性に対応する分類階層を前記属性分類階層記憶手段から抽出し、抽出した前記分類階層の下位階層の分類に基づいて、前記データのうち前記比較対象とする属性に対応する属性値をグループ化するグループ化手段と、
少なくとも前記分析対象の属性と前記比較対象とする属性、または前記分析対象の属性と前記グループ化手段がグループ化した前記比較対象とする属性の全ての属性値のいずれかに対し、前記分析対象の属性と前記比較対象とする属性と、または前記分析対象の属性と前記比較対象とする属性の属性値との関係性の強さを示す検定量を算出する検定量算出手段と、
前記検定量算出手段が算出した検定量が特定の閾値を越えるか否かによって特徴的であるか否かを判定し、特徴的でない属性または特徴的でない属性値を示す検定結果があると判定した場合に、前記グループ化手段に前記分類階層の一つ上の階層の分類に基づいてグループ化処理を実行させ、全ての比較対象の属性または属性値の検定結果が特徴的であると判定した場合に、グループ化手段に分類階層を変更することなく、未判定の別の属性を選択させ、全ての特徴的な属性のリストと検定量とを出力する判定手段とを含む
ことを特徴とするデータマイニングシステム。 A data mining system that outputs data including a plurality of attributes and attribute values and an attribute to be analyzed, and outputs a list of attributes related to the attribute to be analyzed,
Attribute classification hierarchy storage means for storing a classification hierarchy representatively representing the classification corresponding to the attribute;
From the data, select one attribute to be compared, extract the classification hierarchy corresponding to the selected attribute from the attribute classification hierarchy storage means, based on the classification of the lower hierarchy of the extracted classification hierarchy, the Grouping means for grouping attribute values corresponding to the attributes to be compared in the data;
At least one of the analysis target attribute and the comparison target attribute, or the analysis target attribute and all the attribute values of the comparison target attribute grouped by the grouping unit, the analysis target attribute A test amount calculating means for calculating a test amount indicating the strength of the relationship between the attribute and the attribute to be compared, or the attribute value of the attribute to be analyzed and the attribute to be compared;
It is determined whether or not the test amount calculated by the test amount calculation means is characteristic depending on whether or not it exceeds a specific threshold, and it is determined that there is a test result indicating an uncharacteristic attribute or an uncharacteristic attribute value. In the case where the grouping means is caused to execute a grouping process based on the classification of the hierarchy one level above the classification hierarchy, and it is determined that all comparison target attributes or attribute value test results are characteristic In addition, the grouping means includes selecting means for selecting another undecided attribute without changing the classification hierarchy, and outputting a list of all characteristic attributes and the test amount. Mining system.
グループ化手段は、属性に対応する分類階層を前記属性分類階層記憶手段からいずれか一つ選択し、
判定手段は、全ての比較対象の属性または前記属性の属性値の検定結果が特徴的であると判定し、かつ、前記比較対象の属性に対応するその他の分類階層がある場合、グループ化手段に未選択の分類階層を選択させる
請求項3記載のデータマイニングシステム。 The attribute classification hierarchy storage means stores a classification hierarchy corresponding to one attribute,
The grouping means selects one of the classification hierarchies corresponding to the attribute from the attribute classification hierarchy storage means,
The determination unit determines that all the attributes to be compared or the test result of the attribute value of the attribute is characteristic, and if there is another classification hierarchy corresponding to the attribute to be compared, the grouping unit The data mining system according to claim 3, wherein an unselected classification hierarchy is selected.
前記纏め上げ手段は、所定の条件として、検定量順に順位づけした結果、異なる複数の属性が、所定の順位幅以内に含まれることと、所定の検定量の範囲に含まれることとの、少なくともいずれか一つを満たし、かつ、これらの属性が、対応する分類階層において兄弟階層であり同一の親分類を共有する場合に、前記親分類を新たな特徴的な属性として纏め上げて出力する
請求項3又は請求項4記載のデータマイニングシステム。 Including a list of characteristic attributes and a test amount as input, and a grouping unit that combines attributes satisfying a predetermined condition into one attribute,
The summarizing means, as a predetermined condition, as a result of ranking in the order of the test amount, as a result, a plurality of different attributes are included within a predetermined rank range and at least included in the range of the predetermined test amount When any one of these attributes is satisfied and these attributes are sibling hierarchies in the corresponding classification hierarchy and share the same parent classification, the parent classification is collected and output as a new characteristic attribute. Item 5. The data mining system according to item 3 or claim 4.
請求項3から請求項5のうちいずれか1項に記載のデータマイニングシステム。 The data mining system according to any one of claims 3 to 5, further comprising a combination unit that generates a combination of attributes to be grouped by the grouping unit.
前記データから属性を選択し、記憶部が記憶する前記属性に対応する分類を階層的にあらわす分類階層に基づいて、選択した前記属性の属性値をグループ化するグループ化ステップと、
グループ化した属性値と前記分析対象の属性との関連性の強さを示す検定量を算出する検定量算出ステップと、
算出した検定量に基づいて、グループ化した前記属性値が前記分析対象の属性との関係において特徴的であるか否かを判定する判定ステップとを含み、
前記グループ化ステップで、前記判定ステップにおいて特徴的でないと判定すると、前記分類階層のうち、前回より上位の階層の分類に基づいてグループ化処理を再度実行する
ことを特徴とするデータマイニング方法。 A data mining method for identifying an attribute related to an attribute to be analyzed from data including a plurality of attributes and attribute values,
A grouping step of selecting an attribute from the data and grouping attribute values of the selected attribute based on a classification hierarchy that hierarchically represents a classification corresponding to the attribute stored in a storage unit;
A test amount calculation step of calculating a test amount indicating the strength of the relationship between the grouped attribute value and the attribute to be analyzed;
A determination step of determining whether or not the grouped attribute values are characteristic in relation to the analysis target attribute based on the calculated verification amount;
If it is determined in the grouping step that the characteristic is not characteristic in the determination step, a grouping process is executed again based on a classification of a hierarchy higher than the previous one of the classification hierarchies.
請求項7記載のデータマイニング方法。 The data according to claim 7, wherein in the grouping step, when it is determined that all the grouped attribute values are characteristic in relation to the attribute to be analyzed, another attribute is selected from the data and the grouping process is executed. Mining method.
前記属性に対応する分類を階層的にあらわす分類階層を記憶部に記憶する記憶ステップと、
前記データから、比較対象とする属性を一つ選択する選択ステップと、
選択した前記属性に対応する前記分類階層を前記記憶部から抽出する抽出ステップと、
抽出した前記分類階層の下位階層の分類に基づいて前記データの属性に対応する属性値をグループ化するグループ化ステップと、
少なくとも前記分析対象の属性と前記比較対象とする属性、または前記分析対象の属性とグループ化した前期比較対象とする属性の全ての属性値のいずれかに対し、前記分析対象の属性と前記比較対象とする属性と、または前記分析対象の属性と前記比較対象とする属性の属性値との関係性の強さを示す検定量を算出する検定量算出ステップと、
算出した検定量が特定の閾値を越えるか否かによって特徴的であるか否かを判定し、特徴的でない属性または特徴的でない属性値を示す検定結果があると判定した場合に、前記分類階層の一つ上の階層に基づいてグループ化する再グループ化ステップと、
全ての比較対象の属性または属性値の検定結果が特徴的であると判定した場合、分類階層の変更することなく、未判定の別の属性を選択し、全ての特徴的な属性のリストと検定量とを出力する出力ステップとを
含むことを特徴とするデータマイニング方法。 A data mining method for inputting data including a plurality of attributes and attribute values and an attribute to be analyzed, and outputting a list of attributes related to the attribute to be analyzed,
A storage step of storing in the storage unit a classification hierarchy that hierarchically represents the classification corresponding to the attribute;
A selection step of selecting one attribute to be compared from the data;
An extraction step of extracting the classification hierarchy corresponding to the selected attribute from the storage unit;
A grouping step of grouping attribute values corresponding to attributes of the data based on the classification of the lower hierarchy of the extracted classification hierarchy;
The analysis target attribute and the comparison target for at least one of the attribute of the analysis target and the attribute of the comparison target, or all attribute values of the attribute of the previous comparison target grouped with the analysis target attribute Or a test amount calculation step for calculating a test amount indicating the strength of the relationship between the attribute to be analyzed and the attribute value of the attribute to be compared;
The classification hierarchy is determined when it is determined whether there is a test result indicating a non-characteristic attribute or a non-characteristic attribute value by determining whether the calculated test amount exceeds a specific threshold or not. A regrouping step for grouping based on a hierarchy above
When it is determined that the test results of all the comparison target attributes or attribute values are characteristic, another undecided attribute is selected without changing the classification hierarchy, and all characteristic attribute lists and tests are performed. A data mining method comprising: an output step for outputting the quantity.
抽出ステップで、属性に対応する分類階層をいずれか一つ抽出し、
全ての比較対象の属性または前記属性の属性値の検定結果が特徴的であると判定した場合で、かつ、前記比較対象の属性に対応するその他の分類階層がある場合、未選択の分類階層を選択する再選択ステップとを含む
請求項9記載のデータマイニング方法。 In the storing step, the classification hierarchy corresponding to one attribute is stored,
In the extraction step, one of the classification hierarchies corresponding to the attribute is extracted,
When it is determined that all the attributes to be compared or the test result of the attribute value of the attribute is characteristic, and there is another classification hierarchy corresponding to the attribute to be compared, an unselected classification hierarchy is The data mining method according to claim 9, further comprising a reselecting step of selecting.
纏め上げステップで、所定の条件として、検定量順に順位づけした結果、異なる複数の属性が、所定の順位幅以内に含まれることと、所定の検定量の範囲に含まれることとの、いずれか一つまたはいずれも満たし、かつ、これらの属性が、対応する分類階層において兄弟階層であり同一の親分類を共有する場合に、前記親分類を新たな特徴的な属性として纏め上げて出力する
請求項9又は請求項10記載のデータマイニング方法。 Including a list of characteristic attributes and a test amount as input, and a step of combining attributes that satisfy a predetermined condition into one attribute,
In the summarizing step, as a predetermined condition, as a result of ranking in the order of the test amount, any of a plurality of different attributes is included within a predetermined rank range or included in a range of a predetermined test amount When one or both of them are satisfied and these attributes are sibling hierarchies in the corresponding classification hierarchy and share the same parent classification, the parent classification is collected and output as a new characteristic attribute. The data mining method according to claim 9 or claim 10.
請求項9から請求項11のうちいずれか1項に記載のデータマイニング方法。 The data mining method according to claim 9, further comprising a combination step of generating a combination of attributes to be grouped.
前記データから属性を選択し、記憶部が記憶する前記属性に対応する分類を階層的にあらわす分類階層に基づいて、選択した前記属性の属性値をグループ化するグループ化処理と、
グループ化した属性値と前記分析対象の属性との関連性の強さを示す検定量を算出する検定量算出処理と、
算出した検定量に基づいて、グループ化した前記属性値が前記分析対象の属性との関係において特徴的であるか否かを判定する判定処理とを実行させ、
前記グループ化処理で、前記判定処理において特徴的でないと判定すると、前記分類階層のうち、前回より上位の階層の分類に基づいてグループ化処理を再度実行させる
ためのデータマイニング用プログラム。 To identify attributes related to the attribute being analyzed from data containing multiple attributes and attribute values,
A grouping process for selecting an attribute from the data and grouping attribute values of the selected attribute based on a classification hierarchy that hierarchically represents a classification corresponding to the attribute stored in the storage unit;
A test amount calculation process for calculating a test amount indicating the strength of relevance between the grouped attribute value and the attribute to be analyzed;
A determination process for determining whether or not the grouped attribute values are characteristic in relation to the analysis target attribute based on the calculated verification amount;
A data mining program for causing a grouping process to be executed again based on a classification of a hierarchy higher than the previous one of the classification hierarchies when it is determined that the grouping process is not characteristic in the determination process.
グループ化処理で、全てのグループ化した属性値が分析対象の属性との関係において特徴的であると判定すると、データから他の属性を選択してグループ化処理を実行させる
請求項13記載のデータマイニング用プログラム。 On the computer,
14. The data according to claim 13, wherein when the grouping process determines that all grouped attribute values are characteristic in relation to the attribute to be analyzed, the grouping process is performed by selecting another attribute from the data. Mining program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009181900A JP2011034457A (en) | 2009-08-04 | 2009-08-04 | Data mining system, data mining method and data mining program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009181900A JP2011034457A (en) | 2009-08-04 | 2009-08-04 | Data mining system, data mining method and data mining program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011034457A true JP2011034457A (en) | 2011-02-17 |
Family
ID=43763449
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009181900A Pending JP2011034457A (en) | 2009-08-04 | 2009-08-04 | Data mining system, data mining method and data mining program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011034457A (en) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012238207A (en) * | 2011-05-12 | 2012-12-06 | Hitachi Ltd | Data analysis system and data analysis method |
JP2014026655A (en) * | 2012-07-27 | 2014-02-06 | Boeing Co | Locating relevant differentiators within associative memory |
WO2014034557A1 (en) * | 2012-08-31 | 2014-03-06 | 日本電気株式会社 | Text mining device, text mining method, and computer-readable recording medium |
WO2016013099A1 (en) * | 2014-07-25 | 2016-01-28 | 株式会社日立製作所 | Feature data management system and feature data management method |
WO2018047251A1 (en) * | 2016-09-07 | 2018-03-15 | 株式会社日立ハイテクノロジーズ | Data analysis system, data analysis terminal and data analysis method |
JP2018136887A (en) * | 2017-02-23 | 2018-08-30 | ヤフー株式会社 | Generation device, generation method, and generation program |
JP2019003344A (en) * | 2017-06-13 | 2019-01-10 | 株式会社日立製作所 | Information management apparatus, information management method, program, and information management system |
JP2019145051A (en) * | 2018-02-23 | 2019-08-29 | 株式会社日立製作所 | Information analysis system and information analysis method |
JP6810978B1 (en) * | 2020-03-16 | 2021-01-13 | 株式会社ピース企画 | Cluster generator, cluster generation method and cluster generation program |
JP6989185B1 (en) * | 2021-03-19 | 2022-01-05 | 株式会社ピース企画 | Cluster generator, cluster generator and cluster generator |
-
2009
- 2009-08-04 JP JP2009181900A patent/JP2011034457A/en active Pending
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012238207A (en) * | 2011-05-12 | 2012-12-06 | Hitachi Ltd | Data analysis system and data analysis method |
JP2014026655A (en) * | 2012-07-27 | 2014-02-06 | Boeing Co | Locating relevant differentiators within associative memory |
US10140361B2 (en) | 2012-08-31 | 2018-11-27 | Nec Corporation | Text mining device, text mining method, and computer-readable recording medium |
WO2014034557A1 (en) * | 2012-08-31 | 2014-03-06 | 日本電気株式会社 | Text mining device, text mining method, and computer-readable recording medium |
CN104603779A (en) * | 2012-08-31 | 2015-05-06 | 日本电气株式会社 | Text mining device, text mining method, and computer-readable recording medium |
JPWO2014034557A1 (en) * | 2012-08-31 | 2016-08-08 | 日本電気株式会社 | Text mining device, text mining method and program |
WO2016013099A1 (en) * | 2014-07-25 | 2016-01-28 | 株式会社日立製作所 | Feature data management system and feature data management method |
JPWO2016013099A1 (en) * | 2014-07-25 | 2017-04-27 | 株式会社日立製作所 | Feature data management system and feature data management method |
WO2018047251A1 (en) * | 2016-09-07 | 2018-03-15 | 株式会社日立ハイテクノロジーズ | Data analysis system, data analysis terminal and data analysis method |
JP2018136887A (en) * | 2017-02-23 | 2018-08-30 | ヤフー株式会社 | Generation device, generation method, and generation program |
JP2019003344A (en) * | 2017-06-13 | 2019-01-10 | 株式会社日立製作所 | Information management apparatus, information management method, program, and information management system |
JP2019145051A (en) * | 2018-02-23 | 2019-08-29 | 株式会社日立製作所 | Information analysis system and information analysis method |
JP6810978B1 (en) * | 2020-03-16 | 2021-01-13 | 株式会社ピース企画 | Cluster generator, cluster generation method and cluster generation program |
JP2021149224A (en) * | 2020-03-16 | 2021-09-27 | 株式会社ピース企画 | Cluster generation device, generation method and generation program |
JP6989185B1 (en) * | 2021-03-19 | 2022-01-05 | 株式会社ピース企画 | Cluster generator, cluster generator and cluster generator |
JP2022144373A (en) * | 2021-03-19 | 2022-10-03 | 株式会社ピース企画 | Cluster generation device, cluster generation method and cluster generation program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2011034457A (en) | Data mining system, data mining method and data mining program | |
Van Der Aalst | Process discovery from event data: Relating models and logs through abstractions | |
Verenich et al. | Complex symbolic sequence clustering and multiple classifiers for predictive process monitoring | |
US20130311242A1 (en) | Business Process Analytics | |
JP2006268529A (en) | Demand forecast system, demand forecast method, and demand forecast program for data center | |
JPWO2007132547A1 (en) | Business model generation program and business model generation method | |
Eide et al. | Human-machine networks: towards a typology and profiling framework | |
US20240104462A1 (en) | Supply chain management system and supply chain management method | |
Bernard et al. | Contextual and behavioral customer journey discovery using a genetic approach | |
Lee et al. | Approach to derive golden paths based on machine sequence patterns in multistage manufacturing process | |
JP7065718B2 (en) | Judgment support device and judgment support method | |
Syu et al. | A survey of time-aware dynamic QoS forecasting research, its future challenges and research directions | |
US20210279608A1 (en) | Prediction rationale analysis apparatus and prediction rationale analysis method | |
JP6280270B1 (en) | Internal transaction determination device, internal transaction determination method, and internal transaction determination program | |
US9443214B2 (en) | News mining for enterprise resource planning | |
Porouhan et al. | Workflow mining: Discovering process patterns & data analysis from MXML logs | |
JP7454213B2 (en) | New business proposal computer system, new business proposal computer program, new business proposal method, new business proposal device | |
Delias et al. | Business process analytics: a dedicated methodology through a case study | |
JP6472904B2 (en) | Data reference authority management device, data reference authority management method, and data reference authority management program | |
Quah et al. | Timing-of-delivery prediction model to visualize delivery trends for pos laju malaysia by machine learning techniques | |
JP2011076544A (en) | System, method, and program for supporting work procedure planning | |
Bayomie et al. | Multi-perspective process analysis: Mining the association between control flow and data objects | |
Wong et al. | The error analysis for enterprise software application using analytic hierarchy process and supervised learning: a hybrid approach on root cause analysis | |
JP2018190383A (en) | Device, method and program for determining internal transaction | |
JP7260781B2 (en) | INFORMATION PRESENTATION METHOD, INFORMATION PRESENTATION PROGRAM, AND INFORMATION PROCESSING DEVICE |