JPH08161287A - データ分析支援システム - Google Patents

データ分析支援システム

Info

Publication number
JPH08161287A
JPH08161287A JP30585294A JP30585294A JPH08161287A JP H08161287 A JPH08161287 A JP H08161287A JP 30585294 A JP30585294 A JP 30585294A JP 30585294 A JP30585294 A JP 30585294A JP H08161287 A JPH08161287 A JP H08161287A
Authority
JP
Japan
Prior art keywords
analysis
rule
data
item
items
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP30585294A
Other languages
English (en)
Inventor
Kazuhiro Kawashima
一宏 川嶋
Yoji Taniguchi
洋司 谷口
Kazuyoshi Masuda
和愛 舛田
Tsuyoshi Hamaguchi
浜口  強
Akinori Ishibashi
昭憲 石橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP30585294A priority Critical patent/JPH08161287A/ja
Publication of JPH08161287A publication Critical patent/JPH08161287A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

(57)【要約】 【目的】 データ分析の作業時間を短縮すること。 【構成】 データベースに格納される多数の項目のデー
タについて、分析対象とする項目である分析対象項目内
の分析目的のデータを基にして分析するデータ分析支援
システムであって、前記データベースの多数項目を分析
に必要とされる項目である分析項目に絞り込む分析項目
絞り込み手段と、前記分析項目絞り込み手段により絞り
込まれた分析項目のデータと分析目的データとから分析
に用いる分析用ルールを生成する分析用ルール生成出力
手段と、前記分析用ルール生成手段により生成された分
析用ルールを評価し、分析に用いる分析用ルールを選択
して出力する分析用ルール評価選択出力手段とを備え
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、複数の項目を持つデー
タベースを分析し、データベースの中に含まれるデータ
間の関係を抽出することによって、データ分析を行うデ
ータ分析支援システムに関し、特に、金融機関における
マーケティング業務、例えば、金融商品のマーケティン
グ、ダイレクトメールや電話によるセールス等のよう
に、データベースに格納された数多くの顧客属性のデー
タを分析するデータ分析支援システムに適用して有効な
技術に関するものである。
【0002】
【従来の技術】従来、データベースに格納されたデータ
を分析し、マーケティングを行うデータベースマーケテ
ィングに関しては、「荒川著:データベースマーケティ
ングの戦略と戦術、ダイヤモンド社」の116頁から1
64頁に記載されている。
【0003】それは、データベースマーケティングの展
開方法として、リレーショナルデータベース上で、表や
グラフを表示できる意思決定システムを用いることによ
り様々な角度からデータを分析するということが提案さ
れている(従来技術1とする)。
【0004】これらのデータ分析を統計解析的に実現す
る技術としては、「奥野他、多変量解析法、倍風館」に
おいて論じられている統計解析的な技術がある(従来技
術2とする)。
【0005】また、「Christopher J. Matheus, etal :
Systems for Knowledge Discoveryin databases,IEEE
Trans. on Knowledge and Data Engineering, Vol.5, N
o.6, December 1993, pp903-913」で論じられているよ
うに、データマイニング技術としてデータベースから様
々なデータ間の関係を分析用ルールを抽出することによ
って、分析を行うものがある(従来技術3とする)。
【0006】
【発明が解決しようとする課題】本発明者は、上記従来
技術を検討した結果、以下の問題点を見いだした。
【0007】前記従来技術1〜従来技術3は、金融機関
におけるマーケティング業務、例えば、金融商品のマー
ケティング、ダイレクトメールや電話によるセールス等
のように、データベースに格納された数多くの顧客属性
のデータを分析するには下記の問題点がある。
【0008】従来技術1では、どのような角度からデー
タを分析するか、どの項目を組み合わせてデータ分析を
行うかという手順が考慮されておらず、特に、新しい項
目を用いて分析を行う場合、分析者がその組み合わせを
全て分析する必要があり、数多くの項目を分析対象とし
た場合、組み合わせ爆発が起こり、手作業では分析しき
れないという問題点がある。
【0009】従来技術2では、上述の従来技術1の問題
点を解決できるが、全体の傾向を数量的に分析すること
しかできず、きめ細かくデータを分析し、顧客抽出ルー
ルを生成して分析することができないという問題点があ
る。
【0010】従来技術3では、上述の従来技術2の問題
点を解決できるが、数多くの項目のデータを格納したデ
ータベースからデータ間の関係を抽出し、数多くの顧客
抽出ルール(分析用ルール)を生成することができる
が、生成された抽出ルールのうち、どれを用いれば良い
かを検証するために多大の作業時間を要するという問題
点がある。
【0011】本発明の目的は、データ分析の作業時間を
短縮することが可能な技術を提供することにある。
【0012】本発明の前記ならびにその他の目的と新規
な特徴は、本明細書の記述及び添付図面によって明らか
になるであろう。
【0013】
【課題を解決するための手段】本願において開示される
発明のうち、代表的なものの概要を簡単に説明すれば、
下記のとおりである。
【0014】データベースに格納される多数の項目のデ
ータについて、分析対象とする項目である分析対象項目
内の分析目的のデータを基にして分析するデータ分析支
援システムであって、前記データベースの多数項目を分
析に必要とされる項目である分析項目に絞り込む分析項
目絞り込み手段と、前記分析項目絞り込み手段により絞
り込まれた分析項目のデータと分析目的データとから分
析に用いる分析用ルールを生成する分析用ルール生成出
力手段と、前記分析用ルール生成手段により生成された
分析用ルールを評価し、分析に用いる分析用ルールを選
択して出力する分析用ルール評価選択出力手段とを備え
る。
【0015】
【作用】上述した手段によれば、分析項目絞り込み手段
を備えることにより、分析用ルールを生成する前に、不
要となる項目を削除でき、分析する項目が少なくなるの
で、分析用ルール生成時間を削減することができ、分析
用ルール評価選択出力手段を設けることにより、抽出さ
れた分析用ルールの評価ができ、かつ、その評価に対す
る有効順位を出力することができ、生成された分析用ル
ールのうち、どれを用いれば良いかを検証するための作
業時間を削減することができるので、データ分析の作業
時間を短縮することが可能となる。
【0016】以下、本発明の構成について、実施例とと
もに説明する。
【0017】なお、実施例を説明するための全図におい
て、同一機能を有するものは同一符号を付け、その繰り
返しの説明は省略する。
【0018】
【実施例】以下、本発明の一実施例として、金融業にお
けるデータベースマーケティングの業務の中で、学資ロ
ーンのセールス展開を取り挙げ、図面に基づいて詳細に
説明する。
【0019】図1は、本実施例のデータ分析を支援する
データ分析支援システムの構成を説明するためのブロッ
ク図である。
【0020】図1において、100は反応データなどを
入力、データを分析、顧客抽出ルールを出力するデータ
分析支援システム、101は分析対象となる反応データ
ベース、102は分析のために顧客の属性を参照する顧
客データベース、103は顧客抽出ルールである。
【0021】本実施例のデータ分析支援システム100
は、反応データベース101および顧客データベース1
02より各項目のデータを入力する項目データ入力部1
11、各項目のデータの分散、相関係数を計算して分析
する項目を絞り込む分析項目絞り込み部112(分析項
目絞り込み手段)、絞り込まれた項目からその項目のデ
ータ間の因果関係を分析用ルール(以下、ルールと略
す)として生成するルール生成部113(分析用ルール
生成出力手段)、生成されたルールを評価し、顧客抽出
ルールを選択格納するルール評価部114(分析用ルー
ル評価選択出力手段)と、反応データベース101と顧
客データベース102から得られる対象データ121、
対象データに含まれる項目間の関係を示す項目関係デー
タ122、対象データをの項目を絞り込み、データ量が
削減されたルール生成に用いる分析データ123、デー
タ間の因果関係を生成した生成ルール124をそれぞれ
格納する格納手段と、分析データを生成するための分析
項目選択部131、ルール生成用のパラメータ(条件)
を設定するパラメータ設定部132、顧客抽出ルールを
選択するためのルール選択部133とから構成される。
【0022】前述の111から114の各部は計算機の
中央処理装置、121から124のデータ記憶部は計算
機の主記憶装置もしくは補助記憶装置、131から13
3はディスプレイやキーボードなどの計算機の入出力装
置などから実現される。
【0023】また、101から103は計算機の主記憶
装置、補助記憶装置もしくは外部記憶装置から実現され
る。
【0024】次に、本実施例のデータ分析支援システム
におけるマーケティング業務について説明する。
【0025】図2は、本実施例のマーケティング業務の
処理の流れを示すフロー図である。
【0026】本実施例で示す学資ローンのセールス展開
では、まず、顧客データベースの中から任意の顧客を抽
出し、抽出顧客に対して学資ローンの希望があるか否か
のマーケットリサーチを行い、顧客の反応データを収集
する(ステップ201)。
【0027】次に、反応データが得られた顧客の属性デ
ータを参照し、良い反応が得られた顧客属性の因果関係
を分析、その関係をルールとして生成し、その生成ルー
ルの中から、セールス活動を行う顧客を抽出する顧客抽
出ルールを選択する(ステップ202)。
【0028】そして、ルールにより、顧客データベース
からセールス活動を行う顧客を抽出し、その顧客に対し
て、訪問、電話、ダイレクトメールなどの手段によりセ
ールス活動を行う(ステップ203)。
【0029】次に、本実施例のデータ分析支援システム
の処理について説明する。
【0030】図3は、本実施例のデータ分析支援システ
ム100の処理の流れを示すフロー図である。
【0031】まず、データ分析支援システム100の項
目データ入力部111は、分析したい項目(分析対象項
目)として反応データ101の内容を入力すると、顧客
データベース102の内容を参照して、その対象となる
対象データ121を格納する(ステップ301)。
【0032】次に、分析項目絞り込み部112は、入力
した対象データの分散と相関係数を算出し、算出値や分
散図、相関図のグラフから分析項目選択部131の画面
を通して表示する。
【0033】分析項目絞り込み部112は、データの全
体から、例えば、”反応の良い”のデータを判別する判
別率が任意の値以上となる項目のカテゴリを抽出し、そ
の項目を分析データ123へ追加するとともに、分析項
目選択部131の画面より指定された項目のデータを分
析データ123への追加し、分析項目選択部131の画
面を通して削除要求の項目を入力すると、その項目を分
析する項目(分析項目)から削除し、その削除した項目
とその相関係数をデータ関連項目122として格納する
(ステップ302)。
【0034】次に、ルール生成部113は、パラメータ
設定部132の画面を通して、ルール生成のパラメータ
として、最大条件数(分析に必要とする項目の数)、生
成ルール数、処理時間を入力すると、最大条件数の範囲
で条件を組み合わせ、ルールに適合するデータの中に含
まれる”反応の良い”データの割合を濃度として計算す
る。処理時間が過ぎるとルール生成を中断し、濃度の高
いルールを生成ルール数分の生成ルール124に出力す
る(ステップ303)。
【0035】次に、ルール評価部114は、ルールの出
力順すなわち濃度が高い順にルールに適合する”反応の
良い”データの割合を累積網羅率として計算し、累積網
羅率と濃度の推移グラフをルール選択部133の画面に
表示する。
【0036】そして、ルール選択部133からルールの
表示範囲を入力すると、ルールの各条件の判別率を算
出、ルールの濃度と各条件の判別率の積算値による濃度
の予測値とを比較し、積算値が大きいルールを強調的に
表示するとともに、各ルールの条件の表示順序を制御
し、各条件の判別率の高い順に条件をルール選択部13
3の画面に表示する。ルール評価部114は、ルールの
格納要求を入力すると、顧客抽出ルール103に格納す
る(ステップ304)。
【0037】次に、前述の各データ、表示画面、判別
率、濃度、累積網羅率及び条件の判別率の積算値による
濃度の予測値について図4から図10を用いて詳細に説
明する。
【0038】図4は、本実施例の対象データを示した図
である。
【0039】図4に示す対象データは、顧客データベー
スの中から任意の顧客を抽出し、その抽出顧客に対して
学資ローンの希望があるか否かのマーケットリサーチに
より得られた顧客の反応データとその顧客の属性であ
る。
【0040】図4において、411は顧客を識別する”
CIF-NO"、412から418は顧客データベース102
のデータ、419および420は反応データベース10
1のデータである。
【0041】図5は、分析項目絞り込部112が算出し
た対象データの分散、相関係数から、分析項目選択部1
31が分析項目を選択するときの画面の例を示す図であ
る。
【0042】図5において、500は分析項目選択画
面、501はデータ選択画面のコマンドライン、502
はデータ選択画面の表示エリアである。
【0043】分析項目選択画面500のコマンドライン
501のコマンドは、処理終了511、分析データへの
保管512、データの入力513、データ項目の参照5
14、保管した分析データのルール生成実行515であ
る。
【0044】表示エリア502内は、分析対象の表示エ
リア521、分析項目選択表示エリア531、関連項目
登録エリア541、カテゴリ化エリア551からなる。
【0045】分析対象の表示エリア521は、この例で
は、分析データベースは”学資ローン.反応DB”、分
析対象項目として”反応”、そのデータ件数は全体数
が”3105”、”反応の良い”(分析目的のデータ)
のデータ件数が”264”件で平均濃度(反応のよいデ
ータ数/全体のデータ数)”8.5%”を占めているこ
とを示している。なお、分析データ作成に、”関東地
区.顧客DB”を参照していることを示す。
【0046】分析項目選択のための表示エリア531
は、反応DB、参照DBに格納されているデータ項目表
示エリア532と、分析項目及びその分散を表示する分
析項目分散表示エリア533と、関連項目と相関係数を
表示する関連項目相関係数表示エリア534とかなる。
【0047】データ項目表示エリア532では、分析に
必要な項目が指定し、追加535のコマンドボタンを選
択することにより、その指定項目を分析項目として分析
項目分散表示エリア533追加する。
【0048】分析項目分散表示エリア533は、分析項
目とその分析項目の分散の値を表示するエリアであり、
分散の値が”0”である項目は、分散がなく、顧客抽出
ルールの条件とならないので、図中の537のように色
を変えて強調的に表示し、オペレータに対して削除する
ことを要求する。
【0049】また、図中の538に示すように、指示す
ることにより、その分散に関する分散グラフが後述する
サブ画面として表示される。
【0050】そして、分析項目が指定され、削除536
のコマンドボタンが選択されると分析項目から削除す
る。
【0051】関連項目相関係数表示エリア534は、分
析項目のどれか1つが指定されると、その項目とその他
の分析項目との相関係数との表示するエリアである。
【0052】この例では、分析項目分散表示エリア53
3の538に示すように、”預金残高”が指定され、そ
の”預金残高”に対する540で指定された”定期性預
金”の相関係数を表示すると、共に、その相関に関する
相関グラフが後述するサブ画面として表示される。
【0053】相関係数が高い項目間では、どちらかの項
目を用いてルールを生成を行う(ただし、どちらの項目
を用いてルールを生成しても構わない)。
【0054】これは、相関係数が高い2つの項目とも分
析項目に導入すると、処理時間がかかるとともに、結論
として得られるルールに類似した数多くのルールが得ら
れルールを選択する際の作業時間がかかるからである。
【0055】そして、540に示すように、”定期性預
金”が指定され、削除のコマンドボタン539が選択さ
れると分析項目分散表示エリア533からその”定期性
預金”項目を削除するとともに、関連項目として削除項
目とその相関係数を項目関係データ122に格納する。
【0056】関連項目登録エリア541は、項目関係デ
ータ122に格納したデータを表示するエリアである。
この例では、”預金残高”と”定期性預金残高”との間
には強い相関があることを示している。
【0057】カテゴリ化エリア551は、分析項目のカ
テゴリを表示、入力するエリアである。この例では、預
金残高の値域をA〜Eで分割し、カテゴリ化している。
【0058】次に、前述の分散、相関のグラフを表示し
たサブ画面について説明する。
【0059】図6は、分散、相関のグラフを表示したサ
ブ画面の例を示した図である。
【0060】図6(a)は、カテゴリ化された”預金残
高”の分散を示す図である。
【0061】図6(a)に示すように、所定の条件で分
割された各カテゴリ(ここでは、Aは1000以上、B
は500〜1000、Cは100〜500、Dは50〜
100、Eは0〜50であり、オペレータが各自目的に
応じて分割する)に含まれる全体のデータ件数Tと分析
目的である”反応の良い”データ件数Rからそれぞれの
カテゴリにおける判別率を表示する。
【0062】なお、判別率Dは、D=R/Tで示す。
【0063】これは、1つの分析項目から表現されるカ
テゴリにより任意のデータが判別される割合である。
【0064】図6(b)は、分析項目”預金残高”と関
連項目”定期性預金”の分布を示したグラフであり、そ
の分析項目と関連項目の関連を確認するためのものであ
る。
【0065】図6(b)は、図5に示した分析項目分散
表示エリア533および関連項目相関係数表示エリア5
34により指定された項目の分布とその回帰直線、カテ
ゴリ化した値域に対するデータの分布を表示する。
【0066】相関が高いとして分析データから削除して
よいかを判断するためのグラフである。
【0067】本実施例では、前述したように、この図
5、図6に示した画面入力により、分析項目を絞り込
む。
【0068】図7は、分析項目絞り込み部112により
図4に示した対象データを絞り込んだ分析データ123
の例を示した図である。
【0069】図7に示す713から720は、図4に示
す413から420のデータをカテゴリ化テーブル(預
金、借入残高)730、カテゴリ化テーブル(年齢)7
40を用いてカテゴリ化したデータである。
【0070】そして、図4の”CIF-No”411は”反応
が良い顧客”の抽出条件としては不要であり、また、”
性別”412は分散がない、さらに定期性預金残高41
7は”預金残高”416と相関が高いため、図4に示し
た10項目中、7項目に絞り込まれている。
【0071】以下、本実施例では、”預金残高”と”定
期性預金残高”との相関が高いため、二つのうち”預金
残高”を選択し、それを用いてルールを生成するものと
する。
【0072】次に、絞り込まれた分析項目から生成した
ルールについて説明する。
【0073】図8は、最大条件数を3として前述した分
析データ123より、”良い反応の顧客”を抽出するル
ールを生成した例を示した図である。
【0074】図8において、801から805は、抽出
されたルールを示したものであり、例えば、ルール80
1は、”年齢が35から40、預金残高が100から5
00、応対者が女”ならば、”反応が良い”確率が”
0.3”であることを示している。
【0075】この確率を前述した判別率Dと識別するた
めに濃度Dnとする。
【0076】この濃度は、ルールの全ての条件(ここで
は、3つの分析項目)にヒットするデータのデータ数T
nに対し、そのデータに含まれる”良い反応”のデータ
のデータ件数Rnの割合であり、濃度は、Dn=Rn/
Tnで示される。
【0077】これは、複数の分析項目から表現されるカ
テゴリにより任意のデータが判別される割合である。
【0078】次に、生成されたルールの評価、選択につ
いて説明する。
【0079】図9は、生成したルールによって分析目的
が網羅される割合とそのルールの濃度の推移を示した図
である。
【0080】図9において、900はルールの網羅率と
濃度を示した画面、901はその画面900のコマンド
ライン、902はグラフ表示エリアをそれぞれ示す。
【0081】ここのグラフ表示エリアには、濃度の高い
順にルールの条件にヒットする”良い反応”が得られた
データの累積データ数の割合である累積網羅率とルール
の濃度の推移を示したグラフが表示される。
【0082】なお、累積網羅率Miとは、濃度が高いル
ール順に一番目のルールからi番目のルールまでにヒッ
トする”反応が良い”が得られたデータ件数Riにおけ
る”良い反応”が得られたデータ総数Tiに対する割合
であり、累積網羅率は、Mi=Ri/Tiで示される。
【0083】図9に示したグラフでは、一番目ルールか
ら九番目くらいにかけて累積網羅率が上昇し、また、そ
れに対して濃度は減少傾向にあることを示している。
【0084】このグラフの結果から抽出された全ルール
を評価し、ここでは、一番目ルールから九番目ルールま
での選択されたルール(選択ルール)923を検討する
ことにより、70%程の分析目的”良い反応”のデータ
を反映したルールを選択することができる。ただし、こ
こでは、70%以上を基準にルールを選択したが、必ず
しもこれに限定されない。
【0085】また、このグラフの結果において、十番目
ルール以降のルールの濃度は12%程であり、平均濃度
8.5%との差が少なく、十番目ルール以降のルールは
意味がないことを示す。
【0086】そして、このグラフにより、選択ルール9
23が選択され、出力される。
【0087】図10は、前述した選択ルール923を表
示した画面例を示した図である。
【0088】図10において、1000は選択ルール表
示画面、1001はその画面1000のコマンドライ
ン、1002は表示エリアをそれぞれ示す。
【0089】コマンドライン1001において、101
1は表示終了、1012は選択したルールの保管、10
13は図9のルール全体表示画面へ戻るコマンドを示
す。
【0090】表示エリア1002において、1021、
1022、1023は、各々選択ルールを示し、それぞ
れ1枚のカードとして表示する。
【0091】そして、それぞれのルールに含まれる条件
は判別率D1の高い順に並び変えて表示する。
【0092】さらに、各ルールにおける各分析項目の判
別率の積と濃度を比較し、その判別率の積より算出され
る後述する濃度予測値Dpより濃度の値が高いルール
は、分析目的”反応がよい”に対し、条件の組み合わせ
以上の因果関係を抽出しているものとして強調的に表示
する。ここでは、図10に示すように、ルール1022
が強調表示される。
【0093】また、ルールの条件を選択すると、その条
件が分析項目絞り込み部112により絞り込んだ項目と
関係がある場合、図10に示すように、サブ画面100
3を表示する。
【0094】前述の濃度予測値Dpは、1つのルールに
3つの条件(分析項目)が含まれる場合、各条件の判別
率をD1、D2、D3、平均濃度をHとすると、Dp=
D1*(D2/H)*(D3/H)で示される。
【0095】なお、(D2/H)、(D3/H)は条件
1に条件2、3を追加することにより濃度の増加する割
合である。
【0096】ここで、平均濃度Hは8.5%で、例え
ば、ルール1021とルール1022を見た場合、その
濃度予測値をそれぞれDp1、Dp2とし、そのそれぞ
れの濃度Dn1、Dn2を求めると、Dp1=32.3
(%)、Dn1=30(%)…(ルール1021)、D
p2=24.3(%)、Dn2=29(%)…(ルール
1022)となる。
【0097】ここで、ルール1021は濃度予測値Dp
より、ルールの濃度Dn1の値が小さいので、単に判別
率が高い条件を組み合わせたルールであることをしまし
ている。
【0098】これに対し、ルール1022は、条件ごと
の判別率の積から予測される値よりルールの濃度が大き
くなるので、個々の条件の単純な組み合わせより強い因
果関係を示しており、強調的に表示する。
【0099】したがって、本実施例のデータ分析支援シ
ステムを用いたマーケット業務において、学資ローンに
対する分析目的”反応が良い”の顧客抽出ルールとし
て、前述したように、強調表示され、かつ、濃度の値が
一番大きいルール1022(預金残高100〜500、
年齢35〜40、家族数4)を選択をする。
【0100】次に、本実施例の効果について以下に説明
する。
【0101】本実施例の分析項目絞り込み部112は分
析項目選択部131を通じて、分散のないデータ項目や
相関が高くルール生成に不要なデータ項目を削除するよ
うに動作する。これにより、ルール生成時の処理時間を
短縮できる。
【0102】本実施例で、分析を行う10項目のうち3
項目を削減することにより、ルール生成部113におい
て、条件の組み合わせは、60通り(103)から35
通り(73)となり処理時間が半分近くに削減される。
【0103】相関が高い項目をルール生成に用いないこ
とにより、生成ルールに”定期性預金残高”を条件とす
るルールを出力しないので、ルールの数が減少し、顧客
抽出ルールとして使用するルールの選択時間が削減でき
る。
【0104】相関が高い項目についてはルール評価部1
14がルール選択部133を通じて表示するように動作
するので、生成されたルールの条件を変更することが容
易である。
【0105】本実施例では、”預金残高”を用いてルー
ルを生成してきたが、”定期性預金残高”を条件とした
方が顧客抽出上に都合が良ければ、その条件へ変更する
ことが容易にできる。
【0106】本実施例の分析項目絞り込み部112は、
分析項目選択部131を通じて、1項目ごとの分散のグ
ラフ、相関の高い項目間の相関図を表示するように動作
するので、それらの関係を確認しながら、ルール生成に
使用する項目を決定するように動作する。これにより、
分析項目選択の試行錯誤を少なくすることができ、顧客
抽出ルールを作成する作業時間を削減できる。
【0107】本実施例のルール評価部114は、ルール
選択部133を通じて、生成ルールの全体像を示す累積
網羅率や濃度の推移を表示するので、生成ルールの全体
像を容易に把握し、生成ルールの中で、検討すべきルー
ルの選択を容易に行うことができ、顧客抽出ルールの選
択に要する作業時間を大幅に削減することができる。
【0108】各ルールの条件の表示順序を制御すること
により、ルール間の違いを容易に認識することができ
る。
【0109】この例として、図8に示したルール801
とルール802の違いの発見を取り挙げると、その違い
の発見には各条件のパターンマッチングが必要である
が、図10に示したルール1021とルール1022で
は、条件の表示順序が制御されているために、条件の違
い、”応対者性別が女である”と”家族数が4である”
が、容易に発見できる。
【0110】これにより、顧客抽出ルールとして使用す
るルールの選択作業時間を大幅に短縮できる。また、ル
ール評価部114は、ルール選択部133を通じて、単
一の条件の判別率の組み合わせにより予測される予測濃
度よりも高い濃度を示すルールを強調的に表示するの
で、複数の条件の組み合わせにより濃度が高くなったル
ールの選択が容易である。これにより、ヒット率が高い
顧客抽出ルールの選択、特に条件の組み合わせによりヒ
ット率が高くなる顧客抽出ルールの選択作業時間を短縮
することができる。
【0111】以上、本発明者によってなされた発明を、
前記実施例に基づき具体的に説明したが、本発明は、前
記実施例に限定されるものではなく、その要旨を逸脱し
ない範囲において種々変更可能であることは勿論であ
る。
【0112】
【発明の効果】本願において開示される発明のうち代表
的なものによって得られる効果を簡単に説明すれば、下
記のとおりである。
【0113】ルールを生成する前に、不要となる項目を
削除でき、分析する項目が少なくなるので、ルール生成
時間を削減することができ、かつ、抽出されたルールの
評価ができ、その評価に対する有効順位を出力すること
ができるので、生成されたルールのうち、どれを用いれ
ば良いかを検証するための作業時間を削減することがで
きるので、データ分析の作業時間を短縮することが可能
となる。
【図面の簡単な説明】
【図1】本発明の一実施例であるデータ分析を支援する
データ分析支援システムの構成を説明するためのブロッ
ク図である。
【図2】本実施例のマーケティング業務の処理の流れを
示すフロー図である。
【図3】本実施例のデータ分析支援システムの処理の流
れを示すフロー図である。
【図4】本実施例の対象データを示した図である。
【図5】本実施例の分析項目絞り込み部が算出した対象
データの分散、相関係数を表示した例を示した図であ
る。
【図6】本実施例のカテゴリ化した項目の分散の様子と
項目間の相関を示す画面の例を示した図である。
【図7】本実施例の分析項目絞り込み部により図4に示
した対象データを絞り込んだ分析データの例を示した図
である。
【図8】本実施例の分析データより、最大条件数を3と
して、分析目的を抽出するルールを生成した例を示した
図である。
【図9】本実施例における生成したルールによって分析
目的が網羅される割合とそのルールの濃度の推移を示し
た図である。
【図10】本実施例の選択ルールを表示した画面例を示
した図である。
【符号の説明】
101…反応データベース、102…顧客データベー
ス、103…顧客抽出ルール、111…項目データ入力
部、112…分析項目絞り込み部、113…ルール生成
部、114…ルール評価部、121…対象データ、12
2…項目関係データ、123…分析データ、124…生
成ルール、131…分析項目選択部、132…パラメー
タ設定部、133…ルール選択部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 浜口 強 神奈川県川崎市幸区鹿島田890番地の12 株式会社日立製作所情報システム事業部内 (72)発明者 石橋 昭憲 神奈川県川崎市幸区鹿島田890番地の12 株式会社日立製作所情報システム事業部内

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 データベースに格納される多数の項目の
    データについて、分析対象とする項目である分析対象項
    目内の分析目的のデータを基にして分析するデータ分析
    支援システムであって、 前記データベースの多数項目を分析に必要とされる項目
    である分析項目に絞り込む分析項目絞り込み手段と、 前記分析項目絞り込み手段により絞り込まれた分析項目
    のデータと分析目的データとから分析に用いる分析用ル
    ールを生成する分析用ルール生成出力手段と、 前記分析用ルール生成手段により生成された分析用ルー
    ルを評価し、分析に用いる分析用ルールを選択して出力
    する分析用ルール評価選択出力手段とを備えたデータ分
    析支援システム。
  2. 【請求項2】 前記請求項1に記載のデータ分析支援シ
    ステムにおいて、 前記分析項目絞り込み手段は、データベースの各項目内
    のデータを所定の条件でカテゴリ分割する手段と、 そのカテゴリ分割された各項目毎の分析目的のデータの
    分散と相関係数を計算する分散相関算出手段と、 前記分散相関算出手段の結果より分散のない項目を削除
    する手段と、 前記分散相関算出手段の結果より相関係数が所定値より
    高い項目が複数個ある場合は、そのいずれか一方の項目
    のみを分析項目の対象として選択する手段とを備えたこ
    とを特徴とするデータ分析支援システム。
  3. 【請求項3】 前記請求項1に記載のデータ分析支援シ
    ステムにおいて、 前記分析用ルール生成出力手段は、分析用ルールの生成
    条件の設定手段と、 前記生成条件を基に分析項目のデータの組み合わせで複
    数個の分析用ルールを生成する生成手段と、 生成された前記分析用ルールにヒットする分析対象項目
    の全データ数に含まれる分析目的のデータの割合である
    濃度を前記分析用ルール毎に算出する濃度算出手段と、 その濃度の値が高い順序に前記分析用ルールを出力する
    濃度順序出力手段とを備え、 前記分析用ルール評価選択出力手段は、前記分析対象項
    目の全データ数に対する前記複数個の分析用ルールにヒ
    ットする分析目的の全データ数の割合である累積網羅率
    を算出する累積網羅率算出手段と、 前記濃度算出手段で算出された濃度と前記累積網羅率と
    の関係から分析用ルールの表示範囲を設定する手段と、 前記分析用ルール内の各々の分析項目毎にヒットする分
    析対象項目の全データ数に対する分析目的のデータ数の
    割合である判別率をそれぞれ算出する判別率算出手段
    と、 前記判別率算出手段で算出された各分析項目の判別率を
    積算して分析用ルールの濃度の予測値を算出する判別率
    濃度算出手段と、 前記濃度算出手段で算出された濃度が、前記判別率濃度
    算出手段により算出された濃度予測値より大きい分析用
    ルールを強調して出力する手段を備えたことを特徴とす
    る分析データ支援システム。
JP30585294A 1994-12-09 1994-12-09 データ分析支援システム Pending JPH08161287A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30585294A JPH08161287A (ja) 1994-12-09 1994-12-09 データ分析支援システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30585294A JPH08161287A (ja) 1994-12-09 1994-12-09 データ分析支援システム

Publications (1)

Publication Number Publication Date
JPH08161287A true JPH08161287A (ja) 1996-06-21

Family

ID=17950143

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30585294A Pending JPH08161287A (ja) 1994-12-09 1994-12-09 データ分析支援システム

Country Status (1)

Country Link
JP (1) JPH08161287A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1040261A (ja) * 1996-07-25 1998-02-13 Nippon Telegr & Teleph Corp <Ntt> 図形定義生成方法およびその装置
JP2001022851A (ja) * 1999-07-09 2001-01-26 Hitachi Ltd スコアリング方法およびシステム
US6226634B1 (en) 1997-04-18 2001-05-01 Fujitsu Limited Association rule generation and group-by processing system
JP2006338265A (ja) * 2005-06-01 2006-12-14 Fujitsu Ltd データ解析方法およびデータ解析プログラム
JP2006350398A (ja) * 2005-06-13 2006-12-28 Hitachi Ltd データ解析装置及びデータ解析方法
JP2010205077A (ja) * 2009-03-04 2010-09-16 Mitsubishi Electric Corp データ統合装置及びデータ統合プログラム及び記録媒体
JP2013168037A (ja) * 2012-02-15 2013-08-29 Reasonwhy Inc レセプト分析装置及びレセプト分析プログラム
JP2015060259A (ja) * 2013-09-17 2015-03-30 株式会社日立製作所 データ分析支援システム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1040261A (ja) * 1996-07-25 1998-02-13 Nippon Telegr & Teleph Corp <Ntt> 図形定義生成方法およびその装置
US6226634B1 (en) 1997-04-18 2001-05-01 Fujitsu Limited Association rule generation and group-by processing system
JP2001022851A (ja) * 1999-07-09 2001-01-26 Hitachi Ltd スコアリング方法およびシステム
JP2006338265A (ja) * 2005-06-01 2006-12-14 Fujitsu Ltd データ解析方法およびデータ解析プログラム
JP2006350398A (ja) * 2005-06-13 2006-12-28 Hitachi Ltd データ解析装置及びデータ解析方法
JP2010205077A (ja) * 2009-03-04 2010-09-16 Mitsubishi Electric Corp データ統合装置及びデータ統合プログラム及び記録媒体
JP2013168037A (ja) * 2012-02-15 2013-08-29 Reasonwhy Inc レセプト分析装置及びレセプト分析プログラム
JP2015060259A (ja) * 2013-09-17 2015-03-30 株式会社日立製作所 データ分析支援システム

Similar Documents

Publication Publication Date Title
US10977435B2 (en) Method, apparatus, and computer-readable medium for visualizing relationships between pairs of columns
JP3049636B2 (ja) データ分析方法
US8554742B2 (en) System and process for record duplication analysis
US20110076663A1 (en) Systems and methods for selecting survey questions and available responses
US20080195643A1 (en) Graphical Database Interaction System and Method
US20020103695A1 (en) Methods and apparatus for gauging group choices
JP2002092305A (ja) スコア算出方法及びスコア提供方法
JP2002157380A (ja) 企業研修企画方法及び企業研修情報取得方法
WO2020029386A1 (zh) 资产配置方法、系统、计算机设备和存储介质
US20050021286A1 (en) Methods and structure for improved interactive statistical analysis
JPH08161287A (ja) データ分析支援システム
Katsaras et al. Data mining: a segmentation analysis of US grocery shoppers
JP2008117127A (ja) 業務プロセスにおける業務効率低下の原因侯補を抽出する方法、その装置およびプログラム
JP2001076057A (ja) ポートフォリオ最適化方法及びポートフォリオ最適化処理システム
JP2000293092A (ja) シミュレーションシステム
JP2000132558A (ja) 分類ルール探求式クラスター分析装置
JP2004220236A (ja) データ分析方法、装置、プログラム及び該プログラムを記録した記録媒体
JP2003323601A (ja) 信頼性尺度付き予測装置
JP3293582B2 (ja) データ分類装置、データ分類方法およびデータ分類用プログラムを記録した記録媒体
US20040054620A1 (en) Method and apparatus for calculating prepayment factor score
Eason The manager as a computer user
Kabassi et al. Evaluating Websites of Conservation Labs in Museums using Fuzzy Multi-Criteria Decision Making theories
US6907415B2 (en) Finding rules and exceptions from databases
Aydin et al. Multi-channel fuzzy queuing systems and membership functions of related fuzzy services and fuzzy inter-arrival times
US20210358267A1 (en) Operation system based on membership level and method thereof