JP3815218B2 - データ分析方法及び装置 - Google Patents

データ分析方法及び装置 Download PDF

Info

Publication number
JP3815218B2
JP3815218B2 JP2000391834A JP2000391834A JP3815218B2 JP 3815218 B2 JP3815218 B2 JP 3815218B2 JP 2000391834 A JP2000391834 A JP 2000391834A JP 2000391834 A JP2000391834 A JP 2000391834A JP 3815218 B2 JP3815218 B2 JP 3815218B2
Authority
JP
Japan
Prior art keywords
data
inference
value
item
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000391834A
Other languages
English (en)
Other versions
JP2002189597A (ja
Inventor
仁史 芦田
豊久 森田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2000391834A priority Critical patent/JP3815218B2/ja
Priority to US09/994,951 priority patent/US6892208B2/en
Priority to US10/016,193 priority patent/US6877012B2/en
Publication of JP2002189597A publication Critical patent/JP2002189597A/ja
Application granted granted Critical
Publication of JP3815218B2 publication Critical patent/JP3815218B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、データの分析技術に関する。
【0002】
【従来の技術】
近年、コンピュータ機器と、磁気カード、ICカードが一般社会に普及し、百貨店、専門店、家電量販店、スーパーマーケットなど、幅広い業種において、ハウスカードにより、氏名、住所などの顧客の属性データや、購買履歴を蓄積、管理するデータベースの構築が可能になった。金融業界においても取引のトランザクションがデータベース化されている。通信業界においては、CDR(Call Detail Data)と呼ばれる通話履歴データが蓄積されている。これは、通話ごとに、発信者番号、着信者番号、通話時間などが記録されている。
【0003】
このような環境下で、顧客の属性情報と、購買履歴、取引履歴、通話履歴などを活用し、顧客毎にきめ細かなサービスを提供する手法として、CRM(Customer Relationship Management)と呼ばれる手法が注目されている。
【0004】
大量のデータを分析し、半自動的に知識を抽出する技術として、データマイニングと呼ばれる技術が知られている。これにはルールインダクション、MBR(Memory Based Reasoning)、OLAP(On Line Analytical Processing)など種々の方法があるが、文献「Data Mining Techniques For Marketing, Sales, and Customer Support (John Wiley & Sons, Inc. 1997)」(p.120-123) に説明されている。
【0005】
ルールインダクションは、データに潜む特徴を「If…then〜」などのルール形式で抽出する。「Proceedings of 1999 IEEE International Conference on Systems, Man, and Cybernetics」(p.V-882-886)に詳細なアルゴリズムも記載されている。(従来技術1)
MBRについては、上記文献「Data Mining Techniques For Marketing, Sales, and Customer Support」(p.120)に記載されているように、既知の事例の中から未知の事例の近隣の事例を選択し、その値を用いて未知の事例の値の予測やクラシフィケーションをおこなう手法である。(従来技術2)
OLAPについては、上記文献「Data Mining Techniques For Marketing, Sales, and Customer Support」(p.123)に記載されている通り、データに潜む重要なパターンを、多次元データベースを用いて表示する方法である。(従来技術3)
上記、従来技術1と3を併用することにより、MBRの推論精度を向上する手法については、「Proceedings of INFORMS-KORMS SEOUL 2000」「CUSTOMER RELATIONSHIP MANAGEMENT THROUGH DATA MINING」(p.1956-1963)に記載されている。(従来技術4)
【0006】
【発明が解決しようとする課題】
上記従来技術1および2を融合した従来技術4は、ルールに基づく特定のセグメントに関して、推論を実行できるが、ユーザの知見や状況に基づき条件を追加、削除することはできない。また、条件を追加、削除した場合にセグメントに含まれる顧客数など、セグメントの特性を確認することもできない。
【0007】
上記従来技術の問題点に鑑み、本発明は、ルールに基づく特定のセグメントに関して、ユーザが知見と状況に基づき条件を追加、削除した場合のセグメントの特性を確認した上で、推論モデルを構築し、推論を実行することを第1の目的とする。
【0008】
さらに、推論結果にユーザが設定した条件を併記することを第2の目的とする。
【0009】
【課題を解決するための手段】
記憶装置に格納されたデータから生成した多次元データベースについて、クロス表のセルの指定を受け付け、推論対象セグメントに対応する If-then 形式のルールにおける条件を決定し、この条件を満たすデータから推論モデルを生成し、推論を行う。
【0010】
上記第2の目的を達成するため、本発明のデータ分析方法では、推論対象セグメント選択処理において選択したセグメント情報を、推論結果表示処理において、推論結果と合わせて表示する。
【0011】
【発明の実施の形態】
図面を用いて本発明の実施の形態について説明する。この実施形態を構成する処理と、これらの間のデータの流れを図1に示す。
【0012】
本実施形態は、顧客データ101とデータ定義情報102を入力とし、特徴ルールセット104を出力する特徴ルール生成処理103と、該特徴ルールセット104とユーザ105からの情報と該顧客データ101と該データ定義情報を入力とし、推論対象顧客リスト107と推論対象セグメント108を出力する推論対象セグメント選抜処理106と、該推論対象セグメント108と顧客データ101とデータ定義情報102を入力とし、推論モデル110を出力する推論モデル生成処理109と、該推論対象顧客リスト107と該推論モデル110を入力とし、推論結果112を出力する推論処理111から構成される。
【0013】
以下、各処理について詳しく説明する。
【0014】
まず、特徴ルール生成処理103について説明する。特徴ルール生成処理103は、2つ以上の項目を持つ1つ以上のレコードの集合である顧客データ101の特徴を「If…then〜」などのルールの形で抽出する。図2に顧客データ101の例を示す。図2に示す通り、顧客データは月ごとに用意されている。そして、各月のデータにおいて、1行目が項目名を表し、2行目以降、各レコードが1人の顧客に対応する。3月のデータにおいて、解約顧客は、3月末日時点での値を示す。すなわち、顧客ID=00002 の顧客は、3月1日から3月末日までの間に解約したことを示す。また、3月のデータにおいて、性別、年齢、収益額などの契約状態以外の項目は、2ヶ月前の1月末日時点の値である。4月のデータにおいても同様に、契約状態は4月末日時点の値であるが、契約状態以外の項目は、2月末日時点の値である。また、顧客ID=00002のレコードのように、3月の解約顧客のレコードは、4月のデータには含まれるが、5月以降のデータには含まれない。4月1日時点では、3月のデータまでは、全ての項目に値が入っているが、4月のデータには、解約顧客の項目に値が入らず、その他の項目には全て値が入る。ただし、データに欠損値がある場合には、その限りではない。4月1日時点では、6月以降のデータも作成できない。以降の説明も、4月1日と仮定して進める。
【0015】
図3は、特徴ルール生成や、推論対象セグメント選抜を実行するためのデータ定義情報102の例である。データ定義情報102は、ルール生成利用項目と階層構造から構成される。ルール生成利用項目は、条件項目と結論項目から成る。特徴ルール生成処理103において、条件項目は、「If…then〜」形式のルールのIf部の候補となり、結論項目はthen部に利用される。ルール生成手法については、従来技術として前述した文献「Proceedings of 1999 IEEE International Conference on Systems, Man, and Cybernetics」(p.V-882-886)に述べられている。本文献のアルゴリズムに従い、顧客データ101の3月のデータを用いて、特徴ルール生成処理103を実行したものとする。
【0016】
図4に、特徴ルールセット104の例を示す。図4の例では、1行目が項目を表し、2行目以降は、それぞれ1つのルールを表す。ルール文とは、「If…then〜」形式でルールを表記したものであり、ルール/条件とは、ルールを満たすレコード数/条件部を満たすレコード数を表す。精度とは、ルールを満たすレコード数の条件部を満たすレコード数に対する比率を%表示したものである。
【0017】
次に推論対象セグメント選抜処理106について説明する。推論対象セグメント選抜処理106では、データ定義情報102を基に、多次元データベースの構造を決する。データ定義情報102における条件項目が、多次元データベースにおけるキー次元に対応し、結論項目が分析次元に対応する。構造が決定すると、顧客データ101をロードし、多次元データベースを構築する。
【0018】
そして、ユーザ105が、特徴ルールセット104の中から選択した1つのルールの条件項目をカラムとロー、結論項目に関連する項目をセルの値として表示画面を作成する。
【0019】
図5に、図4に示すNo.1のルール「IF 年齢=20〜24 & 性別=女性 then 契約状態=解約」が選択された場合の、多次元データベースの表示例を示す。図5において、ルールの条件項目である年齢と性別が、それぞれローとカラムに設定されている。そして、ルールの結論項目である契約状態から算出される解約率が、各セルに表示されている。ここで、各セルの解約率とは、各セルに含まれる解約した顧客数の、各セルに含まれる全顧客数に対する割合を%表示したものである。各値は多次元データベース上で自動的に算出される。図5において、ルールの条件に該当するセルは、色が反転しており、一目で識別できるようになっている。また、ルールに現れなかった条件項目は、多次元データベースのページとして表示されている。
【0020】
図5において、ユーザは、ルールが指し示すセルの値を、周辺のセルの値と比較することにより、ルールの優位性を把握できる。また、ドリルアップ、ドリルダウン、スライス、ダイスといった多次元データベースの機能により、ユーザは状況や知見に基づき、或いは試行錯誤により条件を追加・削除した場合の、セルの値と変化を確認し、推論モデルを構築し、推論を実行すべきセグメントを選別できる。
【0021】
図6は、収益額のページをドリルダウンし、収益額=3-4万円のスライスを選択した例である。ユーザが、収益額=3-4万円の顧客に対する施策を検討している場合、このように条件を追加できる。ユーザは、条件を追加した場合の、着目しているセルと周辺のセルの値の変化を確認できる。この例の場合、着目しているセルの解約率は、27%から24%に減少している。しかし、同年齢層(20〜24歳)の男性の解約率は16%であり、女性の25〜34歳の解約率は9%であり、依然着目しているセルの解約率が突出している。また、この画面上で、分析項目を解約顧客数に変更すれば、各セルに含まれる解約顧客数が表示され。同様に分析項目を顧客数に変更すれば、各セルに含まれる顧客数が表示される。すなわち、セルごとの解約率とセルに含まれる顧客の規模を確認することにより、推論モデルを構築し、予測するに値するセグメントか否か判断できる。
【0022】
ユーザは以上のように、着目するセルに状況や知見に基づき条件を追加・削除し、着目するセルと周辺のセルの値を確認した上で、着目するセルを決定できる。
【0023】
ユーザが「収益額=3-4万円」といった条件を追加したものとして、以下説明する。設定した条件は、「年齢=20〜24 & 性別=女性 & 収益額=3-4万円」となり、これが推論対象セグメント108となる。推論のターゲットとするセルを決定すると、マウスなどのポインティングデバイスにより選択し、右クリックなどで、図6に示すような機能ボタンのリストを表示する。
【0024】
マウスなどのポインティングデバイスの左クリックなどにより、これらの機能を順次選択する。推論対象顧客リスト生成を選択すると、顧客データ101の中から、5月のデータ、すなわちルール生成に利用したデータの2ヶ月後のデータから、推論対象セグメント108の条件を満たすレコードを抽出し、推論対象顧客リスト107とする。推論対象顧客リスト107のフォーマットは、顧客データ101のフォーマットと同等である。
【0025】
推論モデル生成の機能ボタンを選択すると、推論モデル生成処理109が実行される。推論モデル生成処理109について説明する。推論モデル生成処理109は、ユーザ105が、推論対象セグメント選抜処理106において選択した条件に対して最適な推論モデルを自動的に生成する。
【0026】
図7に推論モデル生成処理109のフローチャートを示す。図7において、モデル生成用データ抽出処理701は、顧客データ101の中から、データ定義情報102に指定された月のデータを選択し、さらに、推論対象セグメント108の条件を満たすレコードのみ抽出する。
【0027】
データ分割処理702は、モデル生成用データ抽出処理701において抽出されたレコードを、候補モデル用データと検証用データの2つに分割する。例えば、ランダムサンプリングにより6割のデータを抽出してモデル用データとし、残りの4割のデータを検証用データとする。
【0028】
推論候補モデル生成処理703は、データ定義情報102の条件項目の中から、網羅的に条件の組合せを生成する。例えば、(性別,年齢)、(性別、収益額)、(性別、年齢、収益額)などである。これらの各組合せを入力、データ定義情報102の結論項目を出力とする推論候補モデルが生成される。
【0029】
モデル生成判別処理704は、推論候補モデル生成処理703で生成した全ての推論候補モデルについて、検証処理706が実行されたか判別する。全ての推論候補モデルについて検証処理706が実行されている場合には、モデル選択処理707を実行する。未だ検証処理706が終了していない推論候補モデルが残っている場合には、候補モデル選択処理70を実行する。
【0030】
候補モデル選択処理705は、推論候補モデルの中から、未だ検証処理が実行されていないモデルを1つ選択する。
【0031】
検証処理706は、データ分割処理702において生成されたモデル用データの中から、候補モデル選択処理705にて選択されたモデルの項目のみ抽出し、MBRモデルを構成する。次にデータ分割処理702において生成された検証用データの各レコードについて、推論を実行する。図8に示すような例の場合、推論対象データの近傍の4レコードのうち、3つのレコードは解約顧客=1、1つのレコードは解約顧客=0であるから、推論対象データの解約可能性は、(1+1+1+0)/4=0.75 となる。同様にして、全ての検証用データについて解約可能性を推論する。そして、検証用データの実際の解約顧客項目の値との差の2乗和を計算し、各モデルの評価値とする。
【0032】
モデル選択処理707においては、検証処理706で算出された各モデルの評価値が最小のものを選択する。図9に、選択された推論モデル110の例を示す。図9において、利用データは、推論に利用するデータである。推論利用項目は、利用データの中で、推論に利用する条件項目と結論項目である。セグメント条件は、この推論モデルが対象とするレコードが満たすべき条件である。
【0033】
図6における推論実行の機能ボタンをクリックすると、推論処理111が実行される。推論処理111は、推論モデル110を用いて、推論対象顧客リスト107に対する推論を実行し、推論結果112を出力する。推論のアルゴリズムは、検証処理706において解約可能性を計算した方法と同様である。また、図6において、推論対象顧客リスト生成と推論モデル生成のボタンをクリックし、推論対象顧客リスト生成と推論モデル生成が正常に終了するまでは、推論実行ボタンは不活性となっており、実行できない。
【0034】
図10に、推論結果112の例を示す。図10に示す通り、推論結果には、顧客IDのような顧客を特定する項目と、解約顧客のような、推論値を示す項目と、選抜条件のような、推論モデルのセグメント条件を示す項目が含まれる。これは、推論モデル110に記載されているセグメント条件の値を代入する。その他、年齢、収益額のような、推論対象顧客リスト中の顧客属性項目を含めることも可能である。
【0035】
本発明は、次のように変更して実施することも可能である。
【0036】
第1に、ユーザ105が、推論対象セグメント選抜処理106を実行する度に推論処理111を実行するのではなく、1つ以上の推論対象セグメントを選択した後で、まとめて推論処理111を実行する。この実施形態を構成する処理と、これらの間のデータの流れを図11に示す。
【0037】
図11において、推論対象顧客リスト107には、ユーザが選択した複数の推論対象セグメントのいずれかに含まれる顧客が全て含まれている。データ定義情報102で指定されるルール生成利用項目は全て含まれる。
【0038】
推論モデル選択処理1101は、推論対象顧客リスト107の中から順次レコードを1つづつ選択し、各レコードに対して、推論モデルセット1102の中から、推論モデルを1つづつ選択する。ここで、推論モデルセット1102とは、推論対象セグメント108毎に予め生成された1つ以上の推論モデル110の集合である。推論モデル選択処理1101は、選択したレコードが、各推論モデルのセグメント条件を満たすか否か検証し、条件を満たすモデルが見つかれば、レコードとモデルを推論処理111に入力し、推論結果112を出力する。推論結果112のフォーマットは、図10に示したものと同じであるが、レコード毎に選抜条件が異なる場合がある。
【0039】
第2に、図6における推論対象顧客リスト生成ボタンと推論モデル生成ボタンと推論実行ボタンを、推論実行ボタン1つとし、推論実行ボタンをクリックすれば、前記推論対象顧客リストを生成する処理と、前記推論モデル生成処理と、前記推論処理を自動的に順次実行するように変更することも可能である。
【0040】
【発明の効果】
本発明によれば、セグメントの特性を確認した上で、着目するセグメントを決定し、決定したセグメントに対する推論モデルを構築できる。
【0041】
また別には、推論結果にユーザが設定した条件を併記することにより、ユーザや推論結果の利用者は、リストにそのデータが含まれる理由を理解し、リストを用いた施策を考えられる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態を構成する処理と、これらの間のデータの流れを示す図である。
【図2】処理の対象となる顧客データの例である。
【図3】データ定義情報の例である。
【図4】特徴ルールセットの例である。
【図5】多次元データベースの表示例である。
【図6】多次元データベース上で条件を追加し、機能ボタンのリストを表示した例である。
【図7】推論モデル生成処理のフローチャートである。
【図8】 MBRの推論方法を説明するための例である。
【図9】推論モデルの例である。
【図10】推論結果の例である。
【図11】変更例を構成する処理と、これらの間のデータの流れを示す図である。
【符号の説明】
101…顧客データ、102…データ定義情報、103…特徴ルール生成処理、104…特徴ルールセット、105…ユーザ、106…推論対象セグメント選抜処理、107…推論対象顧客リスト、108…推論対象セグメント、109…推論モデル生成処理、110…推論モデル、111…推論処理、112…推論結果、701…モデル生成用データ抽出処理、702…データ分割処理、703…推論候補モデル生成処理、704…モデル生成判別処理、705…候補モデル選択処理、706…検証処理、707…モデル選択処理、1101…推論モデル選択処理、1102…推論モデルセット。

Claims (10)

  1. コンピュータによるデータ分析方法であって、
    前記コンピュータの処理部が、
    記憶装置に格納された第1のデータから、条件項目の値と結論項目の値との組み合わせにより複数のIf-then形式のルールを作成し、前記複数のIf-then形式のルールの条件項目を表示軸とし、前記If-then 形式のルールの結論項目を分析軸とする多次元データベースを生成し、
    ユーザインターフェースを介して、前記表示軸の条件項目の値の選択を受け付け、
    前記選択に応じて、前記多次元データベースのクロス表のセルの値を、前記第1のデータに基づき算出した、前記選択された条件項目の値に対応するIf-then 形式のルールを満たす割合を示す情報に変更し、
    前記ユーザインターフェースを介して、該クロスのセルの指定を受け付け、
    指定された前記セルを推論対象セグメントとして決定し、前記セルに対応する表示軸の条件項目の値を前記推論対象セグメントに対応する前記条件項目の値として取得し、該取得した条件項目の値から前記推論対象セグメントに対応するIf-then形式のルールにおける条件を決定し、
    前記決定した条件を満たすデータを前記記憶装置に格納された前記第1のデータから抽出し、該抽出したデータに対する推論モデルを生成し、
    前記決定した条件を満たすデータを前記記憶装置に格納された前記第1のデータとは異なる第2のデータから推論対象データとして抽出し、該推論対象データに対して、前記推論モデルを用いて推論処理を行い、前記結論項目を満たす割合を有する推論結果を出力する
    ことを特徴とするコンピュータによるデータ分析方法。
  2. 請求項1記載のコンピュータによるデータ分析方法であって、
    前記If-then 形式のルールを満たす割合を示す情報は、If-then形式のルールの条件項目の値及び結論項目の値を満たすレコード数の、条件項目の値のみをたすレコード数に対する割合を示す情報である
    ことを特徴とするコンピュータによるデータ分析方法。
  3. 請求項1または2記載のコンピュータによるデータ分析方法であって、
    前記ユーザインターフェースは、ポインティングデバイスを含み、
    前記表示軸の条件項目の値の選択は、プルダウンメニューの中の所定の条件項目の値のセットのうち、前記ポインティングデバイスによる1の条件項目の値の選択により得られたものであることを特徴とするコンピュータによるデータ分析方法。
  4. 請求項1乃至3のいずれか1に記載のコンピュータによるデータ分析方法であって、
    前記セルの指定の受け付けは、複数のセルの指定の受け付けであり、
    指定された前記複数のセルのそれぞれを推論対象セグメントとして決定し、前記複数の推論対象セグメントのそれぞれに対し推論モデルを生成し、
    前記複数の推論対象セグメントのうちの1の推論対象セグメントから前記条件を決定し、
    前記決定した条件を満たすデータを前記記憶装置に格納された前記第1のデータとは異なる第2のデータから推論対象データとして抽出し、該推論対象データに対して、前記推論モデルを用いて推論処理を行い、前記結論項目を満たす割合を有する推論結果を出力する
    ことを特徴とするコンピュータによるデータ分析方法。
  5. 請求項1乃至4のいずれか1に記載のコンピュータによるデータ分析方法であって、
    前記推論モデルはMBR(Memory Based Reasoning)におけるMBR推論モデルであり、前記推論処理はMBRによる推論処理であることを特徴とするコンピュータによるデータ分析方法。
  6. 請求項1乃至5のいずれか1に記載のコンピュータによるデータ分析方法であって、
    前記データは、所定の予約サービスを管理する顧客データであり、前記結論項目を満たす割合は、前記所定の予約サービスの解約見込みであることを特徴とするコンピュータによるデータ分析方法。
  7. データ分析装置であって、
    記憶装置に格納された第1のデータから、条件項目の値と結論項目の値との組み合わせにより複数のIf-then形式のルールを作成し、前記複数のIf-then形式のルールの条件項目を表示軸とし、前記ルールの結論項目を分析軸とする多次元データベースを生成し、
    ユーザインターフェースによる前記表示軸の条件項目の値の選択に応じて、前記多次元データベースのクロス表のセルの値を、前記第1のデータに基づき算出した、前記選択された条件項目の値に対応するIf-then 形式のルールを満たす割合を示す情報に変更し、
    前記ユーザインタフェースにより指定された前記クロスのセルを推論対象セグメントとして決定し、前記セルに対応する表示軸の条件項目の値を前記推論対象セグメントに対応する前記条件項目の値として取得し、該取得した条件項目の値から前記推論対象セグメントに対応するIf-then形式のルールにおける条件を決定し、
    前記決定した条件を満たすデータを前記記憶装置に格納された前記第1のデータから抽出し、該抽出したデータに対する推論モデルを生成し、
    前記決定した条件を満たすデータを前記記憶装置に格納された前記第1のデータとは異なる第2のデータから推論対象データとして抽出し、該推論対象データに対して、前記推論モデルを用いて推論処理を行い、前記結論項目を満たす割合を有する推論結果を出力する
    処理部を有することを特徴とするデータ分析装置。
  8. 請求項7記載のデータ分析装置であって、
    前記If-then 形式のルールを満たす割合を示す情報は、If-then形式のルールの条件項目の値及び結論項目の値を満たすレコード数の、条件項目の値のみをたすレコード数に対する割合を示す情報である
    ことを特徴とするデータ分析装置。
  9. 請求項7または8に記載のデータ分析装置であって、
    前記推論モデルはMBR(Memory Based Reasoning)におけるMBR推論モデルであり、前記推論処理はMBRによる推論処理であることを特徴とするデータ分析装置。
  10. 請求項7乃至9のいずれか1に記載のデータ分析装置であって、
    前記記憶装置に格納されたデータは、所定の予約サービスを管理する顧客データであり、前記結論項目を満たす割合は、前記所定の予約サービスの解約見込みであることを特徴とするデータ分析装置。
JP2000391834A 2000-12-20 2000-12-20 データ分析方法及び装置 Expired - Fee Related JP3815218B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2000391834A JP3815218B2 (ja) 2000-12-20 2000-12-20 データ分析方法及び装置
US09/994,951 US6892208B2 (en) 2000-12-20 2001-11-27 Method and system for database management for data mining
US10/016,193 US6877012B2 (en) 2000-12-20 2001-12-12 Method and system for database management for data mining

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000391834A JP3815218B2 (ja) 2000-12-20 2000-12-20 データ分析方法及び装置

Publications (2)

Publication Number Publication Date
JP2002189597A JP2002189597A (ja) 2002-07-05
JP3815218B2 true JP3815218B2 (ja) 2006-08-30

Family

ID=18857920

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000391834A Expired - Fee Related JP3815218B2 (ja) 2000-12-20 2000-12-20 データ分析方法及び装置

Country Status (2)

Country Link
US (2) US6892208B2 (ja)
JP (1) JP3815218B2 (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7194465B1 (en) * 2002-03-28 2007-03-20 Business Objects, S.A. Apparatus and method for identifying patterns in a multi-dimensional database
AU2003904117A0 (en) * 2003-08-06 2003-08-28 Stephen Morris A method of processing data for a system model
AU2004263907B2 (en) * 2003-08-06 2009-11-19 Stephen Morris A method of processing data for a system model
US7426520B2 (en) 2003-09-10 2008-09-16 Exeros, Inc. Method and apparatus for semantic discovery and mapping between data sources
US7797266B2 (en) 2004-03-18 2010-09-14 Denso It Laboratory, Inc. Vehicle information processing system for content recommendation using Bayesian network models
US20070033098A1 (en) * 2005-08-05 2007-02-08 International Business Machines Corporation Method, system and storage medium for creating sales recommendations
US7836004B2 (en) * 2006-12-11 2010-11-16 International Business Machines Corporation Using data mining algorithms including association rules and tree classifications to discover data rules
US7788269B2 (en) * 2007-03-30 2010-08-31 International Business Machines Corporation Integration of predefined multi-dimensional and flexibly-ordered dynamic search interfaces
US8171001B2 (en) * 2007-06-27 2012-05-01 International Business Machines Corporation Using a data mining algorithm to generate rules used to validate a selected region of a predicted column
US8166000B2 (en) * 2007-06-27 2012-04-24 International Business Machines Corporation Using a data mining algorithm to generate format rules used to validate data sets
US20090019022A1 (en) * 2007-07-15 2009-01-15 Dawning Technologies, Inc. Rules-based data mining
US8401987B2 (en) * 2007-07-17 2013-03-19 International Business Machines Corporation Managing validation models and rules to apply to data sets
US9720971B2 (en) * 2008-06-30 2017-08-01 International Business Machines Corporation Discovering transformations applied to a source table to generate a target table
JP5220582B2 (ja) * 2008-12-25 2013-06-26 インターナショナル・ビジネス・マシーンズ・コーポレーション 新規顧客候補の評価作業を支援するための装置、方法及びプログラム
US8166064B2 (en) * 2009-05-06 2012-04-24 Business Objects Software Limited Identifying patterns of significance in numeric arrays of data
JP5444282B2 (ja) * 2011-05-11 2014-03-19 株式会社日立システムズ データ整形システム、方法、及びプログラム
US20130166498A1 (en) * 2011-12-25 2013-06-27 Microsoft Corporation Model Based OLAP Cube Framework
US20130166551A1 (en) * 2011-12-27 2013-06-27 Mickey MG Wong Cubits
US8930303B2 (en) 2012-03-30 2015-01-06 International Business Machines Corporation Discovering pivot type relationships between database objects
CN102722560A (zh) * 2012-05-31 2012-10-10 深圳市远行科技有限公司 一种基于电信行业主数据的自动识别方法及系统
CN104036409A (zh) * 2013-03-08 2014-09-10 姚德明 提升电子商务企业竞争力的方法和系统
US11397957B1 (en) * 2013-03-15 2022-07-26 Blue Yonder Group, Inc. Framework for implementing segmented dimensions
JP6257298B2 (ja) * 2013-12-11 2018-01-10 株式会社日立システムズ データ分類装置およびデータ分類方法ならびにデータ分類プログラム
JP6343986B2 (ja) * 2014-03-17 2018-06-20 富士通株式会社 情報処理装置,プログラム,情報処理方法
CN111026469B (zh) * 2018-10-09 2023-04-11 阿里巴巴集团控股有限公司 条件处理方法、装置及电子设备
CN110059132A (zh) * 2019-04-15 2019-07-26 成都九鼎瑞信科技股份有限公司 一种智能水务管理平台的数据分析展示系统
KR102634916B1 (ko) 2019-08-29 2024-02-06 주식회사 엘지에너지솔루션 온도 추정 모델 결정 방법 및 장치, 온도 추정 모델이 적용된 배터리 관리 시스템
CN111782966B (zh) 2020-06-30 2023-07-28 北京百度网讯科技有限公司 用户分群方法、装置、计算机设备和介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6119103A (en) * 1997-05-27 2000-09-12 Visa International Service Association Financial risk prediction systems and methods therefor
US5943668A (en) * 1997-06-30 1999-08-24 International Business Machines Corporation Relational emulation of a multi-dimensional database
US6567796B1 (en) * 1999-03-23 2003-05-20 Microstrategy, Incorporated System and method for management of an automatic OLAP report broadcast system
US6671680B1 (en) * 2000-01-28 2003-12-30 Fujitsu Limited Data mining apparatus and storage medium storing therein data mining processing program
US6691120B1 (en) * 2000-06-30 2004-02-10 Ncr Corporation System, method and computer program product for data mining in a normalized relational database

Also Published As

Publication number Publication date
US20020087540A1 (en) 2002-07-04
JP2002189597A (ja) 2002-07-05
US6892208B2 (en) 2005-05-10
US6877012B2 (en) 2005-04-05
US20020091908A1 (en) 2002-07-11

Similar Documents

Publication Publication Date Title
JP3815218B2 (ja) データ分析方法及び装置
US11748345B2 (en) Apparatuses, methods and systems for a lead generating hub
US10628775B2 (en) Sankey diagram graphical user interface customization
US7107238B2 (en) Method and apparatus for providing relative-evaluations of commodities to user by using commodity-comparison map
US8700450B2 (en) Customer relationship management system and method
JP4717945B2 (ja) 業務分析プログラムおよび業務分析装置
JP6134632B2 (ja) 資金フロー分析装置及び方法
JP2008310566A (ja) ビジネスプロセス作成方法、ビジネスプロセス作成装置、及びビジネスプロセス作成プログラム
JP2019148897A (ja) 行動パターン探索システム、および行動パターン探索方法
JP6837411B2 (ja) 販売促進装置、販売促進方法及び販売促進プログラム
JP4914164B2 (ja) 事業情報管理システム、事業情報管理方法および事業情報管理プログラム
JPWO2017203672A1 (ja) アイテム推奨方法、アイテム推奨プログラムおよびアイテム推奨装置
Namvar et al. An approach to optimised customer segmentation and profiling using RFM, LTV, and demographic features
Goar et al. Business decision making by big data analytics
JP2005122560A (ja) デッドロック事前検出プログラム
JP2020077299A (ja) グラフ簡略化方法、グラフ簡略化プログラムおよび情報処理装置
JP2020112890A (ja) データ処理プログラム、データ出力装置、データ統合方法、出力プログラム、データ出力方法及びデータ処理システム
CN114881521A (zh) 业务评估方法、装置、电子设备以及存储介质
JP7211499B2 (ja) 情報処理システム、情報処理装置、情報処理方法及びプログラム
JP7231020B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP6861176B2 (ja) プロジェクト見積り支援方法およびプロジェクト見積り支援装置
Nair et al. Performance comparison of association rule algorithms with SPMF on automotive industry data
US8650050B1 (en) Presentation of benefits of insurance related products
JP2003280901A (ja) 見積評価支援プログラムおよび見積評価支援システム
JP7517396B2 (ja) 情報処理装置、情報処理方法及びプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050823

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051021

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060123

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060221

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060418

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060419

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060516

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060529

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090616

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100616

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100616

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110616

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110616

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120616

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120616

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130616

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees