JP3687768B2 - 組合せ分析情報作成装置及び組合せ分析情報作成プログラムを記録した記録媒体 - Google Patents
組合せ分析情報作成装置及び組合せ分析情報作成プログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP3687768B2 JP3687768B2 JP10600098A JP10600098A JP3687768B2 JP 3687768 B2 JP3687768 B2 JP 3687768B2 JP 10600098 A JP10600098 A JP 10600098A JP 10600098 A JP10600098 A JP 10600098A JP 3687768 B2 JP3687768 B2 JP 3687768B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- information
- combination
- analysis
- bitmap
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Digital Computer Display Output (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、データ分析技術分野に係わり、とくに、データベース上の顧客購入情報などを利用して、顧客の新規購入傾向などを発見するのに好適な組合せ分析情報作成装置及び組合せ分析情報作成プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】
従来のデータ分析手法としては、データを多次元に正規化して分析する手法と、データのルールを導きだす手法が一般に知られている。
【0003】
データを多次元に分析する手法は、データベースのデータ項目を分析する軸として設定し、軸の組合せ毎に情報を正規化する事により、データを多くの視点から参照する事を可能にするものである。この手法では、例えば製品の購入状況を多くの視点から正規化した情報として参照する事ができるが、顧客の購入品の組合せ状況を参照する事はできない。
【0004】
一方、データのルールを導きだす手法は、データの分布状況を統計理論的に分析し、ルールを作成する方法である。たとえば、顧客購入情報から、スラックスを多く買った御客様は、ジョギングシューズを(シェープアップなどの為に)購入する等の分析を行いルールを作成する事ができる。しかし、この場合には、膨大なルールの可能性があり、その中から、真に役に立つ規則を発見する事が非常に困難である。その対策として、ルールを作成する前に、例外項目や既知項目を事前ルールとして入力し、ルールの最適化を行っている。しかし、ユーザの購入意識には、規則で置き換えられない事が多く、ルールを作成する為の、事前ルールを作成する為のそのまた事前ルールを作成するといった事が階層的に発生し、利用者の負担軽減、データの分析精度の向上技法が求められていた。
【0005】
【発明が解決しようとする課題】
上記のように、従来のデータを多次元に分析する手法では、データベースのデータ自体を正規化することにより、任意の次元項目情報に関しては、1個のデータの分析しかできなかった為、複数データの組合せの分析を行うには、利用者が合算して分析を行う必要があるという問題があった。また、統計学的に、データからルールを導びきだす手法では、組合せ分析を行うには、例外ルールの抽出作業が場合で発生し、やはり利用者の負担を残していた。
【0006】
本発明の目的は、データベース上のデータを利用し、正規化情報と名称を要約したサマライズ情報と複数データの組合せ結果毎の情報を出力することにより、例外ルールの除去の高速化を計ったデータの傾向分析(組合せ分析)を可能とする組合せ分析情報作成装置及び組合せ分析情報作成プログラムを記録した記録媒体を提供することにある。
【0007】
【課題を解決するための手段】
上記目的を達成するために、本発明のデータベースのデータを利用し、複数データの組合せ分析情報を作成する組合せ分析情報作成装置では、データベースに含まれる複数の項目のうち、所定項目のデータを統合して上位データの名称に置き換え、データベースのデータの組合せ分析項目の定義情報を作成する手段と、前記組合せ分析項目の定義情報をもとに、データベースのデータを、分析単位情報をロー、組合せ対象の項目をカラムとする、組合せ対象単位と分析単位に正規化した正規化データを作成するとともに、前記正規化データの組合せ対象項目データの有無に応じて1又は0を設定したビットマップを作成する手段と、前記正規化データについて、前記ビットマップをもとに、分析単位ごとに、1が設定されている組合せ対象の各項目を統合して当該データ値の合計を設定し、0が設定されている組合せ対象の項目を削除した組合せ分析情報を作成する手段とを具備することを特徴とする。
【0008】
また、本発明の組合せ分析情報作成装置では、前記正規化データに対して、組合せ対象名称を要約した名称に変換し、同一名称の組合せ対象を統合してサマライズデータを作成するとともに、前記サマライズデータに対するビットマップ(サマライズビットマップ)を作成する手段を更に具備し、前記サマライズデータについて、サマライズビットマップをもとに組合せ分析情報を作成することを特徴とする。
さらに、本発明のデータベースのデータを利用し、複数データの組合せ分析情報を作成するためのプログラムを記録したコンピュータ読み取り可能な記録媒体では、データベースに含まれる複数の項目のうち、所定項目のデータを統合して上位データの名称に置き換え、データベースのデータの組合せ分析項目の定義情報を作成する処理プロセスと、前記組合せ分析項目の定義情報をもとに、データベースのデータを、分析単位情報をロー、組合せ対象の項目をカラムとする、組合せ対象単位と分析単位に正規化した正規化データを作成するとともに、前記正規化データの組合せ対象項目データの有無に応じて1又は0を設定したビットマップを作成する処理プロセスと、前記正規化データについて、前記ビットマップをもとに、分析単位ごとに、1が設定されている組合せ対象の各項目を統合して当該データ値の合計を設定し、0が設定されている組合せ対象の項目を削除した組合せ分析情報を作成する処理プロセスと、前記正規化データに対して、組合せ対象名称を要約した名称に変換し、同一名称の組合せ対象を統合してサマライズデータを作成するとともに、前記サマライズデータに対するビットマップ(サマライズビットマップ)を作成する処理プロセスと、前記サマライズデータについて、サマライズビットマップをもとに組合せ分析情報を作成する処理プロセスとをコンピュータで実行させるための組合せ分析情報作成プログラムが記録されていることを特徴とする。
【0009】
【発明の実施の形態】
以下、本発明による組合せ分析情報作成装置の一実施の形態を図面を参照しつつ説明する。
図1に、本発明による組合せ分析情報作成装置の一実施例のシステム構成図を示す。組合せ分析情報作成装置1は、データベース100の情報を読み取り、利用者が分析項目情報設定装置200を用いて設定した組合せ対象/組合せ単位/多角的分析対象/分析値などに基づいて、データベース情報を分析し、組合せ分析結果を出力する。該組合せ分析情報作成装置1は、分析項目定義情報作成装置2、正規化情報編集装置3、サマライズ情報編集装置4、組合せ情報編集装置5及びキューブ情報作成装置6から構成されている。以下に、顧客購入情報を例にして各装置の働きを詳述する。
【0010】
利用者は、データベース100の情報の組合せ傾向を把握したい時、分析項目情報設定装置200を用いて組合せ分析したい項目、その属性等を指定する。分析項目情報設定装置200は、例えばキーボード、ディスプレィ、マウスなどである。
【0011】
利用者が分析項目情報設定装置200を用いて設定する例を、図2及び図3を用いて説明する。
(a)分析項目情報設定
利用者は、まず、分析項目情報設定装置200を用いて分析項目情報を設定する。図2は、分析項目情報7の内容であり、ここでは、データベース(DB)100のテーブル項目名8、分析項目指定有無(○は有り)9、指定属性10を指定する。
【0012】
(b)分析項目属性設定
次に、利用者は、設定した分析項目に対し、その分析項目属性を設定する。図2では、分析項目属性10として以下の内容を設定する。
*標準11(特別属性無し)
*組合せ対象12(例:製品の組合せ販売実績)
*分析単位13 (例:同じ人が? 1回の買い物(同じ注文番号)?
同じPCに?)
*分析値14 (例:受注金額? 本数?)。
【0013】
(c)変換名称設定
さらに、利用者は、必要に応じて分析項目属性として名称の変換方法を設定する。図3は、利用者が分析項目情報設定装置200を用いて設定する分析項目属性情報15の内容であり、図2の組合せ対象12に対し、組合せ対象分析項目(ここでは形名)の名称変換方法である変換方法17、及び、変換設定値を示す設定情報18を指定する。変換方法17は、名称を要約した名称に変換する方法を示し、ここでは、分析項目情報の階層番号を指定する方式19、及び特定名称に対して固有名称を指定する方式20の2種類を用いる。
名称を要約する目的は、組合せ分析をする場合に組合せ数が多く組合せに優劣がつかない問題を防ぎ、組合せ特性を顕著にする為である。
【0014】
分析項目定義情報作成装置2は、データベース100を参照し、利用者により分析項目情報設定装置200を用いて設定された内容により、組合せ分析項目定義情報を作成する。図4に、分析項目属性情報15とともに分析項目定義情報21の例を示す。
【0015】
図4は、データベース(DB)100を参照して、図3の分析項目属性情報15をもとに作成した組合せ分析項目定義情報21の例である。分析項目定義情報21は、組合せ対象分析項目のデータを示すDB情報22(ここでは型名)と、組合せ対象分析項目の変換後情報23(洗濯機、冷蔵庫など)で構成される。
【0016】
図5は、階層を持った分析項目情報の例に対し、組合せ対象分析項目の名称変換を設定する具体例であり、階層情報を標準値として指定し、特定名称のみ固有名称に変換する(20)場合の例を示したものである。
【0017】
正規化情報編集装置3は、分析項目定義情報作成装置2から分析項目情報7、分析項目属性情報15及び分析項目定義情報21などを受け取り、これをもとにデータベース100の情報を組合せ対象単位12と分析単位13に正規化し、正規化情報を作成する。
【0018】
図6は、正規化情報編集装置3が作成する正規化情報の例であり、ここでは正規化定義情報24、正規化ビットマップ情報25、正規化データ26とで構成される。正規化定義情報24は、組合せ対象に指定された分析項目(型名)のデータ内容27、指定変換方式(図3の19または20)で変換されたデータ内容27の変換値28、正規化ビットマップ25のビット位置を示す情報29とで構成され、分析項目定義設定装置2からの分析項目定義情報21などを元に作成される。正規化ビットマップ情報25は、正規化データ26のデータ有無をビットのON,OFF情報で示した情報であり、データベース100を元に作成する。例えば、受注番号「1234」はビット1と3がONであり、これは正規化定義情報24よりデータ「R−1422」(冷蔵庫)とデータ「S−3454」(洗濯機)に対応する。即ち、受注番号「1234」の顧客は冷蔵庫と同時に洗濯機も購入したことを示す。正規化データ26は、組合せ対象12(型名)と分析単位13(受注番号)を正規化したデータ値の表であり、これもデータベース100を元に作成する。
【0019】
正規化情報編集装置3は、分析項目定義情報作成装置2から与えられる分析項目定義情報21とともに、作成した正規化定義情報24、正規化情報ビットマップ情報25、正規化データ26をサマライズ情報編集装置4へ与える。
【0020】
サマライズ情報編集装置4は、正規化データ26に対し、分析項目定義情報21を元に組合せ対象名称22を要約した名称に変換して、合算統合(サマライズ)し、また、正規化ビットマップ情報25を同様にサマライズした情報を作成する。
【0021】
図7は、サマライズ情報編集装置4が作成する情報であり、サマライズ定義情報32、サマライズビットマップ情報33、サマライズデータ34とで構成される。サマライズ定義情報32は、変換した(要約)名称35、変換前データである正規化ビットマップ情報25のビット位置情報36、変換後データであるサマライズビットマップ情報33のビット位置情報37とで構成される。サマライズビットマップ情報33は、サマライズデータ34のデータ有無をビットのON,OFF情報で示した情報であり、正規化ビットマップ情報25を、分析項目定義情報21に添って正規化し作成する。このサマライズビットマップ情報33は、ビットが型名単位から名称単位に統合されていることを除けば、正規化ビットマップ情報25と基本的に同様である。サマライズデータ34は、正規化データ26に対し、組合せ対象のデータ22を要約した名称に変換23し、統合合算(サマライズ)したデータ値の表である。なお、サマライズビットマップ情報33及びサマライズデータ34は、作成するかしないかを、ユーザが選択できる。
【0022】
サマライズ情報編集装置4では、作成したサマライズ定義情報32、サマライズビットマップ情報33、サマライズデータ34を組合せ情報編集装置5へ与える。なお、ユーザの指示でサマライズビットマップ情報33及びサマラズデータ34を作成されない場合には、正規化ビットマップ情報25及び正規化データ26を与える。
【0023】
組合せ情報編集装置5は、サマライズビットマップ情報33または正規化ビットマップ情報25を元に、サマライズデータ34または正規化データ26に対し、データがある場合の組合せを見つけ、組合せ別に正規化した組合せ分析情報を作成する。
【0024】
図8は、組合せ情報編集装置5が作成する情報であり、組合せ定義情報38、組合せビットマップ39、組合せデータ40とで構成される。組合せ定義情報38は、サマライズ情報のデータが有る組合せの情報41、変換前名称であり対応する正規化データ情報番号42、サマライズデータ情報番号43、サマライズデータの存在位置を示すビットマップのビットマップ番号44とで構成される。組合せビットマップ情報39は、組合せデータ40のデータ有無をビットのON、OFF情報で示したもので、正規化ビットマップ情報25またはサマライズビットマップ情報33を、組合せ定義情報38を元に組合せ別に正規化し作成する。組合せデータ40は、正規化データ26またはサマライズデータ34を、組合せ定義情報38を元に組合せ別に正規化し、統合合算したデータ値の表である。この組合せデータ40を参照する事により、組合せ情報の分析が可能となる。さらに、分析対象外にする組合せ対象45を指定し、未指定である分析対象となるサマライズデータから組み合わせ定義情報を再度作成する事により、現状を参照しながら例外ルールを除去したデータの傾向分析(組合せ分析)を高速に行う事が可能となる。図8の例では、冷蔵庫を買った顧客は、同時に洗濯機や電球も購入する傾向があると分析できる。
【0025】
キューブ情報作成装置6は、正規化情報編集装置3、サマライズ情報編集装置4、組合せ情報編集装置5から正規化データ26、サマライズデータ34、組合せデータ40などを与えられて、これらの情報を元に多角的分析項目情報を作成する。
【0026】
図9は、キューブ情報作成装置の作成する情報の例であり、絞込み分析項目46とキューブ用データ表47で構成される。絞込み分析項目46は、分析データを絞込む為の条件であり、キューブ用データ表47に指定されなかった分析項目9の組合せを変えて絞込み条件をかえる為にある。キューブ用データ47は、指定分析項目9から2種類の分析項目を取り出し、キューブ用データ表47の軸として指定したものであり、絞込み分析項目46の組合せ条件毎にデータを作成する。
【0027】
利用者は、正規化情報編集装置3、サマライズ情報編集装置4、組合せ情報編集装置5、キューブ情報作成装置6で作成された情報を検索参照する事により、データの組合せに着目して多角的分析が可能である。また、全ての段階のデータを、データの有無をビットマップとして管理する事により、常にデータの有無情報(例えば注文番号単位の購入情報)をビットマップとして持つため、組合せの例外項目にあたる情報を除去、または、除去情報の交換が高速にかつ容易に行える。これにより、組合せ情報例外規則の置き換えが容易に行え、多角的に現状を参照しながら組合せ情報の分析を高速に行う事が可能となる。また、上記全ての段階のデータを、分析項目に指定された項目の内2項目を表の軸にし、他の分析項目のデータを前記表への絞り込み条件とし、正規化する事により、組み合わせ情報を多角的に分析する情報として編集作成する事が可能となる。
【0028】
次に、本組合せ分析情報作成装置1の処理の流れについて説明する。
図10は全体の処理概要を示す図であり、ユーザが分析項目情報設定装置200を用いて設定した情報を元に、分析項目定義情報作成装置2がデータベース100を参照して分析項目定義情報を作成し、その後、正規化情報編集装置3、サマライズ情報編集装置4、組合せ情報編集装置5が正規化情報、サマライズ情報、組合せ情報を作成し、これら装置で作成した情報を元に、キューブ情報編集装置6で多角的分析組合せ分析情報を作成する。以下、各装置での処理の流れを図11乃至図14を用いて説明する。なお、これら処理手順は、組合せ分析情報作成プログラムとしてコンピュータで読み取り可能な形式で記録媒体に記録して、いわゆるフロッピーディスク、CD−ROMなどして提供することが可能である。
【0029】
図11は、分析項目情報設定装置200での分析項目等の設定と、分析項目定義情報作成装置2の処理の流れを一緒に示した図である。
利用者は、まず、分析項目情報設定装置200を用いて、多角的分析対象としてデータベース100のカラムを分析項目情報7として指定し、指定分析項目に属性として、組合せ対象12(例:製品の組合せ販売実績)と分析単位(同じ人が?1回の買い物で?)を設定する(図2参照)。次に、利用者は、組合せ分析をする場合に組合せ数が多く組合せに優劣がつかない問題を防ぐ為、組合せ対象名称を要約した名称に変換する方式として、▲1▼分析項目の階層を指定した変換方式19、または、▲2▼固有名称を指定した変換方式20を設定する(図3参照)。
分析項目定義情報作成装置は、ユーザが分析項目情報設定装置200を用いて設定した情報を利用し、データベース100を参照して、組合せ分析項目定義情報21を作成する(図4参照)。
【0030】
図12は正規化情報編集装置3の処理の流れを示した図である。正規化情報編集装置3は、分析項目定義情報21を元に正規化定義情報24作成し、組合せ対象名称27、要約する為変換した名称28、正規化ビットマップ情報のビット位置情報29を設定する。次に、データベース100の情報を読み取り、組合せ対象12と分析単位13に正規化した情報である正規化データ26を作成する。次に、組合せ対象の正規化したデータの有無を管理する正規化ビットマップ情報25を作成する。(図6参照)。
【0031】
図13はサマライズ情報編集装置4の処理の流れを示した図である。サマライズ情報編集装置4は、正規化定義情報24からサマライズ定義情報32を作成し、要約する為に変換した名称35、変換前データである正規化データのビットマップ情報のビット位置36と変換後サマライズデータのビットマップ情報のビット位置37を関連させる情報を設定する。次に、正規化ビットマップ情報25を、分析項目定義情報21に添って正規化し、サマライズビットマップ情報33を作成する。次に、正規化データ26に対し、組合せ対象名称を要約した名称に変換、正規化、統合合算(サマライズ)し、サマライズデータ34を作成する(図7参照)。
【0032】
図14は組合せ情報編集装置5の処理の流れを示した図である。組合せ情報編集装置5は、サマライズ定義情報32の組合せを整理し、組合せ定義情報38を作成する。そして、正規化ビットマップ情報25またはサマライズビットマップ情報33から、組合せ情報のデータの有無を管理する組合せビットマップ情報39を作成する。さらに、正規化データ26またはサマライズデータ34を、組合せ定義情報38に対応させて合算演算し、組合せデータ40を作成する。(図8参照)。
【0033】
【発明の効果】
以上説明したように、本発明によれば、データベース上のデータを利用し、組合せ結果毎の情報を出力する事により、例外ルールの除去の高速化を計ったデータの傾向分析(組合せ分析)が可能であり、多角的に現状データを参照しながら、組合せ情報による新規傾向の分析を高速に行う事が可能になる。
【図面の簡単な説明】
【図1】本発明の一実施例のシステム構成図である。
【図2】分析項目情報の設定例を示す図である。
【図3】分析項目属性の設定例を示す図である。
【図4】分析項目属性設定例および分析項目定義情報例を示す図である。
【図5】組合せ対象分析項目の名称の変換方式を示す図である。
【図6】正規化情報編集装置の出力情報例を示す図である。
【図7】サマライズ情報編集装置の出力情報例を示す図である。
【図8】組合せ情報編集装置の出力情報例を示す図である。
【図9】キューブ情報作成装置の出力情報例を示す図である。
【図10】本発明の組合せ分析情報作成装置の処理概要の流れを示す図である。
【図11】分析項目情報設定と分析項目定義情報作成装置の処理の流れを示す図である。
【図12】正規化情報編集装置の処理の流れを示す図である。
【図13】サマライズ情報編集装置の処理の流れを示す図である。
【図14】組合せ情報編集装置の処理の流れを示す図である。
【符号の説明】
100 データベース
200 分析項目情報設定装置
1 組合せ分析情報作成装置
2 分析項目定義情報作成装置
3 正規化情報編集装置
4 サマライズ情報編集装置
5 組合せ情報編集装置
6 キューブ情報作成装置
【発明の属する技術分野】
本発明は、データ分析技術分野に係わり、とくに、データベース上の顧客購入情報などを利用して、顧客の新規購入傾向などを発見するのに好適な組合せ分析情報作成装置及び組合せ分析情報作成プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】
従来のデータ分析手法としては、データを多次元に正規化して分析する手法と、データのルールを導きだす手法が一般に知られている。
【0003】
データを多次元に分析する手法は、データベースのデータ項目を分析する軸として設定し、軸の組合せ毎に情報を正規化する事により、データを多くの視点から参照する事を可能にするものである。この手法では、例えば製品の購入状況を多くの視点から正規化した情報として参照する事ができるが、顧客の購入品の組合せ状況を参照する事はできない。
【0004】
一方、データのルールを導きだす手法は、データの分布状況を統計理論的に分析し、ルールを作成する方法である。たとえば、顧客購入情報から、スラックスを多く買った御客様は、ジョギングシューズを(シェープアップなどの為に)購入する等の分析を行いルールを作成する事ができる。しかし、この場合には、膨大なルールの可能性があり、その中から、真に役に立つ規則を発見する事が非常に困難である。その対策として、ルールを作成する前に、例外項目や既知項目を事前ルールとして入力し、ルールの最適化を行っている。しかし、ユーザの購入意識には、規則で置き換えられない事が多く、ルールを作成する為の、事前ルールを作成する為のそのまた事前ルールを作成するといった事が階層的に発生し、利用者の負担軽減、データの分析精度の向上技法が求められていた。
【0005】
【発明が解決しようとする課題】
上記のように、従来のデータを多次元に分析する手法では、データベースのデータ自体を正規化することにより、任意の次元項目情報に関しては、1個のデータの分析しかできなかった為、複数データの組合せの分析を行うには、利用者が合算して分析を行う必要があるという問題があった。また、統計学的に、データからルールを導びきだす手法では、組合せ分析を行うには、例外ルールの抽出作業が場合で発生し、やはり利用者の負担を残していた。
【0006】
本発明の目的は、データベース上のデータを利用し、正規化情報と名称を要約したサマライズ情報と複数データの組合せ結果毎の情報を出力することにより、例外ルールの除去の高速化を計ったデータの傾向分析(組合せ分析)を可能とする組合せ分析情報作成装置及び組合せ分析情報作成プログラムを記録した記録媒体を提供することにある。
【0007】
【課題を解決するための手段】
上記目的を達成するために、本発明のデータベースのデータを利用し、複数データの組合せ分析情報を作成する組合せ分析情報作成装置では、データベースに含まれる複数の項目のうち、所定項目のデータを統合して上位データの名称に置き換え、データベースのデータの組合せ分析項目の定義情報を作成する手段と、前記組合せ分析項目の定義情報をもとに、データベースのデータを、分析単位情報をロー、組合せ対象の項目をカラムとする、組合せ対象単位と分析単位に正規化した正規化データを作成するとともに、前記正規化データの組合せ対象項目データの有無に応じて1又は0を設定したビットマップを作成する手段と、前記正規化データについて、前記ビットマップをもとに、分析単位ごとに、1が設定されている組合せ対象の各項目を統合して当該データ値の合計を設定し、0が設定されている組合せ対象の項目を削除した組合せ分析情報を作成する手段とを具備することを特徴とする。
【0008】
また、本発明の組合せ分析情報作成装置では、前記正規化データに対して、組合せ対象名称を要約した名称に変換し、同一名称の組合せ対象を統合してサマライズデータを作成するとともに、前記サマライズデータに対するビットマップ(サマライズビットマップ)を作成する手段を更に具備し、前記サマライズデータについて、サマライズビットマップをもとに組合せ分析情報を作成することを特徴とする。
さらに、本発明のデータベースのデータを利用し、複数データの組合せ分析情報を作成するためのプログラムを記録したコンピュータ読み取り可能な記録媒体では、データベースに含まれる複数の項目のうち、所定項目のデータを統合して上位データの名称に置き換え、データベースのデータの組合せ分析項目の定義情報を作成する処理プロセスと、前記組合せ分析項目の定義情報をもとに、データベースのデータを、分析単位情報をロー、組合せ対象の項目をカラムとする、組合せ対象単位と分析単位に正規化した正規化データを作成するとともに、前記正規化データの組合せ対象項目データの有無に応じて1又は0を設定したビットマップを作成する処理プロセスと、前記正規化データについて、前記ビットマップをもとに、分析単位ごとに、1が設定されている組合せ対象の各項目を統合して当該データ値の合計を設定し、0が設定されている組合せ対象の項目を削除した組合せ分析情報を作成する処理プロセスと、前記正規化データに対して、組合せ対象名称を要約した名称に変換し、同一名称の組合せ対象を統合してサマライズデータを作成するとともに、前記サマライズデータに対するビットマップ(サマライズビットマップ)を作成する処理プロセスと、前記サマライズデータについて、サマライズビットマップをもとに組合せ分析情報を作成する処理プロセスとをコンピュータで実行させるための組合せ分析情報作成プログラムが記録されていることを特徴とする。
【0009】
【発明の実施の形態】
以下、本発明による組合せ分析情報作成装置の一実施の形態を図面を参照しつつ説明する。
図1に、本発明による組合せ分析情報作成装置の一実施例のシステム構成図を示す。組合せ分析情報作成装置1は、データベース100の情報を読み取り、利用者が分析項目情報設定装置200を用いて設定した組合せ対象/組合せ単位/多角的分析対象/分析値などに基づいて、データベース情報を分析し、組合せ分析結果を出力する。該組合せ分析情報作成装置1は、分析項目定義情報作成装置2、正規化情報編集装置3、サマライズ情報編集装置4、組合せ情報編集装置5及びキューブ情報作成装置6から構成されている。以下に、顧客購入情報を例にして各装置の働きを詳述する。
【0010】
利用者は、データベース100の情報の組合せ傾向を把握したい時、分析項目情報設定装置200を用いて組合せ分析したい項目、その属性等を指定する。分析項目情報設定装置200は、例えばキーボード、ディスプレィ、マウスなどである。
【0011】
利用者が分析項目情報設定装置200を用いて設定する例を、図2及び図3を用いて説明する。
(a)分析項目情報設定
利用者は、まず、分析項目情報設定装置200を用いて分析項目情報を設定する。図2は、分析項目情報7の内容であり、ここでは、データベース(DB)100のテーブル項目名8、分析項目指定有無(○は有り)9、指定属性10を指定する。
【0012】
(b)分析項目属性設定
次に、利用者は、設定した分析項目に対し、その分析項目属性を設定する。図2では、分析項目属性10として以下の内容を設定する。
*標準11(特別属性無し)
*組合せ対象12(例:製品の組合せ販売実績)
*分析単位13 (例:同じ人が? 1回の買い物(同じ注文番号)?
同じPCに?)
*分析値14 (例:受注金額? 本数?)。
【0013】
(c)変換名称設定
さらに、利用者は、必要に応じて分析項目属性として名称の変換方法を設定する。図3は、利用者が分析項目情報設定装置200を用いて設定する分析項目属性情報15の内容であり、図2の組合せ対象12に対し、組合せ対象分析項目(ここでは形名)の名称変換方法である変換方法17、及び、変換設定値を示す設定情報18を指定する。変換方法17は、名称を要約した名称に変換する方法を示し、ここでは、分析項目情報の階層番号を指定する方式19、及び特定名称に対して固有名称を指定する方式20の2種類を用いる。
名称を要約する目的は、組合せ分析をする場合に組合せ数が多く組合せに優劣がつかない問題を防ぎ、組合せ特性を顕著にする為である。
【0014】
分析項目定義情報作成装置2は、データベース100を参照し、利用者により分析項目情報設定装置200を用いて設定された内容により、組合せ分析項目定義情報を作成する。図4に、分析項目属性情報15とともに分析項目定義情報21の例を示す。
【0015】
図4は、データベース(DB)100を参照して、図3の分析項目属性情報15をもとに作成した組合せ分析項目定義情報21の例である。分析項目定義情報21は、組合せ対象分析項目のデータを示すDB情報22(ここでは型名)と、組合せ対象分析項目の変換後情報23(洗濯機、冷蔵庫など)で構成される。
【0016】
図5は、階層を持った分析項目情報の例に対し、組合せ対象分析項目の名称変換を設定する具体例であり、階層情報を標準値として指定し、特定名称のみ固有名称に変換する(20)場合の例を示したものである。
【0017】
正規化情報編集装置3は、分析項目定義情報作成装置2から分析項目情報7、分析項目属性情報15及び分析項目定義情報21などを受け取り、これをもとにデータベース100の情報を組合せ対象単位12と分析単位13に正規化し、正規化情報を作成する。
【0018】
図6は、正規化情報編集装置3が作成する正規化情報の例であり、ここでは正規化定義情報24、正規化ビットマップ情報25、正規化データ26とで構成される。正規化定義情報24は、組合せ対象に指定された分析項目(型名)のデータ内容27、指定変換方式(図3の19または20)で変換されたデータ内容27の変換値28、正規化ビットマップ25のビット位置を示す情報29とで構成され、分析項目定義設定装置2からの分析項目定義情報21などを元に作成される。正規化ビットマップ情報25は、正規化データ26のデータ有無をビットのON,OFF情報で示した情報であり、データベース100を元に作成する。例えば、受注番号「1234」はビット1と3がONであり、これは正規化定義情報24よりデータ「R−1422」(冷蔵庫)とデータ「S−3454」(洗濯機)に対応する。即ち、受注番号「1234」の顧客は冷蔵庫と同時に洗濯機も購入したことを示す。正規化データ26は、組合せ対象12(型名)と分析単位13(受注番号)を正規化したデータ値の表であり、これもデータベース100を元に作成する。
【0019】
正規化情報編集装置3は、分析項目定義情報作成装置2から与えられる分析項目定義情報21とともに、作成した正規化定義情報24、正規化情報ビットマップ情報25、正規化データ26をサマライズ情報編集装置4へ与える。
【0020】
サマライズ情報編集装置4は、正規化データ26に対し、分析項目定義情報21を元に組合せ対象名称22を要約した名称に変換して、合算統合(サマライズ)し、また、正規化ビットマップ情報25を同様にサマライズした情報を作成する。
【0021】
図7は、サマライズ情報編集装置4が作成する情報であり、サマライズ定義情報32、サマライズビットマップ情報33、サマライズデータ34とで構成される。サマライズ定義情報32は、変換した(要約)名称35、変換前データである正規化ビットマップ情報25のビット位置情報36、変換後データであるサマライズビットマップ情報33のビット位置情報37とで構成される。サマライズビットマップ情報33は、サマライズデータ34のデータ有無をビットのON,OFF情報で示した情報であり、正規化ビットマップ情報25を、分析項目定義情報21に添って正規化し作成する。このサマライズビットマップ情報33は、ビットが型名単位から名称単位に統合されていることを除けば、正規化ビットマップ情報25と基本的に同様である。サマライズデータ34は、正規化データ26に対し、組合せ対象のデータ22を要約した名称に変換23し、統合合算(サマライズ)したデータ値の表である。なお、サマライズビットマップ情報33及びサマライズデータ34は、作成するかしないかを、ユーザが選択できる。
【0022】
サマライズ情報編集装置4では、作成したサマライズ定義情報32、サマライズビットマップ情報33、サマライズデータ34を組合せ情報編集装置5へ与える。なお、ユーザの指示でサマライズビットマップ情報33及びサマラズデータ34を作成されない場合には、正規化ビットマップ情報25及び正規化データ26を与える。
【0023】
組合せ情報編集装置5は、サマライズビットマップ情報33または正規化ビットマップ情報25を元に、サマライズデータ34または正規化データ26に対し、データがある場合の組合せを見つけ、組合せ別に正規化した組合せ分析情報を作成する。
【0024】
図8は、組合せ情報編集装置5が作成する情報であり、組合せ定義情報38、組合せビットマップ39、組合せデータ40とで構成される。組合せ定義情報38は、サマライズ情報のデータが有る組合せの情報41、変換前名称であり対応する正規化データ情報番号42、サマライズデータ情報番号43、サマライズデータの存在位置を示すビットマップのビットマップ番号44とで構成される。組合せビットマップ情報39は、組合せデータ40のデータ有無をビットのON、OFF情報で示したもので、正規化ビットマップ情報25またはサマライズビットマップ情報33を、組合せ定義情報38を元に組合せ別に正規化し作成する。組合せデータ40は、正規化データ26またはサマライズデータ34を、組合せ定義情報38を元に組合せ別に正規化し、統合合算したデータ値の表である。この組合せデータ40を参照する事により、組合せ情報の分析が可能となる。さらに、分析対象外にする組合せ対象45を指定し、未指定である分析対象となるサマライズデータから組み合わせ定義情報を再度作成する事により、現状を参照しながら例外ルールを除去したデータの傾向分析(組合せ分析)を高速に行う事が可能となる。図8の例では、冷蔵庫を買った顧客は、同時に洗濯機や電球も購入する傾向があると分析できる。
【0025】
キューブ情報作成装置6は、正規化情報編集装置3、サマライズ情報編集装置4、組合せ情報編集装置5から正規化データ26、サマライズデータ34、組合せデータ40などを与えられて、これらの情報を元に多角的分析項目情報を作成する。
【0026】
図9は、キューブ情報作成装置の作成する情報の例であり、絞込み分析項目46とキューブ用データ表47で構成される。絞込み分析項目46は、分析データを絞込む為の条件であり、キューブ用データ表47に指定されなかった分析項目9の組合せを変えて絞込み条件をかえる為にある。キューブ用データ47は、指定分析項目9から2種類の分析項目を取り出し、キューブ用データ表47の軸として指定したものであり、絞込み分析項目46の組合せ条件毎にデータを作成する。
【0027】
利用者は、正規化情報編集装置3、サマライズ情報編集装置4、組合せ情報編集装置5、キューブ情報作成装置6で作成された情報を検索参照する事により、データの組合せに着目して多角的分析が可能である。また、全ての段階のデータを、データの有無をビットマップとして管理する事により、常にデータの有無情報(例えば注文番号単位の購入情報)をビットマップとして持つため、組合せの例外項目にあたる情報を除去、または、除去情報の交換が高速にかつ容易に行える。これにより、組合せ情報例外規則の置き換えが容易に行え、多角的に現状を参照しながら組合せ情報の分析を高速に行う事が可能となる。また、上記全ての段階のデータを、分析項目に指定された項目の内2項目を表の軸にし、他の分析項目のデータを前記表への絞り込み条件とし、正規化する事により、組み合わせ情報を多角的に分析する情報として編集作成する事が可能となる。
【0028】
次に、本組合せ分析情報作成装置1の処理の流れについて説明する。
図10は全体の処理概要を示す図であり、ユーザが分析項目情報設定装置200を用いて設定した情報を元に、分析項目定義情報作成装置2がデータベース100を参照して分析項目定義情報を作成し、その後、正規化情報編集装置3、サマライズ情報編集装置4、組合せ情報編集装置5が正規化情報、サマライズ情報、組合せ情報を作成し、これら装置で作成した情報を元に、キューブ情報編集装置6で多角的分析組合せ分析情報を作成する。以下、各装置での処理の流れを図11乃至図14を用いて説明する。なお、これら処理手順は、組合せ分析情報作成プログラムとしてコンピュータで読み取り可能な形式で記録媒体に記録して、いわゆるフロッピーディスク、CD−ROMなどして提供することが可能である。
【0029】
図11は、分析項目情報設定装置200での分析項目等の設定と、分析項目定義情報作成装置2の処理の流れを一緒に示した図である。
利用者は、まず、分析項目情報設定装置200を用いて、多角的分析対象としてデータベース100のカラムを分析項目情報7として指定し、指定分析項目に属性として、組合せ対象12(例:製品の組合せ販売実績)と分析単位(同じ人が?1回の買い物で?)を設定する(図2参照)。次に、利用者は、組合せ分析をする場合に組合せ数が多く組合せに優劣がつかない問題を防ぐ為、組合せ対象名称を要約した名称に変換する方式として、▲1▼分析項目の階層を指定した変換方式19、または、▲2▼固有名称を指定した変換方式20を設定する(図3参照)。
分析項目定義情報作成装置は、ユーザが分析項目情報設定装置200を用いて設定した情報を利用し、データベース100を参照して、組合せ分析項目定義情報21を作成する(図4参照)。
【0030】
図12は正規化情報編集装置3の処理の流れを示した図である。正規化情報編集装置3は、分析項目定義情報21を元に正規化定義情報24作成し、組合せ対象名称27、要約する為変換した名称28、正規化ビットマップ情報のビット位置情報29を設定する。次に、データベース100の情報を読み取り、組合せ対象12と分析単位13に正規化した情報である正規化データ26を作成する。次に、組合せ対象の正規化したデータの有無を管理する正規化ビットマップ情報25を作成する。(図6参照)。
【0031】
図13はサマライズ情報編集装置4の処理の流れを示した図である。サマライズ情報編集装置4は、正規化定義情報24からサマライズ定義情報32を作成し、要約する為に変換した名称35、変換前データである正規化データのビットマップ情報のビット位置36と変換後サマライズデータのビットマップ情報のビット位置37を関連させる情報を設定する。次に、正規化ビットマップ情報25を、分析項目定義情報21に添って正規化し、サマライズビットマップ情報33を作成する。次に、正規化データ26に対し、組合せ対象名称を要約した名称に変換、正規化、統合合算(サマライズ)し、サマライズデータ34を作成する(図7参照)。
【0032】
図14は組合せ情報編集装置5の処理の流れを示した図である。組合せ情報編集装置5は、サマライズ定義情報32の組合せを整理し、組合せ定義情報38を作成する。そして、正規化ビットマップ情報25またはサマライズビットマップ情報33から、組合せ情報のデータの有無を管理する組合せビットマップ情報39を作成する。さらに、正規化データ26またはサマライズデータ34を、組合せ定義情報38に対応させて合算演算し、組合せデータ40を作成する。(図8参照)。
【0033】
【発明の効果】
以上説明したように、本発明によれば、データベース上のデータを利用し、組合せ結果毎の情報を出力する事により、例外ルールの除去の高速化を計ったデータの傾向分析(組合せ分析)が可能であり、多角的に現状データを参照しながら、組合せ情報による新規傾向の分析を高速に行う事が可能になる。
【図面の簡単な説明】
【図1】本発明の一実施例のシステム構成図である。
【図2】分析項目情報の設定例を示す図である。
【図3】分析項目属性の設定例を示す図である。
【図4】分析項目属性設定例および分析項目定義情報例を示す図である。
【図5】組合せ対象分析項目の名称の変換方式を示す図である。
【図6】正規化情報編集装置の出力情報例を示す図である。
【図7】サマライズ情報編集装置の出力情報例を示す図である。
【図8】組合せ情報編集装置の出力情報例を示す図である。
【図9】キューブ情報作成装置の出力情報例を示す図である。
【図10】本発明の組合せ分析情報作成装置の処理概要の流れを示す図である。
【図11】分析項目情報設定と分析項目定義情報作成装置の処理の流れを示す図である。
【図12】正規化情報編集装置の処理の流れを示す図である。
【図13】サマライズ情報編集装置の処理の流れを示す図である。
【図14】組合せ情報編集装置の処理の流れを示す図である。
【符号の説明】
100 データベース
200 分析項目情報設定装置
1 組合せ分析情報作成装置
2 分析項目定義情報作成装置
3 正規化情報編集装置
4 サマライズ情報編集装置
5 組合せ情報編集装置
6 キューブ情報作成装置
Claims (3)
- データベースのデータを利用し、複数データの組合せ分析情報を作成する組合せ分析情報作成装置であって、
データベースに含まれる複数の項目のうち、所定項目のデータを統合して上位データの名称に置き換え、データベースのデータの組合せ分析項目の定義情報を作成する手段と、
前記組合せ分析項目の定義情報をもとに、データベースのデータを、分析単位情報をロー、組合せ対象の項目をカラムとする、組合せ対象単位と分析単位に正規化した正規化データを作成するとともに、前記正規化データの組合せ対象項目データの有無に応じて1又は0を設定したビットマップを作成する手段と、
前記正規化データについて、前記ビットマップをもとに、分析単位ごとに、1が設定されている組合せ対象の各項目を統合して当該データ値の合計を設定し、0が設定されている組合せ対象の項目を削除した組合せ分析情報を作成する手段と、
を具備することを特徴とする分析情報作成装置。 - 請求項1記載の組合せ分析情報作成装置において、前記正規化データに対して、組合せ対象名称を要約した名称に変換し、同一名称の組合せ対象を統合してサマライズデータを作成するとともに、前記サマライズデータに対するビットマップ(サマライズビットマップ)を作成する手段を更に具備し、前記サマライズデータについて、サマライズビットマップをもとに組合せ分析情報を作成することを特徴とする組合せ分析情報作成装置。
- データベースのデータを利用し、複数データの組合せ分析情報を作成するためのプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
データベースに含まれる複数の項目のうち、所定項目のデータを統合して上位データの名称に置き換え、データベースのデータの組合せ分析項目の定義情報を作成する処理プロセスと、
前記組合せ分析項目の定義情報をもとに、データベースのデータを、分析単位情報をロー、組合せ対象の項目をカラムとする、組合せ対象単位と分析単位に正規化した正規化データを作成するとともに、前記正規化データの組合せ対象項目データの有無に応じて1又は0を設定したビットマップを作成する処理プロセスと、
前記正規化データについて、前記ビットマップをもとに、分析単位ごとに、1が設定されている組合せ対象の各項目を統合して当該データ値の合計を設定し、0が設定されている組合せ対象の項目を削除した組合せ分析情報を作成する処理プロセスと、
前記正規化データに対して、組合せ対象名称を要約した名称に変換し、同一名称の組合せ対象を統合してサマライズデータを作成するとともに、前記サマライズデータに対するビットマップ(サマライズビットマップ)を作成する処理プロセスと、
前記サマライズデータについて、サマライズビットマップをもとに組合せ分析情報を作成する処理プロセスと、
をコンピュータに実行させるための組合せ分析情報作成プログラムを記録した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10600098A JP3687768B2 (ja) | 1998-04-16 | 1998-04-16 | 組合せ分析情報作成装置及び組合せ分析情報作成プログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10600098A JP3687768B2 (ja) | 1998-04-16 | 1998-04-16 | 組合せ分析情報作成装置及び組合せ分析情報作成プログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11306186A JPH11306186A (ja) | 1999-11-05 |
JP3687768B2 true JP3687768B2 (ja) | 2005-08-24 |
Family
ID=14422441
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10600098A Expired - Fee Related JP3687768B2 (ja) | 1998-04-16 | 1998-04-16 | 組合せ分析情報作成装置及び組合せ分析情報作成プログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3687768B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8116537B2 (en) | 2007-04-04 | 2012-02-14 | Sony Corporation | Image recording device, player device, imaging device, player system, method of recording image, and computer program |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4121566B2 (ja) * | 1993-03-23 | 2008-07-23 | 株式会社野村総合研究所 | データベースからのデータ抽出方法 |
JPH09251467A (ja) * | 1996-03-15 | 1997-09-22 | Mitsubishi Electric Corp | データマイニングシステムおよびデータマイニング方法 |
JP3952518B2 (ja) * | 1996-03-29 | 2007-08-01 | 株式会社日立製作所 | 多次元データ処理方法 |
JPH09311862A (ja) * | 1996-05-22 | 1997-12-02 | Hitachi Ltd | データのドリルダウン方式 |
JPH1049544A (ja) * | 1996-08-02 | 1998-02-20 | Nippon Telegr & Teleph Corp <Ntt> | 視覚的多次元データ分析支援方法及び装置 |
JPH1055367A (ja) * | 1996-08-09 | 1998-02-24 | Hitachi Ltd | データ利用システム |
JP3584630B2 (ja) * | 1996-09-20 | 2004-11-04 | 株式会社日立製作所 | データベース処理システムにおける分類集計処理方法 |
-
1998
- 1998-04-16 JP JP10600098A patent/JP3687768B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH11306186A (ja) | 1999-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6240411B1 (en) | Integrating campaign management and data mining | |
JPH08272825A (ja) | データ分析方法 | |
JP2001092825A (ja) | 情報処理装置および情報処理方法 | |
JP2005078111A (ja) | データ分類処理装置、データ分類方法、プログラム及び可搬記憶媒体 | |
JP2002278761A (ja) | 否定項を含む相関ルール抽出方法およびシステム | |
JP5535062B2 (ja) | ウェブログの時系列分析のためのデータ格納および照会方法及びその方法を実行するシステム | |
JP4490012B2 (ja) | ファイル検索装置、ファイル検索プログラム | |
JPH1055367A (ja) | データ利用システム | |
JP3431482B2 (ja) | 分類項目解析方法及びこのプログラムを記録した記録媒体 | |
WO2007026870A1 (ja) | データのクラスタリング装置、クラスタリング方法及びクラスタリング用プログラム | |
KR20060122679A (ko) | 정보 처리 장치 및 정보 처리 방법과 컴퓨터 프로그램 | |
JP4630911B2 (ja) | 文書分類装置、文書分類方法およびそれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP5243366B2 (ja) | 映像要約方法および映像要約プログラム | |
JP3687768B2 (ja) | 組合せ分析情報作成装置及び組合せ分析情報作成プログラムを記録した記録媒体 | |
JP2001337971A (ja) | 文書分類装置、文書分類方法及び文書分類方法のプログラムを記録した記憶媒体 | |
JPH11316766A (ja) | 多次元分析構築システム及び分析処理用データベース | |
JP3478331B2 (ja) | 構造表示方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JPH05233706A (ja) | 文書分類保管システム | |
JPH0696136A (ja) | レビュー処理装置 | |
JP3711710B2 (ja) | 情報検索収集システムおよび情報検索収集プログラムを記憶した記憶媒体 | |
JPH11219361A (ja) | 文書閲覧装置およびそのプログラムを格納した記憶媒体 | |
JP2001014318A (ja) | データベース検索装置及びプログラムを記憶した記憶媒体 | |
JP2004086351A (ja) | テキスト情報分析システム、関連度算出システムおよび分析結果の提示方法 | |
JPH0969112A (ja) | 知的財産情報管理システム | |
JP2759951B2 (ja) | 汎用多次元集計帳表作成システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041026 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041227 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050531 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050601 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |