JP2002183178A - データ分析支援装置、その方法および記憶媒体 - Google Patents

データ分析支援装置、その方法および記憶媒体

Info

Publication number
JP2002183178A
JP2002183178A JP2000384442A JP2000384442A JP2002183178A JP 2002183178 A JP2002183178 A JP 2002183178A JP 2000384442 A JP2000384442 A JP 2000384442A JP 2000384442 A JP2000384442 A JP 2000384442A JP 2002183178 A JP2002183178 A JP 2002183178A
Authority
JP
Japan
Prior art keywords
group
setting
data
record set
record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000384442A
Other languages
English (en)
Inventor
Makoto Yamazaki
真湖人 山崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2000384442A priority Critical patent/JP2002183178A/ja
Publication of JP2002183178A publication Critical patent/JP2002183178A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】 【課題】 本発明は、データ分析作業において、分析者
が構成した視覚表現を容易に管理でき、必要に応じて閲
覧もできるデータ分析支援装置を提供する。 【解決手段】 本発明のデータ分析支援装置は、大量の
データ群を利用するデータ分析支援装置において、分析
対象レコードセットを含むデータソースを取得するデー
タソース設定処理部と、ユーザの設定した設定値に基づ
き、分析対象レコードセットを取得するレコードセット
設定処理部と、レコードセットの内容を表示するレコー
ドセット表示部と、分析対象レコードセットから、指定
された条件に該当するレコードをグループとして抽出す
るグループ設定処理部と、グループの属性およびグルー
プに所属するレコード群を表示するグループ表示部と、
レコードの属性値をグループごとに集計する集計設定処
理部と、集計結果を表示する集計結果表示部とを備え
る。その他5項ある。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、データ分析支援装
置、方法、および記憶媒体に関し、より詳しくは、文書
群多次元データベースを用いたデータ分析支援技術に関
するもので、マーケティング調査結果データの分析支援
等に応用して好適である。
【0002】
【従来の技術】従来技術として、多次元データの分析を
支援する環境として、データマイニングツール、または
OLAP(Online Analytical Processing)ツールと呼ば
れるソフトウェアが知られている。このようなソフトウ
ェアには、分析の流れに従って必要な処理を、ビジュア
ル・ プログラミングの手法によって記述する方式を採用
するものがある。例えば、SAS Enterprise Minerソフト
ウェアの処理フローダイアグラムでは、必要なプロセス
を示すノード( 特定の処理を表すアイコン) を選択して
画面上に配置し、ノード間の関連を矢印で連結してゆく
ことにより、分析に必要な処理を定義して行くことがで
きる(SAS Institute Inc.(1998), SAS Institute white
paper: Finding the solution to data mining. Cary,
NC: SAS Institute Inc.)。また、SPSS Inc. のデータ
マイニングアプリケーション Clementine 5.2 でも、同
様にビジュアル・ プログラミングの手法を取り入れたデ
ータ分析方法を提供している。
【0003】このようにビジュアル・ プログラミング手
法を用いたデータ分析支援環境においては、データ分析
の流れが図的に記録されるため、ユーザが特定のノード
を選択することによって、処理に関する設定内容やチャ
ートなどを必要に応じ閲覧することができる。
【0004】
【発明が解決しようとする課題】一般的に、データ分析
において分析者は1つのデータ集合について様々な視点
から分析を行い、多くのそして形式の異なるリストやチ
ャート(クロス表やグラフ、散布図など)を構成する。
そして、それらを閲覧したり、必要に応じて見比べた
り、設定を変えて変化を見たりしながら、データの概要
や特徴的な点を発見する。このような観点から、データ
分析作業は、データ変換処理のプロセスではなく、分析
者の洞察に必要となる複数の視覚的表現の構成を行う作
業として捉えることができる。これを支援するために
は、リストやチャートといった視覚的表現をスマートに
管理し、必要に応じて閲覧する方法を提供する機能が求
められる。
【0005】このような支援環境が不十分であれば、デ
ータ分析の過程で構成した視覚表現を必要に応じて閲覧
することが難しくなり、データ分析作業の本質ではない
探索作業によって、この分析に必要な思考の流れが阻害
される。このことは、データ分析作業の効率を低下させ
る。分析作業に数日を要するような複雑なデータの分析
にあたっては、このような問題は特に深刻である。
【0006】本発明は、データ分析作業において、分析
者が構成した視覚表現を容易に管理し、必要に応じて閲
覧できることを実現する技術を提供することを目的と
し、具体的には、以下に記載する技術を提供するもので
ある。即ち、ビジュアル・ プログラミング手法を利用し
たデータ分析支援装置は、従来テキストで記述されてい
た統計処理やデータマイニングの処理フローを、より直
感的に把握し構成しやすくする操作方法によって構成で
きるようになっている。このため、画面表示上にはデー
タの置換および変量の選択といった視覚表現とは異なる
操作を表すノードも配置され、画面が煩雑になってしま
う。このような表示および操作方法は、データ分析者が
作業の内容を詳細に知りたい場合には有益であるが、デ
ータ分析者が視覚表現を探索したい場合には、余計な画
面表示の存在により、探索作業が阻害されがちである。
【0007】分析者が実施した分析作業の詳細につい
て、後から調べることはあまり行われない。それに対し
て、データ分析作業で構成した視覚表現(表やチャー
ト)を閲覧することは頻繁に行われる。このとき、分析
者が分析の過程において構成した視覚表現を容易に特定
し、それを利用できることは非常に重要である。また、
分析結果を第三者(分析結果の報告対象者等)に報告す
るための資料を作成する際には、構成した複数の視覚表
現のうちから目的に応じたものを選択し、それを編集し
ながら、報告資料に文章とともに割り付けてゆく作業が
行われる。ここでも、視覚表現探索作業の効率化が重要
となっている。
【0008】本発明はこのような点を考慮してなされた
ものであり、データ分析作業において、分析者が構成し
た視覚表現を容易に管理でき、必要に応じて閲覧もでき
ることによって、データ分析作業を効率的に行うデータ
分析支援装置、その方法および記録媒体を提供すること
を目的とする。
【0009】
【課題を解決するための手段】上記課題を解決するため
に、本発明の請求項1のデータ分析支援装置は、大量の
データ群を利用するデータ分析支援装置において、分析
対象レコードセットを含むデータソースを取得するデー
タソース設定処理部と、ユーザの設定した設定値に基づ
き、分析対象レコードセットを取得するレコードセット
設定処理部と、レコードセットの内容を表示するレコー
ドセット表示部と、分析対象レコードセットから、指定
された条件に該当するレコードをグループとして抽出す
るグループ設定処理部と、グループの属性およびグルー
プに所属するレコード群を表示するグループ表示部と、
レコードの属性値をグループごとに集計する集計設定処
理部と、集計結果を表示する集計結果表示部とを備えた
ことを特徴とする。
【0010】また、本発明の請求項2のデータ分析支援
装置は、請求項1のデータ分析支援装置において、デー
タソースに関する設定情報、レコードセットに関する設
定情報、グループに関する設定情報、集計に関する設定
情報をユーザの要求に応じて提示する分析作業設定入力
・ 表示部を備えたことを特徴とする。
【0011】また、本発明の請求項3のデータ分析支援
装置は、請求項1のデータ分析支援装置において、前記
分析作業設定入力・ 表示部は、データソースに関する設
定情報、レコードセットに関する設定情報、グループに
関する設定情報、集計に関する設定情報に加え、前記レ
コードセット表示部、前記グループ表示部および前記集
計結果表示部が生成した視覚表現をユーザの要求に応じ
て提示することを特徴とする。
【0012】また、本発明の請求項4のデータ分析支援
装置は、請求項3に記載のデータ分析支援装置におい
て、前記分析作業設定入力・ 表示部は、表示されたデー
タソースに関する設定情報、レコードセットに関する設
定情報、グループに関する設定情報、集計に関する設定
情報または、前記レコードセット表示部、前記グループ
所属レコード表示部および前記集計結果表示部が生成し
た視覚表現のうちから、データ分析結果の報告資料に掲
載するものを選択指定できることを特徴とする。
【0013】また、本発明の請求項5のデータ分析支援
方法は、大量のデータ群を利用するデータ分析支援装置
において、分析対象レコードセットを含むデータソース
を取得し、ユーザの設定した設定値に基づいて分析対象
レコードセットを取得して、そのレコードセットの内容
を表示し、この分析対象レコードセットから、指定され
た条件に該当するレコードをグループとして抽出して、
グループの属性およびグループに所属するレコード群を
表示するとともに、レコードの属性値をグループごとに
集計した集計結果を表示するようにしたことを特徴とす
る。
【0014】また、本発明の請求項6の記録媒体は、少
なくとも1台のコンピュータを含むコンピュータシステ
ムによって実行されて、前記コンピュータシステムに、
大量のデータ群の中から分析対象レコードセットを含む
データソースを取得するデータソース設定処理機能と、
ユーザの設定した設定値に基づき、分析対象レコードセ
ットを取得するレコードセット設定処理機能と、レコー
ドセットの内容を表示するレコードセット表示機能と、
分析対象レコードセットから、指定された条件に該当す
るレコードをグループとして抽出するグループ設定処理
機能と、グループの属性およびグループに所属するレコ
ード群を表示するグループ表示機能と、レコードの属性
値をグループごとに集計する集計設定処理機能と、集計
結果を表示する集計結果表示機能とを実現するデータ分
析支援装置として機能するためのプログラムを記録し
た。
【0015】
【発明の実施の形態】図1は、本発明の一実施例を示す
データ分析支援装置のブロック構成図である。図1に示
したように、この実施例のデータ分析支援装置は、設定
入力・ 表示サブシステム10、設定処理サブシステム2
0および設定管理サブシステム30とから構成する。
【0016】設定入力・ 表示サブシステム10は、さら
に分析作業設定入力・表示部11と、データソース設定
入力・表示部12と、レコードセット設定入力・表示部
13と、グループ設定入力・表示部14および集計設定
入力・表示部15とから構成し、分析作業、データソー
ス、レコードセット、グループおよび集計に関する各設
定値の入力を各々の該当部分において受け付け、それら
の設定値を設定処理サブシステム20へ転送し、それら
の処理結果を受け取って表示する。
【0017】設定処理サブシステム20は、分析作業設
定処理部21と、データソース設定処理部22と、レコ
ードセット設定処理部23と、グループ設定処理部24
および集計設定処理部25とから構成し、分析作業、デ
ータソース、レコードセット、グループおよび集計のそ
れぞれに固有のデータ処理実行機能を備える。本サブシ
ステムは、設定入力・ 表示サブシステム10から転送さ
れた各々の設定値に従って、設定管理サブシステム30
に管理されたデータ処理を実行し、その結果を設定入力
・ 表示サブシステム10に転送する。
【0018】設定管理サブシステム30は、分析作業設
定管理部31と、データソース設定管理部32と、レコ
ードセット設定管理部33と、グループ設定管理部34
および集計設定管理部35とから構成し、分析作業、デ
ータソース、レコードセット、グループおよび集計のそ
れぞれに固有のデータ管理機能を備える。ユーザから入
力された各々の設定値を保持管理するとともに、レコー
ドセット、グループ、集計などに関して、必要な処理時
間を短縮させるためにデータソース41から取得しキャ
ッシュしたデータの管理を行う。
【0019】データ分析支援装置は、以下の4つのステ
ップに従って動作する。 1.データソース設定ステップ 2.レコードセット設定ステップ 3.グループ化ステップ 4.集計ステップ
【0020】第一のデータソース設定ステップにおい
て、ユーザは分類対象とするレコードが含まれているデ
ータソース41を指定し、データソース設定入力・ 表示
部12を通じて読み込みに関する諸設定を行う。ここで
データソース41は、表形式に整理されたデータを格納
したものでよく、一般的なリレーショナルデータベース
のテーブルやそれを組み合わせたもの、スプレッドシー
トアプリケーションのデータファイル、あるいは、表形
式に変換できる形式でデータが書き込まれたテキストフ
ァイルを指定する。指定する情報は、データソースを収
めたファイルの保存場所などを指定することによって行
う。
【0021】このスプレッドシートアプリケーションの
データファイルに関しては、それを利用するための仕様
情報をユーザから受け付ける処理を行う。また、テキス
トファイルを指定した際には、データ区切りの方法、デ
ータ区切り記号の種類、各フィールドの値のデータタイ
プなどをユーザから受け付ける処理を行う。リレーショ
ナルデータベースに格納されたデータソースであれば、
一般的なデータ操作記述言語を用いて、複数の表を組み
合わせた結果のデータや、表の一部のみを抽出した結果
のデータを新たな表として定義できるため、ユーザはデ
ータソースの設定を柔軟に行うことができる。データソ
ースに関する設定値は、データソース設定管理部32に
保持する。
【0022】ユーザからのデータソース設定が行われた
ならば、本データ分析支援装置はこの設定に従いデータ
ソース設定管理部32においてデータソースへの接続を
取得する。このとき、レコードセット設定管理部33で
は、データソースに含まれるすべてのレコードに所属レ
コードとする新規レコードセットを無条件に設定しても
よい。これを行うことにより、データソースに含まれる
レコードは、レコードセット設定入力・ 表示部12によ
って表示することが可能となる。
【0023】第二のレコードセット設定ステップにおい
ては、レコードセット設定処理部23において新規レコ
ードセットを作成し、ユーザがレコードセット設定入力
・ 表示部13を通じて入力した設定値に基づき、データ
抽出( サンプリング、あるいはフィルタリング) 、また
はレコードリストの指定によって、それに所属させるレ
コード集合を定義する。レコードセットに関する設定値
は、レコードセット設定管理部33に保持する。
【0024】データ抽出処理では、指定したレコード集
合に対してサンプリングまたはフィルタリングを行うこ
とによって、求めるレコード集合を取得する。サンプリ
ング、フィルタリングの対象として、レコードセット全
体あるいはすでに定義した他のレコード集合を指定す
る。このステップを設けることにより、ユーザが求める
最小限のレコードセットを処理することができるように
なる。これはユーザの操作の手間を削減し、また本デー
タ分析支援装置の処理コストを最適にする効果をもたら
す。
【0025】サンプリングにおいては、ユーザはデータ
ソースに含まれるレコードの総数を超えない整数、また
はレコード総数に対する割合(百分率で指定する場合は
ゼロ以上100以下)を指定する。レコードセット設定
処理部23では、ランダムサンプリング等の手法によっ
て、データソース41からレコードセット設定管理部3
3を介して、指定された数のレコードを含むレコードの
集合を取得する。
【0026】またフィルタリングにおいては、ユーザが
検索対象フィールドの指定と、そのフィールドの値に関
する検索条件との組を1つ以上設定する。このときレコ
ードセット設定処理部23は、設定された検索条件に該
当するレコードをレコードセット設定管理部33によっ
て検索し、その結果を当該レコードセットに属するもの
として取得する。
【0027】この場合の検索手法としては、任意の手法
が利用可能である。ただし、文字列型の値を持つフィー
ルドを検索対象にし、全文検索によって該当レコードを
得る場合には、スコア閾値とする値をユーザ入力などの
方法によって設定する必要がある。
【0028】サンプリングにおいては、1つのレコード
セットを取得するだけでなく、ランダムサンプリングの
手法を応用して、レコードの集合を指定された数の集合
へ、指定されたレコード数または配分比率で分配するこ
とも可能である。この場合、ユーザは取得するレコード
セットの数および、それぞれに対するレコード数または
配分比率を指定する。
【0029】レコードリストの指定では、ユーザがデー
タソースに含まれるレコードのうちから、1 つ以上のレ
コードを選択して指定し、本データ分析支援装置はそれ
をレコードセットの所属レコードとする。
【0030】サンプリングを行った結果に対してフィル
タを行う、または、フィルタリングの結果得られたレコ
ード集合に対してサンプリングを行うことによって、ユ
ーザの要求に合ったレコードセットを定義できる場合が
ある。このため、サンプリングとフィルタリングとは、
処理の順序を指定して組み合わせることが可能となって
いる。
【0031】レコードセット設定入力・ 表示部13で
は、定義されたレコードセットの所属レコード集合を表
示する。表示形式としては、レコードをリスト形式で表
示するほか、ユーザが一つまたは複数のフィールドを指
定することによって、散布図や棒グラフなどの形式とす
ることができ、表示形式はユーザの入力に応じて変更で
きるものとする。こうした表示形式に関する設定値も、
レコードセット設定管理部33に保持する。
【0032】第三のグループ化ステップでは、グループ
設定処理部24において、複数のフィールドに対して値
( 属性値) を持つレコードの集合を、そのいずれかのフ
ィールドに注目して分類し、レコードのグループを作成
する。グループ化ステップには、以下の処理が含まれ
る。 1.新規グループ化次元の作成、選択および削除 2.参照フィールドの選択または新規作成 3.新規グループの作成、グループの設定および削除
【0033】グループ化次元とは、共通のフィールドを
参照するグループの集まりである。1つのフィールドに
対して複数のグループ化次元を設けることができる。参
照フィールドの設定では、グループ化基準を適用するフ
ィールドとして、データソース41に定義されたフィー
ルドを選択するか、あるいは新規フィールドを作成し指
定する。レコードをグループ化する際、およびグループ
に所属するレコードに関して集計値を取得する際には、
データソース41に定義されていたフィールドおよびこ
こで新規作成されたフィールドのうちから、いずれか一
つを参照する。この設定はグループ設定入力・ 表示部1
4を介してユーザが行う。
【0034】新規フィールドを作成しそれを参照する場
合は、グループ化や集計に利用するために、ユーザがフ
ィールドを追加し、各レコードが持つべき値について設
定する。特定のフィールドについて各レコードが持つ値
は、レコードセットに定義されたフィールドの1つ以上
を参照し、その値を代入するか、またはその値に対して
指定された関数を適用することによって取得する。ある
いは、そのようにして得た値どうしを算術演算子で結合
し、その演算結果を当該フィールドの値とすることがで
きる。さらに、条件分岐を設けて、参照するフィールド
の値に応じて代入する値を判断させることにより、値の
変動幅を圧縮したり、欠損やはずれ値を含んだデータを
修正したりすることができる。
【0035】新規グループの作成においては、グループ
化次元上に新規のグループを作成し、その名称、所属グ
ループに関する定義などを設定する。すでに作成したグ
ループに対して、名称や所属グループに関する定義の設
定変更を行うことができる。
【0036】名称はグループを他と区別するための識別
子であり、ユーザが文字列を入力することによって設定
する。また所属グループに関する定義は、グループに所
属するレコードに関する条件を示すものであり、参照フ
ィールドの値に関する検索条件を、ユーザが入力した文
字列などによって設定する。検索条件は、他のグループ
への参照を指定することによって、一度記述した定義内
容を再び入力することなく、所属レコードに関する定義
を表現することができる。また、他のグループへの参照
を組み合わせることによって、複数のグループの和、差
に該当するレコードを、グループの所属レコードとして
設定することが可能である。
【0037】本データ分析支援装置は、入力された所属
グループに関する定義に応じて、各グループに所属する
レコード集合を、レコードセットに対する検索によって
取得し、グループ設定入力・ 表示部14によって表示す
る。1つの分析作業に対し、複数のレコードセットを設
定することができるが、グループ化においては単独のレ
コードセットを指定する。グループ設定入力・ 表示部1
4では、ユーザによって指定された設定値および、所属
レコードを表示する。所属レコードの表示形式として
は、レコードをリスト形式で表示するほか、ユーザが一
つまたは複数のフィールドを指定することによって、散
布図や棒グラフなどの形式とすることができる。グルー
プ設定管理部34では、グループに関する設定値および
所属レコードの表示に関する設定を保持管理する。
【0038】第四の集計ステップでは、指定されたグル
ープごと、指定されたフィールドに関してレコード集合
の集計を行う。ユーザは集計設定入力・ 表示部15を介
して、クロス集計表の行および列に対し、グループ化次
元を指定する。ただし、グループ化次元に含まれる全て
のグループがクロス集計対象となるわけではなく、グル
ープ化次元に含まれるが集計対象とすべきでないグルー
プは「非表示」とすることにより、集計から除外するこ
とができる。さらに、集計結果を表示する値として、参
照するフィールドと、集約のため適用する関数とを組に
したもの( メジャー) を設定する。メジャーを複数指定
する際には、表示する方向を行・ 列いずれかに設定す
る。これらの設定に基づき、集計設定処理部25はクロ
ス表の各セルに該当するレコードに関して、集計設定管
理部35を介してフィールド値を取得し集計計算処理を
行い、結果を集計設定入力・ 表示部15に表示する。例
えば、図2に示したように、3つのグループ化次元業
種、年齢層、性別に関してグループを定義した場合、そ
れをクロス表とした集計設定入力・ 表示部15の例を図
3に示す。ここで、グループ化次元「業種」のグループ
「無職」およびグループ化次元「年齢層」に含まれるグ
ループ「それ以下」、「10代」、「それ以上」は集計
から除外している。メジャーとしては、該当するレコー
ド数を指定した例である。
【0039】分析作業設定入力・ 表示部11において、
データソース、レコードセット、グループおよび集計に
関する設定情報をユーザの要求に応じて表示する機能を
持つようにデータ分析支援装置を構成してもよい。
【0040】また、このような機能に加え、データソー
ス、レコードセット、グループおよび集計に関する設定
値に従って取得したレコード集合や、集計結果の視覚表
現をユーザの要求に応じて表示する機能を持つようにデ
ータ分析支援装置を構成してもよい。
【0041】分析作業設定入力・ 表示部11は、図3に
示すような画面表示をもち、データソースに関する設定
値を表示するエリアと、データソース、レコードセッ
ト、グループおよび集計を選択するエリア( 分析フロー
表示・ 選択エリア) とを備えている。ユーザがデータソ
ース設定エリアにおいて「設定」ボタンをクリックする
ことにより、データソース設定を受け付けるダイアログ
が表示され、ユーザはそれを用いて対話的にデータソー
スに関する設定値を変更する。また、分析フロー表示・
選択エリアにおいてユーザが階層的に表現されたノード
のうちから、必要なものをクリックすることにより、レ
コードセット、グループおよび集計に関する設定入力・
表示オブジェクトが適宜表示され、ユーザが設定内容や
所属レコード、集計結果を閲覧したり、設定を変更した
りすることができる。
【0042】分析作業設定入力・ 表示部11は、選択さ
れたボタンまたはノードに対応するデータソース、レコ
ードセット、グループおよび集計の各設定値を設定管理
サブシステム30から取得し、該当する設定入力・ 表示
オブジェクトを設定入力・ 表示サブシステム10によっ
て表示する。この表示に対してユーザが操作を行うこと
によって、データソース、レコードセット、グループお
よび集計に関する各設定値を変更し、表示内容を更新す
ることができる。
【0043】さらにこのような画面表示となっているこ
とにより、ユーザは当該分析作業においてどのようなレ
コードセット、グループおよび集計を設定したのかを一
覧し、分析作業の振り返りや、今後必要な分析操作の検
討に寄与することができる。
【0044】また、分析フロー表示・ 選択エリアにおい
て階層的に表現された視覚表現のノードを選択し、ドラ
ッグ&ドロップ操作によって、分析結果報告書などの文
書に埋め込む機能を持つようにデータ分析支援装置を構
成してもよい。分析作業設定入力・ 表示部11は、選択
されたボタンまたはノードに対応するデータソース、レ
コードセット、グループおよび集計の各設定値を設定管
理サブシステム30から取得し、該当する設定入力・ 表
示オブジェクトを、指定された文書オブジェクト上に埋
め込み表示する。埋め込み表示の技術としては、Micros
oft 社のOLEなど、公知のコンパウンドドキュメント
構成技術を用いる。分析作業において設定された各種設
定値は、分析作業ファイル42として一括し、保存管理
する。分析作業設定入力・ 表示部11において、データ
ソースに関する設定を変更することにより、異なるデー
タソースの内容を、以前行った分析作業において定義し
たレコードセット、グループの定義に従って処理し、指
定された表示形式で表示することができる。レコードセ
ット、グループに所属するレコードに関する設定はデー
タソースの特定のフィールドに対する検索式となってい
るため、データソースを変更しても、対応するフィール
ドが適切に設定されれば、指定された定義に従ってレコ
ードを取得することができる。また、レコードセットに
関する設定を変更すれば、それを参照するグループの所
属レコード集合、集計結果は変更される。これによっ
て、一度行った分析作業の設定値を利用しながら、それ
を修正することで新たな分析対象(データソース)を分
析したり、方法を部分的に変更した分析を行うことが容
易になる。
【0045】
【発明の効果】以上説明したように、本発明によれば、
データソースの設定、レコードセットの設定、グループ
化の設定、集計の各操作を一連のデータ分析作業として
遂行することができ、効率的にデータ分析作業を行うこ
とが可能となる。
【0046】また、分析作業設定入力・ 表示部を設けた
ことにより、データソースに関する設定情報、レコード
セットに関する設定情報、グループに関する設定情報お
よび集計に関する設定情報をユーザの要求に応じて提示
できるようになり、分析作業の内容を振り返って調べた
り、必要に応じて変更したりする操作が容易に行えるよ
うになり、データ分析作業を効率化することができる。
【0047】また、データソースに関する設定情報、レ
コードセットに関する設定情報、グループに関する設定
情報および集計に関する設定情報に加え、レコードセッ
ト表示部、グループ所属レコード表示部、集計結果表示
部が生成した視覚表現をユーザの要求に応じて提示する
ことができ、分析作業の振り返り、変更を行ったり、構
成した様々な視覚表現を必要に応じて閲覧しながら、デ
ータに関し多角的な検討を行うことが容易になる。
【0048】また、データソースに関する設定情報、レ
コードセットに関する設定情報、グループに関する設定
情報および集計に関する設定情報や、レコードセット表
示部、グループ所属レコード表示部、集計結果表示部が
生成した視覚表現を選択指定し、文書作成を行うことが
できるため、分析結果を説明する報告資料の編集を効率
的に行うことが可能となる。
【図面の簡単な説明】
【図1】本発明の一実施例を示すデータ分析支援装置の
ブロック構成図である。
【図2】本発明のグループ化ステップにおけるグループ
化次元例を示す。
【図3】本発明の集計設定入力・表示部における表示例
を示す。
【符号の説明】
10 設定入力・表示サブシステム 11 分析作業設定入力・表示部 12 データソース設定入力・表示部 13 レコードセット設定入力・表示部 14 グループ設定入力・表示部 15 集計設定入力・表示部 20 設定処理サブシステム 21 分析作業設定処理部 22 データソース設定処理部 23 レコードセット設定処理部 24 グループ設定処理部 25 集計設定処理部 30 設定管理サブシステム 31 分析作業設定管理部 32 データソース設定管理部 33 レコードセット設定管理部 34 グループ設定管理部 35 集計設定管理部 41 データソース 42 分析作業ファイル

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 大量のデータ群を利用するデータ分析支
    援装置において、分析対象レコードセットを含むデータ
    ソースを取得するデータソース設定処理部と、ユーザの
    設定した設定値に基づき、分析対象レコードセットを取
    得するレコードセット設定処理部と、レコードセットの
    内容を表示するレコードセット表示部と、分析対象レコ
    ードセットから、指定された条件に該当するレコードを
    グループとして抽出するグループ設定処理部と、グルー
    プの属性およびグループに所属するレコード群を表示す
    るグループ表示部と、レコードの属性値をグループごと
    に集計する集計設定処理部と、集計結果を表示する集計
    結果表示部とを備えたことを特徴とするデータ分析支援
    装置。
  2. 【請求項2】 請求項1のデータ分析支援装置におい
    て、データソースに関する設定情報、レコードセットに
    関する設定情報、グループに関する設定情報、集計に関
    する設定情報をユーザの要求に応じて提示する分析作業
    設定入力・ 表示部を備えたことを特徴とするデータ分析
    支援装置。
  3. 【請求項3】 請求項1のデータ分析支援装置におい
    て、前記分析作業設定入力・ 表示部は、データソースに
    関する設定情報、レコードセットに関する設定情報、グ
    ループに関する設定情報、集計に関する設定情報に加
    え、前記レコードセット表示部、前記グループ表示部お
    よび前記集計結果表示部が生成した視覚表現をユーザの
    要求に応じて提示することを特徴とするデータ分析支援
    装置。
  4. 【請求項4】 請求項3に記載のデータ分析支援装置に
    おいて、前記分析作業設定入力・ 表示部は、表示された
    データソースに関する設定情報、レコードセットに関す
    る設定情報、グループに関する設定情報、集計に関する
    設定情報または、前記レコードセット表示部、前記グル
    ープ所属レコード表示部および前記集計結果表示部が生
    成した視覚表現のうちから、データ分析結果の報告資料
    に掲載するものを選択指定できることを特徴とするデー
    タ分析支援装置。
  5. 【請求項5】 大量のデータ群を利用するデータ分析支
    援装置において、分析対象レコードセットを含むデータ
    ソースを取得し、ユーザの設定した設定値に基づいて分
    析対象レコードセットを取得して、そのレコードセット
    の内容を表示し、この分析対象レコードセットから、指
    定された条件に該当するレコードをグループとして抽出
    して、グループの属性およびグループに所属するレコー
    ド群を表示するとともに、レコードの属性値をグループ
    ごとに集計した集計結果を表示するようにしたことを特
    徴とするデータ分析支援方法。
  6. 【請求項6】 少なくとも1台のコンピュータを含むコ
    ンピュータシステムによって実行されて、前記コンピュ
    ータシステムに、大量のデータ群の中から分析対象レコ
    ードセットを含むデータソースを取得するデータソース
    設定処理機能と、ユーザの設定した設定値に基づき、分
    析対象レコードセットを取得するレコードセット設定処
    理機能と、レコードセットの内容を表示するレコードセ
    ット表示機能と、分析対象レコードセットから、指定さ
    れた条件に該当するレコードをグループとして抽出する
    グループ設定処理機能と、グループの属性およびグルー
    プに所属するレコード群を表示するグループ表示機能
    と、レコードの属性値をグループごとに集計する集計設
    定処理機能と、集計結果を表示する集計結果表示機能と
    を実現するデータ分析支援装置として機能するためのプ
    ログラムを記録したコンピュータ読み取り可能な記録媒
    体。
JP2000384442A 2000-12-18 2000-12-18 データ分析支援装置、その方法および記憶媒体 Pending JP2002183178A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000384442A JP2002183178A (ja) 2000-12-18 2000-12-18 データ分析支援装置、その方法および記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000384442A JP2002183178A (ja) 2000-12-18 2000-12-18 データ分析支援装置、その方法および記憶媒体

Publications (1)

Publication Number Publication Date
JP2002183178A true JP2002183178A (ja) 2002-06-28

Family

ID=18851896

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000384442A Pending JP2002183178A (ja) 2000-12-18 2000-12-18 データ分析支援装置、その方法および記憶媒体

Country Status (1)

Country Link
JP (1) JP2002183178A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7490287B2 (en) 2004-04-28 2009-02-10 Kabushiki Kaisha Toshiba Time series data analysis apparatus and method
JP2013534674A (ja) * 2010-06-28 2013-09-05 アルカテル−ルーセント 高次元層別サンプリング
JP2020119563A (ja) * 2020-01-17 2020-08-06 株式会社Strategy Partners マーケティング支援システム、マーケティング支援方法、及びプログラム
JP2020166865A (ja) * 2020-04-14 2020-10-08 株式会社Strategy Partners マーケティング支援システム、マーケティング支援方法、及びプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7490287B2 (en) 2004-04-28 2009-02-10 Kabushiki Kaisha Toshiba Time series data analysis apparatus and method
JP2013534674A (ja) * 2010-06-28 2013-09-05 アルカテル−ルーセント 高次元層別サンプリング
US9047362B2 (en) 2010-06-28 2015-06-02 Alcatel Lucent High-dimensional stratified sampling
JP2020119563A (ja) * 2020-01-17 2020-08-06 株式会社Strategy Partners マーケティング支援システム、マーケティング支援方法、及びプログラム
JP2020166865A (ja) * 2020-04-14 2020-10-08 株式会社Strategy Partners マーケティング支援システム、マーケティング支援方法、及びプログラム

Similar Documents

Publication Publication Date Title
JP6580737B2 (ja) データ検索装置、データ検索方法、データ検索プログラム、及び記録媒体
US11675781B2 (en) Dynamic dashboard with guided discovery
US9866561B2 (en) Enhanced user interface and data handling in business intelligence software
US7464096B2 (en) Method and apparatus for information mining and filtering
US7818286B2 (en) Computer-implemented dimension engine
US20120036463A1 (en) Metric navigator
US8190620B2 (en) Apparatus and method for visualizing data within a decomposition graph
CN103678468B (zh) 用于概要分析的改进的消费模型的系统和方法
KR20170098854A (ko) 보고 생성 방법
US7243106B2 (en) Static drill-through modelling
US7937415B2 (en) Apparatus and method for stripping business intelligence documents of references to unused data objects
US11809459B2 (en) Using objects in an object model as database entities
Tešendić et al. Business intelligence in the service of libraries
JP6375029B2 (ja) レポートの重要度を分析するメタデータ基盤のオンライン分析処理システム
Vogelgesang et al. PMCube: a data-warehouse-based approach for multidimensional process mining
EP1814048A2 (en) Content analytics of unstructured documents
US20100293507A1 (en) Method and system for creating report using object-oriented program
JP2002183178A (ja) データ分析支援装置、その方法および記憶媒体
US10990255B1 (en) Hierarchical data display
US20130218893A1 (en) Executing in-database data mining processes
JP2023063180A (ja) データ管理システム、データ管理方法及びデータ管理プログラム
KR101575797B1 (ko) 특허문서의 열람 작업 로그 시스템 및 그 방법
Shrinivasan et al. Supporting exploratory analysis with the select & slice table
US20040199528A1 (en) Apparatus and computer program for managing database
US20070299861A1 (en) System and method for managing large OLAP in an analytical context