JP6550304B2 - 集計分析装置、集計分析方法、及びプログラム - Google Patents

集計分析装置、集計分析方法、及びプログラム Download PDF

Info

Publication number
JP6550304B2
JP6550304B2 JP2015176601A JP2015176601A JP6550304B2 JP 6550304 B2 JP6550304 B2 JP 6550304B2 JP 2015176601 A JP2015176601 A JP 2015176601A JP 2015176601 A JP2015176601 A JP 2015176601A JP 6550304 B2 JP6550304 B2 JP 6550304B2
Authority
JP
Japan
Prior art keywords
section
cross
statistical analysis
unit
strength
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015176601A
Other languages
English (en)
Other versions
JP2017054230A (ja
Inventor
健典 亘
健典 亘
文涛 欧
文涛 欧
経太 難波
経太 難波
佐藤 新
新 佐藤
元英 加藤
元英 加藤
裕 松島
裕 松島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP2015176601A priority Critical patent/JP6550304B2/ja
Publication of JP2017054230A publication Critical patent/JP2017054230A/ja
Application granted granted Critical
Publication of JP6550304B2 publication Critical patent/JP6550304B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、集計分析装置、集計分析方法、及びプログラムに関する。
近年、ビッグデータを用いてデータ分析し、社会問題や経済問題の解決、および業務支援や業務の付加価値向上等を図る取り組みが行われている。ビッグデータを用いたデータ分析は、膨大な量のデータ、かつ、様々な分野のデータを分析対象とする。そのため、ビッグデータを用いたデータ分析によって、従来では気づき得なかった新たな価値を発掘することが可能であると言われている。
データ分析においては、例えば、クロス集計が用いられる。クロス集計では、集計の軸(以下、集計軸とも言う)となるデータ項目(例えば、「地域」や「性別」等の項目)が2つ以上選択され、集計対象値(以下、指標値とも言う)となるデータ項目が1つ選択される。そして、選択された集計軸に基づいて指標値を集計した集計結果に、統計的に有意な関係性があるか否かの確認がなされる。なお、集計軸であるデータ項目と、この集計軸に基づいて集計される指標値のデータ項目とを併せて、以下「断面」と称する。
しかしながら、データ項目数が増えるほど、集計軸および指標値となるデータ項目の組み合わせが指数関数的に増加する。そのため、データ分析を行うアナリストにとって、有意な関係性があると考えられる集計軸および指標値の組み合わせを、効率良く、かつ漏れなく抽出することがより困難になる。このようなアナリストのデータ分析を支援するため、特許文献1に記載の分析軸推薦システムは、所定の閾値以上の関連度があるデータ項目を自動で抽出する。
特開2012−103841号公報
特許文献1に記載の分析軸推薦システムは、データ項目の関連度を数式化して表す。そのため、分析対象のデータが同一ならば、データ分析するアナリストが誰であるかに関わらず、必ず同じ分析結果が導き出される。
しかしながら、実際のデータ分析では、分析するアナリストによって、重視される統計学的な特徴(以下、統計的特徴と言う)が異なることがある。例えば、集計の軸となるデータ項目間の相関関係を重視するアナリストもいれば、指標値の平均値からの乖離の度合いを重視するアナリストもいる。
また、実際のデータ分析では、分析の段階によって、重視される統計的特徴が異なることがある。例えば、アナリストが行うデータ分析が、全体を把握するための基礎分析の段階であるか、または、テーマを絞り込んだ後の詳細分析の段階であるか、等によって、重視される統計的特徴が異なることがある。
また、実際のデータ分析では、アナリストが行う業務によって、重視される統計的特徴が異なることがある。例えば、アナリストが行う業務が、マーケティング業務であるか、または、業務改善活動であるか、等によって、重視される統計的特徴が異なることがある。
したがって、どのアナリストに対しても常に同じ分析結果が提示されることは、必ずしも有効ではなく、むしろビッグデータに含まれる新たな価値を発掘し損なうことに繋がる場合がある。
本発明は上記の点に鑑みてなされたものであり、アナリストが重視する統計的特徴を把握し、把握した統計的特徴を有する断面であってアナリストが抽出していない未知の断面を提示しやすくすることができる集計分析装置、集計分析方法、及びプログラムを提供する。
(1)本発明は上記の課題を解決するためになされたものであり、本発明の一態様としては、多次元データを記憶する記憶部と、前記多次元データに含まれるデータ項目である集計軸と前記多次元データに含まれ前記集計軸に基づいて集計されるデータ項目である指標値との組み合わせである断面について、複数の統計解析手法による統計解析を行ったときの前記統計解析手法に応じた統計的な特徴の強さを表す強度を前記統計解析手法ごとに算出する強度算出部と、前記強度算出部が前記統計解析手法ごとに算出した前記断面ごとの前記強度に基づいて、前記統計解析手法ごとに高い前記強度を有する前記断面で前記多次元データを集計した結果である代表的断面を提示する代表的断面提示部と、前記代表的断面提示部による提示に応じて選択された前記断面を取得する選択結果取得部と、前記選択された断面に対応する前記統計解析手法において、高い前記強度を有する他の断面をレコメンドする断面提示部と、を備えることを特徴とする集計分析装置である。
(2)また、本発明の一態様としては、前記断面提示部は、前記統計解析手法ごとに設定される所定の閾値以上の前記強度である前記断面を提示する、ことを特徴とする(1)に記載の集計分析装置である。
(3)また、本発明の一態様としては、前記断面提示部は、前記統計解析手法ごとに、前記強度の異なる前記断面を複数提示し、提示に応じて選択された前記断面に基づいて前記所定の閾値を設定する、ことを特徴とする(2)に記載の集計分析装置である。
(4)また、本発明の一態様としては、前記断面提示部は、前記強度算出部によって前記統計解析手法ごとに算出された前記断面ごとの前記強度を前記統計解析手法ごとに基準化した基準化強度を算出し、前記基準化強度に基づいて前記断面をレコメンドする、
ことを特徴とする(1)に記載の集計分析装置である。
(5)また、本発明の一態様としては、異なる複数の前記統計解析手法において、同一の断面ごとに前記強度を複合した複合強度を算出する複合強度算出部を備え、前記断面提示部は、前記複合強度算出部によって算出された前記複合強度の値に基づいて前記断面をレコメンドする、ことを特徴とする(1)に記載の集計分析装置である。
(6)また、本発明の一態様としては、前記代表的断面提示部による提示に応じて選択された複数の前記断面において、前記断面を構成する共通の項目を含む場合、前記断面提示部は前記共通の項目を含む他の前記断面をレコメンドする、ことを特徴とする(1)に記載の集計分析装置である。
(7)また、本発明の一態様としては、多次元データを記憶する記憶ステップと、前記多次元データに含まれるデータ項目である集計軸と前記多次元データに含まれ前記集計軸に基づいて集計されるデータ項目である指標値との組み合わせである断面について、複数の統計解析手法による統計解析を行ったときの前記統計解析手法に応じた統計的な特徴の強さを表す強度を前記統計解析手法ごとに算出する強度算出ステップと、前記強度算出ステップにおいて前記統計解析手法ごとに算出された前記断面ごとの前記強度に基づいて、前記統計解析手法ごとに高い前記強度を有する前記断面で前記多次元データを集計した結果である代表的断面を提示する代表的断面提示ステップと、前記代表的断面提示ステップにおける提示に応じて選択された前記断面を取得する選択結果取得ステップと、前記選択された断面に対応する前記統計解析手法において、高い前記強度を有する他の断面をレコメンドする断面提示ステップと、を有することを特徴とする集計分析方法である。
(8)また、本発明の一態様としては、コンピュータに、多次元データを記憶する記憶ステップと、前記多次元データに含まれるデータ項目である集計軸と前記多次元データに含まれ前記集計軸に基づいて集計されるデータ項目である指標値との組み合わせである断面について、複数の統計解析手法による統計解析を行ったときの前記統計解析手法に応じた統計的な特徴の強さを表す強度を前記統計解析手法ごとに算出する強度算出ステップと、前記強度算出ステップにおいて前記統計解析手法ごとに算出された前記断面ごとの前記強度に基づいて、前記統計解析手法ごとに高い前記強度を有する前記断面で前記多次元データを集計した結果である代表的断面を提示する代表的断面提示ステップと、前記代表的断面提示ステップにおける提示に応じて選択された前記断面を取得する選択結果取得ステップと、前記選択された断面に対応する前記統計解析手法において、高い前記強度を有する他の断面をレコメンドする断面提示ステップと、を実行させるためのプログラムである。
本発明によれば、アナリストが重視する統計的特徴を把握し、把握した統計的特徴を有する断面であってアナリストが抽出していない未知の断面を提示しやすくすることができる。
第1の実施形態に係る集計分析装置の機能構成を示すブロック図である。 第1の実施形態に係る集計分析装置の表示部が表示する集計実行指示の入力画面を示す図である。 第1の実施形態に係る集計分析装置の統計解析部が相関分析によって解析した結果を示す図である。 第1の実施形態に係る集計分析装置の統計解析部が独立性検定によって解析した結果を示す図である。 第1の実施形態に係る集計分析装置の統計解析部が指標値の平均値からの乖離度を解析した結果を示す図である。 第1の実施形態に係る集計分析装置の強度算出部が強度を算出した結果を示す図である。 第1の実施形態に係る集計分析装置の表示部に表示される代表的断面提示画面を示す図である。 第1の実施形態に係る集計分析装置の表示部に表示されるレコメンド結果提示画面を示す図である。 第1の実施形態に係る集計分析装置の動作を示すフローチャートである。 第2の実施形態に係る集計分析装置の断面提示部が強度に基づいて断面を並べ替えた状態を表す図である。 第3の実施形態に係る集計分析装置の断面提示部が強度に基づいて基準化強度を算出した状態を表す図である。 第4の実施形態に係る集計分析装置の複合強度算出部が複合強度を算出した状態を表す図である。
(第1の実施形態)
第1の実施形態に係る集計分析装置1は、多次元データをデータ項目ごとに集計する。多次元データとは、多数(2以上)の次元によって構成される超直方体の論理構造を有するデータである。
集計分析装置1は、少なくとも2つのデータ項目を集計の軸(以下、「集計軸」とも言う)とし、少なくとも1つのデータ項目を集計対象値となるデータ項目である「指標値」として、集計を行う。各集計軸は、多次元データにおける各次元に対応する。
例えば、「地域」ごと、および「性別」ごとの「購入金額」を集計する場合には、「地域」および「性別」が集計軸であり、「購入金額」が指標値である。この例においては、次元は2次元である。
また、上述したように、集計軸であるデータ項目と、この集計軸により集計された指標値との組み合わせを、「断面」と称する。集計軸と指標値との組み合わせである断面は、上記の多次元データに対応する超直方体を、複数の集計軸によって成る超面に射影(projection)したものに相当する。上記の例においては、「断面」は、「地域ごとおよび性別ごとの購入金額」である。
そして、集計分析装置1は、上記の集計によって得られた集計結果に基づいて、各種の統計解析手法を用いて「強度」を分析する。強度とは、統計解析手法特有の特徴の強さを表す。例えば、統計解析手法が相関分析である場合には、強度は、相関係数の絶対値の大きさである。例えば、その他の統計解析手法として、独立性検定、および指標値の平均値からの乖離度の分析等がある。
すなわち、集計分析装置1は、統計解析手法ごとに、「断面」ごとの「強度」を分析する。上記の例においては、統計解析手法が相関分析であるならば、集計分析装置1は、「地域」と「性別」とを集計軸とし「購入金額」を指標値として相関分析を行い、「地域」と「性別」との間の相関係数の絶対値の大きさである強度を分析する。
集計分析装置1は、各統計解析手法による統計解析においてそれぞれ強度が高かった断面と、当該断面の中から任意の断面を選択可能な選択画面とをアナリスト(分析者)へ提示する。集計分析装置1は、アナリストにより当該選択画面によって選択された断面に対応する統計解析手法によって解析される統計的特徴が、アナリストによって重視される統計的特徴であると判定する。そして、集計分析装置1は、アナリストによって重視されると判定した統計的特徴に対応する統計解析手法による統計解析結果であって、強度が高い他の断面をアナリストへ提示する。
以下、図面を参照しながら詳細に説明する。
図1は、第1の実施形態に係る集計分析装置1の機能構成を示すブロック図である。
第1の実施形態に係る集計分析装置1は、入出力部11と、集計分析部12と、分析対象データ格納部13と、重要特徴取得部14と、レコメンド部15とを含んで構成される。
入出力部11は、アナリストからの操作入力を受け付けて、操作入力に基づいてデータを生成し、集計分析部12または重要特徴取得部14へ出力する。また、入出力部11は、重要特徴取得部14、またはレコメンド部15から入力されたデータに基づいて入出力画面を形成し、当該入出力画面をアナリストへ提示する。
入出力部11は、例えば、タッチパネル式のディスプレイ、または入力ボタンと液晶ディスプレイ等を含んで構成される。
集計分析部12は、入出力部11から入力されたデータに基づいて、分析対象データ格納部13から、特定のデータ項目を含む分析対象データを取得する。
集計分析部12は、取得した分析対象データを用いて、集計および各種の統計解析を行い、統計解析手法ごとの断面を算出する。集計分析部12は、統計解析手法ごとの断面を示すデータを、重要特徴取得部14へ出力する。
集計分析部12は、例えば、OLAP(On−line Analytical Processing;オンライン分析処理)を含んで構成される。OLAPとは、例えば、企業が顧客データや販売データを蓄積したデータベースを多次元的に解析し、視覚化するシステムである。OLAPは、DWH(Data WareHouse;データウェアハウス)等のデータベースから取得した大量の多次元データを、様々な角度から検索および集計して、問題点や解決策を発見する。例えば、OLAPは、顧客の購入履歴を解析し、売上を地域別、製品別、または月別等、様々な次元から瞬時に分析することができる。また、DWHとは、例えば、基幹系業務システムからトランザクション(取引)データ等を抽出および再構成して蓄積し、情報分析や意思決定支援に最適化された大規模データベースのことである。
分析対象データ格納部13(記憶部)は、集計分析装置1が集計分析する分析対象データが含まれるデータベースを記憶する。分析対象データ格納部13は、集計分析部12からの要求に応じて、分析対象データを集計分析部12へ出力する。
分析対象データ格納部13は、例えば、上述したDWHを含んで構成される。
重要特徴取得部14は、集計分析部12から入力されたデータに基づいて、各統計解析手法による統計解析においてそれぞれ強度が高かった断面を示すデータを入出力部11へ出力する。また、重要特徴取得部14は、当該断面の中から任意の断面を選択可能な選択画面を入出力部11に表示させる。
重要特徴取得部14は、入出力部11から入力されたデータ、すなわち、アナリストによって選択された断面を示すデータを取得する。重要特徴取得部14は、この断面に対応する統計解析手法によって解析される統計的特徴を、アナリストによって重視される統計的特徴であると判定する。重要特徴取得部14は、アナリストによって重視されると判定した統計的特徴に対応する統計解析手法を示すデータを、レコメンド部15へ出力する。
レコメンド部15は、重要特徴取得部14から入力された、アナリストによって重視されると判定された統計的特徴に対応する統計解析手法を示すデータを取得する。レコメンド部15は、当該統計解析手法において強度が高い断面であって、かつ、まだアナリストへ提示していない他の断面を示すデータを入出力部11へ出力する。
以下、上記の各機能ブロックについて、図1乃至図8を参照して実施例を交えながら更に詳細に説明する。
入出力部11は、操作入力部111と、表示部112と、を含んで構成される。
まず、表示部112には、集計実行指示の入力画面が表示される。
図2は、第1の実施形態に係る集計分析装置1の表示部112が表示する集計実行指示の入力画面を示す図である。
集計実行指示の入力画面には、「サーバー名」、「データベース名」、「テーブル名」、「ユーザー名」、および「パスワード」の入力欄と、実行ボタンが含まれる。
アナリストによって、上記の5つの入力欄に情報が入力される。
「テーブル名」の入力欄には、集計対象とするデータが含まれるテーブルを識別する情報が入力される。
「データベース名」の入力欄には、「テーブル名」の入力欄において入力されるテーブルが含まれるデータベースを識別する情報が入力される。
「サーバー名」の入力欄には、「データベース名」の入力欄において入力されるデータベースが含まれるサーバーを識別する情報が入力される。なお、本実施形態においては、分析対象データ格納部13を識別する情報が入力される。本実施形態においては、分析対象データ格納部13は集計分析装置1の中に含まれる構成であるが、分析対象データ格納部13は集計分析装置1の外部の他の装置に含まれる構成であっても構わない。
「ユーザー名」の入力欄には、アナリストを識別する情報(例えば、氏名、または識別子)が入力される。
「パスワード」の入力欄には、アナリスト認証するためのパスワードを示す情報が入力される。
アナリストにより、上記5つの入力欄に情報が入力され、実行ボタンが押下される。
再び図1に戻って説明する。
実行ボタンが押下されると、操作入力部111は、「ユーザー名」、および「パスワード」の入力欄に入力された情報を、認証部(図示せず)に出力する。認証部(図示せず)は、操作入力部111から入力された情報に基づいて、認証処理を実行する。認証が成功した場合には、操作入力部111は、「サーバー名」、「データベース名」、および「テーブル名」の入力欄に入力された情報を、後述する集計部121へ出力する。
集計分析部12は、集計部121と、統計解析部122と、強度算出部123と、を含んで構成される。
集計部121は、操作入力部111から入力された「サーバー名」、「データベース名」、および「テーブル名」を示す情報に基づいて、分析対象データ格納部13に記憶された集計対象とするデータ(以下、集計対象データと言う)を特定する。集計部121は、特定した集計対象データを、分析対象データ格納部13から取得する。
集計対象データには、n個のデータ項目が含まれる。これらのデータ項目には、例えば、「地域」、「性別」、「年齢」、「年収」、「購入商品」、「購入数量」、および「購入金額」等を示すデータ項目が含まれる。
集計部121は、集計対象データに含まれるデータ項目の中から、少なくとも2個以上の個数であって、予め設定された個数(m個)のデータ項目を選択する。この選択されたm個のデータ項目は、集計軸となるデータ項目である。以下、説明を簡単にするため、本実施形態においては、集計部121は集計軸とするデータ項目を2つ選択する。すなわち、本実施形態における集計対象データは、2次元のデータであるものとする。
また、集計部121は、集計対象データのデータ項目の中から、指標値とするデータ項目を1つ選択する。なお、指標値とするデータ項目は、上記で選択した集計軸とする2個のデータ項目以外のデータ項目から選択される。
すなわち、以上により、集計対象データから1つの「断面」が選択される。
集計部121は、指標値とするデータ項目に対して、集計軸とする2つのデータ項目によってクロス集計を行う。例えば、集計部121は、「購入金額」に対して、「地域」と「性別」によってクロス集計を実行する。
集計部121は、上記のクロス集計を、集計対象データにおいて、選択可能な全てのデータ項目の組み合わせについて実行する。すなわち、指標値とするデータ項目(最大n個)ごとに、最大(n−1)Cm個の場合の数(本実施形態においては、最大(n−1)C2個の場合の数)に相当する集計軸の組み合わせが存在する。なお、最大(n−1)Cm個となるのは、指標値とするデータ項目を除いたデータ項目(n−1個)の中から、集計軸(m個)を選択するからである。
以上により、集計部121は、集計対象データに含まれる選択可能な全ての「断面」についてクロス集計を実行する。
なお、実際には、データ項目の値のデータ形式が、数値型であったり、文字列型であったりすることにより、全てのデータ項目が、集計軸または指標値として選択可能なデータ項目であるとは限らない。
集計部121は、各「断面」と、「断面」ごとのクロス集計結果とを示すデータを、統計解析部122へ出力する。
統計解析部122は、集計部121から入力されたデータに基づいて、各種の統計解析手法を用いて、断面ごとに解析する。
本実施形態においては、統計解析部122は、相関分析、独立性検定、および指標値の平均値からの乖離度の算出、の3つの統計解析手法を用いる。なお、これらの統計解析手法は一例であり、本実施形態に係る集計分析装置1が用いる統計解析手法は、これらの手法に限られるものではない。また、集計分析装置1が用いる統計解析手法は3つに限られるものではなく、集計分析装置1は、2つ、または4つ以上の統計解析手法を用いてもよい。
図3は、第1の実施形態に係る集計分析装置1の統計解析部122が相関分析によって解析した結果を示す図である。
図示するように、「断面1」における集計軸間の相関分析による解析結果は「0.9」である。同様に、「断面2」、「断面3」、「断面4」、「断面5」、および「断面6」におけるそれぞれの集計軸間の相関分析による解析結果は、それぞれ「0.8」、「−0.7」、「0.7」、「−0.6」、および「0.5」である。
図4は、第1の実施形態に係る集計分析装置1の統計解析部122が独立性検定によって解析した結果を示す図である。
図示するように、「断面1」における集計軸間の独立性検定による解析結果のP値は「0.8」である。なお、P値とは、独立性検定において、実際に観測された分布が理論的に予想される分布にどれだけ近づいているかを表す確率を示す値である。同様に、「断面2」、「断面3」、「断面4」、「断面5」、および「断面6」におけるそれぞれの集計軸間の相関分析による解析結果は、それぞれ「0.02」、「0.4」、「0.8」、「0.9」、および「0.9」である。
図5は、第1の実施形態に係る集計分析装置1の統計解析部122が指標値の平均値からの乖離度を解析した結果を示す図である。なお、指標値の平均値からの乖離度の解析は、次のように行われる。
各断面におけるクロス集計の集計値をX、集計値の平均値をμ、および集計値の標準偏差をσとする。そして、各集計値Xについて、X−μの値の絶対値を求め、その絶対値を3σによって除算した値を算出する。そして、算出した値の中で最も大きい値を、各断面における、指標値の平均値からの乖離度とする。すなわち、指標値の平均値からの乖離度は、Max[|X−μ|/3σ]の式によって求められる。なお、σが0の場合には、指標値の平均値からの乖離度は0とする。
図示するように、「断面1」における集計軸間の、指標値の平均値からの乖離度の算出結果は「0」である。同様に、「断面2」、「断面3」、「断面4」、「断面5」、および「断面6」におけるそれぞれの集計軸間の相関分析による解析結果は、それぞれ「0.74」、「0.61」、「1.1」、「0.58」、および「0.98」である。
統計解析部122は、上記3つの統計解析手法による解析結果を示すデータを、強度算出部123へ出力する。
強度算出部123は、統計解析部122から入力されたデータに基づいて、統計解析手法ごと(すなわち、統計的特徴ごと)に、断面の強度を算出する。強度算出部123は、断面の強度の算出を以下のようにして行う。
統計解析手法が相関分析の場合、強度算出部123は、解析結果の値の絶対値を強度とする。
統計解析手法が独立性検定の場合、強度算出部123は、独立性検定の結果のP値を「1」から差し引いた値を強度とする。
統計解析手法が指標値の平均値からの乖離度の解析の場合、強度算出部123は、上記で算出した指標値の平均値からの乖離度の値を、次のルールに従って変換した値を強度とする。強度算出部123は、上記で算出した指標値の平均値からの乖離度の値が1以上である場合には、強度は1とする。そうでない場合には、上記で算出した指標値の平均値からの乖離度の値を強度とする。
上記の処理によって、図3乃至図5に示した解析結果から強度を算出した結果を図6に示す。
図6は、第1の実施形態に係る集計分析装置1の強度算出部123が強度を算出した結果を示す図である。
図6に図示するように、特徴1(相関分析による統計的特徴)においては、「断面1」の強度の値は、図3に示した特徴1における「断面1」の解析結果の値「0.9」の絶対値である「0.9」となる。同様に、「断面2」、「断面3」、「断面4」、「断面5」、および「断面6」の強度の値は、図3に示した特徴1における「断面2」、「断面3」、「断面4」、「断面5」、および「断面6」のそれぞれの解析結果の値「0.8」、「−0.7」、「0.7」、「−0.6」、および[0.5」の絶対値である「0.8」、「0.7」、「0.7」、「0.6」、および[0.5」となる。
また、図6に図示するように、特徴2(独立性検定よる統計的特徴)においては、「断面1」の強度の値は、図4に示した特徴2における「断面1」の解析結果の値「0.8」を1から差し引いた値である「0.2」となる。同様に、「断面2」、「断面3」、「断面4」、「断面5」、および「断面6」の強度の値は、図4に示した特徴1における「断面2」、「断面3」、「断面4」、「断面5」、および「断面6」のそれぞれの解析結果の値「0.02」、「0.4」、「0.8」、「0.9」、および[0.9」を1から差し引いた値である「0.98」、「0.6」、「0.2」、「0.1」、「および[0.1」となる。
図6に図示するように、特徴3(指標値の平均値からの乖離度による統計的特徴)においては、「断面1」の強度の値は、図4に示した特徴3における「断面1」、「断面2」、「断面3」、「断面4」、「断面5」、および「断面6」のそれぞれの解析結果の値「0」、「0.74」、「0.61」、「1.1」、「0.58」、および[0.97」に基づいて、「0」、「0.74」、「0.61」、「1」、「0.58」、および[0.97」となる。なお、「断面1」は解析結果の値の平均値が0であるため、強度は「0」となる。また、「断面4」は解析結果の値が1以上の値である「1.1」であるため、強度は「1」となる。
強度算出部123は、上記の処理によって算出した、各統計解析手法における、断面と断面ごとの強度とを示すデータを、重要特徴取得部14の、後述する代表的断面提示部141へ出力する。
重要特徴取得部14は、代表的断面提示部141と、選択結果取得部142と、重要特徴判定部143と、を含んで構成される。
代表的断面提示部141は、強度算出部123から入力されたデータに基づいて、代表的断面を生成する。代表的断面提示部141は、生成した代表的断面を、表示部112を介してアナリストへ提示する。また、代表的断面提示部141は、生成した代表的断面を、選択結果取得部142へ出力する。
代表的断面は、強度算出部123から代表的断面提示部141へ出力されたデータのうち、統計解析手法ごとに、強度が最も高い断面と、当該断面における集計結果を示すデータである。
図7は、第1の実施形態に係る集計分析装置1の表示部112に表示される代表的断面提示画面を示す図である。
図示するように、代表的断面提示画面には、3つの表が表示される。
上段の表は、特徴1における、強度が最も高い断面の集計結果を示す表である。図示するように、この断面において、集計軸は「地域」、および「年代」であり、指標値は「消費額」の合計値である。上段の表には、「地域ごとおよび年代ごとの、消費額の合計値」を示す集計結果データの一部が表示される。
また、中段の表は、特徴2における、強度が最も高い断面の集計結果を示す表である。図示するように、この断面において、集計軸は「商品」、および「発売年」であり、指標値は「数量」の合計値である。上段の表には、「商品ごとおよび発売年ごとの、数量の合計値」を示す集計結果データの一部が表示される。
また、下段の表は、特徴3における、強度が最も高い断面の集計結果である。図示するように、この断面において、集計軸は「支払方法」、および「地域」であり、指標値は「注文数」の合計値である。上段の表には、「支払方法ごとおよび地域ごとの、注文数の合計値」を示す集計結果データの一部が表示される。
なお、上記の例においては、合計値を示すデータが表示された場合について説明したが、集計方法は合計値の算出に限られるものではない。例えば、平均値、数値割合の値、または件数割合の値を示すデータが表示されることもある。
また、複数の集計方法が存在する場合には、集計方法自体も断面を構成する要素となりうる。そのため、強度の高い断面を算出する際には、集計方法ごとに断面を算出することとしてもよい。
3つの表それぞれの下部の表示領域には、「詳細表示」ボタンが表示される。アナリストによって、操作入力部111を介してこの「詳細表示」ボタンが押下されると、表示部112には、代表的断面の一部だけでなく、全部が表示される。これにより、アナリストは、各断面の代表的断面の詳細を確認することができる。
また3つの表それぞれの右側下部の表示領域には、「1(または2、3)の集計結果はいかがでしょうか。」という文言、および「OK」または「NG」を選択させる選択入力ボタン(例えば、ラジオボタン)が表示される。これにより、アナリストは、代表的断面を参照した結果、自身が重視する統計的特徴が表れている断面を選択する。すなわち、アナリストは、自身が重視する統計的特徴が表れている断面の集計結果データに対し、操作入力部111を介して、「OK」の選択入力ボタンを押下する。
そして、アナリストにより、操作入力部111を介して、代表的断面提示画面の右下の部分に表示されている「レコメンド結果抽出」ボタンが押下される。
再び、図1に戻って説明する。
「レコメンド結果抽出」ボタンが押下されると、操作入力部111は、選択結果取得部142へ、押下された選択入力ボタンを示すデータを出力する。
選択結果取得部142は、代表的断面提示部141から入力された代表的断面、および操作入力部111から入力されたデータに基づいて、アナリストによって選択された断面、および当該断面に対応する統計的特徴を特定する。選択結果取得部142は、特定した統計的特徴に対応する統計解析手法を示すデータを、重要特徴判定部143へ出力する。
重要特徴判定部143は、選択結果取得部142から入力されたデータに基づいて、アナリストによって重視される統計的特徴を判定する。本実施形態においては、重要特徴判定部143は、入力されたデータに基づく統計的特徴は全て、アナリストによって重視される統計的特徴であると判定する。すなわち、重要特徴判定部143は、アナリストによって操作入力部111により選択された断面に対応する統計解析手法によって解析される統計的特徴は全て、アナリストによって重視される統計的特徴であると判定する。
図7に示す例においては、上段および下段に表示された断面に対して、アナリストによって選択されている(すなわち、「OK」を示すボタンが押下されている)。また、中段に表示された断面に対しては、アナリストによって選択がされていない(すなわち、「NG」を示すボタンが押下されている)。
したがって、重要特徴判定部143は、上段の断面に対応する「特徴1」と下段の断面に対応する「特徴3」とを、アナリストによって重視される統計的特徴であると判定する。
なお、統計的特徴に対して予め優先順位が付けられていてもよい。例えば、アナリストによって断面が複数選択されることによって、当該断面に対応する統計解析手法によって解析される統計的特徴が複数ある場合に、重要特徴判定部143は、優先順位のより高い統計的特徴を、アナリストによって重視される統計的特徴であると判定するようにしてもよい。
再び図1に戻って説明する。
重要特徴判定部143は、判定した統計的特徴に対応する統計解析手法を示すデータを、レコメンド部15の後述する断面提示部151へ出力する。
レコメンド部15は、断面提示部151と、複合強度算出部152とを含んで構成される。なお、複合強度算出部152は、後述する第4の実施形態において説明する。
断面提示部151は、重要特徴判定部143から入力されたデータに基づく統計解析手法において、代表的断面としてアナリストへ提示された断面以外の断面の中で、強度が高い断面を所定のルールに基づいて選択する。なお、所定のルール(以下、レコメンドルールと言う)については後述する。断面提示部151は、選択した断面を、レコメンド結果として表示部112を介してアナリストへ提示する。
図8は、第1の実施形態に係る集計分析装置1の表示部112に表示されるレコメンド結果提示画面を示す図である。
図示するように、レコメンド結果提示画面には、所定のルールに基づいて選択された断面が表示されている。例えば、図8において最上段に表示されている断面は、「性別ごとおよび地域ごとの、注文数の合計値」である。また2段目に表示されている断面は、「性別ごとおよび商品ごとの、消費額の平均値」である。
なお、上記の例においては、「合計値」および「平均値」に関するレコメンド結果が表示された場合について説明したが、これに限られるものではない。例えば、「数値割合」、または「件数割合」に関するレコメンド結果が表示されることもある。
各断面が表示された表示領域の右側には、それぞれ「詳細表示」ボタンが表示される。アナリストによってこの「詳細表示」ボタンが押下されると、断面の集計結果データを含む詳細画面(図示せず)が表示される。これにより、アナリストは、レコメンドされた断面の詳細な情報を確認することができる。
(第1の実施形態におけるレコメンドルール)
以下、本実施形態におけるレコメンドルールについて説明する。
断面提示部151は、統計解析手法ごとに、強度の値の閾値である閾値Siを、予め保持している。この閾値Siは、例えば、過去の集計分析における経験に基づいて事前に設定される。そして、断面提示部151は、統計解析手法ごとに、閾値Si以上の強度を有する断面であって、代表的断面として提示していない断面を、アナリストへ提示する。
なお、断面提示部151が、代表的断面として提示した断面も含めて、断面をアナリストへ提示するようにしてもよい。
例えば、断面提示部151は、特徴1の閾値S1を「0.7」、および特徴3の閾値S3を「0.9」と事前に設定しているものとする。そして、図6に例示する強度の算出結果の場合、特徴1において閾値S1以上の強度を有する断面は、「断面1」、「断面2」、「断面3」、および「断面4」である。また、特徴3において閾値S3以上の強度を有する断面は、「断面4」、および「断面6」である。
なお、上述したように、断面提示部151は、「断面1」、「断面2」、および「断面4」を代表的断面として既にアナリストへ提示している。したがって、断面提示部151は、「断面3」、および「断面6」を、レコメンド結果としてアナリストへ提示する。
(集計分析装置の動作)
次に集計分析装置1の動作について説明する。
図9は、本実施形態に係る集計分析装置1の動作を示すフローチャートである。
本フローチャートは、操作入力部111から集計部121へ、アナリストによって指定された集計対象データを示すデータが出力された際に開始する。
(ステップS101)集計部121は、操作入力部111から入力されたデータに基づいて、分析対象データ格納部13に記憶された集計対象データを取得する。その後、ステップS102へ進む。
(ステップS102)集計部121は、取得した集計対象データにおいて、集計軸とするデータ項目と指標値とするデータ項目との全ての組み合わせを抽出する。すなわち、集計部121は、集計対象データに含まれる全ての断面を抽出する。集計部121は、抽出した断面について、それぞれクロス集計を行う。集計部121は、クロス集計の結果を示すデータを、統計解析部122へ出力する。その後、ステップS103へ進む。
(ステップS103)統計解析部122は、集計部121から入力されたデータに基づいて、各種の統計解析手法を用いて、断面ごとに解析する。統計解析部122は、解析結果を示すデータを、強度算出部123へ出力する。その後、ステップS104へ進む。
(ステップS104)強度算出部123は、統計解析部122から入力されたデータに基づいて、統計解析手法ごとに、断面の強度を算出する。強度算出部123は、断面の強度の算出結果を示すデータを、代表的断面提示部141へ出力する。
(ステップS105)代表的断面提示部141は、強度算出部123から入力されたデータに基づいて、代表的断面を生成する。代表的断面提示部141は、生成した代表的断面を、表示部112によって表示する。その後、ステップS106へ進む。
(ステップS106)アナリストによる操作入力によって、操作入力部111が選択結果取得部142へ、断面が選択された結果を示すデータが出力された場合、ステップS107へ進む。そうでない場合は、ステップS106に留まる。
(ステップS107)選択結果取得部142は、操作入力部111から入力されたデータに基づいて、アナリストによって選択された断面を特定する。選択結果取得部142は、特定した断面を示すデータを、重要特徴判定部143へ出力する。重要特徴判定部143は、選択結果取得部142から入力された断面を示すデータに基づいて、アナリストによって重視される統計的特徴を判定する。重要特徴判定部143は、判定した統計的特徴に対応する統計解析手法を示すデータを、断面提示部151へ出力する。その後、ステップS108へ進む。
(ステップS108)断面提示部151は、重要特徴判定部143から入力されたデータに基づく統計解析手法において、代表的断面としてアナリストへ提示された断面以外の断面の中で、強度が高い他の断面を選択する。断面提示部151は、選択した断面を、レコメンド結果として表示部112を介してアナリストへ提示する。
以上で、本フローチャートの処理を終了する。
以上、説明したように、第1の実施形態に係る集計分析装置1は、アナリストが重視する統計的特徴を把握し、把握した統計的特徴を有する断面であってアナリストが抽出していない未知の断面を提示しやすくすることができる。
(第2の実施形態)
第1の実施形態におけるレコメンドルールは、統計解析手法ごとに、強度の閾値である閾値Siが予め固定値として設定されている。そして、第1の実施形態におけるレコメンドルールは、閾値Si以上の強度を有する断面であって、代表的断面としてアナリストへ提示されていない断面をアナリストへ提示する、というルールであった。
以下に、第2の実施形態におけるレコメンドルールについて説明する。
(第2の実施形態におけるレコメンドルール)
断面提示部151は、まず、統計解析手法ごとに、強度の大きい順に断面を並べ替える。
図10は、第2の実施形態に係る集計分析装置1の断面提示部151が強度に基づいて断面を並べ替えた状態を表す図である。なお、図10は、断面提示部151が、図6に示した特徴3における強度に基づいて、断面を並べ替えた状態を示す。
まず、断面提示部151は、並べ替えた断面の中で、順位が中間値である断面をアナリストへ提示する。なお、図10に示す例においては、断面の数が偶数(6つ)であるため、断面提示部151は、順位が3位である「断面2」を提示しても、あるいは順位が4位である「断面3」を提示しても、どちらでも構わない。偶数個の断面がある場合、中間値の候補となる2つの断面について、順位が上位の断面を提示するか、あるいは順位が下位の断面を提示するかが、予め定められていればよい。本実施形態においては、そのような場合、断面提示部151は、順位が下位の断面を提示するものとする。
上記のルールに従って、断面提示部151は、表示部112に順位が4位である「断面3」を含む断面提示画面(図示せず)を表示させる。断面提示画面には、例えば、図7に示す代表的断面提示画面のように、「集計結果はいかがでしょうか。」という文言、および「OK」または「NG」を選択させる選択入力ボタン(例えば、ラジオボタン)が含まれる。これにより、アナリストは、提示された断面に、自身が重視する統計的特徴が表れているか否かを、操作入力部111を介して入力することができる。すなわち、アナリストは、自身が重視する統計的特徴が表れている場合には、操作入力部111を介して、「OK」の選択入力ボタンを押下する。そうでない場合は、アナリストは、「NG」の選択入力ボタンを押下する。
アナリストによって「OK」が選択された場合、次に、断面提示部151は、直前に提示した断面(図10に示す例においては、「断面3」)より順位が下位である断面において、順位が中間値である断面を提示する。図10に示す例においては、「断面3」より順位が下位である断面は、順位が5位である「断面5」、および順位が6位である「断面1」である。したがって、断面提示部151は、断面の数が偶数(2つ)であることから、中間値の候補となる2つの断面のうち順位が下位の断面である「断面6」を含む断面提示画面を、表示部112に表示させる。
また、アナリストによって「NG」が選択された場合、次に、断面提示部151は、直前に提示した断面(図10に示す例においては、「断面3」)より順位が上位である断面において、順位が中間値である断面を提示する。図10に示す例においては、「断面3」より順位が上位である断面は、順位が1位である「断面4」、順位が2位である「断面6」、および順位が3位である「断面2」である。したがって、断面提示部151は、順位が中間値の2位である「断面6」を含む断面提示画面を、表示部112に表示させる。
上記の処理を繰り返すことにより、断面提示部151は、アナリストによって重視される断面が、並べ替えた断面においてどの順位の断面までであるかを特定することができる。そして、断面提示部151は、特定した断面の強度を閾値Siとして、閾値Siより強度が高い断面をアナリストへ提示することができる。
以上説明したように、第2の実施形態によれば、断面提示部151は、強度の異なる断面を複数提示し、提示に応じて選択された断面に基づいて閾値を設定する。これにより、断面提示部151は、閾値Siを予め固定的に定めるのではなく、アナリストからの応答に基づいて設定することができる。
(第3の実施形態)
次に、第3の実施形態におけるレコメンドルールを説明する。
(第3の実施形態におけるレコメンドルール)
断面提示部151は、まず、統計解析手法ごとの断面の強度の値を基準化した基準化強度を算出する。例えば、断面提示部151は、統計解析手法ごとに、強度が最大の断面の基準化強度を1とし、強度が最小の断面の基準化強度を0とするように、強度の値を基準化する。
図11は、第3の実施形態に係る集計分析装置の断面提示部が強度に基づいて基準化強度を算出した状態を表す図である。
断面提示部151は、例えば、次のように計算することによって、基準化強度を算出する。基準化強度=(強度−強度の最小値)÷(強度の最大値−強度の最小値)。
例えば、図11に示す強度の中で、最大値は断面1の強度であり「0.9」である。また、図11に示す強度の値の中で、最小値は断面6の強度であり「0.5」である。
断面提示部151は、例えば、断面2の強度の値である「0.8」の基準化強度を算出する場合、上記のとおり、(0.8−0.5)÷(0.9−0.5)と計算する。したがって、断面2の基準化強度は「0.75」となる。
第3の実施形態に係る断面提示部151は、基準化強度の値に基づいて、アナリストへ断面を提示する。例えば、断面提示部151は、基準化強度の値が所定の閾値Si以上である断面をアナリストへ提示する。図11に示す例においては、特徴1における閾値S1が「0.8」であるならば、断面提示部151は、基準化強度の値が「0.9」である断面1のみをアナリストへ提示する。
このように、第3の実施形態に係る断面提示部151は、断面の強度を統計解析手法ごとに基準化した基準化強度を算出し、当該基準化強度に基づいて断面をアナリストへレコメンドする。
以上により、第3の実施形態に係るレコメンドルールによれば、強度の値の幅(最大値と最小値との差)の中で、強度の値が上位から一定の割合(例えば、上位2割)に含まれる断面をアナリストへ提示することが可能になる。
(第4の実施形態)
第1乃至第3の実施形態に係る断面提示部151は、統計解析手法ごとに、アナリストへ提示する断面を選択した。第4の実施形態に係る断面提示部151は、アナリストが重視する複数の統計的特徴に対応する複数の統計解析手法によって解析される断面の強度に基づいて、複合的な断面の強度(以下、複合強度と言う)を算出する。
図1に示すように、第4の実施形態に係るレコメンド部15は、複合強度算出部152を備える。第1乃至第3の実施形態に係る集計分析装置1の場合に対し、第4の実施形態に係る集計分析装置1においては、図1に示す点線部分の処理が追加される。
第4の実施形態に係る重要特徴判定部143は、アナリストによって重視されると判定した統計的特徴に対応する統計解析手法を示すデータを、複合強度算出部152へ出力する。複合強度算出部152は、重要特徴判定部143から入力されたデータに基づく統計的解析手法ごとに、断面の強度の値を示すデータを強度算出部123から取得する。複合強度算出部152は、強度算出部123から取得した、統計解析手法ごとの断面の強度の値を示すデータに基づいて、複合強度を算出する。
複合強度算出部152は、算出した複合強度を断面提示部151へ出力する。断面提示部151は、複合強度算出部152から入力されたデータに基づいて、アナリストへ提示する断面を選択する。そして、断面提示部151は、選択した断面を、表示部112を介してアナリストへ提示する。
以下に、第4の実施形態におけるレコメンドルールを説明する。
(第4の実施形態におけるレコメンドルール)
例えば、第1の実施形態において説明した例と同様に、重要特徴判定部143が、「特徴1」と「特徴3」とを、アナリストによって重視される統計的特徴であると判定したものとする。その場合、第4の実施形態に係る重要特徴判定部143は、「特徴1」と「特徴3」の断面の強度を示すデータを複合強度算出部152へ出力する。複合強度算出部152は、「特徴1」および「特徴3」の断面の強度を示すデータを強度算出部123から取得する。複合強度算出部152は、強度算出部123から取得した「特徴1」および「特徴3」の強度の値に基づいて、断面ごとに複合強度を算出する。ここで、複合強度は、それぞれの強度の平均値としてもよいが、統計的特徴ごとに重み付けをしておき当該重みを考慮して算出した値としてもよい。
図12は、第4の実施形態に係る集計分析装置1の複合強度算出部152が複合強度を算出した状態を表す図である。
例えば、図6に示した例において、特徴1における断面1の強度の値は「0.9」である。また、特徴3における断面1の強度の値は「0」である。複合強度算出部152は、この「0.9」と「0」との平均値を算出することにより、特徴1と特徴3とにおける断面1の複合強度である「0.45」の値を得る。同様に、特徴1における断面2の強度の値は「0.8」である。また、特徴3における断面2の強度の値は「0.74」である。複合強度算出部152は、この「0.8」と「0.74」との平均値を算出することにより、特徴1と特徴3とにおける断面2の複合強度である「0.77」の値を得る。
複合強度算出部152は、算出した複合強度を断面提示部151へ出力する。断面提示部151は、複合強度算出部152から入力されたデータに基づいて、アナリストへ提示する断面を選択する。断面提示部151は、上述した第1乃至第3の実施形態のいずれかに係る断面提示部151と同様の選択方法によって断面を選択してもよいし、その他の任意の選択方法によって断面を選択してもよい。そして、断面提示部151は、選択した断面を、表示部112を介してアナリストへ提示する。
以上説明したように、第4の実施形態に係る複合強度算出部152は、異なる複数の統計解析手法において、同一の断面ごとに強度を複合した複合強度を算出する。そして、断面提示部は、複合強度算出部によって算出された複合強度の値に基づいて断面をレコメンドする。
以上説明したように、本発明の第1の実施形態乃至第4の実施形態に係る集計分析装置1は、アナリストが重視する統計的特徴を把握し、把握した特徴を有する断面であってアナリストが抽出していない未知の断面を提示しやすくすることができる。
以上、この発明の実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
なお、代表的断面提示画面においてアナリストにより選択された複数の断面に、共通する集計軸が含まれている場合において、断面提示部151は、当該集計軸が含まれる他の断面をより多くアナリストへ提示するような構成にしてもよい。
なお、上述した各実施形態における集計分析装置1の一部又は全部をコンピュータで実現するようにしてもよい。その場合、この制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。
なお、ここでいう「コンピュータシステム」とは、集計分析装置1に内蔵されたコンピュータシステムであって、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信回線のように、短時間、動的にプログラムを保持するもの、その場合のサーバーやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
また、上述した第1の実施形態における集計分析装置1を、LSI(Large Scale Integration)等の集積回路として実現してもよい。集計分析装置1の各機能ブロックは個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化してもよい。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現してもよい。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いてもよい。
1・・・集計分析装置、11・・・入出力部、12・・・集計分析部、13・・・分析対象データ格納部(記憶部)、14・・・重要特徴取得部、15・・・レコメンド部、111・・・操作入力部、112・・・表示部、121・・・集計部、122・・・統計解析部、123・・・強度算出部、141・・・代表的断面提示部、142・・・選択結果取得部、143・・・重要特徴判定部、151・・・断面提示部、152・・・複合強度算出部

Claims (8)

  1. 多次元データを記憶する記憶部と、
    前記多次元データに含まれるデータ項目である集計軸と前記多次元データに含まれ前記集計軸に基づいて集計されるデータ項目である指標値との組み合わせである断面について、複数の統計解析手法による統計解析を行ったときの前記統計解析手法に応じた統計的な特徴の強さを表す強度を前記統計解析手法ごとに算出する強度算出部と、
    前記強度算出部が前記統計解析手法ごとに算出した前記断面ごとの前記強度に基づいて、前記統計解析手法ごとに高い前記強度を有する前記断面で前記多次元データを集計した結果である代表的断面を提示する代表的断面提示部と、
    前記代表的断面提示部による提示に応じて選択された前記断面を取得する選択結果取得部と、
    前記選択された断面に対応する前記統計解析手法において、高い前記強度を有する他の断面をレコメンドする断面提示部と、
    を備えることを特徴とする集計分析装置。
  2. 前記断面提示部は、前記統計解析手法ごとに設定される所定の閾値以上の前記強度である前記断面を提示する、
    ことを特徴とする、請求項1に記載の集計分析装置。
  3. 前記断面提示部は、前記統計解析手法ごとに、前記強度の異なる前記断面を複数提示し、提示に応じて選択された前記断面に基づいて前記所定の閾値を設定する、
    ことを特徴とする、請求項2に記載の集計分析装置。
  4. 前記断面提示部は、前記強度算出部によって前記統計解析手法ごとに算出された前記断面ごとの前記強度を前記統計解析手法ごとに基準化した基準化強度を算出し、前記基準化強度に基づいて前記断面をレコメンドする、
    ことを特徴とする、請求項1に記載の集計分析装置。
  5. 異なる複数の前記統計解析手法において、同一の断面ごとに前記強度を複合した複合強度を算出する複合強度算出部を備え、
    前記断面提示部は、前記複合強度算出部によって算出された前記複合強度の値に基づいて前記断面をレコメンドする、
    ことを特徴とする、請求項1に記載の集計分析装置。
  6. 前記代表的断面提示部による提示に応じて選択された複数の前記断面において、前記断面を構成する共通の項目を含む場合、前記断面提示部は前記共通の項目を含む他の前記断面をレコメンドする、
    ことを特徴とする、請求項1に記載の集計分析装置。
  7. 多次元データを記憶する記憶ステップと、
    前記多次元データに含まれるデータ項目である集計軸と前記多次元データに含まれ前記集計軸に基づいて集計されるデータ項目である指標値との組み合わせである断面について、複数の統計解析手法による統計解析を行ったときの前記統計解析手法に応じた統計的な特徴の強さを表す強度を前記統計解析手法ごとに算出する強度算出ステップと、
    前記強度算出ステップにおいて前記統計解析手法ごとに算出された前記断面ごとの前記強度に基づいて、前記統計解析手法ごとに高い前記強度を有する前記断面で前記多次元データを集計した結果である代表的断面を提示する代表的断面提示ステップと、
    前記代表的断面提示ステップにおける提示に応じて選択された前記断面を取得する選択結果取得ステップと、
    前記選択された断面に対応する前記統計解析手法において、高い前記強度を有する他の断面をレコメンドする断面提示ステップと、
    を有することを特徴とする集計分析方法。
  8. コンピュータに、
    多次元データを記憶する記憶ステップと、
    前記多次元データに含まれるデータ項目である集計軸と前記多次元データに含まれ前記集計軸に基づいて集計されるデータ項目である指標値との組み合わせである断面について、複数の統計解析手法による統計解析を行ったときの前記統計解析手法に応じた統計的な特徴の強さを表す強度を前記統計解析手法ごとに算出する強度算出ステップと、
    前記強度算出ステップにおいて前記統計解析手法ごとに算出された前記断面ごとの前記強度に基づいて、前記統計解析手法ごとに高い前記強度を有する前記断面で前記多次元データを集計した結果である代表的断面を提示する代表的断面提示ステップと、
    前記代表的断面提示ステップにおける提示に応じて選択された前記断面を取得する選択結果取得ステップと、
    前記選択された断面に対応する前記統計解析手法において、高い前記強度を有する他の断面をレコメンドする断面提示ステップと、
    を実行させるためのプログラム。
JP2015176601A 2015-09-08 2015-09-08 集計分析装置、集計分析方法、及びプログラム Active JP6550304B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015176601A JP6550304B2 (ja) 2015-09-08 2015-09-08 集計分析装置、集計分析方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015176601A JP6550304B2 (ja) 2015-09-08 2015-09-08 集計分析装置、集計分析方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2017054230A JP2017054230A (ja) 2017-03-16
JP6550304B2 true JP6550304B2 (ja) 2019-07-24

Family

ID=58316690

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015176601A Active JP6550304B2 (ja) 2015-09-08 2015-09-08 集計分析装置、集計分析方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6550304B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7246956B2 (ja) * 2019-02-13 2023-03-28 株式会社キーエンス データ分析装置及びデータ分析方法
JP7246958B2 (ja) * 2019-02-13 2023-03-28 株式会社キーエンス データ分析装置及びデータ分析方法
JP7246957B2 (ja) * 2019-02-13 2023-03-28 株式会社キーエンス データ分析装置及びデータ分析方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005202535A (ja) * 2004-01-14 2005-07-28 Hitachi Ltd 文書集計方法及び装置並びにそれらに用いるプログラムを記憶した媒体
JP5060591B2 (ja) * 2010-06-03 2012-10-31 株式会社東芝 文書分析装置およびプログラム
JP5444282B2 (ja) * 2011-05-11 2014-03-19 株式会社日立システムズ データ整形システム、方法、及びプログラム

Also Published As

Publication number Publication date
JP2017054230A (ja) 2017-03-16

Similar Documents

Publication Publication Date Title
Alshikhi et al. Information quality: definitions, measurement, dimensions, and relationship with decision making
US20160203156A1 (en) Method, apparatus and system for data analysis
Bentley Cross-country differences in publishing productivity of academics in research universities
US20160004757A1 (en) Data management method, data management device and storage medium
US20170140309A1 (en) Database analysis device and database analysis method
US10067964B2 (en) System and method for analyzing popularity of one or more user defined topics among the big data
JP6550304B2 (ja) 集計分析装置、集計分析方法、及びプログラム
WO2017203672A1 (ja) アイテム推奨方法、アイテム推奨プログラムおよびアイテム推奨装置
CN108428138B (zh) 一种基于客户分群的客户生存率分析装置及分析方法
US10990985B2 (en) Remote supervision of client device activity
US9569835B2 (en) Pattern extracting apparatus and method
Chang et al. Performance ranking of Asian lead frame firms: a slack-based method in data envelopment analysis
US10909177B1 (en) Percentile determination system
JP7215318B2 (ja) 情報処理プログラム、情報処理方法、及び情報処理装置
JP5444282B2 (ja) データ整形システム、方法、及びプログラム
Fattah et al. Actualization of Digital Marketing Society 5.0 on MSMES of Sasirangan Cloth in Village Sasirangan in Banjarmasin City
CN111506826A (zh) 基于亲密度的用户推荐方法、装置、设备及存储介质
US10552485B1 (en) Performance percentile determination and display
JP2011123652A (ja) データ解析システム、及びその方法
Martinez et al. Market basket analysis with association rules in the retail sector using Orange. Case Study: Appliances Sales Company
JP2012118612A (ja) マーケティング提案支援システム
JP7256669B2 (ja) 情報処理装置、推定装置、分析装置、情報処理方法及びコンピュータープログラム
JP5600127B2 (ja) 情報集計システム
Gogolou et al. Data exploration: a roll call of all user-data interaction functionality
JP6166772B2 (ja) 個人職務分析を半自動化する方法とそのシステム及びそのプログラム並びにこのプログラムを有する記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180330

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190319

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190326

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190523

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190604

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190701

R150 Certificate of patent or registration of utility model

Ref document number: 6550304

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350