JP2014130539A - 情報処理装置、ノード抽出プログラムおよびノード抽出方法 - Google Patents

情報処理装置、ノード抽出プログラムおよびノード抽出方法 Download PDF

Info

Publication number
JP2014130539A
JP2014130539A JP2012288949A JP2012288949A JP2014130539A JP 2014130539 A JP2014130539 A JP 2014130539A JP 2012288949 A JP2012288949 A JP 2012288949A JP 2012288949 A JP2012288949 A JP 2012288949A JP 2014130539 A JP2014130539 A JP 2014130539A
Authority
JP
Japan
Prior art keywords
node
item
unit
registered
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012288949A
Other languages
English (en)
Other versions
JP6003637B2 (ja
Inventor
Etsuhisa Asai
悦久 浅井
Harumichi Tabata
晴通 田畑
Machiko Ikoma
眞知子 生駒
Kimi Watanabe
希美 渡邉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012288949A priority Critical patent/JP6003637B2/ja
Priority to US14/060,976 priority patent/US9189530B2/en
Priority to EP13190051.6A priority patent/EP2750052B1/en
Priority to AU2013251190A priority patent/AU2013251190B2/en
Publication of JP2014130539A publication Critical patent/JP2014130539A/ja
Application granted granted Critical
Publication of JP6003637B2 publication Critical patent/JP6003637B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • G06F16/244Grouping and aggregation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Fuzzy Systems (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】特定のノードに関連性があり、かつ、分析対象に関連性があるノードを精度良く抽出すること。
【解決手段】サーバ1は、受け付けられたノードに関連性があるノード、および、抽出されたノードに関連性があるノードを選択する。そして、サーバ1は、テーブルにおける関連度を算出する際に用いる項目の登録内容に基づいて、テーブルにおける分析対象の登録内容が登録された項目の登録内容ごとに、次のような関連度を算出する。すなわち、サーバ1は、テーブルにおける分析対象の登録内容が登録された項目に登録された登録内容と選択されたノードとの関連度を算出する。続いて、サーバ1は、算出された関連度に基づいて、選択されたノードの中から、分析対象との関連性があるノードを抽出する。
【選択図】図6

Description

本発明は、情報処理装置、ノード抽出プログラムおよびノード抽出方法に関する。
テキストの内容を分析するテキストマイニングという技術がある。例えば、複数のテキストデータから形態素解析器により抽出したノード(内容語、キーワード)のペアの出現頻度の多さを関連度の高さとし、関連度の高さが所定値を超えるようなノードのペアを関連性のあるノードのペアとして抽出する技術がある。また、かかる技術では、抽出したノードのペアの関連性が高いほど、ノード間の距離が短くなるようなノードリンクが生成され、生成されたノードリンクが表示される。これにより、ユーザは、テキスト全体の特徴を把握したり、ノード間の関連性の強さを視覚的に把握することができる。
また、DWH(Data WareHouse:データウェアハウス)のテーブルに登録されたデータに対して多次元的な分析を行うOLAP(Online Analytical Processing)という技術がある。OLAPは、データの中から、データを階層構造に分類した次元(軸に設定される項目)、および、データに含まれる数値データを抽出し、「スライス」、「ダイス」、「ドリルダウン」などの手法により多次元的な分析を行う。ここで、「スライス」は、分析結果に対して、さらに新たな次元が設定された軸を追加して、さらに詳細な分析を行う手法である。また、「ダイス」は、分析する次元(切り口)を変えて分析を行う手法である。また、「ドリルダウン」は、分析する次元をより詳細な次元に変更して、より詳細に分析を行う手法である。
特開2010−205077号公報 特開2010−49411号公報 特開2005−202535号公報
"Interstage Navigator Explorer Server 概説書"、[online]、[平成24年6月15日検索]、インターネット<http:software.fujitsu.com/jp/manual/manualfiles/M060039/B1WN7811/02Z200/gai02/gai00013.html> "Interstage Navigator Server 8.0 概説書"、[online]、[平成24年6月15日検索]、インターネット<http:software.fujitsu.com/jp/manual/manualfiles/M060059/B1WN7601/03Z200/gaiaa/gai00086.html>
ここで、上記のノードリンクを表示させる技術によって表示されたノードリンクの中から、ユーザは、経験や勘などによって、特定のノードに関連するとともに特定の分析対象に関連するノード群を抽出する作業を行う場合がある。このようなユーザが行う作業の一例について説明する。図26は、ユーザが行う作業の一例を示す図である。図26の例には、東部地区、中部地区、西部地区の3つの地区のうちいずれかの地区で、プリンタやパソコンなどの電子機器を購入した人物が記載した複数のアンケートから生成したノードリンク90が示されている。図26の例に示すノードリンク90が表示され、「アンケート結果に基づいて得られたノードリンク90を基に、購買動機につながる「売れ筋」と関連性の高い、東部地区特有のノードを探したい」という要求がある場合には、ユーザは、次の作業を行う。すなわち、ユーザは、経験や勘などによって、ノード「売れ筋」に関連し、かつ、分析対象の東部地区に特有のノード群を選択する作業を行う。
しかしながら、ユーザは、経験や勘などによってノード群を選択する作業を行うため、選択されたノード群が、必ずしも、特定のノードに関連性があり、かつ、分析対象に関連性があるとはいえない場合があるという問題点がある。
なお、ノードリンクに含まれるノードの数が膨大な場合には、膨大な数のノードの中から、特定のノードに関連性があり、かつ、分析対象に関連性があるノード群をユーザが手動で選択するときに、膨大な時間がかかるという問題点もある。
1つの側面では、本発明は、特定のノードに関連性があり、かつ、分析対象に関連性があるノードを精度良く抽出することを目的とする。
情報処理装置は、受付部と、選択部と、算出部と、抽出部とを有する。受付部は、所定の事項に関するテキストから得られたノードリンクに含まれるノードの中から、ノードを受け付ける。また、受付部は、所定の事項に関するテーブルの項目の中から、分析対象の登録内容が登録された第1の項目を受け付ける。また、受付部は、分析対象の登録内容を受け付ける。また、受付部は、テーブルの項目の中から、テーブルにおける第1の項目に登録された登録内容とノードとの関連性を示す度合いである関連度を算出する際に用いる第2の項目を受け付ける。選択部は、受付部により受け付けられたノードに隣接するノード、および、抽出されたノードに隣接するノードを選択する。算出部は、テーブルにおける第2の項目の登録内容に基づいて、テーブルにおける第1の項目の登録内容ごとに、テーブルにおける第1の項目に登録された登録内容と選択部により選択されたノードとの関連度を算出する。抽出部は、算出部により算出された関連度に基づいて、選択部により選択されたノードの中から、分析対象との関連性があるノードを抽出する。
特定のノードに関連性があり、かつ、分析対象に関連性があるノードを精度良く抽出することができる。
図1は、実施例1に係るシステムを示す図である。 図2は、クライアントの機能構成の一例を示す図である。 図3は、ノードリンクの生成方法の一例を説明するための図である。 図4は、次元の生成方法の一例を説明するための図である。 図5は、レイアウト指定部が実行する処理の一例を説明するための図である。 図6は、サーバの機能構成の一例を示す図である。 図7は、同一性条件の一例を示す図である。 図8は、選択部が実行する処理の一例を説明するための図である。 図9は、特定部が実行する処理の一例を説明するための図である。 図10は、特定部が実行する処理の一例を説明するための図である。 図11は、特定部が実行する処理の一例を説明するための図である。 図12は、算出部が実行する処理の一例を説明するための図である。 図13は、抽出部が実行する処理の一例を説明するための図である。 図14は、抽出部が実行する処理の一例を説明するための図である。 図15は、サーバが実行する処理の一例を説明するための図である。 図16は、サーバが実行する処理の一例を説明するための図である。 図17は、実施例1に係るレイアウト指定処理の手順を示すフローチャートである。 図18は、実施例1に係るノード抽出処理の手順を示すフローチャートである。 図19は、実施例1に係る第一の処理の手順を示すフローチャートである。 図20は、実施例1に係る第二の処理の手順を示すフローチャートである。 図21は、実施例1に係る第三の処理の手順を示すフローチャートである。 図22は、実施例1に係る第四の処理の手順を示すフローチャートである。 図23は、実施例1に係る第五の処理の手順を示すフローチャートである。 図24は、実施例1に係る第六の処理の手順を示すフローチャートである。 図25は、ノード抽出プログラムを実行するコンピュータを示す図である。 図26は、ユーザが行う作業の一例を示す図である。
以下に、本願の開示する情報処理装置、ノード抽出プログラムおよびノード抽出方法の実施例を図面に基づいて詳細に説明する。なお、実施例は開示の技術を限定するものではない。
[システム10の構成の一例]
実施例1に係るナビゲーターサーバが適用されたシステムについて説明する。図1は、実施例1に係るシステムを示す図である。図1に示すように、システム10は、ナビゲーターサーバ1、ナビゲータークライアント20およびDWH30を有する。ナビゲーターサーバ1、ナビゲータークライアント20およびDWH30は、互いに、ネットワーク40を介して接続されている。すなわち、ナビゲーターサーバ1、ナビゲータークライアント20およびDWH30は、互いに通信可能である。以下の説明では、ナビゲーターサーバ1を、サーバ1と略記し、ナビゲータークライアント20をクライアント20と略記する。
クライアント20の機能構成について説明する。図2は、クライアント20の機能構成の一例を示す図である。図2の例に示すように、クライアント20は、入力部21、表示部22、通信部23、記憶部24、制御部25を有する。
入力部21は、ユーザによる操作を受け付け、受け付けた操作の内容を制御部25に送信する。入力部21は、例えば、マウスやキーボードなどのユーザの操作を受け付けるデバイスである。
表示部22は、各種の情報を表示する。例えば、表示部22は、後述の出力制御部25bの制御により、後述のレイアウト指定画面を表示する。表示部22は、例えば、液晶ディスプレイなどの表示装置である。
通信部23は、サーバ1およびDWH30との通信を行うためのインターフェースである。例えば、通信部23は、制御部25から後述のレイアウト指定画面の各項目に指定された内容、および、分析対象の登録内容を受信した場合には、次の処理を行う。すなわち、通信部23は、受信したレイアウト指定画面の各項目に指定された内容、および、分析対象の登録内容をネットワーク40を介してサーバ1に送信する。
記憶部24は、各種の情報を記憶する。例えば、記憶部24は、ノードリンク24a、次元24b、数値データ項目24cを記憶する。
ノードリンク24aは、アンケートに基づいて生成される。例えば、ノードリンク24aは、形態素解析器によって生成される。図3は、ノードリンクの生成方法の一例を説明するための図である。図3の例に示すように、形態素解析器91は、東部地区、中部地区、西部地区の3つの地区のうちいずれかの地区で、プリンタやパソコンなどの電子機器を購入した人物が記載した複数のアンケート92からノードを抽出する。そして、形態素解析器91は、抽出したノードのペアの出現頻度の多さを関連度の高さとし、関連度の高さが所定値を超えるようなノードのペアを関連性のあるノードのペアとして抽出する。続いて、形態素解析器91は、抽出したノードのペアの関連性が高いほど、ノード間の距離が短くなるようなノードリンク24aを生成する。このようにしてノードリンク24aは生成される。
ここで、形態素解析器91は、各ノードのリンク属性およびレコード属性を含むノードリンク24aを生成する。リンク属性とは、例えば、ノードに関連性のあるノード群を指す。例えば、図3の例のノードリンク24aのノード「プリンタ」には、ノード「売れ筋」、「店員」、「安い」、「液晶」の4つのノードが関連性がある。そのため、ノード「プリンタ」のリンク属性として、ノード群「「売れ筋」、「店員」、「安い」、「液晶」」がノードリンク24aに含まれる。また、レコード属性とは、例えば、ノードが回答の欄に記載されたアンケート92の伝票番号を指す。かかる伝票番号は、後述するが、テーブル30aの各レコードの「伝票番号」の項目に登録される。そのため、レコード属性がノードごとに定義されることにより、ノードと、テーブル30aのレコードとが対応付けられる。なお、1つのノードに対して、レコード属性として1つまたは複数の伝票番号が定義される。
ここで、アンケート92は、図3の例に示すように、商品を購入した日付、会員番号、購入した商品の商品番号、商品を購入した際の伝票の伝票番号、および、アンケートの回答を含む。例えば、図3の例では、アンケート92は、会員番号「A005」が示す会員が、5月23日に、商品番号「X−PRT」が示す商品を購入し、購入した際の伝票の伝票番号が「D2983」であることを示す。また、図3の例では、アンケート92は、「A店で一番売れ筋というX社のプリンタが安くなっていたので買った。液晶がキレイでよかった。」という回答を含む。
次元24bは、データ分析の切り口となる項目である。次元24bは、DWH40のテーブル30aから生成される。図4は、次元の生成方法の一例を説明するための図である。次元24bを生成する際に用いられるテーブル30aについて説明する。図4の例に示すテーブル30aは、商品の購入に関するデータが登録された場合を示す。図4の例に示すテーブル30aは、「伝票番号」、「地域」、「店舗」、「担当」、「会員」、「性別」、「商品」、「売上」の各項目を有する。「伝票番号」の項目には、商品を購入した際の伝票の伝票番号が登録される。「地域」の項目には、商品を購入した店舗の地域を示す情報が登録される。「店舗」の項目には、商品を購入得した店舗を示す情報が登録される。「担当」の項目には、店舗ごとの担当者のIDが登録される。「会員」の項目には、商品を購入した会員のIDが登録される。「性別」の項目には、商品を購入した会員の性別を示す情報が登録される。「商品」の項目には、会員によって購入された商品の商品番号が登録される。「売上」の項目には、購入された商品の値段が登録される。また、図4の例には図示されていないが、テーブル30aは、その他の項目も含む。例えば、テーブル30aは、商品を購入した会員の年齢の世代が登録される「世代」の項目を含む。また、テーブル30aは、会員によって購入された商品の粗利が登録される「粗利」の項目を含む。
図4の例に示すように、OLAPの手法などにより、テーブル30aの項目の中から、データ分析の切り口となる項目である次元24bが抽出される。図4の例では、次元24bには、「地域」、「店舗」、「担当」、「会員」、「性別」、「商品」の各項目が含まれる。
数値データ項目24cは、集計することが可能な数値のデータが登録される項目である。図4の例に示すように、OLAPの手法などにより、テーブル30aの項目の中から、数値データ項目24cが抽出される。図4の例では、数値データ項目24cには、「売上」、「粗利」の各項目が含まれる。
図2の説明に戻り、記憶部24は、例えば、フラッシュメモリなどの半導体メモリ素子、または、ハードディスク、光ディスクなどの記憶装置である。なお、記憶部24は、上記の種類の記憶装置に限定されるものではなく、Random Access Memory(RAM)、Read Only Memory(ROM)であってもよい。
制御部25は、各種の処理手順を規定したプログラムや制御データを格納するための内部メモリを有し、これらによって種々の処理を実行する。図2に示すように、制御部25は、レイアウト指定部25aと、出力制御部25bとを有する。
レイアウト指定部25aは、レイアウト指定画面を表示部22に表示させて、レイアウト指定画面の各項目に設定する内容を取得する。図5を参照してレイアウト指定部25aが実行する処理の一例を説明する。図5は、レイアウト指定部が実行する処理の一例を説明するための図である。レイアウト指定部25aは、まず、記憶部24から、ノードリンク24a、次元24b、数値データ項目24cを取得する。そして、レイアウト指定部25aは、図5の例に示すように、レイアウト指定画面26、ノードリンク24a、次元24b、数値データ項目24cを表示するように、表示部22を制御する。
ここで、図5の例に示すように、レイアウト指定画面26は、ユーザによって指定される「縦軸」、「横軸」、「集計」の各項目を有する。「縦軸」の項目には、ノードリンク24aが示す複数のノードのうち、分析の視点となるノードがユーザによって指定される。「横軸」の項目には、次元24bに含まれる複数の項目のうち、分析の切り口となる分析対象の項目、すなわち、分析軸である項目がユーザによって指定される。「集計」の項目には、数値データ項目24cに含まれる複数の項目のうち、「縦軸」の項目に指定されたノードが示す内容を分析する際に集計される項目がユーザによって指定される。
例えば、ユーザは、上述したように「アンケート結果に基づいて得られたノードリンク24aを基に、購買動機につながる「売れ筋」と関連性の高い、東部地区特有のノードを探したい」という要求がある場合には、次の作業を行う。すなわち、ユーザは、図5の例に示すように、「縦軸」にノード「売れ筋」、「横軸」に項目「地域」、「集計」に項目「売上」を指定する。
そして、レイアウト指定部25aは、ユーザによって、「縦軸」、「横軸」、「集計」の全項目に、各項目に対応する内容が指定されたか否かを判定する。指定されていない場合には、レイアウト指定部25aは、再び、同様の判定を行う。一方、指定された場合には、レイアウト指定部25aは、「横軸」に指定されたテーブル30aの項目の登録内容を表示するように、表示部22を制御する。例えば、レイアウト指定部25aは、「横軸」に指定された項目「地域」の登録内容を、DWH40に問い合わせて、問い合わせた結果得られた登録内容「東部」、「中部」、「西部」を表示するように、表示部22を制御する。
登録内容が表示部22に表示された場合には、ユーザは、表示された登録内容の中から、分析対象の登録内容を指定する。例えば、ユーザは、上述の要求がある場合には、次の作業を行う。すなわち、ユーザは、表示された「東部」、「中部」、「西部」の中から、分析対象の登録内容「東部」を指定する。
そして、レイアウト指定部25aは、ユーザによって、分析対象の登録内容が指定されたか否かを判定する。指定されていない場合には、レイアウト指定部25aは、再び、同様の判定を行う。一方、指定された場合には、レイアウト指定部25aは、レイアウト指定画面26の「縦軸」、「横軸」、「集計」の各項目に指定された内容、および、指定された分析対象の登録内容に、サーバ1への送信指示を付加して、通信部23に送信する。これにより、通信部23は、レイアウト指定画面26の「縦軸」、「横軸」、「集計」の各項目に指定された内容、および、指定された分析対象の登録内容をネットワーク40を介してサーバ1に送信する。例えば、図5の例に示すように、ユーザによって「縦軸」、「横軸」、「集計」の各項目に、ノード「売れ筋」、項目「地域」、項目「売上」が指定され、また、分析対象の登録内容「東部」が指定された場合には、レイアウト指定部25aは、次の処理を行う。すなわち、レイアウト指定部25aは、指定されたノード「売れ筋」、項目「地域」、項目「売上」、および、指定された分析対象の登録内容「東部」に、サーバ1への送信指示を付加して、通信部23に送信する。
そして、レイアウト指定部25aは、サーバ1から送信された後述の最終集計結果を受信したか否かを判定する。受信していない場合には、レイアウト指定部25aは、再び、同様の判定を行う。
上述してきたように、レイアウト指定部25aは、商品の購入など所定の事項に関するアンケート92などのテキストから得られたノードリンク24aに含まれるノードの中から、ノードを受け付ける。例えば、レイアウト指定部25aは、ノード「売れ筋」を受け付ける。また、レイアウト指定部25aは、商品の購入など所定の事項に関するテーブル30aの項目の中から、分析対象の登録内容が登録された項目、例えば、分析対象の登録内容「東部」が登録された項目「地域」を受け付ける。また、レイアウト指定部25aは、分析対象の登録内容を受け付ける。例えば、レイアウト指定部25aは、分析対象の登録内容「東部」を受け付ける。また、レイアウト指定部25aは、テーブル30aの項目の中から、テーブル30aにおける分析対象の登録内容が登録された項目に登録された登録内容とノードとの関連性を示す度合いである関連度を算出する際に用いる項目を受け付ける。例えば、レイアウト指定部25aは、テーブル30aの項目の中から、次のような項目を受け付ける。すなわち、レイアウト指定部25aは、テーブル30aにおける分析対象の登録内容「東部」が登録された項目「地域」に登録された登録内容「東部」、「中部」、「西部」のそれぞれとノードとの関連度を算出する際に用いる項目「売上」を受け付ける。
出力制御部25bは、各種の情報を出力する。例えば、出力制御部25bは、レイアウト指定部25aにより、サーバ1から送信された後述の最終集計結果を受信したと判定された場合には、受信した最終集計結果を表示するように、表示部22を制御する。
制御部25は、Application Specific Integrated Circuit(ASIC)などの集積回路である。また、制御部25は、Field Programmable Gate Array(FPGA)であってもよい。また、制御部25は、Central Processing Unit(CPU)などの電子回路であってもよい。さらに、制御部25は、Micro Processing Unit(MPU)であってもよい。
図1の説明に戻る。DWH30は、上述したテーブル30aを有する。また、DWH30は、サーバ1から送信されたSQL文を受信し、受信したSQL文に基づいて、テーブル30aのレコードの中から対応するレコードを検索し、検索の結果得られたレコードを集計し、集計結果をサーバ1に送信する。
サーバ1は、クライアント20のユーザによって「縦軸」の項目に指定されたノードに関連性があり、かつ、分析対象の登録内容「東部」に関連性があるノードを抽出し、抽出した結果をクライアント20に送信する。ここで、サーバ1の機能構成について説明する。図6は、サーバの機能構成の一例を示す図である。図6の例に示すように、サーバ1は、入力部2、表示部3、通信部4、記憶部5、制御部6を有する。
入力部2は、制御部6に各種の情報を入力する。例えば、入力部2は、サーバ1の管理者などから各種の操作を受け付けて、受け付けた操作の内容を制御部6に入力する。入力部2は、例えば、キーボードやマウスなどのデバイスである。
表示部3は、各種の情報を表示する。例えば、表示部3は、サーバ1の稼働状態を示す画像を表示する。表示部3は、例えば、ディスプレイなどの表示装置である。
通信部4は、クライアント20およびDWH30との通信を行うためのインターフェースである。例えば、通信部4は、クライアント20から送信された、レイアウト指定画面26の「縦軸」、「横軸」、「集計」の各項目に指定された内容、および、分析対象の登録内容を受信した場合には、次の処理を行う。すなわち、通信部4は、レイアウト指定画面26の「縦軸」、「横軸」、「集計」の各項目に指定された内容、および、分析対象の登録内容を制御部6に送信する。また、通信部4は、制御部6から送信された後述するSQL文を受信した場合には、受信したSQL文をネットワーク40を介してDWH30に送信する。また、通信部4は、DWH30から送信された、SQL文に対する応答を受信した場合には、受信した応答を制御部6に送信する。また、通信部4は、制御部6から送信された後述の最終集計結果を受信した場合には、受信した最終集計結果をクライアント20に送信する。
換言すれば、通信部4は、商品の購入など所定の事項に関するアンケート92などのテキストから得られたノードリンク24aに含まれるノードの中から、ノードを受け付ける。例えば、通信部4は、ノード「売れ筋」を受け付ける。そして、通信部4は、受け付けたノードを制御部6に送信する。また、通信部4は、商品の購入など所定の事項に関するテーブル30aの項目の中から、分析対象の登録内容が登録された項目を受け付ける。例えば、通信部4は、分析対象の登録内容「東部」が登録された項目「地域」を受け付ける。そして、通信部4は、受け付けた項目を制御部6に送信する。また、通信部4は、分析対象の登録内容を受け付ける。例えば、通信部4は、分析対象の登録内容「東部」を受け付ける。そして、通信部4は、受け付けた分析対象の登録内容を制御部6に送信する。また、通信部4は、テーブル30aの項目の中から、テーブル30aにおける分析対象の登録内容が登録された項目に登録された登録内容とノードとの関連性を示す度合いである関連度を算出する際に用いる項目を受け付ける。例えば、通信部4は、テーブル30aの項目の中から、次のような項目を受け付ける。すなわち、通信部4は、テーブル30aにおける分析対象の登録内容「東部」が登録された項目「地域」に登録された登録内容「東部」、「中部」、「西部」のそれぞれとノードとの関連度を算出する際に用いる項目「売上」を受け付ける。そして、通信部4は、受け付けた項目を制御部6に送信する。通信部4は、受付部の一例である。
記憶部5は、各種の情報を記憶する。例えば、記憶部5は、ノードリンク5a、関連度演算定義5c、同一性条件5cを記憶する。
ノードリンク5aは、上述したノードリンク24aと同一である。
関連度演算定義5cは、後述の算出部6cが関連度を算出する際に用いるアルゴリズムを示す。関連度演算定義5cは、例えば、集計値の全項目の平均値に対する関連度を算出する項目の集計値の割合を、関連度として算出するアルゴリズムを示す。
同一性条件5cは、テーブル30aの項目ごとに、共通項としてみなされる条件が定義されたものである。図7は、同一性条件の一例を示す図である。図7の例に示す同一性条件5cは、例えば、「性別」の項目については、登録された値(性別を示す情報)が1種類までは共通項としてみなすことを示す。また、図7の例に示す同一性条件5cは、例えば、「商品」の項目については、登録された値(商品番号)が2種類までは共通項としてみなすことを示す。
図6の説明に戻り、記憶部5は、例えば、フラッシュメモリなどの半導体メモリ素子、または、ハードディスク、光ディスクなどの記憶装置である。なお、記憶部5は、上記の種類の記憶装置に限定されるものではなく、Random Access Memory(RAM)、Read Only Memory(ROM)であってもよい。
制御部6は、各種の処理手順を規定したプログラムや制御データを格納するための内部メモリを有し、これらによって種々の処理を実行する。図6に示すように、制御部6は、選択部6aと、特定部6bと、算出部6cと、抽出部6dと、出力制御部6eとを有する。
選択部6aは、通信部4により受け付けられた上述のノードに関連性があるノード、および、抽出部6dにより抽出されたノードに関連性があるノードを選択する。選択部6aが実行する処理について具体的な例を挙げて説明する。図8は、選択部が実行する処理の一例を説明するための図である。例えば、通信部4によりノード「売れ筋」が受け付けられた場合には、選択部6aは、図8に示すように、ノードリンク5aにおいて、ノード「売れ筋」に隣接するノード「一番」、「安い」、「プリンタ」、「パソコン」を選択する。ここでノードリンク5aにおいて、あるノードに隣接するノードは、あるノードに関連性のあるノードである。
特定部6bは、選択部6aにより選択されたノードが回答の欄に記載されたアンケート92の伝票番号を有するレコード(テーブル30aのレコード)間の所定の共通性を満たす項目を共通項として特定する。また、特定部6bは、特定した共通項の登録内容も特定する。
一態様としては、特定部6bは、まず、選択部6aにより選択されたノードのうち、後述の算出部6cにより関連度が算出されていないノードがあるか否かを判定する。関連度が算出されていないノードがある場合には、特定部6bは、選択部6aにより選択されたノードのうち、未選択のノードを1つ選択する。例えば、図8の例が示す場合において、特定部6bは、ノード「プリンタ」を選択する。
そして、特定部6bは、選択したノードに共通項属性が設定されているか否かを判定する。なお、上述した形態素解析器91によってノードリンク5aが生成された時点では、ノードリンク5aのノードには、共通項属性は設定されていない。ノードには、特定部6bの後述の処理によって共通項属性が設定される。
選択したノードに共通項属性が設定されている場合には、特定部6bは、設定されている共通項属性が示す共通項(項目、および、登録内容)を特定する。特定部6bが実行する処理について具体的な例を挙げて説明する。図9は、特定部が実行する処理の一例を説明するための図である。例えば、図9の例に示すように、ノード「プリンタ」に共通項属性が示す共通項として、「店舗」の項目と、「店舗」の項目に登録された「A店」、「B店」との組み合わせが設定されている場合について説明する。なお、図9の例では、ノード「プリンタ」に共通項属性が示す共通項として、「世代」と「世代」の項目に登録された「20」、「30」、「40」との組み合わせも設定されている。図9の例が示す場合では、選択したノード「プリンタ」に共通項属性が設定されているため、特定部6bは、設定されている共通項属性が示す共通項として、「店舗」と「店舗」の項目に登録された「A店」、「B店」との組み合わせを特定する。これに加えて、特定部6bは、「世代」と「世代」の項目に登録された「20」、「30」、「40」との組み合わせも特定する。
また、特定部6bは、選択したノードが回答の欄に記載されたアンケート92の伝票番号を有するレコード(テーブル30aのレコード)があるか否かを判定する。例えば、特定部6bは、選択したノードが回答の欄に記載されたアンケート92の「伝票番号」の項目に伝票番号が登録されているか否かを判定する。これにより、特定部6bは、選択したノードが回答の欄に記載されたアンケート92の伝票番号を有するレコードがあるか否かを判定することができる。なお、選択したノードが回答の欄に記載されたアンケート92の数が複数である場合には、特定部6bは、複数のアンケート92のそれぞれについて、同様の判定を行う。
選択したノードが回答の欄に記載されたアンケート92の伝票番号を有するレコードがある場合には、特定部6bは、選択したノードが回答の欄に記載されたアンケート92の伝票番号をDWH30に送信する指示を通信部4に送信する。これにより、通信部4は、ネットワーク40を介してDWH30に、選択したノードが回答の欄に記載されたアンケート92の伝票番号を送信する。かかる伝票番号を受信したDWH30は、受信した伝票番号を有するレコードをテーブル30aから検索し、検索の結果得られたレコードをサーバ1に送信する。これにより、サーバ1の特定部6bは、選択したノードが回答の欄に記載されたアンケート92の伝票番号を有するレコードを取得することができる。
特定部6bが実行する処理について具体的な例を挙げて説明する。図10は、特定部が実行する処理の一例を説明するための図である。図10の例は、選択したノード「プリンタ」が回答の欄に記載された複数のアンケート92のうち、4つのアンケート92のそれぞれに、伝票番号「D0234」、「D2983」、「D9865」、「D4569」が含まれている場合を示す。この場合、特定部6bは、伝票番号「D0234」、「D2983」、「D9865」、「D4569」をDWH30に送信する指示を通信部4に送信する。これにより、特定部6bは、図10の例に示すように、伝票番号「D0234」、「D2983」、「D9865」、「D4569」のそれぞれを有する4つのレコードを取得する。
続いて、特定部6bは、取得したレコードの各項目に対応する同一性条件5cの内容を取得する。例えば、特定部6bが図10の例に示す4つのレコードを取得し、図7の例に示す同一性条件5cが記憶部5に記憶されている場合について説明する。この場合には、特定部6bは、レコードの項目「地域」に対応する同一性条件5cの内容「値は1種類まで」を取得する。また、特定部6bは、レコードの項目「店舗」に対応する同一性条件5cの内容「値は3種類まで」を取得する。また、特定部6bは、レコードの項目「担当」に対応する同一性条件5cの内容「他のレコード排他的」を取得する。また、特定部6bは、レコードの項目「会員」に対応する同一性条件5cの内容「共通項に使用しない」を取得する。また、特定部6bは、レコードの項目「性別」に対応する同一性条件5cの内容「値は1種類まで」を取得する。また、特定部6bは、レコードの項目「商品」に対応する同一性条件5cの内容「値は2種類まで」を取得する。また、特定部6bは、レコードの項目「売上」に対応する同一性条件5cの内容「差が1000以下」を取得する。
続いて、特定部6bは、取得したレコードの項目のうち、未選択の項目を1つ選択する。例えば、図10の例に示す場合には、特定部6bは、レコードの項目「地域」、「店舗」、「担当」、「会員」、「性別」、「商品」、「売上げ」のうち、未選択の項目を1つ選択する。
続いて、特定部6bは、取得した全てのレコードの選択した項目の登録内容が、対応する同一性条件5cの内容を満たすか否かを判定する。例えば、特定部6bが図10の例に示す4つのレコードを取得し、図7の例に示す同一性条件5cが記憶部5に記憶されている場合について説明する。この場合に、レコードの項目「地域」を選択した場合には、特定部6bは、4つの全てのレコードの「地域」の項目の登録内容が、「東部」と「中部」の2種類であるため、「値は1種類まで」という同一性条件5cの内容を満たさないと判定する。同様に、レコードの項目「店舗」、「担当」、「会員」、「売上げ」のいずれかを選択した場合についても、対応する同一性条件5cの内容を満たさないため、特定部6bは、対応する同一性条件5cの内容を満たさないと判定する。一方、レコードの項目「性別」を選択した場合には、特定部6bは、4つの全てのレコードの「性別」の項目の登録内容が、「F」の1種類であるため、「値は1種類まで」という同一性条件5cの内容を満たすと判定する。同様に、レコードの項目「商品」を選択した場合には、特定部6bは、4つの全てのレコードの「商品」の項目の登録内容が、「X−PRT」および「Y−PC」の2種類であるため、「値は2種類まで」という同一性条件5cの内容を満たすと判定する。
取得した全てのレコードの選択した項目の登録内容が、対応する同一性条件5cの内容を満たす場合には、特定部6bは、選択した項目と、選択した項目の登録内容との組み合わせを共通項として特定し、特定した共通項を、選択したノードの共通項属性に設定する。ここで、特定部6bが実行する処理について具体的な例を挙げて説明する。図11は、特定部が実行する処理の一例を説明するための図である。例えば、特定部6bが、上述の例のように、レコードの項目「性別」を選択し、4つの全てのレコードの「性別」の項目の登録内容が、「値は1種類まで」という同一性条件5cの内容を満たすと判定した場合について説明する。なお、この場合において、さらに、特定部6bが、上述の例のように、レコードの項目「商品」を選択し、4つの全てのレコードの「商品」の項目の登録内容が、「値は2種類まで」という同一性条件5cの内容を満たすと判定したものとする。かかる場合には、特定部6bは、図11の例に示すように、選択した項目「性別」と、登録内容「F」との組み合わせ、および、選択した項目「商品」と、登録内容「X−PRT」および「Y−PC」との組み合わせを共通項に追加する。なお、図11の例は、共通項属性が示す共通項として、「店舗」と「店舗」の項目に登録された「A店」、「B店」との組み合わせが予め設定されている場合を示す。これに加えて、図11の例は、共通項属性が示す共通項として、「世代」と「世代」の項目に登録された「20」、「30」、「40」との組み合わせも設定されている場合を示す。
そして、特定部6bは、未選択の項目があるか否かを判定する。未選択の項目がある場合には、特定部6bは、上述した未選択の項目を1つ選択する処理を再び行う。そして、特定部6bは、未選択の項目を1つ選択する処理以降の上述した処理を再び行う。
図6の説明に戻り、算出部6cは、テーブル30aにおける関連度を算出する際に用いる項目の登録内容に基づいて、テーブル30aにおける分析対象の登録内容が登録された項目の登録内容ごとに、次のような関連度を算出する。すなわち、算出部6cは、テーブル30aにおける分析対象の登録内容が登録された項目に登録された登録内容と選択部6aにより選択されたノードとの関連度を算出する。また、算出部6cは、特定部6bにより特定された共通項を含むレコードに含まれる関連度を算出する際に用いる項目の登録内容に基づいて、かかる関連度を算出する。
一態様としては、算出部6cは、特定部6bにより特定された共通項を有するレコード(テーブル30aのレコード)の分析対象の項目の登録内容ごとに集計した、関連度を算出する際に用いる項目の登録内容の集計値をDWH30から取得する。例えば、特定部6bにより特定された共通項が、「性別」と、登録内容「F」との組み合わせ、および、選択した項目「商品」と、登録内容「X−PRT」および「Y−PC」との組み合わせである場合について説明する。この場合、算出部6cは、かかる共通項を有するテーブル30aのレコードの分析対象の項目「地域」の登録内容「東部」、「中部」、「西部」ごとに集計した、関連度を算出する際に用いる項目「売上」の登録内容の集計値をDWH30から取得する。
例えば、算出部6cは、DWH30のテーブル30aに対して発行する以下のようなSQL文を生成する。すなわち、算出部6cは、まず、関連度を算出する際に用いる項目の登録内容の合計が「SELECT」に指定されたSELECT句を生成する。例えば、通信部4により受け付けられた関連度を算出する際に用いる項目が「売上げ」である場合には、「SELECT SUM(売上)」というSELECT句を生成する。
続いて、算出部6cは、特定部6bにより特定された共通項が「WHERE」に指定されたWHERE句を生成する。例えば、特定部6bにより特定された共通項が、「性別」と、登録内容「F」との組み合わせ、および、選択した項目「商品」と、登録内容「X−PRT」および「Y−PC」との組み合わせである場合には、算出部6cは、次のようなWHERE句を生成する。すなわち、算出部6cは、「WHERE 性別=“F” AND 商品=“X−PRT” OR “Y−PC”」というWHERE句を生成する。
そして、算出部6cは、分析対象の項目が「GROUP BY」に指定された「GROUP BY」句を生成する。例えば、通信部4により受け付けられた分析対象の項目が、「地域」である場合には、算出部6cは、「GROUP BY 地域」という「GROUP BY」句を生成する。
続いて、算出部6cは、その他の句、例えば、「FROM テーブル30a」という句を生成する。その後、算出部6cは、生成したSELECT句、WHERE句、「GROUP BY」句、および、その他の句を用いて、新たに特定された共通項をWHERE句に含むSQL文を生成する。
また、算出部6cは、特定部6bによりノードに設定された共通項属性から共通項が特定されたか否かを判定する。特定された場合には、算出部6cは、ノードに設定された共通項属性から特定部6bにより特定された共通項が「WHERE」に指定されたWHERE句を新たに生成する。例えば、算出部6cは、「WHERE 店舗=“A店” OR “B店” AND 世代=“20” OR “30” OR “40”」というWHERE句を生成する。その後、算出部6cは、新たに生成したWHERE句、生成したSELECT句、「GROUP BY」句、および、その他の句を用いて、ノードに設定された共通項属性から特定された共通項をWHERE句に含むSQL文を新たに生成する。
そして、算出部6cは、生成したSQL文ごとに、SQL文をDWH30へ送信する指示を通信部4に送信する。これにより、通信部4は、SQL文をネットワーク40を介してDWH30に送信し、DWH30に対してSQL文が発行される。SQL文を受信した場合には、DWH30は、受信したSQL文に基づいて、テーブル30aのレコードの中から対応するレコードを検索し、検索の結果得られたレコードを集計し、集計結果をサーバ1に送信する。このようにして、DWH30は、受信したSQL文ごとに、集計結果をサーバ1に送信する。
例えば、「SELECT SUM(売上) FROM テーブル30a WHERE 性別=“F” AND 商品=“X−PRT” OR “Y−PC” GROUP BY 地域」というSQL文がDWH30に発行された場合について説明する。図12は、算出部が実行する処理の一例を説明するための図である。図12の例には、DWH30が有するテーブル30aの一例が示されている。上述したSQL文がDWH30に発行されると、DWH30は、SQL文に基づいて、テーブル30aからレコードを検索し、検索の結果、図12の例に示すようなレコード31を得る。そして、DWH30は、SQL文に基づいて、レコード31を集計し、図12の例に示すような集計結果32を得る。続いて、DWH30は、集計結果32をサーバ1に送信する。これにより、「プリンタ」という語をアンケートに実際に記入した人に共通する属性を有する全ての人にまで、集計対象のレコードを拡大することで、後述の関連度を精度良く算出することができる。
続いて、算出部6cは、DWH30から、送信した全てのSQL文に対応する全ての集計結果を受信したか否かを判定する。受信した場合には、算出部6cは、受信した集計結果が複数である場合には、受信した複数の集計結果を1つにまとめた集計結果とする。
そして、算出部6cは、関連度演算定義5bを取得する。続いて、算出部6cは、受信した集計結果(受信した集計結果が複数である場合には、1つにまとめた集計結果)の項目のうち、未選択の項目を1つ選択する。例えば、図12の例に示す集計結果32を受信した場合には、算出部6cは、集計結果32の項目「東部」、「中部」、「西部」のうち、未選択の項目を1つ選択する。
そして、算出部6cは、関連度演算定義5cが示すアルゴリズムを用いて、選択した項目と選択したノードとの関連度を算出する。例えば、算出部6cは、集計値の全項目の平均値に対する関連度を算出する項目の集計値の割合を関連度として算出するアルゴリズムを用いる。この場合、算出部6cは、集計値の全項目の平均値に対する選択した項目の集計値の割合を、選択した項目と選択したノードとの関連度として算出する。例えば、図12の例の集計結果32を受信し、「東部」の項目を選択した場合には、算出部6cは、「東部」と「プリンタ」との関連度「163%」を算出する。同様に、図12の例の集計結果32を受信し、「中部」の項目を選択した場合には、算出部6cは、「中部」と「プリンタ」との関連度「109%」を算出する。様に、図12の例の集計結果32を受信し、「西部」の項目を選択した場合には、算出部6cは、「西部」と「プリンタ」との関連度「28%」を算出する。
続いて、算出部6cは、受信した集計結果の項目の中に、未選択の項目があるか否かを判定する。未選択の項目がある場合には、算出部6cは、上述した、受信した集計結果の項目のうち、未選択の項目を1つ選択する処理を再び行う。そして、算出部6cは、上述した、未選択の項目を1つ選択する処理以降の処理を再び行う。一方、未選択の項目がない場合には、算出部6cは、選択部6aにより選択されたノードの中に未選択のノードがあるか否かを判定する。未選択のノードがある場合には、先の特定部6bが、上述した、選択部6aにより選択されたノードのうち未選択のノードを1つ選択する処理を再び行う。そして、特定部6bが、上述した、未選択のノードを1つ選択する処理以降の処理を再び行う。
抽出部6dは、算出部6cにより算出された関連度に基づいて、選択部6aにより選択されたノードの中から、分析対象との関連性があるノードを抽出する。
例えば、算出部6cにより、選択されたノードの中に未選択のノードがないと判定された場合には、抽出部6dは、選択部6aにより選択されたノードのそれぞれと、分析対象の登録内容との関連度のうち、最も高い関連度を特定する。ここで、抽出部6dが実行する処理の一例について説明する。図13は、抽出部が実行する処理の一例を説明するための図である。図13の例には、選択部6aにより選択されたノード「一番」、「安い」、「プリンタ」、「パソコン」のそれぞれと、項目「東部」、「中部」、「西部」との集計結果51から、算出部6cにより算出された関連度52の一例が示されている。図13の例に示す関連度52において、抽出部6dは、ノード「一番」、「安い」、「プリンタ」、「パソコン」のそれぞれと、分析対象の登録内容「東部」との関連度のうち、最も高い関連度「163%」を特定する。
続いて、抽出部6dは、新たに特定された関連度よりも前に特定された関連度があるか否かを判定する。新たに特定された関連度よりも前に特定された関連度がある場合には、抽出部6dは、新たに特定された関連度が、前回特定された関連度よりも小さいか否かを判定する。新たに特定された関連度が、前回特定された関連度以上である場合には、抽出部6dは、新たに特定された関連度に対応するノードを抽出し、抽出したノードを縦軸に、分析対象の項目を横軸とする集計結果のレコードを最終集計結果の先頭に追加する。また、新たに特定された関連度よりも前に特定された関連度がない場合にも、抽出部6dは、新たに特定された関連度に対応するノードを抽出し、抽出したノードを縦軸に、分析対象の項目を横軸とする集計結果のレコードを最終集計結果の一番上に追加する。図14は、抽出部が実行する処理の一例を説明するための図である。例えば、先の図13の例が示すように、ノード「一番」、「安い」、「プリンタ」、「パソコン」のそれぞれと、分析対象の登録内容「東部」との関連度のうち、最も高い関連度「163%」を特定した場合には、抽出部6dは、次のような処理を行う。すなわち、抽出部6dは、新たに特定された関連度「163%」に対応するノード「プリンタ」を抽出する。これに加えて、抽出部6dは、図14の例に示すように、抽出した「プリンタ」を縦軸に、分析対象の項目の登録内容「東部」、「中部」、「西部」を横軸とする集計結果51のレコードを最終集計結果60の先頭に追加する。そして、先の選択部6aが、上述した、抽出部6dにより抽出されたノードに関連性があるノードを選択する処理を再び行い、ノードを選択する処理以降の処理を再び行う。
図6の説明に戻り、出力制御部6eは、各種の情報を出力する。例えば、出力制御部6eは、特定部6bにより、関連度が算出されていないノードがないと判定された場合、および、抽出部6dにより、新たに特定された関連度が、前回特定された関連度よりも小さいと判定された場合には、次の処理を行う。すなわち、出力制御部6eは、最終集計結果をクライアント20に送信する指示を最終集計結果とともに通信部4に送信する。これにより、通信部4は、最終集計結果をネットワーク40を介してクライアント20に送信する。
サーバ1は、選択部6a、特定部6b、算出部6cおよび抽出部6dによって上述した処理が実行されることで、縦軸として指定されたノードから、分析対象の登録内容と関連性が高いノードが次々と抽出される。図15および図16は、サーバが実行する処理の一例を説明するための図である。図15の例には、選択部6aにより選択されたノード「一番」、「安い」、「プリンタ」、「パソコン」のそれぞれと、項目「東部」、「中部」、「西部」との集計結果から、算出部6cにより算出された関連度53の一例が示されている。図15の例に示す関連度53において、抽出部6dは、ノード「一番」、「安い」、「プリンタ」、「パソコン」のそれぞれと、分析対象の登録内容「東部」との関連度のうち、最も高い関連度「163%」を特定する。
また、図15の例には、選択部6aにより選択されたノード「店員」、「液晶」のそれぞれと、項目「東部」、「中部」、「西部」との集計結果から、算出部6cにより算出された関連度54の一例が示されている。図15の例に示す関連度54において、抽出部6dは、ノード「店員」、「液晶」のそれぞれと、分析対象の登録内容「東部」との関連度のうち、最も高い関連度「180%」が、前回特定された関連度「163%」よりも高いため、次のような処理を行う。すなわち、抽出部6dは、関連度「180%」を特定する。
また、図15の例には、選択部6aにより選択されたノード「きれい」、「X社」のそれぞれと、項目「東部」、「中部」、「西部」との集計結果から、算出部6cにより算出された関連度55の一例が示されている。図15の例に示す関連度55において、抽出部6dは、ノード「きれい」、「X社」のそれぞれと、分析対象の登録内容「東部」との関連度のうち、最も高い関連度「195%」が、前回特定された関連度「180%」よりも高いため、次のような処理を行う。すなわち、抽出部6dは、関連度「195%」を特定する。
また、図15の例には、選択部6aにより選択されたノード「買う」と、項目「東部」、「中部」、「西部」との集計結果から、算出部6cにより算出された関連度56の一例が示されている。なお、図15の例に示すように、算出部6cは、ノード「液晶」に隣接するノード「パソコン」については、すでに関連度が算出済みであるため、関連度56には、ノード「パソコン」についての関連度が含まれない。図15の例に示す関連度56において、出力制御部6eは、ノード「買う」と、分析対象の登録内容「東部」との関連度「105%」が、前回特定された関連度「195%」よりも小さいため、次のような処理を行う。すなわち、出力制御部6eは、図16に示す最終集計結果60をクライアント20に送信する指示とともに最終集計結果60を通信部4に送信する。これにより、最終集計結果60がクライアント20において表示される。
制御部6は、Application Specific Integrated Circuit(ASIC)などの集積回路である。また、制御部6は、Field Programmable Gate Array(FPGA)であってもよい。また、制御部6は、Central Processing Unit(CPU)などの電子回路であってもよい。さらに、制御部6は、Micro Processing Unit(MPU)であってもよい。
次に、本実施例に係るクライアント20が実行する処理の流れを説明する。図17は、実施例1に係るレイアウト指定処理の手順を示すフローチャートである。例えば、レイアウト指定処理は、レイアウト指定処理を実行するための指示が入力部21から制御部25に入力された場合に、実行される。
図17に示すように、レイアウト指定部25aは、記憶部24から、ノードリンク24a、次元24b、数値データ項目24cを取得する(S101)。そして、レイアウト指定部25aは、図5の例に示すように、レイアウト指定画面26、ノードリンク24a、次元24b、数値データ項目24cを表示するように、表示部22を制御する(S102)。
そして、レイアウト指定部25aは、ユーザによって、「縦軸」、「横軸」、「集計」の全項目に、各項目に対応する内容が指定されたか否かを判定する(S103)。指定されていない場合(S103否定)には、レイアウト指定部25aは、再び、S103の判定を行う。一方、指定された場合(S103肯定)には、レイアウト指定部25aは、テーブル30aの「横軸」に指定された項目の登録内容を表示するように、表示部22を制御する(S104)。
そして、レイアウト指定部25aは、ユーザによって、分析対象の登録内容が指定されたか否かを判定する(S105)。指定されていない場合(S105否定)には、レイアウト指定部25aは、再び、S105の判定を行う。一方、指定された場合(S105肯定)には、レイアウト指定部25aは、次のような処理を行う。すなわち、レイアウト指定部25aは、レイアウト指定画面26の「縦軸」、「横軸」、「集計」の各項目に指定された内容、および、指定された分析対象の登録内容に、サーバ1への送信指示を付加して、通信部23に送信する(S106)。
そして、レイアウト指定部25aは、サーバ1から送信された後述の最終集計結果を受信したか否かを判定する(S107)。受信していない場合(S107否定)には、レイアウト指定部25aは、再び、S107の判定を行う。受信した場合(S107肯定)には、出力制御部25bは、受信した最終集計結果を表示するように、表示部22を制御し(S108)、処理を終了する。
次に、本実施例に係るサーバ1が実行するノード抽出処理の流れを説明する。図18は、実施例1に係るノード抽出処理の手順を示すフローチャートである。例えば、ノード抽出処理は、通信部4によりレイアウト指定画面26の「縦軸」、「横軸」、「集計」の各項目に指定された内容、および、分析対象の登録内容が受け付けられた場合に、実行される。
図18に示すように、選択部6aは、通信部4により受け付けられたノードに隣接するノード、および、抽出部6dにより抽出されたノードに隣接するノードを選択する(S201)。特定部6bは、選択部6aにより選択されたノードのうち、後述の算出部6cにより関連度が算出されていないノードがあるか否かを判定する(S202)。
関連度が算出されていないノードがある場合(S202肯定)には、特定部6bは、第一の処理を実行する(S203)。図19は、実施例1に係る第一の処理の手順を示すフローチャートである。図19に示すように、特定部6bは、選択部6aにより選択されたノードのうち、未選択のノードを1つ選択する(S301)。
そして、特定部6bは、第二の処理を実行する(S302)。図20は、実施例1に係る第二の処理の手順を示すフローチャートである。図20に示すように、特定部6bは、選択したノードに共通項属性が設定されているか否かを判定する(S401)。
選択したノードに共通項属性が設定されていない場合(S401否定)には、特定部6bは、S403に進む。一方、選択したノードに共通項属性が設定されている場合(S401肯定)には、特定部6bは、設定されている共通項属性が示す共通項(項目、および、登録内容)を特定する(S402)。そして、特定部6bは、選択したノードが回答の欄に記載されたアンケート92の伝票番号を有するレコードがテーブル30aにあるか否かを判定する(S403)。
レコードがない場合(S403否定)には、特定部6bは、処理結果を内部メモリに格納し、リターンする。一方、レコードがある場合(S403肯定)には、特定部6bは、第三の処理を実行し(S404)、処理結果を内部メモリに格納し、リターンする。図21は、実施例1に係る第三の処理の手順を示すフローチャートである。図21に示すように、特定部6bは、選択したノードが回答の欄に記載されたアンケート92の伝票番号をDWH30に送信する指示を通信部4に送信して、DWH30からレコードを取得する(S501)。
続いて、特定部6bは、取得したレコードの各項目に対応する同一性条件5cの内容を取得する(S502)。続いて、特定部6bは、取得したレコードの項目のうち、未選択の項目を1つ選択する(S503)。
続いて、特定部6bは、取得した全てのレコードの選択した項目の登録内容が、対応する同一性条件5cの内容を満たすか否かを判定する(S504)。
取得した全てのレコードの選択した項目の登録内容の少なくとも1つ以上の登録内容が、対応する同一性条件5cの内容を満たさない場合(S504否定)には、特定部6bは、S506に進む。一方、取得した全てのレコードの選択した項目の登録内容が、対応する同一性条件5cの内容を満たす場合(S504肯定)には、特定部6bは、次のような処理を行う。すなわち、特定部6bは、選択した項目と、選択した項目の登録内容との組み合わせを共通項として特定し、特定した共通項を、選択したノードの共通項属性に設定する(S505)。
そして、特定部6bは、取得したレコードの項目の中に、未選択の項目があるか否かを判定する(S506)。未選択の項目がある場合(S506肯定)には、特定部6bは、S503に戻る。一方、未選択の項目がない場合(S506否定)には、特定部6bは、処理結果を内部メモリに格納し、リターンする。
図19の説明に戻り、算出部6cは、第四の処理を実行する(S303)。図22は、実施例1に係る第四の処理の手順を示すフローチャートである。図22に示すように、算出部6cは、第五の処理を実行する(S601)。図23は、実施例1に係る第五の処理の手順を示すフローチャートである。図23に示すように、算出部6cは、関連度を算出する際に用いる項目の登録内容の合計が「SELECT」に指定されたSELECT句を生成する(S701)。続いて、算出部6cは、特定部6bにより特定された共通項が「WHERE」に指定されたWHERE句を生成する(S702)。
そして、算出部6cは、分析対象の項目が「GROUP BY」に指定された「GROUP BY」句を生成する(S703)。続いて、算出部6cは、その他の句、例えば、「FROM テーブル30a」という句を生成する(S704)。その後、算出部6cは、生成したSELECT句、WHERE句、「GROUP BY」句、および、その他の句を用いて、新たに特定された共通項をWHERE句に含むSQL文を生成する(S705)。
続いて、算出部6cは、特定部6bによりノードに設定された共通項属性から共通項が特定されたか否かを判定する(S706)。特定されていない場合(S706否定)には、算出部6cは、処理結果を内部メモリに格納し、リターンする。一方、特定された場合(S706肯定)には、算出部6cは、ノードに設定された共通項属性から特定部6bにより特定された共通項が「WHERE」に指定されたWHERE句を新たに生成する(S707)。その後、算出部6cは、新たに生成したWHERE句、生成したSELECT句、「GROUP BY」句、および、その他の句を用いて、ノードに設定された共通項属性から特定された共通項をWHERE句に含むSQL文を新たに生成する(S708)。そして、算出部6cは、処理結果を内部メモリに格納し、リターンする。
図22の説明に戻り、算出部6cは、生成したSQL文ごとに、SQL文をDWH30へ送信する指示を通信部4に送信して、DWH30に対してSQL文を発行する(S602)。
続いて、算出部6cは、DWH30から、送信した全てのSQL文に対応する全ての集計結果を受信したか否かを判定する(S603)。受信していない場合(S603否定)には、算出部6cは、再び、S603の判定を行う。一方、受信した場合(S603肯定)には、算出部6cは、受信した集計結果が複数であるか否かを判定する(S604)。複数でない場合(S604否定)には、算出部6cは、処理結果を内部メモリに格納し、リターンする。一方、複数である場合(S604肯定)には、算出部6cは、受信した複数の集計結果を1つにまとめた集計結果とし(S605)、処理結果を内部メモリに格納し、リターンする。
図19の説明に戻り、算出部6cは、第六の処理を実行する(S304)。図24は、実施例1に係る第六の処理の手順を示すフローチャートである。図24に示すように、算出部6cは、関連度演算定義5bを取得する(S801)。続いて、算出部6cは、受信した集計結果(受信した集計結果が複数である場合には、1つにまとめた集計結果)の項目のうち、未選択の項目を1つ選択する(S802)。
そして、算出部6cは、関連度演算定義5bが示すアルゴリズムを用いて、選択した項目と選択したノードとの関連度を算出する(S803)。続いて、算出部6cは、受信した集計結果の項目の中に、未選択の項目があるか否かを判定する(S804)。未選択の項目がある場合(S804肯定)には、算出部6cは、S802に戻る。一方、未選択の項目がない場合(S804否定)には、算出部6cは、処理結果を内部メモリに格納し、リターンする。
図19の説明に戻り、算出部6cは、選択部6aにより選択されたノードの中に未選択のノードがあるか否かを判定する(S305)。未選択のノードがある場合(S305肯定)には、S301に戻る。一方、未選択のノードがない場合(S305否定)には、抽出部6dは、選択部6aにより選択されたノードのそれぞれと、分析対象の登録内容との関連度のうち、最も高い関連度を特定する(S306)。そして、抽出部6dは、処理結果を内部メモリに格納し、リターンする。
図18の説明に戻り、抽出部6dは、新たに特定された関連度よりも前に特定された関連度があるか否かを判定する(S204)。新たに特定された関連度よりも前に特定された関連度がある場合(S204肯定)には、抽出部6dは、新たに特定された関連度が、前回特定された関連度よりも小さいか否かを判定する(S205)。新たに特定された関連度が、前回特定された関連度以上である場合(S205否定)には、抽出部6dは、次のような処理を行う。すなわち、抽出部6dは、新たに特定された関連度に対応するノードを抽出し、抽出したノードを縦軸に、分析対象の項目を横軸とする集計結果のレコードを最終集計結果の先頭に追加し(S206)、S201に戻る。また、新たに特定された関連度よりも前に特定された関連度がない場合(S204否定)にも、抽出部6dは、S206に進む。
一方、関連度が算出されていないノードがない場合(S202否定)、および、新たに特定された関連度が、前回特定された関連度よりも小さい場合(S205肯定)には、出力制御部6eは、次の処理を行う。すなわち、出力制御部6eは、最終集計結果をクライアント20に送信する指示を最終集計結果とともに通信部4に送信する(S207)。そして、出力制御部6eは、処理を終了する。
上述してきたように、本実施例に係るサーバ1は、受け付けられたノードに関連性があるノード、および、抽出されたノードに関連性があるノードを選択する。そして、サーバ1は、テーブル30aにおける関連度を算出する際に用いる項目の登録内容に基づいて、テーブル30aにおける分析対象の登録内容が登録された項目の登録内容ごとに、次のような関連度を算出する。すなわち、サーバ1は、テーブル30aにおける分析対象の登録内容が登録された項目に登録された登録内容と選択されたノードとの関連度を算出する。続いて、サーバ1は、算出された関連度に基づいて、選択されたノードの中から、分析対象との関連性があるノードを抽出する。このように、本実施例1に係るサーバ1によれば、自動的に、特定のノードに関連性があり、かつ、分析対象に関連性があるノードを抽出する。したがって、本実施例1に係るサーバ1によれば、特定のノードに関連性があり、かつ、分析対象に関連性があるノードを精度良く抽出することができる。
また、サーバ1は、選択されたノードが回答の欄に記載されたアンケート92の伝票番号を有するレコード(テーブル30aのレコード)間の所定の共通性を満たす項目を共通項として特定する。これに加えて、サーバ1は、特定した共通項の登録内容も特定する。そして、サーバ1は、特定された共通項を含むレコードに含まれる関連度を算出する際に用いる項目の登録内容に基づいて、関連度を算出する。このように、サーバ1は、選択されたノードが回答の欄に記載されたアンケート92の伝票番号を有するレコードだけでなく、共通項を含む全てのレコードまで、関連度を算出する際の対象のレコードを拡大する。したがって、サーバ1によれば、共通項を含む全てのレコードを対象に関連度を算出するので、精度良く関連度を算出することができる。
さて、これまで開示のシステムや装置に関する実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。
例えば、実施例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともできる。また、本実施例において説明した各処理のうち、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。
また、各種の負荷や使用状況などに応じて、各実施例において説明した各処理の各ステップでの処理を任意に細かくわけたり、あるいはまとめたりすることができる。また、ステップを省略することもできる。
また、各種の負荷や使用状況などに応じて、各実施例において説明した各処理の各ステップでの処理の順番を変更できる。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的状態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
[ノード抽出プログラム]
また、上記の実施例および変形例で説明したサーバ1の各種の処理は、あらかじめ用意されたノード抽出プログラムをパーソナルコンピュータやワークステーションなどのコンピュータシステムで実行することによって実現することもできる。そこで、以下では、図25を用いて、上記の実施例1で説明したサーバ1と同様の機能を有するノード抽出プログラムを実行するコンピュータの一例を説明する。図25は、ノード抽出プログラムを実行するコンピュータを示す図である。
図29に示すように、コンピュータ300は、CPU310、入出力装置320、通信制御部330、メモリ340、Hard Disk Drive(HDD)350を有する。CPU310、入出力装置320、通信制御部330、メモリ340、HDD350は、バス360を介して接続される。
HDD350には、OSなどの基本プログラムが記憶されている。また、HDD350には、上記の実施例で示す選択部6a、特定部6b、算出部6c、抽出部6d、出力制御部6eと同様の機能を発揮するノード抽出プログラム350aが予め記憶される。なお、ノード抽出プログラム350aについては、適宜分離しても良い。また、HDD350には、ノードリンク、関連度演算定義、同一性条件が設けられる。これらノードリンク、関連度演算定義、同一性条件は、上述したノードリンク5a、関連度演算定義5b、同一性条件5cに対応する。
そして、CPU310が、ノード抽出プログラム350aをHDD350から読み出して実行する。
そして、CPU310は、ノードリンク、関連度演算定義、同一性条件を読み出してメモリ340に格納する。さらに、CPU310は、メモリ340に格納されたノードリンク、関連度演算定義、同一性条件を用いて、ノード抽出プログラム350aを実行する。なお、メモリ340に格納される各データは、常に全てのデータがメモリ340に格納されなくともよい。処理に用いられるデータがメモリ340に格納されれば良い。
なお、上記したノード抽出プログラム350aについては、必ずしも最初からHDD350に記憶させておく必要はない。
例えば、コンピュータ300に挿入されるフレキシブルディスク(FD)、CD−ROM、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の物理媒体」にノード抽出プログラム350aを記憶させておく。そして、コンピュータ300がこれらからノード抽出プログラム350aを読み出して実行するようにしてもよい。
さらには、公衆回線、インターネット、LAN、WANなどを介してコンピュータ300に接続される「他のコンピュータ(またはサーバ)」などにノード抽出プログラム350aを記憶させておく。そして、コンピュータ300がこれらからノード抽出プログラム350aを読み出して実行するようにしてもよい。
1 ナビゲーターサーバ
5 記憶部
5a ノードリンク
5b 関連度演算定義
5c 同一性条件
6 制御部
6a 選択部
6b 特定部
6c 算出部
6d 抽出部
6e 出力制御部

Claims (6)

  1. 所定の事項に関するテキストから得られたノードリンクに含まれるノードの中から、ノードを受け付け、前記所定の事項に関するテーブルの項目の中から、分析対象の登録内容が登録された第1の項目を受け付け、前記分析対象の登録内容を受け付け、前記テーブルの項目の中から、前記テーブルにおける前記第1の項目に登録された登録内容とノードとの関連性を示す度合いである関連度を算出する際に用いる第2の項目を受け付ける受付部と、
    前記受付部により受け付けられたノードに関連性があるノード、および、抽出されたノードに関連性があるノードを選択する選択部と、
    前記テーブルにおける前記第2の項目の登録内容に基づいて、前記テーブルにおける前記第1の項目の登録内容ごとに、前記テーブルにおける前記第1の項目に登録された登録内容と前記選択部により選択されたノードとの前記関連度を算出する算出部と、
    前記算出部により算出された関連度に基づいて、前記選択部により選択されたノードの中から、前記分析対象との関連性があるノードを抽出する抽出部と、
    を有することを特徴とする情報処理装置。
  2. 前記選択部により選択されたノードを含むテキストに対応する前記テーブルのレコード間の所定の共通性を満たす項目および該項目の登録内容を特定する特定部をさらに有し、
    前記算出部は、前記特定部により特定された項目および該項目の登録内容を含むレコードに含まれる前記第2の項目の登録内容に基づいて、前記テーブルにおける前記第1の項目の登録内容ごとに、前記テーブルにおける前記第1の項目に登録された登録内容と前記選択部により選択されたノードとの前記関連度を算出する
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記選択部は、前記抽出部によりノードが抽出されるたびに、抽出されたノードに関連性があるノードのそれぞれを選択し、
    前記算出部は、前記選択部により選択されたノードのそれぞれについて、前記テーブルにおける前記第1の項目の登録内容ごとに、前記テーブルにおける前記第1の項目に登録された登録内容と前記選択部により選択されたノードとの前記関連度を算出し、
    前記抽出部は、前記選択部により選択されたノードのそれぞれについて前記算出部により算出された前記関連度のうち最も高い関連度が算出されたノードであって、前回抽出されたノードについて前記算出部により算出された関連度よりも高い関連度が算出されたノードを、前記分析対象との関連性があるノードとして抽出する
    ことを特徴とする請求項1または2に記載の情報処理装置。
  4. 前記抽出部により抽出されたノードに係る情報を出力する出力部
    をさらに有することを特徴とする請求項1〜3のいずれか1つに記載の情報処理装置。
  5. コンピュータに、
    所定の事項に関するテキストから得られたノードリンクに含まれるノードの中から、ノードを受け付け、前記所定の事項に関するテーブルの項目の中から、分析対象の登録内容が登録された第1の項目を受け付け、前記分析対象の登録内容を受け付け、前記テーブルの項目の中から、前記テーブルにおける前記第1の項目に登録された登録内容とノードとの関連性を示す度合いである関連度を算出する際に用いる第2の項目を受け付ける受付部により受け付けられたノードに関連性があるノード、および、抽出されたノードに関連性があるノードを選択し、
    前記テーブルにおける前記第2の項目の登録内容に基づいて、前記テーブルにおける前記第1の項目の登録内容ごとに、前記テーブルにおける前記第1の項目に登録された登録内容と前記選択部により選択されたノードとの前記関連度を算出し、
    算出された関連度に基づいて、選択されたノードの中から、前記分析対象との関連性があるノードを抽出する、
    各処理を実行させることを特徴とするノード抽出プログラム。
  6. コンピュータが、
    所定の事項に関するテキストから得られたノードリンクに含まれるノードの中から、ノードを受け付け、前記所定の事項に関するテーブルの項目の中から、分析対象の登録内容が登録された第1の項目を受け付け、前記分析対象の登録内容を受け付け、前記テーブルの項目の中から、前記テーブルにおける前記第1の項目に登録された登録内容とノードとの関連性を示す度合いである関連度を算出する際に用いる第2の項目を受け付ける受付部により受け付けられたノードに関連性があるノード、および、抽出されたノードに関連性があるノードを選択し、
    前記テーブルにおける前記第2の項目の登録内容に基づいて、前記テーブルにおける前記第1の項目の登録内容ごとに、前記テーブルにおける前記第1の項目に登録された登録内容と前記選択部により選択されたノードとの前記関連度を算出し、
    算出された関連度に基づいて、選択されたノードの中から、前記分析対象との関連性があるノードを抽出する、
    各処理を実行することを特徴とするノード抽出方法。
JP2012288949A 2012-12-28 2012-12-28 情報処理装置、ノード抽出プログラムおよびノード抽出方法 Expired - Fee Related JP6003637B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2012288949A JP6003637B2 (ja) 2012-12-28 2012-12-28 情報処理装置、ノード抽出プログラムおよびノード抽出方法
US14/060,976 US9189530B2 (en) 2012-12-28 2013-10-23 Information processing device, computer-readable recording medium, and node extraction method
EP13190051.6A EP2750052B1 (en) 2012-12-28 2013-10-24 Information processing device, node extraction program, and node extraction method
AU2013251190A AU2013251190B2 (en) 2012-12-28 2013-10-29 Information processing device, node extraction program, and node extraction method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012288949A JP6003637B2 (ja) 2012-12-28 2012-12-28 情報処理装置、ノード抽出プログラムおよびノード抽出方法

Publications (2)

Publication Number Publication Date
JP2014130539A true JP2014130539A (ja) 2014-07-10
JP6003637B2 JP6003637B2 (ja) 2016-10-05

Family

ID=49485559

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012288949A Expired - Fee Related JP6003637B2 (ja) 2012-12-28 2012-12-28 情報処理装置、ノード抽出プログラムおよびノード抽出方法

Country Status (4)

Country Link
US (1) US9189530B2 (ja)
EP (1) EP2750052B1 (ja)
JP (1) JP6003637B2 (ja)
AU (1) AU2013251190B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018078971A1 (ja) * 2016-10-25 2018-05-03 株式会社日立製作所 データ分析支援装置及びデータ分析支援システム
CN112100199A (zh) * 2020-09-21 2020-12-18 上海达梦数据库有限公司 一种基于数据集分组的分析方法、装置、设备及介质

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107209785B (zh) * 2015-02-11 2021-02-09 胡露有限责任公司 数据库系统中的相关性表聚合
WO2017076436A1 (en) 2015-11-03 2017-05-11 Volvo Truck Corporation A control system and method for a vehicle comprising an autonomous emergency braking system
US10430451B2 (en) * 2016-02-22 2019-10-01 Arie Rota System and method for aggregating and sharing accumulated information
JP6784612B2 (ja) * 2017-03-02 2020-11-11 株式会社日立製作所 分析ソフトウェア管理システム及び分析ソフトウェア管理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003141134A (ja) * 2001-11-07 2003-05-16 Hitachi Ltd テキストマイニング処理方法及びその実施装置
JP2004246491A (ja) * 2003-02-12 2004-09-02 Mitsubishi Electric Corp テキストマイニング装置及びテキストマイニングプログラム
JP2005321849A (ja) * 2004-05-06 2005-11-17 Fujitsu Ltd データ分析支援プログラム、データ分析支援方法、およびデータ分析支援装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2399641A1 (en) * 2000-02-10 2001-08-16 Involve Techology, Inc. System for creating and maintaining a database of information utilizing user opinions
US6675164B2 (en) 2001-06-08 2004-01-06 The Regents Of The University Of California Parallel object-oriented data mining system
US7912842B1 (en) * 2003-02-04 2011-03-22 Lexisnexis Risk Data Management Inc. Method and system for processing and linking data records
US6963826B2 (en) 2003-09-22 2005-11-08 C3I, Inc. Performance optimizer system and method
JP2005202535A (ja) 2004-01-14 2005-07-28 Hitachi Ltd 文書集計方法及び装置並びにそれらに用いるプログラムを記憶した媒体
WO2005072405A2 (en) * 2004-01-27 2005-08-11 Transpose, Llc Enabling recommendations and community by massively-distributed nearest-neighbor searching
US8510329B2 (en) 2005-05-25 2013-08-13 Experian Marketing Solutions, Inc. Distributed and interactive database architecture for parallel and asynchronous data processing of complex data and for real-time query processing
JP2010049411A (ja) 2008-08-20 2010-03-04 Fuji Xerox Co Ltd 文書データ解析装置およびプログラム
US20100082427A1 (en) * 2008-09-30 2010-04-01 Yahoo! Inc. System and Method for Context Enhanced Ad Creation
JP5312102B2 (ja) 2009-03-04 2013-10-09 三菱電機株式会社 データ統合装置及びデータ統合プログラム及び記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003141134A (ja) * 2001-11-07 2003-05-16 Hitachi Ltd テキストマイニング処理方法及びその実施装置
JP2004246491A (ja) * 2003-02-12 2004-09-02 Mitsubishi Electric Corp テキストマイニング装置及びテキストマイニングプログラム
JP2005321849A (ja) * 2004-05-06 2005-11-17 Fujitsu Ltd データ分析支援プログラム、データ分析支援方法、およびデータ分析支援装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6016030048; 齋藤 一彦、外2名: 'ミドルウェア' FUJITSU 第50巻,第3号, 19990510, p.130-134, 富士通株式会社 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018078971A1 (ja) * 2016-10-25 2018-05-03 株式会社日立製作所 データ分析支援装置及びデータ分析支援システム
JP2018072960A (ja) * 2016-10-25 2018-05-10 株式会社日立製作所 データ分析支援装置及びデータ分析支援システム
US11188567B2 (en) 2016-10-25 2021-11-30 Hitachi, Ltd. Data analysis support apparatus and data analysis support system
CN112100199A (zh) * 2020-09-21 2020-12-18 上海达梦数据库有限公司 一种基于数据集分组的分析方法、装置、设备及介质
CN112100199B (zh) * 2020-09-21 2024-03-26 上海达梦数据库有限公司 一种基于数据集分组的分析方法、装置、设备及介质

Also Published As

Publication number Publication date
AU2013251190B2 (en) 2016-02-04
EP2750052A2 (en) 2014-07-02
US20140188785A1 (en) 2014-07-03
US9189530B2 (en) 2015-11-17
EP2750052B1 (en) 2019-08-14
JP6003637B2 (ja) 2016-10-05
EP2750052A3 (en) 2014-07-09
AU2013251190A1 (en) 2014-07-17

Similar Documents

Publication Publication Date Title
US11868411B1 (en) Techniques for compiling and presenting query results
US11042591B2 (en) Analytical search engine
JP6003637B2 (ja) 情報処理装置、ノード抽出プログラムおよびノード抽出方法
US20160210294A1 (en) Graph-based search queries using web content metadata
US10210237B2 (en) Information processing system, similar category identification method, program, and computer readable information storage medium
US9116982B1 (en) Identifying interesting commonalities between entities
JP2010079657A (ja) 情報処理装置、情報処理方法およびプログラム
US20150032747A1 (en) Method for systematic mass normalization of titles
US20160004757A1 (en) Data management method, data management device and storage medium
JP5472110B2 (ja) 関係性発見装置、関係性発見方法および関係性発見プログラム
US10134073B2 (en) Information processing device, category displaying method, program, and information storage medium
US9996529B2 (en) Method and system for generating dynamic themes for social data
CN105468649A (zh) 一种待展示对象匹配的判断方法及其装置
WO2017203672A1 (ja) アイテム推奨方法、アイテム推奨プログラムおよびアイテム推奨装置
JP7481181B2 (ja) 計算機システムおよび貢献度計算方法
JP2020107269A (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP2020013413A (ja) 判断支援装置および判断支援方法
JP4269698B2 (ja) 意見分析方法、意見分析装置、および意見分析プログラム
JP2015230594A (ja) 意見活用支援装置、及び意見活用支援方法
KR20220026255A (ko) 빅데이터를 이용한 건강식품 추천시스템
JP6554306B2 (ja) 情報処理システム、情報処理方法、およびコンピュータプログラム
JP6509590B2 (ja) 商品に対するユーザの感情分析装置及びプログラム
JP5056542B2 (ja) コンテンツ表示方法、コンテンツ表示装置およびコンテンツ表示プログラム
KR100888329B1 (ko) 룰을 이용한 실시간 자동 정보 추출 시스템 및 방법
JP6320353B2 (ja) デジタルマーケティングシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150903

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160729

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160809

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160822

R150 Certificate of patent or registration of utility model

Ref document number: 6003637

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees