JP2007073024A - マクロ情報生成システム、マクロ情報生成装置、マクロ情報生成方法及びマクロ情報生成プログラム - Google Patents
マクロ情報生成システム、マクロ情報生成装置、マクロ情報生成方法及びマクロ情報生成プログラム Download PDFInfo
- Publication number
- JP2007073024A JP2007073024A JP2005348322A JP2005348322A JP2007073024A JP 2007073024 A JP2007073024 A JP 2007073024A JP 2005348322 A JP2005348322 A JP 2005348322A JP 2005348322 A JP2005348322 A JP 2005348322A JP 2007073024 A JP2007073024 A JP 2007073024A
- Authority
- JP
- Japan
- Prior art keywords
- information
- data
- macro
- storage device
- data storage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Economics (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】 単一のサイトに蓄積されているデータだけでなく、複数サイトに分散蓄積されているデータをセンタで統合して分析することにより、マクロ情報を得ることができるようにする。
【解決手段】 複数のリモートサイトのサイト装置の集約手段212,222は、蓄積するデータに含まれる情報を抽出し集約情報を生成する。センタ装置30の集約情報統合手段32は、各サイトから受信した集約情報を統合して統合集約情報を生成し、近似情報生成手段33は、全リモートサイトのデータの内容を再現した近似情報を生成する。そして、分析手段35は、近似情報に基づいてマクロ情報を生成する。そのようにすることによって、システム全体としてのマクロ情報を精度よく生成できる。また、データ分析の際のサイトとセンタとの通信量を低減でき、プライバシの保護を確保することができる。
【選択図】 図1
【解決手段】 複数のリモートサイトのサイト装置の集約手段212,222は、蓄積するデータに含まれる情報を抽出し集約情報を生成する。センタ装置30の集約情報統合手段32は、各サイトから受信した集約情報を統合して統合集約情報を生成し、近似情報生成手段33は、全リモートサイトのデータの内容を再現した近似情報を生成する。そして、分析手段35は、近似情報に基づいてマクロ情報を生成する。そのようにすることによって、システム全体としてのマクロ情報を精度よく生成できる。また、データ分析の際のサイトとセンタとの通信量を低減でき、プライバシの保護を確保することができる。
【選択図】 図1
Description
本発明は、分散した複数の情報源が蓄積するヘテロなデータを巨視的に統合した情報であるマクロ情報を生成するマクロ情報生成システム、マクロ情報生成装置、マクロ情報生成方法及びマクロ情報生成プログラムに関する。また、本発明は、マクロ情報を配信するマクロ情報配信システム、マクロ情報配信装置及びマクロ情報配信プログラムに関する。また、本発明は、データを蓄積するデータ蓄積装置、及び蓄積データを処理する蓄積データ処理プログラムに関する。
マクロ情報生成装置を用いて、各サイトの生データ(各サイトが蓄積するデータそのもの)を一箇所に集めることなく、高い精度で各サイトの情報源からのデータについて、全体を鳥瞰した情報(マクロ情報)を求めることが行われている。例えば、特許文献1には、情報の統合とサイト個別の推定処理とを繰り返し実行して、求めるマクロ情報の推定精度を高める方式が記載されている。また、例えば、非特許文献1には、推定処理とサイト個別での推定パラメータの修正とを繰り返し実行して、求めるマクロ情報の推定精度を高める方式が記載されている。
また、各サイトの生データを一箇所に集めることなく、且つ通信ネットワークを介したデータ通信(生データの送受信)を繰り返し実行することなく、高い精度で各サイトの情報源からのデータについて、マクロ情報を求めることができる。例えば、特許文献2には、複数のサイトが各データ集合から確率分布を推定し、それらの確率分布から複数の情報源をまとめて1つの情報源とみたときの同時確率分布を推定することによって、マクロ情報を求める方式が記載されている。
更に、マクロ情報を確率分布としてでなく、所定のルールとして求めることが行われている。例えば、特許文献3には、複数サイトが各データ集合からルールを推定し、その推定結果を用いてデータ全体を説明するルールを推定することによって、マクロ情報を求める方式が記載されている。
しかし、特許文献1や非特許文献1に記載された方式を用いてマクロ情報を生成する場合、各情報源が蓄積するデータから全体としての確率分布を精度良く推定するために、各サイトと情報統合を行う装置(以下、センタ装置)との間で何度も通信を行い、センタで情報を受信する度に推定処理を繰り返し行わなければならない。そのため、通信を繰り返し実行することによって、高コストになってしまうとともに、機密情報の漏洩を招く可能性が増加する。また、センタから送られてきた情報から逆算して他のサイトの機密情報を求められやすく、プライバシの侵害を生じる恐れが増すという問題点がある。
また、特許文献2に記載された方式を用いてマクロ情報を生成する場合、上記の問題点を解決するために、通信ネットワークを介したデータ通信を繰り返し実行することなく、高い精度で同時確率分布の推定が行えるようにしている。しかし、事前にサイト間の類似性を求めるために、予めセンタ装置がサイト間の類似性を示す情報である事前知識を蓄積することが必要となる。そのため、事前知識が必要となることによって、特許文献2に記載された手法を適用してマクロ情報を生成できる範囲が大きく制限されるという問題点がある。また、特許文献2に記載された方式を用いたとしても、センタ装置が事前知識を蓄積していない場合、適切にマクロ情報を生成できないことがある。
また、特許文献3に記載された方式を用いてマクロ情報を生成する場合、通信ネットワークを介したデータ通信を繰り返し実行することなく、高速にデータ全体を説明する所定のルールを推定することができる。しかし、特許文献3に記載された方式では、各サイト間においてデータの性質が異なる等の非均質性(ヘテロ性)が存在することを想定していないという問題点がある。そのため、特許文献3に記載された方式を用いたとしても、各情報源がヘテロなデータを蓄積している場合には、適切にマクロ情報を生成できないことがある。
例えば、現実の各種情報の処理環境では、単一のサイトに蓄積されているデータのみならず、複数サイトに分散蓄積されているデータをセンタで統合して分析することにより、マクロ情報を得ることが重要となる場合がある。この場合、通信量やプライバシ等の問題から、各サイトの生データ全体を一箇所に集めること自体が現実的でないことが多い。例え生データを一箇所に集めたとしても、各データセット間では分析に利用するデータの次元が異なる等、サイト間で非均質性(ヘテロ性)が存在することが多い。なお、「データの次元」とは、センタで分析するためにデータをベクトル化した場合に、ベクトル化したデータの次元を指す。
また、生データをセンタに送信しなくても、各情報源が蓄積するデータを分析してマクロ情報を生成する際に、生データ全体を一箇所(センタ)に集めて分析した時の精度と同程度の精度で分析できるようにすることが望ましい。また、各情報源が蓄積するデータを分析する際に、様々な分析方法で分析を行えるようにすることが望ましい。さらに、マクロ情報をユーザに提示する際に、ユーザにとって分かりやすい意義のあるデータ形式で提示できるようにすることが望ましい。
そこで、本発明は、各サイトが蓄積するデータそのものである生データを一箇所に集めることなくマクロ情報を生成できるマクロ情報生成システム、マクロ情報配信システム、マクロ情報生成装置、マクロ情報配信装置、データ蓄積装置、マクロ情報生成方法、マクロ情報生成プログラム、マクロ情報配信プログラム及び蓄積データ処理プログラムを提供することを目的とする。
また、本発明は、各サイトから送信されるデータの情報量が少ない状態であっても、マクロ情報を生成できるマクロ情報生成システム、マクロ情報配信システム、マクロ情報生成装置、マクロ情報配信装置、データ蓄積装置、マクロ情報生成方法、マクロ情報生成プログラム、マクロ情報配信プログラム及び蓄積データ処理プログラムを提供することを目的とする。
また、本発明は、ヘテロ性をもつ分散蓄積されたデータに対して、マクロ情報を生成できるマクロ情報生成システム、マクロ情報配信システム、マクロ情報生成装置、マクロ情報配信装置、データ蓄積装置、マクロ情報生成方法、マクロ情報生成プログラム、マクロ情報配信プログラム及び蓄積データ処理プログラムを提供することを目的とする。
また、本発明は、サイト間の類似性を示す情報である事前知識を必要とすることなくマクロ情報を生成できるマクロ情報生成システム、マクロ情報配信システム、マクロ情報生成装置、マクロ情報配信装置、データ蓄積装置、マクロ情報生成方法、マクロ情報生成プログラム、マクロ情報配信プログラム及び蓄積データ処理プログラムを提供することを目的とする。
また、本発明は、生データを一箇所に集めた時と同程度の精度でマクロ情報を生成できるマクロ情報生成システム、マクロ情報配信システム、マクロ情報生成装置、マクロ情報配信装置、データ蓄積装置、マクロ情報生成方法、マクロ情報生成プログラム、マクロ情報配信プログラム及び蓄積データ処理プログラムを提供することを目的とする。
また、本発明は、様々な分析手法でマクロ情報を生成できるマクロ情報生成システム、マクロ情報配信システム、マクロ情報生成装置、マクロ情報配信装置、データ蓄積装置、マクロ情報生成方法、マクロ情報生成プログラム、マクロ情報配信プログラム及び蓄積データ処理プログラムを提供することを目的とする。
更に、本発明は、利用ユーザに対して、容易に把握が可能で有意義なマクロ情報を提示できるマクロ情報生成システム、マクロ情報配信システム、マクロ情報生成装置、マクロ情報配信装置、データ蓄積装置、マクロ情報生成方法、マクロ情報生成プログラム、マクロ情報配信プログラム及び蓄積データ処理プログラムを提供することを目的とする。
本発明によるマクロ情報生成システムは、データを蓄積する複数のデータ蓄積装置(例えば、サイト装置20A,20B)と、各データ蓄積装置が蓄積するデータを処理するデータ処理装置(例えば、センタ装置30)とを備え、データ蓄積装置は、蓄積するデータを所定の方法で集約した集約情報を生成する集約情報生成手段(例えば、集約手段212,222によって実現される)と、集約情報生成手段が生成した集約情報を、通信ネットワークを介してデータ処理装置に送信する集約情報送信手段(例えば、集約手段212,222によって実現される)とを含み、データ処理装置は、各データ蓄積装置から受信した集約情報に基づいて、各データ蓄積装置が蓄積するデータの内容を再現した再現データ(例えば、近似情報)を生成するデータ再現手段(例えば、近似情報生成手段33によって実現される)と、データ再現手段が生成した再現データを分析し、各データ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を生成するマクロ情報生成手段(例えば、分析手段35によって実現される)とを含むことを特徴とする。
また、マクロ情報生成システムにおいて、データ処理装置は、各データ蓄積装置から受信した集約情報を統合した統合集約情報を生成する集約情報統合手段(例えば、集約情報統合手段32によって実現される)を含み、データ再現手段は、集約情報統合手段が生成した統合集約情報に基づいて、再現データを生成するものであってもよい。
また、マクロ情報生成システムにおいて、マクロ情報生成手段は、各データ蓄積装置から受信した集約情報をサンプリングすることによって、再現データとしてサンプリングデータを生成するものであってもよい。
また、マクロ情報生成システムにおいて、データ蓄積装置は、蓄積するデータの次元を示す次元情報を生成する次元情報生成手段(例えば、次元枚挙手段213,223によって実現される)と、次元情報生成手段が生成した次元情報を、通信ネットワークを介してデータ処理装置に送信する次元情報送信手段(例えば、次元枚挙手段213,223によって実現される)とを含み、データ処理装置は、各データ蓄積装置から受信した次元情報を統合した統合次元情報を生成する次元情報統合手段(例えば、統合次元生成手段36によって実現される)を含み、データ再現手段は、各データ蓄積装置から受信した集約情報と、次元情報統合手段が生成した統合次元情報とに基づいて、再現データを生成するものであってもよい。
また、マクロ情報生成システムにおいて、データ処理装置は、所定の単語辞書(例えば、同義語辞書)を記憶する辞書記憶手段(例えば、センタ装置30の記憶装置によって実現される)を含み、次元情報統合手段は、辞書記憶手段が記憶する単語辞書に基づいて、各データ蓄積装置から受信した次元情報に含まれる各単語の対応関係を示す対応ルールを、統合次元情報として生成するものであってもよい。
また、マクロ情報生成システムにおいて、マクロ情報生成手段は、マクロ情報として、各データ蓄積装置が蓄積するデータに含まれる情報要素がデータ中に出現する確率分布であるマクロ分布を求めるものであってもよい。
また、マクロ情報生成システムにおいて、データ処理装置は、マクロ情報生成手段が生成したマクロ分布を、所定のデータ形式に変換するデータ変換手段(例えば、部分情報抽出手段39によって実現される)を含むものであってもよい。
また、マクロ情報生成システムにおいて、データ変換手段は、各データ蓄積装置が蓄積するデータに含まれるトピック毎の活性度又は特徴的な単語を抽出することによって、マクロ情報生成手段が生成したマクロ分布を所定のデータ形式に変換するものであってもよい。
また、マクロ情報生成システムにおいて、データ変換手段は、所定の抽出条件(例えば、所定のトピックを含むこと)に従って、マクロ情報生成手段が生成したマクロ分布から部分情報を抽出し、抽出した部分情報を所定のデータ形式に変換するものであってもよい。
また、マクロ情報生成システムにおいて、データ処理装置は、マクロ情報生成手段が生成したマクロ分布と、データ変換手段が抽出した部分情報との対応関係を示す情報を求める対応関係算出手段(例えば、構成推測手段310によって実現される)を含むものであってもよい。
また、マクロ情報生成システムにおいて、データ処理装置は、情報(例えば、製品名や技術名)と技術ドメインとを対応付けた辞書であるドメイン辞書を記憶するドメイン辞書記憶手段(例えば、ドメイン記憶部311によって実現される)と、ドメイン辞書記憶手段が記憶するドメイン辞書に基づいて、所定のラベリング処理を行うラベリング処理手段(例えば、ラベリング手段312によって実現される)とを含むものであってもよい。なお、「技術ドメイン」とは、例えば、製品や技術が属する技術領域のことである。また、「ラベリング処理」とは、例えば、部分情報に所定のラベルを付与する処理のことである。
また、マクロ情報生成システムにおいて、データ変換手段は、所定の抽出条件に従って、マクロ情報生成手段が生成したマクロ分布から部分情報を抽出し、ラベリング処理手段は、ドメイン辞書記憶手段が記憶するドメイン辞書に基づいて、データ変換手段が抽出した部分情報に所定のラベル情報(例えば、図31に示すラベル「プロバイダ」や「データベース」)を付与するものであってもよい。
また、マクロ情報生成システムにおいて、ラベリング処理手段は、部分情報に対応する技術ドメインをドメイン辞書から抽出し、抽出した技術ドメインをラベル情報として部分情報に付与するものであってもよい。
また、マクロ情報生成システムにおいて、データ処理装置は、各データ蓄積装置が蓄積するデータを比較して表示するためのグラフ(例えば、図33に示すレーダーチャート72)を生成するグラフ生成手段(例えば、競合分析手段313によって実現される)を含むものであってもよい。
また、マクロ情報生成システムにおいて、グラフ生成手段は、データ蓄積装置側のトピックとデータ処理装置側のトピックとの構成比を用いて、競合分析を行うためのレーダーチャートを生成するものであってもよい。
また、マクロ情報生成システムにおいて、集約情報生成手段は、集約情報として、データ蓄積装置が蓄積するデータに含まれる情報要素がデータ中に出現する確率分布、又はデータ蓄積装置が蓄積するデータの次元に基づく統計量を求めるものであってもよい。
また、マクロ情報生成システムにおいて、データ処理装置は、時系列のテキストデータ(例えば、電子掲示板システムのデータや議事録データ)に基づいて、全時間帯に共通して出現する共通トピック、特定期間に出現する個別トピック、又は新たに出現する新規トピックを抽出するトピック抽出手段を含むものであってもよい。
また、マクロ情報生成システムにおいて、データ蓄積装置は、テキストデータのデータ内容又は対象物の評価を示す評価情報(例えば、電子掲示板システムから取得可能な評判情報)を記憶する評価情報記憶手段(例えば、データ記憶部211,221によって実現される)と、評価情報記憶手段が記憶する評価情報を、通信ネットワークを介してデータ処理装置に送信する評価情報送信手段(プログラムに従って動作するサイト装置20A,20BのCPU及びネットワークインタフェース部によって実現される)とを含み、データ処理装置は、データ蓄積装置から受信した評価情報に対応するテキストデータと、テキストデータのデータ内容又は対象物(例えば、企業製品の情報内容)との対応関係を示す対応情報(例えば、対応テーブル)を生成する対応情報生成手段(例えば、プログラムに従って動作するセンタ装置30のCPUによって実現される)を含むものであってもよい。
また、マクロ情報生成システムは、データを蓄積する複数のデータ蓄積装置と、各データ蓄積装置が蓄積するデータを処理するデータ処理装置とを備え、データ蓄積装置は、蓄積するデータを所定の方法で集約した集約情報を生成する集約情報生成手段と、集約情報生成手段が生成した集約情報を、通信ネットワークを介してデータ処理装置に送信する集約情報送信手段とを含み、データ処理装置は、各データ蓄積装置から受信した集約情報を統合した統合集約情報を生成する集約情報統合手段(例えば、集約情報統合手段32Aによって実現される)と、集約情報統合手段が生成した統合集約情報に基づいて、各データ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を生成するマクロ情報生成手段(例えば、マクロ分布生成手段38Aによって実現される)とを含むものであってもよい。
また、マクロ情報生成システムにおいて、データ蓄積装置は、蓄積するデータの次元を示す次元情報を生成する次元情報生成手段と、次元情報生成手段が生成した次元情報を、通信ネットワークを介してデータ処理装置に送信する次元情報送信手段とを含み、データ処理装置は、各データ蓄積装置から受信した次元情報を統合した統合次元情報を生成する次元情報統合手段を含み、データ再現手段は、集約情報統合手段が生成した統合集約情報と、次元情報統合手段が生成した統合次元情報とに基づいて、再現データを生成するものであってもよい。
また、マクロ情報生成システムは、データを蓄積する複数のデータ蓄積装置と、各データ蓄積装置が蓄積するデータを処理するデータ処理装置とを備え、データ蓄積装置は、蓄積するデータを所定の方法で集約した集約情報を生成する集約情報生成手段と、集約情報生成手段が生成した集約情報に基づいて、データ蓄積装置が蓄積するデータの内容を再現した再現データを生成するデータ再現手段(例えば、近似情報生成手段214,224によって実現される)と、データ再現手段が生成した再現データを、通信ネットワークを介してデータ処理装置に送信する再現データ送信手段(例えば、近似情報生成手段214,224によって実現される)とを含み、データ処理装置は、データ蓄積装置から受信した再現データを分析し、各データ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を生成するマクロ情報生成手段を含むものであってもよい。
本発明によるマクロ情報配信システムは、データを蓄積する複数のデータ蓄積装置と、各データ蓄積装置が蓄積するデータを処理するデータ処理装置とを備え、データ蓄積装置は、蓄積するデータを所定の方法で集約した集約情報を生成する集約情報生成手段と、集約情報生成手段が生成した集約情報を、通信ネットワークを介してデータ処理装置に送信する集約情報送信手段とを含み、データ処理装置は、各データ蓄積装置から受信した集約情報に基づいて、各データ蓄積装置が蓄積するデータの内容を再現した再現データを生成するデータ再現手段と、データ再現手段が生成した再現データを分析し、各データ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を生成するマクロ情報生成手段と、マクロ情報生成手段が生成したマクロ情報を、通信ネットワークを介してデータ蓄積装置に送信するマクロ情報配信手段(例えば、プログラムに従って動作するセンタ装置30のCPU及びネットワークインタフェース部によって実現される)とを含むことを特徴とする。
また、マクロ情報配信システムにおいて、データ処理装置は、所定の抽出条件に従って、マクロ情報生成手段が生成したマクロ情報に含まれるトピックを抽出するトピック抽出手段を含み、マクロ情報配信手段は、トピック抽出手段が抽出したトピックを、通信ネットワークを介してデータ蓄積装置に送信するものであってもよい。
また、マクロ情報配信システムにおいて、トピック抽出手段は、時系列のテキストデータに基づいて、全時間帯に共通して出現する共通トピック、特定期間に出現する個別トピック、又は新たに出現する新規トピックを抽出するものであってもよい。
また、マクロ情報配信システムにおいて、データ蓄積装置は、蓄積するデータに所定のフラグを付加するフラグ付加手段(例えば、プログラムに従って動作するサイト装置20A,20BのCPUによって実現される)を含み、集約情報生成手段は、集約情報として、データ蓄積装置が蓄積するデータに付加されているフラグ数を求め、マクロ情報生成手段は、データ蓄積装置から受信したフラグ数に基づいた所定の予測処理を行うことによって、マクロ情報を生成するものであってもよい。
また、マクロ情報配信システムにおいて、データ蓄積装置は、データ蓄積装置がいずれのトピックについてのデータを蓄積しているかを示す申告情報を、通信ネットワークを介してデータ処理装置に送信する申告情報送信手段(例えば、プログラムに従って動作するサイト装置20A,20BのCPU及びネットワークインタフェース部によって実現される)と、データ蓄積装置が蓄積するデータに類似する類似データの検索要求を、通信ネットワークを介してデータ処理装置に送信する検索要求送信手段(例えば、プログラムに従って動作するサイト装置20A,20BのCPU及びネットワークインタフェース部によって実現される)とを含み、データ処理装置は、各データ蓄積装置から受信した申告情報を、データ蓄積装置に対応付けて記憶する申告情報記憶手段(例えば、センタ装置30が備えるデータベース)と、データ蓄積装置から検索要求を受信すると、申告情報記憶手段が記憶する申告情報に基づいて、検索要求された類似データを蓄積するデータ蓄積装置を特定する蓄積装置特定手段(例えば、プログラムに従って動作するセンタ装置30のCPUによって実現される)と、蓄積装置特定手段が特定したデータ蓄積装置に、検索要求を受信したデータ蓄積装置への類似データの送信依頼を、通信ネットワークを介して送信するデータ送信依頼手段(例えば、プログラムに従って動作するセンタ装置30のCPU及びネットワークインタフェース部によって実現される)とを含むものであってもよい。
また、マクロ情報配信システムにおいて、データ蓄積装置は、テキストデータのデータ内容又は対象物の評価を示す評価情報を記憶する評価情報記憶手段と、評価情報記憶手段が記憶する評価情報を、通信ネットワークを介してデータ処理装置に送信する評価情報送信手段とを含み、データ処理装置は、データ蓄積装置から受信した評価情報に対応するテキストデータと、テキストデータのデータ内容又は対象物との対応関係を示す対応情報を生成する対応情報生成手段を含み、マクロ情報配信手段は、対応情報生成手段が生成した対応情報を、通信ネットワークを介してデータ蓄積装置に送信するものであってもよい。
本発明によるマクロ情報生成装置(例えば、センタ装置30)は、データを蓄積する複数のデータ蓄積装置から、データ蓄積装置が蓄積するデータを所定の方法で集約した集約情報を、通信ネットワークを介して受信する集約情報受信手段(例えば、プログラムに従って動作するセンタ装置30のCPU及びネットワークインタフェース部によって実現される)と、集約情報受信手段が受信した集約情報に基づいて、各データ蓄積装置が蓄積するデータの内容を再現した再現データを生成するデータ再現手段と、データ再現手段が生成した再現データを分析し、各データ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を生成するマクロ情報生成手段とを備えたことを特徴とする。
また、マクロ情報生成装置は、集約情報受信手段が受信した集約情報を統合した統合集約情報を生成する集約情報統合手段を備え、データ再現手段は、集約情報統合手段が生成した統合集約情報に基づいて、再現データを生成するものであってもよい。
また、マクロ情報生成装置において、マクロ情報生成手段は、各データ蓄積装置から受信した集約情報をサンプリングすることによって、再現データとしてサンプリングデータを生成するものであってもよい。
また、マクロ情報生成装置は、データ蓄積装置が蓄積するデータの次元を示す次元情報を、通信ネットワークを介して各データ蓄積装置から受信する次元情報受信手段(例えば、プログラムに従って動作するセンタ装置30のCPU及びネットワークインタフェース部によって実現される)と、次元情報受信手段が受信した次元情報を統合した統合次元情報を生成する次元情報統合手段とを備え、データ再現手段は、集約情報受信手段が受信した集約情報と、次元情報統合手段が生成した統合次元情報とに基づいて、再現データを生成するものであってもよい。
また、マクロ情報生成装置は、所定の単語辞書を記憶する辞書記憶手段を備え、次元情報統合手段は、辞書記憶手段が記憶する単語辞書に基づいて、各データ蓄積装置から受信した次元情報に含まれる各単語の対応関係を示す対応ルールを、統合次元情報として生成するものであってもよい。
また、マクロ情報生成装置において、マクロ情報生成手段は、マクロ情報として、各データ蓄積装置が蓄積するデータに含まれる情報要素がデータ中に出現する確率分布であるマクロ分布を求めるものであってもよい。
また、マクロ情報生成装置は、マクロ情報生成手段が生成したマクロ分布を、所定のデータ形式に変換するデータ変換手段を備えたものであってもよい。
また、マクロ情報生成装置において、データ変換手段は、各データ蓄積装置が蓄積するデータに含まれるトピック毎の活性度又は特徴的な単語を抽出することによって、マクロ情報生成手段が生成したマクロ分布を所定のデータ形式に変換するものであってもよい。
また、マクロ情報生成装置において、データ変換手段は、所定の抽出条件に従って、マクロ情報生成手段が生成したマクロ分布から部分情報を抽出し、抽出した部分情報を所定のデータ形式に変換するものであってもよい。
また、マクロ情報生成装置は、マクロ情報生成手段が生成したマクロ分布と、データ変換手段が抽出した部分情報との対応関係を示す情報を求める対応関係算出手段を含むものであってもよい。
また、マクロ情報生成装置は、情報と技術ドメインとを対応付けた辞書であるドメイン辞書を記憶するドメイン辞書記憶手段と、ドメイン辞書記憶手段が記憶するドメイン辞書に基づいて、所定のラベリング処理を行うラベリング処理手段とを備えたものであってもよい。
また、マクロ情報生成装置において、データ変換手段は、所定の抽出条件に従って、マクロ情報生成手段が生成したマクロ分布から部分情報を抽出し、ラベリング処理手段は、ドメイン辞書記憶手段が記憶するドメイン辞書に基づいて、データ変換手段が抽出した部分情報に所定のラベル情報を付与するものであってもよい。
また、マクロ情報生成装置において、ラベリング処理手段は、部分情報に対応する技術ドメインをドメイン辞書から抽出し、抽出した技術ドメインをラベル情報として部分情報に付与するものであってもよい。
また、マクロ情報生成装置は、各データ蓄積装置が蓄積するデータを比較して表示するためのグラフを生成するグラフ生成手段を備えたものであってもよい。
また、マクロ情報生成装置において、グラフ生成手段は、データ蓄積装置側のトピックとデータ処理装置側のトピックとの構成比を用いて、競合分析を行うためのレーダーチャートを生成するものであってもよい。
また、マクロ情報生成装置において、集約情報生成手段は、集約情報として、データ蓄積装置が蓄積するデータに含まれる情報要素がデータ中に出現する確率分布、又はデータ蓄積装置が蓄積するデータの次元に基づく統計量を求めるものであってもよい。
また、マクロ情報生成装置は、時系列のテキストデータに基づいて、全時間帯に共通して出現する共通トピック、特定期間に出現する個別トピック、又は新たに出現する新規トピックを抽出するトピック抽出手段を含むものであってもよい。
また、マクロ情報生成装置は、テキストデータのデータ内容又は対象物の評価を示す評価情報を、通信ネットワーク介してデータ蓄積装置から受信する評価情報受信手段と、評価情報受信手段が受信した評価情報に対応するテキストデータと、テキストデータのデータ内容又は対象物との対応関係を示す対応情報を生成する対応情報生成手段とを含むものであってもよい。
また、マクロ情報生成装置は、データを蓄積する複数のデータ蓄積装置から、データ蓄積装置が蓄積するデータを所定の方法で集約した集約情報を、通信ネットワークを介して受信する集約情報受信手段と、集約情報受信手段が受信した集約情報を統合した統合集約情報を生成する集約情報統合手段と、集約情報統合手段が生成した統合集約情報に基づいて、各データ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を生成するマクロ情報生成手段とを備えたものであってもよい。
本発明によるマクロ情報配信装置は(例えば、センタ装置30)、データを蓄積する複数のデータ蓄積装置から、データ蓄積装置が蓄積するデータを所定の方法で集約した集約情報を、通信ネットワークを介して受信する集約情報受信手段と、集約情報受信手段が受信した集約情報に基づいて、各データ蓄積装置が蓄積するデータの内容を再現した再現データを生成するデータ再現手段と、データ再現手段が生成した再現データを分析し、各データ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を生成するマクロ情報生成手段と、マクロ情報生成手段が生成したマクロ情報を、通信ネットワークを介してデータ蓄積装置に送信するマクロ情報配信手段とを備えたことを特徴とする。
また、マクロ情報配信装置は、所定の抽出条件に従って、マクロ情報生成手段が生成したマクロ情報に含まれるトピックを抽出するトピック抽出手段を備え、マクロ情報配信手段は、トピック抽出手段が抽出したトピックを、通信ネットワークを介してデータ蓄積装置に送信するものであってもよい。
また、マクロ情報配信装置において、トピック抽出手段は、時系列のテキストデータに基づいて、全時間帯に共通して出現する共通トピック、特定期間に出現する個別トピック、又は新たに出現する新規トピックを抽出するものであってもよい。
また、マクロ情報配信装置において、集約情報生成手段は、集約情報として、データ蓄積装置が蓄積するデータに付加されているフラグ数を求め、マクロ情報生成手段は、データ蓄積装置から受信したフラグ数に基づいた所定の予測処理を行うことによって、マクロ情報を生成するものであってもよい。
また、マクロ情報配信装置は、データ蓄積装置がいずれのトピックについてのデータを蓄積しているかを示す申告情報を、通信ネットワークを介してデータ蓄積装置から受信する申告情報受信手段と、データ蓄積装置が蓄積するデータに類似する類似データの検索要求を、通信ネットワークを介してデータ蓄積装置から受信する検索要求受信手段と、申告情報受信手段が受信した申告情報を、データ蓄積装置に対応付けて記憶する申告情報記憶手段と、検索要求受信手段が検索要求を受信すると、申告情報記憶手段が記憶する申告情報に基づいて、検索要求された類似データを蓄積するデータ蓄積装置を特定する蓄積装置特定手段と、蓄積装置特定手段が特定したデータ蓄積装置に、検索要求を受信したデータ蓄積装置への類似データの送信依頼を、通信ネットワークを介して送信するデータ送信依頼手段とを備えたものであってもよい。
また、マクロ情報配信装置は、テキストデータのデータ内容又は対象物の評価を示す評価情報を、通信ネットワーク介してデータ蓄積装置から受信する評価情報受信手段と、評価情報受信手段が受信した評価情報に対応するテキストデータと、テキストデータのデータ内容又は対象物との対応関係を示す対応情報を生成する対応情報生成手段とを含み、マクロ情報配信手段は、対応情報生成手段が生成した対応情報を、通信ネットワークを介してデータ蓄積装置に送信するものであってもよい。
本発明によるデータ蓄積装置(例えば、サイト装置20A,20B)は、複数のデータ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を生成するマクロ情報生成システムにおけるデータ蓄積装置であって、蓄積するデータを所定の方法で集約した集約情報を生成する集約情報生成手段と、集約情報生成手段が生成した集約情報に基づいて、データ蓄積装置が蓄積するデータの内容を再現した再現データを生成するデータ再現手段と、データ再現手段が生成した再現データを、各データ蓄積装置が蓄積するデータを処理するデータ処理装置に、通信ネットワークを介して送信する再現データ送信手段とを備えたことを特徴とする。
本発明によるマクロ情報生成方法は、データを蓄積する複数のデータ蓄積装置が、蓄積するデータを所定の方法で集約した集約情報を生成するステップと、各データ蓄積装置が、各データ蓄積装置が蓄積するデータを処理するデータ処理装置に、生成した集約情報を、通信ネットワークを介して送信するステップと、データ処理装置が、各データ蓄積装置から受信した集約情報に基づいて、各データ蓄積装置が蓄積するデータの内容を再現した再現データを生成するステップと、データ処理装置が、生成した再現データを分析し、各データ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を生成するステップとを含むことを特徴とする。
また、マクロ情報生成方法は、データ処理装置が、各データ蓄積装置から受信した集約情報を統合した統合集約情報を生成するステップと、データ処理装置が、生成した統合集約情報に基づいて、再現データを生成するステップとを含むものであってもよい。
また、マクロ情報生成方法は、データ処理装置が、各データ蓄積装置から受信した集約情報をサンプリングすることによって、再現データとしてサンプリングデータを生成するものであってもよい。
また、マクロ情報生成方法は、データ蓄積装置が、蓄積するデータの次元を示す次元情報を生成するステップと、データ蓄積装置が、生成した次元情報を、通信ネットワークを介してデータ処理装置に送信するステップと、データ処理装置が、各データ蓄積装置から受信した次元情報を統合した統合次元情報を生成するステップと、データ処理装置が、各データ蓄積装置から受信した集約情報と、生成した統合次元情報とに基づいて、再現データを生成するステップとを含むものであってもよい。
また、マクロ情報生成方法は、データ処理装置が、予め記憶する所定の単語辞書に基づいて、各データ蓄積装置から受信した次元情報に含まれる各単語の対応関係を示す対応ルールを、統合次元情報として生成するものであってもよい。
また、マクロ情報生成方法は、マクロ情報として、各データ蓄積装置が蓄積するデータに含まれる情報要素がデータ中に出現する確率分布であるマクロ分布を求めるものであってもよい。
また、マクロ情報生成方法は、データ処理装置が、マクロ情報生成手段が生成したマクロ分布を、所定のデータ形式に変換するステップを含むものであってもよい。
また、マクロ情報生成方法は、各データ蓄積装置が蓄積するデータに含まれるトピック毎の活性度又は特徴的な単語を抽出することによって、生成したマクロ分布を所定のデータ形式に変換するものであってもよい。
また、マクロ情報生成方法は、所定の抽出条件に従って、生成したマクロ分布から部分情報を抽出し、抽出した部分情報を所定のデータ形式に変換するものであってもよい。
また、マクロ情報生成方法は、データ処理装置が、生成したマクロ分布と、データ変換手段が抽出した部分情報との対応関係を示す情報を求めるステップを含むものであってもよい。
また、マクロ情報生成方法は、データ処理装置が、情報と技術ドメインとを対応付けた辞書であるドメイン辞書を記憶するステップと、データ処理装置が、記憶するドメイン辞書に基づいて、所定のラベリング処理を行うステップとを含むものであってもよい。
また、マクロ情報生成方法は、データ処理装置が、所定の抽出条件に従って、マクロ情報生成手段が生成したマクロ分布から部分情報を抽出するステップと、データ処理装置が、記憶するドメイン辞書に基づいて、抽出した部分情報に所定のラベル情報を付与するステップとを含むものであってもよい。
また、マクロ情報生成方法は、データ処理装置が、部分情報に対応する技術ドメインをドメイン辞書から抽出し、抽出した技術ドメインをラベル情報として部分情報に付与するものであってもよい。
また、マクロ情報生成方法は、データ処理装置が、各データ蓄積装置が蓄積するデータを比較して表示するためのグラフを生成するステップを含むものであってもよい。
また、マクロ情報生成方法は、データ処理装置が、データ蓄積装置側のトピックとデータ処理装置側のトピックとの構成比を用いて、競合分析を行うためのレーダーチャートを生成するものであってもよい。
また、マクロ情報生成方法は、集約情報として、データ蓄積装置が蓄積するデータに含まれる情報要素がデータ中に出現する確率分布、又はデータ蓄積装置が蓄積するデータの次元に基づく統計量を求めるものであってもよい。
また、マクロ情報生成方法は、データ処理装置が、時系列のテキストデータに基づいて、全時間帯に共通して出現する共通トピック、特定期間に出現する個別トピック、又は新たに出現する新規トピックを抽出するステップを含むものであってもよい。
また、マクロ情報生成方法は、データ蓄積装置が、テキストデータのデータ内容又は対象物の評価を示す評価情報を記憶するステップと、データ蓄積装置が、記憶する評価情報を、通信ネットワークを介してデータ処理装置に送信するステップと、データ処理装置が、データ蓄積装置から受信した評価情報に対応するテキストデータと、テキストデータのデータ内容又は対象物との対応関係を示す対応情報を生成するステップとを含むものであってもよい。
また、マクロ情報生成方法は、データを蓄積する複数のデータ蓄積装置が、蓄積するデータを所定の方法で集約した集約情報を生成するステップと、各データ蓄積装置が、生成した集約情報を、通信ネットワークを介してデータ処理装置に送信するステップと、各データ蓄積装置が蓄積するデータを処理するデータ処理装置が、各データ蓄積装置から受信した集約情報を統合した統合集約情報を生成するステップと、データ処理装置が、生成した統合集約情報に基づいて、各データ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を生成するステップとを含むものであってもよい。
また、マクロ情報生成方法は、データ蓄積装置が、蓄積するデータの次元を示す次元情報を生成するステップと、データ蓄積装置が、生成した次元情報を、通信ネットワークを介してデータ処理装置に送信するステップと、データ処理装置が、各データ蓄積装置から受信した次元情報を統合した統合次元情報を生成するステップと、データ処理装置が、生成した統合集約情報と、生成した統合次元情報とに基づいて、再現データを生成するステップとを含むものであってもよい。
また、マクロ情報生成方法は、データを蓄積する複数のデータ蓄積装置が、蓄積するデータを所定の方法で集約した集約情報を生成するステップと、データ蓄積装置が、生成した集約情報に基づいて、データ蓄積装置が蓄積するデータの内容を再現した再現データを生成するステップと、データ蓄積装置が、生成した再現データを、通信ネットワークを介してデータ処理装置に送信するステップとを含み、各データ蓄積装置が蓄積するデータを処理するデータ処理装置が、データ蓄積装置から受信した再現データを分析し、各データ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を生成するステップを含むものであってもよい。
また、マクロ情報生成方法は、データ処理装置が、生成したマクロ情報を、通信ネットワークを介してデータ蓄積装置に送信するステップとを含むものであってもよい。
また、マクロ情報生成方法は、データ処理装置が、所定の抽出条件に従って、マクロ情報生成手段が生成したマクロ情報に含まれるトピックを抽出するステップと、データ処理装置が、抽出したトピックを、通信ネットワークを介してデータ蓄積装置に送信するステップとを含むものであってもよい。
また、マクロ情報生成方法は、データ処理装置が、時系列のテキストデータに基づいて、全時間帯に共通して出現する共通トピック、特定期間に出現する個別トピック、又は新たに出現する新規トピックを抽出するものであってもよい。
また、マクロ情報生成方法は、データ蓄積装置が、蓄積するデータに所定のフラグを付加するステップと、データ蓄積装置が、集約情報として、データ蓄積装置が蓄積するデータに付加されているフラグ数を求めるステップと、データ処理装置が、データ蓄積装置から受信したフラグ数に基づいた所定の予測処理を行うことによって、マクロ情報を生成するステップとを含むものであってもよい。
また、マクロ情報生成方法は、データ蓄積装置が、データ蓄積装置がいずれのトピックについてのデータを蓄積しているかを示す申告情報を、通信ネットワークを介してデータ処理装置に送信するステップと、データ蓄積装置が、データ蓄積装置が蓄積するデータに類似する類似データの検索要求を、通信ネットワークを介してデータ処理装置に送信するステップと、データ処理装置が、各データ蓄積装置から受信した申告情報を、データ蓄積装置に対応付けて記憶するステップと、データ処理装置が、データ蓄積装置から検索要求を受信すると、申告情報記憶手段が記憶する申告情報に基づいて、検索要求された類似データを蓄積するデータ蓄積装置を特定するステップと、データ処理装置が、特定したデータ蓄積装置に、検索要求を受信したデータ蓄積装置への類似データの送信依頼を、通信ネットワークを介して送信するステップとを含むものであってもよい。
また、マクロ情報生成方法は、データ蓄積装置が、テキストデータのデータ内容又は対象物の評価を示す評価情報を記憶するステップと、データ蓄積装置が、記憶する評価情報を、通信ネットワークを介してデータ処理装置に送信するステップと、データ処理装置が、データ蓄積装置から受信した評価情報に対応するテキストデータと、テキストデータのデータ内容又は対象物との対応関係を示す対応情報を生成するステップと、データ処理装置が、生成した対応情報を、通信ネットワークを介してデータ蓄積装置に送信するステップとを含むものであってもよい。
本発明によるマクロ情報生成プログラムは、複数のデータ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を生成するためのマクロ情報生成プログラム(例えば、センタ用プログラム131)であって、コンピュータに、データを蓄積する複数のデータ蓄積装置から、データ蓄積装置が蓄積するデータを所定の方法で集約した集約情報を、通信ネットワークを介して受信する集約情報受信処理と、受信した集約情報に基づいて、各データ蓄積装置が蓄積するデータの内容を再現した再現データを生成するデータ再現処理と、生成した再現データを分析しマクロ情報を生成するマクロ情報生成処理とを実行させることを特徴とする。
また、マクロ情報生成プログラムは、コンピュータに、各データ蓄積装置から受信した集約情報を統合した統合集約情報を生成する集約情報統合処理を実行させ、データ再現処理で、生成した統合集約情報に基づいて、再現データを生成する処理を実行させるものであってもよい。
また、マクロ情報生成プログラムは、コンピュータに、マクロ情報生成処理で、各データ蓄積装置から受信した集約情報をサンプリングすることによって、再現データとしてサンプリングデータを生成する処理を実行させるものであってもよい。
また、マクロ情報生成プログラムは、コンピュータに、データ蓄積装置が蓄積するデータの次元を示す次元情報を、通信ネットワークを介して各データ蓄積装置から受信する次元情報受信処理と、各データ蓄積装置から受信した次元情報を統合した統合次元情報を生成する次元情報統合処理とを実行させ、データ再現処理で、データ蓄積装置から受信した集約情報と、生成した統合次元情報とに基づいて、再現データを生成する処理を実行させるものであってもよい。
また、マクロ情報生成プログラムは、所定の単語辞書を記憶する辞書記憶手段を備えたコンピュータに、次元情報統合処理で、辞書記憶手段が記憶する単語辞書に基づいて、各データ蓄積装置から受信した次元情報に含まれる各単語の対応関係を示す対応ルールを、統合次元情報として生成する処理を実行させるものであってもよい。
また、マクロ情報生成プログラムは、コンピュータに、マクロ情報生成処理で、マクロ情報として、各データ蓄積装置が蓄積するデータに含まれる情報要素がデータ中に出現する確率分布であるマクロ分布を求める処理を実行させるものであってもよい。
また、マクロ情報生成プログラムは、コンピュータに、生成したマクロ分布を、所定のデータ形式に変換する処理を実行させるものであってもよい。
また、マクロ情報生成プログラムは、コンピュータに、各データ蓄積装置が蓄積するデータに含まれるトピック毎の活性度又は特徴的な単語を抽出することによって、マクロ情報生成手段が生成したマクロ分布を所定のデータ形式に変換する処理を実行させるものであってもよい。
また、マクロ情報生成プログラムは、コンピュータに、所定の抽出条件に従って、生成したマクロ分布から部分情報を抽出し、抽出した部分情報を所定のデータ形式に変換する処理を実行させるものであってもよい。
また、マクロ情報生成プログラムは、コンピュータに、生成したマクロ分布と、データ変換手段が抽出した部分情報との対応関係を示す情報を求める処理を実行させるものであってもよい。
また、マクロ情報生成プログラムは、情報と技術ドメインとを対応付けた辞書であるドメイン辞書を記憶する記憶手段を備えたコンピュータに、記憶手段が記憶するドメイン辞書に基づいて、所定のラベリング処理を行う処理を実行させるものであってもよい。
また、マクロ情報生成プログラムは、コンピュータに、所定の抽出条件に従って、生成したマクロ分布から部分情報を抽出する処理と、記憶手段が記憶するドメイン辞書に基づいて、抽出した部分情報に所定のラベル情報を付与する処理とを実行させるものであってもよい。
また、マクロ情報生成プログラムは、コンピュータに、部分情報に対応する技術ドメインをドメイン辞書から抽出し、抽出した技術ドメインをラベル情報として部分情報に付与する処理を実行させるものであってもよい。
また、マクロ情報生成プログラムは、コンピュータに、各データ蓄積装置が蓄積するデータを比較して表示するためのグラフを生成する処理を実行させるものであってもよい。
また、マクロ情報生成プログラムは、コンピュータに、データ蓄積装置側のトピックとデータ処理装置側のトピックとの構成比を用いて、競合分析を行うためのレーダーチャートを生成する処理を実行させるものであってもよい。
また、マクロ情報生成プログラムは、コンピュータに、集約情報として、データ蓄積装置が蓄積するデータに含まれる情報要素がデータ中に出現する確率分布、又はデータ蓄積装置が蓄積するデータの次元に基づく統計量を求める処理を実行させるものであってもよい。
また、マクロ情報生成プログラムは、コンピュータに、時系列のテキストデータに基づいて、全時間帯に共通して出現する共通トピック、特定期間に出現する個別トピック、又は新たに出現する新規トピックを抽出する処理を実行させるものであってもよい。
また、マクロ情報生成プログラムは、コンピュータに、テキストデータのデータ内容又は対象物の評価を示す評価情報を、通信ネットワーク介してデータ蓄積装置から受信する処理と、受信した評価情報に対応するテキストデータと、テキストデータのデータ内容又は対象物との対応関係を示す対応情報を生成する処理をを実行させるものであってもよい。
また、マクロ情報生成プログラムは、コンピュータに、データを蓄積する複数のデータ蓄積装置から、データ蓄積装置が蓄積するデータを所定の方法で集約した集約情報を、通信ネットワークを介して受信する集約情報受信処理と、受信した集約情報を統合した統合集約情報を生成する集約情報統合処理と、生成した統合集約情報に基づいて、各データ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を生成するマクロ情報生成処理とを実行させるものであってもよい。
本発明によるマクロ情報配信プログラムは、複数のデータ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を配信するためのマクロ情報配信プログラム(例えば、センタ用プログラム131)であって、コンピュータに、データを蓄積する複数のデータ蓄積装置から、データ蓄積装置が蓄積するデータを所定の方法で集約した集約情報を、通信ネットワークを介して受信する集約情報受信処理と、各データ蓄積装置から受信した集約情報に基づいて、各データ蓄積装置が蓄積するデータの内容を再現した再現データを生成するデータ再現処理と、生成した再現データを分析しマクロ情報を生成するマクロ情報生成処理と、生成したマクロ情報を、通信ネットワークを介してデータ蓄積装置に送信するマクロ情報配信処理とを実行させることを特徴とする。
また、マクロ情報配信プログラムは、コンピュータに、所定の抽出条件に従って、生成したマクロ情報に含まれるトピックを抽出する処理と、抽出したトピックを、通信ネットワークを介してデータ蓄積装置に送信する処理とを実行させるものであってもよい。
また、マクロ情報配信プログラムは、コンピュータに、時系列のテキストデータに基づいて、全時間帯に共通して出現する共通トピック、特定期間に出現する個別トピック、又は新たに出現する新規トピックを抽出する処理を実行させるものであってもよい。
また、マクロ情報配信プログラムは、コンピュータに、集約情報として、データ蓄積装置が蓄積するデータに付加されているフラグ数を求める処理と、データ蓄積装置から受信したフラグ数に基づいた所定の予測処理を行うことによって、マクロ情報を生成する処理とを実行させるものであってもよい。
また、マクロ情報配信プログラムは、コンピュータに、データ蓄積装置がいずれのトピックについてのデータを蓄積しているかを示す申告情報を、通信ネットワークを介してデータ蓄積装置から受信する申告情報受信処理と、データ蓄積装置が蓄積するデータに類似する類似データの検索要求を、通信ネットワークを介してデータ蓄積装置から受信する検索要求受信処理と、受信した申告情報を、データ蓄積装置に対応付けて記憶する申告情報記憶処理と、検索要求を受信すると、記憶する申告情報に基づいて、検索要求された類似データを蓄積するデータ蓄積装置を特定する蓄積装置特定処理と、特定したデータ蓄積装置に、検索要求を受信したデータ蓄積装置への類似データの送信依頼を、通信ネットワークを介して送信するデータ送信依頼処理とを実行させるものであってもよい。
また、マクロ情報配信プログラムは、コンピュータに、テキストデータのデータ内容又は対象物の評価を示す評価情報を、通信ネットワーク介してデータ蓄積装置から受信する処理と、受信した評価情報に対応するテキストデータと、テキストデータのデータ内容又は対象物との対応関係を示す対応情報を生成する処理と、生成した対応情報を、通信ネットワークを介してデータ蓄積装置に送信する処理とを実行させるものであってもよい。
本発明による蓄積データ処理プログラムは、複数のデータ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を生成するマクロ情報生成システムにおける、データ蓄積装置が蓄積データを処理する蓄積データ処理プログラム(例えば、サイト用プログラム121,122)であって、データを蓄積するデータ蓄積手段を備えたコンピュータに、データ蓄積手段が蓄積するデータを所定の方法で集約した集約情報を生成する集約情報生成処理と、生成した集約情報に基づいて、データ蓄積手段が蓄積するデータの内容を再現した再現データを生成するデータ再現処理と、生成した再現データを、各データ蓄積装置が蓄積するデータを処理するデータ処理装置に、通信ネットワークを介して送信する再現データ送信処理とを実行させることを特徴とする。
なお、本発明によるマクロ情報生成システムは、サイト側のデータ蓄積装置が、データを記憶するデータ記憶部と、データを集約する集約手段とを有し、センタ側のデータ処理装置が、サイトからの集約情報を記憶する集約情報記憶部と、全サイトの集約情報を統合する集約情報統合手段と、統合された集約情報から全サイトの生データに近似した情報を生成する近似情報生成手段と、生成した近似情報を記憶する近似情報記憶部と、マクロ情報を生成する分析手段とを有することが望ましい。
上記のような構成を採用し、サイトで集約された情報のみをセンタで統合して、その統合した集約情報に基づいてマクロ情報を生成できる。そのため、各サイトが蓄積するデータそのものである生データを一箇所に集めることなくマクロ情報を生成できるようにするという本発明の第1の目的を達成することができる。また、各サイトから送信されるデータの情報量が少ない状態であっても、マクロ情報を生成できるようにするという本発明の第2の目的を達成することができる。また、サイト間の類似性を示す情報である事前知識を必要とすることなくマクロ情報を生成できるようにするという本発明の第4の目的を達成することができる。
更に、全サイトの生データに近似した情報を生成し、生データを一箇所に集めてデータ分析を行った場合と同様の状態で、データ分析を行うことができる。そのため、生データを一箇所に集めた時と同程度の精度でマクロ情報を生成できるようにするという本発明の第5の目的を達成することができる。また、様々な分析手法でマクロ情報を生成できるようにするという本発明の第6の目的を達成することができる。
また、本発明によるマクロ情報生成システムは、上記の構成要素に加えて、サイト側のデータ蓄積装置が、データを分析するのに使用する次元を枚挙する次元枚挙手段と、センタ側のデータ処理装置が、全サイトの次元を統合する統合次元生成手段と、その統合次元を記憶する統合次元記憶部とを有することが望ましい。そのような構成を採用したことより、ヘテロ性をもつ分散蓄積されたデータに対して、マクロ情報を生成できるようにするという本発明の第3の目的を達成することができる。
更に、本発明によるマクロ情報生成システムは、分析手段に代えてマクロ分布生成手段を有し、上記の構成要素に加えて、マクロ情報を利用ユーザにとって容易に把握できる形式に変換する表示手段を有することが望ましい。そのような構成を採用したことより、利用ユーザに対して、容易に把握が可能で有意義なマクロ情報を提示できるようにするという本発明の第7の目的を達成することができる。
本発明によれば、データ蓄積装置は、蓄積する生データを送信することなく、集約情報を生成してデータ処理装置に送信する。また、データ処理装置は、集約情報に基づいて再現データを生成しマクロ情報を生成する。従って、各サイトが蓄積するデータそのものである生データを一箇所に集めることなくマクロ情報を生成することができる。また、各データ蓄積装置から生データを受信しなくても、データ処理装置は、生データを分析する場合と同様に、全サイトが蓄積するデータの分析を行うことができる。
また、本発明によれば、各データ蓄積装置がデータ処理装置に集約情報を送信さえすれば、データ処理装置は、各データ蓄積装置が蓄積する生データを再現することができる。そのため、データ蓄積装置は、データ分析を行ってマクロ情報を生成する際に、特定の分析手法に制限されることなく、様々な分析方法を用いてデータ分析を行うことが可能である。更に、本発明によれば、データ処理装置は、各データ蓄積装置が蓄積するデータを再現した状態でデータ分析できるので、各データ蓄積装置が蓄積する生データを分析する場合と同程度の精度でデータ分析を行うことが可能である。
また、本発明において、データ処理装置が、受信した集約情報を統合し、その統合した集約情報のみを用いて、全サイトのデータの内容を再現した再現データを生成するように構成すれば、各データ蓄積装置がデータ処理装置に集約情報を1回だけ送信すれば、データ処理装置がマクロ情報を生成することができる。また、データ蓄積装置からデータ処理装置に集約情報を一回だけ送信すればマクロ情報を生成できるので、システム全体の通信量が少なくて済む。また、マクロ情報を分析するために、あるサイトの情報を他のサイトに送信しないので、自分のサイトの情報を他のサイトで解析され知られてしまう恐れがない。また、データ蓄積装置が送信する情報は生データそのものでなく集約情報であり、データ処理装置に1度送信するのみであるので、システムの外部に情報が漏洩する恐れも少ない。よって、生データを一カ所に集めて分析する場合と比較して、プライバシをより強く確保することができる。
また、本発明において、各データ蓄積装置が、集約情報に加えて次元情報をデータ処理装置に送信するように構成すれば、データ処理装置は、集約情報に加えて次元情報に基づいて、マクロ情報を生成できる。蓄積データの次元を考慮したデータ分析が行えるので、各データ蓄積装置が蓄積するデータにヘテロ性が存在する場合であっても、データ間の次元を統合してマクロ情報を生成することができる。従って、ヘテロ性をもつ分散蓄積されたデータに対しても、マクロ情報を生成することができる。
また、本発明において、生成したマクロ分布を所定のデータ形式に変換するように構成すれば、生成したマクロ分布がユーザにとって分かりにくいデータ形式のものであっても、利用ユーザにとって分かりやすい価値のあるデータ形式の情報に変換して提示することができる。
また、本発明において、マクロ分布と部分情報との対応関係を示す情報を求めるように構成すれば、利用ユーザに対して、容易に把握が可能で有意義なマクロ情報を提示することができる。
また、本発明において、抽出した部分情報に所定のラベル情報を付与するように構成すれば、部分情報を利用ユーザにとってより把握しやすい情報に変換できる。従って、利用ユーザに対して、より容易に把握が可能で有意義なマクロ情報を提示することができる。
また、本発明において、各データ蓄積装置が蓄積するデータを比較して表示するためのグラフを生成するように構成すれば、利用ユーザに対して、サイト間の相対的な比較を行うために必要な情報を提示して、競合分析等の支援を行うことができる。
実施の形態1.
以下、本発明の第1の実施の形態について図面を参照して説明する。図1は、本発明によるマクロ情報生成システムの構成の一例を示すブロック図である。図1に示すように、マクロ情報生成システムは、各種データを蓄積するサイト装置20A,20Bと、データを処理するセンタ装置30とを含む。また、各サイト装置20A,20Bとデータ処理記憶装置3とは、インターネットやLAN等の通信ネットワークを介して接続される。なお、図1では、2つのサイト装置20A,20Bを示しているが、マクロ情報生成システムは、3以上のサイト装置を含んでもよい。
以下、本発明の第1の実施の形態について図面を参照して説明する。図1は、本発明によるマクロ情報生成システムの構成の一例を示すブロック図である。図1に示すように、マクロ情報生成システムは、各種データを蓄積するサイト装置20A,20Bと、データを処理するセンタ装置30とを含む。また、各サイト装置20A,20Bとデータ処理記憶装置3とは、インターネットやLAN等の通信ネットワークを介して接続される。なお、図1では、2つのサイト装置20A,20Bを示しているが、マクロ情報生成システムは、3以上のサイト装置を含んでもよい。
本実施の形態において、マクロ情報生成システムは、例えば、CRM(Customer Relationship Management)やナレッジマネジメント、BPM(Business Process Management )、BAM(Business Activity Monitoring)を用いた企業の情報分析システムの用途に用いられる。この場合、例えば、マクロ情報生成システムは、企業が蓄積するデータに基づいて、活動報告書や週報等の企業知識を分析してマクロ情報を生成する。また、マクロ情報生成システムは、例えば、コンタクトセンタにおける顧客問い合わせデータを分析してマクロ情報を生成する用途に適用できる。また、マクロ情報生成システムは、例えば、BLOG(Weblog)やRSS(Rich Site Summary )、掲示板等のWebに公開されている記事の分析を行い、マクロ情報を生成する用途に適用できる。
サイト装置20A,20Bは、具体的には、パーソナルコンピュータ等の情報処理端末によって実現される。例えば、マクロ情報生成システムを企業知識の分析に用いる場合、サイト装置20A,20Bは、各企業に設置される。また、例えば、マクロ情報生成システムを顧客問い合わせデータの分析に用いる場合、サイト装置20A,20Bは、コンタクトセンタやコールセンタに設置される。図1に示すように、サイト装置20A,20Bは、入力装置11,12と、データ処理記憶装置(サイト)21、22とを含む。
入力装置11,12は、具体的には、プログラムに従って動作する情報処理端末のCPU、及びキーボードやマウス等の入力部によって実現される。入力装置11,12は、テキスト文書等のデータを入力する入力手段を備える。
入力装置11,12は、例えば、サイトのユーザの入力操作に従って、キーボードから各種データを入力する。また、入力装置11,12は、例えば、コールセンタにおけるコンタクト内容(オペレータと顧客との通話内容)を、コンタクトセンタ装置から入力する。この場合、例えば、入力装置11,12は、アプリケーションソフトウェア(以下、単にアプリケーションという)を用いて、コンタクトセンタ装置から、そのまま転送されるデータを入力する。
また、入力装置11,12は、例えば、アプリケーションを用いて、インターネットを介して、Webサイトに掲載された記事等をダウンロードする。また、入力装置11,12は、例えば、各種サーバに蓄積されるシステムログを入力する。この場合、例えば、入力装置11,12は、アプリケーションを用いて、各種サーバからそのまま転送されるシステムログを、データ処理記憶装置(サイト)21,22への分析対象データとして入力する。
データ処理記憶装置21,22は、プログラム制御により動作し、入力装置11,12が入力したデータを処理する機能を備える。データ処理記憶装置(サイト)21,22は、データ記憶部211,221と、集約手段212,213とを含む。
データ記憶部211,221は、具体的には、磁気ディスク装置や光ディスク装置等の記憶装置によって実現される。データ記憶部211,221は、入力装置11,12が入力したデータを記憶する。本実施の形態では、データ記憶部211,221は、入力装置11,12が入力したデータをそのまま格納する。
集約手段212,222は、具体的には、プログラムに従って動作する情報処理端末のCPU、及びネットワークインタフェース部によって実現される。集約手段212,222は、データ記憶部211,221が蓄積するデータを、所定の方法を用いて集約した集約情報を生成する機能を備える。本実施の形態では、集約手段212,222は、集約情報として、例えば、蓄積するデータに従う確率分布や、所定の統計量を求める。この場合、集約手段212,222は、例えば、データ記憶部211,221が蓄積するデータ中に各単語が含まれる確率や、データ中に各単語が含まれる統計量を求める。また、本実施の形態では、集約手段212,222は、集約情報として、求めた確率分布や統計量等の情報要素を含むベクトルを生成する。また、集約手段212,222は、生成した集約情報を、通信ネットワークを介してセンタ装置30に送信する機能を備える。
センタ装置30は、具体的には、ワークステーションやパーソナルコンピュータ等の情報処理装置によって実現される。例えば、マクロ情報生成システムを企業知識の分析に用いる場合、センタ装置30は、各企業に企業知識の分析結果としてマクロ情報を配信するサービス事業者が運営するサーバである。また、例えば、マクロ情報生成システムを顧客問い合わせデータの分析に用いる場合、センタ装置30は、各コールセンタに顧客問い合わせデータの分析結果としてマクロ情報を配信するサービス事業者が運営するサーバである。図1に示すように、センタ装置30は、データ処理記憶装置(センタ)3と、出力装置4とを含む。
データ処理記憶装置3は、プログラム制御により動作し、データ処理記憶装置(サイト)21,22から送信される情報を処理する機能を備える。データ処理記憶装置(センタ)3は、集約情報記録部31と、集約情報統合手段32と、近似情報生成手段33と、近似情報記憶部34と、分析手段35とを含む。
集約情報記録部31は、具体的には、プログラムに従って動作する情報処理装置のCPU、ネットワークインタフェース部、及び磁気ディスク装置や光ディスク装置等の記憶装置によって実現される。集約情報記録部31は、各サイトの集約手段212,222により集約された情報を記録する機能を備える。
本実施の形態では、集約情報記録部31は、各サイト装置20A,20Bから、通信ネットワークを介してそれぞれ集約情報を受信する。また、集約情報記録部31は、受信した集約情報を、サイト装置20A,20Bに対応付けて記憶装置に記憶する。この場合、集約情報記録部31は、各サイト装置20A,20Bから受信した集約情報に、サイトを特定できる情報(例えば、サイト装置20A,20BのIPアドレスや部署名)を付加して記憶する。例えば、センタ装置30は、サイト装置20A,20Bから、集約情報とともにIPアドレスを受信し、受信した集約情報をIPアドレスに対応付けて記憶する。
集約情報統合手段32は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。集約情報統合手段32は、集約情報記録部31が格納する各サイトの集約情報を、所定の方法を用いて統合する機能を備える。本実施の形態では、集約情報統合手段32は、集約情報記録部31が記憶する各集約情報を統合した統合集約情報を生成する。
近似情報生成手段33は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。近似情報生成手段33は、集約情報統合手段32が統合した集約情報(統合集約情報)に基づいて、各サイトが蓄積するデータを再現する機能を備える。本実施の形態では、近似情報生成手段33は、集約情報統合手段32が生成した統合集約情報を用いて、集約情報に示される全サイトが蓄積するデータを再現する。この場合、近似情報生成手段33は、サイトが蓄積するデータの内容を再現した再現データとして、所定のアルゴリズムに従って、サイトが蓄積するデータの情報内容と等価な情報内容を含むデータ(以下、近似情報ともいう)を生成する。
近似情報記憶部34は、具体的には、磁気ディスク装置や光ディスク装置等の記憶装置によって実現される。近似情報記憶部34は、近似情報生成手段33が再現データとして生成した近似情報を記憶する。
分析手段35は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。分析手段35は、近似情報記憶部34が記憶する近似情報を分析して、各サイトに蓄積されるデータを巨視的に統合した情報であるマクロ情報を生成する機能を備える。また、分析手段35は、生成したマクロ情報を出力装置4に出力させる機能を備える。
出力装置4は、具体的には、ディスプレイ装置等の表示機器やプリンタ等の印刷機器によって実現される。出力装置4は、データ処理記憶装置(センタ)3が求めた結果を出力する出力手段を備える。また、出力装置4は、データ処理記憶装置(センタ)3が生成したマクロ情報を出力する機能を備える。例えば、出力装置4がディスプレイ装置である場合、出力装置4は、分析手段35が生成したマクロ情報を、分析手段35の指示に従って表示する。また、出力装置4がプリンタである場合、出力装置4は、分析手段35が生成したマクロ情報を、分析手段35の指示に従って印刷する。
次に、動作について説明する。図2は、サイト装置20A,20B(入力装置11,12及びデータ処理記憶装置(サイト)21,22)が集約情報を生成してセンタ装置30に送信する処理の一例を示す流れ図である。また、図3は、センタ装置30(データ処理記憶装置(センタ)3及び出力装置4)がマクロ情報を生成する処理の一例を示す流れ図である。
サイト装置20A,20Bのデータ処理記憶装置21,22は、入力装置11,12を用いて、各種データを入力する(ステップS11)。例えば、マクロ情報生成システムを企業知識の分析に用いる場合、サイト装置20A,20Bは、企業の担当者の操作に従って、活動報告書や週報等の企業知識を入力する。また、データ処理記憶装置(サイト)21,22は、入力したデータをデータ記憶部211,221に記憶させる。
データ処理記憶装置(サイト)21,22の集約手段212,222は、所定のタイミングで、ステップS11で入力したデータを集約する。例えば、集約手段212,222は、所定期間毎に、データ記憶部211、221が蓄積する全てのデータを抽出する。そして、集約手段212,222は、抽出したデータを所定の方法を用いて集約し、集約情報を生成する(ステップS12)。また、集約手段212,222は、集約した情報(集約情報)を、通信ネットワークを介してデータ処理記憶装置(センタ)3に送信する(ステップS13)。
データ処理記憶装置(センタ)3の集約情報記録部31は、各データ処理記憶装置(サイト)21,22から、通信ネットワークを介して集約情報を受信する(ステップS21)。また、集約情報記録部31は、受信した各集約情報を記憶装置に記憶する。この場合、集約情報記録部31は、受信サイトを特定できる情報に加えて、集約情報を集約情報記録部31に記憶する。例えば、集約情報記録部31は、各データ処理記憶装置21,22から、集約情報とともに各サイト装置20A,20BのIPアドレスを受信し、集約情報をIPアドレスに対応付けて記憶装置に記憶する。
また、集約情報統合手段32は、所定のタイミングで、所定の方法を用いて、集約情報記録部31が蓄積する集約情報を統合する(ステップS22)。例えば、集約情報統合手段32は、センタ装置30の管理者によってマクロ情報生成の指示操作が行われると、集約情報記録部31が蓄積する集約情報を抽出し、抽出した集約情報を統合して統合集約情報を生成する。
また、近似情報生成手段33は、集約情報統合手段32が統合した集約情報(統合集約情報)に基づいて、全サイトが蓄積するデータの情報内容を再現できる近似情報を生成する(ステップS23)。また、近似情報生成手段33は、生成した近似情報を近似情報記憶部34に記憶させる。
分析手段35は、データの情報内容を再現した近似情報の分析を行い、マクロ情報を生成する(ステップS24)。この場合、分析手段35は、近似情報記憶部34から近似情報を抽出し、抽出した近似情報を所定の方法を用いて分析してマクロ情報を生成する。そして、分析手段35は、生成したマクロ情報を出力装置4に出力させる(ステップS25)。この場合、出力装置4は、分析手段35の指示に従って、マクロ情報を表示又は印刷する。
以上のように、本実施の形態によれば、サイト装置は、蓄積する生データ(サイト装置が蓄積するデータそのもの)を送信することなく、集約情報を生成してセンタ装置に送信する。また、センタ装置は、受信した集約情報を統合し、その統合した集約情報から全サイトのデータの内容を再現した近似情報を生成する。そのため、各サイト装置から生データを受信しなくても、センタ装置は、生データを分析する場合と同様に、全サイトが蓄積するデータの分析を行うことができる。
すなわち、本実施の形態によれば、各サイト装置がセンタ装置に集約情報を送信さえすれば、センタ装置は、各サイト装置が蓄積する生データを再現することができる。そのため、センタ装置は、データ分析を行ってマクロ情報を生成する際に、特定の分析手法に制限されることなく、様々な分析方法を用いてデータ分析を行うことが可能である。更に、本実施の形態によれば、センタ装置は、各サイト装置が蓄積するデータを再現した状態でデータ分析できるので、各サイト装置が蓄積する生データを分析する場合と同程度の精度でデータ分析を行うことが可能である。従って、各サイトが蓄積するデータそのものである生データを一箇所に集めることなくマクロ情報を生成することができる。
また、本実施の形態によれば、センタ装置は、受信した集約情報を統合し、その統合した集約情報のみを用いて、全サイトのデータの内容を再現した近似情報を生成できる。そのため、各サイト装置がセンタ装置に集約情報を1回だけ送信すれば、センタ装置がマクロな情報を分析することができる。また、サイト装置からセンタ装置に集約情報を一回だけ送信すればマクロ情報を生成できるので、システム全体の通信量が少なくて済む。また、マクロ情報を分析するために、あるサイトの情報を他のサイトに送信しないので、自分のサイトの情報を他のサイトで解析され知られてしまう恐れがない。また、サイト装置が送信する情報は生データそのものでなく集約情報であり、センタ装置に1度送信するのみであるので、システムの外部に情報が漏洩する恐れも少ない。よって、生データを一カ所に集めて分析する場合と比較して、プライバシをより強く確保することができる。
実施の形態2.
次に、本発明の第2の実施の形態について図面を参照して説明する。図4は、マクロ情報生成システムの他の構成例を示すブロック図である。図4に示すように、本実施の形態では、データ処理記憶装置(サイト)51,52が、図1に示したデータ処理記憶装置(サイト)21,22の構成要素に加えて、データの次元を枚挙(抽出)する次元枚挙手段213,223を有する点で、第1の実施の形態と異なる。また、本実施の形態では、データ処理記憶装置(センタ)6が、図1に示したデータ処理記憶装置(センタ)3の構成要素に加えて、各サイトの次元を統合して統合次元を生成する統合次元手段36、及び生成した統合次元を記憶する統合次元記憶部37を有する点で、第1の実施の形態と異なる。
次に、本発明の第2の実施の形態について図面を参照して説明する。図4は、マクロ情報生成システムの他の構成例を示すブロック図である。図4に示すように、本実施の形態では、データ処理記憶装置(サイト)51,52が、図1に示したデータ処理記憶装置(サイト)21,22の構成要素に加えて、データの次元を枚挙(抽出)する次元枚挙手段213,223を有する点で、第1の実施の形態と異なる。また、本実施の形態では、データ処理記憶装置(センタ)6が、図1に示したデータ処理記憶装置(センタ)3の構成要素に加えて、各サイトの次元を統合して統合次元を生成する統合次元手段36、及び生成した統合次元を記憶する統合次元記憶部37を有する点で、第1の実施の形態と異なる。
次元枚挙手段213,223は、具体的には、プログラムに従って動作する情報処理端末のCPU、及びネットワークインタフェース部によって実現される。次元枚挙手段213,223は、サイト装置20A,20Bが蓄積するデータの次元を示す次元情報を生成する機能を備える。本実施の形態では、次元枚挙手段213,223は、集約手段212,222が生成した集約情報から次元を抽出する。例えば、次元枚挙手段213,223は、所定のタイミングで(例えば、所定期間毎に)、集約手段212,222がベクトルとして生成した集約情報のベクトルの次元を抽出し、抽出した次元を示す次元情報を生成する。ここで、「次元」は、例えば、データがテキストである場合、データ中の使用語彙(例えば、「**社」や「パソコン」、「世界」等の語彙)である。また、例えば、「次元」は、例えば、データがカテゴリデータである場合、そのデータに対応するカテゴリ(例えば、蓄積するデータがメールデータである場合、「メールエラーの種類」等の所定のカテゴリを示す情報)である。
また、次元枚挙手段213,223は、生成した次元情報を、通信ネットワークを介してセンタ装置30に送信する機能を備える。
統合次元生成手段36は、具体的には、プログラムに従って動作する情報処理装置のCPU及びネットワークインタフェース部によって実現される。統合次元手段36は、各サイト装置20A,20Bから送信された次元を統合する機能を備える。本実施の形態では、統合次元生成手段36は、各サイト装置20A,20Bから、通信ネットワークを介してそれぞれ次元情報を受信する。また、統合次元生成手段36は、受信した各次元情報を一旦磁気ディスク装置等の記憶装置に記憶させる。また、統合次元生成手段36は、所定のタイミングで(例えば、所定期間毎に)、記憶装置から各次元情報を抽出し、抽出した各次元情報を所定の方法で統合して統合次元情報を生成する。例えば、データがテキストデータやカテゴリデータである場合、統合次元生成手段36は、データに含まれる語彙から次元間の対応付けを行い、統合次元を生成する。
統合次元記憶部37は、具体的には、磁気ディスク装置や光ディスク装置等の記憶装置によって実現される。統合次元記憶部37は、統合次元手段36が生成した統合次元(統合次元情報)を記憶する。
なお、本実施の形態において、次元枚挙手段213,223以外のサイト装置20A,20Bの各構成要素の機能は、第1の実施の形態で示したそれらの機能と同様である。また、統合次元生成手段36及び統合次元記憶部37以外のセンタ装置30の各構成要素の機能は、第1の実施の形態で示したそれらの機能と同様である。
次に、動作について説明する。図5は、サイト装置20A,20B(入力装置11,12及びデータ処理記憶装置(サイト)51,52)が集約情報を生成してセンタ装置30に送信する処理の他の例を示す流れ図である。また、図6は、センタ装置30(データ処理記憶装置(センタ)6及び出力装置4)がマクロ情報を生成する処理の他の例を示す流れ図である。
第1の実施の形態では、各サイトが蓄積するデータのデータセット間で次元が異なる(各サイトが蓄積するデータの性質が異なる)等のヘテロ性が存在している場合であっても、個別の次元としてそれぞれ扱っていた。すなわち、第1の実施の形態では、各サイトが蓄積するデータの性質の違いを考慮せずに、マクロ情報の生成を行っていた。本実施の形態では、各サイトが蓄積するデータにそのような次元のヘテロ性が存在している場合であっても、マクロ情報生成システムは、次元のヘテロ性を解消して次元を統合し、マクロ情報を生成する。
データ処理記憶装置21,22は、第1の実施の形態で示したステップS11,S12と同様の処理に従って、各種データを入力し(ステップS31)、集約情報を生成する(ステップS32)。また、データ処理記憶装置21,22の次元枚挙手段213,223は、所定のタイミングで、サイト内で集約したデータの次元を枚挙(抽出)し、次元情報を生成する(ステップS33)。例えば、次元枚挙手段213,223は、データがテキストデータである場合、テキスト内に出現する語彙を抽出し、抽出した語彙を含む次元情報を生成する。また、例えば、次元枚挙手段213,223は、データがカテゴリデータである場合、データで用いられているカテゴリを抽出し、抽出したカテゴリを含む次元情報を生成する。
また、集約手段212,222は、集約した情報(集約情報)を、通信ネットワークを介してセンタ装置30に送信する。また、次元枚挙手段213,223は、抽出した次元を示す次元情報を、通信ネットワークを介してデータ処理記憶装置(センタ)6に送信する(ステップS34)。なお、次元枚挙手段213,223は、集約手段212,222が集約情報を送信するタイミングとは異なるタイミングで、次元情報をデータ処理記憶装置6に送信してもよい。
データ処理記憶装置(センタ)6の集約情報記録部31は、各データ処理記憶装置(サイト)51,52から、通信ネットワークを介してそれぞれ集約情報を受信し記録する。また、データ処理記憶装置6の統合次元生成手段36は、データ処理記憶装置51,52から、通信ネットワークを介してそれぞれ次元情報を受信する(ステップS41)。また、統合次元生成手段36は、受信した各次元情報を一旦記憶装置に記憶させる。
統合次元生成手段36は、各サイトから送信されたヘテロ性をもつ次元の統合を行い、統合次元を生成する。この場合、統合次元生成手段36は、記憶装置が一旦記憶する次元情報を抽出し、所定の統合方法を用いて統合次元情報を生成する(ステップS42)。そして、統合次元生成手段36は、生成した統合次元情報を、統合次元記憶部37に記憶させる。
例えば、統合次元生成手段36は、同義語を含む同義語辞書やユーザが定義したユーザ辞書を予め記憶装置に記憶している。この場合、統合次元生成手段36は、データがテキストである場合、同義語辞書やユーザが定義したユーザ辞書を用いて、各サイト間における表現の違いや、表記のゆらぎ等が原因となって異なったものとなっている表現を、次元が同一の表現であると見なして統一次元を生成する。例えば、統合次元生成手段36は、同義語辞書を用いて、「PC」と「パソコン」とは同一の意味の表現であるとして統一次元情報を生成する。
集約情報統合手段32は、統合次元記憶部37が記憶する統合次元(統合次元情報)に基づいて、所定のタイミングで、集約情報記録部31が蓄積する集約情報を統合する(ステップS43)。この場合、集約情報統合手段32は、例えば、統合次元情報に基づいて、各集約情報に含まれる同義語を同一の表現であるとして統合集約情報を生成する。
統合集約情報を生成すると、近似情報生成手段33は、第1の実施の形態で示したステップS23と同様の処理に従って、近似情報を生成する(ステップS44)。また、分析手段35は、第1の実施の形態で示したステップS24と同様の処理に従って、マクロ情報を生成する(ステップS45)。また、分析手段35は、第1の実施の形態で示したステップS25と同様の処理に従って、マクロ情報を出力装置4に出力させる(ステップS46)。
以上のように、本実施の形態によれば、各サイト装置は、集約情報に加えて次元情報をセンタ装置に送信する。そして、センタ装置は、集約情報に加えて次元情報に基づいて、マクロ情報を生成する。蓄積データの次元を考慮したデータ分析が行えるので、各サイト装置が蓄積するデータにヘテロ性が存在する場合であっても、データ間の次元を統合してマクロ情報を生成することができる。従って、ヘテロ性をもつ分散蓄積されたデータに対しても、マクロ情報を生成することができる。
実施の形態3.
次に、本発明の第3の実施の形態について図面を参照して説明する。図7は、マクロ情報生成システムの更に他の構成例を示すブロック図である。図7に示すように、本実施の形態では、データ処理記憶装置(センタ)7が、図4に示したデータ処理記憶装置(センタ)6の分析手段35に代えて、サイトデータを再現した情報から分布を推測するマクロ分布生成手段38を有する点で、第2の実施の形態と異なる。
次に、本発明の第3の実施の形態について図面を参照して説明する。図7は、マクロ情報生成システムの更に他の構成例を示すブロック図である。図7に示すように、本実施の形態では、データ処理記憶装置(センタ)7が、図4に示したデータ処理記憶装置(センタ)6の分析手段35に代えて、サイトデータを再現した情報から分布を推測するマクロ分布生成手段38を有する点で、第2の実施の形態と異なる。
マクロ分布生成手段38は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。マクロ分布生成手段38は、近似情報記憶部34が格納する情報(全サイトのデータを再現した近似情報)を用いて、各サイトが蓄積するデータに含まれる情報要素の確率分布(以下、マクロ分布ともいう)を推測する。例えば、蓄積するデータがテキストデータである場合、マクロ分布生成手段38は、データ中に含まれる各語彙の確率分布(各語彙がデータ中に出現する確率分布)を求める。本実施の形態では、マクロ分布生成手段38は、確率分布をマクロ情報として生成する。また、マクロ分布生成手段38は、求めたマクロ分布を出力装置4に出力させる機能を備える。
なお、本実施の形態において、サイト装置20A,20Bの機能は、第2の実施の形態で示したサイト装置20A,20Bの機能と同様である。また、マクロ分布生成手段38以外のセンタ装置30の各構成要素の機能は、第2の実施の形態で示したそれらの機能と同様である。
次に、動作について説明する。本実施の形態において、サイト装置20A,20Bは、第2の実施の形態で示したステップS31からステップS34までと同様の処理に従って、集約情報及び次元情報を生成しセンタ装置30に送信する。
図8は、センタ装置30(データ処理記憶装置(センタ)7及び出力装置4)がマクロ情報を生成する処理の更に他の例を示す流れ図である。センタ装置30は、第2の実施の形態で示したステップS41からステップS44までと同様の処理に従って、統合次元情報及び統合集約情報を生成し(ステップS51〜ステップS53)、全サイトが蓄積するデータを再現した近似情報を生成する(ステップS54)。
マクロ分布生成手段38は、近似情報記憶部34から近似情報を抽出し、抽出した近似情報に基づいてマクロ分布を求める(ステップS55)。例えば、マクロ分布生成手段38は、マクロ分布として各サイトが蓄積するデータに含まれる情報の確率分布を求める。第1の実施の形態及び第2の実施の形態では、近似情報から生成するマクロ情報を特に限定しなかった。本実施の形態では、マクロ分布生成手段38は、近似情報記憶部35が格納する近似情報に従って、マクロ情報として確率分布を推定する。
そして、マクロ分布生成手段38は、求めたマクロ分布を出力装置4に出力させる(ステップS56)。この場合、出力装置4は、マクロ分布生成手段38の指示に従って、マクロ分布を表示又は印刷する。
実施の形態4.
次に、本発明の第4の実施の形態について図面を参照して説明する。図9は、マクロ情報生成システムの更に他の構成例を示すブロック図である。図9に示すように、本実施の形態では、データ処理記憶装置(センタ)8が、図7に示したデータ処理記憶装置(センタ)7の構成要素に加えて、マクロ情報やサイトの集約情報を利用ユーザにとって容易に把握できる情報に変換する部分情報抽出手段39を有する点で、第3の実施の形態と異なる。
次に、本発明の第4の実施の形態について図面を参照して説明する。図9は、マクロ情報生成システムの更に他の構成例を示すブロック図である。図9に示すように、本実施の形態では、データ処理記憶装置(センタ)8が、図7に示したデータ処理記憶装置(センタ)7の構成要素に加えて、マクロ情報やサイトの集約情報を利用ユーザにとって容易に把握できる情報に変換する部分情報抽出手段39を有する点で、第3の実施の形態と異なる。
部分情報抽出手段39は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。部分情報抽出手段39は、マクロ分布生成手段38が生成したマクロ分布や、サイトから集約情報として送信された分布を示す情報から、所定の抽出条件に従って部分情報を抽出する機能を備える。また、部分情報抽出手段39は、抽出した部分情報を、所定のデータ変換アルゴリズムに従って、利用ユーザにとって分かりやすい価値のある情報(データ形式)に変換する機能を備える。また、部分情報抽出手段39は、変換した部分情報を出力装置4に出力させる機能を備える。
なお、本実施の形態において、サイト装置20A,20Bの機能は、第2の実施の形態及び第3の実施の形態で示したサイト装置20A,20Bの機能と同様である。また、部分情報抽出手段39以外のセンタ装置30の各構成要素の機能は、第3の実施の形態で示したそれらの機能と同様である。
次に、動作について説明する。本実施の形態において、サイト装置20A,20Bは、第2の実施の形態で示したステップS31からステップS34までと同様の処理に従って、集約情報及び次元情報を生成しセンタ装置30に送信する。
図10は、センタ装置30(データ処理記憶装置(センタ)8及び出力装置4)がマクロ情報を生成する処理の更に他の例を示す流れ図である。センタ装置30は、第3の実施の形態で示したステップS51からステップS54までと同様の処理に従って、統合次元情報及び統合集約情報を生成し(ステップS61〜ステップS63)、全サイトが蓄積するデータを再現した近似情報を生成する(ステップS64)。また、センタ装置30は、第3の実施の形態で示したステップS55と同様の処理に従って、マクロ分布を求める(ステップS65)。
部分情報抽出手段39は、マクロ分布や集約情報から部分情報を抽出し、抽出した部分情報を所定のアルゴリズムに従ってユーザが認識しやすい形式の情報に変換する(ステップS66)。第3の実施の形態では、マクロ情報として、近似情報から全サイトデータの分布を推定するだけであり、利用ユーザにとって容易に把握できる形にマクロ分布を変換する処理を行わない場合を説明した。本実施の形態では、部分情報抽出手段39は、マクロ分布や集約情報から部分情報を抽出し、利用ユーザにとって分かりやすい形式の情報に変換する。
例えば、部分情報抽出手段39は、マクロ分布の部分的な特徴や、部分的な活性具合を数値化した情報に変換し、ユーザに提示したりする。また、部分情報抽出手段39は、センタに集約情報として送信された分布に対しても部分情報を抽出し、利用ユーザにとって分かりやすい形式の情報に変換する。
そして、部分情報抽出手段39は、変換した部分情報を出力装置4に出力させる(ステップS67)。この場合、出力装置4は、部分情報抽出手段39の指示に従って、変換した部分情報を表示又は印刷する。
以上のように、本実施の形態によれば、センタ装置は、全サイトのデータの内容を再現し、各サイト装置から集約情報も得ることができる。そのため、センタ装置は、これら2つの情報(再現データと集約情報)を組み合わせて、分かりやすいデータ形式の情報をユーザに提示することができる。従って、生成したマクロ情報を利用ユーザにとって分かりやすい価値のあるデータ形式に情報に変換して提示することができる。例えば、生成したマクロ情報がユーザにとって分かりにくいデータ形式のものであっても、利用ユーザにとって分かりやすい価値のあるデータ形式の情報に変換して提示することができる。
実施の形態5.
次に、本発明の第5の実施の形態について図面を参照して説明する。図11は、マクロ情報生成システムの更に他の構成例を示すブロック図である。図11に示すように、本実施の形態では、データ処理記憶装置(センタ)8Aが、図9に示したデータ処理記憶装置(センタ)8の構成要素に加えて、マクロ分布とサイトとの対応関係をユーザにとって容易に把握できる形式の情報に変換する構成推測手段310を有する点で、第4の実施の形態と異なる。
次に、本発明の第5の実施の形態について図面を参照して説明する。図11は、マクロ情報生成システムの更に他の構成例を示すブロック図である。図11に示すように、本実施の形態では、データ処理記憶装置(センタ)8Aが、図9に示したデータ処理記憶装置(センタ)8の構成要素に加えて、マクロ分布とサイトとの対応関係をユーザにとって容易に把握できる形式の情報に変換する構成推測手段310を有する点で、第4の実施の形態と異なる。
構成推測手段310は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。構成推測手段310は、マクロ分布生成手段38が生成したマクロ分布と、各サイト又は各サイトに含まれる情報の分布を示す部分情報との対応関係を求める機能を備える。また、構成推測手段310は、求めた対応関係を示す情報を、所定のアルゴリズムに従って、利用ユーザにとって把握しやすい形式の情報に変換する機能を備える。また、構成推測手段310は、変換した情報(マクロ分布と部分情報との対応関係を示す情報)を出力装置4に出力させる機能を備える。
なお、本実施の形態において、サイト装置20A,20Bの機能は、第2の実施の形態から第4の実施の形態で示したサイト装置20A,20Bの機能と同様である。また、構成推測手段310以外のセンタ装置30の各構成要素の機能は、第4の実施の形態で示したそれらの機能と同様である。
次に、動作について説明する。本実施の形態において、サイト装置20A,20Bは、第2の実施の形態で示したステップS31からステップS34までと同様の処理に従って、集約情報及び次元情報を生成しセンタ装置30に送信する。
図12は、センタ装置30(データ処理記憶装置(センタ)9及び出力装置4)がマクロ情報を生成する処理の更に他の例を示す流れ図である。センタ装置30は、第4の実施の形態で示したステップS61からステップS64までと同様の処理に従って、統合次元情報及び統合集約情報を生成し(ステップS71〜ステップS73)、全サイトが蓄積するデータを再現した近似情報を生成する(ステップS74)。また、センタ装置30は、第4の実施の形態で示したステップS65と同様の処理に従って、マクロ分布を求める(ステップS75)。また、センタ装置30は、第4の実施の形態で示したステップS66と同様の処理に従って、マクロ分布や集約情報から部分情報を抽出し、抽出した部分情報をユーザが認識しやすい形式の情報に変換する(ステップS76)。
構成推測手段310は、マクロ分布と部分情報との対応関係を、所定のアルゴリズムに従って、ユーザが容易に把握できる形式の情報に変換する(ステップS77)。第4の実施の形態では、マクロ情報及びサイトが蓄積する情報それぞれに対して、利用ユーザが把握しやすい形式に情報を変換するだけであり、マクロ情報とサイトが蓄積する情報との対応関係を示した情報を利用ユーザに提示することはしていなかった。本実施の形態では、構成推測手段310は、マクロ情報と各サイトが蓄積する情報とを対応付ける情報を、利用ユーザにとって容易に把握できる形式に変換して提示する。例えば、構成推測手段310は、マクロ情報の部分情報がどの程度各サイト又は各サイトの部分情報に寄与しているかを示す情報を生成し、利用ユーザに分かりやすい形式で提示する。
そして、構成推測手段310は、ステップS76で変換した部分情報や、ステップS77で変換した情報(マクロ情報と各サイトが蓄積する情報との対応関係を示す情報)を、出力装置4に出力させる(ステップS78)。この場合、出力装置4は、部分情報抽出手段39の指示に従って、変換した部分情報を表示又は印刷する。また、出力装置4は、構成推測手段310の指示に従って変換した情報を表示又は印刷する。
以上のように、本実施の形態によれば、マクロ分布と、各サイトの情報の分布を示す部分情報との対応関係を求め、利用ユーザにとって把握しやすい形式の情報に変換する。従って、利用ユーザに対して、容易に把握が可能で有意義なマクロ情報を提示することができる。
実施の形態6.
次に、本発明の第6の実施の形態について図面を参照して説明する。図13は、マクロ情報生成システムの更に他の構成例を示すブロック図である。図13に示すように、本実施の形態では、データ処理記憶装置(センタ)9が、図7に示したデータ処理記憶装置(センタ)8の構成要素のうち、近似情報生成手段33及び近似情報記憶部34を含まない点で、第3の実施の形態と異なる。また、本実施の形態では、集約情報統合手段32Aが、マクロ分布生成手段38に集約情報(統合集約情報)を直接出力する点で、第3の実施の形態で示した集約情報統合手段32と異なる。また、本実施の形態では、マクロ分布生成手段38Aが、統合集約情報からマクロ分布を求める点で、第3の実施の形態で示したマクロ分布生成手段38と異なる。
次に、本発明の第6の実施の形態について図面を参照して説明する。図13は、マクロ情報生成システムの更に他の構成例を示すブロック図である。図13に示すように、本実施の形態では、データ処理記憶装置(センタ)9が、図7に示したデータ処理記憶装置(センタ)8の構成要素のうち、近似情報生成手段33及び近似情報記憶部34を含まない点で、第3の実施の形態と異なる。また、本実施の形態では、集約情報統合手段32Aが、マクロ分布生成手段38に集約情報(統合集約情報)を直接出力する点で、第3の実施の形態で示した集約情報統合手段32と異なる。また、本実施の形態では、マクロ分布生成手段38Aが、統合集約情報からマクロ分布を求める点で、第3の実施の形態で示したマクロ分布生成手段38と異なる。
なお、本実施の形態において、サイト装置20A,20Bの機能は、第2の実施の形態及び第3の実施の形態で示したサイト装置20A,20Bの機能と同様である。また、集約情報統合手段32A以外のセンタ装置30の各構成要素の機能は、第3の実施の形態で示したそれらの機能と同様である。
次に、動作について説明する。本実施の形態において、サイト装置20A,20Bは、第2の実施の形態で示したステップS31からステップS34までと同様の処理に従って、集約情報及び次元情報を生成しセンタ装置30に送信する。
図14は、センタ装置30(データ処理記憶装置(センタ)9及び出力装置4)がマクロ情報を生成する処理の更に他の例を示す流れ図である。センタ装置30は、第3の実施の形態で示したステップS51からステップS53までと同様の処理に従って、統合次元情報及び統合集約情報を生成する(ステップS81〜ステップS83)。
マクロ分布生成手段38Aは、集約情報統合手段32Aが統合した統合集約情報に基づいて、マクロ分布を求める(ステップS84)。第3の実施の形態では、マクロ情報を分析するために一度サイト内のデータを再現した近似情報を生成し、生成した近似情報を用いて分析を行う場合を説明した。本実施の形態では、マクロ分布生成手段38Aは、センタ装置30が求めるマクロ分布と、集約情報統合手段32Aが生成した統合集約情報に含まれる情報の分布との分布間距離を、マクロ分布を変化させて近づけることによって、マクロ分布を求める。この場合、マクロ分布生成手段38Aは、分布間距離が最小となる場合のマクロ分布を、マクロ情報として求める。
そして、マクロ分布生成手段38Aは、求めたマクロ分布を出力装置4に出力させる(ステップS56)。この場合、出力装置4は、マクロ分布生成手段38Aの指示に従って、マクロ分布を表示又は印刷する。
以上のように、本実施の形態によれば、各サイト装置がセンタ装置に集約情報を送信さえすれば、センタ装置は、マクロ情報を生成することができる。従って、各サイトが蓄積するデータそのものである生データを一箇所に集めることなくマクロ情報を生成することができる。
実施の形態7.
次に、本発明の第7の実施の形態について図面を参照して説明する。図15は、マクロ情報生成システムの更に他の構成例を示すブロック図である。図15に示すように、本実施の形態では、データ処理記憶装置(サイト)101,102が、図7に示したデータ処理記憶装置(サイト)51,52の構成構成のうち、次元枚挙手段213,223を含まない点で、第3の実施の形態と異なる。また、本実施の形態では、データ処理記憶装置101,102が、図7に示したデータ処理記憶装置51,52の構成要素に加えて、近似情報生成手段214,224を有する点で、第3の実施の形態と異なる。
次に、本発明の第7の実施の形態について図面を参照して説明する。図15は、マクロ情報生成システムの更に他の構成例を示すブロック図である。図15に示すように、本実施の形態では、データ処理記憶装置(サイト)101,102が、図7に示したデータ処理記憶装置(サイト)51,52の構成構成のうち、次元枚挙手段213,223を含まない点で、第3の実施の形態と異なる。また、本実施の形態では、データ処理記憶装置101,102が、図7に示したデータ処理記憶装置51,52の構成要素に加えて、近似情報生成手段214,224を有する点で、第3の実施の形態と異なる。
また、本実施の形態では、データ処理記憶装置(センタ)111が、図7に示したデータ処理記憶装置(センタ)9の構成要素のうち、集約情報記録部31、集約情報統合手段32、近似情報生成手段33、統合次元生成手段36及び統合次元記憶部37を含まない点で、第3の実施の形態と異なる。
近似情報生成手段214,224は、具体的には、プログラムに従って動作する情報処理端末のCPU及びネットワークインタフェース部によって実現される。近似情報生成手段214,224は、図7に示した近似情報生成手段33と同様の処理に従って、集約手段212,222が生成する集約情報に基づいて、近似情報を生成する機能を備える。また、近似情報生成手段214,224は、生成した近似情報を、通信ネットワークを介してセンタ装置30に送信する機能を備える。
なお、本実施の形態において、近似情報生成手段214,224以外のサイト装置20A,20Bの各構成要素の機能は、第1の実施の形態から第3の実施の形態で示したそれらの機能と同様である。また、センタ装置30の近似情報記憶部34及びマクロ分布生成手段38の機能は、第3の実施の形態で示したそれらの機能と同様である。
次に、動作について説明する。図16は、サイト装置20A,20B(入力装置11,12及びデータ処理記憶装置(サイト)101,102)が近似情報を生成してセンタ装置30に送信する処理の例を示す流れ図である。また、図17は、センタ装置30(データ処理記憶装置(センタ)111及び出力装置4)がマクロ情報を生成する処理の更に他の例を示す流れ図である。
データ処理記憶装置101,102は、第1の実施の形態で示したステップS11,S12と同様の処理に従って、各種データを入力し(ステップS91)、集約情報を生成する(ステップS92)。また、近似情報生成手段214,224は、集約手段212,222が生成した集約情報に基づいて、データ記憶部211,221が蓄積するデータを再現した近似情報を生成する(ステップS93)。そして、近似情報生成手段214,224は、生成した近似情報を、通信ネットワークを介してセンタ装置30に送信する(ステップS94)。
センタ装置30のデータ処理記憶装置111は、サイト装置20A,20Bから、通信ネットワークを介して近似情報を受信する(ステップS101)。また、データ処理記憶装置111は、受信した近似情報を近似情報記憶部34に記憶させる。また、マクロ分布生成手段38は、近似情報記憶部34が記憶する近似情報に基づいて、マクロ分布を求める(ステップS102)。そして、マクロ分布生成手段38は、求めたマクロ分布を出力装置4に出力させる(ステップS103)。
第3の実施の形態では、センタ装置30が、集約情報を統合して、サイトが蓄積するデータを再現した近似情報を生成する場合を説明した。本実施の形態では、各サイト装置20A,20Bが、集約情報に基づいて近似情報を生成する。そして、各サイト装置20A,20Bが生成した近似情報をセンタ装置30に送信することにより、センタ装置30の近似情報記憶部34に近似情報が記憶される。
以上のように、本実施の形態によれば、各サイト装置がセンタ装置に近似情報を送信さえすれば、センタ装置は、マクロ情報を生成することができる。従って、各サイトが蓄積するデータそのものである生データを一箇所に集めることなくマクロ情報を生成することができる。
実施の形態8.
次に、本発明の第8の実施の形態について図面を参照して説明する。図18は、マクロ情報生成システムの更に他の構成例を示すブロック図である。図18に示すように、本実施の形態において、マクロ情報生成システムは、第1の実施の形態から第7の実施の形態と同様に、サイト装置20A,20B及びセンタ装置30を含む。また、サイト装置20A,20Bは、入力装置11,12及びデータ処理記憶装置(サイト)141,142を含む。また、センタ装置30は、データ処理記憶装置(センタ)151及び出力装置4を含む。
次に、本発明の第8の実施の形態について図面を参照して説明する。図18は、マクロ情報生成システムの更に他の構成例を示すブロック図である。図18に示すように、本実施の形態において、マクロ情報生成システムは、第1の実施の形態から第7の実施の形態と同様に、サイト装置20A,20B及びセンタ装置30を含む。また、サイト装置20A,20Bは、入力装置11,12及びデータ処理記憶装置(サイト)141,142を含む。また、センタ装置30は、データ処理記憶装置(センタ)151及び出力装置4を含む。
本実施の形態において、データ処理記憶装置141,142は、記憶媒体(例えば、CD−ROM)が記憶するサイト用プログラム121,122を読み込み、読み込んだサイト用プログラム121,22に従って処理を実行する。サイト用プログラム121,122は、データ処理記憶装置(サイト)141,142に読み込まれ、データ処理記憶装置(サイト)141,142の動作を制御するためのプログラムである。本実施の形態では、データ処理記憶装置141,142は、サイト用プログラム121,122に従って処理を実行することによって、次元情報や集約情報、近似情報を生成して、データ処理記憶装置(センタ)151に送信する。
データ処理記憶装置(サイト)141,142は、サイト用プログラム121,122に従って制御することにより、第1の実施の形態から第7の実施の形態で示したいずれかのデータ処理記憶装置(サイト)21,22,51,52,101,102と同様の処理を実行する。
例えば、データ処理記憶装置141,142は、サイト用プログラム121,122として、コンピュータに、データ蓄積手段が蓄積するデータを所定の方法で集約した集約情報を生成する集約情報生成処理と、生成した集約情報に基づいて、データ蓄積手段が蓄積するデータの内容を再現した再現データを生成するデータ再現処理と、生成した再現データを、各データ蓄積装置が蓄積するデータを処理するデータ処理装置に、通信ネットワークを介して送信する再現データ送信処理とを実行させるための蓄積データ処理生成プログラムを読み込み、集約情報や近似情報を生成する。
また、本実施の形態において、データ処理記憶装置151は、記憶媒体(例えば、CD−ROM)が記憶するセンタ用プログラム131を読み込み、読み込んだセンタ用プログラム131に従って処理を実行する。センタ用プログラム131は、データ処理記憶装置(センタ)151に読み込まれ、データ処理記憶装置(センタ)151の動作を制御するためのプログラムである。本実施の形態では、データ処理記憶装置151は、センタ用プログラム131に従って処理を実行することによって、マクロ情報を生成し出力装置4に出力させる。
データ処理記憶装置(センタ)151は、センタ用プログラム131に従って制御することににより、第1の実施の形態から第7の実施の形態で示したいずれかのデータ処理記憶装置(センタ)3,6,7,8,9,111と同様の処理を実行する。
例えば、データ処理記憶装置151は、センタ用プログラム131として、コンピュータに、データを蓄積する複数のデータ蓄積装置から、データ蓄積装置が蓄積するデータを所定の方法で集約した集約情報を、通信ネットワークを介して受信する集約情報受信処理と、受信した集約情報に基づいて、各データ蓄積装置が蓄積するデータの内容を再現した再現データを生成するデータ再現処理と、生成した再現データを分析しマクロ情報を生成するマクロ情報生成処理とを実行させるためのマクロ情報生成プログラムを読み込み、マクロ情報を生成する。
なお、第1の実施の形態から第8の実施の形態では、サイト装置20A,20B(入力装置及びデータ処理記憶装置(サイト))を2つ用いる場合を説明したが、サイト装置20A,20B(入力装置及びデータ処理記憶装置(サイト))の数は、2つに限られない。例えば、マクロ情報生成システムは、3以上のサイト装置を含んでもよい。
実施の形態9.
次に、本発明の第9の実施の形態について図面を参照して説明する。図19は、マクロ情報生成システムの更に他の構成例を示すブロック図である。図19に示すように、本実施の形態では、データ処理記憶装置(センタ)8Bが、図11に示したデータ処理記憶装置8Aの構成要素に加えて、製品名や技術名等の名前とその技術ドメインが記された情報(本例では、辞書)を記憶するドメイン記憶部311と、ドメイン記憶部311が記憶する情報を用いてマクロ情報やサイトの集約情報に対して利用ユーザにとって更に分かりやすいラベルを付与するラベリング手段312とを有する点で、第5の実施の形態と異なる。
次に、本発明の第9の実施の形態について図面を参照して説明する。図19は、マクロ情報生成システムの更に他の構成例を示すブロック図である。図19に示すように、本実施の形態では、データ処理記憶装置(センタ)8Bが、図11に示したデータ処理記憶装置8Aの構成要素に加えて、製品名や技術名等の名前とその技術ドメインが記された情報(本例では、辞書)を記憶するドメイン記憶部311と、ドメイン記憶部311が記憶する情報を用いてマクロ情報やサイトの集約情報に対して利用ユーザにとって更に分かりやすいラベルを付与するラベリング手段312とを有する点で、第5の実施の形態と異なる。
ドメイン記憶部311は、具体的には、磁気ディスク装置や光ディスク装置等の記憶装置によって実現される。ドメイン記憶部311は、各企業や団体等で使用される製品名や技術名等の名前と、その製品名や技術名についての技術ドメイン(例えば、製品や技術が属する技術領域)を対応付けた辞書を記憶する。
ラベリング手段312は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。ラベリング手段312は、部分情報抽出手段39が生成した部分情報(マクロ情報やサイトの集約情報から生成した部分情報)を、利用ユーザにとって更に容易に把握できる形式の情報に変換する機能を備える。この場合、ラベリング手段312は、ドメイン記憶部311が記憶するドメイン辞書に基づいて、所定のラベリング処理を行う。本実施の形態では、ラベリング手段312は、ドメイン記憶部311が記憶する辞書を用いて、部分情報に所定のラベルを付与する。また、ラベリング手段312は、ラベルを付与した部分情報を出力装置4に出力させる機能を備える。例えば、ラベリング手段は、312は、部分情報に対応する技術ドメインをドメイン辞書から抽出し、抽出した技術ドメインをラベル情報として部分情報に付与(付加)する。
なお、本実施の形態において、サイト装置20A,20Bの各構成要素の機能は、第2の実施の形態及び第3の実施の形態で示したサイト装置20A,20Bの機能と同様である。また、ドメイン記憶部311とラベリング手段312以外のセンタ装置30の各構成要素の機能は、第5の形態で示したそれらの機能と同様である。
次に、動作について説明する。本実施の形態において、サイト装置20A,20Bは、第2の実施の形態で示したステップS31からステップS34までと同様の処理に従って、集約情報及び次元情報を生成しセンタ装置30に送信する。
図20は、センタ装置30(データ処理記憶装置(センタ)8B及び出力装置4)がマクロ情報を生成する処理の更に他の例を示す流れ図である。センタ装置30は、第5の実施の形態で示したステップS71からステップS74までと同様の処理に従って、統合次元情報及び統合集約情報を生成し(ステップS111〜ステップS113)、全サイトが蓄積するデータを再現した近似情報を生成する(ステップS114)。また、センタ装置30は、第5の実施の形態で示したステップS75と同様の処理に従って、マクロ分布を求める(ステップS115)。
また、センタ装置30は、第5の実施の形態で示したステップS76と同様の処理に従って、マクロ分布や集約情報から部分情報を抽出し、抽出した部分情報をユーザが認識しやすい形式の情報に変換する(ステップS116)。また、センタ装置30は、第5の実施の形態で示したステップS77と同様の処理に従って、マクロ分布と部分情報との対応関係をユーザが容易に把握できる形式の情報に変換する(ステップS117)。
ラベリング手段312は、部分情報(マクロ情報やサイトの集約情報の部分情報)に、所定のラベルを付与する。この場合、ラベリング手段312は、所定のアルゴリズムに従って、ドメイン記憶部311が記憶する辞書を用いて、利用ユーザにとってより把握しやすい形式のラベルを付与する(ステップS118)。
第5の実施の形態では、マクロ情報及びサイトが蓄積する情報それぞれに対して、利用ユーザが把握しやすい形式に変換したり、対応関係を示す形式に変換したりする処理だけしか行っていなかった。すなわち、別情報源(内部データから生成した情報、もしくは外部情報)を用いて、より分かりやすい単語レベルで表現されたラベルを付与して、利用ユーザに提示することはしていなかった。本実施の形態では、ラベリング手段312は、マクロ情報の部分情報や各サイトの集約情報の部分情報に、別情報源(本例では、辞書)を用いて単語レベルで表現されたラベルを付与して、利用ユーザにより分かりやすい形式で提示する。
また、ラベリング手段312は、ステップS118で変換したラベル情報を、ステップS116で変換した部分情報や、ステップS117で変換した情報(マクロ情報と各サイトが蓄積する情報との対応関係を示す情報)に付与する。そして、ラベリング手段312は、ラベルを付与した情報(部分情報や、対応関係を示す情報)を出力装置4に出力させる(ステップS119)。この場合、出力装置4は、ラベリング手段312の指示に従って、変換した情報を表示又は印刷する。
以上のように、本実施の形態によれば、マクロ分布と、各サイトの情報の分布を示す部分情報を、別情報(本例では、辞書)を用いて、利用ユーザにとってより把握しやすい情報に変換する。従って、利用ユーザに対して、より容易に把握が可能で有意義なマクロ情報を提示することができる。
実施の形態10.
次に、本発明の第10の実施の形態について図面を参照して説明する。図21は、マクロ情報生成システムの更に他の構成例を示すブロック図である。図21に示すように、本実施の形態では、データ処理記憶装置(センタ)8Cが、図19に示したデータ処理記憶装置8Bの構成要素に加えて、各サイト情報を比較して示すためのグラフを利用ユーザに提示する競合分析手段313を有する点で、第9の実施の形態と異なる。
次に、本発明の第10の実施の形態について図面を参照して説明する。図21は、マクロ情報生成システムの更に他の構成例を示すブロック図である。図21に示すように、本実施の形態では、データ処理記憶装置(センタ)8Cが、図19に示したデータ処理記憶装置8Bの構成要素に加えて、各サイト情報を比較して示すためのグラフを利用ユーザに提示する競合分析手段313を有する点で、第9の実施の形態と異なる。
競合分析手段313は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。競合分析手段313は、サイトの相対的な比較を行うためのグラフ(各サイト情報を比較して表示するグラフ)を生成する機能を備える。例えば、競合分析手段313は、サイト側のトピックとセンタ側のトピックとの構成比を用いて、競合分析を行うためのレーダーチャートを生成する。また、競合分析手段313は、各サイト情報を比較して示すためのグラフを、出力装置4に出力させる機能を備える。
なお、本実施の形態において、サイト装置20A,20Bの各構成要素の機能は、第2の実施の形態及び第3の実施の形態で示したサイト装置20A,20Bの機能と同様である。また、競合分析手段313以外のセンタ装置30の各構成要素の機能は、第9の形態で示したそれらの機能と同様である。
次に、動作について説明する。本実施の形態において、サイト装置20A,20Bは、第2の実施の形態で示したステップS31からステップS34までと同様の処理に従って、集約情報及び次元情報を生成しセンタ装置30に送信する。
図22は、センタ装置30(データ処理記憶装置(センタ)8C及び出力装置4)がマクロ情報を生成する処理の更に他の例を示す流れ図である。センタ装置30は、第9の実施の形態で示したステップS111からステップS114までと同様の処理に従って、統合次元情報及び統合集約情報を生成し(ステップS121〜ステップS123)、全サイトが蓄積するデータを再現した近似情報を生成する(ステップS124)。また、センタ装置30は、第9の実施の形態で示したステップS115と同様の処理に従って、マクロ分布を求める(ステップS125)。
また、センタ装置30は、第9の実施の形態で示したステップS116と同様の処理に従って、マクロ分布や集約情報から部分情報を抽出し、抽出した部分情報をユーザが認識しやすい形式の情報に変換する(ステップS126)。また、センタ装置30は、第9の実施の形態で示したステップS117と同様の処理に従って、マクロ分布と部分情報との対応関係をユーザが容易に把握できる形式の情報に変換する(ステップS127)。
また、センタ装置30は、第9の実施の形態で示したステップS118と同様の処理に従って、部分情報(マクロ情報やサイトの集約情報の部分情報)に、利用ユーザにとってより把握しやすいラベルを付与する(ステップS128)。
競合分析手段313は、マクロ情報と各サイトの情報とを対応付けた情報を、所定のアルゴリズムに従って、相対的な比較が容易に把握できる形式の情報に変換する(ステップS129)。本実施の形態では、競合分析手段313は、マクロ情報と各サイトの情報とを対応付けた情報に基づいて、各サイト情報を比較して表示するグラフを生成する。
第9の実施の形態では、マクロ情報及びサイトが蓄積する情報それぞれに対して、対応関係を示す形式に変換したりする処理だけしか行っていなかった。すなわち、サイト間の相対的な比較が把握できる情報を、利用ユーザに提示することはしていなかった。本実施の形態では、競合分析手段313は、サイト間の相対的な比較が容易に行える情報を、マクロ情報も用いて、利用ユーザに容易に理解できる形式で提示する。
そして、競合分析手段313は、ステップS129で変換(生成)したサイト間の相対的な比較を示した情報(グラフ)を、出力装置4に出力させる(ステップS130)。この場合、出力装置4は、競合分析手段313の指示に従って、変換した情報を表示又は印刷する。
以上のように、本実施の形態によれば、サイトの情報の相対的な比較を行うために、マクロ情報を用いて、マクロ情報と各サイトの情報とを対応付けた情報を、利用ユーザにとって容易に理解できる情報に変換する。従って、利用ユーザに対して、サイト間の相対的な比較を行うために必要な情報を提示して、競合分析等の支援を行うことができる。
次に、本発明の第1の実施例を図面を参照して説明する。なお、本実施例に示すマクロ情報生成システムは、第1の実施の形態で示したマクロ情報生成システムに相当する。本実施例において、マクロ情報生成システムは、入力装置11,12としてキーボードを備え、データ処理記憶装置(サイト)21,22及びデータ処理記憶装置(センタ)3として、それぞれパーソナルコンピュータ及び磁気ディスク記憶装置を備える。また、マクロ情報生成システムは、出力装置4としてディスプレイ装置を備える。
サイト側のパーソナルコンピュータは、集約手段として機能する中央演算装置を有する。また、センタ側のパーソナルコンピュータは、集約情報統合手段、近似情報生成手段及び分析手段として機能する中央演算装置を有する。また、サイト側の磁気ディスク記憶装置は、分析対象のデータを記憶する。また、センタ側の磁気ディスク記憶装置は、集約情報及び近似情報を記憶する。
本実施例では、リモートサイトに蓄積されているデータを集約してセンタに送る。そして、センタ側で、集約情報を統合して、その統合した集約情報から全サイトのデータを再現することによって、生データを一箇所に集めなくても様々な分析を行うことができる。図23は、マクロ情報生成システムの具体的な構成例を示すブロック図である。図23は、図1に示すマクロ情報生成システムの構成をより具体化したものに相当する。
複数のサイトでは、集約手段は、入力したデータから、データに含まれる情報要素(例えば、語彙)の分布を推定する。ここで、集約手段が求める分布とは、データに含まれる情報要素の確率分布や、各次元の値から求められる統計量のことである。
分析対象のデータがテキストである場合、次元はテキスト内に出現する単語となる。テキスト内に出現する可能性がある全ての単語をw1,w2,...,wNとすると、1つのテキストデータをベクトル(x(w1),x(w2),...,x(wN))で表現することができる。x(wi)は、例えば、単語wiが分析対象のテキスト内に現れる場合「1」の値となり、テキスト内に現れない場合「0」の値となる。
集約手段は、EMアルゴリズムを用いて有限混合モデルを推定することによって、分布を推定してもよい。また、集約手段は、単純に1つの確率分布のパラメータを計算するだけでもよい。また、集約手段は、各次元の値の総和を求めて統計量を求めるだけでもよい。例えば、集約手段は、データから1つの正規分布を推定する場合であれば、データの各次元に対して期待値や分散等のパラメータを求めるだけでもよい。
上記のように、集約手段は、分析対象のデータに含まれる情報要素の分布を推定し、求めた分布を示すパラメータを集約情報としてセンタに送信する。例えば、集約手段は、集約情報として、推定した分布が正規分布である場合、期待値や分散、データ数、分布の種類(本例では、正規分布)を送信する。
センタでは、集約情報統合手段は、各サイトから受信した分布を用いて、各サイトが蓄積するデータの分布を統合した統合分布を作成する。例えば、各サイトからの集約情報として確率分布を受信した場合、集約情報統合手段は、各サイトlの確率分布pl(x|θl)を混合したモデルp’(x|θ’)を式(1)を用いて構築する(求める)。この確率分布を混合したモデルp’(x|θ’)のパラメータθ’が、集約情報を統合した統合集約情報となる。
式(1)において、nlはサイトlのデータ数であり、Nは全サイトのデータ数であり、sは全サイト数である。各サイトからの集約情報として各次元の値を総和した統計量を受信した場合、センタでも、集約情報統合手段は、各サイトにおける同一の意味を示す次元に対して総和を求める。この総和として求めた統計量が、集約情報を統合した統合集約情報に相当する。
次に、サンプリング手段(近似情報生成手段に相当)は、この統合した集約情報から、サイトが蓄積するデータを再現する。集約情報が確率分布であれば、サンプリング手段は、所定のサンプリング技術を用いて、サンプリングデータを近似情報として生成する。集約情報が次元の値を総和した統計量である場合、サンプリング手段は、その統計量を全サイトのデータ数で除算した値(次元の平均値)を求める。そして、サンプリング手段は、求めた各次元の平均値に従ってランダムサンプリングすることによって、サイトが蓄積するデータを再現することができる。
分析手段は、サンプリング手段がサンプリングしたデータに基づいて、様々な分析を行う。データがテキストデータである場合、例えば、分析手段は、所定のクラスタリング技術を用いて、トピック分析を行う。また、分析手段は、所定の特徴語抽出技術を用いて、各サイトが蓄積するデータ中において特徴的に現れる単語を推定したりすることも可能である。また、データがシステムログ等のログデータであれば、分析手段は、所定のシステムログ解析技術を用いて、複数サイトにおけるシステムの相関を解析してルール化し、ルール情報を生成する。また、分析手段は、システムの障害時にどのサイトで異常が発生しているか等の障害要因の追求をしたりすることも可能である。
次に、本発明の第2の実施例を説明する。なお、本実施例に示すマクロ情報生成システムは、第2の実施の形態で示したマクロ情報生成システムに相当する。本実施例では、サイト側のパーソナルコンピュータの中央演算装置が、次元枚挙手段としても機能する点で、第1の実施例と異なる。また、センタ側のパーソナルコンピュータの中央演算装置が、統合次元手段としても機能する点で、第1の実施例と異なる。また、センタ側の磁気ディスク記憶装置が、統合次元も記憶する点で、第1の実施例と異なる。
第1の実施例では、サイト間でデータの次元にヘテロ性が生じている場合であっても、センタ側で個別の次元であると判断し分析を行っていた。しかし、第1の実施例のように、データ間にヘテロ性が生じている場合であっても多数の次元を全て個別の次元として扱うと、精度よくマクロ情報を分析することが難しくなる。そこで、本実施例では、サイト間でデータの次元にヘテロ性が生じている場合、センタ側の統合次元生成手段は、各サイトの次元同士がそれぞれ同一かどうかの判定する
例えば、データがテキストであれば、各サイトの次元枚挙手段は、センタに、次元としてテキストに用いられている単語を送信する。また、センタ側では、統合次元手段は、同義語辞書等の単語辞書を用いて、統合後の単語とサイトで用いられている各単語との対応ルールを作成する。例えば、サイトAでは「パソコン」と表現され、他の複数のサイトでは「PC」と表現された同義語についての次元が存在する場合、統合次元手段は、統合次元として「PC」のみを採用する。そして、統合次元手段は、サイトAにおける「パソコン」という次元が統合次元では「PC」という次元であることを示すルールを作成する。そのようにすることにより、サイト間で次元が異なる等のヘテロ性の問題がある場合であっても、サイトから次元の情報をセンタに送信するだけで、生成するマクロ情報の精度を確保することができる。
次に、本発明の第3の実施例を説明する。なお、本実施例に示すマクロ情報生成システムは、第3の実施の形態で示したマクロ情報生成システムに相当する。本実施例では、センタ側のパーソナルコンピュータの中央演算装置が、マクロ分布生成手段としても機能する点で、第2の実施例と異なる。
第1の実施例及び第2の実施例では、センタ側の分析手段が生成するマクロ情報について具体的に特定しなかったが、本実施例では、センタ側のマクロ分布生成手段は、マクロ情報として確率分布を推定する。本実施例では、マクロ分布生成手段は、サイトが蓄積する生データを集めることなく、例えば、各サイトに蓄積されているテキストデータに対して、データ全体としてどのようなトピックが存在するかを分析する。ここで、「トピック」とは、特定の事象や活動について述べたテキスト群である。マクロ分布生成手段は、例えば、有限混合モデルと呼ばれる確率モデルを用いて、テキストデータ中に含まれるトピックを生成する。
なお、本実施例において、マクロ分布生成手段以外の構成要素の機能は、第1の実施例又は第2の実施例で示したそれらの機能と同様である。
マクロ分布生成手段では、サンプリング手段が近似情報として生成した再現データから、1コンポーネントを1トピックとして示す有限混合モデルを学習することによって、トピックを見つける。例えば、マクロ分布生成手段は、EM(Expectation Maximization)アルゴリズムを用いて有限混合モデルを学習することによって、トピックを抽出する。また、例えば、マクロ分布生成手段は、時系列で表現されるテキストストリームから同一の話題を示すトピックを有限混合モデルを用いて学習するトピック分析手法を用いて、トピックを抽出する。
なお、上記に示したトピック分析手法は、例えば、「S.Morinaga, K.Yamanishi, "Tracking Dynamics of Topic Trends Using a Finite Mixture Model", Proceedings of the Tenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, ACM Press,2004年8月, pp.811-816」に記載されている。
上記のように処理を実行することによって、マクロ分布生成手段は、マクロ情報として、有限混合モデルで示されたデータ全体としてのトピックを推定することができる。
次に、本発明の第4の実施例を図面を参照して説明する。なお、本実施例に示すマクロ情報生成システムは、第4の実施の形態で示したマクロ情報生成システムに相当する。本実施例では、センタ側のパーソナルコンピュータの中央演算装置が、トピック情報抽出手段としても機能する点で、第3の実施例と異なる。
第3の実施例では、マクロ分布として、例えば、有限混合モデルを推定する場合を説明したが、生成するマクロ情報(マクロ分布)が利用ユーザにとって分かりやすい価値のある形式の情報であるか否かを考慮しなかった。本実施例では、マクロ情報生成システムは、ユーザがマクロ分布を容易に把握できるようにするために、混合モデルの各コンポーネント情報を容易に把握できる形式の情報に変換する。さらに、マクロ情報生成システムは、マクロ分布のデータ形式を変換するだけでなく、サイトから受信した集約情報が有限混合モデルで表現されている場合であっても、各コンポーネント情報を容易に把握できる形式の情報に変換する。
本実施例では、マクロ情報生成システムは、サイトから受信した集約情報とセンタ側で作成したトピックを示す有限混合モデルとに基づいて、マクロ情報の部分情報であるトピック情報を抽出する。この場合、マクロ情報生成システムは、それぞれのトピックについて特有に述べられている単語や活性度をトピック情報として抽出する。「トピックの活性度」とは、そのトピックについてどの程度の割合で述べられているか(単語中に対象のトピックを示す単語がどの程度含まれているか)を示す尺度である。なお、本実施例では、サイトの集約手段は、有限混合モデルを推定し集約情報を求めるものとする。
図24は、マクロ情報生成システムの具体的な他の構成例を示すブロック図である。図24は、図9に示すマクロ情報生成システムの構成をより具体化したものに相当する。図24に示すように、本実施例では、マクロ情報生成システムは、サイト装置が有限混合モデルを推定する学習手段(集約手段に相当する)を有する点で、第3の実施例と異なる。また、センタ装置がトピック情報を抽出するトピック情報抽出手段(部分情報抽出手段に相当する)を有する点で、第3の実施例と異なる。
一般に各トピックがどのような事象について述べられているかを示す場合に、数値パラメータとして示すのでなく、単語を用いてユーザに提示すれば、利用ユーザにとって、マクロ分布がより分かりやすく価値のある情報となる。
本実施例では、具体的には、図24に示すトピック情報抽出手段は、トピックに特有な単語をマクロ分布や集約情報から抽出する。この場合、トピック情報抽出手段は、例えば、式(2)に示すESC(Extended Stochastic Complexity)と呼ばれる手法を用いて、トピックに特有な単語を抽出する。
G(W)=ESC−(ESC1+ESC0)
ESC =A+L×Sqrt((A+B)×log(A+B))
ESC1=D+L×Sqrt((C+D)×log(C+D))
ESC0=(A−C)+L×Sqrt((A+B−C−D)×log(A+B−C−D)) 式(2)
ESC =A+L×Sqrt((A+B)×log(A+B))
ESC1=D+L×Sqrt((C+D)×log(C+D))
ESC0=(A−C)+L×Sqrt((A+B−C−D)×log(A+B−C−D)) 式(2)
ここで、式(2)において、Aは分析対象のトピックを含む文書数であり、Bは分析対象のトピック以外のトピックを含む文書数である。また、Cは分析対象のトピック内の単語Wを含む文書数であり、Dは分析対象のトピック内の単語Wを含まない文書数である。また、Lは定数である。
A及びBを求める場合、トピック情報抽出手段は、サイトlのトピックiについては、nl×πiを算出することによってトピックを含む文書数を求めることができる。また、トピック情報抽出手段は、センタのトピックについては、N×(nl/n)×πiを算出することによってトピックを含む文書数を求めることができ、A,Bを推測することができる。ここで、nlはサイトlのデータ数であり、nは全サイトのデータ数である。また、πiはトピックiの混合比であり、Nはサンプリングデータ数である。また、トピック情報抽出手段は、分析トピックのデータ数Aから、所定のサンプリング技術を用いることによってC及びDを推測することができる。
トピックの活性度は、有限混合モデルの各コンポーネントの混合比πに相当する。各トピックの活性度を求めることにより、そのトピックが全体のサイトでどの程度中心に述べられているかを、システム利用者にとって分かりやすい数値という形式で提示することが可能となる。さらに、活性度が既知であれば、サイトが蓄積する生データがなくても、トピックに占められるテキストデータ数を推測することが可能となる。例えば、トピック情報抽出手段は、サイトlのトピックiに属するテキストデータ数を、nl×πi(Σπi=1)を算出することによって推測することができる。また、例えば、トピック情報抽出手段は、センタのトピックjに属するテキストデータ数を、n×πj(Σπj=1)を算出することによって推測することができる。ただし、この場合、1つのテキストデータは、1つのトピックのみに属するものとする。
図25は、各サイトに蓄積されているテキストデータ及びトピック分析結果の出力例と、マクロ情報としての全体のサイトのトピック分析結果の出力例とを示す説明図である。図25に示すように、センタ装置は、トピック分析結果の出力例として所定の表(テーブル)を出力する。トピック分析結果を示すの表(テーブル)において、テーブルの各列は主要トピックを表し、トピック毎に活性度及び特徴的な表現(トピック情報抽出手段の出力結果)が含まれる。
例えば、図25に示すサイトAにおける分析例では、1つ目のコンポーネントが活性度「0.3」及び特徴表現(「音」、「静か」、「基準」)を含む主要トピックであり、2つ目のコンポーネントが活性度「0.3」及び特徴表現(「低価格」、「××」、「最近」)を含む主要トピックであり、3つ目のコンポーネントが活性度「0.2」及び特徴表現(「画質」、「普通」)を含む主要トピックである。また、サイトBにおける分析例では、1つ目のコンポーネントが活性度「0.7」及び特徴表現(「低価格」、「画質」、「最近」)を含む主要トピックであり、2つ目のコンポーネントが活性度「0.2」及び特徴表現(「△△」、「価格」、「高い」)を含む主要トピックである。
トピック情報抽出手段は、図25に示す各サイトのトピック情報を統合したモデルに基づいてサンプリングを行い、そのサンプリングデータを再学習することによって、マクロ情報としてトピック分析結果を求めることができる。
図25に示すように、センタにおける分析例(推測した結果)では、1つ目のコンポーネントが活性度「0.5」及び特徴表現(「低価格」、「人気」、「××」)を含む主要トピックであり、2つ目のコンポーネントが活性度「0.3」及び特徴表現(「△△」、「価格」、「高い」、「画質」、「良い」)を含む主要トピックであり、3つ目のコンポーネントが活性度「0.1」及び特徴表現(「音」、「静か」、「基準」)を含む主要トピックである。センタ装置が図25に示す分析結果を出力することによって、サイトA及びサイトBを含む全体のシステムとして、「低価格」や「人気」、「××」が最もトピックとして中心に述べられていることをユーザが容易に知ることができる。
なお、上記に示したESCを用いてトピックに特有な単語を抽出する方法は、例えば、特開平02−098775号公報(決定リストの生成方法及び装置登録)や、特開2001−266060号公報(アンケート回答分析システム)に記載されている。
次に、本発明の第5の実施例を図面を参照して説明する。なお、本実施例に示すマクロ情報生成システムは、本発明の第5の実施の形態で示したマクロ情報生成システムに相当する。本実施例では、マクロ情報生成システムは、サンプリングテキストデータを用いて、マクロ情報である各トピックに占めるサイト及びサイトに含まれるトピックを推測する。
図26は、マクロ情報生成システムの具体的な更に他の構成例を示すブロック図である。本実施例では、図24に示すセンタ装置の構成要素に加えて、センタ装置が、サンプリングテキストデータと学習した混合モデルとを用いてトピックの構成比を推測する構成推測手段を有する点で、第4の実施例と異なる。
構成推測手段は、センタ側で学習した混合モデルの各コンポーネントに対して、各サイト又は各サイトのコンポーネントのデータがどの程度グルーピングされたかを推測する。本実施例では、構成推測手段が推測する値を構成比(サイトに含まれるトピックの構成比)という。
構成比を求めるために、構成推測手段は、センタ側の学習手段が用いるEMアルゴリズムを用いて、各データが各コンポーネントに属しうる確率(以下、事後確率という)を求める。本実施例では、事後確率が最大となるコンポーネントにサンプリングデータがグルーピングされるものとする。この場合、構成推測手段は、事後確率を用いることによって、いずれのサイトのいずれのコンポーネントに原因となって、各サンプリングデータが発生したかか(いずれのコンポーネントに基づいてサンプリングデータを生成したか)を特定することが可能となる。よって、構成推測手段は、推測対象のサイト又はサイトのコンポーネントの情報を用いて、コンポーネントにグルーピングされたデータの構成を調べる(求める)ことができる。そのようにすることによって、マクロ情報の各トピックに対して、サイト又はサイトのトピックの構成比を知ることができる。
図27は、センタ側の各トピックについて、構成推測手段が求めるサイト又はサイトのトピックの構成比の例を示す説明図である。図27に示すように、センタ装置は、各トピックの構成比を含むテーブルを出力する。図27において、テーブルの列はセンタ側のトピックであり、行はサイト側のトピックである。また、表(テーブル)の各欄に示される数値は、トピックの構成比を示している。図27に示す分析結果では、トピックの構成比から、センタのトピック1は、サイトAのトピック2とサイトBのトピック1とで主に構成されていることが分かる。
次に、本発明の第6の実施例を図面を参照して説明する。なお、本実施例に示すマクロ情報生成システムは、本発明の第5の実施の形態で示したマクロ情報生成システムに相当する。また、本実施例において、マクロ情報生成システムの構成は、第5の実施例で示したマクロ情報生成システムの構成と同じである。本実施例では、マクロ情報生成システムは、各サイト側のトピックがセンタ側のどのトピックに対応するかを判断し、センタ側とサイト側とのトピックを対応付けた表(テーブル)を作成する。
本実施例では、構成推測手段は、あるサイトのあるトピックに基づいて生成したサンプリングデータがセンタ側の特定のトピックに最も多く属する等の情報を求める。すなわち、構成推測手段は、サイト側のあるトピックに基づくサンプルデータが、センタ側のいずれのトピックに最も多く属するかを特定する。また、構成推測手段は、最も多く属すると判断したセンタ側のトピックが、推測対象のサイトのトピックに対応していると判断する。
図28は、センタ側とサイト側とのトピックを対応付けたテーブルの例を示す説明図である。なお、図28に示すテーブルは、図25に示すデータに基づいて、構成推測手段が作成した対応表(テーブル)に相当する。図28において、テーブルの各欄に含まれる円で示されている情報が1つのトピックに相当する。また、図28において、テーブルの列は、センタ側のトピックに対応しているサイト側のトピックを示す。トピックを示す円の中には、第4の実施例と同様の処理に従って求めた特徴表現が含まれる。また、例えば、円の大きさを変化させて出力装置に出力することにより、第4の実施例と同様の処理に従って求めたトピックの活性度を示すこともできる。
次に、本発明の第7の実施例を説明する。なお、本実施例に示すマクロ情報生成システムは、本発明の第5の実施の形態で示したマクロ情報生成システムに相当する。また、本実施例において、マクロ情報生成システムの構成は、第5の実施例及び第6の実施例で示したマクロ情報生成システムの構成と同じである。
本実施例では、センタ装置は、求めた混合モデルの情報を、通信ネットワークを介してサイト装置に送信する。ここで、センタ装置は、例えば、センタでの確率分布が正規分布である場合、期待値(μ)や分散共分散行列(Σ)、混合比(π)、確率分布の種類(本例では、正規分布)、統合次元、トピックの特徴語リストを、サイト装置に送信する。そのようにすることにより、サイト側においても、システム全体におけるトピックを把握することができ、自らのサイトで蓄積するデータが精度の高いトピックであるか否かを知ることができる。
次に、本発明の第8の実施例を説明する。なお、本実施例に示すマクロ情報生成システムは、本発明の第5の実施の形態で示したマクロ情報生成システムに相当する。また、本実施例において、マクロ情報生成システムの構成は、第5の実施例から第7の実施例で示したマクロ情報生成システムの構成と同じである。本実施例では、マクロ情報生成システムを具体的なビジネスモデルに適用する場合を説明する。
本実施例では、サイトを企業等の顧客、及びセンタをサービス事業者とする。そして、顧客である企業は、サービス事業者であるセンタと、マクロ情報の配信サービスの提供を受けることについて予め契約を締結している。本実施例では、センタ装置が各サイト装置にマクロ情報である混合モデルを提供(配信)することによって、各サイトから代金(情報提供料)を徴収するビジネスモデルを提案する。
本実施例では、各サイト装置は、第7の実施例と同様の処理に従って集約情報を生成し、インターネット等の通信ネットワークを介してセンタ装置に送信する。また、センタ装置は、各サイト装置から受信した集約情報に基づいて、マクロ情報として混合モデルを生成する。そして、センタ装置は、所定期間毎に、求めたマクロ情報を、通信ネットワークを介して各サイト装置に配信する。また、例えば、センタ装置は、サイト装置からの要求に応じて、マクロ情報を、通信ネットワークを介してサイト装置に配信する。すなわち、本実施例では、第7の実施例と同様の処理に従ってセンタ側で推測した混合モデルを、各サイトに送信する。
マクロ情報である混合モデルは、1つのサイトが蓄積するデータのみに基づいて作成することができない情報であり、サイト側にとって分析精度のよいトピック群である。そのため、企業等のサイトにとって料金(情報提供料)を支払ってでも得たい情報である。上記の処理を行うことによって、センタは、複数のサイトから集約情報を集めさえすれば、各サイトに対してマクロ情報を生成し配信するマクロ情報分析サービスを提供する事業を行うことが可能となる。
次に、本発明の第9の実施例を説明する。なお、本実施例に示すマクロ情報生成システムは、本発明の第5の実施の形態で示したマクロ情報生成システムに相当する。また、本実施例において、マクロ情報生成システムの構成は、第5の実施例から第8の実施例で示したマクロ情報生成システムの構成と同じである。
第7の実施例では、センタ装置が、マクロ情報である混合モデルそのものをサイト装置に送信する場合を説明した。本実施例では、センタ装置は、マクロ情報である混合モデルそのものをサイト装置に送信するのでなく、サイトに関係の深いマクロ情報のトピック(そのサイトが蓄積するデータ中に含まれるトピック)を送信する。又は、センタ装置は、サイトに全く関係がないトピック(そのサイトが蓄積するデータ中に含まれないトピック)を送信する。
本実施例では、センタ装置は、第5の実施例と同様の処理に従ってトピックの構成比を推測する。また、センタ装置は、求めた構成比に基づいて、マクロ情報として求めたトピックについて、どの程度各サイトが算出に寄与しているかを示す寄与率を定量的に求める。そして、所定のの閾値を設けることにより、マクロ情報のトピックとサイトとの関係の有無をセンタ側で求めることができる。この場合、例えば、センタ装置は、求めた寄与率を所定の閾値より大きいか否かを判断し、所定の閾値より大きいと判断すると、マクロ情報のトピックがそのサイトに関係が深いと判断する。そのような処理を実行することによって、各サイトにとって関係の深いトピックのみ、又は関係がなかったトピックのみをサイト装置に送信することが可能となる。
次に、本発明の第10の実施例を説明する。なお、本実施例に示すマクロ情報生成システムは、本発明の第5の実施の形態で示したマクロ情報生成システムに相当する。また、本実施例において、マクロ情報生成システムの構成は、第5の実施例から第9の実施例で示したマクロ情報生成システムの構成と同じである。本実施例では、第8の実施例と同様に、マクロ情報生成システムを具体的なビジネスモデルに適用する場合を説明する。
本実施例では、サイトを企業等の顧客、及びセンタをサービス事業者とする。そして、顧客である企業は、サービス事業者であるセンタと、マクロ情報の配信サービスの提供を受けることについて予め契約を締結している。本実施例では、センタ装置が各サイト装置にマクロ情報中の一部のトピックを提供(配信)することによって、各サイトから代金(情報提供料)を徴収するビジネスモデルを提案する。
本実施例では、各サイト装置は、第9の実施例と同様の処理に従って集約情報を生成し、通信ネットワークを介してセンタ装置に送信する。また、センタ装置は、各サイト装置から受信した集約情報に基づいてマクロ情報を生成する。また、センタ装置は、第9の実施の形態と同様の処理に従って、マクロ情報中のトピックのうち、サイトと関係の深いトピック、又はサイトと関係のないトピックを抽出する。そして、センタ装置は、所定期間毎に、抽出したトピックを、通信ネットワークを介して各サイト装置に配信する。また、例えば、センタ装置は、サイト装置からの要求に応じて、抽出したトピックを、通信ネットワークを介してサイト装置に配信する。すなわち、本実施例では、第9の実施例と同様の処理に従って、サイトと関係が深いトピック又はサイトとあまり関係がないトピックを、サイトに送信することができる。
サイトと関係が深いトピックは、他のサイトの情報も含み、サイト側にとってより精度のよいトピックである。また、サイトとあまり関係がないトピックは、自らのサイトが蓄積するデータ中にはあまり見られないが、他サイトが蓄積するデータ中にはよく見られるトピックであり、企業等にとって有用である。
例えば、各サイトが同業者である企業であり、各サイトが蓄積するデータがそのサイトを運営する企業の活動報告書である場合を考える。この場合、自社にとってあまり関係のないトピックは自社では積極的に活用されていないが、同業の他社では積極的に活用されているトピックであることがある。このように他社で活用されている情報は、複数のライバル会社の活動を知る上で、企業にとって必要な情報である。従って、サイトに関係があるトピックも、サイトにあまり関係がないトピックもともに、企業等のサイトにとって料金(情報提供料)を支払ってでも得たい情報である。本実施例では、上記の処理を行うことによって、センタは、第8の実施例と同様に、各サイトに対してマクロ情報分析サービスを提供することができる。
次に、本発明の第11の実施例を説明する。なお、本実施例に示すマクロ情報生成システムは、本発明の第5の実施の形態で示したマクロ情報生成システムに相当する。また、本実施例において、マクロ情報生成システムの構成は、第7の実施例で示したマクロ情報生成システムの構成と同じである。
本実施例では、サイト装置によって蓄積データに所定のフラグが事前に付加されることによって、トピックについてフラグを用いた分析や、新規データに対してフラグを用いた予測を行う。例えば、サイト装置は、蓄積データが活動報告書である場合、プロジェクトが期日通りに達成できたか否かを示すフラグを付加する。また、例えば、サイト装置は、蓄積データがBLOGや掲示板の記事である場合、閲覧回数が多い人気がある記事か否かを示すフラグを付加する。この場合、例えば、サイト装置は、新規データ入力やデータ編集の際に、ユーザの操作に従って、新規データや編集データに所定のフラグを付加する。
本実施例では、センタ装置が、第7の実施例に示した処理に従って推測した混合モデルを、各サイト装置に予め送信している場合を想定する。また、各サイト装置は、予めセンタ装置から混合モデルを受信し、記憶装置に記憶している。
各サイト装置は、所定のタイミングで(例えば、所定期間毎に)、予め記憶する混合モデルに基づいて、蓄積する生データがセンタ側のいずれのトピックに属する否かを示す事後確率Wijを、式(3)を用いて調べる(求める)。
ここで、式(3)において、xjはサイトが蓄積するデータを示し、piはコンポーネントiの確率密度関数を示す。また、kはコンポーネント数を示し、θiはコンポーネントiのパラメータを示す。サイト装置は、式(3)を用いて各データの事後確率を求め、各データを事後確率が最大となるセンタ側のトピックにグルーピングする。
次に、サイト装置は、センタ側の各トピックに対して、トピックにグルーピングされたデータに付加されているフラグの数を数え上げる(求める)。そして、サイト装置は、求めたフラグ数を、通信ネットワークを介してセンタ装置に送信する。以上の処理が、センタ側でフラグに基づいた分析を行うための事前準備となる。
以上の処理を実行することにより、センタ装置は、各トピックについてフラグを用いた分析を行うことが可能となる。例えば、蓄積データが1企業の活動報告書であり、各サイト装置が同一企業内の事業部が管理するサーバである場合を考える。また、各サイト装置は、事業において十分な利益をえられたか否かを示すフラグを蓄積データに付加するものとする。この場合、センタ装置は、各サイト装置から受信するフラグ数に基づいて、海外向けのトピックにおいて十分な利益がえられたケースが多い旨を分析したり、PC販売のトピックにおいて利益がえられていない旨を分析したりすることが可能となる。
さらに、センタ装置は、サイトで入力された新規データが、センタ側のいずれのトピックに属するかを調べる(判断する)ことにより、フラグに基づいた予測を行うことも可能である。例えば、蓄積データが活動報告書であり、各サイト装置がプロジェクトの成否を示すフラグを蓄積データに付加する場合を考える。この場合、センタ装置は、各サイト装置から受信したフラグ数に基づいて判断することによって、過去の事例から新規テキストに示されるプロジェクトの成否予測を行うことが可能となる。また、例えば、蓄積データがBLOG記事であり、各サイト装置が人気記事であるか否かを示すフラグを蓄積データに付加する場合を考える。この場合、センタ装置は、各サイト装置から受信したフラグ数に基づいて判断することによって、過去の事例から新規記事に対しての人気予測を行うことが可能となる。
次に、本発明の第12の実施例を説明する。なお、本実施例に示すマクロ情報生成システムは、本発明の第5の実施の形態で示したマクロ情報生成システムに相当する。また、本実施例において、マクロ情報生成システムの構成は、第11の実施例で示したマクロ情報生成システムの構成と同じである。本実施例では、第8の実施例及び第10の実施例と同様に、マクロ情報生成システムを具体的なビジネスモデルに適用する場合を説明する。
本実施例では、センタ装置は、第11の実施例と同様の処理に従って、各サイト装置から受信したフラグに関する情報(フラグ数)を用いて、フラグに基づく予測を行えるものとする。本実施例では、サイトを企業等の顧客、及びセンタをサービス事業者とする。そして、顧客である企業は、サービス事業者であるセンタと、マクロ情報の配信サービスの提供を受けることについて予め契約を締結している。本実施例では、センタ装置が各サイト装置に予測結果を提供(配信)することによって、各サイトから代金(情報提供料)を徴収するビジネスモデルを提案する。
本実施例では、各サイト装置は、第11の実施例と同様の処理に従ってフラグ数を求め、通信ネットワークを介してセンタ装置に送信する。また、センタ装置は、第11の実施例と同様の処理に従って、各サイト装置から受信したフラグ数に基づいて予測処理を行う。そして、センタ装置は、所定期間毎に、求めた予測結果を、通信ネットワークを介して各サイト装置に配信する。また、例えば、センタ装置は、サイト装置からの要求に応じて、求めた予測結果を、通信ネットワークを介してサイト装置に配信する。
例えば、各サイトが同業種の企業である場合を考える。本実施例では、上記の処理を実行することによって、顧客である企業は、配信された予測結果の情報に基づいて、自社も含めた同業種の企業の過去事例から、プロジェクトの成否等の様々な予測を行うことができる。これらセンタ装置から配信される予測結果は、生データをセンタに集めなくても、マクロ情報を生成する本枠組みでのみ求めることが可能な情報であり、企業にとって十分価値のある情報である。本実施例では、上記の処理を行うことによって、センタは、第8の実施例及び第10の実施例と同様に、各サイトに対してマクロ情報分析サービスを提供することができる。
次に、本発明の第13の実施例を説明する。なお、本実施例に示すマクロ情報生成システムは、本発明の第5の実施の形態で示したマクロ情報生成システムに相当する。本実施例において、マクロ情報生成システムの構成は、第8の実施例で示したマクロ情報生成システムの構成と同じである。
本実施例では、センタ装置は、新規データに対して、全サイトが蓄積するデータのうち、その新規データに類似するデータを自動的に検索する。本実施例では、センタ装置は、第7の実施例に示した処理に従って推測した混合モデルを、各サイト装置に予め送信している場合を想定する。また、各サイト装置は、予めセンタ装置から混合モデルを受信し、記憶装置に記憶している。
まず、各サイト装置は、第8の実施例と同様の処理に従って、サイトが蓄積するデータを、マクロ情報であるトピックに従ってグルーピングしているものとする。そして、各サイト装置は、センタ装置にデータ自身(すなわち、サイトが蓄積する生データ)を送信することなく、いずれのトピックについてのデータを蓄積しているかの申告だけをセンタに行う。この場合、各サイト装置は、いずれのトピックについてのデータを蓄積しているかを示す申告情報を、通信ネットワークを介して予めセンタ装置に送信する。また、センタ装置は、各サイト装置から受信した申告情報を、サイト装置(例えば、サイト装置のIDやIPアドレス)に対応付けて予めデータベースに記憶している。本実施の形態では、通常、上記に示す事前準備の処理が完了しているものとする。
本実施例では、マクロ情報生成システムの利用シーンとして、以下のシーンを考える。例えば、あるサイトにおいて、新しく入手(入力)した新規データに類似するデータを、他の複数のサイトが蓄積するデータの中から検索したい旨の要求がある場合を考える。以下、この類似検索を要求するサイトを、類似検索依頼サイトという。
まず、類似検索依頼サイトのサイト装置は、第8の実施例と同様の処理に従って、記憶装置に記憶する混合モデルに基づいて、新規のデータがセンタ側のいずれのトピックに属するかを調べ特定する)。また、サイト装置は、センタ装置に、特定したトピックに関するデータ(類似するデータ)の検索依頼を、通信ネットワークを介して要求(送信)する。
次に、センタ装置は、類似検索依頼サイトから受信した検索要求(検索依頼)に基づいて、検索要求されたトピックに属するデータ(類似するデータ)をいずれのサイト装置が蓄積しているかを調べ特定する。この場合、センタ装置は、例えば、予めデータベースに蓄積する申告情報のうち、検索要求されたトピックを含む申告情報を選択する。また、センタ装置は、選択した申告情報に対応するサイトを、検索要求されたトピックに類似するデータを蓄積するサイトとして特定する。そして、センタ装置は、特定したサイト(検索要求された類似データを蓄積しているサイト)のサイト装置に、類似検索依頼サイトへの類似データの送信依頼を、通信ネットワークを介して送信する。
センタから送信依頼を受信したサイト(類似データを蓄積するサイト)は、閲覧を許可できる範囲内で、類似検索依頼サイトに情報を送信したり、リンク付けによって情報を開示する。この場合、サイト装置は、例えば、類似データの送信依頼とともに、送信先のサイト(類似検索依頼サイト)のアドレス情報をセンタ装置から受信する。そして、サイト装置は、受信したアドレス情報に従って、類似検索依頼サイトのサイト装置に、通信ネットワークを介して類似データを送信する。上記の処理を実行することによって、各サイト装置は、センタ装置に生データを送信しなくても、他のサイトが蓄積する情報について類似検索を行うことが可能となる。
次に、本発明の第14の実施例を図面を参照して説明する。なお、本実施例に示すマクロ情報生成システムは、本発明の第5の実施の形態で示したマクロ情報生成システムに相当する。また、本実施例において、マクロ情報生成システムの構成は、第13の実施例で示したマクロ情報生成システムの構成と同じである。本実施例では、第8の実施例、第10の実施例及び第12の実施例と同様に、マクロ情報生成システムを具体的なビジネスモデルに適用する場合を説明する。
本実施例では、各サイト装置及びセンタ装置は、第13の実施例と同様の処理に従って、全サイトが蓄積するデータの中から、検索対象のデータに類似するデータを自動的に検索できるものとする。本実施例では、サイトを企業等の顧客、及びセンタをサービス事業者とする。そして、顧客である企業は、サービス事業者であるセンタと、マクロ情報の配信サービスの提供を受けることについて予め契約を締結している。本実施例では、センタ装置が各サイト装置に代行して類似データの送信依頼を行う代行サービスを提供することによって、センタが各サイトから代金(仲介手数料)を徴収するビジネスモデルを提案する。
図29は、本実施例におけるビジネスモデルの適用概念を示す説明図である。本実施例では、類似検索依頼サイトのサイト装置は、第13の実施例と同様の処理に従って、類似データの検索依頼を、通信ネットワークを介してセンタ装置に送信する。センタ装置は、第13の実施例と同様の処理に従って、予めデータベースに記憶する申告情報に基づいて、類似データを蓄積するサイトを特定する。また、センタ装置は、特定したサイトのサイト装置に、類似検索依頼サイトへの類似データの送信依頼を、通信ネットワークを介して送信する。そして、送信依頼を受信したサイト装置は、類似検索依頼サイトのサイト装置に、通信ネットワークを介して類似データを送信する。
本実施例では、図29に示すように、類似検索依頼サイトは、センタに対して代金を支払う。また、センタは、類似検索依頼サイトから徴収した代金から、依頼代行サービスの提供に伴う一部代金(仲介手数料)を得る。また、センタは、仲介手数料を差し引いた残りの代金(情報提供料)を、類似データを提供した類似データ所有サイトに支払う。そのようにすることにより、各サイトに対して、他のサイトが蓄積するデータであっても、類似データを自動的に検索し取得できるサービスを提供することができる。また、類似データを提供するサイトにとっても、センタから代金(情報提供料)の支払いを受けることができる。本実施例では、上記の処理を行うことによって、センタは、第8の実施例、第10の実施例及び第12の実施例と同様に、各サイトに対してマクロ情報分析サービスを提供することができる。
次に、本発明の第15の実施例を説明する。なお、本実施例に示すマクロ情報生成システムは、本発明の第6の実施の形態で示したマクロ情報生成システムに相当する。本実施例では、サイトのパーソナルコンピュータの中央演算装置は、第9の実施例で示した構成要素のうち、次元枚挙手段を含まない。また、本実施例では、センタのパーソナルコンピュータの中央演算装置は、統合次元生成手段及び近似情報生成手段を含まない。また、本実施例では、センタの磁気ディスク記憶装置は、統合次元及び近似情報を記憶しない。
第1の実施例から第9の実施例では、センタ装置は、所定のサンプリング処理を行うことによって、サイトが蓄積するデータを再現した。本実施例では、センタ装置は、サンプリング処理を行うことなく、統合した確率分布に基づいて、マクロ情報となる確率分布を積分によって直接求める。例えば、センタ装置は、統合した確率分布に基づいて、所定の積分式を用いて、マクロ情報としての確率分布(マクロ分布)を求める。
集約情報統合手段が統合した確率分布(統合分布ともいう)を、p’(x|θ’)とする。集約情報統合手段が求める統合分布p’(x|θ’)は、各サイトが蓄積するデータの分布を、所定の表現方法で示したものに相当する。また、センタ装置が求めるべきマクロ情報を示す分布(マクロ分布)を、p(x|θ)とする。
センタ装置は、マクロ分布p(x|θ)におけるθの値を推測するために、2つの確率分布の分布間距離D(p’,p)が最小となるようにθを近づけていく。そのようにすることによって、センタ装置は、マクロ分布p(x|θ)を求めることが可能である。よって、センタ装置は、分布間距離D(p’,p)が最小となる場合のθの値を推定する。本実施例では、センタ装置は、分布間距離としてKL(Kullback Leibler)ダイバージェンスを、式(4)を用いて求める。
ここで、式(4)において、「∫p’(x|θ’)log p’(x|θ’)dx」は、θによらない定数である。そのため、分布間距離D(p’,p)を最小化する問題は、「∫p’(x|θ’)log p’(x|θ’)dx」を最大化するθを推定する問題に帰着する。よって、センタ装置は、「∫p’(x|θ’)log p’(x|θ’)dx」を、所定の積分技術を用いて求めることによって、容易にθを推定することができる。そして、センタ装置は、推定したθの値を用いて、マクロ分布p(x|θ)を求めることができる。
次に、本実施例の第16の実施例を説明する。なお、本実施例に示すマクロ情報生成システムは、本発明の第7の実施の形態で示したマクロ情報生成システムに相当する。本実施例では、サイトのパーソナルコンピュータの中央演算装置は、第14の実施例で示した構成要素に加えて、近似情報生成手段を有する。また、センタのパーソナルコンピュータの中央演算装置は、第14の実施例で示した構成要素のうち、集約情報統合手段、統合次元生成手段及び近似情報生成手段を含まない。また、本実施例では、センタの磁気ディスク記憶装置は、集約情報を記憶しない点で、第14の実施例と異なる。
第1の実施例から第9の実施例では、サイト装置がセンタ装置に確率分布や統計量等の集約情報を送信し、センタ装置が近似情報を生成する場合を説明した。本実施例では、サイト装置が近似情報を生成して、生成した近似情報をセンタ装置に送信する。そして、センタ装置は、サイト装置から受信した近似情報に基づいて、マクロ情報を生成する。
サイト装置の近似情報生成手段は、第1の実施例で示したセンタ装置の近似情報生成手段と同様の処理に従って、近似情報を生成する。例えば、集約情報が確率分布である場合、サイト装置は、所定のサンプリング技術を用いて近似情報を生成する。また、例えば、集約情報がデータベクトルの次元の値を総和した統計量である場合、サイト装置は、統計量をサイトのデータ数で除算して平均値を求める。そして、サイト装置は、求めた平均値に従ってランダムサンプリングをすることによって、近似情報を生成する。
近似情報は、生データそのものではなく、そのサイトの分布から生成した代表的なデータであるとみなすことができる。そのため、本実施例において、近似情報は、集約情報の一種とみなすことができる。よって、サイト装置からセンタ装置に近似情報を送信することによって、各サイト装置がセンタ装置に集約情報を送信さえすれば、センタ装置は、各サイト装置が蓄積する生データを再現することができる。また、各サイト装置がセンタ装置に集約情報を1回だけ送信すれば、センタ装置がマクロな情報を分析することができ、システムの外部に情報が漏洩する危険性を低減することができる。また、生成したマクロ情報を利用ユーザにとって分かりやすい価値のあるデータ形式に情報に変換して提示することができる。
なお、上記の各実施の形態及び各実施例で示したマクロ情報生成システムは、各種ビジネスモデルに適用できる。例えば、CRM(Customer Relationship Management)やナレッジマネジメント、BPM(Business Process Management )、BAM(Business Activity Monitoring)において、活動報告書や週報等の企業知識を分析した情報を配信する用途に適用できる。また、例えば、コンタクトセンタにおける顧客問い合わせデータを分析した情報を配信する用途に適用できる。また、例えば、BLOG(Weblog)やRSS(Rich Site Summary )、掲示板等のWEB上の記事を分析した情報を配信する用途に適用できる。
例えば、企業知識を分析する用途に用いる場合、第1の実施例から第16の実施例で示した処理を行うことにより、効果的な知識管理や活用を行えることが期待できる。また、例えば、各サイトが各部署であり、センタが企業の経営部門である場合を考える。この場合、第1の実施例から第6の実施例、第15の実施例、又は第16の実施例で示した処理を行うことにより、上位経営部門は、全社的に力を入れているトピックや、そのトピックに対して各事業部がどの程度力を注いでいるかを容易に把握することができる。
また、社内に分散した企業知識を統合するために、トピックを部署とみなして、社内で蓄積されているデータの蓄積構造を改編することも可能である。例えば、第7の実施例から第10の実施例で示した処理を行うことにより、各部署においても、全社的なトピックを容易に把握することができたり、少ないデータ量であっても精度の高いトピックを知ることができたりする。また、自らの部署が全社的なトピックに及ぼす影響力を知ることや、他の部署との相対的な比較を行うことも可能となる。
また、第11の実施例又は第12の実施例で示した処理を行うことにより、新規プロジェクトに対するコストや進捗具合を過去事例から予測する等、様々な予測を行うことが可能となる。また、第13の実施例又は第14の実施例で示した処理を行うことにより、他の部署の類似情報も閲覧することができる。そのため、自分とは異なる様々な視点をもつ人の考えを参照することができ、新たな知識の創出に大いに役立てられることが期待できる。また、サイトを顧客である一企業とし、センタを複数企業の情報を統合して分析を行うサービス事業者とすると、顧客である各企業にとって効果的な知識管理や活用を行うことが期待できる。
また、上記の各実施の形態及び各実施例で示したマクロ情報生成システムは、複数のリモートサイトに格納されている情報からマクロな情報を分析するビジネスモデルに適用できる。具体的には、第8の実施例、第10の実施例、第12の実施例又は第14の実施例で示した処理に従って、マクロ情報生成システムは、情報分析を行う。
例えば、一般に、サイト間や、サイトとセンタとの間で送受信されるデータのプライバシを保護することは難しく、現在、マクロな情報分析を行うビジネスモデルを実現することは難しい。しかし、上記の各実施の形態及び各実施例で示したマクロ情報生成システムは、各サイトからセンタに生データを直接送信することなく、またサイトに他のサイトの情報が送信されることなく、マクロ情報を生成することができる。そのため、サイト間、及びサイトとセンタとの間で送受信されるデータに対して、プライバシを保護することができる。よって、マクロな情報分析を行うという新たなビジネスモデルが実現でき、産業上大いに利用することが期待できる。
次に、本発明の第17の実施例を説明する。なお、本実施例に示すマクロ情報生成システムは、本発明の第5の実施の形態で示したマクロ情報生成システムに相当する。本実施例において、マクロ情報生成システムの構成は、第8の実施例で示したマクロ情報生成システムの構成と同じである。
本実施例では、センタ装置は、時間が経過するに従って更新又は新規生成されるデータ(例えば、テキストデータ)に対して、全時間帯で述べられている(出現する)共通トピック、ある特定期間内で述べられる(出現する)個別トピック、又は時間が経過するに従って新たに出現する新規トピックを発見する。例えば、センタ装置は、blog又は電子掲示板システムのデータや、定例会議の議事録等のデータに基づいて、トピックを抽出する。
本実施例では、まず、各サイト装置は、時間軸に従って更新又は新規生成されるデータのうち、ある一定期間内のデータを所有(蓄積)しているとする。次に、センタ装置は、第8の実施例と同様の処理に従って、サイトが蓄積するデータに基づいて、マクロ情報であるトピックや、各トピックを対応付けた表(テーブル)を生成する。また、サイト装置が顧客が使用する装置であり、センタ装置がサービス事業者が運営する装置である場合のように、サイトとセンタとの位置が異なる場合には、センタ装置は、各サイト装置に対して、通信ネットワークを介して、トピックや、各トピックを対応付けた表(テーブル)を含むマクロ情報を送信する。
サイトでトピックを対応付けた表が参照されると、センタ装置は、ある1つのマクロ情報であるトピックに対して、全サイト共通に対応付けられたトピックが存在する場合には、共通トピックを抽出する。また、センタ装置は、ある特定サイトのみに対応付けられたトピックが存在する場合には、個別トピックを抽出する。また、センタ装置は、サイトを時間軸に従って並べ替え、時間軸の途中からサイトに対応付けらたトピックが存在する場合には、新規トピックを抽出する。この場合、共通トピックを発見(抽出)することにより、そのデータに対して全時間帯常に述べられているトピックを、容易に知ることが可能になる。また、個別トピックを見つけることにより、他の期間では見られない一時的なトピックを、容易に知ることが可能になる。また、新規トピックを見つけることにより、その期間で述べられ始めたトピックを、容易に知ることが可能になる。
次に、本発明の第18の実施例を説明する。なお、本実施例に示すマクロ情報生成システムは、本発明の第5の形態で示したマクロ情報生成システムに相当する。また、本実施例において、マクロ情報生成システムの構成は、第8の実施例、第10の実施例、第12の実施例及び第14の実施例で示したマクロ情報生成システムの構成と同様である。また、本実施例では、マクロ情報生成システムを具体的なビジネスモデルに適用する場合を説明する。
本実施例では、各サイト装置及びセンタ装置は、第17の実施例と同様の処理に従って、時間軸に従って更新又は生成されるデータが、特定期間毎に各サイトに蓄積されているときの共通トピックや個別トピック、新規トピックを発見(抽出)するものとする。本実施例では、サイト装置が同一企業等の顧客が使用する装置であり、センタ装置がサービス事業者又はサイトと同一の顧客が運営する装置であるとする。センタがサービス事業者である場合、顧客である企業は、サービス事業者であるセンタと、マクロ情報の配信サービスの提供を受けることについて予め契約を締結している。本実施例では、センタ装置が分析したトピックや、対応付けたトピック表を含むマクロ情報を提供することによって、サイトから代金を徴収するビジネスモデルを提案する。
次に、本発明の第19の実施例を説明する。なお、本実施例に示すマクロ情報生成システムは、本発明の第5の実施の形態で示したマクロ情報生成システムに相当する。本実施例において、マクロ情報生成システムの構成は、第8の実施例で示したマクロ情報生成システムの構成と同じである。
本実施例では、センタ装置は、ある1つのサイトが所有(蓄積)するデータ(例えば、テキストデータ)に対して、そのデータに記述された内容や対象物の批評内容(評価)を示すデータ(評判情報ともいう)との比較を行う。
本実施例において、まず、ある1つのサイト装置は、1企業の1製品の広報データ等の比較対象となるデータを蓄積している。また、他のサイト装置は、比較対象データのblogや電子掲示板システムのデータから取得(例えば、抽出)した評判情報を蓄積している。例えば、各サイト装置は、評判情報をそれぞれデータ記憶部211,221に予め記憶している。次に、センタ装置は、第8の実施例と同様の処理に従って、サイトが蓄積するデータに基づいて、マクロ情報であるトピックや、各トピックを対応付けた表(対応テーブル)を生成する。例えば、センタ装置は、評判情報に対応するテキストデータと、そのテキストデータのデータ内容又は対象物との対応関係を示す対応テーブルを生成する。更に、センタ装置は、比較対象のデータを所有(蓄積)するサイト装置に対して、通信ネットワークを介して、トピックや、各トピックを対応付けた表(対応テーブル)を含むマクロ情報を送信する。
本実施例では、マクロ情報生成システムの利用シーンとして、以下のシーンを考える。例えば、あるサイトにおいて、販売している製品がどのように世間では評価されているのか、または販売側が考えている認識と一致しているのかという情報を得たい旨の要求がある場合を考える。以下、この評判の調査を要求するサイトを評判調査依頼サイトという。
まず、評判調査依頼サイトのサイト装置は、センタ装置に、特定製品の評判調査依頼を、通信ネットワークを介して要求(送信)する。次に、センタ装置は、評判調査依頼サイトから受信した評判調査依頼に基づいて、依頼製品の評判情報が記載されている情報を蓄積する複数のサイト装置を特定する。そして、センタ装置は、特定サイトに製品に関するトピック分析依頼要求を、通信ネットワークを介して、サイト装置に送信する。
センタからトピック分析依頼を受信したサイトのサイト装置は、トピック分析依頼要求を受信すると、記憶する評判情報に基づいて、蓄積するデータを分析する。本実施例では、サイト装置は、第8の実施例と同様の処理に従って、サイトで情報(評判情報を含む)を集約し、センタ装置に集約情報を送信する。集約情報を受信したセンタ装置は、第8の実施例と同様の処理に従って、評判調査依頼サイト及び評判情報をもつ(蓄積する)特定サイトからの集約情報に基づいて、トピック、及びトピックを対応付けた表(対応テーブル)を含むマクロ情報を生成する。そして、センタ装置は、その生成したマクロ情報を評判調査依頼サイトのサイト装置に送信する。
上記の処理を実行することによって、評判調査依頼サイトのサイト装置は、センタ装置に生データを送信しなくても、トピック対応表から、評判調査依頼サイトと世間との製品に対する認識の違いを把握することができる。また、性能やコスト等のトピック毎に評判情報が整理されることによって、評判調査依頼サイトと世間との製品に対する認識の違いを容易に理解することができる。
次に、本発明の第20の実施例を説明する。なお、本実施例に示すマクロ情報生成システムは、本発明の第5の形態で示したマクロ情報生成システムに相当する。また、本実施例において、マクロ情報生成システムの構成は、第8の実施例、第10の実施例、第12の実施例、第14の実施例及び第18の実施例で示したマクロ情報生成システムの構成と同様である。また、本実施例では、マクロ情報生成システムを具体的なビジネスモデルに適用する場合を説明する。
本実施例では、各サイト装置及びセンタ装置は、第19の実施例と同様の処理に従って、ある1つのサイトが所有する(蓄積する)データに対して、そのデータに記述された内容や対象物を批評したデータとの比較を行う。本実施例では、ある1つのサイトを企業等の顧客とし、他のサイトを評判情報が掲載された情報源を所有する企業とする。また、センタをサービス事業者とする。顧客である企業は、サービス事業者であるセンタと、マクロ情報の配信サービスの提供を受けることについて予め契約を締結している。本実施例では、センタ装置が分析したトピックや、対応付けたトピック表を含むマクロ情報を提供することによって、顧客であるサイトから代金を徴収するとともに、評判情報を所有するサイトにも顧客から徴収した代金の一部(例えば、情報提供料)を支払うビジネスモデルを提案する。そのようにすることによって、評判情報を所有するサイトにとっても、所有データの分析により代金が得られ、利得を得ることができる。
次に、本発明の第21の実施例を図面を参照して説明する。なお、本実施例に示すマクロ情報生成システムは、本発明の第9の実施の形態で示したマクロ情報生成システムに相当する。また、本実施例において、マクロ情報生成システムの構成は、第6の実施例で示したマクロ情報生成システムの構成と同じである。本実施例では、マクロ情報生成システムは、各サイト側のトピックやセンタ側のトピックに対して、技術領域や製品名等の名前を対応付けた辞書を利用して、更にわかりやすいラベルを付与する。
図30は、マクロ情報生成システムの具体的な更に他の構成例を示すブロック図である。本実施例では、図26に示すセンタ装置の構成要素に加えて、センタ装置が、把握しやすいラベルをトピックに付与するためのドメイン辞書及びラベリング手段を有する点で、第6の実施例と異なる。
本実施例では、ドメイン辞書は、製品や技術等の主に固有名詞で表現された名前と、それら製品や技術が属する技術領域等のドメインとを対応付けて含む。例えば、このようなドメイン辞書は、Web等の外部情報源から入手した情報に基づいて、予め人手によって(例えば、センタ装置の管理者によって)作成される。また、ラベリング手段は、まず、センタ側及びサイト側のトピックに属するサンプリングデータや特徴語等の情報から、製品や技術等の名前を抽出する。また、ラベリング手段は、その抽出した名前がどのような技術ドメインに属しているかを、ドメイン辞書を用いて調べる。そして、ラベリング手段は、特定した技術ドメインをラベルとしてトピックに付与する。
トピックへの技術ドメイン付与方法として、例えば、最も多く出現した技術ドメインをトピックのラベルとして選択する方法がある。そのようにすることにより、特定トピックがどのような話題について述べられたトピックであるのかを、利用ユーザが把握しやすい形式(技術ドメインという形式)で、ラベルとして付与することができる。
図31は、トピックのラベリングの例を示す説明図である。図31において、表61は、トピック1及びトピック2それぞれに属する記事を示す。また、図31に示すように、ドメイン辞書62は、製品や技術等の名前(図31のドメイン辞書62内の表の左欄)と、それら製品や技術の名前のドメイン名(ドメイン辞書62内の表の右欄)とを含む。
図31に示す例において、ラベリング手段は、各トピックの記事内の製品や技術等の名前を抽出する。また、ラベリング手段は、ドメイン辞書62を用いて、製品名や技術名に対応して出現するドメイン回数をカウントし、最も多く含まれた(カウント数が最も多くなった)ドメイン名をトピックにラベリングする。すると、図31のラベリング結果63に示すように、トピック1には「プロバイダ」というラベルが付与され、トピック2には「データベース」というラベルが付与される。
次に、本発明の第22の実施例を説明する。なお、本実施例に示すマクロ情報生成システムは、本発明の第10の実施の形態で示したマクロ情報生成システムに相当する。また、本実施例において、マクロ情報生成システムの構成は、第21の実施例で示したマクロ情報生成システムの構成と同じである。本実施例では、マクロ情報生成システムは、各サイトの強みや弱み等を分析する競合分析を支援するためのレーダーチャート等のグラフを生成する。
図32は、マクロ情報生成システムの具体的な更に他の構成例を示すブロック図である。本実施例では、図30に示すセンタ装置の構成要素に加えて、センタ装置が、各サイトの競合分析を支援するためのレーダーチャート等のグラフを生成する競合分析手段を有する点で、第21の実施例と異なる。
本実施例では、競合分析手段は、構成推測手段が求めたセンタ側のトピックに対するサイトの寄与率に基づいて、センタ側のトピックを軸とするレーダーチャート等のグラフを生成する。例えば、競合分析手段は、マクロ情報の算出に最も寄与したサイトを示す点を、レーダーチャートの軸の最大値の位置にプロットし、他のサイトを示す点を、その最大値をもつサイトとの相対比から求めた値の位置にプロットする。また、競合分析手段は、軸のラベルとして、例えば、ラベリング手段が生成した技術ドメインを付与する。
上記のようにすることによって、サイトが同業種の企業であれば、各会社(企業)は、特定の技術ドメインに対して、どの企業がデータを多く所有しているかという量の観点から、各企業のその技術領域の強弱を知ることができる。従って、各企業による競合分析の手助けとなる。例えば、サイトに蓄積されるデータが企業の所有する特許情報であれば、特定技術ドメインに対して、どの企業が業界内で多く特許を出願しているか等を示す特許マップを自動的に作成することが可能となる。
図33は、センタトピックのサイト構成比に基づいて、レーダーチャートを自動生成して出力した出力例を示す説明図である。図33において、棒グラフ71は、センタトピックの各サイトの寄与率に基づいて求めた構成比を示するグラフである。この棒グラフ71は、図32に示す構成推測手段及びラベリング手段によって生成されたものである。図33に示す例では、トピック1には「検索エンジン・ブロードバンドサービス」というラベルが付与され、トピック2には「システム開発」というラベルが付与されている。
競合分析手段は、図33の棒グラフに示す各トピックをレーダーチャートの各軸として、図33に示すレーダーチャート72を自動生成する。この場合、競合分析手段は、レーダーチャート72への値の入力方法として、最も寄与したサイトを軸の最大値にプロットし、他のサイトをその最大値をもつサイトとの相対比に基づいてプロットする。そのようにすることによって、図33に示す例では、例えば、B社及びC社がA社及びD社に比べてデータベース関連のデータを多く所有(蓄積)していることがわかり、B社及びC社がトピック「データベース」に強いことがわかる。
本発明は、複数のサイトが蓄積するデータに基づいて、確率分布等のマクロ情報を生成する用途に適用できる。特に、本発明は、センタ装置が生成したマクロ情報を、各サイト装置に配信するマクロ情報配信サービスを提供するビジネスモデルの用途に適用できる。
3,21,22 データ処理記憶装置
4 出力装置
11,12 入力装置
20A,20B サイト装置
30 センタ装置
31 集約情報記録部
32 集約情報統合手段
33 近似情報生成手段
34 近似情報記憶部
35 分析手段
211,221 データ記憶部
212,222 集約手段
4 出力装置
11,12 入力装置
20A,20B サイト装置
30 センタ装置
31 集約情報記録部
32 集約情報統合手段
33 近似情報生成手段
34 近似情報記憶部
35 分析手段
211,221 データ記憶部
212,222 集約手段
Claims (38)
- データを蓄積する複数のデータ蓄積装置と、
前記各データ蓄積装置が蓄積するデータを処理するデータ処理装置とを備え、
前記データ蓄積装置は、
蓄積するデータを所定の方法で集約した集約情報を生成する集約情報生成手段と、
前記集約情報生成手段が生成した集約情報を、通信ネットワークを介して前記データ処理装置に送信する集約情報送信手段とを含み、
前記データ処理装置は、
前記各データ蓄積装置から受信した集約情報に基づいて、前記各データ蓄積装置が蓄積するデータの内容を再現した再現データを生成するデータ再現手段と、
前記データ再現手段が生成した再現データを分析し、前記各データ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を生成するマクロ情報生成手段とを含む
ことを特徴とするマクロ情報生成システム。 - データ処理装置は、各データ蓄積装置から受信した集約情報を統合した統合集約情報を生成する集約情報統合手段を含み、
データ再現手段は、前記集約情報統合手段が生成した統合集約情報に基づいて、再現データを生成する
請求項1記載のマクロ情報生成システム。 - マクロ情報生成手段は、各データ蓄積装置から受信した集約情報をサンプリングすることによって、再現データとしてサンプリングデータを生成する請求項1又は請求項2記載のマクロ情報生成システム。
- データ蓄積装置は、
蓄積するデータの次元を示す次元情報を生成する次元情報生成手段と、
前記次元情報生成手段が生成した次元情報を、通信ネットワークを介してデータ処理装置に送信する次元情報送信手段とを含み、
前記データ処理装置は、各データ蓄積装置から受信した次元情報を統合した統合次元情報を生成する次元情報統合手段を含み、
データ再現手段は、前記各データ蓄積装置から受信した集約情報と、前記次元情報統合手段が生成した統合次元情報とに基づいて、再現データを生成する
請求項1から請求項3のうちのいずれか1項に記載のマクロ情報生成システム。 - データ処理装置は、所定の単語辞書を記憶する辞書記憶手段を含み、
次元情報統合手段は、前記辞書記憶手段が記憶する単語辞書に基づいて、各データ蓄積装置から受信した次元情報に含まれる各単語の対応関係を示す対応ルールを、統合次元情報として生成する
請求項4記載のマクロ情報生成システム。 - マクロ情報生成手段は、マクロ情報として、各データ蓄積装置が蓄積するデータに含まれる情報要素が前記データ中に出現する確率分布であるマクロ分布を求める請求項1から請求項5のうちのいずれか1項に記載のマクロ情報生成システム。
- データ処理装置は、マクロ情報生成手段が生成したマクロ分布を、所定のデータ形式に変換するデータ変換手段を含む請求項6記載のマクロ情報生成システム。
- データ変換手段は、各データ蓄積装置が蓄積するデータに含まれるトピック毎の活性度又は特徴的な単語を抽出することによって、マクロ情報生成手段が生成したマクロ分布を所定のデータ形式に変換する請求項7記載のマクロ情報生成システム。
- データ変換手段は、所定の抽出条件に従って、マクロ情報生成手段が生成したマクロ分布から部分情報を抽出し、抽出した前記部分情報を所定のデータ形式に変換する請求項7又は8記載のマクロ情報生成システム。
- データ処理装置は、マクロ情報生成手段が生成したマクロ分布と、データ変換手段が抽出した部分情報との対応関係を示す情報を求める対応関係算出手段を含む請求項7から請求項9のうちのいずれか1項に記載のマクロ情報生成システム。
- データ処理装置は、
情報と技術ドメインとを対応付けた辞書であるドメイン辞書を記憶するドメイン辞書記憶手段と、
前記ドメイン辞書記憶手段が記憶するドメイン辞書に基づいて、所定のラベリング処理を行うラベリング処理手段とを含む
請求項10記載のマクロ情報生成システム。 - データ変換手段は、所定の抽出条件に従って、マクロ情報生成手段が生成したマクロ分布から部分情報を抽出し、
ラベリング処理手段は、前記ドメイン辞書記憶手段が記憶するドメイン辞書に基づいて、前記データ変換手段が抽出した部分情報に所定のラベル情報を付与する
請求項11記載のマクロ情報生成システム。 - ラベリング処理手段は、部分情報に対応する技術ドメインをドメイン辞書から抽出し、抽出した技術ドメインをラベル情報として前記部分情報に付与する請求項12記載のマクロ情報生成システム。
- データ処理装置は、各データ蓄積装置が蓄積するデータを比較して表示するためのグラフを生成するグラフ生成手段を含む請求項11から請求項13のうちのいずれか1項に記載のマクロ情報生成システム。
- グラフ生成手段は、データ蓄積装置側のトピックとデータ処理装置側のトピックとの構成比を用いて、競合分析を行うためのレーダーチャートを生成する請求項14記載のマクロ情報生成システム。
- 集約情報生成手段は、集約情報として、データ蓄積装置が蓄積するデータに含まれる情報要素が前記データ中に出現する確率分布、又は前記データ蓄積装置が蓄積するデータの次元に基づく統計量を求める請求項1から請求項15のうちのいずれか1項に記載のマクロ情報生成システム。
- データ処理装置は、時系列のテキストデータに基づいて、全時間帯に共通して出現する共通トピック、特定期間に出現する個別トピック、又は新たに出現する新規トピックを抽出するトピック抽出手段を含む請求項1から請求項16のうちのいずれか1項に記載のマクロ情報生成システム。
- データ蓄積装置は、
テキストデータのデータ内容又は対象物の評価を示す評価情報を記憶する評価情報記憶手段と、
前記評価情報記憶手段が記憶する評価情報を、通信ネットワークを介してデータ処理装置に送信する評価情報送信手段とを含み、
データ処理装置は、データ蓄積装置から受信した評価情報に対応するテキストデータと、前記テキストデータのデータ内容又は対象物との対応関係を示す対応情報を生成する対応情報生成手段を含む
請求項1から請求項17のうちのいずれか1項に記載のマクロ情報生成システム。 - データを蓄積する複数のデータ蓄積装置と、
前記各データ蓄積装置が蓄積するデータを処理するデータ処理装置とを備え、
前記データ蓄積装置は、
蓄積するデータを所定の方法で集約した集約情報を生成する集約情報生成手段と、
前記集約情報生成手段が生成した集約情報を、通信ネットワークを介して前記データ処理装置に送信する集約情報送信手段とを含み、
前記データ処理装置は、
各データ蓄積装置から受信した集約情報を統合した統合集約情報を生成する集約情報統合手段と、
前記集約情報統合手段が生成した統合集約情報に基づいて、前記各データ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を生成するマクロ情報生成手段とを含む
ことを特徴とするマクロ情報生成システム。 - データ蓄積装置は、
蓄積するデータの次元を示す次元情報を生成する次元情報生成手段と、
前記次元情報生成手段が生成した次元情報を、通信ネットワークを介してデータ処理装置に送信する次元情報送信手段とを含み、
前記データ処理装置は、各データ蓄積装置から受信した次元情報を統合した統合次元情報を生成する次元情報統合手段を含み、
データ再現手段は、集約情報統合手段が生成した統合集約情報と、前記次元情報統合手段が生成した統合次元情報とに基づいて、再現データを生成する
請求項19記載のマクロ情報生成システム。 - データを蓄積する複数のデータ蓄積装置と、
前記各データ蓄積装置が蓄積するデータを処理するデータ処理装置とを備え、
前記データ蓄積装置は、
蓄積するデータを所定の方法で集約した集約情報を生成する集約情報生成手段と、
前記集約情報生成手段が生成した集約情報に基づいて、前記データ蓄積装置が蓄積するデータの内容を再現した再現データを生成するデータ再現手段と、
前記データ再現手段が生成した再現データを、通信ネットワークを介して前記データ処理装置に送信する再現データ送信手段とを含み、
前記データ処理装置は、前記データ蓄積装置から受信した再現データを分析し、前記各データ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を生成するマクロ情報生成手段を含む
ことを特徴とするマクロ情報生成システム。 - データを蓄積する複数のデータ蓄積装置と、
前記各データ蓄積装置が蓄積するデータを処理するデータ処理装置とを備え、
前記データ蓄積装置は、
蓄積するデータを所定の方法で集約した集約情報を生成する集約情報生成手段と、
前記集約情報生成手段が生成した集約情報を、通信ネットワークを介して前記データ処理装置に送信する集約情報送信手段とを含み、
前記データ処理装置は、
前記各データ蓄積装置から受信した集約情報に基づいて、前記各データ蓄積装置が蓄積するデータの内容を再現した再現データを生成するデータ再現手段と、
前記データ再現手段が生成した再現データを分析し、前記各データ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を生成するマクロ情報生成手段と、
前記マクロ情報生成手段が生成したマクロ情報を、通信ネットワークを介して前記データ蓄積装置に送信するマクロ情報配信手段とを含む
ことを特徴とするマクロ情報配信システム。 - データ処理装置は、所定の抽出条件に従って、マクロ情報生成手段が生成したマクロ情報に含まれるトピックを抽出するトピック抽出手段を含み、
マクロ情報配信手段は、前記トピック抽出手段が抽出したトピックを、通信ネットワークを介してデータ蓄積装置に送信する
請求項22記載のマクロ情報配信システム。 - トピック抽出手段は、時系列のテキストデータに基づいて、全時間帯に共通して出現する共通トピック、特定期間に出現する個別トピック、又は新たに出現する新規トピックを抽出する請求項23記載のマクロ情報配信システム。
- データ蓄積装置は、蓄積するデータに所定のフラグを付加するフラグ付加手段を含み、
集約情報生成手段は、集約情報として、前記データ蓄積装置が蓄積するデータに付加されているフラグ数を求め、
マクロ情報生成手段は、前記データ蓄積装置から受信したフラグ数に基づいた所定の予測処理を行うことによって、マクロ情報を生成する
請求項22記載のマクロ情報配信システム。 - データ蓄積装置は、
当該データ蓄積装置がいずれのトピックについてのデータを蓄積しているかを示す申告情報を、通信ネットワークを介してデータ処理装置に送信する申告情報送信手段と、
当該データ蓄積装置が蓄積するデータに類似する類似データの検索要求を、通信ネットワークを介して前記データ処理装置に送信する検索要求送信手段とを含み、
データ処理装置は、
各データ蓄積装置から受信した申告情報を、データ蓄積装置に対応付けて記憶する申告情報記憶手段と、
データ蓄積装置から検索要求を受信すると、前記申告情報記憶手段が記憶する申告情報に基づいて、検索要求された類似データを蓄積するデータ蓄積装置を特定する蓄積装置特定手段と、
前記蓄積装置特定手段が特定したデータ蓄積装置に、検索要求を受信したデータ蓄積装置への類似データの送信依頼を、通信ネットワークを介して送信するデータ送信依頼手段とを含む
請求項22記載のマクロ情報配信システム。 - データ蓄積装置は、
テキストデータのデータ内容又は対象物の評価を示す評価情報を記憶する評価情報記憶手段と、
前記評価情報記憶手段が記憶する評価情報を、通信ネットワークを介してデータ処理装置に送信する評価情報送信手段とを含み、
データ処理装置は、データ蓄積装置から受信した評価情報に対応するテキストデータと、前記テキストデータのデータ内容又は対象物との対応関係を示す対応情報を生成する対応情報生成手段を含み、
マクロ情報配信手段は、前記対応情報生成手段が生成した対応情報を、通信ネットワークを介してデータ蓄積装置に送信する
請求項22記載のマクロ情報配信システム。 - データを蓄積する複数のデータ蓄積装置から、前記データ蓄積装置が蓄積するデータを所定の方法で集約した集約情報を、通信ネットワークを介して受信する集約情報受信手段と、
前記集約情報受信手段が受信した集約情報に基づいて、前記各データ蓄積装置が蓄積するデータの内容を再現した再現データを生成するデータ再現手段と、
前記データ再現手段が生成した再現データを分析し、前記各データ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を生成するマクロ情報生成手段とを
備えたことを特徴とするマクロ情報生成装置。 - 集約情報受信手段が受信した集約情報を統合した統合集約情報を生成する集約情報統合手段を備え、
データ再現手段は、前記集約情報統合手段が生成した統合集約情報に基づいて、再現データを生成する
請求項28記載のマクロ情報生成装置。 - データ蓄積装置が蓄積するデータの次元を示す次元情報を、通信ネットワークを介して各データ蓄積装置から受信する次元情報受信手段と、
前記次元情報受信手段が受信した次元情報を統合した統合次元情報を生成する次元情報統合手段とを備え、
データ再現手段は、集約情報受信手段が受信した集約情報と、前記次元情報統合手段が生成した統合次元情報とに基づいて、再現データを生成する
請求項28又は請求項29記載のマクロ情報生成装置。 - データを蓄積する複数のデータ蓄積装置から、前記データ蓄積装置が蓄積するデータを所定の方法で集約した集約情報を、通信ネットワークを介して受信する集約情報受信手段と、
前記集約情報受信手段が受信した集約情報に基づいて、前記各データ蓄積装置が蓄積するデータの内容を再現した再現データを生成するデータ再現手段と、
前記データ再現手段が生成した再現データを分析し、前記各データ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を生成するマクロ情報生成手段と、
前記マクロ情報生成手段が生成したマクロ情報を、通信ネットワークを介して前記データ蓄積装置に送信するマクロ情報配信手段とを
備えたことを特徴とするマクロ情報配信装置。 - 複数のデータ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を生成するマクロ情報生成システムにおけるデータ蓄積装置であって、
蓄積するデータを所定の方法で集約した集約情報を生成する集約情報生成手段と、
前記集約情報生成手段が生成した集約情報に基づいて、前記データ蓄積装置が蓄積するデータの内容を再現した再現データを生成するデータ再現手段と、
前記データ再現手段が生成した再現データを、各データ蓄積装置が蓄積するデータを処理するデータ処理装置に、通信ネットワークを介して送信する再現データ送信手段とを
備えたことを特徴とするデータ蓄積装置。 - データを蓄積する複数のデータ蓄積装置が、蓄積するデータを所定の方法で集約した集約情報を生成するステップと、
前記各データ蓄積装置が、前記各データ蓄積装置が蓄積するデータを処理するデータ処理装置に、生成した前記集約情報を、通信ネットワークを介して送信するステップと、
前記データ処理装置が、前記各データ蓄積装置から受信した集約情報に基づいて、前記各データ蓄積装置が蓄積するデータの内容を再現した再現データを生成するステップと、
前記データ処理装置が、生成した前記再現データを分析し、前記各データ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を生成するステップとを
含むことを特徴とするマクロ情報生成方法。 - 複数のデータ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を生成するためのマクロ情報生成プログラムであって、
コンピュータに、
データを蓄積する複数のデータ蓄積装置から、前記データ蓄積装置が蓄積するデータを所定の方法で集約した集約情報を、通信ネットワークを介して受信する集約情報受信処理と、
受信した前記集約情報に基づいて、前記各データ蓄積装置が蓄積するデータの内容を再現した再現データを生成するデータ再現処理と、
生成した前記再現データを分析しマクロ情報を生成するマクロ情報生成処理とを
実行させるマクロ情報生成プログラム。 - コンピュータに、
各データ蓄積装置から受信した集約情報を統合した統合集約情報を生成する集約情報統合処理を実行させ、
データ再現処理で、生成した前記統合集約情報に基づいて、再現データを生成する処理を実行させる
請求項34記載のマクロ情報生成プログラム。 - コンピュータに、
データ蓄積装置が蓄積するデータの次元を示す次元情報を、通信ネットワークを介して各データ蓄積装置から受信する次元情報受信処理と、
各データ蓄積装置から受信した次元情報を統合した統合次元情報を生成する次元情報統合処理とを実行させ、
データ再現処理で、データ蓄積装置から受信した集約情報と、生成した前記統合次元情報とに基づいて、再現データを生成する処理を実行させる
請求項34又は請求項35記載のマクロ情報生成プログラム。 - 複数のデータ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を配信するためのマクロ情報配信プログラムであって、
コンピュータに、
データを蓄積する複数のデータ蓄積装置から、前記データ蓄積装置が蓄積するデータを所定の方法で集約した集約情報を、通信ネットワークを介して受信する集約情報受信処理と、
各データ蓄積装置から受信した集約情報に基づいて、前記各データ蓄積装置が蓄積するデータの内容を再現した再現データを生成するデータ再現処理と、
生成した前記再現データを分析しマクロ情報を生成するマクロ情報生成処理と、
生成した前記マクロ情報を、通信ネットワークを介して前記データ蓄積装置に送信するマクロ情報配信処理とを
実行させるマクロ情報配信プログラム。 - 複数のデータ蓄積装置が蓄積するデータを巨視的に統合した情報であるマクロ情報を生成するマクロ情報生成システムにおける、データ蓄積装置が蓄積データを処理する蓄積データ処理プログラムであって、
データを蓄積するデータ蓄積手段を備えたコンピュータに、
前記データ蓄積手段が蓄積するデータを所定の方法で集約した集約情報を生成する集約情報生成処理と、
生成した前記集約情報に基づいて、前記データ蓄積手段が蓄積するデータの内容を再現した再現データを生成するデータ再現処理と、
生成した前記再現データを、各データ蓄積装置が蓄積するデータを処理するデータ処理装置に、通信ネットワークを介して送信する再現データ送信処理とを
実行させる蓄積データ処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005348322A JP2007073024A (ja) | 2005-08-11 | 2005-12-01 | マクロ情報生成システム、マクロ情報生成装置、マクロ情報生成方法及びマクロ情報生成プログラム |
US11/500,937 US20070094384A1 (en) | 2005-08-11 | 2006-08-09 | Macro information generation system, macro information generation device, macro information generation method and macro information generation program |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005233638 | 2005-08-11 | ||
JP2005348322A JP2007073024A (ja) | 2005-08-11 | 2005-12-01 | マクロ情報生成システム、マクロ情報生成装置、マクロ情報生成方法及びマクロ情報生成プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007073024A true JP2007073024A (ja) | 2007-03-22 |
Family
ID=37934382
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005348322A Pending JP2007073024A (ja) | 2005-08-11 | 2005-12-01 | マクロ情報生成システム、マクロ情報生成装置、マクロ情報生成方法及びマクロ情報生成プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20070094384A1 (ja) |
JP (1) | JP2007073024A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009026307A (ja) * | 2007-06-28 | 2009-02-05 | Nec (China) Co Ltd | 交通情報処理装置および方法、交通情報統合装置および方法 |
WO2009116342A1 (ja) * | 2008-03-18 | 2009-09-24 | 日本電気株式会社 | 動的トピック分析システム、動的トピック分析方法および動的トピック分析プログラムを記録した媒体 |
JP2013003413A (ja) * | 2011-06-17 | 2013-01-07 | Nippon Telegr & Teleph Corp <Ntt> | 会話データ解析装置、方法、及びプログラム |
JP2014016922A (ja) * | 2012-07-11 | 2014-01-30 | Kddi Corp | アイテム推薦システム、アイテム推薦方法およびプログラム |
JP2018061091A (ja) * | 2016-10-03 | 2018-04-12 | 株式会社Preferred Networks | データ圧縮装置、データ再現装置、データ圧縮方法、データ再現方法及びデータ転送方法 |
JP2019168820A (ja) * | 2018-03-22 | 2019-10-03 | 株式会社日立製作所 | データ分析支援システムおよびデータ分析支援方法 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8566439B2 (en) * | 2007-10-01 | 2013-10-22 | Ebay Inc | Method and system for intelligent request refusal in response to a network deficiency detection |
US8745142B2 (en) * | 2008-03-07 | 2014-06-03 | Aspect Software, Inc. | Method and system for publishing ACD specific data |
US8745637B2 (en) * | 2009-11-20 | 2014-06-03 | International Business Machines Corporation | Middleware for extracting aggregation statistics to enable light-weight management planners |
US8918399B2 (en) * | 2010-03-03 | 2014-12-23 | Ca, Inc. | Emerging topic discovery |
JP5589685B2 (ja) * | 2010-09-06 | 2014-09-17 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
JP5804492B2 (ja) * | 2011-03-29 | 2015-11-04 | 日本電気株式会社 | リスク管理装置 |
US9430529B2 (en) * | 2011-11-30 | 2016-08-30 | Microsoft Technology Licensing, Llc | Techniques for incrementally updating aggregation of states |
WO2016122513A1 (en) | 2015-01-29 | 2016-08-04 | Hewlett Packard Enterprise Development Lp | Data analytics on encrypted data elements |
US9722957B2 (en) * | 2015-05-04 | 2017-08-01 | Conduent Business Services, Llc | Method and system for assisting contact center agents in composing electronic mail replies |
US10621602B2 (en) * | 2015-09-22 | 2020-04-14 | Adobe Inc. | Reinforcement machine learning for personalized intelligent alerting |
US10282456B2 (en) * | 2015-10-01 | 2019-05-07 | Avaya Inc. | Managing contact center metrics |
US11823013B2 (en) * | 2017-08-29 | 2023-11-21 | International Business Machines Corporation | Text data representation learning using random document embedding |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0934721A (ja) * | 1995-07-21 | 1997-02-07 | Hitachi Ltd | データ分析装置 |
JPH10171772A (ja) * | 1996-12-10 | 1998-06-26 | Nec Corp | 分散的パラメータ推定方式 |
JP2004102537A (ja) * | 2002-09-06 | 2004-04-02 | Nec Corp | 協調推定方法、協調推定装置、および協調推定プログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4155363B2 (ja) * | 1997-06-19 | 2008-09-24 | 富士通株式会社 | データ表示装置、データ表示方法、およびデータ表示用プログラムを記録した記録媒体 |
US7539677B1 (en) * | 2000-10-09 | 2009-05-26 | Battelle Memorial Institute | Sequential pattern data mining and visualization |
EP1728138A1 (en) * | 2004-03-16 | 2006-12-06 | Grid Analytics Llc | System and method for aggregation and analysis of information from multiple disparate sources while assuring source and record anonymity using an exchange hub |
US20060005121A1 (en) * | 2004-06-30 | 2006-01-05 | Microsoft Corporation | Discretization of dimension attributes using data mining techniques |
-
2005
- 2005-12-01 JP JP2005348322A patent/JP2007073024A/ja active Pending
-
2006
- 2006-08-09 US US11/500,937 patent/US20070094384A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0934721A (ja) * | 1995-07-21 | 1997-02-07 | Hitachi Ltd | データ分析装置 |
JPH10171772A (ja) * | 1996-12-10 | 1998-06-26 | Nec Corp | 分散的パラメータ推定方式 |
JP2004102537A (ja) * | 2002-09-06 | 2004-04-02 | Nec Corp | 協調推定方法、協調推定装置、および協調推定プログラム |
Non-Patent Citations (3)
Title |
---|
C. CLIFTON, M. KANTARCIOGLU, J. VAIDYA, X. LIN, M. ZHU: ""Tools for Privacy Preserving Distributed Data Mining"", ACM SIGKDD EXPLORATIONS NEWSLETTER [ONLINE], vol. Volume 4, Issue 2, JPN7011002093, 2002, US, pages 28 - 34, ISSN: 0001938197 * |
李 航、外1名: "情報論的学習理論とその応用", 情報処理, vol. 第42巻,第1号, JPN6011055153, 15 January 2001 (2001-01-15), JP, pages 8 - 15, ISSN: 0002048431 * |
李 航、外1名: "線形結合モデルを用いたドキュメント分類", 情報処理学会研究報告, vol. 第97巻,第53号, JPN6011029952, 27 May 1997 (1997-05-27), JP, pages 37 - 44, ISSN: 0001938198 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009026307A (ja) * | 2007-06-28 | 2009-02-05 | Nec (China) Co Ltd | 交通情報処理装置および方法、交通情報統合装置および方法 |
US8296045B2 (en) | 2007-06-28 | 2012-10-23 | Nec (China) Co., Ltd. | Traffic information processing apparatus and method, traffic information integrating device and method |
WO2009116342A1 (ja) * | 2008-03-18 | 2009-09-24 | 日本電気株式会社 | 動的トピック分析システム、動的トピック分析方法および動的トピック分析プログラムを記録した媒体 |
JP5397370B2 (ja) * | 2008-03-18 | 2014-01-22 | 日本電気株式会社 | 動的トピック分析システム、動的トピック分析方法および動的トピック分析プログラムを記録した媒体 |
JP2013003413A (ja) * | 2011-06-17 | 2013-01-07 | Nippon Telegr & Teleph Corp <Ntt> | 会話データ解析装置、方法、及びプログラム |
JP2014016922A (ja) * | 2012-07-11 | 2014-01-30 | Kddi Corp | アイテム推薦システム、アイテム推薦方法およびプログラム |
JP2018061091A (ja) * | 2016-10-03 | 2018-04-12 | 株式会社Preferred Networks | データ圧縮装置、データ再現装置、データ圧縮方法、データ再現方法及びデータ転送方法 |
JP2019168820A (ja) * | 2018-03-22 | 2019-10-03 | 株式会社日立製作所 | データ分析支援システムおよびデータ分析支援方法 |
Also Published As
Publication number | Publication date |
---|---|
US20070094384A1 (en) | 2007-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007073024A (ja) | マクロ情報生成システム、マクロ情報生成装置、マクロ情報生成方法及びマクロ情報生成プログラム | |
US10614077B2 (en) | Computer system for automated assessment at scale of topic-specific social media impact | |
Zou et al. | AI planning and combinatorial optimization for web service composition in cloud computing | |
US20140189000A1 (en) | Social media impact assessment | |
JP5253519B2 (ja) | スマートテキストを生成するための方法、装置、及び記憶媒体 | |
CN1610311A (zh) | 通过把推理用于it系统进行自动建模的方法和设备 | |
CN104885053A (zh) | 流匹配系统中的结果的存留和实时排名 | |
CN108694324B (zh) | 一种信息泄露监控方法以及装置 | |
Agrawal et al. | Sparkbench–a spark performance testing suite | |
US20130173388A1 (en) | Methods and systems for service discovery and selection | |
JP5848199B2 (ja) | 影響力予測装置、影響力予測方法、及びプログラム | |
Trubiani et al. | Guilt-based handling of software performance antipatterns in palladio architectural models | |
Le et al. | Analysis of the interdependent co-evolution of product structures and community structures using dependency modelling techniques | |
Sinnott et al. | A scalable cloud-based system for data-intensive spatial analysis | |
Rai et al. | Using open source intelligence as a tool for reliable web searching | |
US10394804B1 (en) | Method and system for increasing internet traffic to a question and answer customer support system | |
Wyatt et al. | AI4IO: A suite of AI-based tools for IO-aware scheduling | |
Raban et al. | Acting or reacting? Preferential attachment in a people‐tagging system | |
US10380135B2 (en) | Data aggregation and reporting environment for data center infrastructure management | |
Haines | Web services as information systems innovation: a theoretical framework for web service technology adoption | |
CN115269044A (zh) | 一种接口配置方法及装置 | |
US11580322B2 (en) | Scalable attributed graph embedding for large-scale graph analytics | |
JP2022078008A (ja) | 法令関連情報利用支援システム及びこれを用いた法令関連情報利用支援方法 | |
JP6070338B2 (ja) | 多階層システムに含まれる処理システムの分類装置及び多階層システムに含まれる処理システムの分類プログラム並びに多階層システムに含まれる処理システムの分類方法 | |
US7937356B2 (en) | Apparatus, and associated method, for assessing viability of communication system arrangement transformation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081112 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110614 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110727 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20111025 |