WO2016021726A1

WO2016021726A1 - 情報処理システム

Info

Publication number: WO2016021726A1
Application number: PCT/JP2015/072564
Authority: WO
Inventors: 龍道本; 真也 ▼徳▲久
Original assignee: 株式会社博報堂Ｄｙホールディングス
Priority date: 2014-08-08
Filing date: 2015-08-07
Publication date: 2016-02-11
Also published as: US10657149B2; AU2015300012B2; CN106687956A; CN106687956B; CA2957506A1; PH12017500234B1; SG11201700974WA; MY175611A; AU2015300012A1; CA2957506C; EP3196777A4; EP3196777A1; PH12017500234A1; US20170235803A1

Abstract

　情報処理システムは、記憶ユニット（５５）と結合ユニット（５１）とを備える。結合ユニットは、記憶ユニットが記憶する第一及び第二のデータベース（１５５）を結合するように構成される。第一のデータベースは、第一のグループの構成体毎の特徴データに基づき、特徴が一致又は類似する複数の構成体の特徴データを統合した仮想構成体毎の特徴データを備える。第二のデータベースは、第二のグループにおける構成体毎の特徴データを備える。第一及び第二のデータベースが備える特徴データの夫々は、共通する種類の特徴を表す参照データを含む。結合ユニットは、第一のデータベースと第二のデータベースとの間で参照データが表す特徴が一致又は類似する特徴データ同士を結合するように、第一のデータベースと第二のデータベースとを結合する。

Description

情報処理システム

関連出願の相互参照

　本国際出願は、２０１４年８月８日に日本国特許庁に出願された日本国特許出願第２０１４－１６２６２３号及び２０１５年１月６日に日本国特許庁に出願された日本国特許出願第２０１５－０００９４５号に基づく優先権を主張するものであり、日本国特許出願第２０１４－１６２６２３号及び日本国特許出願第２０１５－０００９４５号の全内容を本国際出願に援用する。

　本開示は、データベースを取り扱う情報処理システムに関する。

　従来、商品の販売データに基づき顧客の購買行動を解析することが行われている。商業活動に役立てるために、顧客によるマスメディアやネットワークコンテンツへの接触行動を解析することも行われている。

　アンケート形式や対面での質問形式により、顧客の購買行動、マスメディア／ネットワークコンテンツへの接触行動、及び、ライフスタイル等の多様な情報を収集することも行われている。

　近年では、こうした顧客に関するデータを備える巨大なデータベースを、各企業が有している。しかしながら、各企業は、個人情報保護を主な理由として、これらの顧客に関するデータを外部に提供することに消極的である。これらのデータは、それを保有する企業から外部に提供される場合、暗号化されて提供されたり、顧客の特定に繋がる情報が大幅に削除されて提供されたり、意図的に誤り（ノイズ）を含むように変更された状態で提供されたりする（特許文献１参照）。

特開２０１４－１０９６４７号公報

　上述したように、データ保有企業からの顧客に関するデータの提供は、個人情報保護の観点から限られている。顧客に関するデータに限らず、粒度の細かなデータに関しても、その情報価値の高さや提供に起因する不利益発生への懸念から、データ保有企業がデータ提供に消極的になりがちである。このため、従来技術によれば、社会に存在する各種データを有効に活用することが難しい。

　従って、本開示の一側面では、社会に存在する各種データを有効活用可能な、データベースに関する新規技術を提供できることが望ましい。

　本開示の一側面に係る情報処理システムは、第一のデータベース及び第二のデータベースを記憶するように構成される記憶ユニットと、第一のデータベースと第二のデータベースとを結合するように構成される結合ユニットとを備える。本開示の一側面において、情報処理システムは、第一のデータベースを生成するように構成される生成ユニットを更に備えてもよい。

　第一のデータベースは、第一のグループの構成体に関する仮想構成体毎の特徴データを備えるデータベースである。この仮想構成体毎の特徴データは、第一のグループの構成体毎の特徴データに基づき、特徴が一致又は類似する複数の構成体の特徴データを統合して生成され得る。構成体の特徴データは、その構成体に関する特徴を表す。例えば、生成ユニットは、第一のグループにおいて、特徴が一致又は類似する複数の構成体毎に、当該複数の構成体の特徴データを統計処理することにより、特徴が一致又は類似する複数の構成体の特徴データを統合して、仮想構成体毎の特徴データを生成する構成にされ得る。

　第二のデータベースは、第二のグループの構成体毎の特徴データを備える。第二のグループは、第一のグループとは同一又は別のグループである。第一及び第二のデータベースが備える特徴データの夫々は、結合時に参照される参照データであって、第一のデータベースと第二のデータベースとの間で共通する種類の特徴を表す参照データを含むように構成される。

　結合ユニットは、第一のデータベースと第二のデータベースとの間で参照データが表す特徴が一致又は類似する特徴データ同士を結合するように、第一のデータベースと第二のデータベースとを結合する。

　本開示の一側面に係る情報処理システムによれば、複数の特徴データが統合されて、上記仮想構成体毎の特徴データを備えるデータベースが生成される。仮想構成体の特徴データは、複数の構成体の特徴が混合されたデータである。例えば、第一のグループが顧客の集合であり、統合前の特徴データが一人の顧客の特徴を表す単一顧客の特徴データである場合、仮想構成体の特徴データは、複数顧客の特徴が混合されたデータに対応する。

　構成体毎の特徴データを仮想構成体毎の特徴データに変換すれば、特徴データの情報粒度を大きくすることができ、これにより詳細な情報に対する情報保護を図ることができる。従って、本開示の一側面によれば、情報保護を理由とするデータ保有者によるデータ提供の障壁を小さくすることができる。従って、本開示の一側面によれば、社会に存在する各種データを有効活用可能なシステムを提供し得る。

　上述した特徴が一致又は類似する複数の構成体は、特徴が一致する構成体と特徴が類似する構成体との両方が混在する集合であり得る。本明細書における用語「類似」は、「一致」を下位概念に含む広義の用語として理解されてよい。

　特徴が一致又は類似する複数の構成体の特徴データを統合する際には、周知のクラスタリング技術（分類技術）を用いることが可能である。クラスタリング技術としては、言語処理、パターン認識、及び、人工知能等の分野で様々なものが知られている。良く知られるクラスタリング技術としては、ｋ－ｍｅａｎｓ（ｋ平均法）、及び、ＢＩＲＣＨ（平衡木による階層クラスタリング）等のハードクラスタリング技術、ＬＳＡ（潜在意味解析）、ｐＬＳＡ（確率的潜在意味解析）、及び、ＬＤＡ（潜在的ディリクレ配分法）等のソフトクラスタリング技術が知られている。

　本開示の一側面において、生成ユニットは、これら周知のクラスタリング技術、又は、その他のクラスタリング技術を用いて、第一のグループに関する特徴データの集合を、特徴が一致又は類似する複数の特徴データ毎に分けるようにクラスタ化する構成にされ得る。この生成ユニットは、クラスタ毎に、このクラスタに対応する複数の特徴データを統合するように構成され得る。

　本開示の一側面において、生成ユニットは、クラスタ毎に、クラスタに対応する複数の特徴データを統計処理する構成にされ得る。具体的には、生成ユニットは、クラスタ毎に、クラスタに対応する複数の特徴データが有する各パラメータについての統計量を算出する構成にされ得る。統計量の例には、平均値、最大値、最小値、及び、分布を表す値（割合等）が含まれる。特徴データのパラメータ値、及び、その統計量は、スカラー量であってもよいしベクトル量であってもよい。仮想構成体の特徴データは、クラスタ毎に生成され得る。本開示の一側面において、仮想構成体の特徴データは、上記統計量を、仮想構成体に関する特徴を表すパラメータ値として含むように生成され得る。

　上記第一のデータベースは、上記生成ユニットによって生成されてもよいし、人による手作業によって生成されてもよいし、その他の方法（例えば、コンピュータによる情報処理と人による手作業との組合せ）によって生成されてもよい。

　本開示の一側面においては、上記第二のデータベースも、第一のデータベースと同様に生成され得る。第二のデータベースが備える構成体毎の特徴データは、仮想構成体毎の特徴データであり得る。この仮想構成体毎の特徴データは、第一のグループとは同一又は別のグループの構成体毎の特徴データに基づき、特徴が一致又は類似する複数の構成体の特徴データを統合して生成され得る。本開示の一側面において、情報処理システムは、第二のデータベースを生成する生成ユニットを備えていてもよい。

　本開示の一側面において、第二のデータベースは、上記統合のなされていない特徴データを備えるデータベースであってもよい。第二のデータベースは、特徴データとしてシングルソースデータを備え得る。シングルソースデータの夫々は、単一の情報源から収集された情報に基づくデータである。シングルソースデータは、統計化及びモデル化されていない構成体の特徴データであって、単一の構成体に関する特徴を表す特徴データであり得る。

　上述した第一及び第二のグループの夫々は、人、物、サービス、及び場所の少なくとも一つの集合であり得る。上記構成体は、この集合の要素であり得る。即ち、上記構成体は人、物、サービス、及び場所のいずれかであり得る。物、サービス、及び場所は、人に関連する物、サービス、及び場所であり得る。

　本開示の一側面によれば、第一のグループ及び第二のグループの一方が、人の集合であり、第一のグループ及び第二のグループの他方が、物、サービス、及び場所の少なくとも一つの集合であってもよい。第一及び第二のグループの夫々が、物、サービス、及び場所の少なくとも一つの集合であってもよい。

　本開示の一側面によれば、情報処理システムは、互いに同一又は異なるグループについてのデータベースを生成するように構成される複数の生成ユニットと、複数の生成ユニットにより生成された複数のデータベースを結合するように構成される結合ユニットと、を備えた構成にされてもよい。生成ユニットの夫々は、対応するグループの構成体毎の特徴データに基づき、特徴が一致又は類似する複数の構成体の特徴データを統合した仮想構成体毎の特徴データを備えるデータベースを生成するように構成され得る。

　複数のデータベースが備える特徴データの夫々は、結合時に参照される参照データであって、結合対象のデータベースと共通する種類の特徴を表す参照データを含んでよい。結合ユニットは、複数のデータベース間で、参照データが表す特徴が一致又は類似する特徴データ同士を結合するように、複数のデータベースを結合する構成にされ得る。

　本開示の一側面によれば、仮想構成体毎の特徴データを備える複数のデータベースを記憶するように構成される記憶ユニットと、記憶ユニットが記憶する複数のデータベースを結合するように構成される結合ユニットと、を備えた情報処理システムが提供されてもよい。この情報処理システムによっても、社会に存在するデータを有効活用可能である。

　本開示の一側面において、結合ユニットは、上記複数のデータベース間を、複数のデータベースとは同一又は異なるグループについてのデータベースであって、グループの構成体毎に特徴データとしてシングルソースデータを備える特定種のデータベースを介して結合する構成にされてもよい。シングルソースデータは、データベースの結合時に参照される参照データであって、結合対象のデータベースと共通する種類の特徴を表す参照データを含み得る。

　本開示の一側面において、結合ユニットは、参照データが表す特徴が一致又は類似する特徴データ同士を結合するように、上記特定種のデータベースと、それ以外のデータベースの夫々とを結合することにより、複数のデータベース間を、特定種のデータベースを介して結合する構成にされ得る。

　シングルソースデータは、上記統合がなされていないという点で構成体の特徴を良く表す。従って、シングルソースデータを介して各データベースを結合することにより、データベース間における仮想構成体毎の特徴データを一層適切に結びつけることができる。

　本開示の一側面において、上述した生成ユニット及び結合ユニットとしての機能は、ハードウェアにより実現することができる。これら各ユニットとしての機能は、プログラムにより、コンピュータに実現させてもよい。これら各ユニットとしての機能は、複数のコンピュータにより分散して実現されてもよい。コンピュータには、これらのユニットの少なくとも一つとしての機能をコンピュータに実現させるためのプログラムを提供することができる。プログラムは、半導体製メモリ、磁気ディスク及び光ディスク等のコンピュータ読取可能な一時的でない記録媒体に記録され得る。

　本開示の一側面によれば、生成ユニット及び結合ユニットの少なくとも一方としての機能をコンピュータに実現させるためのプログラムを記憶するコンピュータ読取可能な一時的でない記録媒体が提供されてもよい。本開示の一側面によれば、コンピュータ（プロセッサ）と、メモリとを備え、メモリが上記プログラムを記憶した情報処理システムが提供されてもよい。

　本開示の一側面によれば、上記第一のデータベースを生成又は取得する手順と、第一のデータベースを上記第二のデータベースと結合する手順と、を備えるデータベース結合方法が提供されてもよい。本開示の別側面によれば、第一のデータベースを生成又は取得する手順と、第二のデータベースを生成又は取得する手順と、第一のデータベースと第二のデータベースとを結合する手順と、を備えるデータベース結合方法が提供されてもよい。

　上述したデータベースは、顧客に関するデータベースであってもよい。データベースは、顧客に対応する人、物、サービス、及び場所の少なくとも一つの特徴を表す特徴データを備えた構成にされ得る。本開示の一側面に係る情報処理システムによれば、顧客の個人情報を保護しながら、結合ユニットに顧客に関するデータを提供し得る。結合ユニットは、データ提供元の異なる顧客に関するデータを結合したデータベースを生成することができる。

　データベースの夫々が、顧客の特徴を表す特徴データを備える場合、上記参照データは、顧客のデモグラフィック属性を表すデータとして構成され得る。デモグラフィック属性は、様々な企業な保有する顧客に関するデータに含まれる。このようなデモグラフィック属性を表す参照データに基づき、データベース間を結合すれば、異なるデータベース間の特徴データを適切に結合することができる。勿論、参照データは、デモグラフィック属性以外の顧客の特徴を、デモグラフィック属性に加えて、又は、代えて表すデータであってもよい。

　顧客に関する特徴データには、参照データ以外の非参照データとして、顧客の消費行動、マスメディアへの接触行動、ネットワークコンテンツへの接触行動、ライフスタイル、価値観、及び、ブランド意識の少なくとも一つの特徴を表すデータが含まれてもよい。こうした顧客に関する多様な情報を含む特徴データ同士を、データベース間で結合すれば、結合後のデータベースから、顧客（消費者）に関する多種の有意義な統計情報を解析により抽出することができる。

　ここで例として挙げた非参照データは、参照データにもなり得る。参照データは、複数のデータベースの内、直接的に結合されるデータベース間において、共通する種類の特徴を表すデータであればよい。

第一実施例の情報処理システムの構成を表すブロック図である。図２Ａは、データ加工装置の構成を表すブロック図であり、図２Ｂは、データ加工装置の演算部で実行される処理を表すブロック図である。図３Ａ－３Ｄは、顧客関連データベースが有する特徴データの構成を表す図である。加工後データベースの例を説明した図である。図５Ａは、データ結合装置の構成を表すブロック図であり、図５Ｂは、データ結合装置の演算部で実行される処理を表すブロック図である。加工後データベースの結合例を説明した図である。結合対象の加工後データベースの構成を例示する図である。加工後データベースに基づく結合データベースの構成例を表す図である。結合データベースの解析例を説明した図である。第二実施例における加工後データベースの結合例を説明した図である。第二実施例における結合データベースの構成例を表す図である。第三実施例における顧客関連データベースの構成を説明した図である。第四実施例における顧客関連データベースの構成を説明した図である。第五実施例における顧客関連データベースの構成を説明した図である。第六実施例における顧客関連データベースの構成を説明した図である。第七実施例における顧客関連データベースの構成を説明した図である。第八実施例における顧客関連データベースの構成を説明した図である。

　以下に本開示の実施例を図面と共に説明する。
　［第一実施例］
　図１に示す本実施例の情報処理システム１は、複数のデータ加工装置１０と、データ結合装置５０と、を備える。データ加工装置１０は、企業が保有する顧客に関するデータベース１５３を加工し、加工後データベース１５５をデータ結合装置５０に提供する。データ加工装置１０は、顧客に関するデータベース１５３を保有する企業側に配置される。

　以下では、顧客に関するデータベース１５３のことを顧客関連データベース１５３と表現する。顧客関連データベース１５３を加工して提供する企業のことをデータ提供元と表現する。顧客関連データベース１５３は、顧客に関する特徴データの一群を備える。

　特徴データとしては、顧客の消費行動、マスメディアへの接触行動、ネットワークコンテンツへの接触行動、ライフスタイル、価値観、及び、ブランド意識の少なくとも一つの特徴を、顧客の識別ＩＤ又はデモグラフィック属性と共に表すデータを一例に挙げることができる。

　上記顧客の識別ＩＤは、顧客のデモグラフィック属性を表すデータを、顧客情報を記憶するデータベースから引出可能な識別コードであり得る。顧客の消費行動には、顧客の購買行動が含まれる。

　例えば、上記特徴データは、顧客のデモグラフィック属性と共に、顧客の購買データを有した構成にされ得る。購買データは、購入商品及び／又は購入金額を表すデータであり得る。この場合、顧客関連データベース１５３は、顧客毎及び決済毎の特徴データを有し得る。

　データ加工装置１０は、顧客関連データベース１５３が有する上記特徴データの一群に基づき、特徴が類似する複数の特徴データを一つの特徴データに統合するように加工する。本明細書で用いる用語「類似」は、「一致」を下位概念に含む広義の用語として理解されてよい。データ加工装置１０は、加工後の特徴データを、仮想顧客の特徴データとして備えるデータベースを、上記加工後データベース１５５として生成する。本明細書では、加工後の顧客関連データベースのことを加工後データベース１５５とも表現する。加工後データベース１５５は、例えば、複数の顧客に対応する仮想顧客毎に、この仮想顧客の特徴データを備える。

　加工後データベース１５５は、例えば通信によりデータ結合装置５０に提供される。データベースの漏洩を防ぐために、通信には、暗号鍵や専用回線を用いることができる。別例として、加工後データベース１５５は、持ち運び可能であってコンピュータ読取可能な記録媒体に保存され、当該記録媒体の運搬によりデータ結合装置５０側に提供され得る。記録媒体としては、半導体製メモリ、ＣＤ－ＲＯＭ及びＤＶＤ等の光ディスク、並びに、ハードディスク等の磁気ディスクを一例に挙げることができる。

　データ結合装置５０は、データ加工装置１０の夫々から提供される複数の加工後データベース１５５を結合して、結合データベース５５７を生成する。データ提供元としては、上述したように、特徴データとして顧客の購買データを含む顧客関連データベース１５３を備える企業を一例に挙げることができる。

　購買データを有する企業としては、コンビニエンスストア、スーパーマーケット及び／又は百貨店等を運営する小売（物販）業者、自動販売機を運営する企業、電子マネーによる決済サービスを提供する企業、並びに、クレジットカードによる決済サービスを提供する企業を一例に挙げることができる。

　小売業者によれば、ＰＯＳシステム等を通じて得られる決済毎の購買データが蓄積されたデータベースを有する。ＰＯＳシステムとしては、顧客を特定可能なＩＤ－ＰＯＳシステムが知られている。

　小売業者では、決済時にポイントカードの提示を顧客から受けて、ポイントカードから特定される顧客ＩＤと関連付けて購買データを蓄積することにより、顧客を特定可能な決済毎の購買データを備えるデータベースを構築することも行われている。決済時に、販売員が見た目から判別される顧客の性別及び年齢を入力することで、顧客のデモグラフィック属性と購買データとを関連付けるように、決済毎の購買データを蓄積することも行われている。

　データ結合装置５０は、このようなデータ提供元の異なる、購買データを含む加工後データベース１５５の複数を結合することで、一企業では構築することのできない巨大なデータベースを構築することができる。例えば、広範囲の商品についての顧客（消費者）の購買行動を解析可能な結合データベース５５７を生成することができる。

　図２Ａに示すように、データ加工装置１０の夫々は、演算部１１、記憶部１５、入力部１７、及び、出力部１９を備える。演算部１１は、各種プログラム１５１に従う処理を実行するＣＰＵ１３を備える。更に演算部１１は、ＣＰＵ１３による処理実行時に作業メモリとして使用されるＲＡＭ１４を備える。演算部１１は、ＣＰＵ１３における上記処理の実行により、図２Ｂに示すように、クラスタリング処理部１１０及び加工処理部１１５として機能する。

　記憶部１５は、演算部１１を、クラスタリング処理部１１０及び加工処理部１１５として機能させるためのプログラムを含む各種プログラム１５１、及び、加工前の顧客関連データベース１５３を記憶する。更に記憶部１５は、この顧客関連データベース１５３の加工によって生成される加工後データベース１５５を記憶するように構成される。

　顧客関連データベース１５３を構成するデータは、入力部１７から入力される。入力部１７は、顧客関連データベース１５３を構成するデータを記録媒体から取込可能なインタフェースであってもよいし、当該データを企業内システムから通信により取込可能なインタフェースであってもよい。

　図３Ａ－３Ｄには、顧客関連データベース１５３が備える特徴データ（レコード）の例を示す。図３Ａに示す例によれば、特徴データは、顧客のデモグラフィック属性として、顧客の性別及び年齢を表すパラメータを有する。更に、この特徴データは、顧客が購入した商品に関するパラメータとして、商品の購入場所、ＪＡＮ（Ｊａｐａｎｅｓｅ　Ａｒｔｉｃｌｅ　Ｎｕｍｂｅｒ）コード、購入数、及び、商品単価を表すパラメータを有する。ＪＡＮコードは、日本国において、広く普及している商品コードである。図３Ａに示すような購入商品の詳細情報を含む顧客関連データベース１５３は、例えばコンビニエンスストアやスーパーマーケット等の小売業者が有する。

　図３Ｂに示す別例によれば、特徴データは、顧客のデモグラフィック属性として、顧客の性別及び年齢を表すパラメータを有する。更に、この特徴データは、顧客が購入した商品に関するパラメータとして、商品の購入場所及び購入金額を表すパラメータを有する。図３Ｂに示すような特徴データを含む顧客関連データベース１５３は、例えばクレジットカード会社が有する。この顧客関連データベース１５３は、小売業者と比較して莫大な購買データを有する点で、小売業者が有する顧客関連データベース１５３よりも優れているが、具体的な購入商品までを特定することができない点で、小売業者が有する顧客関連データベース１５３とは相互に補完関係にある。

　図３Ｃに示す別例によれば、特徴データは、顧客のデモグラフィック属性として、顧客の性別、年齢及び職業を表すパラメータを有する。更に、この特徴データは、顧客のマスメディアとの接触状況に関するパラメータとして、複数のマスメディア（新聞／雑誌／ラジオ／テレビ／映画等）についての利用状況を表すパラメータを有する。例えば、利用状況を表すパラメータは、該当するマスメディアを顧客が利用（購読／視聴等）している場合には値１を示し、利用していない場合には値０を示す。この種の情報は、例えば、アンケート形式又は対話形式により収集されて、特徴データとして顧客関連データベース１５３に蓄積される。この種の顧客関連データベース１５３は、通常、マスコミュニケーションに関する企業が有し、小売業者が有さないデータベースである。

　図３Ｄに示す別例によれば、特徴データは、顧客のデモグラフィック属性として、顧客の性別、年齢及び居住地域を表すパラメータを有する。更に、この特徴データは、顧客によるネットワークコンテンツとの接触状況に関するパラメータとして、複数のインターネットサイトについての利用状況を表すパラメータを有する。例えば、利用状況を表すパラメータは、該当するサイトを顧客が利用（訪問）している場合には値１を示し、利用していない場合には値０を示す。この種の情報は、例えば、予め顧客からの同意を得て顧客の情報端末にインストールされたアクセスログ生成プログラムを通じて特定のサーバに蓄積される。この顧客関連データベース１５３は、通常、ＩＴ企業が有し、小売業者が有さないデータベースである。

　出力部１９は、上述した顧客関連データベース１５３に基づく加工後データベース１５５をデータ加工装置１０から外部に取り出し可能な構成にされる。例えば、出力部１９は、加工後データベース１５５を通信によりデータ結合装置５０に提供可能な通信インタフェース、又は、加工後データベース１５５を記録媒体に出力可能なインタフェースを有した構成にされる。

　クラスタリング処理部１１０は、記憶部１５が記憶する加工前の顧客関連データベース１５３から、特徴データの集合を読み出し、これら特徴データの集合を、特徴が類似する複数の特徴データ毎にクラスタ化する。クラスタリングの手法としては、上述した周知の手法を採用することができる。

　簡単なクラスタリング手法としては、特徴データの夫々を、特徴ベクトルとして特徴空間上に配置し、特徴ベクトル間のコサイン類似度に基づいて、特徴が類似する特徴データを特定し、クラスタ化する手法を一例に挙げることができる。

　顧客の特徴が類似する特徴ベクトルの一群が、特徴空間上で他の特徴ベクトルと良く分離するように、次元削減行列を特徴ベクトルの夫々に作用させることも可能である。次元削減行列の調整によって、より適切なクラスタリングが可能である。

　クラスタリング技術としては、ｐＬＳＡ（確率的潜在意味解析）のように、一つの特徴データを、確率的に複数のクラスタに分類する技術も知られている。一つの特徴データの８０％を第一のクラスタに分類し、残りの２０％を第二のクラスタに分類するといった具合である。

　どのように特徴の類似性を判断し、特徴データの一群をクラスタ化するかは、結合データベース５５７に基づくデータ解析の目的を考慮して、データ結合装置５０の運営者が決定することができる。データ結合装置５０の運営者は、クラスタリング処理部１１０及び加工処理部１１５として演算部１１を機能させるためのプログラムを、データ提供元に提供して、データ解析目的に良く適合した加工後データベース１５５をデータ提供元から取得することができる。

　一側面において、情報処理システム１は、データ提供元が保有する顧客関連データベース１５３に対する統計処理により、個人情報を保護した加工後データベース１５５を生成するものであり得る。この場合、クラスタリングは、クラスタの夫々が統計処理（統合）により個人情報保護可能な個数以上の特徴データを含むように、行われるのが好ましい。個人情報保護可能な個数以上の特徴データを含まないクラスタが生じる場合には、そのクラスタに属する特徴データを、加工処理部１１５における処理対象とせずに破棄することが考えられる。

　加工処理部１１５は、クラスタリング処理部１１０によりクラスタ化された複数の特徴データ毎に、換言すればクラスタ毎に、これら同一クラスタに属する複数の特徴データを統合するための統計処理を行う。具体的に、加工処理部１１５は、クラスタ毎に、同一クラスタに属する複数の特徴データが有する各パラメータについての統計量を算出し、これらの統計量をパラメータ値として含む特徴データを、クラスタに対応する仮想顧客の特徴データとして生成する処理を行う。加工処理部１１５は、全てのクラスタに関して、クラスタ毎に一つの仮想顧客の特徴データを生成することにより、これらの特徴データを備える加工後データベース１５５を生成し、これを記憶部１５に書き込む。

　図４に示す例によれば、加工処理部１１５は、性別のパラメータに関する統計量として、クラスタ内の特徴データが表す性別の比を算出し、この比を、クラスタに対応する仮想顧客の特徴データにおいて性別のパラメータ値として記載する。加工処理部１１５は、年齢のパラメータに関する統計量として、クラスタ内の特徴データが表す年齢の平均を算出し、この平均をクラスタに対応する仮想顧客の特徴データにおいて年齢のパラメータ値として記載する。

　図４上段に示す例によれば、加工前の特徴データは、ＪＡＮコードと購入場所との組合せ毎に、顧客が該当ＪＡＮコードの商品を該当購入場所で購入した金額の合計を表す購買パラメータを有する。この場合、加工処理部１１５は、購買パラメータに関する統計量として、ＪＡＮコードと購入場所との組合せ毎に、クラスタ内の特徴データが表す金額の平均値を算出して、これをクラスタに対応する仮想顧客の特徴データに記載することができる。

　図４下段に示す加工後の特徴データは、仮想顧客のデモグラフィック属性（性別及び年齢）と共に、ＪＡＮコードと購入場所との組合せ毎に、仮想顧客による商品の購入金額（平均値）を表す。

　別例として、加工処理部１１５は、上記金額の平均値に代えて、上記金額の最大値及び最小値を、購入金額の分布を表す値として算出してもよい。即ち、加工処理部１１５は、ＪＡＮコードと購入場所との組合せ毎に、上記金額の最大値及び最小値を、購買パラメータに関する統計量として、仮想顧客の特徴データに記載することができる。

　図４によれば、加工前後の特徴データは、加工後の特徴データが統計量を表すものである点、及び、加工前特徴データの個数（標本数）を表すパラメータが加工後の特徴データに追加されている点を除けば、基本的に同じものである。

　但し、加工処理部１１５は、図３Ａに示す特徴データを有する顧客関連データベース１５３から、図４下段に示すような仮想顧客（クラスタ）毎の特徴データを備える加工後データベース１５５を生成することも可能である。即ち、特徴データが有するパラメータの種類は、加工前後で一致する必要はなく、加工前のパラメータの一つ又は複数は、加工時に、そこから算出可能な他の種類のパラメータに置き換えられてもよい。

　統計量として、比（割合）、平均、又は、最大値及び最小値の組が算出される例を上述したが、統計量としては、その他に中央値が算出されてもよいし、平均及び分散の組が算出されてもよい。どのような統計量を算出するかは、データ解析目的に応じて、解析に有意な情報が失われないように定めることができる。

　データ加工装置１０では、このようにしてクラスタ毎に、このクラスタに属する特徴データの一群が、統計量を表す特徴データに加工（統合）されて、この加工後の特徴データを含む加工後データベース１５５がデータ結合装置５０に向けて出力される。

　続いて、データ結合装置５０の構成を図５Ａ及び図５Ｂを用いて説明する。データ結合装置５０は、図５Ａに示すように、演算部５１、記憶部５５、入力部５７、及び、出力部５９を備える。演算部５１は、各種プログラム５５１に従う処理を実行するＣＰＵ５３を備える。更に演算部５１は、ＣＰＵ５３による処理実行時に作業メモリとして使用されるＲＡＭ５４を備える。演算部５１は、ＣＰＵ５３における上記処理の実行により、図５Ｂに示すようにデータフュージョン処理部５１０として機能する。

　記憶部５５は、演算部５１をデータフュージョン処理部５１０として機能させるためのプログラムを含む各種プログラム５５１を記憶する。記憶部５５はまた、データ加工装置１０から提供される加工後データベース１５５、及び、これらの加工後データベース１５５を結合して生成される結合データベース５５７を記憶するように構成される。データ加工装置１０から提供される加工後データベース１５５は、入力部５７を通じてデータ結合装置５０内に入力される。入力部５７は、記録媒体から加工後データベース１５５を入力可能なインタフェースであってもよいし、データ加工装置１０から通信により送信されてくる加工後データベース１５５を入力可能なインタフェースであってもよい。出力部５９は、例えば結合データベース５５７や結合データベース５５７に基づくデータ解析結果をデータ結合装置５０から外部に取り出すために用いられる。

　データフュージョン処理部５１０は、記憶部５５が記憶する複数の加工後データベース１５５を結合して、結合データベース５５７を生成する。具体的に、データフュージョン処理部５１０は、糊代として機能する特徴データ内のパラメータを参照し、結合対象の加工後データベース１５５間で、参照パラメータが表す特徴が類似する特徴データ同士を結合するようにして、結合対象の加工後データベース１５５間を結合する。

　上述したように、加工後データベース１５５が備える各特徴データは、データ提供元が異なる加工後データベース１５５間でも、顧客のデモグラフィック属性を表すパラメータを共通して有する。例えば、特徴データは、データ提供元が異なる特徴データ間でも、性別を表すパラメータと、年齢を表すパラメータとを共通して有する。

　データフュージョン処理部５１０は、このように結合対象の加工後データベース１５５が備える特徴データが共通して有するパラメータ（以下、共通パラメータと表現する）を参照して、共通パラメータが表す顧客の特徴が類似する特徴データ同士を結合するように、加工後データベース１５５間を結合する。

　加工後データベース１５５間の結合は、図６Ａに示すように、記憶部５５が記憶する第１の加工後データベース１５５を第２の加工後データベース１５５と結合し、第２の加工後データベース１５５を第３の加工後データベース１５５と結合し、第ｍの加工後データベース１５５を第（ｍ＋１）の加工後データベース１５５と結合（ｍは３以上の整数）するようにして、順に加工後データベース１５５間を結合することで実現することができる。別例として、データフュージョン処理部５１０は、特定の加工後データベース１５５に対して、残りの加工後データベース１５５の夫々を結合することにより、記憶部５５が記憶する加工後データベース１５５間を、特定の加工後データベース１５５を中心にスター状に結合することができる（図８Ａ参照）。

　データフュージョン技術としては種々のものが知られている。本実施例のデータフュージョン処理部５１０においても、周知のデータフュージョン技術を用いて加工後データベース１５５間を結合することができる。簡単なデータフュージョン方法によれば、二つの加工後データベース１５５間における類似する特徴データ同士のマッチング（結合）を次のように行うことができる。

　例えば、類似度を評価するための共通パラメータ（例えば年齢及び性別）について、これらの共通パラメータを要素とする特徴ベクトルを特徴空間に配置したときの特徴ベクトル間の距離（例えばコサイン距離）を、加工後データベース１５５間における全ての特徴データの組合せについて算出する。そして、距離が最短の特徴ベクトル同士をマッチングすることにより、共通パラメータが表す顧客の特徴が類似する特徴データ同士を結合するように、加工後データベース１５５間を結合することができる。

　二つの特徴データ間の類似度を特徴空間上において距離で評価するときには、輸送問題の解法を援用し、輸送費が「全体で最小」となるように、加工後データベース１５５間における特徴データ同士のマッチングを行うことも可能である。

　このようなマッチングにより生成される結合データベース５５７は、二つの加工後データベース１５５における特徴データ間を紐付けるデータが格納されたものとして構成され得る。

　標本数、性別、年齢、購買Ｐ１，Ｐ２，…，購買Ｑ１，Ｑ２，…のパラメータを有する特徴データを備える図６Ｂに示す加工後データベース１５５Ａと、標本数、性別、年齢、購買Ｒ１，Ｒ２，…，購買Ｑ１，Ｑ２，…のパラメータを有する特徴データを備える図６Ｂに示す加工後データベース１５５Ｂと、を結合した場合における結合データベース５５７の構成を、図６Ｃに示す。

　これらの加工後データベース１５５Ａ，１５５Ｂによれば、共通パラメータは、性別、年齢、購買Ｑ１，Ｑ２，…である。購買Ｐ１，Ｐ２，…，購買Ｑ１，Ｑ２，…，購買Ｒ１，Ｒ２，…は、例えばＪＡＮコード及び購入場所の組合せ毎の購買パラメータである。例えば、この購買パラメータは、対応する組合せに関する顧客の購入金額又は購入の有無を表す。

　例えば、購買Ｐｉ（ｉは２以上の整数）は、購買Ｐ１と同一ＪＡＮコードの商品に関する購買Ｐ１とは異なる購入場所での顧客の購入金額又は購入の有無を表すパラメータであり得る。購買Ｑｊ，Ｒｊ（ｊは１以上の整数）は、購買Ｐｊと異なるＪＡＮコードの商品に関するパラメータｊに対応する購入場所での顧客の購入金額又は購入の有無を表すパラメータであり得る。

　このような構成の加工後データベース１５５Ａ，１５５Ｂを結合した結合データベース５５７では、互いに結合される加工後データベース１５５Ａの特徴データと加工後データベース１５５Ｂの特徴データとが、それらの識別番号の関連付けによって表現される。即ち、結合データベース５５７では、加工後データベース１５５Ａの特徴データの識別番号に関連付けられて、この特徴データに結合される加工後データベース１５５Ｂの特徴データの識別番号が記載される。

　図６Ｃに示すように、加工後データベース１５５Ａにおける一つの特徴データ（Ａ００００１）に対して、加工後データベース１５５Ｂにおける複数の特徴データ（Ｂ２００５６，Ｂ００２３４，Ｂ０１１２３）が関連付けられる場合もあり得る。

　加工後データベース１５５における各特徴データは、加工前の複数の特徴データに対応するものであり、加工前特徴データに対応するクラスタ内の標本数が互いに異なるものであり得る。この場合には、各特徴データが標本数に対応する量存在するものとみなして、顧客の特徴が最も類似する特徴データ同士を、同じ標本数分だけ結合し、残りの標本数分の特徴データを、次に類似する特徴データと同一標本数分だけ結合することができる。

　図６Ｃにおいて、Ａ００００１、Ｂ２００５６、５．３と記載されたレコードは、加工後データベース１５５Ａの識別番号Ａ００００１の特徴データと、加工後データベース１５５Ｂの識別番号Ｂ２００５６の特徴データとが、互いに標本数５．３だけ結合されていることを示す。同様に次のレコードは、加工後データベース１５５Ａの識別番号Ａ００００１の特徴データと、加工後データベース１５５Ｂの識別番号Ｂ００２３４の特徴データとが、互いに標本数８．２だけ結合されていることを示す。更に次のレコードは、加工後データベース１５５Ａの識別番号Ａ００００１の特徴データと、加工後データベース１５５Ｂの識別番号Ｂ０１１２３の特徴データとが、互いに標本数６．５だけ結合されていることを示す。加工後データベース１５５Ａの識別番号Ａ００００１の特徴データは、標本数２０のクラスタに基づき生成される。加工後データベース１５５Ａの識別番号Ａ００００１の特徴データは、加工後データベース１５５Ｂの識別番号Ｂ２００５６、識別番号Ｂ００２３４、及び、識別番号Ｂ０１１２３の特徴データに割り振られて結合される。

　このように構成される結合データベース５５７により、加工後データベース１５５間は互いに結合され、結合データベース５５７及び加工後データベース１５５は、一つの巨大なデータベースを構成する。図６Ｂ及び図６Ｃに示す例によれば、購買Ｒ１，Ｒ２，…についての情報がない加工後データベース１５５Ａと、購買Ｐ１，Ｐ２，についての情報がない加工後データベース１５５Ｂとが結合されることで、購買Ｐ１，Ｐ２，…，購買Ｑ１，Ｑ２，…，購買Ｒ１，Ｒ２，…の情報が連結された巨大なデータベースが構築される。従って、例えば購買Ｐ１，Ｐ２，…を購入する顧客が、購買Ｒ１，Ｒ２，…に対してどのような傾向を示すのかを分析することが可能になる。

　図７は、ＪＡＮコードと購入場所との組合せ毎のブロックが横方向に配列され、そのブロックの配列が、縦方向において、仮想顧客毎に配置された図である。ハッチングされたブロックは、対応する仮想顧客が、該当ＪＡＮコードに対応する商品を該当する購入場所で購入していることを示す。ハッチングされていないブロックは、対応する仮想顧客が、該当ＪＡＮコードに対応する商品を該当する購入場所で購入していないことを示す。

　図７によれば、破線に示す領域には、ハッチングされたブロックが集中して存在している。この集中は、領域内においてＪＡＮコードと購入場所との組合せに対する購買層が存在することを示している。従って、この領域内において、ハッチングされていないブロックに対応する顧客の層に、対応する商品の広告を行うと、広告の効果が有意義に発揮される。例えば、太線で囲む仮想顧客は、破線に示す領域に対応する購買行動をほとんど起こしていないが、統計上では購買層に該当する。従って、対応する顧客層に、対応する商品の広告を行うと、広告の効果が有意義に発揮されることが期待される。

　このようなデータ解析を、従来の顧客に関するデータに基づき行うと、顧客のプライバシーに関する情報が解析過程で詳細に特定される可能性がある。これに対し、本実施例によれば、図６Ｂ及び図７に示す各行のデータは、統計化された仮想的な顧客に関するデータである。本実施例によれば、統計化されたデータに基づき上記データ解析を行うので、このような従来技術が有する問題の発生を抑えつつも、商業活動に役立つ情報をデータ解析によって得ることができる。

　以上、本実施例の情報処理システム１について説明した。本実施例によれば、データ加工装置１０が、顧客関連データベース１５３を加工して、加工後データベース１５５をデータ結合装置５０に提供する。そして、データ結合装置５０が、データ加工装置１０により生成された複数の加工後データベース１５５間を結合する。

　データ加工装置１０の演算部１１は、加工前の顧客関連データベース１５３が備える特徴データの一群に基づき、これら特徴データの集合を、特徴が類似する複数の特徴データ毎にクラスタ化する。更に演算部１１は、各クラスタに対応する複数の特徴データを統計処理して、統合する。これにより、特徴が類似する複数顧客に対応する仮想顧客毎の特徴データを生成する。特に、演算部１１（加工処理部１１５）は、クラスタ毎に、クラスタに属する複数の特徴データが有する各パラメータについての統計量を算出する。仮想顧客毎の特徴データは、これらの統計量をパラメータ値として含むように生成される。演算部１１（加工処理部１１５）は、このように複数の特徴データが統合された仮想顧客毎の特徴データを備えるデータベースを、加工後データベース１５５として生成する。

　加工後データベース１５５における特徴データの夫々は、加工後データベース１５５間の結合時に参照される参照データを含む。参照データは、結合対象の加工後データベース１５５と共通する種類の特徴を表す。上記実施例における参照データは、顧客のデモグラフィック属性として、顧客の性別及び年齢を表す。

　データ結合装置５０の演算部５１は、複数の加工後データベース１５５間で参照データが表す特徴が類似する特徴データ同士を結合するように、加工後データベース１５５間を結合する。

　即ち、この情報処理システム１によれば、データ加工装置１０が、複数顧客の特徴データを統計処理して統合し、仮想顧客毎の特徴データを備える加工後データベース１５５を生成する。例えば、統計処理前の特徴データが一人の顧客の特徴を表す単一顧客のデータである場合、データ加工装置１０の動作により、特徴データは、単一顧客のデータから複数顧客の特徴が混合された仮想顧客のデータに変換される。

　従って、データ提供元では、データ加工装置１０を用いて顧客関連データベース１５３を顧客の個人情報を保護した加工後データベース１５５に変換でき、個人情報を保護しながらデータ結合装置５０に顧客に関するデータを提供することができる。

　これにより、データ結合装置５０の運営者は、以前は情報保護の観点から顧客関連データベース１５３の提供に消極的であった企業から、加工後データベース１５５として、顧客関連データベースを入手することができる。データ結合装置５０は、データ提供元の異なる各種の顧客に関するデータを結合したデータベースを生成することができる。

　結果として、この情報処理システム１は、結合データベース５５７として、社会に分散する各種の顧客に関するデータを統合したデータベースを構築することができる。情報処理システム１は、このデータベースに基づいて、各種の顧客に関するデータを有効活用し、有意義なデータ解析を行うことができる。

　上記実施例において加工後データベース１５５間の共通パラメータ（データベース結合時の参照データ）は、顧客の性別及び年齢であった。しかしながら、共通パラメータは、他のパラメータを含んでいてもよい。例えば、共通パラメータは、顧客のデモグラフィック属性として、顧客の性別、年齢、職業、居住地域、所得、学歴、及び、家族構成の少なくとも一つを含むことができる。

　［第二実施例］
　第二実施例の情報処理システム１は、データ結合装置５０において、シングルソースデータを備えるデータベースをハブデータベースＨ（図８Ａ参照）として用いるように構成される。情報処理システム１は、このハブデータベースＨに、データ加工装置１０から提供された各加工後データベース１５５を結合することにより、複数の加工後データベース１５５間を、ハブデータベースＨを介して結合する。

　本実施例の情報処理システム１のハードウェア構成は、第一実施例と同様である。本実施例の情報処理システム１は、データ結合装置５０の記憶部５５が、データ加工装置１０から提供される加工後データベース１５５以外に、ハブデータベースＨを有する点で第一実施例と異なる。本実施例の情報処理システム１は、この点に加えて、データフュージョン処理部５１０の処理動作が第一実施例と異なるだけのものである。従って、以下では、第一実施例と同一構成の説明を適宜省略する。

　ハブデータベースＨを構成するシングルソースデータは、例えば、博報堂株式会社が行っている生活者調査「ＨＡＢＩＴ（登録商標）」から得られる。ＨＡＢＩＴは、訪問面接やアンケート形式により、当該調査の協力者の夫々から、ライフスタイル（生活意識や態度）、価値観及びブランド意識に関する種々の情報を、協力者のデモグラフィック属性の情報と共に収集するものである。ＨＡＢＩＴにより生成される顧客（協力者）毎のシングルソースデータは、購買データ等には現れない顧客の特徴を表す。

　ハブデータベースＨに設けることのできる他のシングルソースデータの例としては、ＩＤ－ＰＯＳから得られる顧客の購買データを含むシングルソースデータや、アンケート形式で得られるマスメディアへの接触状況を表すシングルソースデータを挙げることができる。付言すれば、ハブデータベースＨには、これらの複数種類のシングルソースデータを、同一顧客のデータ毎に結合したデータを設けてもよい。

　ハブデータベースＨが備えるシングルソースデータは、顧客の特徴を表す特徴データに該当するものであり、加工後データベース１５５との結合のために、共通する顧客のデモグラフィック属性を表すパラメータを、加工後データベース１５５との間の共通パラメータとして有する。

　データフュージョン処理部５１０は、図８Ａに示すように、このハブデータベースＨに、データ加工装置１０から提供された各加工後データベース１５５を結合することにより、複数の加工後データベース１５５間を、ハブデータベースＨを介して結合する。結合方法は、上述した通りである。即ち、データフュージョン処理部５１０は、共通パラメータが表す特徴が類似する特徴データ同士を結合するようにして、ハブデータベースＨと、加工後データベース１５５の夫々とを結合する。

　結合データベース５５７は、例えば、ハブデータベースＨの特徴データと、それに結合される各加工後データベース１５５の特徴データとの関係を、上記実施例と同様に、それらの識別番号の関連付けによって表現する。図８Ｂに示す結合データベース５５７では、ハブデータベースＨの特徴データの識別番号（Ｈ００００１）に関連付けられて、この特徴データに結合される加工後データベース１５５Ａ，１５５Ｂの特徴データの識別番号（Ａ１２３４５，Ｂ０００４４）が記載されている。図８Ｂに示す標本数は、図６Ｃで説明した通りである。

　シングルソースデータは、顧客の特徴を良く表す。従って、顧客の特徴を表す特徴データとしてシングルソースデータを備えるハブデータベースＨを基準に、ハブデータベースＨと加工後データベース１５５の夫々とを結合すれば、加工後データベース１５５間の特徴データを一層適切に結びつけることができる。

　ＨＡＢＩＴ等のシングルソースデータには、顧客の特徴を表す多様な情報が含まれる。このようなシングルソースデータを備えるハブデータベースＨに対して、データ加工装置１０から提供された各加工後データベース１５５を結合する場合には、結合に用いる参照データを変更することができる。即ち、加工後データベース１５５が有する顧客の特徴を表すパラメータの種類に応じて、ハブデータベースＨと加工後データベース１５５との結合に用いる参照データを変更することができる。

　例えば、加工後データベース１５５が、顧客のネットワークコンテンツとの接触行動を表すパラメータを有する特徴データを備える場合、ハブデータベースＨと加工後データベース１５５との間には、共通パラメータとして、顧客のデモグラフィック属性を表すパラメータに加えて、又は、代えて、顧客のネットワークコンテンツとの接触行動を表すパラメータが含まれる。

　この場合には、共通パラメータが表す顧客のネットワークコンテンツとの接触行動が類似する特徴データ同士を結合するようにして、ハブデータベースＨと、加工後データベース１５５とを結合することができる。

　［第三実施例］
　第三実施例の情報処理システム１は、複数のデータ加工装置１０及びデータ結合装置５０を備える。データ加工装置１０及びデータ結合装置５０は、第一実施例及び第二実施例と同様のハードウェア構成にされる。以下では、第三実施例の情報処理システム１における第一実施例及び第二実施例と同様の構成及び処理内容についての説明を省略する。

　本実施例の情報処理システム１は、顧客関連データベース１５３として、図９Ａに示す顧客関連データベース１５３１Ｌ，１５３１Ｒを有する。図９Ａ左領域には、ＰＯＳシステムから得られた顧客の購買データを、顧客に関する特徴データとして有する顧客関連データベース１５３１Ｌの例を示す。図９Ａ右領域には、顧客が利用するデバイスの利用状況を表す特徴データを、顧客に関する特徴データとして有する顧客関連データベース１５３１Ｒの例を示す。デバイスの例としては、オーブンレンジが挙げられる。

　図９Ａによれば、顧客関連データベース１５３１Ｌは、決済毎の特徴データを備える。この特徴データは、顧客のデモグラフィック属性として、顧客の性別、年齢、及び居住地を表すパラメータを有する。更に、この特徴データは、顧客が購入した商品の購入場所、商品コード、購入数、及び、単価を表すパラメータを有する。商品コードは、例えば、ＪＡＮコードを含む。

　図９Ａによれば、顧客関連データベース１５３１Ｒは、オーブンレンジ毎の特徴データを備える。この特徴データは、オーブンレンジを所有する顧客の性別及び年齢を表すパラメータ、オーブンレンジの設置場所、並びに、オーブンレンジにおいて利用された時間帯別の機能及びレシピを表すパラメータを有する。

　顧客関連データベース１５３１Ｌを有するデータ加工装置１０は、この顧客関連データベース１５３１Ｌにおいて、例えば、性別、年齢及び購買履歴が類似する複数の特徴データをクラスタ化するように構成される。このデータ加工装置１０は、第一実施例と同様、クラスタ毎に、同一クラスタに属する複数の特徴データに対する統計処理を行うことにより、同一クラスタに属する複数の特徴データを統合した仮想顧客の特徴データをクラスタ毎に生成するように構成される。

　このようにして、データ加工装置１０は、顧客関連データベース１５３１Ｌに対応する、仮想顧客毎の特徴データを備える加工後データベース１５５を生成する。顧客関連データベース１５３１Ｌに対応する加工後データベース１５５が有する特徴データは、基本的に、顧客関連データベース１５３１Ｌの特徴データと同様のパラメータを有する。但し、加工後データベース１５５の特徴データは、パラメータ値として、対応するクラスタの統計量を示す。顧客ＩＤは、加工時に削除されてよい。

　別例として、データ加工装置１０は、顧客関連データベース１５３１Ｌが有する決済単位の特徴データを、同一の顧客ＩＤを示す特徴データ毎にまとめて、個人単位の特徴データに変換するように構成されてもよい。更に、データ加工装置１０は、個人単位の特徴データの集合に基づき、購買履歴が類似する複数の特徴データをクラスタ化及び統計処理することにより、顧客関連データベース１５３１Ｌに対応する加工後データベース１５５を生成するように構成されてもよい。

　顧客関連データベース１５３１Ｒを有する別のデータ加工装置１０は、顧客関連データベース１５３１Ｒにおいて、例えば、性別、年齢、並びに、機能及びレシピの利用状況が類似する複数の特徴データをクラスタ化するように構成される。更に、データ加工装置１０は、クラスタ毎に、同一クラスタに属する複数の特徴データを統計処理することにより、同一クラスタに属する複数の特徴データを統合した仮想デバイスの特徴データをクラスタ毎に生成するように構成される。データ加工装置１０は、このようにして顧客関連データベース１５３１Ｒに対応する、仮想デバイス毎の特徴データを備える加工後データベース１５５を生成する。

　データ結合装置５０は、上記顧客関連データベース１５３１Ｌに対応する加工後データベース１５５、及び、顧客関連データベース１５３１Ｒに対応する加工後データベース１５５を結合して、結合データベース５５７を生成するように構成される。

　データ結合装置５０は、加工後データベース１５５が共通して有する顧客の性別及び年齢を表すパラメータ、並びに、食材に関するパラメータを参照データとして用いて、結合対象の加工後データベース１５５間で、参照データが表す特徴が類似する特徴データ同士を結合するように、結合対象の加工後データベース１５５間を結合し得る。

　「食材に関するパラメータ」は、顧客関連データベース１５３１Ｌに対応する加工後データベース１５５において、特徴データが有する商品コード及び購入数を表すパラメータに対応する。顧客関連データベース１５３１Ｒに対応する加工後データベース１５５において、「食材に関するパラメータ」は、利用レシピに対応する。

　こうして生成される結合データベース５５７によれば、性別、年齢、購入食材、及び、レシピとの間の対応関係を分析することができる。従って、オーブンレンジを通じて、ユーザが良く購入する食材に対応するお勧めレシピを、ユーザに紹介することができる。また、ＰＯＳレジスタから出力するレシートに、利用頻度の高いレシピに対応する食材のクーポンを付すことができる。

　以上には、第三実施例として、顧客関連データベース１５３１Ｌ，１５３１Ｒの両者を、特徴が類似する特徴データ毎にクラスタ化して統計処理する例を説明した。しかしながら、顧客関連データベース１５３１Ｌ，１５３１Ｌの一方は、統計処理されなくてもよい。

　即ち、結合データベース５５７は、顧客関連データベース１５３１Ｌの加工後データベース１５５と、顧客関連データベース１５３１Ｒとを結合して生成されてもよいし、顧客関連データベース１５３１Ｌと、顧客関連データベース１５３１Ｒの加工後データベース１５５とを結合して生成されてもよい。前者の結合データベース５５７は、例えば、顧客関連データベース１５３１Ｒのデータ提供元に提供可能である。後者の結合データベース５５７は、例えば、顧客関連データベース１５３１Ｌのデータ提供元に提供可能である。

　［第四実施例］
　第四実施例の情報処理システム１は、第三実施例と同様、基本的には、顧客関連データベース１５３の構成が第一実施例及び第二実施例と異なるだけのシステムである。本実施例の情報処理システム１が備えるデータ加工装置１０及びデータ結合装置５０は、第一実施例及び第二実施例と同様のハードウェア構成にされる。

　以下では、第四実施例の情報処理システム１における第一実施例及び第二実施例と同様の構成及び処理内容についての説明を省略する。続いて説明される第五～第八実施例の情報処理システム１のハードウェア構成及び処理内容も、基本的には、第一実施例及び第二実施例と同様である。

　本実施例の情報処理システム１は、顧客関連データベース１５３として、図９Ｂに示す顧客関連データベース１５３２Ｌ，１５３２Ｒを有する。図９Ｂ左領域には、ＰＯＳシステムから得られた顧客の購買データを、顧客に関する特徴データとして有する顧客関連データベース１５３２Ｌの例を示す。図９Ｂ右領域には、自動販売機の利用状況を表す特徴データを、顧客に関する特徴データとして有する顧客関連データベース１５３２Ｒの例を示す。

　近年では、液晶ディスプレイ及びカメラを備えた飲料用自動販売機が知られている。この自動販売機は、カメラの撮影画像から、自動販売機の利用者の性別及び年齢を判別し、この判別結果に基づき、お勧め飲料を、液晶ディスプレイを通じて表示する機能を備える。以下に説明する結合データベース５５７は、自動販売機で表示するお勧め飲料の決定に役立つ。

　図９Ｂによれば、顧客関連データベース１５３２Ｌは、第三実施例の顧客関連データベース１５３１Ｌと同様に構成される。この顧客関連データベース１５３２Ｌは、飲料に関しての購買履歴を表す特徴データを備える。

　図９Ｂによれば、顧客関連データベース１５３２Ｒは、各自動販売機における飲料販売毎の特徴データを備える。この顧客関連データベース１５３２Ｒを構成する特徴データは、自動販売機の設置場所及びメーカーを表す。更に、この特徴データは、飲料販売時の気象及び時刻、並びに、購入者のデモグラフィック属性としての性別及び年齢を表す。更に、この特徴データは、購入者が購入した飲料の商品コード、購入数、及び、単価を表す。この他、特徴データは、販売時の在庫情報を表す。自動販売機の設置場所は、例えば、自動販売機が設置された地点の緯度経度で表される。

　顧客関連データベース１５３２Ｌを有するデータ加工装置１０は、例えば、顧客関連データベース１５３２Ｌにおいて、性別、年齢及び購買履歴が類似する複数の特徴データをクラスタ化し、第三実施例と同様に、顧客関連データベース１５３２Ｌに対応する加工後データベース１５５を生成するように構成される。

　顧客関連データベース１５３２Ｒを有するデータ加工装置１０は、例えば、顧客関連データベース１５３２Ｒにおける設置場所、メーカー及び在庫情報等が類似する複数の特徴データをクラスタ化する。そして、クラスタ毎に、同一クラスタに属する複数の特徴データに対する統計処理を行うことにより、同一クラスタに属する複数の特徴データを統合した仮想デバイス（自動販売機）の特徴データをクラスタ毎に生成するように構成される。

　データ加工装置１０は、このようにして、顧客関連データベース１５３２Ｒに対応する、仮想デバイス毎の特徴データを備える加工後データベース１５５を生成するように構成される。

　データ結合装置５０は、上記顧客関連データベース１５３２Ｌに対応する加工後データベース１５５、及び、顧客関連データベース１５３２Ｒに対応する加工後データベース１５５を結合して、結合データベース５５７を生成するように構成される。

　例えば、データ結合装置５０は、顧客の性別及び年齢を表すパラメータ、並びに、場所に関するパラメータを参照データとして用いて、結合対象の加工後データベース１５５間で、参照データが表す特徴が類似する特徴データ同士を結合するように、結合対象の加工後データベース１５５間を結合する。

　ここで言う「場所に関するパラメータ」は、顧客関連データベース１５３２Ｌに対応する加工後データベース１５５において、特徴データが有する購入場所を表すパラメータに対応する。顧客関連データベース１５３２Ｒに対応する加工後データベース１５５において、「場所に関するパラメータ」は、自動販売機の設置場所を表すパラメータに対応する。

　こうして生成される結合データベース５５７によれば、例えば、コンビニエンスストアやスーパーマーケット等の店舗での消費者の購買行動と、自動販売機での消費者の購買行動との間の対応関係を分析することができる。従って、この結合データベース５５７に基づいては、自動販売機において、自動販売機の前に立つ利用者の年齢及び性別に対応する購買層が同地域の店舗で良く購入する飲料を、その利用者にお勧めすることができる。店舗では、ＰＯＳレジスタから出力するレシートに、同地域の自動販売機で、購入者の年齢及び性別に対応する売れ筋の飲料のクーポンを付すことができる。

　第三実施例と同様に、顧客関連データベース１５３２Ｌ及び顧客関連データベース１５３２Ｒの一方は、統計処理されなくてもよい。即ち、結合データベース５５７は、顧客関連データベース１５３２Ｌの加工後データベース１５５と、顧客関連データベース１５３２Ｒとを結合したものであってもよいし、顧客関連データベース１５３２Ｌと、顧客関連データベース１５３２Ｒの加工後データベース１５５とを結合したものであってもよい。この技術的思想は、後述する第五～第八実施例に対しても適用することができる。

　［第五実施例］
　以下では、第五実施例の情報処理システム１における第一実施例及び第二実施例と同様の構成及び処理内容についての説明を省略する。本実施例の情報処理システム１は、顧客関連データベース１５３として、図１０Ａに示す顧客関連データベース１５３３Ｌ，１５３３Ｒを有する。

　図１０Ａ左領域には、スマートフォンに代表される携帯端末を所有するユーザの特徴を表す特徴データを、顧客に関する特徴データとして有する顧客関連データベース１５３３Ｌの例を示す。図１０Ａ右領域には、駅の利用状況を表す特徴データを、顧客に関する特徴データとして有する顧客関連データベース１５３３Ｒの例を示す。

　図１０Ａによれば、顧客関連データベース１５３３Ｌは、携帯端末毎に特徴データを有する。この特徴データは、携帯端末を所有するユーザのデモグラフィック属性として性別、年齢及び居住地を表す。更に、この特徴データは、ユーザの移動履歴、及び、各移動地点の気象を表す。更に、この特徴データは、携帯端末にインストールされたアプリケーションプログラムを通じて、ユーザにより利用されたクーポンの利用状況を表す。

　顧客関連データベース１５３３Ｒは、駅、改札口、気象、及び時間帯の組合せ毎に、特徴データを有する。この顧客関連データベース１５３３Ｒを構成する特徴データは、対応する駅及び改札口の通行データとして、この改札口の通行人の性別及び年齢、並びに、通行時間帯及び通行時の気象を表す。通行人の性別及び年齢は、定期券の情報から、又は、カメラによる撮影画像から得ることができる。

　顧客関連データベース１５３３Ｌを有するデータ加工装置１０は、例えば、顧客関連データベース１５３３Ｌにおいて、性別、年齢、移動状況及びクーポン利用状況が類似する複数の特徴データをクラスタ化する。そして、クラスタ毎に、同一クラスタに属する複数の特徴データに対する統計処理を行うことにより、同一クラスタに属する複数の特徴データを統合した仮想携帯端末の特徴データをクラスタ毎に生成する。このようにして、データ加工装置１０は、顧客関連データベース１５３３Ｌに対応する、仮想携帯端末毎の特徴データを備える加工後データベース１５５を生成する。

　顧客関連データベース１５３３Ｒを有するデータ加工装置１０は、顧客関連データベース１５３３Ｒにおいて、特徴が類似する特徴データをクラスタ化する。そして、クラスタ毎に上記統計処理を行うことにより、駅、改札口、気象及び時間対の組合せについての仮想組合せ毎の特徴データを備える加工後データベース１５５を生成する。

　データ結合装置５０は、上記顧客関連データベース１５３３Ｌに対応する加工後データベース１５５、及び、顧客関連データベース１５３３Ｒに対応する加工後データベース１５５を結合して、結合データベース５５７を生成するように構成される。

　例えば、データ結合装置５０は、加工後データベース１５５が共通して有する性別及び年齢を表すパラメータ、並びに、場所及び気象に関するパラメータを参照データとして用いて、結合対象の加工後データベース１５５間で、参照データが表す特徴が類似する特徴データ同士を結合するように、結合対象の加工後データベース１５５間を結合する。

　こうして生成される結合データベース５５７によれば、例えば、駅周辺での消費者の行動及びクーポン利用状況と、駅及び改札口における通行人の傾向との間の対応関係を分析することができる。従って、この結合データベース５５７に基づいては、改札口を通過したユーザの携帯端末に、駅周辺店舗の利用促進を目的としたクーポンを適切に配信することができる。

　［第六実施例］
　以下では、第六実施例の情報処理システム１における第一実施例及び第二実施例と同様の構成及び処理内容についての説明を省略する。本実施例の情報処理システム１は、顧客関連データベース１５３として、図１０Ｂに示す顧客関連データベース１５３４Ｌ，１５３４Ｒを有する。

　図１０Ｂ左領域には、ＥＴＣカードを所有する顧客の特徴データを有する顧客関連データベース１５３４Ｌの例を示す。ＥＴＣカードは、日本国において普及している、有料道路網における電子料金収受（ＥＴＣ）システム用のクレジットカードである。図１０Ｂ右領域には、インターチェンジ及び通行ゲートの組合せ毎の特徴データを、顧客に関する特徴データとして有する顧客関連データベース１５３４Ｒの例を示す。

　顧客関連データベース１５３４Ｌは、ＥＴＣカード毎に特徴データを有する。この特徴データは、ＥＴＣカードに関連付けられた車載器のＩＤを表す。また、この特徴データは、ＥＴＣカードを所有する顧客の性別、年齢及び居住地を表す。更に、この特徴データは、通行ゲートのＩＤ及び通行日時を表す。

　顧客関連データベース１５３４Ｒを構成する特徴データは、対応するインターチェンジの対応する通行ゲートを通行した車両のＥＴＣカード番号、車載器ＩＤ、及び通行日時を表す。更に、この特徴データは、通行車両数及び周辺施設情報を有する。

　顧客関連データベース１５３４Ｌを有するデータ加工装置１０は、例えば、顧客関連データベース１５３４Ｌにおいて、性別、年齢及び移動状況が類似する複数の特徴データをクラスタ化する。そして、クラスタ毎に、同一クラスタに属する複数の特徴データに対する統計処理を行うことにより、同一クラスタに属する複数の特徴データを統合した仮想顧客（カード）毎の特徴データをクラスタ毎に生成する。このようにして、データ加工装置１０は、顧客関連データベース１５３４Ｌに対応する、仮想顧客（カード）毎の特徴データを備える加工後データベース１５５を生成する。

　顧客関連データベース１５３４Ｒを有するデータ加工装置１０は、顧客関連データベース１５３４Ｒにおいて、特徴が類似する特徴データをクラスタ化する。そして、クラスタ毎に上記統計処理を行うことにより、仮想通行ゲート毎の特徴データを備える加工後データベース１５５を生成する。

　データ結合装置５０は、これらの顧客関連データベース１５３４Ｌに対応する加工後データベース１５５、及び、顧客関連データベース１５３４Ｒに対応する加工後データベース１５５を結合して、結合データベース５５７を生成するように構成される。

　こうして生成される結合データベース５５７に基づけば、カーナビゲーション装置等の車載器又はクレジットカード会社を通じて、顧客に対し、通行ゲート周辺の施設の利用促進を目的としたクーポンを適切に配信することができる。

　［第七実施例］
　以下では、第七実施例の情報処理システム１における第一実施例及び第二実施例と同様の構成及び処理内容についての説明を省略する。本実施例の情報処理システム１は、顧客関連データベース１５３として、図１１Ａに示す顧客関連データベース１５３５Ｌ，１５３５Ｒを有する。

　図１１Ａ左領域には、ディジタルサイネージ毎に、ディジタルサイネージの前を通過する通行人毎の特徴データを、顧客に関する特徴データとして有する顧客関連データベース１５３５Ｌの例を示す。図１１Ａ右領域には、各駅の改札口毎に、改札口を通行する通行人毎の特徴データを、顧客に関する特徴データとして有する顧客関連データベース１５３５Ｒの例を示す。

　図１１Ａによれば、顧客関連データベース１５３５Ｌが有する特徴データは、ディジタルサイネージの設置場所を表す。また、この特徴データは、通行人の性別、年齢及び通行日時を表す。通行人の性別及び年齢は、ディジタルサイネージ又はその付近に設置されたカメラによる撮影画像から判別することができる。この特徴データは、更に、ディジタルサイネージ付近の時間帯別通行人数、時間帯別のディジタルサイネージの視聴者数、及び、時間帯別の出稿情報を表すデータであってもよい。

　顧客関連データベース１５３５Ｒが有する通行人毎の特徴データは、通行人の性別、年齢及び通行日時、並びに、通行改札口のＩＤ及び当該改札口を有する駅のＩＤを表す。
　顧客関連データベース１５３５Ｌを有するデータ加工装置１０は、例えば、顧客関連データベース１５３５Ｌにおいて、通行人の特徴が類似する特徴データをクラスタ化する。そして、クラスタ毎に、同一クラスタに属する複数の特徴データに対する統計処理を行うことにより、同一クラスタに属する複数の特徴データを統合した仮想通行人の特徴データをクラスタ毎に生成する。このようにして、データ加工装置１０は、顧客関連データベース１５３５Ｌに対応する仮想通行人毎の特徴データを備える加工後データベース１５５を生成する。

　顧客関連データベース１５３５Ｒを有するデータ加工装置１０は、例えば、顧客関連データベース１５３５Ｒにおいて、通行人の特徴が類似する特徴データをクラスタ化する。そして、クラスタ毎に上記統計処理を行うことにより、仮想通行人毎の特徴データを備える加工後データベース１５５を生成する。

　データ結合装置５０は、顧客関連データベース１５３５Ｌに対応する加工後データベース１５５、及び、顧客関連データベース１５３５Ｒに対応する加工後データベース１５５を結合して、結合データベース５５７を生成するように構成される。

　例えば、データ結合装置５０は、加工後データベース１５５が共通して有する通行人の性別及び年齢を表すパラメータ、並びに、場所に関するパラメータを参照データとして用いて、結合対象の加工後データベース１５５間で、参照データが表す特徴が類似する特徴データ同士を結合するように、結合対象の加工後データベース１５５間を結合する。

　「場所に関するパラメータ」は、顧客関連データベース１５３５Ｌに対応する加工後データベース１５５において、特徴データが有するディジタルサイネージの設置場所を表すパラメータに対応する。顧客関連データベース１５３５Ｒに対応する加工後データベース１５５において、「場所に関するパラメータ」は、駅及び改札口を表すパラメータに対応する。

　こうして生成される結合データベース５５７によれば、例えば、改札口の通行人と、ディジタルサイネージ前の通行人との対応関係を分析することができる。従って、改札口の通行人の変化に合わせて、ディジタルサイネージに表示させる広告を適切に切り替えることができる。

　［第八実施例］
　以下では、第八実施例の情報処理システム１における第一実施例及び第二実施例と同様の構成及び処理内容についての説明を省略する。本実施例の情報処理システム１は、顧客関連データベース１５３として、図１１Ｂに示す顧客関連データベース１５３６Ｌ，１５３６Ｒを有する。

　図１１Ｂ左領域には、カメラによる監視エリアに映った通行人毎の特徴データを、顧客に関する特徴データとして有する顧客関連データベース１５３６Ｌの例を示す。図１１Ｂ右領域には、飲料用自動販売機の利用状況を表す特徴データを、顧客に関する特徴データとして有する顧客関連データベース１５３６Ｒの例を示す。

　図１１Ｂによれば、顧客関連データベース１５３６Ｌが有する特徴データは、通行人が映った場所（監視エリア）及び時間帯を表す。また、この特徴データは、通行人の性別及び年齢を表す。更に、特徴データは、通行人の滞留時間又は通行時間を表すものであってもよい。

　顧客関連データベース１５３６Ｒは、各自動販売機における飲料販売毎の特徴データを備える。この顧客関連データベース１５３６Ｒを構成する特徴データは、第四実施例における顧客関連データベース１５３２Ｒが有する特徴データと同様に構成される。

　顧客関連データベース１５３６Ｌを有するデータ加工装置１０は、顧客関連データベース１５３６Ｌにおいて、通行人の特徴が類似する特徴データをクラスタ化する。そして、クラスタ毎に、同一クラスタに属する複数の特徴データに対する統計処理を行うことにより、同一クラスタに属する複数の特徴データを統合した仮想通行人の特徴データをクラスタ毎に生成する。このようにして、データ加工装置１０は、顧客関連データベース１５３６Ｌに対応する、仮想通行人毎の特徴データを備える加工後データベース１５５を生成する。

　顧客関連データベース１５３６Ｒを有するデータ加工装置１０は、顧客関連データベース１５３６Ｒにおいて、購入者の特徴が類似する特徴データ毎にクラスタ化して、仮想購入者毎の特徴データを備える加工後データベース１５５を生成する。

　データ結合装置５０は、顧客関連データベース１５３６Ｌに対応する加工後データベース１５５、及び、顧客関連データベース１５３６Ｒに対応する加工後データベース１５５を結合して、結合データベース５５７を生成するように構成される。

　例えば、データ結合装置５０は、これら加工後データベース１５５が共通して有する性別及び年齢を表すパラメータ、並びに、場所に関するパラメータを参照データとして用いて、結合対象の加工後データベース１５５間で、参照データが表す特徴が類似する特徴データ同士を結合するように、結合対象の加工後データベース１５５間を結合する。「場所に関するパラメータ」は、顧客関連データベース１５３６Ｌに対応する加工後データベース１５５において、特徴データが有する通行人が映った場所を表すパラメータに対応する。顧客関連データベース１５３６Ｒに対応する加工後データベース１５５において、「場所に関するパラメータ」は、自動販売機の設置場所を表すパラメータに対応する。

　こうして生成される結合データベース５５７によれば、例えば、通行人の分布及び滞留時間と、自動販売機の購買行動との対応関係を分析することができる。この分析結果は、自動販売機の在庫管理、品揃え、及び、お勧め表示に役立てることができる。

　［その他］
　本開示は、上記実施例に限定されるものではなく、種々の態様を採ることができる。例えば、上記実施例では、結合対象のデータベース（加工後データベース１５５又は顧客関連データベース１５３）間の顧客グループが一致しない例について説明した。しかしながら、同一顧客グループについての異なる種類の特徴を表すデータベース間を結合するために、本開示の技術は、用いられてもよい。例えば、同一顧客グループについてのコンビニエンスストアにおける購買データと、スーパーマーケットにおける購買データと、を結合するために、本開示の技術が用いられてもよい。特許請求の範囲に記載の文言から特定される技術思想に含まれるあらゆる態様が本開示の実施形態である。

　最後に用語間の対応関係について説明する。データ加工装置１０が備える演算部１１（特にクラスタリング処理部１１０及び加工処理部１１５）は、生成ユニットの一例に対応する。データ結合装置５０が備える演算部５１（特にデータフュージョン処理部５１０）は、結合ユニットの一例に対応する。データ結合装置５０が備える記憶部５５は、記憶ユニットの一例に対応する。データベース（顧客関連データベース１５３／加工後データベース１５５）を構成する特徴データの集合、又は、この集合に対応する人、物（例えば携帯端末／自動販売機／オーブンレンジ／カード）、若しくは、場所（例えば改札口／通行ゲート）の集合は、グループの一例に対応する。この集合の要素は、構成体の一例に対応する。

Claims

　第一のデータベース及び第二のデータベースを記憶するように構成される記憶ユニットと、
　前記記憶ユニットが記憶する前記第一のデータベースと前記第二のデータベースとを結合するように構成される結合ユニットと、
　を備え、
　前記第一のデータベースは、第一のグループの構成体毎の特徴データに基づき、特徴が一致又は類似する複数の構成体の特徴データを統計処理により統合した仮想構成体毎の特徴データを備えるデータベースであり、
　前記第二のデータベースは、前記第一のグループとは同一又は別のグループとしての第二のグループにおける構成体毎の特徴データを備えるデータベースであり、
　前記第一及び前記第二のデータベースが備える前記特徴データの夫々は、前記結合時に参照される参照データであって、前記第一のデータベースと前記第二のデータベースとの間で共通する種類の特徴を表す参照データを含み、
　前記結合ユニットは、前記第一のデータベースと前記第二のデータベースとの間で前記参照データが表す前記特徴が一致又は類似する前記特徴データ同士を結合するように、前記第一のデータベースと前記第二のデータベースとを結合する情報処理システム。
　前記第一のグループの構成体毎の特徴データに基づき、前記第一のデータベースを生成するように構成される生成ユニット
　を更に備える請求項１記載の情報処理システム。
　前記生成ユニットは、前記第一のグループに関する前記特徴データの集合を、前記特徴が一致又は類似する複数の特徴データ毎に分けるようにクラスタ化し、クラスタ毎に、前記クラスタに対応する前記複数の特徴データを統計処理して、前記複数の特徴データが有する各パラメータについての統計量を算出することにより、前記統計量を、前記特徴を表すパラメータ値として含む前記クラスタの夫々に対応する前記仮想構成体毎の特徴データを生成する請求項２記載の情報処理システム。
　前記第二のデータベースが備える前記構成体毎の前記特徴データは、前記第一のグループとは同一又は別のグループの構成体毎の特徴データに基づき、特徴が一致又は類似する複数の構成体の特徴データを統計処理により統合した仮想構成体毎の特徴データである請求項１～請求項３のいずれか一項記載の情報処理システム。
　前記生成ユニットを、第一の生成ユニットとして備え、
　前記第一のグループとは同一又は別のグループの構成体毎の特徴データに基づき、前記第二のデータベースを生成するように構成される第二の生成ユニットを更に備える請求項２又は請求項３記載の情報処理システム。
　前記第二のデータベースは、前記特徴データとしてシングルソースデータを備えるデータベースである請求項１～請求項３のいずれか一項記載の情報処理システム。
　前記第一及び前記第二のグループの夫々は、人、物、サービス、及び場所の少なくとも一つの集合であり、前記構成体は、前記集合の要素である請求項１～請求項５のいずれか一項記載の情報処理システム。
　前記第一のグループ及び前記第二のグループの一方は、人の集合であり、前記第一のグループ及び前記第二のグループの他方は、人に関連する物、サービス、及び場所の少なくとも一つの集合である請求項７記載の情報処理システム。
　前記第一及び前記第二のグループの夫々は、人に関連する物、サービス、及び場所の少なくとも一つの集合である請求項７記載の情報処理システム。
　複数のデータベースを記憶するように構成される記憶ユニットと、
　前記記憶ユニットが記憶する前記複数のデータベースを結合するように構成される結合ユニットと、
　を備え、
　前記データベースの夫々は、互いに同一又は異なるグループについてのデータベースであり、対応する前記グループの構成体毎の特徴データに基づき、特徴が一致又は類似する複数の構成体の特徴データを統計処理により統合した仮想構成体毎の特徴データを備えるデータベースであり、
　前記複数のデータベースが備える前記特徴データの夫々は、前記データベースの結合時に参照される参照データであって、結合対象の前記データベースと共通する種類の特徴を表す参照データを含み、
　前記結合ユニットは、前記複数のデータベース間で、前記参照データが表す前記特徴が一致又は類似する前記特徴データ同士を結合するように、前記複数のデータベースを結合する情報処理システム。
　前記複数のデータベースを生成するように構成されるデータベース毎の生成ユニット
　を備え、
　前記生成ユニットの夫々は、対応する前記グループの構成体毎の特徴データに基づき、前記データベースとして、特徴が一致又は類似する複数の構成体の特徴データを統計処理により統合した仮想構成体毎の特徴データを備えるデータベースを生成する請求項１０記載の情報処理システム。
　前記生成ユニットの夫々は、前記グループに関する前記特徴データの集合を、前記特徴が一致又は類似する複数の特徴データ毎に分けるようにクラスタ化し、クラスタ毎に、前記クラスタに対応する前記複数の特徴データを統計処理して、前記複数の特徴データが有する各パラメータについての統計量を算出することにより、前記統計量を、前記特徴を表すパラメータ値として含む前記クラスタの夫々に対応する前記仮想構成体毎の特徴データを生成する請求項１１記載の情報処理システム。
　前記結合ユニットは、前記複数のデータベース間を、前記複数のデータベースとは同一又は異なるグループについてのデータベースであって、前記グループの構成体毎に特徴データとしてシングルソースデータを備える特定種のデータベースを介して結合する構成にされ、
　前記シングルソースデータは、前記データベースの結合時に参照される参照データであって、結合対象の前記データベースと共通する種類の特徴を表す参照データを含み、
　前記結合ユニットは、前記参照データが表す前記特徴が一致又は類似する前記特徴データ同士を結合するように、前記特定種のデータベースと、それ以外の前記データベースの夫々とを結合することにより、前記複数のデータベース間を、前記特定種のデータベースを介して結合する請求項１０～請求項１２のいずれか一項記載の情報処理システム。
　請求項１～請求項１３のいずれか一項記載の情報処理システムにおける前記結合ユニットとして、コンピュータを機能させるためのプログラム。
　請求項２、請求項３、請求項１１及び請求項１２のいずれか一項記載の情報処理システムにおける前記生成ユニットとして、コンピュータを機能させるためのプログラム。
　請求項１４又は請求項１５記載のプログラムを記録したコンピュータ読取可能な記録媒体。
　第一のグループの構成体毎の特徴データに基づき、特徴が一致又は類似する複数の構成体の特徴データを統計処理により統合した仮想構成体毎の特徴データを備える第一のデータベースを生成又は取得する手順と、
　前記第一のグループとは同一又は別のグループとしての第二のグループにおける構成体毎の特徴データを備える第二のデータベースを生成又は取得する手順と、
　前記第一のデータベースと前記第二のデータベースとを結合する手順と、
　を含み、
　前記第一及び前記第二のデータベースが備える前記特徴データの夫々は、前記結合時に参照される参照データであって、前記第一のデータベースと前記第二のデータベースとの間で共通する種類の特徴を表す参照データを含み、
　前記結合する手順は、前記第一のデータベースと前記第二のデータベースとの間で前記参照データが表す前記特徴が一致又は類似する前記特徴データ同士を結合するように、前記第一のデータベースと前記第二のデータベースとを結合する手順であるデータベース結合方法。