JP2010286868A - コミュニティ形成システム、そのコミュニティ形成装置、そのデータ処理方法およびコンピュータプログラム - Google Patents

コミュニティ形成システム、そのコミュニティ形成装置、そのデータ処理方法およびコンピュータプログラム Download PDF

Info

Publication number
JP2010286868A
JP2010286868A JP2009137901A JP2009137901A JP2010286868A JP 2010286868 A JP2010286868 A JP 2010286868A JP 2009137901 A JP2009137901 A JP 2009137901A JP 2009137901 A JP2009137901 A JP 2009137901A JP 2010286868 A JP2010286868 A JP 2010286868A
Authority
JP
Japan
Prior art keywords
community
cluster
users
attribute
clusters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009137901A
Other languages
English (en)
Inventor
Masahiro Kawato
正裕 川戸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009137901A priority Critical patent/JP2010286868A/ja
Publication of JP2010286868A publication Critical patent/JP2010286868A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】今まで接点のなかったユーザ同士をメンバーに含むようなコミュニティを形成することができるコミュニティ形成システムを提供する。
【解決手段】コミュニケーションサービスを利用する複数のユーザごとに少なくとも所属グループと各種のプロフィール情報とを属性名と属性値のペアからなる集合として表現したユーザ情報310を、ユーザ間でのメッセージの送信者と受信者の情報を含むメッセージログ320とともに記憶する。この状態でメッセージログ320でコミュニケーションが頻繁な複数のユーザの集合をクラスタとし、複数のクラスタから新規クラスタ形成の基になるクラスタ対の候補を選択する。この選択されたクラスタ対のユーザ情報310からコミュニティを特徴付けるよう共通するトピック属性を検出する。この検出されたトピック属性で対象のクラスタ対を選択的に併合してコミュニティを形成する。
【選択図】図1

Description

本発明は、ユーザの集まりをコミュニティとして顕在化するコミュニティ形成システムに関し、特に既存の活発なコミュニティを併合するためのトピックを検出するコミュニティ形成システム、そのコミュニティ形成装置、そのデータ処理方法およびコンピュータプログラム、に関する。
現在提案されているコミュニティ形成システムは、例えば、図10に示すように、各ユーザが使用するパーソナルコンピュータ(PC)110、それらのPC110に各種の情報処理サービスを提供するメールサーバ120、ローカルエリアネットワーク(LAN)100内のユーザやインターネット上のユーザのウェブ(Web)ページを提供するウェブサーバ130、PC110上のユーザに対して電子メールの送受信サービスを提供するメールサーバ140、コミュニティ形成装置200から構成されている。
ここで、コミュニティ形成装置200は、メール監視部152、分析部154、サービス登録部156を備える。このような構成を有する従来のコミュニティ形成システムは次のように動作する。
メール監視部152は、LAN100上に流れる電子メールのヘッダ情報および本文の引用情報を元に、当該電子メールの転送関係を抽出する。ここで、転送関係とは、当該電子メールを受け取ってきたユーザの履歴を指す。
分析部154は、メール監視部152によって抽出されたメール転送関係およびメール中のキーワードを元に、共通の話題を持つユーザの集まりをコミュニティとして抽出する。
サービス登録部156は、抽出されたコミュニティのためのウェブページを開設し、コミュニティの各メンバーに対して開設を通知する。この従来のコミュニティ形成システムは、すでに相互作用が行われているユーザの集まりをコミュニティとして顕在化することで、コミュニティの形成や成長を支援するものである(例えば、特許文献1参照)。
特開2005−244647号公報
しかし、上述のようなコミュニティ形成システムでは、今まで接点のなかったユーザ同士を含むコミュニティを形成することが困難である。その理由は、コミュニティの抽出をユーザ同士の過去のコミュニケーション履歴に基づいて行うために、過去に接点のなかったユーザ同士は同一コミュニティには入らないためである。
より単純な方法として、ユーザのプロフィール情報を参照して、類似した属性を持つユーザの集まりをコミュニティとして抽出する方法もありうる。しかし、そのような方法では過去のコミュニケーション履歴は考慮されないので、形成されたコミュニティ上で活発なやりとりが行われることは期待できない。
また、上述のようなコミュニティ形成システムでは、異なるグループ同士を結び付ける形でコミュニティを形成することも困難である。ここで、グループとは、例えば企業における従業員の所属部門のように、特定の属性に基づいて集められたユーザの集団を指す。その理由は、コミュニティを形成するときに、その構成員であるユーザの所属情報が考慮されないためである。
本発明は上述のような課題に鑑みてなされたものであり、今まで接点のなかったユーザ同士をメンバーに含むようなコミュニティを形成することができ、異なるグループ同士を結び付ける形でコミュニティを形成することができる、コミュニティ形成システム、そのコミュニティ形成装置、そのデータ処理方法およびコンピュータプログラム、を提供するものである。
本発明のコミュニティ形成システムは、コミュニケーションサービスを利用する複数のユーザごとに少なくとも所属グループと各種のプロフィール情報とを属性名と属性値のペアからなる集合として表現したユーザ情報を、複数のユーザ間でのメッセージの送信者と受信者の情報を含むメッセージログとともに記憶するデータ記憶装置と、メッセージログでコミュニケーションが頻繁な複数のユーザの集合をクラスタとして、複数のクラスタから新規クラスタ形成の基になるクラスタ対の候補を選択するクラスタ検出手段と、選択されたクラスタ対のユーザ情報からコミュニティを特徴付けるよう共通するトピック属性を検出するクラスタ対比較手段と、検出されたトピック属性を用いて対象のクラスタ対を選択的に併合してコミュニティを形成するコミュニティ選択手段と、を有する。
本発明のコミュニティ形成装置は、本発明のコミュニティ形成システムのコミュニティ形成装置であって、メッセージログでコミュニケーションが頻繁な複数のユーザの集合をクラスタとして、複数のクラスタから新規クラスタ形成の基になるクラスタ対の候補を選択するクラスタ検出手段と、選択されたクラスタ対のユーザ情報からコミュニティを特徴付けるよう共通するトピック属性を検出するクラスタ対比較手段と、検出されたトピック属性を用いて対象のクラスタ対を選択的に併合してコミュニティを形成するコミュニティ選択手段と、を有する。
本発明のコンピュータプログラムは、本発明のコミュニティ形成装置のためのコンピュータプログラムであって、メッセージログでコミュニケーションが頻繁な複数のユーザの集合をクラスタとして、複数のクラスタから新規クラスタ形成の基になるクラスタ対の候補を選択するクラスタ検出処理と、選択されたクラスタ対のユーザ情報からコミュニティを特徴付けるよう共通するトピック属性を検出するクラスタ対比較処理と、検出されたトピック属性を用いて対象のクラスタ対を選択的に併合してコミュニティを形成するコミュニティ選択処理と、をコミュニティ形成装置に実行させる。
本発明のデータ処理方法は、本発明のコミュニティ形成装置のデータ処理方法であって、メッセージログでコミュニケーションが頻繁な複数のユーザの集合をクラスタとして、複数のクラスタから新規クラスタ形成の基になるクラスタ対の候補を選択するクラスタ検出動作と、選択されたクラスタ対のユーザ情報からコミュニティを特徴付けるよう共通するトピック属性を検出するクラスタ対比較動作と、検出されたトピック属性を用いて対象のクラスタ対を選択的に併合してコミュニティを形成するコミュニティ選択動作と、を有するデータ処理方法。
なお、本発明の各種の構成要素は、その機能を実現するように形成されていればよく、例えば、所定の機能を発揮する専用のハードウェア、所定の機能がコンピュータプログラムにより付与されたコミュニティ形成システム、コンピュータプログラムによりコミュニティ形成システムに実現された所定の機能、これらの任意の組み合わせ、等として実現することができる。
また、本発明の各種の構成要素は、必ずしも個々に独立した存在である必要はなく、複数の構成要素が一個の部材として形成されていること、一つの構成要素が複数の部材で形成されていること、ある構成要素が他の構成要素の一部であること、ある構成要素の一部と他の構成要素の一部とが重複していること、等でもよい。
また、本発明のコンピュータプログラムおよびデータ処理方法は、複数の処理および動作を順番に記載してあるが、その記載の順番は複数の処理および複数の動作を実行する順番を限定するものではない。
このため、本発明のコンピュータプログラムおよびデータ処理方法を実施するときには、その複数の処理および複数の動作の順番は内容的に支障しない範囲で変更することができる。
さらに、本発明のコンピュータプログラムおよびデータ処理方法は、複数の処理および複数の動作が個々に相違するタイミングで実行されることに限定されない。このため、ある処理および動作の実行中に他の処理および動作が発生すること、ある処理および動作の実行タイミングと他の処理および動作の実行タイミングとの一部ないし全部が重複していること、等でもよい。
本発明のコミュニティ形成システムでは、コミュニケーションサービスを利用する複数のユーザごとに少なくとも所属グループと各種のプロフィール情報とを属性名と属性値のペアからなる集合として表現したユーザ情報を、ユーザ間でのメッセージの送信者と受信者の情報を含むメッセージログとともにデータ記憶装置が記憶する。このような状態で、メッセージログでコミュニケーションが頻繁なユーザの集合をクラスタとして、複数のクラスタから新規クラスタ形成の基になるクラスタ対の候補をクラスタ検出手段が選択する。このように選択されたクラスタ対のユーザ情報からコミュニティを特徴付けるよう共通するトピック属性をクラスタ対比較手段が検出する。この検出されたトピック属性を用いて対象のクラスタ対をコミュニティ選択手段が選択的に併合してコミュニティを形成する。従って、今まで接点のなかったユーザ同士をメンバーに含むようなコミュニティを形成することができ、異なるグループ同士を結び付ける形でコミュニティを形成することができる。
本発明の実施の形態のコミュニティ形成システムの論理構造を示す模式的なブロック図である。 ユーザ情報のデータ構造を示す模式図である。 メッセージログに格納されるデータ構造を示す模式図である。 本発明の全体の動作を説明する模式的なブロック図である。 クラスタ検出手段の動作手順を説明するフローチャートである。 クラスタ検出手段およびコミュニティ選択手段のデータ構造を説明する模式的なブロック図である。 クラスタ対比較手段の動作手順を説明するフローチャートである。 クラスタ対比較手段およびコミュニティ選択手段のデータ構造を説明する模式図である。 コミュニティ選択手段の動作手順を説明するフローチャートである。 従来のコミュニティ形成支援システムの構成を示すブロック図である。
本発明の実施の一形態を図面を参照して以下に説明する。本発明の実施の形態のコミュニティ形成システムは、図1を参照すると、コミュニケーションサービスを利用する複数のユーザごとに少なくとも所属グループと各種のプロフィール情報とを属性名と属性値のペアからなる集合として表現したユーザ情報310を、複数のユーザ間でのメッセージの送信者と受信者の情報を含むメッセージログ320とともに記憶するデータ記憶装置300と、メッセージログ320でコミュニケーションが頻繁な複数のユーザの集合をクラスタとして、複数のクラスタから新規クラスタ形成の基になるクラスタ対の候補を選択するクラスタ検出手段210と、選択されたクラスタ対のユーザ情報310からコミュニティを特徴付けるよう共通する属性値として検出するクラスタ対比較手段220と、検出されたトピック属性を用いて対象のクラスタ対を選択的に併合してコミュニティを形成するコミュニティ選択手段230と、を有する。
より具体的には、本実施の形態のコミュニティ形成システムは、コミュニケーションサーバ1100と、コミュニティ形成装置200と、データ記憶装置300と、少なくとも一個の利用者端末400と、少なくとも一個の管理者端末500と、を備える。
このうち、コミュニケーションサーバ1100、コミュニティ形成装置200、利用者端末400、管理者端末500は、プログラム制御により動作するコンピュータである。コミュニケーションサーバ1100と、コミュニティ形成装置200と、利用者端末400と、管理者端末500は、通信ネットワーク600を介して相互に接続される。
ここで、通信ネットワーク600はイーサネット(Ethernet、登録商標)などのローカルエリアネットワーク(LAN)でもよいし、インターネット(the Internet)などの広域ネットワーク(WAN)でもよい。
利用者端末400および管理者端末500は、典型的にはWebブラウザが動作するパーソナルコンピュータであって、HTTP(Hypertext Transfer Protocol)などの通信プロトコルを介してコミュニケーションサーバ1100およびコミュニティ形成装置200との間で通信する。
コミュニケーションサーバ1100と、コミュニティ形成装置200は、同一のデータ記憶装置300に接続される。データ記憶装置300の一例は、NFS(Network File System)プロトコルを用いてファイルへの読み書きが行われるNAS(Network Attached Storage)装置である。
図1では、これらの構成要素間は専用のネットワークを用いて相互に接続されるが、通信ネットワーク600に直接にデータ記憶装置300が接続される形態でもよい。本実施の形態のコミュニティ形成システムでは、データ記憶装置300内に、ユーザ情報310とメッセージログ320が事前に格納されていることを前提とする。
ユーザ情報310とは、コミュニケーションサービスの各利用者(ユーザ)について、所属グループと、その他のプロフィール情報を、属性名と属性値のペアからなる集合として表現したものである。
メッセージログ320とは、ユーザ間で過去にコミュニケーションサーバ1100を通して送受信されたメッセージの記録であり、各メッセージについて送信者と受信者の情報を含む。
コミュニケーションサーバ1100は、ユーザ登録手段1110と、メッセージ送受信手段1120とを含む。ユーザ登録手段1110は、利用者端末400を通して、新規ユーザの情報を受け取り、その内容をデータ記憶装置300内にユーザ情報310として格納する。
メッセージ送受信手段1120は、利用者端末400を通してユーザから入力されたメッセージを受け取るとともに、他の利用者端末400からの要求に対してそのメッセージを送信することにより、複数の利用者端末400間でメッセージを配布する。さらに、メッセージ送受信手段1120は、利用者端末400から受け取ったメッセージの内容を、データ記憶装置300内にメッセージログ320として蓄積する。
コミュニケーションサーバ1100の具体例は、既存のブログ(Blog)ソフトウェアが動作するサーバ装置であり、ブログソフトウェアの機能としてユーザ登録手段1110およびメッセージ送受信手段1120を備える。
コミュニティ形成装置200は、クラスタ検出手段210と、クラスタ対比較手段220と、コミュニティ選択手段230と、を含む。クラスタ検出手段210は、データ記憶装置300内のメッセージログ320から、密にコミュニケーションが行われているユーザの集まり、すなわちクラスタを抽出し、クラスタ検出手段210により抽出されたクラスタの中から、新規クラスタ形成の基になるクラスタ対の候補を選択する。
本実施の形態のコミュニティ形成システムは、ユーザ情報310とメッセージログ320を入力して受け取り、クラスタ検出手段210、クラスタ対比較手段220、コミュニティ選択手段230を順に適用することにより、新規コミュニティを構成するユーザのリストと、そのコミュニティのトピック(話題)を出力する。
クラスタ検出手段210は、メッセージログ320の情報から、過去にメッセージのやりとりを頻繁に行ったユーザの集まりを抽出する。前述の特許文献1では、同様の手順で抽出されたユーザの集まりをコミュニティと呼称しているが、ここでは後述のコミュニティ選択手段230によって形成するコミュニティと区別するために、クラスタ(Cluster)と呼称する。
クラスタ対比較手段220は、クラスタ対の候補に含まれるユーザについて、データ記憶装置300に格納されているユーザ情報310を参照して、共通するトピック属性を検出する。
クラスタ対比較手段220は、クラスタ検出手段210によって検出されたクラスタの集まりの中から、二つずつ一対にして取り出し、それらを併合して一つのコミュニティを形成する場合のトピック属性を選択する。
ここで、コミュニティとは、コミュニケーションサービス上に作られる、特定の話題、すなわちトピックに関して情報交換することを目的としたユーザの集まりを指す。ここで、トピックは、ユーザ情報310における特定の属性名と属性値のペア、つまり、トピック属性として表現される。
クラスタとの違いは、コミュニティに所属するユーザ間で事前にコミュニケーション関係が存在するとは限らないことと、特定のトピックに関連付けられることである。ここで、トピックを選択する基準として、クラスタ対の中に、プロフィール情報としてそのトピックを持つユーザが共通して多く含まれるという事実を用いる。
コミュニティ選択手段230は、クラスタ対比較手段220によるトピック属性の検出結果を用いて、新規コミュニティの属性名と属性値を出力する。コミュニティ選択手段230は、クラスタ対比較手段220によってトピック属性が付加されたクラスタ対の集まりを入力として、その中から新規コミュニティとして最も適したものを選択する。
さらに、そのクラスタ対に関連付けられたトピック属性とともに、クラスタ対に含まれるユーザのうち、プロフィール情報中にそのトピックを持つユーザのリストを出力する。主力に含まれるユーザのリストは、新規コミュニティを構成するメンバーとなる。
ここで、クラスタ対を選択する基準として、同じトピックを持つユーザが両クラスタに多く含まれていることに加えて、同一グループに所属するユーザが少ないという事実を用いる。
コミュニティ形成システムの出力であるトピック属性とメンバーリストの利用方法については、いくつかの方法がありうる。一つは、最上位のクラスタ対について、出力結果であるトピック属性とメンバーリストを用いて機械的に新規コミュニティを作成する方法である。
別の方法は、上位数件のクラスタ対についてトピック属性とメンバーリストを出力し、本システムを操作する管理者がその中から実際に作成するコミュニティを選択するという方法である。
データ記憶装置300は、ユーザ情報310と、メッセージログ320とを格納する。ユーザ情報310は、本システムのユーザについてのプロフィール情報であり、前述のユーザ登録手段1110により格納される。メッセージログ320は、ユーザによるメッセージ送信および受信の履歴であり、前述のメッセージ送受信手段1120により格納される。
上述のような構成において、本実施の形態のコミュニティ形成装置200は、既存のクラスタ対を併合する形でコミュニティを形成するようなトピックを出力する。以下に本実施の形態の動作について詳細に説明する。
[コミュニケーションサーバ1100]
コミュニケーションサーバ1100に対しては、通信ネットワーク600を介して、利用者端末400から、ユーザ登録要求、メッセージ書き込み要求、メッセージ読み出し要求、のいずれかの要求が送られる。
ここで、ユーザ登録要求には、ユーザを一意に識別するユーザIDと、ユーザの所属グループ名と、その他のプロフィール情報が含まれる。コミュニケーションサーバ1100のユーザ登録手段1110は、ユーザ登録要求に含まれる情報を、データ記憶装置300中のユーザ情報310に追加する。
図2に、ユーザ情報310の具体例を示す。この例では、所属グループとして所属部門の情報が使われ、プロフィール情報として勤務地、保有スキル、趣味、好きな食べ物が含まれる。
メッセージ書き込み要求には、メッセージの送信者を示すユーザIDと、メッセージ本文が最低限含まれる。それ以外に、そのメッセージを関連付ける他のメッセージを識別するID、またはメッセージ送信先のユーザIDが含まれる場合もある。
例えば、ブログシステムの場合、メッセージはブログ記事あるいはコメントに相当し、ブログ記事へのコメントは、その記事を書いたユーザに対するメッセージとみなすことができる。
コミュニケーションサーバ1100のメッセージ送受信手段1120は、受け取ったメッセージ書き込み要求の内容をデータ記憶装置300中のメッセージログ320に追記する。
図3に、メッセージログ320の具体例を示す。この例は、ブログシステムを前提としている。コメント番号は、記録されたメッセージを一意に識別する番号である。記事著者は、ブログ記事の著者を示すユーザIDである。
記事番号は、記事著者との組み合わせブログ記事を一意に識別する番号である。コメント記入者は、当該ブログ記事に対してコメントを記入したユーザを識別するユーザIDである。
コメント記入者が空欄になっている行は、ブログ記事本文に相当し、コメント記入者の内容が入っている行は、ブログ記事へのコメントに相当する。メッセージ本文は、ブログ記事あるいはそれに対するコメントの文章である。
メッセージ読み出し要求には、メッセージを特定するための情報が含まれる。図3の例では、メッセージを特定するための情報として、記事著者、あるいは記事著者と記事番号の組、あるいはコメント番号を用いることができる。
メッセージ送受信手段1120は、メッセージログ320から、メッセージ読み出し要求に含まれる情報に対応するメッセージの内容を参照し、その内容を要求元の利用者端末400に送信する。
[コミュニティ形成装置200:全体の動作の流れ]
本実施の形態のコミュニティ形成システムでは、データ記憶装置300が、コミュニケーションサービスを利用する複数のユーザごとに少なくとも所属グループと各種のプロフィール情報とを属性名と属性値のペアからなる集合として表現したユーザ情報310を、ユーザ間でのメッセージの送信者と受信者の情報を含むメッセージログ320とともに記憶する。
このような状態で、メッセージログ320でコミュニケーションが頻繁なユーザの集合をクラスタとして、複数のクラスタから新規クラスタ形成の基になるクラスタ対の候補をクラスタ検出手段210が選択する。
このように選択されたクラスタ対のユーザ情報310からコミュニティを特徴付けるよう共通するトピック属性をクラスタ対比較手段220が検出する。この検出されたトピック属性を用いて対象のクラスタ対をコミュニティ選択手段230が選択的に併合してコミュニティを形成する。
より詳細には、図4を参照して、コミュニティ形成装置200の全体の動作の流れを説明する。図4の矢印は、情報の流れる向きを示す。
1.本システムの管理者は、管理者端末500を通して、コミュニティ形成装置200に対してコミュニティ形成要求を送信する。送信されたコミュニティ形成要求を、コミュニティ形成装置200のクラスタ検出手段210が受け取る。
2.クラスタ検出手段210は、データ記憶装置300中のメッセージログ320を参照し、その内容に基づいてユーザをクラスタ化し、その結果をコミュニティ選択手段230に渡す。
ここで、ユーザのクラスタ化とは、メッセージの交換頻度に基づいてユーザを複数の集まり、すなわちクラスタに分割する処理を指す。コミュニティ選択手段230が受け取るのは、クラスタの集まりであり、各クラスタはユーザIDの集まりとして表現される。
3.コミュニティ選択手段230は、クラスタ検出手段210から渡された各クラスタに所属する各ユーザについて、ユーザ情報310中の所属グループ名を参照し、その内容に基づいてクラスタ対の集まりを出力し、それをクラスタ対比較手段220に渡す。ここで、クラスタ対とは、二つの既存のクラスタを指す。
4.クラスタ対比較手段220は、コミュニティ選択手段230によって出力された各クラスタ対について、ユーザ情報310中のプロフィール情報を参照し、その内容に基づいてクラスタ対の構成ユーザに共通する属性名と属性値を検出する。
5.コミュニティ選択手段230は、クラスタ対比較手段220によって出力された、属性情報つきの各クラスタについて評価関数を適用し、それを最大化する属性名・属性値の対を出力する。これをコミュニティ形成装置200の最終的な出力とする。
以下、コミュニティ形成装置200が備える各手段の動作の詳細を説明する。
[クラスタ検出手段210]
クラスタ検出手段210は、メッセージログ320から読み取れるユーザ間のメッセージ送受信頻度に基づき、ユーザ群を複数のクラスタに分割する。ここでの処理は、特許文献1に記載されている、潜在的に形成されているコミュニティを顕在化させる手段と同様のものを適用することができる。
すなわち、ユーザ間のメッセージ送受信関係と、そのメッセージに含まれるキーワードを用いて、同一のキーワードを通して活発にコミュニケーションが行われているユーザの集まりをクラスタとして抽出する。
図5を参照して、クラスタ検出手段210による出力の一例を示す。図6では、1から8までのラベルが振られた円がユーザ、円の間を結ぶ矢印がメッセージに相当する。このうち、ユーザ1,2,3,4の間でプログラミングの話題についてメッセージのやり取りが行われていて、ユーザ5,6,7,8の間でマーケティングの話題についてメッセージのやり取りが行われていたとすると、ユーザ1,2,3,4を要素とするクラスタAと、ユーザ5,6,7,8を要素とするクラスタBの二つを抽出する。
[クラスタ対比較手段220]
クラスタ対比較手段220は、クラスタ検出手段210により出力されるクラスタの集まりを入力として、その中から二つずつ一対として取り出し、各クラスタ対に所属するユーザの属性を比較することにより、複数のクラスタ対を一つに併合した場合に生まれるコミュニティのトピック属性を選択する。ここで、トピック属性とは、コミュニティを特徴付ける属性名と属性値の対を指す。
クラスタ対比較手段220は、入力であるクラスタの集まりから、すべての可能なクラスタ対を順に取り出し、それらを処理の対象とする。例えば、入力がC1、C2、C3の3つのクラスタである場合、処理対象のクラスタ対は{C1,C2},{C1,C3},{C2,C3}の3種類となる。
以下、図7のフローチャートを参照して、クラスタ対比較手段220の詳細な動作手順を説明する。まず、処理対象のクラスタ対のうち、以下のステップS222以降で未処理のものがあるかどうかを調べる(ステップS221)。ここで、処理対象のクラスタ対とは、前述したとおり、入力されたクラスタの集合のうち、すべての可能なクラスタ対を指す。
S221でYESの場合、処理対象のクラスタ対のうち、未処理のものを一つ取得する(ステップS222)。ここでどのクラスタ対を選択するかは、結果に影響しない。以下のステップS223からS228では、本ステップで選択したクラスタ対を、それぞれクラスタX、Yと呼称する。
つぎに、データ記憶装置300中のユーザ情報310を構成する属性名のうち、未計算のものがあるかどうかを調べる(ステップS223)。ここで、未計算の属性名とは、クラスタ対X,Yについて、以下のステップS224からS227においてまだ計算対象としてない属性名を指す。
つぎに、未計算の属性名を一つ取得する(ステップS224)。ここでの未計算の属性名についての基準は、S223と同様である。以下のステップ225からS227では、ここで選択した属性名を属性Aと呼称する。なお、ここでは選択対象の属性名として、ユーザIDおよび所属グループは使用しない。
つぎに、ユーザ情報310において、属性Aに対応する属性値のうち、未計算のものが存在するかどうかを調べる(ステップS225)。ここで、未計算の属性値とは、クラスタXまたはクラスタYに所属するユーザについて、属性Aの取りうる属性値であり、かつ以下のステップS226からS227においてまだ選択されていないものを指す。
S225でYESの場合、未計算の属性値を一つ選択する(ステップS226)。ここでの未計算の属性値の基準は、ステップS225と同様である。
つぎに、クラスタX,Yのそれぞれについて、属性AがS226で選択した属性値vを持つユーザの数を数え、そのうちの小さい方を、クラスタ対X,Yと属性名A,属性値vについての共通ユーザ数と呼称する(ステップS227)。本ステップの後、ステップ225以降のステップを繰り返す。
S225でNOの場合、クラスタX,Yに属するユーザの属性Aのすべての属性値について、共通ユーザ数を計算したことになる。この場合、ステップS223に戻り、他の属性名について共通ユーザ数の計算を行う。
S223でNOの場合、クラスタX,Yに属するユーザの全属性名・属性値について、共通ユーザ数を計算したことになる。この場合、ステップS228に進む。
ステップS228では、クラスタX,Yについての共通ユーザ数を最大化する属性名と属性値の対を選択し、その属性名と属性値をクラスタ対X,Yのトピック属性とする。本ステップの後、ステップS221に戻り、他のクラスタ対についてトピック属性を計算する。
S221でNOの場合、処理対象の全クラスタ対について、トピック属性を計算したことになる。この場合、ステップS229に進む。ステップS229では、処理対象の各クラスタ対にトピック属性を付加したものを出力する。
以下では、クラスタ対比較手段220の動作の具体例を示す。図8は、ユーザ情報310のうち、クラスタ検出手段210によって検出された二つのクラスタA,Bに属するユーザについての情報を示している。
図2の例と同様に、この例では所属グループの代わりに「所属部門」の属性が用いられている。ここでは、上記のステップS222におけるX,YとしてクラスタA,Bを選択した場合について、ステップS224からS228までの動作を示す。
まず、ステップS224において、未計算の属性名として「勤務地」を選択する。この場合、取り得る属性値は、東京、横浜、大阪、京都である。つぎに、ステップS225では、東京、横浜、大阪、京都のいずれについて未計算なので、S226に進む。
つぎに、ステップS226では、未計算の属性値として「東京」を選択する。つぎに、ステップS227では、「属性名:勤務地、属性値:東京」を満たすユーザ数は、クラスタA:3名、クラスタB:0名となる。したがって、「クラスタA,B,属性名:勤務地、属性値:東京」についての共通ユーザ数は0となる。
同様に、各属性名と属性値に関して上記のステップS224から227の処理を繰り返した結果、クラスタA,Bおよび各属性名・属性値についての共通ユーザ数は以下のようになる。
・ 属性名:勤務地、属性値:東京、共通ユーザ数:0
・ 属性名:勤務地、属性値:横浜、共通ユーザ数:0
・ 属性名:勤務地、属性値:大阪、共通ユーザ数:0
・ 属性名:勤務地、属性値:京都、共通ユーザ数:0
・ 属性名:保有スキル、属性値:英会話、共通ユーザ数:1
・ 属性名:保有スキル、属性値:中国語、共通ユーザ数:0
・ 属性名:保有スキル、属性値:Perl(登録商標)、共通ユーザ数:0
・ 属性名:保有スキル、属性値:Java(登録商標)、共通ユーザ数:0
・ 属性名:保有スキル、属性値:数学、共通ユーザ数:0
・ 属性名:保有スキル、属性値:簿記、共通ユーザ数:0
・ 属性名:保有スキル、属性値:PHP、共通ユーザ数:0
・ 属性名:趣味、属性値:楽器演奏、共通ユーザ数:0
・ 属性名:趣味、属性値:水泳、共通ユーザ数:0
・ 属性名:趣味、属性値:サッカー、共通ユーザ数:0
・ 属性名:趣味、属性値:ゴルフ、共通ユーザ数:1
・ 属性名:趣味、属性値:音楽鑑賞、共通ユーザ数:0
・ 属性名:趣味、属性値:野球、共通ユーザ数:0
・ 属性名:趣味、属性値:美術、共通ユーザ数:0
・ 属性名:好きな食べ物、属性値:スイーツ 、共通ユーザ数:2
・ 属性名:好きな食べ物、属性値:ラーメン 、共通ユーザ数:1
・ 属性名:好きな食べ物、属性値:果物 、共通ユーザ数:1
つぎに、ステップS228において、上記の計算結果を比較し、共通ユーザ数が最大となるものを選ぶ。この例では、「属性名:好きな食べ物、属性値:スイーツ、共通ユーザ数:2」を選択する。したがって、クラスタA,Bの対についてのトピック属性は、「属性名:好きな食べ物、属性値:スイーツ」となる。
[コミュニティ選択手段230]
コミュニティ選択手段230は、クラスタ対比較手段220の出力結果である、クラスタ対とそれに関連づけられたトピック属性の集まりについて、それらを元にコミュニティを形成した場合に期待される活性度を予測し、その結果を最大化するものを出力する。
ここでは、コミュニティの活性度を、クラスタ対を対象とした評価関数の値、すなわち評価値として予測する。以下、図9のフローチャートを参照して、コミュニティ選択手段230の動作手順を説明する。
まず、入力されたクラスタ対のうち、以下のS232以降でまだ処理されていないものがあるかどうかを調べる(ステップS231)。ステップS231でYESの場合、未処理のクラスタ対を一つ選択する(ステップS232)。
ここで、どのクラスタ対を選択するかは結果に影響しない。以下、ステップS233からS237において、選択したクラスタ対をクラスタX,Yと呼称する。つぎに、クラスタ対X,Yとそのトピック属性について、共通ユーザ数を計算する(ステップS233)。
共通ユーザ数の定義は、クラスタ対比較手段220(図7)で用いたものと共通である。この値はクラスタ対比較手段220で計算されたものと同一なので、クラスタ対比較手段220の出力に含めて、ここでは再計算しないという方法と取ることもできる。
つぎに、クラスタXに属するユーザaと、クラスタYに属するユーザbのすべての可能な組み合わせについて、ユーザaとユーザbの間のリンクが存在するか否かを調べ、リンクの総数を数える(ステップS234)。
ここで、ユーザ間のリンクの定義は、クラスタ検出手段210(図5)で用いたものと同一である。図6の例にように、リンクに重みがある場合には、リンクの総数を数える代わりに、リンクの重みの和を取ってもよい。
つぎに、クラスタXとYに共通して含まれるユーザ数を数える(ステップS235)。クラスタ検出手段210の動作手順によっては、クラスタXとYに共通して含まれるユーザは存在しえないので、この値は常に0になる。
つぎに、ユーザ情報310を参照して、クラスタXとYおよび所属グループの各属性値について共通ユーザ数を計算し、その最大値を取る(ステップS236)。共通ユーザ数の計算には、クラスタ対比較手段220のS225からS227と同様の手順を用いる。
つぎに、ステップS233からS236で計算した各数値を用いて、クラスタXとYについての評価値を計算する(ステップS237)。ここで、評価値を計算する方法の一例は、定数c1、c2、c3、c4(すべて正の実数)を用いて、以下の計算式を用いるというものである。
[数1]
評価値=c1×(S233の計算結果)−c2×(S234の計算結果)−c3×(S235の計算結果)−c4×(S236の計算結果)
ステップS237が完了すると、次のクラスタ対について同様の評価値を計算するために、ステップS231に戻る。ステップS231でNOの場合、すべてのクラスタ対について評価値を計算したことになる。この場合、ステップS238に進む。
ステップS238では、前ステップまでに計算した評価値を最大化するクラスタ対を選択し、それに対応するトピック属性とともに出力する。この出力を、コミュニティ形成装置200の最終的な出力とする。
以下、図8および図6を参照して、コミュニティ選択手段230の動作の具体例を説明する。ここでは、図8におけるクラスタA,Bについて、上記のステップS233からS237までの手順を用いて、実際に評価値を計算する。また、クラスタA,Bに所属する各ユーザは、図6に示すリンク関係を持つと仮定する。
まず、S233で、クラスタA,Bの間のトピック属性についての共通ユーザ数を計算する。ここでは、クラスタ対比較手段220についての例と同様に、トピック属性は「属性名:好きな食べ物、属性値:スイーツ」となるので、共通ユーザ数は2となる。
つぎに、S234で、クラスタA,B間のユーザa,b間のリンク数を計算する。ここでは、図6に示すリンク関係を参照して、ユーザk-takahashiとe-hasebe、およびt-okadaとe-hasebeの2本のリンクが存在する。さらに、リンク数の代わりに重みの和を用いることにすると、その数値は2+1=3となる。
つぎに、S235で、クラスタA,Bに共通して含まれるユーザの数を数える。この例では共通して含まれるユーザはいないので、この数は0となる。つぎに、S236で、クラスタA,Bと各所属部門についての共通ユーザ数の最大値を計算する。図8を参照して、所属部門についての各属性値について共有ユーザ数を数えると、以下の結果になる。
・ 属性名:所属部門、属性値:営業、共通ユーザ数:1
・ 属性名:所属部門、属性値:人事、共通ユーザ数:0
・ 属性名:所属部門、属性値:研究、共通ユーザ数:0
・ 属性名:所属部門、属性値:開発、共通ユーザ数:1
・ 属性名:所属部門、属性値:経理、共通ユーザ数:0
・ 属性名:所属部門、属性値:企画、共通ユーザ数:0
したがって、所属部門に関する共通ユーザ数の最大値は1となる。最後に、S237で、クラスタA,Bについての評価値を計算する。ここでは、c1=5,c2=1,c3=3,c4=3とすると、評価値の計算結果は以下のようになる。
[数2]
評価値=5×2−1×3−3×0−3×1=4
なお、本発明は本実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で各種の変形を許容する。例えば、本実施の形態のコミュニティ形成システムは、企業内の人脈形成を支援するためのソーシャルネットワーキングサービス(SNS:Social Networking Service)におけるコミュニティ自動作成機能といった用途に適用できる。また、一般消費者向けのソーシャルネットワーキングサービスにおけるコミュニティ自動作成機能といった用途にも適用可能である。
さらに、本実施の形態ではコミュニティ形成システムの各部がコンピュータプログラムにより各種機能として論理的に実現されることを例示した。しかし、このような各部の各々を固有のハードウェアとして形成することもでき、ソフトウェアとハードウェアとの組み合わせとして実現することもできる。
また、上記形態では通信ネットワーク600として現状のインターネットを例示したが、これが次世代のインターネットであるNGN(Next Generation Network)などでもよい。
なお、当然ながら、上述した実施の形態および複数の変形例は、その内容が相反しない範囲で組み合わせることができる。また、上述した実施の形態および変形例では、各部の構造などを具体的に説明したが、その構造などは本願発明を満足する範囲で各種に変更することができる。
100 LAN
110 パーソナルコンピュータ
120 メールサーバ
130 ウェブサーバ
140 メールサーバ
152 メール監視部
154 分析部
156 サービス登録部
200 コミュニティ形成装置
210 クラスタ検出手段
220 クラスタ対比較手段
230 コミュニティ選択手段
300 データ記憶装置
310 ユーザ情報
320 メッセージログ
400 利用者端末
500 管理者端末
600 通信ネットワーク
1100 コミュニケーションサーバ
1110 ユーザ登録手段
1120 メッセージ送受信手段

Claims (6)

  1. コミュニケーションサービスを利用する複数のユーザごとに少なくとも所属グループと各種のプロフィール情報とを属性名と属性値のペアからなる集合として表現したユーザ情報を、複数の前記ユーザ間でのメッセージの送信者と受信者の情報を含むメッセージログとともに記憶するデータ記憶装置と、
    前記メッセージログでコミュニケーションが頻繁な複数の前記ユーザの集合をクラスタとして、複数の前記クラスタから新規クラスタ形成の基になるクラスタ対の候補を選択するクラスタ検出手段と、
    選択された前記クラスタ対の前記ユーザ情報からコミュニティを特徴付けるよう共通するトピック属性を検出するクラスタ対比較手段と、
    検出された前記トピック属性を用いて対象の前記クラスタ対を選択的に併合して前記コミュニティを形成するコミュニティ選択手段と、
    を有するコミュニティ形成システム。
  2. 前記クラスタ対比較手段は、前記クラスタ対の前記トピック属性を検出するときに前記クラスタを構成する前記ユーザの多数が共通して持っている前記属性値の情報を用いる請求項1に記載のコミュニティ形成システム。
  3. 前記コミュニティ選択手段は、前記クラスタ対の選択基準の中に前記ユーザ間のリンク関係を含める請求項1または2に記載のコミュニティ形成システム。
  4. 請求項1ないし3の何れか一項に記載のコミュニティ形成システムのコミュニティ形成装置であって、
    前記メッセージログでコミュニケーションが頻繁な複数の前記ユーザの集合をクラスタとして、複数の前記クラスタから新規クラスタ形成の基になるクラスタ対の候補を選択するクラスタ検出手段と、
    選択された前記クラスタ対の前記ユーザ情報からコミュニティを特徴付けるよう共通するトピック属性を検出するクラスタ対比較手段と、
    検出された前記トピック属性を用いて対象の前記クラスタ対を選択的に併合して前記コミュニティを形成するコミュニティ選択手段と、
    を有するコミュニティ形成装置。
  5. 請求項4に記載のコミュニティ形成装置のためのコンピュータプログラムであって、
    前記メッセージログでコミュニケーションが頻繁な複数の前記ユーザの集合をクラスタとして、複数の前記クラスタから新規クラスタ形成の基になるクラスタ対の候補を選択するクラスタ検出処理と、
    選択された前記クラスタ対の前記ユーザ情報からコミュニティを特徴付けるよう共通するトピック属性を検出するクラスタ対比較処理と、
    検出された前記トピック属性を用いて対象の前記クラスタ対を選択的に併合して前記コミュニティを形成するコミュニティ選択処理と、
    をコミュニティ形成装置に実行させるコンピュータプログラム。
  6. 請求項4に記載のコミュニティ形成装置のデータ処理方法であって、
    前記メッセージログでコミュニケーションが頻繁な複数の前記ユーザの集合をクラスタとして、複数の前記クラスタから新規クラスタ形成の基になるクラスタ対の候補を選択するクラスタ検出動作と、
    選択された前記クラスタ対の前記ユーザ情報からコミュニティを特徴付けるよう共通するトピック属性を検出するクラスタ対比較動作と、
    検出された前記トピック属性を用いて対象の前記クラスタ対を選択的に併合して前記コミュニティを形成するコミュニティ選択動作と、
    を有するデータ処理方法。
JP2009137901A 2009-06-09 2009-06-09 コミュニティ形成システム、そのコミュニティ形成装置、そのデータ処理方法およびコンピュータプログラム Pending JP2010286868A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009137901A JP2010286868A (ja) 2009-06-09 2009-06-09 コミュニティ形成システム、そのコミュニティ形成装置、そのデータ処理方法およびコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009137901A JP2010286868A (ja) 2009-06-09 2009-06-09 コミュニティ形成システム、そのコミュニティ形成装置、そのデータ処理方法およびコンピュータプログラム

Publications (1)

Publication Number Publication Date
JP2010286868A true JP2010286868A (ja) 2010-12-24

Family

ID=43542554

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009137901A Pending JP2010286868A (ja) 2009-06-09 2009-06-09 コミュニティ形成システム、そのコミュニティ形成装置、そのデータ処理方法およびコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP2010286868A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013094361A1 (ja) * 2011-12-19 2013-06-27 インターナショナル・ビジネス・マシーンズ・コーポレーション ソーシャル・メデイアにおけるコミュニティを検出する方法、コンピュータ・プログラム、コンピュータ
JP2013165687A (ja) * 2012-02-16 2013-08-29 Ntt Docomo Inc 栽培支援装置、栽培支援システム、栽培支援方法及びプログラム
JP2015164008A (ja) * 2014-02-28 2015-09-10 株式会社日立製作所 解析装置及び解析方法
CN113657947A (zh) * 2021-08-31 2021-11-16 北京沃东天骏信息技术有限公司 由电子设备执行的数据处理方法及装置、电子设备

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013094361A1 (ja) * 2011-12-19 2013-06-27 インターナショナル・ビジネス・マシーンズ・コーポレーション ソーシャル・メデイアにおけるコミュニティを検出する方法、コンピュータ・プログラム、コンピュータ
CN103999082A (zh) * 2011-12-19 2014-08-20 国际商业机器公司 用于检测社交媒体中的社区的方法、计算机程序和计算机
JPWO2013094361A1 (ja) * 2011-12-19 2015-04-27 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation ソーシャル・メデイアにおけるコミュニティを検出する方法、コンピュータ・プログラム、コンピュータ
US9659098B2 (en) 2011-12-19 2017-05-23 International Business Machines Corporation Method, computer program and computer for detecting communities in social media
CN103999082B (zh) * 2011-12-19 2017-09-12 国际商业机器公司 用于检测社交媒体中的社区的方法、计算机程序和计算机
US10068009B2 (en) 2011-12-19 2018-09-04 International Business Machines Corporation Method, computer program and computer for detecting communities in social media
JP2013165687A (ja) * 2012-02-16 2013-08-29 Ntt Docomo Inc 栽培支援装置、栽培支援システム、栽培支援方法及びプログラム
JP2015164008A (ja) * 2014-02-28 2015-09-10 株式会社日立製作所 解析装置及び解析方法
CN113657947A (zh) * 2021-08-31 2021-11-16 北京沃东天骏信息技术有限公司 由电子设备执行的数据处理方法及装置、电子设备

Similar Documents

Publication Publication Date Title
Mourad et al. Critical impact of social networks infodemic on defeating coronavirus COVID-19 pandemic: Twitter-based study and research directions
Morstatter et al. A new approach to bot detection: striking the balance between precision and recall
Alrubaian et al. Reputation‐based credibility analysis of Twitter social network users
CN106682770B (zh) 一种基于好友圈子的动态微博转发行为预测系统及方法
US8805937B2 (en) Electronic mail analysis and processing
US8849813B1 (en) Method and system to determine a member profile associated with a reference in a publication
Zhao et al. Segmenting and understanding publics in a social media information sharing network: An interactional and dynamic approach
Adewole et al. SMSAD: a framework for spam message and spam account detection
Finin et al. The information ecology of social media and online communities
US8359362B2 (en) Analyzing news content information
US20100268716A1 (en) System and methods of providing interactive expertized communications responses using single and multi-channel site-specific integration
Bendler et al. Taming uncertainty in big data: Evidence from social media in urban areas
US10013480B2 (en) Method and system for decomposing social relationships into domains of interactions
TW201304516A (zh) 使用自使用者活動更新所得觀點增加內容關聯性之方法
Li et al. Exploiting concept drift to predict popularity of social multimedia in microblogs
CN115836305A (zh) 用于分布式事件分类和路由的系统和方法
Floos Arabic rumours identification by measuring the credibility of Arabic tweet content
US20220360604A1 (en) System and method for social network analysis
Lota et al. A systematic literature review on sms spam detection techniques
Cheong et al. A literature review of recent microblogging developments
Chen et al. The best answers? think twice: online detection of commercial campaigns in the CQA forums
JP2010286868A (ja) コミュニティ形成システム、そのコミュニティ形成装置、そのデータ処理方法およびコンピュータプログラム
Gentile et al. Extracting semantic user networks from informal communication exchanges
CN113158069A (zh) 基于大数据的互动话题场景分析方法、服务器及介质
Liang et al. Information propagation formalized representation of micro-blog network based on petri nets