JP2007328610A - 情報管理装置及び情報管理方法、並びにコンピュータ・プログラム - Google Patents
情報管理装置及び情報管理方法、並びにコンピュータ・プログラム Download PDFInfo
- Publication number
- JP2007328610A JP2007328610A JP2006160007A JP2006160007A JP2007328610A JP 2007328610 A JP2007328610 A JP 2007328610A JP 2006160007 A JP2006160007 A JP 2006160007A JP 2006160007 A JP2006160007 A JP 2006160007A JP 2007328610 A JP2007328610 A JP 2007328610A
- Authority
- JP
- Japan
- Prior art keywords
- information
- parent
- score
- procedure
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】時間とともに変化する電子コミュニケーションにおける各時点における重要なテーマを抽出する。
【解決手段】まず、親子関係のあるメッセージ間で関連度を示すスコアを算出し、スコアを用いたクラスタリングによって、テーマ抽出対象となるメッセージ群の絞り込みを行なう。電子掲示板などのコミュニケーションではメッセージ間に親子関係が形成されていることを利用して、単にメッセージ間リンクのスコアでクラスタリングするだけでなく、同時にメッセージ群(クラスタ)のスコアとみなし、それによって抽出テーマを選択することができる。
【選択図】 図1
【解決手段】まず、親子関係のあるメッセージ間で関連度を示すスコアを算出し、スコアを用いたクラスタリングによって、テーマ抽出対象となるメッセージ群の絞り込みを行なう。電子掲示板などのコミュニケーションではメッセージ間に親子関係が形成されていることを利用して、単にメッセージ間リンクのスコアでクラスタリングするだけでなく、同時にメッセージ群(クラスタ)のスコアとみなし、それによって抽出テーマを選択することができる。
【選択図】 図1
Description
本発明は、通信路を経由してユーザ間で交換されるメッセージなどの文書を処理する情報管理装置及び情報管理方法、並びにコンピュータ・プログラムに関する。
情報通信技術の普及に伴い、メール、電子掲示板、チャットといったさまざまなメッセージ交換システムが利用可能であり、特定又は不特定のユーザ間でネットワークを介した情報の共有が可能となっている。メールが1対1のやり取りであるのに対し、電子掲示板はあるユーザが書き込んだメッセージを参加ユーザ全員が閲覧するシステムであり、ユーザは質問文を投稿することによって幅広い意見や回答を得ることができ、常に最新の情報を入手することができ、情報の拡張性にも優れ、多くのユーザが提供する情報を全員で共有することができる。電子掲示板は、一般に、扱う分野に応じて数多くのフォーラムに分けられる。インターネットなどの広域ネットワーク上では、フォーラムの追加や消去、合併、分裂などがしばしば行なわれている。
電子掲示板システムに代表される電子コミュニケーションは、基本的には、あるユーザからの質問文の投稿と、これを閲覧した不特定のユーザからの意見や回答という形式でメッセージ交換が行なわれ、ある特定の話題に関する投稿の集まりは、「スレッド(thread)」と呼ばれる。電子掲示板によれば、1対1で行なわれるメールに比べ、極めて効率的に情報収集を行なうことができ、得られる情報も多岐にわたる。また、多くの場合、投稿されたメッセージの受け手は多人数であり、この点では、メーリング・リストやネットニュース、その他の仮想空間上のコミュニティも類似する。
この種のメッセージ交換システムでは、不特定多数のユーザから広範に渡る情報が入手可能であり、知識の共有並びに活用の場となる。このような利便性の反面、投稿された大量のメッセージが多人数で利用されるという正確上、掲示板のメッセージが増加していくと、内容も多岐に渡り、ある部分に特化した議論のみが深まったり、当初の掲示板の目的から外れた議論が活発になったりすることがあり、元の議論の本質を見失う可能性がある。
一方、その特化した議論や、当初の目的とは異なる議論から見ると、必要な情報が多量なメッセージの中に埋没してしまい、せっかく活性化した議論を阻害し、あるいは新たな発見の機会を逸してしまうことにもなりかねない。
この種の問題の対処方法として、特化した議論や、目的から外れた議論を抽出して、元の掲示板の内容を把握する際に混乱をしないようにすることが考えられる。
例えば、記事の集まりを、記事間の参照関係を使って話題毎に分割して表示、検索する電子掲示板ブラウザについて提案がなされている(例えば、特許文献1を参照のこと)。このブラウザによれば、親子関係のあるノード間で特徴ベクトル差あるいはリンク近傍記事における特徴量の加重平均の差分が閾値を超えるときにノード間のリンクを切って話題を分割するようになっている。しかしながら、一般的な文書クラスタラングの手法をそのまま電子掲示板に適用したものであり、重複部分を省略して全体の内容を把握し易くし、掲示板全体から幅広く内容を抽出することはできるが、掲示板が元来掲げているテーマや位置付けに則した抽出や、時間とともに変化していく重要テーマを抽出することはできない。
また、掲載される質疑情報を有効に利用することができる電子掲示板の運営方法について提案がなされている(例えば、特許文献2を参照のこと)。同運営方法によれば、質問が解決せず、回答もなく時間が経過したときにアラートを発することで、質疑情報の放置を防止し、質疑情報を有効に利用することができる。しかしながら、メッセージの属性(質問、回答、意見など)を利用して課題を抽出するようになっているものの、メールなどでそのことを通知するのみで、掲示板の内容を把握し易くすることとは無関係である。
また、利用要求の大きい電子掲示板を自動作成する電子掲示板作成装置について提案がなされている(例えば、特許文献3を参照のこと)。この電子掲示板作成装置は、検索ログを基に、ニーズのあるテーマの掲示板を自動作成し、ニーズのない掲示板を自動削除するようになっている。この場合、ニーズのある掲示板を用意することで各掲示板におけるテーマの散乱を防止し、掲示板の内容を均質化することができるが、既存の掲示板の内容を把握し易くしたり、その状態を改善したりするものではない。
また、重要な元発言が容易に分るようにした方法について提案がなされている(例えば、特許文献4を参照のこと)。この方法では、重要キーワード数とコメント数から元発言の重要度を算出するようになっているが、多数のコメントが付く元発言が重要であるという前提に基づくため、元発言以外に含まれる重要な内容はすべて漏れてしまう。
また、電子掲示板上で行なわれている議論の「まとめ」、「結論」に相当する文書を見つけ易くして、議論全体の内容把握を最適に行なえるようにした電子掲示板システムについて提案がなされている(例えば、特許文献5を参照のこと)。同システムによれば、課題と結論のペアが表示され、課題と回答の対を抽出して内容を把握するのに有効であるが、回答ユーザの指定操作が必要となる上、この対に含まれない重要な内容は漏れてしまう。
近年、グループ間や企業間のコラボレーションがますます広がってきており、アイデア(又は課題)の発散と収束によって課題解決を図るネットワーク・ツールの必要性は高まってきている。ところが、アイデアの発散と収束は、本来相反するものであり、両立させる仕組みはこれまで存在していなかった。
本発明の目的は、電子掲示板のように複数のユーザ間で、投稿した情報とこれに対する意見や回答などの情報の投稿の繰り返しという形式で交換される情報の管理を好適に行なうことができる、優れた情報管理装置及び情報管理方法、並びにコンピュータ・プログラムを提供することにある。
本発明のさらなる目的は、電子コミュニケーションにおいてある部分に特化した議論や当初の目的から外れた議論を抽出することができる、優れた情報管理装置及び情報管理方法、並びにコンピュータ・プログラムを提供することにある。
本発明のさらなる目的は、時間とともに変化する電子コミュニケーションにおける各時点における重要なテーマを抽出することができる、優れた情報管理装置及び情報管理方法、並びにコンピュータ・プログラムを提供することにある。
本発明は、上記課題を参酌してなされたものであり、その第1の側面は、投稿された情報を情報間リンクに基づいて情報間で親子関係を形成して格納する情報格納手段と、ユーザからの参照要求に応じて前記情報格納手段に格納されている情報を出力する情報出力手段と、親子関係のある情報間で関連度を示すスコアを算出する情報間関連度算出手段と、該算出されたスコアに基づいて情報をクラスタリングするクラスタリング手段を具備することを特徴とする情報管理装置である。
そこで、本発明に係る情報管理装置では、時間とともに変化する電子コミュニケーションにおいて、ある部分に特化した議論や目的から外れた議論など各時点での重要なテーマを抽出するようにした。
具体的には、メッセージ間リンクに基づいてメッセージ間で親子関係が形成されており、メッセージ間関連度算出手段は、親子関係のあるメッセージ間に限定して関連度を示すスコアを算出する。そして、クラスタリング手段は、算出されたスコアに基づいてメッセージのクラスタリングを行なうことによって、テーマ抽出対象となるメッセージ群の絞り込みを行なう。すなわち、通常のクラスタリングのように総当りで関連度の計算を行なうのではなく、メッセージ間で形成されている親子関係を利用して、単にメッセージ間リンクのスコアでクラスタリングするだけでなく、同時にメッセージ群(クラスタ)のスコアとみなし、それによって抽出テーマを選択する。
前記クラスタリング手段は、すべてのリンクについて、親メッセージ(群)のスコアSm、子メッセージ(群)のスコアSc、孫メッセージ(群)のスコアSgからリンクLmcのスコアを算出して(但し、SmとScの間のリンクLmcが存在するとき但し、SmとScの間のリンクLmcが存在するとき)、スコアが最大のリンクにおける親子を同一クラスタとして出力する。また、同一クラスタとした親子において算出されたリンクLmcのスコアを、当該クラスタ内の関連度とする。
そして、任意のクラスタ数となるまで(あるいは、任意の最大スコアとなるまで)前記クラスタリング手順を繰り返し実行することで、クラスタ内関連度が最大のものから(若しくは大きいものから順に)テーマを抽出する。
また、本発明に係る情報管理装置では、親を持たずに格納されたすべての元メッセージに対する親メッセージを仮想的に設定する。例えば、掲示板のタイトルや掲示板の説明などを仮想的にすべての元メッセージの親とした上で、メッセージ間関連度を計算して、クラスタ生成を行なう。これにより任意の数の(あるいは任意の関連度までの)クラスタを生成することができる。
また、前記メッセージ間関連度算出手段は、メッセージが投稿される特性、すなわち掲示板が持つ特性を加味した重み付けを行なってスコアを算出するようにしてもよい。
また、親メッセージと子孫メッセージのメッセージ数の合計又はそれに関与する投稿ユーザ数に応じた重み付けを行なう。すなわち、限られた人数で深い議論をしているメッセージ間リンクに対してより高いスコアを与える。
また、親メッセージと子孫メッセージのうち最新のメッセージ投稿からの経過時間に応じた重み付けを行なう。すなわち、新しいメッセージほどより高いスコアを与える。
また、親メッセージと子孫メッセージの参照者数に応じた重み付けを行なう。すなわち、多くの人が参照しているメッセージには高いスコアを与える。
また、本発明の第2の側面は、投稿された情報を情報間リンクに基づいて情報間で親子関係を形成して格納する情報格納手順と、ユーザからの参照要求に応じて前記情報格納手順において格納された情報を出力する情報出力手順と、親子関係のある情報間で関連度を示すスコアを算出する情報間関連度算出手順と、該算出されたスコアに基づいて情報をクラスタリングするクラスタリング手順をコンピュータに実行させることを特徴とするコンピュータ・プログラムである。
本発明の第2の側面に係るコンピュータ・プログラムは、コンピュータ・システム上で所定の処理を実現するようにコンピュータ可読形式で記述されたコンピュータ・プログラムを定義したものである。換言すれば、本発明の第2の側面に係るコンピュータ・プログラムをコンピュータ・システムにインストールすることによって、コンピュータ・システム上では協働的作用が発揮され、本発明の第1の側面に係る情報管理装置と同様の作用効果を得ることができる。
本発明によれば、電子コミュニケーションにおいてある部分に特化した議論や当初の目的から外れた議論を抽出することができる、優れた情報管理装置及び情報管理方法、並びにコンピュータ・プログラムを提供することができる。
また、本発明によれば、電子コミュニケーションにおける各時点における重要なテーマを抽出することができる、優れた情報管理装置及び情報管理方法、並びにコンピュータ・プログラムを提供することができる。
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施形態や添付する図面に基づくより詳細な説明によって明らかになるであろう。
以下、図面を参照しながら本発明の実施形態について詳解する。
本発明は、ネットワーク上で交換されるメッセージを処理する情報管理装置に関するものであり、具体的には、コミュニティや、メーリング・リスト、ネットニュース、電子掲示板などに投稿されたメッセージを処理する情報管理装置である。
この種のメッセージ交換システムでは、多岐に渡る情報が入手可能であり、知識の共有並びに活用の場となるといった利便性の反面、掲示板のメッセージが増加していくと、内容も多岐に渡り、ある部分に特化した議論のみが深まったり、当初の掲示板の目的から外れた議論が活発になったりすることがあり、元の議論の本質を見失う可能性がある。一方、その特化した議論や、当初の目的とは異なる議論から見ると、必要な情報が多量なメッセージの中に埋没してしまい、せっかく活性化した議論を阻害し、あるいは新たな発見の機会を逸してしまうことにもなりかねない。
そこで、本発明に係る情報管理装置では、時間とともに変化する電子コミュニケーションにおいて、ある部分に特化した議論や目的から外れた議論など各時点での重要なテーマを抽出するようにした。この結果、電子コミュニケーションの秩序を維持しながら活性化した議論を促進することができる。また、電子コミュニケーションの利用者にとっては、元の掲示板の内容を把握する際に、混乱をしなくて済む。
図1には、本発明の一実施形態に係る情報管理装置100の機能的構成を模式的に示している。図示の情報管理装置100は、メッセージ登録部101と、メッセージ表示部102と、メッセージ検索部103と、メッセージ情報格納部104と、テーマ抽出部105と、テーマ参照部106を備えている。情報管理装置100は、例えば、パーソナル・コンピュータのような一般的な計算機システム上で所定のサーバ・アプリケーションを実行するという形態で実現することができる。
メッセージ登録部101は、インターネットなどの広域ネットワーク上で、不特定多数のユーザに対して提供されるコミュニケーション場で投稿されたメッセージを、データベースに登録するようになっている。
ここで言うコミュニケーション場は、電子コミュニケーションや、メーリング・リスト、ネットニュース、電子掲示板といった、大量のメッセージを扱うシステムであり、1つのメッセージを多人数で利用されるという性質を持つ。例えば電子掲示板の場合、あるユーザからの質問文の投稿と、これを閲覧した不特定のユーザからの意見や回答という形式でメッセージ交換が行なわれ、ユーザが書き込んだメッセージをすべての参加ユーザが閲覧することができる。掲示板上では、ユーザは質問文を投稿することによって幅広い意見や回答を得ることができ、常に最新の情報を入手することができ、情報の拡張性にも優れ、多くのユーザが提供する情報を全員で共有することができる。
メッセージ表示部102は、通常のタスク毎のメッセージ・リストを表示したり、アクション・リストを、時系列的にまとめたリスト形式、特定のタスクに関するメッセージを一覧するリスト形式といった具合に、さまざまな形式で表示したりする。
メッセージ検索部103は、表示するメッセージを、メッセージを登録しているデータベースから検索する。例えば、掲示板(若しくは掲示板内の特定のスレッド)へのアクセスなど、任意のユーザからのメッセージ参照要求に応じて、メッセージ検索部103が該当するメッセージを取り出して、メッセージ表示部102に出力する。
メッセージ情報格納部104は、電子コミュニケーションで投稿されたメッセージを登録するデータベースなどで構成される。
投稿される各メッセージには、例えば投稿された順にシーケンス番号が割り振られる。また、各メッセージは、「質問」、質問に対する「回答」といったメッセージ属性と、投稿者名、投稿日などの情報を持つ。ある特定の話題に関する投稿の集まりは、「スレッド(thread)」と呼ばれ、スレッド内のメッセージ間には親子の関係が形成される。メッセージ情報格納部104では、親子メッセージを構造化して格納するようになっている。また、ユーザは、メッセージ検索部103を通して所望のメッセージを取り出し、メッセージ表示部102から参照することができるが、メッセージ格納部104はメッセージの参照者を逐次記録する。
テーマ抽出部105は、データベースに登録されているメッセージから、時間とともに変化する電子コミュニケーションのその時点での重要テーマを抽出する。そして、テーマ参照部106では、抽出されたテーマをユーザに提示する。
ユーザは、テーマ参照部106を通して、テーマ抽出部105で抽出されたテーマを参照することができる。テーマの参照方法は幾通りか考えられる。例えば、抽出したテーマ部分のスレッドのみを表示する方法や(図2を参照のこと)、抽出したテーマ部分のスレット以外を表示する方法(図3を参照のこと)、抽出したテーマ部分のスレッドを別の場所にコピーする方法(図4を参照のこと)、あるいは抽出したテーマ部分のスレッドを切り出して別の場所に移動する方法(図5を参照のこと)などである。このような操作は、管理者のみならず全ユーザがいつでも行なうことができる。したがって、ユーザは、元の掲示板の目的に沿った議論も、新たな特化したテーマの議論も、秩序を維持したまま継続することができる。
通常の文書からは、例えば、形態素解析などの自然言語処理によって重要なキーワードを抽出する方法や、抽出すべきテーマと判断できる表現パターンとのマッチングにより抽出する方法などが一般的である。例えば、単語ベクトルから算出するスコアを用いて記事参照関係を切ることができる。しかしながら、これは一般的な文書クラスタリングの手法であり、掲示板全体から幅広く内容を抽出することはできるものの、掲示板が元来掲げているテーマや位置付けに則した抽出や、時間とともに変化していく重要テーマを抽出することはできない。電子掲示板のようなシステムは、会話によって成立し、さらに状況が時間とてともに変化する。ある時点で課題であったことが、一定時間経過後には解決していることもある。一般的な文書クラスタリング手法をそのまま適用すると、このような掲示板の特性が無視されてしまう。
そこで、本実施形態では、テーマ抽出部105は、まず、親子関係のあるメッセージ間で関連度を示すスコアを算出し、このスコアを用いてクラスタリングを行なうことによって(図6を参照のこと)、テーマ抽出対象となるメッセージ群の絞り込みを行なう。親子関係のあるメッセージ間で行なうスコアの算出方法自体は、形態素解析などの自然言語処理によって重要なキーワードを抽出する方法や、抽出すべきテーマと判断できる表現パターンとのマッチングにより抽出する方法など、一般的な方法でも構わない。
通常のクラスタリングでは総当りで関連度の計算を行なう。これに対し、本実施形態では、電子掲示板などのコミュニケーションではメッセージ間に親子関係が形成されていることを利用して、単にメッセージ間リンクのスコアでクラスタリングするだけでなく、同時にメッセージ群(クラスタ)のスコアとみなし、それによって抽出テーマを選択する。
例えば、親メッセージ(群)のスコアをSm、子メッセージ(群)のスコアをSc、孫メッセージ(群)のスコアをSgとおき、SmとScの間のリンクLmcが存在するとき、Sm、Sc、SgからリンクLmcのスコアを算出する。すべてのリンクのスコアを算出し、スコアが最大のリンクにおける親子を同一クラスタ(すなわち新たなメッセージ群)とする。また、そのスコアを、このクラスタ内関連度とする。
これを任意のクラスタ数(あるいは、任意の最大スコア)まで繰り返し、クラスタ内関連度が最大のものを(あるいは大きいものから順に)、テーマ抽出対象とする。
掲示板ではすべてのメッセージ間にリンクがある訳ではなく、親も子も持たないメッセージも存在し得る。一般に、クラスタリングは任意の数のクラスタを生成することができる。ところが、本実施形態のように、メッセージ間リンク(スレッド)を利用してクラスタリングを行なう場合には、元メッセージ(親を持たないメッセージ)数よりクラスタ数を少なくすることができないという問題がある。
そこで、掲示板のタイトルや掲示板の説明などを仮想的にすべての元メッセージの親メッセージとした上で、メッセージ間関連度を計算して、クラスタ生成を行なうようにしてもよい。これにより任意の数の(あるいは任意の関連度までの)クラスタを生成することができる。
また、親子関係のあるメッセージ間でスコアを算出する際に、掲示板の特性を加味した重み付けを行なうことによって、時間とともに変化する掲示板のその時点での状況において適切なテーマ抽出のためのクラスタリングを行なうことができる。言語処理などによって算出された元スコアに対し、例えば、(1)親メッセージの属性、(2)メッセージ数+投稿者数、(3)経過時間、(4)メッセージ参照者数といった掲示板の特性に基づいて、重み付けを行なうことができる。
(1)親メッセージの属性に基づく重み付け
掲示板に投稿されるメッセージには、一般に、「課題」、「問題」、「質問」などの属性が付加されているので、抽出すべきテーマを含んでいる可能性が高いもののスコアを高くする重みW1を与える。例えば、親メッセージの属性が「課題」、「問題」、「質問」などのテーマを包含するものの場合には、P1=1として一定の重みW1を与える。さらに、子孫メッセージに「解決」、「回答」などの議論が終結したことを示す属性が付加されている場合には、その時点での課題が含まれていないと推察されるので、P2=1として一定のBをW1から減じる。但し、下式においてA、Bはあらかじめ設定しておく。図7には、メッセージ属性による重みを計算した例を示している。
掲示板に投稿されるメッセージには、一般に、「課題」、「問題」、「質問」などの属性が付加されているので、抽出すべきテーマを含んでいる可能性が高いもののスコアを高くする重みW1を与える。例えば、親メッセージの属性が「課題」、「問題」、「質問」などのテーマを包含するものの場合には、P1=1として一定の重みW1を与える。さらに、子孫メッセージに「解決」、「回答」などの議論が終結したことを示す属性が付加されている場合には、その時点での課題が含まれていないと推察されるので、P2=1として一定のBをW1から減じる。但し、下式においてA、Bはあらかじめ設定しておく。図7には、メッセージ属性による重みを計算した例を示している。
(2)メッセージ数+投稿者数
親メッセージと子孫メッセージのメッセージ数合計又はそれに関与する投稿ユーザ数に応じた重み付けW2を行ない、限られた人数で深い議論をしているメッセージ間リンクに対してより高いスコアを与える。例えば、親メッセージ及び子孫メッセージの合計メッセージ数がM、メッセージ投稿人数がP、掲示板全体のメッセージ数がBm、掲示板のメンバ数がBpのとき、Bm及びBpに対するM及びPの割合に応じて、元スコアSに重みW2を与える。但し、下式において、Q、Rはあらかじめ設定しておく。図8には、メッセージ数と投稿者数による重みを計算した例を示している。
親メッセージと子孫メッセージのメッセージ数合計又はそれに関与する投稿ユーザ数に応じた重み付けW2を行ない、限られた人数で深い議論をしているメッセージ間リンクに対してより高いスコアを与える。例えば、親メッセージ及び子孫メッセージの合計メッセージ数がM、メッセージ投稿人数がP、掲示板全体のメッセージ数がBm、掲示板のメンバ数がBpのとき、Bm及びBpに対するM及びPの割合に応じて、元スコアSに重みW2を与える。但し、下式において、Q、Rはあらかじめ設定しておく。図8には、メッセージ数と投稿者数による重みを計算した例を示している。
(3)経過時間
親メッセージと子孫メッセージのうち最新のメッセージ投稿からの経過時間に応じた重み付けを行ない、新しいメッセージほどより高いスコアを与える。例えば、親メッセージと子孫メッセージのうち最新のメッセージ投稿からの経過時間T及び設定した範囲時間T0(これよりも古いメッセージの時間は考慮しない)に応じて、最大Dまでの重みW3を与える。但し、下式においてD、T0はあらかじめ設定しておく。図9には、最新のメッセージの投稿時間からの経過時間による重みを計算した例を示している。
親メッセージと子孫メッセージのうち最新のメッセージ投稿からの経過時間に応じた重み付けを行ない、新しいメッセージほどより高いスコアを与える。例えば、親メッセージと子孫メッセージのうち最新のメッセージ投稿からの経過時間T及び設定した範囲時間T0(これよりも古いメッセージの時間は考慮しない)に応じて、最大Dまでの重みW3を与える。但し、下式においてD、T0はあらかじめ設定しておく。図9には、最新のメッセージの投稿時間からの経過時間による重みを計算した例を示している。
(4)メッセージ参照者数
親メッセージと子孫メッセージの参照者数に応じた重み付けを行ない、多くの人が参照しているメッセージには高いスコアを与える。例えば、親メッセージ及び子孫メッセージの参照者数がBa、掲示板のメンバ数がBpのとき、BaとBpに応じた重みW4を与える。但し、下式においてCはあらかじめ設定しておく。図10には、メッセージの参照者数による重みを計算した例を示している。
親メッセージと子孫メッセージの参照者数に応じた重み付けを行ない、多くの人が参照しているメッセージには高いスコアを与える。例えば、親メッセージ及び子孫メッセージの参照者数がBa、掲示板のメンバ数がBpのとき、BaとBpに応じた重みW4を与える。但し、下式においてCはあらかじめ設定しておく。図10には、メッセージの参照者数による重みを計算した例を示している。
親子関係のあるメッセージ間に限定して算出されたメッセージ間関連度の元のスコアがSのとき、上記(1)〜(4)をすべて適用した場合の重み付きスコアは、以下の通りとなる。
通常の文書から言語解析によってテーマと判断できるキーワードや表現を抽出することは、従来からも可能であるが、質問とこれに対する回答によって会話が成立する、時間とともに状況が変化する、といった掲示板の特性に対応することはできない。これに対し、本実施形態によれば、掲示板固有の「メッセージ属性」、「メッセージ間リンク(スレッド)」、「投稿日時」、「参照者」といった特徴を活用してクラスタリングを行なうので、その時点での課題が含まれていると推察できるメッセージからユーザがその時点で期待する内容及び個数のテーマを提示することができる。
また、抽出されたスレッドは、管理者など特定ユーザのみでなく誰にでも簡単に結果を参照できるものであり、管理者ユーザの管理コスト低減にも寄与することができる。
近年、グループ間や企業間のコラボレーションがますます広がってきており、アイデア(又は課題)の発散と収束によって課題解決を図るネットワーク・ツールの必要性は高まってきている。本発明によれば、発散したアイデアを埋没させることなく、別の掲示板に移すことができるので、議論が発散した場合であっても、元の掲示板での秩序を保ちながら、コミュニティの活動を促進することができる。企業においては知識共有や知識創造活動の推進が求められているが、本発明によれば、その状態や秩序を適切に維持し続けることができる。
本明細書では、本発明を電子掲示板システムに適用した実施形態を中心に説明してきたが、本発明の要旨はこれに限定されるものではない。複数のユーザ間でメッセージ交換などの電子コミュニケーションを行なうその他のシステムや、多人数で知識活用を行なうシステムなどに対して同様に本発明を適用することが可能である。
100…情報管理装置
101…メッセージ登録部
102…メッセージ表示部
103…メッセージ検索部
104…メッセージ情報格納部
105…テーマ抽出部
106…テーマ参照部
101…メッセージ登録部
102…メッセージ表示部
103…メッセージ検索部
104…メッセージ情報格納部
105…テーマ抽出部
106…テーマ参照部
Claims (13)
- 投稿された情報を、情報間リンクに基づいて情報間で親子関係を形成して格納する情報格納手段と、
ユーザからの参照要求に応じて、前記情報格納手段に格納されている情報を出力する情報出力手段と、
親子関係のある情報間で関連度を示すスコアを算出する情報間関連度算出手段と、
該算出されたスコアに基づいて情報をクラスタリングするクラスタリング手段と、
を具備することを特徴とする情報管理装置。 - 投稿された情報を、情報間リンクに基づいて情報間で親子関係を形成して格納する情報格納ステップと、
ユーザからの参照要求に応じて、前記情報格納ステップにおいて格納された情報を出力する情報出力ステップと、
親子関係のある情報間で関連度を示すスコアを算出する情報間関連度算出ステップと、
該算出されたスコアに基づいて情報をクラスタリングするクラスタリング・ステップと、
を具備することを特徴とする情報管理方法。 - 投稿された情報を、情報間リンクに基づいて情報間で親子関係を形成して格納する情報格納手順と、
ユーザからの参照要求に応じて、前記情報格納手順において格納された情報を出力する情報出力手順と、
親子関係のある情報間で関連度を示すスコアを算出する情報間関連度算出手順と、
該算出されたスコアに基づいて情報をクラスタリングするクラスタリング手順と、
をコンピュータに実行させることを特徴とするコンピュータ・プログラム。 - 前記クラスタリング手順では、すべてのリンクについて、親情報(群)のスコアSm、子情報(群)のスコアSc、孫情報(群)のスコアSgからリンクLmcのスコアを算出し(但し、SmとScの間のリンクLmcが存在するとき)、スコアが最大のリンクにおける親子を同一クラスタとする、
ことを特徴とする請求項3に記載のコンピュータ・プログラム。 - 前記クラスタリング手順では、同一クラスタとした親子において算出されたリンクLmcのスコアをクラスタ内関連度とする、
ことを特徴とする請求項4に記載のコンピュータ・プログラム。 - 任意のクラスタ数となるまで前記クラスタリング手順を繰り返し実行し、クラスタ内関連度が最大のもの、若しくは大きいものから順に、テーマを抽出するテーマ抽出手順をさらに前記コンピュータに実行させる、
ことを特徴とする請求項4に記載のコンピュータ・プログラム。 - 任意の最大スコアとなるまで前記クラスタリング手順を繰り返し実行し、クラスタ内関連度が最大のもの、若しくは大きいものから順に、テーマを抽出するテーマ抽出手順をさらに前記コンピュータに実行させる、
ことを特徴とする請求項4に記載のコンピュータ・プログラム。 - 前記情報間関連度算出手順では、情報が投稿される特性を加味した重み付けを行なってスコアを算出する、
ことを特徴とする請求項3に記載のコンピュータ・プログラム。 - 前記情報間関連度算出手順では、情報に付与されている属性に応じた重み付けを行なう、
ことを特徴とする請求項8に記載のコンピュータ・プログラム。 - 前記情報間関連度算出手順では、親情報と子孫情報の情報数合計又はそれに関与する投稿ユーザ数に応じた重み付けを行なう、
ことを特徴とする請求項8に記載のコンピュータ・プログラム。 - 前記情報間関連度算出手順では、親情報と子孫情報のうち最新の情報投稿からの経過時間に応じた重み付けを行なう、
ことを特徴とする請求項8に記載のコンピュータ・プログラム。 - 前記情報間関連度算出手順では、親情報と子孫情報の参照者数に応じた重み付けを行なう、
ことを特徴とする請求項8に記載のコンピュータ・プログラム。 - 前記情報格納手順において親を持たずに格納されたすべての元情報に対する親情報を仮想的に設定して、前記情報間関連度算出手順及び前記クラスタリング手順を実行させる、
ことを特徴とする請求項3に記載のコンピュータ・プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006160007A JP2007328610A (ja) | 2006-06-08 | 2006-06-08 | 情報管理装置及び情報管理方法、並びにコンピュータ・プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006160007A JP2007328610A (ja) | 2006-06-08 | 2006-06-08 | 情報管理装置及び情報管理方法、並びにコンピュータ・プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007328610A true JP2007328610A (ja) | 2007-12-20 |
Family
ID=38929031
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006160007A Pending JP2007328610A (ja) | 2006-06-08 | 2006-06-08 | 情報管理装置及び情報管理方法、並びにコンピュータ・プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007328610A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012032998A (ja) * | 2010-07-30 | 2012-02-16 | Rakuten Inc | 階層構造を持つ書込み記事の評価システム |
JP2014142738A (ja) * | 2013-01-23 | 2014-08-07 | Fujitsu Ltd | 管理方法、管理装置および管理プログラム |
WO2015182559A1 (ja) * | 2014-05-29 | 2015-12-03 | 日本電信電話株式会社 | 情報分析システム、情報分析方法及び情報分析プログラム |
-
2006
- 2006-06-08 JP JP2006160007A patent/JP2007328610A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012032998A (ja) * | 2010-07-30 | 2012-02-16 | Rakuten Inc | 階層構造を持つ書込み記事の評価システム |
JP2014142738A (ja) * | 2013-01-23 | 2014-08-07 | Fujitsu Ltd | 管理方法、管理装置および管理プログラム |
WO2015182559A1 (ja) * | 2014-05-29 | 2015-12-03 | 日本電信電話株式会社 | 情報分析システム、情報分析方法及び情報分析プログラム |
JPWO2015182559A1 (ja) * | 2014-05-29 | 2017-04-20 | 日本電信電話株式会社 | 情報分析システム、情報分析方法及び情報分析プログラム |
US9940319B2 (en) | 2014-05-29 | 2018-04-10 | Nippon Telegraph And Telephone Corporation | Information analysis system, information analysis method, and information analysis program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106980692B (zh) | 一种基于微博特定事件的影响力计算方法 | |
US9934286B2 (en) | Generating contact suggestions | |
Chen et al. | Battling the internet water army: Detection of hidden paid posters | |
Farrell et al. | Socially augmenting employee profiles with people-tagging | |
Uysal et al. | User oriented tweet ranking: a filtering approach to microblogs | |
US7657603B1 (en) | Methods and systems of electronic message derivation | |
CN106796682B (zh) | 填充用户联系人条目 | |
US20080097994A1 (en) | Method of extracting community and system for the same | |
US20130191451A1 (en) | Presence-based Synchronization | |
US20120117059A1 (en) | Ranking Authors in Social Media Systems | |
US9253137B1 (en) | Concurrent display of conversation messages and social network posts by conversation message authors | |
US8527450B2 (en) | Apparatus and methods for analyzing and using short messages from commercial accounts | |
US8612375B2 (en) | Dynamic playbook: experimentation platform for social networks | |
US9203792B2 (en) | Integration system providing conversation messages and social network posts by conversation message authors to client | |
Zhou et al. | Community discovery and profiling with social messages | |
JP2006092539A (ja) | ナレッジ交換クエリを受信しおよび応答する方法、システム、および装置 | |
JP3896014B2 (ja) | 情報収集システム、情報収集方法及びコンピュータに情報収集を実行させるプログラム | |
WO2011106907A1 (en) | Intelligent feature expansion of online text ads | |
JP5373818B2 (ja) | 集中型ソーシャル・ネットワーク応答追跡 | |
WO2014029314A1 (zh) | 信息聚合归类的显示方法及系统 | |
US20100211674A1 (en) | Community generation support system, community generation support method, and community generation support program | |
JP6584756B2 (ja) | 関連トピック表示制御装置、関連トピック表示制御方法、及びプログラム | |
JPWO2013094361A1 (ja) | ソーシャル・メデイアにおけるコミュニティを検出する方法、コンピュータ・プログラム、コンピュータ | |
JP2008158792A (ja) | ネットワークサーバ及び制御方法 | |
JPWO2006028213A1 (ja) | 広告・情報配信システム |