JP5223865B2

JP5223865B2 - 知識発見支援システム、方法、及び、プログラム

Info

Publication number: JP5223865B2
Application number: JP2009524465A
Authority: JP
Inventors: 陽司宮崎
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2007-07-20
Filing date: 2008-07-17
Publication date: 2013-06-26
Anticipated expiration: 2028-07-17
Also published as: WO2009014058A1; JPWO2009014058A1

Description

本発明は、知識発見支援システム、方法、及び、プログラムに関し、更に詳しくは、ユーザに検索条件の候補を提供する知識発見支援システム、方法、及び、プログラムに関する。

複数のユーザで文書を共有し、キーワードを入力して共有した文書の中から所望の文書を検索できるシステムがある。従来のシステムでは、ユーザは、自身が保有する知識をもとにキーワードを設定し、文書検索を行う。このため、従来のシステムでは、ユーザが検索可能な文書の範囲は、ユーザが有する知識の範囲に限定されることになる。このため、ユーザにとって興味深い文書や重要な文書が存在する場合でも、ユーザがそれらを発見することが困難な場合がある。この問題を解消する技術として、他のユーザの知識を利用して新たな文書の発見を支援する技術がある。具体的には、特許文献１、２、及び、非特許文献１は、検索履歴をもとに、検索を行うユーザと他のユーザとの関係を分析し、検索を行うユーザにとって興味深い文書や重要な文書の発見を支援する技術を記載する。

特許文献１では、ユーザが入力した検索キーワードに対する検索結果に対し、他のユーザの参照回数や参照日を基に、検索意図に合わせて並び替えを行う。例えば、グループの中で、自分だけが知らない情報を得たいという検索意図の場合は、自身はあまり参照していないが他のユーザがよく参照している文書が上位にくるように並び替えを行う。また、非特許文献１では、協調フィルタリング技術を用い、他のユーザの中で自分の興味に近いユーザを探し、そのユーザの評価が高くかつ検索を行うユーザが知らないであろう文書を推薦する。具体的には、各ユーザが文書に設定した評価値や既知・不既知情報を用いて協調フィルタリングを行い、検索を行うユーザが未評価かつ不既知の文書の評価値を予測する。非特許文献１では、予測された評価値をもとに文書を並び替えてユーザに提示することで、自分の興味に近い他のユーザの評価が高く、かつ、自分がまだ見ていない文書を簡単に探すことができる。

特許文献２では、他のユーザの検索キーワード履歴の中から、自分が入力した検索キーワードに類似する検索キーワード履歴を抽出し、類似検索キーワードとその類似検索キーワードを利用したユーザの所属や業務内容などの情報を提示する。特許文献２では、ユーザは、今まで思いつかなかった検索キーワードを入手できるだけでなく、そのキーワードを使用したユーザの所属や業務内容も参照できるため、ユーザの所属や業務に関係する知識発見が容易になる。
上記した文献は、以下の通りである。
特開２００６−２６８７８９号公報特開２００５−７８３３４号公報清水拓也、土方嘉徳、西田正吾、「発見性を考慮した協調フィルタリングアルゴリズムに関する基礎検討」、情報処理学会研究報告（ＤＢＳ）データベース・システム、２００６、ＤＢＳ−１３９、ｐｐ．５３−６０

上記関連技術では、各ユーザの閲覧履歴や、検索に用いたキーワードを基に、文書を推薦し、或いは、検索条件履歴を提示して、ユーザが新たな知識を発見するための支援を行っている。これら関連技術における第１の問題点は、現実の所属部署の関係や人間関係を反映した知識発見支援を行えないということである。特許文献１や非特許文献１の技術は、他のユーザの文書の閲覧履歴や評価履歴を基に、近い興味をもつユーザを選別している。新たな知識の発見を支援するためには、近い興味をもつユーザの情報だけでなく、所属する部署や、関連する部署や、関連する他のユーザの活動内容も考慮することが重要である。しかし、特許文献１及び非特許文献１では、部署や人間関係を考慮して、推薦を行っていない。また、特許文献２の技術では、所属や業務内容とあわせて検索条件履歴を提示している。しかし、ユーザの所属や業務内容や興味などに合わせた絞り込みを行っておらず、大量の検索条件履歴がある場合には、適切なキーワードを検索することは困難である。

関連技術の第２の問題点は、共有する文書が大量であると、大量の文書が推薦されることになって、ユーザが、次にどのように絞り込んでよいか分からなくなるということである。特許文献１や非特許文献１の技術は、共有する文書を興味や重要度の観点からランキングするだけであり、ユーザへ提示する文書数自体は絞り込まれない。そのため、ユーザは、自分の関心に合致するか否かを、逐次文書を見て判断しなければならないことになる。ランキング上位の文書のみユーザに提示することも考えられるが、提示した文書がユーザにとって関心の対象でない場合には、知識が発見できずに検索が終了することになる。
更には、大量の文書を共有する場合、ユーザ同士で同じ文書を閲覧し、評価する確率が低くなるため、ユーザが、まだ閲覧・評価していない文書が大量に現れることになる。

関連技術の第３の問題点は、現在共有している文書に対する適切な知識発見支援を行えないことである。共有する文書は、追加・削除されるため、文書集合は日々変化する。特許文献２の発明では、過去の文書集合に対して利用された検索キーワードをユーザに提示する。しかし、提示したキーワードは、過去の文書集合において検索できるキーワードであるものの、現在の文書集合でうまく絞り込みを行えない場合がある。例えば、５年前は「ＰＨＳ」に関する文書が存在していたため、「ＰＨＳ」というキーワードで文書を検索できたが、現在「ＰＨＳ」に関する文書が存在しない場合には、「ＰＨＳ」というキーワードで検索しても、文書を見つけることはできない。

本発明は、ユーザの人間関係を考慮して、ユーザの知識発見を支援できる知識発見支援システム、方法、及び、プログラムを提供することを目的とする。

本発明は、ユーザに、検索対象データに対する検索条件の候補を提示し、ユーザの知識発見を支援する知識発見支援システムであって、各ユーザの前記検索対象データに対するアクセス履歴を記憶するアクセス履歴記憶装置と、検索対象データを管理する検索対象データ管理部が記憶しているメタ情報とを参照して、各ユーザについて、ユーザの興味の度合いを示すユーザ興味情報を生成するユーザ興味抽出部と、前記ユーザ興味情報と、ユーザ間の関係を表すユーザ関係情報とを用いて、知識発見支援対象のユーザの興味に近いユーザのグループを生成するグループ生成部と、前記ユーザ興味情報を用いて、前記グループ生成部が生成したグループの興味情報を生成するグループ興味生成部と、前記知識発見支援対象のユーザのユーザ興味情報と、前記グループ興味生成部が生成したグループ興味情報とに基づいて、前記検索条件の候補を生成する条件候補生成部と、前記条件候補生成部が生成した条件候補を、ユーザに提示する条件候補提示部とを備えることを特徴とする知識発見支援システムを提供する。

本発明は、コンピュータを用い、ユーザに、検索対象データに対する検索条件の候補を提示し、ユーザの知識発見を支援する知識発見支援方法であって、
前記コンピュータが、各ユーザの前記検索対象データに対するアクセス履歴を記憶するアクセス履歴記憶装置と、検索対象データを管理する検索対象データ管理部が記憶しているメタ情報とを参照して、各ユーザについて、ユーザの興味の度合いを示すユーザ興味情報を生成するステップと、前記コンピュータが、前記ユーザ興味情報と、ユーザ間の関係を表すユーザ関係情報とを用いて、知識発見支援対象のユーザの興味に近いユーザのグループを生成するステップと、前記コンピュータが、前記ユーザ興味情報を用いて、前記生成したグループの興味情報を生成するステップと、前記コンピュータが、前記知識発見支援対象のユーザのユーザ興味情報と、前記グループ興味情報とに基づいて、前記検索条件の候補を生成するステップと、前記コンピュータが、前記生成した条件候補を、ユーザに提示するステップとを有することを特徴とする知識発見支援方法を提供する。

本発明は、コンピュータに、ユーザに、検索対象データに対する検索条件の候補を提示し、ユーザの知識発見を支援する処理を実行させるプログラムであって、前記コンピュータに、各ユーザの前記検索対象データに対するアクセス履歴を記憶するアクセス履歴記憶装置と、検索対象データを管理する検索対象データ管理部が記憶しているメタ情報とを参照して、各ユーザについて、ユーザの興味の度合いを示すユーザ興味情報を生成するステップと、前記ユーザ興味情報と、ユーザ間の関係を表すユーザ関係情報とを用いて、知識発見支援対象のユーザの興味に近いユーザのグループを生成するステップと、前記ユーザ興味情報を用いて、前記生成したグループの興味情報を生成するステップと、前記知識発見支援対象のユーザのユーザ興味情報と、前記グループ興味情報とに基づいて、前記検索条件の候補を生成するステップと、前記生成した条件候補を、ユーザに提示するステップとを実行させることを特徴とするプログラムを提供する。

本発明は、ユーザに、検索対象データに対する検索条件の候補を提示し、ユーザの知識発見を支援する知識発見支援システムであって、各ユーザの前記検索対象データに対するアクセス履歴を記憶するアクセス履歴記憶装置と、検索対象データを管理する検索対象データ管理部が記憶しているメタ情報とを参照して、各ユーザについて、ユーザの興味の度合いを示すユーザ興味情報を生成するユーザ興味抽出部と、前記ユーザ興味情報と、ユーザ間の関係を表すユーザ関係情報とを用いて、グループの興味情報を生成するグループ興味生成部と、前記知識発見支援対象のユーザのユーザ興味情報と、前記グループ興味生成部が生成したグループ興味情報とに基づいて、前記検索条件の候補を生成する条件候補生成部と、前記条件候補生成部が生成した条件候補を、ユーザに提示する条件候補提示部とを備えることを特徴とする知識発見支援システムを提供する。

本発明は、コンピュータを用い、ユーザに、検索対象データに対する検索条件の候補を提示し、ユーザの知識発見を支援する知識発見支援方法であって、
前記コンピュータが、各ユーザの前記検索対象データに対するアクセス履歴を記憶するアクセス履歴記憶装置と、検索対象データを管理する検索対象データ管理部が記憶しているメタ情報とを参照して、各ユーザについて、ユーザの興味の度合いを示すユーザ興味情報を生成するステップと、前記コンピュータが、前記ユーザ興味情報と、ユーザ間の関係を表すユーザ関係情報とを用いて、グループの興味情報を生成するステップと、前記コンピュータが、前記知識発見支援対象のユーザのユーザ興味情報と、前記グループ興味情報とに基づいて、前記検索条件の候補を生成するステップと、前記コンピュータが、前記生成した条件候補を、ユーザに提示するステップとを有することを特徴とする知識発見支援方法を提供する。

本発明は、コンピュータに、ユーザに、検索対象データに対する検索条件の候補を提示し、ユーザの知識発見を支援する処理を実行させるプログラムであって、前記コンピュータに、各ユーザの前記検索対象データに対するアクセス履歴を記憶するアクセス履歴記憶装置と、検索対象データを管理する検索対象データ管理部が記憶しているメタ情報とを参照して、各ユーザについて、ユーザの興味の度合いを示すユーザ興味情報を生成するステップと、前記ユーザ興味情報と、ユーザ間の関係を表すユーザ関係情報とを用いて、グループの興味情報を生成するステップと、前記知識発見支援対象のユーザのユーザ興味情報と、前記グループ興味情報とに基づいて、前記検索条件の候補を生成するステップと、前記生成した条件候補を、ユーザに提示するステップとを実行させることを特徴とするプログラムを提供する。

本発明の知識発見支援システム、方法、及び、プログラムでは、知識発見支援対象のユーザの人的関係を用いた条件候補の提示が可能である。

本発明の上記、及び、他の目的、特徴及び利益は、図面を参照する以下の説明により明らかになる。

本発明の第１実施形態の知識発見支援システムの構成を示すブロック図。アクセス履歴、組織情報、及び、メタ情報の具体例を示す図。ユーザ興味情報、グループ興味情報、条件候補提示画面、及び、ログイン画面の具体例を示す図。条件評価情報、条件候補提示画面、及び、検索結果提示画面の具体例を示す図。第１実施形態の知識発見支援システムの動作手順を示すフローチャート。アクセス履歴、メタ情報、及び、興味情報の具体例を示す図。興味類似度計算式、興味類似度（ＣＯＳ値）、重み付けを行った興味類似度、グループ興味情報、及び、条件評価情報の具体例を示す図。条件候補提示画面、検索結果提示画面、及び、アクセス履歴の具体例を示す図。本発明の第２実施形態の知識発見支援システムの構成を示すブロック図。人脈情報の具体例を示す図。第２実施形態の知識発見支援システムの動作手順を示すフローチャート。人脈情報、重み付けを行ったユーザ興味類似度、及び、グループ興味情報の具体例を示す図。

以下、図面を参照し、本発明の実施形態を詳細に説明する。図１は、本発明の第１実施形態の知識発見支援システムの構成を示している。知識発見支援システムは、アクセス履歴記憶装置１００、ユーザ興味抽出部２００、ユーザ設定入力部３００、グループ生成部４００、グループ興味生成部５００、条件候補生成部６００、条件候補提示部７００、文書管理部８００、及び、組織情報管理部９００を備える。なお、以下では、検索対象データを「文書」とし、文書における知識発見支援について説明するが、検索対象データは、文書には限定されない。検索対象データは、ホームページや電子掲示板などのＷＥＢページ、店舗情報や観光情報などの位置関連情報、テレビやラジオの番組情報、映像コンテンツや音楽コンテンツ、書籍情報、店舗情報などであってもよい。

文書管理部８００は、検索対象データである文書データの集合と、検索対象文書に関連するメタ情報とを記憶する。メタ情報は、文書の付加的な情報であり、例えば、文書の作成者や作成日時、ジャンル、関連語などを含む。文書管理部８００は、ユーザが検索要求を発生すると、管理する文書の中で、検索条件に合致する文書を検索し、ユーザに検索結果を提示する機能を有する。アクセス履歴記憶装置１００は、各ユーザによる検索対象文書に対するアクセス履歴を記憶する。アクセス履歴は、例えば、アクセスしたユーザを特定する情報や、閲覧又はダウンロードした文書を特定する情報、検索日、検索に用いたキーワードなどの情報を含む。

ユーザ興味抽出部２００は、アクセス履歴記憶装置１００に記憶されるアクセス履歴と、文書管理部８００に記憶された文書のメタ情報とから、各ユーザについて、ユーザ興味情報を生成する。ユーザ興味情報は、ユーザの興味の度合いを示す情報である。ユーザ設定入力部３００は、知識発見支援の対象となるユーザを設定する。組織情報管理部９００は、組織情報（ユーザ関係情報）を管理する。組織情報は、例えば、各部署にどのユーザが所属しているかを示す情報や、組織における部署同士のつながりを示す情報などを含む。グループ生成部４００は、ユーザ興味抽出部２００にて生成されたユーザ興味情報と、組織情報管理部９００が管理する組織情報とから、ユーザ設定入力部３００で設定されたユーザに近い興味を持つ、一人乃至は複数人のユーザからなるユーザグループを生成する。グループ興味生成部５００は、ユーザ興味抽出部２００にて生成されたユーザ興味情報から、グループ生成部４００にて生成されたユーザグループのグループ興味情報を生成する。

条件候補生成部６００は、グループ興味生成部５００にて生成されたグループ興味情報と、ユーザ興味抽出部２００にて抽出されたユーザ興味情報と、文書管理部８００が管理する検索対象文書の集合とから、知識発見支援のための条件候補を生成する。条件候補は、例えば、文書管理部８００が管理するメタ情報にて、文書名、作成者、作成日、関連語などに条件を指定して文書を絞り込むための検索条件の候補である。条件候補提示部７００は、条件候補生成部６００が生成した条件候補をユーザに提示し、ユーザによる検索条件の選択を促す。

ユーザは、提示された条件候補の中から、任意の条件候補を、検索条件として選択する。文書管理部８００は、ユーザが検索条件を選択すると、検索対象文書の中からの検索条件に合致する文書を検索する。ユーザは、検索結果に表示された文書の中から、閲覧又はダウンロードする文書を指定し、文書の閲覧、又は、ダウンロードを行う。ユーザが、文書を閲覧又はダウンロードすると、アクセス履歴記憶装置１００は、ユーザ名、閲覧又はダウンロードした文書名、検索日、検索に用いたキーワードなどの情報を、アクセス履歴として記憶する。

ユーザは、検索結果に対して、更なる絞り込みを希望することがある。この場合、ユーザ興味抽出部２００は、アクセス履歴記憶装置１００が記憶するアクセス履歴の中から、検索結果に含まれる文書のみを用いて、対象を検索結果に含まれる文書に狭めたユーザ興味情報を生成する。その後、グループ生成部４００にてそのユーザ興味情報を用いてグループを生成し、グループ興味生成部５００にてグループ興味情報を生成し、条件候補生成部６００にて、再度、条件候補を生成する。

知識発見支援システムの物理的な構成について簡単に説明する。ユーザ設定入力部３００及び条件候補提示部７００は、例えば、ディスプレイなどの情報表示装置と、ボタンなどのユーザが意思表示を行える入力装置とを備えたコンピュータ上で動作するソフトウエアで実装すればよい。具体的には、ＰＤＡ（Personal Data Assistants）やパーソナルコンピュータ、携帯電話上で動作するソフトウエアで実装すればよい。

文書管理部８００は、文書とメタ情報とを関連付けて記憶するデータベースであり、パーソナルコンピュータやサーバ型のコンピュータ上に、広く知られているデータベースソフトウエアで実装すればよい。アクセス履歴記憶装置１００は、ユーザとアクセス履歴とを関連づけて記憶するデータベースであり、パーソナルコンピュータやサーバ型のコンピュータ上に、広く知られているデータベースソフトウエアで実装すればよい。

組織情報管理部９００は、組織情報を記憶するデータベースであり、パーソナルコンピュータやサーバ型のコンピュータ上に、広く知られているデータベースソフトウエアで実装すればよい。ユーザ興味抽出部２００、グループ生成部４００、グループ興味生成部５００、及び、条件候補生成部６００は、それぞれパーソナルコンピュータやサーバ型のコンピュータ上で動作するソフトウエアで実装すればよい。

なお、アクセス履歴記憶装置１００、ユーザ興味抽出部２００、ユーザ設定入力部３００、グループ生成部４００、グループ興味生成部５００、条件候補生成部６００、条件候補提示部７００、文書管理部８００、及び、組織情報管理部９００は、同じコンピュータ上に存在してもよいし、異なるコンピュータ上に存在し、広く知られているＴＣＰ／ＩＰ（Transmission Control Protocol/Internet Protocol）などの通信プロトコルを使って通信してもよい。本実施形態では、システム内の各部について、特定の物理的な構成を前提としているわけではない。

次に、各部にて、管理、記憶、生成する情報の詳細について説明する。図２に、アクセス履歴記憶装置１００が記憶するアクセス履歴、組織情報管理部９００が管理する組織情報、文書管理部８００が管理するメタ情報の具体例を示す。アクセス履歴記憶装置１００が記憶するアクセス履歴５１０は、ユーザが文書を検索する際に用いたキーワードや、検索した後に閲覧或いはダウンロードした文書、検索した日などを含む。このアクセス履歴５１０を参照することで、例えば、ユーザ「ＵＳＥＲ０１」が、検索日「２００５年１月１日」に、キーワード「セキュリティ」で文書を検索し、文書「ＤＯＣ０１」をダウンロードしたことがわかる。

組織情報管理部９００が管理する組織情報５２０は、企業内などで各ユーザが所属する部署名や、その部署に所属するユーザ、その部署に関連する部署名などの情報を含む。この組織情報５２０を参照することで、例えば、部署「Ａ事業部」に所属するユーザは「ＵＳＥＲ０１」、「ＵＳＥＲ０２」、「ＵＳＥＲ０３」であり、「Ａ事業部」に関連する部署は「Ｃ本部」であることがわかる。文書管理部８００は、文書の付加的な情報であり、文書の作成者や作成日時、ジャンル、関連語などを含むメタ情報５３０を記憶する。メタ情報５３０を参照することで、例えば、文書名「ＤＯＣ０１」の文書の作成者は「ＵＳＥＲ０１」、作成日は「２００５年１月１日」であり、「セキュリティ」、「文書管理」、「ユビキタス」という関連語が関連付いていることがわかる。

図３に、ユーザ興味抽出部２００が生成するユーザ興味情報、グループ興味生成部５００が生成するグループ興味情報、条件候補提示部７００が提示する条件候補、ユーザ設定入力部３００が表示するログイン画面の具体例を示す。ユーザ興味抽出部２００が生成するユーザ興味情報６１０は、ユーザが過去に閲覧又はダウンロードした文書のメタ情報や、検索に用いたキーワードを基に生成した、ユーザの興味をあらわす情報である。ユーザ興味情報６１０は、多次元ベクトルの形で表され、各次元が興味の要素を表し、各次元の値が興味の強さを表す。

図３の例では、ユーザ興味情報６１０は、「セキュリティ」、「文書管理」、「ユビキタス」、「ＲＦＩＤ」、「パソコン」、「サーバ」、「ソフトウエア」を要素に持つ多次元ベクトルによって表されている。例えば、ユーザ「ＵＳＥＲ０１」についてみると、「セキュリティ」、「文書管理」、「ユビキタス」、「ＲＦＩＤ」への興味の強さをあらわす値がそれぞれ「２」、「１」、「２」、「１」であり、「パソコン」、「サーバ」、「ソフトウエア」の値がそれぞれ「０」、「０」、「０」となっている。このユーザ興味情報６１０を参照することで、ユーザ「ＵＳＥＲ０１」は、「セキュリティ」、「文書管理」、「ユビキタス」、「ＲＦＩＤ」に関連する文書に興味を持っているが、「パソコン」、「サーバ」、「ソフトウエア」に関連する文書には興味を持っていないことがわかる。

グループ興味生成部５００が生成するグループ興味情報６２０は、グループ生成部４００が生成したグループについてのグループの興味を表す情報であり、ユーザ興味情報６１０と同様に、多次元ベクトルで表される。より詳細には、「セキュリティ」、「文書管理」、「ユビキタス」、「ＲＦＩＤ」、「パソコン」、「サーバ」、「ソフトウエア」を要素に持つ多次元ベクトルによって表される。グループ興味情報６２０において、グループ「ＧＲＯＵＰ０１」のグループ興味情報を参照すると、「セキュリティ」、「ユビキタス」、「ＲＦＩＤ」の値が、他の値よりも大きいことがわかる。このことから、グループ「ＧＲＯＵＰ０１」は、「セキュリティ」、「ユビキタス」、「ＲＦＩＤ」に関する文書に興味を持っていることがわかる。

条件候補提示部７００が提示する条件候補提示画面６３０は、条件候補生成部６００が生成した知識発見支援のための条件候補を列挙した画面である。図３の条件候補提示画面６３０では、ユーザ「ＵＳＥＲ０１」に対し、関連語「パソコン」、「サーバ」、「ソフトウエア」を条件候補として提示している。ユーザ「ＵＳＥＲ０１」は、このような条件候補提示画面６３０から、１つ、又は、複数の条件候補（キーワード）を選択する。例えば、ユーザは、「パソコン」を選択する。ユーザが選択したキーワードは、文書管理部８００に送られ、文書管理部８００は、受け取ったキーワード「パソコン」を関連語に含む文書を検索する。

ユーザ設定入力部３００は、ログイン画面６４０を表示して、ユーザにユーザ名の入力を促し、入力されたユーザ名のユーザを、知識発見支援の対象となるユーザに設定する。または、携帯電話機のようにユーザが限定されている場合においては、携帯電話機の番号（識別番号、電話番号）をユーザ名としてもよく、或いは、あらかじめユーザ名を登録しておき、それを利用してもよい。これ以外にも、Ｃｏｏｋｉｅなどを用いて、以前入力したユーザ名を自動的に利用してもよい。

次に、動作について説明する。ユーザ興味抽出部２００は、アクセス履歴記憶装置１００が記憶している各ユーザのアクセス履歴と、文書管理部８００が検索した文書集合とを基に、各ユーザの興味情報を生成する。ユーザ興味情報の生成では、ユーザ興味抽出部２００は、まず、アクセス履歴情報を参照して、ユーザがダウンロードした文書を特定する。次いで、文書管理部８００が管理するメタ情報を参照し、当該文書に対応付けられた関連語を特定する。その後、ユーザ興味情報６１０における対応する関連語の要素の値を更新する。

具体例として、「ＵＳＥＲ０１」についてのユーザ興味情報を生成する際の動作を説明する。ユーザ興味抽出部２００は、まず、図２に示すアクセス履歴５１０を参照して、「ＵＳＥＲ０１」が、過去に、「ＤＯＣ０１」、「ＤＯＣ０２」をダウンロードしたことを認識する。次いで、図２に示すメタ情報５３０を参照し、「ＤＯＣ０１」の関連語が、「セキュリティ」、「文書管理」、「ユビキタス」であり、「ＤＯＣ０２」の関連語が、「セキュリティ」、「ユビキタス」、「ＲＦＩＤ」であることを認識する。

ユーザ興味抽出部２００は、ユーザがダウンロードした文書、或いは、閲覧した文書の関連語の個数（出現回数）をカウントする。上記の例では、各関連語の出現回数は、「セキュリティ」は２回、「文書管理」は１回、「ユビキタス」は２回、「ＲＦＩＤ」は１回となる。ユーザ興味抽出部２００は、各関連語の出現回数を、ユーザ興味情報におけるベクトルの要素の値として、当該ユーザのユーザ興味情報を生成する。ユーザ興味抽出部２００は、他のユーザ、「ＵＳＥＲ０２」、「ＵＳＥＲ０３」、「ＵＳＥＲ０４」についても同様な処理を行い、各ユーザについて、ユーザ興味情報を生成する。このような処理により、図３に示すユーザ興味情報６１０が生成される。

なお、上記では、ユーザ興味情報６１０におけるベクトル値を、文書の関連語の出現数で生成したが、各文書を検索する際に利用したキーワードや、検索日、各文書の作成者などによって重み付けを行ってもよい。例えば、文書の検索に用いたキーワードと、文書の関連語とが一致するときには、出現回数を１よりも大きな値にする重み付けを行う。具体的には、図２のアクセス履歴５１０を参照すると、ユーザ「ＵＳＥＲ０１」は、キーワード「セキュリティ」を用いて文書「ＤＯＣ０１」を検索しており、かつ、メタ情報５３０を参照すると、文書「ＤＯＣ０１」は関連語に「セキュリティ」を含んでいる。このような場合は、「ＤＯＣ０１」の関連語「セキュリティ」を１回出現したと数えるのではなく、重みをつけて１．５回出現したと数え、「ＵＳＥＲ０１」のユーザ興味情報の「セキュリティ」の値を２．５にする。

また、日付を用いて重み付けする場合は、現在の日付と文書の検索日とが離れているときには、出現回数を１よりも小さくする重み付けを行う。例えば、アクセス履歴５１０を参照すると、ユーザ「ＵＳＥＲ０１」がキーワード「セキュリティ」を用いて文書「ＤＯＣ０１」を検索した日は「２００５年１月１日」である。現在の日付が「２００７年１月１日」であるとすると、検索したのは２年前のことであり、ユーザは、現在は興味が薄れていると考えられる。そこで、「ＤＯＣ０１」の関連語「セキュリティ」を１回出現したと数えるのではなく、０．５回出現したと数え、「ＵＳＥＲ０１」の興味情報の「セキュリティ」の値を１．５にする。

文書の作成者を用いて重み付けする場合は、ユーザ自身が作成した文書については、これをユーザ興味情報の生成に利用しないようにする。例えば、アクセス履歴５１０を参照すると、「ＵＳＥＲ０１」は「ＤＯＣ０１」をダウンロードしているが、メタ情報５３０を参照すると、この「ＤＯＣ０１」の作成者は「ＵＳＥＲ０１」自身である。この場合には、ユーザ興味情報の作成で、関連語の出現数を数える際には、文書「ＤＯＣ０１」の関連語を数えないようにする。

また、図３では、ユーザ興味情報６１０のベクトルの要素を「関連語」に対応させたが、それ以外の要素、例えば「文書の作成者」や「作成日」をベクトルの要素として含めてもよい。例えば、ユーザ興味情報６１０のベクトルの要素に、「文書の作成者」として、「ＵＳＥＲ０１」や「ＵＳＥＲ１１」を加える。この場合、ユーザ「ＵＳＥＲ０１」が文書「ＤＯＣ０１」、「ＤＯＣ０２」をダウンロードしたときには、各作成者「ＵＳＥＲ０１」、「ＵＳＥＲ１１」の出現回数「１」、「１」を、それぞれの要素の値とする。また、ユーザ興味情報６１０のベクトルの要素に、「作成日」として、「２００５年」、「２００６年」などの要素を加える。この場合、「ＤＯＣ０１」、「ＤＯＣ０２」の作成日は、それぞれ「２００５／１／１」、「２００５／２／１」であるので、ユーザ興味情報６１０における「２００５年」の値を、２００５年中に作成された文書数である「２」とする。

組織情報管理部９００は、組織情報から、ユーザ設定入力部３００が設定したユーザに関連する組織情報を抽出する。例えば、組織情報管理部９００が、図２に示す組織情報５２０を管理している場合を考える。ユーザ設定入力部３００が、知識発見支援ユーザとしてユーザ「ＵＳＥＲ０４」を設定したときには、組織情報管理部９００は、組織情報５２０の所属ユーザに「ＵＳＥＲ０４」を含む組織情報を抽出する。組織情報５２０を参照すると、所属ユーザに「ＵＳＥＲ０４」を含む組織情報の部署名は「Ｂプロジェクト」であり、「Ｂプロジェクト」の他の所属ユーザは「ＵＳＥＲ０１」、関連部署は「Ａ事業部」である。組織情報管理部９００は、これらの情報を、グループ生成部４００及びグループ興味生成部５００に与える。これらに加えて、関連部署である「Ａ事業部」のユーザ「ＵＳＥＲ０１」、「ＵＳＥＲ０２」、「ＵＳＥＲ０３」を、ユーザ「ＵＳＥＲ０４」に関連する組織情報として、グループ生成部４００及びグループ興味生成部５００に与えてもよい。

グループ生成部４００は、ユーザ興味抽出部２００が抽出したユーザ興味情報と組織情報管理部９００が管理する組織情報とを用いて、ユーザ設定入力部３００が設定した知識発見支援の対象となるユーザの興味に近いユーザのグループを生成する。グループの生成では、知識発見支援対象のユーザと、他のユーザとの興味類似度を求める。「興味類似度」は、知識発見支援対象のユーザの興味情報と、他のユーザの興味情報との相関を表す値であり、興味情報のベクトル演算で得られるＣＯＳ値や、相関係数を用いることができる。得られた興味類似度に、組織情報による重み付けを行い、重み付けを行った興味類似度により、知識発見支援の対象のユーザの興味に近いユーザグループを生成する。

知識情報による重み付けでは、例えば、知識発見支援対象のユーザと同じ部署に所属する他のユーザについては重み係数を「１」とし、同じ部署に所属しないユーザについては重み係数を「０」とする。また、知識発見支援対象のユーザと同じ部署に所属する他のユーザ、及び、当該部署の関連部署に所属するユーザについては重み係数を０以外の値とし、同じ部署及び関連部署に所属しないユーザについては重み係数を「０」としてもよい。なお、重み係数を「０」とするユーザについては、重み付けを行った興味類似度は常に「０」となるので、興味類似度を求める必要はない。

上記では、知識発見支援対象のユーザと同じ部署又はその関連部署に所属しないユーザの重み係数を「０」としたが、これには限定されない。知識発見支援対象のユーザと同じ部署又はその関連部署に所属しないユーザの重み係数を、０よりも大きく、かつ、同じ部署及び関連部署に所属するユーザの重み係数よりも小さい値として、同じ部署及び関連部署に所属するユーザの興味類似度を重視してもよい。あるユーザが、知識発見支援対象のユーザと同じ部署の所属ユーザであると同時に、関連部署の所属ユーザでもあるときには、重み係数が大きい方を優先し、興味類似度に、大きい方の重み係数を乗じた値を、重み付けを行った興味類似度とすればよい。各重み係数は、あらかじめグループ生成部４００に設定しておくものとする。

具体例として、グループ生成部４００が、知識発見支援対象のユーザ「ＵＳＥＲ０４」について興味が近いグループを生成する場合を説明する。重み係数は、同じ部署のユーザの重みは「１．５」、関連部署のユーザの重みは「１．１」、同じ部署又は関連部署以外の部署のユーザの重みは「０」とする。図２の組織情報５２０を参照すると、ユーザ「ＵＳＥＲ０４」は「Ｂプロジェクト」に所属しており、「Ｂプロジェクト」に所属する他のユーザは「ＵＳＥＲ０１」である。グループ生成部４００は、ユーザ「ＵＳＥＲ０４」のユーザ興味情報と、ユーザ「ＵＳＥＲ０１」のユーザ興味情報とから、ベクトル演算を行って興味類似度（ＣＯＳ値）を求め、求めたＣＯＳ値に、重み係数「１．５」を乗じたものを、重み付けを行った興味類似度とする。

また、組織情報５２０を参照すると、「Ｂプロジェクト」の関連部署は「Ａ事業部」であり、「Ａ事業部」の所属ユーザのうちで、「Ｂプロジェクト」に所属していないユーザは、「ＵＳＥＲ０２」、「ＵＳＥＲ０３」である。グループ生成部４００は、知識発見支援対象のユーザ「ＵＳＥＲ０４」のユーザ興味情報と、関連部署のユーザ「ＵＳＥＲ０２」及び「ＵＳＥＲ０３」のユーザ興味情報とのＣＯＳ値を求め、求めたＣＯＳ値に、重み係数「１．１」を乗じたものを、重み付けを行った興味類似度とする。同じ部署又は関連部署の何れにも所属しない他のユーザについては、重み係数が「０」であるので、ＣＯＳ値の演算は行わない。グループ生成部４００は、重み付けを行った興味類似度を求めると、その値が所定のしきい値以上のユーザを興味が近いユーザと捉え、その集合を、興味が近いユーザのグループとする。

グループ興味生成部５００は、ユーザ興味情報を用いて、グループ生成部４００が生成したグループのグループ興味情報を生成する。グループ興味生成部５００は、例えば、グループを構成する各ユーザのユーザ興味情報の各要素の平均値を、グループ興味情報とする。具体例として、グループ生成部４００が、知識発見支援対象のユーザ「ＵＳＥＲ０４」について、ユーザ「ＵＳＥＲ０１」、「ＵＳＥＲ０２」、「ＵＳＥＲ０３」で構成されるグループ「ＧＲＯＵＰ０１」を生成した場合を考える。この場合、グループ興味生成部５００は、ユーザ「ＵＳＥＲ０１」のユーザ興味情報、「ＵＳＥＲ０２」のユーザ興味情報、「ＵＳＥＲ０３」のユーザ興味情報の各要素の平均値を、グループ「ＧＲＯＵＰ０１」のグループ興味情報とする。例えば、「セキュリティ」については、ユーザ「ＵＳＥＲ０１」、「ＵＳＥＲ０２」、「ＵＳＥＲ０３」の値はそれぞれ「２」、「０」、「１」であるので、その平均値「１．０」を、グループ「ＧＲＯＵＰ０１」の「セキュリティ」の値とする。

上記では、グループ興味情報は、各ユーザの興味情報の平均値を用いて求めたが、他の統計的手法を用いてもよい。例えば、最大値や中央値を用いてもよい。或いは、組織情報管理部９００が抽出した組織情報を用いて、各ユーザのユーザ興味情報に、組織情報による重み付けを行い、グループ興味情報を求めてもよい。具体的には、ｇｊをグループ興味情報におけるベクトルの要素ｊの値、ｕｉ,ｊをユーザｉの興味情報におけるベクトル要素ｊの値、βｉを組織情報に基づいたユーザｉの重みとして、下記式１により、グループ興味情報を求めてもよい。

グループ興味情報生成における重みは、例えば、知識発見支援対象のユーザと同じ部署のユーザについては「１．５」とし、関連部署のユーザについては「１．２」とし、他のユーザについては「１．０」に設定する。これらの重み係数は、あらかじめグループ興味生成部５００内に設定されている。例えば、あるユーザ（ユーザ４）について、「ユーザ１」、「ユーザ２」、「ユーザ３」の３人のユーザによりグループが構成されている場合を考える。「ユーザ１」は、「ユーザ４」と同じ部署に所属するユーザであり、「ユーザ２」は関連部署に所属するユーザ、「ユーザ３」はそれ以外の部署に所属するユーザであるとする。この場合、
β１＝１．５（ユーザ１）、β２＝１．２（ユーザ２）、β３＝１．０（ユーザ３）
となり、αｉは、
α１＝０．４１、α２＝０．３２、α３＝０．２７
となる。各ユーザのユーザ興味情報において、「セキュリティ」の要素の値が、ユーザ１は「２」、ユーザ２は「０」、ユーザ３は「１」であったとする。この場合、ユーザ４についてのグループのグループ興味情報の「セキュリティ」の要素の値は、
ｇセキュリティ＝α１×ｕ１，セキュリティ＋α２×ｕ２，セキュリティ＋α３×ｕ３，セキュリティ
＝０．４１×２．０＋０．３２×０＋０．２７×１．０
＝１．０９
となる。このような計算を、グループ興味情報の各要素について行い、組織情報による重み付けを行ったグループ興味情報を生成してもよい。

条件候補生成部６００は、グループ興味生成部５００が生成したグループ興味情報と、知識発見支援対象のユーザのユーザ興味情報と、文書管理部８００が管理している文書集合とから、知識発見支援を行うための検索の条件候補を生成する。条件候補生成部６００は、例えば、グループ興味情報にてグループの興味が高く、かつ、ユーザ興味情報にてユーザの興味が低いキーワードを、条件候補とする。

条件候補の生成では、条件候補生成部６００は、知識発見支援対象のユーザのユーザ興味情報と、グループ興味生成部５００にて生成されたグループ興味情報とから、興味情報の各要素について、条件評価値を求める。例えば、条件候補生成部６００は、グループ興味情報における各要素の値から、ユーザ興味情報における各要素の値を減算して、条件評価値とする。また、条件候補生成部６００は、文書管理部８００により、興味情報の各要素に関連する文書を検索し、関連する文書数を求める。その後、条件候補生成部６００は、条件評価値及び関連文書数がそれぞれしきい値を超えている要素を、条件候補とする。

条件候補提示部７００は、条件候補生成部６００が生成した条件候補を、表示画面上に表示するなどによってユーザに提示し、ユーザに、条件候補の選択を促す。ユーザが１つ又は複数の条件候補を選択すると、文書管理部８００は、選択された条件候補（キーワード）にて文書検索を行い、検索結果をユーザに通知する。ユーザは、通知された検索結果の中から、所望の文書を選択し、選択した文書をダウンロード又は閲覧する。ユーザが、文書を閲覧又はダウンロードしたときは、アクセス履歴記憶装置１００は、文書を閲覧又はダウンロードしたユーザ名、文書名、検索日、及び、検索に用いたキーワードを、アクセス履歴情報に追加登録する。

条件候補の生成から検索結果の表示までを、具体例を用いて説明する。図４に、条件候補生成部６００が生成する条件評価情報、条件候補提示部７００が提示する条件候補提示画面、及び、文書管理部８００による検索結果の提示画面を示す。条件候補生成部６００は、グループ「ＧＲＯＵＰ０１」のグループ興味情報６２０（図３）における各要素の値から、知識発見支援対象のユーザ「ＵＳＥＲ０４」のユーザ興味情報６１０における各要素の値を減算し、条件評価情報７１０の条件評価値とする。例えば、グループ「ＧＲＯＵＰ０１」のグループ興味情報６２０における「文書管理」の値は「０．３３」で、ユーザ興味情報６１０におけるユーザ「ＵＳＥＲ０４」における「文書管理」の値は「１」であるので、条件評価値の「文書管理」の値は「−０．６７」となる。

また、条件候補生成部６００は、文書管理部８００にて、興味情報の各要素に関連する文書を検索し、関連する文書数を求め、これを条件評価情報７１０に含める。文書管理部８００における検索では、メタ情報５３０（図２）を用いる。条件評価情報７１０の「関連文書数」を参照することで、例えば、メタ情報５３０の関連語に「セキュリティ」が含まれる文書が、１００個存在することがわかる。条件候補生成部６００は、条件評価情報７１０を参照し、「条件評価値」及び「関連文書数」が、それぞれしきい値以上の値となっている要素を、条件候補とする。例えば、条件評価値のしきい値、及び、関連文書数のしきい値を、それぞれ「０」とする。この場合、条件評価情報７１０から、「ユビキタス」、「ＲＦＩＤ」、「パソコン」、「サーバ」が条件候補として選び出される。

条件候補提示部７００は、条件候補生成部６００が生成した条件候補を、ユーザに提示し、選択を促す。条件候補提示部７００は、例えば、図４の条件候補提示画面７２０のように、「ＵＳＥＲ０４さん以下のキーワードで情報を探してはどうですか？」という案内文と、条件候補「ユビキタス」、「ＲＦＩＤ」、「パソコン」、「サーバ」を、知識発見支援対象のユーザ「ＵＳＥＲ０４」に提示する。条件候補「ユビキタス」、「ＲＦＩＤ」、「パソコン」、「サーバ」は、ＨＴＭＬのハイパーリンク機能などを利用して、選択された際に文書管理部８００の検索が開始するようにしておくとよい。

ユーザが、条件候補提示画面７２０における条件候補の中から任意の条件候補（キーワード）を選択すると、文書管理部８００は、ユーザが選択したキーワードを検索条件として文書を検索し、検索した結果をユーザに提示する。例えば、ユーザが、条件候補の中から「パソコン」を選択したときは、図４の検索結果提示画面７３０に示すように、「“パソコン”に関する文書は２００件です」という案内文とともに、検索結果一覧を提示する。検索結果一覧では、ＨＴＭＬのハイパーリンク機能などを利用して、検索結果の各文書名を選択できるようにし、ユーザが選択したときに、対応する文書ファイルをダウンロードし、或いは、更に詳細な情報を表示できるようにしておくとよい。なお、図４の条件候補提示画面７４０に示すように、条件候補と現在の検索対象とを同じ画面に表示してもよい。

図５に、知識発見支援システムの動作手順を示す。ユーザ設定入力部３００は、知識発見支援の対象となるユーザを設定する（ステップＳ１）。ユーザ興味抽出部２００は、アクセス履歴記憶装置１００に記憶されたアクセス履歴情報と、文書理管理部８００が管理する文書のメタ情報とを用いて、各ユーザの興味情報を生成する（ステップＳ２）。組織情報管理部９００は、ステップＳ１で設定したユーザに関する組織情報を抽出する（ステップＳ３）。グループ生成部４００は、組織情報管理部９００が抽出した組織情報と、ユーザ興味抽出部２００が生成したユーザ興味情報とから、ステップＳ１で設定したユーザの興味に近い興味を持つユーザのグループを生成する（ステップＳ４）。

グループ興味生成部５００は、ユーザ興味抽出部２００が生成したユーザ興味情報から、グループ生成部４００にて生成されたユーザグループのグループ興味情報を生成する（ステップＳ５）。条件候補生成部６００は、ユーザ設定入力部３００が設定したユーザの興味情報と、グループ興味生成部５００が生成したグループの興味情報と、文書管理部８００が管理する現在の検索対象文書のメタ情報とから、ユーザの知識発見を支援するための条件候補を生成する（ステップＳ６）。条件候補生成部６００は、条件候補が１つ以上生成できたか否かを判断し（ステップＳ７）、条件候補が存在しないときには、処理を終了する。

条件候補生成部６００が、１以上の条件候補を生成したときは、条件候補提示部７００は、条件候補生成部６００が生成した条件候補をユーザに提示し（ステップＳ８）、ユーザによる条件候補の選択を促す。条件候補提示部７００は、ユーザが条件候補を選択したか否かを判断し（ステップＳ９）、ユーザが条件候補を選択せずに処理終了を選んだときは、処理を終了する。ユーザが、ステップＳ８で提示された条件候補から、任意の条件候補を選択すると、文書管理部８００は、ユーザが選択した条件候補を検索条件として文書を検索する（ステップＳ１０）。文書管理部８００は、検索結果文書一覧をユーザに提示する（ステップＳ１１）。その後、ユーザが、検索結果文書一覧に含まれる文書にアクセスしたときは、アクセス履歴記憶装置１００は、アクセス履歴を追加登録する（ステップＳ１２）。

ユーザは、条件候補を選択した検索の後に、検索文書の更なる絞込みを指示することができる。ユーザが、更なる絞込みを指示したときは、ステップＳ２に戻り、再度処理を行う。このとき、ステップＳ２では、検索結果提示画面にて検索された文書を対象に、ユーザ興味情報を生成する。すなわち、アクセス履歴記憶装置１００に記憶されているアクセス履歴のうちで、メタ情報に、検索に用いられた関連語を含む文書に対するアクセス履歴を用いて、ユーザ興味情報を生成する。その後、ステップＳ２で生成したユーザ興味情報を用いてグループ生成を行い、グループ興味情報を生成し、条件候補を生成して、条件候補提示画面を表示する。

以下、知識発見支援システムの動作を、具体例を用いつつ説明する。知識発見支援システムは、文字列やボタンなどを表示できる画面、マウス、キーボード等を備えたパーソナルコンピュータで構成されているものとする。また、アクセス履歴記憶装置１００及び文書管理部８００は、データベースプログラム上で動作しているものとする。図６に、アクセス履歴、メタ情報、及び、興味情報を示す。アクセス履歴記憶装置１００は、ユーザ名と、該ユーザがダウンロードした文書名と、該文書を検索するために利用したキーワードとを、アクセス履歴８１０として記憶する。また、文書管理部８００は、文書名と該文書の関連語とを文書のメタ情報８２０として、文書ファイルと共に記憶している。

図５のステップＳ１では、ユーザ設定入力部３００は、図３のログイン画面６４０をユーザに提示し、ユーザ名の入力を促す。ここでは、ユーザ名として「ＵＳＥＲ０４」が入力されたとする。ステップＳ２では、ユーザ興味抽出部２００は、アクセス履歴記憶装置が記憶しているアクセス履歴８１０と、文書管理部８００が記憶しているメタ情報８２０とから、各ユーザのユーザ興味情報を生成する。興味情報は、各関連語を要素とするベクトルで定義する。ユーザ興味抽出部２００は、ダウンロードした文書の関連語の数を各ユーザについて求め、関連語の出現回数を、各要素の値として、ユーザ興味情報を生成する。その際、文書の検索キーワードと、そのキーワードで検索した文書の関連語とが一致する場合は、ユーザが該関連語に強い興味を持っているものと考え、出現回数を１回ではなく、１．５回と数える。

ユーザ「ＵＳＥＲ０１」のユーザ興味情報の生成について、詳細に説明する。アクセス履歴８１０を参照すると、ユーザ「ＵＳＥＲ０１」がダウンロードした文書は、「ＤＯＣ０１」と「ＤＯＣ０２」である。メタ情報８２０を参照すると、「ＤＯＣ０１」の関連語は、「セキュリティ」、「文書管理」、「ユビキタス」である。また、ユーザ「ＵＳＥＲ０１」は、「ＤＯＣ０１」の検索ではキーワード「セキュリティ」を用いており、これは、「ＤＯＣ０１」の関連語「セキュリティ」に一致する。「文書管理」、「ユビキタス」については、検索キーワードには一致しない。この場合、ユーザ興味抽出部２００は、「セキュリティ」の出現回数を「１．５回」、「文書管理」、「ユビキタス」の出現回数を「１回」とカウントする。

「ＤＯＣ０２」については、メタ情報８２０を参照すると、「ＤＯＣ０２」の関連語は「セキュリティ」、「ユビキタス」、「ＲＦＩＤ」である。また、アクセス履歴８１０を参照すると、ユーザ「ＵＳＥＲ０１」は、「ＤＯＣ０２」の検索では、キーワード「ユビキタス」を用いており、これは、「ＤＯＣ０２」の関連語「ユビキタス」と一致している。「セキュリティ」、「ＲＦＩＤ」については、検索キーワードには一致しない。この場合、ユーザ興味抽出部２００は、「ユビキタス」の出現回数を「１．５回」、「セキュリティ」、「ＲＦＩＤ」の出現回数を「１回」とカウントする。

ユーザ興味抽出部２００は、「ＤＯＣ０１」と「ＤＯＣ０２」とにおける各関連語の出現回数の和を、ユーザ興味情報とする。すなわち、ユーザ興味情報における「セキュリティ」の値を「１．５＋１＝２．５」とし、「文書管理」の値を「１＋０＝１」とし、「ユビキタス」の値を「１＋１．５＝２．５」とし、「ＲＦＩＤ」の値を「０＋１＝１」とする。その他の要素「パソコン」、「サーバ」、「ソフトウエア」については、「ＤＯＣ０１」、「ＤＯＣ０２」の関連語には含まれないので、値は０である。このような処理を、他のユーザ「ＵＳＥＲ０２」、「ＵＳＥＲ０３」、「ＵＳＥＲ０４」について行うことで、図６に示すユーザ興味情報８３０が生成される。

ステップＳ３では、組織情報管理部９００は、ユーザ「ＵＳＥＲ０４」に関する組織情報として、ユーザ「ＵＳＥＲ０４」が所属する部署、及び、その関連部署に所属するユーザを抽出する。同じユーザが、ユーザ「ＵＳＥＲ０４」が所属する部署に所属するユーザであり、かつ、関連部署に所属するユーザでもあるときは、同じ部署に所属するユーザとして取り扱うことにする。図２に示す組織情報５２０を参照すると、ユーザ「ＵＳＥＲ０４」が所属する部署は「Ｂプロジェクト」であり、「Ｂプロジェクト」の他のユーザは「ＵＳＥＲ０１」である。また、「Ｂプロジェクト」に関連する部署は「Ａ事業部」であり、「Ａ事業部」の所属ユーザで「Ｂプロジェクト」に所属しないユーザは「ＵＳＥＲ０２」、「ＵＳＥＲ０３」である。この場合、組織情報管理部９００は、同じ部署のユーザがユーザ「ＵＳＥＲ０１」であり、関連部署のユーザが「ＵＳＥＲ０２」、「ＵＳＥＲ０３」であることを示す情報を出力する。

ステップＳ４では、グループ生成部４００は、ステップＳ２で生成された各ユーザの興味情報と、ステップＳ３で抽出されたユーザ「ＵＳＥＲ０４」に関する組織情報とを用いて、グループを生成する。グループの生成では、ユーザ「ＵＳＥＲ０４」と他のユーザの興味類似度を求め、求めた興味類似度に、組織情報による重み付けを行い、重み付けを行った興味類似度が所定しきい値以上となるユーザを、ユーザ「ＵＳＥＲ０４」に興味が近いユーザのグループとする。重み付けの際の重み係数は、ユーザ「ＵＳＥＲ０４」と同じ部署に所属するユーザは「１．５」とし、関連部署のユーザは「１．０」とし、同じ部署又は関連部署の何れにも所属しないユーザは「０」とする。

図７に、興味類似度計算式、興味類似度、重み付けを行った興味類似度、グループ興味情報、条件評価情報を示す。興味類似度は、ベクトル演算によるＣＯＳ値を用いる。すなわち、図７に式９１０で示すように、ユーザ間の興味情報の内積を、ベクトルの大きさの積で割った値（ＣＯＳ値）を、興味類似度として用いる。図６のユーザ興味情報８３０より、ユーザ「ＵＳＥＲ０４」と、ユーザ「ＵＳＥＲ０１」、「ＵＳＥＲ０２」、「ＵＳＥＲ０３」との間のＣＯＳ値を求めると、図７のＣＯＳ値９２０に示すように、それぞれ、「０．５３」、「０．０」、「０．６８」となった。

グループ生成部４００は、計算したＣＯＳ値に、組織情報による重み付けを行い、重み付けを行った興味類似度を求める。ユーザ「ＵＳＥＲ０４」と同じ部署のユーザは、ユーザ「ＵＳＥＲ０１」であり、関連部署のユーザはユーザ「ＵＳＥＲ０２」、「ＵＳＥＲ０３」であるので、ユーザ「ＵＳＥＲ０１」のＣＯＳ値に重み係数「１．５」を乗じた値（０．５３×１．５＝０．８０）を重み付けを行った興味類似度とし、ユーザ「ＵＳＥＲ０２」、「ＵＳＥＲ０３」のＣＯＳ値に重み係数「１．０」を乗じた値（０×１＝０、０．６８×１＝０．６８）を重み付けを行った興味類似度とする。このような処理により、ＣＯＳ値９２０から、重み付けを行った興味類似度９３０が得られる。

グループ生成部４００は、重み付けを行った興味類似度が高いユーザを、ユーザ「ＵＳＥＲ０４」に興味が近いユーザとする。ここでは、重み付けを行った興味類似度のしきい値を、「０．２」とする。重み付けを行った興味類似度９３０を参照すると、値が「０．２」以上となるユーザは、ユーザ「ＵＳＥＲ０１」と「ＵＳＥＲ０３」である。この場合、グループ生成部４００は、ユーザ「ＵＳＥＲ０１」、「ＵＳＥＲ０３」を、ユーザ「ＵＳＥＲ０４」に興味が近いユーザのグループ「ＧＲＯＵＰ０１」とする。

ステップＳ５では、グループ興味生成部５００は、ステップＳ４で生成したグループの各ユーザのユーザ興味情報と、ステップＳ３で抽出されたユーザ「ＵＳＥＲ０４」の組織情報とに基づいて、ステップＳ４で生成したグループの興味情報を生成する。グループ興味情報の生成には、式１を用いる。式１における組織情報に基づいたユーザの重みβは、ユーザ「ＵＳＥＲ０４」と同じ部署のユーザは「１．５」、関連部署のユーザは「１．２」、同じ部署又は関連部署の何れにも所属しないユーザは「０」とする。

ユーザ「ＵＳＥＲ０４」に興味が近いユーザのグループ「ＧＲＯＵＰ０１」は、ユーザ「ＵＳＥＲ０１」と「ＵＳＥＲ０３」とで構成されており、ユーザ「ＵＳＥＲ０１」は、ユーザ「ＵＳＥＲ０４」と同じ部署に所属し、ユーザ「ＵＳＥＲ０３」は、関連部署に所属している。よって、式１におけるグループ内の各ユーザの重みβｉは、
β１（ＵＳＥＲ０１に相当）＝１．５
β２（ＵＳＥＲ０３に相当）＝１．２
となる。また、Σβｉ＝２．７であるので、
α１＝１．５／２．７＝０．５６
α２＝１．２／２．７＝０．４４
となる。

グループ興味生成部５００は、上記α１、α２を用い、ユーザ「ＵＳＥＲ０１」の興味情報と、ユーザ「ＵＳＥＲ０３」の興味情報とから、グループ「ＧＲＯＵＰ０１」の興味情報を生成する。例えば、ユーザ興味情報８３０（図６）を参照すると、ユーザ「ＵＳＥＲ０１」、「ＵＳＥＲ０３」の「セキュリティ」の値は、
ｕ１，セキュリティ＝２．５
ｕ２，セキュリティ＝１．５
であるので、グループ「ＧＲＯＵＰ０１」のグループ興味情報における「セキュリティ」の値ｇセキュリティは、
ｇセキュリティ＝α１×ｕ１，セキュリティ＋α１×ｕ１，セキュリティ
＝０．５６×２．５＋０．４４＋１．５＝２．１
となる。他の要素についても、同様な計算を行うことで、図７に示すグループ興味情報９４０が得られる。

ステップＳ６では、条件候補生成部６００は、ユーザ「ＵＳＥＲ０４」のユーザ興味情報のベクトルと、グループ「ＧＲＯＵＰ０１」のグループ興味情報のベクトルとの差から、各キーワードの条件評価値を求める。また、条件候補生成部６００は、各キーワードを関連語として持つ関連文書数を求め、これらを、条件評価情報９５０とする。条件候補生成の際の条件評価値のしきい値を「０．５」とし、関連文書数のしきい値を「０」とする。条件評価情報９５０を参照すると、条件評価値及び関連文書数がしきい値以上となる要素は、「セキュリティ」、「ユビキタス」、「ＲＦＩＤ」の３つである。条件候補生成部６００は、「セキュリティ」、「ユビキタス」、「ＲＦＩＤ」を条件候補として選択する。

図８に、条件候補提示画面、検索結果提示画面、及び、アクセス履歴を示す。ステップＳ８では、条件候補提示部７００は、新しい知識を発見するためのおすすめキーワードである、ステップＳ６で生成された条件候補「セキュリティ」、「ユビキタス」、「ＲＦＩＤ」を含む条件候補提示画面１１１０を、ユーザに提示する。ユーザは、このような条件候補提示画面１１１０から、任意のキーワードを選択可能である。ユーザが、「セキュリティ」を選択すると、ステップＳ１０へ移行し、条件候補提示部７００は、文書管理部８００に選択されたキーワード「セキュリティ」を送り、文書管理部８００は、「セキュリティ」を検索キーワードとして、文書検索を行う。その後、文書管理部８００は、ステップＳ１１にて、検索結果提示画面１１２０を、ユーザに提示する。

ユーザは、検索結果提示画面１１２０で示した検索結果から、例えば、「○○技術紹介資料」を選択する。文書管理部８００は、「○○技術紹介資料」の詳細情報を表示し、或いは、「○○技術紹介資料」のファイルをユーザに送付する。ユーザ「ＵＳＥＲ０４」が、「○○技術紹介資料」のファイルをダウンロードしたときは、アクセス履歴記憶装置１００は、ステップＳ１２にて、アクセス履歴１１３０に示すように、「ユーザ名＝ＵＳＥＲ０４」、「文書名＝○○技術紹介資料」、「キーワード＝セキュリティ」を、アクセス履歴に記憶する。

図８に示す検索結果提示画面１１２０には、「さらに絞込み」のリンクが埋め込まれている。ユーザが、検索結果提示画面１１２０から「さらに絞込み」を選択した場合は、「セキュリティ」で絞り込んだ検索結果１００件に対して、ステップＳ２から再度処理を行う。このとき、ステップＳ２では、検索結果提示画面１１２０にて検索された文書を対象に、ユーザ興味情報を生成する。すなわち、アクセス履歴記憶装置１００に記憶されているアクセス履歴のうちで、メタ情報に「セキュリティ」を関連語として含む文書に対するアクセス履歴を用いて、ユーザ興味情報を生成する。その後、ステップＳ２で生成したユーザ興味情報を用いてグループ生成を行い、グループ興味情報を生成し、条件候補を生成して、条件候補提示画面を表示する。

本実施形態では、ユーザの興味に近いグループの興味情報の生成の際に、組織情報による重み付けを行う。この重み付けにて、組織上、ユーザに近い関係にあるユーザほど、興味類似度が高く計算されるようにすることで、ユーザに近い関係にあるユーザを重視した形で、ユーザに興味が近いユーザのグループを生成できる。つまりは、ユーザ間の関係を反映した形で、ユーザに興味が近いユーザのグループを生成できる。このグループについてのグループ興味情報を求め、これと、ユーザの興味情報とを比較し、ユーザの興味が低く、グループの興味が高い興味情報の要素を求める。このようにすることで、ユーザは、自身と組織上近い他のユーザは検索に用いているが、自身はこれまでにあまり検索に利用しなかった検索ワード（条件候補）を得ることができる。ユーザは、提示された条件候補を用いて文書を検索することで、新たな知識獲得のための文書に、アクセスすることができる。

アクセス履歴記憶装置１００が記憶するアクセス履歴は、ユーザが文書をダウンロードすることで更新される。また、文書管理部８００に、新たな文書が追加されたときは、その文書及びメタ情報が、文書管理部８００に記憶されていく。本実施形態では、現在のアクセス履歴、及び、検索対象文書に基づいて、条件候補を生成するため、ユーザの興味の変化によるアクセス文書の変化や、検索対象の文書の変化に合わせて、生成される条件候補が随時変化する。従って、本実施形態では、状況変化に合わせて、ユーザに、新たな知識獲得のための条件候補を提示することができる。また、本実施形態では、ユーザが検索した文書に対して、更なる絞込みを行う機能を提供する。このようにすることで、検索対象の文書が大量にあるときでも、ユーザは、条件候補を選択しつつ、文書絞り込みを行うことで、所望の文書にたどり着くことができる。

図９は、本発明の第２実施形態の知識発見支援システムの構成を示している。本実施形態では、組織情報管理部９００（図１）に代えて、人脈情報管理部９０１を用いる。人脈情報管理部９０１は、ユーザとユーザとの関係を表した人脈情報（ユーザ関係情報）を管理する。人脈情報は、例えば、上司／部下の関係や、部署内メンバーの先輩・後輩の関係、グループメンバの業務領域の近さ、知り合い関係などを表したものである。人脈情報の具体例を、図１０に示す。この例では、人脈情報１２００は、ユーザと、その上司に当たるユーザとの関係を表している。この人脈情報１２００を参照することで、ユーザ「ＵＳＥＲ０１」の上司はユーザ「ＵＳＥＲ０２」であり、ユーザ「ＵＳＥＲ０２」の上司は「ＵＳＥＲ０３」であることがわかる。ここでは、ユーザ間の関係を１対１で表したが、１ユーザと多ユーザとの関係を人脈情報としてもよい。

人脈情報管理部９０１は、ユーザ設定入力部３００が設定したユーザに関する人脈情報を、グループ生成部４００及びグループ興味生成部５００に与える。例えば、人脈情報管理部９０１が、図１０に示す人脈情報１２００を記憶しており、ユーザ設定入力部３００がユーザ「ＵＳＥＲ０１」をユーザと設定した場合を考える。この場合、人脈情報管理部９０１は、ユーザ「ＵＳＥＲ０１」に関する人脈情報として、上司が「ＵＳＥＲ０２」であり、その上の上司が「ＵＳＥＲ０３」であることを示す情報を出力する。

グループ生成部４００は、人脈情報管理部９０１が出力する人脈情報と、ユーザ興味抽出部２００が生成したユーザ興味情報とから、ユーザ設定入力部３００が設定した、知識発見支援の対象となるユーザの興味に近いユーザのグループを生成する。グループ生成では、知識発見支援対象のユーザと、他のユーザとの間での興味類似度を求め、興味類似度に、人脈情報に基づく重み付けを行い、重み付けを行った興味類似度が所定のしきい値以上のユーザを、興味が近いユーザのグループとする。人脈情報に基づく重み付けにおける重み係数は、あらかじめグループ生成部４００内に設定されている。人脈情報による重み付けでは、例えば、知識発見支援対象のユーザの部下や上司にあたるユーザに対する重み係数を「１」とし、それ以外のユーザについては重み係数を「０」とする。また、知識発見支援対象のユーザの部下や上司にあたるユーザに対する重み係数を「１」以外の値として、知識発見支援対象のユーザとの関係に応じて、重みを変化させてもよい。

例えば、ユーザ設定入力部３００が設定したユーザが「ＵＳＥＲ０１」であり、人脈情報管理部９０１が、ユーザ「ＵＳＥＲ０１」の人脈情報として、「上司＝「ＵＳＥＲ０２」、上司の上司＝「ＵＳＥＲ０３」」を出力する場合を考える。グループ生成の際の重み係数については、「上司」は「１．５」とし、「上司の上司」は「１．１」とする。グループ生成部４００は、ユーザ「ＵＳＥＲ０１」とユーザ「ＵＳＥＲ０２」との間での興味類似度（ＣＯＳ値）を計算し、得られた興味類似度に重み係数「１．５」を乗じたものを、重み付けを行った興味類似度とする。また、ユーザ「ＵＳＥＲ０１」とユーザ「ＵＳＥＲ０３」との間での興味類似度を計算し、得られた興味類似度に重み係数「１．１」を乗じたものを、重み付けを行った興味類似度とする。グループ生成部４００は、第１実施形態と同様に、知識発見支援対象のユーザとの間での重み付けを行った興味類似度がしきい値以上のユーザを、興味の近いユーザとして捉え、それらのユーザでグループを生成する。

グループ興味生成部５００は、ユーザ興味抽出部２００が生成したユーザ興味情報から、グループ生成部４００が生成したグループについてのグループ興味情報を生成する。グループ興味生成部５００は、グループ生成部４００が生成したグループに属するユーザの興味情報の平均値を、グループ興味情報とする。或いは、人脈情報を用いてユーザ興味情報の各要素の値に重み付けを行い、ユーザとの関係を考慮してグループ興味情報を生成してもよい。

人脈情報による重み付けを行ったグループ興味情報では、例えば、第１実施形態で説明した式１を用いる。ただし、βｉの値は、人脈情報に基づく重み係数とする。重み係数は、例えば、知識発見支援対象のユーザの上司は「１．５」とし、上司の上司は「１．１」とし、他のユーザ「１．０」に設定する。これら重み係数は、グループ興味生成部５００にあらかじめ設定されている。グループ興味生成部５００は、式１に従って、グループを構成する各ユーザについてαｉを求め、これを用いて、グループ興味情報の各要素ｇｊを算出する。

上記では、人脈情報として、部署内での人間関係に着目した人脈情報を用いたが、ユーザ間の関係は、部署内での人間関係には限られず、その他の関係を用いてもよい。例えば、ＳＮＳ（ソーシャルネットワーキングサービス）が管理する人と人とのつながりを人脈情報として用いることができ、或いは、趣味のサークルなどのグループの所属情報を人脈情報として用いてもよい。具体的に、ＳＮＳが管理する人と人とのつながりを人脈情報とするときは、人脈情報管理部９０１により、知識発見支援対象のユーザの友人、友人の友人などの関係を抽出し、グループ生成及びグループ興味情報生成にて、ユーザとの関係に応じた重み付けを行えばよい。その際には、ユーザの友人の重みを、友人の友人よりも大きくして、重み付けを行えばよい。

図１１に、本実施形態の知識発見支援システムの動作手順を示す。知識発見支援対象のユーザの設定、及び、ユーザ興味情報の生成は、第１実施形態と同様である（ステップＳ１、ステップＳ２）。人脈情報管理部９０１は、ステップＳ１で設定したユーザに関係する人脈情報を抽出する（ステップＳ１０３）。グループ生成部４００は、人脈情報管理部９０１が抽出した組織情報と、ユーザ興味抽出部２００が生成したユーザ興味情報とから、ステップＳ１で設定したユーザの興味に近い興味を持つユーザのグループを生成する（ステップＳ１０４）。グループ興味生成部５００は、ユーザ興味情報から、グループ生成部４００が生成したユーザグループのグループ興味情報を生成する（ステップＳ１０５）。その後の動作は、第１実施形態と同様である（ステップＳ６〜ステップＳ１２）。

以下、本実施形態の知識発見支援システムの動作を、具体例を用いつつ説明する。ユーザ設定入力部３００は、図１２に、人脈情報管理部９０１が管理／抽出する人脈情報、グループ生成の際の重み付けを行ったユーザ興味類似度、及び、グループ興味生成部５００が生成するグループ興味情報の具体例を示す。ステップＳ１で、知識発見支援対象のユーザとして、ユーザ「ＵＳＥＲ０４」を設定する。ユーザ興味抽出部２００は、ステップＳ２で、アクセス履歴情報から、各ユーザの興味情報を生成する。このとき生成されたユーザ興味情報は、図６に示すユーザ興味情報８３０とする。

人脈情報管理部９０１は、図１２に示す人脈情報１３１０を記憶している。人脈情報管理部９０１は、ステップＳ１０３で、人脈情報１３１０から、ステップＳ１で設定されたユーザ「ＵＳＥＲ０４」の人脈情報を抽出する。人脈情報１３１０を参照すると、ユーザ「ＵＳＥＲ０４」の上司はユーザ「ＵＳＥＲ０１」であり、上司の上司はユーザ「ＵＳＥＲ０２」であるので、ステップＳ１０３では、その旨を示す人脈情報１３２０を抽出する。

グループ生成部４００は、ステップＳ１０４にて、ステップＳ２で生成した各ユーザの興味情報８３０と、ステップＳ１０３で抽出したユーザ「ＵＳＥＲ０４」の人脈情報１３２０とを用いて、ユーザ「ＵＳＥＲ０４」に興味が近いユーザのグループを生成する。ステップＳ１０４のグループの生成では、ユーザ興味情報８３０を用いてユーザ「ＵＳＥＲ０４」と他のユーザとの間で興味類似度（ＣＯＳ値）を求め、求めたＣＯＳ値にユーザ人脈情報１３２０に基づく重み付けを行って、重み付けを行った興味類似度１３３０を求める。重み付けにおける重み係数は、ユーザの上司は「１．５」とし、上司の上司は「１．１」とし、その他のユーザは「１．０」とする。

重み付けを行った興味類似度１３３０を参照すると、ユーザ「ＵＳＥＲ０４」とユーザ「ＵＳＥＲ０１」との興味類似度は「０．８０」であり、ユーザ「ＵＳＥＲ０２」との興味類似度は「０．０」であり、ユーザ「ＵＳＥＲ０３」との興味類似度は「０．６８」である。興味類似度のしきい値を「０．５」とした場合、重み付けを行った興味類似度１３３０の中でしきい値以上となるユーザはユーザ「ＵＳＥＲ０１」と「ＵＳＥＲ０３」であるので、これらユーザを、ユーザ「ＵＳＥＲ０４」に興味が近いユーザのグループ「ＧＲＯＵＰ０２」とする。

グループ興味生成部５００は、ステップＳ１０５で、ステップＳ１０４で生成したグループ「ＧＲＯＵＰ０２」の興味情報を生成する。グループ興味情報の生成には、式１を用いる。グループ興味情報生成における人脈情報に基づく重み係数は、ユーザ「ＵＳＥＲ０４」の上司は「１．５」とし、上司の上司は「１．１」とし、その他のユーザは「１．０」とする。グループ「ＧＲＯＵＰ０２」を構成するユーザのうち、ユーザ「ＵＳＥＲ０１」はユーザＵＳＥＲ０４」の上司であるため、式１における重み係数β１（ＵＳＥＲ０１に対応）は「１．５」となる。また、ユーザ「ＵＳＥＲ０３」は、ユーザ「ＵＳＥＲ０４」と上司／部下の関係にないので、重み係数β２（ＵＥＳＲ０３に対応）は「１．０」となる。この場合、式１より、α１、α２は、それぞれ、
α１＝β１／Σβ＝１．５／（１．５＋１．０）＝０．６
α２＝β２／Σβ＝１．０／（１．５＋１．０）＝０．４
となる。

グループ興味生成部５００は、式１に従って、興味情報の各要素の値を算出する。例えば、「セキュリティ」については、
ｇセキュリティ＝α１×ｕ１，セキュリティ＋α２×ｕ２，セキュリティ
＝０．６×２．５＋０．４×１．５＝２．１
となる。グループ興味生成部５００は、このような計算を各要素について行うことで、グループ「ＧＲＯＵＰ０２」の興味情報１３４０を生成する。これ以降の動作については、第１実施形態と同様であるので、説明は省略する。

本実施形態では、組織情報に代えて、人脈情報を用いる。本実施形態では、人脈情報を用いた重み付けを行うことで、知識発見支援対象のユーザの上司／部下や、知り合い関係を考慮した条件候補生成が可能である。従って、実際の人間関係を考慮し、よりユーザの業務や興味に関係の深い知識発見を支援することができる。その他の効果は、第１実施形態と同様である。

なお、第１実施形態では組織情報を用い、第２実施形態では人脈情報を用いたが、これら２つを用いてグループ生成、グループ興味情報生成を行ってもよい。例えば、グループの生成に際して、「ユーザ１」が、知識発見支援対象のユーザと同じ部署に所属し、かつ、「ユーザ１」が知識発見支援対象のユーザの上司である場合には、知識類似度に乗じる重み係数を、同じ部署のユーザに設定する重み係数と、上司に設定する重み係数との積とする。具体的には、同じ部署のユーザに設定する重み係数が「１．５」であり、上司に設定する重み係数が「１．５」であるときには、興味類似度に、１．５×１．５＝２．２５を乗じる。この場合は、組織上の関係と、上司／部下の関係との双方を、条件候補の生成に反映させることができる。

また、上記各実施形態では、組織情報又は人脈情報を用いてグループ生成を行い、生成したグループの興味情報を求めたが、グループ興味情報の生成にて、組織情報又は人脈情報を用いる場合は、グループの生成は必須ではない。例えば、図５にて、ステップＳ３からステップＳ５に移行し、ステップＳ５にて、組織情報又は人脈情報による重み付けを行いつつ、グループ興味情報を生成してもよい。この場合も、知識発見支援対象のユーザに関係が深いユーザほど重み係数を大きくすることで、ユーザに関係が深いユーザのユーザ興味情報がグループ興味情報に与える影響を大きくすることができ、人的関係を考慮した条件候補の生成が可能である。

本発明を特別に示し且つ例示的な実施形態を参照して説明したが、本発明は、その実施形態及びその変形に限定されるものではない。当業者に明らかなように、本発明は、添付のクレームに規定される本発明の精神及び範囲を逸脱することなく、種々の変更が可能である。

本出願は、２００７年７月２０日出願に係る日本特許出願２００７−１８８９５０号を基礎とし且つその優先権を主張するものであり、引用によってその開示の内容の全てを本出願の明細書中に加入する。

本発明は、データベースに格納されたデータを検索する情報検索システムや、データベースに格納されたデータの中から適した情報を推薦してくれる情報推薦システムといった用途に適用できる。

Claims

ユーザに、検索対象データに対する検索条件の候補を提示し、ユーザの知識発見を支援する知識発見支援システムであって、
各ユーザの前記検索対象データに対するアクセス履歴を記憶するアクセス履歴記憶装置と、検索対象データを管理する検索対象データ管理部が記憶しているメタ情報とを参照して、各ユーザについて、ユーザの興味の度合いを示すユーザ興味情報を生成するユーザ興味抽出部と、
前記ユーザ興味情報と、ユーザ間の関係を表すユーザ関係情報とを用いて、知識発見支援対象のユーザの興味に近いユーザのグループを生成するグループ生成部と、
前記ユーザ興味情報を用いて、前記グループ生成部が生成したグループの興味情報を生成するグループ興味生成部と、
前記知識発見支援対象のユーザのユーザ興味情報と、前記グループ興味生成部が生成したグループ興味情報との差に基づいて、前記検索条件の候補を生成する条件候補生成部と、
前記条件候補生成部が生成した条件候補を、ユーザに提示する条件候補提示部とを備えることを特徴とする知識発見支援システム。
前記メタ情報は、前記検索対象データが関連する分野を示す関連語を含んでおり、前記興味情報は、前記関連語を要素として含む多次元ベクトルで表されることを特徴とする、請求項１に記載の知識発見支援システム。
前記グループ生成部は、前記ユーザ興味情報に基づいて、前記知識発見支援対象のユーザと、他のユーザとの間の興味類似度を求め、該求めた興味類似度に、前記ユーザ関係情報による重み付けを行い、重み付けを行った興味類似度が所定のしきい値以上の他のユーザを、前記知識発見支援対象のユーザの興味に近いユーザのグループとすることを特徴とする、請求項２に記載の知識発見支援システム。
前記グループ生成部は、前記知識発見支援対象のユーザのユーザ興味情報を表すベクトルをＡ、他のユーザのユーザ興味情報を表すベクトルをＢとして、興味類似度を、
興味類似度＝（Ａ・Ｂ）／｜Ａ｜×｜Ｂ｜
で求めることを特徴とする、請求項３に記載の知識発見支援システム。
前記グループ生成部は、前記知識発見支援対象のユーザのユーザ興味情報を表すベクトルと、他のユーザのユーザ興味情報を表すベクトルとの相関係数を、興味類似度として求めることを特徴とする、請求項３に記載の知識発見支援システム。
前記グループ生成部は、前記知識発見支援対象のユーザが属する部署、当該部署に所属するユーザ、及び当該部署の関連部署を記述し、ユーザに応じてそれぞれのユーザや部署で同じ、あるいは異なる重み付けが設定された組織情報をもとにユーザの重み付けを行うことを特徴とする、請求項３〜５の何れか一に記載の知識発見支援システム。
前記グループ生成部は、前記知識発見支援対象のユーザの上司／部下、知り合い関係、及び、グループメンバ関係の少なくとも１つを有する人脈を記述し、ユーザとの関係に応じて同じ、あるいは異なる重み付けが設定された人脈情報をもとにユーザの重み付けを行うことを特徴とする、請求項３〜５の何れか一に記載の知識発見支援システム。
前記グループ興味生成部は、前記グループ生成部が生成したグループを構成する各ユーザの興味情報における各要素の値の平均を、前記グループ興味情報における各要素の値とすることを特徴とする、請求項７に記載の知識発見支援システム。
前記グループ興味生成部は、ユーザが属する部署、当該部署に所属するユーザ、及び、当該部署の関連部署を記述し、ユーザに応じてそれぞれのユーザや部署で同じ、あるいは異なる重み付けが設定された組織情報で表現されたユーザ関係情報を用いて生成したグループを構成する各ユーザの興味情報における各要素の値に、前記ユーザ関係情報による重み付けを行い、前記グループ興味情報における各要素の値を生成することを特徴とする、請求項２〜８の何れか一に記載の知識発見支援システム。
前記グループ興味生成部は、ユーザの上司／部下、知り合い関係、及び、グループメンバ関係の少なくとも１つを有する人脈を記述し、ユーザとの関係に応じて同じ、あるいは異なる重み付けが設定された人脈情報を用いて生成したグループを構成する各ユーザの興味情報における各要素の値に、前記ユーザ関係情報による重み付けを行い、前記グループ興味情報における各要素の値を生成することを特徴とする、請求項２〜８の何れか一に記載の知識発見支援システム。
前記条件候補生成部は、前記グループ興味生成部が生成したグループ興味情報における要素の値と、前記知識発見支援対象のユーザのユーザ興味情報における要素の値との差に基づいて、前記条件候補を生成することを特徴とする、請求項２〜１０の何れか一に記載の知識発見支援システム。
前記条件候補生成部は、前記グループ興味生成部が生成したグループ興味情報における要素の値と、前記知識発見支援対象のユーザのユーザ興味情報における要素の値との差が所定のしきい値以上の要素に対応する関連語を、前記条件候補とすることを特徴とする、請求項１１に記載の知識発見支援システム。
前記条件候補生成部は、前記グループ興味生成部が生成したグループ興味情報における要素の値と、前記知識発見支援対象のユーザのユーザ興味情報における要素の値との差が所定のしきい値以上で、かつ、該要素に対応する関連語で検索される検索対象データ数が所定のしきい値以上の要素に対応する関連語を、前記条件候補とすることを特徴とする、請求項１１に記載の知識発見支援システム。
前記ユーザ興味抽出部は、前記アクセス履歴を参照して、各ユーザがアクセスした検索対象データを特定し、前記メタ情報を参照して、前記特定した検索対象データの関連語の出現個数を調べ、該出現個数を、前記多次元ベクトルにおける各要素の値とすることを特徴とする、請求項２〜１３の何れか一に記載の知識発見支援システム。
前記検索対象データ管理部は、前記条件候補提示部が提示する条件候補のうちの少なくとも１つがユーザによって選択されると、該選択された条件候補に合致する検索対象データを検索し、検索結果を表示することを特徴とする、請求項１〜１６の何れか一に記載の知識発見支援システム。
何れか一に記載の知識発見支援システム。
前記アクセス履歴記憶装置は、ユーザが、前記検索された検索対象データのうちの何れかにアクセスすると、該アクセスした検索対象データを特定する情報、及び、検索に際して使用された条件候補を含むアクセス履歴を生成し記憶することを特徴とする、請求項１７に記載の知識発見支援システム。
ユーザが、前記検索結果に対して更に絞り込む旨の指令を与えると、前記ユーザ興味抽出部は、前記アクセス履歴のうちの前記検索された検索対象データに関するアクセス履歴と、前記メタ情報とを参照して、各ユーザについて、対象が狭められたユーザ興味情報を生成し、前記グループ生成部は、前記対象が狭められたユーザ興味情報と、前記ユーザ関係情報とを用いて、知識発見支援対象のユーザの興味に近いユーザのグループを生成し、前記グループ興味生成部は、前記対象が狭められたユーザ興味情報を用いて、対象が狭められたグループ興味情報を生成し、前記条件候補生成部は、前記知識発見支援対象のユーザの対象が狭められたユーザ興味部と、前記グループ興味生成部が生成した対象が狭められたグループ興味情報とに基づいて、前記検索条件の候補を生成することを特徴とする、請求項１７又は１８に記載の知識発見支援システム。
コンピュータを用い、ユーザに、検索対象データに対する検索条件の候補を提示し、ユーザの知識発見を支援する知識発見支援方法であって、
前記コンピュータが、各ユーザの前記検索対象データに対するアクセス履歴を記憶するアクセス履歴記憶装置と、検索対象データを管理する検索対象データ管理部が記憶しているメタ情報とを参照して、各ユーザについて、ユーザの興味の度合いを示すユーザ興味情報を生成するステップと、
前記コンピュータが、前記ユーザ興味情報と、ユーザ間の関係を表すユーザ関係情報とを用いて、知識発見支援対象のユーザの興味に近いユーザのグループを生成するステップと、
前記コンピュータが、前記ユーザ興味情報を用いて、前記生成したグループの興味情報を生成するステップと、
前記コンピュータが、前記知識発見支援対象のユーザのユーザ興味情報と、前記グループ興味情報との差に基づいて、前記検索条件の候補を生成するステップと、
前記コンピュータが、前記生成した条件候補を、ユーザに提示するステップとを有することを特徴とする知識発見支援方法。
ユーザに、検索対象データに対する検索条件の候補を提示し、ユーザの知識発見を支援する処理を、コンピュータに実行させるプログラムであって、前記コンピュータに、
各ユーザの前記検索対象データに対するアクセス履歴を記憶するアクセス履歴記憶装置と、検索対象データを管理する検索対象データ管理部が記憶しているメタ情報とを参照して、各ユーザについて、ユーザの興味の度合いを示すユーザ興味情報を生成するステップと、
前記ユーザ興味情報と、ユーザ間の関係を表すユーザ関係情報との差に基づいて、知識発見支援対象のユーザの興味に近いユーザのグループを生成するステップと、
前記ユーザ興味情報を用いて、前記生成したグループの興味情報を生成するステップと、
前記知識発見支援対象のユーザのユーザ興味情報と、前記グループ興味情報とに基づいて、前記検索条件の候補を生成するステップと、
前記生成した条件候補を、ユーザに提示するステップとを実行させることを特徴とするプログラム。