JP5223865B2 - 知識発見支援システム、方法、及び、プログラム - Google Patents
知識発見支援システム、方法、及び、プログラム Download PDFInfo
- Publication number
- JP5223865B2 JP5223865B2 JP2009524465A JP2009524465A JP5223865B2 JP 5223865 B2 JP5223865 B2 JP 5223865B2 JP 2009524465 A JP2009524465 A JP 2009524465A JP 2009524465 A JP2009524465 A JP 2009524465A JP 5223865 B2 JP5223865 B2 JP 5223865B2
- Authority
- JP
- Japan
- Prior art keywords
- user
- interest
- information
- group
- knowledge discovery
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 32
- 230000008520 organization Effects 0.000 claims description 63
- 238000000605 extraction Methods 0.000 claims description 34
- 230000008569 process Effects 0.000 claims description 13
- 238000013523 data management Methods 0.000 claims description 10
- 238000007726 management method Methods 0.000 description 81
- 238000011156 evaluation Methods 0.000 description 26
- 238000005516 engineering process Methods 0.000 description 9
- 239000000284 extract Substances 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 239000000463 material Substances 0.000 description 5
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 235000014510 cooky Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、知識発見支援システム、方法、及び、プログラムに関し、更に詳しくは、ユーザに検索条件の候補を提供する知識発見支援システム、方法、及び、プログラムに関する。
複数のユーザで文書を共有し、キーワードを入力して共有した文書の中から所望の文書を検索できるシステムがある。従来のシステムでは、ユーザは、自身が保有する知識をもとにキーワードを設定し、文書検索を行う。このため、従来のシステムでは、ユーザが検索可能な文書の範囲は、ユーザが有する知識の範囲に限定されることになる。このため、ユーザにとって興味深い文書や重要な文書が存在する場合でも、ユーザがそれらを発見することが困難な場合がある。この問題を解消する技術として、他のユーザの知識を利用して新たな文書の発見を支援する技術がある。具体的には、特許文献1、2、及び、非特許文献1は、検索履歴をもとに、検索を行うユーザと他のユーザとの関係を分析し、検索を行うユーザにとって興味深い文書や重要な文書の発見を支援する技術を記載する。
特許文献1では、ユーザが入力した検索キーワードに対する検索結果に対し、他のユーザの参照回数や参照日を基に、検索意図に合わせて並び替えを行う。例えば、グループの中で、自分だけが知らない情報を得たいという検索意図の場合は、自身はあまり参照していないが他のユーザがよく参照している文書が上位にくるように並び替えを行う。また、非特許文献1では、協調フィルタリング技術を用い、他のユーザの中で自分の興味に近いユーザを探し、そのユーザの評価が高くかつ検索を行うユーザが知らないであろう文書を推薦する。具体的には、各ユーザが文書に設定した評価値や既知・不既知情報を用いて協調フィルタリングを行い、検索を行うユーザが未評価かつ不既知の文書の評価値を予測する。非特許文献1では、予測された評価値をもとに文書を並び替えてユーザに提示することで、自分の興味に近い他のユーザの評価が高く、かつ、自分がまだ見ていない文書を簡単に探すことができる。
特許文献2では、他のユーザの検索キーワード履歴の中から、自分が入力した検索キーワードに類似する検索キーワード履歴を抽出し、類似検索キーワードとその類似検索キーワードを利用したユーザの所属や業務内容などの情報を提示する。特許文献2では、ユーザは、今まで思いつかなかった検索キーワードを入手できるだけでなく、そのキーワードを使用したユーザの所属や業務内容も参照できるため、ユーザの所属や業務に関係する知識発見が容易になる。
上記した文献は、以下の通りである。
特開2006−268789号公報
特開2005−78334号公報
清水拓也、土方嘉徳、西田正吾、「発見性を考慮した協調フィルタ リングアルゴリズムに関する基礎検討」、情報処理学会研究報告(DBS)データベース・システム、2006、DBS−139、pp.53−60
上記した文献は、以下の通りである。
上記関連技術では、各ユーザの閲覧履歴や、検索に用いたキーワードを基に、文書を推薦し、或いは、検索条件履歴を提示して、ユーザが新たな知識を発見するための支援を行っている。これら関連技術における第1の問題点は、現実の所属部署の関係や人間関係を反映した知識発見支援を行えないということである。特許文献1や非特許文献1の技術は、他のユーザの文書の閲覧履歴や評価履歴を基に、近い興味をもつユーザを選別している。新たな知識の発見を支援するためには、近い興味をもつユーザの情報だけでなく、所属する部署や、関連する部署や、関連する他のユーザの活動内容も考慮することが重要である。しかし、特許文献1及び非特許文献1では、部署や人間関係を考慮して、推薦を行っていない。また、特許文献2の技術では、所属や業務内容とあわせて検索条件履歴を提示している。しかし、ユーザの所属や業務内容や興味などに合わせた絞り込みを行っておらず、大量の検索条件履歴がある場合には、適切なキーワードを検索することは困難である。
関連技術の第2の問題点は、共有する文書が大量であると、大量の文書が推薦されることになって、ユーザが、次にどのように絞り込んでよいか分からなくなるということである。特許文献1や非特許文献1の技術は、共有する文書を興味や重要度の観点からランキングするだけであり、ユーザへ提示する文書数自体は絞り込まれない。そのため、ユーザは、自分の関心に合致するか否かを、逐次文書を見て判断しなければならないことになる。ランキング上位の文書のみユーザに提示することも考えられるが、提示した文書がユーザにとって関心の対象でない場合には、知識が発見できずに検索が終了することになる。
更には、大量の文書を共有する場合、ユーザ同士で同じ文書を閲覧し、評価する確率が低くなるため、ユーザが、まだ閲覧・評価していない文書が大量に現れることになる。
更には、大量の文書を共有する場合、ユーザ同士で同じ文書を閲覧し、評価する確率が低くなるため、ユーザが、まだ閲覧・評価していない文書が大量に現れることになる。
関連技術の第3の問題点は、現在共有している文書に対する適切な知識発見支援を行えないことである。共有する文書は、追加・削除されるため、文書集合は日々変化する。特許文献2の発明では、過去の文書集合に対して利用された検索キーワードをユーザに提示する。しかし、提示したキーワードは、過去の文書集合において検索できるキーワードであるものの、現在の文書集合でうまく絞り込みを行えない場合がある。例えば、5年前は「PHS」に関する文書が存在していたため、「PHS」というキーワードで文書を検索できたが、現在「PHS」に関する文書が存在しない場合には、「PHS」というキーワードで検索しても、文書を見つけることはできない。
本発明は、ユーザの人間関係を考慮して、ユーザの知識発見を支援できる知識発見支援システム、方法、及び、プログラムを提供することを目的とする。
本発明は、ユーザに、検索対象データに対する検索条件の候補を提示し、ユーザの知識発見を支援する知識発見支援システムであって、各ユーザの前記検索対象データに対するアクセス履歴を記憶するアクセス履歴記憶装置と、検索対象データを管理する検索対象データ管理部が記憶しているメタ情報とを参照して、各ユーザについて、ユーザの興味の度合いを示すユーザ興味情報を生成するユーザ興味抽出部と、前記ユーザ興味情報と、ユーザ間の関係を表すユーザ関係情報とを用いて、知識発見支援対象のユーザの興味に近いユーザのグループを生成するグループ生成部と、前記ユーザ興味情報を用いて、前記グループ生成部が生成したグループの興味情報を生成するグループ興味生成部と、前記知識発見支援対象のユーザのユーザ興味情報と、前記グループ興味生成部が生成したグループ興味情報とに基づいて、前記検索条件の候補を生成する条件候補生成部と、前記条件候補生成部が生成した条件候補を、ユーザに提示する条件候補提示部とを備えることを特徴とする知識発見支援システムを提供する。
本発明は、コンピュータを用い、ユーザに、検索対象データに対する検索条件の候補を提示し、ユーザの知識発見を支援する知識発見支援方法であって、
前記コンピュータが、各ユーザの前記検索対象データに対するアクセス履歴を記憶するアクセス履歴記憶装置と、検索対象データを管理する検索対象データ管理部が記憶しているメタ情報とを参照して、各ユーザについて、ユーザの興味の度合いを示すユーザ興味情報を生成するステップと、前記コンピュータが、前記ユーザ興味情報と、ユーザ間の関係を表すユーザ関係情報とを用いて、知識発見支援対象のユーザの興味に近いユーザのグループを生成するステップと、前記コンピュータが、前記ユーザ興味情報を用いて、前記生成したグループの興味情報を生成するステップと、前記コンピュータが、前記知識発見支援対象のユーザのユーザ興味情報と、前記グループ興味情報とに基づいて、前記検索条件の候補を生成するステップと、前記コンピュータが、前記生成した条件候補を、ユーザに提示するステップとを有することを特徴とする知識発見支援方法を提供する。
前記コンピュータが、各ユーザの前記検索対象データに対するアクセス履歴を記憶するアクセス履歴記憶装置と、検索対象データを管理する検索対象データ管理部が記憶しているメタ情報とを参照して、各ユーザについて、ユーザの興味の度合いを示すユーザ興味情報を生成するステップと、前記コンピュータが、前記ユーザ興味情報と、ユーザ間の関係を表すユーザ関係情報とを用いて、知識発見支援対象のユーザの興味に近いユーザのグループを生成するステップと、前記コンピュータが、前記ユーザ興味情報を用いて、前記生成したグループの興味情報を生成するステップと、前記コンピュータが、前記知識発見支援対象のユーザのユーザ興味情報と、前記グループ興味情報とに基づいて、前記検索条件の候補を生成するステップと、前記コンピュータが、前記生成した条件候補を、ユーザに提示するステップとを有することを特徴とする知識発見支援方法を提供する。
本発明は、コンピュータに、ユーザに、検索対象データに対する検索条件の候補を提示し、ユーザの知識発見を支援する処理を実行させるプログラムであって、前記コンピュータに、各ユーザの前記検索対象データに対するアクセス履歴を記憶するアクセス履歴記憶装置と、検索対象データを管理する検索対象データ管理部が記憶しているメタ情報とを参照して、各ユーザについて、ユーザの興味の度合いを示すユーザ興味情報を生成するステップと、前記ユーザ興味情報と、ユーザ間の関係を表すユーザ関係情報とを用いて、知識発見支援対象のユーザの興味に近いユーザのグループを生成するステップと、前記ユーザ興味情報を用いて、前記生成したグループの興味情報を生成するステップと、前記知識発見支援対象のユーザのユーザ興味情報と、前記グループ興味情報とに基づいて、前記検索条件の候補を生成するステップと、前記生成した条件候補を、ユーザに提示するステップとを実行させることを特徴とするプログラムを提供する。
本発明は、ユーザに、検索対象データに対する検索条件の候補を提示し、ユーザの知識発見を支援する知識発見支援システムであって、各ユーザの前記検索対象データに対するアクセス履歴を記憶するアクセス履歴記憶装置と、検索対象データを管理する検索対象データ管理部が記憶しているメタ情報とを参照して、各ユーザについて、ユーザの興味の度合いを示すユーザ興味情報を生成するユーザ興味抽出部と、前記ユーザ興味情報と、ユーザ間の関係を表すユーザ関係情報とを用いて、グループの興味情報を生成するグループ興味生成部と、前記知識発見支援対象のユーザのユーザ興味情報と、前記グループ興味生成部が生成したグループ興味情報とに基づいて、前記検索条件の候補を生成する条件候補生成部と、前記条件候補生成部が生成した条件候補を、ユーザに提示する条件候補提示部とを備えることを特徴とする知識発見支援システムを提供する。
本発明は、コンピュータを用い、ユーザに、検索対象データに対する検索条件の候補を提示し、ユーザの知識発見を支援する知識発見支援方法であって、
前記コンピュータが、各ユーザの前記検索対象データに対するアクセス履歴を記憶するアクセス履歴記憶装置と、検索対象データを管理する検索対象データ管理部が記憶しているメタ情報とを参照して、各ユーザについて、ユーザの興味の度合いを示すユーザ興味情報を生成するステップと、前記コンピュータが、前記ユーザ興味情報と、ユーザ間の関係を表すユーザ関係情報とを用いて、グループの興味情報を生成するステップと、前記コンピュータが、前記知識発見支援対象のユーザのユーザ興味情報と、前記グループ興味情報とに基づいて、前記検索条件の候補を生成するステップと、前記コンピュータが、前記生成した条件候補を、ユーザに提示するステップとを有することを特徴とする知識発見支援方法を提供する。
前記コンピュータが、各ユーザの前記検索対象データに対するアクセス履歴を記憶するアクセス履歴記憶装置と、検索対象データを管理する検索対象データ管理部が記憶しているメタ情報とを参照して、各ユーザについて、ユーザの興味の度合いを示すユーザ興味情報を生成するステップと、前記コンピュータが、前記ユーザ興味情報と、ユーザ間の関係を表すユーザ関係情報とを用いて、グループの興味情報を生成するステップと、前記コンピュータが、前記知識発見支援対象のユーザのユーザ興味情報と、前記グループ興味情報とに基づいて、前記検索条件の候補を生成するステップと、前記コンピュータが、前記生成した条件候補を、ユーザに提示するステップとを有することを特徴とする知識発見支援方法を提供する。
本発明は、コンピュータに、ユーザに、検索対象データに対する検索条件の候補を提示し、ユーザの知識発見を支援する処理を実行させるプログラムであって、前記コンピュータに、各ユーザの前記検索対象データに対するアクセス履歴を記憶するアクセス履歴記憶装置と、検索対象データを管理する検索対象データ管理部が記憶しているメタ情報とを参照して、各ユーザについて、ユーザの興味の度合いを示すユーザ興味情報を生成するステップと、前記ユーザ興味情報と、ユーザ間の関係を表すユーザ関係情報とを用いて、グループの興味情報を生成するステップと、前記知識発見支援対象のユーザのユーザ興味情報と、前記グループ興味情報とに基づいて、前記検索条件の候補を生成するステップと、前記生成した条件候補を、ユーザに提示するステップとを実行させることを特徴とするプログラムを提供する。
本発明の知識発見支援システム、方法、及び、プログラムでは、知識発見支援対象のユーザの人的関係を用いた条件候補の提示が可能である。
本発明の上記、及び、他の目的、特徴及び利益は、図面を参照する以下の説明により明らかになる。
以下、図面を参照し、本発明の実施形態を詳細に説明する。図1は、本発明の第1実施形態の知識発見支援システムの構成を示している。知識発見支援システムは、アクセス履歴記憶装置100、ユーザ興味抽出部200、ユーザ設定入力部300、グループ生成部400、グループ興味生成部500、条件候補生成部600、条件候補提示部700、文書管理部800、及び、組織情報管理部900を備える。なお、以下では、検索対象データを「文書」とし、文書における知識発見支援について説明するが、検索対象データは、文書には限定されない。検索対象データは、ホームページや電子掲示板などのWEBページ、店舗情報や観光情報などの位置関連情報、テレビやラジオの番組情報、映像コンテンツや音楽コンテンツ、書籍情報、店舗情報などであってもよい。
文書管理部800は、検索対象データである文書データの集合と、検索対象文書に関連するメタ情報とを記憶する。メタ情報は、文書の付加的な情報であり、例えば、文書の作成者や作成日時、ジャンル、関連語などを含む。文書管理部800は、ユーザが検索要求を発生すると、管理する文書の中で、検索条件に合致する文書を検索し、ユーザに検索結果を提示する機能を有する。アクセス履歴記憶装置100は、各ユーザによる検索対象文書に対するアクセス履歴を記憶する。アクセス履歴は、例えば、アクセスしたユーザを特定する情報や、閲覧又はダウンロードした文書を特定する情報、検索日、検索に用いたキーワードなどの情報を含む。
ユーザ興味抽出部200は、アクセス履歴記憶装置100に記憶されるアクセス履歴と、文書管理部800に記憶された文書のメタ情報とから、各ユーザについて、ユーザ興味情報を生成する。ユーザ興味情報は、ユーザの興味の度合いを示す情報である。ユーザ設定入力部300は、知識発見支援の対象となるユーザを設定する。組織情報管理部900は、組織情報(ユーザ関係情報)を管理する。組織情報は、例えば、各部署にどのユーザが所属しているかを示す情報や、組織における部署同士のつながりを示す情報などを含む。グループ生成部400は、ユーザ興味抽出部200にて生成されたユーザ興味情報と、組織情報管理部900が管理する組織情報とから、ユーザ設定入力部300で設定されたユーザに近い興味を持つ、一人乃至は複数人のユーザからなるユーザグループを生成する。グループ興味生成部500は、ユーザ興味抽出部200にて生成されたユーザ興味情報から、グループ生成部400にて生成されたユーザグループのグループ興味情報を生成する。
条件候補生成部600は、グループ興味生成部500にて生成されたグループ興味情報と、ユーザ興味抽出部200にて抽出されたユーザ興味情報と、文書管理部800が管理する検索対象文書の集合とから、知識発見支援のための条件候補を生成する。条件候補は、例えば、文書管理部800が管理するメタ情報にて、文書名、作成者、作成日、関連語などに条件を指定して文書を絞り込むための検索条件の候補である。条件候補提示部700は、条件候補生成部600が生成した条件候補をユーザに提示し、ユーザによる検索条件の選択を促す。
ユーザは、提示された条件候補の中から、任意の条件候補を、検索条件として選択する。文書管理部800は、ユーザが検索条件を選択すると、検索対象文書の中からの検索条件に合致する文書を検索する。ユーザは、検索結果に表示された文書の中から、閲覧又はダウンロードする文書を指定し、文書の閲覧、又は、ダウンロードを行う。ユーザが、文書を閲覧又はダウンロードすると、アクセス履歴記憶装置100は、ユーザ名、閲覧又はダウンロードした文書名、検索日、検索に用いたキーワードなどの情報を、アクセス履歴として記憶する。
ユーザは、検索結果に対して、更なる絞り込みを希望することがある。この場合、ユーザ興味抽出部200は、アクセス履歴記憶装置100が記憶するアクセス履歴の中から、検索結果に含まれる文書のみを用いて、対象を検索結果に含まれる文書に狭めたユーザ興味情報を生成する。その後、グループ生成部400にてそのユーザ興味情報を用いてグループを生成し、グループ興味生成部500にてグループ興味情報を生成し、条件候補生成部600にて、再度、条件候補を生成する。
知識発見支援システムの物理的な構成について簡単に説明する。ユーザ設定入力部300及び条件候補提示部700は、例えば、ディスプレイなどの情報表示装置と、ボタンなどのユーザが意思表示を行える入力装置とを備えたコンピュータ上で動作するソフトウエアで実装すればよい。具体的には、PDA(Personal Data Assistants)やパーソナルコンピュータ、携帯電話上で動作するソフトウエアで実装すればよい。
文書管理部800は、文書とメタ情報とを関連付けて記憶するデータベースであり、パーソナルコンピュータやサーバ型のコンピュータ上に、広く知られているデータベースソフトウエアで実装すればよい。アクセス履歴記憶装置100は、ユーザとアクセス履歴とを関連づけて記憶するデータベースであり、パーソナルコンピュータやサーバ型のコンピュータ上に、広く知られているデータベースソフトウエアで実装すればよい。
組織情報管理部900は、組織情報を記憶するデータベースであり、パーソナルコンピュータやサーバ型のコンピュータ上に、広く知られているデータベースソフトウエアで実装すればよい。ユーザ興味抽出部200、グループ生成部400、グループ興味生成部500、及び、条件候補生成部600は、それぞれパーソナルコンピュータやサーバ型のコンピュータ上で動作するソフトウエアで実装すればよい。
なお、アクセス履歴記憶装置100、ユーザ興味抽出部200、ユーザ設定入力部300、グループ生成部400、グループ興味生成部500、条件候補生成部600、条件候補提示部700、文書管理部800、及び、組織情報管理部900は、同じコンピュータ上に存在してもよいし、異なるコンピュータ上に存在し、広く知られているTCP/IP(Transmission Control Protocol/Internet Protocol)などの通信プロトコルを使って通信してもよい。本実施形態では、システム内の各部について、特定の物理的な構成を前提としているわけではない。
次に、各部にて、管理、記憶、生成する情報の詳細について説明する。図2に、アクセス履歴記憶装置100が記憶するアクセス履歴、組織情報管理部900が管理する組織情報、文書管理部800が管理するメタ情報の具体例を示す。アクセス履歴記憶装置100が記憶するアクセス履歴510は、ユーザが文書を検索する際に用いたキーワードや、検索した後に閲覧或いはダウンロードした文書、検索した日などを含む。このアクセス履歴510を参照することで、例えば、ユーザ「USER01」が、検索日「2005年1月1日」に、キーワード「セキュリティ」で文書を検索し、文書「DOC01」をダウンロードしたことがわかる。
組織情報管理部900が管理する組織情報520は、企業内などで各ユーザが所属する部署名や、その部署に所属するユーザ、その部署に関連する部署名などの情報を含む。この組織情報520を参照することで、例えば、部署「A事業部」に所属するユーザは「USER01」、「USER02」、「USER03」であり、「A事業部」に関連する部署は「C本部」であることがわかる。文書管理部800は、文書の付加的な情報であり、文書の作成者や作成日時、ジャンル、関連語などを含むメタ情報530を記憶する。メタ情報530を参照することで、例えば、文書名「DOC01」の文書の作成者は「USER01」、作成日は「2005年1月1日」であり、「セキュリティ」、「文書管理」、「ユビキタス」という関連語が関連付いていることがわかる。
図3に、ユーザ興味抽出部200が生成するユーザ興味情報、グループ興味生成部500が生成するグループ興味情報、条件候補提示部700が提示する条件候補、ユーザ設定入力部300が表示するログイン画面の具体例を示す。ユーザ興味抽出部200が生成するユーザ興味情報610は、ユーザが過去に閲覧又はダウンロードした文書のメタ情報や、検索に用いたキーワードを基に生成した、ユーザの興味をあらわす情報である。ユーザ興味情報610は、多次元ベクトルの形で表され、各次元が興味の要素を表し、各次元の値が興味の強さを表す。
図3の例では、ユーザ興味情報610は、「セキュリティ」、「文書管理」、「ユビキタス」、「RFID」、「パソコン」、「サーバ」、「ソフトウエア」を要素に持つ多次元ベクトルによって表されている。例えば、ユーザ「USER01」についてみると、「セキュリティ」、「文書管理」、「ユビキタス」、「RFID」への興味の強さをあらわす値がそれぞれ「2」、「1」、「2」、「1」であり、「パソコン」、「サーバ」、「ソフトウエア」の値がそれぞれ「0」、「0」、「0」となっている。このユーザ興味情報610を参照することで、ユーザ「USER01」は、「セキュリティ」、「文書管理」、「ユビキタス」、「RFID」に関連する文書に興味を持っているが、「パソコン」、「サーバ」、「ソフトウエア」に関連する文書には興味を持っていないことがわかる。
グループ興味生成部500が生成するグループ興味情報620は、グループ生成部400が生成したグループについてのグループの興味を表す情報であり、ユーザ興味情報610と同様に、多次元ベクトルで表される。より詳細には、「セキュリティ」、「文書管理」、「ユビキタス」、「RFID」、「パソコン」、「サーバ」、「ソフトウエア」を要素に持つ多次元ベクトルによって表される。グループ興味情報620において、グループ「GROUP01」のグループ興味情報を参照すると、「セキュリティ」、「ユビキタス」、「RFID」の値が、他の値よりも大きいことがわかる。このことから、グループ「GROUP01」は、「セキュリティ」、「ユビキタス」、「RFID」に関する文書に興味を持っていることがわかる。
条件候補提示部700が提示する条件候補提示画面630は、条件候補生成部600が生成した知識発見支援のための条件候補を列挙した画面である。図3の条件候補提示画面630では、ユーザ「USER01」に対し、関連語「パソコン」、「サーバ」、「ソフトウエア」を条件候補として提示している。ユーザ「USER01」は、このような条件候補提示画面630から、1つ、又は、複数の条件候補(キーワード)を選択する。例えば、ユーザは、「パソコン」を選択する。ユーザが選択したキーワードは、文書管理部800に送られ、文書管理部800は、受け取ったキーワード「パソコン」を関連語に含む文書を検索する。
ユーザ設定入力部300は、ログイン画面640を表示して、ユーザにユーザ名の入力を促し、入力されたユーザ名のユーザを、知識発見支援の対象となるユーザに設定する。または、携帯電話機のようにユーザが限定されている場合においては、携帯電話機の番号(識別番号、電話番号)をユーザ名としてもよく、或いは、あらかじめユーザ名を登録しておき、それを利用してもよい。これ以外にも、Cookieなどを用いて、以前入力したユーザ名を自動的に利用してもよい。
次に、動作について説明する。ユーザ興味抽出部200は、アクセス履歴記憶装置100が記憶している各ユーザのアクセス履歴と、文書管理部800が検索した文書集合とを基に、各ユーザの興味情報を生成する。ユーザ興味情報の生成では、ユーザ興味抽出部200は、まず、アクセス履歴情報を参照して、ユーザがダウンロードした文書を特定する。次いで、文書管理部800が管理するメタ情報を参照し、当該文書に対応付けられた関連語を特定する。その後、ユーザ興味情報610における対応する関連語の要素の値を更新する。
具体例として、「USER01」についてのユーザ興味情報を生成する際の動作を説明する。ユーザ興味抽出部200は、まず、図2に示すアクセス履歴510を参照して、「USER01」が、過去に、「DOC01」、「DOC02」をダウンロードしたことを認識する。次いで、図2に示すメタ情報530を参照し、「DOC01」の関連語が、「セキュリティ」、「文書管理」、「ユビキタス」であり、「DOC02」の関連語が、「セキュリティ」、「ユビキタス」、「RFID」であることを認識する。
ユーザ興味抽出部200は、ユーザがダウンロードした文書、或いは、閲覧した文書の関連語の個数(出現回数)をカウントする。上記の例では、各関連語の出現回数は、「セキュリティ」は2回、「文書管理」は1回、「ユビキタス」は2回、「RFID」は1回となる。ユーザ興味抽出部200は、各関連語の出現回数を、ユーザ興味情報におけるベクトルの要素の値として、当該ユーザのユーザ興味情報を生成する。ユーザ興味抽出部200は、他のユーザ、「USER02」、「USER03」、「USER04」についても同様な処理を行い、各ユーザについて、ユーザ興味情報を生成する。このような処理により、図3に示すユーザ興味情報610が生成される。
なお、上記では、ユーザ興味情報610におけるベクトル値を、文書の関連語の出現数で生成したが、各文書を検索する際に利用したキーワードや、検索日、各文書の作成者などによって重み付けを行ってもよい。例えば、文書の検索に用いたキーワードと、文書の関連語とが一致するときには、出現回数を1よりも大きな値にする重み付けを行う。具体的には、図2のアクセス履歴510を参照すると、ユーザ「USER01」は、キーワード「セキュリティ」を用いて文書「DOC01」を検索しており、かつ、メタ情報530を参照すると、文書「DOC01」は関連語に「セキュリティ」を含んでいる。このような場合は、「DOC01」の関連語「セキュリティ」を1回出現したと数えるのではなく、重みをつけて1.5回出現したと数え、「USER01」のユーザ興味情報の「セキュリティ」の値を2.5にする。
また、日付を用いて重み付けする場合は、現在の日付と文書の検索日とが離れているときには、出現回数を1よりも小さくする重み付けを行う。例えば、アクセス履歴510を参照すると、ユーザ「USER01」がキーワード「セキュリティ」を用いて文書「DOC01」を検索した日は「2005年1月1日」である。現在の日付が「2007年1月1日」であるとすると、検索したのは2年前のことであり、ユーザは、現在は興味が薄れていると考えられる。そこで、「DOC01」の関連語「セキュリティ」を1回出現したと数えるのではなく、0.5回出現したと数え、「USER01」の興味情報の「セキュリティ」の値を1.5にする。
文書の作成者を用いて重み付けする場合は、ユーザ自身が作成した文書については、これをユーザ興味情報の生成に利用しないようにする。例えば、アクセス履歴510を参照すると、「USER01」は「DOC01」をダウンロードしているが、メタ情報530を参照すると、この「DOC01」の作成者は「USER01」自身である。この場合には、ユーザ興味情報の作成で、関連語の出現数を数える際には、文書「DOC01」の関連語を数えないようにする。
また、図3では、ユーザ興味情報610のベクトルの要素を「関連語」に対応させたが、それ以外の要素、例えば「文書の作成者」や「作成日」をベクトルの要素として含めてもよい。例えば、ユーザ興味情報610のベクトルの要素に、「文書の作成者」として、「USER01」や「USER11」を加える。この場合、ユーザ「USER01」が文書「DOC01」、「DOC02」をダウンロードしたときには、各作成者「USER01」、「USER11」の出現回数「1」、「1」を、それぞれの要素の値とする。また、ユーザ興味情報610のベクトルの要素に、「作成日」として、「2005年」、「2006年」などの要素を加える。この場合、「DOC01」、「DOC02」の作成日は、それぞれ「2005/1/1」、「2005/2/1」であるので、ユーザ興味情報610における「2005年」の値を、2005年中に作成された文書数である「2」とする。
組織情報管理部900は、組織情報から、ユーザ設定入力部300が設定したユーザに関連する組織情報を抽出する。例えば、組織情報管理部900が、図2に示す組織情報520を管理している場合を考える。ユーザ設定入力部300が、知識発見支援ユーザとしてユーザ「USER04」を設定したときには、組織情報管理部900は、組織情報520の所属ユーザに「USER04」を含む組織情報を抽出する。組織情報520を参照すると、所属ユーザに「USER04」を含む組織情報の部署名は「Bプロジェクト」であり、「Bプロジェクト」の他の所属ユーザは「USER01」、関連部署は「A事業部」である。組織情報管理部900は、これらの情報を、グループ生成部400及びグループ興味生成部500に与える。これらに加えて、関連部署である「A事業部」のユーザ「USER01」、「USER02」、「USER03」を、ユーザ「USER04」に関連する組織情報として、グループ生成部400及びグループ興味生成部500に与えてもよい。
グループ生成部400は、ユーザ興味抽出部200が抽出したユーザ興味情報と組織情報管理部900が管理する組織情報とを用いて、ユーザ設定入力部300が設定した知識発見支援の対象となるユーザの興味に近いユーザのグループを生成する。グループの生成では、知識発見支援対象のユーザと、他のユーザとの興味類似度を求める。「興味類似度」は、知識発見支援対象のユーザの興味情報と、他のユーザの興味情報との相関を表す値であり、興味情報のベクトル演算で得られるCOS値や、相関係数を用いることができる。得られた興味類似度に、組織情報による重み付けを行い、重み付けを行った興味類似度により、知識発見支援の対象のユーザの興味に近いユーザグループを生成する。
知識情報による重み付けでは、例えば、知識発見支援対象のユーザと同じ部署に所属する他のユーザについては重み係数を「1」とし、同じ部署に所属しないユーザについては重み係数を「0」とする。また、知識発見支援対象のユーザと同じ部署に所属する他のユーザ、及び、当該部署の関連部署に所属するユーザについては重み係数を0以外の値とし、同じ部署及び関連部署に所属しないユーザについては重み係数を「0」としてもよい。なお、重み係数を「0」とするユーザについては、重み付けを行った興味類似度は常に「0」となるので、興味類似度を求める必要はない。
上記では、知識発見支援対象のユーザと同じ部署又はその関連部署に所属しないユーザの重み係数を「0」としたが、これには限定されない。知識発見支援対象のユーザと同じ部署又はその関連部署に所属しないユーザの重み係数を、0よりも大きく、かつ、同じ部署及び関連部署に所属するユーザの重み係数よりも小さい値として、同じ部署及び関連部署に所属するユーザの興味類似度を重視してもよい。あるユーザが、知識発見支援対象のユーザと同じ部署の所属ユーザであると同時に、関連部署の所属ユーザでもあるときには、重み係数が大きい方を優先し、興味類似度に、大きい方の重み係数を乗じた値を、重み付けを行った興味類似度とすればよい。各重み係数は、あらかじめグループ生成部400に設定しておくものとする。
具体例として、グループ生成部400が、知識発見支援対象のユーザ「USER04」について興味が近いグループを生成する場合を説明する。重み係数は、同じ部署のユーザの重みは「1.5」、関連部署のユーザの重みは「1.1」、同じ部署又は関連部署以外の部署のユーザの重みは「0」とする。図2の組織情報520を参照すると、ユーザ「USER04」は「Bプロジェクト」に所属しており、「Bプロジェクト」に所属する他のユーザは「USER01」である。グループ生成部400は、ユーザ「USER04」のユーザ興味情報と、ユーザ「USER01」のユーザ興味情報とから、ベクトル演算を行って興味類似度(COS値)を求め、求めたCOS値に、重み係数「1.5」を乗じたものを、重み付けを行った興味類似度とする。
また、組織情報520を参照すると、「Bプロジェクト」の関連部署は「A事業部」であり、「A事業部」の所属ユーザのうちで、「Bプロジェクト」に所属していないユーザは、「USER02」、「USER03」である。グループ生成部400は、知識発見支援対象のユーザ「USER04」のユーザ興味情報と、関連部署のユーザ「USER02」及び「USER03」のユーザ興味情報とのCOS値を求め、求めたCOS値に、重み係数「1.1」を乗じたものを、重み付けを行った興味類似度とする。同じ部署又は関連部署の何れにも所属しない他のユーザについては、重み係数が「0」であるので、COS値の演算は行わない。グループ生成部400は、重み付けを行った興味類似度を求めると、その値が所定のしきい値以上のユーザを興味が近いユーザと捉え、その集合を、興味が近いユーザのグループとする。
グループ興味生成部500は、ユーザ興味情報を用いて、グループ生成部400が生成したグループのグループ興味情報を生成する。グループ興味生成部500は、例えば、グループを構成する各ユーザのユーザ興味情報の各要素の平均値を、グループ興味情報とする。具体例として、グループ生成部400が、知識発見支援対象のユーザ「USER04」について、ユーザ「USER01」、「USER02」、「USER03」で構成されるグループ「GROUP01」を生成した場合を考える。この場合、グループ興味生成部500は、ユーザ「USER01」のユーザ興味情報、「USER02」のユーザ興味情報、「USER03」のユーザ興味情報の各要素の平均値を、グループ「GROUP01」のグループ興味情報とする。例えば、「セキュリティ」については、ユーザ「USER01」、「USER02」、「USER03」の値はそれぞれ「2」、「0」、「1」であるので、その平均値「1.0」を、グループ「GROUP01」の「セキュリティ」の値とする。
上記では、グループ興味情報は、各ユーザの興味情報の平均値を用いて求めたが、他の統計的手法を用いてもよい。例えば、最大値や中央値を用いてもよい。或いは、組織情報管理部900が抽出した組織情報を用いて、各ユーザのユーザ興味情報に、組織情報による重み付けを行い、グループ興味情報を求めてもよい。具体的には、gjをグループ興味情報におけるベクトルの要素jの値、ui,jをユーザiの興味情報におけるベクトル要素jの値、βiを組織情報に基づいたユーザiの重みとして、下記式1により、グループ興味情報を求めてもよい。
グループ興味情報生成における重みは、例えば、知識発見支援対象のユーザと同じ部署のユーザについては「1.5」とし、関連部署のユーザについては「1.2」とし、他のユーザについては「1.0」に設定する。これらの重み係数は、あらかじめグループ興味生成部500内に設定されている。例えば、あるユーザ(ユーザ4)について、「ユーザ1」、「ユーザ2」、「ユーザ3」の3人のユーザによりグループが構成されている場合を考える。「ユーザ1」は、「ユーザ4」と同じ部署に所属するユーザであり、「ユーザ2」は関連部署に所属するユーザ、「ユーザ3」はそれ以外の部署に所属するユーザであるとする。この場合、
β1=1.5(ユーザ1)、β2=1.2(ユーザ2)、β3=1.0(ユーザ3)
となり、αiは、
α1=0.41、α2=0.32、α3=0.27
となる。各ユーザのユーザ興味情報において、「セキュリティ」の要素の値が、ユーザ1は「2」、ユーザ2は「0」、ユーザ3は「1」であったとする。この場合、ユーザ4についてのグループのグループ興味情報の「セキュリティ」の要素の値は、
gセキュリティ=α1×u1,セキュリティ+α2×u2,セキュリティ+α3×u3,セキュリティ
=0.41×2.0+0.32×0+0.27×1.0
=1.09
となる。このような計算を、グループ興味情報の各要素について行い、組織情報による重み付けを行ったグループ興味情報を生成してもよい。
β1=1.5(ユーザ1)、β2=1.2(ユーザ2)、β3=1.0(ユーザ3)
となり、αiは、
α1=0.41、α2=0.32、α3=0.27
となる。各ユーザのユーザ興味情報において、「セキュリティ」の要素の値が、ユーザ1は「2」、ユーザ2は「0」、ユーザ3は「1」であったとする。この場合、ユーザ4についてのグループのグループ興味情報の「セキュリティ」の要素の値は、
gセキュリティ=α1×u1,セキュリティ+α2×u2,セキュリティ+α3×u3,セキュリティ
=0.41×2.0+0.32×0+0.27×1.0
=1.09
となる。このような計算を、グループ興味情報の各要素について行い、組織情報による重み付けを行ったグループ興味情報を生成してもよい。
条件候補生成部600は、グループ興味生成部500が生成したグループ興味情報と、知識発見支援対象のユーザのユーザ興味情報と、文書管理部800が管理している文書集合とから、知識発見支援を行うための検索の条件候補を生成する。条件候補生成部600は、例えば、グループ興味情報にてグループの興味が高く、かつ、ユーザ興味情報にてユーザの興味が低いキーワードを、条件候補とする。
条件候補の生成では、条件候補生成部600は、知識発見支援対象のユーザのユーザ興味情報と、グループ興味生成部500にて生成されたグループ興味情報とから、興味情報の各要素について、条件評価値を求める。例えば、条件候補生成部600は、グループ興味情報における各要素の値から、ユーザ興味情報における各要素の値を減算して、条件評価値とする。また、条件候補生成部600は、文書管理部800により、興味情報の各要素に関連する文書を検索し、関連する文書数を求める。その後、条件候補生成部600は、条件評価値及び関連文書数がそれぞれしきい値を超えている要素を、条件候補とする。
条件候補提示部700は、条件候補生成部600が生成した条件候補を、表示画面上に表示するなどによってユーザに提示し、ユーザに、条件候補の選択を促す。ユーザが1つ又は複数の条件候補を選択すると、文書管理部800は、選択された条件候補(キーワード)にて文書検索を行い、検索結果をユーザに通知する。ユーザは、通知された検索結果の中から、所望の文書を選択し、選択した文書をダウンロード又は閲覧する。ユーザが、文書を閲覧又はダウンロードしたときは、アクセス履歴記憶装置100は、文書を閲覧又はダウンロードしたユーザ名、文書名、検索日、及び、検索に用いたキーワードを、アクセス履歴情報に追加登録する。
条件候補の生成から検索結果の表示までを、具体例を用いて説明する。図4に、条件候補生成部600が生成する条件評価情報、条件候補提示部700が提示する条件候補提示画面、及び、文書管理部800による検索結果の提示画面を示す。条件候補生成部600は、グループ「GROUP01」のグループ興味情報620(図3)における各要素の値から、知識発見支援対象のユーザ「USER04」のユーザ興味情報610における各要素の値を減算し、条件評価情報710の条件評価値とする。例えば、グループ「GROUP01」のグループ興味情報620における「文書管理」の値は「0.33」で、ユーザ興味情報610におけるユーザ「USER04」における「文書管理」の値は「1」であるので、条件評価値の「文書管理」の値は「−0.67」となる。
また、条件候補生成部600は、文書管理部800にて、興味情報の各要素に関連する文書を検索し、関連する文書数を求め、これを条件評価情報710に含める。文書管理部800における検索では、メタ情報530(図2)を用いる。条件評価情報710の「関連文書数」を参照することで、例えば、メタ情報530の関連語に「セキュリティ」が含まれる文書が、100個存在することがわかる。条件候補生成部600は、条件評価情報710を参照し、「条件評価値」及び「関連文書数」が、それぞれしきい値以上の値となっている要素を、条件候補とする。例えば、条件評価値のしきい値、及び、関連文書数のしきい値を、それぞれ「0」とする。この場合、条件評価情報710から、「ユビキタス」、「RFID」、「パソコン」、「サーバ」が条件候補として選び出される。
条件候補提示部700は、条件候補生成部600が生成した条件候補を、ユーザに提示し、選択を促す。条件候補提示部700は、例えば、図4の条件候補提示画面720のように、「USER04さん 以下のキーワードで情報を探してはどうですか?」という案内文と、条件候補「ユビキタス」、「RFID」、「パソコン」、「サーバ」を、知識発見支援対象のユーザ「USER04」に提示する。条件候補「ユビキタス」、「RFID」、「パソコン」、「サーバ」は、HTMLのハイパーリンク機能などを利用して、選択された際に文書管理部800の検索が開始するようにしておくとよい。
ユーザが、条件候補提示画面720における条件候補の中から任意の条件候補(キーワード)を選択すると、文書管理部800は、ユーザが選択したキーワードを検索条件として文書を検索し、検索した結果をユーザに提示する。例えば、ユーザが、条件候補の中から「パソコン」を選択したときは、図4の検索結果提示画面730に示すように、「“パソコン”に関する文書は200件です」という案内文とともに、検索結果一覧を提示する。検索結果一覧では、HTMLのハイパーリンク機能などを利用して、検索結果の各文書名を選択できるようにし、ユーザが選択したときに、対応する文書ファイルをダウンロードし、或いは、更に詳細な情報を表示できるようにしておくとよい。なお、図4の条件候補提示画面740に示すように、条件候補と現在の検索対象とを同じ画面に表示してもよい。
図5に、知識発見支援システムの動作手順を示す。ユーザ設定入力部300は、知識発見支援の対象となるユーザを設定する(ステップS1)。ユーザ興味抽出部200は、アクセス履歴記憶装置100に記憶されたアクセス履歴情報と、文書理管理部800が管理する文書のメタ情報とを用いて、各ユーザの興味情報を生成する(ステップS2)。組織情報管理部900は、ステップS1で設定したユーザに関する組織情報を抽出する(ステップS3)。グループ生成部400は、組織情報管理部900が抽出した組織情報と、ユーザ興味抽出部200が生成したユーザ興味情報とから、ステップS1で設定したユーザの興味に近い興味を持つユーザのグループを生成する(ステップS4)。
グループ興味生成部500は、ユーザ興味抽出部200が生成したユーザ興味情報から、グループ生成部400にて生成されたユーザグループのグループ興味情報を生成する(ステップS5)。条件候補生成部600は、ユーザ設定入力部300が設定したユーザの興味情報と、グループ興味生成部500が生成したグループの興味情報と、文書管理部800が管理する現在の検索対象文書のメタ情報とから、ユーザの知識発見を支援するための条件候補を生成する(ステップS6)。条件候補生成部600は、条件候補が1つ以上生成できたか否かを判断し(ステップS7)、条件候補が存在しないときには、処理を終了する。
条件候補生成部600が、1以上の条件候補を生成したときは、条件候補提示部700は、条件候補生成部600が生成した条件候補をユーザに提示し(ステップS8)、ユーザによる条件候補の選択を促す。条件候補提示部700は、ユーザが条件候補を選択したか否かを判断し(ステップS9)、ユーザが条件候補を選択せずに処理終了を選んだときは、処理を終了する。ユーザが、ステップS8で提示された条件候補から、任意の条件候補を選択すると、文書管理部800は、ユーザが選択した条件候補を検索条件として文書を検索する(ステップS10)。文書管理部800は、検索結果文書一覧をユーザに提示する(ステップS11)。その後、ユーザが、検索結果文書一覧に含まれる文書にアクセスしたときは、アクセス履歴記憶装置100は、アクセス履歴を追加登録する(ステップS12)。
ユーザは、条件候補を選択した検索の後に、検索文書の更なる絞込みを指示することができる。ユーザが、更なる絞込みを指示したときは、ステップS2に戻り、再度処理を行う。このとき、ステップS2では、検索結果提示画面にて検索された文書を対象に、ユーザ興味情報を生成する。すなわち、アクセス履歴記憶装置100に記憶されているアクセス履歴のうちで、メタ情報に、検索に用いられた関連語を含む文書に対するアクセス履歴を用いて、ユーザ興味情報を生成する。その後、ステップS2で生成したユーザ興味情報を用いてグループ生成を行い、グループ興味情報を生成し、条件候補を生成して、条件候補提示画面を表示する。
以下、知識発見支援システムの動作を、具体例を用いつつ説明する。知識発見支援システムは、文字列やボタンなどを表示できる画面、マウス、キーボード等を備えたパーソナルコンピュータで構成されているものとする。また、アクセス履歴記憶装置100及び文書管理部800は、データベースプログラム上で動作しているものとする。図6に、アクセス履歴、メタ情報、及び、興味情報を示す。アクセス履歴記憶装置100は、ユーザ名と、該ユーザがダウンロードした文書名と、該文書を検索するために利用したキーワードとを、アクセス履歴810として記憶する。また、文書管理部800は、文書名と該文書の関連語とを文書のメタ情報820として、文書ファイルと共に記憶している。
図5のステップS1では、ユーザ設定入力部300は、図3のログイン画面640をユーザに提示し、ユーザ名の入力を促す。ここでは、ユーザ名として「USER04」が入力されたとする。ステップS2では、ユーザ興味抽出部200は、アクセス履歴記憶装置が記憶しているアクセス履歴810と、文書管理部800が記憶しているメタ情報820とから、各ユーザのユーザ興味情報を生成する。興味情報は、各関連語を要素とするベクトルで定義する。ユーザ興味抽出部200は、ダウンロードした文書の関連語の数を各ユーザについて求め、関連語の出現回数を、各要素の値として、ユーザ興味情報を生成する。その際、文書の検索キーワードと、そのキーワードで検索した文書の関連語とが一致する場合は、ユーザが該関連語に強い興味を持っているものと考え、出現回数を1回ではなく、1.5回と数える。
ユーザ「USER01」のユーザ興味情報の生成について、詳細に説明する。アクセス履歴810を参照すると、ユーザ「USER01」がダウンロードした文書は、「DOC01」と「DOC02」である。メタ情報820を参照すると、「DOC01」の関連語は、「セキュリティ」、「文書管理」、「ユビキタス」である。また、ユーザ「USER01」は、「DOC01」の検索ではキーワード「セキュリティ」を用いており、これは、「DOC01」の関連語「セキュリティ」に一致する。「文書管理」、「ユビキタス」については、検索キーワードには一致しない。この場合、ユーザ興味抽出部200は、「セキュリティ」の出現回数を「1.5回」、「文書管理」、「ユビキタス」の出現回数を「1回」とカウントする。
「DOC02」については、メタ情報820を参照すると、「DOC02」の関連語は「セキュリティ」、「ユビキタス」、「RFID」である。また、アクセス履歴810を参照すると、ユーザ「USER01」は、「DOC02」の検索では、キーワード「ユビキタス」を用いており、これは、「DOC02」の関連語「ユビキタス」と一致している。「セキュリティ」、「RFID」については、検索キーワードには一致しない。この場合、ユーザ興味抽出部200は、「ユビキタス」の出現回数を「1.5回」、「セキュリティ」、「RFID」の出現回数を「1回」とカウントする。
ユーザ興味抽出部200は、「DOC01」と「DOC02」とにおける各関連語の出現回数の和を、ユーザ興味情報とする。すなわち、ユーザ興味情報における「セキュリティ」の値を「1.5+1=2.5」とし、「文書管理」の値を「1+0=1」とし、「ユビキタス」の値を「1+1.5=2.5」とし、「RFID」の値を「0+1=1」とする。その他の要素「パソコン」、「サーバ」、「ソフトウエア」については、「DOC01」、「DOC02」の関連語には含まれないので、値は0である。このような処理を、他のユーザ「USER02」、「USER03」、「USER04」について行うことで、図6に示すユーザ興味情報830が生成される。
ステップS3では、組織情報管理部900は、ユーザ「USER04」に関する組織情報として、ユーザ「USER04」が所属する部署、及び、その関連部署に所属するユーザを抽出する。同じユーザが、ユーザ「USER04」が所属する部署に所属するユーザであり、かつ、関連部署に所属するユーザでもあるときは、同じ部署に所属するユーザとして取り扱うことにする。図2に示す組織情報520を参照すると、ユーザ「USER04」が所属する部署は「Bプロジェクト」であり、「Bプロジェクト」の他のユーザは「USER01」である。また、「Bプロジェクト」に関連する部署は「A事業部」であり、「A事業部」の所属ユーザで「Bプロジェクト」に所属しないユーザは「USER02」、「USER03」である。この場合、組織情報管理部900は、同じ部署のユーザがユーザ「USER01」であり、関連部署のユーザが「USER02」、「USER03」であることを示す情報を出力する。
ステップS4では、グループ生成部400は、ステップS2で生成された各ユーザの興味情報と、ステップS3で抽出されたユーザ「USER04」に関する組織情報とを用いて、グループを生成する。グループの生成では、ユーザ「USER04」と他のユーザの興味類似度を求め、求めた興味類似度に、組織情報による重み付けを行い、重み付けを行った興味類似度が所定しきい値以上となるユーザを、ユーザ「USER04」に興味が近いユーザのグループとする。重み付けの際の重み係数は、ユーザ「USER04」と同じ部署に所属するユーザは「1.5」とし、関連部署のユーザは「1.0」とし、同じ部署又は関連部署の何れにも所属しないユーザは「0」とする。
図7に、興味類似度計算式、興味類似度、重み付けを行った興味類似度、グループ興味情報、条件評価情報を示す。興味類似度は、ベクトル演算によるCOS値を用いる。すなわち、図7に式910で示すように、ユーザ間の興味情報の内積を、ベクトルの大きさの積で割った値(COS値)を、興味類似度として用いる。図6のユーザ興味情報830より、ユーザ「USER04」と、ユーザ「USER01」、「USER02」、「USER03」との間のCOS値を求めると、図7のCOS値920に示すように、それぞれ、「0.53」、「0.0」、「0.68」となった。
グループ生成部400は、計算したCOS値に、組織情報による重み付けを行い、重み付けを行った興味類似度を求める。ユーザ「USER04」と同じ部署のユーザは、ユーザ「USER01」であり、関連部署のユーザはユーザ「USER02」、「USER03」であるので、ユーザ「USER01」のCOS値に重み係数「1.5」を乗じた値(0.53×1.5=0.80)を重み付けを行った興味類似度とし、ユーザ「USER02」、「USER03」のCOS値に重み係数「1.0」を乗じた値(0×1=0、0.68×1=0.68)を重み付けを行った興味類似度とする。このような処理により、COS値920から、重み付けを行った興味類似度930が得られる。
グループ生成部400は、重み付けを行った興味類似度が高いユーザを、ユーザ「USER04」に興味が近いユーザとする。ここでは、重み付けを行った興味類似度のしきい値を、「0.2」とする。重み付けを行った興味類似度930を参照すると、値が「0.2」以上となるユーザは、ユーザ「USER01」と「USER03」である。この場合、グループ生成部400は、ユーザ「USER01」、「USER03」を、ユーザ「USER04」に興味が近いユーザのグループ「GROUP01」とする。
ステップS5では、グループ興味生成部500は、ステップS4で生成したグループの各ユーザのユーザ興味情報と、ステップS3で抽出されたユーザ「USER04」の組織情報とに基づいて、ステップS4で生成したグループの興味情報を生成する。グループ興味情報の生成には、式1を用いる。式1における組織情報に基づいたユーザの重みβは、ユーザ「USER04」と同じ部署のユーザは「1.5」、関連部署のユーザは「1.2」、同じ部署又は関連部署の何れにも所属しないユーザは「0」とする。
ユーザ「USER04」に興味が近いユーザのグループ「GROUP01」は、ユーザ「USER01」と「USER03」とで構成されており、ユーザ「USER01」は、ユーザ「USER04」と同じ部署に所属し、ユーザ「USER03」は、関連部署に所属している。よって、式1におけるグループ内の各ユーザの重みβiは、
β1(USER01に相当)=1.5
β2(USER03に相当)=1.2
となる。また、Σβi=2.7であるので、
α1=1.5/2.7=0.56
α2=1.2/2.7=0.44
となる。
β1(USER01に相当)=1.5
β2(USER03に相当)=1.2
となる。また、Σβi=2.7であるので、
α1=1.5/2.7=0.56
α2=1.2/2.7=0.44
となる。
グループ興味生成部500は、上記α1、α2を用い、ユーザ「USER01」の興味情報と、ユーザ「USER03」の興味情報とから、グループ「GROUP01」の興味情報を生成する。例えば、ユーザ興味情報830(図6)を参照すると、ユーザ「USER01」、「USER03」の「セキュリティ」の値は、
u1,セキュリティ=2.5
u2,セキュリティ=1.5
であるので、グループ「GROUP01」のグループ興味情報における「セキュリティ」の値gセキュリティは、
gセキュリティ=α1×u1,セキュリティ+α1×u1,セキュリティ
=0.56×2.5+0.44+1.5=2.1
となる。他の要素についても、同様な計算を行うことで、図7に示すグループ興味情報940が得られる。
u1,セキュリティ=2.5
u2,セキュリティ=1.5
であるので、グループ「GROUP01」のグループ興味情報における「セキュリティ」の値gセキュリティは、
gセキュリティ=α1×u1,セキュリティ+α1×u1,セキュリティ
=0.56×2.5+0.44+1.5=2.1
となる。他の要素についても、同様な計算を行うことで、図7に示すグループ興味情報940が得られる。
ステップS6では、条件候補生成部600は、ユーザ「USER04」のユーザ興味情報のベクトルと、グループ「GROUP01」のグループ興味情報のベクトルとの差から、各キーワードの条件評価値を求める。また、条件候補生成部600は、各キーワードを関連語として持つ関連文書数を求め、これらを、条件評価情報950とする。条件候補生成の際の条件評価値のしきい値を「0.5」とし、関連文書数のしきい値を「0」とする。条件評価情報950を参照すると、条件評価値及び関連文書数がしきい値以上となる要素は、「セキュリティ」、「ユビキタス」、「RFID」の3つである。条件候補生成部600は、「セキュリティ」、「ユビキタス」、「RFID」を条件候補として選択する。
図8に、条件候補提示画面、検索結果提示画面、及び、アクセス履歴を示す。ステップS8では、条件候補提示部700は、新しい知識を発見するためのおすすめキーワードである、ステップS6で生成された条件候補「セキュリティ」、「ユビキタス」、「RFID」を含む条件候補提示画面1110を、ユーザに提示する。ユーザは、このような条件候補提示画面1110から、任意のキーワードを選択可能である。ユーザが、「セキュリティ」を選択すると、ステップS10へ移行し、条件候補提示部700は、文書管理部800に選択されたキーワード「セキュリティ」を送り、文書管理部800は、「セキュリティ」を検索キーワードとして、文書検索を行う。その後、文書管理部800は、ステップS11にて、検索結果提示画面1120を、ユーザに提示する。
ユーザは、検索結果提示画面1120で示した検索結果から、例えば、「○○技術紹介資料」を選択する。文書管理部800は、「○○技術紹介資料」の詳細情報を表示し、或いは、「○○技術紹介資料」のファイルをユーザに送付する。ユーザ「USER04」が、「○○技術紹介資料」のファイルをダウンロードしたときは、アクセス履歴記憶装置100は、ステップS12にて、アクセス履歴1130に示すように、「ユーザ名=USER04」、「文書名=○○技術紹介資料」、「キーワード=セキュリティ」を、アクセス履歴に記憶する。
図8に示す検索結果提示画面1120には、「さらに絞込み」のリンクが埋め込まれている。ユーザが、検索結果提示画面1120から「さらに絞込み」を選択した場合は、「セキュリティ」で絞り込んだ検索結果100件に対して、ステップS2から再度処理を行う。このとき、ステップS2では、検索結果提示画面1120にて検索された文書を対象に、ユーザ興味情報を生成する。すなわち、アクセス履歴記憶装置100に記憶されているアクセス履歴のうちで、メタ情報に「セキュリティ」を関連語として含む文書に対するアクセス履歴を用いて、ユーザ興味情報を生成する。その後、ステップS2で生成したユーザ興味情報を用いてグループ生成を行い、グループ興味情報を生成し、条件候補を生成して、条件候補提示画面を表示する。
本実施形態では、ユーザの興味に近いグループの興味情報の生成の際に、組織情報による重み付けを行う。この重み付けにて、組織上、ユーザに近い関係にあるユーザほど、興味類似度が高く計算されるようにすることで、ユーザに近い関係にあるユーザを重視した形で、ユーザに興味が近いユーザのグループを生成できる。つまりは、ユーザ間の関係を反映した形で、ユーザに興味が近いユーザのグループを生成できる。このグループについてのグループ興味情報を求め、これと、ユーザの興味情報とを比較し、ユーザの興味が低く、グループの興味が高い興味情報の要素を求める。このようにすることで、ユーザは、自身と組織上近い他のユーザは検索に用いているが、自身はこれまでにあまり検索に利用しなかった検索ワード(条件候補)を得ることができる。ユーザは、提示された条件候補を用いて文書を検索することで、新たな知識獲得のための文書に、アクセスすることができる。
アクセス履歴記憶装置100が記憶するアクセス履歴は、ユーザが文書をダウンロードすることで更新される。また、文書管理部800に、新たな文書が追加されたときは、その文書及びメタ情報が、文書管理部800に記憶されていく。本実施形態では、現在のアクセス履歴、及び、検索対象文書に基づいて、条件候補を生成するため、ユーザの興味の変化によるアクセス文書の変化や、検索対象の文書の変化に合わせて、生成される条件候補が随時変化する。従って、本実施形態では、状況変化に合わせて、ユーザに、新たな知識獲得のための条件候補を提示することができる。また、本実施形態では、ユーザが検索した文書に対して、更なる絞込みを行う機能を提供する。このようにすることで、検索対象の文書が大量にあるときでも、ユーザは、条件候補を選択しつつ、文書絞り込みを行うことで、所望の文書にたどり着くことができる。
図9は、本発明の第2実施形態の知識発見支援システムの構成を示している。本実施形態では、組織情報管理部900(図1)に代えて、人脈情報管理部901を用いる。人脈情報管理部901は、ユーザとユーザとの関係を表した人脈情報(ユーザ関係情報)を管理する。人脈情報は、例えば、上司/部下の関係や、部署内メンバーの先輩・後輩の関係、グループメンバの業務領域の近さ、知り合い関係などを表したものである。人脈情報の具体例を、図10に示す。この例では、人脈情報1200は、ユーザと、その上司に当たるユーザとの関係を表している。この人脈情報1200を参照することで、ユーザ「USER01」の上司はユーザ「USER02」であり、ユーザ「USER02」の上司は「USER03」であることがわかる。ここでは、ユーザ間の関係を1対1で表したが、1ユーザと多ユーザとの関係を人脈情報としてもよい。
人脈情報管理部901は、ユーザ設定入力部300が設定したユーザに関する人脈情報を、グループ生成部400及びグループ興味生成部500に与える。例えば、人脈情報管理部901が、図10に示す人脈情報1200を記憶しており、ユーザ設定入力部300がユーザ「USER01」をユーザと設定した場合を考える。この場合、人脈情報管理部901は、ユーザ「USER01」に関する人脈情報として、上司が「USER02」であり、その上の上司が「USER03」であることを示す情報を出力する。
グループ生成部400は、人脈情報管理部901が出力する人脈情報と、ユーザ興味抽出部200が生成したユーザ興味情報とから、ユーザ設定入力部300が設定した、知識発見支援の対象となるユーザの興味に近いユーザのグループを生成する。グループ生成では、知識発見支援対象のユーザと、他のユーザとの間での興味類似度を求め、興味類似度に、人脈情報に基づく重み付けを行い、重み付けを行った興味類似度が所定のしきい値以上のユーザを、興味が近いユーザのグループとする。人脈情報に基づく重み付けにおける重み係数は、あらかじめグループ生成部400内に設定されている。人脈情報による重み付けでは、例えば、知識発見支援対象のユーザの部下や上司にあたるユーザに対する重み係数を「1」とし、それ以外のユーザについては重み係数を「0」とする。また、知識発見支援対象のユーザの部下や上司にあたるユーザに対する重み係数を「1」以外の値として、知識発見支援対象のユーザとの関係に応じて、重みを変化させてもよい。
例えば、ユーザ設定入力部300が設定したユーザが「USER01」であり、人脈情報管理部901が、ユーザ「USER01」の人脈情報として、「上司=「USER02」、上司の上司=「USER03」」を出力する場合を考える。グループ生成の際の重み係数については、「上司」は「1.5」とし、「上司の上司」は「1.1」とする。グループ生成部400は、ユーザ「USER01」とユーザ「USER02」との間での興味類似度(COS値)を計算し、得られた興味類似度に重み係数「1.5」を乗じたものを、重み付けを行った興味類似度とする。また、ユーザ「USER01」とユーザ「USER03」との間での興味類似度を計算し、得られた興味類似度に重み係数「1.1」を乗じたものを、重み付けを行った興味類似度とする。グループ生成部400は、第1実施形態と同様に、知識発見支援対象のユーザとの間での重み付けを行った興味類似度がしきい値以上のユーザを、興味の近いユーザとして捉え、それらのユーザでグループを生成する。
グループ興味生成部500は、ユーザ興味抽出部200が生成したユーザ興味情報から、グループ生成部400が生成したグループについてのグループ興味情報を生成する。グループ興味生成部500は、グループ生成部400が生成したグループに属するユーザの興味情報の平均値を、グループ興味情報とする。或いは、人脈情報を用いてユーザ興味情報の各要素の値に重み付けを行い、ユーザとの関係を考慮してグループ興味情報を生成してもよい。
人脈情報による重み付けを行ったグループ興味情報では、例えば、第1実施形態で説明した式1を用いる。ただし、βiの値は、人脈情報に基づく重み係数とする。重み係数は、例えば、知識発見支援対象のユーザの上司は「1.5」とし、上司の上司は「1.1」とし、他のユーザ「1.0」に設定する。これら重み係数は、グループ興味生成部500にあらかじめ設定されている。グループ興味生成部500は、式1に従って、グループを構成する各ユーザについてαiを求め、これを用いて、グループ興味情報の各要素gjを算出する。
上記では、人脈情報として、部署内での人間関係に着目した人脈情報を用いたが、ユーザ間の関係は、部署内での人間関係には限られず、その他の関係を用いてもよい。例えば、SNS(ソーシャルネットワーキングサービス)が管理する人と人とのつながりを人脈情報として用いることができ、或いは、趣味のサークルなどのグループの所属情報を人脈情報として用いてもよい。具体的に、SNSが管理する人と人とのつながりを人脈情報とするときは、人脈情報管理部901により、知識発見支援対象のユーザの友人、友人の友人などの関係を抽出し、グループ生成及びグループ興味情報生成にて、ユーザとの関係に応じた重み付けを行えばよい。その際には、ユーザの友人の重みを、友人の友人よりも大きくして、重み付けを行えばよい。
図11に、本実施形態の知識発見支援システムの動作手順を示す。知識発見支援対象のユーザの設定、及び、ユーザ興味情報の生成は、第1実施形態と同様である(ステップS1、ステップS2)。人脈情報管理部901は、ステップS1で設定したユーザに関係する人脈情報を抽出する(ステップS103)。グループ生成部400は、人脈情報管理部901が抽出した組織情報と、ユーザ興味抽出部200が生成したユーザ興味情報とから、ステップS1で設定したユーザの興味に近い興味を持つユーザのグループを生成する(ステップS104)。グループ興味生成部500は、ユーザ興味情報から、グループ生成部400が生成したユーザグループのグループ興味情報を生成する(ステップS105)。その後の動作は、第1実施形態と同様である(ステップS6〜ステップS12)。
以下、本実施形態の知識発見支援システムの動作を、具体例を用いつつ説明する。ユーザ設定入力部300は、図12に、人脈情報管理部901が管理/抽出する人脈情報、グループ生成の際の重み付けを行ったユーザ興味類似度、及び、グループ興味生成部500が生成するグループ興味情報の具体例を示す。ステップS1で、知識発見支援対象のユーザとして、ユーザ「USER04」を設定する。ユーザ興味抽出部200は、ステップS2で、アクセス履歴情報から、各ユーザの興味情報を生成する。このとき生成されたユーザ興味情報は、図6に示すユーザ興味情報830とする。
人脈情報管理部901は、図12に示す人脈情報1310を記憶している。人脈情報管理部901は、ステップS103で、人脈情報1310から、ステップS1で設定されたユーザ「USER04」の人脈情報を抽出する。人脈情報1310を参照すると、ユーザ「USER04」の上司はユーザ「USER01」であり、上司の上司はユーザ「USER02」であるので、ステップS103では、その旨を示す人脈情報1320を抽出する。
グループ生成部400は、ステップS104にて、ステップS2で生成した各ユーザの興味情報830と、ステップS103で抽出したユーザ「USER04」の人脈情報1320とを用いて、ユーザ「USER04」に興味が近いユーザのグループを生成する。ステップS104のグループの生成では、ユーザ興味情報830を用いてユーザ「USER04」と他のユーザとの間で興味類似度(COS値)を求め、求めたCOS値にユーザ人脈情報1320に基づく重み付けを行って、重み付けを行った興味類似度1330を求める。重み付けにおける重み係数は、ユーザの上司は「1.5」とし、上司の上司は「1.1」とし、その他のユーザは「1.0」とする。
重み付けを行った興味類似度1330を参照すると、ユーザ「USER04」とユーザ「USER01」との興味類似度は「0.80」であり、ユーザ「USER02」との興味類似度は「0.0」であり、ユーザ「USER03」との興味類似度は「0.68」である。興味類似度のしきい値を「0.5」とした場合、重み付けを行った興味類似度1330の中でしきい値以上となるユーザはユーザ「USER01」と「USER03」であるので、これらユーザを、ユーザ「USER04」に興味が近いユーザのグループ「GROUP02」とする。
グループ興味生成部500は、ステップS105で、ステップS104で生成したグループ「GROUP02」の興味情報を生成する。グループ興味情報の生成には、式1を用いる。グループ興味情報生成における人脈情報に基づく重み係数は、ユーザ「USER04」の上司は「1.5」とし、上司の上司は「1.1」とし、その他のユーザは「1.0」とする。グループ「GROUP02」を構成するユーザのうち、ユーザ「USER01」はユーザUSER04」の上司であるため、式1における重み係数β1(USER01に対応)は「1.5」となる。また、ユーザ「USER03」は、ユーザ「USER04」と上司/部下の関係にないので、重み係数β2(UESR03に対応)は「1.0」となる。この場合、式1より、α1、α2は、それぞれ、
α1=β1/Σβ=1.5/(1.5+1.0)=0.6
α2=β2/Σβ=1.0/(1.5+1.0)=0.4
となる。
α1=β1/Σβ=1.5/(1.5+1.0)=0.6
α2=β2/Σβ=1.0/(1.5+1.0)=0.4
となる。
グループ興味生成部500は、式1に従って、興味情報の各要素の値を算出する。例えば、「セキュリティ」については、
gセキュリティ=α1×u1,セキュリティ+α2×u2,セキュリティ
=0.6×2.5+0.4×1.5=2.1
となる。グループ興味生成部500は、このような計算を各要素について行うことで、グループ「GROUP02」の興味情報1340を生成する。これ以降の動作については、第1実施形態と同様であるので、説明は省略する。
gセキュリティ=α1×u1,セキュリティ+α2×u2,セキュリティ
=0.6×2.5+0.4×1.5=2.1
となる。グループ興味生成部500は、このような計算を各要素について行うことで、グループ「GROUP02」の興味情報1340を生成する。これ以降の動作については、第1実施形態と同様であるので、説明は省略する。
本実施形態では、組織情報に代えて、人脈情報を用いる。本実施形態では、人脈情報を用いた重み付けを行うことで、知識発見支援対象のユーザの上司/部下や、知り合い関係を考慮した条件候補生成が可能である。従って、実際の人間関係を考慮し、よりユーザの業務や興味に関係の深い知識発見を支援することができる。その他の効果は、第1実施形態と同様である。
なお、第1実施形態では組織情報を用い、第2実施形態では人脈情報を用いたが、これら2つを用いてグループ生成、グループ興味情報生成を行ってもよい。例えば、グループの生成に際して、「ユーザ1」が、知識発見支援対象のユーザと同じ部署に所属し、かつ、「ユーザ1」が知識発見支援対象のユーザの上司である場合には、知識類似度に乗じる重み係数を、同じ部署のユーザに設定する重み係数と、上司に設定する重み係数との積とする。具体的には、同じ部署のユーザに設定する重み係数が「1.5」であり、上司に設定する重み係数が「1.5」であるときには、興味類似度に、1.5×1.5=2.25を乗じる。この場合は、組織上の関係と、上司/部下の関係との双方を、条件候補の生成に反映させることができる。
また、上記各実施形態では、組織情報又は人脈情報を用いてグループ生成を行い、生成したグループの興味情報を求めたが、グループ興味情報の生成にて、組織情報又は人脈情報を用いる場合は、グループの生成は必須ではない。例えば、図5にて、ステップS3からステップS5に移行し、ステップS5にて、組織情報又は人脈情報による重み付けを行いつつ、グループ興味情報を生成してもよい。この場合も、知識発見支援対象のユーザに関係が深いユーザほど重み係数を大きくすることで、ユーザに関係が深いユーザのユーザ興味情報がグループ興味情報に与える影響を大きくすることができ、人的関係を考慮した条件候補の生成が可能である。
本発明を特別に示し且つ例示的な実施形態を参照して説明したが、本発明は、その実施形態及びその変形に限定されるものではない。当業者に明らかなように、本発明は、添付のクレームに規定される本発明の精神及び範囲を逸脱することなく、種々の変更が可能である。
本出願は、2007年7月20日出願に係る日本特許出願2007−188950号を基礎とし且つその優先権を主張するものであり、引用によってその開示の内容の全てを本出願の明細書中に加入する。
本発明は、データベースに格納されたデータを検索する情報検索システムや、データベースに格納されたデータの中から適した情報を推薦してくれる情報推薦システムといった用途に適用できる。
Claims (19)
- ユーザに、検索対象データに対する検索条件の候補を提示し、ユーザの知識発見を支援する知識発見支援システムであって、
各ユーザの前記検索対象データに対するアクセス履歴を記憶するアクセス履歴記憶装置と、検索対象データを管理する検索対象データ管理部が記憶しているメタ情報とを参照して、各ユーザについて、ユーザの興味の度合いを示すユーザ興味情報を生成するユーザ興味抽出部と、
前記ユーザ興味情報と、ユーザ間の関係を表すユーザ関係情報とを用いて、知識発見支援対象のユーザの興味に近いユーザのグループを生成するグループ生成部と、
前記ユーザ興味情報を用いて、前記グループ生成部が生成したグループの興味情報を生成するグループ興味生成部と、
前記知識発見支援対象のユーザのユーザ興味情報と、前記グループ興味生成部が生成したグループ興味情報との差に基づいて、前記検索条件の候補を生成する条件候補生成部と、
前記条件候補生成部が生成した条件候補を、ユーザに提示する条件候補提示部とを備えることを特徴とする知識発見支援システム。 - 前記メタ情報は、前記検索対象データが関連する分野を示す関連語を含んでおり、前記興味情報は、前記関連語を要素として含む多次元ベクトルで表されることを特徴とする、請求項1に記載の知識発見支援システム。
- 前記グループ生成部は、前記ユーザ興味情報に基づいて、前記知識発見支援対象のユーザと、他のユーザとの間の興味類似度を求め、該求めた興味類似度に、前記ユーザ関係情報による重み付けを行い、重み付けを行った興味類似度が所定のしきい値以上の他のユーザを、前記知識発見支援対象のユーザの興味に近いユーザのグループとすることを特徴とする、請求項2に記載の知識発見支援システム。
- 前記グループ生成部は、前記知識発見支援対象のユーザのユーザ興味情報を表すベクトルをA、他のユーザのユーザ興味情報を表すベクトルをBとして、興味類似度を、
興味類似度=(A・B)/|A|×|B|
で求めることを特徴とする、請求項3に記載の知識発見支援システム。 - 前記グループ生成部は、前記知識発見支援対象のユーザのユーザ興味情報を表すベクトルと、他のユーザのユーザ興味情報を表すベクトルとの相関係数を、興味類似度として求めることを特徴とする、請求項3に記載の知識発見支援システム。
- 前記グループ生成部は、前記知識発見支援対象のユーザが属する部署、当該部署に所属するユーザ、及び当該部署の関連部署を記述し、ユーザに応じてそれぞれのユーザや部署で同じ、あるいは異なる重み付けが設定された組織情報をもとにユーザの重み付けを行うことを特徴とする、請求項3〜5の何れか一に記載の知識発見支援システム。
- 前記グループ生成部は、前記知識発見支援対象のユーザの上司/部下、知り合い関係、及び、グループメンバ関係の少なくとも1つを有する人脈を記述し、ユーザとの関係に応じて同じ、あるいは異なる重み付けが設定された人脈情報をもとにユーザの重み付けを行うことを特徴とする、請求項3〜5の何れか一に記載の知識発見支援システム。
- 前記グループ興味生成部は、前記グループ生成部が生成したグループを構成する各ユーザの興味情報における各要素の値の平均を、前記グループ興味情報における各要素の値とすることを特徴とする、請求項7に記載の知識発見支援システム。
- 前記グループ興味生成部は、ユーザが属する部署、当該部署に所属するユーザ、及び、当該部署の関連部署を記述し、ユーザに応じてそれぞれのユーザや部署で同じ、あるいは異なる重み付けが設定された組織情報で表現されたユーザ関係情報を用いて生成したグループを構成する各ユーザの興味情報における各要素の値に、前記ユーザ関係情報による重み付けを行い、前記グループ興味情報における各要素の値を生成することを特徴とする、請求項2〜8の何れか一に記載の知識発見支援システム。
- 前記グループ興味生成部は、ユーザの上司/部下、知り合い関係、及び、グループメンバ関係の少なくとも1つを有する人脈を記述し、ユーザとの関係に応じて同じ、あるいは異なる重み付けが設定された人脈情報を用いて生成したグループを構成する各ユーザの興味情報における各要素の値に、前記ユーザ関係情報による重み付けを行い、前記グループ興味情報における各要素の値を生成することを特徴とする、請求項2〜8の何れか一に記載の知識発見支援システム。
- 前記条件候補生成部は、前記グループ興味生成部が生成したグループ興味情報における要素の値と、前記知識発見支援対象のユーザのユーザ興味情報における要素の値との差に基づいて、前記条件候補を生成することを特徴とする、請求項2〜10の何れか一に記載の知識発見支援システム。
- 前記条件候補生成部は、前記グループ興味生成部が生成したグループ興味情報における要素の値と、前記知識発見支援対象のユーザのユーザ興味情報における要素の値との差が所定のしきい値以上の要素に対応する関連語を、前記条件候補とすることを特徴とする、請求項11に記載の知識発見支援システム。
- 前記条件候補生成部は、前記グループ興味生成部が生成したグループ興味情報における要素の値と、前記知識発見支援対象のユーザのユーザ興味情報における要素の値との差が所定のしきい値以上で、かつ、該要素に対応する関連語で検索される検索対象データ数が所定のしきい値以上の要素に対応する関連語を、前記条件候補とすることを特徴とする、請求項11に記載の知識発見支援システム。
- 前記ユーザ興味抽出部は、前記アクセス履歴を参照して、各ユーザがアクセスした検索対象データを特定し、前記メタ情報を参照して、前記特定した検索対象データの関連語の出現個数を調べ、該出現個数を、前記多次元ベクトルにおける各要素の値とすることを特徴とする、請求項2〜13の何れか一に記載の知識発見支援システム。
- 前記検索対象データ管理部は、前記条件候補提示部が提示する条件候補のうちの少なくとも1つがユーザによって選択されると、該選択された条件候補に合致する検索対象データを検索し、検索結果を表示することを特徴とする、請求項1〜16の何れか一に記載の知識発見支援システム。
何れか一に記載の知識発見支援システム。 - 前記アクセス履歴記憶装置は、ユーザが、前記検索された検索対象データのうちの何れかにアクセスすると、該アクセスした検索対象データを特定する情報、及び、検索に際して使用された条件候補を含むアクセス履歴を生成し記憶することを特徴とする、請求項17に記載の知識発見支援システム。
- ユーザが、前記検索結果に対して更に絞り込む旨の指令を与えると、前記ユーザ興味抽出部は、前記アクセス履歴のうちの前記検索された検索対象データに関するアクセス履歴と、前記メタ情報とを参照して、各ユーザについて、対象が狭められたユーザ興味情報を生成し、前記グループ生成部は、前記対象が狭められたユーザ興味情報と、前記ユーザ関係情報とを用いて、知識発見支援対象のユーザの興味に近いユーザのグループを生成し、前記グループ興味生成部は、前記対象が狭められたユーザ興味情報を用いて、対象が狭められたグループ興味情報を生成し、前記条件候補生成部は、前記知識発見支援対象のユーザの対象が狭められたユーザ興味部と、前記グループ興味生成部が生成した対象が狭められたグループ興味情報とに基づいて、前記検索条件の候補を生成することを特徴とする、請求項17又は18に記載の知識発見支援システム。
- コンピュータを用い、ユーザに、検索対象データに対する検索条件の候補を提示し、ユーザの知識発見を支援する知識発見支援方法であって、
前記コンピュータが、各ユーザの前記検索対象データに対するアクセス履歴を記憶するアクセス履歴記憶装置と、検索対象データを管理する検索対象データ管理部が記憶しているメタ情報とを参照して、各ユーザについて、ユーザの興味の度合いを示すユーザ興味情報を生成するステップと、
前記コンピュータが、前記ユーザ興味情報と、ユーザ間の関係を表すユーザ関係情報とを用いて、知識発見支援対象のユーザの興味に近いユーザのグループを生成するステップと、
前記コンピュータが、前記ユーザ興味情報を用いて、前記生成したグループの興味情報を生成するステップと、
前記コンピュータが、前記知識発見支援対象のユーザのユーザ興味情報と、前記グループ興味情報との差に基づいて、前記検索条件の候補を生成するステップと、
前記コンピュータが、前記生成した条件候補を、ユーザに提示するステップとを有することを特徴とする知識発見支援方法。 - ユーザに、検索対象データに対する検索条件の候補を提示し、ユーザの知識発見を支援する処理を、コンピュータに実行させるプログラムであって、前記コンピュータに、
各ユーザの前記検索対象データに対するアクセス履歴を記憶するアクセス履歴記憶装置と、検索対象データを管理する検索対象データ管理部が記憶しているメタ情報とを参照して、各ユーザについて、ユーザの興味の度合いを示すユーザ興味情報を生成するステップと、
前記ユーザ興味情報と、ユーザ間の関係を表すユーザ関係情報との差に基づいて、知識発見支援対象のユーザの興味に近いユーザのグループを生成するステップと、
前記ユーザ興味情報を用いて、前記生成したグループの興味情報を生成するステップと、
前記知識発見支援対象のユーザのユーザ興味情報と、前記グループ興味情報とに基づいて、前記検索条件の候補を生成するステップと、
前記生成した条件候補を、ユーザに提示するステップとを実行させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009524465A JP5223865B2 (ja) | 2007-07-20 | 2008-07-17 | 知識発見支援システム、方法、及び、プログラム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007188950 | 2007-07-20 | ||
JP2007188950 | 2007-07-20 | ||
PCT/JP2008/062900 WO2009014058A1 (ja) | 2007-07-20 | 2008-07-17 | 知識発見支援システム、方法、及び、プログラム |
JP2009524465A JP5223865B2 (ja) | 2007-07-20 | 2008-07-17 | 知識発見支援システム、方法、及び、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2009014058A1 JPWO2009014058A1 (ja) | 2010-09-30 |
JP5223865B2 true JP5223865B2 (ja) | 2013-06-26 |
Family
ID=40281314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009524465A Expired - Fee Related JP5223865B2 (ja) | 2007-07-20 | 2008-07-17 | 知識発見支援システム、方法、及び、プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5223865B2 (ja) |
WO (1) | WO2009014058A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110270850A1 (en) * | 2010-04-30 | 2011-11-03 | Microsoft Corporation | Prioritization of Resources based on User Activities |
US9697500B2 (en) | 2010-05-04 | 2017-07-04 | Microsoft Technology Licensing, Llc | Presentation of information describing user activities with regard to resources |
WO2012090661A1 (ja) * | 2010-12-27 | 2012-07-05 | コニカミノルタビジネステクノロジーズ株式会社 | 情報提供装置、記憶媒体、および、情報提供方法 |
JP2012174122A (ja) * | 2011-02-23 | 2012-09-10 | Ntt Docomo Inc | キーワード選定装置、キーワード提示システム、キーワード提示方法及びプログラム |
WO2012172916A1 (ja) * | 2011-06-16 | 2012-12-20 | コニカミノルタビジネステクノロジーズ株式会社 | プロファイル生成装置、プロファイル生成方法、および、記録媒体 |
JP5787717B2 (ja) * | 2011-10-24 | 2015-09-30 | ニフティ株式会社 | 情報処理装置、プログラム及び情報検索システム |
JP5696094B2 (ja) * | 2012-05-14 | 2015-04-08 | 日本電信電話株式会社 | 推薦情報提示装置及びそのプログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09153063A (ja) * | 1995-11-30 | 1997-06-10 | Toshiba Corp | 情報フィルタリング装置 |
JP2000331013A (ja) * | 1999-05-19 | 2000-11-30 | Matsushita Electric Ind Co Ltd | 情報問いあわせ支援装置及び情報問いあわせ支援方法 |
US6493702B1 (en) * | 1999-05-05 | 2002-12-10 | Xerox Corporation | System and method for searching and recommending documents in a collection using share bookmarks |
JP2004126975A (ja) * | 2002-10-03 | 2004-04-22 | Nippon Telegr & Teleph Corp <Ntt> | 選好傾向類似ユーザ抽出方法及び装置、並びに選好傾向類似ユーザ抽出プログラム及びそれを記録した記録媒体 |
JP2004192581A (ja) * | 2002-12-13 | 2004-07-08 | Matsushita Electric Ind Co Ltd | 端末装置、端末システム、嗜好特定方法およびプログラム |
-
2008
- 2008-07-17 JP JP2009524465A patent/JP5223865B2/ja not_active Expired - Fee Related
- 2008-07-17 WO PCT/JP2008/062900 patent/WO2009014058A1/ja active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09153063A (ja) * | 1995-11-30 | 1997-06-10 | Toshiba Corp | 情報フィルタリング装置 |
US6493702B1 (en) * | 1999-05-05 | 2002-12-10 | Xerox Corporation | System and method for searching and recommending documents in a collection using share bookmarks |
JP2000331013A (ja) * | 1999-05-19 | 2000-11-30 | Matsushita Electric Ind Co Ltd | 情報問いあわせ支援装置及び情報問いあわせ支援方法 |
JP2004126975A (ja) * | 2002-10-03 | 2004-04-22 | Nippon Telegr & Teleph Corp <Ntt> | 選好傾向類似ユーザ抽出方法及び装置、並びに選好傾向類似ユーザ抽出プログラム及びそれを記録した記録媒体 |
JP2004192581A (ja) * | 2002-12-13 | 2004-07-08 | Matsushita Electric Ind Co Ltd | 端末装置、端末システム、嗜好特定方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2009014058A1 (ja) | 2009-01-29 |
JPWO2009014058A1 (ja) | 2010-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5431727B2 (ja) | 関連性判定方法、情報収集方法、オブジェクト組織化方法及び検索システム | |
US20200372421A1 (en) | User-centric browser location | |
JP5223865B2 (ja) | 知識発見支援システム、方法、及び、プログラム | |
JP5386663B1 (ja) | 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体 | |
Shafiq et al. | On personalizing Web search using social network analysis | |
US20080005101A1 (en) | Method and apparatus for determining the significance and relevance of a web page, or a portion thereof | |
US20080059897A1 (en) | Method and system of social networking through a cloud | |
US8997008B2 (en) | System and method for searching through a graphic user interface | |
US20160162583A1 (en) | Apparatus and method for searching information using graphical user interface | |
Tian et al. | Geek talents: Who are the top experts on github and stack overflow? | |
JP5228584B2 (ja) | 興味情報特定システム、興味情報特定方法、および興味情報特定用プログラム | |
CN112615958A (zh) | 联系人显示方法、装置及电子设备 | |
JP2008217674A (ja) | 情報処理システム、情報処理方法、サーバコンピュータおよびプログラム | |
JP2009015589A (ja) | 関連文書提示システム及びプログラム | |
Li et al. | Personalized mention probabilistic ranking–recommendation on mention behavior of heterogeneous social network | |
US20140095465A1 (en) | Method and apparatus for determining rank of web pages based upon past content portion selections | |
JP2013011940A (ja) | 情報提供サーバ、情報検索システム、情報検索方法、および情報検索プログラム | |
JP2017162275A (ja) | 情報処理装置、情報処理方法及びプログラム | |
US20140149378A1 (en) | Method and apparatus for determining rank of web pages based upon past content portion selections | |
JP6941802B1 (ja) | 検索システム、検索方法及び検索プログラム | |
JP2015011503A (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
JP4870903B2 (ja) | コンテンツ分類処理装置、および同装置におけるディレクトリのリスティング方法ならびにその処理プログラム | |
JP2020102035A (ja) | 情報処理装置及びプログラム | |
JP6941803B1 (ja) | 検索システム、検索方法及び検索プログラム | |
JP6443431B2 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110603 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130225 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160322 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |