JP2004348626A - 文書検索方法及び文書検索システム - Google Patents

文書検索方法及び文書検索システム Download PDF

Info

Publication number
JP2004348626A
JP2004348626A JP2003147353A JP2003147353A JP2004348626A JP 2004348626 A JP2004348626 A JP 2004348626A JP 2003147353 A JP2003147353 A JP 2003147353A JP 2003147353 A JP2003147353 A JP 2003147353A JP 2004348626 A JP2004348626 A JP 2004348626A
Authority
JP
Japan
Prior art keywords
document
search
user
group
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003147353A
Other languages
English (en)
Inventor
Yumi Oshima
由未 大島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2003147353A priority Critical patent/JP2004348626A/ja
Publication of JP2004348626A publication Critical patent/JP2004348626A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】利用者が直接入力していないキーワードにおいても同じグループの者が必要とした結果を反映することができ、利用者が必要としている情報を提供することができる文書検索システムを提供する。
【解決手段】検索サーバ200により、利用者がキーワードを入力して文書のキーワード検索を行う際、個人情報管理サーバ100の認証情報から利用者の所属するグループを特定し、利用者から入力されたキーワードによる文書の検索結果を、グループ内で過去に使用されたキーワードの使用頻度又は使用頻度から算出された重み付け値に基づいて並び替える。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、文書を検索する文書検索方法及び文書検索システムに関し、特に、少ないキーワードで利用者が必要としている検索結果を表示する技術に関する。
【0002】
【従来の技術】
従来、各個人が所有している文書を公開し参照可能とする情報共有化が進み、管理対象となる文書の量は増加している。
【0003】
そして、これらの膨大な量の情報の中から、利用者が必要としている情報を検索する文書検索システムとして、キーワードを用いて検索するものがあった。
【0004】
また、キーワード検索の精度を高めるために、文書のキーワード検索を行う際に、キーワードの使用頻度や使用頻度から算出された重み付けの値などを用いて、検索を行うものがあった(例えば、特許文献1,2参照)。
【0005】
【特許文献1】
特開平5−35795号公報
【0006】
【特許文献2】
特開平6−4584号公報
【0007】
【発明が解決しようとする課題】
従来の文書検索システムには、前記特許文献1,2に記載のように、検索システムの利用者が入力したキーワードの使用頻度や使用頻度から算出された重み付けの値などを元に検索結果を抽出し表示するシステムがあったが、検索システムの利用者の全てについて、同じキーワードに対しては、同じ使用頻度の情報を使うことになるので、利用者の所属しているグループなどによる詳細な検索を行うことができなかった。
【0008】
そこで、本発明の目的は、利用者をグループ分けし、所属グループ内にて入力されたキーワードの使用頻度をもとに検索結果を抽出することにより、利用者が直接入力していないキーワードにおいても同じグループの者が必要とした結果を反映することができ、利用者が必要としている情報を提供することができる文書検索システムを提供することにある。
【0009】
【課題を解決するための手段】
本発明による文書検索方法は、利用者がキーワードを入力して文書のキーワード検索を行う際、利用者の所属するグループを特定し、利用者から入力されたキーワードによる文書の検索結果を、グループ内で過去に使用されたキーワードの使用頻度又は使用頻度から算出された重み付け値に基づいて並び替えるものである。
【0010】
本発明による文書検索システムは、利用者の所属するグループを含む個人情報を管理し、利用者の認証処理を行う個人情報管理手段と、利用者からのアクセスにより文書の検索処理を行う検索手段とを備え、検索手段は、利用者がキーワードを入力して文書のキーワード検索を行う際、個人情報管理手段の認証情報から利用者の所属するグループを特定し、利用者から入力されたキーワードによる文書の検索結果を、グループ内で過去に使用されたキーワードの使用頻度又は使用頻度から算出された重み付け値に基づいて並び替えるものである。
【0011】
【発明の実施の形態】
以下、本発明の実施の形態を図面に基づいて詳細に説明する。
【0012】
図1は本発明の一実施の形態における文書検索システムの構成を示すブロック図である。
【0013】
図において、文書検索システムは、個人情報管理手段である個人情報管理サーバ100、検索手段である検索サーバ200、利用者が使用する端末機30から構成され、個人情報管理サーバ100、検索サーバ200、文書を検索する利用者が使用する端末機30はそれぞれ、イントラネット400を介して接続されている。
【0014】
なお、端末機30はイントラネット400を介して接続するのではなく、インターネットなどの他のネットワークにより接続してもよい。
【0015】
また、端末機30は使用する利用者の所属するグループによりグループ分けされ、例えば、グループ1(300−1)から、グループn(300−n)に分かれている。なお、端末機30は、利用者の所属するグループによりグループが分かれるので、どのグループの端末機30としても使用される。
【0016】
また、端末機30はウェブブラウザ31などにより、検索サーバ200からの情報を表示できる。
【0017】
また、個人情報管理サーバ100は利用者の所属するグループを含む個人情報を管理し、利用者の認証処理を行う個人情報管理部110を有し、個人情報管理部110では個人情報DB111を有している。
【0018】
検索サーバ200は利用者からのアクセスにより文書の検索処理を行う検索管理部210と文書管理部220を有し、検索管理部210は検索管理DB211、文書管理部220は文書DB221をそれぞれ有している。また、検索サーバ200では、文書の検索時に使用されるキーワード一覧表212が、利用者の検索開始時に作成されている。
【0019】
次に、個人情報DB111、検索管理DB211、文書DB221の構造の一例について説明する。
【0020】
図2は個人情報DBの構造の一例を示す図、図3は検索管理DBの構造の一例を示す図、図4は文書DBの構造の一例を示す図である。
【0021】
図2に示すように、個人情報DB111には、文書検索システムの利用者の氏名、ユーザID、パスワードを、それぞれ個人情報DBの氏名エリア40、ユーザIDエリア41、パスワードエリア42に登録し、さらに利用者をグループ分けし、そのグループ名を所属グループエリア43に登録する。
【0022】
この個人情報DB111の情報により、文書検索システムを利用する利用者が端末機30からログインすると、その利用者の所属しているグループを特定できる。
【0023】
また、図3に示すように、検索管理DB211には、所属グループエリア50に登録されている所属グループに属している利用者が、検索システム利用時に入力したキーワードをキーワードエリア51に登録し、また、その利用者の所属グループがそのキーワードを何度入力したかの使用頻度を使用頻度エリア52に登録する。
【0024】
この検索管理DB211の情報により、文書検索システムを利用する利用者の所属するグループ内の他の利用者が文書の検索時に使用したキーワードの使用頻度が分かる。
【0025】
また、図4に示すように、文書DB221には、検索対象となる文書を文書エリア60に登録し、その文書を閲覧したグループを所属グループエリア61に登録し、その文書を閲覧した所属グループ毎の閲覧回数を所属グループ毎の閲覧回数エリア62に登録する。
【0026】
なお、文書が複数のグループの利用者によって閲覧された場合には、文書エリア60に登録した文書に対して、複数の所属グループと所属グループ毎の閲覧回数が登録される。
【0027】
この文書DB221の情報により、検索対象の文書に対して、グループ毎にどの程度閲覧されているかが分かる。
【0028】
なお、図4では、文書DB221に、検索対象の文書と文書を閲覧したグループ及びその文書を閲覧した所属グループ毎の閲覧回数の情報を登録しているが、文書DB221は検索対象の文書のみ登録し、文書DB221に登録された文書の文書名に対応して、文書を閲覧したグループ及びその文書を閲覧した所属グループ毎の閲覧回数の情報を別の文書管理DBなどで管理してもよい。
【0029】
なお、図2〜図4に示す個人情報DB111、検索管理DB211、文書DB221の構造は一例であり、文書検索システムの利用者の所属するグループが特定でき、各グループの利用者が検索時に使用したキーワードの使用頻度が分かり、検索対象の文書に対して、グループ毎にどの程度閲覧されているかが分かる構成であれば、どのような構成であってもよい。
【0030】
次に、文書の検索時に使用されるキーワード一覧表212の内容について説明する。
【0031】
図5はキーワード一覧表の構成を示す図である。
【0032】
このキーワード一覧表212は文書検索システムの利用者が文書の検索を行う際に作成されるものであり、図5に示すように、利用者の検索開始時に、個人情報DB111の情報及び検索管理DB211の情報に基づいて、利用者が所属しているグループにおいて、使用頻度の高いキーワードをキーワードエリア70に高い順に登録し、そのキーワードの使用頻度から算出された重み付けの値を重み付けエリア71に登録する。
【0033】
なお、重み付けエリア71に登録される重み付けの値は、例えば、使用頻度の高い順に重み付けの値を1ずつ少なくするなどの値であり、この値は文書の検索時に検索結果に優先度を付けられる値であればよい。
【0034】
また、重み付けの値は、文書の検索時の処理により算出されるものであれば、キーワード一覧表212の重み付けの値は使用頻度の値であってもよい。
【0035】
次に、この実施の形態における文書検索システムにおいて文書検索方法の動作について説明する。
【0036】
図6はこの実施の形態における文書検索システムの動作を示すフローチャートである。
【0037】
まず、検索サーバ200は、利用者が使用する端末機30のウェブブラウザ31上に、文書検索システムを利用するためのユーザID及びパスワードの入力画面を表示させる(S100)。
【0038】
そして、例えば、グループ1(300−1)に所属している利用者がユーザID及びパスワードを入力すると(S101)、個人情報管理サーバ100は、個人情報DB111の情報に基づいて利用者の所属するグループ(例えば、グループ1)を特定する(S102)。
【0039】
そして、S102で特定された利用者の所属するグループが検索サーバ200に送られ、検索サーバ200では、利用者の所属するグループと検索管理DB211の情報に基づいて、図5に示すような、利用者が所属するグループの他の利用者がよく入力するキーワードに重み付けしたキーワード一覧表212を作成する(S103)。
【0040】
そして、利用者により文書の検索のためのキーワードが入力されると、検索サーバ200では、利用者から入力されたキーワード及び文書DB221の情報に基づいて、例えば、文書DB221に登録されている文書の全文検索を行い、キーワードを含む文書を抽出する(S104)。
【0041】
なお、この検索は、文書の全文検索ではなく、文書にキーワードが登録されている場合では、その登録されているキーワードによる検索でもよい。
【0042】
そして、S104で検索された検索結果にキーワード一覧表212を用いてさらに検索し、初めの検索結果にキーワード一覧表212のキーワードが記載されている場合は、キーワード一覧表212に記載されているキーワードの重み付けが大きい順に、またキーワード一覧表212に記載されているキーワードをより多く含む順に文書を並び替え(S105)、さらに、文書DB221に登録された利用者が所属するグループ毎の閲覧回数の情報に基づいて、利用者の所属するグループ内で閲覧された文書を優先して並び替え(S106)、検索結果を利用者の端末機30上に表示する(S107)。
【0043】
そして、利用者の入力したキーワードが、利用者の所属するグループで検索管理DB211に登録されているか否かを判断し(S108)、S108でキーワードが利用者の所属するグループで検索管理DB211に登録されていないと判断されると、検索管理DB211に、利用者の所属グループ、利用者により入力されたキーワード、使用頻度を新たに登録し(S109)、S108でキーワードが利用者の所属するグループで検索管理DB211に登録されていると判断されると、検索管理DB211の利用者の所属するグループでの該当するキーワードの使用頻度を更新する(S110)。
【0044】
そして、S107で表示した検索結果により、利用者が文書を閲覧すると(S111)、利用者に閲覧された文書について、文書DB221内の所属グループ毎の閲覧回数エリア62の情報を更新する(S112)。
【0045】
そして、利用者からの操作などにより、検索を終了するか否かを判断し(S113)、S113で検索終了と判断されると、検索処理を終了し、S113で検索終了でないと判断されると、S104に戻り、S104〜S113の処理を繰り返す。
【0046】
このように、この実施の形態では、利用者が入力したキーワードだけではなく、利用者が所属しているグループで使用されたキーワードや、利用者が所属しているグループで閲覧された文書の情報により、検索結果が並び替えられるので、利用者は少ないキーワードで同じグループ内での過去の検索結果や閲覧状況を反映した検索結果を得ることができ、利用者の必要としている情報を容易に得ることが可能である。
【0047】
また、この実施の形態では、文書に利用者が所属しているグループ毎の閲覧回数の情報が登録されているので、文書を階層構造により管理する場合、大量に蓄積された多種多様の文書を利用者のグループ毎の利用状況によって体系化して管理することも可能である。
【0048】
なお、この実施の形態では、利用者が入力したキーワードによる文書の検索結果を、キーワード一覧表212の情報と文書DB221のグループ毎の閲覧回数の情報により並び替えているが、どちらかの情報だけにより、検索結果の並び替えをしてもよい。
【0049】
また、文書DB221に登録されている文書について、複数の所属グループ及び所属グループ毎の閲覧回数の情報が登録されている場合、グループ毎の閲覧回数が一番多いグループを、その文書が所属するグループとして設定し、この文書の所属するグループの情報に基づいて、利用者の所属するグループと同じグループに所属している文書を優先して検索結果の並び替えを行ってもよい。
【0050】
また、グループ毎の閲覧回数が多い文書だけではなく、その文書に類似した文書も管理し、類似した文書はグループ毎の閲覧回数に関係なく検索結果の並び替えの情報として使用するようにしてもよい。
【0051】
【発明の効果】
以上のように、本発明によれば、利用者が直接入力していないキーワードにおいても同じグループの者が必要とした結果を反映することができ、利用者が必要としている情報を提供することができる。
【0052】
さらに、文書を階層構造により管理する場合、大量に蓄積された多種多様の文書を利用者のグループ毎の利用状況によって体系化して管理することができる。
【図面の簡単な説明】
【図1】本発明の一実施の形態における文書検索システムの構成を示すブロック図である。
【図2】本発明の一実施の形態における個人情報DBの構造の一例を示す図である。
【図3】本発明の一実施の形態における検索管理DBの構造の一例を示す図である。
【図4】本発明の一実施の形態における文書DBの構造の一例を示す図である。
【図5】本発明の一実施の形態におけるキーワード一覧表の構成を示す図である。
【図6】本発明の一実施の形態における文書検索システムの動作を示すフローチャートである。
【符号の説明】
100…個人情報管理サーバ、200…検索サーバ、300−1〜300−n…利用者の所属グループ、110…個人情報管理部、210…検索管理部、220…文書管理部、111…個人情報DB、211…検索管理DB、221…文書DB、212…キーワード一覧表、30…端末機。

Claims (5)

  1. 利用者がキーワードを入力して文書のキーワード検索を行う際、前記利用者の所属するグループを特定し、前記利用者から入力されたキーワードによる前記文書の検索結果を、前記グループ内で過去に使用されたキーワードの使用頻度又は使用頻度から算出された重み付け値に基づいて並び替えることを特徴とする文書検索方法。
  2. 請求項1記載の文書検索方法において、
    前記グループ内で閲覧された文書を優先して並び替えることを特徴とする文書検索方法。
  3. 利用者の所属するグループを含む個人情報を管理し、利用者の認証処理を行う個人情報管理手段と、
    前記利用者からのアクセスにより文書の検索処理を行う検索手段とを備え、
    前記検索手段は、前記利用者がキーワードを入力して文書のキーワード検索を行う際、前記個人情報管理手段の認証情報から前記利用者の所属するグループを特定し、前記利用者から入力されたキーワードによる前記文書の検索結果を、前記グループ内で過去に使用されたキーワードの使用頻度又は使用頻度から算出された重み付け値に基づいて並び替えることを特徴とする文書検索システム。
  4. 請求項3記載の文書検索システムにおいて、
    前記検索手段は、さらに、前記グループ内で閲覧された文書を優先して並び替えることを特徴とする文書検索システム。
  5. 請求項3記載の文書検索システムにおいて、
    前記検索手段は、さらに、前記グループ内で閲覧された文書及びその文書に類似する文書を優先して並び替えることを特徴とする文書検索システム。
JP2003147353A 2003-05-26 2003-05-26 文書検索方法及び文書検索システム Pending JP2004348626A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003147353A JP2004348626A (ja) 2003-05-26 2003-05-26 文書検索方法及び文書検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003147353A JP2004348626A (ja) 2003-05-26 2003-05-26 文書検索方法及び文書検索システム

Publications (1)

Publication Number Publication Date
JP2004348626A true JP2004348626A (ja) 2004-12-09

Family

ID=33533902

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003147353A Pending JP2004348626A (ja) 2003-05-26 2003-05-26 文書検索方法及び文書検索システム

Country Status (1)

Country Link
JP (1) JP2004348626A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100727819B1 (ko) 2006-05-09 2007-06-13 엔에이치엔(주) 두 집단간에 차이를 보이는 검색어를 선별하는 방법 및상기 방법을 수행하는 시스템
JP2010055494A (ja) * 2008-08-29 2010-03-11 Oki Electric Ind Co Ltd 検索分析サーバ装置及び検索分析方法
JP2011141838A (ja) * 2010-01-08 2011-07-21 Fujitsu Ltd 情報処理装置、情報処理プログラム、及び、情報処理方法
JP2013206130A (ja) * 2012-03-28 2013-10-07 Fujitsu Ltd 検索装置、検索方法およびプログラム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09214935A (ja) * 1996-02-02 1997-08-15 Mitsubishi Electric Corp 映像情報提供システム
JPH10254885A (ja) * 1997-03-07 1998-09-25 Canon Inc 文書検索装置及び文書検索方法
JPH11143900A (ja) * 1997-11-11 1999-05-28 Matsushita Electric Ind Co Ltd 情報フィルタ装置及び情報フィルタリング方法
JP2001273326A (ja) * 2000-03-27 2001-10-05 Yamaha Corp 情報抽出方法および嗜好情報作成装置
JP2001344245A (ja) * 2000-03-29 2001-12-14 Fujitsu Ltd 情報処理装置
JP2002230024A (ja) * 2001-02-05 2002-08-16 Ntt Comware Corp 検索方法、文書情報の特性情報を生成する方法、ユーザの嗜好情報を生成する方法、検索装置、文書特性情報生成装置、ユーザ嗜好情報生成装置、記録媒体およびプログラム
JP2003085206A (ja) * 2001-09-06 2003-03-20 Ntt Software Corp 情報検索方法及びシステム及び情報検索プログラム及び情報検索プログラムを格納した記憶媒体

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09214935A (ja) * 1996-02-02 1997-08-15 Mitsubishi Electric Corp 映像情報提供システム
JPH10254885A (ja) * 1997-03-07 1998-09-25 Canon Inc 文書検索装置及び文書検索方法
JPH11143900A (ja) * 1997-11-11 1999-05-28 Matsushita Electric Ind Co Ltd 情報フィルタ装置及び情報フィルタリング方法
JP2001273326A (ja) * 2000-03-27 2001-10-05 Yamaha Corp 情報抽出方法および嗜好情報作成装置
JP2001344245A (ja) * 2000-03-29 2001-12-14 Fujitsu Ltd 情報処理装置
JP2002230024A (ja) * 2001-02-05 2002-08-16 Ntt Comware Corp 検索方法、文書情報の特性情報を生成する方法、ユーザの嗜好情報を生成する方法、検索装置、文書特性情報生成装置、ユーザ嗜好情報生成装置、記録媒体およびプログラム
JP2003085206A (ja) * 2001-09-06 2003-03-20 Ntt Software Corp 情報検索方法及びシステム及び情報検索プログラム及び情報検索プログラムを格納した記憶媒体

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100727819B1 (ko) 2006-05-09 2007-06-13 엔에이치엔(주) 두 집단간에 차이를 보이는 검색어를 선별하는 방법 및상기 방법을 수행하는 시스템
US7958118B2 (en) 2006-05-09 2011-06-07 Nhn Corporation Method for retrieving keyword showing difference between two groups and system for executing the method
JP2010055494A (ja) * 2008-08-29 2010-03-11 Oki Electric Ind Co Ltd 検索分析サーバ装置及び検索分析方法
JP2011141838A (ja) * 2010-01-08 2011-07-21 Fujitsu Ltd 情報処理装置、情報処理プログラム、及び、情報処理方法
JP2013206130A (ja) * 2012-03-28 2013-10-07 Fujitsu Ltd 検索装置、検索方法およびプログラム

Similar Documents

Publication Publication Date Title
JP5328896B2 (ja) ソーシャルネットワークを活用したクエリーの絞込みおよび提案
CN103377200B (zh) 用户偏好信息采集方法和装置
US8380721B2 (en) System and method for context-based knowledge search, tagging, collaboration, management, and advertisement
US20030074409A1 (en) Method and apparatus for generating a user interest profile
WO2007059096A2 (en) System for dynamic product summary based on consumer-contributed keywords
JP2004213675A (ja) 構造化ドキュメントの検索
JPH1115840A (ja) 情報提示支援方法、情報提示支援システム、記録媒体
JP4371382B2 (ja) アクセス対象情報検索装置
JPH10260955A (ja) 情報収集装置、情報評価装置、情報処理システム、情報収集方法、情報評価方法及び情報処理方法
CN103744887B (zh) 一种用于人物搜索的方法、装置和计算机设备
JP2008234550A (ja) 専門家情報検索装置、専門家情報検索方法およびプログラム。
US7827175B2 (en) Framework reactive search facility
JP2005107688A (ja) 情報表示方法及びシステム及び情報表示プログラム
JPWO2009014058A1 (ja) 知識発見支援システム、方法、及び、プログラム
JPH11282875A (ja) 情報フィルタリング装置
JP2007034772A (ja) Webサイト検索結果の最適表示システム及びその装置及びその方法及びそのプログラム
Perugini et al. A connection-centric survey of recommender systems research
JP2004078689A (ja) 検索システム及び検索プログラム並びに検索方法
JP2004348626A (ja) 文書検索方法及び文書検索システム
US20140095465A1 (en) Method and apparatus for determining rank of web pages based upon past content portion selections
CN106021602A (zh) 一种搜索结果排序的方法及装置
CN103514237B (zh) 一种获取用户和文档个性化特征的方法和系统
US20140149378A1 (en) Method and apparatus for determining rank of web pages based upon past content portion selections
WO2002041182A1 (fr) Systeme et procede de distribution de nouvelles interessantes
JP2004030428A (ja) 情報サービス検索支援装置、情報サービス検索装置、情報サービス検索方法及び情報サービス検索プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051104

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081125

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090126

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090428