JP2010244187A - 文書検索システムおよび方法 - Google Patents

文書検索システムおよび方法 Download PDF

Info

Publication number
JP2010244187A
JP2010244187A JP2009090130A JP2009090130A JP2010244187A JP 2010244187 A JP2010244187 A JP 2010244187A JP 2009090130 A JP2009090130 A JP 2009090130A JP 2009090130 A JP2009090130 A JP 2009090130A JP 2010244187 A JP2010244187 A JP 2010244187A
Authority
JP
Japan
Prior art keywords
group
document
user
keyword
priority
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009090130A
Other languages
English (en)
Inventor
Yojiro Tagawa
陽次郎 田川
Kazuhiko Nakashita
和彦 中下
Noritaka Nishimura
法貴 西村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2009090130A priority Critical patent/JP2010244187A/ja
Publication of JP2010244187A publication Critical patent/JP2010244187A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】 類似性が高い他の利用者の文書検索状況および閲覧状況を検索結果に反映し、利用者が最近必要としている情報を効率的に検索することができる文書検索システムを提供する。
【解決手段】 文書検索サーバ100により、利用者がキーワードを入力して文書のキーワード検索を行う際、利用者の認証情報から利用者の所属グループを特定し、利用者から入力されたキーワードによる文書の検索結果を、利用者の所属グループおよび前記所属グループの類似グループ内における、キーワードの使用回数と、キーワードの使用時期と、キーワードの使用グループと利用者の所属グループとの類似度と、文書の閲覧回数と、文書の閲覧時期と、文書の閲覧グループと利用者の所属グループとの類似度と、に基づいて算出された重み付け値に基づいて並び替える。
【選択図】 図1

Description

本発明は、文書を検索する文書検索方法および文書検索システムに関し、検索を行う利用者と類似性が高い他の利用者の文書検索状況や閲覧状況を検索結果に反映し、利用者が必要としている情報を優先的に表示する技術に関する。
従来、共有化された膨大な量の文書の中から、利用者が必要としている情報を検索する文書検索システムとして、キーワードを用いて検索するものが一般的である。
そして、効率的にキーワード検索を行うために、利用者をグループ分けし、利用者の所属グループ内で過去に使用された、キーワードの使用頻度および文書の閲覧頻度から算出された重み付け値に基づいて検索結果を並び替えるものがあった(例えば、特許文献1参照)。
特開2004−348626号公報
上述した従来の文書検索システムでは、検索を行う利用者が所属するグループ内の文書の検索状況と閲覧状況により文書の重み付けを行うため、新設されたグループや利用者が少ないグループなど、過去の検索行為と閲覧行為の蓄積がない場合は、前記利用者が必要としている文書を効率的に検索できないという問題があった。
また、過去に使用されたキーワードの使用回数と文書の閲覧回数により優先度重み付けを行うため、過去に多数利用されたが最近利用されなくなった「枯れたキーワード」および「枯れた文書」の優先度が高いままになってしまい、前記利用者が最近必要性の高まっている文書を効率的に検索できないという問題があった。
本発明は、上記に鑑みてなされたもので、その目的とするところは、検索を行う利用者との類似性が高い他の利用者の文書検索状況および閲覧状況を検索結果に反映し、利用者が最近必要としている情報を効率的に検索することができる文書検索システムを提供することにある。
本発明による文書検索システムは、
利用者の所属するグループを含む個人情報を管理する利用者情報管理手段と、
前記個人情報に基づいて利用者の認証処理を行う認証手段と、
グループ間の類似度を含むグループ情報を管理するグループ情報管理手段と、
利用者の所属グループおよび類似グループ内で過去に使用されたキーワードの使用時期と、使用回数と、使用グループと利用者の所属グループとの類似度と、に基づいて、グループ別にキーワードの重み付けを行うグループ別キーワード重み付け手段と、
文書内のキーワードの出現回数と前記グループ別キーワードの重み付けに基づいてグループ別にキーワード評価による文書の優先度を算出するグループ別キーワード評価文書優先度算出手段と、
利用者の所属グループおよび類似グループ内で過去に閲覧された文書の閲覧時期と、閲覧回数と、閲覧グループと利用者の所属グループとの類似度と、に基づいて、グループ別に閲覧状況評価による文書の優先度を算出するグループ別閲覧状況評価文書優先度算出手段と、
前記グループ別キーワード評価文書優先度と前記グループ別閲覧状況評価文書優先度に基づいてグループ別に文書優先度を算出するグループ別文書優先度算出手段と、
利用者からのアクセスにより文書の検索を行う文書検索手段を備え、
前記文書検索手段は、利用者から入力されたキーワードによる文書の検索結果を、前記グループ別文書優先度算出手段によって算出された、利用者の所属グループにおける文書優先度に基づいて並び替えて表示するものである。
本発明によれば、検索を行う利用者と類似性が高い他の利用者の文書検索状況や閲覧状況を検索結果に反映し、利用者が最近必要としている情報を効率的に検索することが可能となる。
本発明による一実施の形態における文書検索システムのブロック構成を示すブロック図である。 本発明による一実施の形態における利用者情報DBの構造の一例である。 本発明による一実施の形態におけるグループ情報DBの構造の一例である。 本発明による一実施の形態における利用者所属グループDBの構造の一例である。 本発明による一実施の形態におけるグループ間類似度DBの構造の一例である。 本発明による一実施の形態における文書管理情報DBの一例である。 本発明による一実施の形態における文書内キーワード出現回数DBの構造の一例である。 本発明による一実施の形態におけるキーワード使用履歴DBの構造の一例である。 本発明による一実施の形態における文書閲覧履歴DBの構造の一例である。 本発明による一実施の形態におけるグループ別キーワード重み付けDBの構造の一例である。 本発明による一実施の形態におけるグループ別キーワード評価文書優先度DBの一例である。 本発明による一実施の形態におけるグループ別文書閲覧状況評価文書優先度DBの構造の一例である。 本発明による一実施の形態におけるグループ別文書優先度DBの構造の一例である。 本発明による一実施の形態における文書検索システムの検索動作に関するフローチャートである。 本発明による一実施の形態における文書検索システムのデータフロー図である。 本発明による一実施の形態におけるグループ間類似度の算出式の一例である。 本発明による一実施の形態におけるキーワード重み付け値の算出式の一例である。 本発明による一実施の形態におけるキーワード重み付け値の算出式の一例である。 本発明による一実施の形態におけるキーワード評価文書優先度の算出式の一例である。 本発明による一実施の形態における閲覧状況評価文書優先度の算出式の一例である。 本発明による一実施の形態における閲覧状況評価文書優先度の算出式の一例である。 本発明による一実施の形態における文書優先度の算出式の一例である。 本発明による一実施の形態における文書検索システムの画面遷移図である。 本発明による一実施の形態におけるログイン画面の一例である。 本発明による一実施の形態におけるメニュー画面の一例である。 本発明による一実施の形態における文書検索画面の一例である。 本発明による一実施の形態における文書閲覧画面の一例である。 本発明による一実施の形態における文書一覧画面の一例である。 本発明による一実施の形態における文書登録画面の一例である。 本発明による一実施の形態におけるグループ一覧画面の一例である。 本発明による一実施の形態におけるグループ登録画面の一例である。 本発明による一実施の形態における利用者一覧画面の一例である。 本発明による一実施の形態における利用者登録画面の一例である。
(実施例1)
以下に本発明の実施の形態を、図面に基づいて説明する。
図1は本発明の一実施の形態における文書検索システムの構成を示すブロック図である。
図において、文書検索システムは、文書検索サーバ100、利用者端末400から構成され、文書検索サーバ100と利用者端末400はそれぞれイントラネット200を介して接続されている。
なお、利用者端末400はイントラネット200を介して接続するのではなく、インターネットなど他のネットワークにより接続してもよい。
利用者端末400は利用者の所属するグループ300によりグループ分けされている。なお、利用者端末400は利用者の所属するグループ300によりグループ分けされるので、どのグループの利用者端末400としても利用され得る。また、利用者は利用者端末400上のウェブブラウザを介して、文書検索サーバ100からの応答を画面に表示することが可能である。
利用者情報管理部110は、利用者の所属グループを含む利用者情報とグループ間の類似度を含むグループ情報を管理し、利用者情報DB111、利用者所属グループDB112、グループ情報DB113、グループ間類似度DB114を有している。
文書管理部120は、文書に関する情報を管理し、文書DB121、文書管理情報DB122、文書内キーワード出現回数DB123を有している。なお、文書DB121は文書ファイルを階層型ディレクトリ構造で格納することができる。
検索管理部130は、利用者からのアクセスにより文書の検索処理を行い、キーワード使用履歴DB131、文書閲覧履歴DB132、グループ別キーワード重み付けDB133、グループ別キーワード評価文書優先度DB134、グループ別閲覧状況評価文書優先度DB135、グループ別文書優先度DB136を有している。
バッチプログラム140は、利用者からのアクセスが少ない時間帯に定期的に実行される処理であり、グループ間類似度DB114、グループ別キーワード重み付けDB133、グループ別キーワード評価文書優先度DB134、グループ別閲覧状況評価文書優先度DB135、グループ別文書優先度DB136の情報を作成または更新するものである。
なお、これらの情報を、利用者からの検索要求を文書検索サーバ100が受け取ったタイミングで作成または更新してもよいが、登録されている文書数が増大すると計算量が膨大な量になり、検索効率が落ちる可能性がある。よって、本実施例では、バッチプログラム140によって定期的に作成または更新する方法を採用することにする。
次に、本発明の一実施の形態における文書検索システムの、各DBの構造の一例について説明する。
図2は利用者情報DB111の構造の一例を示す図である。図に示すとおり、利用者ID1111、氏名1112、パスワード1113で構成される。この利用者情報DB111の情報により、利用者ID1111とパスワード1113による利用者認証処理を行う。
図3は利用者所属グループDB112の構造の一例を示す図である。図に示すとおり、利用者ID1121、所属グループID1122で構成される。この利用者所属グループDB112の情報により、利用者が所属するグループを特定することができる。
図4はグループ情報DB113の構造の一例を示す図である。図に示すとおり、グループID1131、グループ名1132で構成される。
図5はグループ間類似度DB114の構造の一例を示す図である。図に示すとおり、グループID1141、類似グループID1142、設定方法1143、類似度1144で構成される。このグループ間類似度DB114の情報により、グループ間の類似度を得ることができる。
なお、設定方法1143には「手動」と「自動」の2種類の値を設定することができ、「手動」が設定されている場合は、利用者が定数を類似度1144に設定する。また、設定方法1143に「自動」の値が設定されている場合は、定期的に実行されるバッチプログラム140によって、「自動」が設定されたグループ間における検索に使用されるキーワードの類似性に基づいて、類似度1144が設定される。
図6は文書管理情報DB122の構造の一例を示す図である。図に示すとおり、文書ID1221、文書名1222、格納場所1223で構成される。この文書管理情報DB122の情報により、文書DB121内に格納されている文書ファイルの格納場所を得ることができる。
図7は文書内キーワード出現回数DB123の構造の一例を示す図である。図に示すとおり、文書ID1231、キーワード1232、出現回数1233で構成される。この文書内キーワード出現回数DB123の情報により、文書内にどのキーワードが何回出現するかの情報を得ることができる。なお、この文書内キーワード出現回数DB123の情報は、文書登録時に作成される。
図8はキーワード使用履歴DB131の構造の一例を示す図である。図に示すとおり、使用日時1311、使用グループID1312、キーワード1313で構成される。このキーワード使用履歴DB131の情報により、いつ、どのグループが、どのキーワードを使用して検索を行ったかの情報を得ることができる。なお、このキーワード使用履歴DB131の情報は、利用者がキーワード検索を行った際に追加される。
図9は文書閲覧履歴DB132の構造の一例を示す図である。図に示すとおり、閲覧日時1321、閲覧グループID1322、閲覧文書ID1323で構成される。この文書閲覧履歴DB132の情報により、いつ、どのグループが、どの文書を閲覧したかの情報を得ることができる。なお、この文書閲覧履歴DB132の情報は、利用者が文書を閲覧した際に追加される。
図10はグループ別キーワード重み付けDB133の構造の一例を示す図である。図に示すとおり、グループID1331、キーワード1332、重み付け1333で構成される。このグループ別キーワード重み付けDB133の情報により、グループ別のキーワードの重み付けを得ることができる。なお、グループ別キーワード重み付けDB133の情報は、定期的に実行されるバッチプログラム140によって作成される。
図11はグループ別キーワード評価文書優先度DB134の構造の一例を示す図である。図に示すとおり、グループID1341、文書ID1342、文書優先度1343で構成される。このグループ別キーワード評価文書優先度DB134の情報により、グループ別のキーワード評価による文書優先度を得ることができる。なお、グループ別キーワード評価文書優先度DB133の情報は、定期的に実行されるバッチプログラム140によって作成される。
図12はグループ別閲覧状況評価文書優先度DB135の構造の一例を示す図である。図に示すとおり、グループID1351、文書ID1352、文書優先度1353で構成される。このグループ別閲覧状況評価文書優先度DB135の情報により、グループ別の文書閲覧状況評価による文書優先度を得ることができる。なお、グループ別閲覧状況評価文書優先度DB135の情報は、定期的に実行されるバッチプログラム140によって作成される。
図13はグループ別文書優先度DB136の構造の一例を示す図である。図に示すとおり、文書検索システムの利用者グループのグループID1361、文書ID1362、文書優先度1363で構成される。このグループ別文書優先度DB136の情報により、グループ別の文書優先度を得ることができる。なお、グループ別文書優先度DB136の情報は、定期的に実行されるバッチプログラム140によって作成される。
次に、本発明の一実施の形態における文書検索システムの動作について説明する。
図14は前記文書検索システムにおける文書検索方法の動作を示すフローチャートである。
まず、利用者が、利用者端末400上のウェブブラウザから、利用者IDおよびパスワードを入力する。(S101)。
次に、文書検索サーバ100は、前記入力された利用者IDおよびパスワードより、利用者情報DB111の情報に基づいて認証を行う(S102)。
次に、前記認証した利用者の所属グループを、利用者所属グループDB112の情報から取得する(S103)。
次に、利用者がウェブブラウザ上から、前記所属グループの中から、検索処理内で文書優先度の重み付けの基準となる基準グループを指定した上で、キーワードによる文書検索を行う(S104)。
次に、文書検索サーバ100は、前記検索キーワードの使用履歴情報をキーワード使用履歴DB131に追加する(S105)。
次に、文書検索サーバ100は、前記検索キーワードによる検索結果を、グループ別文書優先度DB136から得られる前記基準グループにおける文書優先度の降順となるように表示順序を並べ替える(S106)。
次に、文書検索サーバ100は、ウェブブラウザ上に前記並び替えを行った検索結果を表示する(S107)。
次に、利用者がウェブブラウザ上で前記検索結果の中から必要とする文書を選択し、文書の内容を閲覧する(S108)。
次に、文書検索サーバ100は、利用者が閲覧した文書の閲覧履歴情報を、文書閲覧履歴DB132に追加する(S109)。
ここで、利用者が検索終了の操作を行った場合はウェブブラウザを終了し、検索終了となる。検索を続行する場合は、S104〜S110の処理を繰り返す(S110)。
図15は本発明の一実施の形態における文書検索システムのデータフロー図である。
文書登録手段31では、利用者端末400上の文書20を、文書ファイルとして文書DB121に格納し、文書IDと、文書ファイル名および文書ファイルの格納先ディレクトリ情報との対応を、文書管理情報DB122に記録する。また、文書の内容からキーワードとキーワードの出現回数を取得し、文書内キーワード出現回数DB123に格納する。
文書検索手段32では、文書優先度の重み付けの基準となる基準グループと検索キーワードを利用者10から受け取り、該検索キーワードによる文書の検索結果を、グループ別文書優先度DB136の内容から得られる前記基準グループにおける文書優先度に基づいて並び替えて、前記利用者10に返却する。また、該検索キーワードの使用日付と使用グループをキーワード使用履歴DB131に格納する。
文書閲覧手段33では、利用者10からの文書閲覧要求と共に文書IDを受け取り、文書管理情報DB122の情報に照らし合わせて、文書DB121における文書ファイル名と格納先ディレクトリ情報を取得する。そして、文書DB121から利用者から閲覧要求のあった文書ファイルを取り出し、利用者にその内容を返却する。また、文書の閲覧日付と閲覧グループと閲覧文書IDを文書閲覧履歴DB132に格納する。
利用者認証手段41では、利用者10から利用者IDとパスワードを受け取り、利用者情報DB111の内容に基づいて認証を行う。
利用者情報管理手段42では、利用者10から所属グループを含む利用者情報を受け取り、利用者情報DB111および利用者所属グループDB112に格納する。
グループ情報管理手段43では、利用者10から類似グループおよび類似グループとの類似度を含むグループ情報を受け取り、グループ情報DB113およびグループ間類似度DB114に格納する。また、キーワード使用履歴DB131の内容より、類似グループとの検索キーワードの類似性に基づいて、類似グループとの類似度を算出して格納することもできる。なお、算出方法の詳細は後述するバッチプログラム140の説明で示す。
キーワード重み付け手段51では、キーワード使用履歴DB131より得られるキーワードの使用日付と、使用回数と、キーワードの使用グループと、グループ間類似度DB114より得られる、グループ間の類似度と、に基づいて、グループ別にキーワードの重み付け値を算出し、グループ別のキーワードの重み付け値をグループ別キーワード重み付けDB133に格納する。なお、算出方法の詳細は後述するバッチプログラム140の説明で示す。
キーワード評価文書優先度取得手段52では、グループ別キーワード重み付けDB133から得られるグループ別のキーワードの重み付け値と、文書内キーワード出現回数DBから得られる文書中に出現するキーワードとキーワードの出現回数に基づいて、グループ別にキーワード評価による文書優先度を算出し、グループ別キーワード評価文書優先度DB134に格納する。なお、算出方法の詳細は後述するバッチプログラム140の説明で示す。
閲覧状況評価文書優先度取得手段53では、文書閲覧履歴DB132より得られる、文書の閲覧日付と、閲覧回数と、文書の閲覧グループと、グループ間類似度DB114より得られる、グループ間の類似度と、に基づいて、グループ別に文書閲覧状況評価による文書優先度を算出し、グループ別閲覧状況評価文書優先度DB135に格納する。なお、算出方法の詳細は後述するバッチプログラム140の説明で示す。
文書優先度取得手段54では、グループ別キーワード評価文書優先度DB134より得られるグループ別のキーワード評価による文書優先度と、グループ別閲覧状況評価文書優先度DB135より得られるグループ別の文書閲覧状況評価による文書優先度に基づいて、グループ別に文書優先度を算出し、文書優先度DB136に格納する。なお、算出方法の詳細は後述するバッチプログラム140の説明で示す。
次に、バッチプログラム140の処理の一例について説明する。
まず、バッチプログラム140は、グループ間類似度DB114で類似度設定方法が「自動」に設定されている情報に対して、検索に使用するキーワードの類似性に基づいてグループ間類似度を算出して設定する処理を実行する(グループ情報管理手段43)。以下、具体的な算出方法の一例を説明する。
まず、グループ間類似度DB114で類似度設定方法が「自動」に設定されている情報について、グループID1141に設定されているグループをg、類似グループIDに設定されているグループをg、類似度評価キーワード数をCと表した場合、キーワード使用履歴DB131の内容より、グループgで多く利用されているキーワードの中から上位C個取り出した集合をK、同様にグループgで多く利用されているキーワードの中から上位C個取り出した集合をKとする。
ここで、類似度評価キーワード数Cは文書検索システムに予め設定されている正の整数である。
キーワード集合Kとキーワード集合Kで一致したキーワードの個数をmとすると、グループgと類似グループg間の類似度Sim(g,g)は(1)式で表される(ただし、グループgまたはグループgで利用されているキーワードの個数がCに満たない場合は、類似度を0とする)。
この類似度Sim(g,g)をグループ間類似度DB114で類似度設定方法が「自動」に設定されている全ての情報に対して設定する。
次に、バッチプログラム140は、グループ別キーワード重み付けDB133の情報を作成する処理を実行する(キーワード重み付け手段51)。以下、具体的な算出方法の一例を説明する。
まず、キーワード使用履歴DB131に格納されている情報をキーワード1313別に抽出する。あるキーワードkの使用履歴がHK1…HKnのn個ある場合、使用日付1311とバッチプログラム140が実行された日付の差によって算出される、ある履歴HKiの経過日数をDay(HKi)、履歴有効日数をDで表すとすると、時間経過による減衰率Dec(HKi)は(2)式で表される(ただし、解が0より小さい場合は0とする)。
ここで、履歴有効日数Dは文書検索システムに予め設定されている正の整数で、履歴情報が記録されてから履歴有効日数Dが経過すると、その履歴情報はキーワード重み付けの材料として意味を持たなくなるといった定数である。
更に、グループ間類似度DB114の情報から取得できる、履歴HKiのキーワード使用グループとグループgの類似度をSim(g,HKi)で表すとすると(ただし、履歴HKiのキーワード使用グループとグループgが等しい場合は類似度を1とする)、グループgにおけるキーワードkの重み付け値Grav(g,k)は(3)式で表される。
この重み付け値Grav(g,k)を、全てのグループ、キーワードについて算出し、グループ別キーワード重み付けDB133に格納する。
続いて、バッチプログラム140は、グループ別キーワード評価文書優先度DB134の情報を作成する処理を実行する(キーワード評価文書優先度取得手段52)。以下、具体的な算出方法の一例を説明する。
ある文書d中にキーワードがK…Kのn個出現する場合、文書内キーワード出現回数DB123の内容より得られる文書d中のキーワードKの出現回数をCnt(d,K)、グループ別キーワード重み付けDB133の内容より得られるグループgにおけるキーワードKの重み付け値をGrav(g,K)で表すとすると、グループgにおける文書dのキーワード評価文書優先度Key(g,d)は(4)式で表される。
このキーワード評価文書優先度Key(g,d)を全てのグループ、文書について算出し、グループ別キーワード評価文書優先度DB134に格納する。
更に、バッチプログラム140は、グループ別閲覧状況評価文書優先度DB135の情報を作成する処理を実行する(閲覧状況評価文書優先度取得手段53)。以下、具体的な算出方法の一例を説明する。
まず、文書閲覧履歴DB132に格納されている情報を抽出する。ある文書dの閲覧履歴がHD1…HDnのn個ある場合、使用日付1311とバッチプログラム140が実行された日付の差によって算出される、ある履歴HDiの経過日数をDay(HDi)、履歴有効日数をDで表すとすると、時間経過による減衰率Dec(HDi)は(5)式で表される(ただし、解が0より小さい場合は0とする)。
更に、グループ間類似度DB114の情報から取得できる、履歴HDiの文書閲覧グループとグループgの類似度をSim(g,HDi)で表すとすると(ただし、履歴HDiのキーワード使用グループとグループgが等しい場合は類似度を1とする)、グループgにおける文書dの閲覧状況評価優先度Doc(g,d)は(6)式で表される。
この閲覧状況評価文書優先度Doc(g,d)を、全てのグループ、文書について算出し、グループ別閲覧状況評価文書優先度DB135に格納する。
最後に、バッチプログラム140は、文書優先度DB136の情報を作成する処理を実行する(文書優先度取得手段54)。以下、具体的な算出方法の一例を説明する。
グループgにおける文書dについて、キーワード評価文書優先度DB134から得られるキーワード評価文書優先度をKey(g,d)、閲覧状況評価文書優先度DB135から得られる閲覧状況評価文書優先度をDoc(g,d)とすると、文書優先度Prior(g,d)は(7)式で表される。
この文書優先度Prior(g,d)を、全てのグループ、文書について算出し、グループ別文書優先度DB136に格納する。
次に、本発明の一実施の形態における文書検索システムの、各画面の構造の一例について説明する。
図23は、文書検索システムの画面遷移の一例を示す図である。
ログイン画面7000は、利用者IDとパスワードによる利用者認証を行うための画面である。
メニュー画面8000は、利用者が文書検索システムの各機能の中から利用する機能を選択するための画面である。
文書検索画面3000は、文書の検索を行うための画面である。
文書閲覧画面3100は、検索した文書を閲覧するための画面である。
文書一覧画面4000は、文書検索システムに登録されている文書の一覧を表示し、文書の新規登録を行うか、または既に登録されている文書情報の編集を行うかの選択を行う画面である。
文書登録画面4100は、文書の新規登録または既に登録されている文書情報の編集を行う画面である。
グループ一覧画面5000は、文書検索システムに登録されている利用者グループの一覧を表示し、グループの新規登録を行うか、または既に登録されているグループ情報の編集を行うかの選択を行う画面である。
グループ登録画面5100は、グループの新規登録または既に登録されているグループ情報の編集を行う画面である。
利用者一覧画面6000は、文書検索システムに登録されている利用者の一覧を表示し、利用者の新規登録を行うか、または既に登録されている利用者情報の編集を行うかの選択を行う画面である。
利用者登録画面6100は、利用者の新規登録または既に登録されている利用者情報の編集を行う画面である。
図24は、ログイン画面の一例を示す図である。
ログイン画面7000は、利用者ID項目7001、パスワード項目7002、ログインボタン7003を有している。利用者ID項目7001、パスワード項目7002にそれぞれ利用者IDとパスワードを入力してログインボタン7003を押下すると、利用者情報DB111に登録されている情報に対して認証処理を行う。認証処理が完了したら、メニュー画面8000に遷移する。
図25は、メニュー画面の一例を示す図である。
メニュー画面8000は、文書検索ボタン8001、文書登録ボタン8002、グループ登録ボタン8003、利用者登録ボタン8004を有している。文書検索ボタン8001を押下すると、文書検索画面3000に遷移する。文書登録ボタン8002を押下すると、文書一覧画面4000に遷移する。グループ登録ボタン8003を押下すると、グループ一覧画面5000に遷移する。利用者登録ボタン8004を押下すると、利用者一覧画面6000に遷移する。
図26は、文書検索画面の一例を示す図である。
文書検索画面3000は、キーワード項目3001、基準グループ選択項目3002、検索ボタン3003、検索結果文書リスト3004、閲覧ボタン3005、戻るボタン3006を有している。
基準グループ選択項目3002には、利用者が所属するグループがリスト表示される。
キーワード項目3001に検索キーワードを入力し、基準グループ選択項目3002に前記利用者が所属するグループの中から検索結果重み付けの基準とするグループを選択して、検索ボタン3003を押下すると、検索操作を行った日付、基準グループとして検索条件に指定したグループのグループID、キーワードから構成される情報を、キーワード使用履歴DB131に新規履歴情報としてキーワードの個数分格納した後、文書内キーワード出現回数DB123の情報から得られる検索キーワードを含む文書を一覧表示する。
なお、表示順序はグループ別文書優先度DB136の情報から得られる、選択された基準グループにおける文書優先度1362の降順になるように検索結果文書リスト3004に表示する。
閲覧ボタン3005を押下すると、閲覧操作を行った日付、基準グループとして検索条件に指定したグループのグループID、閲覧する文書の文書IDから構成される情報を、文書閲覧履歴DB132に新規履歴情報として格納した後、文書閲覧画面3100に遷移する。戻るボタン3006を押下すると、メニュー画面8000に遷移する。
図27は、文書閲覧画面の一例を示す図である。
文書閲覧画面3100は、文書内容表示エリア3101、戻るボタン3102を有している。文書内容表示エリア3101には文書の内容を表示する。
戻るボタン3102を押下すると、文書検索画面3000に遷移する。
図28は、文書一覧画面の一例を示す図である。
文書一覧画面4000は、文書リスト4001、編集ボタン4002、新規追加ボタン4003、戻るボタン4004を有している。
文書リスト4001には文書管理情報DB122に登録されている全ての文書が一覧表示される。
編集ボタン4002を押下すると、編集モードの文書登録画面4100に遷移する。新規追加ボタン4003を押下すると、新規追加モードの文書登録画面4100に遷移する。戻るボタン4004を押下すると、メニュー画面8000に遷移する。
図29は、文書登録画面の一例を示す図である。
文書登録画面4100は、登録する文書ファイル名項目4101、登録元のサーバ上のパス項目4102、登録ボタン4103、削除ボタン4104、戻るボタン4105を有している。
新規追加モードの場合は各入力項目が空欄であり、編集モードの場合は既に登録されている文書情報の内容が予め表示されている。
登録する文書ファイル名項目4101に文書検索サーバ100に登録する利用者端末400上の文書ファイル名を指定し、登録先のサーバ上のパス項目4102に文書DB121上の格納先ディレクトリを入力して、登録ボタン4103ボタンを押下すると、新規追加モードの場合は自動的に発行した文書IDと共に文書管理情報DB122に追加し、編集モードの場合は文書管理情報DB122に既に格納されている文書情報を更新する。
また、形態素解析システム等の従来技術を利用して登録する文書ファイルの内容からキーワードを抽出し、各文書中のキーワードの出現回数を取得する。そして、文書内キーワード出現回数DB123に新規追加または編集する文書の文書ID、キーワード、キーワードの出現回数から構成される情報を、文書中に出現するキーワードの種類分追加または更新する。
編集モードの際に削除ボタン4104を押下すると、編集対象の文書に関する文書DB121に格納されている文書ファイルおよび文書管理情報DB122に格納されている情報を削除する。なお、新規追加モードの場合は削除ボタン4104が無効化されている。
戻るボタン4105を押下すると、文書一覧画面4000に遷移する。
図30は、グループ一覧画面の一例を示す図である。
グループ一覧画面5000は、グループリスト5001、編集ボタン5002、新規追加ボタン5003、戻るボタン5004を有している。
グループリスト5001にはグループ情報DB113に登録されている全てのグループが一覧表示される。編集ボタン5002を押下すると、編集モードのグループ登録画面5100に遷移する。
新規追加ボタン5003を押下すると、新規追加モードのグループ登録画面5100に遷移する。
戻るボタン5004を押下すると、メニュー画面8000に遷移する。
図31は、グループ登録画面の一例を示す図である。
グループ登録画面5100は、グループ名項目5101、類似グループリスト5102、類似グループ名5103、設定方法項目5104、類似度項目5105、グループ追加ボタン5106、グループ削除ボタン5107、登録ボタン5108、削除ボタン5109、戻るボタン5110を有している。
新規追加モードの場合は各入力項目が空欄であり、編集モードの場合は既に登録されているグループ情報の内容が予め表示されている。
グループ追加ボタン5106を押下することによって、グループ情報DB113に登録されているグループの中から任意のグループを選択して、類似グループリストに追加することができる。
類似グループリストに設定されている類似グループの中から任意のグループを選択して、グループ削除ボタン5106を押下することによって、類似グループリストからグループを削除することができる。
類似グループリスト5102内のグループ名項目5103、設定方法項目5104、類似度項目5105を入力して、登録ボタン5108ボタンを押下すると、新規追加モードの場合は自動的に発行したグループIDと共に、入力情報をグループ情報DB113およびグループ間類似度DB114に追加し、編集モードの場合は、編集対象のグループに関する、グループ情報DB113およびグループ間類似度DB114に既に格納されているグループ情報を更新する。
なお、類似グループリスト5102内で設定方法項目5104に「自動」が選択されている類似グループとの類似度は、前述のグループ情報管理手段43のグループ間類似度算出方法と同様に算出してグループ間類似度DB114に設定する。
編集モードの際に削除ボタン5109を押下すると、編集対象のグループに関するグループ情報DB113およびグループ間類似度DB114に格納されている情報を削除する。なお、新規追加モードの場合は削除ボタン5109が無効化されている。
戻るボタン5110を押下すると、グループ一覧画面5000に遷移する。
図32は、利用者一覧画面の一例を示す図である。
利用者一覧画面6000は、利用者リスト6001、編集ボタン6002、新規追加ボタン6003、戻るボタン6004を有している。
利用者リスト6001には利用者情報DB111に登録されている全ての利用者が一覧表示される。
編集ボタン6002を押下すると、編集モードの利用者登録画面6100に遷移する。
新規追加ボタン6003を押下すると、新規追加モードの利用者登録画面6100に遷移する。
戻るボタン6004を押下すると、メニュー画面8000に遷移する。
図33は、利用者登録画面の一例を示す図である。
利用者登録画面6100は、氏名項目6101、パスワード項目6102、所属グループリスト6103、グループ追加ボタン6104、グループ削除ボタン6105、登録ボタン6106、削除ボタン6107、戻るボタン6108を有している。
新規追加モードの場合は各入力項目が空欄であり、編集モードの場合は既に登録されている利用者情報の内容が予め表示されている。
グループ追加ボタン6104を押下することによって、グループ情報DB113に登録されているグループの中から任意のグループを選択して、所属グループリストに追加することができる。
所属グループリストに設定されているグループの中から任意のグループを選択して、グループ削除ボタン6105を押下することによって、所属グループリストからグループを削除することができる。
グループ名項目6101にグループの名称、パスワード項目6102にパスワード、所属グループリスト6103に所属グループを設定して、登録ボタン6106を押下すると、新規追加モードの場合は自動的に発行した利用者IDと共に、利用者グループ情報DB111に追加し、編集モードの場合は利用者情報DB111に既に格納されている文書情報を更新する。
編集モードの際に削除ボタン6107を押下すると、編集対象の利用者情報に関する利用者情報DB113に格納されている情報を削除する。なお、新規追加モードの場合は削除ボタン6107が無効化されている。
戻るボタン6108を押下すると、利用者一覧画面6000に遷移する。
100 文書検索サーバ
110 利用者情報管理部
111 利用者情報DB
112 利用者所属グループDB
113 グループ情報DB
114 グループ間類似度DB
120 文書管理部
121 文書DB
122 文書管理情報DB
123 文書内キーワード出現回数DB
130 検索管理部
131 キーワード使用履歴DB
132 文書閲覧履歴DB
133 グループ別キーワード重み付けDB
134 グループ別キーワード評価文書優先度DB
135 グループ別閲覧状況評価文書優先度DB
136 グループ別文書優先度DB
140 バッチプログラム
200 イントラネット
300 利用者の所属グループ
400 利用者端末
3000 文書検索画面
3100 文書閲覧画面
4000 文書一覧画面
4100 文書登録画面
5000 グループ一覧画面
5100 グループ登録画面
6000 利用者一覧画面
6100 利用者登録画面
7000 ログイン画面
8000 メニュー画面

Claims (5)

  1. 利用者の所属するグループを含む個人情報を管理する利用者情報管理手段と、
    前記個人情報に基づいて利用者の認証処理を行う認証手段と、
    グループ間の類似度を含むグループ情報を管理するグループ情報管理手段と、
    利用者の所属グループおよび類似グループ内で過去に使用されたキーワードの使用時期と、使用回数と、使用グループと利用者の所属グループとの類似度と、に基づいて、グループ別にキーワードの重み付けを行うグループ別キーワード重み付け手段と、
    文書内のキーワードの出現回数と前記グループ別キーワードの重み付けに基づいてグループ別にキーワード評価による文書の優先度を算出するグループ別キーワード評価文書優先度算出手段と、
    利用者の所属グループおよび類似グループ内で過去に閲覧された文書の閲覧時期と、閲覧回数と、閲覧グループと利用者の所属グループとの類似度と、に基づいて、グループ別に閲覧状況評価による文書の優先度を算出するグループ別閲覧状況評価文書優先度算出手段と、
    前記グループ別キーワード評価文書優先度と前記グループ別閲覧状況評価文書優先度に基づいてグループ別に文書優先度を算出するグループ別文書優先度算出手段と、
    利用者からのアクセスにより文書の検索を行う文書検索手段を備え、
    前記文書検索手段は、利用者から入力されたキーワードによる文書の検索結果を、前記グループ別文書優先度算出手段によって算出された、利用者の所属グループにおける文書優先度に基づいて並び替えて表示することを特徴とする文書検索システム。
  2. 文書を検索する際のキーワードの類似性に基づいてグループ間の類似度を算出することを特徴とする請求項1に記載の文書検索システム。
  3. 管理されている個人情報に基づいて利用者の認証を行うステップと、
    前記認証された利用者の所属グループを求め、該所属グループおよび類似グループ内で過去に使用されたキーワードの、使用時期と、使用回数と、使用グループと利用者の所属グループとの類似度と、に基づいて、グループ別にキーワードの重み付けを行うグループ別キーワード重み付けステップと、
    文書内のキーワードの出現回数と前記グループ別キーワードの重み付けに基づいて、グループ別にキーワード評価による文書の優先度を算出するグループ別キーワード評価文書優先度算出ステップと、
    前記利用者の所属グループおよび類似グループ内で過去に閲覧された文書の、閲覧時期と、閲覧回数と、閲覧グループと利用者の所属グループとの類似度と、に基づいて、グループ別に閲覧状況評価による文書の優先度を算出するグループ別閲覧状況評価文書優先度算出ステップと、
    前記グループ別キーワード評価文書優先度と前記グループ別閲覧状況評価文書優先度に基づいてグループ別に文書優先度を算出するグループ別文書優先度算出ステップと、
    前記利用者によって入力されたキーワードによる文書を検索し、該検索結果を前記グループ別文書優先度算出ステップによって算出された、利用者の所属グループにおける文書優先度に基づいて並び替えて表示する文書検索ステップと、
    を有する事を特徴とするプログラム。
  4. 文書を検索する際のキーワードの類似性に基づいてグループ間の類似度を算出するステップを含むことを特徴とする請求項3に記載のプログラム。
  5. 前記請求項3乃至4のプログラムが格納されたコンピュータ読み取り可能な記憶媒体。
JP2009090130A 2009-04-02 2009-04-02 文書検索システムおよび方法 Pending JP2010244187A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009090130A JP2010244187A (ja) 2009-04-02 2009-04-02 文書検索システムおよび方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009090130A JP2010244187A (ja) 2009-04-02 2009-04-02 文書検索システムおよび方法

Publications (1)

Publication Number Publication Date
JP2010244187A true JP2010244187A (ja) 2010-10-28

Family

ID=43097160

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009090130A Pending JP2010244187A (ja) 2009-04-02 2009-04-02 文書検索システムおよび方法

Country Status (1)

Country Link
JP (1) JP2010244187A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012164059A (ja) * 2011-02-04 2012-08-30 Konica Minolta Business Technologies Inc 文書管理装置、文書管理方法および文書管理プログラム
JP2012212329A (ja) * 2011-03-31 2012-11-01 Tottori Univ テキストデータの冗長性を解析する情報解析装置
JP2018136829A (ja) * 2017-02-23 2018-08-30 日本電信電話株式会社 提示装置及び提示方法
JP2019053525A (ja) * 2017-09-15 2019-04-04 ヤフー株式会社 生成装置、生成方法、及び生成プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012164059A (ja) * 2011-02-04 2012-08-30 Konica Minolta Business Technologies Inc 文書管理装置、文書管理方法および文書管理プログラム
JP2012212329A (ja) * 2011-03-31 2012-11-01 Tottori Univ テキストデータの冗長性を解析する情報解析装置
JP2018136829A (ja) * 2017-02-23 2018-08-30 日本電信電話株式会社 提示装置及び提示方法
JP2019053525A (ja) * 2017-09-15 2019-04-04 ヤフー株式会社 生成装置、生成方法、及び生成プログラム

Similar Documents

Publication Publication Date Title
JP5224868B2 (ja) 情報推薦装置および情報推薦方法
US9576057B2 (en) User interface for navigating a keyword space
US20090228482A1 (en) Network search method, system and device
US20140201204A1 (en) Systems and methods for personalizing aggregated news content
US20070067304A1 (en) Search using changes in prevalence of content items on the web
JP2012524331A (ja) 主題ベースのバイタリティ
JP2010182340A (ja) コンテンツナビゲーションプログラム
JP4939637B2 (ja) 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体
JP2003173280A (ja) データベース生成装置、データベース生成方法及びデータベース生成プログラム
JP2009026249A (ja) 閲覧履歴編集端末及びプログラムおよびその方法
JP2009500764A (ja) 情報価値を反映した情報検索方法及びその装置
CN101432727A (zh) 项目类型特定结构的搜索
JP2010244187A (ja) 文書検索システムおよび方法
US8140525B2 (en) Information processing apparatus, information processing method and computer readable information recording medium
KR20070119394A (ko) 컨텐츠 브라우징 장치 및 방법
JP4955841B2 (ja) 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体
JP2004206492A (ja) ドキュメント表示方法およびそれを用いたリンク先選択機能付ゲートウェイ装置
JP2002149668A (ja) インターネット補助ソフトウェア及び該プログラムを記録した記録媒体
JP2010282402A (ja) 検索システム
KR100720993B1 (ko) 날짜 검색어를 이용한 인터넷 검색 방법
KR100953491B1 (ko) 최신정보 제공 방법 및 시스템
JP2009169519A (ja) 情報提示装置、情報提示方法、および情報提示用プログラム
JP3933407B2 (ja) 文書処理装置、文書処理方法および文書処理プログラムが格納された記憶媒体
JP6275685B2 (ja) Webページ作成処理プログラムおよび電子機器
KR101449994B1 (ko) 사용자 성향에 따른 검색 서비스 제공 방법