JP2006277061A - 知識検索システム、知識検索方法及びプログラム - Google Patents
知識検索システム、知識検索方法及びプログラム Download PDFInfo
- Publication number
- JP2006277061A JP2006277061A JP2005092196A JP2005092196A JP2006277061A JP 2006277061 A JP2006277061 A JP 2006277061A JP 2005092196 A JP2005092196 A JP 2005092196A JP 2005092196 A JP2005092196 A JP 2005092196A JP 2006277061 A JP2006277061 A JP 2006277061A
- Authority
- JP
- Japan
- Prior art keywords
- document
- search
- information
- hit
- documents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】インデックス更新部123は、情報収集部121によって公開情報ソース2から収集された文書情報の示す文書の集合に含まれる文書間の関連性を解析し、当該文書間の関連性を表す関連文書情報をリンクDB111bに格納する。知識検索部112は、ユーザからの知識検索要求に基づいてインデックスDB111aを検索する。この際、知識検索部112はリンクDB111bに格納された関連文書情報を利用して、ヒット文書ごとの検索スコアだけでなく、当該ヒット文書と他の文書との関連性が検索結果順位に反映された検索結果を取得する。ユーザインタフェース13は知識検索部112によって取得された検索結果をユーザ4に提示する。
【選択図】 図1
Description
図1は本発明の一実施形態に係るナレッジマネジメントシステム1の構成を示すブロック図である。このナレッジマネジメントシステム1は、知識情報の収集、分析及び検索等のサービスを提供する、広義の知識検索システムである。ナレッジマネジメントシステム1は、主として、狭義の知識検索システム11と、知識データベース構築システム12と、ユーザインタフェース13とから構成される。
インデックス更新部123は、関係解析部123aと文書解析部123bとを含む。関係解析部123aは、中間データ格納ユニット122に一時的に格納されている情報(中間データ)の中から順に文書(以下、元文書と称する)を取り出して、当該元文書の例えば論理構造を解析する。関係解析部123aはまた、元文書に関連する文書(関連文書)を中間データから取得する。関係解析部123aは、取得された関連文書の情報を関連文書情報としてリンクDB111bに格納する。図2の例では、元文書Mの関連文書が文書Nであることが示されている。関係解析部123aはまた、文書(元文書及び関連文書)の解析結果に従って、当該文書を当該文書の要素(構成要素)に分割する。図2では、文書(元文書)Mが要素M1乃至M3に分割される例が示されている。文書解析部123bは、関係解析部123aによって分割された文書の要素ごとに、その文書のテキストデータを抽出して知識検索用のインデックスを生成する。
まず、本実施形態の知識検索処理で適用される判定手法の概要について説明する。この判定手法は、ユーザからの検索のための問い合わせに従う検索で知識データベース111から取得された文書の内容のユーザにとっての重要さ(つまり内容の「濃さ」)を判定するのに用いられる。以下の説明では、ユーザの問い合わせた条件に合致する程度を表す評価値をスコア(検索スコア)と呼ぶ。
(1)ユーザの問い合わせた条件に合致(ヒット)した文書のスコアを親子間(親文書と子文書との間)で比較することで、子文書の内容の「濃さ」の程度を判定
親文書のスコア > 子文書のスコア
→子文書にはユーザにとってそれほど必要でないインデックスやサマリが記載されている
→子文書の内容の「濃さ」の程度は低い
親文書のスコア < 子文書のスコア
→子文書には親文書よりも詳細なユーザにとって必要な内容が記載されている
→子文書の内容の「濃さ」の程度は高い
(2)どの子文書よりもスコアの低い親文書にはインデックスやサマリが記載されている。
(3)親子で共通してヒットしている文書の群は意味のあるまとまりである。
(4)他から参照されている文書は、単独の文書よりまとまった意味を持つ。
まずユーザ4は、クライアント端末3の入力装置を用いて知識検索のための検索要求を入力するための操作を行ったものとする。すると、この検索要求を示す問い合わせ(クエリ)がクライアント端末3によりナレッジマネジメントシステム1に発行される。このクエリは、キーワードまたは自然文(質問文)で記述することができる。ナレッジマネジメントシステム1内のユーザインタフェース13は、クライアント端末3により発行されたクエリを入力して受け付ける(ステップS11)。
まず知識検索部112は、未処理のヒット文書Djを1つ選択して、当該文書DjのスコアSjと当該文書Djの親文書DpのスコアSpとを比較する(ステップS156a)。もし、Sj<Spである場合、知識検索部112は親文書Dpの方が文書(子文書)Djより重要であると判定して、当該親文書Dpの「重み」を1インクリメントする(ステップS156b)。また知識検索部112は、ヒット文書群から現在処理対象となっている文書(子文書)Djを取り除き、当該文書Djを文書Dpの「関連文書」として保持する(ステップS156c)。
ユーザインタフェース13は、図13に示す検索結果に基づき、図14に示す検索結果一覧画面141の情報を生成してクライアント端末3に送出することで、当該検索結果一覧画面141をクライアント端末3の表示装置に表示させる。この検索結果一覧画面141には、検索された文書(ヒット文書)の識別情報としての例えばタイトルが、検索結果順位の並びで表示される。また、タイトルの近傍には、当該タイトルの文書の識別情報としての当該文書の要約(要旨)が表示される。
ユーザインタフェース13は、図13に示す検索結果に基づき、図14の検索結果一覧画面141と同様の、図15に示す検索結果一覧画面151をクライアント端末3の表示装置に表示させる。タイトルには、当該タイトルの文書に添付されているファイルへのリンクが設定されている。
上記実施形態では、文書間の関連性(親子関係)として、上述のWebサーバから収集される文書群のような一方の文書から他方の文書へのハイパーリンクによる参照関係(第1の関係)、上記他方の文書が上記一方の文書に添付されている添付ファイルである関係(第2の関係)、及び上記一方の文書の構造上上記他方の文書が当該一方の文書に含まれている包含関係(第3の関係)が適用される。しかし、これらの関連性の他に、上記他方の文書が上記一方の文書に圧縮されて添付されているデータが解凍されたものである文書要素の親子関係(第4の関係)を適用することも可能である。また、これら第1乃至第4の関係の少なくとも1つを、文書間の関連性として適用することも可能である。
Claims (12)
- 文書情報から生成された知識検索用のインデックス情報が格納されたインデックスデータベースを対象にユーザからの知識検索要求に基づく検索を実行する知識検索システムにおいて、
前記インデックスデータベースに格納されたインデックス情報の示す文書間の関連性を表す関連文書情報を格納するリンクデータベースと、
公開されている文書情報を収集する情報収集手段と、
前記情報収集手段によって収集された文書情報から、知識検索用のインデックス情報を生成して前記インデックスデータベースに格納するインデックス更新手段であって、前記収集された文書情報の示す文書の集合に含まれる文書間の関連性を解析し、当該文書間の関連性を表す関連文書情報を前記リンクデータベースに格納するインデックス更新手段と、
ユーザからの知識検索要求を入力すると共に、当該知識検索要求に従う知識検索の結果をユーザに提示するユーザインタフェースと、
前記ユーザインタフェースによって入力された知識検索要求に基づいて前記インデックスデータベースを検索することで、文書ごとの検索スコアを取得する知識検索手段であって、少なくとも前記知識検索要求にヒットしたヒット文書について、当該ヒット文書ごとの検索スコアと当該ヒット文書に対応する前記リンクデータベース内の関連文書情報の示す当該ヒット文書と他の文書との関連性とが検索結果順位に反映された検索結果を取得する知識検索手段と
を具備することを特徴とする知識検索システム。 - 前記インデックス更新手段は、
前記情報収集手段によって収集された文書情報の示す文書の各々について、当該文書の構造を解析して当該文書を文書要素ごとに分割し、当該文書を親文書とし、当該分割された文書要素を当該文書の子文書とする前記関連文書情報を生成して前記リンクデータベースに格納する関係解析手段と、
前記関係解析手段によって分割された文書要素ごとに前記インデックス情報を生成する文書解析手段と
を含むことを特徴とする請求項1記載の知識検索システム。 - 前記知識検索手段は、前記ヒット文書ごとに、前記リンクデータベースに格納された関連文書情報に従って親文書が存在するかを判定すると共に、当該親文書が存在する場合には、当該親文書がヒット文書であるかを判定し、当該親文書がヒット文書である場合、ヒット文書の集合に含まれている当該親文書の全ての子文書について、当該子文書及び当該親文書の検索スコアを比較して、当該親文書の検索スコアより低い子文書を前記ヒット文書の集合から削除し、当該全ての子文書のどれよりも検索スコアの低い親文書を前記ヒット文書の集合から削除し、前記ヒット文書の集合に残っているヒット文書について、当該ヒット文書ごとの検索スコアと当該ヒット文書に対応する前記リンクデータベース内の関連文書情報の示す当該文書と他の文書との関連性とが検索結果順位に反映された検索結果を取得することを特徴とする請求項1記載の知識検索システム。
- 前記知識検索手段は、前記子文書及び当該子文書の親文書の検索スコアを比較した結果、前記親文書の方が前記検索スコアが高い場合には、当該親文書と他の文書との前記関連性の度合いを表す当該親文書の重みをインクリメントし、前記子文書の方が前記検索スコアが高い場合には、当該子文書と他の文書との前記関連性の度合いを表す当該子文書の重みをインクリメントし、前記ヒット文書ごとの検索スコアと当該文書の重みとが検索結果順位に反映された検索結果を取得することを特徴とする請求項3記載の知識検索システム。
- 前記インデックス更新手段は、前記文書間の関連性として、一方の文書から他方の文書へのハイパーリンクによる参照関係、前記一方の文書の構造上前記他方の文書が当該一方の文書に含まれている包含関係、前記他方の文書が前記一方の文書に添付されている添付ファイルである関係、及び前記他方の文書が前記一方の文書に圧縮されて添付されているデータが解凍されたものである文書要素の親子関係のうちの少なくとも1つの関係を解析することを特徴とする請求項1記載の知識検索システム。
- 前記ユーザインタフェースは、知識検索要求に従う知識検索の結果を、ヒット文書と当該ヒット文書の検索結果順位とが識別可能な文書一覧の形式でユーザに提示し、前記文書一覧から任意の文書が選択され、かつ当該選択された文書と関連している文書が存在する場合には、当該選択された文書のテキストまたは実体と、当該関連している文書の存在が識別可能でかつユーザにより選択可能な識別情報とをユーザに提示することを特徴とする請求項1記載の知識検索システム。
- 前記ユーザインタフェースは、前記識別情報がユーザによって選択され、かつ当該選択された識別情報によって識別される文書と関連している文書が存在する場合には、当該選択された文書のテキストまたは実体と、当該関連している文書の存在が識別可能でかつユーザにより選択可能な識別情報とをユーザに提示することを特徴とする請求項6記載の知識検索システム。
- 文書情報から生成されたインデックス情報が格納されたインデックスデータベースを対象にユーザからの知識検索要求に基づく検索を行う知識検索方法において、
公開されている文書情報を収集するステップと、
前記収集された文書情報から、知識検索用のインデックス情報を生成して当該インデックス情報を前記インデックスデータベースに格納するステップと、
前記収集された文書情報の示す文書の集合に含まれる文書間の関連性を解析し、当該文書間の関連性を表す関連文書情報をリンクデータベースに格納するステップと、
ユーザからの知識検索要求を入力するステップと、
前記入力された知識検索要求に基づいて前記インデックスデータベースを検索することで、文書ごとの検索スコアを取得するステップと、
少なくとも前記知識検索要求にヒットしたヒット文書について、当該ヒット文書ごとの検索スコアと当該ヒット文書に対応する前記リンクデータベース内の関連文書情報の示す当該ヒット文書と他の文書との関連性とが検索結果順位に反映された検索結果を取得するステップと
を具備することを特徴とする知識検索方法。 - 前記関連文書情報をリンクデータベースに格納するステップは、
前記収集された文書情報の示す文書の各々について、当該文書の構造を解析して当該文書を文書要素ごとに分割するステップと、
当該文書を親文書とし、当該分割された文書要素を当該文書の子文書とする前記関連文書情報を生成して前記リンクデータベースに格納するステップとを含み、
前記インデックス情報をインデックスデータベースに格納するステップは、前記分割された文書要素ごとに前記インデックス情報を生成するステップを含む
ことを特徴とする請求項8記載の知識検索方法。 - 前記検索結果を取得するステップは、
前記ヒット文書ごとに、前記リンクデータベースに格納された関連文書情報に従って親文書が存在するかを判定するステップと、
前記親文書が存在する場合には、当該親文書がヒット文書であるかを判定するステップと、
前記親文書がヒット文書である場合、ヒット文書の集合に含まれている当該親文書の全ての子文書について、当該子文書及び当該親文書の検索スコアを順次比較するステップと、
前記比較の結果、前記子文書の方が前記親文書よりも検索スコアが低い場合、当該子文書をその時点における前記ヒット文書の集合から削除するステップと、
前記全ての子文書についての前記比較の結果、前記親文書の方が当該全ての子文書のどれよりも検索スコアが低い場合、当該親文書をその時点における前記ヒット文書の集合から削除するステップと、
前記ヒット文書ごとの処理が全て終了した段階で前記ヒット文書の集合に残っているヒット文書について、当該ヒット文書ごとの検索スコアと当該ヒット文書に対応する前記リンクデータベース内の関連文書情報の示す当該文書と他の文書との関連性とが検索結果順位に反映された検索結果を取得するステップと
を含むことを特徴とする請求項8記載の知識検索方法。 - 前記検索結果を取得するステップは、
前記比較の結果、前記親文書の方が前記子文書よりも検索スコアが高い場合に、当該親文書と他の文書との前記関連性の度合いを表す当該親文書の重みをインクリメントするステップと、
前記子文書の方が前記親文書より検索スコアが高い場合に、当該子文書と他の文書との前記関連性の度合いを表す当該子文書の重みをインクリメントするステップとを含み、
前記ヒット文書ごとの検索スコアと当該文書の重みとが検索結果順位に反映された検索結果を取得する
ことを特徴とする請求項10記載の知識検索方法。 - 文書情報から生成されたインデックス情報が格納されたインデックスデータベースを対象にユーザからの知識検索要求に基づく検索をコンピュータに実行させるためのプログラムであって、
前記コンピュータに、
公開されている文書情報を収集するステップと、
前記収集された文書情報から、知識検索用のインデックス情報を生成して当該インデックス情報を前記インデックスデータベースに格納するステップと、
前記収集された文書情報の示す文書の集合に含まれる文書間の関連性を解析し、当該文書間の関連性を表す関連文書情報をリンクデータベースに格納するステップと、
ユーザからの知識検索要求を入力するステップと、
前記入力された知識検索要求に基づいて前記インデックスデータベースを検索することで、文書ごとの検索スコアを取得するステップと、
少なくとも前記知識検索要求にヒットしたヒット文書について、当該ヒット文書ごとの検索スコアと当該ヒット文書に対応する前記リンクデータベース内の関連文書情報の示す当該ヒット文書と他の文書との関連性とが検索結果順位に反映された検索結果を取得するステップと
を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005092196A JP4189387B2 (ja) | 2005-03-28 | 2005-03-28 | 知識検索システム、知識検索方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005092196A JP4189387B2 (ja) | 2005-03-28 | 2005-03-28 | 知識検索システム、知識検索方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006277061A true JP2006277061A (ja) | 2006-10-12 |
JP4189387B2 JP4189387B2 (ja) | 2008-12-03 |
Family
ID=37211795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005092196A Expired - Fee Related JP4189387B2 (ja) | 2005-03-28 | 2005-03-28 | 知識検索システム、知識検索方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4189387B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008129821A (ja) * | 2006-11-20 | 2008-06-05 | Canon Inc | 検索システム及び前記システムにおける検索結果の表示方法 |
JP2011039976A (ja) * | 2009-08-18 | 2011-02-24 | Nippon Telegr & Teleph Corp <Ntt> | 文書格納装置及び文書格納プログラム |
JP5522598B1 (ja) * | 2013-08-05 | 2014-06-18 | 求 藤川 | 情報管理システム、情報管理プログラム、情報管理方法、情報管理装置、記録媒体 |
US9767191B2 (en) | 2013-07-23 | 2017-09-19 | International Business Machines Corporation | Group based document retrieval |
-
2005
- 2005-03-28 JP JP2005092196A patent/JP4189387B2/ja not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008129821A (ja) * | 2006-11-20 | 2008-06-05 | Canon Inc | 検索システム及び前記システムにおける検索結果の表示方法 |
JP2011039976A (ja) * | 2009-08-18 | 2011-02-24 | Nippon Telegr & Teleph Corp <Ntt> | 文書格納装置及び文書格納プログラム |
US9767191B2 (en) | 2013-07-23 | 2017-09-19 | International Business Machines Corporation | Group based document retrieval |
JP5522598B1 (ja) * | 2013-08-05 | 2014-06-18 | 求 藤川 | 情報管理システム、情報管理プログラム、情報管理方法、情報管理装置、記録媒体 |
JP2015052811A (ja) * | 2013-08-05 | 2015-03-19 | 求 藤川 | 情報管理システム、情報管理プログラム、情報管理方法、情報管理装置、記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP4189387B2 (ja) | 2008-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4638439B2 (ja) | ウェブ検索の個人化 | |
KR101171405B1 (ko) | 검색 결과에서 배치 내용 정렬의 맞춤화 | |
JP3717808B2 (ja) | 情報検索システム | |
US20090089278A1 (en) | Techniques for keyword extraction from urls using statistical analysis | |
US20040059727A1 (en) | Document information management system | |
US8983965B2 (en) | Document rating calculation system, document rating calculation method and program | |
JP3803961B2 (ja) | データベース生成装置、データベース生成処理方法及びデータベース生成プログラム | |
JP2002215659A (ja) | 情報検索支援方法および情報検索支援システム | |
JP2007256992A (ja) | コンテンツ特定方法及び装置 | |
JP4189387B2 (ja) | 知識検索システム、知識検索方法及びプログラム | |
JP2003271609A (ja) | 情報監視装置及び情報監視方法 | |
KR100616152B1 (ko) | 인터넷상에서 기사를 자동분류하여 타 웹사이트에 자동송출하는 제어방법 | |
US9990444B2 (en) | Apparatus and method for supporting visualization of connection relationship | |
JP4853915B2 (ja) | 検索システム | |
JP4469818B2 (ja) | データ管理装置、データプログラム及びデータ管理方法 | |
JP5127553B2 (ja) | 情報処理装置、情報処理方法、プログラム及び記録媒体 | |
JP2003108584A (ja) | 情報検索システム及びプログラム | |
JP2007012100A (ja) | 人物情報に基づく検索方法および検索装置、あるいは情報提供システム | |
US20150046437A1 (en) | Search Method | |
JP2003186901A (ja) | Webサイト検索方法とシステム、並びに、この方法の実行プログラムとこの方法の実行プログラムを記録した記録媒体 | |
JP2003173351A (ja) | 情報解析、収集、検索方法、装置、プログラム、および記録媒体 | |
JP2004234582A (ja) | 辞書構築方法,システム及び画面 | |
JP4146067B2 (ja) | 文書検索システムおよび文書検索方法 | |
JP5559725B2 (ja) | 複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供方法 | |
JP5525424B2 (ja) | 文書検索装置、文書検索方法及び文書検索プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080530 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080610 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080807 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080909 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080912 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110919 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120919 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120919 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130919 Year of fee payment: 5 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |