JP2005242401A - 文書検索プログラム及び文書検索方法 - Google Patents

文書検索プログラム及び文書検索方法 Download PDF

Info

Publication number
JP2005242401A
JP2005242401A JP2004047168A JP2004047168A JP2005242401A JP 2005242401 A JP2005242401 A JP 2005242401A JP 2004047168 A JP2004047168 A JP 2004047168A JP 2004047168 A JP2004047168 A JP 2004047168A JP 2005242401 A JP2005242401 A JP 2005242401A
Authority
JP
Japan
Prior art keywords
document
search
application
basic
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004047168A
Other languages
English (en)
Inventor
Eiichi Nagahama
栄一 長浜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2004047168A priority Critical patent/JP2005242401A/ja
Publication of JP2005242401A publication Critical patent/JP2005242401A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 引用関係の繋がりが途切れている場合でも、直前に参照した文書に関連する文書を容易に見つけだせるようにする。
【解決手段】 検索条件7aが入力されると、検索手段3により、応用文書データベース2から検索条件に合致する応用文書が検索される。そして、検索結果7bに含まれる応用文書情報7cが検索条件生成手段4に渡されると、検索条件生成手段4により、応用文書と基本文書との特徴キーワードを用いて関連文書検索条件7dが生成される。生成された関連文書検索条件7dが関連文書検索手段5に渡されると、関連文書検索手段5により、関連文書検索条件7dによって応用文書データベース2内の応用文書が検索される。そして、表示手段6により、関連文書検索手段5による検索結果が表示される。
【選択図】 図1

Description

本発明は文書データを検索するための文書検索プログラム及び文書検索方法に関し、特に検索範囲を拡張した文書検索を行うための文書検索プログラム及び文書検索方法に関する。
企業では、過去の業務で使用された膨大な量の文書データがデータベースに保存されている。データベースに保存されている文書データを有効に利用すれば、業務に必要な文書作成の手間を省くことができる。そこで、文書データをデータベースから検索するシステムが利用される。たとえば、顧客にシステム導入を提案する際の提案書の作成者は、既存の使えそうな提案書をデータベースから検索し、それを利用して新たな提案書を作成できる。
なお、文書検索を行う際には、検索条件を満たす文書が大量に検出される場合がある。そこで、検出された文書の中から、検索者が目的の文書を見つけやすく表示する技術が考えられている。
たとえば、文書データベースをキーワードで検索し、検索された各文書に対して検索キー毎の照合度を求める。そして、照合度を元に、検索キーとの照合状況が分かるような表現と文書とを関連付けて一覧表示する。これにより、検索結果からユーザの意図する文書を選択するのが容易となる(たとえば、特許文献1参照)。
また、検索結果から得られる統計情報に基づいて文書のスコアを計算することで、正確な検索文書間のランキングを行い、文書検索の品質を向上させる技術もある(たとえば、特許文献2参照)。
特開2000−172698号公報 特開2002−366547号公報
ところで、文書を作成する際に、他の文書を引用する場合がある。たとえば、コンピュータシステムの導入を顧客に提案する際の提案書では、提案するシステムに採用される発明の特許番号等が引用される。このように、提案するシステムに関連する自社の発明があれば、その発明の特許番号等を提案書に記載することで、商談を有利に進めることができる。そのため、新たな提案書を作成する際にも、自社で出願された発明に関する特許文献のデータベースから、提案する技術に関連する特許文献を検索する作業が必要となる。ただし、特許文献の内容を理解するには高度な技術知識が必要であるため、膨大な量の特許文献から目的の発明を見つけだすには、非常に手間が掛かる。
そこで、関連する特許文献の効率的な検索方法として、過去の商談の際に作成された提案書のデータベースを有効利用することが考えられる。すなわち、顧客に提案するシステムに採用されている技術を示すキーワードによって提案書のデータベースを検索する。検出された提案書で特許文献が引用されていれば、その特許文献に記載された発明が採用されているか否かを検討する。さらに、その特許文献が他の提案書からも引用されていれば、当該他の提案書を参照する。その提案書において、他の特許文献を引用していれば、当該他の特許文献に記載された発明が採用されているか否かを検討する。このように、提案書と特許文献との引用関係を辿っていくことで、関連する特許文献を容易に見つけだすことができる。
しかし、自社が権利を持つ特許文献を引用して、提案を効果的なものにするという作業が、全ての提案書作成者によって守られているとは限らない。したがって、本来、特許文献を引用して提案書を作成すべきだったにもかかわらず、それを行っていない場合も多かった。そのため、引用関係を辿ることで関連する特許文献を見つけ出す方法では、各提案書において関連する特許文献を正しく引用していないと、提案書に記載する特許文献に漏れが生じてしまう。すなわち、提案するシステムで採用する技術で特許が取得されているにも拘わらず、提案書にその特許の存在が主張されない結果を招く。
本発明はこのような点に鑑みてなされたものであり、引用関係の繋がりが途切れている場合でも、直前に参照した文書に関連する文書を容易に見つけだすことができる文書検索プログラム及び文書検索方法を提供することを目的とする。
本発明では上記課題を解決するために、図1に示すような文書検索プログラムが提供される。本発明に係る文書検索プログラムは、文書に対しキーワード検索を行うためのものである。文書検索プログラムを実行するコンピュータは以下の機能を有する。
基本文書データベース1は、基本文書を格納する。応用文書データベース2は、基本文書を引用する記述を含む応用文書を格納する。検索手段3は、検索条件7aが入力されると、応用文書データベース2から検索条件7aに合致する応用文書を検索する。検索条件生成手段4は、応用文書データベース2を参照して検索手段3で検出された応用文書が引用している基本文書を判断し、基本文書データベース1を参照して引用されている基本文書の特徴を示す特徴キーワードを判断し、基本文書の特徴キーワードを用いて関連文書検索条件7dを生成する。関連文書検索手段5は、検索条件生成手段4で生成された関連文書検索条件7dによって応用文書データベース2内の応用文書を検索する。表示手段6は、関連文書検索手段5による検索結果を表示する。
このような文書検索プログラムによれば、検索条件7aが入力されると、検索手段3により、応用文書データベース2から検索条件に合致する応用文書が検索される。次に、検索条件生成手段4により、応用文書データベース2を参照して検索手段3で検出された応用文書が引用している基本文書が判断され、基本文書データベース1を参照して引用されている基本文書の特徴を示す特徴キーワードが判断され、基本文書の特徴キーワードを用いて関連文書検索条件が生成される。さらに、関連文書検索手段5により、検索条件生成手段4で生成された関連文書検索条件によって応用文書データベース2内の応用文書が検索される。そして、表示手段6により、関連文書検索手段5による検索結果が表示される。
また、上記課題を解決するために、文書に対しキーワード検索を行うための文書検索方法において、検索手段が、検索条件が入力されると、基本文書を引用する記述を含む応用文書を格納する応用文書データベースから前記検索条件に合致する前記応用文書を検索し、検索条件生成手段が、前記応用文書データベースを参照して前記検索手段で検出された前記応用文書が引用している前記基本文書を判断し、前記基本文書データベースを参照して引用されている前記基本文書の特徴を示す特徴キーワードを判断し、前記基本文書の前記特徴キーワードを用いて関連文書検索条件を生成し、関連文書検索手段が、前記検索条件生成手段で生成された前記関連文書検索条件によって前記応用文書データベース内の前記応用文書を検索し、表示手段が、前記関連文書検索手段による検索結果を表示する、ことを特徴とする文書検索方法が提供される。
このような文書検索方法によれば、検索条件が入力されると、検索手段により、応用文書データベースから検索条件に合致する応用文書が検索される。次に、検索条件生成手段により、応用文書データベースを参照して検索手段で検出された応用文書が引用している基本文書が判断され、基本文書データベースを参照して引用されている基本文書の特徴を示す特徴キーワードが判断され、基本文書の特徴キーワードを用いて関連文書検索条件が生成される。さらに、関連文書検索手段により、検索条件生成手段で生成された関連文書検索条件によって応用文書データベース内の応用文書が検索される。そして、表示手段により、関連文書検索手段による検索結果が表示される。
以上説明したように本発明では、検出された応用文書が引用している基本文書の特徴キーワードで応用文書を再度検索し、それを関連文書として表示するようにした。これにより、検出された応用文書に関連する他の応用文書を容易に見つけだすことが可能となる。
以下、本発明の実施の形態を図面を参照して説明する。
まず、実施の形態に適用される発明の概要について説明し、その後、実施の形態の具体的な内容を説明する。
図1は、実施の形態に適用される発明の概念図である。基本文書データベース1は、基本文書を格納する。応用文書データベース2は、基本文書を引用する記述を含む応用文書を格納する。
検索手段3は、検索条件7aが入力されると、応用文書データベース2から検索条件7aに合致する応用文書を検索する。これにより、検索結果7bとして、検索条件7aを満たす応用文書を示す応用文書情報のリストが得られる。検索結果7bは、表示手段6に渡される。また、検索結果7bのうち、関連文書の検索を行う応用文書の応用文書情報7cが検索条件生成手段4に渡される。どの応用文書に対する関連文書検索を行うのかは、たとえば、ユーザからの操作入力によって指定される。
検索条件生成手段4は、応用文書情報7cで示される応用文書に対応する関連文書検索条件7dを生成する。具体的には、検索条件生成手段4は、応用文書データベース2を参照して検索手段3で検出された応用文書が引用している基本文書を判断する。次に、検索条件生成手段4は、基本文書データベース1を参照して引用されている基本文書の特徴を示す特徴キーワードを判断する。そして、検索条件生成手段4は、基本文書の特徴キーワードを用いて関連文書検索条件7dを生成する。
関連文書検索手段5は、検索条件生成手段4で生成された関連文書検索条件7dによって応用文書データベース2内の応用文書を検索する。そして、関連文書検索手段5は、検索によって得られた関連文書検索結果7eを表示手段6に渡す。
表示手段6は、検索手段3や関連文書検索手段5による検索結果を表示する。このとき、表示手段6は、検索結果に含まれる各応用文書の得点(重み)を計算し、その得点によって並べ替えで表示することができる。
これにより検索条件7aが入力されると、検索手段3により、応用文書データベース2から検索条件に合致する応用文書が検索される。そして、検索結果7bに含まれる応用文書情報7cが検索条件生成手段4に渡されると、検索条件生成手段4により、応用文書データベース2を参照して検索手段3で検出された応用文書が引用している基本文書、及び検出された応用文書の特徴を示す特徴キーワードが判断され、基本文書データベース1を参照して引用されている基本文書の特徴を示す特徴キーワードが判断され、応用文書と基本文書との特徴キーワードを用いて関連文書検索条件7dが生成される。
生成された関連文書検索条件7dが関連文書検索手段5に渡されると、関連文書検索手段5により、関連文書検索条件7dによって応用文書データベース2内の応用文書が検索される。そして、表示手段6により、関連文書検索手段5による検索結果が表示される。
このように、検出された応用文書で引用している基本文書の特徴キーワードによって再検索を行うことによって、検出された応用文書に対して引用関係による繋がりがない他の応用文書であっても、基本文書と同様の特徴キーワードを有していれば、関連文書として検出することができる。その結果、関連文書検索によって検出した応用文書で引用されている他の基本文書を見つけだすことができる。このように、文書の関連性を広げることで、最初に入力した検索条件7aと関連する応用文書や基本文書の検出漏れを少なくすることができる。
なお、関連文書検索条件7dを作成する際には、たとえば、応用文書情報7cで指定された応用文書の特徴キーワードと、その応用文書で引用している基本文書の特徴キーワードとのうち、共通する特徴キーワードを用いて関連文書検索条件7dを作成することができる。共通する特徴キーワードを用いることで、応用文書と基本文書との引用関係が存在している原因となる共通の特徴を示すキーワードによって、関連文書検索をすることができる。すなわち、応用文書と基本文書とに共通する特徴を有する他の応用文書が検出される。
また、検索結果7bを表示する際には、応用文書情報を、引用している基本文書の数に応じて並べ替えてもよい。すなわち、基本文書の引用度から、応用文書の価値評価を行うことができる。これは、コンピュータシステムの提案書で引用すべき特許文献を検索する場合のように、引用文献があることが重要な場合に有効である。また、表示された検索結果7bからユーザが選択した応用文書について関連文書検索を行う場合、基本文書を多く引用している応用文書が優先的に表示された方が便利である。
さらに、多くの応用文書から引用されている基本文書の価値(重み)を高め、価値の高い基本文書を引用している応用文書を優先的に表示することもできる。これにより、多く利用されている基本文書を介して、関連する応用文書を効率よく見つけだすことができる。
以下、本発明の実施の形態を具体的に説明する。
図2は、本発明の実施の形態のシステム構成例を示す図である。図2に示すように、文書検索システム100には、ネットワーク10を介して端末装置210,220,230が接続されている。また、文書検索システム100には、データベース110が接続されている。
データベース110には、基本文書と応用文書とが格納されている。応用文書では、その文書の内容の説明に必要な場合、基本文書が引用される。たとえば、基本文書として特許文献が用意されて、顧客に装置等を販売するための提案書が応用文書として用意されるとき、提案書において、提案するシステムで使用されている発明の特許文献が引用される。
文書検索システム100は、端末装置210,220,230の利用者からの検索要求に応答して、データベース110内の文書を検索する。そして、文書検索システム100は、検索結果を端末装置210,220,230に対して送信する。
このようなシステムにおいて、ユーザは、端末装置210,220,230を利用して、データベース110内の文書検索できる。
図3は、文書検索システムのハードウェア構成例を示す図である。文書検索システム100は、CPU(Central Processing Unit)101によって装置全体が制御されている。CPU101には、バス107を介してRAM(Random Access Memory)102、ハードディスクドライブ(HDD:Hard Disk Drive)103、グラフィック処理装置104、入力インタフェース105、および通信インタフェース106が接続されている。
RAM102には、CPU101に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、CPU101による処理に必要な各種データが格納される。HDD103には、OSやアプリケーションプログラムが格納される。また、HDD103内には、データベース110が構築される。
グラフィック処理装置104には、モニタ11が接続されている。グラフィック処理装置104は、CPU101からの命令に従って、画像をモニタ11の画面に表示させる。入力インタフェース105には、キーボード12とマウス13とが接続されている。入力インタフェース105は、キーボード12やマウス13から送られてくる信号を、バス107を介してCPU101に送信する。
通信インタフェース106は、ネットワーク10に接続されている。通信インタフェース106は、ネットワーク10を介して、他のコンピュータとの間でデータの送受信を行う。
以上のようなハードウェア構成によって、本実施の形態の処理機能を実現することができる。なお、図3には、文書検索システム100のハードウェア構成を示したが、端末装置210,220,230も同様のハードウェアで実現することができる。
このようなハードウェア構成のシステムにおいて文書検索を行うために、文書検索システム100内には、以下のような機能が設けられる。
図4は、文書検索システムの機能を示すブロック図である。なお、図4の例では、基本文書執筆者が端末装置210を使用し、応用文書作成者が端末装置220を使用し、文書検索者が端末装置230を使用するものとする。また、文書検索システム100は、ネットワークを介してデータベース110に保存された情報を提供している。
たとえば、データベース110には、基本文書として特許文献が格納され、応用文書として、特許文献を引用して作成された提案書等が格納される。その場合、基本文書執筆者は、特許文献に記載された発明の発明者である。また、応用文書作成者は、顧客に提出する提案書を作成する担当者である。
データベース110には、基本文書情報ファイル111、応用文書情報ファイル112、基本文書ファイル113、および応用文書ファイル114が格納されている。基本文書情報ファイル111には、基本文書のキーワード等の管理情報が登録されている。応用文書情報ファイル112には、応用文書のキーワード等の管理情報が登録されている。基本文書ファイル113には、複数の基本文書が格納されている。応用文書ファイル114には、複数の応用文書が格納されている。
文書検索システム100には処理機能として、基本文書キーワード設定部120、応用文書キーワード設定部130、応用文書検索部140、および関連文書検索部150を有している。
基本文書キーワード設定部120は、基本文書のキーワードが端末装置210から送られると、指定された基本文書に対応付けてキーワードを基本文書情報ファイル111に登録する。登録するキーワードは、たとえば、ユーザの操作入力基づいて端末装置210から送られる。また、基本文書キーワード設定部120は、指定された基本文書を解析(形態素解析等)してキーワードを抽出することもできる。その場合、基本文書キーワード設定部120は、抽出したキーワードをその基本文書に関連付けて、基本文書情報ファイル111に登録する。
また、基本文書キーワード設定部120は、端末装置210から基本文書が送られた場合、その基本文書を基本文書ファイル113に格納すると共に、基本文書に文書番号を振って、基本文書情報ファイル111に格納した基本文書に対応するレコードを登録する。
応用文書キーワード設定部130は、応用文書のキーワード及び引用されている基本文書の文書番号が端末装置220から送られると、指定された応用文書に対応付けてキーワード及び文書番号を応用文書情報ファイル112に登録する。登録するキーワード及び文書番号は、たとえば、ユーザの操作入力に基づいて端末装置220から送られる。また、応用文書キーワード設定部130は、指定された応用文書を解析(形態素解析等)してキーワード及び文書番号を抽出することもできる。その場合、応用文書キーワード設定部130は、抽出したキーワードをその応用文書に関連付けて、応用文書情報ファイル112に登録する。
また、応用文書キーワード設定部130は、端末装置210から応用文書が送られた場合、その応用文書を応用文書ファイル114に格納すると共に、応用文書に文書番号を振って、応用文書情報ファイル112に格納した応用文書に対応するレコードを登録する。
応用文書検索部140は、端末装置230からの検索要求に応答して、応用文書の検索を行う。具体的には、応用文書検索部140は、応用文書情報ファイル112を参照し、検索要求に含まれる検索キーに合致するキーワードが関連付けられている応用文書を検出する。応用文書検索部140は、検出された応用文書の得点(応用文書の重み)を計算する。得点は、多くのキーワードに合致した応用文書ほど大きく、且つ多くの文書を参照している応用文書ほど大きくなるようにする。その後、応用文書検索部140は、検索結果を得点の高い順にソートして応用文書リストを作成する。そして、応用文書検索部140は、応用文書リストを端末装置230に送信する。
関連文書検索部150は、応用文書の関連文書の検索要求を端末装置230から受け取ると、指定された応用文書に関連する他の応用文書の検索を行う。具体的には、関連文書検索部150は、応用文書情報ファイル112を参照し、指定された応用文書で引用している基本文書を判断する。次に、関連文書検索部150は、基本文書情報ファイル111を参照し、引用されている基本文書のキーワードを抽出する。さらに、関連文書検索部150は、基本文書のキーワードに基づいて検索条件を生成し、生成した検索条件に合致する応用文書を検索する。そして、関連文書検索部150は、検出された応用文書のリストを端末装置230に対して送信する。
次に、データベース110内の基本文書情報ファイル111と応用文書情報ファイル112とのデータ構造について説明する。
図5は、基本文書情報ファイルのデータ構造例を示す図である。基本文書情報ファイル111には、基本文書のキーワードが基本文書の執筆者の操作入力に基づいて設定される。なお、このときキーワードの候補を基本文書の要約等から自動抽出し、執筆者等に選択させる方法も考えられる。また、基本文書情報ファイル111には、基本文書を引用している応用文書の文書番号が応用文書の執筆者の操作入力に基づいて設定される。
基本文書情報ファイル111には、文書番号、タイトル、設定キーワード、応用文書番号の欄が設けられており、各欄の横方向に並べられた情報同士が互いに関連づけられている。文書番号は、基本文書を一意に識別するための識別番号である。タイトルは、文書番号で指定された基本文書のタイトルである。設定キーワードは、文書番号で指定された基本文書の特徴を示すキーワードである。応用文書番号は、文書番号で指定された基本文書を引用している応用文書を一意に識別するための識別番号である。
図5の例では、文書番号“基本文書#1”の基本文書に対して2つのキーワード“キーワード#2”、“キーワード#3”が設定されている。この基本文書は、2つの応用文書“応用文書#1”、“応用文書#2”から引用されている。また、文書番号“基本文書#2”の基本文書に対して2つのキーワード“キーワード#3”、“キーワード#4”が設定されている。この基本文書は、どの応用文書からも引用されていない。
図6は、応用文書情報ファイルのデータ構造例を示す図である。応用文書情報ファイル112には、応用文書のキーワードや引用している基本文書の文書番号が、応用文書の作成者等の操作入力に基づいて設定される。なお、このときキーワードの候補を応用文書の要約等から自動抽出し、作成者等に選択させる方法も考えられる。
応用文書情報ファイル112には、文書番号、タイトル、設定キーワード、基本文書番号の欄が設けられており、各欄の横方向に並べられた情報同士が互いに関連づけられている。
文書番号は、応用文書を一意に識別するための識別番号である。タイトルは、文書番号で指定された応用文書のタイトルである。設定キーワードは、文書番号で指定された応用文書の特徴を示すキーワードである。基本文書番号は、文書番号で指定された応用文書で引用している基本文書を一意に識別するための識別番号である。
図6の例では、文書番号“応用文書#1”の応用文書に対して3つのキーワード“キーワード#1”、“キーワード#2”、“キーワード#3”が設定されている。この応用文書は、1つの基本文書“基本文書#1”を引用している。文書番号“応用文書#2”の応用文書に対して2つのキーワード“キーワード#1”、“キーワード#3”が設定されている。この応用文書は、1つの基本文書“基本文書#1”を引用している。文書番号“応用文書#3”の応用文書に対して3つのキーワード“キーワード#2”、“キーワード#3”、“キーワード#4”が設定されている。この応用文書は、いずれの基本文書も引用していない。文書番号“応用文書#4”の応用文書に対して2つのキーワード“キーワード#1”、“キーワード#2”が設定されている。この応用文書は、いずれの基本文書も引用していない。
図5,図6に示した文書とキーワードとの関係、および文書間の引用関係をまとめると、図7のようになる。
図7は、文書とキーワードとの対応関係例を示す図である。この図7は、基本文書情報ファイル111と応用文書情報ファイル112とにおいて、各文書に対して設定されたキーワードと引用文書との例を示している。各文書に設定されているキーワードを丸印で示している。
この例では、“応用文書#1”に対して“キーワード#1”、“キーワード#2”、“キーワード#3”が設定されており、“応用文書#1”の引用文書として、“基本文書#1”が設定されている。“応用文書#2”に対して“キーワード#1”、“キーワード#3”が設定されており、“応用文書#2”の引用文書として、“基本文書#1”が設定されている。“応用文書#3”に対して“キーワード#2”、“キーワード#3”、“キーワード#4”が設定されており、“応用文書#3”の引用文書は無い。“応用文書#4”に対して“キーワード#1”、“キーワード#2”が設定されており、“応用文書#4”の引用文書は無い。
また、“基本文書#1”に対して“キーワード#2”、“キーワード#3”が設定されている。“基本文書#2”に対して“キーワード#3”、“キーワード#4”が設定されている。
以上のような構成のシステムによって文書検索が行われる。次に、文書検索システムを用いた文書検索処理を詳細に説明する。なお、上記システムで実行する処理は、基本文書へのキーワード設定処理、応用文書へのキーワード設定処理、応用文書検索処理、関連文書リスト一覧表示処理に分けることができる。以下、これらの処理をシーケンス図を参照して説明する。
図8は、基本文書キーワード設定処理のシーケンス図である。この例では、端末装置210の処理と文書検索システム100の基本文書キーワード設定部120の処理とが示されている。以下、図8に示す処理をステップ番号に沿って説明する。
[ステップS11]端末装置210は、ユーザからの基本文書の文書番号の入力を受け付ける。
[ステップS12]端末装置210は、入力された文書番号を指定した基本文書取得要求を、文書検索システム100に対して送信する。
[ステップS13]文書検索システム100では、基本文書取得要求を基本文書キーワード設定部120が受け取る。基本文書キーワード設定部120は、基本文書取得要求で指定された文書番号に対応する基本文書を、基本文書ファイル113から読み込む。
[ステップS14]基本文書キーワード設定部120は、読み込んだ基本文書を端末装置210に対して送信する。
[ステップS15]端末装置210では、文書検索システム100から送られた基本文書の内容を、基本文書キーワード入力画面としてモニタ等に表示する。たとえば、文書番号、タイトル、文書の内容などが表示される。
[ステップS16]端末装置210は、ユーザからのキーワードの入力を受け付ける。
[ステップS17]端末装置210は、入力されたキーワードの登録を示すボタンが押下されると、入力されたキーワードを文書検索システム100に送信する。
[ステップS18]文書検索システム100では、キーワードを基本文書キーワード設定部120が受け取る。基本文書キーワード設定部120は、ステップS14で送信した基本文書に関連付けて、受け取ったキーワードを基本文書情報ファイル111に設定する。
図9は、基本文書キーワード入力画面の例を示す図である。基本文書キーワード入力画面20には、文書番号21、文書のタイトル22、文書の内容23が表示されている。ユーザは、これらの表示内容を確認し、表示された基本文書に設定するキーワードを、キーワード設定領域24に入力する。その後、ユーザによって登録ボタン25が押下されると、キーワード設定領域24に登録されたキーワードが、文書検索システム100に送信される。
このようにして、基本文書に対するキーワードが設定される。次に、応用文書に対するキーワード及び基本文書番号の設定処理について説明する。
図10は、応用文書キーワード設定処理のシーケンス図である。この例では、端末装置220の処理と文書検索システム100の応用文書キーワード設定部130の処理とが示されている。以下、図10に示す処理をステップ番号に沿って説明する。
[ステップS21]端末装置220は、ユーザからの応用文書の文書番号の入力を受け付ける。
[ステップS22]端末装置220は、入力された文書番号を指定した応用文書取得要求を、文書検索システム100に対して送信する。
[ステップS23]文書検索システム100では、応用文書取得要求を応用文書キーワード設定部130が受け取る。応用文書キーワード設定部130は、応用文書取得要求で指定された文書番号に対応する応用文書を、応用文書ファイル114から読み込む。
[ステップS24]応用文書キーワード設定部130は、読み込んだ応用文書を端末装置220に対して送信する。
[ステップS25]端末装置220では、文書検索システム100から送られた応用文書の内容を、応用文書キーワード及び基本文書番号入力画面としてモニタ等に表示する。たとえば、文書番号、タイトル、文書の内容などが表示される。
[ステップS26]端末装置220は、ユーザからのキーワード及び応用文書で引用している基本文書の文書番号の入力を受け付ける。
[ステップS27]端末装置220は、入力されたキーワードの登録を示すボタンが押下されると、入力されたキーワード及び文書番号を文書検索システム100に送信する。
[ステップS28]文書検索システム100では、キーワード及び文書番号を応用文書キーワード設定部130が受け取る。応用文書キーワード設定部130は、ステップS24で送信した応用文書に関連付けて、受け取ったキーワード及び文書番号を応用文書情報ファイル112に設定する。
[ステップS29]応用文書キーワード設定部130は、受け取った文書番号の基本文書に関連付けて、ステップS24で送信した応用文書を基本文書情報ファイル111に設定する。
図11は、応用文書キーワード及び基本文書番号入力画面の例を示す図である。応用文書キーワード及び基本文書番号入力画面30には、文書番号31、文書のタイトル32、文書の内容33が表示されている。ユーザは、これらの表示内容を確認し、表示された応用文書に設定するキーワードを、キーワード設定領域34に入力する。また、ユーザは、表示された応用文書で引用している基本文書の文書番号を、基本文書番号設定領域35に設定する。その後、ユーザによって登録ボタン36が押下されると、キーワード設定領域34に登録されたキーワードと、基本文書番号設定領域35に設定された基本文書番号とが、文書検索システム100に送信される。
このようにして、応用文書のキーワード及び、応用文書と基本文書との引用関係が登録される。
基本文書キーワード設定、応用文書キーワード設定および引用関係が登録されると、検索処理が可能となる。以下に、検索処理の詳細を説明する。
図12は、検索処理の手順を示すシーケンス図である。この例では、端末装置230の処理と文書検索システム100の応用文書検索部140の処理とが示されている。以下、図12に示す処理をステップ番号に沿って説明する。
[ステップS31]端末装置230は、ユーザからの検索キーとするキーワードの入力を受け付ける。
[ステップS32]端末装置230は、入力されたキーワードを文書検索システム100に送信する。
[ステップS33]文書検索システム100の応用文書検索部140は、検索要求で指定されたキーワードから未処理のキーワードを選択し、そのキーワードによる応用文書検索を行う。具体的には、応用文書検索部140は、選択したキーワードが設定された応用文書情報を応用文書情報ファイル112から読み込む。
[ステップS34]応用文書検索部140は、応用文書検索結果リストを生成する。
[ステップS35]応用文書検索部140は、全てのキーワードについて処理したか否かを判断する。全てのキーワードについて処理が完了していれば、処理がステップS36に進められる。未処理のキーワードがあれば、処理がステップS33に進められ、未処理のキーワードによる応用文書検索が行われる。
[ステップS36]応用文書検索部140は、引用関係による並べ替え処理を行う。すなわち、基本文書を多く引用している文書が上位に表示されるように、応用文書検索結果リスト内の応用文書情報を並べ替える。この処理の詳細は後述する。
[ステップS37]応用文書検索部140は、応用文書検索結果リストを端末装置230に送信する。
[ステップS38]端末装置230は、応用文書検索結果リストを画面に表示する。これにより、端末装置230を使用するユーザは、入力したキーワードに関連する応用文書を、引用文献の多い順に参照することができる。
次に、引用関係による並べ替え処理(ステップS36)の詳細を説明する。
図13は、引用関係並べ替え処理の手順を示すフローチャートである。以下、図13に示す処理をステップ番号に沿って説明する。
[ステップS41]応用文書検索部140は、応用文書検索結果リストに含まれる応用文書から未処理の応用文書を1つ選択する。
[ステップS42]応用文書検索部140は、選択した応用文書の得点を0に初期化する。
[ステップS43]応用文書検索部140は、合致したキーワード数を、選択した応用文書の得点に加算する。
[ステップS44]応用文書検索部140は、選択した応用文書からの引用先として設定されている基本文書のうち、ステップS45,S46の処理が行われていない基本文書があるか否かを判断する。未処理の基本文書があれば処理がステップS45に進められる。全ての基本文書に対して処理が終了していれば、処理がステップS47に進められる。
[ステップS45]応用文書検索部140は、選択された応用文書で引用している基本文書のうち、未処理のものを1つ選択する。
[ステップS46]応用文書検索部140は、選択した基本文書に対応付けられている検索キーの数に、その基本文書を引用している応用文書数(被引用文書数)を乗算し、乗算結果を応用文書の得点に加算する。その後、処理がステップS44に進められる。
[ステップS47]応用文書検索部140は、現在の得点を、選択した応用文書の得点としてRAM102等に記憶する。
[ステップS48]応用文書検索部140は、応用文書検索結果リスト未処理の応用文書があるか否かを判断する。未処理の応用文書がある場合、処理がステップS41に進められる。全ての応用文書に対して処理が完了した場合、処理がステップS49に進められる。
[ステップS49]応用文書検索部140は、応用文書検索結果リストに含まれる応用文書を、その文章に設定された得点に従って降順でソートする。その後、処理が図12のステップS37に進められる。
このようにして、キーワードによる応用文書検索が行われる。端末装置230を操作するユーザは、任意のキーワードを検索キーとして入力することで、得点によってソートされた検索結果を得ることができる。
図14は、検索キー入力画面の例を示す図である。検索キー入力画面40には、キーワード入力領域41が設けられている。ユーザは、キーワード入力領域41に検索用のキーワードを入力する。複数のキーワードを入力する場合、キーワード同士をor(論理和)やand(論理積)などの演算子で結ぶことができる。複数のキーワードが論理和で結合された場合、いずれか1つのキーワードを含む応用文書が検出される。複数のキーワードが論理積で結合された場合、全てのキーワードを含む応用文書が検出される。
キーワード入力領域41にキーワードを入力後、ユーザが検索ボタン42を押下すると、キーワード入力領域41に入力されたキーワードを検索キーとした検索要求が、文書検索システム100に対して送信される。文書検索システム100からは、検索要求に対する検索結果として、応用文書検索結果リストが返される。
図15は、応用文書検索結果リストの表示画面例を示す図である。応用文書検索結果リストの表示画面50には、検出された応用文書毎に、応用文書番号51、タイトル52、得点53が表示されている。応用文書は得点53で示される値によって降順にソートされており、得点が高い応用文書が上位に表示される。
各応用文書に対応付けて、応用文書表示ボタン54a〜54dが設けられている。応用文書表示ボタン54a〜54dが押下されると、押下された応用文書表示ボタンに対応する応用文書の取得要求が文書検索システム100に対して送信される。そして、文書検索システム100から該当する応用文書が送られる。そして、端末装置230に応用文書の内容が表示される。
また、基本文書を引用している応用文書に対応付けて、関連文書表示ボタン55a,55bが表示されている。関連文書表示ボタン55a,55bが押下されると、押下された関連文書表示ボタンに対応する応用文書の文書番号を指定した関連文書検索要求が文書検索システム100に対して送信される。そして、文書検索システム100において関連文書リストが生成され、端末装置230に返される。
図16は、関連文書検索処理の手順を示すシーケンス図である。以下、図16に示す処理をステップ番号に沿って説明する。
[ステップS51]端末装置230は、ユーザから、関連文書表示ボタンの入力を受け付ける。
[ステップS52]端末装置230は、押下された関連文書表示ボタンに対応する応用文書の識別番号を指定した関連文書検索要求を、文書検索システム100に送信する。
[ステップS53]文書検索システム100の関連文書検索部150は、関連文書検索要求を受信すると、関連文書検索処理を行う。関連文書検索処理により、関連文書リストが生成される。関連文書検索処理の詳細は後述する。
[ステップS54]関連文書検索部150は、生成した関連文書リストを端末装置230に送信する。
[ステップS55]端末装置230は、関連文書リストの内容を関連文書リスト画面としてモニタに表示する。
次に、関連文書検索処理を詳細に説明する。
図17は、関連文書検索処理の手順を示すフローチャートである。以下、図17に示す処理をステップ番号に沿って説明する。
[ステップS61]関連文書検索部150は、応用文書情報ファイルを参照し、関連文書検索要求で指定された応用文書のキーワードを抽出する。
[ステップS62]関連文書検索部150は、応用文書情報ファイルを参照し、指定された応用文書から引用されている未処理の基本文書の1つを選択する。
[ステップS63]関連文書検索部150は、基本文書情報ファイル111を参照し、ステップS62で選択した基本文書のキーワードを抽出する。
[ステップS64]関連文書検索部150は、ステップS61で抽出した応用文書のキーワードと、ステップS63で抽出した基本文書のキーワードから、共通するキーワードを抽出する。
[ステップS65]関連文書検索部150は、共通するキーワードから検索式を作成する。たとえば、共通するキーワードをAND(論理積)で接続した検索式を作成する。
[ステップS66]関連文書検索部150は、作成された検索式に基づき文書を検索する。検索結果は、関連文書リストに設定される。
[ステップS67]関連文書検索部150は、指定された応用文書で引用する全ての基本文書に対して、ステップS62〜S66の処理を行ったか否かを判断する。全ての基本文書に対して処理が完了していれば、処理が図16のステップS54に進められる。未処理の基本文書があれば、処理がステップS62に進められる。
このようにして、応用文書で引用された基本文書に設定されたキーワードのうち、応用文書と共通するキーワードによって新たな検索式が生成される。そして、生成された検索式による検索結果が、関連文書リストとして端末装置230に表示される。
図18は、関連文書リスト表示画面の例を示す図である。関連リスト表示画面60には、検出された応用文書に関する応用文書番号61およびタイトル62が表示されている。また、応用文書に対応付けて、応用文書表示ボタン63と基本文書表示ボタン64が設けられている。応用文書表示ボタン63は、対応する応用文書の内容を表示させるためのボタンである。基本文書表示ボタン64は、対応する応用文書を検出した際の検索式の作成元となった基本文書の内容を表示させるためのボタンである。
以上のようにして、検索結果として表示された応用文書の引用文書に基づいて関連文書検索用の検索式を生成し、再検索することができる。再検索の際の検索式は、応用文書と基本文書とに共通して設定されているキーワードによって作成される。これにより、検索漏れ(ユーザの検索目的に合致している文書が検索結果として表示されないこと)を少なくすることができる。
次に、関連文書検索処理の具体例を示す。以下の説明では、基本文書ファイル113として特許文献が格納されており、応用文書ファイル114として顧客への提案書が格納されているものとする。また、図7の例で、キーワードは、“キーワード#1”が“Web”、“キーワード#2”が“広告”、“キーワード#3”が“地図情報”、“キーワード#4”が“課金”であるものとする。
このとき、顧客に対して提案書を作成すべきユーザが、顧客から「Web上で広告を行うサービスを提供したいので、システムを提案して欲しい」という依頼を受けている。この場合、ユーザが“Web(キーワード#1)”と“広告(キーワード#2)”とのキーワードを検索キーとして指定して検索を行ったものとする。すると、図7の例では、“応用文書#1”と“応用文書#4”とが検索結果として表示される。この際に、応用文書毎に以下の得点計算が行われ、得点の高い順に表示される。
「得点=ヒットしたキーの数+引用された基本文書のキーの中でヒットしたキーの数×その基本文書を引用している応用文書の数」
その結果、図15と同様に“応用文書#1”が先頭に表示される。担当者は、先頭に表示された“応用文書#1”を素早く見つけ、地図情報を広告で利用するという自社特許を引用していることを知り、強力な提案書を作成できることになる。従来の技術では、“応用文書#4”を利用して提案するにとどまる可能性があり、検索結果の数が多いと、応用文書#1を見落とす可能性もある。
一方、“応用文書#3”という提案書があり、この中では地図情報を使いさらに課金機能を付加したシステムの提案を行っていた。本来、“応用文書#3”は“基本文書#1”を引用すべきものであったが、“応用文書#3”作成者のように、特許に関する認識が薄く特許の存在を知らずに引用しない場合がよくある。これを救うのが本実施の形態の目的の一つである。
具体的には、“応用文書#1”の関連文書表示ボタンが押下されると、“応用文書#1”と“基本文書#1”の共通のキーワードである“広告(キーワード#2)”と“地図情報(キーワード#3)”で応用文書が検索され、“応用文書#3”が得られる。
図19は、関連文書検索により検出される応用文書を示す図である。図19において、各応用文書に設定されているキーワードのうち、関連文書検索で利用されるキーワードが黒丸で示されている。すなわち、“広告(キーワード#2)”と“地図情報(キーワード#3)”との論理積(AND)で応用文書の検索が行われると“応用文書#1”と“応用文書#3”とが検出される。
これにより、担当者は“応用文書#1”より優れている可能性のある“応用文書#3”を得ることができ、“応用文書#3”をベースに地図情報を広告に利用し、課金する機能を持つシステムの提案が可能となる。この中には、自社特許が使われているため、他社との差別化が可能で、顧客に効果的な提案ができることになる。すなわち、ユーザが最初に入力した検索キーでは、下位に表示されてしまう(あるいは、キーワード#1とキーワード#3との論理積(AND)で検索した場合には表示されない)“応用文書#3”が、関連文書検索を行うことでユーザに明示され、効果的な提案書のベースとして選択することができる。
ところで、関連文書の検索結果についても重み付けを行い、重み付けに応じた順番に並べ替えて表示することができる。その場合、関連文書検索処理中に重み付け処理とソート処理とが追加される。
図20は、重み付けを行った関連文書検索処理の手順を示すフローチャートである。なお、ステップS71〜S76の処理は、それぞれ図17に示すステップS61〜66と同様である。また、ステップS78の処理は、図17に示すステップS67の処理と同様である。以下、図20に示す処理のうち、図17と異なる処理を説明する。
検索式による検索が行われた後、処理がステップS77に進められる。ステップS77では、関連文書検索部150が、ステップS76により検出された応用文書に対して、ステップS75で作成された検索式のキーワード数を得点として設定する。この得点が、関連文書リスト内での応用文書の重みを示す。
そして、応用文書で引用されている全ての基本文書に基づいて関連文書検索が行われた後、処理がステップS79に進められる。ステップS79では、関連文書検索部150が、関連文書リストに含まれる応用文書を、ステップS77で設定された得点に基づいて降順にソートする。すなわち、得点が高い関連文書が上位となる様に並べ替えられる。
図21は、得点でソートされた関連文書リスト表示画面の例を示す図である。関連リスト表示画面70には、検出された応用文書に関する応用文書番号71、タイトル72および得点75が表示されている。各応用文書は、得点75で示される値が大きいほど、上に表示される。
また、応用文書に対応付けて、応用文書表示ボタン73と基本文書表示ボタン74が設けられている。応用文書表示ボタン73は、対応する応用文書の内容を表示させるためのボタンである。基本文書表示ボタン74は、対応する応用文書を検出した際の検索式の作成元となった基本文書の内容を表示させるためのボタンである。
このように、関連文書検索の結果について、検索式に含まれるキーワード数に応じて、検索結果を並べ替えることで、応用文書や基本文書との共通する特徴が多い他の応用文書が上位に表示される。その結果、関連性の高い応用文書を容易に見つけだすことができる。
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、文書検索システム100が有すべき機能の処理内容を記述した文書検索プログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記録装置には、ハードディスク装置(HDD)、フレキシブルディスク(FD)、磁気テープなどがある。光ディスクには、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)などがある。光磁気記録媒体には、MO(Magneto-Optical disk)などがある。
プログラムを流通させる場合には、たとえば、そのプログラムが記録されたDVD、CD−ROMなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
プログラムを実行するコンピュータは、たとえば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送される毎に、逐次、受け取ったプログラムに従った処理を実行することもできる。
(付記1) 文書に対しキーワード検索を行うための文書検索プログラムにおいて、
コンピュータを、
基本文書を格納する基本文書データベース、
前記基本文書を引用する記述を含む応用文書を格納する応用文書データベース、
検索条件が入力されると、前記応用文書データベースから前記検索条件に合致する前記応用文書を検索する検索手段、
前記応用文書データベースを参照して前記検索手段で検出された前記応用文書が引用している前記基本文書を判断し、前記基本文書データベースを参照して引用されている前記基本文書の特徴を示す特徴キーワードを判断し、前記基本文書の前記特徴キーワードを用いて関連文書検索条件を生成する検索条件生成手段、
前記検索条件生成手段で生成された前記関連文書検索条件によって前記応用文書データベース内の前記応用文書を検索する関連文書検索手段、
前記関連文書検索手段による検索結果を表示する表示手段、
として機能させることを特徴とする文書検索プログラム。
(付記2) 前記表示手段は、前記検索手段で検出された複数の前記応用文書それぞれに対して、引用している前記基本文書に応じた得点を与え、前記得点に応じた順番で並べられた前記応用文書を表示することを特徴とする付記1記載の文書検索プログラム。
(付記3) 前記表示手段は、前記検索手段で検出された前記応用文書で引用している前記基本文書それぞれについて、前記基本文書を引用している応用文書数に応じた値を求め、検出された前記応用文書の得点に加算することを特徴とする付記2記載の文書検索プログラム。
(付記4) 前記基本文書データベースは、前記基本文書が格納された基本文書記憶手段と、前記基本文書の前記特徴キーワードが予め登録された基本文書情報が格納された基本文書情報記憶手段とで構成され、
前記検索条件生成手段は、前記基本文書情報を参照して、引用されている前記基本文書の特徴を示す特徴キーワードを判断することを特徴とする付記1記載の文書検索プログラム。
(付記5) 前記応用文書データベースは、前記応用文書が格納された応用文書記憶手段と、前記応用文書で引用されている基本文書の識別情報が格納された応用文書情報記憶手段とで構成され、
前記検索条件生成手段は、前記応用文書情報を参照して、前記応用文書で引用されている基本文書を判断することを特徴とする付記1記載の文書検索プログラム。
(付記6) 前記検索条件生成手段は、前記応用文書データベースを参照して前記検索手段で検出された前記応用文書の特徴を示す特徴キーワードを判断し、検出された前記応用文書と引用されている前記基本文書とに共通する特徴キーワードを組み合わせて関連文書検索条件を生成することを特徴とする付記1記載の文書検索プログラム。
(付記7) 文書に対しキーワード検索を行うための文書検索方法において、
検索手段が、検索条件が入力されると、基本文書を引用する記述を含む応用文書を格納する応用文書データベースから前記検索条件に合致する前記応用文書を検索し、
検索条件生成手段が、前記応用文書データベースを参照して前記検索手段で検出された前記応用文書が引用している前記基本文書を判断し、前記基本文書データベースを参照して引用されている前記基本文書の特徴を示す特徴キーワードを判断し、前記基本文書の前記特徴キーワードを用いて関連文書検索条件を生成し、
関連文書検索手段が、前記検索条件生成手段で生成された前記関連文書検索条件によって前記応用文書データベース内の前記応用文書を検索し、
表示手段が、前記関連文書検索手段による検索結果を表示する、
ことを特徴とする文書検索方法。
(付記8) 文書に対しキーワード検索を行うための文書検索装置において、
基本文書を格納する基本文書データベースと、
前記基本文書を引用する記述を含む応用文書を格納する応用文書データベースと、
検索条件が入力されると、前記応用文書データベースから前記検索条件に合致する前記応用文書を検索する検索手段と、
前記応用文書データベースを参照して前記検索手段で検出された前記応用文書が引用している前記基本文書を判断し、前記基本文書データベースを参照して引用されている前記基本文書の特徴を示す特徴キーワードを判断し、前記基本文書の前記特徴キーワードを用いて関連文書検索条件を生成する検索条件生成手段と、
前記検索条件生成手段で生成された前記関連文書検索条件によって前記応用文書データベース内の前記応用文書を検索する関連文書検索手段と、
前記関連文書検索手段による検索結果を表示する表示手段と、
を有することを特徴とする文書検索装置。
(付記9) 文書に対しキーワード検索を行うための文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体において、
コンピュータを、
基本文書を格納する基本文書データベース、
前記基本文書を引用する記述を含む応用文書を格納する応用文書データベース、
検索条件が入力されると、前記応用文書データベースから前記検索条件に合致する前記応用文書を検索する検索手段、
前記応用文書データベースを参照して前記検索手段で検出された前記応用文書が引用している前記基本文書を判断し、前記基本文書データベースを参照して引用されている前記基本文書の特徴を示す特徴キーワードを判断し、前記基本文書の前記特徴キーワードを用いて関連文書検索条件を生成する検索条件生成手段と、
前記検索条件生成手段で生成された前記関連文書検索条件によって前記応用文書データベース内の前記応用文書を検索する関連文書検索手段、
前記関連文書検索手段による検索結果を表示する表示手段、
として機能させることを特徴とする文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体。
実施の形態に適用される発明の概念図である。 本発明の実施の形態のシステム構成例を示す図である。 文書検索システムのハードウェア構成例を示す図である。 文書検索システムの機能を示すブロック図である。 基本文書情報ファイルのデータ構造例を示す図である。 応用文書情報ファイルのデータ構造例を示す図である。 文書とキーワードとの対応関係例を示す図である。 基本文書キーワード設定処理のシーケンス図である。 基本文書キーワード入力画面の例を示す図である。 基本文書キーワード設定処理のシーケンス図である。 応用文書キーワード及び基本文書番号入力画面の例を示す図である。 検索処理の手順を示すシーケンス図である。 引用関係並べ替え処理の手順を示すフローチャートである。 検索キー入力画面の例を示す図である。 応用文書検索結果リストの表示画面例を示す図である。 関連文書検索処理の手順を示すシーケンス図である。 関連文書検索処理の手順を示すフローチャートである。 関連文書リスト表示画面の例を示す図である。 関連文書検索により検出される応用文書を示す図である。 重み付けを行った関連文書検索処理の手順を示すフローチャートである。 得点でソートされた関連文書リスト表示画面の例を示す図である。
符号の説明
1 基本文書データベース
2 応用文書データベース
3 検索手段
4 検索条件生成手段
5 関連文書検索手段
6 表示手段
7a 検索条件
7b 検索結果
7c 応用文書情報
7d 関連文書検索条件
7e 関連文書検索結果

Claims (5)

  1. 文書に対しキーワード検索を行うための文書検索プログラムにおいて、
    コンピュータを、
    基本文書を格納する基本文書データベース、
    前記基本文書を引用する記述を含む応用文書を格納する応用文書データベース、
    検索条件が入力されると、前記応用文書データベースから前記検索条件に合致する前記応用文書を検索する検索手段、
    前記応用文書データベースを参照して前記検索手段で検出された前記応用文書が引用している前記基本文書を判断し、前記基本文書データベースを参照して引用されている前記基本文書の特徴を示す特徴キーワードを判断し、前記基本文書の前記特徴キーワードを用いて関連文書検索条件を生成する検索条件生成手段、
    前記検索条件生成手段で生成された前記関連文書検索条件によって前記応用文書データベース内の前記応用文書を検索する関連文書検索手段、
    前記関連文書検索手段による検索結果を表示する表示手段、
    として機能させることを特徴とする文書検索プログラム。
  2. 前記表示手段は、前記検索手段で検出された複数の前記応用文書それぞれに対して、引用している前記基本文書に応じた得点を与え、前記得点に応じた順番で並べられた前記応用文書を表示することを特徴とする請求項1記載の文書検索プログラム。
  3. 前記表示手段は、前記検索手段で検出された前記応用文書で引用している前記基本文書それぞれについて、前記基本文書を引用している応用文書数に応じた値を求め、検出された前記応用文書の得点に加算することを特徴とする請求項2記載の文書検索プログラム。
  4. 前記検索条件生成手段は、前記応用文書データベースを参照して前記検索手段で検出された前記応用文書の特徴を示す特徴キーワードを判断し、検出された前記応用文書と引用されている前記基本文書とに共通する特徴キーワードを組み合わせて関連文書検索条件を生成することを特徴とする請求項1記載の文書検索プログラム。
  5. 文書に対しキーワード検索を行うための文書検索方法において、
    検索手段が、検索条件が入力されると、基本文書を引用する記述を含む応用文書を格納する応用文書データベースから前記検索条件に合致する前記応用文書を検索し、
    検索条件生成手段が、前記応用文書データベースを参照して前記検索手段で検出された前記応用文書が引用している前記基本文書を判断し、前記基本文書データベースを参照して引用されている前記基本文書の特徴を示す特徴キーワードを判断し、前記基本文書の前記特徴キーワードを用いて関連文書検索条件を生成し、
    関連文書検索手段が、前記検索条件生成手段で生成された前記関連文書検索条件によって前記応用文書データベース内の前記応用文書を検索し、
    表示手段が、前記関連文書検索手段による検索結果を表示する、
    ことを特徴とする文書検索方法。
JP2004047168A 2004-02-24 2004-02-24 文書検索プログラム及び文書検索方法 Pending JP2005242401A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004047168A JP2005242401A (ja) 2004-02-24 2004-02-24 文書検索プログラム及び文書検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004047168A JP2005242401A (ja) 2004-02-24 2004-02-24 文書検索プログラム及び文書検索方法

Publications (1)

Publication Number Publication Date
JP2005242401A true JP2005242401A (ja) 2005-09-08

Family

ID=35024118

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004047168A Pending JP2005242401A (ja) 2004-02-24 2004-02-24 文書検索プログラム及び文書検索方法

Country Status (1)

Country Link
JP (1) JP2005242401A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007272872A (ja) * 2006-03-08 2007-10-18 Ricoh Co Ltd 情報検索方法、情報検索装置、情報検索システム、及び情報検索プログラム
JP2008071198A (ja) * 2006-09-14 2008-03-27 Ricoh Co Ltd 文書検索装置、文書検索方法、文書検索プログラムおよび記録媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007272872A (ja) * 2006-03-08 2007-10-18 Ricoh Co Ltd 情報検索方法、情報検索装置、情報検索システム、及び情報検索プログラム
US8386470B2 (en) 2006-03-08 2013-02-26 Ricoh Company, Ltd. Information searching method, information searching apparatus, information searching system, and computer-readable information searching program
JP2008071198A (ja) * 2006-09-14 2008-03-27 Ricoh Co Ltd 文書検索装置、文書検索方法、文書検索プログラムおよび記録媒体

Similar Documents

Publication Publication Date Title
JP3694149B2 (ja) 画像検索装置、画像検索用キーテキストの生成方法、並びにその装置としてコンピュータを機能させるためのプログラムおよびその方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4569955B2 (ja) 情報格納及び検索方法
JP4363792B2 (ja) 情報検索システムおよび方法
JP4540970B2 (ja) 情報検索装置及びその方法
JP3917625B2 (ja) データ解析装置
KR100706389B1 (ko) 이미지 상호간의 유사도를 고려한 이미지 검색 방법 및장치
JP2004178604A (ja) 情報検索装置及びその方法
JP2008276768A (ja) 情報検索装置及び方法
JP2005122295A (ja) 関係図作成プログラム、関係図作成方法、および関係図作成装置
CN100416548C (zh) 图像处理装置、图像处理系统、图像处理方法
KR101103126B1 (ko) 정보 처리 장치 및 정보 처리 방법
JP4896132B2 (ja) 情報価値を反映した情報検索方法及びその装置
JP2004341940A (ja) 類似画像検索装置、類似画像検索方法、および類似画像検索プログラム
JP4375626B2 (ja) カテゴリ別のキーワードの入力順位を提供するための検索サービスシステムおよびその方法
US20050144179A1 (en) Method and apparatus for document-analysis, and computer product
JP2006251935A (ja) 文書検索装置、文書検索方法、および文書検索プログラム
JP5292247B2 (ja) コンテンツタグ収集方法、コンテンツタグ収集用プログラム、コンテンツタグ収集システム及びコンテンツ検索システム
JP4995770B2 (ja) 画像辞書生成装置,画像辞書生成方法,および画像辞書生成プログラム
JP2005242401A (ja) 文書検索プログラム及び文書検索方法
JPH11213000A (ja) インタラクティブ情報検索方法及び装置及びインタラクティブ情報検索プログラムを格納した記憶媒体
JP2002251412A (ja) 文書検索装置および方法ならびに記憶媒体
JP2009069874A (ja) コンテンツ検索装置、コンテンツ検索方法、プログラム、および記録媒体
JP2002251401A (ja) 文書検索装置および方法ならびに記憶媒体
JP2002056009A (ja) 文書分類方法および装置
JP7284371B2 (ja) 情報処理装置、情報処理方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091022

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091027

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100309