JP3767763B2 - Information retrieval device and computer-readable recording medium recording a program for causing a computer to function as the device - Google Patents

Information retrieval device and computer-readable recording medium recording a program for causing a computer to function as the device Download PDF

Info

Publication number
JP3767763B2
JP3767763B2 JP20062897A JP20062897A JP3767763B2 JP 3767763 B2 JP3767763 B2 JP 3767763B2 JP 20062897 A JP20062897 A JP 20062897A JP 20062897 A JP20062897 A JP 20062897A JP 3767763 B2 JP3767763 B2 JP 3767763B2
Authority
JP
Japan
Prior art keywords
search
document
condition
icon
search condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP20062897A
Other languages
Japanese (ja)
Other versions
JPH1145261A (en
Inventor
尚 若杉
昭徳 酒井
Original Assignee
株式会社ジャストシステム
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ジャストシステム filed Critical 株式会社ジャストシステム
Priority to JP20062897A priority Critical patent/JP3767763B2/en
Publication of JPH1145261A publication Critical patent/JPH1145261A/en
Application granted granted Critical
Publication of JP3767763B2 publication Critical patent/JP3767763B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Digital Computer Display Output (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、検索条件を保存し、保存した検索条件をアイコンで表示することにより、同一の検索条件で定期的に検索を行う場合等の検索処理の利便性の向上を図った情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体に関する。
【0002】
【従来の技術】
コンピュータの発達に伴って、紙を媒体として記録され、また保存されていた文書についても、電子化された情報として取り扱うことが一般的となり、大量の電子化された文書がデータベースに蓄積されることとなっている。
【0003】
ところで、大量の電子化された文書が蓄積されていくに従って、大量の文書の中から所望の文書を容易に探し出すことができる検索技術が重要となってくる。特に、誰もがコンピュータを用いて作業を行う今日にあっては、特殊な手法を用いることなく、コンピュータの初心者であっても簡単に所望の文書を検索できるような検索システムを構築することが重要なポイントとなる。
【0004】
検索の容易化を図るための1つの手法として、人間が通常用いる自然言語を用いて検索条件を入力することができるようにする技術を挙げることができる。この技術は、近年の自然言語処理技術の発達に伴って、多くの検索システムに取り入れられつつある。
【0005】
【発明が解決しようとする課題】
しかしながら、従来の検索システムにおいては、検索条件を自然言語で入力できるようにして、検索条件を入力する作業を容易にしているが、同一の検索条件で検索を行う場合には、再度検索条件を入力し直さなければならないという問題があった。
【0006】
また、入力した検索条件を保存しておき、保存した検索条件を読み出して検索を行うことができるようにしたものも開発されてはいるが、検索条件の保存や読み出しのための操作が複雑で、使い勝手が悪いという問題点があった。
【0007】
本発明は上記に鑑みてなされたものであって、検索条件を保存し、保存した検索条件をアイコンで表示することにより、同一の検索条件で定期的に検索を行う場合等の検索処理の利便性の向上を図ることを目的とする。
【0008】
【課題を解決するための手段】
上記目的を達成するため、本発明にかかる情報検索装置は、検索条件に基づいて、該当する情報の検索処理を行う検索手段を備えた情報検索装置において、前記検索条件の保存を指定するための指定手段と、前記指定手段を介して前記検索条件の保存が指定されると、前記検索条件のファイルおよびアイコンを生成して前記検索条件を保存する検索条件保存手段と、前記検索条件保存手段で生成したアイコンを画面表示するアイコン表示手段と、前記アイコン表示手段で画面表示されたアイコンを選択するための選択手段と、を備え、前記検索手段が、前記選択手段を介して選択されたアイコンに基づいて、該当する情報を検索するものである。
【0009】
また、本発明にかかる情報検索装置は、上記に記載の情報検索装置において、さらに、前記検索条件保存手段で保存した検索条件毎に、少なくとも前記検索手段による前回の検索結果を第1の検索結果として保持する検索結果保持手段と、予め設定された検索実行条件に基づいて、前記検索手段を制御して所定のタイミングで前記検索処理を実行させる検索実行制御手段と、前記検索実行制御手段の制御に基づいて前記検索処理を行った結果を第2の検索結果として入力し、入力した第2の検索結果と前記検索結果保持手段に保持された第1の検索結果とを比較して、前記第1および第2の検索結果が同一か否かを判定する検索結果判定手段と、を備え、前記アイコン表示手段が、前記検索結果判定手段の判定結果を入力し、前記第1および第2の検索結果が異なる場合に、前記アイコンの表示色または/および表示形態を変更するものである。
【0010】
さらに、本発明にかかるコンピュータ読み取り可能な記録媒体は、上記に記載の情報検索装置の各手段としてコンピュータを機能させるためのプログラムを記録したものである。
【0011】
【発明の実施の形態】
以下、本発明の情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体の実施の形態について、添付の図面を参照しつつ詳細に説明する。
【0012】
〔実施の形態1〕
図1は、実施の形態1の情報検索装置のシステム構成図である。図1に示す情報検索装置は、検索条件を保存し、保存した検索条件をアイコンで表示することができる機能を有した複数のクライアント100と、文書DB(データベース)101に格納された文書から転置ファイル102を生成すると共に、ベクトル空間検索を行うことができる検索エンジン(例えば、CLARITECH社のCLARIT等)を備え、クライアント100から検索条件を入力し、入力した検索条件に基づいて、転置ファイル102を用いて該当する文書を検索し、検索した文書のリストをクライアント100に出力する検索サーバ103と、上記クライアント100や検索サーバ103等を接続するネットワーク104と、から構成されている。
【0013】
図1において、文書DB101は、クライアント100等で作成された複数の文書を格納したものであり、格納される文書は、ワープロ文書や、SGML,HTML等の構造化文書等、いかなる種類の文書であっても良い。実施の形態1においては、文書DB101に格納された文書を検索対象とするが、検索対象となる文書をこの文書DB101中の文書に限定するものではない。
【0014】
転置ファイル102は、文書DB101中の複数の文書と、これら複数の文書それぞれから後述する方法で抽出した複数の索引語との関係を規定することにより、ある索引語が各文書それぞれにおいてどの程度重要な語彙であるかをベクター表現を用いて示したものであって、この索引語を用いて該当する文書を検索することができるようにしたものである。
【0015】
具体的には、1つの文書を予め定めた複数のセンテンスからなるサブドキュメント単位に区切り、サブドキュメントから上記索引語となる名詞句を抽出して、抽出した名詞句それぞれについて、サブドキュメント中の出現頻度,文書DB101全体における分布等の統計情報を求め、求めた名詞句毎の統計情報を用いて各サブドキュメントをベクター表現に変換する。そして、変換したサブドキュメントのベクター表現に基づいて、文書のベクター表現を生成する。転置ファイル102は、このようにしてベクター表現された文書DB101中の文書を格納するものである。
【0016】
なお、各索引語には、対応する文書中の重要度に応じた重み付けを行うことができる。また、文書のベクター表現については、実際の検索を行う際に、サブドキュメントのベクター表現に基づいて生成することにしても良い。
【0017】
また、クライアント100および検索サーバ103は、パーソナルコンピュータやワークステーション等によって構成される。図2は、クライアント100のブロック構成図である。クライアント100は、特定の内容の文書を検索するための条件を記述した検索条件のファイルおよびアイコンを生成して検索条件を保存・管理すると共に、この検索条件を検索サーバ103に出力し、検索サーバ103から検索条件に該当する文書のリストを入力して、検索した文書の一覧を表示するものである。
【0018】
図2において、入力装置200は、キーボードおよびマウス等からなり、特定の内容の文書を検索するための条件を記述した検索条件の入力、入力した検索条件に基づく検索処理の実行の指定、入力した検索条件のファイルおよびアイコンの生成の指定、生成したアイコンを選択することによる検索処理の実行の指定等を行うためのものである。ここで、検索条件は、検索したい文書の特徴を自然言語で記述した文章や、検索式、キーワードの集合、検索したい文書の例となる文書等のいずれであっても良い。検索条件を文書とする場合には、その文書のファイル名を指定することができる。また、検索条件には、ファイル名,作成日および作成者等の制約条件を含めることができる。
【0019】
検索条件管理部201は、入力装置200で入力した検索条件のファイルおよびアイコンを生成して検索条件を保存・管理すると共に、入力装置200を介してアイコンが選択されると、選択されたアイコンに基づいて、該当する検索条件を検索サーバ103に出力し、該当する文書のリストを入力して、検索した文書の一覧の表示処理を制御するものである。
【0020】
検索条件ファイル格納部202は、検索条件のファイルおよびアイコンの描画情報とを関連づけて格納するものである。
【0021】
出力装置203は、CRT等からなり、検索条件ファイル格納部202に格納されたアイコンの描画情報に基づいて、検索条件のアイコンを画面表示すると共に、検索サーバ103から入力した検索結果である文書リストを表示するものである。
【0022】
入出力部204は、入力装置200,出力装置203およびネットワーク104と検索条件管理部201とのインターフェイスとなるものである。
【0023】
また、図3は、検索サーバ103の処理を示す概略ブロック図である。検索サーバ103は、文書DB101中の文書のベクター表現を生成して転置ファイル102に登録する処理と、ベクトル空間法を利用した検索処理を用いて、検索条件206に該当する文書を検索する処理を行うものである。
【0024】
検索サーバ103において、転置ファイル102に登録する処理は、自然言語処理モジュール300と、データベース・ビルド・コンポーネント304とによって行われる。具体的に、自然言語処理モジュール300は、文書DB101から文書を入力し、文書のフォーマットの認識処理や、品詞情報等を格納した辞書301および各単語の係り受け等を解析するための文法辞書302を用いて形態素解析,構文解析,名詞句抽出等の解析処理を行い、上述したサブドキュメント毎の名詞句リストを含むドキュメント・セット303を生成する。データベース・ビルドコンポーネント304は、自然言語処理モジュール300で生成したドキュメント・セット303を入力し、入力したドキュメント・セット303中の各サブドキュメントをベクター表現に変換すると共に、サブドキュメントのベクター表現に基づいて、文書のベクター表現を生成して転置ファイル102に登録する。
【0025】
一方、文書を検索する処理は、自然言語処理モジュール300と、クエリー・ビルド・コンポーネント305と、検索エンジン307とによって行われる。具体的に、自然言語処理モジュール300は、クライアント100から検索条件206を入力し、品詞情報等を格納した辞書301および各単語の係り受け等を解析するための文法辞書302を用いて形態素解析,構文解析,名詞句抽出等の解析処理を行い、検索条件206中の名詞句のリストを含むドキュメント・セット303を生成する。クエリー・ビルド・コンポーネント305は、ドキュメント・セット303を入力し、検索条件206を構成する各名詞句について、検索条件206中の出現頻度,文書DB101全体における分布等の統計情報を求め、求めた統計情報を用いて検索条件206をベクター表現に変換したクエリー・ドキュメント306を生成する。検索エンジン307は、クエリー・ビルド・コンポーネント305で生成したクエリー・ドキュメント306を入力し、転置ファイル102中の各文書のベクトルとクエリー・ドキュメント306のベクトルとを比較して、クエリー・ドキュメント306との類似度に応じたスコアを各文書に付与し、所定の閾値を超えるスコアが付与された文書リスト308を検索結果として出力する。
【0026】
なお、図1においては、文書DB101および転置ファイル102をネットワーク104に単独に接続した構成を示したが、これらを検索サーバ103に直接接続する構成としても良い。また、図1においては、実施の形態1の情報検索装置をネットワーク104を介したシステムで構成するように示したが、クライアント100と検索サーバ103の処理を1つのコンピュータで行うようにすることもできる。
【0027】
次に、上述した構成を備えた情報検索装置の動作について、(1)転置ファイルの生成処理,(2)文書の検索処理,(3)アイコン(ファイル)の生成処理,(4)生成したアイコンを用いた文書の検索処理の順で詳細に説明する。
【0028】
(1)転置ファイルの生成処理
図4は、転置ファイルの生成処理を示すフローチャートである。検索サーバ103は、新たな文書が文書DB101に登録された場合(S401)、この文書を入力して転置ファイル102に登録するための処理を開始する(S402)。
【0029】
検索サーバ103において、自然言語処理モジュール300は、ステップS402で入力した文書を解析する処理を行う(S403)。具体的には、入力した文書がワープロ文書,HTML等の構造化文書等、いかなるフォーマットの文書であるかを判定する処理を行う。その後、辞書301および文法辞書302を用いて形態素解析,係り受け等の構文解析を行い、文書を複数のサブドキュメントに区分すると共に、区分したサブドキュメントから名詞句を抽出する等の処理を行う。
【0030】
そして、自然言語処理モジュール300は、ステップS403における処理の結果に基づいて、サブドキュメント毎に名詞句リストを生成し、生成した名詞句リストを含むドキュメント・セット303を生成する(S404)。
【0031】
その後、データベース・ビルド・コンポーネント304は、自然言語処理モジュール300で生成したドキュメント・セット303を入力し、文書のベクター表現を生成して転置ファイル102に登録する処理を行う(S405)。
【0032】
具体的には、ドキュメント・セット303中のサブドキュメントの各名詞句を転置ファイル102の索引語として、サブドキュメント中の出現頻度,文書DB101全体における分布等の統計情報を求め、求めた名詞句毎の統計情報を用いてサブドキュメントをベクター表現に変換する。この処理をドキュメント・セット303中の全てのサブドキュメントについて行い、変換したサブドキュメントのベクター表現に基づいて、文書のベクター表現を生成して転置ファイル102に登録する。
【0033】
(2)文書の検索処理
次に、上述したようにして登録した検索条件に基づいて、該当する文書を検索するための処理について説明する。図5は文書の検索処理を示すフローチャートである。なお、実施の形態1の情報検索装置は、検索条件206のファイルおよびアイコンを生成して保存・管理するものであるが、ここでは、保存・管理の対象となる検索条件206を入力し、少なくとも1回検索処理を行い、最適な検索結果を得ることができることを確認した後に初めてその検索条件のファイルおよびアイコンを生成するものとする。だだし、入力した検索条件206について、検索処理を行うことなく、直ちにファイルおよびアイコンを生成して保存することにしても良い。
【0034】
クライアント100の検索条件管理部201は、入力装置200において検索条件206の入力があると(S501)、入力装置200を介して検索条件206を入力する(S502)。ここでは、検索条件206の一例として、「マイクロプロセッサの開発動向」を入力したものとする。
【0035】
続いて、検索条件管理部201は、入力装置200を介して検索要求を入力すると、ステップS502で入力した検索条件206を検索サーバ103に出力する(S503)。
【0036】
検索サーバ103は、クライアント100から検索条件206を入力し、自然言語処理モジュール300において、検索条件206の解析処理を行う(S504)。具体的には、辞書301および文法辞書302を用いて形態素解析,係り受け等の構文解析処理を行う。
【0037】
そして、自然言語処理モジュール300は、ステップS504での解析結果に基づいて、検索条件206から転置ファイル102中の索引語に対応する名詞句を抽出し、名詞句からなるドキュメント・セット303を生成する(S505)。
【0038】
続いて、クエリー・ビルド・コンポーネント305は、自然言語処理モジュール300からドキュメント・セット303を入力し、入力したドキュメント・セット303を構成する各名詞句について、検索条件206中の出現頻度,文書DB101全体における分布等の統計情報を求め、求めた統計情報を用いてドキュメント・セット303をベクター表現に変換したクエリー・ドキュメント306を生成する(S506)。
【0039】
検索エンジン307は、クエリー・ビルド・コンポーネント305で生成したクエリー・ドキュメント306を入力し、転置ファイル102中の各文書のベクター表現とクエリー・ドキュメント306(検索条件のベクター表現)を比較して、クエリー・ドキュメント306との類似度に応じたスコアを各文書に付与する(S507)。すなわち、ベクトル空間法による検索処理が実行される。
【0040】
なお、類似度に応じたスコアは、各文書とクエリー・ドキュメント306との類似度を余弦距離に基づいて表現したものであり、スコアが大きい文書がよりクエリー・ドキュメント306と類似していることを表している。
【0041】
そして、検索エンジン307は、予め設定されたスコアの閾値に基づいて、閾値を超えるスコアが付与された文書を選択し、選択した文書に基づいて、文書リスト308を生成して、検索結果として出力する(S508)。
【0042】
図6は、文書リスト308の一例を示す説明図である。図6に示すように、文書リスト308にはクエリー・ドキュメント306との類似度に応じたスコアのランキング,文書名,作成日等が表示される。実施の形態1においては、ステップS502で入力した検索条件206が「マイクロプロセッサの開発動向」であるため、マイクロプロセッサに関する文書がリストアップされている。
【0043】
クライアント100の検索条件管理部201は、検索サーバ103から文書リスト308を入力し、入力した文書リスト308に基づいて、上位のランキングの文書から順に、文書名を一覧表示する(S509)。
【0044】
図7は、検索した文書を一覧表示した様子の一例を示す説明図である。ユーザは、図7に示した文書の一覧から所望の文書を選択することにより、選択した文書を画面表示することができる。また、ユーザは、この検索結果に基づいて、検索条件206を登録しても良いかを判断し、図7に示すアイコン登録ボタン700を選択することにより、検索条件206のファイルおよびアイコンを生成する作業に入る。一方、検索条件206を変更した方が好ましいを判断した場合には、検索条件206を変更した後、必要に応じて再度検索処理を行い、アイコン登録ボタン700を選択する。
【0045】
(3)アイコン(ファイル)の生成処理
図7に示したアイコン登録ボタン700が選択されると、検索条件管理部201は、検索条件206のファイルおよびアイコンを生成する処理を行う。具体的には、例えば、アイコンを一覧表示してユーザに所望のアイコンを選択させる処理、必要に応じてアイコンに名称を付ける処理および検索条件206のファイルを生成する処理等を行い、検索条件206のファイルとアイコンの描画情報とを関連づけて、検索条件ファイル格納部202に格納する。
【0046】
このようにして、検索条件206のファイルおよびアイコンを生成すると、図8に示すように、クライアント100のデスクトップ800に検索条件206のアイコン801〜803が画面表示されることになる。図8において、例として挙げた検索条件「マイクロプロセッサの開発動向」は、アイコン801として表示されている。なお、図8においては、デスクトップ800に検索条件206のアイコンを表示することにしたが、表示する場所をデスクトップ800に限定するものではない。
【0047】
(4)生成したアイコンを用いた検索処理
次に、上述したようにして生成したアイコンを用いた検索処理について説明する。アイコンを用いて検索処理を行うには、図8に示したように表示されたアイコン801〜803のいずれかを入力装置200で選択するだけで良い。
【0048】
具体的には、例えば、アイコン801が選択されたとすると、クライアント100の検索条件管理部201は、選択されたアイコン801に該当する検索条件を検索条件ファイル格納部202から読み出して、検索サーバ103に出力する。検索サーバ103は、図5を用いて説明したようにして検索処理を行い、文書リスト308をクライアント100に出力する。検索条件管理部201は、検索サーバ103から文書リスト308を入力し、入力した文書リスト308に基づいて、図7に示したような文書一覧を画面表示する。その結果、ユーザは、一覧表示された文書のいずれかを選択することにより、所望の文書について閲覧,加工等を行うことができる。なお、検索処理の詳細については、図5を用いて説明した通りであるため、ここでは詳細な説明を省略する。
【0049】
このように、実施の形態1の情報検索装置によれば、検索条件206をアイコンとして登録することができるようにしたため、所望のアイコンを選択するだけで、該当する情報を検索し、画面表示することができる。したがって、同一の検索条件206で定期的に検索を行う場合等において、検索処理の利便性の向上を図ることができる。
【0050】
また、検索条件206をアイコンとして登録しておくことにより、コンピュータの初心者であっても容易に情報の検索を行うことができる。すなわち、アイコンを選択するのみであるため、ユーザに検索処理を意識させることがなく、まるで情報が分類されたフォルダ(またはディレクトリ)を開く感覚で検索処理を行うことができる。
【0051】
なお、生成した検索条件206のファイルを他のユーザに配布することができ、他人数のユーザで同一の検索条件206を共有することもできる。
【0052】
〔実施の形態2〕
次に、実施の形態2の情報検索装置について説明する。実施の形態2の情報検索装置は、実施の形態1の情報検索装置において、保存された検索条件206に基づいて、定期的に該当する情報を検索して前回の検索結果と比較し、検索結果が前回と異なる場合に、アイコンの表示色または/および表示形態を変更して、情報が更新されていることをユーザに通知することができるようにしたものである。
【0053】
図9は、実施の形態2の情報検索装置におけるクライアント100のブロック構成図である。図9に示すクライアント100は、図2に示した構成以外に、保存された検索条件206毎に、少なくとも前回の検索結果である文書リスト308を格納する文書リスト格納部900と、保存された検索条件206に基づいて、検索処理を定期的に行うタイミングを規定した検索実行条件を格納する検索実行条件格納部901と、検索実行条件格納部901に格納された検索実行条件に基づいて、検索処理の実行を制御する検索実行管理部902と、検索実行管理部902の制御によって実行された検索処理によって得た文書リスト308と文書リスト格納部900に格納された文書リスト308とを比較し、2つの文書リスト308が同一であるか否かを判定する判定部903とを備えている。
【0054】
次に、実施の形態2の情報検索装置の動作について説明する。図10は、実施の形態2の情報検索装置における検索処理を示すフローチャートである。
【0055】
まず、ユーザは、入力装置200を操作して検索条件管理部201に指示を出し、検索処理を定期的に実行するための検索実行条件を入力する。例えば、起動時に実行,毎日0:00に実行,月曜日の0:00に実行等を検索条件206として規定することができる。また、検索条件ファイル毎に異なる検索実行条件を設定することもできる。入力された検索実行条件は、検索実行条件格納部901に格納される。
【0056】
なお、ここで検索処理を説明するにあたり、文書リスト格納部900には、各検索条件ファイルの検索条件206に基づいて検索処理を行った際の文書リスト308が格納されているものとする。
【0057】
そして、検索実行管理部902は、検索実行条件格納部901に格納された検索実行条件を参照し、検索を実行すべき時間になったか否かを判定する(S1001)。ステップS1001において、検索を実行すべき時間になったと判定した場合、検索実行管理部902は、検索条件ファイル格納部202から該当する検索条件206を読み出して、検索サーバ103に出力する。
【0058】
検索サーバ103は、クライアント100から検索条件206を入力し、入力した検索条件206に基づいて検索処理を実行し、検索結果として文書リスト308を出力する(S1002)。なお、検索処理の詳細については、実施の形態1において図5を用いて説明した通りであるため、ここでは詳細な説明を省略する。
【0059】
クライアント100の判定部903は、検索サーバ103から文書リスト308を入力すると、文書リスト格納部900から該当する検索条件206の前回の文書リスト308を入力して比較する(S1003)。
【0060】
ステップS1004において、判定部903が2つの文書リスト308の内容が同一であると判定した場合、該当する検索条件206についての検索処理を終了する。
【0061】
一方、ステップS1004において、判定部903が2つの文書リスト308の内容が異なると判定した場合、検索条件管理部201は、該当する検索条件206のアイコンの表示色または/および表示形態を変更する処理を行って検索処理を終了する(S1005)。
【0062】
以上の処理が各検索条件ファイル毎に行われ、必要に応じてアイコンの表示色や表示形態が変更される。ユーザは、アイコンの表示色や表示形態が変更されている場合に、その検索条件206に該当する情報,即ち文書DB101中の情報が更新されていることを知ることができる。
【0063】
このように、実施の形態2の情報検索装置によれば、保存された検索条件206に基づいて、定期的に該当する情報を検索して前回の検索結果と比較し、検索結果が前回と異なる場合に、アイコンの表示色または/および表示形態を変更するため、ユーザは自ら検索処理を行って確認するまでもなく、情報が更新されていることを知ることができる。したがって、いちいちアイコンを選択して検索を行い、情報が更新されているか否かを確認する手間を省略することができ、定期的に情報の更新状況を確認したい場合の利便性の向上を図ることができる。
【0064】
また、実施の形態1および2の情報検索装置において、検索した情報に関して、ユーザが検索結果としてふさわしいと思う情報やふさわしくないと思う情報については、その結果を情報管理サーバ103にフィードバックすることができる。すなわち、ユーザは、検索結果としてふさわしいと思う情報に対して、正の重み、例えば「+」を指定することができ、検索結果としてふさわしくないと思う情報に対して負の重み、例えば「−」を指定することができる。その結果、入力した重みが正の指定である場合には、転置ファイル102中の該当する情報の重みが強化され、入力した重みが負の指定である場合には、情報の重みが弱められる。
【0065】
また、実施の形態1および2の情報検索装置においては、登録した検索条件206について、文書を検索する処理を行う毎にベクター表現に変換する処理が必要となるが、検索条件ファイル格納部202に検索条件206を格納する際に、検索条件206をベクター表現に変換して格納することにして、ベクター表現に変換する処理を1回で済むようにすることができる。
【0066】
また、ベクトル空間法による検索処理を行うことを前提として実施の形態1および2の情報検索装置について説明したが、ベクトル空間法による検索処理ではなく、ブーリアン検索による検索処理を用いることにしても良い。
【0067】
さらに、実施の形態1および2で説明した情報検索装置は、予め用意されたプログラムをコンピュータやワークステーションで実行することによって実現される。このプログラムは、ハードディスク,フロッピーディスク,CD−ROM,MO,DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また、このプログラムは、上記記録媒体を介して、またはネットワークを介して配布することができる。
【0068】
【発明の効果】
以上説明したように、本発明の情報検索装置によれば、検索条件の保存を指定するための指定手段と、指定手段を介して検索条件の保存が指定されると、検索条件のファイルおよびアイコンを生成して検索条件を保存する検索条件保存手段と、検索条件保存手段で生成したアイコンを画面表示するアイコン表示手段と、アイコン表示手段で画面表示されたアイコンを選択するための選択手段と、を備え、検索手段は、選択手段を介して選択されたアイコンに基づいて、該当する情報を検索するため、所望のアイコンを選択するだけで、該当する情報を検索し、画面表示することができる。したがって、同一の検索条件で定期的に検索を行う場合等において、検索処理の利便性の向上を図ることができる。
【0069】
また、本発明の情報検索装置によれば、上記に記載の情報検索装置において、さらに、検索条件保存手段で保存した検索条件毎に、少なくとも検索手段による前回の検索結果を第1の検索結果として保持する検索結果保持手段と、予め設定された検索実行条件に基づいて、検索手段を制御して所定のタイミングで検索処理を実行させる検索実行制御手段と、検索実行制御手段の制御に基づいて検索処理を行った結果を第2の検索結果として入力し、入力した第2の検索結果と検索結果保持手段に保持された第1の検索結果とを比較して、第1および第2の検索結果が同一か否かを判定する検索結果判定手段と、を備え、アイコン表示手段は、検索結果判定手段の判定結果を入力し、第1および第2の検索結果が異なる場合に、アイコンの表示色または/および表示形態を変更するため、ユーザは自ら検索処理を行って確認するまでもなく、情報が更新されていることを知ることができる。したがって、いちいちアイコンを選択して検索を行い、情報が更新されているか否かを確認する手間を省略することができ、定期的に情報の更新状況を確認したい場合の利便性の向上を図ることができる。
【0070】
さらに、本発明のコンピュータ読み取り可能な記録媒体によれば、上記に記載の情報検索装置の各手段としてコンピュータを機能させるためのプログラムを記録したため、このプログラムをコンピュータに実行させることにより、所望のアイコンを選択するだけで、該当する情報を検索し、画面表示することができ、同一の検索条件で定期的に検索を行う場合等において、検索処理の利便性の向上を図ることができる情報検索装置を実現することができる。
【図面の簡単な説明】
【図1】実施の形態1の情報検索装置のシステム構成図である。
【図2】図1に示したクライアントのブロック構成図である。
【図3】図1に示した検索サーバの処理を示す概略ブロック図である。
【図4】実施の形態1の情報検索装置において、転置ファイルの生成処理を示すフローチャートである。
【図5】実施の形態1の情報検索装置において、文書の検索処理を示すフローチャートである。
【図6】実施の形態1の情報検索装置において、文書リストの一例を示す説明図である。
【図7】実施の形態1の情報検索装置において、検索した文書を一覧表示した様子の一例を示す説明図である。
【図8】実施の形態1の情報検索装置において、検索条件のアイコンを画面表示した様子の一例を示す説明図である。
【図9】実施の形態2の情報検索装置におけるクライアントのブロック構成図である。
【図10】実施の形態2の情報検索装置における検索処理を示すフローチャートである。
【符号の説明】
100 クライアント
101 文書DB
102 転置ファイル
103 検索サーバ
104 ネットワーク
200 入力装置
201 検索条件管理部
202 検索条件ファイル格納部
203 出力装置
204 入出力部
206 検索条件
300 自然言語処理モジュール
301 辞書
302 文法辞書
303 ドキュメント・セット
304 データベース・ビルド・コンポーネント
305 クエリー・ビルド・コンポーネント
306 クエリー・ドキュメント
307 検索エンジン
308 文書リスト
700 アイコン登録ボタン
800 デスクトップ
801〜803 アイコン
900 文書リスト格納部
901 検索実行条件格納部
902 検索実行管理部
903 判定部
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an information search device that improves the convenience of search processing when storing search conditions and displaying the stored search conditions as icons, for example, when performing a search periodically under the same search conditions, and the like The present invention relates to a computer-readable recording medium that records a program for causing a computer to function as the apparatus.
[0002]
[Prior art]
Along with the development of computers, documents that are recorded and stored on paper as a medium are generally handled as digitized information, and a large amount of digitized documents are accumulated in a database. It has become.
[0003]
By the way, as a large amount of electronic documents are accumulated, a search technique that can easily find a desired document from a large amount of documents becomes important. In particular, today, when everyone works using a computer, it is possible to construct a search system that allows a beginner of a computer to easily search for a desired document without using a special technique. It becomes an important point.
[0004]
One technique for facilitating search is a technique that enables a user to input search conditions using a natural language normally used by humans. With the recent development of natural language processing technology, this technology is being incorporated into many search systems.
[0005]
[Problems to be solved by the invention]
However, in the conventional search system, the search condition can be input in a natural language to facilitate the input of the search condition. However, when searching with the same search condition, the search condition is set again. There was a problem of having to re-enter.
[0006]
In addition, the search conditions that have been entered are saved, and the saved search conditions can be read and searched, but the operations for saving and reading the search conditions are complicated. There was a problem that it was not easy to use.
[0007]
The present invention has been made in view of the above, and it is convenient for search processing when the search condition is saved, and the saved search condition is displayed as an icon so that the search is periodically performed under the same search condition. The purpose is to improve the performance.
[0008]
[Means for Solving the Problems]
To achieve the above objective, According to the present invention An information search device includes an information search device including a search unit that performs a search process for corresponding information based on a search condition, a specification unit for specifying storage of the search condition, and the specification unit via the specification unit. When storage of search conditions is specified, search condition storage means for generating the search condition file and icon and storing the search conditions, and icon display means for displaying the icons generated by the search condition storage means on the screen Selection means for selecting an icon displayed on the screen by the icon display means, and the search means searches for corresponding information based on the icon selected through the selection means. is there.
[0009]
Also, According to the present invention Information retrieval device the above In addition, the information search device according to claim 1 further includes preset search result holding means for holding at least a previous search result by the search means as a first search result for each search condition stored by the search condition storage means. Search execution control means for controlling the search means to execute the search processing at a predetermined timing based on the search execution conditions, and results of performing the search processing based on the control of the search execution control means. Whether the first and second search results are the same by comparing the input second search result with the first search result held in the search result holding means. Search result determination means for determining whether the icon display means inputs the determination result of the search result determination means, and the icon is different when the first and second search results are different. And it changes the display color and / or display mode.
[0010]
further, According to the present invention Computer-readable recording media the above A program for causing a computer to function as each means of the information search device described in 1 is recorded.
[0011]
DETAILED DESCRIPTION OF THE INVENTION
DESCRIPTION OF THE PREFERRED EMBODIMENTS Embodiments of an information retrieval apparatus of the present invention and a computer-readable recording medium that records a program for causing a computer to function as the apparatus will be described below in detail with reference to the accompanying drawings.
[0012]
[Embodiment 1]
FIG. 1 is a system configuration diagram of the information search apparatus according to the first embodiment. The information search apparatus shown in FIG. 1 transposes a plurality of clients 100 having a function of storing search conditions and displaying the stored search conditions as icons, and documents stored in a document DB (database) 101. A search engine that can generate a file 102 and perform a vector space search (for example, CARITECH CLARIT, etc.) is input. Search conditions are input from the client 100, and the transposed file 102 is stored based on the input search conditions. The search server 103 is used to search for a corresponding document, and a list of searched documents is output to the client 100. The network 104 connects the client 100, the search server 103, and the like.
[0013]
In FIG. 1, a document DB 101 stores a plurality of documents created by the client 100 or the like, and the stored document is any type of document such as a word processor document or a structured document such as SGML or HTML. There may be. In the first embodiment, a document stored in the document DB 101 is set as a search target, but the search target document is not limited to the document in the document DB 101.
[0014]
The transposed file 102 defines the relationship between a plurality of documents in the document DB 101 and a plurality of index words extracted from each of the plurality of documents by a method described later, thereby determining how important an index word is in each document. The vocabulary is indicated using a vector expression, and the corresponding document can be searched using this index word.
[0015]
Specifically, one document is divided into sub-document units composed of a plurality of predetermined sentences, the noun phrases that are the index words are extracted from the sub-documents, and each extracted noun phrase appears in the sub-document. Statistical information such as frequency and distribution in the entire document DB 101 is obtained, and each sub-document is converted into a vector expression using the obtained statistical information for each noun phrase. A vector representation of the document is generated based on the vector representation of the converted subdocument. The transposed file 102 stores the document in the document DB 101 expressed as a vector in this way.
[0016]
Each index word can be weighted according to the importance in the corresponding document. Further, the vector representation of the document may be generated based on the vector representation of the subdocument when performing an actual search.
[0017]
The client 100 and the search server 103 are configured by a personal computer, a workstation, or the like. FIG. 2 is a block configuration diagram of the client 100. The client 100 generates a search condition file and icons describing conditions for searching for a document having a specific content, stores and manages the search conditions, and outputs the search conditions to the search server 103, A list of documents corresponding to the search condition is input from 103 and a list of searched documents is displayed.
[0018]
In FIG. 2, an input device 200 includes a keyboard, a mouse, and the like, and inputs a search condition describing a condition for searching for a document having a specific content, specifies execution of a search process based on the input search condition, and inputs the search condition. This is for specifying generation of a search condition file and icon, specifying execution of search processing by selecting the generated icon, and the like. Here, the search condition may be any of a sentence describing the characteristics of a document to be searched in a natural language, a search formula, a set of keywords, a document as an example of a document to be searched, and the like. When the search condition is a document, the file name of the document can be specified. In addition, the search condition can include a constraint condition such as a file name, a creation date, and a creator.
[0019]
The search condition management unit 201 generates a search condition file and an icon input by the input device 200 to store and manage the search condition. When an icon is selected via the input device 200, the search condition management unit 201 displays the selected icon. Based on this, the corresponding search condition is output to the search server 103, the corresponding document list is input, and the display processing of the searched document list is controlled.
[0020]
The search condition file storage unit 202 stores a search condition file and icon drawing information in association with each other.
[0021]
The output device 203 is a CRT or the like, and displays a search condition icon on the screen based on the icon drawing information stored in the search condition file storage unit 202 and a document list that is a search result input from the search server 103. Is displayed.
[0022]
The input / output unit 204 serves as an interface between the input device 200, the output device 203 and the network 104 and the search condition management unit 201.
[0023]
FIG. 3 is a schematic block diagram showing processing of the search server 103. The search server 103 performs processing for generating a vector representation of a document in the document DB 101 and registering it in the transposed file 102 and processing for searching for a document corresponding to the search condition 206 using search processing using a vector space method. Is what you do.
[0024]
In the search server 103, the process registered in the transposed file 102 is performed by the natural language processing module 300 and the database build component 304. Specifically, the natural language processing module 300 inputs a document from the document DB 101, recognizes the format of the document, a dictionary 301 storing part-of-speech information, etc., and a grammar dictionary 302 for analyzing the dependency of each word. Are used to perform analysis processing such as morphological analysis, syntax analysis, and noun phrase extraction to generate a document set 303 including the above-described noun phrase list for each sub-document. The database build component 304 inputs the document set 303 generated by the natural language processing module 300, converts each subdocument in the input document set 303 into a vector representation, and based on the vector representation of the subdocument. A vector representation of the document is generated and registered in the transposed file 102.
[0025]
On the other hand, the document search process is performed by the natural language processing module 300, the query build component 305, and the search engine 307. Specifically, the natural language processing module 300 inputs a search condition 206 from the client 100 and uses a dictionary 301 storing part-of-speech information and the like and a grammatical dictionary 302 for analyzing the dependency of each word, Analysis processing such as syntactic analysis and noun phrase extraction is performed to generate a document set 303 including a list of noun phrases in the search condition 206. The query build component 305 inputs the document set 303, obtains statistical information such as the appearance frequency in the search condition 206, the distribution in the entire document DB 101, and the like for each noun phrase constituting the search condition 206. Using the information, a query document 306 is generated by converting the search condition 206 into a vector expression. The search engine 307 inputs the query document 306 generated by the query build component 305, compares the vector of each document in the transposed file 102 with the vector of the query document 306, and compares the query document 306 with the query document 306. A score corresponding to the similarity is assigned to each document, and a document list 308 to which a score exceeding a predetermined threshold is assigned is output as a search result.
[0026]
1 shows a configuration in which the document DB 101 and the transposed file 102 are independently connected to the network 104. However, a configuration in which these are directly connected to the search server 103 may be employed. In FIG. 1, the information search apparatus according to the first embodiment is configured as a system via the network 104, but the processing of the client 100 and the search server 103 may be performed by one computer. it can.
[0027]
Next, regarding the operation of the information search apparatus having the above-described configuration, (1) transposed file generation processing, (2) document search processing, (3) icon (file) generation processing, and (4) generated icon This will be described in detail in the order of the document search process using.
[0028]
(1) Transposed file generation processing
FIG. 4 is a flowchart showing a transposed file generation process. When a new document is registered in the document DB 101 (S401), the search server 103 starts processing for inputting this document and registering it in the transposed file 102 (S402).
[0029]
In the search server 103, the natural language processing module 300 performs processing for analyzing the document input in step S402 (S403). Specifically, a process for determining what format the input document is, such as a word processor document or a structured document such as HTML, is performed. Thereafter, syntax analysis such as morphological analysis and dependency is performed using the dictionary 301 and the grammar dictionary 302, and the document is divided into a plurality of subdocuments, and a noun phrase is extracted from the divided subdocuments.
[0030]
Then, the natural language processing module 300 generates a noun phrase list for each sub-document based on the processing result in step S403, and generates a document set 303 including the generated noun phrase list (S404).
[0031]
Thereafter, the database build component 304 inputs the document set 303 generated by the natural language processing module 300, generates a vector representation of the document, and registers it in the transposed file 102 (S405).
[0032]
Specifically, each noun phrase of the sub-document in the document set 303 is used as an index word of the transposed file 102, and statistical information such as the appearance frequency in the sub-document and the distribution in the entire document DB 101 is obtained. Convert sub-documents into vector representations using statistical information. This process is performed for all subdocuments in the document set 303, and a vector representation of the document is generated and registered in the transposed file 102 based on the vector representation of the converted subdocument.
[0033]
(2) Document search processing
Next, processing for searching for a corresponding document based on the search conditions registered as described above will be described. FIG. 5 is a flowchart showing document search processing. The information search apparatus according to the first embodiment generates and saves / manages a file and an icon of the search condition 206. Here, the search condition 206 to be saved / managed is input, and at least It is assumed that a search condition file and an icon are generated only after the search process is performed once and it is confirmed that an optimum search result can be obtained. However, a file and an icon may be immediately generated and stored for the input search condition 206 without performing a search process.
[0034]
The search condition management unit 201 of the client 100 inputs the search condition 206 via the input device 200 when the input of the search condition 206 is performed on the input device 200 (S501). Here, it is assumed that “microprocessor development trend” is input as an example of the search condition 206.
[0035]
Subsequently, when a search request is input via the input device 200, the search condition management unit 201 outputs the search condition 206 input in step S502 to the search server 103 (S503).
[0036]
The search server 103 inputs the search condition 206 from the client 100, and the natural language processing module 300 analyzes the search condition 206 (S504). Specifically, syntax analysis processing such as morphological analysis and dependency is performed using the dictionary 301 and the grammar dictionary 302.
[0037]
The natural language processing module 300 extracts a noun phrase corresponding to the index word in the transposed file 102 from the search condition 206 based on the analysis result in step S504, and generates a document set 303 including noun phrases. (S505).
[0038]
Subsequently, the query build component 305 inputs the document set 303 from the natural language processing module 300, and for each noun phrase constituting the input document set 303, the appearance frequency in the search condition 206, the entire document DB 101. Statistical information such as distribution is obtained, and a query document 306 is generated by converting the document set 303 into a vector expression using the obtained statistical information (S506).
[0039]
The search engine 307 inputs the query document 306 generated by the query build component 305, compares the vector expression of each document in the transposed file 102 with the query document 306 (vector expression of the search condition), and executes the query. A score corresponding to the degree of similarity with the document 306 is assigned to each document (S507). That is, the search process by the vector space method is executed.
[0040]
The score corresponding to the similarity is a representation of the similarity between each document and the query document 306 based on the cosine distance. A document with a higher score is more similar to the query document 306. Represents.
[0041]
Then, the search engine 307 selects a document with a score exceeding the threshold based on a preset score threshold, generates a document list 308 based on the selected document, and outputs it as a search result. (S508).
[0042]
FIG. 6 is an explanatory diagram showing an example of the document list 308. As shown in FIG. 6, the document list 308 displays score rankings, document names, creation dates, and the like according to the similarity to the query document 306. In the first embodiment, since the search condition 206 input in step S502 is “microprocessor development trend”, documents regarding the microprocessor are listed.
[0043]
The search condition management unit 201 of the client 100 inputs the document list 308 from the search server 103, and displays a list of document names in order from the highest ranking document based on the input document list 308 (S509).
[0044]
FIG. 7 is an explanatory diagram showing an example of a list of searched documents. The user can display the selected document on the screen by selecting the desired document from the document list shown in FIG. Further, the user determines whether or not the search condition 206 may be registered based on the search result, and generates a file and an icon for the search condition 206 by selecting an icon registration button 700 shown in FIG. Get into work. On the other hand, if it is determined that it is preferable to change the search condition 206, after changing the search condition 206, the search process is performed again as necessary, and the icon registration button 700 is selected.
[0045]
(3) Icon (file) generation processing
When the icon registration button 700 shown in FIG. 7 is selected, the search condition management unit 201 performs processing for generating a file and an icon for the search condition 206. Specifically, for example, a process for displaying a list of icons and allowing the user to select a desired icon, a process for naming an icon as necessary, a process for generating a file for the search condition 206, and the like are performed. Are associated with the icon drawing information and stored in the search condition file storage unit 202.
[0046]
When the file and icon of the search condition 206 are generated in this manner, the icons 801 to 803 of the search condition 206 are displayed on the desktop 800 of the client 100 as shown in FIG. In FIG. 8, the search condition “microprocessor development trend” given as an example is displayed as an icon 801. In FIG. 8, the search condition 206 icon is displayed on the desktop 800, but the display location is not limited to the desktop 800.
[0047]
(4) Search processing using the generated icon
Next, a search process using the icon generated as described above will be described. In order to perform a search process using an icon, it is only necessary to select any of the icons 801 to 803 displayed as shown in FIG.
[0048]
Specifically, for example, if the icon 801 is selected, the search condition management unit 201 of the client 100 reads the search condition corresponding to the selected icon 801 from the search condition file storage unit 202 and sends it to the search server 103. Output. The search server 103 performs search processing as described with reference to FIG. 5 and outputs the document list 308 to the client 100. The search condition management unit 201 inputs the document list 308 from the search server 103 and displays the document list as shown in FIG. 7 on the screen based on the input document list 308. As a result, the user can browse and process a desired document by selecting one of the listed documents. Note that the details of the search process are as described with reference to FIG. 5, and thus detailed description thereof is omitted here.
[0049]
As described above, according to the information search apparatus of the first embodiment, the search condition 206 can be registered as an icon. Therefore, by selecting a desired icon, the corresponding information is searched and displayed on the screen. be able to. Therefore, the convenience of the search process can be improved when a search is periodically performed using the same search condition 206.
[0050]
In addition, by registering the search condition 206 as an icon, even a computer beginner can easily search for information. That is, since only the icon is selected, the search process can be performed as if the user opened the folder (or directory) in which the information is classified without making the user aware of the search process.
[0051]
The generated search condition 206 file can be distributed to other users, and the same search condition 206 can be shared by other users.
[0052]
[Embodiment 2]
Next, the information search apparatus according to the second embodiment will be described. The information search device according to the second embodiment is the information search device according to the first embodiment. The information search device according to the first embodiment searches the corresponding information periodically based on the stored search condition 206 and compares it with the previous search result. Is different from the previous time, the display color or / and display form of the icon is changed to notify the user that the information has been updated.
[0053]
FIG. 9 is a block configuration diagram of the client 100 in the information search apparatus according to the second embodiment. In addition to the configuration shown in FIG. 2, the client 100 shown in FIG. 9 includes at least a document list storage unit 900 that stores a document list 308 that is a previous search result for each saved search condition 206, and a saved search. Based on the condition 206, a search execution condition storage unit 901 that stores a search execution condition that defines the timing for periodically performing the search process, and a search process based on the search execution condition stored in the search execution condition storage unit 901 The search execution management unit 902 that controls the execution of the document, the document list 308 obtained by the search process executed under the control of the search execution management unit 902, and the document list 308 stored in the document list storage unit 900 are compared, and 2 A determination unit 903 that determines whether the two document lists 308 are the same.
[0054]
Next, the operation of the information search apparatus according to the second embodiment will be described. FIG. 10 is a flowchart showing search processing in the information search apparatus according to the second embodiment.
[0055]
First, the user operates the input device 200 to issue an instruction to the search condition management unit 201, and inputs a search execution condition for periodically executing the search process. For example, the search condition 206 can be defined to be executed at startup, executed at 0:00 every day, or executed at 0:00 on Monday. Different search execution conditions can be set for each search condition file. The input search execution condition is stored in the search execution condition storage unit 901.
[0056]
In describing the search process here, it is assumed that the document list storage unit 900 stores the document list 308 when the search process is performed based on the search condition 206 of each search condition file.
[0057]
Then, the search execution management unit 902 refers to the search execution conditions stored in the search execution condition storage unit 901 and determines whether it is time to execute the search (S1001). If it is determined in step S1001 that it is time to execute the search, the search execution management unit 902 reads the corresponding search condition 206 from the search condition file storage unit 202 and outputs it to the search server 103.
[0058]
The search server 103 inputs the search condition 206 from the client 100, executes search processing based on the input search condition 206, and outputs a document list 308 as a search result (S1002). Note that the details of the search process are as described with reference to FIG. 5 in the first embodiment, and thus detailed description thereof is omitted here.
[0059]
When the document list 308 is input from the search server 103, the determination unit 903 of the client 100 inputs and compares the previous document list 308 of the corresponding search condition 206 from the document list storage unit 900 (S1003).
[0060]
If the determination unit 903 determines in step S1004 that the contents of the two document lists 308 are the same, the search process for the corresponding search condition 206 is terminated.
[0061]
On the other hand, if the determination unit 903 determines that the contents of the two document lists 308 are different in step S1004, the search condition management unit 201 changes the display color or / and display form of the icon of the corresponding search condition 206. To complete the search process (S1005).
[0062]
The above processing is performed for each search condition file, and the display color and display form of the icon are changed as necessary. The user can know that information corresponding to the search condition 206, that is, information in the document DB 101 has been updated when the display color or display form of the icon is changed.
[0063]
As described above, according to the information search apparatus of the second embodiment, the corresponding information is periodically searched based on the stored search condition 206 and compared with the previous search result, and the search result is different from the previous search result. In this case, since the display color or / and display form of the icon is changed, the user can know that the information has been updated without performing a search process and confirming it. Therefore, it is possible to save the trouble of selecting and searching for each icon and checking whether the information has been updated, and to improve convenience when it is necessary to periodically check the information update status. Can do.
[0064]
In the information retrieval apparatus according to the first and second embodiments, regarding the retrieved information, the information that the user thinks is appropriate as the search result or the information that the user thinks is not appropriate can be fed back to the information management server 103. . That is, the user can specify a positive weight, for example, “+” for information that is considered appropriate as a search result, and a negative weight, for example, “−”, for information that is not appropriate as a search result. Can be specified. As a result, when the input weight is positive designation, the weight of the corresponding information in the transposed file 102 is strengthened, and when the input weight is negative designation, the information weight is weakened.
[0065]
In the information search apparatus of Embodiments 1 and 2, the registered search condition 206 needs to be converted into a vector expression every time a document search process is performed. When storing the search condition 206, the search condition 206 is converted into a vector expression and stored, so that the process of converting into the vector expression can be performed only once.
[0066]
Also, the information search apparatus according to the first and second embodiments has been described on the assumption that search processing by the vector space method is performed. However, instead of search processing by the vector space method, search processing by Boolean search may be used. .
[0067]
Furthermore, the information retrieval apparatus described in the first and second embodiments is realized by executing a program prepared in advance on a computer or a workstation. This program is recorded on a computer-readable recording medium such as a hard disk, floppy disk, CD-ROM, MO, or DVD, and is executed by being read from the recording medium by the computer. The program can be distributed via the recording medium or via a network.
[0068]
【The invention's effect】
As described above, the information retrieval apparatus of the present invention. In place According to the specification means for specifying the storage of the search condition, and the search condition storage means for generating the search condition file and icon and storing the search condition when the storage of the search condition is specified via the specifying means. And an icon display means for displaying the icon generated by the search condition storage means on the screen, and a selection means for selecting the icon displayed on the screen by the icon display means. The search means is selected via the selection means. Since the corresponding information is searched based on the icon, the corresponding information can be searched and displayed on the screen simply by selecting the desired icon. Therefore, the convenience of search processing can be improved when searching periodically under the same search conditions.
[0069]
Also, the information retrieval device of the present invention In place According to the above And a search result holding means for holding at least a previous search result by the search means as a first search result for each search condition stored by the search condition storage means, and a preset search Based on the execution condition, the search execution control means for controlling the search means to execute the search processing at a predetermined timing, and the result of the search processing based on the control of the search execution control means is input as the second search result Search result determination means for comparing the input second search result with the first search result held in the search result holding means to determine whether or not the first and second search results are the same. The icon display means inputs the determination result of the search result determination means, and changes the icon display color or / and display form when the first and second search results are different. Over The is neither to confirm conducted their own search process, it is possible to know that the information has been updated. Therefore, it is possible to save the trouble of selecting and searching for each icon and checking whether the information has been updated, and to improve convenience when it is necessary to periodically check the information update status. Can do.
[0070]
Furthermore, the computer-readable recording medium of the present invention To the body According to the above Since the program for causing the computer to function as each means of the information search device described in the above is recorded, by causing the computer to execute this program, the corresponding information is searched and displayed on the screen simply by selecting a desired icon. Thus, an information search apparatus that can improve the convenience of search processing when the search is periodically performed under the same search condition can be realized.
[Brief description of the drawings]
FIG. 1 is a system configuration diagram of an information search apparatus according to a first embodiment.
FIG. 2 is a block diagram of the client shown in FIG.
FIG. 3 is a schematic block diagram showing processing of the search server shown in FIG. 1;
4 is a flowchart showing transposed file generation processing in the information search apparatus according to Embodiment 1. FIG.
FIG. 5 is a flowchart showing document search processing in the information search apparatus according to the first embodiment;
6 is an explanatory diagram illustrating an example of a document list in the information search apparatus according to Embodiment 1. FIG.
7 is an explanatory diagram illustrating an example of a state in which searched documents are displayed as a list in the information search apparatus according to Embodiment 1. FIG.
FIG. 8 is an explanatory diagram illustrating an example of a state where a search condition icon is displayed on the screen in the information search apparatus according to the first embodiment;
FIG. 9 is a block configuration diagram of a client in the information search apparatus according to the second embodiment.
FIG. 10 is a flowchart showing search processing in the information search apparatus of the second embodiment.
[Explanation of symbols]
100 clients
101 Document DB
102 Transposed file
103 Search server
104 network
200 input device
201 Search condition management department
202 Search condition file storage
203 Output device
204 Input / output unit
206 Search conditions
300 Natural language processing module
301 dictionary
302 Grammar dictionary
303 Document set
304 Database Build Component
305 Query Build Component
306 Query Document
307 search engine
308 Document List
700 Icon registration button
800 desktops
801-803 icons
900 Document list storage
901 Search execution condition storage unit
902 Search execution management unit
903 determination unit

Claims (2)

検索条件に基づいて、該当する情報の検索処理を行う検索手段を備えた情報検索装置において、
前記検索条件の保存を指定させるための指定手段と、
前記指定手段を介して前記検索条件の保存が指定されると、前記検索条件のファイルおよびアイコンを生成して前記検索条件を保存する検索条件保存手段と、
前記検索条件保存手段で生成されたアイコンを画面表示するアイコン表示手段と、
前記アイコン表示手段で画面表示されたアイコンを選択させるための選択手段と、
前記検索条件保存手段で保存した検索条件毎に、少なくとも前記検索手段による前回の検索結果(以下「第1の検索結果」という)を保持する検索結果保持手段と、
予め設定された検索実行条件に基づいて、前記検索手段を制御して所定のタイミングで前記検索処理を実行させる検索実行制御手段と、
前記検索実行制御手段の制御に基づいて前記検索処理を行った結果(以下「第2の検索結果」という)を受け付けて、前記第1の検索結果とを比較して、前記第1および第2の検索結果が同一か否かを判定する検索結果判定手段と、を備え、
前記検索手段は、前記選択手段を介して選択されたアイコンに基づいて、該当する情報を検索し、
前記アイコン表示手段は、前記検索結果判定手段の判定結果に基づいて、前記第1の検索結果と第2の検索結果とが異なる場合に、前記アイコンの表示色および表示形態の少なくともいずれか一方を変更することを特徴とする情報検索装置。
In an information search apparatus provided with search means for performing a search process for corresponding information based on a search condition,
Designating means for causing specify the storage of the search condition,
When storage of the search condition is specified through the specifying means, search condition storage means for generating a file and icon of the search condition and storing the search condition;
Icon display means for displaying an icon generated by the search condition storage means on a screen;
Selection means for causing selection screen displayed icons in the icon display means,
Search result holding means for holding at least the previous search result (hereinafter referred to as “first search result”) by the search means for each search condition stored by the search condition storage means;
Search execution control means for controlling the search means to execute the search processing at a predetermined timing based on a preset search execution condition;
A result of performing the search process based on the control of the search execution control means (hereinafter referred to as “second search result”) is received, compared with the first search result, and the first and second Search result determination means for determining whether or not the search results are identical ,
The search means searches for corresponding information based on the icon selected through the selection means ,
The icon display means displays at least one of a display color and a display form of the icon when the first search result and the second search result are different based on the determination result of the search result determination means. An information search apparatus characterized by changing .
前記請求項1に記載の情報検索装置の各手段としてコンピュータを機能させるためのプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。2. A computer-readable recording medium in which a program for causing a computer to function as each means of the information search apparatus according to claim 1 is recorded.
JP20062897A 1997-07-25 1997-07-25 Information retrieval device and computer-readable recording medium recording a program for causing a computer to function as the device Expired - Fee Related JP3767763B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20062897A JP3767763B2 (en) 1997-07-25 1997-07-25 Information retrieval device and computer-readable recording medium recording a program for causing a computer to function as the device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20062897A JP3767763B2 (en) 1997-07-25 1997-07-25 Information retrieval device and computer-readable recording medium recording a program for causing a computer to function as the device

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2005315471A Division JP4000332B2 (en) 2005-10-28 2005-10-28 Information retrieval apparatus and computer-readable recording medium recording a program for causing a computer to function as the apparatus

Publications (2)

Publication Number Publication Date
JPH1145261A JPH1145261A (en) 1999-02-16
JP3767763B2 true JP3767763B2 (en) 2006-04-19

Family

ID=16427551

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20062897A Expired - Fee Related JP3767763B2 (en) 1997-07-25 1997-07-25 Information retrieval device and computer-readable recording medium recording a program for causing a computer to function as the device

Country Status (1)

Country Link
JP (1) JP3767763B2 (en)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2546173T3 (en) 1998-03-13 2015-09-21 Canon Kabushiki Kaisha Apparatus and procedure for information processing
EP1052806B1 (en) 1999-05-13 2006-03-22 Canon Kabushiki Kaisha Apparatus for searching a device on a network
JP2001282841A (en) * 2000-03-31 2001-10-12 Japan Tobacco Inc Data retrieval method using data retrieval condition registration function
JP3631681B2 (en) * 2001-02-23 2005-03-23 株式会社ビーコンインフォメーションテクノロジー Data management system, data management method, and computer program
JP4380494B2 (en) 2004-10-07 2009-12-09 ソニー株式会社 Content management system, content management method, and computer program
JP4774805B2 (en) * 2005-05-25 2011-09-14 セイコーエプソン株式会社 File search device, printing device, file search method and program thereof
JP5147363B2 (en) * 2007-11-09 2013-02-20 株式会社Jvcケンウッド Vehicle operation management device, method and program
JP5212694B2 (en) * 2008-02-12 2013-06-19 日本電気株式会社 Search device and search method
JP5133796B2 (en) * 2008-06-30 2013-01-30 ヤフー株式会社 Search support device
JP5568953B2 (en) * 2009-10-29 2014-08-13 ソニー株式会社 Information processing apparatus, scene search method, and program

Also Published As

Publication number Publication date
JPH1145261A (en) 1999-02-16

Similar Documents

Publication Publication Date Title
JP3691844B2 (en) Document processing method
US6785869B1 (en) Method and apparatus for providing a central dictionary and glossary server
US6968332B1 (en) Facility for highlighting documents accessed through search or browsing
US20020099685A1 (en) Document retrieval system; method of document retrieval; and search server
WO2008141583A1 (en) Character input method, input system and method for updating word lexicon
Witten et al. Managing complexity in a distributed digital library
JP3767763B2 (en) Information retrieval device and computer-readable recording medium recording a program for causing a computer to function as the device
JP4967037B2 (en) Information search device, information search method, terminal device, and program
JP4091146B2 (en) Document retrieval apparatus and computer-readable recording medium recording a program for causing a computer to function as the apparatus
JP3356519B2 (en) Document information retrieval device
JP4469432B2 (en) INTERNET INFORMATION PROCESSING DEVICE, INTERNET INFORMATION PROCESSING METHOD, AND COMPUTER-READABLE RECORDING MEDIUM CONTAINING PROGRAM FOR CAUSING COMPUTER TO EXECUTE THE METHOD
US20020077844A1 (en) Component-description-manual creation support method, component-description-manual creation support system, and computer-readable recording medium
JP4000332B2 (en) Information retrieval apparatus and computer-readable recording medium recording a program for causing a computer to function as the apparatus
JP4499179B1 (en) Terminal device
JPH1115841A (en) Information retrieving device and medium recording information retrieving program
JP3851712B2 (en) Document management system and computer-readable recording medium storing a program for causing a computer to function as the system
JPH1145252A (en) Information retrieval device and computer readable recording medium for recording program for having computer function as the same device
JP4138048B2 (en) Information retrieval device and computer-readable recording medium recording a program for causing a computer to function as the device
JP3059710B1 (en) INFORMATION SEARCH SYSTEM, DATABASE MANAGEMENT DEVICE, DATABASE MANAGEMENT METHOD, AND COMPUTER-READABLE RECORDING MEDIUM RECORDING PROGRAM FOR CAUSING COMPUTER TO EXECUTE THE METHOD
JP4384736B2 (en) Image search device and computer-readable recording medium storing program for causing computer to function as each means of the device
JPH08153117A (en) Device and method for document retrieval
JPH1145249A (en) Information retrieval device and computer-readable recording medium where program for making computer function as same device is recorded
JP3328913B1 (en) Multilingual document retrieval system
JPH1145254A (en) Document retrieval device and computer readable recording medium recorded with program for functioning computer as the device
JPH1145269A (en) Document management support system and computer readable recording medium recorded with program for functioning computer as the system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051028

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060126

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120210

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees