JP2004157965A - Search support device and method, program and recording medium - Google Patents

Search support device and method, program and recording medium Download PDF

Info

Publication number
JP2004157965A
JP2004157965A JP2003048029A JP2003048029A JP2004157965A JP 2004157965 A JP2004157965 A JP 2004157965A JP 2003048029 A JP2003048029 A JP 2003048029A JP 2003048029 A JP2003048029 A JP 2003048029A JP 2004157965 A JP2004157965 A JP 2004157965A
Authority
JP
Japan
Prior art keywords
information
file
auxiliary information
search
support device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003048029A
Other languages
Japanese (ja)
Inventor
Masumi Narita
真澄 成田
Masako Bosu
雅子 望主
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2003048029A priority Critical patent/JP2004157965A/en
Publication of JP2004157965A publication Critical patent/JP2004157965A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a search support device enabling a user to efficiently select necessary files from a list when searching for and browsing files that match search conditions, without confirming the contents of each individual file. <P>SOLUTION: The search support device includes an auxiliary information acquisition means 30 which acquires auxiliary information to be added to a list of files to be browsed when the files matching the search conditions designated by the user are searched for and browsed; an auxiliary information storage means 80 for storing the auxiliary information and the files to be browsed which have acquired the auxiliary information, while associating the auxiliary information with the file; and an auxiliary information output control means 40 for displaying a list of the files to be browsed, while adding the auxiliary information of each file to be browsed in a predetermined display format. Since the auxiliary information from a plurality of viewing points about the contents of the files to be browsed is added to the list of files to be browsed and displayed, the efficiency and accuracy of sorting information are increased without confirming the contents of each file. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
本発明は、検索支援装置、検索支援方法、プログラムおよび記録媒体に関し、特に、ユーザが指定した検索条件に合致するファイルを検索して閲覧する場合に、ユーザが個別に各ファイルを開いて内容を確認しなくても効率的に所望のファイルをリスト中から選別できるようにした検索・閲覧のための表示技術に関する。
【0002】
【従来の技術】
近年、インターネットやイントラネットを介して膨大な量の電子情報ファイルを共有し利用することができるようになった。この膨大な情報源の中から自分の目的に合致する情報のみを取り出すために、ユーザは自分にとって使い勝手のよい検索エンジンを使用している。
【0003】
しかし、現在利用可能な検索エンジンは、ユーザが入力した検索要求に対する検索結果を閲覧対象ファイルの一覧としてディスプレイに表示する際に、それらのファイルのロケーション情報(例えばインターネット上のURL)あるいはファイル中の検索要求に合致した部分の情報のみを付加して提示するといった断片的な付加情報を提示するだけで、ファイルの中身に関して概要がつかめるように複数の観点から抽出した情報を提示していない。
そのために、ユーザは各ファイルにアクセスして内容を確認してから自分が必要とするファイルのみを選別するという作業を余儀なくされ、ユーザが情報選別を効率的に行えないという事態を招いている。
【0004】
【特許文献1】
特開平11−232299号公報
【特許文献2】
特開平11−85786号公報
【0005】
【発明が解決しようとする課題】
検索結果の閲覧対象ファイルに対して、内容に関する情報をユーザに提示する技術として、特許文献1や特許文献2がある。
【0006】
特許文献1の技術では、ネットワーク上に公開または共有されているファイルを検索して閲覧する場合に、その閲覧ファイルに対して過去にユーザが入力した情報(メモ書き等)やアクセス履歴、ファイルの中に含まれるキーワードや単語数といった言語的情報を閲覧時にユーザに提示している。
しかし、閲覧ファイルに関する補助的な情報を提示することにより、そのファイルの読みやすさを向上させるという効果は得られるが、検索結果一覧の中から個々のファイルの中身を見ないで所望のファイルのみを選別するという問題は依然として解決されていない。
【0007】
一方、特許文献2の技術では、検索結果のタイトル情報と特徴語を用いた検索結果分析ツリー図の両方をユーザに提示することにより、ユーザが検索条件を考える際に必要となる検索結果の分析を効率的に行えるようにしている。
しかし、検索結果全体の特徴を反映するような特徴語の相互の関連性を反映したグラフ表示をタイトルリストと並置して提示することにより検索結果の個々の情報と全体像を分析しながら検索条件の改良を試みたり、観点を変えた検索を試みたりすることができるようになるという効果は得られるが、ユーザは全体像を表す特徴語のグラフ表示を分析しながら所望のファイルを選別しなければならない。即ち、全体から個の抽出という作業を行う必要があり、効率的な情報選別という問題は依然として残っている。
【0008】
本発明は、上述の実情を考慮してなされたものであり、ユーザが指定した検索条件に合致するファイルを検索して閲覧する場合に、ユーザが個別に各ファイルを開き、時間をかけて内容を確認しなくても所望のファイルのみをリスト中から効率的に選別できる検索支援装置、検索支援方法、検索支援装置の機能を実行するためのプログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体を提供することを目的とする。
【0009】
【課題を解決するための手段】
上述の目的を達成するために、本発明の請求項1の検索支援装置は、ユーザが指定した検索条件に合致するファイルを検索して閲覧する場合に、閲覧対象ファイルの内容に対する複数の観点からの補助情報を組み合わせて付加した閲覧対象のファイルリストを表示する検索支援装置であって、前記閲覧対象のファイルリストに付加する補助情報を獲得する補助情報獲得手段と、前記補助情報とこの補助情報を獲得した閲覧対象ファイルとを関連づけて格納する補助情報記憶手段と、前記閲覧対象のファイルリストを表示する際、各閲覧対象ファイルの補助情報を所定の表示形式で付加して表示する補助情報出力制御手段とを備えることを特徴とする。
【0010】
また、本発明の請求項2は、請求項1に記載の検索支援装置において、前記補助情報獲得手段は、前記閲覧対象ファイルの書誌情報を補助情報として獲得する書誌情報獲得手段と、前記閲覧対象ファイル中から検索条件と合致する部分の情報を補助情報として獲得する検索語合致箇所獲得手段と、前記閲覧対象ファイルの内容を代表する語句および文を補助情報として獲得する言語情報獲得手段とを有することを特徴とする。
【0011】
また、本発明の請求項3は、請求項2に記載の検索支援装置において、前記検索語合致箇所獲得手段における検索条件と合致する部分の情報は、前記閲覧対象ファイル中から検索条件と合致する部分とその近傍情報であることを特徴とする。
また、本発明の請求項4は、請求項3に記載の検索支援装置において、前記検索語合致箇所獲得手段における近傍情報は、検索条件と合致する部分の開始位置よりも前方の文字列および終了位置よりも後方の文字列を所定の量だけ抽出した文字列であることを特徴とする。
また、本発明の請求項5は、請求項2に記載の検索支援装置において、前記検索語合致箇所獲得手段における検索条件と合致する部分の情報は、前記閲覧対象ファイル中の検索条件と合致する部分の位置情報であることを特徴とする。
【0012】
また、本発明の請求項6は、請求項2に記載の検索支援装置において、前記言語情報獲得手段は、前記閲覧対象ファイルの内容を代表する語句として、検索語が出現している同一文中に共起する名詞句を抽出することを特徴とする。
また、本発明の請求項7は、請求項2に記載の検索支援装置において、前記言語情報獲得手段は、前記閲覧対象ファイルの内容を代表する文を抽出する際に、文書タイプに応じて抽出方法を切り替えるようにしたことを特徴とする。
また、本発明の請求項8は、請求項2、6または7に記載の検索支援装置において、前記補助情報獲得手段は、前記補助情報の獲得量を選択指定する情報抽出量指定手段を有し、前記言語情報獲得手段は、この補助情報の獲得量だけ前記閲覧対象ファイルの内容から代表する語句および文を獲得することを特徴とする。また、本発明の請求項9は、請求項2に記載の検索支援装置において、検索対象となるファイルの内容を代表する語句および文を属性情報として当該ファイルと対応付けて予め記憶しておき、前記言語情報獲得手段は、前記閲覧対象ファイルに対応する属性情報を補助情報として獲得することを特徴とする。
【0013】
また、本発明の請求項10は、請求項1に記載の検索支援装置において、前記補助情報出力制御手段は、前記閲覧対象のファイルリストに付加して表示する補助情報の種類を選択指定する補助情報選択手段を有することを特徴とする。
また、本発明の請求項11は、請求項10に記載の検索支援装置において、補助情報を翻訳対象言語に翻訳する翻訳処理実行手段と、補助情報の翻訳処理の有無および翻訳対象言語を選択指定する補助情報選択手段とを有し、前記補助情報出力制御手段は、翻訳を指定されたときには、補助情報を指定された翻訳対象言語へ翻訳して表示することを特徴とする。
【0014】
また、本発明の請求項12の検索支援方法は、ユーザが指定した検索条件に合致するファイルを検索して閲覧する場合に、閲覧対象ファイルの内容に対する複数の観点からの補助情報を組み合わせて付加した閲覧対象のファイルリストを表示する検索支援方法であって、前記閲覧対象のファイルリストに付加する補助情報を獲得し、前記補助情報とこの補助情報を獲得した閲覧対象ファイルとを関連づけて格納し、前記閲覧対象のファイルリストを表示する際、各閲覧対象ファイルの補助情報を所定の表示形式で付加して表示するようにしたことを特徴とする。
【0015】
また、本発明の請求項13のプログラムは、コンピュータに、請求項1乃至11のいずれかに記載の検索支援装置の機能を実行させるためのプログラムである。
また、本発明の請求項14の記録媒体は、請求項13に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体である。
【0016】
上記構成により、ユーザが指定した検索条件に合致するファイルを検索して閲覧する場合に、閲覧対象のファイルリストに、各対象ファイルの内容に関する複数の観点からの補助情報を組み合わせて付加することにより、ユーザは個別にファイルを開いて内容を確認しなくても自分が必要とするファイルのみをリスト中から効率的に選別することができる。
【0017】
また、閲覧対象ファイルに対して書誌的な情報のみならず検索語が含まれる部分の情報、ファイル中の重要な語句や文といった言語的情報まで補助情報として獲得されるため、ユーザは閲覧対象ファイルの内容について複数の観点から情報を得ることができるようになり、情報選別の効率と精度が向上する。
この検索語が含まれる部分の情報として、その検索語の出現位置の前後の文字列を表示して、ユーザは検索語が閲覧対象ファイルの中でどのような文脈で使用されているのかを知ることができる。
【0018】
また、ファイル中の内容を代表する語句として、検索語が出現している同一文中に共起する名詞句を抽出するため、ユーザは検索語が閲覧対象ファイルの中でどのような文脈で使用されているのかを知ることができるようになり、情報選別が効率的に行えるようになる。
【0019】
さらに、ファイルの内容を代表する文(重要文)を抽出する際に、ユーザは文書タイプに応じて抽出方法を切り替えられるようになり、抽出される重要文の精度が向上し、情報選別がより効率的に行えるようになる。
【0020】
また、抽出する補助情報の量をユーザが選択指定できるため、ユーザは検索の目的や検索対象分野に対する習熟度に応じて、表示される補助情報の量を調節できるようになる。
【0021】
また、閲覧対象ファイルリストに付加される補助情報の種類、補助情報の翻訳処理の有無と翻訳対象言語をユーザ自身が選択できるようになり、ユーザが希望する補助情報のみを提示する、あるいは提示される補助情報を必要に応じて自由に切り替えられるというユーザフレンドリなインタフェースを提供できる。
【0022】
さらに、閲覧対象文書が外国語の文書の場合やユーザの母語が対象文書の言語ではない場合には、表示される補助情報の翻訳の有無や翻訳言語をユーザが選択指定できるため、ユーザが個別に各ファイルを開いて時間をかけて内容を確認しなくても所望のファイルのみをリスト中から効率的に選別できるようになる。
【0023】
また、閲覧対象ファイルをリアルタイムに言語解析してキーとなる言語情報を獲得するかわりに、予め言語情報を抽出し、当該ファイルと関連づけて格納しておくことによって、閲覧するときに言語解析を行う必要がなくなり、より効率的に補助情報を獲得できる。
【0024】
【発明の実施の形態】
以下、図面を参照して本発明の検索支援装置に係る好適な実施形態を説明する。実施形態では、本発明の検索支援装置を検索装置へ組み込んだものとし、また、日本語で書かれた文書を検索対象として説明するが、英語、独語や仏語等の他の言語による文書の検索においても適用することができる。
【0025】
<実施形態1>
図1は、一般の検索装置を実現するためのハードウェア構成を示すブロック図である。図1において、検索装置は、データ等の演算や処理を行うCPU(中央演算処理ユニット)101と、プログラムやデータおよび動作時に一時的に格納する情報等を記憶するメモリ102と、キー操作に基づきプログラムやデータ等を入力するキーボード、タッチパネルや一般にマウスカーソルと呼ばれる目印を移動させると共に、その移動に基づくデータを入力するマウス等の入力装置103と、入力データや処理結果等を表示するCRTディスプレイあるいは液晶ディスプレイ等の表示装置104と、プログラムや検索対象となる情報ファイル群が登録されたデータベースや検索結果を記憶する比較的大容量のハードディスク等の記憶装置105と、それらの各装置を相互に接続するデータバス106とを少なくとも備えている。
【0026】
図2は、本実施形態1の検索装置の機能構成を示すブロック図である。
図2において、検索装置は、検索語入力手段10、検索手段20、補助情報獲得手段30、補助情報出力制御手段40、補助情報選択手段50、ファイル群記憶手段60、ファイルリスト記憶手段70、補助情報記憶手段80とを含んでいる。ここで、本発明の検索支援装置は、補助情報獲得手段30、補助情報出力制御手段40、補助情報選択手段50および補助情報記憶手段80とから構成される。
【0027】
検索語入力手段10は、検索対象の複数の文書等を記憶しているファイル群記憶手段60に対して、閲覧する文書等を特定するための検索語を入力装置103から入力する。
例えば、図3のような検索語入力画面を表示させて、ユーザが検索語『グルメ』を入力して、「検索実行」ボタンを押下する。
【0028】
検索手段20は、検索語入力手段10で指定された検索語(例えば、『グルメ』)によってファイル群記憶手段60を検索し、例えば、検索語との関連度の高いものから5件ずつ閲覧対象ファイルのリストをファイルリスト記憶手段70へ格納する。
ファイル群記憶手段60は、検索対象となる複数のファイルを記憶している。このファイルは、検索装置をインターネット等のネットワークに接続した場合に、このネットワーク上で共有されているファイルであってもよいし、あるいは、検索装置の記憶装置105に記憶されているファイルのいずれであってもかまわない。
【0029】
ファイルリスト記憶手段70には、検索されたファイルのロケーションを格納する。ロケーションとしては、ファイル群記憶手段60を検索装置の記憶装置105に記憶するようにした場合には、この記憶装置105上のファイルアドレスとし、ファイル群記憶手段60をネットワーク上で共有されているファイルとした場合には、そのファイルのURL(Uniform Resource Locator)を用いる。
以下、ファイル群記憶手段60を、ネットワーク上で共有されたファイルとして説明するが検索装置の記憶装置105に記憶された場合にも適用可能である。
【0030】
補助情報獲得手段30は、ファイルリスト記憶手段70に記憶された閲覧対象ファイルをひとつずつ取り出し、この閲覧対象ファイルから獲得した補助情報をこの閲覧対象ファイルと対応づけて補助情報記憶手段80に記憶する。
このように獲得した補助情報と閲覧対象ファイルとを分離して格納するようにしたので、補助情報の管理と利用を容易に行えるようになる。
【0031】
この補助情報記憶手段80のデータ構造は、図4に示すように、閲覧対象の各ファイルに対して、書誌情報、検索語合致箇所情報および言語情報を対応づけて格納する。
書誌情報としては、ファイルのロケーション(例えば、URL)、タイトル名、ファイルの作成者名、作成年月日とファイルサイズ等である。
検索語合致箇所情報としては、検索語に一致した部分の開始位置、終了位置、さらに合致した箇所の前後の所定量(例えば、10文字)の文字列である。この所定量の文字数は、ユーザの指定により適宜変更可能である。
言語情報としては、1つ以上のキーワード、1つ以上の重要文である。このキーワードや重要文の数量もユーザの指定により適宜変更可能である。
【0032】
図5は、補助情報記憶手段80に記憶された1つのファイルに対する補助情報の具体例を示している。
これにより閲覧対象ファイルに対して書誌的な情報のみならず検索語が含まれる部分の情報、ファイル中の重要な語句や文といった言語的情報まで補助情報として獲得されるため、ユーザは閲覧対象ファイルの内容について複数の観点から情報を得ることができるようになり、情報選別の効率と精度が向上する。
【0033】
ファイルリスト記憶手段70に記憶されたすべての閲覧対象ファイルに対して補助情報の獲得処理が終了すると、補助情報出力制御手段40は、予め格納しておいた補助情報表示形式テーブル(図6参照)を参照することにより、補助情報記憶手段80に格納されている補助情報を検索結果の閲覧対象ファイルのリストに付加して表示装置104へ表示する。
【0034】
補助情報表示形式テーブル(図6参照)は、獲得された補助情報(書誌情報、検索語合致箇所情報および言語情報)を表示するときの表示形式を保持するテーブルであり、各補助情報(書誌情報、検索語合致箇所情報および言語情報)の表示項目ごとに、文字列を表示させるときの文字サイズ、文字の色、表示位置および属性等を保持するデータ構造である。
また、補助情報表示形式テーブルは、出力指定フラグを各補助情報の表示項目ごとに備えており、出力指定フラグのオン(1)である表示項目は、対応する補助情報を表示する。一方、出力指定フラグのオフ(0)である表示項目は、補助情報の表示は行わない。
【0035】
この補助情報出力制御手段40による表示結果は、図7のような形式で表示され、この後、表示された情報をもとに、ユーザは所望のファイルを指示または閲覧する。
図7の表示例では、閲覧対象ファイルリストの各ファイルに対して次のように補助情報を付加して表示している。
【0036】
(1)ファイル名として
ファイルのタイトル名を12ポイントの大きさの黒色の文字でロケーションへのハイパーリンクをつけて表示する。
【0037】
(2)書誌情報として
タイトル名の直下の行にロケーションを9ポイントの大きさの青色の文字でロケーションへのハイパーリンクをつけて表示し、ファイルの作成年月日およびファイルのサイズを9ポイントの大きさの黒色の文字でロケーションと同じ行に表示する。ファイルの作成者名の出力指定フラグが1(オン)である場合には、9ポイントの大きさの黒色の文字でロケーションと同じ行に表示する。
【0038】
(3)検索語合致箇所情報として
書誌情報を表示した行の直下行に、前方文字列と合致箇所の文字列(検索語)と後方文字列とを連結して、10ポイントの大きさの文字で表示する。
このとき前方文字列と後方文字列は黒色の文字で表示し、合致箇所の文字列は赤色の文字で強調表示する。
【0039】
(4)言語情報として
キーワードは、検索語合致箇所情報の直下行に、10ポイントの大きさの緑色の文字列で獲得した数だけ表示する。
重要文は、キーワードの直下行に、10ポイントの大きさの黒色の文字で表示する。
【0040】
図7のように、閲覧対象ファイルリストに各閲覧対象ファイルの内容を表す種々の観点からの補助情報が組み合わされて提示されることにより、ユーザは各閲覧対象ファイルにアクセスして中身を見なくても自分にとって必要なファイルを効率よく選別することができる。
【0041】
補助情報選択手段50は、ユーザからの選択指定によって、閲覧対象ファイルリストを表示する際に付加する補助情報の種類を入力する。
例えば、図3や図7の画面右上に補助情報選択ボタンを用意しておき、このボタンをユーザが押下すると、図8に示すような補助情報選択指定画面を表示させ、ユーザが表示させたい補助情報の種類をマウス等で選択し、選択実行ボタンを押下して入力する。
この指定された補助情報の種類は、図6のような補助情報表示形式テーブル中の出力指定フラグを更新することによって保持・管理する。
これにより閲覧対象ファイルリストに付加して表示する補助情報の種類をユーザが選択指定できるので、ユーザが希望する補助情報のみを提示する、あるいは提示される補助情報を必要に応じて自由に切り替えることができる。
【0042】
以下、上述した補助情報獲得手段30について詳しく説明する。
図9は、補助情報獲得手段30の機能構成を示すブロック図であり、書誌情報獲得手段31、検索語合致箇所獲得手段32および言語情報獲得手段33とから構成され、獲得した補助情報(言語情報、検索語合致箇所情報および言語情報)を補助情報記憶手段80へ記憶する。
書誌情報獲得手段31は、ファイルリスト記憶手段70に記憶されている閲覧対象ファイルのロケーションを参照して、そのロケーションにあるファイルの書誌情報をファイル群記憶手段60からファイルのタイトル名、作成者名、作成年月日およびサイズ(ファイル容量)等を獲得する。
【0043】
検索語合致箇所獲得手段32は、ファイル中の検索語が合致した部分の開始位置と終了位置の情報を獲得するとともに、開始位置よりも前方の文字列並びに終了位置よりも後方の文字列を所定量(例えば、10文字)だけ獲得する。
これによりユーザは閲覧対象ファイルの中において検索語がどのような文脈で使用されているのかを知ることができるようになる。
【0044】
言語情報獲得手段33は、閲覧対象ファイルの文書内容のテキスト部分を言語解析手段34で言語解析し、この文書内容を代表する語句として抽出したキーワード、また、キーワードの頻度情報や文の位置情報等を用いて抽出した重要文を獲得する。ここで、言語解析方法、キーワード抽出方法および重要文抽出方法は、従来の技術を用いる。
【0045】
また、新聞記事や報告書のような場合には、重要な情報を文書の先頭に置くことが多いので、先頭文を重要文とするようにしてもよい。
例えば、図3または図7にある補助情報選択ボタンを使って、ファイル中から抽出する言語情報としてキーワードとファイルの先頭部分(例えば先頭30文字分)を指定した場合、図10のように、先頭部分の文字列が補助情報の重要文として表示される。
このように、補助情報として抽出する言語情報の重要文をファイルの先頭部分と指定しておくと、言語解析を用いた重要文抽出処理を行う必要がなくなり、処理効率をアップさせることができる。
【0046】
図11は、本発明の検索支援装置を組み込んだ検索装置の処理手順を示すフローチャートである。
ユーザが図3または図7のような入力画面で検索語を入力する(ステップS1)。
この検索語を使って、ファイル群記憶手段60に対して検索処理を実行する(ステップS2)と、検索結果として閲覧対象ファイルのロケーションのリストがファイルリスト記憶手段70へ格納される(ステップS3)。
【0047】
補助情報として出力すべき種類を入力する(ステップS4)。
図3または図7の補助情報選択ボタンを押下した場合には、図8のような補助情報選択画面から出力したい補助情報を選択し、選択実行ボタンを押下することによって、補助情報表示形式テーブル中の出力指定フラグを設定する。
一方、図3または図7の補助情報選択ボタンを押下しない場合には、この選択のステップS4は実行されない。
【0048】
次に、ファイルリスト記憶手段70に記憶されたロケーションにある閲覧対象ファイルの内容をひとつずつ取り出し(ステップS5)、補助情報を獲得し、補助情報記憶手段80に閲覧対象ファイルと獲得した補助情報を対応づけて記憶する(ステップS6)。
このステップS5とS6の処理をすべての閲覧対象ファイルに対して繰り返す(ステップS7)。
【0049】
すべての閲覧対象ファイルに対して補助情報の獲得処理が終了すると(ステップS7のYes)、予め格納しておいた補助情報表示形式テーブルを参照して、ファイルリスト記憶手段70中の閲覧対象ファイルへ、補助情報表示形式テーブル中の出力指定フラグがオン(1)の獲得された補助情報を付加して、図7のように所定の表示形式で表示装置104に1画面分の一覧表を表示する(ステップS8)。
【0050】
この後、ユーザは、タイトル名またはロケーションにリンクした閲覧対象ファイルをマウスでクリックして、内容等を表示させて閲覧する(ステップS9)。指定された検索語に対する検索結果を1画面で表示できない場合には(ステップ10の「あり」)、次の検索結果を要求するためにステップS8へ戻る。
一方、すべての検索結果を表示してしまい他の検索語を指定したい場合には(ステップ11の「あり」)、ステップS1へ戻り、他の検索語を指定しない場合には(ステップ11の「なし」)、処理を終了する。
【0051】
<実施形態2>
本実施形態2は、上述した実施形態1に加えて、補助情報の抽出量や翻訳処理を行うか否かを指定できるようにした。また、実施形態1と同様な機能については、同じ符号を付し、その相違点のみを説明する。
【0052】
図12は、本実施形態2における補助情報獲得手段30の機能構成を示すブロック図である。
図12において、補助情報獲得手段30は、書誌情報獲得手段31、検索語合致箇所獲得手段32、言語情報獲得手段33、情報抽出量指定部35とから構成され、獲得した補助情報(言語情報、検索語合致箇所情報および言語情報)を補助情報記憶手段80へ記憶する。また、言語情報獲得手段33は、言語解析手段34を含んでいる。
【0053】
書誌情報獲得手段31は、ファイルリスト記憶手段70に記憶されている閲覧対象ファイルのロケーションを参照して、そのロケーションにあるファイルの書誌情報をファイル群記憶手段60からファイルのタイトル名、作成年月日、サイズ(ファイル容量)および文書タイプ等を獲得する。
文書タイプは、その文書が報告書、新聞記事、論文、ネットワークからの配信文書またはメール等の区分である。
ファイル群記憶手段60には、上述した実施形態1の書誌事項に加えて、文書タイプも記憶しておく(図13参照)。
【0054】
検索語合致箇所獲得手段32は、ファイル中の検索語が合致した部分の位置情報(例えば、開始位置と終了位置)を獲得する。
言語情報獲得手段33は、閲覧対象ファイルの文書内容のテキスト部分を言語解析手段34で言語解析し、この文書内容を代表する語句として抽出したキーワード、また、キーワードの頻度情報や文の位置情報等を用いて抽出した重要文を、情報抽出量指定部35によって指定された分量だけ獲得する。ここで、言語解析方法、キーワード抽出方法および重要文抽出方法は、従来の技術を用いる。
【0055】
言語情報獲得手段33は、キーワードとして、ユーザが入力した検索語が出現している同一文中に共起している名詞句を抽出する。
この場合、言語解析手段34では、検索語合致箇所情報に基づいて当該検索語を含む文を切り出して形態素解析を行い、検索語と同一文中に共起している名詞句を抽出してキーワードとする。文の切り出しは、検索語に合致した箇所の前後に句点を見つけ、この2つの句点に囲まれた部分を文と認定することにより行う。
【0056】
例えば、検索語『グルメ』が文書(図14参照)において2箇所検出された場合、検索語を含む各々の文を切り出し、同一文中に共起している名詞句として「今」、「激戦地」、「デパ地下」、「高級食料品」、「イメージ」、「おしゃれ」、「最近」および「特徴」が抽出され、これらの語句をキーワードとして出力する。
このように、ファイル中の内容を代表する語句として、検索語が出現している同一文中に共起する名詞句を抽出するため、ユーザは当該の検索語がどのような文脈で使用されているのかを知ることができるようになり、情報選別が効率的に行えるようになる。
【0057】
また、キーワード情報として補助情報記憶手段80に格納する際に、これらの語句の出現順に格納する場合と、検索語を含む文の中での共起頻度の高い順番に格納する場合とがある。後者の場合、抽出する補助情報の量をユーザが少なめに設定したときに共起頻度の高いものから抽出・表示することができる。
【0058】
また、言語情報獲得手段33は、重要文を抽出するときに、閲覧対象ファイルの書誌的情報として格納されている文書タイプによって抽出方法を切り替える。例えば、閲覧対象ファイルの文書タイプがインターネット上での配信記事や新聞記事のような場合には、対象ファイルの先頭部分から複数の文を重要文として抽出することが望ましい。
【0059】
また、論文や報告書のように構造化された文書の場合には、「目的」や「結論」の部分から複数の文を重要文として抽出することが望ましい。
従って、言語解析手段34は、文書タイプごとに重要文抽出規則を予め用意し、言語情報の獲得処理に際して、閲覧対象ファイルの書誌情報として格納された文書タイプに対応した重要文抽出規則を駆動する。
このように、ファイルの内容を代表する重要文を抽出する際に、ユーザは文書タイプに応じて抽出方法を切り替えられるようになり、抽出される重要文の精度が向上し、情報選別がより効率的に行えるようになる。
【0060】
情報抽出量指定部35は、閲覧対象ファイルに付加される補助情報の量を入力する。
例えば、図15の画面右上に抽出量指定ボタンを用意しておき、このボタンをユーザが押下すると、図16に示すような補助情報の抽出量指定画面を表示させ、ユーザが表示させたいキーワードの個数と重要文の文数をキーボード等で入力し、実行ボタンを押下する。
または、図17に示すような補助情報の抽出量指定画面を表示させ、ユーザが表示させたいキーワードの個数と重要文の文数をマウス等で選択し、実行ボタンを押下する。
このように、抽出する補助情報の量をユーザが選択指定できるようにすると、ユーザは検索の目的や検索対象分野に対する習熟度に応じて、表示される補助情報の量を調節できるようになる。
【0061】
図18は、補助情報獲得手段30によって獲得された補助情報を補助情報記憶手段80に記憶した1つのファイル(ファイルA)の具体例を示している。
【0062】
図19は、補助情報出力制御手段40の機能構成を示すブロック図である。
図19によると、補助情報出力制御手段40は、翻訳処理実行手段41、補助情報選択手段50とから構成される。
【0063】
補助情報選択手段50は、ユーザからの選択指定によって、閲覧対象ファイルリストを表示する際に付加する補助情報の種類、補助情報の翻訳処理の有無と翻訳対象言語に関する選択指定を入力する。
例えば、図15の画面右上に補助情報選択ボタンを用意しておき、このボタンをユーザが押下すると、図20に示すような補助情報選択指定画面を表示させ、ユーザが表示させたい補助情報の種類、補助情報の翻訳処理の有無と翻訳対象言語をマウス等で選択し、実行ボタンを押下する。例えば、日本語があまり得意でない外国人が閲覧対象ファイルリストから自分の目的に合致する文書を選別するためには、母語に翻訳された補助情報が提供されることが望ましい。
【0064】
この指定された補助情報の種類や補助情報の翻訳処理の有無は、補助情報表示形式テーブル(後述)中の出力指定フラグ並びに翻訳指定フラグを更新することによって保持・管理する。
【0065】
これにより、閲覧対象ファイルリストに付加して表示する補助情報の種類や翻訳処理の有無をユーザが選択指定できるので、ユーザが希望する補助情報のみを提示する、あるいは提示される補助情報を必要に応じて自由に切り替えるというユーザフレンドリなインタフェースを提供できる。
さらに、閲覧対象文書が外国語の文書の場合やユーザの母語が対象文書の言語ではない場合には、表示される補助情報の翻訳の有無や翻訳言語をユーザが選択指定できるため、ユーザが個別に各ファイルを開いて時間をかけて内容を確認しなくても所望のファイルのみをリスト中から効率的に選別できるようになる。
【0066】
補助情報出力制御手段40は、ファイルリスト記憶手段70に記憶されたすべての閲覧対象ファイルに対して補助情報の獲得処理が終了すると、予め格納しておいた補助情報表示形式テーブル(図21参照)を参照することにより、補助情報記憶手段80に格納されている補助情報を検索結果の閲覧対象ファイルのリストに付加して表示装置104へ表示する。
【0067】
補助情報表示形式テーブル(図21参照)は、獲得された補助情報(ファイル名、書誌情報および言語情報)を表示するときの表示形式を保持するテーブルであり、各補助情報(ファイル名、書誌情報および言語情報)の表示項目ごとに、文字列を表示させるときの文字サイズ、文字の色、表示位置および属性等を保持するデータ構造である。
【0068】
また、補助情報表示形式テーブルは、出力指定フラグおよび翻訳指定フラグを各補助情報の表示項目ごとに備えており、出力指定フラグのオン(1)である表示項目は、対応する補助情報を表示する。一方、出力指定フラグのオフ(0)である表示項目は、補助情報の表示は行わない。
【0069】
また、翻訳指定フラグのオン(1)である表示項目は翻訳対象の項目であり、オフ(0)の表示項目は翻訳対象外である。さらに、「−」が付された表示項目は、翻訳対象外の項目であり、オン(1)およびオフ(0)以外の値を設定しておく。
【0070】
この補助情報出力制御手段40による表示結果は、図22のような形式で表示され、この後、表示された情報をもとに、ユーザは所望のファイルを指示または閲覧する。
図22の表示例では、閲覧対象ファイルリストの各ファイルに対して次のように補助情報を付加して表示している。
【0071】
(1)ファイル名として
ファイルのタイトル名を12ポイントの大きさの黒色の文字でロケーションへのハイパーリンクをつけて表示する。
【0072】
(2)書誌情報として
タイトル名の直下の行にロケーションを9ポイントの大きさの青色の文字でロケーションへのハイパーリンクをつけて表示し、ファイルの作成年月日およびファイルのサイズを9ポイントの大きさの黒色の文字でロケーションと同じ行に表示する。文書タイプの出力指定フラグが1(オン)である場合には、9ポイントの大きさの黒色の文字でロケーションと同じ行に表示する。
【0073】
(3)言語情報として
キーワードは、書誌情報の直下行に、10ポイントの大きさの緑色の文字列で獲得した数だけ表示する。
重要文は、キーワード情報の直下行に、10ポイントの大きさの黒色の文字で表示する。
【0074】
図22のように、閲覧対象ファイルリストに各閲覧対象ファイルの内容を表す種々の観点からの補助情報が組み合わされて提示されることにより、ユーザは各閲覧対象ファイルにアクセスして中身を見なくても自分にとって必要なファイルを効率よく選別することができる。
【0075】
翻訳処理実行手段41は、ユーザが補助情報の翻訳処理を選択した場合に補助情報出力制御手段40から起動され、ユーザが指定した対象言語に補助情報を翻訳して出力する。翻訳処理方法は、従来の技術を用いる。
図23は、図22の検索結果のうち、補助情報として対象ファイルのタイトル名、ロケーション情報とキーワードを指定し、さらに英語に翻訳した場合の表示例である。
【0076】
<実施形態1および実施形態2の変形例>
上述の実施形態1および実施形態2では、検索して閲覧対象のファイルリストを表示するときになって、言語解析して言語情報を獲得しているため、表示するまでに時間がかかっていた。
これを解消するために本変形例では、ファイル群記憶手段60へ検索対象のファイルを登録する際に、予め言語解析を行い、そのファイルの内容を代表する語句や文として、キーワードや重要文を抽出して、そのファイルと対応付けてファイル群記憶手段60へ記憶させておく。
【0077】
補助情報獲得手段30では、補助情報のうち言語情報に対しては、上記のファイル群記憶手段60から予め獲得してある言語情報を取り出すようにする。
これにより閲覧対象ファイルをリアルタイムに言語解析して言語情報を獲得する処理を行わないで済むため、より効率的に補助情報が獲得できる。
【0078】
尚、上述の実施形態では、ネットワークで接続した検索装置に対して端末からネットワーク上またはこの検索装置に存在するファイルを検索・閲覧する場合について説明したが、個人用コンピュータの記憶装置に記録された個人用ファイルを検索・閲覧する場合にも適用可能である。この場合、ロケーション情報としては、例えば、閲覧対象ファイルに辿りつくまでのフォルダのパスとして考える。
【0079】
<実施形態3>
本発明は上述した実施形態の機能をプログラム化し、あらかじめCD−ROM等の記録媒体に書き込んでおき、コンピュータに搭載したCD−ROMドライブのような媒体駆動装置にこのCD−ROM等を装着して、プログラムをコンピュータのメモリあるいは記憶装置に格納し、それを実行することによって、本発明の目的を達成することができる。
【0080】
尚、記録媒体としては半導体媒体(例えば、ROM、不揮発性メモリカード等)、光媒体(例えば、DVD、MO、MD、CD−R等)、磁気媒体(例えば、磁気テープ、フレキシブルディスク等)のいずれであってもよい。
【0081】
また、ロードしたプログラムの指示に基づき、オペレーティングシステム等が実際の処理の一部または全部を行い、その処理によって上述した実施形態の機能が実現される場合も含まれる。
【0082】
さらに、上述したプログラムが、機能拡張ボードや機能拡張ユニットに備わるメモリにロードされ、そのプログラムの実行によって、上述した実施形態の機能が実現される場合も含まれる。
【0083】
市場に流通させる場合には、可搬型の記録媒体にプログラムを格納して流通させたり、インターネット等の通信網を介して接続されたサーバコンピュータの記憶装置に格納しておき、通信網を通じて他のコンピュータに転送することによっても流通させることができる。この場合、このサーバコンピュータの記憶装置も本発明の記録媒体に含まれる。
尚、コンピュータでは、可搬型の記録媒体上のプログラム、または転送されてくるプログラムを、コンピュータに接続した記憶装置にインストールし、そのインストールされたプログラムを実行することによって上述した実施形態の機能が実現される。
【0084】
尚、本発明は上述した実施形態に限定されず、本発明の要旨を逸脱しない範囲内で各種の変形、修正が可能である。
【0085】
【発明の効果】
以上説明したように本発明によれば、ユーザが指定した検索条件に合致するファイルを検索して閲覧する場合に、閲覧対象のファイルリストに、各対象ファイルの内容に関する複数の観点からの補助情報を組み合わせて付加することにより、ユーザは個別にファイルを開いて内容を確認しなくても自分が必要とするファイルのみをリスト中から効率的に選別することができる。
【0086】
また、閲覧対象ファイルに対して書誌的な情報のみならず検索語が含まれる部分の情報、ファイル中の重要な語句や文といった言語的情報まで補助情報として獲得されるため、ユーザは閲覧対象ファイルの内容について複数の観点から情報を得ることができるようになり、情報選別の効率と精度が向上する。
この検索語が含まれる部分の情報として、その検索語の出現位置の前後の文字列を表示して、ユーザは検索語が閲覧対象ファイルの中でどのような文脈で使用されているのかを知ることができる。
【0087】
また、ファイル中の内容を代表する語句として、検索語が出現している同一文中に共起する名詞句を抽出するため、ユーザは検索語が閲覧対象ファイルの中でどのような文脈で使用されているのかを知ることができるようになり、情報選別が効率的に行えるようになる。
【0088】
さらに、ファイルの内容を代表する文(重要文)を抽出する際に、ユーザは文書タイプに応じて抽出方法を切り替えられるようになり、抽出される重要文の精度が向上し、情報選別がより効率的に行えるようになる。
【0089】
また、抽出する補助情報の量をユーザが選択指定できるため、ユーザは検索の目的や検索対象分野に対する習熟度に応じて、表示される補助情報の量を調節できるようになる。
【0090】
また、閲覧対象ファイルリストに付加される補助情報の種類、補助情報の翻訳処理の有無と翻訳対象言語をユーザ自身が選択できるようになり、ユーザが希望する補助情報のみを提示する、あるいは提示される補助情報を必要に応じて自由に切り替えられるというユーザフレンドリなインタフェースを提供できる。
【0091】
さらに、閲覧対象文書が外国語の文書の場合やユーザの母語が対象文書の言語ではない場合には、表示される補助情報の翻訳の有無や翻訳言語をユーザが選択指定できるため、ユーザが個別に各ファイルを開いて時間をかけて内容を確認しなくても所望のファイルのみをリスト中から効率的に選別できるようになる。
【0092】
また、閲覧対象ファイルをリアルタイムに言語解析してキーとなる言語情報を獲得するかわりに、予め言語情報を抽出し、当該ファイルと関連づけて格納しておくことによって、閲覧するときに言語解析を行う必要がなくなり、より効率的に補助情報を獲得できる。
【図面の簡単な説明】
【図1】一般の検索装置を実現するためのハードウェア構成を示すブロック図である。
【図2】実施形態1の検索装置の機能構成を示すブロック図である。
【図3】検索語を入力し、検索の実行を指示する画面例である。
【図4】補助情報記憶手段のデータ構造例である。
【図5】1つの閲覧対象ファイルに対する補助情報の具体例である。
【図6】補助情報表示形式テーブルのデータ構造例である。
【図7】補助情報を付加した閲覧対象ファイルリストの表示例である。
【図8】ユーザが表示させたい補助情報の種類を入力する画面例である。
【図9】補助情報獲得手段の機能構成を示すブロック図である。
【図10】キーワードとファイルの先頭部分を補助情報の言語情報として指定した場合の表示例である。
【図11】本発明の検索支援装置を組み込んだ検索装置の処理手順を示すローチャートである。
【図12】実施形態2の補助情報獲得手段の機能構成を示すブロック図である。
【図13】補助情報記憶手段のデータ構造例である。
【図14】閲覧対象ファイルの内容例である。
【図15】補助情報の抽出量指定画面を呼び出すときの画面例である。
【図16】補助情報の抽出量指定画面例である。
【図17】補助情報の抽出量指定画面例である。
【図18】1つの閲覧対象ファイルに対する補助情報の具体例である。
【図19】補助情報出力制御手段の機能構成を示すブロック図である。
【図20】ユーザが表示させたい補助情報の種類、翻訳処理の可否を入力する画面例である。
【図21】補助情報表示形式テーブルのデータ構造例である。
【図22】補助情報を付加した閲覧対象ファイルリストの表示例である。
【図23】補助情報を付加した閲覧対象ファイルリストの翻訳処理された表示例である。
【符号の説明】
10…検索語入力手段、20…検索手段、30…補助情報獲得手段、31…書誌情報獲得手段、32…検索語合致箇所獲得手段、33…言語情報獲得手段、34…言語解析手段、35…情報抽出量指定部、40…補助情報出力制御手段、41…翻訳処理実行手段、50…補助情報選択手段、60…ファイル群記憶手段、70…ファイルリスト記憶手段、80…補助情報記憶手段、101…CPU、102…メモリ、103…入力装置、104…表示装置、105…記憶装置、106…データバス。
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a search support device, a search support method, a program, and a recording medium, and in particular, when a user searches for and browses a file that matches a search condition specified by a user, the user individually opens each file to read the contents. The present invention relates to a display technique for searching and browsing that enables a desired file to be efficiently selected from a list without confirmation.
[0002]
[Prior art]
In recent years, an enormous amount of electronic information files can be shared and used via the Internet or an intranet. In order to extract only information that meets his purpose from this vast source of information, users use search engines that are easy to use for themselves.
[0003]
However, currently available search engines, when displaying a search result corresponding to a search request input by a user as a list of files to be viewed on a display, location information (for example, URL on the Internet) of those files or a file in the file. It merely presents fragmentary additional information, such as adding and presenting only the information of the part that matches the search request, but does not present information extracted from a plurality of viewpoints so that the outline of the contents of the file can be grasped.
For this reason, the user is forced to access each file to check the contents and then select only the files required by the user, which causes a situation in which the user cannot efficiently select information.
[0004]
[Patent Document 1]
JP-A-11-232299
[Patent Document 2]
JP-A-11-85786
[0005]
[Problems to be solved by the invention]
Patent Literatures 1 and 2 disclose techniques for presenting information about contents to a user with respect to a search target browsing target file.
[0006]
In the technique of Patent Document 1, when a file published or shared on a network is searched for and browsed, information (memo writing, etc.) input by the user in the past, access history, and file Linguistic information such as the number of keywords and words contained in the information is presented to the user when browsing.
However, by presenting auxiliary information about the browsed file, the effect of improving the readability of the file can be obtained, but only the desired file can be viewed from the search result list without looking at the contents of each file. The problem of sorting is still unresolved.
[0007]
On the other hand, in the technique of Patent Literature 2, by presenting both the title information of a search result and a search result analysis tree diagram using characteristic words to a user, analysis of the search result required when the user considers a search condition is performed. Can be performed efficiently.
However, by presenting a graph display reflecting the relevance of characteristic words that reflects the characteristics of the entire search result alongside the title list, the search conditions are analyzed while analyzing the individual information and the overall image of the search results. Although it is possible to try to improve the search and search from a different viewpoint, the user must select the desired file while analyzing the graphical display of the characteristic words representing the whole image. Must. In other words, it is necessary to perform an operation of extracting individuals from the whole, and the problem of efficient information selection still remains.
[0008]
The present invention has been made in view of the above-described circumstances, and when searching for and browsing a file that matches a search condition specified by a user, the user individually opens each file and takes time to read the contents. SUPPORT DEVICE, SEARCH SUPPORT METHOD, PROGRAM FOR EXECUTING FUNCTION OF SEARCH SUPPORT DEVICE, AND COMPUTER-READABLE RECORDING MEDIUM RECORDING THE PROGRAM The purpose is to provide.
[0009]
[Means for Solving the Problems]
In order to achieve the above object, a search support device according to claim 1 of the present invention provides a method for searching for a file that meets a search condition specified by a user and browsing the file from multiple viewpoints of the contents of a file to be viewed. A search support apparatus for displaying a file list of a browsing target added by combining auxiliary information of the above, wherein auxiliary information obtaining means for obtaining auxiliary information to be added to the file list of the browsing target; and the auxiliary information and the auxiliary information Auxiliary information storage means for storing the file to be browsed in association with the file to be browsed, and auxiliary information output for adding and displaying auxiliary information of each file to be browsed in a predetermined display format when displaying the file list to be browsed And control means.
[0010]
According to a second aspect of the present invention, in the search support device according to the first aspect, the auxiliary information obtaining means obtains bibliographic information of the file to be viewed as auxiliary information; A search word matching portion obtaining unit that obtains information of a part that matches a search condition from a file as auxiliary information; and a linguistic information obtaining unit that obtains, as auxiliary information, a phrase and a sentence representing the contents of the file to be browsed. It is characterized by the following.
[0011]
According to a third aspect of the present invention, in the search support device according to the second aspect, information of a part that matches a search condition in the search word matching point acquisition unit matches a search condition from the browse target file. It is characterized by a part and its neighborhood information.
According to a fourth aspect of the present invention, in the search support device according to the third aspect, the neighborhood information in the search word matching point acquiring means includes a character string ahead of a start position of a part matching a search condition and an end character string. It is a character string obtained by extracting a character string behind a position by a predetermined amount.
According to a fifth aspect of the present invention, in the search support device according to the second aspect, information of a part that matches a search condition in the search word matching point acquisition unit matches a search condition in the browse target file. It is characterized by the position information of the part.
[0012]
According to a sixth aspect of the present invention, in the search support device according to the second aspect, the linguistic information obtaining means includes, in a same sentence where a search word appears as a phrase representing the content of the file to be browsed. It is characterized by extracting co-occurring noun phrases.
According to a seventh aspect of the present invention, in the search support device according to the second aspect, when the language information acquiring means extracts a sentence representing the contents of the file to be browsed, the sentence is extracted according to a document type. The method is characterized in that the method is switched.
According to an eighth aspect of the present invention, in the search support device according to the second, sixth or seventh aspect, the auxiliary information obtaining means has an information extraction amount specifying means for selecting and specifying the obtaining amount of the auxiliary information. The linguistic information acquiring means acquires a representative phrase and a sentence from the contents of the file to be browsed by the amount of acquisition of the auxiliary information. According to a ninth aspect of the present invention, in the search support device according to the second aspect, words and sentences representing the contents of a file to be searched are stored in advance as attribute information in association with the file, The language information obtaining means obtains attribute information corresponding to the file to be viewed as auxiliary information.
[0013]
According to a tenth aspect of the present invention, in the search support device according to the first aspect, the auxiliary information output control means selects and specifies a type of auxiliary information to be added to the file list to be viewed and displayed. It is characterized by having information selection means.
According to an eleventh aspect of the present invention, in the search support device according to the tenth aspect, a translation processing executing means for translating the auxiliary information into a translation target language, and whether or not the auxiliary information is to be translated and a translation target language are selectively designated. And a supplementary information output control means that, when a translation is designated, translates the supplementary information into a designated translation target language and displays it.
[0014]
The search support method according to the twelfth aspect of the present invention adds a combination of auxiliary information from a plurality of viewpoints to the content of a file to be browsed when searching and browsing a file that matches a search condition specified by a user. A search support method for displaying a browsed file list obtained by acquiring auxiliary information to be added to the browse target file list, storing the auxiliary information and the browse target file having acquired the auxiliary information in association with each other. When displaying the file list to be viewed, auxiliary information of each file to be viewed is added and displayed in a predetermined display format.
[0015]
A program according to a thirteenth aspect of the present invention is a program for causing a computer to execute the functions of the search support device according to any one of the first to eleventh aspects.
A recording medium according to a fourteenth aspect of the present invention is a computer-readable recording medium storing the program according to the thirteenth aspect.
[0016]
With the above configuration, when searching for and browsing files that match the search conditions specified by the user, by adding auxiliary information from multiple viewpoints regarding the contents of each target file to the list of files to be browsed in combination Thus, the user can efficiently select only necessary files from the list without opening individual files and checking the contents.
[0017]
In addition, since the file to be browsed is acquired as supplementary information, not only bibliographic information but also information about the part containing the search term and linguistic information such as important words and phrases in the file are acquired. Information can be obtained from a plurality of viewpoints regarding the contents of the information, and the efficiency and accuracy of the information selection are improved.
By displaying the character string before and after the position where the search term appears as the information of the part including the search term, the user can know in what context the search term is used in the browse target file. be able to.
[0018]
In addition, since noun phrases that co-occur in the same sentence where the search word appears are extracted as phrases that are representative of the contents in the file, the user can use the search word in any context in the browse target file. Information can be determined, and information can be sorted efficiently.
[0019]
Furthermore, when extracting a sentence (important sentence) representing the contents of the file, the user can switch the extraction method according to the document type, the accuracy of the extracted important sentence is improved, and the information selection is improved. It can be done efficiently.
[0020]
In addition, since the user can select and specify the amount of auxiliary information to be extracted, the user can adjust the amount of auxiliary information to be displayed according to the purpose of the search or the level of proficiency in the search target field.
[0021]
In addition, the type of auxiliary information added to the browse target file list, the presence or absence of a translation process of the auxiliary information, and the translation target language can be selected by the user himself, and only the auxiliary information desired by the user is presented or presented. User-friendly interface that allows the user to freely switch auxiliary information as needed.
[0022]
Furthermore, if the document to be viewed is a foreign language document or the user's native language is not the language of the target document, the user can select and specify whether or not to translate the auxiliary information to be displayed and the translation language. Thus, only the desired file can be efficiently selected from the list without opening each file and checking the contents over time.
[0023]
Also, instead of acquiring the language information as a key by performing a language analysis of the file to be viewed in real time, the language information is extracted in advance and stored in association with the file, thereby performing the language analysis when browsing. There is no need, and auxiliary information can be obtained more efficiently.
[0024]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, a preferred embodiment according to a search support device of the present invention will be described with reference to the drawings. In the embodiment, the search support device of the present invention is incorporated in a search device, and a description is given of a document written in Japanese as a search target. However, a search of a document in another language such as English, German, or French is performed. Can also be applied.
[0025]
<First embodiment>
FIG. 1 is a block diagram showing a hardware configuration for realizing a general search device. In FIG. 1, a search device includes a CPU (Central Processing Unit) 101 for performing calculations and processes on data and the like, a memory 102 for storing programs and data, information temporarily stored at the time of operation, and the like. An input device 103 such as a mouse for inputting data based on the movement of a keyboard, a touch panel or a mark generally called a mouse cursor for inputting a program or data, and a CRT display for displaying input data or processing results or the like. A display device 104 such as a liquid crystal display, a storage device 105 such as a relatively large-capacity hard disk for storing a database or a search result in which a program or an information file group to be searched is registered, and these devices are interconnected. And at least a data bus 106.
[0026]
FIG. 2 is a block diagram illustrating a functional configuration of the search device according to the first embodiment.
In FIG. 2, the search device includes search word input means 10, search means 20, auxiliary information acquisition means 30, auxiliary information output control means 40, auxiliary information selection means 50, file group storage means 60, file list storage means 70, auxiliary And information storage means 80. Here, the search support device of the present invention includes the auxiliary information acquisition unit 30, the auxiliary information output control unit 40, the auxiliary information selection unit 50, and the auxiliary information storage unit 80.
[0027]
The search term input unit 10 inputs a search term for specifying a document or the like to be browsed from the input device 103 to the file group storage unit 60 that stores a plurality of documents to be searched.
For example, a search word input screen as shown in FIG. 3 is displayed, and the user inputs a search word “gourmet” and presses a “search execution” button.
[0028]
The search means 20 searches the file group storage means 60 according to the search word (for example, “gourmet”) specified by the search word input means 10, and, for example, five objects to be browsed in descending order of relevance to the search word The file list is stored in the file list storage means 70.
The file group storage means 60 stores a plurality of files to be searched. This file may be a file shared on the network when the search device is connected to a network such as the Internet, or may be a file stored in the storage device 105 of the search device. It doesn't matter.
[0029]
The file list storage means 70 stores the location of the searched file. In the case where the file group storage means 60 is stored in the storage device 105 of the search device, the location is a file address on the storage device 105, and the file group storage means 60 is a file shared on the network. In this case, the URL (Uniform Resource Locator) of the file is used.
Hereinafter, the file group storage unit 60 will be described as a file shared on a network, but the present invention is also applicable to a case where the file group storage unit 60 is stored in the storage device 105 of the search device.
[0030]
The auxiliary information acquisition unit 30 extracts the browsing target files stored in the file list storage unit 70 one by one, and stores the auxiliary information acquired from the browsing target file in the auxiliary information storage unit 80 in association with the browsing target file. .
Since the acquired auxiliary information and the file to be viewed are stored separately, it is possible to easily manage and use the auxiliary information.
[0031]
As shown in FIG. 4, the data structure of the auxiliary information storage means 80 stores bibliographic information, search word matching location information, and language information in association with each file to be viewed.
The bibliographic information includes the location (for example, URL) of the file, the title name, the name of the creator of the file, the creation date, the file size, and the like.
The search word matching location information is a start position and an end position of a portion that matches the search word, and a character string of a predetermined amount (for example, 10 characters) before and after the matching position. The predetermined number of characters can be appropriately changed by the user.
The linguistic information is one or more keywords and one or more important sentences. The number of keywords and important sentences can also be changed as appropriate by the user.
[0032]
FIG. 5 shows a specific example of the auxiliary information for one file stored in the auxiliary information storage unit 80.
As a result, the user is able to obtain not only bibliographic information but also information on the part containing the search term and linguistic information such as important words and phrases in the file as auxiliary information. Information can be obtained from a plurality of viewpoints regarding the contents of the information, and the efficiency and accuracy of the information selection are improved.
[0033]
When the acquisition process of the auxiliary information for all the browsing target files stored in the file list storage unit 70 is completed, the auxiliary information output control unit 40 sets the auxiliary information display format table stored in advance (see FIG. 6). , The auxiliary information stored in the auxiliary information storage unit 80 is added to the list of browse target files of the search result and displayed on the display device 104.
[0034]
The auxiliary information display format table (see FIG. 6) is a table for holding a display format when displaying the obtained auxiliary information (bibliographic information, search term matching location information and language information). , A search word matching location information and a language information) for each display item.
Further, the auxiliary information display format table includes an output designation flag for each display item of the auxiliary information, and a display item whose output designation flag is ON (1) displays the corresponding auxiliary information. On the other hand, for display items whose output designation flag is off (0), no auxiliary information is displayed.
[0035]
The display result by the auxiliary information output control means 40 is displayed in a format as shown in FIG. 7, and thereafter, the user designates or browses a desired file based on the displayed information.
In the display example of FIG. 7, auxiliary information is added to each file in the file list for browsing and displayed as follows.
[0036]
(1) As file name
The title of the file is displayed in 12-point black text with a hyperlink to the location.
[0037]
(2) Bibliographic information
In the line immediately below the title, the location is displayed with a hyperlink to the location in 9-point blue characters and the file creation date and file size are displayed in 9-point black characters. To display on the same line as the location. If the output designation flag of the creator name of the file is 1 (ON), the file is displayed on the same line as the location in 9-point black characters.
[0038]
(3) As search term matching point information
The front character string, the character string (search word) of the matching part, and the rear character string are connected to the line immediately below the line on which the bibliographic information is displayed, and the resulting character string is displayed in 10-point size characters.
At this time, the front character string and the rear character string are displayed in black characters, and the character string of the matching portion is highlighted in red characters.
[0039]
(4) As language information
The keywords are displayed in the line immediately below the search word matching point information in the number obtained as a green character string having a size of 10 points.
The important sentence is displayed in the line immediately below the keyword in black characters of a size of 10 points.
[0040]
As shown in FIG. 7, by presenting auxiliary information from various viewpoints representing the content of each file to be browsed in combination in the file list to be browsed, the user can access each file to be browsed and view the contents Even so, it is possible to efficiently select files necessary for oneself.
[0041]
The auxiliary information selecting means 50 inputs the type of auxiliary information to be added when the browse target file list is displayed, according to the selection designation from the user.
For example, an auxiliary information selection button is prepared at the upper right of the screens of FIGS. 3 and 7, and when this button is pressed by the user, an auxiliary information selection designation screen as shown in FIG. The type of information is selected with a mouse or the like, and a selection execution button is pressed to input.
The type of the designated auxiliary information is held and managed by updating the output designation flag in the auxiliary information display format table as shown in FIG.
This allows the user to select and specify the type of auxiliary information to be added to the list of files to be viewed and displayed, so that only the auxiliary information desired by the user can be presented, or the presented auxiliary information can be freely switched as necessary. Can be.
[0042]
Hereinafter, the above-described auxiliary information obtaining means 30 will be described in detail.
FIG. 9 is a block diagram showing a functional configuration of the auxiliary information obtaining means 30. The auxiliary information obtaining means 30 is composed of a bibliographic information obtaining means 31, a search word matching point obtaining means 32, and a linguistic information obtaining means 33. , Search word matching location information and language information) in the auxiliary information storage means 80.
The bibliographic information acquiring unit 31 refers to the location of the file to be viewed stored in the file list storage unit 70, and retrieves the bibliographic information of the file at that location from the file group storage unit 60, the title of the file, the creator name. , Creation date, size (file capacity), etc.
[0043]
The search term matching point obtaining means 32 obtains information on a start position and an end position of a portion where the search word in the file matches, and also stores a character string before the start position and a character string after the end position. Acquire only a fixed amount (for example, 10 characters).
This allows the user to know in what context the search term is used in the file to be viewed.
[0044]
The linguistic information acquiring means 33 analyzes the language of the text part of the document content of the file to be browsed by the linguistic analyzing means 34 and extracts a keyword extracted as a phrase representative of the document content, keyword frequency information, sentence position information, and the like. The important sentence extracted by using is acquired. Here, a conventional technique is used for the language analysis method, the keyword extraction method, and the important sentence extraction method.
[0045]
In the case of a newspaper article or a report, important information is often placed at the top of the document, so that the top sentence may be an important sentence.
For example, when a keyword and a head portion (for example, the first 30 characters) of a file are specified as language information to be extracted from the file by using the auxiliary information selection button shown in FIG. 3 or FIG. The character string of the part is displayed as an important sentence of the auxiliary information.
In this way, when the important sentence of the linguistic information to be extracted as the auxiliary information is designated as the head of the file, it is not necessary to perform the important sentence extraction processing using the linguistic analysis, and the processing efficiency can be improved.
[0046]
FIG. 11 is a flowchart showing a processing procedure of a search device incorporating the search support device of the present invention.
A user inputs a search word on an input screen as shown in FIG. 3 or FIG. 7 (step S1).
When a search process is performed on the file group storage unit 60 using this search word (step S2), a list of the locations of the files to be browsed is stored in the file list storage unit 70 as search results (step S3). .
[0047]
The type to be output is input as auxiliary information (step S4).
When the auxiliary information selection button in FIG. 3 or FIG. 7 is pressed, the auxiliary information to be output is selected from the auxiliary information selection screen as shown in FIG. 8, and the selection execution button is pressed. Set the output specification flag of
On the other hand, when the auxiliary information selection button in FIG. 3 or FIG. 7 is not pressed, step S4 of this selection is not performed.
[0048]
Next, the contents of the file to be viewed at the location stored in the file list storage means 70 are extracted one by one (step S5), auxiliary information is obtained, and the file to be viewed and the obtained auxiliary information are stored in the auxiliary information storage means 80. The information is stored in association (step S6).
The processes of steps S5 and S6 are repeated for all files to be browsed (step S7).
[0049]
When the supplementary information acquisition process is completed for all the files to be browsed (Yes in step S7), the file to be browsed in the file list storage unit 70 is referred to by referring to the previously stored supplementary information display format table. The auxiliary information whose output designation flag in the auxiliary information display format table is ON (1) is added, and a list for one screen is displayed on the display device 104 in a predetermined display format as shown in FIG. (Step S8).
[0050]
Thereafter, the user clicks the browsing target file linked to the title name or the location with the mouse to display the contents or the like for browsing (step S9). If the search result for the specified search word cannot be displayed on one screen ("Yes" in step 10), the process returns to step S8 to request the next search result.
On the other hand, if all search results are displayed and another search word is to be designated (“Yes” in step 11), the process returns to step S1, and if another search word is not designated (“11” in step 11). None "), and terminates the process.
[0051]
<Embodiment 2>
In the second embodiment, in addition to the first embodiment, the extraction amount of the auxiliary information and whether or not to perform the translation process can be specified. The same reference numerals are given to the same functions as those in the first embodiment, and only the differences will be described.
[0052]
FIG. 12 is a block diagram illustrating a functional configuration of the auxiliary information acquiring unit 30 according to the second embodiment.
In FIG. 12, the auxiliary information obtaining means 30 is composed of a bibliographic information obtaining means 31, a search term matching point obtaining means 32, a linguistic information obtaining means 33, and an information extraction amount designating section 35. The search term matching location information and the language information) are stored in the auxiliary information storage unit 80. Further, the linguistic information acquiring means 33 includes a linguistic analyzing means 34.
[0053]
The bibliographic information obtaining means 31 refers to the location of the file to be browsed stored in the file list storage means 70 and retrieves the bibliographic information of the file at that location from the file group storage means 60, the title of the file, the date of creation, and the like. Get date, size (file capacity), document type, etc.
The document type is a classification of the document such as a report, a newspaper article, a dissertation, a distribution document from a network, or a mail.
The file group storage unit 60 stores the document type in addition to the bibliographic items of the first embodiment (see FIG. 13).
[0054]
The search term matching point obtaining means 32 obtains position information (for example, a start position and an end position) of a portion where the search words match in the file.
The linguistic information acquiring means 33 analyzes the language of the text part of the document content of the file to be browsed by the linguistic analyzing means 34 and extracts a keyword extracted as a phrase representative of the document content, keyword frequency information, sentence position information, and the like. Is obtained by the amount specified by the information extraction amount specifying unit 35. Here, a conventional technique is used for the language analysis method, the keyword extraction method, and the important sentence extraction method.
[0055]
The linguistic information acquisition means 33 extracts, as keywords, noun phrases co-occurring in the same sentence in which the search term input by the user appears.
In this case, the language analysis unit 34 cuts out a sentence including the search word based on the search word matching point information, performs morphological analysis, extracts a noun phrase co-occurring in the same sentence as the search word, and extracts the noun phrase as a keyword. I do. Sentences are cut out by finding punctuation before and after a part that matches the search word, and certifying the part surrounded by these two punctuation points as a sentence.
[0056]
For example, when the search word “gourmet” is detected in two places in the document (see FIG. 14), each sentence including the search word is cut out, and “now” and “fight battlefield” are noun phrases co-occurring in the same sentence. , "Department basement,""High-endfood,""Image,""Fashion,""Recent," and "Characteristics," and these phrases are output as keywords.
As described above, in order to extract a noun phrase co-occurring in the same sentence where a search word appears as a phrase representing the contents in the file, the user can use the search word in any context. Information can be known, and information can be sorted efficiently.
[0057]
Further, when the words are stored in the auxiliary information storage unit 80 as the keyword information, the words may be stored in the order of appearance of the words or in the order of the highest co-occurrence frequency in the sentence including the search word. In the latter case, when the amount of auxiliary information to be extracted is set to a relatively small value by the user, the auxiliary information can be extracted and displayed in descending order of co-occurrence.
[0058]
When extracting an important sentence, the linguistic information acquisition unit 33 switches the extraction method according to the document type stored as the bibliographic information of the file to be viewed. For example, when the document type of the file to be viewed is an article distributed on the Internet or a newspaper article, it is desirable to extract a plurality of sentences as important sentences from the head of the file.
[0059]
In the case of a structured document such as a dissertation or a report, it is desirable to extract a plurality of sentences as important sentences from the “purpose” and “conclusion” parts.
Therefore, the language analysis means 34 prepares an important sentence extraction rule for each document type in advance, and drives the important sentence extraction rule corresponding to the document type stored as the bibliographic information of the file to be browsed at the time of acquiring the linguistic information. .
As described above, when extracting an important sentence representing the contents of a file, the user can switch the extraction method according to the document type, thereby improving the accuracy of the extracted important sentence and making the information selection more efficient. Will be able to do it.
[0060]
The information extraction amount designation unit 35 inputs the amount of auxiliary information added to the file to be viewed.
For example, an extraction amount designation button is prepared at the upper right of the screen in FIG. 15, and when this button is pressed by the user, an extraction amount designation screen for auxiliary information as shown in FIG. Enter the number and the number of important sentences using a keyboard or the like, and press the execute button.
Alternatively, a screen for specifying the extraction amount of auxiliary information as shown in FIG. 17 is displayed, the user selects the number of keywords to be displayed and the number of important sentences with a mouse or the like, and presses an execution button.
As described above, if the user can select and specify the amount of auxiliary information to be extracted, the user can adjust the amount of auxiliary information to be displayed in accordance with the purpose of the search and the level of proficiency in the search target field.
[0061]
FIG. 18 shows a specific example of one file (file A) in which the auxiliary information obtained by the auxiliary information obtaining means 30 is stored in the auxiliary information storage means 80.
[0062]
FIG. 19 is a block diagram showing a functional configuration of the auxiliary information output control means 40.
According to FIG. 19, the auxiliary information output control means 40 includes a translation processing executing means 41 and an auxiliary information selecting means 50.
[0063]
The auxiliary information selecting means 50 inputs the type of auxiliary information to be added when displaying the browse target file list, the presence / absence of translation processing of the auxiliary information, and the selection specification regarding the language to be translated, according to the selection specification from the user.
For example, an auxiliary information selection button is prepared at the upper right of the screen in FIG. 15, and when the user presses this button, an auxiliary information selection designation screen as shown in FIG. 20 is displayed, and the type of auxiliary information to be displayed by the user Then, the user selects the presence / absence of the auxiliary information translation process and the translation target language with a mouse or the like, and presses the execution button. For example, in order for a foreigner who is not very good at Japanese to select a document that meets his purpose from a list of files to be viewed, it is desirable to provide auxiliary information translated into a native language.
[0064]
The type of the specified auxiliary information and the presence / absence of the translation processing of the auxiliary information are retained and managed by updating the output designation flag and the translation designation flag in the auxiliary information display format table (described later).
[0065]
This allows the user to select and specify the type of auxiliary information to be added to the list of files to be viewed and the presence or absence of translation processing, so that only the auxiliary information desired by the user is presented, or the presented auxiliary information is required. It is possible to provide a user-friendly interface of freely switching according to the user.
Furthermore, if the document to be viewed is a foreign language document or the user's native language is not the language of the target document, the user can select and specify whether or not to translate the auxiliary information to be displayed and the translation language. Thus, only the desired file can be efficiently selected from the list without opening each file and checking the contents over time.
[0066]
When the acquisition process of the auxiliary information is completed for all the browsing target files stored in the file list storage unit 70, the auxiliary information output control unit 40 stores the auxiliary information display format table stored in advance (see FIG. 21). , The auxiliary information stored in the auxiliary information storage unit 80 is added to the list of browse target files of the search result and displayed on the display device 104.
[0067]
The auxiliary information display format table (see FIG. 21) is a table for holding a display format when displaying the obtained auxiliary information (file name, bibliographic information and language information), and stores each auxiliary information (file name, bibliographic information). And language information) for each display item. The data structure holds a character size, a character color, a display position, an attribute, and the like when a character string is displayed.
[0068]
The auxiliary information display format table includes an output designation flag and a translation designation flag for each display item of the auxiliary information, and a display item whose output designation flag is ON (1) displays the corresponding auxiliary information. . On the other hand, for display items whose output designation flag is off (0), no auxiliary information is displayed.
[0069]
A display item whose translation designation flag is ON (1) is an item to be translated, and a display item OFF (0) is not a translation item. Further, the display items to which "-" is added are items not to be translated, and values other than ON (1) and OFF (0) are set.
[0070]
The display result by the auxiliary information output control means 40 is displayed in a format as shown in FIG. 22, and thereafter, the user designates or browses a desired file based on the displayed information.
In the display example of FIG. 22, auxiliary information is added to each file in the browse target file list and displayed as follows.
[0071]
(1) As file name
The title of the file is displayed in 12-point black text with a hyperlink to the location.
[0072]
(2) Bibliographic information
In the line immediately below the title, the location is displayed with a hyperlink to the location in 9-point blue characters and the file creation date and file size are displayed in 9-point black characters. To display on the same line as the location. When the output designation flag of the document type is 1 (ON), it is displayed on the same line as the location with black characters of 9 points in size.
[0073]
(3) As language information
The keywords are displayed in the line immediately below the bibliographic information in the number obtained in a green character string having a size of 10 points.
The important sentence is displayed in a line immediately below the keyword information in black characters of a size of 10 points.
[0074]
As shown in FIG. 22, by presenting auxiliary information from various viewpoints representing the contents of each file to be viewed in combination in the file list to be viewed, the user can access each file to be viewed without looking at the contents. Even so, it is possible to efficiently select files necessary for oneself.
[0075]
The translation processing execution means 41 is started by the auxiliary information output control means 40 when the user selects the translation processing of the auxiliary information, and translates and outputs the auxiliary information into a target language specified by the user. The translation processing method uses a conventional technique.
FIG. 23 is a display example when the title name, the location information, and the keyword of the target file are specified as auxiliary information in the search results of FIG. 22, and further translated into English.
[0076]
<Modification of First and Second Embodiments>
In the above-described first and second embodiments, it takes a long time to display the file list to be browsed and browsed because the language information is obtained by language analysis at the time of display.
In order to solve this, in the present modification, when registering a file to be searched in the file group storage means 60, a language analysis is performed in advance, and a keyword or an important sentence is used as a word or sentence representing the contents of the file. The file is extracted and stored in the file group storage unit 60 in association with the file.
[0077]
The auxiliary information acquisition means 30 extracts the language information previously acquired from the file group storage means 60 for the linguistic information in the auxiliary information.
As a result, it is not necessary to perform a process of acquiring the linguistic information by analyzing the language of the viewing target file in real time, and thus it is possible to acquire the auxiliary information more efficiently.
[0078]
In the above-described embodiment, the case where the terminal searches and browses a file existing on the network or in the search device from the terminal to the search device connected via the network has been described. The present invention is also applicable to searching and browsing personal files. In this case, the location information is considered, for example, as a path of a folder to reach the file to be viewed.
[0079]
<Embodiment 3>
In the present invention, the functions of the above-described embodiment are programmed, written in advance on a recording medium such as a CD-ROM, and the CD-ROM or the like is mounted on a medium drive device such as a CD-ROM drive mounted on a computer. By storing the program in a memory or a storage device of a computer and executing the program, the object of the present invention can be achieved.
[0080]
The recording medium may be a semiconductor medium (for example, ROM, nonvolatile memory card, etc.), an optical medium (for example, DVD, MO, MD, CD-R, etc.), a magnetic medium (for example, magnetic tape, flexible disk, etc.). Any of them may be used.
[0081]
Further, a case is also included in which the operating system or the like performs part or all of the actual processing based on the instruction of the loaded program, and the processing realizes the functions of the above-described embodiments.
[0082]
Further, a case is also included in which the above-described program is loaded into a memory provided in a function expansion board or a function expansion unit, and the functions of the above-described embodiments are realized by executing the program.
[0083]
When distributing to the market, the program is stored and distributed in a portable recording medium, or stored in a storage device of a server computer connected via a communication network such as the Internet, and another program is stored through the communication network. It can also be distributed by transferring it to a computer. In this case, the storage device of the server computer is also included in the recording medium of the present invention.
In the computer, the functions of the above-described embodiments are realized by installing a program on a portable recording medium or a transferred program in a storage device connected to the computer, and executing the installed program. Is done.
[0084]
It should be noted that the present invention is not limited to the above-described embodiment, and various changes and modifications can be made without departing from the spirit of the present invention.
[0085]
【The invention's effect】
As described above, according to the present invention, when searching for and browsing a file that matches a search condition specified by a user, auxiliary information from a plurality of viewpoints regarding the contents of each target file is added to the list of files to be viewed. By combining and adding, the user can efficiently select only the files that he or she needs from the list without having to individually open the files and check the contents.
[0086]
In addition, since the file to be browsed is acquired as supplementary information, not only bibliographic information but also information about the part containing the search term and linguistic information such as important words and phrases in the file are acquired. Information can be obtained from a plurality of viewpoints regarding the contents of the information, and the efficiency and accuracy of the information selection are improved.
By displaying the character string before and after the position where the search term appears as the information of the part including the search term, the user can know in what context the search term is used in the browse target file. be able to.
[0087]
In addition, since noun phrases that co-occur in the same sentence where the search word appears are extracted as phrases that are representative of the contents in the file, the user can use the search word in any context in the browse target file. Information can be determined, and information can be sorted efficiently.
[0088]
Furthermore, when extracting a sentence (important sentence) representing the contents of the file, the user can switch the extraction method according to the document type, the accuracy of the extracted important sentence is improved, and the information selection is improved. It can be done efficiently.
[0089]
In addition, since the user can select and specify the amount of auxiliary information to be extracted, the user can adjust the amount of auxiliary information to be displayed according to the purpose of the search or the level of proficiency in the search target field.
[0090]
In addition, the type of auxiliary information added to the browse target file list, the presence or absence of a translation process of the auxiliary information, and the translation target language can be selected by the user himself, and only the auxiliary information desired by the user is presented or presented. User-friendly interface that allows the user to freely switch auxiliary information as needed.
[0091]
Furthermore, if the document to be viewed is a foreign language document or the user's native language is not the language of the target document, the user can select and specify whether or not to translate the auxiliary information to be displayed and the translation language. Thus, only the desired file can be efficiently selected from the list without opening each file and checking the contents over time.
[0092]
Also, instead of acquiring the language information as a key by performing a language analysis of the file to be viewed in real time, the language information is extracted in advance and stored in association with the file, thereby performing the language analysis when browsing. There is no need, and auxiliary information can be obtained more efficiently.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a hardware configuration for realizing a general search device.
FIG. 2 is a block diagram illustrating a functional configuration of a search device according to the first embodiment.
FIG. 3 is an example of a screen for inputting a search word and instructing execution of a search.
FIG. 4 is an example of a data structure of an auxiliary information storage unit.
FIG. 5 is a specific example of auxiliary information for one browsing target file.
FIG. 6 is an example of a data structure of an auxiliary information display format table.
FIG. 7 is a display example of a browse target file list to which auxiliary information has been added.
FIG. 8 is an example of a screen on which the user inputs the type of auxiliary information to be displayed.
FIG. 9 is a block diagram illustrating a functional configuration of an auxiliary information acquiring unit.
FIG. 10 is a display example when a keyword and a head part of a file are designated as language information of auxiliary information.
FIG. 11 is a flowchart showing a processing procedure of a search device incorporating the search support device of the present invention.
FIG. 12 is a block diagram illustrating a functional configuration of an auxiliary information acquiring unit according to the second embodiment.
FIG. 13 is an example of a data structure of an auxiliary information storage unit.
FIG. 14 is an example of the contents of a viewing target file.
FIG. 15 is a screen example when a screen for specifying the extraction amount of auxiliary information is called.
FIG. 16 is an example of an extraction amount designation screen of auxiliary information.
FIG. 17 is an example of an auxiliary information extraction amount designation screen.
FIG. 18 is a specific example of auxiliary information for one browsing target file.
FIG. 19 is a block diagram illustrating a functional configuration of an auxiliary information output control unit.
FIG. 20 is a screen example in which the user inputs the type of auxiliary information to be displayed and whether or not translation processing is possible.
FIG. 21 is an example of a data structure of an auxiliary information display format table.
FIG. 22 is a display example of a browse target file list to which auxiliary information has been added.
FIG. 23 is a display example of a translation target file list to which auxiliary information has been added;
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 10 ... Search term input means, 20 ... Search means, 30 ... Auxiliary information acquisition means, 31 ... Bibliographic information acquisition means, 32 ... Search term match location acquisition means, 33 ... Language information acquisition means, 34 ... Language analysis means, 35 ... Information extraction amount designating unit, 40: auxiliary information output control means, 41: translation processing execution means, 50: auxiliary information selection means, 60: file group storage means, 70: file list storage means, 80: auxiliary information storage means, 101 ... CPU, 102, memory, 103, input device, 104, display device, 105, storage device, 106, data bus.

Claims (14)

ユーザが指定した検索条件に合致するファイルを検索して閲覧する場合に、閲覧対象ファイルの内容に対する複数の観点からの補助情報を組み合わせて付加した閲覧対象のファイルリストを表示する検索支援装置であって、前記閲覧対象のファイルリストに付加する補助情報を獲得する補助情報獲得手段と、前記補助情報とこの補助情報を獲得した閲覧対象ファイルとを関連づけて格納する補助情報記憶手段と、前記閲覧対象のファイルリストを表示する際、各閲覧対象ファイルの補助情報を所定の表示形式で付加して表示する補助情報出力制御手段とを備えることを特徴とする検索支援装置。A search support device for displaying a list of files to be browsed added by combining auxiliary information from a plurality of viewpoints with respect to the contents of the files to be browsed when searching for and browsing files matching the search conditions specified by the user. A supplementary information acquisition unit for acquiring supplementary information to be added to the file list to be browsed; a supplementary information storage unit for storing the supplementary information in association with a browse target file that has acquired the supplementary information; And a supplementary information output control means for adding and displaying supplementary information of each file to be viewed in a predetermined display format when the file list is displayed. 請求項1に記載の検索支援装置において、前記補助情報獲得手段は、前記閲覧対象ファイルの書誌情報を補助情報として獲得する書誌情報獲得手段と、前記閲覧対象ファイル中から検索条件と合致する部分の情報を補助情報として獲得する検索語合致箇所獲得手段と、前記閲覧対象ファイルの内容を代表する語句および文を補助情報として獲得する言語情報獲得手段とを有することを特徴とする検索支援装置。2. The search support device according to claim 1, wherein the auxiliary information obtaining unit obtains bibliographic information of the file to be viewed as auxiliary information, and a bibliographic information obtaining unit that obtains a part of the file to be viewed that matches a search condition. A search support device comprising: a search word matching point obtaining unit that obtains information as auxiliary information; and a linguistic information obtaining unit that obtains, as auxiliary information, a phrase and a sentence representing the contents of the file to be viewed. 請求項2に記載の検索支援装置において、前記検索語合致箇所獲得手段における検索条件と合致する部分の情報は、前記閲覧対象ファイル中から検索条件と合致する部分とその近傍情報であることを特徴とする検索支援装置。3. The search support device according to claim 2, wherein the information of the part that matches the search condition in the search word matching part acquisition means is a part that matches the search condition in the browse target file and information on its vicinity. Search support device. 請求項3に記載の検索支援装置において、前記検索語合致箇所獲得手段における近傍情報は、検索条件と合致する部分の開始位置よりも前方の文字列および終了位置よりも後方の文字列を所定の量だけ抽出した文字列であることを特徴とする検索支援装置。4. The search support device according to claim 3, wherein the neighborhood information in the search word matching point acquiring means includes a character string ahead of a start position and a character string behind an end position of a part that matches a search condition. A search support device characterized by being a character string extracted by an amount. 請求項2に記載の検索支援装置において、前記検索語合致箇所獲得手段における検索条件と合致する部分の情報は、前記閲覧対象ファイル中の検索条件と合致する部分の位置情報であることを特徴とする検索支援装置。3. The search support device according to claim 2, wherein the information of the part that matches the search condition in the search word matching part obtaining means is position information of a part that matches the search condition in the file to be viewed. Search support device. 請求項2に記載の検索支援装置において、前記言語情報獲得手段は、前記閲覧対象ファイルの内容を代表する語句として、検索語が出現している同一文中に共起する名詞句を抽出することを特徴とする検索支援装置。3. The search support device according to claim 2, wherein the linguistic information acquiring means extracts a noun phrase co-occurring in the same sentence where a search word appears as a phrase representing the contents of the file to be browsed. Characteristic search support device. 請求項2に記載の検索支援装置において、前記言語情報獲得手段は、前記閲覧対象ファイルの内容を代表する文を抽出する際に、文書タイプに応じて抽出方法を切り替えるようにしたことを特徴とする検索支援装置。3. The search support device according to claim 2, wherein the linguistic information acquiring means switches an extraction method according to a document type when extracting a sentence representing the contents of the file to be browsed. Search support device. 請求項2、6または7に記載の検索支援装置において、前記補助情報獲得手段は、前記補助情報の獲得量を選択指定する情報抽出量指定手段を有し、前記言語情報獲得手段は、この補助情報の獲得量だけ前記閲覧対象ファイルの内容から代表する語句および文を獲得することを特徴とする検索支援装置。8. The search support device according to claim 2, wherein the auxiliary information obtaining means includes an information extraction amount specifying means for selecting and specifying an obtaining amount of the auxiliary information, and the linguistic information obtaining means includes an auxiliary information obtaining means. A retrieval support apparatus characterized in that a representative phrase and a sentence are acquired from the contents of the file to be browsed by the amount of information acquired. 請求項2に記載の検索支援装置において、検索対象となるファイルの内容を代表する語句および文を属性情報として当該ファイルと対応付けて予め記憶しておき、前記言語情報獲得手段は、前記閲覧対象ファイルに対応する属性情報を補助情報として獲得することを特徴とする検索支援装置。3. The search support device according to claim 2, wherein words and sentences representing the contents of the file to be searched are stored in advance as attribute information in association with the file, and the linguistic information acquiring means stores the language information and A search support device characterized by acquiring attribute information corresponding to a file as auxiliary information. 請求項1に記載の検索支援装置において、前記補助情報出力制御手段は、前記閲覧対象のファイルリストに付加して表示する補助情報の種類を選択指定する補助情報選択手段を有することを特徴とする検索支援装置。2. The search support device according to claim 1, wherein the auxiliary information output control means includes auxiliary information selection means for selecting and specifying a type of auxiliary information to be added to and displayed on the file list to be viewed. Search support device. 請求項10に記載の検索支援装置において、補助情報を翻訳対象言語に翻訳する翻訳処理実行手段と、補助情報の翻訳処理の有無および翻訳対象言語を選択指定する補助情報選択手段とを有し、前記補助情報出力制御手段は、翻訳を指定されたときには、補助情報を指定された翻訳対象言語へ翻訳して表示することを特徴とする検索支援装置。The search support device according to claim 10, further comprising: a translation processing execution unit that translates the auxiliary information into a translation target language; and an auxiliary information selection unit that selects and specifies whether to perform a translation process of the auxiliary information and a translation target language. The search support device, wherein the auxiliary information output control means translates the auxiliary information into a specified translation target language and displays the translated information when a translation is specified. ユーザが指定した検索条件に合致するファイルを検索して閲覧する場合に、閲覧対象ファイルの内容に対する複数の観点からの補助情報を組み合わせて付加した閲覧対象のファイルリストを表示する検索支援方法であって、前記閲覧対象のファイルリストに付加する補助情報を獲得し、前記補助情報とこの補助情報を獲得した閲覧対象ファイルとを関連づけて格納し、前記閲覧対象のファイルリストを表示する際、各閲覧対象ファイルの補助情報を所定の表示形式で付加して表示するようにしたことを特徴とする検索支援方法。A search support method for displaying a list of files to be browsed added by combining auxiliary information from a plurality of viewpoints with respect to the contents of the files to be browsed when searching and browsing files matching the search conditions specified by the user. Obtaining auxiliary information to be added to the file list to be browsed, storing the auxiliary information and the file to be browsed having acquired the auxiliary information in association with each other, and displaying the file list to be browsed, A search support method, wherein auxiliary information of a target file is added and displayed in a predetermined display format. コンピュータに、請求項1乃至11のいずれかに記載の検索支援装置の機能を実行させるためのプログラム。A program for causing a computer to execute the functions of the search support device according to claim 1. 請求項13に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。A computer-readable recording medium on which the program according to claim 13 is recorded.
JP2003048029A 2002-09-12 2003-02-25 Search support device and method, program and recording medium Pending JP2004157965A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003048029A JP2004157965A (en) 2002-09-12 2003-02-25 Search support device and method, program and recording medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002266601 2002-09-12
JP2003048029A JP2004157965A (en) 2002-09-12 2003-02-25 Search support device and method, program and recording medium

Publications (1)

Publication Number Publication Date
JP2004157965A true JP2004157965A (en) 2004-06-03

Family

ID=32827517

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003048029A Pending JP2004157965A (en) 2002-09-12 2003-02-25 Search support device and method, program and recording medium

Country Status (1)

Country Link
JP (1) JP2004157965A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241635A (en) * 2006-03-08 2007-09-20 Nec Corp Document retrieval device, information processor, retrieval result output method, retrieval result display method and program
JP2009157865A (en) * 2007-12-28 2009-07-16 Nifty Corp Information search device, information search program and information search method
JP2009199164A (en) * 2008-02-19 2009-09-03 Ricoh Co Ltd Document management device, document management method and recording medium
WO2010103916A1 (en) * 2009-03-13 2010-09-16 コニカミノルタホールディングス株式会社 Device for presentation of characteristic words in document and program giving priority of characteristic words
JP2015001899A (en) * 2013-06-17 2015-01-05 株式会社Nttドコモ Content search system, content search method and content search program
JP2015102957A (en) * 2013-11-22 2015-06-04 株式会社ユニバーサルエンターテインメント Information search system, information search device, information search method, and program

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241635A (en) * 2006-03-08 2007-09-20 Nec Corp Document retrieval device, information processor, retrieval result output method, retrieval result display method and program
JP2009157865A (en) * 2007-12-28 2009-07-16 Nifty Corp Information search device, information search program and information search method
JP2009199164A (en) * 2008-02-19 2009-09-03 Ricoh Co Ltd Document management device, document management method and recording medium
WO2010103916A1 (en) * 2009-03-13 2010-09-16 コニカミノルタホールディングス株式会社 Device for presentation of characteristic words in document and program giving priority of characteristic words
JP2015001899A (en) * 2013-06-17 2015-01-05 株式会社Nttドコモ Content search system, content search method and content search program
JP2015102957A (en) * 2013-11-22 2015-06-04 株式会社ユニバーサルエンターテインメント Information search system, information search device, information search method, and program

Similar Documents

Publication Publication Date Title
US6381593B1 (en) Document information management system
US7783644B1 (en) Query-independent entity importance in books
US8024175B2 (en) Computer program, apparatus, and method for searching translation memory and displaying search result
US10552467B2 (en) System and method for language sensitive contextual searching
US20020083045A1 (en) Information retrieval processing apparatus and method, and recording medium recording information retrieval processing program
JPH0785056A (en) Dictionary preparation supporting method
JP4934355B2 (en) Information search support program, computer having information search support function, server computer, program storage medium
JP2002189721A (en) Web page retrieval system and translation system
JP2011181109A (en) Information retrieval support program, computer having information retrieval support function, server computer and program storage medium
JP2004157965A (en) Search support device and method, program and recording medium
JP2005128872A (en) Document retrieving system and document retrieving program
JP2002189744A (en) Web page retrieval system
JPH08287088A (en) Method and device for information retrieval
JP2000231569A (en) Internet information retrieving device, internet information retrieving method and computer readable recording medium with program making computer execute method recorded therein
JP3710463B2 (en) Translation support dictionary device
JP2005011149A (en) Information retrieval system and retrieval request device
JP2009123067A (en) Term dictionary creating method, term dictionary creating apparatus, program, and recording medium
JP4384736B2 (en) Image search device and computer-readable recording medium storing program for causing computer to function as each means of the device
JP2004348774A5 (en)
JP4368550B2 (en) Document search apparatus, document search method, and program causing computer to execute the method
JPH01214963A (en) Device for consulting dictionary
JPH1145238A (en) Document management system and computer readable recording medium for recording program for having computer function as the same system
WO2010106660A1 (en) Keyword presentation device and keyword presentation program
JP2006172029A (en) Method for presenting retrieval result
JP2002288221A (en) Document indicating equipment, method for document indicating, and its program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050627

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080828

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080909

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081030

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081202