JP3578651B2 - 文書検索システム、文書検索方法およびその方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

文書検索システム、文書検索方法およびその方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP3578651B2
JP3578651B2 JP34497398A JP34497398A JP3578651B2 JP 3578651 B2 JP3578651 B2 JP 3578651B2 JP 34497398 A JP34497398 A JP 34497398A JP 34497398 A JP34497398 A JP 34497398A JP 3578651 B2 JP3578651 B2 JP 3578651B2
Authority
JP
Japan
Prior art keywords
search
document
unit
collation
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP34497398A
Other languages
English (en)
Other versions
JP2000172698A (ja
Inventor
雅之 亀田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP34497398A priority Critical patent/JP3578651B2/ja
Publication of JP2000172698A publication Critical patent/JP2000172698A/ja
Application granted granted Critical
Publication of JP3578651B2 publication Critical patent/JP3578651B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、文書検索システムにおける文書検索結果の一覧表示に関する。
【0002】
【従来の技術】
文書の電子化やインターネットの普及により、文書検索システムのニーズが高まってきている。
文書検索システムでは、通常、検索語や検索文字列(以下「検索キー」と呼ぶ)を並べたり、AND/OR論理演算子で組み合わせた検索条件をユーザーが指定して、その検索条件に合致する文書を検索し、検索結果として検索された文書を一覧表示で提示し、また、必要に応じてユーザーが指定した文書を参照表示等することができる。また、検索条件に、自然言語文や文書の一部あるいは全体を指定できる文書検索システムもある。
文書の一覧は、通常、文書のタイトルに相当する部分が名称情報として表示されるが、近年では、併せて、その文書の冒頭部分、重要キーワード、要約文等の効果的な縮約情報を表示することで、ユーザーが文書を直接に参照する前に、その文書がユーザーの求めている文書かどうかを判断することを助ける機能が用意されるようになっている。
【0003】
【発明が解決しようとする課題】
しかしながら、上述のような従来の手法では以下のような問題がある。
提示されるタイトル、冒頭部分、重要キーワード、要約文は、ユーザーの検索条件を指向したものではない。そこで、ユーザーの検索条件を反映した情報として、ユーザーの検索条件とどの程度照合しているかを点数(スコア)付けして、その順に文書一覧を並べたり、さらにそのスコアを付与して、ユーザーの検索条件に応じた情報を付加することも行われるようになってきた。
【0004】
しかし、検索キーが一つだけの場合なら、スコアでも十分であるが、実際には、複数の検索キーがある場合に、検索条件には表現しきれないユーザーの検索キーの重きの置き方等がスコアに反映されていないので、適切な判定の参考にはなりにくい面があった。
又、検索条件式の中の検索キーが各文書に対してどの程度の重要なキーとなっているかどうかが判然としないため、目視による文書の選定を行うことができなかった。
【0005】
これを解決するために、特開平10−49543号公報における技術では、ユーザーの検索意図を表す言語特徴を分類し、その分類の特徴を表すキーワード(入力特徴)を選定してから文書群を分類する。分類わけした後、分類毎に評価点を計算し、評価点の高い順に文書とその分類毎の評価点とを表示するようにして、その分類と評価点を確認することで検索意図に近い文書を効率良く絞り込むことを支援している。
しかしながら、文書検索するためにこのような言語特徴を分類するという新たな困難な作業を行わなければならないし、システムとしてもシソーラスや概念辞書、共起辞書を必要とすることになり、システムも大きくなるという問題点がでてくる。
【0006】
このような問題点を解決するために、本発明では、一般に使われているキーワード検索条件式によってユーザーの意図する文書を検索する文書検索システムにおいて、「検索された文書が選定されるために、ユーザーの指定した検索条件の中のどの検索キーがどの程度貢献しているかを照合度で提示する」ことによってユーザーの検索意図がどの程度反映された文書であるかを自分で確かめられるような文書検索システムを最小限の労力にて構成できるようにすることを目的とする。
【0007】
【課題を解決するための手段】
請求項1の文書検索システムは、検索条件を入力して文書データベースを検索し、検索結果を一覧表示する文書検索システムにおいて、検索条件を入力する検索条件入力部と、複数の文書が格納されている文書データベースと、前記検索条件入力部で入力した検索条件で前記文書データベースを検索する検索部と、前記検索部で検索された各文書に対して検索条件中の検索語あるいは検索文字列(以下「検索キー」と呼ぶ)毎に照合度を求める照合度評価部と、前記検索部で検索された文書を一覧表示する検索結果表示部とを備え、前記検索結果表示部に前記照合度評価部で得た照合度をもとに検索キーとの照合状況が検索キー毎に分かるよう表現を生成する照合状況表現部を付加して前記検索部で検索された文書と該照合状況表現部で得た表現とを関連付けて一覧表示するようにした。
【0008】
請求項2の文書検索システムは、検索条件を入力して文書データベースを検索し、検索結果を一覧表示する文書検索システムにおいて、検索条件を入力する検索条件入力部と、前記検索条件入力部で入力した検索条件を送って、その検索条件で複数の文書が格納されている文書データベースを検索した結果を受信する検索インタフェース部と、前記検索インタフェース部で受信した検索結果の各文書に対して検索条件中の検索語あるいは検索文字列(以下「検索キー」と呼ぶ)毎に照合度を求める照合度評価部と、前記検索インタフェース部で受信した検索結果の文書を一覧表示する検索結果表示部とを備え、前記検索結果表示部に前記照合度評価部で得た照合度をもとに検索キーとの照合状況が検索キー毎に分かるよう表現を生成する照合状況表現部を付加して前記検索インタフェース部で受信した検索結果の文書と該照合状況表現部で得た表現とを関連付けて一覧表示するようにした。
【0009】
請求項3の文書検索システムは、請求項1又は請求項2記載の文書検索システムにおいて、前記照合状況表現部は、検索キー毎に、照合度の評価値の大きさが分かる表現を生成し、照合度の評価値の順序で該表現と検索キーを対応させて並べるようにした。
【0010】
請求項4の文書検索システムは、請求項1又は請求項2記載の文書検索システムにおいて、前記照合状況表現部は、検索条件式中の検索キーの構成と、該検索キーに対応する照合度の評価値の大きさが分かるような図形を生成するようにした。
【0011】
請求項5の文書検索システムは、請求項1又は請求項2又は請求項4の文書検索システムにおいて、前記照合状況表現部は、検索キー毎に照合度の評価値を図形の装飾によって照合度の評価値の違いが分かるようにした。
【0012】
請求項6の文書検索システムは、請求項1又は請求項2又は請求項4の文書検索システムにおいて、前記照合状況表現部は、検索キー毎に照合度の評価値を図形の形状によって照合度の評価値の違いが分かるようにした。
【0013】
請求項7の文書検索方法は、検索条件によって文書データベースを検索し、検索結果を一覧表示する文書検索方法において、検索条件を入力し、複数の文書が格納されている文書データベースを前記検索条件によって検索して、合致した文書を文書一覧記憶手段に記憶し、この文書一覧記憶手段に記憶された各文書に対して検索キー毎に照合度を求め、該検索キー毎の照合度を各文書に対応させて前記文書一覧記憶手段を更新し、前記文書一覧記憶手段に記憶された各文書に対応する照合度をもとに検索キーとの照合状況が検索キー毎に分かるような表現を生成し、該表現と文書とを関連付けて一覧表示するようにした
【0014】
請求項8のコンピュータ読み取り可能な記録媒体は、コンピュータに、検索条件を入力し、複数の文書が格納されている文書データベースを前記検索条件によって検索して、合致した文書を文書一覧記憶手段に記憶し、この文書一覧記憶手段に記憶された各文書に対して検索キー毎に照合度を求め、該検索キー毎の照合度を各文書に対応させて前記文書一覧記憶手段を更新し、前記文書一覧記憶手段に記憶された各文書に対応する照合度をもとに検索キーとの照合状況が検索キー毎に分かるような表現を生成し、該表現と文書とを関連付けて一覧表示させるためのプログラムを記録している
【0015】
【発明の実施の形態】
以下、3つの実施例を用いて、本発明の構成および動作原理について説明する。
【0016】
1.実施例1(単独型)
本発明の第1の実施例について図1〜図14を用いて説明する。
(1)全体構成
図1に本実施例の文書検索システム(以下、本システムという)の全体構成を示す。1は入力手段、2は表示手段、3はCPU、4はメモリ、5は記憶手段である。
入力手段1はキーボード、マウス、タッチパネル等により構成され、本システムへの情報の入力に使用される。表示手段2は、本システムからの出力情報や入力手段1からの入力された情報などを表示させるものである。CPU3は、本システムの各部(後述する検索条件入力部、検索部、照合度評価部、検索結果表示部、照合状況表現部等)のプログラムを動作させる。メモリ4には、本システムの各部がCPU3によって実行されるときに一時的に作成される情報や各部のプログラム等が保持される。記憶手段5は、文書群を保持する文書データベースや本システムの各部のプログラム等を保持している。
【0017】
図2は、本システムの機能構成を示す図である。
検索条件入力部10は、入力部1から入力される検索のための検索条件式を入力させ、それを検索部20へ送る。
文書データベース20は、複数の文書を登録管理するデータベースであり、記憶手段5に保持され、例えばリレーショナルデータベース管理システムのような既存のものを使って管理する。このデータベースの管理する情報としては、1つの文書について少なくともタイトルと文書内容の情報を持っている。
検索部30は、検索条件入力部10から与えられた検索条件式を使って文書データベース20を検索して検索結果を照合度評価部へ送る。
照合度評価部40は、検索結果の各文書に対して検索条件式にある検索キー毎の照合度を評価する。
検索結果表示部50は、検索された文書とその照合度とを受けて表示手段2へ一覧表示する。このとき検索結果表示部50の照合状況表現部52は、ユーザーの指示又はシステムで予め決めた表現方法により検索キーの照合度を出力可能な形に変換する。
【0018】
(2)処理の流れ
以下に、本システムの処理の流れを図3のフローチャートを使って説明する。
【0019】
ステップS100:
ユーザーは、必要とする文書に対する検索語等(検索キー)を単位にした論理式で表現した検索条件式を入力手段1(例えば、キーボード等)から入力する。例えば、検索キー「兵器」を持ち且つ、検索キー「輸出規制」又は「輸出緩和」のいずれかをもつ文書を文書データベース20から検索するための検索条件式は次のような形式をとる。
兵器 & (輸出規制 | 輸出緩和)
ここで、&は論理積(AND演算子)、|は論理和(OR演算子)、( )は優先範囲を示す。この他に、最も単純な場合は、単一の検索キーだけであったり、また、演算子を用いずに複数の検索キーを並べて、「すべて含む」とか「いずれかを含む」という意味で記述することもできる。
さらに、自然言語文や文書の一部あるいは全部を検索条件として受け入れるようにもできる。ただし、この場合は、必ずしもその内容の理解に基づくわけではなく、自然言語文や文書に含まれる単語群を検索キー群と見て、それらを論理和的に扱ったり、検索条件内及び文書データベースの各文書内の単語群をベクトルとして見なす方法などがあるが、本実施例では論理式で表現された検索条件式を対象にして説明することにする。
【0020】
ステップS110:
この入力された検索条件式を解釈し、文書データベース20中から検索条件式に合致する文書を検索する。
これを実現する方法として例えば、文書毎の検索キー頻度テーブル200(図4)を作成し、検索キーの出現頻度と検索条件式から条件に合致する文書を選択する。
この合致した文書に対して、次の情報からなる文書一覧テーブル300(図5)を作成する。
文書ID(識別子)
タイトル
この文書内での検索キーの出現頻度(すべての検索キーに対して)
尚、検索キー頻度テーブル200を作成せず各文書の検索時に合致したものだけを文書一覧テーブル300として直接作成しても良い。
【0021】
ステップS120:
検索された文書一覧テーブル300にある各文書ごとに、検索条件式の各検索キーの照合度を計算する(図7)。
上記の例では、「兵器」、「輸出規制」、「輸出緩和」の3つの検索キーがそれぞれ各文書にどのくらい貢献しているのかを照合度として評価する(詳細は後述する)。
【0022】
ステップS130:
文書一覧テーブル300に設定された照合度をもとに、各文書について検索キー毎の照合の状況表現を生成する。
この表現生成に際しては、入力手段1からどのような形式で状況を表示したいかをユーザーが指定することによって変更することができる。指定されなければ予め定められた形式とされる(詳細は後述する)。
【0023】
ステップS140:
その結果を各文書ごとに検索キー毎の照合状況を付加した検索文書の一覧(例えば文書タイトル等の一覧)をディスプレイ等の表示手段2へ表示する(詳細は後述する)。
【0024】
(a)照合度評価(ステップS120)
本システムの照合度の評価には検索キー(単語)毎の重要度を用いて計算する。
この単語の重要度には、次のような種々の計算方法がある。
・文書内での出現頻度(tf:term frequency)、
・文書頻度(文書データベース全体でその単語が出現する文書の数df:document frequency)の逆数値(idf:inverted df)
・idfの対数値(これを改めてidfと呼ぶことがある)
・tfとidfとの積
【0025】
本システムでは、上記のうち最後に上げた「tfとidfの対数値(ここではlog(1000/df)として計算した)との積」に基づいて評価することにする。
この場合は、予め文書データベース20全体について、単語ごとに出現する文書数(文書頻度:df)を計数し、上記計算式で単語の重要度として計算し、単語重要度テーブル400(図6)を作成する。
単語重要度テーブル400は次のエントリーを持つ。
単語
この単語のデータベース内での出現頻度
この単語の重要度(上記の計算式で求めたもの)
従って、各文書の検索キー毎の照合度は、文書一覧テーブル300の各検索キーの文書内頻度と単語頻度テーブル400の単語(検索キー)の重要度との積をとった値として計算できる。その結果、次のエントリーを持つ照合度テーブル500を作成する。図7はその計算結果である。
文書ID
文書タイトル
検索キー毎の照合度
【0026】
又、照合度の評価値を検索キーの文書内頻度としても良い。このときには上記の単語重要度テーブル400は必要なくなり、頻度そのものが評価値となる。
【0027】
(b)照合状況表現(ステップS130)
本システムでは、照合度テーブル500の検索キー毎の照合度を用いて照合状況の表現を生成するが、これには下記のような種々の表現がある。更にこれらを適宜組み合わせて表現を生成することもできる。
【0028】
(i)照合状況を照合度評価値そのものの大きさを使って表現する場合
(イ)照合状況をその文書で合致した検索キーをリストアップする。
例えば、図7の文書IDが12の場合
兵器 輸出規制
文書IDが1245の場合
兵器 輸出規制 輸出緩和
というように表現を生成する。
又、この検索キーリストを照合度の大きい順に並べることも検索キーの貢献度を知る上で有効である。図7の文書IDが1245の場合
輸出緩和 輸出規制 兵器
又、検索条件式そのものを用いて、照合度がゼロの検索キーを省略した形での表現を生成することもできる。
例えば、図7の文書IDが201の場合
兵器 & 輸出規制
文書IDが1245の場合
兵器 & (輸出規制 | 輸出緩和)
【0029】
(ロ)照合状況をその文書で合致した検索キーに照合度を付加した形でリストアップする。上例(イ)では、照合があったこととその順位はわかるがその貢献の程度は分からないので、照合度の数値を付加した形で表現を生成する(この形式を検索結果表示部50から検索結果一覧表を表示する際の規定値とする)。
例えば、図7の文書IDが201の場合
兵器:1.34 輸出規制:2.94
又は、照合度の順番に並べて
輸出規制:2.94 兵器:1.34
とすることもできる。表示されなかった検索キーは、存在していなかったのか又は省略されているのか分からないときもあるので、このように照合度を付加するときは照合度がゼロであってもリストに加えることも有効である。
兵器:2.01 輸出規制:0.98 輸出緩和:0.00
又は、検索条件式そのものを用いて、検索条件式の中の検索キーに照合度を付加して表現を生成することも有効である。
例えば、図7の文書IDが1245の場合
兵器:0.67 & (輸出規制:1.96 | 輸出緩和:3.50)
又、文書IDが999は照合度がゼロのところを省略した形で
兵器:2.01 & 輸出規制:0.98
とも表現を生成できるし、ゼロを省略せずにそのまま付加した形でも良い。
上記の照合度の数値は、計算されたものをそのまま用いているが、これを四捨五入や何倍かして整数型としてもよい。
例: 兵器:2 & 輸出規制:1
【0030】
(ii)照合状況を照合度の大きさを長さ、面積、形状、色の相違、濃淡、装飾の相違等によって表現する場合
(イ)照合状況をその文書で合致した検索キーを図形(円形、長方形、帯グラフ等)で囲った形でリストアップする。
又、この図形を照合度の大きい順に並べることも検索キーの貢献度を知る上で有効である。照合度がゼロの場合には対応する図形を省略するようにしてもよい。
【0031】
(ロ)寸法線の長さや棒グラフの棒の長さによって大きさを表現する。(図8)照合度を付加して表現しても良い。
(ハ)図形(円形、長方形、帯グラフ等)の面積によって大きさを表現する(図9)。
(ニ)大きさを図形の形状に対応付けて表現する。
例:◎、○、□、△、×等の順で大きさを定義して使用する。
このうち×を照合度がゼロに対応させるようにすれば、合致しなかった検索キーを知ることができる。
(ホ)図形(○や□等)を色彩の種類によって大きさを表現する。
例:赤、青、紫、緑、黄色、黒、白等の順で大きさを定義して使用する。
無色の輪郭だけの図形は照合度がゼロに対応させるようにすれば、合致しなかった検索キーを知ることができる。
【0032】
(ヘ)図形(○や□等)を色彩の濃淡によって大きさを表現する。
例:上記の中でも色の濃淡を使い分けて、濃いほうを大きさが大きいとする。
この場合、一色でも上記のように多色でも良い。
無色の輪郭だけの図形は照合度がゼロに対応させるようにすれば、合致しなかった検索キーを知ることができる。
(ト)図形(○や□等)をハッチングするとき、その模様の相違によって大きさを表現する(図10)。
ハッチングの無い輪郭だけの図形は照合度がゼロに対応させるようにすれば、合致しなかった検索キーを知ることができる。
(チ)検索条件式において、論理形式のANDとORの関係の軸を図形(例えば、帯グラフ)を用いて、直交させるように表現する。
図11は検索条件式が
兵器 & (輸出規制 | 輸出緩和)& 日本
であり、照合度がそれぞれ兵器:2、輸出規制:3、輸出緩和:1、日本:0のときの表現を表している。
【0033】
(iii)照合状況を上記の(ロ)、(ハ)や(チ)のように図形の面積や線分の長さを使って表現する場合に、トータルの大きさを文書の照合度の大きさにして、それを各検索キーの照合度の割合に分割して表現するようにしても良い(図12)。
【0034】
(c)検索結果表示(ステップS140)
図13は、検索条件式の照合状況表現が付加されていない検索結果一覧の例で、表示順番号と文書のタイトルとをリストアップしている。
又、検索結果一覧を表示する際には、文書毎の照合度を計算して、その照合度の値の順序で表示するようにしても良い。図14は、検索結果一覧に文書のタイトルだけでなく、文書毎の照合度を示す値が〔 〕内に示され、その値の大きさの順にソートして表示するようにしている。
【0035】
この文書毎の照合度は、ここでは各検索キーの照合度の和を10倍して、四捨五入した値として求める。このとき、’&’関係のキーの組み合わせの照合度は、各検索キーの照合度の和とし、「輸出規制」と「輸出緩和」のような’|’関係の検索キーの組み合わせは、各検索キーの照合度のうちの最大の照合度として計算する。このようにして求めた文書の照合度は、照合度テーブル500に文書の照合度というエントリーを作成して保存する。
例えば、文書IDが1245の文書では、
0.67+max(1.96,3.50)=0.67+3.50=4.17
であり、文書の照合度は、上記の照合度和を10倍して、四捨五入した値として算出する。
【0036】
図14のような一覧表示からユーザーの望んでいる文書を選択するときに、検索キー毎の照合度や文書の内容を表示させて判断材料とすることができる。
例えば、詳細な内容を表示させたいときには、対象となる文書をマウスのような入力手段1を使ってダブルクリックして、その選択された文書の文書IDで文書データベース20から文書の内容を抽出して表示させて判断材料とすることができる。
【0037】
又、本発明で提案されているように検索キー毎の照合度を表示させて判断材料とすることもできる。
これには、照合状況を前記したいずれか又はその組み合わせのいずれの形式で表示したいかをユーザーがメニュー表示させた中から選択する。
検索結果表示部50は、この指示に従って照合テーブル500の各照合度を照合状況表現部52によって生成された表現は、各文書のタイトルの下に図15(a)のような形式で表示手段2へ表示される。
又は、文書の照合度とタイトルとの間に照合状況を図15(b)のような形式で表示手段2へ表示するようにしても良い。
又は、文書の照合度とタイトルとの間に照合状況を図15(c)のような形式で表示手段2へ表示するようにしても良い。
又は、検索結果一覧を図14の形式で表示してから、個別に照合状況を表示させるようにしても良い。
【0038】
例えば、図15(b)は、検索キーに付けられた照合度により、上位4文書のうち、
・1番目の文書は、「輸出規制」について多く記述されている
・2番目の文書だけは、「輸出緩和」についても述べられている
といったことがわかり、ユーザーの文書選択の判断に有効な情報となり得る。
【0039】
(d)評価のタイミング
上述した検索部30では、文書毎に検索キー毎の文書頻度を計算して文書一覧テーブル300を作成したが、次の2つのうちのいずれの構成方法であってもよい。
(1)検索部30では、検索条件に合致する文書だけを検出し、その合致した文書IDのみを文書一覧テーブル300として作成する。
照合度評価部40では、この文書一覧テーブル300に登録された文書毎に各検索キー毎の文書内の出現頻度を計算する。この頻度を基に検索キーの照合度を計算する。
さらに必要であれば文書毎の照合度も計算する。
(2)検索部30で合致する文書を検出するだけでなく、合致した文書の検索キー毎の出現頻度から照合度、更には必要であれば文書毎の照合度も計算してしまう。即ち、検索部30と照合度評価部40とが一体となって動作するように構成する。
【0040】
2.実施例2(ネットワーク型)
本発明の第2の実施例は、クライアント/サーバー型によって構成した例であり、図16はその全体構成図である。
サーバーは、実施例1と同じ構成としており、文書データベースの検索サーバーとして動作する。
クライアントは、実施例1の構成から文書データベースと検索実行部分を省略したもので構成している。
これらの1台の検索サーバーと複数台のクライアントとはLANを介して結合されている。
【0041】
図17は、本実施例の機能構成図であり、以下のように検索サーバーとクライアントとは連携して動作する。
クライアント1が本文書検索システムを利用するときには、クライアント1の検索条件入力部10で検索条件を入力し、この検索条件を検索インタフェース部60が検索サーバーの検索部30へ送信し、検索サーバーの検索部30が指定された検索条件に合致した文書の文書一覧テーブル300をクライアント1の検索インターフェース部60へ送り返す。
クライアント1は、この文書一覧テーブル300から照合度評価部40によって照合度を計算し、その結果の照合テーブル500によって検索結果表示部50によって表示手段2へ表示される。
【0042】
尚、クライアント側に照合度評価部30を備えるように構成したが、検索サーバーに照合度評価部40を備えさせて検索された文書とその照合度を計算し、その結果である照合テーブル500をクライアントの検索インタフェース部60へ送り返し、検索インタフェース部60から検索結果表示部50を通じて照合度の表現を付加した検索結果一覧表を表示手段2へ表示するように構成しても良い。
【0043】
3.実施例3(プログラムとしての実施例)
なお、本発明の文書検索システムは上記の実施形態のみに限定されたものではない。
例えば、図2に示した文書検索システムを構成する検索条件入力部10、検索部30、照合度評価部40、検索結果表示部50の各機能をプログラム化し、予めCD−ROM等の記録媒体に書き込んでおき、このCD−ROMをCD−ROMドライブを搭載したコンピュータに装着して、コンピュータへそのプログラムをロードすることによって、実施例1の実施形態と同様な機能を実現することができる。
【0044】
又、本文書検索システムを図16のようなクライアント/サーバーシステム(実施例2)で構成することもあるが、サーバー側の検索部30の機能をプログラム化してCD−ROMへ記録し、クライアント側は検索条件入力部10、照合度評価部40、検索結果表示部50、検索インタフェース部60の各機能をプログラム化してCD−ROMへ記録するようにしてもよい。
【0045】
又は、サーバー側の検索部30、照合度評価部40の各機能をプログラム化してCD−ROMへ記録し、クライアント側は検索条件入力部10、検索結果表示部50、検索インタフェース部60の各機能をプログラム化してCD−ROMへ記録するようにしてもよい。
【0046】
尚、記録媒体としては半導体媒体(例えば、ROM、ICメモリカード等)、光媒体(例えば、DVD−ROM,MO,MD,CD−R等)、磁気媒体(例えば、磁気テープ、フレキシブルディスク等)のいずれであってもよい。
【0047】
【発明の効果】
以上説明したように特許請求の範囲の発明によれば、検索結果の一覧を表示するときに、文書毎に検索キーとの照合状況を表示する種々の表現手段を提供し、且つ、ユーザーの検索条件に応じて簡潔な情報を提供することにより、検索結果の一覧の中から所望の文書を効率良く選択することができるようになった。
【図面の簡単な説明】
【図1】本発明の文書検索システムに関する実施例1の全体構成図である。
【図2】本発明の文書検索システムに関する実施例1の機能構成図である。
【図3】本発明の文書検索システムに関する処理の流れを説明するためのフローチャートである。
【図4】検索キー頻度テーブルのデータ構造を説明するための図である。
【図5】文書一覧テーブルのデータ構造を説明するための図である。
【図6】単語重要度テーブルのデータ構造を説明するための図である。
【図7】照合度テーブルのデータ構造を説明するための図である。
【図8】照合状況表現のうち長さによって表現する例を示す図である。
【図9】照合状況表現のうち図形の面積によって大きさを表現する例を示す図である。
【図10】照合状況表現のうち図形のハッチングの模様によって表現する例を示す図である。
【図11】照合状況表現のうち検索条件式の構造を表現する例を示す図である。
【図12】照合状況表現のうち文書の照合度の大きさを検索キーの照合度の割合で分割して表現する例を示す図である。
【図13】一般的な検索結果一覧の出力画面の一例である。
【図14】本発明の検索結果一覧の出力画面の一例である。
【図15】本発明の検索結果一覧の出力画面の他の例である。
【図16】本発明の情報検索システムに関する実施例2の全体構成図である。
【図17】本発明の文書検索システムに関する実施例2の機能構成図である。
【符号の説明】
1…入力手段、2…表示手段、3…CPU、4…メモリ、5…記憶手段、10…検索条件入力部、20…文書データベース、30…検索部、40…照合度評価部、50…検索結果表示部、52…照合状況表現部、200…検索キー頻度テーブル、300…文書一覧テーブル、400…単語重要度テーブル、500…照合度テーブル。

Claims (8)

  1. 検索条件を入力して文書データベースを検索し、検索結果を一覧表示する文書検索システムにおいて、検索条件を入力する検索条件入力部と、複数の文書が格納されている文書データベースと、前記検索条件入力部で入力した検索条件で前記文書データベースを検索する検索部と、前記検索部で検索された各文書に対して検索条件中の検索語あるいは検索文字列(以下「検索キー」と呼ぶ)毎に照合度を求める照合度評価部と、前記検索部で検索された文書を一覧表示する検索結果表示部とを備え、前記検索結果表示部に前記照合度評価部で得た照合度をもとに検索キーとの照合状況が検索キー毎に分かるような表現を生成する照合状況表現部を付加して前記検索部で検索された文書と該照合状況表現部で得た表現とを関連付けて一覧表示するようにしたことを特徴とする文書検索システム。
  2. 検索条件を入力して文書データベースを検索し、検索結果を一覧表示する文書検索システムにおいて、検索条件を入力する検索条件入力部と、前記検索条件入力部で入力した検索条件を送って、その検索条件で複数の文書が格納されている文書データベースを検索した結果を受信する検索インタフェース部と、前記検索インタフェース部で受信した検索結果の各文書に対して検索条件中の検索語あるいは検索文字列(以下「検索キー」と呼ぶ)毎に照合度を求める照合度評価部と、前記検索インタフェース部で受信した検索結果の文書を一覧表示する検索結果表示部とを備え、前記検索結果表示部に前記照合度評価部で得た照合度をもとに検索キーとの照合状況が検索キー毎に分かるよう表現を生成する照合状況表現部を付加して前記検索インタフェース部で受信した検索結果の文書と該照合状況表現部で得た表現とを関連付けて一覧表示するようにしたことを特徴とする文書検索システム。
  3. 請求項1又は請求項2記載の文書検索システムにおいて、前記照合状況表現部は、検索キー毎に、照合度の評価値の大きさが分かる表現を生成し、照合度の評価値の順序で該表現と検索キーを対応させて並べることを特徴とする文書検索システム。
  4. 請求項1又は請求項2記載の文書検索システムにおいて、前記照合状況表現部は、検索条件式中の検索キーの構成と、該検索キーに対応する照合度の評価値の大きさが分かるような図形を生成することを特徴とする文書検索システム。
  5. 請求項1又は請求項2又は請求項4記載の文書検索システムにおいて、前記照合状況表現部は、検索キー毎に照合度の評価値を図形の装飾によって照合度の評価値の違いが分かるようにしたことを特徴とする文書検索システム。
  6. 請求項1又は請求項2又は請求項4記載の文書検索システムにおいて、前記照合状況表現部は、検索キー毎に照合度の評価値を図形の形状によって照合度の評価値の違いが分かるようにしたことを特徴とする文書検索システム。
  7. 検索条件によって文書データベースを検索し、検索結果を一覧表示する文書検索方法において、検索条件を入力し、複数の文書が格納されている文書データベースを前記検索条件によって検索して、合致した文書を文書一覧記憶手段に記憶し、この文書一覧記憶手段に記憶された各文書に対して検索キー毎に照合度を求め、該検索キー毎の照合度を各文書に対応させて前記文書一覧記憶手段を更新し、前記文書一覧記憶手段に記憶された各文書に対応する照合度をもとに検索キーとの照合状況が検索キー毎に分かるような表現を生成し、該表現と文書とを関連付けて一覧表示することを特徴とする文書検索方法。
  8. コンピュータに、検索条件を入力し、複数の文書が格納されている文書データベースを前記検索条件によって検索して、合致した文書を文書一覧記憶手段に記憶し、この文書一覧記憶手段に記憶された各文書に対して検索キー毎に照合度を求め、該検索キー毎の照合度を各文書に対応させて前記文書一覧記憶手段を更新し、前記文書一覧記憶手段に記憶された各文書に対応する照合度をもとに検索キーとの照合状況が検索キー毎に分かるような表現を生成し、該表現と文書とを関連付けて一覧表示させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP34497398A 1998-12-04 1998-12-04 文書検索システム、文書検索方法およびその方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP3578651B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34497398A JP3578651B2 (ja) 1998-12-04 1998-12-04 文書検索システム、文書検索方法およびその方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34497398A JP3578651B2 (ja) 1998-12-04 1998-12-04 文書検索システム、文書検索方法およびその方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2000172698A JP2000172698A (ja) 2000-06-23
JP3578651B2 true JP3578651B2 (ja) 2004-10-20

Family

ID=18373421

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34497398A Expired - Fee Related JP3578651B2 (ja) 1998-12-04 1998-12-04 文書検索システム、文書検索方法およびその方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP3578651B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006323811A (ja) * 2005-04-20 2006-11-30 Just Syst Corp 文書処理装置、文書処理方法、文書処理プログラムおよびコンピュータに読み取り可能な記録媒体
JP4746439B2 (ja) * 2006-02-15 2011-08-10 株式会社ジャストシステム 文書検索サーバおよび文書検索方法
JP4750628B2 (ja) * 2006-06-14 2011-08-17 日本電信電話株式会社 情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP5384884B2 (ja) * 2008-09-03 2014-01-08 日本電信電話株式会社 情報検索装置および情報検索プログラム
WO2013021696A1 (ja) 2011-08-05 2013-02-14 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報検索システム、方法、及びプログラム
JP6316642B2 (ja) * 2014-04-21 2018-04-25 アルパイン株式会社 コンテンツ検索装置、方法およびプログラム
JP6534454B2 (ja) * 2016-02-03 2019-06-26 株式会社日立製作所 情報検索方法及び情報検索装置並びに情報検索システム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0675265B2 (ja) * 1989-09-20 1994-09-21 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 情報検索方法及びシステム
JP3460728B2 (ja) * 1992-08-14 2003-10-27 株式会社リコー 文書検索方式
JPH1097545A (ja) * 1996-09-20 1998-04-14 Sharp Corp 情報処理装置
JP3195752B2 (ja) * 1997-02-28 2001-08-06 シャープ株式会社 検索装置

Also Published As

Publication number Publication date
JP2000172698A (ja) 2000-06-23

Similar Documents

Publication Publication Date Title
JP3132738B2 (ja) テキスト検索方法
EP2315135B1 (en) Document search system
US7401078B2 (en) Information processing apparatus, document search method, program, and storage medium
JP2002140361A (ja) 文書検索方法、文書検索装置及び文書検索プログラムの記憶媒体
JPH0424869A (ja) 文書処理システム
WO2011040025A1 (en) Method for setting metadata, system for setting metadata, and program
JP3820878B2 (ja) 情報検索装置,スコア決定装置,情報検索方法,スコア決定方法及びプログラム記録媒体
JP3578651B2 (ja) 文書検索システム、文書検索方法およびその方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP5455232B2 (ja) 画像選定装置、方法及びプログラム
JP4146361B2 (ja) ラベル表示型文書検索装置、ラベル表示型文書検索方法、ラベル表示型文書検索方法を実行させるコンピュータプログラム並びにこのコンピュータプログラムが格納されたコンピュータ読み取り可能な記録媒体
JP3612769B2 (ja) 情報検索装置および情報検索方法
JP2007164583A (ja) 判定装置,判定方法および判定プログラム
US6424963B1 (en) Document retrieval having retrieval conditions that shuffles documents in a sequence of occurrence
JPH08263514A (ja) 文書の自動分類方法、および情報空間の可視化方法、ならびに情報検索システム
JPH0773197A (ja) 異表記語辞書作成支援装置
JP2004310561A (ja) 情報検索方法、情報検索システム及び検索サーバ
JP2000137725A (ja) 情報検索システム、情報検索方法およびその方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000112959A (ja) 情報検索装置及び方法
JP2004362480A (ja) 品質機能展開支援方法とそのためのプログラム
JP5439028B2 (ja) 情報検索装置、情報検索方法、およびプログラム
JP7238411B2 (ja) 情報処理装置及びプログラム
JPH07121552A (ja) 文書群分析装置
JP3275813B2 (ja) 文書検索装置、方法及び記録媒体
JP3489326B2 (ja) テーブル生成方法
JP2005141476A (ja) 文書管理装置、プログラムおよび記録媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040427

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040602

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040713

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040713

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070723

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080723

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090723

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090723

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100723

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110723

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120723

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120723

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130723

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees