JPH06314296A - 情報検索システム - Google Patents

情報検索システム

Info

Publication number
JPH06314296A
JPH06314296A JP5130918A JP13091893A JPH06314296A JP H06314296 A JPH06314296 A JP H06314296A JP 5130918 A JP5130918 A JP 5130918A JP 13091893 A JP13091893 A JP 13091893A JP H06314296 A JPH06314296 A JP H06314296A
Authority
JP
Japan
Prior art keywords
keyword
dictionary
search
keywords
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5130918A
Other languages
English (en)
Inventor
道子 ▲鶴▼田
Michiko Tsuruta
Hide Fuji
秀 富士
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP5130918A priority Critical patent/JPH06314296A/ja
Publication of JPH06314296A publication Critical patent/JPH06314296A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】キーワードによる情報検索システムに関し、検
索式の内容を利用することにより、自動的にキーワード
辞書を生成することを目的とする。 【構成】検索式を入力する入力手段1と、複数の文書を
格納してある文書データべース2と、検索式の指定に基
づいて条件に合致する文書を文書データベース2から検
索する検索手段3とよりなり、キーワード辞書7と、入
力されたキーワードに関連する候補キーワード71をそれ
から得て、検索式として生成または表示する辞書参照手
段5とを備えた情報検索システムにおいて、辞書生成手
段6を設け、入力された検索式またはログデータを解析
して、その中のキーワードに対してORとなるキーワー
ドあるいはANDとなるキーワードを取り出し、キーワ
ード辞書7に更新・蓄積するように構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はキーワードによる情報検
索装置に関する。キーワード検索において、検索者は、
目的の文書・文献を漏らさないためのORキーワード
(同義語等)や、目的の文献を絞り込むためのANDキ
ーワードを的確に選択・指定しなければならない。これ
は、初心者には難しく、熟練者でも面倒であり、これを
支援する技術が要求されている。
【0002】
【従来の技術】図6は従来の情報検索装置の構成図であ
る。図において、1はキーワードまたは複数のキーワー
ドもしくは検索式番号同士の論理的結合を示す検索式
(以下検索式と記す)を入力する入力手段、2は検索の
対象である文書を保持した文書データベース、3は検索
手段、4は検索式のログデータ、5は辞書参照手段、7
は同義語辞書である。
【0003】検索手段3は入力された検索式により、文
書データベース2を検索し、指定の条件に適うものを取
り出す。また検索式は検索ログデータ4として保存す
る。なお、検索は直接に文書データベース2をキーワー
ドでサーチする方式とインバーテッドファイル2aによる
方式がある。インバーテッドファイル2aとは、文書デー
タベース2の中の文書のキーワードをあらかじめとりだ
し、キーワードとそのキーワードを含む文書番号のリス
トを対応させたものである。インバーテッドファイル方
式はあらかじめ設定されたキーワードでなければ検索で
きないが、検索を高速におこなうことができる。
【0004】検索式はキーワードや検索式番号をAND
およびOR論理演算子により結合したものである。な
お、一つの検索式(単一のキーワードでもよい)を入力
すると、それに対して番号(検索式番号)をつけ、これ
をANDおよびOR論理演算子の対象とする検索式を入
力することを許す。
【0005】検索支援のために同義語辞書7を用意して
おき、メニュー指定やファンクションキー等の指定によ
り、辞書参照手段5がこの辞書を索引して同義語を表示
したり、入力されたキーワードに対してORキーワード
として検索式を生成して組み込むようにすることが行な
われている。同義語辞書7はあらかじめ手作業によって
作成しておくのが一般的である。手作業による辞書作成
は大きな工数を要し、柔軟性に乏しい決まりきった辞書
になる。また、同義語辞書7を検索対象文書の構文解析
情報などから作成する方法が考えられるが、構文解析に
よる方法はある程度自動的に作成できるが、構文解析に
時間がかかる上に精度が低く、実用性の点で問題があっ
た。
【0006】また、ANDキーワードのための辞書は、
一般的な形で作成することは難しく、従来の情報検索シ
ステムに備えられることは全くといっていいほどなかっ
た。
【0007】
【発明が解決しようとする課題】従って、大規模で使い
やすい、実用的なキーワード辞書を備えることは困難で
あった。
【0008】ところで、検索時に実際に使った検索式
は、似たような検索をする場合、ORキーワードの候補
としてOR検索式の内容が、ANDキーワードの候補と
してAND検索式の内容が参考になる。特に検索の専門
家であるサーチャの使った検索式は有効である。
【0009】本発明は、検索途中の検索式の内容や、そ
のログデータを利用することにより、自動的にキーワー
ド辞書を生成・拡張することができる情報検索装置を実
現することを目的としている。
【0010】
【課題を解決するための手段】図1は本発明の原理ブロ
ック図である。検索式を入力する入力手段1と、複数の
文書を格納してある文書データべース2と、検索式の指
定に基づいて条件に合致する文書を文書データベース2
から検索する検索手段3とよりなる情報検索装置であっ
て、項目キーワード70と、それに関連する候補キーワー
ド71を対応させてリストしたキーワード辞書7と、入力
されたキーワードを項目キーワード70とする候補キーワ
ード71をキーワード辞書7から得て、検索式として生成
する、もしくは表示する辞書参照手段5とを備えた情報
検索装置において、辞書生成手段6を設ける。
【0011】辞書生成手段6は、検索式を解析して、そ
の中のキーワードに対してORとなるキーワードを取り
出し、項目キーワード70とそれに対する一つ以上の候補
キーワード71として対応させてキーワード辞書7に更新
・蓄積する。
【0012】また、ANDとなるキーワードについても
同様に構成する。キーワード辞書7は複数個設けてもよ
い。例えば共通の辞書一つと検索者毎に一つずつ個別の
辞書を設ける。これを個別に指定してもよいし、同時に
複数の辞書を指定して複数の辞書から読み出したキーワ
ードをマージしてもよい。
【0013】検索手段3は検索式をはじめとする指示入
力をログデータ4として保存しておき、辞書生成手段6
は、検索結果が使用された場合にログデータ内の検索式
を解析するようにしてもよい。また、検索式中のキーワ
ードが文書データベース2中に存在するとき、辞書生成
手段6はキーワード辞書7の更新・蓄積を行なうように
するとより効率がよくなる。
【0014】候補キーワード71のそれぞれに頻度表示72
をもたせて、キーワード辞書7の構成を、項目キーワー
ド70に対応する候補キーワード71とその頻度表示72との
対を一つ以上並べたものとしてもよい。辞書生成手段6
は検索式を解析する毎にキーワード辞書内の対応候補キ
ーワード71の頻度表示72にあらかじめ定めた増分値を加
えて更新する。元の辞書にない項目キーワードを加える
ときは頻度表示の元の値は0として扱う。辞書参照手段
5は、検索式を生成するとき、一定値以上の頻度表示値
をもつキーワードのみを使う。
【0015】辞書生成手段6は、候補キーワード71の頻
度表示72を更新するとき、検索を行なった検索者のレベ
ルに対応して異なる増分値を使用するようにしてもよ
い。辞書整理手段を設け、キーワード辞書7を定期的に
調べて頻度表示72の値が一定値より少ない候補キーワー
ドを除去するようにしてもよい。
【0016】以上の発明においてはインバーテッドファ
イル2aを使う方式であってもよいし、直接に文書データ
ベース2 をサーチする方式であってもよい。請求項10に
記載の発明は、検索式を入力する入力手段1と、複数の
文書を格納してある文書データべース2と、そのインバ
ーテッドファイル2aと、検索式の指定に基づいて条件に
合致する文書を、インバーテッドファイル2aを用いて文
書データベース2から検索する検索手段3とよりなる情
報検索システムにおいて、キーワード検査手段2bを設け
る。
【0017】キーワード検査手段2bは、検索式内のキー
ワードに含まれる任意文字列マークを検出すると、その
キーワードをインバーテッドファイル2aを用いて展開
し、展開後のキーワードの数を算定し、表示する。
【0018】請求項11に記載の発明は、請求項1ないし
請求項9に記載の情報検索システムにおいて、キーワー
ド検査手段2bを設ける。また、検索手段(3)は、検索
式の指定に基づいて条件に合致する文書を文書データべ
ース(2)のインバーテッドファイル2aを用いて検索す
る。
【0019】キーワード検査手段2bは、検索式内のキー
ワードに含まれる任意文字列マークを検出すると、その
キーワードをインバーテッドファイル2aを用いて展開
し、展開後のキーワードの数が1以下であることを検出
するとキーワードから任意文字列マークを除いて検索式
を辞書生成手段(5)に渡す。
【0020】
【作用】検索手段3は従来技術と同じく文書データベー
ス2内の文書を検索式に従って条件を満たすものを検索
する。その間に入力された検索式は検索ログデータ4に
保持する場合もある。また辞書参照手段5は、検索のた
めのキーワード(検索式内のキーワードも同じ)が入力
されると、キーワード辞書7を参照し、入力されたキー
ワードが項目キーワードとして存在すれば対応する候補
キーワードを取り出し画面に表示したり、ORまたはA
ND検索式を自動的に生成したり拡充したりする。ここ
までは、キーワード辞書7がORのための候補キーワー
ドを蓄積したもの、すなわちOR候補辞書であれば従来
の同義語辞書による検索者への支援と同等である。
【0021】辞書生成手段6は、入力された検索式また
は検索ログデータ4を解析して、あるキーワードに対し
てORとなるキーワードまたはANDとなるキーワード
を取り出しキーワード辞書に(OR候補辞書、AND候
補辞書として)蓄積する。
【0022】このように構成することにより、キーワー
ド辞書7は検索が行なわれる毎に拡充され、自動的に成
長することになる。キーワード辞書7を複数個設けるこ
とにより、検索者固有のキーワード辞書として使った
り、初心者が熟練者の辞書を利用して効率を上げること
ができる。
【0023】検索結果が使用されたとき(例えば検索の
結果得られた文書リストを印刷したり、そのなかの文書
を表示・印刷したりする指示がされていたとき)だけに
ログデータ4中の検索式を解析することにより、キーワ
ード辞書7を拡充するものが有効なキーワードである可
能性が高くなる。またキーワードが実際に文書データベ
ース2の中に存在するときのみキーワード辞書7にその
キーワードを蓄積することにより無駄なキーワードを入
れないようにすることができる。同様に、候補キーワー
ドの頻度表示72とその増分値の差別化により、よく使わ
れる候補キーワードやレベルの高い検索者が入力した検
索式による候補キーワードの頻度表示の値が高くなり、
頻度表示の値の低い候補キーワードを使用しないことに
より有効な候補キーワードが優先して使用できる。ま
た、適宜頻度表示の低い候補キーワードを削除すること
によってもより効果的な辞書とすることができる。
【0024】請求項10に記載の発明は、該当するキーワ
ードの数を表示することによって、任意文字列マークを
付けることの有効性を操作者に示す。請求項11に記載の
発明においては、キーワード検査手段2bが任意文字列マ
ークの有効性を判断して無意味な任意文字列マークを削
除し、キーワード辞書7には入れないようにする。
【0025】
【実施例】以下、図面を参照して本発明の実施例を説明
する。図2は本発明の実施例の辞書生成の説明図であ
る。以下にキーワード辞書の生成の基本例を説明する。
【0026】図2(A)は検索者が情報検索を行なう際
に用いた検索式のログデータ(検索履歴)の例を示す。
なお検索中のディスプレイ装置の画面にも同等の表示が
行なわれる(図4参照。ただし、図4は辞書参照を行な
った場合を示す点で異なる。)。この場合、検索者は一
回目の検索で、キーワード「文献」と、「文書」と「テ
キスト」のORをとり(検索式番号1)、2回目の検索
で、「検索」と、「情報検索」と「サーチ」のORをと
り(検索式番号2)、3回目の検索で検索式1と検索式
2のANDをとり(検索式番号3)、文献検索に関する
情報検索を行なっている。図4(A)の検索式入力画面
で、検索式番号の右の数字は検索の結果得られた文書の
件数である。検索者はこの数が適当な値になったとき、
文書リストの表示・印刷、あるいは文書を指定して表示
・印刷の指示を行なう。これはログデータ中では★表示
で示す。
【0027】辞書生成手段6は、文書リストの表示・印
刷等の指示があると(ログデータの★表示に相当する処
理の指示があると)辞書生成処理に入る。辞書生成手段
6は、まず各検索式を見て、必要があれば検索式展開等
の処理を行なう。または、検索手段3が展開した結果を
もらうようにしてもよい。図2(B)は検索式の展開を
示す。ここでは、検索式番号3の「1 AND 2」を
展開して「(文献OR文書ORテキスト)AND(検索
OR情報検索ORサーチ)」としている。次に、辞書生
成手段6は、検索式のORの部分から、OR候補辞書を
作る。ここでは、検索式番号1より、キーワード「文
献」に対して「文書」「テキスト」がORになっている
ので、「文献」のORのための候補キーワードは「文
書」「テキスト」となる。「文書」のORのための候補
キーワードは「文献」「テキスト」となり、「テキス
ト」のORのための候補キーワードは「文献」「文書」
となる。以下同様にして、「検索」「情報検索」「サー
チ」のOR候補キーワードが作られる。
【0028】また辞書生成手段6は、展開結果の検索式
のANDの部分からAND候補キーワードを作る。ここ
では検索式番号3より、キーワード「文献」に対して、
「検索」「情報検索」「サーチ」がANDになっている
ので、「文献」に対するAND候補キーワードは「検
索」「情報検索」「サーチ」となる。以下同様にして、
「文書」「テキスト」「検索」「情報検索」「サーチ」
のAND候補キーワードが作られる。
【0029】できあがったOR候補辞書とAND候補辞
書は、図2(C)のようになる。頻度表示の増分値を1
とすれば各候補キーワードの頻度表示は「1」である。
頻度表示の増分値を検索者のレベルによって変えること
もできる。以上は初めて出てきた項目キーワードの例を
示したが、例えば、頻度表示の増分値を検索者がサーチ
ャのとき「10」、一般のとき「1」とし、「文献」と
「文書」がORでつながれてサーチャによって一度検索
されたため項目キーワードとして既に辞書に存在してい
る(頻度表示「10」)場合には図2(D)のようにな
る。
【0030】なお、キーワード辞書として、OR候補辞
書だけ、またはAND候補辞書だけを備えることにして
もよいことはいうまでもない。図3に実施例のシステム
構成を示す。この例は文書データベース2をもつセンタ
装置10とパソコンによる複数の端末装置20とをLAN
(または通信回線)によって結合したシステムである。
センタ装置10には文書データベース2を検索する検索手
段3c、辞書参照手段5c、辞書生成手段6c、共通のキーワ
ード辞書7cを備える。検索式の入力手段は備えても備え
なくてもよい。端末パソコンには個別のキーワード辞書
7tと辞書参照手段5t、辞書生成手段6tおよび検索式の入
力手段1tをそれぞれ個別にもつ。入力手段1tはパソコン
のキーボードディスプレイ装置を使用する。ただし検索
手段3tは検索ログデータ4tを残すことと辞書参照手段5t
と辞書生成手段6tとの連携機能とをもつのみで、本当の
検索処理は、通信手段8t、LAN、通信手段8cを介して
センタ装置10の検索手段3cに依頼する。すなわち、検索
手段3c、検索手段3t、通信手段8t、LAN、通信手段8c
の全体で検索手段3をなす。その他の手段についても同
様である。
【0031】図4に実施例の入力手段であるパソコンの
ディスプレイ装置1tの表示画面の例を示す。図4(A)
は検索式入力画面の例であり、(B)は検索に先立って
指定する初期画面(辞書選択画面)の例である。
【0032】本実施例では、指定された辞書のOR候補
辞書は常に参照され、キーワードを入力するとOR候補
キーワードが取り出され、検索式に自動的に書き加えら
れるようになっており、検索者は画面上でそれを確認
し、必要なら削除・修正するものとする。また、AND
候補辞書は、検索画面にAND候補辞書参照指示のメニ
ューがあり、それを指定するとAND候補を参照するよ
うになっている。もちろん、初期画面においてOR候補
辞書、AND候補辞書を個別に指定するように構成して
もよいし、各選択肢のデフォルト値をあらかじめ設定し
ておいて指定が無いときはデフォルト値に従うようにし
てもよい。
【0033】ここで、初心者がセンタの共通辞書7cを参
照しながら文献検索を行い、ついでに自分の個別辞書7t
を生成する場合を説明する。なお、先に説明したような
キーワード辞書が、共通キーワード辞書7cとしてできて
いるとする。
【0034】図4(B)の辞書選択画面で、検索者は共
通辞書の参照,個別辞書の作成,確認表示にY(yes) を
指定し、その他の項目にN(no)を指定した。図4(A)
において、検索式番号1で「文献」と入力すると共通辞
書7cからOR候補として「文書」と「テキスト」が自動
的に付加される。同様に検索式番号2で「検索」と入力
すると共通辞書7cからOR候補が自動的に付加される。
なお、図の例はOR候補として「探索」というキーワー
ドも共通辞書7cに存在した場合である。このキーワード
が不要であるならば、検索者は画面上で消去すればよ
い。例えば検索式番号1で「文献」と入力したとき、検
索式番号11に示すように共通辞書7cからOR候補として
「文書」と「テキスト」が自動的に付加された後、AN
D候補キーワードを参照したければ、検索画面の最下行
のメニューのANDキーワード参照を指定する。その結
果、図5に示すように画面上に別ウインドウが現れAN
D候補キーワードとして「検索」その他のキーワードが
表示される。これを参照して検索者は画面上でAND検
索式を作ればよい。
【0035】検索式の左に表示してある数字は、指定さ
れた検索式に基づいて検索した結果該当する文献の数で
ある。この数が適当な値になったところで、順に文献の
内容を画面に表示し、必要なものがあれば検索者は印刷
指定をする等の処理を指定すればよい。これらの指示も
画面のメニュー等によって行なう。
【0036】目的の文書が見つかった場合には、検索者
は内容の表示、印刷等の指示を行なうので、先に説明し
たようにキーワード辞書の更新が行なわれる。内容の表
示、印刷等の指示があったことは、通信手段を通して端
末装置20に伝えられ、個別辞書7tの更新は端末パソコン
において行なわれる。従って、この検索が終了したとき
にはこの検索者の個別辞書7tは検索前より拡充されてい
る。
【0037】もし共通辞書7cの作成・更新が指定されて
いればセンタ装置10で共通辞書7cの更新が行なわれる。
上記の実施例では検索時にリアルタイムにキーワード辞
書の更新を行なうこととしたが、端末装置20の能力が低
いため検索時に個別のキーワード辞書の更新を行なうこ
とができない場合や、端末装置20の数が多くてセンタ装
置10の負荷が重いため共通キーワード辞書の更新を検索
時に行なうと応答が遅れる場合等は、それぞれ検索ログ
データを溜め込んでおいて、別途随時に検索ログデータ
を解析してキーワード辞書の更新を行なうようにしても
よい。
【0038】また、キーワード辞書を定期的に調べて、
頻度表示の値が一定値より少ない候補キーワード71を、
辞書整理手段によって除去するようにしてもよい。な
お、センタ装置10と端末装置20とのLANを介した連携
処理は公知の技術によればよい。
【0039】以上はインバーテッドファイル2aを使用し
てもしなくてもよいが、以下に、インバーテッドファイ
ル2aを使用した情報検索システムに特有の部分一致検索
の場合における発明(請求項10,11)の実施例を説明す
る。
【0040】インバーテッドファイル2aを使用する検索
システムでは、キーワードの一部だけを指定して検索を
行なう部分一致検索を使うことがある。部分一致検索で
あることを示すためにあらかじめ定めた任意文字列マー
クを使用し、このマークの部分は任意の文字列が対応す
るキーワードでもよいことを示す。
【0041】ここで、任意文字列マークを「#」とす
る。例えば、「コンピュータ#」としてキーワードを入
力すると、これは#の位置に任意の文字列があってもよ
いことを意味し、検索手段3はインバーテッドファイル
2aをみて「コンピュータ#」を展開する。すなわち、
「コンピュータ」、「コンピューター」の二つが存在す
れば、その両方を検索対象とする。このように部分一致
検索は便利ではあるが、一面、慣れないと使いにくいこ
ともある。例えば、キーワードを「検索#」としたと
き、検索手段、検索方法、検索システム、検索・・とい
うように、多くのキーワードが含まれることになり、意
図しない余計なものまで範囲が広がることがある。ま
た、インバーテッドファイル2aに「コンピュータ」しか
ないのであれば任意文字列マーク「#」をつける意味が
ない。
【0042】これらの難点を解消するためには、一致結
果を操作者に知らせればよいが、前述のように多くのキ
ーワードが含まれる場合には画面の制約により難しい。
請求項10の発明はこれを一致したキーワードの数を表示
することで簡単に解決した。この数が1であれば、任意
文字列マーク「#」をつける意味がないのであるし、こ
の数が非常に多ければ、やはり適当な使いかたでないこ
とがわかる。
【0043】部分一致検索の結果をキーワード辞書に反
映させる例を以下に示す。 コンピュータ# OR 計算機 という検索式が入力されたとする。キーワード検査手段
2bはインバーテッドファイル2aをみて、または前述した
検索手段3の展開結果を利用して「コンピュータ#」を
展開する。インバーテッドファイル2aに「コンピュー
タ」、「コンピューター」の二つが存在すれば、「#」
が有効であるので検索式をそのまま辞書生成手段6へ送
る。その結果、OR候補辞書は、 コンピュータ#:計算機,1 計算機:コンピュータ#,1 となる。しかし、インバーテッドファイル2aに「コンピ
ュータ」しか入っていないのであれば「#」の意味がな
いので、検索式から「#」を削除して辞書生成手段6へ
送る。その結果、OR候補辞書は、 コンピュータ:計算機,1 計算機:コンピュータ,1 となる。
【0044】
【発明の効果】以上説明したように、本発明によればキ
ーワード辞書は検索が行なわれる毎に拡充され、自動的
に成長することになり、使い易く柔軟で適切なキーワー
ド辞書付情報検索システムを実現することができる。な
お、キーワード辞書にはOR候補辞書とAND候補辞書
とがあり、従来はほとんど無かったANDキーワードに
ついても、支援することができる。また、OR候補辞書
は従来の同義語辞書と類似するが、必ずしも同義でない
用語(例えばLANと通信回線)も入れておくことがで
き、検索の範囲を広くしたい場合に効果がある。
【図面の簡単な説明】
【図1】本発明の原理構成図である。
【図2】本発明の辞書生成の説明図である。
【図3】実施例のシステム構成図である。
【図4】実施例の表示画面の例である。
【図5】実施例のANDキーワード表示を指定したとき
の表示画面の例である。
【図6】従来の情報検索システムの構成図である。
【符号の説明】
1 入力手段 2 文書データベース 2a インバーテッドファイル 2b キーワード検査手段 3,3c,3t 検索手段 4, 4c,4t 検索ログデータ 5, 5c,5t 辞書参照手段 6, 6c,6t 辞書生成手段 7, 7c,7t キーワード辞書(同義語辞書) 8c,8t 通信手段 10 センタ装置 20 端末装置 (パソコン) 70 項目キーワード 71 候補キーワード 72 頻度表示

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 検索式を入力する入力手段(1)と、 複数の文書を格納してある文書データべース(2)と、 検索式の指定に基づいて条件に合致する文書を文書デー
    タベース(2)から検索する検索手段(3)とよりなる
    情報検索システムであって、 項目キーワード(70)と、それに関連する候補キーワー
    ド(71)とを対応させてリストしたキーワード辞書
    (7)と、入力されたキーワードを項目キーワード(7
    0)とする候補キーワード(71)をキーワード辞書
    (7)から得て、検索式として生成する、もしくは表示
    する辞書参照手段(5)とを備えた情報検索システムに
    おいて、 辞書生成手段(6)を設け、 辞書生成手段(6)は、検索式を解析して、その中のキ
    ーワードに対してORとなるキーワードを取り出し、項
    目キーワード(70)と一つ以上の候補キーワード(71)
    として対応させてキーワード辞書(7)に更新・蓄積す
    るように構成したことを特徴とするキーワード辞書付情
    報検索システム。
  2. 【請求項2】 辞書生成手段(6)は、検索式を解析し
    て、その中のキーワードに対してANDとなるキーワー
    ドを取り出し、項目キーワード(70)と一つ以上の候補
    キーワード(71)として対応させてキーワード辞書
    (7)に更新・蓄積することを特徴とする請求項1に記
    載の情報検索システム。
  3. 【請求項3】 キーワード辞書(7)を複数設けること
    を特徴とする請求項1または請求項2に記載の情報検索
    システム。
  4. 【請求項4】 複数のキーワード辞書(7)の索引結果
    をマージすることを特徴とする請求項3に記載の情報検
    索システム。
  5. 【請求項5】 辞書生成手段(6)は、検索式中のキー
    ワードが文書データベース(2)中に存在するとき、キ
    ーワード辞書(7)の更新・蓄積を行なうことを特徴と
    する請求項1ないし請求項4に記載の情報検索システ
    ム。
  6. 【請求項6】 検索手段(3)は検索式をはじめとする
    指示入力をログデータ(4)として保存し、 辞書生成手段(6)は、検索結果が使用された場合に、
    ログデータ(4)内の検索式を解析することを特徴とす
    る請求項1ないし請求項5に記載の情報検索システム。
  7. 【請求項7】 キーワード辞書(7)は、項目キーワー
    ド(70)に対する一つ以上の候補キーワード(71)のそ
    れぞれに頻度表示(72)をもち、 辞書生成手段(6)は検索式を解析する毎にキーワード
    辞書内の対応候補キーワード(71)の頻度表示(72)に
    あらかじめ定めた増分値を加えて更新し、 辞書参照手段(5)は、一定値以上の頻度表示値をもつ
    キーワードのみを使うことを特徴とする請求項1ないし
    請求項6に記載のキーワード辞書付情報検索システム。
  8. 【請求項8】 辞書生成手段(6)は、候補キーワード
    (71)の頻度表示(72)を更新するとき、検索を行なっ
    た検索者のレベルに対応して用意された異なる増分値を
    使用することを特徴とする請求項7に記載の情報検索シ
    ステム。
  9. 【請求項9】 辞書整理手段を設け、キーワード辞書
    (7)を定期的に調べて頻度表示(72)の値が一定値よ
    り少ない候補キーワード(71)を除去することを特徴と
    する請求項7または請求項8に記載の情報検索システ
    ム。
  10. 【請求項10】 検索式を入力する入力手段(1)と、複
    数の文書を格納してある文書データべース(2)と、そ
    のインバーテッドファイル(2a)と、検索式の指定に基づ
    いて条件に合致する文書をインバーテッドファイル(2a)
    を用いて検索する検索手段(3)とよりなる情報検索シ
    ステムにおいて、 キーワード検査手段(2b)を設け、 キーワード検査手段(2b)は、検索式内のキーワードに含
    まれる任意文字列マークを検出すると、そのキーワード
    をインバーテッドファイル(2a)を用いて展開し、展開後
    のキーワードの数を算定し、表示することを特徴とする
    情報検索システム。
  11. 【請求項11】 キーワード検査手段(2b)を設け、 検索手段(3)は、検索式の指定に基づいて条件に合致
    する文書を文書データべース(2)のインバーテッドフ
    ァイル(2a)を用いて検索し、 キーワード検査手段(2b)は、検索式内のキーワードに含
    まれる任意文字列マークを検出すると、そのキーワード
    をインバーテッドファイル(2a)を用いて展開し、展開後
    のキーワードの数が1以下であることを検出するとキー
    ワードから任意文字列マークを除いて検索式を辞書生成
    手段(6)に渡すことを特徴とする請求項1ないし請求
    項9に記載の情報検索システム。
JP5130918A 1993-03-02 1993-06-02 情報検索システム Pending JPH06314296A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5130918A JPH06314296A (ja) 1993-03-02 1993-06-02 情報検索システム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP5-40340 1993-03-02
JP4034093 1993-03-02
JP5130918A JPH06314296A (ja) 1993-03-02 1993-06-02 情報検索システム

Publications (1)

Publication Number Publication Date
JPH06314296A true JPH06314296A (ja) 1994-11-08

Family

ID=26379793

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5130918A Pending JPH06314296A (ja) 1993-03-02 1993-06-02 情報検索システム

Country Status (1)

Country Link
JP (1) JPH06314296A (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09237281A (ja) * 1996-03-01 1997-09-09 Omron Corp テキストデータ検索装置およびテキストデータ検索方法
JPH09319767A (ja) * 1996-05-29 1997-12-12 Oki Electric Ind Co Ltd 類義語辞書登録方法
JP2002518748A (ja) * 1998-06-15 2002-06-25 アマゾン ドット コム インコーポレイテッド 検索照会改善システムおよび方法
JP2003216634A (ja) * 2002-01-28 2003-07-31 Ricoh Techno Systems Co Ltd 情報検索システム
US7171431B2 (en) 2004-04-21 2007-01-30 Hitachi, Ltd. File system updating metadata of files according to results of keyword search
JP2007200019A (ja) * 2006-01-26 2007-08-09 Ricoh Co Ltd 検索クライアント
JP2008152454A (ja) * 2006-12-15 2008-07-03 Industrial Property Cooperation Center 類義語統合システム
JP2008158998A (ja) * 2006-12-26 2008-07-10 Yafoo Japan Corp 語句又は文章分析方法、サーバ
JP2008234047A (ja) * 2007-03-16 2008-10-02 Industrial Property Cooperation Center 関連語統合システム
US7444324B2 (en) 1998-07-15 2008-10-28 A9.Com, Inc. Search query processing to identify search string corrections that reflect past search query submissions of users
US7630979B2 (en) 2004-06-30 2009-12-08 Fujitsu Limited Information retrieval terminal
JP2010524099A (ja) * 2007-04-10 2010-07-15 アリババ グループ ホールディング リミテッド 更新パラメータを生成および相関するキーワードを表示するための方法および装置
JP2019139413A (ja) * 2018-02-08 2019-08-22 富士通株式会社 検索処理プログラム、検索処理方法及び検索処理装置

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09237281A (ja) * 1996-03-01 1997-09-09 Omron Corp テキストデータ検索装置およびテキストデータ検索方法
JPH09319767A (ja) * 1996-05-29 1997-12-12 Oki Electric Ind Co Ltd 類義語辞書登録方法
JP2002518748A (ja) * 1998-06-15 2002-06-25 アマゾン ドット コム インコーポレイテッド 検索照会改善システムおよび方法
US7444324B2 (en) 1998-07-15 2008-10-28 A9.Com, Inc. Search query processing to identify search string corrections that reflect past search query submissions of users
US7996398B2 (en) * 1998-07-15 2011-08-09 A9.Com, Inc. Identifying related search terms based on search behaviors of users
US7840577B2 (en) 1998-07-15 2010-11-23 A9.Com, Inc. Search query processing to identify related search terms and to correct misspellings of search terms
JP2003216634A (ja) * 2002-01-28 2003-07-31 Ricoh Techno Systems Co Ltd 情報検索システム
US7171431B2 (en) 2004-04-21 2007-01-30 Hitachi, Ltd. File system updating metadata of files according to results of keyword search
US7734638B2 (en) 2004-04-21 2010-06-08 Hitachi, Ltd. File system updating metadata of files according to results of keyword search
US7630979B2 (en) 2004-06-30 2009-12-08 Fujitsu Limited Information retrieval terminal
JP2007200019A (ja) * 2006-01-26 2007-08-09 Ricoh Co Ltd 検索クライアント
JP2008152454A (ja) * 2006-12-15 2008-07-03 Industrial Property Cooperation Center 類義語統合システム
JP4656330B2 (ja) * 2006-12-15 2011-03-23 一般財団法人工業所有権協力センター 類義語統合システム
JP2008158998A (ja) * 2006-12-26 2008-07-10 Yafoo Japan Corp 語句又は文章分析方法、サーバ
JP2008234047A (ja) * 2007-03-16 2008-10-02 Industrial Property Cooperation Center 関連語統合システム
JP2010524099A (ja) * 2007-04-10 2010-07-15 アリババ グループ ホールディング リミテッド 更新パラメータを生成および相関するキーワードを表示するための方法および装置
JP2013152744A (ja) * 2007-04-10 2013-08-08 Alibaba Group Holding Ltd 更新パラメータを生成および相関するキーワードを表示するための方法および装置
US8676811B2 (en) 2007-04-10 2014-03-18 Alibaba Group Holding Limited Method and apparatus of generating update parameters and displaying correlated keywords
US8874588B2 (en) 2007-04-10 2014-10-28 Alibaba Group Holding Limited Method and apparatus of generating update parameters and displaying correlated keywords
US9135370B2 (en) 2007-04-10 2015-09-15 Alibaba Group Holding Limited Method and apparatus of generating update parameters and displaying correlated keywords
JP2019139413A (ja) * 2018-02-08 2019-08-22 富士通株式会社 検索処理プログラム、検索処理方法及び検索処理装置

Similar Documents

Publication Publication Date Title
JP3691844B2 (ja) 文書処理方法
JPH08190564A (ja) 情報検索方法及びシステム
JPH09114860A (ja) データ検索方法及び装置
JPH06314296A (ja) 情報検索システム
JP4160548B2 (ja) 文書要約作成システム、方法、及びプログラム
KR20100071829A (ko) 인덱스 분석장치와 인덱스 검색장치 및 그 방법
JP2000200281A (ja) 情報検索装置および情報検索方法ならびに情報検索プログラムを記録した記録媒体
JP2006285656A (ja) 文書検索システム、記録媒体、プログラム、および文書検索方法
JPH0773197A (ja) 異表記語辞書作成支援装置
JP2003323457A (ja) 文書検索装置、文書検索方法、プログラム及び記録媒体
JPH05151253A (ja) 文書検索装置
JP2002351896A (ja) 特許検索装置および特許検索方法
JP3558267B2 (ja) 文書検索装置
JPH08272818A (ja) 情報検索システム
JPS6378228A (ja) 情報検索装置
JP2012118750A (ja) 情報検索装置、検索入力方法、及び検索入力プログラム
JPH0773187A (ja) 検索システム
JPH08235204A (ja) 文書検索方法及び装置
JPH07210565A (ja) 情報検索方法及び装置
JPH02158870A (ja) データベース検索方式
JPH1145238A (ja) 文書管理システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
CN110609859A (zh) 一种基于词组库的智能精准检索方法
JPH10334114A (ja) 文書検索装置及び文書検索プログラムを記録した記憶媒体
KR20090073809A (ko) 파일검색 방법 및 그 시스템
JPH04151761A (ja) 文字入力装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030107