JPH03294965A - 文書検索方法 - Google Patents

文書検索方法

Info

Publication number
JPH03294965A
JPH03294965A JP2097397A JP9739790A JPH03294965A JP H03294965 A JPH03294965 A JP H03294965A JP 2097397 A JP2097397 A JP 2097397A JP 9739790 A JP9739790 A JP 9739790A JP H03294965 A JPH03294965 A JP H03294965A
Authority
JP
Japan
Prior art keywords
keyword
search
document
ambiguity
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2097397A
Other languages
English (en)
Inventor
Mitsuhisa Kaneya
光久 金矢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2097397A priority Critical patent/JPH03294965A/ja
Publication of JPH03294965A publication Critical patent/JPH03294965A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、利用者が指定した検索条件によって文書デー
タベースより文書を検索する際、検索結果の適切さに基
づいて出力することにより適量・適量検索の可能な文書
検索方法に関する。
従来の技術 従来、文書検索装置においては種々の検索方式があるが
、その一つとして各キーワード間の関連情報を記述した
キーワードコネクション表(キーワード関連度表)を用
いて文書確度(利用者の検索要求に近いものほど大きな
値を持つ評価値)を計算し、この結果に基づいて文書を
検索するようにしたものが、本出願人により例えば特願
昭638291号「文書検索装置」等により提案されて
いる。このような文書検索装置にあっては、使用者が正
確なキーワードを覚えていなくてもキーワードコネクシ
ョン表を使ったあいまい検索を行なうことにより、適量
・適量な検索結果を得ることができる。
発明が解決しようとする課題 ところが、このようなキーワードコネクション表を利用
したあいまい検索法にあっても、次のような問題がある
。例えば、利用者がキーワードAは確実に自分の探した
い文書に付与されていることが判っているが、キーワー
ドB、Cはともに目的とする文書に付与されているか否
かあいまいである場合を考える。この場合、単純なAN
D検索ではキーワードB又はキーワードCが付与されて
いない文書は検索できないので、キーワードコネクショ
ン表を用いたあいまい検索を行なわなければならない。
しかし、検索装置側では、キーワードAもあいまいなキ
ーワードとして処理してしまうため、キーワードAと関
係のあるキーワードを含んだ余計な文書まで検索結果と
して出力してしまう。
課題を解決するための手段 キーワード等の検索条件を入力とし、キーワード間の関
係の強さを示すキーワード関連度等の情報を用いた所定
の計算式から、入力された前記検索条件に対する各文書
の評価値を文書確度として求め、その文書と求められた
文書確度とを検索結果とする検索を行なうようにした文
書検索方法において、前記検索条件の入力時に利用者に
検索条件中の各キーワードの属性としてあいまい度を選
択指定させ、このあいまい度を前記キーワード関連度に
換算して文書確度を求めるようにした。
作用 検索条件中の各キーワードに対してあいまい度という概
念を導入して利用者に指定付与させるようにしたので、
利用者の感覚に、より近づいたあいまい検索を行なわせ
ることができるとともに、あいまいでないキーワードに
ついてはあいまい検索を行なわせない指定により余計な
文書検索を減らすこともでき、検索結果の絞り込みに役
立ち、検索時間の短縮化を図れる適量・適量な文書検索
が可能となる。
実施例 本発明の一実施例を図面に基づいて説明する。
まず、本発明が適用される既提案の文書検索装置の概要
を第2図のブロック図を参照して説明する。キーワード
抽出部lは登録文書2を入力するとそのキーワードを抽
出し、キーワード及び登録文書2の情報を文書情報管理
部3、キーワードコネクション表処理部4及びインバー
テツドファイル作成部5へ出力する。文書情報管理部3
は抽出されたキーワードと書誌的情報6とをファイル7
に格納し、検索時に利用可能な形にデータベース化する
。キーワードコネクション表処理部4は必要なキーワー
ドとともに関連性のあるキーワード同士のつながり及び
その関連度を記述したキーワードコネクション(キーワ
ード関連度)表を作成しファイル9に格納するものであ
る。ここに、キーワードコネクション表は例えばリスト
構造とされ、関連度の大きい順にソートされる。インバ
ーテツドファイル作成部5は各キーワードと登録文書2
とを対応付けるインバーテツドファイル10を作成し、
ファイル11に格納するものである。
即ち、インバーテツドファイル10はキーワードからそ
のキーワードを含む文書を指すポインタを集合させたも
のである。
ついで、文書選出部12が設けられている。この文書選
出部12は検索利用者の要求主題・要求概念により近い
文書ファイルをキーワード群によって抽出することを目
的としたもので、キーボード13からアクセスする利用
者に対してキーワード−賢夫をデイスプレィ14に出力
する。その中から利用者は要求主題に必要なキーワード
を選択するか、自由キーワードを選択して、再びキーボ
ード13から表示検索要求を入力するものである。
このような文書選出部12は、要求処理部15とソート
部16と表示管理部17とキーワード間関連度計算部1
8とファイル確度計算部19とよりなる。要求処理部1
5はキーボード13から受理したキーワードをキーワー
ド間開速度計算部18に転送する。キーワード間開速度
計算部18では転送されたキーワードに関する関連キー
ワードとその関連情報をキーワードコネクション表8か
ら抽出する。抽出されたキーワード群は関連の強い順に
ソート部16でソートされて表示管理部17へ出力され
る。表示管理部17はこの関連キーワード群をデイスプ
レィ14に出力し、利用者に対して表示する。この表示
に従い、利用者がさらに必要なキーワードを選択入力す
ることにより、最終的なキーワード群が文書選択要求と
ともに要求処理部15へ送られる。
要求処理@15では文書選択要求を受けると、ファイル
確度計算部19にキーワード群を転送させる。同時に、
最終的なキーワード群に関する関連情報の重み変更を行
うようにキーワードコネクション表処理部4に指示する
。ファイル確度計算部19では受理したキーワード群と
キーワードコネクション表8及びインバーテツドファイ
ル10を用いて、登録文書2のファイル7についてファ
イル確度(文書確度)を計算し、結果をソート部16に
転送する。必要なファイル確度の計算が終了すると、ソ
ート部16によるソートを経てデイスプレィ14に表示
され、検索結果とされる。
しかして、本実施例では、第1図に示すように、ファイ
ル確度計算部19と要求処理部15との間にキーワード
関連度変換部20を設け、前記キーボード13からはあ
いまい度付き要求を入力させるようにしたものである。
即ち、キーボード13から要求としてキーワード番号、
その他による検索条件を入力する際に、各キーワードに
2値以上の値を持つ「あいまい度」という概念の属性を
指定付与させるものである。あいまい度付き要求データ
の内、キーワード番号とあいまい度データは、キーワー
ドコネクション表処理部4からのキーワード関連度情報
とともにキーワード関連度変換部20に入力され、キー
ワードコネクション表における各キーワード関連度をあ
いまい度によって変換した値に変え、変換後のキーワー
ド関連度をファイル確度計算部19に出力する。その他
の入ツノデータは要求処理部15からファイル確度計算
部19に直接出力される。
ここに、説明を簡単にするため、あいまい度は0から1
の間の値をとる実数とし、1か最もあいまいで、Oか最
もあいまいではない、ことを表すものとする。また、キ
ーワードコネクションの変換方法は乗算による変換とす
る。例えば、キーワードコネクション表のキーワードA
に対する他のキーワードの関連度が第3図に示すような
値の場合において、キーワードAのあいまい度が0.5
だったときには、ファイル確度の計算は、第4図に示す
ように各キーワード関連度にあいまい度O5を乗じた値
を使用する。キーワードへのあいまい度がOlOであれ
ば、キーワードAを中心としたキーワード関連度は第5
図に示すように全てOとなり、従来のキーワード関連度
を使わない検索(単純なA N Dlo R検索)と等
価となる。
方、キーワードAのあいまい度として1.0を付与した
場合には、ファイル確度計算に用いるキーワード関連度
は第6図に示すようにキーワードコネクション表中の値
に等しいものとなり(第3図と同じ)、既提案のあいま
い検索と等価となる。
即ち、あいまい度が1.0の場合は既提案のあいまい検
索に等価で、あいまい度が0.0の場合はあいまい性を
持たない従来の単純なA N D10R検索に等価であ
り、中間に位置する本実施例はこれらの2方式の検索の
使用割合を連続的に切換える、つまり、あいまい検索を
どの程度の中間的なあいまい度1.0−0.0で行なう
がを、利用者が指定できるものである。
二二に、各キーワードに付与するあいまい度は2値以上
の多値をとる。あいまい度のとり得る値の数が多いほど
、よりきめ細かな検索条件の指定ができるが、利用者の
検索条件入力の手間を考慮すると、とり得る値の数は少
ないほうがよい。実際、あいまい度の値が2値、即ち、
あるキーワードについて、あいまい検索を行なうか、行
なわないかを指定するだけでも、かなりの効果が期待で
きる。
あいまい度指定を伴う本実施例によれば、次のような効
果が得られる。まず、利用者の感覚に、より近づいたあ
いまい検索が可能となる。即ち、検索条件中の各キーワ
ードに対してあいまい度という概念を導入することによ
り、利用者は[このキーワードは間違いなく付与されて
いた(又は、いない)」[このキーワードは付与されて
いたがいないか判らないJ又は「このキーワードが必ず
付与されている(又は、いない)文書を探したい」「で
きればこのキーワードが付与されている(又は、いない
)文書が欲しい」といった指定を、キーワード毎に行な
うことができるため、利用者のきめ細かな要求に応える
ことができる。また、余計な文書検索を減らすこともで
きる。即ち、利用者は検索条件中の各キーワードについ
てあいまい検索を行なうかどうかをあいまい度にて指定
できるので、あいまいでないキーワードに関してはあい
まい検索を行なわないことにより、あいまいでないキー
ワードと関係のあるキーワードが付与されている文書ま
で検索してしまうことがない。これは、検索結果の絞り
込みに役立つたけでなく、検索時間の短縮化も図れるも
のとなる。
発明の効果 本発明は、上述したように検索条件中の各キーワードに
対してあいまい度という概念を導入して利用者に指定付
与させるようにしたので、利用者の感覚に、より近づい
たあいまい検索を行なわせることができるとともに、あ
いまいでないキーワードについてはあいまい検索を行な
わせない指定により余計な文書検索を減らすこともでき
、検索結果の絞り込みに役立ち、検索時間の短縮化を図
れる適量・適量な文書検索を可能とすることができる。
【図面の簡単な説明】
図面は本発明の一実施例を示すもので、第1図は要部の
ブロック図、第2図は検索装置全体の構成を示すブロッ
ク図、第3図はキーワードコネクション表の内容例を示
す説明図、第4図ないし第6図はあいまい度指定に伴う
キーワード関連度の変化した様子を示す説明図である。

Claims (1)

    【特許請求の範囲】
  1. キーワード等の検索条件を入力とし、キーワード間の関
    係の強さを示すキーワード関連度等の情報を用いた所定
    の計算式から、入力された前記検索条件に対する各文書
    の評価値を文書確度として求め、その文書と求められた
    文書確度とを検索結果とする検索を行なうようにした文
    書検索方法において、前記検索条件の入力時に利用者に
    検索条件中の各キーワードの属性としてあいまい度を選
    択指定させ、このあいまい度を前記キーワード関連度に
    換算して文書確度を求めるようにしたことを特徴とする
    文書検索方法。
JP2097397A 1990-04-12 1990-04-12 文書検索方法 Pending JPH03294965A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2097397A JPH03294965A (ja) 1990-04-12 1990-04-12 文書検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2097397A JPH03294965A (ja) 1990-04-12 1990-04-12 文書検索方法

Publications (1)

Publication Number Publication Date
JPH03294965A true JPH03294965A (ja) 1991-12-26

Family

ID=14191387

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2097397A Pending JPH03294965A (ja) 1990-04-12 1990-04-12 文書検索方法

Country Status (1)

Country Link
JP (1) JPH03294965A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06309377A (ja) * 1993-04-23 1994-11-04 Nec Corp 画像検索方法とその装置
JPH07239856A (ja) * 1994-02-25 1995-09-12 Canon Inc 画像検索方法および装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06309377A (ja) * 1993-04-23 1994-11-04 Nec Corp 画像検索方法とその装置
JPH07239856A (ja) * 1994-02-25 1995-09-12 Canon Inc 画像検索方法および装置

Similar Documents

Publication Publication Date Title
US5210868A (en) Database system and matching method between databases
EP0722145B1 (en) Information retrieval system and method of operation
JP3781696B2 (ja) イメージ検索方法及び検索装置
US5893094A (en) Method and apparatus using run length encoding to evaluate a database
EP0704075A1 (en) Method and apparatus for indexing searching and displaying data
JPH11328228A (ja) 問い合わせ検索結果精緻化方法及び装置
JPH1063685A (ja) 情報検索システム
JPH0486950A (ja) 文書検索方法
JP4075094B2 (ja) 情報分類装置
JPH09231231A (ja) データ検索装置
JPH03294965A (ja) 文書検索方法
JPH0394375A (ja) 文書検索装置
JPH03294964A (ja) 文書検索方法
JPH08272806A (ja) データベース検索システム
KR100341418B1 (ko) 문서자료 검색 데이터베이스화 및 이를 이용한 문서자료검색 방법
JPH11154164A (ja) 全文検索処理における適合度算出方法および該方法に係るプログラムを格納した記憶媒体
JPH0241564A (ja) 文書検索装置
JPH05266085A (ja) 動的概念辞書を用いた類似検索方法及びその装置
JPH08329101A (ja) データベースシステム
JP2939841B2 (ja) データベース検索装置
JP2732661B2 (ja) テキスト型データベース装置
JPH0584938B2 (ja)
JP2000207422A (ja) 概念シソ―ラスを用いた文書の検索及び格付けシステム並びに方法
JPH08314974A (ja) キーワード自動抽出装置および文書検索装置
JPS61182131A (ja) 情報検索システム