JPH05151271A - 情報検索装置 - Google Patents
情報検索装置Info
- Publication number
- JPH05151271A JPH05151271A JP3340360A JP34036091A JPH05151271A JP H05151271 A JPH05151271 A JP H05151271A JP 3340360 A JP3340360 A JP 3340360A JP 34036091 A JP34036091 A JP 34036091A JP H05151271 A JPH05151271 A JP H05151271A
- Authority
- JP
- Japan
- Prior art keywords
- search
- data
- word
- matching data
- retrieving
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3322—Query formulation using system suggestions
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【目的】 情報検索において短時間で容易にしかも精度
よく目的とする情報を検索することができる情報検索装
置を提供すること。 【構成】 検索者によって自分の検索要求に合致してい
ると判断された適合データ1と、検索要求に合致してい
ないと判断された不適合データ2と、適合データ1と不
適合データ2を読み込んで適合データ1に出現している
語を適合データテーブルに格納するとともにその中から
検索語を選択する検索語選択部3と、検索語選択部3に
て選択された検索語について能力値を計算するとともに
その検索語と能力値を検索語テーブルに格納する能力値
算出部4と、検索語テーブルと適合データテーブルから
各適合データにおける検索語の能力値の加算値を計算し
しきい値を決定するしきい値決定部5と、しきい値決定
部5にて決定されたしきい値により検索式7を生成する
検索式生成部6とから構成されている。
よく目的とする情報を検索することができる情報検索装
置を提供すること。 【構成】 検索者によって自分の検索要求に合致してい
ると判断された適合データ1と、検索要求に合致してい
ないと判断された不適合データ2と、適合データ1と不
適合データ2を読み込んで適合データ1に出現している
語を適合データテーブルに格納するとともにその中から
検索語を選択する検索語選択部3と、検索語選択部3に
て選択された検索語について能力値を計算するとともに
その検索語と能力値を検索語テーブルに格納する能力値
算出部4と、検索語テーブルと適合データテーブルから
各適合データにおける検索語の能力値の加算値を計算し
しきい値を決定するしきい値決定部5と、しきい値決定
部5にて決定されたしきい値により検索式7を生成する
検索式生成部6とから構成されている。
Description
【0001】
【産業上の利用分野】本発明は情報検索装置に係り、と
くに、情報検索において適合データと不適合データが入
力されたときに、それらのデータから適合データをでき
るだけ多く検索する可能性がある語を選択し、それらの
語から検索式を自動的に生成する情報検索装置に関す
る。
くに、情報検索において適合データと不適合データが入
力されたときに、それらのデータから適合データをでき
るだけ多く検索する可能性がある語を選択し、それらの
語から検索式を自動的に生成する情報検索装置に関す
る。
【0002】
【従来の技術】情報検索システムにおいて、検索者は自
分の検索要求を表現する語をANDやORなどの論理演
算子で連結して検索式を作成し、それを検索システムに
投入して検索を行う。検索して得られた結果に検索者が
要求するデータが少なくて満足できない場合には、検索
者が再度検索式を作成して検索を行う。適合データをも
とに検索式を自動的に生成する方法として「適合情報利
用によるオンライン高性能自動文献探索法」(海老沼幸
夫著、情報管理、VOL.27、NO.8、P.692
−703、1984年)が報告されている。この方法で
は最初に検索者から得られた10件程度の適合データ中
の語から、検索者に10語前後を検索語として選択して
もらう。次に選択された語に対して適合データを検索す
る能力値を次のように求める。
分の検索要求を表現する語をANDやORなどの論理演
算子で連結して検索式を作成し、それを検索システムに
投入して検索を行う。検索して得られた結果に検索者が
要求するデータが少なくて満足できない場合には、検索
者が再度検索式を作成して検索を行う。適合データをも
とに検索式を自動的に生成する方法として「適合情報利
用によるオンライン高性能自動文献探索法」(海老沼幸
夫著、情報管理、VOL.27、NO.8、P.692
−703、1984年)が報告されている。この方法で
は最初に検索者から得られた10件程度の適合データ中
の語から、検索者に10語前後を検索語として選択して
もらう。次に選択された語に対して適合データを検索す
る能力値を次のように求める。
【0003】「能力値=(適合データ中でその語が出現
している件数)/(検索対象データベース中でその語が
出現している件数)」
している件数)/(検索対象データベース中でその語が
出現している件数)」
【0004】そして、この能力値をもとに検索語をAN
D演算子で連結して部分検索式を生成し、さらに部分検
索式をOR演算子で連結して最終的な検索式を生成す
る。
D演算子で連結して部分検索式を生成し、さらに部分検
索式をOR演算子で連結して最終的な検索式を生成す
る。
【0005】
【発明が解決しようとする課題】しかしながら、上記従
来例においては、検索語の能力値の計算の際に、検索対
象データベース中でその語が出現している件数を調べる
ためにデータベースを検索語ごとに検索しなければなら
ず、多大な時間を要するという不都合があった。また、
検索語の選択は検索者の判断にまかされており、適合デ
ータ中の語が多ければ多いほど検索者に負担がかかると
いう問題点があった。
来例においては、検索語の能力値の計算の際に、検索対
象データベース中でその語が出現している件数を調べる
ためにデータベースを検索語ごとに検索しなければなら
ず、多大な時間を要するという不都合があった。また、
検索語の選択は検索者の判断にまかされており、適合デ
ータ中の語が多ければ多いほど検索者に負担がかかると
いう問題点があった。
【0006】
【発明の目的】本発明の目的は、かかる従来例の有する
不都合を改善し、とくに情報検索において短時間で容易
にしかも精度よく目的とする情報を検索することができ
る情報検索装置を提供することにある。
不都合を改善し、とくに情報検索において短時間で容易
にしかも精度よく目的とする情報を検索することができ
る情報検索装置を提供することにある。
【0007】
【課題を解決するための手段】そこで、本発明では、検
索者によって自分の検索要求に合致していると判断され
た適合データと、検索要求に合致していないと判断され
た不適合データと、適合データと不適合データを読み込
んで適合データに出現している語を適合データテーブル
に格納するとともにその中から検索語を選択する検索語
選択部と、検索語選択部にて選択された検索語について
能力値を計算するとともにその検索語と能力値を検索語
テーブルに格納する能力値算出部と、検索語テーブルと
適合データテーブルから各適合データにおける検索語の
能力値の加算値を計算ししきい値を決定するしきい値決
定部と、しきい値決定部にて決定されたしきい値により
検索式を生成する検索式生成部とを具備するという構成
を採っている。これによって前述した目的を達成しよう
とするものである。
索者によって自分の検索要求に合致していると判断され
た適合データと、検索要求に合致していないと判断され
た不適合データと、適合データと不適合データを読み込
んで適合データに出現している語を適合データテーブル
に格納するとともにその中から検索語を選択する検索語
選択部と、検索語選択部にて選択された検索語について
能力値を計算するとともにその検索語と能力値を検索語
テーブルに格納する能力値算出部と、検索語テーブルと
適合データテーブルから各適合データにおける検索語の
能力値の加算値を計算ししきい値を決定するしきい値決
定部と、しきい値決定部にて決定されたしきい値により
検索式を生成する検索式生成部とを具備するという構成
を採っている。これによって前述した目的を達成しよう
とするものである。
【0008】
【作用】検索者が適合データと不適合データを検索語選
択部に入力する。検索語選択部は入力された適合データ
に出現している語を取り出し適合データテーブルに格納
するとともに入力された適合データおよび不適合データ
中に適合データから取り出した語が出現している件数を
調べ、さらに適合データから取り出した語が適合データ
および不適合データに出現している比率と適合データの
みに出現している比率を算出する。そして検索語選択部
は適合データおよび不適合データに出現している比率よ
りも適合データのみに出現している比率のほうが大きい
語を検索語として選択する。能力値算出部は検索語選択
部にて選択された検索語の適合データを検索するための
能力値を計算し、そして検索語テーブルに検索語とその
能力値を格納する。しきい値決定部では適合データテー
ブルと検索語テーブルから各適合データについてそこに
出現している検索語の能力値を加算し最も低い加算値を
しきい値とする。検索式生成部では検索語テーブルを参
照してこのしきい値以上の能力値をもつ検索語を探す。
もしそのような検索語が存在しないときは複数個の検索
語でそれぞれの能力値を加算した値がしきい値以上とな
る組合せを探し、それぞれがAND演算子で連結された
部分検索式として部分検索式テーブルに格納する。そし
てこれらの部分検索式をOR演算子で連結し検索式とし
て出力する。
択部に入力する。検索語選択部は入力された適合データ
に出現している語を取り出し適合データテーブルに格納
するとともに入力された適合データおよび不適合データ
中に適合データから取り出した語が出現している件数を
調べ、さらに適合データから取り出した語が適合データ
および不適合データに出現している比率と適合データの
みに出現している比率を算出する。そして検索語選択部
は適合データおよび不適合データに出現している比率よ
りも適合データのみに出現している比率のほうが大きい
語を検索語として選択する。能力値算出部は検索語選択
部にて選択された検索語の適合データを検索するための
能力値を計算し、そして検索語テーブルに検索語とその
能力値を格納する。しきい値決定部では適合データテー
ブルと検索語テーブルから各適合データについてそこに
出現している検索語の能力値を加算し最も低い加算値を
しきい値とする。検索式生成部では検索語テーブルを参
照してこのしきい値以上の能力値をもつ検索語を探す。
もしそのような検索語が存在しないときは複数個の検索
語でそれぞれの能力値を加算した値がしきい値以上とな
る組合せを探し、それぞれがAND演算子で連結された
部分検索式として部分検索式テーブルに格納する。そし
てこれらの部分検索式をOR演算子で連結し検索式とし
て出力する。
【0009】
【発明の実施例】以下、本発明の一実施例を図1ないし
図5に基づいて説明する。
図5に基づいて説明する。
【0010】図1の実施例は、検索者によって自分の検
索要求に合致していると判断された適合データ1と、検
索要求に合致していないと判断された不適合データ2
と、適合データ1と不適合データ2を読み込んで適合デ
ータ1に出現している語を適合データテーブルに格納す
るとともにその中から検索語を選択する検索語選択部3
と、検索語選択部3にて選択された検索語について能力
値を計算するとともにその検索語と能力値を検索語テー
ブルに格納する能力値算出部4と、検索語テーブルと適
合データテーブルから各適合データにおける検索語の能
力値の加算値を計算ししきい値を決定するしきい値決定
部5と、しきい値決定部5にて決定されたしきい値によ
り検索式7を生成する検索式生成部6とから構成されて
いる。
索要求に合致していると判断された適合データ1と、検
索要求に合致していないと判断された不適合データ2
と、適合データ1と不適合データ2を読み込んで適合デ
ータ1に出現している語を適合データテーブルに格納す
るとともにその中から検索語を選択する検索語選択部3
と、検索語選択部3にて選択された検索語について能力
値を計算するとともにその検索語と能力値を検索語テー
ブルに格納する能力値算出部4と、検索語テーブルと適
合データテーブルから各適合データにおける検索語の能
力値の加算値を計算ししきい値を決定するしきい値決定
部5と、しきい値決定部5にて決定されたしきい値によ
り検索式7を生成する検索式生成部6とから構成されて
いる。
【0011】ここで、各部の機能を詳述する。
【0012】(a).検索語選択部3では、適合データ
1に出現している全ての語を適合データテーブルに格納
し、適合データ1および不適合データ2においてその語
が出現している件数と、適合データ1のみに出現してい
る件数を算出し、それぞれの語について適合データ1お
よび不適合データ2に出現する比率と、適合データ1の
みに出現する比率とを以下の式により算出する。
1に出現している全ての語を適合データテーブルに格納
し、適合データ1および不適合データ2においてその語
が出現している件数と、適合データ1のみに出現してい
る件数を算出し、それぞれの語について適合データ1お
よび不適合データ2に出現する比率と、適合データ1の
みに出現する比率とを以下の式により算出する。
【0013】「(適合データ1および不適合データ2に
出現する比率)=(その語が適合データ1および不適合
データ2中に出現する件数)÷(適合データ1および不
適合データの件数)」 ・・・ (1)
出現する比率)=(その語が適合データ1および不適合
データ2中に出現する件数)÷(適合データ1および不
適合データの件数)」 ・・・ (1)
【0014】「(適合データ1のみに出現する比率)=
(その語が適合データ1中に出現する件数)÷(適合デ
ータ1の件数)」・・・(2)
(その語が適合データ1中に出現する件数)÷(適合デ
ータ1の件数)」・・・(2)
【0015】そして、適合データ1のみに出現する比率
が適合データ1および不適合データ2に出現する比率よ
りも高い語を検索語として選択する。
が適合データ1および不適合データ2に出現する比率よ
りも高い語を検索語として選択する。
【0016】(b).能力値算出部4では、以下の式に
より能力値を算出する。
より能力値を算出する。
【0017】「(能力値)=(その語が適合データ1中
に出現する件数+1)÷(その語が適合データ1および
不適合データ2中に出現する件数+2)」・・・(3)
に出現する件数+1)÷(その語が適合データ1および
不適合データ2中に出現する件数+2)」・・・(3)
【0018】(c).しきい値決定部5では、適合デー
タテーブル中の各適合データについて、それぞれに出現
する検索語を検索語テーブルで確認しながら、それぞれ
の検索語の能力値を加算し、その適合データの加算値と
する。そして適合データ1の中で最も低い加算値をしき
い値とする。
タテーブル中の各適合データについて、それぞれに出現
する検索語を検索語テーブルで確認しながら、それぞれ
の検索語の能力値を加算し、その適合データの加算値と
する。そして適合データ1の中で最も低い加算値をしき
い値とする。
【0019】(d).検索式生成部6では、検索語テー
ブルに記載されている各検索語について、能力値がこの
しきい値以上を示しているかどうかを調べ、しきい値以
上の能力値をもつ検索語があれば部分検索式テーブルに
格納する。このとき全ての検索語が部分検索式テーブル
に格納されなければ2個の検索語の能力値を加算した値
がしきい値以上となる検索語の全ての組合せを調べて、
その2個の検索語をAND演算子で連結して部分検索式
とし、部分検索式テーブルに格納する。全ての検索語が
部分検索式テーブルに格納されるまで、検索語の数を3
個、4個と増やしてこの処理を続ける。部分検索式が全
て部分検索式テーブルに格納されたら、それぞれの部分
検索式をOR演算子で連結して検索式7を出力する。
ブルに記載されている各検索語について、能力値がこの
しきい値以上を示しているかどうかを調べ、しきい値以
上の能力値をもつ検索語があれば部分検索式テーブルに
格納する。このとき全ての検索語が部分検索式テーブル
に格納されなければ2個の検索語の能力値を加算した値
がしきい値以上となる検索語の全ての組合せを調べて、
その2個の検索語をAND演算子で連結して部分検索式
とし、部分検索式テーブルに格納する。全ての検索語が
部分検索式テーブルに格納されるまで、検索語の数を3
個、4個と増やしてこの処理を続ける。部分検索式が全
て部分検索式テーブルに格納されたら、それぞれの部分
検索式をOR演算子で連結して検索式7を出力する。
【0020】次に、本実施例の動作について説明する。
【0021】1).検索者が適合データ1と不適合デー
タ2を検索語選択部3に入力する。
タ2を検索語選択部3に入力する。
【0022】ここでは1例として3件の適合データ1と
5件の不適合データ2が入力されたとする。
5件の不適合データ2が入力されたとする。
【0023】2).検索語選択部3は、入力された適合
データ1に出現している語を取り出し適合データテーブ
ルに格納する。
データ1に出現している語を取り出し適合データテーブ
ルに格納する。
【0024】ここでは1例として適合データテーブルに
は図2に示されるように適合データについては「ガ
ン」,「予防」,「喫煙」,「肺ガン」,「ビタミン
C」,適合データについては「ガン」,「予防」,
「植物繊維」,「偏食」,「大腸ガン」,適合データ
については「ガン」,「予防」,「偏食」が格納されて
いるとする。
は図2に示されるように適合データについては「ガ
ン」,「予防」,「喫煙」,「肺ガン」,「ビタミン
C」,適合データについては「ガン」,「予防」,
「植物繊維」,「偏食」,「大腸ガン」,適合データ
については「ガン」,「予防」,「偏食」が格納されて
いるとする。
【0025】3).検索語選択部3は、入力された適合
データおよび不適合データ中に、2)にて適合データ1
から取り出した語が出現している件数を調べる。
データおよび不適合データ中に、2)にて適合データ1
から取り出した語が出現している件数を調べる。
【0026】ここでは1例として図3に示されるように
適合データおよび不適合データ8件中に「ガン」は6
件、「予防」は4件、「喫煙」は6件、「肺ガン」は5
件、「ビタミンC」は1件、「植物繊維」は2件、「偏
食」は7件、「大腸ガン」は5件あったとする。また、
適合データのみに出現している件数は図3に示されるよ
うに「ガン」は3件、「予防」は3件、「喫煙」は1
件、「肺ガン」は1件、「ビタミンC」は1件、「植物
繊維」は1件、「偏食」は2件、「大腸ガン」は1件で
ある。
適合データおよび不適合データ8件中に「ガン」は6
件、「予防」は4件、「喫煙」は6件、「肺ガン」は5
件、「ビタミンC」は1件、「植物繊維」は2件、「偏
食」は7件、「大腸ガン」は5件あったとする。また、
適合データのみに出現している件数は図3に示されるよ
うに「ガン」は3件、「予防」は3件、「喫煙」は1
件、「肺ガン」は1件、「ビタミンC」は1件、「植物
繊維」は1件、「偏食」は2件、「大腸ガン」は1件で
ある。
【0027】4).検索語選択部3は、適合データ1か
ら取り出した語が適合データおよび不適合データに出現
している比率を(1)式により算出する。
ら取り出した語が適合データおよび不適合データに出現
している比率を(1)式により算出する。
【0028】ここでは、「ガン」は6/8=0.75、
「予防」は4/8=0.5、「喫煙」は6/8=0.7
5、「肺ガン」は5/8=0.625、「ビタミンC」
は1/8=0.125、「植物繊維」は2/8=0.2
5、「偏食」は7/8=0.875、「大腸ガン」は5
/8=0.625である。
「予防」は4/8=0.5、「喫煙」は6/8=0.7
5、「肺ガン」は5/8=0.625、「ビタミンC」
は1/8=0.125、「植物繊維」は2/8=0.2
5、「偏食」は7/8=0.875、「大腸ガン」は5
/8=0.625である。
【0029】5).検索語選択部3は、適合データ1か
ら取り出した語が適合データのみに出現している比率を
(2)式により算出する。
ら取り出した語が適合データのみに出現している比率を
(2)式により算出する。
【0030】ここでは、「ガン」は3/3=1.0、
「予防」は3/3=1.0、「喫煙」は1/3=0.3
3、「肺ガン」は1/3=0.33、「ビタミンC」は
1/3=0.33、「植物繊維」は1/3=0.33、
「偏食」は2/3=0.67、「大腸ガン」は1/3=
0.33である。
「予防」は3/3=1.0、「喫煙」は1/3=0.3
3、「肺ガン」は1/3=0.33、「ビタミンC」は
1/3=0.33、「植物繊維」は1/3=0.33、
「偏食」は2/3=0.67、「大腸ガン」は1/3=
0.33である。
【0031】6).検索語選択部3は、適合データおよ
び不適合データに出現している比率よりも適合データの
みに出現している比率のほうが大きい語を検索語として
選択する。
び不適合データに出現している比率よりも適合データの
みに出現している比率のほうが大きい語を検索語として
選択する。
【0032】ここでは、「ガン」、「予防」、「ビタミ
ンC」、「植物繊維」の4語が検索語として選択され
る。
ンC」、「植物繊維」の4語が検索語として選択され
る。
【0033】7).能力値算出部4が(3)式により検
索語の適合データを検索する能力値を計算し、そして検
索語テーブルに検索語とその能力値を格納する。
索語の適合データを検索する能力値を計算し、そして検
索語テーブルに検索語とその能力値を格納する。
【0034】ここでは、「ガン」については(3+1)
/(6+2)=0.5、「予防」については(3+1)
/(4+2)=0.67、「ビタミンC」については
(1+1)/(1+2)=0.67、「植物繊維」につ
いては(1+1)/(2+2)=0.50となる。
/(6+2)=0.5、「予防」については(3+1)
/(4+2)=0.67、「ビタミンC」については
(1+1)/(1+2)=0.67、「植物繊維」につ
いては(1+1)/(2+2)=0.50となる。
【0035】8).しきい値決定部5では、適合データ
テーブルと検索語テーブルから、各適合データについて
そこに出現している検索語の能力値を加算し、最も低い
加算値をしきい値とするする。
テーブルと検索語テーブルから、各適合データについて
そこに出現している検索語の能力値を加算し、最も低い
加算値をしきい値とするする。
【0036】ここでは、適合データには検索語「ガ
ン」、「予防」、「ビタミンC」が出現しており、それ
ぞれの能力値を加算すれば適合データの加算値は0.
5+0.67+0.67=1.84となる。同様にして
適合データについては1.67、適合データについ
ては1.17という加算値が得られる。そして、3件の
適合データの中でデータの1.17が最も低いのでこ
の加算値をしきい値とする。
ン」、「予防」、「ビタミンC」が出現しており、それ
ぞれの能力値を加算すれば適合データの加算値は0.
5+0.67+0.67=1.84となる。同様にして
適合データについては1.67、適合データについ
ては1.17という加算値が得られる。そして、3件の
適合データの中でデータの1.17が最も低いのでこ
の加算値をしきい値とする。
【0037】9).検索式生成部6では、検索語テーブ
ルを参照してこのしきい値以上の能力値をもつ検索語を
探し、出力する。
ルを参照してこのしきい値以上の能力値をもつ検索語を
探し、出力する。
【0038】ここでは、そのような検索語は存在しない
ので、次に2個の検索語でそれぞれの能力値を加算した
値がしきい値以上となる組合せを探す。例えば検索語
「ガン」と「予防」の組合せは、それぞれの能力値の
0.5と0.67を加算すると1.17でしきい値以上
となる。その他、「ガン」と「ビタミンC」、「予防」
と「ビタミンC」、「予防」と「植物繊維」、「ビタミ
ンC」と「植物繊維」の組合せがしきい値以上の能力値
を示し、それぞれがAND演算子で連結した部分検索式
が部分検索式テーブルに格納される。これらの部分検索
式中で検索語「ガン」、「予防」、「ビタミンC」、
「植物繊維」が全て出現しているので、部分検索式はこ
れ以上生成されない。そしてこれらの部分検索式をOR
演算子で連結し、以下の検索式7を出力する。
ので、次に2個の検索語でそれぞれの能力値を加算した
値がしきい値以上となる組合せを探す。例えば検索語
「ガン」と「予防」の組合せは、それぞれの能力値の
0.5と0.67を加算すると1.17でしきい値以上
となる。その他、「ガン」と「ビタミンC」、「予防」
と「ビタミンC」、「予防」と「植物繊維」、「ビタミ
ンC」と「植物繊維」の組合せがしきい値以上の能力値
を示し、それぞれがAND演算子で連結した部分検索式
が部分検索式テーブルに格納される。これらの部分検索
式中で検索語「ガン」、「予防」、「ビタミンC」、
「植物繊維」が全て出現しているので、部分検索式はこ
れ以上生成されない。そしてこれらの部分検索式をOR
演算子で連結し、以下の検索式7を出力する。
【0039】「ガン」AND「予防」 OR 「ガン」
AND「ビタミンC」 OR
AND「ビタミンC」 OR
【0040】「予防」AND「ビタミンC」 OR
「予防」AND「植物繊維」
「予防」AND「植物繊維」
【0041】OR 「ビタミンC」AND「植物繊維」
【0042】
【発明の効果】本発明は以上のように構成され機能する
ので、これによると、操作者は検索者の要求に合致して
いる適合データと合致していない不適合データを入力す
るだけで自動的に検索式を求めることができ、これがた
め、短時間で容易にしかも精度よく目的とする情報を検
索することができるという従来にない優れた情報検索装
置を提供することができる。
ので、これによると、操作者は検索者の要求に合致して
いる適合データと合致していない不適合データを入力す
るだけで自動的に検索式を求めることができ、これがた
め、短時間で容易にしかも精度よく目的とする情報を検
索することができるという従来にない優れた情報検索装
置を提供することができる。
【図1】本発明の一実施例を示したブロック図である。
【図2】入力された適合データを格納する適合データテ
ーブルの一例を示した説明図である。
ーブルの一例を示した説明図である。
【図3】適合データ中の語について、入力された適合デ
ータおよび不適合データと適合データにおけるそれぞれ
の出現件数の一例を示した説明図である。
ータおよび不適合データと適合データにおけるそれぞれ
の出現件数の一例を示した説明図である。
【図4】検索語と、適合データを検索するその語の能力
値を格納する検索語テーブルの一例を示した説明図であ
る。
値を格納する検索語テーブルの一例を示した説明図であ
る。
【図5】検索語から構成された部分検索式を格納する部
分検索式テーブルの一例を示した説明図である。
分検索式テーブルの一例を示した説明図である。
1 適合データ 2 不適合データ 3 検索語選択部 4 能力値算出部 5 しきい値決定部 6 検索式生成部 7 検索式
Claims (2)
- 【請求項1】 検索者の検索要求に合致していると判断
された適合データと,検索要求に合致していないと判断
された不適合データを読み込んで適合データに出現して
いる語を適合データテーブルに格納すると共にその中か
ら検索語を選択する検索語選択部と、検索語選択部にて
選択された検索語について能力値を計算するとともにそ
の検索語と能力値を検索語テーブルに格納する能力値算
出部と、検索語テーブルと適合データテーブルから各適
合データにおける検索語の能力値の加算値を計算ししき
い値を決定するしきい値決定部と、しきい値決定部にて
決定されたしきい値により検索式を生成する検索式生成
部とから構成されることを特徴とする情報検索装置。 - 【請求項2】 前記能力値算出部では、式「(能力値)
=(その語が適合データ中に出現する件数+1)÷(そ
の語が適合データおよび不適合データ中に出現する件数
+2)」により能力値が算出されることを特徴とする請
求項1記載の情報検索装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3340360A JP2792293B2 (ja) | 1991-11-29 | 1991-11-29 | 情報検索装置 |
US07/980,702 US5442781A (en) | 1991-11-29 | 1992-11-24 | System for generating a search formula by accessing search terms on the basis of a training set of pertinent and non-pertinent objects |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3340360A JP2792293B2 (ja) | 1991-11-29 | 1991-11-29 | 情報検索装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05151271A true JPH05151271A (ja) | 1993-06-18 |
JP2792293B2 JP2792293B2 (ja) | 1998-09-03 |
Family
ID=18336198
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3340360A Expired - Fee Related JP2792293B2 (ja) | 1991-11-29 | 1991-11-29 | 情報検索装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US5442781A (ja) |
JP (1) | JP2792293B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001184370A (ja) * | 1995-09-04 | 2001-07-06 | Matsushita Electric Ind Co Ltd | キーワード検索式生成装置及びキーワード検索式生成方法 |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6169763B1 (en) | 1995-06-29 | 2001-01-02 | Qualcomm Inc. | Characterizing a communication system using frame aligned test signals |
US5742811A (en) * | 1995-10-10 | 1998-04-21 | International Business Machines Corporation | Method and system for mining generalized sequential patterns in a large database |
US6044377A (en) * | 1995-11-07 | 2000-03-28 | Sun Microsystem, Inc. | User-defined object type and method of making the object type wherein a file associated with a rule is invoked by accessing the file which generates code at run time |
US5727199A (en) * | 1995-11-13 | 1998-03-10 | International Business Machines Corporation | Database mining using multi-predicate classifiers |
US5778364A (en) * | 1996-01-02 | 1998-07-07 | Verity, Inc. | Evaluation of content of a data set using multiple and/or complex queries |
JP3597697B2 (ja) * | 1998-03-20 | 2004-12-08 | 富士通株式会社 | 文書要約装置およびその方法 |
GB2336700A (en) * | 1998-04-24 | 1999-10-27 | Dialog Corp Plc The | Generating machine readable association files |
US6768997B2 (en) * | 1999-05-24 | 2004-07-27 | International Business Machines Corporation | System and method for creating a search query using movable elements in a graphical user interface |
CA2307404A1 (en) * | 2000-05-02 | 2001-11-02 | Provenance Systems Inc. | Computer readable electronic records automated classification system |
US7027987B1 (en) * | 2001-02-07 | 2006-04-11 | Google Inc. | Voice interface for a search engine |
US7085760B2 (en) * | 2002-10-03 | 2006-08-01 | International Business Machines Corporation | Data query differential analysis |
US6938036B2 (en) * | 2002-10-24 | 2005-08-30 | International Business Machines Corporation | Query modification analysis |
US20050123526A1 (en) * | 2003-12-01 | 2005-06-09 | Medtronic Inc. | Administration of growth factors for neurogenesis and gliagenesis |
US9268780B2 (en) | 2004-07-01 | 2016-02-23 | Emc Corporation | Content-driven information lifecycle management |
US8065283B2 (en) * | 2008-01-24 | 2011-11-22 | Globalspec, Inc. | Term synonym generation |
US8600173B2 (en) | 2010-01-27 | 2013-12-03 | Dst Technologies, Inc. | Contextualization of machine indeterminable information based on machine determinable information |
CN103870461B (zh) * | 2012-12-10 | 2019-09-10 | 腾讯科技(深圳)有限公司 | 主题推荐方法、装置和服务器 |
US9069882B2 (en) * | 2013-01-22 | 2015-06-30 | International Business Machines Corporation | Mapping and boosting of terms in a format independent data retrieval query |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4554631A (en) * | 1983-07-13 | 1985-11-19 | At&T Bell Laboratories | Keyword search automatic limiting method |
US5274749A (en) * | 1984-08-23 | 1993-12-28 | Health Care Expert Systems, Inc. | Interpretative system for systematic learning and support for decision-making |
JP2760794B2 (ja) * | 1988-01-29 | 1998-06-04 | 株式会社日立製作所 | データベース処理方法および装置 |
US4956774A (en) * | 1988-09-02 | 1990-09-11 | International Business Machines Corporation | Data base optimizer using most frequency values statistics |
US4839853A (en) * | 1988-09-15 | 1989-06-13 | Bell Communications Research, Inc. | Computer information retrieval using latent semantic structure |
US5222234A (en) * | 1989-12-28 | 1993-06-22 | International Business Machines Corp. | Combining search criteria to form a single search and saving search results for additional searches in a document interchange system |
US5301109A (en) * | 1990-06-11 | 1994-04-05 | Bell Communications Research, Inc. | Computerized cross-language document retrieval using latent semantic indexing |
US5321833A (en) * | 1990-08-29 | 1994-06-14 | Gte Laboratories Incorporated | Adaptive ranking system for information retrieval |
US5265065A (en) * | 1991-10-08 | 1993-11-23 | West Publishing Company | Method and apparatus for information retrieval from a database by replacing domain specific stemmed phases in a natural language to create a search query |
-
1991
- 1991-11-29 JP JP3340360A patent/JP2792293B2/ja not_active Expired - Fee Related
-
1992
- 1992-11-24 US US07/980,702 patent/US5442781A/en not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001184370A (ja) * | 1995-09-04 | 2001-07-06 | Matsushita Electric Ind Co Ltd | キーワード検索式生成装置及びキーワード検索式生成方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2792293B2 (ja) | 1998-09-03 |
US5442781A (en) | 1995-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH05151271A (ja) | 情報検索装置 | |
JP3087694B2 (ja) | 情報検索装置及びプログラムを記録した機械読み取り可能な記録媒体 | |
US5151857A (en) | Dictionary linked text base apparatus | |
EP0590858B1 (en) | Method for performing a search of a plurality of documents for similarity to a query | |
US7509314B2 (en) | Document retrieval system recognizing types and values of numeric search conditions | |
US6681222B2 (en) | Unified database and text retrieval system | |
JPH10171819A (ja) | 情報検索装置 | |
JP4227797B2 (ja) | 類義語検索装置、それによる類義語検索方法、類義語検索プログラム及び記憶媒体 | |
JP2538736B2 (ja) | 関連キ―ワ―ド自動生成装置 | |
WO1993018484A1 (en) | Method and apparatus for comparison of data strings | |
JPH03116377A (ja) | 情報検索装置 | |
French et al. | A classification approach to Boolean query reformulation | |
JP3418876B2 (ja) | データ・ベース検索装置および方法 | |
JP2604587B2 (ja) | 情報検索装置 | |
JPH11213004A (ja) | データ処理装置及びその方法、及びそのプログラムを記憶した記憶媒体 | |
JP2002183194A (ja) | 検索式生成装置およびその方法 | |
JPH02129756A (ja) | 単語照合装置 | |
JPH08320879A (ja) | 適合フィードバック装置 | |
JPH0584938B2 (ja) | ||
JP3374946B2 (ja) | 検索装置 | |
JP2004234175A (ja) | コンテンツ検索装置およびそのプログラム | |
JPH0330066A (ja) | 情報検索方式 | |
JP2571229B2 (ja) | 多階層化探索処理装置 | |
JPH03116376A (ja) | キーワード・マッチング装置 | |
JPH0584937B2 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19980519 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080619 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090619 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100619 Year of fee payment: 12 |
|
LAPS | Cancellation because of no payment of annual fees |