JPH06251076A - データ・ベース検索装置および方法 - Google Patents

データ・ベース検索装置および方法

Info

Publication number
JPH06251076A
JPH06251076A JP5063422A JP6342293A JPH06251076A JP H06251076 A JPH06251076 A JP H06251076A JP 5063422 A JP5063422 A JP 5063422A JP 6342293 A JP6342293 A JP 6342293A JP H06251076 A JPH06251076 A JP H06251076A
Authority
JP
Japan
Prior art keywords
search
keyword
database
input
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5063422A
Other languages
English (en)
Other versions
JP3418876B2 (ja
Inventor
Futoshi Hayashi
太志 林
Toshimi Kudo
敏巳 工藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP06342293A priority Critical patent/JP3418876B2/ja
Publication of JPH06251076A publication Critical patent/JPH06251076A/ja
Application granted granted Critical
Publication of JP3418876B2 publication Critical patent/JP3418876B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 公知のデータ・ベースから文書情報を得られ
るようにする。 【構成】 検索条件入力装置11から入力キーワードおよ
び重視度を含む検索条件が入力される。関連語辞書14を
用いて,入力キーワードの関連語とその関連度が読出さ
れる。キーワード選択装置15により読出した関連語の中
から適したものを検索キーワードとして選択される。検
索条件および検索キーワードに基づいてデータ・ベース
検索条件を作成し,これに応じてデータ・ベース1の検
索が行なわれる。

Description

【発明の詳細な説明】
【0001】
【技術分野】この発明は,データ・ベース検索装置およ
び方法に関する。
【0002】
【従来技術とその問題点】従来,文書情報を有するデー
タ・ベースの検索を行なう場合,検索条件として入力さ
れたキーワードを含む文書情報が検索される。しかしな
がら,このような検索方法では,データ・ベースから多
数の文書が検索されるので,利用者が検索された文書情
報の内容を理解して,その文書情報の中から所望の文書
情報を取捨選択しなければならないという問題点があっ
た。
【0003】また検索条件と検索された文書情報とがど
の程度一致しているかを表わす合致度を出力する検索方
法が特開平4-96177 号公報に記載されている。しかしな
がら,この方法は,特定のデータ・ベースを用いてお
り,既に構築されている公知のデータ・ベースを利用で
きないという問題点があった。
【0004】
【発明の開示】第1の発明は,公知のデータ・ベース・
システムから文書情報を検索できるようにするととも
に,検索された文書情報について検索条件をどの程度一
致しているかを表わす合致度を得られるようにすること
を目的としている。
【0005】第1の発明によるデータ・ベース検索装置
は,多数の文書情報を有するデータ・ベース,および所
与のデータ・ベース検索条件に基づいて上記データ・ベ
ースの検索を行なうデータ・ベース管理システムを備え
たデータ・ベース・システムにおいて,見出し語ごと
に,上記見出し語に関連する関連語,上記見出し語と上
記関連語との関連する度合いを表わす関連度があらかじ
め登録されている関連語辞書,結合演算子によって結合
された複数のキーワードと上記キーワードの重視度とか
らなる検索条件を入力するための検索条件入力手段,上
記検索条件入力手段により入力されたキーワードに対応
する関連語とその関連度を上記関連語辞書から読出す関
連語読出手段,上記関連語読出手段により読出された関
連語のうちデータ・ベース検索に用いるのに適したもの
を選択する選択手段,上記検索条件入力手段から入力さ
れたキーワードおよび上記選択手段によって選択された
関連語を検索キーワードとし,それらの重視度および関
連度をキーワード係数として,上記検索条件入力手段か
ら入力された結合演算子を用いてデータ・ベース検索条
件を作成する手段,作成されたデータ・ベース検索条件
を上記データ・ベース管理システムに与え,上記データ
・ベース検索条件に応じて上記データ・ベースから文書
情報を検索させる検索手段,検索された文書情報と,上
記データ・ベース検索条件との合致度を,上記結合演算
子およびキーワード係数に基づいて算出する合致度演算
手段,検索された文書情報に関するデータと,上記合致
度演算手段により算出された合致度とを対応させて記憶
する検索結果記憶手段を備えている。
【0006】第1の発明によるデータ・ベース検索方法
は,多数の文書情報を有するデータ・ベース,および所
与のデータ・ベース検索条件に基づいて上記データ・ベ
ースの検索を行なうデータ・ベース管理システムを備え
たデータ・ベース・システムを設けて,見出し語ごと
に,上記見出し語に関連する関連語,上記見出し語と上
記関連語との関連する度合いを表わす関連度を関連語辞
書にあらかじめ登録しておき,結合演算子によって結合
された複数のキーワードと上記キーワードの重視度とか
らなる検索条件を受付け,入力されたキーワードに対応
する関連語とその関連度を上記関連語辞書から読出し,
読出された関連語のうちデータ・ベース検索に用いるの
に適したものを選択し,入力されたキーワードおよび選
択された関連語を検索キーワードとし,それらの重視度
および関連度をキーワード係数として,入力された結合
演算子を用いてデータ・ベース検索条件を作成し,作成
されたデータ・ベース検索条件を上記データ・ベース管
理システムに与え,上記データ・ベース検索条件に応じ
て上記データ・ベースから文書情報を検索し,検索され
た文書情報と,上記データ・ベース検索条件との合致度
を,上記結合演算子およびキーワード係数に基づいて算
出し,検索された文書情報に関するデータと,算出され
た合致度とを対応させて記憶するものである。
【0007】第1の発明によると,入力されたキーワー
ドとこのキーワードに関連する関連語が検索キーワード
として検索条件を作成されるので,検索条件を簡単に設
定できかつ検索洩れがなくなる。入力された検索条件か
ら公知のデータ・ベース・システムに入力可能なデータ
・ベース検索条件が作成されるので,公知のデータ・ベ
ース・システムを利用できる。検索された文書情報につ
いて,検索条件との合致度が算出されるので,利用者は
合致度に基づいて必要な文書情報を選択できる。
【0008】第1の発明の好ましい実施態様において
は,上記検索条件入力手段は,上記データ・ベース管理
システムに与える検索キーワード数を入力するものであ
り,上記キーワード選択手段は,入力されたキーワード
の関連語数を,入力された検索キーワード数と上記キー
ワードの重視度とに基づいて配分し,上記関連語読出手
段から読出した関連語の中から関連度の大きい順に上記
関連語数の関連語を選択するものである。
【0009】これにより,データ・ベース・システムに
入力される検索キーワード数に制限がある場合には,入
力された重視度に基づいてキーワード毎に適した検索キ
ーワードを選択されるので,各キーワードについて適し
た検索キーワードをデータ・ベース・システムに与える
ことができる。
【0010】第1の発明の好ましい実施態様において
は,上記検索条件入力手段は,上記データ・ベース管理
システムに与える検索キーワード数を入力するものであ
り,上記キーワード選択手段は,関連語読出手段により
読出された上記キーワードの関連語の総数が入力され
た,検索キーワード数よりも大きい場合には,読出した
関連語の中から関連度の大きい順に上記検索キーワード
数の関連語を選択し,読出された上記キーワードの関連
語の総数が上記検索キーワード数よりも小さい場合に
は,所定値以上の関連度の関連語を選択するものであ
る。
【0011】これにより,データ・ベース・システムに
入力される検索キーワード数に制限がある場合には,入
力されたキーワードの関連語の中から関連度の大きいも
のだけが選択されるので,適した検索キーワードのみが
データ・ベース・システムに入力されることはない。
【0012】第2の発明は,第1の発明と同様に公知の
データ・ベース・システムから文書情報を検索できるよ
うにするとともに,検索された文書情報について検索条
件をどの程度一致しているかを表わす合致度を得られる
ようにすることを目的としている。
【0013】第2の発明によるデータ・ベース検索装置
は,多数の文書情報を有するデータ・ベース,および所
与のデータ・ベース検索条件に基づいて上記データ・ベ
ースの検索を行なうデータ・ベース管理システムを備え
たデータ・ベース・システムにおいて,見出し語ごと
に,上記見出し語に関連する関連語があらかじめ登録さ
れかつ,上記見出し語と上記関連語との関連する度合い
を表わす関連度が分野名とともにあらかじめ登録されて
いる関連語辞書,結合演算子によって結合された複数の
キーワードと上記キーワードの重視度とからなる検索条
件を入力するための検索条件入力手段,分野名を入力す
る分野名入力手段,上記検索条件入力手段により入力さ
れたキーワードに対応する関連語とその関連度を,分野
名入力手段により入力された分野名に応じて,上記関連
語辞書から読出す関連語読出手段,上記関連語読出手段
により読出された関連語のうちデータ・ベース検索に用
いるのに適したものを選択する選択手段,上記検索条件
入力手段から入力されたキーワードおよび上記選択手段
によって選択された関連語を検索キーワードとし,それ
らの重視度および関連度をキーワード係数として,上記
検索条件入力手段から入力された結合演算子を用いてデ
ータ・ベース検索条件を作成する手段,作成されたデー
タ・ベース検索条件を上記データ・ベース管理システム
に与え,上記データ・ベース検索条件に応じて上記デー
タ・ベースから文書情報を検索させる検索手段,検索さ
れた文書情報と,上記データ・ベース検索条件との合致
度を,上記結合演算子およびキーワード係数に基づいて
算出する合致度演算手段,検索された文書情報に関する
データと,上記合致度演算手段により算出された合致度
とを対応させて記憶する検索結果記憶手段を備えてい
る。
【0014】第2の発明によるデータ・ベース検索方法
は,多数の文書情報を有するデータ・ベース,および所
与のデータ・ベース検索条件に基づいて上記データ・ベ
ースの検索を行なうデータ・ベース管理システムを備え
たデータ・ベース・システムを設けて,見出し語ごと
に,上記見出し語に関連する関連語があらかじめ登録さ
れかつ,上記見出し語と上記関連語との関連する度合い
を表わす関連度が分野名とともに関連語辞書にあらかじ
め登録しておき,結合演算子によって結合された複数の
キーワードと上記キーワードの重視度とからなる検索条
件を受付け,分野名を受付け,入力されたキーワードに
対応する関連語とその関連度を,入力された分野名に応
じて上記関連語辞書から読出し,読出された関連語のう
ちデータ・ベース検索に用いるのに適したものを選択
し,入力されたキーワードおよび選択された関連語を検
索キーワードとし,それらの重視度および関連度をキー
ワード係数として,入力された演算子を用いてデータ・
ベース検索条件を作成し,作成されたデータ・ベース検
索条件を上記データ・ベース管理システムに与え,上記
データ・ベース検索条件に応じて上記データ・ベースか
ら文書情報を検索し,検索された文書情報と,上記デー
タ・ベース検索条件との合致度を,上記結合演算子およ
びキーワード係数に基づいて算出し,検索された文書情
報に関するデータと,算出された合致度とを対応させて
記憶するものである。
【0015】第1の発明によると,入力された分野名に
ついて入力されたキーワードとこのキーワードに関連す
る関連語が検索キーワードとして検索条件が作成される
ので,入力された分野名に適した検索条件を簡単に設定
できかつ検索洩れがなくなるとともに検索の精度も高ま
る。入力された検索条件から公知のデータ・ベース・シ
ステムに入力可能なデータ・ベース検索条件が作成され
るので,公知のデータ・ベース・システムを利用でき
る。入力された分野名において,検索された文書情報に
ついて,検索条件との合致度が算出されるので,利用者
は合致度に基づいて必要な文書情報を選択できる。
【0016】第2の発明の好ましい実施態様において
は,上記検索条件入力手段は,上記データ・ベース管理
システムに与える検索キーワード数を入力するものであ
り,上記キーワード選択手段は,入力されたキーワード
の関連語数を,入力された検索キーワード数と上記キー
ワードの重視度とに基づいて配分し,上記関連語読出手
段から読出した関連語の中から関連度の大きい順に上記
関連語数の関連語を選択するものである。
【0017】これにより,データ・ベース・システムに
入力される検索キーワード数に制限がある場合には,入
力された重視度に基づいてキーワード毎に適した検索キ
ーワードを選択されるので,各キーワードについて適し
た検索キーワードをデータ・ベース・システムに与える
ことができる。
【0018】第2の発明の好ましい実施態様において
は,上記検索条件入力手段は,上記データ・ベース管理
システムに与える検索キーワード数を入力するものであ
り,上記キーワード選択手段は,関連語読出手段により
読出された上記キーワードの関連語の総数が入力され
た,検索キーワード数よりも大きい場合には,読出した
関連語の中から関連度の大きい順に上記検索キーワード
数の関連語を選択し,読出された上記キーワードの関連
語の総数が上記検索キーワードよりも小さい場合には,
所定値以上の関連度の関連語を選択するものである。
【0019】これにより,データ・ベース・システムに
入力される検索キーワード数に制限がある場合には,入
力されたキーワードの関連語の中から関連度の大きいも
のだけが選択されるので,適した検索キーワードのみが
データ・ベース・システムに入力されることはない。
【0020】
【実施例の説明】図1はデータ・ベース検索装置の全体
的構成を示すブロック図である。
【0021】このデータ・ベース検索装置はそのすべて
をハードウェア・アーキテクチャにより実現することも
できるし,プログラムされたコンピュータ・システムに
より実現することもできる。またデータ・ベース検索装
置の一部をハードウェアにより,他の部分をソフトウェ
アにより実現することもできる。
【0022】データ・ベース1およびデータ・ベース管
理システム2には公知のシステムを用いることができ
る。
【0023】データ・ベース1は,テキスト型データ・
ベースであり,多数の電子化された文書ファイル(文書
情報または文書データ)があらかじめ登録されている。
データ・ベース1に登録されている文書ファイルの一例
が図2に示されている。
【0024】データ・ベース1は,文書ファイルのみを
格納したデータ・ベースに限らず,キーワード・インデ
ックス・ファイルをさらに有するデータ・ベースであっ
てもよい。
【0025】データ・ベース管理システム2は,データ
・ベース1の管理を行なうものであり,データ・ベース
1からの文書ファイルの検索のみならず,文書ファイル
の登録,その他の処理を行なう。この管理システム2に
よる検索処理の詳細については後述する。
【0026】検索条件入力装置11は検索条件を入力する
ものであり,キーボード等により実現される。
【0027】検索条件には次のような態様がある。 1)1個のキーワードからなるもの。 2)複数のキーワードとそれらを結合する結合演算子と
からなるもの。 3)上記2)の検索条件においてキーワードにその重視
度を付加したもの。(上記1)のキーワードに重視度を
付加することもできる)
【0028】以下に,上記3)の検索条件に基づくデー
タ・ベース検索処理について詳述する。
【0029】入力される検索条件は上記3)の態様のも
のであり,たとえば,次のように表現される。
【0030】 「メモリ」AND「アメリカ」 1.0 0.8 …(1)
【0031】ここで,「メモリ」および「アメリカ」は
検索キーワードであり,ANDは結合演算子である。入
力キーワードの下に付されている数値「1.0 」および
「0.8」は対応する入力キーワードの重視度である。
【0032】結合演算子は入力キーワードの間の関係を
表わし,ANDの他にOR,MEAN(加重平均値の演
算を表わす)等を用いることができる。
【0033】重視度は,検索条件式(1) に含まれる各入
力キーワードについてその入力キーワードをどの程度重
要視するのかを表わす度合いである。重視度は0.0 〜1.
0 の範囲の数値で表わされる。
【0034】検索条件記憶装置12は,検索条件入力装置
11から入力される検索条件および後述する関連語展開さ
れた検索キーワードを記憶するものである。検索条件記
憶装置12に記憶されるデータの一例が図3に示されてい
る。
【0035】入力された検索条件は逆ポーランド記法で
記述される。逆ポーランド記法は,演算子が前,引数が
その演算の後に来るようなプリオーダ系列で記述する方
式である。結合演算子「AND」に続くカッコ内の数字
(2)は引数(入力キーワード)の個数を表わす。
【0036】関連語辞書14はハード・ディスク,ROM
等のメモリにより実現される。関連語辞書14には見出し
語毎に,この見出し語に関連のある関連語および見出し
語と関連語との関連の度合いを表わす関連度があらかじ
め登録されている。この関連語辞書14の一例が図4に示
されている。
【0037】入力装置11から入力され記憶装置12に記憶
された入力キーワードはキーワード読出装置13に与えら
れる。関連語読出装置13は,与えられた入力検索条件に
含まれる入力キーワードのそれぞれについて,関連語辞
書14を検索してその入力キーワードの関連語およびその
関連度をまず読出してキーワード選択装置15に与える。
たとえば入力キーワード「メモリ」の関連語は「コンピ
ュータ」,「記憶素子」および「CPU」であり,それ
らの関連度はそれぞれ「0.8 」,「0.7 」および「0.9
」である。
【0038】データ・ベース管理システム2に与えるこ
とのできるキーワード(これを検索キーワードという)
総数Nはあらかじめ定められている。
【0039】キーワード選択装置15は,入力キーワード
および関連語読出装置14によって読出されたそれらの関
連語の中からN個以下の検索キーワードを選択するもの
である。
【0040】図5はキーワード選択装置15における検索
キーワードの選択処理手順を示すフロー・チャートであ
る。この選択処理は,入力キーワードとともに検索キー
ワードを構成する関連語の数を,各入力キーワードの重
視度にしたがって総数Nの範囲内で分配するものであ
る。
【0041】データ・ベース管理システム2に与えるこ
とのできる検索キーワードの数Nが,検索条件入力装置
11からキーワード選択装置15に与えられる(ステップ10
1 )。
【0042】検索条件記憶装置12に記憶されている入力
検索条件に含まれる入力キーワード,重視度がキーワー
ド選択装置15に与えられる(ステップ102 )。
【0043】キーワード選択装置15は与えられた検索キ
ーワード数Nおよび入力検索条件に含まれる各入力キー
ワードiの重視度wi に基づいて各入力キーワードiに
配分される検索キーワード(入力キーワードとその関連
語からなる)の数ni を次式により決定する(ステップ
103 )。
【0044】 ni =(wi /Σwi )×N …(2)
【0045】原則的に端数は切捨てられる。端数を四捨
五入してもよいが,選択された検索キーワードの総数が
Nを超えた場合には超えた分を破棄する処理が必要とな
る。
【0046】各入力キーワードについて,関連語読出装
置13により読出された関連語の中から関連度の高い順に
(ni −1)個選択される(ステップ104 )。
【0047】選択された関連語は図2(B) および(C) に
示すように,対応する入力キーワードとともにその入力
キーワードとにポインタにより関連付けられて検索キー
ワードとして検索条件記憶装置12に記憶される(ステッ
プ105 )。入力キーワードの重視度および関連語の関連
度はキーワード係数として検索キーワードに付随して記
憶される。
【0048】ステップ103 〜105 の処理は入力検索条件
に含まれる全ての入力キーワードについて繰返し実行さ
れる(ステップ106 )。
【0049】たとえば,検索キーワードの数がN=7,
式(1) の検索条件に含まれる入力キーワード「メモリ」
および「アメリカ」の重視度はそれぞれ「1.0 」および
「0.8 」である。入力キーワード「メモリ」の検索キー
ワードの数は{1.0 /(1.0+0.8 )}×7=4とな
る。したがって,入力キーワード「メモリ」の関連語は
(4−1)=3個選択される。入力キーワード「メモ
リ」の関連語「コンピュータ」,「記憶素子」および
「CPU」は全て選択され,図3に示すように入力キー
ワードのポインタにより関連付けられて,検索キーワー
ドとして検索条件記憶装置12記憶される。このとき,検
索キーワード「メモリ」のキーワード係数は「1.0 」,
検索キーワード「コンピュータ」,「記憶素子」及び
「CPU」のキーワード係数は,そのキーワード関連度
となる。
【0050】また入力キーワード「アメリカ」の検索キ
ーワード数も,入力キーワード「メモリ」と同様に算出
すると,3となる。入力キーワード「アメリカ」の関連
語は,「米国」,「USA」および「日本」があり,検
索キーワード数は3だから,関連度の最も小さい関連語
「日本」は検索キーワードとして選択されない。入力キ
ーワード「アメリカ」,関連語「米国」および「US
A」が,入力キーワード「メモリ」の場合と同様に検索
条件記憶装置12に記憶される。
【0051】図6は,キーワード選択装置15における選
択処理の変形例を示すフロー・チャートである。この選
択処理は,検索キーワードを関連語の関連度に基づいて
キーワード数Nの範囲内で選択するものである。
【0052】データ・ベースに与えることのできる検索
キーワード数Nが検索条件入力装置11からキーワード選
択装置15に与えられる(ステップ101 )。
【0053】検索条件記憶装置12に記憶されている入力
検索条件に含まれる入力キーワードがキーワード選択装
置15に与えられる(ステップ107 )。
【0054】検索条件に含まれる全ての入力キーワード
について関連語読出装置13により関連語辞書14から関連
語が読出される(ステップ108 )。
【0055】読出した関連語の総数が入力された検索キ
ーワード数Nと比較し,検索キーワード数Nよりも関連
語の総数が大きいと,その関連語の中から関連語が関連
度の大きい順にN個選択される(ステップ109 ,110
)。
【0056】関連語の総数が検索キーワード数Nよりも
少ないと,所定の閾値α以上の関連度の関連語が選択さ
れる(ステップ111 )。
【0057】選択された関連語は対応する入力キーワー
ドとともにその入力キーワードごとにポインタにより関
連付けられて検索キーワードとして,その関連度はキー
ワード係数として検索条件記憶装置12に記憶される(ス
テップ112 )。
【0058】このようにして作成された検索キーワード
とそのキーワード係数および入力された結合演算子は,
データ・ベース検索条件作成装置16および合致度演算装
置18に与えられる。
【0059】データ・ベース検索条件作成装置16は,与
えられた検索キーワード,そのキーワード係数および結
合演算子に基づいてデータ・ベース管理システム2に入
力可能なフォーマットの検索条件(データ・ベース検索
条件)を作成して,作成したデータ・ベース検索条件を
データ・ベース管理システムに与える。このとき,入力
キーワードおよびその関連語は,結合演算子「OR」で
結合される。
【0060】とえば式(1) で示される入力検索条件のデ
ータ・ベース検索条件は次のようになる。 (「メモリ」OR「コンピュータ」OR「記憶素子」OR「CPU」) 1.0 0.75 0.9 0.7 AND(「アメリカ」OR「米国」OR「USA」) 1.0 1.0 1.0 …(3)
【0061】データ・ベース管理システム2は与えられ
たデータ・ベース検索条件に含まれる検索キーワードを
用いて,これらの検索キーワードのうちの少くとも1つ
を含む文書ファイルを探し出し,探し出したすべての文
書ファイルのファイル名とタイトルを検索結果記憶装置
17に与えてそこに記憶させる。
【0062】検索結果記憶装置17は,検索された文書フ
ァイルに関するデータを記憶するとともにこの文書ファ
イルを合致度演算装置18に与える。
【0063】合致度演算装置18は,検索条件記憶装置12
から与えられたデータ・ベース検索条件と,検索結果記
憶装置17から与えられた文書ファイルとの合致度を算出
する。
【0064】合致度は,検索された文書ファイルが入力
検索条件をどの程度満しているかを表わす度合いであ
り,0.0 〜1.0 の数値で表わされる。合致度が1.0 に近
い程検索条件をより多く満していることになる。
【0065】合致度の演算は,検索キーワード,キーワ
ード係数および入力キーワードの重視度を用いて検索条
件式に基づいて行なわれる。すなわち,図7に示すよう
に検索条件式(式(3) )の結合演算子ANDがMIN演
算に,結合演算子ORがMAX演算に,結合演算子ME
ANが加重平均にそれぞれ置きかえられ,各検索キーワ
ードについて検索キーワードと対応する入力キーワード
とのMIN演算が行なわれる。
【0066】図2に示されるファイル名AAA.TXT
の文書ファイルについての合致度は次のようにして算出
される。
【0067】文書ファイルには,検索キーワード「メモ
リ」および「アメリカ」,関連キーワード「コンピュー
タ」および「日本」が含まれており,関連キーワード
「記憶素子」,「CPU」,「米国」および「USA」
が含まれていない。したがって,関連キーワード「記憶
素子」,「CPU」,「米国」および「USA」の重視
度および関連度は,合致度演算には用いられない。
【0068】ファイル名AAA.TXTの文書ファイル
合致度は,検索条件式から次のようにして算出する。
【0069】合致度 =MIN[MAX{MIN(「メモリ」の関連度「メモ
リ」の重視度),MIN(「コンピュータ」の関連度,
「メモリ」の重視度)},MIN(「アメリカ」の関連
度,「アメリカ」の重視度)] =MIN[MAX{MIN(1.0 ,1.0 ),MIN(0.
75,1.0 )},MIN(1.0 ,0.8 )] =0.80
【0070】算出されたファイル名AAA.TXTの合
致度「0.8 」は,合致度演算装置18から検索結果記憶装
置17に与えられ,検索された文書ファイルとともに記憶
される。
【0071】検索結果記憶装置17に記憶される情報の一
例が示されている。検索結果記憶装置17には,データ・
ベース1から検索した文書ファイルのファイル名および
タイトルと,それについて算出された合致度とが記憶さ
れる。
【0072】検索された全ての文書ファイルについて合
致度が算出されると,合致度の大きい順に文書ファイル
のファイル名,タイトルおよび合致度が適当な出力装置
を通して出力される。これによりユーザは必要な文書フ
ァイルを容易に選択できる。
【0073】図9は,データ・ベース検索装置における
処理概要を示すフロー・チャートである。
【0074】入力検索条件が検索条件入力装置11から入
力され,検索条件記憶装置12に記憶される(ステップ12
1 )。
【0075】与えられた入力検索条件に含まれる入力キ
ーワードの関連語が,関連度とともに関連語辞書14から
関連語読出装置13により読出される(ステップ122 )。
【0076】読出した入力キーワードの関連語の中から
入力された検索キーワード数の数だけ関連語がキーワー
ド選択装置15により選択され,その選択した関連語は入
力キーワードとともにその入力キーワード毎にポインタ
により関連付けられて検索キーワードとしてその関連度
をキーワード係数として検索条件記憶装置12に記憶され
る(ステップ123 )。このとき,入力キーワードのキー
ワード係数は「1.0 」である。
【0077】入力検索条件および検索キーワードに基づ
いて,データ・ベース検索条件作成装置16によりデータ
・ベース検索条件が作成され,作成されたデータ・ベー
ス検索条件に応じてデータ・ベース管理システム21によ
りデータ・ベース1から文書ファイルが検索される(ス
テップ124 )。
【0078】検索された文書ファイルは,検索結果記憶
装置17に記憶されるとともに,検索条件および関連キー
ワードとその関連度に基づいて,検索された文書ファイ
ルの合致度が合致度演算装置18により算出され,検索結
果記憶装置17に記憶される(ステップ125 )。
【0079】検索された全ての文書ファイルについて,
合致度が算出されると,検索された文書ファイルについ
て合致度の算出が終了すると,検索された文書ファイル
およびこの合致度が出力される(ステップ126 ,127
)。
【0080】図10は,データ・ベース検索装置の変形例
を示すブロック図である。図1に示す装置と比較すると
分野名入力装置19が追加されているのみである。図10に
おいて,図1と同一物には同一符号を付し,説明を省略
する。
【0081】分野名入力装置13は検索の対象となる文書
の分野名を入力するものであり,キーボード等により実
現される。
【0082】分野名は,一定の考え方にしたがって文書
を分類したとき,その文書が属するグループを表わす。
標準的な分類に国際特許分類,国際図書10進分類等があ
る。
【0083】たとえば,分野名「計算機」が入力され
る。入力された分野名は関連語読出装置14に与えられ
る。分野名は必ずしも入力する必要はない。
【0084】関連語辞書14Aの一例が図11に示されてい
る。関連語辞書14Aには見出し語毎に,この見出し語に
関連のある関連語が記憶され,さらに各関連語につい
て,その関連語が属する分野と関連度とがあらかじめ登
録されている。
【0085】たとえば,見出し語「メモリ」に関しては
関連語「コンピュータ」,「記憶素子」,「CPU」お
よび「ダンピング」があり,そのうちの関連度「コンピ
ュータ」については分野名「一般」,「経済」および
「計算機」と,その分野名毎に関連度が登録されてい
る。一方,関連語「ダンピング」については分野名は
「経済」のみであり,その分野名と関連度が登録されて
いる。
【0086】関連語読出装置13Aは,検索条件記憶装置
12から与えられる検索条件に含まれる入力キーワードの
関連語を次のようにして読出す。
【0087】分野入力装置19から分野名が入力されてい
る場合には,各入力キーワードの関連語のうち入力され
た分野名をもつ関連語が選択され,その関連語と,その
関連語について入力された分野名の関連語とが読出され
る。これにより,入力された分野名に関する関連語とそ
の関連度を得ることができる。
【0088】たとえば,分野入力装置19から分野名「計
算機」が入力された場合,検索キーワード「メモリ」に
ついては,関連語辞書14Aから関連語「コンピュー
タ」,「記憶素子」および「CPU」とその関連度「0.
9 」,「1.0 」および「0.9 」が読出される。
【0089】一方,分野名が入力されていない場合に
は,分野名は「一般」として取扱われる。
【0090】他の処理は図1と同じである。
【0091】検索条件が1個のキーワードからなる場合
(上記1))についても,同様に行なわれる。
【0092】また検索条件に重視度が付加されない場合
(上記2))については,重視度を「1.0 」または適当
な値にして,合致度の演算が行なわれる。
【図面の簡単な説明】
【図1】データ・ベース検索装置の全体的構成を示すブ
ロック図である。
【図2】文書ファイルの一例を示す。
【図3】検索条件記憶装置に記憶されるデータの一例を
示す。
【図4】関連語辞書の一例を示す。
【図5】展開キーワード選択装置の処理手順を示すフロ
ー・チャートである。
【図6】展開キーワードと選択装置の変形例を示すフロ
ー・チャートである。
【図7】結合演算子の演算方式の一例を示す。
【図8】検索結果記憶装置に記憶されるデータの一例を
示す。
【図9】データ・ベース検索装置の処理概要を示すフロ
ー・チャートである。
【図10】データ・ベース検索装置の変形例を示すブロ
ック図である。
【図11】関連語辞書の一例を示す。
【符号の説明】
1 データ・ベース 2 データ・ベース管理システム 11 検索条件入力装置 12 検索条件記憶装置 13,13A 関連語読出装置 14,14A 関連語辞書 15 キーワード選択装置 16 データ・ベース検索条件作成装置 17 検索結果記憶装置 18 合致度演算装置 19 分野名入力装置

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 多数の文書情報を有するデータ・ベー
    ス,および所与のデータ・ベース検索条件に基づいて上
    記データ・ベースの検索を行なうデータ・ベース管理シ
    ステムを備えたデータ・ベース・システムにおいて,見
    出し語ごとに,上記見出し語に関連する関連語,上記見
    出し語と上記関連語との関連する度合いを表わす関連度
    があらかじめ登録されている関連語辞書,結合演算子に
    よって結合された複数のキーワードと上記キーワードの
    重視度とからなる検索条件を入力するための検索条件入
    力手段,上記検索条件入力手段により入力されたキーワ
    ードに対応する関連語とその関連度を上記関連語辞書か
    ら読出す関連語読出手段,上記関連語読出手段により読
    出された関連語のうちデータ・ベース検索に用いるのに
    適したものを選択する選択手段,上記検索条件入力手段
    から入力されたキーワードおよび上記選択手段によって
    選択された関連語を検索キーワードとし,それらの重視
    度および関連度をキーワード係数として,上記検索条件
    入力手段から入力された結合演算子を用いてデータ・ベ
    ース検索条件を作成する手段,作成されたデータ・ベー
    ス検索条件を上記データ・ベース管理システムに与え,
    上記データ・ベース検索条件に応じて上記データ・ベー
    スから文書情報を検索させる検索手段,検索された文書
    情報と,上記データ・ベース検索条件との合致度を,上
    記結合演算子およびキーワード係数に基づいて算出する
    合致度演算手段,検索された文書情報に関するデータ
    と,上記合致度演算手段により算出された合致度とを対
    応させて記憶する検索結果記憶手段,を備えたデータ・
    ベース検索装置。
  2. 【請求項2】 上記検索条件入力手段は,上記データ・
    ベース管理システムに与える検索キーワード数を入力す
    るものであり,上記キーワード選択手段は,入力された
    キーワードの関連語数を,入力された検索キーワード数
    と上記キーワードの重視度とに基づいて配分し,上記関
    連語読出手段から読出した関連語の中から関連度の大き
    い順に上記関連語数の関連語を選択するものである,請
    求項1に記載のデータ・ベース検索装置。
  3. 【請求項3】 上記検索条件入力手段は,上記データ・
    ベース管理システムに与える検索キーワード数を入力す
    るものであり,上記キーワード選択手段は,関連語読出
    手段により読出された上記キーワードの関連語の総数が
    入力された検索キーワード数よりも大きい場合には,読
    出した関連語の中から関連度の大きい順に上記検索キー
    ワード数の関連語を選択し,読出された上記キーワード
    の関連語の総数が上記検索キーワード数よりも小さい場
    合には,所定値以上の関連度の関連語を選択するもので
    ある,請求項1に記載のデータ・ベース検索装置。
  4. 【請求項4】 多数の文書情報を有するデータ・ベー
    ス,および所与のデータ・ベース検索条件に基づいて上
    記データ・ベースの検索を行なうデータ・ベース管理シ
    ステムを備えたデータ・ベース・システムを設け,見出
    し語ごとに,上記見出し語に関連する関連語,上記見出
    し語と上記関連語との関連する度合いを表わす関連度を
    関連語辞書にあらかじめ登録しておき,結合演算子によ
    って結合された複数のキーワードと上記キーワードの重
    視度とからなる検索条件を受付け,入力されたキーワー
    ドに対応する関連語とその関連度を上記関連語辞書から
    読出し,読出された関連語のうちデータ・ベース検索に
    用いるのに適したものを選択し,入力されたキーワード
    および選択された関連語を検索キーワードとし,それら
    の重視度および関連度をキーワード係数として,入力さ
    れた結合演算子を用いてデータ・ベース検索手段を作成
    し,作成されたデータ・ベース検索条件を上記データ・
    ベース管理システムに与え,上記データ・ベース検索条
    件に応じて上記データ・ベースから文書情報を検索し,
    検索された文書情報と,上記データ・ベース検索条件と
    の合致度を,上記結合演算子およびキーワード係数に基
    づいて算出し,検索された文書情報に関するデータと,
    算出された合致度とを対応させて記憶する,データ・ベ
    ース検索方法。
  5. 【請求項5】 上記データ・ベース管理システムに与え
    る検索キーワード数を受付け,入力されたキーワードの
    関連語数を,入力された検索キーワード数と上記キーワ
    ードの重視度とに基づいて配分し,読出した関連語の中
    から関連度の大きい順に上記関連語数の関連語を選択す
    る,請求項4に記載のデータ・ベース検索方法。
  6. 【請求項6】 上記データ・ベース管理システムに与え
    る検索キーワード数を受付け,読出された上記キーワー
    ドの関連語の総数が入力された検索キーワード数よりも
    大きい場合には,読出した関連語の中から関連度の大き
    い順に上記検索キーワード数の関連語を選択し,読出し
    た上記キーワードの関連語の総数が上記検索キーワード
    数よりも小さい場合には,所定値以上の関連度の関連語
    を選択する,請求項4に記載のデータ・ベース検索方
    法。
  7. 【請求項7】 多数の文書情報を有するデータ・ベー
    ス,および所与のデータ・ベース検索条件に基づいて上
    記データ・ベースの検索を行なうデータ・ベース管理シ
    ステムを備えたデータ・ベース・システムにおいて,見
    出し語ごとに,上記見出し語に関連する関連語があらか
    じめ登録されかつ,上記見出し語と上記関連語との関連
    する度合いを表わす関連度が分野名とともにあらかじめ
    登録されている関連語辞書,結合演算子によって結合さ
    れた複数のキーワードと上記キーワードの重視度とから
    なる検索条件を入力するための検索条件入力手段,分野
    名を入力する分野名入力手段,上記検索条件入力手段に
    より入力されたキーワードに対応する関連語とその関連
    度を,分野名入力手段により入力された分野名に応じ
    て,上記関連語辞書から読出す関連語読出手段,上記関
    連語読出手段により読出された関連語のうちデータ・ベ
    ース検索に用いるのに適したものを選択する選択手段,
    上記検索条件入力手段から入力されたキーワードおよび
    上記選択手段によって選択された関連語を検索キーワー
    ドとし,それらの重視度および関連度をキーワード係数
    として,上記検索条件入力手段から入力された結合演算
    子を用いてデータ・ベース検索条件を作成する手段,作
    成されたデータ・ベース検索条件を上記データ・ベース
    管理システムに与え,上記データ・ベース検索条件に応
    じて上記データ・ベースから文書情報を検索させる検索
    手段,検索された文書情報と,上記データ・ベース検索
    条件との合致度を,上記結合演算子およびキーワード係
    数に基づいて算出する合致度演算手段,検索された文書
    情報に関するデータと,上記合致度演算手段により算出
    された合致度とを対応させて記憶する検索結果記憶手
    段,を備えたデータ・ベース検索装置。
  8. 【請求項8】 上記検索条件入力手段は,上記データ・
    ベース管理システムに与える検索キーワード数を入力す
    るものであり,上記キーワード選択手段は,入力された
    キーワードの関連語数を,入力された検索キーワード数
    と上記キーワードの重視度とに基づいて配分し,上記関
    連語読出手段から読出した関連語の中から関連度の大き
    い順に上記関連語数の関連語を選択するものである,請
    求項7に記載のデータ・ベース検索装置。
  9. 【請求項9】 上記検索条件入力手段は,上記データ・
    ベース管理システムに与える検索キーワード数を入力す
    るものであり,上記キーワード選択手段は,関連語読出
    手段により読出された上記キーワードの関連語の総数が
    入力された検索キーワード数よりも大きい場合には,読
    出した関連語の中から関連度の大きい順に上記検索キー
    ワード数の関連語を選択し,読出された上記キーワード
    の関連語の総数が上記検索キーワード数よりも小さい場
    合には,所定値以上の関連度の関連語を選択するもので
    ある,請求項7に記載のデータ・ベース検索装置。
  10. 【請求項10】 多数の文書情報を有するデータ・ベー
    ス,および所与のデータ・ベース検索条件に基づいて上
    記データ・ベースの検索を行なうデータ・ベース管理シ
    ステムを備えたデータ・ベース・システムを設け,見出
    し語ごとに,上記見出し語に関連する関連語があらかじ
    め登録されかつ,上記見出し語と上記関連語との関連す
    る度合いを表わす関連度が分野名とともに関連語辞書に
    あらかじめ登録しておき,結合演算子によって結合され
    た複数のキーワードと上記キーワードの重視度とからな
    る検索条件を受付け,分野名を受付け,入力されたキー
    ワードに対応する関連語とその関連度を,入力された分
    野名に応じて上記関連語辞書から読出し,読出された関
    連語のうちデータ・ベース検索に用いるのに適したもの
    を選択し,入力されたキーワードおよび選択された関連
    語を検索キーワードとし,それらの重視度および関連度
    をキーワード係数として,入力された結合演算子を用い
    てデータ・ベース検索手段を作成し,作成されたデータ
    ・ベース検索条件を上記データ・ベース管理システムに
    与え,上記データ・ベース検索条件に応じて上記データ
    ・ベースから文書情報を検索し,検索された文書情報
    と,上記データ・ベース検索条件との合致度を,上記結
    合演算子およびキーワード係数に基づいて算出し,検索
    された文書情報に関するデータと,算出された合致度と
    を対応させて記憶する,データ・ベース検索方法。
  11. 【請求項11】 上記データ・ベース管理システムに与
    える検索キーワード数を受付け,読出された上記キーワ
    ードの関連語の総数が入力された検索キーワード数より
    も大きい場合には,読出した関連語の中から関連度の大
    きい順に上記検索キーワード数の関連語を選択し,読出
    した上記キーワードの関連語の総数が上記検索キーワー
    ド数よりも小さい場合には,所定値以上の関連度の関連
    語を選択する,請求項10に記載のデータ・ベース検索
    方法。
  12. 【請求項12】 上記データ・ベース管理システムに与
    える検索キーワード数を受付け,入力されたキーワード
    の関連語数を,入力された検索キーワード数と上記キー
    ワードの重視度とに基づいて配分し,読出した関連語の
    中から関連度の大きい順に上記関連語数の関連語を選択
    する,請求項10に記載のデータ・ベース検索方法。
JP06342293A 1993-02-27 1993-02-27 データ・ベース検索装置および方法 Expired - Fee Related JP3418876B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06342293A JP3418876B2 (ja) 1993-02-27 1993-02-27 データ・ベース検索装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06342293A JP3418876B2 (ja) 1993-02-27 1993-02-27 データ・ベース検索装置および方法

Publications (2)

Publication Number Publication Date
JPH06251076A true JPH06251076A (ja) 1994-09-09
JP3418876B2 JP3418876B2 (ja) 2003-06-23

Family

ID=13228842

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06342293A Expired - Fee Related JP3418876B2 (ja) 1993-02-27 1993-02-27 データ・ベース検索装置および方法

Country Status (1)

Country Link
JP (1) JP3418876B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10105577A (ja) * 1996-08-28 1998-04-24 Philips Electron Nv 情報項目選択方法および選択系
JPH10105571A (ja) * 1996-10-02 1998-04-24 Hitachi Ltd 検索システム
JPH11345249A (ja) * 1998-05-20 1999-12-14 Sharp Corp 情報検索のための方法および装置ならびに記憶媒体
JP2002366567A (ja) * 2001-06-13 2002-12-20 Hitachi Ltd 代替キーワードのフリー設定による検索システム
JP2006146586A (ja) * 2004-11-19 2006-06-08 Pioneer Electronic Corp 検索データベース作成装置、情報検索装置および情報検索システム
JP2011085986A (ja) * 2009-10-13 2011-04-28 Nippon Telegr & Teleph Corp <Ntt> テキスト要約方法、その装置およびプログラム
US8392949B2 (en) 2000-05-29 2013-03-05 Sony Corporation Electronic-program-guide retrieval method and electronic-program-guide retrieval system

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04135278A (ja) * 1990-09-27 1992-05-08 Ricoh Co Ltd 文書検索装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04135278A (ja) * 1990-09-27 1992-05-08 Ricoh Co Ltd 文書検索装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10105577A (ja) * 1996-08-28 1998-04-24 Philips Electron Nv 情報項目選択方法および選択系
JPH10105571A (ja) * 1996-10-02 1998-04-24 Hitachi Ltd 検索システム
JPH11345249A (ja) * 1998-05-20 1999-12-14 Sharp Corp 情報検索のための方法および装置ならびに記憶媒体
US8392949B2 (en) 2000-05-29 2013-03-05 Sony Corporation Electronic-program-guide retrieval method and electronic-program-guide retrieval system
JP2002366567A (ja) * 2001-06-13 2002-12-20 Hitachi Ltd 代替キーワードのフリー設定による検索システム
JP4617608B2 (ja) * 2001-06-13 2011-01-26 株式会社日立製作所 代替キーワードのフリー設定による検索システム
JP2006146586A (ja) * 2004-11-19 2006-06-08 Pioneer Electronic Corp 検索データベース作成装置、情報検索装置および情報検索システム
JP2011085986A (ja) * 2009-10-13 2011-04-28 Nippon Telegr & Teleph Corp <Ntt> テキスト要約方法、その装置およびプログラム

Also Published As

Publication number Publication date
JP3418876B2 (ja) 2003-06-23

Similar Documents

Publication Publication Date Title
US5404514A (en) Method of indexing and retrieval of electronically-stored documents
US5893094A (en) Method and apparatus using run length encoding to evaluate a database
US6681222B2 (en) Unified database and text retrieval system
US5960449A (en) Database system shared by multiple client apparatuses, data renewal method, and application to character processors
JPH10240759A (ja) 検索装置
JP2751793B2 (ja) 情報検索システム
JP3418876B2 (ja) データ・ベース検索装置および方法
US5008818A (en) Method and apparatus for reconstructing a token from a token fragment
JPH09231231A (ja) データ検索装置
JP3470782B2 (ja) 情報検索装置
JP2604587B2 (ja) 情報検索装置
JPH07146878A (ja) 情報検索装置
JP3275813B2 (ja) 文書検索装置、方法及び記録媒体
JPH08320879A (ja) 適合フィードバック装置
JP3578045B2 (ja) 全文検索方法及び装置及び全文検索プログラムを格納した記憶媒体
JPH05250411A (ja) 検索条件式作成装置
JP3019286B2 (ja) 文書検索装置
JP2003345824A (ja) 文書検索装置及び文書検索方法、文書検索プログラム
JPH03189870A (ja) データベースのマッチング方法
JP2000250921A (ja) データベースの管理方法およびシステム
RU2266560C1 (ru) Способ поиска информации в политематических массивах неструктурированных текстов
JPH05204978A (ja) 情報検索装置
JPH1125117A (ja) 語検索装置
JP2715981B2 (ja) 検索結果評価装置
JP2001142887A (ja) 文書検索方法および文書検索装置およびプログラム記録媒体

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100418

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees