JPH021059A - 連想検索システム - Google Patents

連想検索システム

Info

Publication number
JPH021059A
JPH021059A JP63141262A JP14126288A JPH021059A JP H021059 A JPH021059 A JP H021059A JP 63141262 A JP63141262 A JP 63141262A JP 14126288 A JP14126288 A JP 14126288A JP H021059 A JPH021059 A JP H021059A
Authority
JP
Japan
Prior art keywords
keyword
search
associative
degree
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63141262A
Other languages
English (en)
Inventor
Hajime Hashimoto
肇 橋本
Takeshi Hattori
服部 雄
Yukio Akase
赤瀬 幸夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP63141262A priority Critical patent/JPH021059A/ja
Publication of JPH021059A publication Critical patent/JPH021059A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、連想検索システムに関し、特に、所望情報を
得る情報検索を行う場合に、入力したキーワードから連
想される連想キーワードにより検索を行い、いわゆる知
的な情報検索が行える連想検索システムに関するもので
ある。このような連想検索システムは、エキスパートシ
ステム等に用いて好適な技術である。
〔従来の技術〕
従来、所望情報を得るための情報検索は、通常の場合、
キーワード検索法によって行われることが多い。キーワ
ード検索法はキーワードとなる索引語により検索を行う
方法である。キーワード検索法に関しては1例えば、高
橋・成田・坂本著。
「情報検索の手法と機器」、南江堂、 1969年、第
230頁から第262頁において論じられている。
また、キーワード検索を行う専用マシンの例として、キ
ーワード付けされた資料データベースを対象としたキー
ワード検索を高速に行う専用マシンのキーワード検索マ
シンの試作例が、第31回全国大会講演文集、情報処理
学会、第637頁〜第638頁に記載されている。
〔発明が解決しようとする課題〕
ところで、上記のようなキーワード検索法およびキーワ
ード検索マシンにおいては、 (1)利用者から指定されるキーワードが、検索対象に
付与されているキーワードと間接的に関与している場合
、 (2)キーワードが検索対象に対して、設定できるか設
定できないかの2値の設定条件しか許されず、設定でき
ない場合、 についての配慮がなされていない、このため、利用者が
所望の情報を確実に得るためには、(1)自分が検索し
たい検索対象に付与されているキーワードを正確に指定
しなければならない。
(2)大量に検索された出力結果から自分の検索したい
検索対象を、別に手作業で見出さなければならない。
という問題があったゆ 本発明は、上記問題点を解決するためになされたもので
ある。
本発明の目的は、利用者が、所望する情報を得るための
検索に十分なキーワードを指定しなかまた場合にも、検
索システムが、指定されたキーワードから関連するキー
ワードを連想して、広く検索対象を得ると共に、キーワ
ードと関連の強いものから順に高速に検索結果を示すこ
とができる連想検索システムを提供することにある。
本発明の前記ならびにその他の目的と新規な特徴は、本
明細書の記述及び添付図面によって明らかになるであろ
う。
〔課題を解決するための手段〕
上記目的を達成するため、本発明においては、入力キー
ワードに対して連想される連想キーワードを生成すると
共に、生成した連想キーワードと入力キーワードとの関
連の強さを表わす確実度情報を生成するキーワード連想
ユニットと、連想キーワードと検索対象に対する重み付
けを表わす関係度情報により連想キーワードに対して検
索対象の関連の強さを示す関連度を算出する関連度計算
ユニットとを備え、入力された入力キーワードからキー
ワード連想ユニットにより連想キーワードを生成し、生
成した連想キーワードにより検索を行い、関連度ユニッ
トで算出した関連度にしたがい検索結果情報を出力する
ことを特徴とする。
〔作用〕
前記手段によれば、連想検索システムには、キーワード
連想ユニットと、関連度計算ユニットとが備えられる。
そして、キーワード連想ユニットにより入力された入力
キーワードから連想キーワードを生成し、生成した連想
キーワードで検索を行い、関連度ユニットにより算出し
た関連度にしたがい検索結果情報を出力する。
キーワード連想ユニットは、入力キーワードに対して連
想される連想キーワードを生成すると共に、生成した連
想キーワードと入力キーワードとの関連の強さを表わす
確実度情報を生成する。この連想キーワードと確実度情
報を受けて、関連度計算ユニットは、連想キーワードと
検索対象に対する重み付けを表わす関係度情報により連
想キーワードに対して検索対象の関連の強さを示す関連
度を算出する。
これにより、利用者が、所望する情報を得るための検索
に十分なキーワードを指定しなかった場合にも、検索シ
ステムは入力されたキーワードから関連する連想キーワ
ードを生成して、広く検索の対象を得る検索を行う。得
られた結果の検索対象は、入力キーワードと関連の強い
ものから順に検索結果が出力される。
このように、キーワード連想ユニットは、利用者が入力
したキーワードに対して関連する連想キーワードを重み
付きで連想し検索範囲を広げるので、利用者が不十分で
不適切なキーワードを指定した場合でも、キーワードを
連想して知的な検索を行い、検索もれを防止することが
できる。関連度計算ユニットは、関連度を算出する場合
、検索対象ごとに処理するので、並列処理が可能で検索
処理が高速化される。また、キーワードに対する検索対
象の適合度が関連度として算出され、関連度にしたがっ
て検索結果が出力されて、検索対象の絞り込みを行うの
で、大量の検索対象が出力されるような結果になっても
、検索対象の結果の中から所望の検索結果を効率良く見
い出すことができ検索効率が向上する。
このような連想検索を他のシステムに応用する場合でも
、キーワード検索ユニットと関連度計算ユニットは、単
純なデータパターンの更新と単一な加算と乗算との処理
機構ですむため、マイクロプロセッサ、ハードロジック
により実現することが可能である。
〔実施例〕
以下、本発明の一実施例を図面を用いて具体的に説明す
る。
第1図は、本発明の一実施例にかかる連想検索システム
の構成を示すブロック図である。第1図において、1は
制御装置、2は検索装置、3は入出力装置である。また
、4は関連度計算ユニット、5はキーワード連想ユニッ
トである。6はキーワード変換部、7はキーワード振分
部、8は変換情報記憶部、9は検索対象記憶部、10は
関連度計算結果マージ部、11はソート部、12は検索
結果取出部、13はキーワード連想部、14はキーワー
ド関連情報記憶部、15は関連度計算処理部、16はキ
ーワード検索対象情報記憶部、17はキーワード入力部
、18は検索結果表示部、19は登録更新データ入力部
、20は登録更新処理部、21はキーワード記憶部であ
る。
連想検索システムは、制御装置1.検索装置2゜および
入出力装置3から構成される。制御装置1は、キーワー
ド変換部6.キーワード振分部7゜変換情報記憶部8.
検索対象記憶部9.関連度計算結果マージ部10.ソー
ト部11.検索結果取出部12、登録更新処理部20.
およびキーワード記憶部21から構成される。また、検
索装置2は、キーワード連想ユニット5と関連度計算ユ
ニット4から構成される。キーワード連想ユニット5は
キーワード連想部13とキーワード関連情報記憶部14
から構成される。関連度計算ユニット4は関連度計算処
理部15とキーワード検索対象情報記憶部16から構成
される。入出力装置3は、キーワード入力部17、検索
結果表示部18.および登録更新データ入力部19から
構成されている。
第2図は、キーワード連想ユニットにおけるキーワード
関連情報記憶部を説明する図である。ここには、キーワ
ード連想ユニット5のキーワード関連情報記憶部14に
設けられるデータテーブルの例が示されている。第2図
のテーブルデータは、例えば、入力キーワードとしてk
ey3が指定されると、key3に対して連想される連
想キーワードとして、keylが確実度0.3で連想で
き、key2が確実度0.5で連想できることを意味し
ている。ここでいう確実度とは、キーワード間の関連の
強さを表わす主観的な値であり、確実に連想できる場合
を1とし、全く無関係の場合をOとして、[0〜1]の
範囲の値で設定する。
第3図は、関連度計算ユニットのキーワード検索対象情
報記憶部を説明する図である。ここには、関連度計算ユ
ニット4のキーワード検索対象情報記憶部16に設けら
れるデータテーブルの例が示されている。このデータテ
ーブルには、連想キーワードと検索対象obj 1〜o
bj Nとの間の関連度が設定される。第3図の最上段
部のデータの例は、連想キーワードとしてkeylが入
力された場合、検索対象obj 1が関連度0.5で関
連し、また、検索対象obj 3が関連度0.7で関連
していることを示している。この関連度も、第2図の確
実度と同様に主観的な値であり、[0〜1]の範囲の値
に設定されている。
関連度計算ユニット4は、第1図に示すように検索装置
に複数個設けられている。複数個設けられる関連度計算
ユニット4は、その設けられた数で、検索対象objl
〜objNを分割し1分割した範囲の検索対象に対して
、それぞれに関連度計算ユニット4が割り当てられ、関
連度を計算する。
次に、第1図を参照して具体的な連想検索システムの動
作例を説明する。
利用者が、検索対象データを登録または登録済データの
更新を行う場合、まず、登録更新データ入力部19から (1)検索対象データ(文献、事例など)の情報。
(2)入力キーワードと、連想キーワードおよび確実塵
(例えば第2図のkey 1−+key 3の0.7)
の情報、 (3)連想キーワードと検索対象及び関連度(例えば第
3図のkey 1→obj 1の0.5)の情報。
を入力する。
連想検索システムは、登録更新データ入力部19から入
力された上記の(1)〜(3)の情報を、登録更新処理
部20により各ユニットに分配する。(1)の情報は検
索対象記憶部9に格納し、(2)の情報はキーワード関
連情報記憶部14に格納し、また、(3)の情報はキー
ワード検索対象情報記憶部16に格納する。この場合、
(2)および(3)の情報は、第2図および第3図に示
すように、テーブル表現ができるので、登録更新処理部
20において、キーワードの番号付けを行い、キーワー
ド番号順にキーワードの文字列を変換情報記憶部8に格
納する。
また、検索対象obj 1〜obj Nも番号付けを行
い。
番号を付けた順に検索対象記憶部9へ検索対象のデータ
を格納する。関連度計算ユニット4は複数台設けられる
。設ける台数にしたがい、検索対象を所定数の件数で区
切って、関連度を並列して算出する。このため、検索対
象obj l〜obj Nの(3)の情報を分割(第3
図では縦に分割)し、各々の関連度計算ユニット4のキ
ーワード検索対象情報記憶部16へ格納する。これによ
り、利用者が検索対象データの登録または登録済データ
の更新の処理が完了する 次に、この連想検索システムを用いて情報検索を実行す
る場合を説明する。この場合、利用者がキーワードをキ
ーワード入力部17から入力する。
キーワード入力部17で入力キーワードが得られると、
入力キーワードはキーワード記憶部21に記憶される6
次に、キーワード変換部6が、入力キーワードと登録さ
れたキーワードとの一致を取って変換情報記憶部8から
キーワード番号を求める。
得られたキーワード番号はキーワード連想ユニット5の
キーワード連想部13に入力される。キーワード連想ユ
ニット5のキーワード連想部13では、入力キーワード
に対応するキーワード番号から、キーワード関連情報記
憶部14のテーブルデータの情報を用いて、連想キーワ
ードを生成して、連想キーワードのキーワード番号と確
実塵のデータを出力する。第2図のテーブルデータの例
においては、入力された入力済のキーワードに対し、図
の横方向に加算して確実塵を求める1例えば、入力キー
ワードとしてkey 1 、 key 2が指定された
場合、コンバイン関数 Fcomb(cf、 、 cf、)=cf、 +cf、
−cf1X cfまただし、確実度:cf工%Cf2t cfx t cf、≧0 を用いて、連想キーワードkey 3の確実塵は、Fc
omb(0,5,0,7)==0.5+0.7−0.5
X0.7=0.85 として求める。
次に、キーワード振分部7において、キーワード連想部
13からの出力結果である連想キーワードのキーワード
番号と確実塵を、複数個の関連度計算ユニット4に同時
に転送する。これにより、複数個の関連度計算ユニット
4は1割当てられているそれぞれの検索対象に対して関
連度の計算を並行して処理し、関連度を算出する。この
ように関連度計算を並行処理できるので検索の処理速度
を上げることができる。関連度計算ユニット4では、関
連度計算処理部15が、連想キーワードのキーワード番
号と確実塵およびキーワード検索対象端軸記憶部1日の
テーブルデータの情報を用いて、キーワードと検索対象
の関連付けられる関連度を算出する。第3図のテーブル
データの例では、確実塵が0以上のものについて、図の
縦方向に加算して関連度を算出する6例えば、第3図に
おいて、連想キーワードの確実塵がkeyl 、 ke
y2 、 key3に対して、それぞれ1,1.O40
の場合、検索対象obj 3の関連度は、コンバイン関
数F、確実度GF (a、b) = a + b −a
 X b 。
G (c、cf) = c Xcf ただし、関連度: a、 be G 確実塵:cf を用いて、 0.7+0.85X0.1−0,7X0.85X0.1
=0.7255として求める。
関連度計算結果マージ部10は、複数個の関連度計算ユ
ニット4から、出力結果である検索対象番号と関連度を
受け、その結果を統合する。全ての関連度計算ユニット
4から結果が得られて、同期がとれた時点において、ソ
ート部11が関連度計算結果マージ部10で統合された
結果により、関連度順に検索対象番号を並び換える。ソ
ート部11で並び換えられた結果出力は検索結果取出部
12に供給される。検索結果取出部12は、ソート部1
1から得た検索対象番号に対応する検索対象データを検
索対象記憶部9から読込み、検索対象データの編集を行
い、検索結果表示部18により、利用者に対して検索結
果を、入力された入力キーワードと関連が高い関連度の
高い順から表示する。
以上、説明したように、本実施例によれば、入力される
キーワードの連想キーワードにより、検索が行われるの
で、例えば、同義語、関連語の入力漏れによる検索漏れ
が生ずることはない。また、キーワードと検索対象の関
連付けにより、関連度が大きな検索結果から出力するの
で、大量の検索結果の出力結果から、目的とする検索対
象を効率よく見つけ出すことができる。
以上、本発明を実施例にもとづき具体的に説明した孤本
発明は、前記実施例に限定されるものではなく、その要
旨を逸脱しない範囲において種々変更可能であることは
言うまでもない。
〔発明の効果〕
以上、説明したように、本発明によれば、利用者が指定
した入力キーワードからシステムが関連度の高い連想キ
ーワードを連想して、連想キーワードによ、り検索を行
うので、確実に検索結果が得られ、検索もれを防ぐこと
ができる。また、検索対象がキーワードに関連する度合
を数値として算出することができるので、検索効率を向
上させることができる。
【図面の簡単な説明】
第1図は、本発明の一実施例にかかる連想検索システム
の構成を示すブロック図、 第2図は、キーワード連想ユニットのキーワード関連情
報記憶部を説明する図、 第3図は、関連度計算ユニットのキーワード検索対象情
報記憶部を説明する図である。 図中、1・・・制御装置、2・・・検索装置、3・・・
入出力装置、4・・・関連度計算ユニット、5・・・キ
ーワード連想ユニット、6・・・キーワード変換部、7
・・・キーワード振分部、13・・・キーワード連想部
、14・・・キーワード関連情報記憶部、15・・・関
連度計算処理部、16・・・キーワード検索対象情報記
憶部、20・・・登録更新処理部、21・・・キーワー
ド記憶部。 箋1図

Claims (1)

    【特許請求の範囲】
  1. 1、入力キーワードに対して連想される連想キーワード
    を生成すると共に、生成した連想キーワードと入力キー
    ワードとの関連の強さを表わす確実度情報を生成するキ
    ーワード連想ユニットと、連想キーワードと検索対象に
    対する重み付けを表わす関係度情報により連想キーワー
    ドに対して検索対象の関連の強さを示す関連度を算出す
    る関連度計算ユニットとを備え、入力された入力キーワ
    ードからキーワード連想ユニットにより連想キーワード
    を生成し、生成した連想キーワードにより検索を行い、
    関連度ユニットで算出した関連度にしたがい検索結果情
    報を出力することを特徴とする連想検索システム。
JP63141262A 1988-06-07 1988-06-07 連想検索システム Pending JPH021059A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63141262A JPH021059A (ja) 1988-06-07 1988-06-07 連想検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63141262A JPH021059A (ja) 1988-06-07 1988-06-07 連想検索システム

Publications (1)

Publication Number Publication Date
JPH021059A true JPH021059A (ja) 1990-01-05

Family

ID=15287812

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63141262A Pending JPH021059A (ja) 1988-06-07 1988-06-07 連想検索システム

Country Status (1)

Country Link
JP (1) JPH021059A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0496177A (ja) * 1990-08-08 1992-03-27 Ricoh Co Ltd 文書検索方法及びそのキーワード関連度表作成装置
JPH04262460A (ja) * 1991-02-15 1992-09-17 Ricoh Co Ltd 情報検索装置
JPH0589176A (ja) * 1991-09-25 1993-04-09 Dainippon Printing Co Ltd 画像検索装置
JPH05181719A (ja) * 1991-12-27 1993-07-23 Nippon Steel Corp 可変長データの格納および参照システム
JPH0736689A (ja) * 1993-07-20 1995-02-07 Nec Corp マイクロプログラムのパッチ支援装置
US5537132A (en) * 1990-03-30 1996-07-16 Hitachi, Ltd. Method of information reference for hypermedia
JPH09231237A (ja) * 1996-02-28 1997-09-05 Nippon Telegr & Teleph Corp <Ntt> 情報検索方法及び装置
JPH10198682A (ja) * 1996-12-28 1998-07-31 Nec Corp データベース検索装置およびデータベース登録装置
JPH11312115A (ja) * 1999-03-19 1999-11-09 Nec Corp デ―タベ―ス登録装置
JPH11328221A (ja) * 1998-05-14 1999-11-30 Nippon Telegr & Teleph Corp <Ntt> データ検索方法、その装置および記録媒体
JP2007164285A (ja) * 2005-12-09 2007-06-28 Fuji Xerox Co Ltd 情報処理システムおよび情報処理方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5537132A (en) * 1990-03-30 1996-07-16 Hitachi, Ltd. Method of information reference for hypermedia
JPH0496177A (ja) * 1990-08-08 1992-03-27 Ricoh Co Ltd 文書検索方法及びそのキーワード関連度表作成装置
JPH04262460A (ja) * 1991-02-15 1992-09-17 Ricoh Co Ltd 情報検索装置
JPH0589176A (ja) * 1991-09-25 1993-04-09 Dainippon Printing Co Ltd 画像検索装置
JPH05181719A (ja) * 1991-12-27 1993-07-23 Nippon Steel Corp 可変長データの格納および参照システム
JPH0736689A (ja) * 1993-07-20 1995-02-07 Nec Corp マイクロプログラムのパッチ支援装置
JPH09231237A (ja) * 1996-02-28 1997-09-05 Nippon Telegr & Teleph Corp <Ntt> 情報検索方法及び装置
JPH10198682A (ja) * 1996-12-28 1998-07-31 Nec Corp データベース検索装置およびデータベース登録装置
JPH11328221A (ja) * 1998-05-14 1999-11-30 Nippon Telegr & Teleph Corp <Ntt> データ検索方法、その装置および記録媒体
JPH11312115A (ja) * 1999-03-19 1999-11-09 Nec Corp デ―タベ―ス登録装置
JP2007164285A (ja) * 2005-12-09 2007-06-28 Fuji Xerox Co Ltd 情報処理システムおよび情報処理方法

Similar Documents

Publication Publication Date Title
US7080091B2 (en) Inverted index system and method for numeric attributes
KR100295354B1 (ko) 문서 정보 검색 시스템
US7062499B2 (en) Enhanced multiway radix tree and related methods
JPH11120203A (ja) データベースを合併する方法およびデータベースからドキュメントを検索する装置
JPH11212980A (ja) インデクス作成方法および検索方法
JPH021059A (ja) 連想検索システム
CN107209768A (zh) 用于数据集的可扩展排序的方法和设备
JP2001331509A (ja) リレーショナルデータベース処理装置、リレーショナルデータベースの処理方法及びリレーショナルデータベースの処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH05151253A (ja) 文書検索装置
JP2000132560A (ja) 中国語テレテキスト処理方法及び装置
JP4888677B2 (ja) 文書検索システム
CN114595319A (zh) 对搜索内容的搜索结果进行排序的方法
JP2735866B2 (ja) データベースのデータ検索方法
JPH01149127A (ja) 情報検索装置
JPH08329101A (ja) データベースシステム
JPH07210565A (ja) 情報検索方法及び装置
CN112100399B (zh) 基于知识体系的知识图谱模型的创建方法及图谱检索方法
JP3061486B2 (ja) データソート処理システム
JPH0584937B2 (ja)
JPH04337867A (ja) データベース検索システム
JPH01219927A (ja) データベースの情報検索方式
Parsaeian et al. Local Sequence Alignment with a Parallel Hash based Model
JPH05313971A (ja) リレーショナル・データベースにおけるキーワード管理方式
JPH04182828A (ja) 擬似乱数によるテーブル内エントリー選択方式
JPH03123973A (ja) 文書検索方法