JPH07249045A - 情報検索方法および情報検索装置 - Google Patents

情報検索方法および情報検索装置

Info

Publication number
JPH07249045A
JPH07249045A JP6064484A JP6448494A JPH07249045A JP H07249045 A JPH07249045 A JP H07249045A JP 6064484 A JP6064484 A JP 6064484A JP 6448494 A JP6448494 A JP 6448494A JP H07249045 A JPH07249045 A JP H07249045A
Authority
JP
Japan
Prior art keywords
keyword
data
word
index
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6064484A
Other languages
English (en)
Inventor
Hiromi Haniyuda
博美 羽生田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP6064484A priority Critical patent/JPH07249045A/ja
Publication of JPH07249045A publication Critical patent/JPH07249045A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【構成】 索引51を作成する場合、先ず、被検索デー
タ10より、キーワード101を抽出する。次に、この
キーワード101と意味的に関係のある語集合102を
シソーラス40を用いて抽出する。次に、キーワード1
01と語集合102の各語句と、キーワード101が被
検索データ10中に存在する位置との関係を対応付ける
ための索引語を、キーワード101と語集合102とか
ら生成した重ね合わせ符号とする。任意のキーワード1
01で検索を行う場合は、そのキーワード101が含ま
れる重ね合わせ符号を索引語として、被検索データ10
を検索する。 【効果】 与えられたキーワードは含まないが、このキ
ーワードに関連する情報を検索する場合でも、短時間で
行うことができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、任意の語句をキーワー
ドとして検索する場合、そのキーワードに関連した情報
検索を行う情報検索方法および情報検索装置に関する。
【0002】
【従来の技術】キーワードに関連した情報検索を行う方
法として、例えば、特開平4−10062号に記載され
るものがある。この情報検索方法は、シソーラスを用い
たキーワード展開処理と、データベース検索処理とを組
み合わせたものであった。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来の情報検索方法は、与えられたキーワードを検索時に
展開し、展開された語一つ一つについてキーワード検索
をデータベースに対して行っていた。そのため、与えら
れたキーワードを展開するためには、シソーラスに何回
もアクセスする必要があると共に、与えられたキーワー
ドが複数の語に展開される場合、展開された語の数に比
例した回数のキーワード検索を行う必要がある。
【0004】従って、上記従来の情報検索方法では、与
えられたキーワードを含まないが、このキーワードに関
連する情報を検索する場合には、与えられたキーワード
を含む情報だけを検索する場合、即ち、キーワードを展
開せずに検索する場合に比較して、与えられたキーワー
ドを展開した結果得られる語の数に比例した検索時間が
必要であり、このような検索を行う場合でも、短い検索
時間で検索を実行することのできる情報検索方法の実現
が望まれていた。
【0005】
【課題を解決するための手段】本発明の情報検索方法お
よび情報検索装置は、前述の課題を解決するために、予
め、任意のキーワードに対して、シソーラスよりそのキ
ーワードと意味的な関係のある語集合を抽出し、キーワ
ードを含むこれら語集合から生成した重ね合わせ符号
と、被検索データ中のそれらのキーワードが存在する全
ての位置とを前記キーワード毎に対応付けた索引を作成
する。そして、任意の語句をキーワードとして検索を行
う場合は、作成した索引を使用して行うものである。
【0006】
【作用】本発明の情報検索方法および情報検索装置は、
先ず、被検索データからキーワードを抽出する。次に、
シソーラスを用い、抽出したキーワードと意味的な関係
のある語集合を抽出する。そして、これらキーワードお
よび語集合から生成した重ね合わせ符号と、キーワード
が被検索データ中に存在する位置とを対応付けた索引を
作成する。任意の語句をキーワードとして検索を行う場
合は、その語句に対応する索引を用い、被検索データを
検索する。従って、与えられたキーワードは含まない
が、そのキーワードに関連する情報を検索する場合も、
シソーラス等にアクセスする必要がない。
【0007】
【実施例】以下、本発明の実施例を図面を用いて詳細に
説明する。図1は本発明の情報検索方法を示す説明図で
ある。本発明の情報検索方法は、予め、任意のキーワー
ドに対して、シソーラスよりそのキーワードと意味的な
関係のある語集合を抽出し、キーワードを含むこれら語
集合から生成した重ね合わせ符号と被検索データ中の各
キーワードが存在する全ての位置とを対応付けた索引を
作成し、任意の語句をキーワードとして検索を行う場合
は、その作成した索引を使用して行うことを特徴とする
ものである。
【0008】従って、与えられたキーワードを含まない
が、このキーワードに関連する情報を検索する場合であ
っても、キーワードを展開せずに検索する場合と殆ど同
じ時間しかかからず、効率の良い検索を行うことができ
る。尚、図1のフローチャートについては、後述の情報
検索装置の動作で詳細に説明する。
【0009】次に、このような情報検索方法を実施する
ための情報検索装置を説明する。 《実施例1》図2は本発明の情報検索装置の実施例1を
示す構成図である。図の装置は、被検索データ10、キ
ーワード抽出部20、語彙拡張部30、シソーラス4
0、索引部50、検索部60からなる。
【0010】被検索データ10は、データベース中に格
納するファイルに相当するものであり、このファイル
は、例えば、文書や図書の書誌情報が文書や図書毎に一
まとまりのデータの集合となっている。キーワード抽出
部20は、被検索データ10よりキーワードを抽出する
もので、語彙拡張部30は、シソーラス40を用いて、
キーワード抽出部20で抽出されたキーワードから意味
的に関係のある語集合を取り出す機能を有している。ま
た、シソーラス40は、ある語句に対する上位概念語、
下位概念語、類義語、同義語、反義語といったその語句
に意味的な関係のある語句を示したものである。
【0011】索引部50は、キーワードを含む語集合か
ら生成した重ね合わせ符号と、被検索データ10中のそ
れらのキーワードが存在する全ての位置(例えば、この
場合は該当するデータが相当する)とを対応付けた索引
エントリを持った索引として備えたものである。尚、こ
の重ね合わせ符号については、後で詳述する。検索部6
0は、任意の語句をキーワードとして検索要求が発生し
た場合、索引部50より、そのキーワードに対応する索
引エントリを取り出し、この索引エントリを用いて被検
索データ10を検索する機能を有している。
【0012】次に、上記情報検索装置における語彙拡張
部30および索引部50の動作について説明する。図3
は、その動作を説明するための状態説明図である。先
ず、ここでは、キーワード抽出部20で抽出されたキー
ワード101を「ひと」とする。語彙拡張部30は、シ
ソーラス40より、このキーワード101と意味的な関
係のある語集合102を抽出する。即ち、「ひと」の類
義語102aとして「人間」「人類」、上位概念語10
2bとして「動物」「生物」、下位概念語102cとし
て「こども」「おとな」を抽出する。
【0013】次に索引部50は、これらキーワード10
1を含む語集合、即ちキーワード101および語集合1
02を符号化する。この符号は、例えば2進数で表現さ
れ、かつそのビット数が予め決められている。例えば、
キーワード101の符号111は「01000…」、下
位概念語102cにおける「おとな」の符号113は
「00010…」といったように各語句が2進数で符号
化されている。そして、各語句の符号111〜113を
ビット毎に論理和をとって重ね合わせ符号201を得
る。
【0014】また、索引部50は、複数の索引エントリ
51−1〜51−nを備え、これらの索引エントリで索
引51を構成している。任意の索引エントリ51−i
は、索引語フィールド51a−iとポインタフィールド
51b−iとからなるレコードで構成され、索引語フィ
ールド51a−iには重ね合わせ符号201が、ポイン
タフィールド51b−iには被検索データ10中の対応
する位置(該当データ301)を示すポインタ202が
それぞれ格納されている。
【0015】このため、キーワードに関係のある語をシ
ソーラスを用いて取り出す際の取り出し方、例えば関係
のある語をすべて取り出すか、あるいは一部分だけを取
り出すかによって、類義語102aや上位概念語102
bが含まれるそれぞれの該当データが同一の重ね合わせ
符号201で表される場合もあるため、重ね合わせ符号
201が等しい索引エントリ51−iは、複数存在する
こともある。
【0016】尚、被検索データ10における該当データ
301とは、キーワード101が存在する被検索データ
10中の位置に対応するものである。また、図3中、索
引部50における索引エントリ51−i以外の索引エン
トリ、および被検索データ10における該当データ30
1以外の該当データは図示省略している。
【0017】次に、図1を用いて、本発明の情報検索方
法を説明する。 1.キーワード抽出処理(ステップS11) キーワード抽出部20は、利用者あるいは応用プログラ
ムから入力された被検索データ10からキーワード10
1を抽出する。尚、このキーワード抽出処理では、複数
のキーワード101を抽出するが、以下の処理は、個々
のキーワード101に対して共通であるため、一つのキ
ーワード101に着目して説明する。
【0018】2.語彙拡張処理(ステップS12) 語彙拡張部30は、抽出されたキーワード101の語集
合102として、上位概念語、下位概念語、類義語、同
義語等をシソーラス40より抽出する。
【0019】3.符号化処理(ステップS13) 索引部50は、上述したように、キーワード101およ
び語集合102中の各語句を符号化し、得られた符号の
論理和演算を行って、重ね合わせ符号201を生成す
る。
【0020】4.データ格納処理(ステップS14) 索引部50は、上述した、重ね合わせ符号201とポイ
ンタ202とからなる索引51をデータベース70に格
納すると共に、被検索データ10を格納する。
【0021】次に、データベース70に格納された被検
索データ10の検索動作について、まず被検索データか
ら抽出されたキーワードを与えられて検索を行う場合に
ついて説明する。 1.キーワード入力処理(ステップS21) 利用者あるいは応用プログラムからキーワード101を
入力する。 2.キーワード符号化処理(ステップS22) 検索部60は、キーワード101を符号化して符号11
1を生成する。 3.データベース検索処理(ステップS23) 検索部60は、符号111を元に、索引51をサーチ
し、重ね合わせ符号201の索引語フィールド51a−
iにキーワード101の符号111が含まれるような索
引エントリ51−iを抽出し、この抽出されたエントリ
中のポインタ202をたどって被検索データ10中の該
当データ301を抽出する。そして、この該当データ3
01が検索結果となる。
【0022】ここで、重ね合わせ符号201に符号11
1が含まれるとは、任意の索引エントリ51−iの重ね
合わせ符号をSCW、サーチを行うための符号をCW、
ビット毎にSCWとCWとの論理和をつくることで得ら
れた符号をWとした場合、SCWとWとが一致すること
を意味する。
【0023】次に、被検索データ10から抽出されたキ
ーワード以外の語をキーワードとして与えられた場合の
検索動作について説明する。 1.キーワード入力処理(ステップS21) 利用者あるいは応用プログラムからキーワードとして語
102a−1を入力する(以下、キーワード102a−
1と呼ぶ)。 2.キーワード符号化処理(ステップS22) 検索部60は、キーワード102a−1を符号化して符
号112を生成する。 3.データベース検索処理(ステップS23) 検索部60は、符号112を元に、索引51をサーチ
し、重ね合わせ符号201の索引語フィールド51a−
iにキーワード102a−1の符号112が含まれるよ
うな索引エントリ51−iを抽出し、この抽出されたエ
ントリ中のポインタ202をたどって被検索データ10
中の該当データ301を抽出する。そして、この該当デ
ータ301が検索結果となる。
【0024】従って、あるキーワード101を与えられ
て検索を行った場合の検索結果には、このキーワード1
01を含むデータが含まれる。また、あるキーワード1
02a−1を与えられて検索を行った場合の検索結果に
は、シソーラス40から語を抽出する際に用いたキーワ
ード101を含むデータが含まれる。即ち、任意の語句
をキーワードとして与えられて検索を行った場合の検索
結果には、この語句を含むデータ、あるいは語彙拡張処
理によってこの語句が抽出されるようなキーワードを含
むデータである。また、このような情報検索方法におけ
るデータベース検索に要する負荷は、従来の方法におけ
るデータベース検索と同等の負荷であり、更に、このと
き、与えられたキーワード101(あるいは102a−
1)の符号111(あるいは112)が、索引エントリ
51−iの重ね合わせ符号201に含まれるか否かを検
査する処理の負荷は、データベース70に格納された被
検索データ10から抽出されたキーワード101および
このキーワード101の語集合102の個数に影響され
ず一定である。
【0025】このように実施例1では、与えられたキー
ワード101を含む情報だけを検索する場合に比較し
て、与えられたキーワード101を含む情報だけでな
く、このキーワード101を含んではいないが、このキ
ーワード101に関連する情報をも検索する場合の検索
時間の増加を抑えることができる。
【0026】《実施例2》次に、索引エントリに複数の
索引語フィールドを設けるようにした実施例2を説明す
る。図4は、その語彙拡張処理および符号化処理の説明
図である。尚、実施例2の情報検索装置の図面上の構成
は、図2に示した構成と同様であるため、ここでの説明
は省略する。図4は、上述した実施例1の図3に対応す
るもので、キーワード101から、意味的に関係のある
語集合102を抽出し、これらキーワード101および
語集合102を符号化するのは、実施例1と同様であ
る。
【0027】また、実施例2では、索引52における索
引エントリ52−iは複数の索引語フィールドを持って
いる。これら索引語フィールドの設定個数および各フィ
ールドに格納する重ね合わせ符号の生成方法としては、
いくつかの方法が考えられるが、ここでは、二つの索引
語フィールド52a−i、52b−iを設定し、第1の
索引語フィールド52a−iには、被検索データ10か
ら抽出したキーワード101とその類義語(同義語)1
02aを対応させ、第2の索引語フィールド52b−i
には上位概念語102bと下位概念語102cとを対応
させている。
【0028】例えば、図示例の場合、キーワード101
である「ひと」の符号CW1と、類義語102aである
「人間」「人類」の符号CW2、CW3とから重ね合わ
せ符号SCW1を作成する。また、上位概念語102b
である「動物」「生物」の符号CW4、CW5と、下位
概念語102cである「こども」「おとな」の符号CW
6、CW7とから重ね合わせ符号SCW2を作成する。
そして、このように構成した重ね合わせ符号SCW1
を、いずれかの索引エントリ52−iの第1の索引語フ
ィールド52a−iに、また、重ね合わせ符号SCW2
をいずれかの索引エントリ52−iの第2の索引語フィ
ールド52b−iに格納する。また、索引エントリ52
−iのポインタフィールド52c−iのポインタは、被
検索データ10中の該当データ401を示している。
【0029】次に、このように構成された情報検索装置
の検索動作を説明する。ある任意の検索要求の語句が与
えられ、かつ、その語句に対する意味的な状態の指定が
なされると、検索部60は、索引52から対応する索引
語フィールド(第1の索引語フィールド52a−iまた
は第2の索引語フィールド52b−i)の重ね合わせ符
号SCW1(またはSCW2)をサーチする。例えば、
「動物」の類義語を含んでいる情報を検索せよ、といっ
た要求が発生した場合、検索部60は、第1の索引語フ
ィールド52a−iの重ね合わせ符号SCW1をサーチ
し、該当する索引エントリ52−iのポインタに基づき
該当データ401を取り出す。これによって、「動物」
の類義語を含んでいる情報のみ取り出され、その上位概
念語や下位概念語が含まれるデータは検索結果から除外
することができる。
【0030】また、「動物」の下位概念語が含まれてい
る情報を検索せよ、といった要求が発生した場合、検索
部60は、第2の検索語フィールド52b−iの重ね合
わせ符号SCW2をサーチし、該当する索引エントリ5
2−iのポインタに基づき該当データ401を取り出
す。従って、この場合は、「動物」の類義語が含まれて
いるデータを検索結果から除外することができる。
【0031】このように、実施例2では、検索に際して
与えられた語句から得られる符号が含まれるかどうかを
検査する対象となる索引語フィールドを類似度により指
定するようにしたので、検索に際して与えられたキーワ
ードと検索される情報との類似度を制御することがで
き、正確な検索結果を得ることができる。
【0032】《実施例3》次に、被検索データ10中の
該当データに、照合データを備え、この照合データと入
力されたキーワードとを照合して検索結果とする情報検
索装置を実施例3として説明する。図5は、その装置の
構成を示すブロック図である。この装置は、被検索デー
タ11〜判定部80からなり、キーワード抽出部20〜
索引部50の構成は、上記実施例1と同様であるため、
その説明は省略する。
【0033】被検索データ11は、該当データ502
と、この該当データ502を検索結果とする照合データ
501とを備えている。
【0034】図6に、被検索データ11と索引53の構
成を示す。即ち、被検索データ11のデータエントリ1
1−iは、照合語フィールド11a−iとデータフィー
ルド11b−iで構成され、照合語フィールド11a−
iには照合データ501が、データフィールド11b−
iには該当データ502が格納されている。この照合デ
ータ501は、あるキーワード101で検索を行った場
合に、その該当データ502が検索結果となるキーワー
ド101と語集合102からなるもので、図示の場合は
語句k1、k2であることを示している。
【0035】図5に戻って、検索部61は、任意のキー
ワードが与えられた場合、索引部50よりそのキーワー
ドに対応する索引エントリを取り出し、この索引エント
リに対応した該当データ502と照合データ501とを
取り出すものである。また、判定部80は、検索部61
によって取り出された照合データ501と、キーワード
とを比較して、一致した場合に、検索部61によって取
り出された該当データ502を検索結果として出力する
ものである。
【0036】次に、このように構成された情報検索装置
の検索動作について説明する。利用者あるいは応用プロ
グラムからキーワード(検索要求の語句)を入力する
と、検索部61は、そのキーワードを符号化し、更に、
その符号に基づき索引53をサーチするのは実施例1と
同様である。そして、重ね合わせ符号201にキーワー
ドの符号が含まれるような索引エントリ53−iを抽出
し、この抽出されたポインタ202をたどって被検索デ
ータ11中のデータエントリ11−iから照合データ5
01と該当データ502とを抽出する。更に、検索部6
1は、この照合データ501と該当データ502とを判
定部80に送る。
【0037】判定部80は、検索要求のキーワードと、
照合データ501を照合し、この照合データ501中に
キーワードが含まれていた場合は、該当データ502が
正しいと判定し、この該当データ502を検索結果とし
て出力する。
【0038】このように、実施例3によれば、予め、該
当データ502と共に、照合データ501を被検索デー
タ11中に格納し、検索時は、入力したキーワードと照
合データ501とを照合して、検索結果を得るようにし
たので、正確なデータを取り出すことができる。
【0039】即ち、重ね合わせ符号201は、その重ね
合わせの構成から、あるキーワードと語集合とから抽出
した重ね合わせ符号と、これとは異なるキーワードと語
集合とから抽出した重ね合わせ符号とが等しくなってし
まう場合がある。従って、重ね合わせ符号を索引語とし
て検索を行った場合、入力したキーワードとは無関係の
データを取り出してしまう可能性がある。そこで、実施
例3では、実際のデータと入力したキーワードとの比較
を行って、無関係なデータを除外するようにしたもので
ある。
【0040】《実施例4》次に、索引エントリに複数の
索引語フィールドを設け、かつ、被検索データ12のデ
ータエントリに、対応する照合データを設けるようにし
た実施例4を説明する。
【0041】図7は、その索引54と被検索データ12
との関係を示す説明図である。この実施例4では、その
索引54が上述した実施例2と同様の構成となってい
る。即ち、任意の索引エントリ54−iは、第1の索引
語フィールド54a−i、第2の索引語フィールド54
b−iとポインタフィールド54c−iとから構成され
ている。そして、第1の索引語フィールド54a−iに
は、キーワード101と類義語102aから抽出された
重ね合わせ符号201a(SCW1)が、また、第2の
索引語フィールド54b−iには、上位概念語102b
と下位概念語102cから抽出された重ね合わせ符号2
01b(SCW2)が格納され、ポインタフィールド5
4c−iには、データエントリ12−iの位置を示すポ
インタ202が格納されている。
【0042】また、被検索データ12では、第1の照合
語フィールド12a−iと、第2の照合語フィールド1
2b−iと、データフィールド12c−iからなるレコ
ードでデータエントリ12−iが構成されている。第1
の照合語フィールド12a−iには、該当データ603
が検索結果となるキーワードと類義語の照合データ60
1(図示状態では、k1、k2)が、第2の照合語フィ
ールド12b−iには、該当データ603が検索結果と
なる上位概念語と下位概念語の照合データ602(図示
状態では、k3、k4)が格納されている。尚、実施例
4の図面上の構成は図5に示した実施例3と同様である
ため、ここでの説明は省略する。
【0043】次に、このように構成された情報検索装置
の検索動作について説明する。ある検索要求の語句が与
えられ、かつ、その語句に対する意味的な状態の指定が
なされると、検索部61は、索引54から対応する索引
語フィールド(第1の索引語フィールド54a−iまた
は第2の索引語フィールド54b−i)の重ね合わせ符
号201a(または201b)をサーチする。尚、これ
は実施例2の動作と同様である。
【0044】そして、検索部61は、該当する索引エン
トリ54−iのポインタ202に基づき、被検索データ
12から、対応するデータエントリ12−iの照合デー
タ601(または照合データ602)と該当データ60
3を取り出す。これにより、判定部80は、入力された
キーワードと、これに対応する照合語フィールド12a
−i(または、照合語フィールド12b−i)の照合デ
ータ601(または照合データ602)とを照合し、照
合データ601(602)中に、キーワードが含まれて
いた場合は、その該当データ603を検索結果として出
力する。
【0045】このように、実施例4では、実施例2と同
様に、検索に際して与えられた語句から得られる符号が
含まれるかどうかを検査する対象となる索引語フィール
ドを類似度により指定するようにし、かつ、実施例3と
同様に、予め、該当データ603と共に、照合データ6
01、602を被検索データ12中に格納し、検索時
は、入力したキーワードと照合データ601(602)
とを照合して、検索結果を得るようにしたので、検索に
際して与えられたキーワードと検索される情報との類似
度を制御することができ、かつ、その類似度の制御を正
確に行うことができる。
【0046】尚、上記各実施例では、重ね合わせ符号2
01、201a、201bを作成する場合に、キーワー
ド101の語集合102を類義語102a、上位概念語
102b、下位概念語102cに基づき作成したが、こ
の他にも反意語等を加えてもよい。
【0047】また、実施例2、4では、その索引語フィ
ールドをキーワードと類義語からなるグループと上位・
下位概念語からなるグループに分類したが、この分類に
限定されるものではなく、種々のグループに分類しても
よい。そして、その分類の個数も2個に限定されるもの
ではなく、更に細かく分類するようにしてもよい。
【0048】
【発明の効果】以上説明したように、本発明の情報検索
方法および情報検索装置によれば、予め、任意のキーワ
ードに対して、シソーラスより当該キーワードと意味的
な関係のある語集合を抽出し、これら語集合とキーワー
ドと、被検索データ中の該当データの位置とを対応付け
た索引を作成し、任意のキーワードで検索を行う場合
は、この索引を使用して行うようにしたので、検索に際
してシソーラス等にアクセスする必要がなく、従って、
指定したキーワードを含む情報だけではなく、このキー
ワードを含んではいないがこのキーワードに関連してい
る情報をも検索する場合であっても、高速な検索を行う
ことができる。
【図面の簡単な説明】
【図1】本発明の情報検索方法の説明図である。
【図2】本発明の情報検索装置における実施例1、2の
構成図である。
【図3】本発明の情報検索装置における実施例1の語彙
拡張処理と符号化処理の説明図である。
【図4】本発明の情報検索装置における実施例2の語彙
拡張処理と符号化処理の説明図である。
【図5】本発明の情報検索装置における実施例3、4の
構成図である。
【図6】本発明の情報検索装置における実施例3の被検
索データと索引との関係を示す説明図である。
【図7】本発明の情報検索装置における実施例4の被検
索データと索引との関係を示す説明図である。
【符号の説明】
10、11 被検索データ 20 キーワード抽出部 30 語彙拡張部 40 シソーラス 50 索引部 51〜54 索引 60、61 検索部 80 判定部 101 キーワード 102 語集合 201、201a、201b 重ね合わせ符号 202 ポインタ 301、401、502、603 該当データ 501、601、602 照合データ

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 予め、任意のキーワードに対して、シソ
    ーラスより当該キーワードと意味的な関係のある語集合
    を抽出し、前記キーワード毎に、当該キーワードを含む
    これら語集合と、被検索データ中の前記キーワードが存
    在する全ての位置とを対応付けた索引を作成し、 任意の語句をキーワードとして検索を行う場合は、前記
    作成した索引を使用して行うことを特徴とする情報検索
    方法。
  2. 【請求項2】 被検索データより、キーワードを抽出す
    るキーワード抽出部と、 シソーラスを用い、前記抽出されたキーワードに対し
    て、意味的に関係のある語集合を取り出す語彙拡張部
    と、 前記キーワードを含む語集合から生成した重ね合わせ符
    号と、前記被検索データ中の当該キーワードが存在する
    全ての位置とを対応付けた索引エントリを持つ索引を備
    えた索引部と、 任意の語句をキーワードとして検索要求が発生した場
    合、前記索引部より、当該語句に対応する索引エントリ
    を取り出し、この索引エントリを用いて前記被検索デー
    タを検索する検索部とを備えたことを特徴とする情報検
    索装置。
  3. 【請求項3】 被検索データより、キーワードを抽出す
    るキーワード抽出部と、 シソーラスを用い、前記抽出されたキーワードに対し
    て、意味的に関係のある語集合を取り出すと共に、前記
    キーワードを含む前記語集合を意味的な状態別に分類す
    る語彙拡張部と、 分類されたそれぞれの状態別の語集合から生成した重ね
    合わせ符号と、これら語句に対応する前記キーワードが
    前記被検索データ中で存在する全ての位置とをそれぞれ
    対応付けた索引エントリを持つ索引を備えた索引部と、 任意の語句をキーワードとして検索要求が発生し、か
    つ、当該語句の意味的な状態の指定がなされた場合、前
    記索引部より、当該語句に対応し、かつ、当該語句の意
    味的な状態の一致した索引エントリを取り出し、この索
    引エントリによって前記被検索データを検索する検索部
    とを備えたことを特徴とする情報検索装置。
  4. 【請求項4】 請求項2の情報検索装置において、 前記被検索データ中の、前記各キーワードの存在する位
    置に予め設けられ、その位置が検索位置となる照合デー
    タと、 任意の語句をキーワードとして検索要求が発生した場
    合、前記索引部より、当該語句に対応する索引エントリ
    を取り出し、この索引エントリに対応した被検索データ
    と前記照合データを取り出す検索部と、 前記取り出された照合データと、前記検索要求語句とを
    比較し、前記照合データ中に、前記検索要求語句が含ま
    れていた場合に、前記取り出した被検索データを検索結
    果とする判定部とを備えたことを特徴とする情報検索装
    置。
  5. 【請求項5】 請求項3の情報検索装置において、 前記被検索データ中の、前記各キーワードの存在する位
    置に予め設けられ、その位置が検索位置となる照合デー
    タと、 任意の語句をキーワードとして検索要求が発生し、か
    つ、当該語句の意味的な状態の指定がなされた場合、前
    記索引部より、当該語句に対応し、かつ、当該語句の意
    味的な状態の一致した索引エントリを取り出し、この索
    引エントリに対応した被検索データと前記照合データを
    取り出す検索部と、 前記取り出された照合データと、前記検索要求語句とを
    比較し、前記照合データ中に、前記検索要求語句が含ま
    れていた場合に、前記取り出した被検索データを検索結
    果とする判定部とを備えたことを特徴とする情報検索装
    置。
JP6064484A 1994-03-08 1994-03-08 情報検索方法および情報検索装置 Pending JPH07249045A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6064484A JPH07249045A (ja) 1994-03-08 1994-03-08 情報検索方法および情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6064484A JPH07249045A (ja) 1994-03-08 1994-03-08 情報検索方法および情報検索装置

Publications (1)

Publication Number Publication Date
JPH07249045A true JPH07249045A (ja) 1995-09-26

Family

ID=13259545

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6064484A Pending JPH07249045A (ja) 1994-03-08 1994-03-08 情報検索方法および情報検索装置

Country Status (1)

Country Link
JP (1) JPH07249045A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09245059A (ja) * 1996-03-12 1997-09-19 Sharp Corp キーワード抽出方法、概念抽出方法、キーワード抽出装置、及び概念抽出装置
US7054861B2 (en) 1998-09-30 2006-05-30 Canon Kabushiki Kaisha Information search apparatus and method, and computer readable memory
JP2007102786A (ja) * 2005-09-30 2007-04-19 Internatl Business Mach Corp <Ibm> 大規模フルテキスト・インデックスでタキソノミーにインデックスを付け、探索することをサポートする方法、装置およびシステム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09245059A (ja) * 1996-03-12 1997-09-19 Sharp Corp キーワード抽出方法、概念抽出方法、キーワード抽出装置、及び概念抽出装置
US7054861B2 (en) 1998-09-30 2006-05-30 Canon Kabushiki Kaisha Information search apparatus and method, and computer readable memory
US7664803B2 (en) 1998-09-30 2010-02-16 Canon Kabushiki Kaisha Information search apparatus and method, and computer readable memory
JP2007102786A (ja) * 2005-09-30 2007-04-19 Internatl Business Mach Corp <Ibm> 大規模フルテキスト・インデックスでタキソノミーにインデックスを付け、探索することをサポートする方法、装置およびシステム
US8600997B2 (en) 2005-09-30 2013-12-03 International Business Machines Corporation Method and framework to support indexing and searching taxonomies in large scale full text indexes

Similar Documents

Publication Publication Date Title
US6018735A (en) Non-literal textual search using fuzzy finite-state linear non-deterministic automata
Al‐Sughaiyer et al. Arabic morphological analysis techniques: A comprehensive survey
Peterson Computer programs for spelling correction: an experiment in program design
US5701469A (en) Method and system for generating accurate search results using a content-index
US5606690A (en) Non-literal textual search using fuzzy finite non-deterministic automata
US7139977B1 (en) System and method for producing a virtual online book
RU2591175C1 (ru) Способ и система для глобальной идентификации в коллекции документов
US20120130999A1 (en) Method and Apparatus for Searching Electronic Documents
EP0287310A2 (en) Intelligent query system
Bernier et al. Correlative indexes III. Semantic relations among semantemes-The technical thesaurus
KR20210134878A (ko) 키워드 추출 기법을 이용한 윅수퍼비전 방법론에 기초하여 정보검색모델을 학습시키는 방법
JPS6175957A (ja) 機械翻訳処理装置
JPH07249045A (ja) 情報検索方法および情報検索装置
Freire et al. Identification of FRBR works within bibliographic databases: An experiment with UNIMARC and duplicate detection techniques
JP2894301B2 (ja) 文脈情報を用いた文書検索方法および装置
El-Barbary Arabic news classification using field association words
KR100372078B1 (ko) 관련어 검색 방법
CA1276728C (en) Information retrieval system and method
JPH05250411A (ja) 検索条件式作成装置
JPS5856071A (ja) 日本語による検索システム
Min et al. A Longest Matching Resource Mapping Algorithm with State Compression Dynamic Programming Optimization.
Wang et al. Automatic keyword extraction from single-sentence natural language queries
JP3578045B2 (ja) 全文検索方法及び装置及び全文検索プログラムを格納した記憶媒体
JP2001067378A (ja) 文字列類似度算出方法、装置及び記録媒体
US20240086442A1 (en) Heuristic identification of shared substrings between text documents