JPH04184678A - 情報検索装置 - Google Patents

情報検索装置

Info

Publication number
JPH04184678A
JPH04184678A JP2316504A JP31650490A JPH04184678A JP H04184678 A JPH04184678 A JP H04184678A JP 2316504 A JP2316504 A JP 2316504A JP 31650490 A JP31650490 A JP 31650490A JP H04184678 A JPH04184678 A JP H04184678A
Authority
JP
Japan
Prior art keywords
information
cluster
knowledge information
similarity
knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2316504A
Other languages
English (en)
Inventor
Shiyou Imasato
詔 今郷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2316504A priority Critical patent/JPH04184678A/ja
Publication of JPH04184678A publication Critical patent/JPH04184678A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、データベース検索システムなどに利用される
情報検索装置に関するものである。
従来の技術 一般的な情報検索装置は、予め複数の知識情報を対応す
る登録キーワードと共に情報記憶手段に格納しておき、
入力する検索キーワードと登録キーワードとのマツチン
グで知識情報を検索するようになっている。そして、こ
のような情報検索装置は、現在では検索精度を向上させ
るために検索キーワードと演算子とを組合わせて検索条
件を生成するようになっており、その具体例としては、
[化学・薬学・生物医学のオンライン情報検索」(笹本
光雄、坂本徹朗、黒沢正彦共著 地人書館1981年)
に開示された情報検索方法がある。
その−例である組立型の検索では、最初に単独の検索キ
ーワードで検索作業を行なってから、結果を演算子で組
合わせるようになっており、例えば、検索キーワードを
A〜Cとすると、1 、5elect A (Aに対応する情報検索) 2、5elect B (Bに対応する情報検索) 3、 combine 1and2 (1と2の検索結果の共通集合を横比)と云うように検
索条件を複数回で入力する。
また、他の例である試行錯誤型の検索では、最初に検索
条件式を組立てて検索結果を確認しながら検索条件式を
修正するようになっており、例えば、検索キーワードを
A−Cとすると、A or B and C と云うような検索条件を一回で入力する。
発明が解決しようとする課題 上述のような情報検索方法は、情報検索の専任者の使用
を想定しており、初心者には検索条件の選定や生成が容
易でない。
具体的には、知識情報の検索に適した検索キーワードを
作業者が考える必要があるので、個人差により結果が異
なることになる。このような課題は、利用できる検索キ
ーワードが予め設定されている統制キーワード方式の情
報検索装置では発生しないが、これは作業の自由度が低
い。そして、作業者の所望により検索キーワードを入力
する自由キーワード方式の情報検索装置では、上述のよ
うな課題が発生すると共に、初心者が適当に検索キーワ
ードを生成しても良好な検索結果が得られないことが多
発する。
また、上述のような情報検索装置では、検索キーワード
や演算子等からなる検索条件をキーボードによる文字入
力で行なうようになっており、その操作が煩雑で作業能
率を低下させている。
さらに、上述した情報検索方法では、複数の演算子を内
包する検索条件式を入力できるようになっているが、こ
の場合は使用者が演算子の優先順位をDI!している必
要がある。つまり、A or B and C と云う検索条件式を入力した場合、これが(A or 
B )and C Aor(BandC) の何れになるかは情報検索装置の設定によるので、使用
者の要望に反した検索結果が検出されることがある。
例えば、初心者が情報検索装置を使用する場合の作業を
想定すると、まず、思いついた一つの検索キーワードを
入力し、検索結果が多い場合は他の検索キーワードとの
andをとり、検索結果が少ない場合は他の検索キーワ
ードとのorをとる。そして、もしも検索結果が予想に
反するものである場合は、検索結果を破棄して作業を最
初から繰返すことになる。しかし、これでは操作が煩雑
で作業能率が低く、良好な検索結果を得ることが困難で
ある。
上述のような情報検索装置を使用する際は、−般的に作
業者は適正な個数の検索結果を要望している場合が多く
、検索意図に適した検索結果が得られても個数が過多で
あったり過少であった場合は、検索意図を狭くしたり拡
大するなどして操作を繰返している。しかし、これでは
操作が煩雑で作業能率が低く、操作を繰返すと共に検索
条件の生成が困難となる。
ここで、上述のような検索キーワードの入力を要しない
情報検索手段の一例が、稲垣博人“文書内容検索システ
ムにおける現状と課題”情報管理vo1.33  No
、2 1990に開示されている。これは、検索キーワ
ードの代わりに所定の文書情報をキー文書として入力し
、文書情報を検索すると云うものである。
つまり、データベース内の文書情報の各々にキー文書に
対するキーワード包含率を、(キー文書と一致したキー
ワード数)/(キー文書のキーワード数)として算出し
、このキーワード包含率が高い文書情報について係受は
関係の類似性とキーワードの重みとでキー文書との類似
度を算出し、この類似度の高いものから文書情報を作業
者に提示するようになっている。
しかし、これではキー文書と文書情報とを互いの一部で
比較しているので、良好な検索結果を得ることが困難で
ある。さらに、このようにして検索した文書情報を類似
度に従って順番に提示するのでは、作業者の要望に最も
近い文書情報が下位に分散される懸念があり、最終的に
は作業者が文書情報の内容を確認する必要が生じるなど
して作業能率が低下することになる。
課題を解決するための゛手段 請求項1記載の発明は、予め複数の知識情報が記憶され
た情報記憶手段を設け、情報記憶手段内の知識情報間の
類似度を算定する類似度検出手段を設け、この類似度検
出手段の算定結果に従って知識情報を複数のクラスタか
らなる階層構造にクラスタリングするクラスタリング手
段を設け、この情報クラスタリング手段がクラスタリン
グした知識情報の階層構造を記憶するクラスタ記憶手段
を設け、このクラスタ記憶手段の記憶内容や知識情報の
内容に従って少なくともクラスタの階層構造を内包する
補助情報を提示する補助情報提供手段を設け、操作入力
に従ってクラスタを階層構造の上位から下位に向かって
順次検索するクラスタ選択手段を設け、このクラスタ選
択手段が検索したクラスタ下の知識情報を出力する情報
出力手段を設けた。
請求項2記載の発明は、予め複数の知識情報が登録キー
ワードと共に記憶された情報記憶手段を設け、登録キー
ワードの一致率に従って知識情報の類似度を算定する類
似度検出手段を設けた。
請求項3記載の発明は、各々少なくとも一つの単語を内
包する複数の知識情報が予め記憶された情報記憶手段を
設け、単語の一致率に従って知識情報の類似度を算定す
る類似度検出手段を設けた。
請求項4記載の発明は、各々少なくとも一つの文字を内
包する複数の知識情報が予め記憶された情報記憶手段を
設け、文字の一致率に従って知識情報の類似度を算定す
る類似度検出手段を設けた。
請求項5記載の発明は、各知識情報が一つのクラスタに
付属するように規制するクラスタ限定手段を設けた。
請求項6記載の発明は、クラスタ選択手段が検索する知
識情報の個数を指定する検索個数指定手段を設け、この
検索個数指定手段の指定個数の近似値に各クラスタに付
属する知識情報の個数を規制するクラスタ限定手段を設
けた。
請求項7記載の発明は、クラスタ選択手段が検索する知
識情報の個数を指定する検索個数指定手段を設け、この
検索個数指定手段の指定個数以下に各クラスタに付属す
る知識情報の個数を規制するクラスタ限定手段を設けた
請求項8記載の発明は、予め情報記憶手段に記憶された
複数の知識情報の一つを検索基準として指定する情報指
定手段を設け、この情報指定手段で指定された知識情報
が付属するクラスタの一つを選択するクラスタ選択手段
を設けた。
作用 請求項1記載の発明は、情報記憶手段が予め複数の知識
情報を記憶しており、これらの知識情報間の類似度を類
似度検出手段が算定し、この算定結果に従って知識情報
を複数のクラスタからなる階層構造にクラスタリング手
段がクラスタリングし、このクラスタリングした知識情
報の階層構造をクラスタ記憶手段が記憶し、この記憶内
容や知識情報の内容に従って少なくともクラスタの階層
構造を内包する補助情報を補助情報提供手段が提示し、
操作入力に従ってクラスタを階層構造の上位から下位に
向かってクラスタ選択手段が順次検索し、この検索され
たクラスタ下の知識情報を情報出力手段が出力すること
で、作業者は検索作業を行なう場合に二つのクラスタの
一方を選択するだけなので、作業者がキーワードや演算
子等からなる検索条件を考えたり、このような検索条件
をキーボードの操作で文字入力する必要や、試行錯誤に
従って検索作業を繰返す必要がなく、さらに、予め知識
情報に登録キーワードを設定しておくことも要しない。
請求項2記載の発明は、予め複数の知識情報と共に記憶
された登録キーワードの一致率に従って類似度検出手段
が知識情報の類似度を算定することで、簡易に知識情報
の類似度を算定することができる。
請求項3記載の発明は、各々少なくとも一つの単語を内
包する複数の知識情報の単語の一致率に従って類似度検
出手段が知識情報の類似度を算定することで、簡易に知
識情報の類似度を算定することができ、しかも、予め知
識情報に登録キーワードを設定しておくことを要しない
請求項4記載の発明は、各々少なくとも一つの文字を内
包する複数の知識情報の文字の一致率に従って類似度検
出手段が知識情報の類似度を算定することで、簡易に知
識情報の類似度を算定することができ、しかも、予め知
識情報に登録キーワードを設定しておくことを要しない
請求項5記載の発明は、各知識情報が一つのクラスタに
付属するようにクラスタ限定手段が規制することで、ク
ラスタ選択手段の動作を制御するなどして検索結果の個
数を作業者の所望の個数に近似させることができる。
請求項6記載の発明は、クラスタ選択手段が検索する知
識情報の個数を検索個数指定手段で指定し、この指定個
数の近似値に各クラスタに付属する知識情報の個数をク
ラスタ限定手段が規制することで、作業者は略所望する
個数の検索結果を得ることができる。
請求項7記載の発明は、クラスタ選択手段が検索する知
識情報の個数を検索個数指定手段で指定し、この指定個
数以下に各クラスタに付属する知識情報の個数をクラス
タ限定手段が規制することで、作業者は略所望する個数
の検索結果を得ることができる。
請求項8記載の発明は、予め情報記憶手段に記憶された
複数の知識情報の一つを検索基準として情報指定手段で
指定し、この指定された知識情報が付属するクラスタの
一つをクラスタ選択手段で選択することで、作業者がキ
ーワードや演算子等からなる検索条件を考える必要がな
く、また、類似度が高い知識情報を隣接して提示するこ
とができる。
実施例 請求項1〜4記載の発明の実施例を第1図ないし第5図
に基づいて説明する。まず、本実施例の情報検索装置1
は、第1図に例示するように、予め複数の知識情報が記
憶された情報記憶手段(図示せず)に、前記知識情報間
の類似度を算定する類似度検出手段2が接続されており
、この類似度検出手段2に前記知識情報をクラスタリン
グするクラスタリング手段3が接続されている。そして
、このクラスタリング手段3には前記知識情報の階層構
造を記憶するクラスタ記憶手段4が接続されており、こ
のクラスタ記憶手段4には操作入力に従って前記クラス
タを階層構造の上位から下位に向かって順次検索するク
ラスタ選択手段5が接続されている。そして、このクラ
スタ選択手段5には、前記知識情報に対する前記クラス
タの階層構造を提示する補助情報提供手段6と、前記知
識情報を表示や印刷で出力する情報出力手段7とが接続
されている。
ここで、本発明の情報検索装置lで利用するクラスタリ
ングとは、所定の情報を複数のクラスタからなる階層構
造に分類すると云う既存の概念であり、例えば、河口主
部“多変量解析入門■”森北出版 数学ライブラリー4
6.1978などに詳述されている。
このような構成において、本実施例の情報検索装置1の
各部の動作を以下に詳述する。
まず、類似度検出手段2は、任意の二つの知識情報の類
似度を所定の演算処理で算定するようになっており、こ
の演算手段としては以下に例示するようなものがある。
第一に例示する手段は、請求項2記載の発明に記載した
もので、予め知識情報が登録キーワードと共に記憶され
ている場合に、登録キーワードの一致率に従って知識情
報の類似度を算定する。つまり、二つの知識情報A、B
の登録キーワードの個数がNA、NBであり、これらに
共通する登録キーワードの個数をNABとすると、 類似度=NAB/(NA十NB−NAB)とする。この
ようにすることで、この類似度は二つの知識情報A、B
に共通する登録キーワードがなければOとなり、全ての
登録キーワードが共通ならば】となる。
つぎに、第二に例示する手段は、請求項3記載の発明に
記載したもので、文書等からなる知識情報が各々少なく
とも一つの単語を内包する場合、これらの単語の一致率
に従って知識情報の類似度を算定する。つまり、二つの
知識情報A、Bに出現する単語の個数がNA、NBで共
通する単語の個数をNABとすると、 類似度=NAB/(NA十NB−NAB)とする。この
ようにすることで、この類似度は二つの知識情報A、B
に共通する単語がなければOとなり、全ての単語が共通
ならば1となる。なお、この方法を実施する場合は、助
詞や助動詞等の付属語を除去してから類似度を算定する
ことや、名詞だけを抽出して類似度を算定することなど
が考えられる。
さらに、第三に例示する手段は、請求項4記載の発明に
記載したもので、文書や単語等からなる知識情報が各々
少なくとも一つの文字を内包する場合、これらの文字の
一致率に従って知識情報の類似度を算定する。この場合
、最初に所定の文字Cの知識情報内における使用率を、 使用率=(文字Cの個数)/(文字の総数)として算定
し、それぞれの文字の使用率を要素とするベクトルの内
積で二つの知識情報の類似度を算定する。なお、この方
法を実施する場合は、主に付属語として利用される平仮
名を除去してから類似度を算定することなどが考えられ
る。
また、第四に例示する手段は、知識情報が画像のイメー
ジデータ等からなる場合に有効なもので、抽出した特徴
ベクトルの内積で二つの知識情報の類似度を算定する。
上述のように知識情報の種別に従って各種の演算処理を
行なうことで、類似度検出手段2は二つ   ・の知識
情報の類似度をO〜1の範囲で算定することができる。
つぎに、クラスタリング手段3は、初期状態として各知
識情報を要素が一つのクラスタと見なし、第2図に例示
するように、類似度が高いクラスタ対から順次併合して
木構造状の階層構造を形成する。そこで、その動作を簡
易に詳述する。
まず、全ての知識情報を各々クラスタとする6なお、こ
の段階では各クラスタの類似度は知識情報の類似度と同
一である。
つぎに、類似度が最も高いクラスタ対を検出して併合し
、この連結と共に類似度を再計算する。
なお、この再計算の方法としては、併合されるクラスタ
をCo1r3. 、 Co1d、として併合後のクラス
タをCnevとし、これに併合するクラスタをCe1s
eとすると、CnewとCe1seとの類似度を、Co
ld。
とCe1se、 Co1d、とCe1seの類似度のう
ち大きい方、平均値、小さい方等とすることなどが考え
られる。
そして、併合するクラスタがなくなるまで上述の作業を
繰返すことで、クラスタリング手段3は複数の知識情報
から階層構造を形成する。
また、クラスタ記憶手段4は、上述のようにしてクラス
タリング手段3でクラスタリングされた知識情報の木構
造状の階層構造を記憶する。なお、第2図に例示した階
層構造では、最初に知識情報■、■が併合されて次に知
識情報■、■が併合されたことが分かる。実際には、ク
ラスタリング記憶手段4内の記憶構造は、第3図に例示
するような形態となっており、所定のクラスタを指定す
ると全ての子クラスタを検出することができる。
さらに、補助情報提供手段6は、初心者でも操作が簡明
であるように検索作業の補助情報を提供するもので、実
際には上述のようなりラスタ記憶手段4の記憶内容や知
識情報の内容に従って階層構造に基づいたクラスタの関
係を内包した補助情報を表示や印刷で提示する。さらに
、このような補助情報としては、以下に例示するような
ことを付加することが実施可能である。
1、知識情報に表題がある場合、各クラスタ下の知識情
報の表題の一覧を提示する。
2、知識情報に表題がある場合、表題を構成する単語を
出現数の多い順に提示する。
3、各知識情報の内容の一部を一覧提示する。
4、知識情報にキーワードがある場合は、各キーワード
を対応情報が多い順に提示する。
5、知識情報をランダムに選出して内容を提示する。
このようにすることで、作業者は補助情報提供手段6が
提示した内容に基づいて検索作業を容易に行なうことが
できる。
そして、クラスタ選択手段5は、操作入力に従ってクラ
スタ記憶手段4内のクラスタを上位から下位に辿り、作
業者が所望する知識情報を検索するようになっている。
つまり、注目点を最上位のクラスタとして二つの子クラ
スタに関する補助情報を補助情報提供手段6で提示し、
作業者の選択による操作入力に従って次の二つの子クラ
スタの補助情報を提示する。そして、このような動作を
繰返すことで、作業者は所望の知識情報を検出すること
ができる。ここで、上述のような補助情報の一部として
クラスタに付属する知識情報の個数を提示することで、
作業者は所望の個数の知識情報を得ることができる。
さらに、情報出力手段7は、クラスタ選択手段5で検索
された知識情報を表示や印刷等で出力するようになって
おり、ここでは知識情報をクラスタリングされた順番°
に出力するようになっている。
例えば、第2図及び第3図に例示した階層構造では、ク
ラスタ■は知識情報■とクラスタ■とからなり、このク
ラスタ■は知識情報■、■からなるので、クラスタ■に
は知識情報■、■が取込まれてから知識情報■が取込ま
れたことになる。そこで、この場合の情報出力手段7の
出力順序は、知識情報■−知識情報■−知識情報■ となるか、 知識情報■→知識情報■→知識情報■ となる。
そこで、この情報検索装置lで知識情報をクラスタリン
グする場合の処理動作を、第4図に例示するフローチャ
ートに基づいて以下に説明する。
まず、予め情報記憶手段内に記憶された全ての知識情報
に対して類似度を類似度検出手段2が算定する。そこで
、クラスタリング手段3は、各知識情報をクラスタと見
なして最も類似度が高いクラスタ対を選出し、このクラ
スタ対を新たなりラスタとして類似度を再計算し、併合
するクラスタが無くなるまで類似度に従ったクラスタの
併合を繰返す。
このようにすることで、知識情報が階層構造にクラスタ
リングされる。
つぎに、この情報検索装置1でクラスタリングされた知
識情報を検索する場合の処理動作を、第5図に例示する
フローチャートに基づいて以下に説明する。まず、クラ
スタリング記憶手段4の記憶内容に従って機器が最上位
のクラスタに注目するので、作業者は二つの子クラスタ
の補助情報を補助情報提供手段6から得て一方を選択す
る。そこで、選択されたクラスタの二つの子クラスタの
補助情報が得られるので、上述の操作を繰返して所望す
る知識情報を検索し、この検索された知識情報の内容を
情報出力手段7で出力することで検索作業が完了する。
上述のように、この情報検索装置lでは、検索作業を行
なう場合に二つのクラスタの一方を選択するだけなので
、作業者がキーワードや演算子等からなる検索条件を考
えたり、このような検索条件をキーボードの操作で文字
入力する必要がなく、試行錯誤に従って検索作業を繰返
す必要もないので、検索作業の操作が容易で作業能率が
良好である。また、この情報検索装置1では、既存の技
術で知識情報がクラスタリングされ、予め知識情報に登
録キーワードを設定しておくことを要しないので、機器
の構造が簡易で形成が容易である。
また、請求項2記載の発明に記載したように、知識情報
が登録キーワードと共に記憶されている場合は、登録キ
ーワードの一致率に従って知識情報の類似度を算定する
ことができ、請求項3記載の発明に記載したように、文
書等からなる知識情報が単語を内包する場合は、これら
の単語の一致率に従って知識情報の類似度を算定するこ
とができ、請求項4記載の発明に記載したように、文書
や単語等からなる知識情報が文字を内包する場合は、こ
れらの文字の一致率に従って知識情報の類似度を算定す
ることができる。このようにすることで、容易に知識情
報の類似度を算定して情報検索装置1を実現することが
できる。
さらに、請求項5〜7記載の発明の実施例を第6図及び
第7図に基づいて説明する。まず、この情報検索装置8
では、第6図に例示するように、クラスタ記憶手段4と
クラスタ選択手段5との間に、各知識情報が一つのクラ
スタに付属するように規制するクラスタ限定手段9が設
けられており、このクラスタ限定手段9に検索する知識
情報の個数を指定する検索個数指定手段10が接続され
ている。なお、この他の構造は前述の情報検索装置1と
同様になっている。
このような構成において、本実施例の情報検索装置8の
各部の動作を以下に詳述する。なお、前述の情報検索装
置1と同一の部分2〜7は同様に機能する。
まず、検索個数指定手段10は、作業者が要望する検索
結果の個数が入力されるようになっており、この入力値
に従ってクラスタ限定手段9の動作が制御されるように
なっている。
そして、このクラスタ限定手段9は、各知識情報が一つ
のクラスタに付属するように規制すると共に、クラスタ
選択手段5の動作を制御するなどして検索結果の個数が
検索個数指定手段10で指定された個数以下の最大数や
近似値となるようにクラスタを限定する。
つまり、第7図のフローチャートに例示するように、ま
ず、検索個数指定手段10で検索を要望する知識情報の
個数を指定すると、注目点を最上位のクラスタとして付
属する知識情報の個数である検索個数が指定個数と比較
される。そこで、この指定個数より検索個数が小さけれ
ば二つの子クラスタの一方が選択され、この選択された
クラスタにも同様な処理が行なわれて検索個数指定手段
10の指定個数以下の最大数や近似した個数の知識情報
が検出される。
このようにすることで、作業者は略所望する個数の検索
結果を得ることができるので、検索結果が所望の個数に
なるまで試行錯誤に従って検索作業を繰返すような必要
がない。そして、上述のように検索個数指定手段10で
大きい個数を指定することで、漏れが少ない検索結果を
得ることができ、小さい個数を指定することで、不要な
情報量が少ない検索結果を得ることができる。
つぎに、請求項8記載の発明の実施例を第8図及び第9
図に基づいて説明する。まず、この情報検索装置11で
は、第8図に例示するように、検索基準となる知識情報
を指定する情報指定手段12がクラスタ選択手段5に接
続されている。なお、この他の構造は前述の情報検索装
置1と同様になっている。
このような構成において、本実施例の情報検索装置11
の情報指定手段12に、検索基準となる文書情報等の知
識情報を入力すると、この知識情報が付属するクラスタ
の一つをクラスタ選択手段5が選択するようになってい
る。なお、上述のような検索基準となる知識情報は、予
め情報記憶手段内に格納されている知識情報の一つであ
り、これを得るためには表題や検索キーワードによる検
索作業を行なうことが考えられる。また、新たに知識情
報を登録した場合は、これを検索基準とすることも可能
である。
そこで、この情報検索装置11で検索作業を行なう場合
の動作を第9図に例示するフローチャートに基づいて以
下に説明する。まず、情報指定手段12で指定された知
識情報が付属する最下位のクラスタ対の一方がクラスタ
選択手段5で検出され、このクラスタの補助情報が補助
情報提供手段6から作業者に出力される。そこで、この
作業者は、そのクラスタに付属する知識情報を情報出力
手段7から出力させて検索作業を完了するか、注目点を
上位のクラスタと対のクラスタとの一方に移動させるか
を判断する。そこで、注目点を移動する場合は、そのク
ラスタに対して上述と同様な作業を行なうことで、作業
者が所望する検索結果が得られることになる。
このようにすることで、この情報検索装置11では、検
索基準として知識情報を指定すれば良いので、作業者が
キーワードや演算子等からなる検索条件を考える必要が
なく、また、類似度が高い知識情報を隣接して提示する
ことができるので、作業者の要望に近い知識情報を簡易
に得ることができ、検索作業の操作が容易で作業能率が
良好である。
発明の効果 請求項1記載の発明は、予め複数の知識情報が記憶され
た情報記憶手段を設け、情報記憶手段内の知識情報間の
類似度を算定する類似度検出手段を設け、この類似度検
出手段の算定結果に従って知識情報を複数のクラスタか
らなる階層構造にクラスタリングするクラスタリング手
段を設け、この情報クラスタリング手段がクラスタリン
グした知識情報の階層構造を記憶するクラスタ記憶手段
を設け、このクラスタ記憶手段の記憶内容や知識情報の
内容に従って少なくともクラスタの階層構造を内包する
補助情報を提示する補助情報提供手段を設け、操作入力
に従ってクラスタを階層構造の上位から下位に向かって
順次検索するクラスタ選択手段を設け、このクラスタ選
択手段が検索したクラスタ下の知識情報を出力する情報
出力手段を設けたことにより、作業者は検索作業を行な
う場合に二つのクラスタの一方を選択するだけなので、
作業者がキーワードや演算子等からなる検索条件を考え
たり、このような検索条件をキーボードの操作で文字入
力する必要がなく、試行錯誤に従って検索作業を繰返す
必要もないので、検索作業の操作が容易で作業能率が良
好であり、予め知識情報に登録キーワードを設定してお
くことを要しないので、機器の構造が簡易で形成が容易
である等の効果を有するものである。
請求項2記載の発明は、予め複数の知識情報が登録キー
ワードと共に記憶された情報記憶手段を設け、登録キー
ワードの一致率に従って知識情報の類似度を算定する類
似度検出手段を設けたことにより、簡易に知識情報の類
似度を算定することができ、高性能な情報検索装置を容
易に実施することができる等の効果を有するものである
請求項3記載の発明は、各々少なくとも一つの単語を内
包する複数の知識情報が予め記憶された情報記憶手段を
設け、単語の一致率に従って知識情報の類似度を算定す
る類似度検出手段を設けたことにより、簡易に知識情報
の類似度を算定することができ、しかも、予め知識情報
に登録キーワードを設定しておくことを要しないので、
高性能な情報検索装置を容易に実施することができる等
の効果を有するものである。
請求項4記載の発明は、各々少なくとも一つの文字を内
包する複数の知識情報が予め記憶された情報記憶手段を
設け、文゛字の一致率に従って知識情報の類似度を算定
する類似度検出手段を設けたことにより、簡易に知識情
報の類似度を算定することができ、しかも、予め知識情
報に登録キーワードを設定しておくことを要しないので
、高性能な情報検索装置を容易に実施することができる
等の効果を有す・るものである。
請求項5記載の発明は、各知識情報が一つのクラスタに
付属するように規制するクラスタ限定手段を設けたこと
により、クラスタ選択手段の動作を制御するなどして検
索結果の個数を作業者の所望の個数に近似させることが
でき、高性能な情報検索装置を容易に実施することがで
きる等の効果を有するものである。
請求項6記載の発明は、クラスタ選択手段が検索する知
識情報の個数を指定する検索個数指定手段を設け、この
検索個数指定手段の指定個数の近似値に各クラスタに付
属する知識情報の個数を規制するクラスタ限定手段を設
けたことにより、作業者は略所望する個数の検索結果を
得ることができるので、検索結果が所望の個数になるま
で試行錯誤に従って検索作業を繰返すような必要がなく
、大きい個数を指定して漏れが少ない検索結果を得たり
、小さい個数を指定して不要な情報量が少ない検索結果
を得るようなことができる等の効果を有するものである
請求項7記載の発明は、クラスタ選択手段が検索する知
識情報の個数を指定する検索個数指定手段を設け、この
検索個数指定手段の指定個数以下に各クラスタに付属す
る知識情報の個数を規制するクラスタ限定手段を設けた
ことにより、作業者は略所望する個数の検索結果を得る
ことができるので、検索結果が所望の個数になるまで試
行錯誤に従って検索作業を繰返すような必要がなく、大
きい個数を指定して漏れが少ない検索結果を得たり、小
さい個数を指定して不要な情報量が少ない検索結果を得
るようなことができる等の効果を有するものである。
請求項8記載の発明は、予め情報記憶手段に記憶された
複数の知識情報の一つを検索基準として指定する情報指
定手段を設け、この情報指定手段で指定された知識情報
が付属するクラスタの一つを選択するクラスタ選択手段
を設けたことにより、検索基準として知識情報を指定す
れば良いので、作業者がキーワードや演算子等からなる
検索条件を考える必要がなく、また、類似度が高い知識
情報を隣接して提示することができるので、作業者の要
望に近い知識情報を簡易に得ることができ、検索作業の
操作が容易で作業能率が良好である等の効果を有するも
のである。
【図面の簡単な説明】
図面は本発明の実施例を示すものであり、第1図は請求
項1〜4記載の発明のブロック図、第2図及び第3図は
データ構造の概念説明図、第4図及び第5図はフローチ
ャート、第6図は請求項5〜7記載の発明のブロック図
、第7図はフローチャート、第8図は請求項8記載の発
明のブロック図、第9図はフローチャートである。 1.8.11・・・情報検索装置、2・・・類似度検出
手段、3・・・クラスタリング手段、4・・・クラスタ
記憶手段、5・・・クラスタ選択手段、6・・・補助情
報提供手段、7・・・情報出力手段、9・・・クラスタ
限定手段、10・・・検索個数指定手段、12・・・情
報指定手−篤 6図

Claims (1)

  1. 【特許請求の範囲】 1、予め複数の知識情報が記憶された情報記憶手段と、
    前記情報記憶手段内の知識情報間の類似度を算定する類
    似度検出手段と、この類似度検出手段の算定結果に従っ
    て前記知識情報を複数のクラスタからなる階層構造にク
    ラスタリングするクラスタリング手段と、この情報クラ
    スタリング手段がクラスタリングした前記知識情報の階
    層構造を記憶するクラスタ記憶手段と、このクラスタ記
    憶手段の記憶内容や前記知識情報の内容に従って少なく
    とも前記クラスタの階層構造を内包する補助情報を提示
    する補助情報提供手段と、操作入力に従って前記クラス
    タを階層構造の上位から下位に向かって順次検索するク
    ラスタ選択手段と、このクラスタ選択手段が検索したク
    ラスタ下の前記知識情報を出力する情報出力手段とより
    なることを特徴とする情報検索装置。 2、予め複数の知識情報が登録キーワードと共に記憶さ
    れた情報記憶手段を設け、前記登録キーワードの一致率
    に従って前記知識情報の類似度を算定する類似度検出手
    段を設けたことを特徴とする請求項1記載の情報検索装
    置。 3、各々少なくとも一つの単語を内包する複数の知識情
    報が予め記憶された情報記憶手段を設け、前記単語の一
    致率に従って前記知識情報の類似度を算定する類似度検
    出手段を設けたことを特徴とする請求項1記載の情報検
    索装置。 4、各々少なくとも一つの文字を内包する複数の知識情
    報が予め記憶された情報記憶手段を設け、前記文字の一
    致率に従って前記知識情報の類似度を算定する類似度検
    出手段を設けたことを特徴とする請求項1記載の情報検
    索装置。 5、各知識情報が一つのクラスタに付属するように規制
    するクラスタ限定手段を設けたことを特徴とする請求項
    1、2、3又は4記載の情報検索装置。 6、クラスタ選択手段が検索する知識情報の個数を指定
    する検索個数指定手段を設け、この検索個数指定手段の
    指定個数の近似値に各クラスタに付属する前記知識情報
    の個数を規制するクラスタ限定手段を設けたことを特徴
    とする請求項5記載の情報検索装置。 7、クラスタ選択手段が検索する知識情報の個数を指定
    する検索個数指定手段を設け、この検索個数指定手段の
    指定個数以下に各クラスタに付属する前記知識情報の個
    数を規制するクラスタ限定手段を設けたことを特徴とす
    る請求項5記載の情報検索装置。 8、予め情報記憶手段に記憶された複数の知識情報の一
    つを検索基準として指定する情報指定手段を設け、この
    情報指定手段で指定された知識情報が付属するクラスタ
    の一つを選択するクラスタ選択手段を設けたことを特徴
    とする請求項1、2、3及び4記載の情報検索装置。
JP2316504A 1990-11-20 1990-11-20 情報検索装置 Pending JPH04184678A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2316504A JPH04184678A (ja) 1990-11-20 1990-11-20 情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2316504A JPH04184678A (ja) 1990-11-20 1990-11-20 情報検索装置

Publications (1)

Publication Number Publication Date
JPH04184678A true JPH04184678A (ja) 1992-07-01

Family

ID=18077841

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2316504A Pending JPH04184678A (ja) 1990-11-20 1990-11-20 情報検索装置

Country Status (1)

Country Link
JP (1) JPH04184678A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0962703A (ja) * 1995-08-30 1997-03-07 Nec Corp データベース検索システムおよびその情報検索処理方法
WO1999030259A1 (fr) * 1997-12-08 1999-06-17 Nippon Steel Corporation Appareil, systeme et procede d'echange de biens, et support de donnees
JP2002109536A (ja) * 2000-09-22 2002-04-12 Nightingale Technologies Ltd データクラスタリング方法とアプリケーション
JPWO2006028213A1 (ja) * 2004-09-11 2008-05-08 好邦 田村 広告・情報配信システム
JP2010211793A (ja) * 2009-02-26 2010-09-24 Fujitsu Ltd 自動オントロジーのためのドメインコーパス及び辞書の生成
US7904870B2 (en) 2008-04-30 2011-03-08 International Business Machines Corporation Method and apparatus for integrated circuit design model performance evaluation using basic block vector clustering and fly-by vector clustering

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0962703A (ja) * 1995-08-30 1997-03-07 Nec Corp データベース検索システムおよびその情報検索処理方法
WO1999030259A1 (fr) * 1997-12-08 1999-06-17 Nippon Steel Corporation Appareil, systeme et procede d'echange de biens, et support de donnees
JP2002109536A (ja) * 2000-09-22 2002-04-12 Nightingale Technologies Ltd データクラスタリング方法とアプリケーション
JPWO2006028213A1 (ja) * 2004-09-11 2008-05-08 好邦 田村 広告・情報配信システム
JP4832307B2 (ja) * 2004-09-11 2011-12-07 好邦 田村 広告・情報配信システム
US7904870B2 (en) 2008-04-30 2011-03-08 International Business Machines Corporation Method and apparatus for integrated circuit design model performance evaluation using basic block vector clustering and fly-by vector clustering
JP2010211793A (ja) * 2009-02-26 2010-09-24 Fujitsu Ltd 自動オントロジーのためのドメインコーパス及び辞書の生成

Similar Documents

Publication Publication Date Title
JP4098539B2 (ja) プロファイル情報の推薦方法、プログラム及び装置
US6845354B1 (en) Information retrieval system with a neuro-fuzzy structure
JP2010009577A (ja) 情報処理装置、全文検索方法、全文検索プログラム、及び記録媒体
KR20080031262A (ko) 관계 네트워크
JP6260294B2 (ja) 情報検索装置、情報検索方法および情報検索プログラム
JPH05151271A (ja) 情報検索装置
JP4017354B2 (ja) 情報分類装置および情報分類プログラム
JP6736224B2 (ja) 文章解析装置及び文章解析プログラム
JPWO2017104043A1 (ja) 画像処理装置、画像検索インタフェース表示装置、及び画像検索インタフェースの表示方法
JPH04184678A (ja) 情報検索装置
JP4325370B2 (ja) 文書関連語彙獲得装置及びプログラム
JPH05101107A (ja) 適合率を用いた絞り込みデータ検索装置及び方法
JP3686802B2 (ja) データベース検索方法、装置、およびデータベース検索プログラムを記録した記録媒体
JP2008152641A (ja) 類似例文検索装置
JPH08287086A (ja) 適合度順画像強調表示方法及び装置
JP2005063157A (ja) 文書クラスタ抽出装置および方法
JP2003256472A (ja) 文書検索システム
JP2005332080A (ja) 視覚的情報分類方法及び装置及びプログラム及び視覚的情報分類プログラムを記録した記憶媒体
JPH11213004A (ja) データ処理装置及びその方法、及びそのプログラムを記憶した記憶媒体
JP2003150635A (ja) 検索装置、画像検索装置、音声検索装置、語句検索装置及び検索プログラム、並びに検索方法
JP2001117930A (ja) 文書分類装置、文書分類方法および記録媒体
JP6756648B2 (ja) 生成装置、生成方法および生成プログラム
JP4010711B2 (ja) ターム評価プログラムを記憶した記憶媒体
JPH10232871A (ja) 検索装置
JP4705430B2 (ja) 距離の概念に基づく言語処理装置