JPH10187739A - 情報検索装置 - Google Patents

情報検索装置

Info

Publication number
JPH10187739A
JPH10187739A JP8341945A JP34194596A JPH10187739A JP H10187739 A JPH10187739 A JP H10187739A JP 8341945 A JP8341945 A JP 8341945A JP 34194596 A JP34194596 A JP 34194596A JP H10187739 A JPH10187739 A JP H10187739A
Authority
JP
Japan
Prior art keywords
search
node
question
leaf
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8341945A
Other languages
English (en)
Other versions
JP2985805B2 (ja
Inventor
Katsumi Nihei
克己 二瓶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP8341945A priority Critical patent/JP2985805B2/ja
Publication of JPH10187739A publication Critical patent/JPH10187739A/ja
Application granted granted Critical
Publication of JP2985805B2 publication Critical patent/JP2985805B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】最も効果的な順に質問と回答をユーザに提示す
ることにより、ユーザが提示された回答を選択するだけ
で情報検索結果の絞り込みができるようにする。 【解決手段】検索対象のデータを格納した検索対象デー
タベース1と、階層構造インデックス2と、ユーザから
の入力を受付ける検索条件入力受付部3と、検索条件式
を記憶する検索条件式記憶部4と、検索条件と検索条件
式とを統合して検索実行可能な検索条件式を生成する検
索条件式生成部5と、検索実行可能な検索条件式に基づ
いて検索を実行する検索実行部6と、検索結果を記憶し
ておく検索結果記憶部7と、検索結果をユーザに表示す
る検索結果表示部8と、さらに検索条件を追加して検索
を実行することでより検索結果数を少なくしていくため
に、ユーザからの入力を受付ける絞り込み実行受付部9
と、絞り込みを行い、期待獲得情報量最大化原理に基づ
き質問順を決定する絞り込み実行部10とからなる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、検索対象への階層
構造インデックスを利用した検索結果の絞り込み機能を
備える情報検索装置に関する。
【0002】
【従来の技術】情報検索において、ユーザは検索条件を
入力して検索結果を得ている。そして、得られた検索結
果が多数存在した場合には検索結果の絞り込みをおこな
う必要がある。このとき、ユーザは何を検索条件として
入力すれば検索結果が絞り込まれるのか分らず、試行錯
誤で検索条件を追加したり削除したりして検索結果を絞
り込んでいた。
【0003】一部には、特開平7−65020号公報に
あるように、各々の情報に設定されているキーワードイ
ンデックスや、特開平4−114277号公報にあるよ
うに、階層構造インデックスを利用して絞り込みのため
の検索条件をユーザに提示する情報検索装置もある。し
かし、階層構造インデックスにもとづいて、検索結果の
絞り込みに効率の良いものから順番に条件をユーザに提
示してくる情報検索装置は存在しなかった。
【0004】
【発明が解決しようとする課題】上述した従来の技術に
おいては、検索結果が多数存在した場合の検索結果の絞
り込みにおいて、ユーザは何を検索条件として入力すれ
ば検索結果が絞り込まれるのか分らず、試行錯誤で検索
条件を追加したり削除したりして検索結果を絞り込む必
要があった。
【0005】本発明は、ユーザにとって理解しやすい構
造である検索対象への階層構造インデックスのノード
を、絞り込みが最も効果的になるような順に質問と回答
という形でユーザに提示し、ユーザは提示された回答を
選択するだけで検索結果の絞り込みを行うことができる
情報検索装置を提供することを目的とする。
【0006】
【課題を解決するための手段】本発明の第1の情報検索
装置は、検索対象のデータを格納した検索対象データベ
ースと、ノードとリーフからなり、ノードはその下の階
層に複数のノードまたはリーフを持つことができ、リー
フはその下の階層にノードまたはリーフを持たず検索対
象へのインデックスを持つ階層構造インデックスと、ユ
ーザからの検索条件の入力を受け付ける検索条件入力受
付部と、検索条件式を記憶しておく検索条件式記憶部
と、前記検索条件入力受付部で入力された検索条件と前
記検索条件式記憶部に記憶されている検索条件式を統合
して検索実行可能な検索条件式に変換して生成する検索
条件式生成部と、前記検索条件式生成部で生成された検
索条件式にもとづいて前記検索対象データベースに対し
て検索を実行する検索実行部と、前記検索実行部で得ら
れた検索結果を記憶しておく検索結果記憶部と、前記検
索結果記憶部に記憶されている検索結果をユーザに表示
する検索結果表示部と、前記検索結果表示部が表示を実
行したことを受け、検索結果の集合に対して、さらに検
索条件を追加して検索を実行することでより検索結果数
を少なくしていく処理をユーザから受け付ける絞り込み
実行受付部と、前記絞り込み実行受付部からの出力を受
け、絞り込みを実行する絞り込み実行部とを有すること
を特徴とする。
【0007】本発明の第2の情報検索装置は、本発明の
第1の情報検索装置において、前記絞り込み実行部は、
質問ノードを、検索結果として得られた検索対象データ
へのインデックスを持つ階層構造インデックスの各リー
フから、階層を上に上がっていって同一階層構造インデ
ックス内の全ての先のリーフが最初にたどりつく共通ノ
ードとし、回答ノードを、検索結果として得られた検索
対象データへのインデックスを持つ階層構造インデック
スの各リーフから、階層を上に上がっていって得られた
質問ノードの一つ下の階層のノードとし、前記検索結果
記憶部で得られた検索結果数が1以下なら終了し、前記
階層構造インデックスから質問ノードを得て、前記質問
ノード数が0なら終了し、前記各質問ノードの回答ノー
ドを得て、検索結果の同一データへのインデックスを持
つリーフが同一前記質問ノードの異なる前記回答ノード
の下の階層にまたがって存在する場合、その回答ノード
を質問ノードとして新たな質問ノードに対する回答ノー
ドを求める処理をまたがりがなくなるまで繰り返し、前
記質問ノードによって得られる検索結果へのインデック
スを持つリーフが、全て同じ階層でかつ前記質問ノード
の階層が先のリーフの一つ上または同じ階層の場合、そ
の前記質問ノードは使用不可にし、前記質問ノードの使
用可能な数が0なら終了し、各前記質問ノードについ
て、質問順を計算し、計算した順番にしたがって前記質
問ノードと前記回答ノードをユーザに提示し、ユーザか
らの入力を受け付け、終了を選択すれば終了し、回答ノ
ードを選択すれば絞り込みを実行し、選択された前記回
答ノードによって得られるリーフに設定された検索結果
を新たな検索結果とし、以上の処理を繰り返す機構を有
することを特徴とする。
【0008】本発明の第3の情報検索装置は、本発明の
第2の情報検索装置において、前記質問順の計算は、期
待獲得情報量最大化原理にもとづき、Cを属性とその属
性値、所属クラスによって表現される事例集合とし、A
を属性の集合とし、kをクラスの数,pjを事例集合C
の中でクラスjに属する事例の比率とすると、事例集合
Cの情報量(エントロピー)M(C)は以下の式で表せ、
【0009】Cをある属性aの属性値a1, ...,anによ
って部分集合C1, ...,Cnに分割したときの期待情報
量B(C,a)は以下の式で表せ、
【0010】獲得情報量の期待値gain(C,a)は以下の
式になり、 gain(C,a)=M(C)−B(C,a) このgain(C,a)を最大にする属性aで事例集合を分割
していくことで、効率的に事例をクラスに分けることが
でき、各検索結果はそれぞれ別のクラスであるとして扱
い、属性は質問として使用するノードとし、属性値は回
答として使用するノードとし、gainの大きいものから質
問することで質問回数を最小にすることが期待される質
問順計算機構を有することを特徴とする。
【0011】
【発明の実施の形態】本発明の発明の実施の形態につい
て図面を参照して説明する。
【0012】図1は、本発明の一実施の形態の構成を示
すブロック図であり、本発明の情報検索装置は、検索対
象のデータを格納した検索対象データベース1と、ノー
ドとリーフからなり、ノードはその下の階層に複数のノ
ードまたはリーフを持つことができ、リーフはその下の
階層にノードまたはリーフを持たず検索対象へのインデ
ックスを持つ階層構造インデックス2と、ユーザからの
検索条件の入力を受け付ける検索条件入力受付部3と、
検索条件式を記憶しておく検索条件式記憶部4と、検索
条件入力受付部3で入力された検索条件と検索条件式記
憶部4に記憶されている検索条件式を統合して検索実行
可能な検索条件式に変換して生成する検索条件式生成部
5と、検索条件式生成部5で生成された検索条件式にも
とづいて検索対象データベース1に対して検索を実行す
る検索実行部6と、検索実行部6で得られた検索結果を
記憶しておく検索結果記憶部7と、検索結果記憶部7に
記憶されている検索結果をユーザに表示する検索結果表
示部8と、検索結果表示部8が表示を実行したことを受
け、検索結果の集合に対して、さらに検索条件を追加し
て検索を実行することでより検索結果数を少なくしてい
くために、ユーザからの入力を受け付ける絞り込み実行
受付部9と、絞り込み実行受付部9からの出力を受け、
絞り込みを実行する絞り込み実行部10とから構成され
る。
【0013】次に、図1の各構成部分について説明す
る。
【0014】検索対象データベース1は、検索対象のデ
ータを格納する。例えば、図1の検索対象データベース
1の一実施の形態を示す図である図2に示すように、植
物のデータを関係データベースに格納した場合には、テ
ーブル「植物」20に、フィールド「ID」21,フィ
ールド「植物名」22,フィールド「キーワード」2
3,フィールド「記述」24などが格納される。
【0015】階層構造インデックス2は、検索対象デー
タベース1への階層構造状のインデックスを格納する。
例えば、検索対象データベースに植物のデータが格納さ
れている場合には、図1の階層構造インデックス2の一
実施の形態を示す図である図3に示したような階層構造
のインデックスが格納される。
【0016】図3は植物のデータを「葉の特徴」30と
いう観点で階層的に分類したものを階層構造インデック
スとしてある。「葉はどのようについていますか」30
aはノードの例で、その下の階層に他のノード,リーフ
を持つ。「コセンダングサ」311aはリーフの例で、
その下の階層に他のノード,リーフを持たず、検索対象
データベース1の各データ101へのインデックスとな
っている。検索対象データを分類する観点は一般に複数
ある。例えば植物のデータの場合には「葉の特徴」,
「茎の高さ」などが考えられる。そこで、階層構造イン
デックスは異なる観点ごとに複数持つことができる。
【0017】検索条件入力受付部3は、ユーザからの検
索条件の入力を受け付ける。検索条件の入力方法には、
例えばキーワードを「タンポポ OR 白」のように論
理式で組み合わせるものなどがある。
【0018】検索条件式生成部5は、検索条件入力受付
部3で入力された検索条件と検索条件式記憶部4に記憶
されている検索条件式を統合して検索実行可能な検索条
件式に変換して生成する。検索条件式生成部5からの出
力を受けた場合には、検索条件式生成部5の生成した部
分検索条件式と検索条件式記憶部4に記憶されている検
索条件式を統合して検索実行可能な検索条件式に変換し
て生成する。例えば、検索対象データベース1が関係デ
ータベースの形式で格納されているならば、検索条件式
は関係データベースの標準的な問い合わせ言語であるS
QL(Structured Query Language)式となる。
【0019】検索条件式記憶部4に記憶されていた検索
条件式が SELECT*FROM 植物 WHERE キーワード=“四角形” であったとする。このSQL式はテーブル「植物」から
フィールド「キーワード」の値が四角形であるデータを
検索するものである。検索条件入力受付部3で入力され
た検索条件がキーワード「タンポポ」であった場合に論
理和で統合すると検索条件式生成部5はSELECT*FROM 植
物 WHERE キーワード=“四角形” OR キーワード=
“タンポポ”といった検索条件式を生成する。この式は
テーブル「植物」からフィールド「キーワード」の値が
四角形またはタンポポのデータを検索するものである。
ここでは論理和としたがこれに限定せず、論理積でもよ
い。
【0020】検索条件式記憶部4は、検索条件式生成部
5で生成された検索条件式を記憶しておく。
【0021】検索実行部6は、検索条件式生成部5で生
成された検索条件式にもとづいて検索対象データベース
1に対して検索を実行する。例えば、検索対象データベ
ース1が関係データベースの形式で格納されているなら
ば検索条件式を関係データベース管理システムに発行す
ればよい。
【0022】検索結果記憶部7は、検索実行部6で得ら
れた検索結果を記憶しておく。
【0023】検索結果表示部8は、検索結果記憶部7に
記憶されている検索結果をユーザに表示する。図4は図
1の検索結果表示部8の一実施の形態を示す図である
が、例えば、植物のデータを検索して、コンピュータの
グラフィカルユーザインタフェースを使用して、ディス
プレイ上に検索結果40を表示したものである。41は
検索された植物の件数,42は検索された植物の名前の
一覧である。
【0024】絞り込み実行受付部9は、検索結果表示部
8が表示を実行したことを受け、絞り込みを実行するた
めのユーザからの入力を受け付ける。例えば、図4は検
索結果が表示されていて、43が絞り込みを実行するボ
タンであったとする。絞り込み実行受付部9は、ユーザ
が「絞り込み」ボタン43を選択することで絞り込みの
実行を開始する。
【0025】次に、絞り込み実行部10の動作について
図5〜図7を用いて詳細に説明する。
【0026】図5および図6は、図1の絞り込み実行部
10の一実施の形態を示す図であり、図7は、絞り込み
のアルゴリズムのフローチャートである。
【0027】例えば検索対象データが植物のデータの場
合、階層構造インデックスが図5に示すように「葉の
形」50と「生息地」55の二つあったとする。検索対
象データへのインデックスを階層構造インデックス「葉
の形」50ではリーフ52a〜52fまで持ち、階層構
造インデックス「生息地」55ではリーフ57a〜57
gまで持つ。ここで、リーフ57cと57gは同じ検索
対象データへのインデックスである。
【0028】ここで、以下の説明で使用する用語の定義
を述べる。
【0029】質問ノードとは、検索結果として得られた
検索対象データへのインデックスを持つ階層構造インデ
ックスの各リーフから、階層を上に上がっていって同一
階層構造インデックス内の全ての先のリーフが最初にた
どりつく共通ノードとする。
【0030】回答ノードとは、検索結果として得られた
検索対象データへのインデックスを持つ階層構造インデ
ックスの各リーフから、階層を上に上がっていって得ら
れた質問ノードの一つ下の階層のノードとする。例え
ば、図5において、検索対象データとして「シロバナセ
ンダングサ」,「アメリカセンダングサ」,「シオザキ
ソウ」,「センダングサ」の4件が検索結果として得ら
れたとする。階層構造インデックス「生息地」55の検
索対象データへのインデックスを持つリーフは57a,
57b,57e,57fとなる。この場合の質問ノード
は、各リーフから階層を上に上げていってたどりつく共
通ノードである「生息地」56である。回答ノードはそ
の直下にある「草地」56aと「湿地」56bである。
【0031】別の状況として検索結果が「コセンダング
サ」,「シオザキソウ」,「センダングサ」の3件の場
合には、質問ノードは今度は「湿地」56bになる。回
答ノードはその直下にある「河岸」56dと「沼地」5
6eである。
【0032】以上の定義をもとに、絞り込みの実行につ
いて図7のフローチャートにより説明する。
【0033】まず、キーワード検索などいずれかの方法
で検索を実行し、「アワユキセンダングサ」,「コセン
ダングサ」,「シオザキソウ」,「センダングサ」の4
件の植物のデータが検索されたとする。以下、この検索
結果にもとづいて説明する。
【0034】ステップS100では、検索結果記憶部7
で得られた検索結果数が1以下なら終了し、そうでない
ならステップS101へと進む。
【0035】ステップS101では、階層構造インデッ
クス2から質問ノードを得る。図5で説明すると、階層
構造インデックス「葉の形」50の場合、質問ノードは
ノード「葉の形」51である。階層構造インデックス
「生息地」55の質問ノードはノード「生息地」56で
ある。
【0036】ステップS102では、ステップS101
で得られた質問ノード数が0なら終了し、そうでないな
らステップS103へ進む。
【0037】ステップS103では、ステップS101
で得られた各質問ノードの回答ノードを得る。図5で説
明すると、質問ノード「葉の形」51の回答ノードはノ
ード「とがっている」51aとノード「丸い」51bの
二つである。同様にして質問ノード「生息地」56の回
答ノードは、ノード「湿地」56bとノード「荒れ地」
56fである。
【0038】ステップS104では、ステップS101
で得られた各質問ノードの回答ノードで重複するインデ
ックスの除去を行なう。質問ノードの回答選択肢である
回答ノードによって検索結果が分割されるが、検索結果
の同一データへのインデックスを持つリーフが同一質問
ノードの異なる回答ノードの下の階層にまたがって存在
する場合、その回答ノードを質問ノードとして新たな質
問ノードに対する回答ノードを求める。この処理をまた
がりがなくなるまで繰り返す。
【0039】図5の例の場合は、質問ノード「葉の形」
51の回答ノード「とがっている」51aでは「アワユ
キセンダングサ」,「コセンダングサ」が得られ、回答
ノード「丸い」51bでは「シオザキソウ」,「センダ
ングサ」が得られる。この場合は、またがりがない。
【0040】質問ノード「生息地」56の回答ノード
「湿地」56bでは「アワユキセンダングサ」、「コセ
ンダングサ」、「シオザキソウ」、「センダングサ」が
得られ、回答ノード「荒れ地」56fでは「アワユキセ
ンダングサ」が得られる。この場合は「アワユキセンダ
ングサ」が回答ノード「湿地」56bと「荒れ地」56
fでまたがって存在する。そこで、回答ノード「湿地」
56bと「荒れ地」56fを新たな質問ノードとして、
その回答ノードを求める。質問ノード「湿地」56bの
回答ノードはノード「田んぼ」56c,ノード「河岸」
56d,ノード「沼地」56eである。質問ノード「荒
れ地」56fの回答ノードはノード「放牧地」56gで
ある。これでまたがりは存在しない。
【0041】ステップS105では、質問ノードの使用
可、不可の判定を行なう。ステップS104で得られた
質問ノードによって得られる検索結果へのインデックス
を持つリーフが全て同じ階層で、かつ、質問ノードの階
層が先のリーフの一つ上または同じ階層の場合、その質
問ノードは使用不可にする。
【0042】図5の例の場合は、質問ノード「葉の形」
51によって得られる検索結果へのインデックスを持つ
リーフは「アワユキセンダングサ」52c,「コセンダ
ングサ」52d,「シオザキソウ」52e,「センダン
グサ」52fである。これらのリーフは全て同じ階層で
あるが、質問ノード「葉の形」51が同じ階層でも一つ
上の階層でもないので使用可能である。
【0043】質問ノード「湿地」56bによって得られ
る検索結果へのインデックスを持つリーフは「アワユキ
センダングサ」57c,「コセンダングサ」57d,
「シオザキソウ」57e,「センダングサ」57fであ
る。これらのリーフは全て同じ階層であるが、質問ノー
ド「湿地」56bが同じ階層でも一つ上の階層でもない
ので使用可能である。
【0044】質問ノード「荒れ地」56fによって得ら
れる検索結果へのインデックスを持つリーフは「アワユ
キセンダングサ」57gである。これらのリーフは全て
同じ階層であるが、質問ノード「荒れ地」56fが同じ
階層でも一つ上の階層でもないので使用可能である。
【0045】ステップS106では終了判定を行なう。
ステップS105で判定された質問ノードの使用可能な
数が0なら終了する。そうでないならステップS107
へ進む。
【0046】ステップS107では、質問順の決定を行
なう。各質問ノードについて、その質問をすることによ
って得られる期待獲得情報量を計算し(後述)、期待獲
得情報量の大きい順に質問ノードをソートする。図5の
例の場合は、質問ノード「湿地」56b,質問ノード
「葉の形」51,質問ノード「荒れ地」56fの順であ
る。
【0047】ステップS108では、ステップS107
で計算した順番にしたがって質問ノードと回答ノードを
ユーザに提示する。例えば、図6は図5の例の場合で、
コンピュータのグラフィカルユーザインタフェースを使
用して、ディスプレイ上に質問「1.湿地」61a,
「2.葉の形」61b,「3.荒れ地」61cと回答
「田んぼ」62a,「河岸」62b,「沼地」62cを
表示したものである。ここで、ユーザが「1.湿地」6
1aを選択すると、選択された質問「1.湿地」61a
の回答選択肢として回答62a,62b,62cが表示
される。これはユーザに「植物が湿地に生息するものの
うち、田んぼか河岸か沼地のどこに生息するのか」を提
示している。63は検索された植物の件数,64は検索
された植物の名前の一覧である。
【0048】ステップS109では、ユーザからの入力
を受け付ける。終了を選択すれば終了する。回答ノード
を選択すれば絞り込みを実行するためステップS110
へ進む。図6の例の場合は終了ボタン66を選択すれば
終了し、回答「田んぼ」62aを選択して絞り込みボタ
ン65を選択すると絞り込みを実行する。
【0049】ステップS110では、絞り込みを実行す
る。選択された回答ノードによって得られるリーフに設
定された検索結果を新たな検索結果とし、ステップS1
00へ進む。図6の例の場合に回答「田んぼ」62aを
選択したとすると、図5の回答ノード「田んぼ」56c
の下の階層のリーフ「アワユキセンダングサ」57cに
よってインデックス付けされた検索対象データ1件に絞
り込まれる。
【0050】次に、ステップS107の質問順の決定に
ついて詳細に説明する。質問順の決定はID3(J.R.Qui
nlan, ”Induction of Decision Trees”, Machine Lea
rning, Vol.1, pp.81-pp.106, 1986)等で使用されてい
る期待獲得情報量最大化原理にもとづいている。この原
理を簡単に説明する。Cを属性とその属性値、所属クラ
スによって表現される事例集合とする。Aを属性の集合
とし、kをクラスの数,pjを事例集合Cの中でクラス
jに属する事例の比率とすると、事例集合Cの情報量
(エントロピー)M(C)は以下の式で表せる。
【0051】
【0052】Cをある属性aの属性値a1, ...,anに
よって部分集合C1, ...,Cnに分割したときの期待情
報量B(C,a)は以下の式で表せる。
【0053】
【0054】獲得情報量の期待値gain(C,a)は以下の
式になる。
【0055】gain(C,a)=M(C)−B(C,a) このgain(C,a)を最大にする属性aで事例集合を分割
していくことで、効率的に事例をクラスに分けることが
できる。
【0056】本発明の場合、各検索結果はそれぞれ別の
クラスであるとして扱う。属性は質問として使用するノ
ードになり、属性値は回答として使用するノードとな
る。質問順の決定は以下に示す処理をおこない、gainの
大きいものから質問することで質問回数を最小にするこ
とが期待される。
【0057】ステップ1:検索結果集合の情報量(エン
トロピー)M(C)を計算。
【0058】
【0059】ステップ2:検索結果集合から属性=質問
ノードaをひとつ取り出し、質問ノードaの属性値=回
答ノードa1, ... ,anによって検索結果集合を分割
した場合の期待情報量B(C,a)を計算する。
【0060】
【0061】ステップ3:ステップ2で取り出した質問
ノードaの獲得情報量の期待値gain(C,a)を計算す
る。
【0062】gain(C,a)=M(C)−B(C,a) (bits) ステップ4:検索結果集合にまだ取り出してない質問ノ
ードがあるならステップ2へ。なければ終了。
【0063】図5の例の場合には検索結果数=4なの
で、検索結果集合の情報量M(C)は以下のようになる。
【0064】
【0065】質問ノード「葉の形」51の期待情報量B
(C,葉の形)を計算する。質問ノード「葉の形」51は
回答ノードとして「とがっている」51a,「丸い」5
1bを持つ。属性値数=2、回答ノード「とがってい
る」51aで得られる検索結果数=2、回答ノード「丸
い」51bで得られる検索結果数=2である。以上か
ら、期待情報量B(C,葉の形)は以下のようになる。
【0066】
【0067】同様にして質問ノード「湿地」56bと質
問ノード「荒れ地」56fの期待情報量B(C,湿地)と
B(C,荒れ地)を計算する。
【0068】
【0069】次に質問ノード「葉の形」51のgain(C,
葉の形),質問ノード「湿地」56bのgain(C,湿地),
質問ノード「荒れ地」56fのgain(C,荒れ地)を計
算する。
【0070】 gain(C,葉の形) =M(C)−B(C,葉の形) (bits) =2.000-1.000 =1.000 gain(C,湿地) =M(C)−B(C,湿地) (bits) =2.000-0.500 =1.500 gain(C,荒れ地)=M(C)−B(C,荒れ地) (bits) =2.000-1.189 =0.811 以上から質問順はgainの大きい順に、質問ノード「湿
地」56b,質問ノード「葉の形」51,質問ノード
「荒れ地」56fの順になる。
【0071】
【発明の効果】上述したように、本発明の効果は、ユー
ザにとって理解しやすい構造である検索対象への階層構
造状インデックスのノードを、絞り込みに最も効果的な
順に質問と回答としてユーザに提示することにより、ユ
ーザが提示された回答を選択するだけで検索結果の絞り
込みが可能になったことである。
【図面の簡単な説明】
【図1】本発明の一実施の形態の構成を示すブロック図
である。
【図2】図1の検索対象データベース1の一実施の形態
を示す図である。
【図3】図1の階層構造インデックス2の一実施の形態
を示す図である。
【図4】図1の検索結果表示部8の一実施の形態を示す
図である。
【図5】図1の絞り込み実行部10の一実施の形態を示
す図である。
【図6】図1の絞り込み実行部10の一実施の形態を示
す図である。
【図7】絞り込みのアルゴリズムのフローチャートであ
る。
【符号の説明】
1 検索対象データベース 2 階層構造インデックス 3 検索条件入力受付部 4 検索条件式記憶部 5 検索条件式生成部 6 検索実行部 7 検索結果記憶部 8 検索結果表示部 9 絞り込み実行受付部 10 絞り込み実行部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 検索対象のデータを格納した検索対象デ
    ータベースと、 ノードとリーフからなり、ノードはその下の階層に複数
    のノードまたはリーフを持つことができ、リーフはその
    下の階層にノードまたはリーフを持たず検索対象へのイ
    ンデックスを持つ階層構造インデックスと、 ユーザからの検索条件の入力を受け付ける検索条件入力
    受付部と、 検索条件式を記憶しておく検索条件式記憶部と、 前記検索条件入力受付部で入力された検索条件と前記検
    索条件式記憶部に記憶されている検索条件式を統合して
    検索実行可能な検索条件式に変換して生成する検索条件
    式生成部と、 前記検索条件式生成部で生成された検索条件式にもとづ
    いて前記検索対象データベースに対して検索を実行する
    検索実行部と、 前記検索実行部で得られた検索結果を記憶しておく検索
    結果記憶部と、 前記検索結果記憶部に記憶されている検索結果をユーザ
    に表示する検索結果表示部と、 前記検索結果表示部が表示を実行したことを受け、検索
    結果の集合に対して、さらに検索条件を追加して検索を
    実行することでより検索結果数を少なくしていく処理を
    ユーザから受け付ける絞り込み実行受付部と、 前記絞り込み実行受付部からの出力を受け、絞り込みを
    実行する絞り込み実行部と、 を有することを特徴とする情報検索装置。
  2. 【請求項2】 前記絞り込み実行部は、 質問ノードを、検索結果として得られた検索対象データ
    へのインデックスを持つ階層構造インデックスの各リー
    フから、階層を上に上がっていって同一階層構造インデ
    ックス内の全ての先のリーフが最初にたどりつく共通ノ
    ードとし、回答ノードを、検索結果として得られた検索
    対象データへのインデックスを持つ階層構造インデック
    スの各リーフから、階層を上に上がっていって得られた
    質問ノードの一つ下の階層のノードとし、 前記検索結果記憶部で得られた検索結果数が1以下なら
    終了し、 前記階層構造インデックスから質問ノードを得て、 前記質問ノード数が0なら終了し、 前記各質問ノードの回答ノードを得て、 検索結果の同一データへのインデックスを持つリーフが
    同一前記質問ノードの異なる前記回答ノードの下の階層
    にまたがって存在する場合、その回答ノードを質問ノー
    ドとして新たな質問ノードに対する回答ノードを求める
    処理をまたがりがなくなるまで繰り返し、 前記質問ノードによって得られる検索結果へのインデッ
    クスを持つリーフが、全て同じ階層でかつ前記質問ノー
    ドの階層が先のリーフの一つ上または同じ階層の場合、
    その前記質問ノードは使用不可にし、 前記質問ノードの使用可能な数が0なら終了し、 各前記質問ノードについて、質問順を計算し、 計算した順番にしたがって前記質問ノードと前記回答ノ
    ードをユーザに提示し、ユーザからの入力を受け付け、
    終了を選択すれば終了し、回答ノードを選択すれば絞り
    込みを実行し、 選択された前記回答ノードによって得られるリーフに設
    定された検索結果を新たな検索結果とし、以上の処理を
    繰り返す機構を有することを特徴とする請求項1記載の
    情報検索装置。
  3. 【請求項3】 前記質問順の計算は、 期待獲得情報量最大化原理にもとづき、Cを属性とその
    属性値、所属クラスによって表現される事例集合とし、
    Aを属性の集合とし、kをクラスの数,pjを事例集合
    Cの中でクラスjに属する事例の比率とすると、事例集
    合Cの情報量(エントロピー)M(C)は以下の式で表せ、 Cをある属性aの属性値a1, ...,anによって部分集合
    C1, ...,Cnに分割したときの期待情報量B(C,a)は
    以下の式で表せ、 獲得情報量の期待値gain(C,a)は以下の式になり、 gain(C,a)=M(C)−B(C,a) このgain(C,a)を最大にする属性aで事例集合を分割
    していくことで、効率的に事例をクラスに分けることが
    でき、 各検索結果はそれぞれ別のクラスであるとして扱い、 属性は質問として使用するノードとし、 属性値は回答として使用するノードとし、 gainの大きいものから質問することで質問回数を最小に
    することが期待される質問順計算機構を有することを特
    徴とする請求項2記載の情報検索装置。
JP8341945A 1996-12-20 1996-12-20 情報検索装置 Expired - Fee Related JP2985805B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8341945A JP2985805B2 (ja) 1996-12-20 1996-12-20 情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8341945A JP2985805B2 (ja) 1996-12-20 1996-12-20 情報検索装置

Publications (2)

Publication Number Publication Date
JPH10187739A true JPH10187739A (ja) 1998-07-21
JP2985805B2 JP2985805B2 (ja) 1999-12-06

Family

ID=18349982

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8341945A Expired - Fee Related JP2985805B2 (ja) 1996-12-20 1996-12-20 情報検索装置

Country Status (1)

Country Link
JP (1) JP2985805B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000194722A (ja) * 1998-12-24 2000-07-14 Nec Corp 情報検索装置及びその方法ならびに情報検索プログラムを格納した記憶媒体
JP2006113683A (ja) * 2004-10-12 2006-04-27 Patolis Corp 文献検索支援装置、その方法、文献検索装置、それらのプログラム、および、そのプログラムを記録した記録媒体
KR100884217B1 (ko) * 2000-11-28 2009-02-17 코닌클리케 필립스 일렉트로닉스 엔.브이. 계층적 오브젝트 구조에서의 검색 방법
US7730100B2 (en) 2005-11-14 2010-06-01 Canon Kabushiki Kaisha Information processing apparatus, information processing method, and storage medium
WO2011061980A1 (ja) * 2009-11-20 2011-05-26 シャープ株式会社 食事メニュー管理装置、食事メニュー管理システム、食事メニュー管理方法、食事メニュー管理プログラムおよび記録媒体
JP2012084029A (ja) * 2010-10-14 2012-04-26 Kyocera Mita Corp 文書管理装置及び文書管理プログラム
JP2015230514A (ja) * 2014-06-03 2015-12-21 Kddi株式会社 属性値が付与された情報要素を絞り込んで検索する対話検索プログラム、装置及び方法
JP6450051B2 (ja) * 2016-03-07 2019-01-09 楽天株式会社 フィルタ装置、フィルタ方法、非一時的な記録媒体およびプログラム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03174654A (ja) * 1989-12-01 1991-07-29 Matsushita Electric Ind Co Ltd ファイリング方法およびその装置
JPH0439774A (ja) * 1990-06-06 1992-02-10 Ricoh Co Ltd 検索方式
JPH04145578A (ja) * 1990-10-05 1992-05-19 Fujitsu Ltd 検索用キーワード指定の処理方法及び情報検索装置
JPH0728687A (ja) * 1993-07-15 1995-01-31 Fujitsu Ltd マルチメディア知識ベ−ス装置,及び、情報提供装置
JPH07129623A (ja) * 1993-11-08 1995-05-19 Fuji Xerox Co Ltd データ検索装置
JPH08147322A (ja) * 1994-11-24 1996-06-07 Toshiba Corp 情報検索装置
JPH08255166A (ja) * 1995-03-17 1996-10-01 Canon Inc データ管理方法及びそのシステム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03174654A (ja) * 1989-12-01 1991-07-29 Matsushita Electric Ind Co Ltd ファイリング方法およびその装置
JPH0439774A (ja) * 1990-06-06 1992-02-10 Ricoh Co Ltd 検索方式
JPH04145578A (ja) * 1990-10-05 1992-05-19 Fujitsu Ltd 検索用キーワード指定の処理方法及び情報検索装置
JPH0728687A (ja) * 1993-07-15 1995-01-31 Fujitsu Ltd マルチメディア知識ベ−ス装置,及び、情報提供装置
JPH07129623A (ja) * 1993-11-08 1995-05-19 Fuji Xerox Co Ltd データ検索装置
JPH08147322A (ja) * 1994-11-24 1996-06-07 Toshiba Corp 情報検索装置
JPH08255166A (ja) * 1995-03-17 1996-10-01 Canon Inc データ管理方法及びそのシステム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000194722A (ja) * 1998-12-24 2000-07-14 Nec Corp 情報検索装置及びその方法ならびに情報検索プログラムを格納した記憶媒体
US6470337B1 (en) 1998-12-24 2002-10-22 Nec Corporation Information retrieval system using a hierarchical index for narrowing a retrieval result and its method and storing medium with information retrieval program stored therein
KR100884217B1 (ko) * 2000-11-28 2009-02-17 코닌클리케 필립스 일렉트로닉스 엔.브이. 계층적 오브젝트 구조에서의 검색 방법
JP2006113683A (ja) * 2004-10-12 2006-04-27 Patolis Corp 文献検索支援装置、その方法、文献検索装置、それらのプログラム、および、そのプログラムを記録した記録媒体
US7730100B2 (en) 2005-11-14 2010-06-01 Canon Kabushiki Kaisha Information processing apparatus, information processing method, and storage medium
WO2011061980A1 (ja) * 2009-11-20 2011-05-26 シャープ株式会社 食事メニュー管理装置、食事メニュー管理システム、食事メニュー管理方法、食事メニュー管理プログラムおよび記録媒体
JP2012084029A (ja) * 2010-10-14 2012-04-26 Kyocera Mita Corp 文書管理装置及び文書管理プログラム
JP2015230514A (ja) * 2014-06-03 2015-12-21 Kddi株式会社 属性値が付与された情報要素を絞り込んで検索する対話検索プログラム、装置及び方法
JP6450051B2 (ja) * 2016-03-07 2019-01-09 楽天株式会社 フィルタ装置、フィルタ方法、非一時的な記録媒体およびプログラム
JPWO2017154074A1 (ja) * 2016-03-07 2019-01-10 楽天株式会社 フィルタ装置、フィルタ方法、非一時的な記録媒体およびプログラム

Also Published As

Publication number Publication date
JP2985805B2 (ja) 1999-12-06

Similar Documents

Publication Publication Date Title
JP3087694B2 (ja) 情報検索装置及びプログラムを記録した機械読み取り可能な記録媒体
US6618727B1 (en) System and method for performing similarity searching
US6980976B2 (en) Combined database index of unstructured and structured columns
US8037059B2 (en) Implementing aggregation combination using aggregate depth lists and cube aggregation conversion to rollup aggregation for optimizing query processing
JP3640346B2 (ja) データベース管理システムにおける集合述部および検索
EP1349081A1 (en) Method and apparatus for querying relational databases
US20020002550A1 (en) Process for enabling flexible and fast content-based retrieval
US6681222B2 (en) Unified database and text retrieval system
US20070073759A1 (en) Methods and systems for joining database tables using indexing data structures
CN109241278A (zh) 科研知识管理方法及系统
US20060074857A1 (en) Method and apparatus for querying relational databases
JP2985805B2 (ja) 情報検索装置
WO1998049632A1 (en) System and method for entity-based data retrieval
Li et al. Aggregate nearest keyword search in spatial databases
Doerr et al. Integration of complementary archaeological sources
Kumar et al. Fuzzy clustering of web documents using equivalence relations and fuzzy hierarchical clustering
US8745035B1 (en) Multistage pipeline for feeding joined tables to a search system
Yang et al. Developing Reliable Taxonomic Features for Data Warehouse Architectures
Amin et al. Extracting top-K interesting subgraphs with weighted query semantics
Bodra Processing queries over partitioned graph databases: An approach and it’s evaluation
Chen et al. Signature file hierarchies and signature graphs: a new index method for object-oriented databases
JP3066836B2 (ja) 知識ベースシステムにおける高速アクセス方式
Lucredio et al. Component retrieval using metric indexing
Karban Relational Data Mining and GUHA.
Singh et al. Integrating user's domain knowledge with association rule mining

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990831

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071001

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081001

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091001

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees