JPH11213000A - インタラクティブ情報検索方法及び装置及びインタラクティブ情報検索プログラムを格納した記憶媒体 - Google Patents

インタラクティブ情報検索方法及び装置及びインタラクティブ情報検索プログラムを格納した記憶媒体

Info

Publication number
JPH11213000A
JPH11213000A JP10017422A JP1742298A JPH11213000A JP H11213000 A JPH11213000 A JP H11213000A JP 10017422 A JP10017422 A JP 10017422A JP 1742298 A JP1742298 A JP 1742298A JP H11213000 A JPH11213000 A JP H11213000A
Authority
JP
Japan
Prior art keywords
information
search
user
document
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10017422A
Other languages
English (en)
Inventor
Yoshihiko Hayashi
林  良彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP10017422A priority Critical patent/JPH11213000A/ja
Publication of JPH11213000A publication Critical patent/JPH11213000A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 情報検索の結果が単なる文書のリストによっ
てしか提示されないために、ユーザは、情報検索の結果
を起点とした効率的な情報ナビゲーション行動ができな
いといいう課題を解決した、インタラクティブなインタ
クティブ情報検索方法及び装置及びインラクティブ情報
検索プログラムを格納した記憶媒体を提供する。 【解決手段】 本発明は、ドキュメントア−カイブを検
索対象として、ユーザの情報要求に基づいて基本的な情
報検索を行い、情報検索により取得した検索結果のリス
トにおけるドキュメント群を互いに類似したドキュメン
トにより構成されるドキュメント集合に分類し、検索結
果の各ドキュメント集合から特徴的な単語のリストを抽
出し、分類されたグループと、抽出された単語のリスト
に基づいてユーザに対してインタラクティブに操作可能
な出力画面の情報を生成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、インタクティブ情
報検索方法及び装置及びインラクティブ情報検索プログ
ラムを格納した記憶媒体に係り、特に、ドキュメントア
−カイブをユーザの情報要求に従って検索する情報検索
システムにおいて、検索結果を自動分類し、検索結果の
ドキュメント群において特徴的な単語リストを求めるこ
とにより、ユーザの次の情報検索行動を支援するための
出力情報を提供し、これにより、ユーザのインタラクテ
ィブな情報検索行動を支援するためのインタクティブ情
報検索方法及び装置及びインラクティブ情報検索プログ
ラムを格納した記憶媒体に関する。
【0002】
【従来の技術】従来の情報検索システムにおいては、ユ
ーザの情報検索要求に対して検索されたドキュメントア
−カイブ中の各ドキュメントについて、ユーザの情報要
求に対する適合度を計算し、これによってソートされた
ドキュメントのリストをユーザに提示することが通常行
われている。
【0003】
【発明が解決しようとする課題】しかしながら、上記の
従来の情報検索システムでは、この適合度は必ずしもユ
ーザの意向や直感を反映するものであるとは限らない。
また、単なるドキュメントのリストであるため、情報検
索結果を起点とするユーザの情報ナビゲーション行動を
支援するには十分でない。
【0004】また、近年のインターネット上のサーチエ
ンジンに顕著なように、膨大なドキュメント群(この場
合はWWW上のページ群)を対象とする場合、リストは
膨大なものになる場合も多く、リストの各要素であるド
キュメントを全てユーザがチェックすることは事実上不
可能と言える。本発明は、上記の点に鑑みなされたもの
で、情報検索の結果が単なる文書のリストによってしか
提示されないために、ユーザは、情報検索の結果を起点
とした効率的な情報ナビゲーション行動ができないとい
う課題を解決する、インタラクティブなインタクティブ
情報検索方法及び装置及びインラクティブ情報検索プロ
グラムを格納した記憶媒体を提供することを目的とす
る。
【0005】
【課題を解決するための手段】図1は、本発明の原理を
説明するための図である。本発明(請求項1)は、予め
構築されたドキュメントア−カイブをユーザにより入力
される情報要求に従って検索するインタラクティブ情報
検索方法において、ドキュメントア−カイブを検索対象
として、ユーザの情報要求に基づいて基本的な情報検索
を行い(ステップ1)、情報検索により取得した検索結
果のリストにおけるドキュメント群を互いに類似したド
キュメントにより構成されるドキュメント集合に分類し
(ステップ2)、検索結果の各ドキュメント集合から特
徴的な単語のリストを抽出し(ステップ3)、分類され
たグループと、抽出された単語のリストに基づいてユー
ザに対してインタラクティブに操作可能な出力画面の情
報を生成する(ステップ4)。
【0006】本発明(請求項2)は、出力画面の情報を
生成する際に、出力画面の表示と同時に、ユーザの次の
行動を入力可能な画面情報を表示する。本発明(請求項
3)は、ユーザにより選択された少なくとも1つのドキ
ュメント集合に対して、再度分類を行い、検索結果を絞
り込む。本発明(請求項4)は、抽出された単語のリス
トからユーザにより選択された単語または、単語の組み
合わせにより再度検索を実行する。
【0007】図2は、本発明の原理構成図である。本発
明(請求項5)は、予め構築されたドキュメントア−カ
イブ50をユーザにより入力される情報要求に従って検
索するインタラクディブ情報検索装置であって、ドキュ
メントア−カイブ50を検索対象として、ユーザの情報
要求に基づいて基本的な情報検索を行う情報検索手段1
0と、情報検索手段10により取得した検索結果のリス
トにおけるドキュメント群を互いに類似したドキュメン
トにより構成されるドキュメント集合に分類する検索結
果分類手段20と、検索結果の各ドキュメント集合から
特徴的な単語のリストを抽出する単語抽出手段30と、
検索結果分類手段20と、単語抽出手段30の結果に基
づいて、ユーザに対してインタラクティブに操作可能な
出力画面の情報を生成する出力情報編集手段40とを有
する。
【0008】本発明(請求項6)は、出力情報編集手段
40において、出力画面の表示と同時に、ユーザの次の
行動を入力可能な画面情報を表示する手段を含む。本発
明(請求項7)は、検索結果分類手段20において、ユ
ーザにより少なくとも1つ選択されたドキュメント集合
に対して、再度分類を行う手段を含む。本発明(請求項
8)は、情報検索手段10において、単語抽出手段30
により抽出された単語のリストからユーザにより選択さ
れた単語または、単語の組み合わせにより再度検索を実
行する手段を含む。
【0009】本発明(請求項9)は、予め構築されたド
キュメントア−カイブをユーザにより入力される情報要
求に従って検索するインタラクディブ情報検索プログラ
ムを格納した記憶媒体であって、ドキュメントア−カイ
ブを検索対象として、ユーザの情報要求に基づいて基本
的な情報検索を行う情報検索プロセスと、情報検索プロ
セスにより取得した検索結果のリストにおけるドキュメ
ント群を互いに類似したドキュメントにより構成される
ドキュメント集合に分類する検索結果分類プロセスと、
検索結果の各ドキュメント集合から特徴的な単語のリス
トを抽出する単語抽出プロセスと、検索結果分類プロセ
スと、単語抽出プロセスの結果に基づいて、ユーザに対
してインタラクティブに操作可能な出力画面の情報を生
成する出力情報編集プロセスとを有する。
【0010】本発明(請求項10)は、情報報編集プロ
セスにおいて、出力画面の表示と同時に、ユーザの次の
行動を入力可能な画面情報を表示するプロセスを含む。
本発明(請求項11)は、検索結果分類プロセスにおい
て、ユーザにより選択された少なくとも1つのドキュメ
ント集合に対して、再度分類を行うプロセスを含む。
【0011】本発明(請求項12)は、情報検索プロセ
スにおいて、抽出された単語のリストからユーザにより
選択された単語または、単語の組み合わせにより再度検
索を実行するプロセスを含む。上記のように、本発明に
よれば、以下のようなことが可能となり、これらは情報
検索に基づく、ユーザのインタラクティブな情報ナビゲ
ーションを支援することが可能となる。
【0012】(1) 情報検索結果が単なるリストでは
なく、検索結果のドキュメントがいくつかの数のグルー
プへと自動的に分類されるため、実際にアクセスするド
キュメントを決定する際の支援となる。 (2) さらに、上記で生成されたグループを1つ以上
選択した結果であるドキュメント集合に対して、再度の
自動分類を指示することにより、検索結果を絞り込んで
いくことが可能となる。
【0013】(3) 自動分類の過程で抽出される特徴
的な単語のリストを利用して、この中からユーザが適当
な単語を選択して新しい検索を実行することにより、選
択する単語群とその組み合わせ方によって、絞り込み的
な検索や、関連するトピックに関する検索(連想型検
索)が可能となる。
【0014】
【発明の実施の形態】図3は、本発明の情報検索装置の
構成を示す。同図に示すシステムは、入力部100、検
索サービス部200、情報検索実行部210、ドキュメ
ントア−カイブ220、ドキュメント分類サービス部3
00、検索結果分類実行部310、ドキュメント特徴抽
出部320、出力部400、及び出力情報編集部410
から構成される。
【0015】入力部100は、ユーザ端末から送信され
るシステムへの指示を受け付ける。ユーザからの指示
は、 検索のための情報要求; 検索結果の再分類の指示; のどちらかである。入力部100は、これらの判断を行
い、の場合には、検索サービス部200へ入力された
情報要求を転送する。の場合は、ドキュメント分類サ
ービス部300へ入力された検索結果の再分類の指示を
転送する。
【0016】検索サービス部200は、まず、入力部1
00から転送されてきた情報要求を情報検索実行部21
0へ転送する。情報検索実行部210は、予め構築され
たドキュメントア−カイブ220を検索対象とした情報
検索を実行し、その結果として、ユーザの情報要求に対
する適合度順にソートされた、ドキュメントア−カイブ
220のドキュメントのリストを検索サービス部200
へ返却する。なお、情報検索実行部210に相当するテ
キスト検索エンジンサブシステムは、公知の技術により
十分実現可能であるため、本発明ではその詳細は問わ
ず、入力として単語の論理結合(AND結合、OR結
合)を許すことと、適合度順にソートされたドキュメン
トリストを結果とすることのみ条件とする。
【0017】検索サービス部200は、次にドキュメン
トリストを検索結果分類実行部310へ転送し、その処
理結果をさらに出力情報編集部410へと転送する。ド
キュメント分類サービス部300は、転送されてきた検
索結果の再分類の指示に基づいて、再分類の対象となる
ドキュメントの集合を求め、これを検索結果分類実行部
310へ転送し、その処理結果をさらに出力情報編集部
410に転送する。
【0018】検索結果分類実行部310は、検索サービ
ス部200または、ドキュメント分類サービス部300
より転送されてくるドキュメント集合(実際にはドキュ
メントア−カイブ220におけるドキュメントIDの集
合)を入力する。検索結果分類実行部310は、まず、
ドキュメント特徴抽出部320を呼び出すことにより、
ドキュメントア−カイブ220における指定されたドキ
ュメント特徴を得る。ここで、ドキュメントの特徴と
は、ドキュメントに含まれる単語のリストであり、各単
語には、その単語の重要性を表す重み(実数値)が付与
されているものとする。即ち、ドキュメントの特徴は実
数値を値とし、各要素はある単語に対応しているベクト
ルとして表現される。単語の重みとしては、情報検索の
分野において従来より検討がなされており、単純な頻
度、正規化された頻度や特徴的であるか否かを表す値
(TF* IDF)などが考えられる。本発明では、単語
の重みとして何を使用するかについては規定しない。ま
た、ドキュメント特徴抽出部320では、指示されたド
キュメントの特徴をその都度計算するのではなく、ドキ
ュメントの特徴を内部データベースにキャッシュしてお
くなどの効率化手段が考えられるが、本発明ではその詳
細は規定しない。
【0019】検索結果分類実行部310は、次に、入力
されたドキュメント集合の各要素であるドキュメントに
対して求められたドキュメント特徴ベクトルを総合する
ことにより、図4に示すようなマトリクスを求める。当
該マトリクスの各行はドキュメントに、各列は単語に相
当する。このようなマトリクスを以下では特徴マトリク
スと呼ぶ。
【0020】ここで、図4のような特徴マトリクスに基
づいて、オブジェクト(ドキュメント)の自動分類を行
う方法として、クラスタリングと呼ばれる手法が知られ
ており、いくつかのアルゴリズムが提案されている(参
考文献例:E.Rasmussen: Clustering Algorithms, in
W.B.Frakes, R.Baeza-Yates, editors, Information Re
trieval, Prentice Hall, 1992)。本発明における検索
結果分類実行部310の採用するクラスタリングのアル
ゴリズムについては、本発明では規定しないが、入力さ
れた特徴マトリクスとグループの個数に対して、図5に
示すようなマトリクス(分類結果マトリクスと呼ぶ)で
表される分類結果が得られるものとする。
【0021】また、図6に示すように、各グループにお
いて特徴的な単語のリストも求めるものとする。このよ
うな単語のリストは、分類結果マトリクスの各行から、
大きな重みを持つ単語を抽出することで、容易に構成す
ることができる。ここで、リストの大きさ(単語の数)
を陽に指定することもできるし、ある一定の値以上の重
みを持つ単語のみを対象としてリストを構成してもよい
が、本発明では、その方法にてついては規定しない。
【0022】出力情報編集部410は、検索結果分類実
行部310から以下のデータ (1) グループに属するドキュメントのリスト; (2) グループを特徴付ける単語のリスト(単語+重
み); を受け取り、ユーザによるインタラクティブな情報検索
行動を支援するための出力画面(同時に次の行動を入力
する画面でもある)情報を生成する。
【0023】出力部400は、出力情報編集部410か
ら転送されてきた画面情報をユーザの端末へと転送す
る。
【0024】
【実施例】以下、図面と共に本発明の実施例を説明す
る。以下の実施例では、本発明のインタラクティブ情報
検索システムをWWW(World Wide Web) 上のサーチエ
ンジンに適用した場合の具体例を説明する。図7は、本
発明の一実施例の検索要求入力画面の例を示しており、
ユーザ端末に表示される初期画面の例である。この画面
例においては、まず、情報要求を表すフレーズを入力す
る領域が最上部に設定されており、ユーザは、“オリン
ピックでのボランティア”なる情報要求を入力したもの
とする。第2の領域では、自動分類処理に関する設定を
行えるようになっており、この例では、分類グループの
数は自動的に決定すること、結果は、フレームを利用し
て表示することを指示している。第3の領域では、テキ
スト情報検索に関する基本的な設定が行えるようになっ
ており、この例では、情報要求フレーズから抽出した語
をAND条件で結んで検索を行うこと、また、検索結果
のドキュメント件数を10件に制限することなどを指示
している。以下では、この入力例に即して説明を行う。
【0025】入力部100は、上記のような入力画面を
通してユーザ端末から送信されてくる要求のタイプに従
って、検索サービス部200、または、ドキュメント分
類サービス部300へユーザの要求を転送する。上記の
例の場合、情報検索のための情報要求であるため、検索
サービス部200へと要求を転送する。検索サービス部
200は、転送されてきた情報要求から検索条件に用い
る単語を抽出する。この例において転送されてくる情報
要求は、“オリンピックのボラインティア”であり、こ
のフレーズからは、“オリンピック”と“ボランティ
ア”の2語を抽出する。なお、自然言語表現から単語を
抽出する処理は、既存の形態素解析技術などを適用する
ことにより、容易に実現可能であるので、本発明では、
その詳細については規定しない。上記の情報要求及び検
索条件からは、 (AND“オリンピック”“ボランティア”) なる検索式が生成され、この検索式は、情報検索実行部
210へ転送される。
【0026】図8は、本発明の一実施例の情報検索結果
のドキュメントリストの例を示し、上記の検索式によっ
て情報検索実行部210がドキュメントア−カイブ22
0を検索対象として検索を行った結果例である。情報検
索実行部210に適用されるような通常のテキスト検索
サブシステムは、ここに示されたような情報以外の情報
も返却することもできる(実際、後で示される画面例で
は、そのような情報も利用した表示が行われている)
が、図8では、以下の説明に必要最小限な情報のみを示
す。即ち、情報検索結果の各ドキュメントに対しては、
そのドキュメントア−カイブ220内におけるドキュメ
ントID(この例では4桁の正数)、情報要求との適合
度を表すスコア(値が大きいほど情報要求に適合してい
る)、ドキュメントのタイトル(これは、説明を分かり
やすくするために導入した)が返却されるものとする。
【0027】検索サービス部200は、図8に示される
ような情報検索実行部210による検索結果を検索結果
分類実行部310へと転送する。検索結果分類実行部3
10は、まず、ドキュメント特徴抽出部320を呼び出
すことにより、転送されてきたドキュメントの特徴を得
る。図9は、本発明の一実施例のドキュメント特徴ベク
トルの例であり、検索結果リストにおける第1要素の例
である。同図は、前述の図8の検索結果リストにおける
第1要素である(ID=1000,タイトル=平成9年
度予算の主要事業)なるドキュメントの特徴ベクトルの
概念を説明するための図である。説明の簡単化のため、
このドキュメントは5つの検索対象単語(T1−T5)
のみを示す。
【0028】検索結果分類実行部310が、次に、入力
されたドキュメント集合の各要素であるドキュメントに
対して求められたドキュメント特徴ベクトルを総合する
ことにより、図4に示すようなマトリクスを求める。図
10は、本発明の一実施例の特徴マトリクスの例であ
り、検索結果リストに対する特徴マトリクスを説明する
ための図である。同図は、前述の図8の検索結果リスト
に対する特徴マトリクスを示しており、同図では、図9
と同様に説明の簡単化のため、検索結果の10のドキュ
メントはいずれも5つの検索対象単語から構成されるも
のとするが、実際においては、検索対象単語の数はこれ
にとどまるものではない。
【0029】検索結果分類実行部310は、次に図10
の特徴マトリクスに対してクラスタリングアルゴリズム
を実行する。前述したように、いくつかのクラスタリン
グのアルゴリズムが提案されているので、本発明におけ
る検索結果分類実行部310は、適当なアルゴリズムを
実装していると仮定する。図11は、本発明の一実施例
の分類結果マトリクスの例を示す。同図は、図10の特
徴マトリクスに対してクラスタリングアルゴリズムを実
行した結果の分類結果マトリクスを説明するものであ
る。図11に示すように、この例においては、10のド
キュメントが2つのグループ(1つは6つのドキュメン
トからなり、もう1つは4つのドキュメントからなる)
へ自動分類されたものである。
【0030】図12は、本発明の一実施例の特徴的単語
リストの例である。同図は検索結果分類実行部310の
処理結果として、分類結果マトリクスと同時に得られる
特徴的な単語リストを説明するための図である。同図に
おいて、第1のドキュメントグループにおける特徴的な
単語がその重みと共に示されている(ここでは、重みが
3以上の単語のみを表示した)。
【0031】上記のような検索結果分類実行部310の
結果は、出力情報編集部410へと転送される。出力情
報編集部410は、転送されてきたデータに基づいて、
ユーザによるインタラクティブな情報検索行動を支援す
るための出力画面(同時に次の行動を入力する画面でも
ある)情報を生成する。出力部400は、出力情報編集
部410から転送されてきた画面情報をユーザの端末へ
と転送する。
【0032】図13は、本発明の一実施例の出力画面の
例を示す。同図は、出力部400によりユーザの端末に
転送される具体的な出力画面の例である。同図に明らか
なように、画面は、左上部、右上部、下部の3つ
の領域に分割されている。 左上部の領域には、自動分類処理の結果として生成さ
れたドキュメントグループ(画面ではクラスタと記され
ている)の情報が表示される。図13においては、6ド
キュメント(画面では6Pages と記されている)からな
る「クラスター1」と、4ドキュメントからなる「クラ
スター2」が生成されたことが示されている。また、そ
れぞれのドキュメントグループ(クラスター)における
特徴的な単語のリストが、ドキュメントグループの特性
をユーザに示すものとして表示されている。
【0033】右上部の領域には、生成されたドキュメ
ントグループの数のサブ領域から構成され、各サブ領域
は、一つのドキュメントグループに属するドキュメント
の情報が表示される。図13の例においては、各ドキュ
メントに対して、タイトル、適合度((score 181)などと
表示されている) の他に様々な付加情報が表示されてい
るが、これらは本発明の説明には関係しないので、説明
は省略する。
【0034】下部の領域には、各ドキュメントグルー
プから抽出された特徴単語群を総合することにより構成
した単語のリストが表示される。このような画面構成に
おいて特徴的な点は、左上部の領域と下部の領域が単な
る情報表示だけでなく、ユーザの次の行動を支援する
(次の行動を入力する領域にもなっている)ように構成
されている点である。即ち、 (A) 左上部の領域においては、チェックボックスを
チェックすることにより、一つ以上のドキュメントグル
ープを選択することによって、再分類を行わせることが
できる。図13の例においては顕著でないが、検索結果
件数の上限をもっと多くした場合や多数のドキュメント
グループが生成された場合など、適切な数のグループを
選択して再分類を行わせることにより、検索結果の特性
をさらに詳しく調べることが可能となる。これは、必要
・有用な情報へユーザを効率よく導く情報ナビゲーショ
ン支援となり得る。
【0035】(B) 下部の領域においては、システム
から提示された単語のいくつかをチェックボックスをチ
ェックすることにより選択し、また、他に加えたい単語
や表現があれば、それらを追加キーワードのフィールド
に入力し、単語を結合する検索条件(AND/OR)を
選択することにより、新たな検索を実行することができ
る。このことは、検索結果の自動分類を行う過程により
抽出された特徴的な単語を次の検索に利用できることを
示しており、前回の検索をさらに絞り込むような検索
や、直接には関係しないが、緩く関連した単語を用いる
ことによる連想的な検索などが可能となる。これは、必
要・有用な情報へのユーザを効率よく導く情報ナビゲー
ション支援となり得る。
【0036】以下に、(A),(B)の場合の具体的な
画面例を示す。図14は、本発明の一実施例の再分類の
指示例を示す。同図は、図13における(A)左上部の
領域において、6つのドキュメントからなる「クラスタ
ー1」を選択した状況を示している。この状態で、“G
o!”と記されたボタンを押すことにより、「クラスタ
ー1」をさらに再分類させることができる。
【0037】図15は、本発明の一実施例の再分類結果
の表示例である。同図は、再分類の結果、表示される画
面例である。同図においては、6つのドキュメントが5
つのドキュメントからなるグループと1つのドキュメン
トからなるグループの2つに分類されたことを示してい
る。図15を図13と比較すると明らかなように、双方
の画面は同じ構造を持っている。このことは、再分類の
結果をさらに再分類させたり、再分類の処理において抽
出された特徴的単語を利用して新たに検索実行すること
が可能なことを示す。
【0038】図16は、本発明の一実施例の再検索結果
の指示例を示す。同図は、図13における(B)下部の
領域に表示されている特徴的な単語のリストから“オリ
ンピック”、“対策”、“環境”、“長野”の4単語を
選択し、これらをAND結合することを指定した状況を
示している。この状態で、“Search”と記されたボタン
を押すことにより、上記の条件による新しい検索を実行
させることができる。
【0039】図17は、本発明の一実施例の再検索結果
の表示例を示す。同図は、上述の新しい条件による検索
の結果、表示される画面例である。この条件下では、前
回と同様に10のドキュメントが検索されているが、今
度は、8つのドキュメントからなるグループと2つのド
キュメントからなるグループが生成されている。また、
当然ながら図17の画面は、図13の画面と同様の構造
を持っており、ドキュメントグループの再分類や提示さ
れた単語を選択することによる新たな検索の実行が可能
なことを示す。
【0040】また、上記の実施例では、図3に示す構成
に基づいて情報検索について説明したが、この例に限定
されることなく、上記の処理をプログラムとして構築
し、検索を行うコンピュータに接続されるディスク装置
や、フロッピーディスク、CD−ROM等の可搬記憶媒
体に格納しておき、本発明を実行する際に適宜インスト
ールすることにより、本発明を容易に実現することが可
能となる。
【0041】なお、本発明は上記の実施例に限定される
ことなく、特許請求の範囲内で種々変更・応用が可能で
ある。
【0042】
【発明の効果】上述のように、本発明によれば、情報検
索結果の自動分類や、検索結果の部分集合に対する再自
動分類による検索結果の構造化、自動分類の過程で抽出
された特徴的な単語を組み合わせることによる次の段階
の検索支援が可能となり、これらは、情報検索に基づく
ユーザの情報ナビゲーションを支援する。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明の情報検索装置の構成図である。
【図4】本発明の特徴マトリクスの概念図である。
【図5】本発明の分類結果マトリクスの概念図である。
【図6】本発明の特徴単語リストの概念図である。
【図7】本発明の一実施例の検索要求入力画面の例であ
る。
【図8】本発明の一実施例の情報検索結果のドキュメン
トリストの例である。
【図9】本発明の一実施例のドキュメント特徴ベクトル
の例である。
【図10】本発明の一実施例の特徴マトリクスの例であ
る。
【図11】本発明の一実施例の分類結果マトリクスの例
である。
【図12】本発明の一実施例の特徴的単語リストの例
(重み3以上を残す場合の例)である。
【図13】本発明の一実施例の出力画面例である。
【図14】本発明の一実施例の再分類の指示例である。
【図15】本発明の一実施例の再分類結果の表示例であ
る。
【図16】本発明の一実施例の再検索の指示例である。
【図17】本発明の一実施例の再検索結果の表示例であ
る。
【符号の説明】
10 情報検索手段 20 検索結果分類手段 30 単語抽出手段 40 出力情報編集手段 50 ドキュメントア−カイブ 100 入力部 200 検索サービス部 210 情報検索実行部 220 ドキュメントア−カイブ 300 ドキュメント分類サービス部 310 検索結果分類実行部 320 ドキュメント特徴抽出部 400 出力部 410 出力情報編集部

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 予め構築されたドキュメントア−カイブ
    をユーザにより入力される情報要求に従って検索するイ
    ンタラクティブ情報検索方法において、 前記ドキュメントア−カイブを検索対象として、前記ユ
    ーザの情報要求に基づいて基本的な情報検索を行い、 前記情報検索により取得した検索結果のリストにおける
    ドキュメント群を互いに類似したドキュメントにより構
    成されるドキュメント集合に分類し、 前記検索結果の各前記ドキュメント集合から特徴的な単
    語のリストを抽出し、 分類されたグループと、抽出された単語のリストに基づ
    いて前記ユーザに対してインタラクティブに操作可能な
    出力画面の情報を生成することを特徴とするインタラク
    ティブ情報検索方法。
  2. 【請求項2】 前記出力画面の情報を生成する際に、 前記出力画面の表示と同時に、前記ユーザの次の行動を
    入力可能な画面情報を表示する請求項1記載のインタラ
    クディブ情報検索方法。
  3. 【請求項3】 前記ユーザにより選択された少なくとも
    1つのドキュメント集合に対して、再度分類を行い、前
    記検索結果を絞り込む請求項1記載のインタラクティブ
    情報検索方法。
  4. 【請求項4】 抽出された前記単語のリストから前記ユ
    ーザにより選択された単語または、単語の組み合わせに
    より再度検索を実行する請求項1記載のインタラクティ
    ブ情報検索方法。
  5. 【請求項5】 予め構築されたドキュメントア−カイブ
    をユーザにより入力される情報要求に従って検索するイ
    ンタラクディブ情報検索装置であって、 前記ドキュメントア−カイブを検索対象として、前記ユ
    ーザの情報要求に基づいて基本的な情報検索を行う情報
    検索手段と、 前記情報検索手段により取得した検索結果のリストにお
    けるドキュメント群を互いに類似したドキュメントによ
    り構成されるドキュメント集合に分類する検索結果分類
    手段と、 前記検索結果の各前記ドキュメント集合から特徴的な単
    語のリストを抽出する単語抽出手段と、 前記検索結果分類手段と、前記単語抽出手段の結果に基
    づいて、前記ユーザに対してインタラクティブに操作可
    能な出力画面の情報を生成する出力情報編集手段とを有
    することを特徴とするインタラクティブ情報検索装置。
  6. 【請求項6】 前記出力情報編集手段は、 前記出力画面の表示と同時に、前記ユーザの次の行動を
    入力可能な画面情報を表示する手段を含む請求項5記載
    のインタラクディブ情報検索装置。
  7. 【請求項7】 前記検索結果分類手段は、 前記ユーザにより選択された少なくとも1つの前記ドキ
    ュメント集合に対して、再度分類を行う手段を含む請求
    項5記載のインタラクティブ情報検索装置。
  8. 【請求項8】 前記情報検索手段は、 抽出された前記単語のリストから前記ユーザにより選択
    された単語または、単語の組み合わせにより再度検索を
    実行する手段を含む請求項5記載のインタラクティブ情
    報検索装置。
  9. 【請求項9】 予め構築されたドキュメントア−カイブ
    をユーザにより入力される情報要求に従って検索するイ
    ンタラクディブ情報検索プログラムを格納した記憶媒体
    であって、 前記ドキュメントア−カイブを検索対象として、前記ユ
    ーザの情報要求に基づいて基本的な情報検索を行う情報
    検索プロセスと、 前記情報検索プロセスにより取得した検索結果のリスト
    におけるドキュメント群を互いに類似したドキュメント
    により構成されるドキュメント集合に分類する検索結果
    分類プロセスと、 前記検索結果の各前記ドキュメント集合から特徴的な単
    語のリストを抽出する単語抽出プロセスと、 前記検索結果分類プロセスと、前記単語抽出プロセスの
    結果に基づいて、前記ユーザに対してインタラクティブ
    に操作可能な出力画面の情報を生成する出力情報編集プ
    ロセスとを有することを特徴とするインタラクティブ情
    報検索プログラムを格納した記憶媒体。
  10. 【請求項10】 前記出力情報編集プロセスは、 前記出力画面の表示と同時に、前記ユーザの次の行動を
    入力可能な画面情報を表示するプロセスを含む請求項9
    記載のインタラクディブ情報検索プログラムを格納した
    記憶媒体。
  11. 【請求項11】 前記検索結果分類プロセスは、 前記ユーザにより選択された少なくとも1つの前記ドキ
    ュメント集合に対して、再度分類を行うプロセスを含む
    請求項9記載のインタラクティブ情報検索プログラムを
    格納した記憶媒体。
  12. 【請求項12】 前記情報検索プロセスは、 抽出された前記単語のリストから前記ユーザにより選択
    された単語または、単語の組み合わせにより再度検索を
    実行するプロセスを含む請求項5記載のインタラクティ
    ブ情報検索プログラムを格納した記憶媒体。
JP10017422A 1998-01-29 1998-01-29 インタラクティブ情報検索方法及び装置及びインタラクティブ情報検索プログラムを格納した記憶媒体 Pending JPH11213000A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10017422A JPH11213000A (ja) 1998-01-29 1998-01-29 インタラクティブ情報検索方法及び装置及びインタラクティブ情報検索プログラムを格納した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10017422A JPH11213000A (ja) 1998-01-29 1998-01-29 インタラクティブ情報検索方法及び装置及びインタラクティブ情報検索プログラムを格納した記憶媒体

Publications (1)

Publication Number Publication Date
JPH11213000A true JPH11213000A (ja) 1999-08-06

Family

ID=11943585

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10017422A Pending JPH11213000A (ja) 1998-01-29 1998-01-29 インタラクティブ情報検索方法及び装置及びインタラクティブ情報検索プログラムを格納した記憶媒体

Country Status (1)

Country Link
JP (1) JPH11213000A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002108881A (ja) * 2000-10-02 2002-04-12 Hitachi Tool Engineering Ltd 電子カタログシステム
JP2004525458A (ja) * 2001-03-16 2004-08-19 トムソン ライセンシング ソシエテ アノニム グループの計算によるナビゲーション方法、この方法を実施する受信器、及び、この方法を表示するグラフィックインタフェース
US6826724B1 (en) 1998-12-24 2004-11-30 Ricoh Company, Ltd. Document processor, document classification device, document processing method, document classification method, and computer-readable recording medium for recording programs for executing the methods on a computer
JP2005519396A (ja) * 2002-03-07 2005-06-30 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 情報検索要求に応じて検索結果を提供する方法及び装置
JP2005250693A (ja) * 2004-03-02 2005-09-15 Tsubasa System Co Ltd 文字情報分類プログラム
JP2005535948A (ja) * 2002-05-30 2005-11-24 トムソン ライセンシング セマンティックブラウジングオプションを作成する方法およびデバイス
JP2008027104A (ja) * 2006-07-20 2008-02-07 Sharp Corp 端末装置およびコンテンツ記録方法
JP2009211124A (ja) * 2008-02-29 2009-09-17 Oki Electric Ind Co Ltd ワード提示システム、方法及びプログラム、並びに情報検索システム
JP2010009577A (ja) * 2008-05-28 2010-01-14 Ricoh Co Ltd 情報処理装置、全文検索方法、全文検索プログラム、及び記録媒体

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6826724B1 (en) 1998-12-24 2004-11-30 Ricoh Company, Ltd. Document processor, document classification device, document processing method, document classification method, and computer-readable recording medium for recording programs for executing the methods on a computer
JP2002108881A (ja) * 2000-10-02 2002-04-12 Hitachi Tool Engineering Ltd 電子カタログシステム
JP2004525458A (ja) * 2001-03-16 2004-08-19 トムソン ライセンシング ソシエテ アノニム グループの計算によるナビゲーション方法、この方法を実施する受信器、及び、この方法を表示するグラフィックインタフェース
JP2005519396A (ja) * 2002-03-07 2005-06-30 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 情報検索要求に応じて検索結果を提供する方法及び装置
JP2005535948A (ja) * 2002-05-30 2005-11-24 トムソン ライセンシング セマンティックブラウジングオプションを作成する方法およびデバイス
JP4733975B2 (ja) * 2002-05-30 2011-07-27 トムソン ライセンシング セマンティックブラウジングオプションを作成する方法およびデバイス
US8510676B2 (en) 2002-05-30 2013-08-13 Thomson Licensing Method and device for creating semantic browsing options
JP2005250693A (ja) * 2004-03-02 2005-09-15 Tsubasa System Co Ltd 文字情報分類プログラム
JP2008027104A (ja) * 2006-07-20 2008-02-07 Sharp Corp 端末装置およびコンテンツ記録方法
JP2009211124A (ja) * 2008-02-29 2009-09-17 Oki Electric Ind Co Ltd ワード提示システム、方法及びプログラム、並びに情報検索システム
JP2010009577A (ja) * 2008-05-28 2010-01-14 Ricoh Co Ltd 情報処理装置、全文検索方法、全文検索プログラム、及び記録媒体

Similar Documents

Publication Publication Date Title
JP4776894B2 (ja) 情報検索方法
US7523095B2 (en) System and method for generating refinement categories for a set of search results
US6182091B1 (en) Method and apparatus for finding related documents in a collection of linked documents using a bibliographic coupling link analysis
US20080077569A1 (en) Integrated Search Service System and Method
US20090083270A1 (en) System and program for handling anchor text
US7333985B2 (en) Dynamic content clustering
US20070150473A1 (en) Search By Document Type And Relevance
US20060095852A1 (en) Information storage and retrieval
US20020099685A1 (en) Document retrieval system; method of document retrieval; and search server
GB2395808A (en) Information retrieval
US7523109B2 (en) Dynamic grouping of content including captive data
JP2003167914A (ja) マルチメディア情報検索方法、プログラム、記録媒体及びシステム
GB2395807A (en) Information retrieval
WO2010014082A1 (en) Method and apparatus for relating datasets by using semantic vectors and keyword analyses
KR20080037413A (ko) 온라인 문맥기반 광고 장치 및 방법
GB2395805A (en) Information retrieval
GB2393275A (en) Information storage and retrieval
Chandramouli et al. Query refinement and user relevance feedback for contextualized image retrieval
JPH11213000A (ja) インタラクティブ情報検索方法及び装置及びインタラクティブ情報検索プログラムを格納した記憶媒体
JPWO2003034279A1 (ja) 情報検索方法、情報検索プログラム、情報検索プログラムを記録したコンピュータ読み取り可能な記録媒体
CN112749328B (zh) 搜索方法、装置和计算机设备
JP2001101227A (ja) 文書分類装置および文書分類方法
JP3692416B2 (ja) 情報フィルタリング方法および装置
JPH1145257A (ja) Web文書の検索支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
Moumtzidou et al. Discovery of environmental nodes in the web