JPH11259485A - 文書検索装置及び記録媒体 - Google Patents

文書検索装置及び記録媒体

Info

Publication number
JPH11259485A
JPH11259485A JP10054812A JP5481298A JPH11259485A JP H11259485 A JPH11259485 A JP H11259485A JP 10054812 A JP10054812 A JP 10054812A JP 5481298 A JP5481298 A JP 5481298A JP H11259485 A JPH11259485 A JP H11259485A
Authority
JP
Japan
Prior art keywords
document
search
information
search result
relevance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10054812A
Other languages
English (en)
Inventor
Tomoya Ogawa
知也 小川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP10054812A priority Critical patent/JPH11259485A/ja
Publication of JPH11259485A publication Critical patent/JPH11259485A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】本発明は文書検索装置に関し、文書検索時に得
られる文書データからの情報を活用して、効率的な検索
結果提示や操作手段の提供を可能とする。 【解決手段】文書データベース27と、文書データベー
ス27の検索処理を行う検索エンジン23と、情報の視
覚的操作のためのインターフェース制御を行うGUIモ
ジュール21と、検索結果情報の関連統合処理を行う関
連統合モジュール24と、文書属性の表示管理を行う文
書属性表示管理モジュール25と、検索結果情報の評価
情報を管理し、関連フィードバックが行われた際、その
文書の表示情報を制御する関連フィードバック管理モジ
ュール26とを備え、文書検索での検索結果提示の際
に、検索結果の文書間の関連度情報に基づき、関連度の
高い文書をまとめて表示するように構成した。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書データベース
から検索した検索結果の情報を、ディスプレイ装置の画
面上に表示する機能を備えた文書検索装置及び記録媒体
に関する。
【0002】近年、インターネットの普及や全文データ
ベースの増加に伴い、我々の身の回りの情報は飛躍的に
増加している。しかし、検索精度や検索システムの使い
勝手に関し、現状の大規模な商用のオンラインデータベ
ースや全文検索システムは、必ずしも十分とはいえな
い。必要な情報が効率良く入手できる情報検索技術の開
発が望まれている。
【0003】
【従来の技術】以下、従来例を説明する。図16は従来
の検索結果情報表示例を示した図である。従来、文書検
索における検索結果の提示では、検索結果を検索キーと
の文書間の関連度に基づき、一次元的に表示するランキ
ング表示が行われている程度であった。このような文書
検索における検索結果情報の表示例として、例えば、図
16に示したような例がある。なお、この場合の「検索
結果の提示」は、例えば、表示であるが、表示に限ら
ず、他の出力手段(印刷出力等)により利用者に提示で
きれば良い。
【0004】この例は、数百件の文書(論文)からの検
索を行った場合の例であり、「概念学習」を検索キーと
して検索を行うと、図16に示したような検索結果情報
が提示される。この例では、検索結果の提示として、順
位、関連度、文書ID、及び文書タイトルについての各
情報が提示されている。
【0005】前記関連度は、通常のベクトル空間モデル
や特異値分解などの統計処理に基づく意味空間モデルに
おける検索キーベクトルと、各文書ベクトルとのCOS
距離などで求まる。この場合、前記COS距離は、前記
2つのベクトルの成す角度をθとした場合、COS距離
=COS(θ)などで求めることができる。
【0006】前記の表示例において、順位=1は、関連
度=0.84、文書ID=92−89−03であり、文
書タイトルは、「名詞述語文からの概念学習システム−
比喩の理解と学習−」となっている。順位=2は、関連
度=0.78、文書ID=90−79−04であり、文
書タイトルは、「名詞述語文における意味概念の学習」
となっている。
【0007】順位=3は、関連度=0.74、文書ID
=91−83−19であり、文書タイトルは、「自然言
語概念学習に関する考察」となっている。順位=4は、
関連度=0.72、文書ID=93−93−06であ
り、文書タイトルは、「名詞述語文からの概念学習シス
テム−継承と経路情報の処理−」となっている。以下、
同様にして、一次元的検索結果が提示されている。
【0008】
【発明が解決しようとする課題】前記のような従来のも
のにおいては、次のような課題があった。すなわち、従
来の文書検索における検索結果提示では、検索結果情報
を検索キーとの関連度に基づき、一次元的に表示するラ
ンキング表示が行われている程度であり、検索時に得ら
れる文書データからの情報を十分に活用した検索結果の
表示や、操作手段の提示は行われていなかった。従っ
て、必要な情報が効率良く入手できなかった。
【0009】本発明は、このような従来の課題を解決
し、文書検索時に得られる文書データからの情報を有効
に活用することで、効率的な検索結果情報の提示や操作
手段の提供を可能にすることを目的とする。
【0010】
【課題を解決するための手段】本発明は前記の目的を達
成するため、次のように構成した。 (1) :文書データを格納した文書データベースと、前記
文書データベースの文書検索を行う検索エンジンと、情
報の視覚的操作のためのインターフェース制御を行うグ
ラフィカルユーザインターフェースモジュールと、前記
検索エンジンによる検索結果の情報に対して関連情報の
統合処理を行う関連統合モジュールと、文書属性の表示
管理を行う文書属性表示管理モジュールと、検索結果情
報の評価情報を管理し、関連フィードバックが行われた
際その文書の表示情報を制御する関連フィードバック管
理モジュールとを備えた文書検索装置であって、文書検
索での検索結果提示の際に、検索結果の文書間の関連度
情報に基づき、関連度の高い文書の情報をまとめて表示
させる検索結果情報提示手段(前記各モジュールを含む
手段)を備えている。
【0011】(2) :前記(1) の文書検索装置において、
前記検索結果情報提示手段は、関連度の高い文書の情報
をまとめて表示させる際、多段階に階層的に表示させる
機能を備えている。
【0012】(3) :前記(1) の文書検索装置において、
前記検索結果情報提示手段は、検索結果の文書間の関連
度情報に基づき、上位レベルの文書のみの表示や下位レ
ベルの展開を含むアウトライン操作を行う機能を備えて
いる。
【0013】(4) :前記(1) の文書検索装置において、
前記検索結果情報提示手段は、検索結果提示の際に、同
一グループに属する複数文書に対し、関連フィードバッ
クの対象とする/しないの指定を一度に行える手段を提
供する機能を備えている。
【0014】(5) :前記(1) の文書検索装置において、
前記検索結果情報提示手段は、検索結果提示の際に、関
連度判定の閾値を、アイテムの密集度に応じて動的に変
更する機能を備えている。
【0015】(6) :前記(1) の文書検索装置において、
前記検索結果情報提示手段は、関連フィードバックを用
いた検索結果提示の際に、関連フィードバックに伴う評
価の向上/下降を表示させる機能を備えている。
【0016】(7) :前記(1) の文書検索装置において、
前記検索結果情報提示手段は、関連フィードバックを用
いた検索結果提示の際に、関連フィードバックに伴い、
評価の向上した文書の表示を優先させる機能を備えてい
る。
【0017】(8) :前記(1) の文書検索装置において、
前記検索結果情報提示手段は、検索結果提示の際に、検
索結果の文書の文書属性を表示させる機能を備えてい
る。 (9) :前記(7) の文書検索装置において、前記検索結果
情報提示手段は、前記検索結果の文書の文書属性を表示
させる際、文書中のキーワードといった何らかの観点に
よる特徴素を、背景色の濃淡などの表示特性を用いて表
示させる機能を備えている。
【0018】(10):前記(7) の文書検索装置において、
前記検索結果情報提示手段は、前記検索結果の文書の文
書属性を表示させる際、文書長及びキーワード密度とい
った何らかの観点による複数の特徴素を、背景色の濃淡
などの複数の表示特性を用いて表示させる機能を備えて
いる。
【0019】(11):前記(7) の文書検索装置において、
前記検索結果情報提示手段は、前記検索結果の文書の文
書属性を表示させる際、文書ベクトルの情報要求関連の
情報量といった検索キーをも考慮した背景色などの表示
特性を用いて表示させる機能を備えている。
【0020】(12):文書データを格納した文書データベ
ースと、前記文書データベースの文書検索処理を行う検
索エンジンと、情報の視覚的操作のためのインターフェ
ース制御を行うグラフィカルユーザインターフェースモ
ジュールと、前記検索エンジンによる検索結果の情報に
対して関連情報の統合処理を行う関連統合モジュール
と、文書属性の表示管理を行う文書属性表示管理モジュ
ールと、検索結果情報の評価情報を管理し、関連フィー
ドバックが行われた際、その文書の表示情報を制御する
関連フィードバック管理モジュールとを備えた文書検索
装置に、文書検索での検索結果提示の際に、検索結果の
文書間の関連度情報に基づき、関連度の高い文書をまと
めて表示させる手順を実行させるためのプログラムを記
録したコンピュータ読取可能な記録媒体。
【0021】(作用)前記構成に基づく本発明の作用を
説明する。 (a) :前記(1) の作用 グラフィカルユーザインターフェースモジュールは、ユ
ーザより検索キーが与えられると、その検索キーを検索
エンジンに渡す。この時、検索エンジンは前記検索キー
によるデータベースの検索を行い、検索結果情報を取得
する。関連統合モジュールは、前記データベース検索の
結果得られた検索結果情報について、予めユーザから指
定された関連統合処理を行い、関連統合表示情報を得
る。
【0022】また、文書属性表示管理モジュールは、前
記検索結果情報について、文書属性表示のための処理を
行い、文書属性表示情報を得る。そして、グラフィカル
ユーザインターフェースモジュールはディスプレイ装置
の画面上に前記各モジュールから受け取った情報を表示
してユーザに提示する。
【0023】更に、関連フィードバック管理モジュール
は、前記検索結果情報における評価情報を管理し、関連
フィードバックが行われた際、表示制御のための情報を
グラフィカルユーザインターフェースモジュールへ渡
す。この情報を受け取ったグラフィカルユーザインター
フェースモジュールは、その情報をディスプレイ装置の
画面上に表示してユーザに提示する。
【0024】このような文書検索処理において、検索結
果情報提示手段は、文書検索での検索結果提示の際に検
索結果の文書間の関連度情報に基づき、関連度の高い文
書の情報をまとめて表示させる。
【0025】このようにすれば、通常の検索結果におけ
る順位や検索キーとの関連度などの情報に加え、それぞ
れの文書間の関連情報を含む検索結果情報を提示するこ
とができる。そして、文書間の関連度の計算は、検索結
果における検索キーとの関連度が高いもののみに限定す
ることができるため、高速な処理が可能になる。更に、
検索時に得られる文書データからの情報を活用すること
で、効率的な検索結果情報や操作手段の提供が可能にな
る。
【0026】(b) :前記(2) の作用 前記文書検索時において、検索結果情報提示手段は、関
連度の高い文書の情報をまとめて表示させる際多段階に
階層的に表示させる。このようにすれば、文書間の関係
が見やすくなり、検索結果情報が効率的に活用できる。
【0027】(c) :前記(3) の作用 前記文書検索時において、前記検索結果情報提示手段
は、検索結果の文書間の関連度情報に基づき、上位レベ
ルの文書のみの表示や下位レベルの展開を含むアウトラ
イン操作を行う。このようにすれば、例えば、上位レベ
ルの文書のみの表示により、検索キーとの関連度の高い
文書の概要を大まかに知ることができる。従って、検索
漏れを減らすことができる。
【0028】(d) :前記(4) の作用 前記文書検索時において、前記検索結果情報提示手段
は、検索結果提示の際に、同一グループに属する複数文
書に対し、関連フィードバックの対象とする/しないの
指定を一度に行える手段(例えば、画面上にオン/オフ
ボタンを表示し、マウス等によるクリックで指定する手
段)を提供する。このようにすれば、効率的な検索結果
情報や操作手段の提供が可能になる。
【0029】(e) :前記(5) の作用 前記文書検索時において、前記検索結果情報提示手段
は、検索結果提示の際に関連度判定の閾値をアイテムの
密集度に応じて動的に変更する。この場合、文書データ
ベースによっては、検索の結果検索キーとの関連度の高
い文書が多く存在することがあり、検索結果の文書が全
て一つのグループになってしまうこともある。そのよう
な場合、前記のように、関連度を判定する閾値を動的に
変更することで、常に適切な検索結果情報を提示するこ
とができる。
【0030】(f) :前記(6) の作用 前記文書検索時において、前記検索結果情報提示手段
は、関連フィードバックを用いた検索結果提示の際に関
連フィードバックに伴う評価の向上/下降を表示させ
る。このようにすれば、前回の検索結果との順位や関連
度といった評価の違いを明確にすることができ、検索結
果情報の効率的な利用が可能になる。
【0031】(g) :前記(7) の作用 前記文書検索時において、前記検索結果情報提示手段
は、関連フィードバックを用いた検索結果提示の際に関
連フィードバックに伴い評価の向上した文書の表示を優
先させる。このようにすれば、検索漏れを減らし、関連
フィードバックによる検索精度向上の効率化を期待でき
る。
【0032】(h) :前記(8) の作用 前記文書検索時において、前記検索結果情報提示手段
は、検索結果提示の際に検索結果の文書の文書属性を表
示させる。このようにすれば、通常の検索結果情報に加
え、文書に含まれる情報量を提示することで、より効率
的な検索結果の利用が可能になる。
【0033】(i) :前記(9) の作用 前記文書検索時に検索結果の文書の文書属性を表示させ
る場合、前記検索結果情報提示手段は、文書中のキーワ
ードといった何らかの観点による特徴素を、背景色の濃
淡などの表示特性を用いて表示させる。このようにすれ
ば、特徴素が見やすくなり、検索結果情報の効率的な利
用が可能になる。
【0034】(j) :前記(10)の作用 前記文書検索時に検索結果の文書の文書属性を表示させ
る場合、前記検索結果情報提示手段は、文書長及びキー
ワード密度といった何らかの観点による複数の特徴素
を、背景色の濃淡などの複数の表示特性を用いて表示さ
せる。このようにすれば、特徴素が見やすくなり、検索
結果情報の効率的な利用が可能になる。
【0035】(k) :前記(11)の作用 前記文書検索時に検索結果の文書の文書属性を表示させ
る場合、前記検索結果情報提示手段は、前記検索結果の
文書の文書属性を表示させる際、文書ベクトルの情報要
求関連の情報量といった検索キーをも考慮した背景色な
どの表示特性を用いて表示させる。このようにすれば、
特徴素が見やすくなり、検索結果情報の効率的な利用が
可能になる。
【0036】(l) :前記(12)の作用 文書検索装置において、前記記録媒体から読み出したプ
ログラムを実行することにより、文書検索での検索結果
提示の際に、検索結果の文書間の関連度情報に基づき、
関連度の高い文書の情報をまとめて表示させる。
【0037】このようにすれば、通常の検索結果におけ
る順位や検索キーとの関連度などの情報に加え、それぞ
れの文書間の関連情報を含む検索結果情報の提示を得る
ことができる。そして、文書間の関連度の計算は、検索
結果における検索キーとの関連度が高いもののみに限定
することができるため、高速な処理が可能になる。更
に、検索時に得られる文書データからの情報を活用する
ことで、効率的な検索結果情報や操作手段の提供が可能
になる。
【0038】
【発明の実施の形態】以下、発明の実施の形態を図面に
基づいて詳細に説明する。 §1:文書検索装置の説明・・・図1参照 図1は装置構成図である。以下、図1に基づいて、文書
検索装置の構成を説明する。図1に示したように、文書
検索装置は、装置本体1と、前記装置本体1に接続され
たディスプレイ装置2、キーボード3、ハードディスク
装置(HDD)5、プリンタ6、フレキシブルディスク
装置(FDD)7等により構成されている。
【0039】また、装置本体1には、文書検索時の各種
制御を行うCPU10と、入出力制御を行う入出力制御
部11と、メモリ12等が設けてある。この場合、前記
ハードディスク装置5には、データベース(後述する)
や文書検索処理に必要なプログラムを格納しておき、文
書検索を行う場合には、CPU10の制御によりハード
ディスク装置5内のプログラムを読み出してメモリ12
に格納する。そして、CPU10がメモリ12から必要
なプログラムを読み出して実行することで、文書検索処
理を実行する。なお、前記文書検索装置は、パーソナル
コンピュータ、ワークステーション等の各種コンピュー
タで実現できる。
【0040】§2:文書検索モジュールの説明・・・図
2参照 図2は文書検索モジュールの説明図である。前記文書検
索装置には、図2に示したような文書検索モジュールが
格納されており、これらのモジュール等により文書検索
処理を行う。以下、詳細に説明する。
【0041】図2に示したように、前記文書検索装置に
は、グラフィカル・ユーザ・インターフェースモジュー
ル(Graphycal User Interface:以下「GUIモジュー
ル」と記す)21と、文書検索制御モジュール22と、
検索エンジン23と、関連統合モジュール24と、文書
属性表示管理モジュール25と、関連フィードバック管
理モジュール26を備えている。そして、前記モジュー
ルにより文書データベース27の検索処理を行う。
【0042】前記GUIモジュール21は、コンピュー
タを視覚的に操作できるように考案されたインターフェ
ースモジュールであり、OSやOS上の基本環境として
提供されるものである。例えば、ビットマップディスプ
レイにウインドウを開き、ドライブやディレクトリ、フ
ァイルをアイコンで表示し、マウスなどのポインティン
グデバイスで操作する。
【0043】前記文書検索制御モジュール22は、検索
エンジン23、関連統合モジュール24、文書属性表示
管理モジュール25、関連フィードバック管理モジュー
ル26に対する制御を行うと共に、GUIモジュール2
1との間で情報交換を行うことで、文書検索処理全体の
制御を行うものである。
【0044】前記検索エンジン23は、文書検索制御モ
ジュール22の指示により文書データベース27の検索
処理を行い、検索結果を文書検索制御モジュール22へ
転送するものである。前記関連統合モジュール24は、
文書検索制御モジュール22の指示により検索結果の情
報に対して関連する情報の統合処理を行うものである。
【0045】前記文書属性表示管理モジュール25は、
文書検索制御モジュール22の指示により、検索結果の
情報に対して文書属性の表示管理を行うものである。前
記関連フィードバック管理モジュール26は、文書検索
制御モジュール22の指示により検索結果の情報におけ
る評価情報を管理し、関連フィードバックが行われた
ら、指定された表示制御のための情報を文書検索制御モ
ジュール22へ転送するものである。
【0046】前記文書データベース27は、文書データ
(単に「文書」と記す)を格納したデータベースであ
り、前記ハードディスク装置5の記憶媒体(又は記録媒
体)に記憶されている。なお、前記GUIモジュール2
1と、文書検索制御モジュール22と、検索エンジン2
3と、関連統合モジュール24と、文書属性表示管理モ
ジュール25と、関連フィードバック管理モジュール2
6は、それぞれ文書検索処理用のプログラム(図1のハ
ードディスク装置5から読み出し、メモリ12に格納し
てCPU10が実行するプログラム)の実行により実現
する。
【0047】前記モジュールの動作概要は次の通りであ
る。GUIモジュール21は、ユーザより検索キーが与
えられると、その検索キーを文書検索制御モジュール2
2へ渡す。この検索キーを受け取った文書検索制御モジ
ュール22は、検索エンジン23に指示して文書データ
ベース27の検索を行い、検索結果の情報を取得する。
【0048】文書検索制御モジュール22は、受け取っ
た検索結果情報を関連統合モジュール24及び文書属性
表示管理モジュール25へと渡す。関連統合モジュール
24は、渡された検索結果情報について予めユーザから
指定された関連統合処理を行い、文書検索制御モジュー
ル22へと関連統合表示情報を与える。
【0049】また、文書属性表示管理モジュール25
は、前記渡された検索結果情報について文書属性表示の
ための処理を行い、文書検索制御モジュール22へと文
書属性表示情報を与える。そして、文書検索制御モジュ
ール22は前記得られた情報をGUIモジュール21へ
渡し、GUIモジュール21はディスプレイ装置2の画
面上に前記受け取った情報を表示してユーザに提示す
る。
【0050】また、関連フィードバック管理モジュール
26は、検索結果情報における評価情報を管理し、関連
フィードバックが行われた際、表示制御のための情報を
文書検索制御モジュール22へ渡す。この情報を受け取
った文書検索制御モジュール22は、その情報をGUI
モジュール21へ渡し、GUIモジュール21は受け取
った情報をディスプレイ装置2の画面上に表示してユー
ザに提示する。
【0051】§3:具体例による文書検索処理の説明 以下、図に基づいて、前記文書検索装置における文書検
索処理の具体例を説明する。なお、以下の例において、
検索結果情報の提示はディスプレイ装置2の画面上へ表
示することで行う。
【0052】(1) :例1・・・図3、4参照 図3は例1の処理フローチャート(その1)、図4は例
1の処理フローチャート(その2)である。例1は、文
書検索での検索結果提示の際に、検索結果の文書間の関
連度情報に基づき、関連度の高い文書をまとめて表示す
る例である。以下、図3、4に基づいて例1の処理を説
明する。なお、S1〜S12は各処理ステップを示す。
【0053】:全体の処理・・・図3参照 例1は、文書検索での検索結果提示の際に、検索結果の
文書間の関連度情報に基づき、関連度の高い文書をまと
めて表示する例であり、先ず、文書検索制御モジュール
22の指示により、検索エンジン23が文書データベー
ス27を検索し、検索結果情報を得る。
【0054】そして、得られた検索結果情報は文書検索
制御モジュール22へ渡された後、関連統合モジュール
24へ渡される。このようにして、関連統合モジュール
24は検索結果情報、すなわち、検索結果の各文書の情
報として、文書ID、検索キーとの関連度、タイトル、
対応するベクトル等の情報を得る(S1)。
【0055】次に、関連統合モジュール24は、各文書
間の関連度を計算し、関連度が与えられた閾値(予め設
定しておく)以上のものを統合する(S2)。そして、
統合された文書同士がまとまって表示されるように、検
索結果情報を提示する(S3)。
【0056】なお、前記S2の処理では、各文書間の関
連度を計算し、関連度が与えられた閾値以上のものを統
合するが、この処理の具体例としてはいくつかの処理が
ある。ここでは、関連度の高い順に簡易的に統合する処
理と、クラスタリングに基づき統合する処理について以
下に説明する。
【0057】:関連度の高い順に簡易的に統合する処
理の説明・・・図4のA図参照 図4のA図に示したように、関連度の高い順に簡易的に
統合する処理では、次のように処理を行う。先ず、関連
統合モジュール24は、パラメータiを初期値1に設定
(i←1)し(S5)、全ての文書について処理が済ん
だか否かを判断する(S6)。
【0058】その結果、全ての文書について処理が済ん
でいれば、処理を終了するが、処理が済んでいなけれ
ば、i位の文書Diはマーク(処理済みか否かを示すマ
ーク)されているか否かを判断する(S7)。その結
果、マークされていれば、iを更新(i←i+1)し
(S10)、S6の処理から繰り返して行う。しかし、
S7の処理で、マークされていなければ(未処理であれ
ば)、i+1位以下のマークされていない各文書につい
て、Diとの関連度を求め、関連度が予め定めた閾値よ
り高いものをDiと統合する(S8)。
【0059】次に、関連統合モジュール24は、前記D
iと統合した文書にマークし(S9)、iを更新(i←
i+1)し(S10)、S6の処理から繰り返して行
う。このようにして、全ての文書について前記処理を行
うことで、文書間の関連度の高い順に簡易的に統合する
ことができる。
【0060】:クラスタリングに基づき統合する処理
の説明・・・図4のB図参照 図4のB図に示したように、クラスタリングに基づき統
合する処理では次のように処理を行う。先ず、関連統合
モジュール24は、検索結果の文書全体を階層型クラス
タリングを用いてクラスタ間の距離が閾値(予め設定し
ておく)を越えるようクラスタC1,C2,・・・Cm
へと分ける(S11)。次に、各クラスタに属する文書
を統合する(S12)。このような処理により、クラス
タリングに基づき統合する処理を行う。
【0061】(2) :例2・・・図5、6参照 図5は例2の処理フローチャート(その1)、図6は例
2の処理フローチャート(その2)である。例2は、前
記関連度の高い文書をまとめて表示する際、多段階に階
層的に表示する例である。以下、図5、6に基づいて例
2の処理を説明する。なお、S21〜S39は各処理ス
テップを示す。
【0062】:全体の処理・・・図5のA図参照 例2の処理は、前記例1において、関連度の高い文書を
まとめて表示する際、多段階に階層的に表示する例であ
り、図5のA図に示したように、先ず、関連統合モジュ
ール24は、検索エンジン23より、文書検索制御モジ
ュール22を介して検索結果の各文書の情報(文書I
D、検索キーとの関連度、タイトル、対応するベクト
ル)を得る(S21)。
【0063】次に、関連統合モジュール24は、各文書
間の関連度を計算し、関連度が与えられた閾値以上のも
のを階層的に統合する(S22)。そして、前記統合し
た情報を文書検索制御モジュール22を介してGUIモ
ジュール21へ渡し、該GUIモジュール21により画
面に表示することで、統合された文書同士が纏まって表
示されるように、検索結果を提示する(S23)。
【0064】このようにして、関連度の高い文書をまと
めて表示する際、多段階に階層的に表示することができ
る。なお、前記関連度の高いものを階層的に統合する処
理には幾つかのやり方がある。ここでは、クラスタリン
グに基づき統合する処理と、関連度の高い順に簡易的に
統合する処理とについて以下に説明する。
【0065】:クラスタリングに基づき統合する処理
の説明・・・図5のB図参照 図5のB図に示したように、クラスタリングに基づき統
合する処理は次のようにして処理を行う。先ず、関連統
合モジュール24は、検索結果の文書全体を、階層型ク
ラスタリングを用いてクラスタ間の距離が予め定めた閾
値を越えるようクラスタC1,C2,・・・Cmへと分
ける。その際、クラスタリング過程の階層情報をメモリ
12に保存する(S25)。そして、関連統合モジュー
ル24は、各クラスタの階層情報に基づいて、文書を統
合する(S26)。このようにして、クラスタリングに
基づき統合する処理を行う。
【0066】:関連度の高い順に統合する処理の説明
・・・図6のC図参照 図6のC図に示したように、前記関連度の高い順に統合
する処理は次のようにして行う。先ず、関連統合モジュ
ール24は、パラメータiを初期化(i←1)し(S3
1)、全ての文書について処理が済んだか否かを判断す
る(S32)。その結果、全ての処理が済んでいれば、
処理を終了するが、全ての処理が済んでいなければ、i
位の文書Diはマーク(処理済みか否かを示すマーク)
されているか否かを判断する(S33)。
【0067】その結果、i位の文書Diがマークされて
いれば、iを更新(i←1)し(S35)、S32の処
理から繰り返して行う。しかし、i位の文書Diがマー
クされていなければ、統合処理integ(Di)(詳
細は後述する)を行い(S34)、iを更新(i←1)
し(S35)、S32の処理から繰り返して行う。
【0068】:統合処理integ(Di)・・・図
6のD図参照 図6のD図に示したように、前記S34の処理で行う統
合処理integ(Di)は次のようにして行う。先
ず、関連統合モジュール24は、i+1位以下のマーク
されていない各文書について、Diとの関連度を求め、
関連度が予め定めた閾値より高いものをDiと統合する
(S37)。
【0069】次に、Diと統合した文書にマーク(処理
済みか否かを示すマーク)し(S38)、Di(の直
下)に統合された各文書Djについて、統合処理int
eg(Dj)を再帰的に実行する(S39)。このよう
にして、前記統合処理integ(Di)を行う。
【0070】(3) :例3・・・図7参照 図7は例3の処理フローチャートである。例3は、文書
検索時において、検索結果の文書間の関連度情報に基づ
き、上位レベルの文書のみの表示や下位レベルの展開を
含むアウトライン操作を提供する例である。以下、図7
に基づいて例3の処理を説明する。なお、S41〜S4
6は各処理ステップを示す。
【0071】:全体の処理・・・図7のA図参照 例3は、例1の文書検索処理において、検索結果の文書
間の関連度情報に基づき、上位レベルの文書のみの表示
や、下位レベルの展開といったアウトライン操作を提供
する例であり、図7のA図に示したように、先ず、関連
統合モジュール24は、検索エンジン23より、文書検
索制御モジュール22を介して検索結果の各文書の情報
を得る(S41)。この場合の検索結果の各文書の情報
には、文書ID、検索キーとの関連度、タイトル、対応
するベクトル等を含む。
【0072】次に、関連統合モジュール24は、各文書
間の関連度を計算し、関連度に基づき文書間の階層性を
抽出する様に統合する(S42)。そして、抽出された
階層性に基づき、ユーザ指示に基づき、アウトライン操
作を実行する(S43)。このようにして、検索結果の
文書間の関連度情報に基づき、上位レベルの文書のみの
表示や、下位レベルの展開といったアウトライン操作を
提供する。
【0073】なお、前記アウトライン操作には様々なも
のがあるが、基本的には各文書に対応するノード(文
書)の展開と、ノードの統合の組み合わせで実現され
る。この場合の処理は次のようになっている。
【0074】:ノードの展開の説明・・・図7のB図
参照 図7のB図に示したように、ノードの展開では、或るノ
ード(文書)の直下のノードを表示に追加する(S4
5)。このようにしてノードの展開を行う。
【0075】:ノードの統合の説明・・・図7のC図
参照 図7のC図に示したように、ノードの統合は、あるノー
ド(文書)の下位のノードの表示を表示から削除する
(S46)。このようにしてノードの統合を行う。
【0076】(4) :例4・・・図無し 例4は、例1の文書検索処理において、検索結果の提示
の際に、同一グループのオン/オフ指定を一度に行える
ようにした例である。例4では、関連フィードバック指
定の際のGUIとして、検索結果の文書間の関連度情報
に基づく階層性を利用して、同じグループに属する文書
を一度にオン/オフ(関連フィードバックの対象とする
/しない)指定を行うボタンを設けることで、関連フィ
ードバック指定を効率化する。
【0077】なお、前記ボタンは、例えば、表示画面上
に表示されたクリックボタン(マウスでクリック可能な
ボタン)であり、このボタンを使って、複数文書を一度
に指定できるようにするものである。
【0078】(5) :例5・・・図8参照 図8は例5の処理フローチャートである。例5は、前記
文書検索処理において、検索結果提示の際に、関連度判
定の閾値を、アイテムの密集度に応じて動的に変更する
例である。以下、図8に基づいて例5の処理を説明す
る。なお、S51〜S55は各処理ステップを示す。
【0079】例5は、例1の文書検索処理において、検
索結果提示の際に、関連度判定の閾値を、アイテムの密
集度に応じて動的に変更する例であり、図8に示したよ
うに、関連統合モジュール24は、先ず、検索エンジン
23より文書検索制御モジュール22を介して検索結果
の各文書の情報を得る(S51)。この場合の検索結果
の各文書の情報には、文書ID、検索キーとの関連度、
タイトル、対応するベクトル等を含む。
【0080】次に、関連統合モジュール24は、各文書
間の関連度を計算し、関連度に基づき文書間の階層性を
抽出する様に統合する(S52)。この場合、関連度の
計算結果は、再試行の時のためにメモリ12に保存して
おくと良い。次に、関連統合モジュール24は、統合結
果のグループ数が予め決めたグループ数より少ないか否
かを判断する(S53)。
【0081】その結果、統合結果のグループ数が、予め
決めたグループ数より少なければ、関連度判定の閾値を
上げ(S54)、前記閾値の値が、予め決めた規定値以
下か否かを判断する(S55)。その結果、予め決めた
規定値以下ならば、S52の処理から繰り返して行い、
予め決めた規定値以下でなければ、処理を終了する。ま
た、前記S53の処理で、統合結果のグループ数が、予
め決めたグループ数より少なくなければ、処理を終了す
る。
【0082】(6) :例6・・・図9のB図参照 図9のB図は例6の処理フローチャートである。例6
は、例1の文書検索処理において、関連フィードバック
を用いた検索結果提示の際に、関連フィードバックに伴
う評価の向上/下降を表示する例である。以下、図9の
B図に基づいて例6の処理を説明する。なお、S65〜
S67は各処理ステップを示す。
【0083】例6は、例1の文書検索処理において、関
連フィードバックを用いた検索結果提示の際に、関連フ
ィードバックに伴う評価の向上/下降を表示する例であ
り、図9のB図に示したように、関連フィードバック管
理モジュール26は、検索結果における各文書につい
て、以下の処理を行う(S65)。
【0084】先ず、文書IDを元に、前回の検索結果と
の評価(その文書の順位や関連度)の比較を行う(S6
6)。次に、評価の向上/下降情報を表示するための処
理を行う(S67)。
【0085】この場合、関連フィードバック管理モジュ
ール26は、前記評価の向上/下降情報を作成し、文書
検索制御モジュール22へ渡す。この情報を受け取った
文書検索制御モジュール22はその情報をGUIモジュ
ール21へ送り、このGUIモジュール21がディスプ
レイ装置2の画面上に前記情報を表示させる。
【0086】(7) :例7・・・図10参照 図10は例7の処理フローチャートである。例7は、例
1の文書検索処理において、関連フィードバックを用い
た検索結果提示の際に関連フィードバックに伴い、評価
の向上した文書の表示を優先させる例である。以下、図
10に基づいて例7の処理を説明する。なお、S71〜
S74は各処理ステップを示す。
【0087】図10に示したように、関連フィードバッ
ク管理モジュール26は、検索結果における各文書につ
いて、以下の処理を行う(S71)。先ず、文書IDを
元に、前回の検索結果との評価(その文書の順位や関連
度)の比較を行い(S72)、評価の下降が、予め決め
た値より大きいか否かを判断する(S73)。
【0088】その結果、評価の下降が、予め決めた値よ
り大きければ、その文書の表示を抑制し(S74)し、
処理を終了する。また、評価の下降が予め決めた値より
大きくなければ、そのまま処理を終了する。このように
して、関連フィードバックを用いた検索結果提示の際
に、関連フィードバックに伴い、評価の向上した文書の
表示を優先させる処理を行う。
【0089】(8) :例8〜11・・・図9のA図参照 図9のA図は例8〜例11の処理フローチャートであ
る。以下、図9のA図に基づいて例8〜例11の処理を
説明する。なお、S61、S62は各処理ステップを示
す。例8は、例1の文書検索処理において、検索結果提
示の際に検索結果の文書の文書属性を提示する例であ
る。例9は、例8において、文書中のキーワードといっ
た何らかの観点による特徴素を、背景色の濃淡などの表
示特性を用いて提示する例である。
【0090】例10は、例8において、文書長及びキー
ワード密度といった何らかの観点による複数の特徴素を
背景色の濃淡などの複数の表示特性を用いて提示する例
である。例11は、例8において、文書ベクトルの情報
要求関連の情報量といった検索キーをも考慮した背景色
などの表示特性を用いた提示する例である。
【0091】図9のA図に示したように、文書属性表示
管理モジュール25は、文書検索制御モジュール22を
介して検索エンジン23により検索結果の各文書の情報
(文書ID、検索キーとの関連度、タイトル、対応する
ベクトル、属性情報)を得る(S61)。そして、検索
結果の各文書について(必要ならば適宜計算を行い)文
書属性を提示する。 §4:検索結果情報例表示例の説明・・・図11〜図1
5参照 図11〜図15は、検索結果情報表示例(その1)〜
(その5)である。以下、図11〜図15に基づいて前
記各例の処理による検索結果情報表示例を説明する。な
お、以下に説明する各例は、それぞれ前記例1〜11に
対応している。
【0092】(1) :例1・・・図11のA図参照 図11のA図は、前記例1の検索処理により得られた結
果の表示例(関連統合表示)である。この例では、前記
従来例と同様に、数百件の文書(論文)からの検索結果
であり、検索キーとして「概念学習」を用いたものであ
る。
【0093】前記従来例に対し、例1では、関連統合モ
ジュール24で文書間の関連度を求め、関連度が高いも
の同士をまとめて表示すると、図11のA図のように、
従来例の検索結果における順位や検索キーとの関連度な
どの情報に加え、それぞれの文書間の関連情報を含む検
索結果提示ができる。図11の検索結果情報では、各文
書毎に、順位、関連度、文書ID、文書タイトルの順に
表示されている。
【0094】この例では、順位=1は、関連度=0.8
4、文書ID=92−89−03であり、文書タイトル
は、「名詞述語文からの概念学習システム−比喩の理解
と学習−」となっている。順位=2は、関連度=0.7
8、文書ID=90−79−04であり、文書タイトル
は、「名詞述語文における意味概念の学習」となってい
る。
【0095】順位=3は、関連度=0.74、文書ID
=91−83−19であり、文書タイトルは、「自然言
語概念学習に関する考察」となっている。順位=4は、
関連度=0.72、文書ID=93−93−06であ
り、文書タイトルは、「名詞述語文からの概念学習シス
テム−継承と経路情報の処理−」となっている。
【0096】順位=5は、関連度=0.65、文書ID
=92−92−11であり、文書タイトルは、「ハイパ
ー・シソーラスとその学習」となっている。順位=6
は、関連度=0.56、文書ID=90−78−06で
あり、文書タイトルは、「記述量圧縮の観点から見た概
念体系の構築」となっている。
【0097】順位=7は、関連度=0.54、文書ID
=91−85−09であり、文書タイトルは、「概念の
動的管理システム」となっている。順位=8は、関連度
=0.50、文書ID=91−83−14であり、文書
タイトルは、「語彙概念と知識について」となってい
る。
【0098】順位=9は、関連度=0.45、文書ID
=90−75−07であり、文書タイトルは、「自然言
語意味学習の試み」となっている。順位=10は、関連
度=0.45、文書ID=90−75−12であり、文
書タイトルは、「概念辞書の作成」となっている。
【0099】この場合、文書間の関連度の計算は、検索
結果における検索キーとの関連度が高いもののみに限定
することができるため、高速な処理が可能になる。な
お、この例1では、次の順序で処理を行い、図示の情報
を得た。
【0100】:順位1との関連度の高い(或る閾値以
上の)ものを求める。その結果、順位2、4の検索結果
情報(順位1に対して、順位2、4は下位レベルの情
報)を得る。
【0101】:順位2はマーク済み(処理済み)なの
で、次に、順位3との関連度の高い(或る閾値以上の)
ものを求める。その結果、順位9の検索結果情報(順位
3に対して、順位9は下位レベルの情報)を得る。
【0102】:順位4はマーク済み(処理済み)なの
で、次に、順位5との関連度の高い(或る閾値以上の)
ものを求める。その結果、関連度の高いものは得られな
かった。
【0103】:順位6との関連の高い(或る閾値以上
の)ものを求める。その結果、関連度の高いものは得ら
れなかった。 :順位7との関連の高い(或る閾値以上の)ものを求
める。その結果、順位10の検索結果情報(順位7に対
して、順位10は下位レベルの情報)を得る。
【0104】:順位8との関連の高い(或る閾値以上
の)ものを求める。その結果、関連度の高いものは得ら
れなかった。 (2) :例2・・・図11のB図参照 図11のB図は、前記例2の検索処理により得られた結
果の表示例(関連統合表示)である。この例2では、関
連度の高い文書をまとめて表示する際、多段階に階層的
に表示する。すなわち、1レベルの階層の代わりに再帰
的な処理を行うと、図示のような多段階の階層的表示
(階層的な関連統合表示)を得る。この場合、図示した
各順位の検索結果情報は、前記例1と同じである。な
お、この例2では、次の順序で処理を行い、図示の情報
を得た。
【0105】:順位1との関連度の高い(或る閾値以
上の)ものを求める。その結果、順位2、4の検索結果
情報を得る。 :順位2との関連度の高い(或る閾値以上の)ものを
求める。その結果、順位7の検索結果情報を得る。
【0106】:順位7との関連度の高い(或る閾値以
上の)ものを求める。その結果、順位10の検索結果情
報を得る。 :順位4との関連の高い(或る閾値以上の)ものを求
める。その結果、関連度の高いものは得られなかった。
【0107】:順位3との関連の高い(或る閾値以上
の)ものを求める。その結果、順位9の検索結果情報を
得る。以下、同様にして、図示の検索結果情報を得た。 (3) :例3・・・図12参照 図12のA図、B図は、前記例3の検索処理により得ら
れた結果の表示例(アウトライン処理による表示例)で
あり、A図は上位レベルの文書のみの表示例、B図は下
位レベル文書の展開表示例である。
【0108】例3では、検索結果における文書間の関連
性による階層構造に注目することで、上位レベルの文書
のみの表示(図12のA図参照)や、下位レベル文書の
展開(図12のB図参照)といった効率の良いアウトラ
イン操作が可能になる。
【0109】そして、例えば、上位レベルの文書のみの
表示により、検索キーと関連度の高い文書の概要を、よ
り大まかに知ることができ、検索漏れの可能性を減らす
ことができる。図12の検索結果情報では、各文書毎
に、順位、関連度、文書ID、文書タイトルの順に表示
されている。
【0110】図12のA図の例では、図11のA図に示
した表示例において、上位レベルの文書のみを表示して
いる。すなわち、図11のA図において、順位1に対し
て、順位2、4は下位レベルの情報であり、順位3に対
して、順位9は下位レベルの情報であり、順位7に対し
て、順位10は下位レベルの情報である。そこで、前記
下位レベルである、順位2、4、9、10の情報を無く
し、上位レベルの情報のみを表示すると、図12のA図
に示した例3の情報を得る。
【0111】従って、例3の図12のA図に示した例で
は、順位1、3、5、6、7、8の各情報が表示される
と共に、新たに、順位11、12、14、15の各情報
が表示されている。なお、この場合、下位レベル文書の
数(自分を含む)も表示することで、下位レベル文書の
情報も提示している。
【0112】すなわち、各文書について、順位1では下
位レベル文書の数=3、順位3では下位レベル文書の数
=2、順位5では下位レベル文書の数=1、順位6では
下位レベル文書の数=1、順位7では下位レベル文書の
数=2、順位8では下位レベル文書の数=1、順位11
では下位レベル文書の数=1、順位12では下位レベル
文書の数=2、順位14では下位レベル文書の数=1、
順位15では下位レベル文書の数=1となっている。
【0113】また、図12のB図に示した例3は、図1
1のA図に示した表示例において、上位レベルの文書の
みを表示しているだけでなく、順位7の文書についての
み、下位レベル文書の展開(順位7の下位レベルが順位
10として表示されている)が行われている。
【0114】(4):例5・・・図13参照 図13は検索結果情報表示例(その3)であり、前記例
5の検索処理により得られた結果の表示例(動的な関連
度閾値の変更による表示例)である。図13のA図は閾
値を或る値に設定した場合の表示例、B図は前記閾値を
上げた場合の表示例を表す。
【0115】ところで、文書データベースによっては、
検索の結果検索キーと関連度の高い文書が多く存在する
ことがあり、検索結果の文書が全て一つのグループにな
ってしまうことがある。そのような場合、関連度を判定
する閾値を動的に変更することで、常に適切な検索結果
情報の提示を得ることができる。このように動的に関連
度の閾値を変更して検索結果を得た例が図13に示して
ある。
【0116】この例では、検索キーを「機械翻訳」とし
て、前記文書データベース27を検索した結果の情報例
であり、順位、関連度、文書ID、文書タイトルの順に
表示されている。図13のA図に示した例では、順位1
の文書は、順位=1、関連度=0.91、文書ID=9
1−82−05、文書タイトル=用例主導型機械翻訳と
なっており、この順位1の文書の下位レベル文書とし
て、順位2〜10の各文書が並んでいる。
【0117】すなわち、順位2〜10は全て順位1に関
連した文書として表示されているが、これらの下位レベ
ルの表示は、密集度が高過ぎる。そこで、関連度数の閾
値を上げて検索を行うと、図13のB図のような検索結
果情報の表示が得られる。
【0118】この例では、閾値を上げたことで、順位1
の下位レベルは順位2のみとなる。また、順位3の下位
レベルは順位5のみとなり、順位4の下位レベルは順位
9のみとなり、順位6位の下位レベルは順位7、8、1
0となる。このように、検索結果の提示の際に、関連度
判定の閾値をアイテムの密集度に応じて動的に変更する
ことで、常に、適切な検索結果情報の提示が可能にな
る。
【0119】(5):例6〜例11の説明・・・図14、
図15参照 図14は検索結果情報表示例(その4)、図15は検索
結果情報表示例(その5)である。検索結果提示におい
ては、検索キーとの関連度の強さのみでなく、検索され
た文書に含まれる情報量もユーザにとって重要である。
すなわち、関連度は、「文書Aの方が少し高いが、文書
Bの方が内容が多そうなので、先ず、文書Bから目を通
そう」ということがあるからである。
【0120】そこで、通常の検索結果に加え、文書に含
まれる情報量を提示することで、より効率的な検索結果
の利用が可能になる(例8)。その際の提示に用いる文
書情報量や、提示方法としては、:文書中のキーワー
ドの量(キーワードの総数など)を、背景色の濃淡で提
示する(例9)。:文書長(文書単語数、或いは文書
文字数)を背景色の長さで、キーワード密度(キーワー
ド量/文書長)を背景色の濃淡で表示する(例10)。
:文書ベクトルの情報要求関連の情報量(キーベクト
ル方向成分)を提示する(例11)などが考えられる。
【0121】実際の検索では、或る検索キーで検索を行
った後、関連フィードバックを繰り返し行うことで、よ
り適切に検索結果を得るための絞り込みを行うことが多
い。関連フィードバックを行うと、通常の場合、前回と
は異なる検索結果を得る。その際、どこがどう変化した
のか分かりやすく提示することができれば、検索結果の
有効利用につながる。
【0122】本発明では、関連フィードバック情報(或
いは、評価情報)を用いることで、前回の検索結果との
順位や関連度といった評価の違いを求め、それを検索結
果と一緒に提示する(例6)。関連フィードバックによ
り評価が下がる文書は、例えば、順位が上の方でも、そ
の検索においては、あまり重要ではないと考えられる。
【0123】逆に、順位はそれほど高くなくても、関連
フィードバックにより評価が上がる文書は重要である可
能性がある。そこで、評価の向上した文書の表示を優先
させることで検索漏れを減らし、関連フィードバックに
よる検索精度向上の効率化を期待することができる(例
7)。前記関連フィードバックに伴う評価の変化の提示
例を図14、図15に基づいて説明する。
【0124】図14に示した検索結果情報表示例は、検
索キーを「曖昧」として文書データベース27を検索し
た結果の情報を表示した例である。この表示例でも前記
表示例と同様に、各文書について、順位、関連度、文書
ID、文書タイトルの順に表示されている。このような
検索結果表示情報に対し、図示の*印の文書(順位が
1、2、3、5、7、8の各文書)を対象として関連フ
ィードバックを行うと、図15のA図に示した例6の検
索結果情報表示例が得られた。
【0125】この例6の表示例では、前回の検索結果と
の順位や、関連度といった評価の違いを求め、それを検
索結果と一緒に提示する。この場合、任意の整数nに対
し、「↑n」はn位評価向上を表し、「↓n」はn位評
価下降を表し、「−0」は評価変化無しを表す。
【0126】また、図14の検索結果表示情報に対し、
図示の*印の文書(順位が1、2、3、5、7、8の各
文書)を対象として関連フィードバックを行い、評価向
上文書の優先表示を行うと、図15のB図に示した例7
の検索結果情報表示例が得られた。
【0127】この場合、「↓3」以上の表示を抑制
(「↓3」より悪いものを表示しない)しているので、
図15のA図に示した順位8、9の文書は表示が抑制さ
れ(表示されない)、新たに、順位10、11、12の
文書が表示されている。このようにすれば、検索漏れを
減らし、関連フィードバックによる検索精度向上の効率
化を期待することができる。
【0128】§5:記録媒体とプログラムの説明 前記文書検索装置が行う処理、すなわち、文書データベ
ース27の検索処理を行う検索エンジン23と、文書検
索時の制御を行う文書検索制御モジュール22と、情報
の視覚的操作のためのインターフェース制御を行うGU
Iモジュール21と、検索結果情報の関連統合処理を行
う関連統合モジュール24と、文書属性の表示管理を行
う文書属性表示管理モジュール25と、検索結果情報の
評価情報を管理し、関連フィードバックが行われた際、
その文書の表示情報を制御する関連フィードバック管理
モジュール26により行う文書検索処理は、文書検索装
置内のCPU10がメモリ12に格納したプログラムを
実行することにより、次のようにして実現する。
【0129】前記文書検索装置に設けたハードディスク
装置5の記録媒体(ハードディスク)に、文書データベ
ース27や、前記文書検索処理を実現するためのプログ
ラム、各種パラメータ等のデータを格納しておく。そし
て、文書検索処理を行う場合は、CPU10の制御によ
りハードディスク装置5の記録媒体に格納されている前
記プログラム等を読み出して装置本体1内のメモリ12
に取り込む。
【0130】その後、CPU10がメモリ12に格納し
てあるプログラムの内、必要なプログラムから順次読み
出して実行することにより、前記文書検索装置の文書検
索処理を行う。なお、前記ハードディスク装置5の記録
媒体に格納するプログラムは、次のようにして記録(記
憶)する。
【0131】:フレキシブルディスク(フロッピィデ
ィスク)に格納されているプログラム(他の装置で作成
したプログラムデータ)を、フレキシブルディスク装置
(FDD)7により読み取り、ハードディスク装置5の
記録媒体(ハードディスク)に格納する。
【0132】:光磁気ディスク、或いはCD−ROM
等の記憶媒体に格納されているデータを、前記装置本体
1に設けたドライブ装置(図示省略)により読み取り、
ハードディスク装置5の記録媒体(ハードディスク)に
格納する。
【0133】:LAN等の通信回線を介して他の装置
から伝送されたデータを前記装置本体1で受信し、その
データをハードディスク装置5の記録媒体(ハードディ
スク)に格納する。
【0134】
【発明の効果】以上説明したように、本発明によれば次
のような効果がある。 (1) :文書検索時に得られる文書データからの情報を活
用することで、効率的な検索結果提示や、操作手段の提
供が可能になる。
【0135】(2) :大規模な商用オンラインデータベー
スや、全文検索システムにおいても、検索精度や検索シ
ステムの使い勝手が良くなり、効率良く文書検索を行う
ことが可能になる。
【0136】前記効果の他、各請求項に対応して次のよ
うな効果がある。 (3) :請求項1では、グラフィカルユーザインターフェ
ースモジュールはユーザより検索キーが与えられるとそ
の検索キーを検索エンジンに渡し、検索エンジンは検索
キーによるデータベースの検索を行い検索結果情報を取
得する。関連統合モジュールはデータベース検索の結果
得られた検索結果情報について、予めユーザから指定さ
れた関連統合処理を行い関連統合表示情報を得る。
【0137】また、文書属性表示管理モジュールは検索
結果情報について文書属性表示のための処理を行い文書
属性表示情報を得る。そして、グラフィカルユーザイン
ターフェースモジュールはディスプレイ装置の画面上に
各モジュールから受け取った情報を表示してユーザに提
示する。
【0138】更に、関連フィードバック管理モジュール
は検索結果情報における評価情報を管理し、関連フィー
ドバックが行われた表示制御のための情報をグラフィカ
ルユーザインターフェースモジュールへ渡し、その情報
をディスプレイ装置の画面上に表示してユーザに提示す
る。このような文書検索処理において、検索結果情報提
示手段は文書検索での検索結果提示の際に検索結果の文
書間の関連度情報に基づき、関連度の高い文書の情報を
まとめて表示させる。
【0139】このようにすれば、通常の検索結果におけ
る順位や検索キーとの関連度などの情報に加え、それぞ
れの文書間の関連情報を含む検索結果情報を提示するこ
とができる。そして、文書間の関連度の計算は、検索結
果における検索キーとの関連度が高いもののみに限定す
ることができるため、高速な処理が可能になる。更に、
検索時に得られる文書データからの情報を活用すること
で、効率的な検索結果情報や操作手段の提供が可能にな
る。
【0140】(4) :請求項2では、文書検索時におい
て、検索結果情報提示手段は関連度の高い文書の情報を
まとめて表示させる際多段階に階層的に表示させる。こ
のようにすれば文書間の関係が見やすくなり、検索結果
情報が効率的に活用できる。
【0141】(5) :請求項3では、文書検索時におい
て、検索結果情報提示手段は検索結果の文書間の関連度
情報に基づき上位レベルの文書のみの表示や下位レベル
の展開を含むアウトライン操作を行う。このようにすれ
ば、例えば、上位レベルの文書のみの表示により、検索
キーとの関連度の高い文書の概要を大まかに知ることが
できる。従って、検索漏れを減らすことができる。
【0142】(6) :請求項4では、文書検索時におい
て、前記検索結果情報提示手段は検索結果提示の際に、
同一グループに属する複数文書に対し関連フィードバッ
クの対象とする/しないの指定を一度に行える手段を提
供する。このようにすれば、効率的な検索結果情報や操
作手段の提供が可能になる。
【0143】(7) :請求項5では、文書検索時におい
て、前記検索結果情報提示手段は検索結果提示の際に関
連度判定の閾値をアイテムの密集度に応じて動的に変更
する。この場合、文書データベースによっては検索の結
果検索キーとの関連度の高い文書が多く存在することが
あり、検索結果の文書が全て一つのグループになってし
まうこともある。そのような場合、関連度を判定する閾
値を動的に変更することで、常に適切な検索結果情報を
提示することができる。
【0144】(8) :請求項6では、文書検索装置におい
て、記録媒体から読み出したプログラムを実行すること
により、文書検索での検索結果提示の際に、検索結果の
文書間の関連度情報に基づき、関連度の高い文書の情報
をまとめて表示させる。
【0145】このようにすれば、通常の検索結果におけ
る順位や検索キーとの関連度などの情報に加え、それぞ
れの文書間の関連情報を含む検索結果情報の提示を得る
ことができる。そして、文書間の関連度の計算は、検索
結果における検索キーとの関連度が高いもののみに限定
することができるため、高速な処理が可能になる。更
に、検索時に得られる文書データからの情報を活用する
ことで、効率的な検索結果情報や操作手段の提供が可能
になる。
【図面の簡単な説明】
【図1】本発明の実施の形態における装置構成図であ
る。
【図2】本発明の実施の形態における文書検索モジュー
ルの説明図である。
【図3】本発明の実施の形態における例1の処理フロー
チャート(その1)である。
【図4】本発明の実施の形態における例1の処理フロー
チャート(その2)である。
【図5】本発明の実施の形態における例2の処理フロー
チャート(その1)である。
【図6】本発明の実施の形態における例2の処理フロー
チャート(その2)である。
【図7】本発明の実施の形態における例3の処理フロー
チャートである。
【図8】本発明の実施の形態における例5の処理フロー
チャートである。
【図9】本発明の実施の形態における例6、例8〜11
の処理フローチャートである。
【図10】本発明の実施の形態における例7の処理フロ
ーチャートである。
【図11】本発明の実施の形態における検索結果情報表
示例(その1)である。
【図12】本発明の実施の形態における検索結果情報表
示例(その2)である。
【図13】本発明の実施の形態における検索結果情報表
示例(その3)である。
【図14】本発明の実施の形態における検索結果情報表
示例(その4)である。
【図15】本発明の実施の形態における検索結果情報表
示例(その5)である。
【図16】従来の検索結果情報表示例である。
【符号の説明】
1 装置本体 2 ディスプレイ装置 3 キーボード 4 マウス 5 ハードディスク装置(HDD) 6 プリンタ 7 フレキシブルディスク装置(フロッピィディスクド
ライブ:FDD) 10 CPU(中央処理装置) 11 入出力制御部 12 メモリ 21 GUIモジュール(グラフィカルユーザインター
フェース) 22 文書検索制御モジュール 23 検索エンジン 24 関連統合モジュール 25 文書属性表示管理モジュール 26 関連フィードバック管理モジュール 27 文書データベース

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】文書データを格納した文書データベース
    と、前記文書データベースの文書検索を行う検索エンジ
    ンと、情報の視覚的操作のためのインターフェース制御
    を行うグラフィカルユーザインターフェースモジュール
    と、前記検索エンジンによる検索結果の情報に対して関
    連情報の統合処理を行う関連統合モジュールと、文書属
    性の表示管理を行う文書属性表示管理モジュールと、検
    索結果情報の評価情報を管理し、関連フィードバックが
    行われた際その文書の表示情報を制御する関連フィード
    バック管理モジュールと、 を備えた文書検索装置であって、 文書検索での検索結果提示の際に、検索結果の文書間の
    関連度情報に基づき、関連度の高い文書の情報をまとめ
    て表示させる検索結果情報提示手段を備えていることを
    特徴とした文書検索装置。
  2. 【請求項2】前記検索結果情報提示手段は、関連度の高
    い文書の情報をまとめて表示させる際、多段階に階層的
    に表示させる機能を備えていることを特徴とした請求項
    1記載の文書検索装置。
  3. 【請求項3】前記検索結果情報提示手段は、検索結果の
    文書間の関連度情報に基づき、上位レベルの文書のみの
    表示や下位レベルの展開を含むアウトライン操作を行う
    機能を備えていることを特徴とした請求項1記載の文書
    検索装置。
  4. 【請求項4】前記検索結果情報提示手段は、検索結果提
    示の際に、同一グループに属する複数文書に対し、関連
    フィードバックの対象とする/しないの指定を一度に行
    える手段を提供する機能を備えていることを特徴とした
    請求項1記載の文書検索装置。
  5. 【請求項5】前記検索結果情報提示手段は、検索結果提
    示の際に、関連度判定の閾値を、アイテムの密集度に応
    じて動的に変更する機能を備えていることを特徴とした
    請求項1記載の文書検索装置。
  6. 【請求項6】文書データを格納した文書データベース
    と、前記文書データベースの文書検索処理を行う検索エ
    ンジンと、情報の視覚的操作のためのインターフェース
    制御を行うグラフィカルユーザインターフェースモジュ
    ールと、前記検索エンジンによる検索結果の情報に対し
    て関連情報の統合処理を行う関連統合モジュールと、文
    書属性の表示管理を行う文書属性表示管理モジュール
    と、検索結果情報の評価情報を管理し、関連フィードバ
    ックが行われた際、その文書の表示情報を制御する関連
    フィードバック管理モジュールとを備えた文書検索装置
    に、 文書検索での検索結果提示の際に、検索結果の文書間の
    関連度情報に基づき、関連度の高い文書をまとめて表示
    させる手順を実行させるためのプログラムを記録したコ
    ンピュータ読取可能な記録媒体。
JP10054812A 1998-03-06 1998-03-06 文書検索装置及び記録媒体 Pending JPH11259485A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10054812A JPH11259485A (ja) 1998-03-06 1998-03-06 文書検索装置及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10054812A JPH11259485A (ja) 1998-03-06 1998-03-06 文書検索装置及び記録媒体

Publications (1)

Publication Number Publication Date
JPH11259485A true JPH11259485A (ja) 1999-09-24

Family

ID=12981131

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10054812A Pending JPH11259485A (ja) 1998-03-06 1998-03-06 文書検索装置及び記録媒体

Country Status (1)

Country Link
JP (1) JPH11259485A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113449164A (zh) * 2021-05-15 2021-09-28 南方电网调峰调频发电有限公司信息通信分公司 一种移动办公用敏捷开发管理系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07114572A (ja) * 1993-10-18 1995-05-02 Sharp Corp 文書分類装置
JPH0991314A (ja) * 1995-07-14 1997-04-04 Fuji Xerox Co Ltd 情報探索装置
JPH0991299A (ja) * 1994-07-28 1997-04-04 Xerox Corp 階層的に関連した情報の生成方法及びコンピュータ制御ディスプレイシステム
JPH09114847A (ja) * 1995-10-16 1997-05-02 Fuji Xerox Co Ltd 情報処理装置
JPH09153064A (ja) * 1995-11-30 1997-06-10 Toshiba Corp 情報フィルタリング装置
JPH09212513A (ja) * 1996-01-31 1997-08-15 Nippon Telegr & Teleph Corp <Ntt> 書籍情報表示装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07114572A (ja) * 1993-10-18 1995-05-02 Sharp Corp 文書分類装置
JPH0991299A (ja) * 1994-07-28 1997-04-04 Xerox Corp 階層的に関連した情報の生成方法及びコンピュータ制御ディスプレイシステム
JPH0991314A (ja) * 1995-07-14 1997-04-04 Fuji Xerox Co Ltd 情報探索装置
JPH09114847A (ja) * 1995-10-16 1997-05-02 Fuji Xerox Co Ltd 情報処理装置
JPH09153064A (ja) * 1995-11-30 1997-06-10 Toshiba Corp 情報フィルタリング装置
JPH09212513A (ja) * 1996-01-31 1997-08-15 Nippon Telegr & Teleph Corp <Ntt> 書籍情報表示装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113449164A (zh) * 2021-05-15 2021-09-28 南方电网调峰调频发电有限公司信息通信分公司 一种移动办公用敏捷开发管理系统
CN113449164B (zh) * 2021-05-15 2022-08-05 南方电网调峰调频发电有限公司信息通信分公司 一种移动办公用敏捷开发管理系统

Similar Documents

Publication Publication Date Title
Marchionini Exploratory search: from finding to understanding
US7523095B2 (en) System and method for generating refinement categories for a set of search results
US8171049B2 (en) System and method for information seeking in a multimedia collection
US7769771B2 (en) Searching a document using relevance feedback
US6304864B1 (en) System for retrieving multimedia information from the internet using multiple evolving intelligent agents
JP2002230021A (ja) 情報検索装置及び情報検索方法並びに記憶媒体
US20020073079A1 (en) Method and apparatus for searching a database and providing relevance feedback
US20060101102A1 (en) Method for organizing a plurality of documents and apparatus for displaying a plurality of documents
JP4634214B2 (ja) リンクおよびページレイアウトの分析を利用することによりイメージ関連性を識別する方法およびシステム
US20050044487A1 (en) Method and apparatus for automatic file clustering into a data-driven, user-specific taxonomy
JP2006508446A (ja) 情報格納及び検索方法
JP2004287725A (ja) 検索処理方法及びプログラム
JP2008276768A (ja) 情報検索装置及び方法
JP3381378B2 (ja) 情報構造化表示装置
Hoeber et al. Visualization support for interactive query refinement
JP2009064191A (ja) 情報検索支援装置、情報検索支援方法、プログラムおよび記録媒体
JPH11259485A (ja) 文書検索装置及び記録媒体
Song Bibliomapper: A cluster-based information visualization technique
JP3856388B2 (ja) 類義性計算方法、類義性計算プログラム、類義性計算プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3100955B2 (ja) 情報検索方法及び情報検索装置
JP2939841B2 (ja) データベース検索装置
JPH0727532B2 (ja) 情報検索方法及びシステム
JP2000207422A (ja) 概念シソ―ラスを用いた文書の検索及び格付けシステム並びに方法
JP4344207B2 (ja) 文書検索装置、文書検索方法、文書検索プログラム、および記録媒体
JP2006501545A (ja) オブジェクト分類のための顕著な特徴を自動的に判定する方法および装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060914

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060926

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061121

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070213